11月24日午間消息,世界互聯(lián)網(wǎng)大會(huì)·互聯(lián)網(wǎng)發(fā)展論壇于11月23-24日在浙江烏鎮(zhèn)互聯(lián)網(wǎng)國際會(huì)展中心舉行。在24日的“人工智能:育新機(jī)、開新局”人工智能分論壇上,清華大學(xué)講席教授兼智能產(chǎn)業(yè)研究院院長、美國藝術(shù)與科學(xué)院院士張亞勤在演講中表示,不太完全認(rèn)同算力比算法更重要的觀點(diǎn)。
他表示,這次數(shù)字化和過去那兩次有很大的不同。首先是量高了很多數(shù)量級(jí),比如說無人車每天所產(chǎn)生的數(shù)據(jù)就是5到10個(gè)T。基因測序每一次就差不多3T左右。所以這個(gè)數(shù)量級(jí)是高了很多,可能是上千或者上萬倍。“這次數(shù)據(jù)更多的是給機(jī)器看的,而不是給人看的。機(jī)器要做決策,機(jī)器要進(jìn)行更多的智能決策。那么過去1.0、2.0更多是給人所看的,同時(shí)我們看到人工智能的算法有很大的進(jìn)展。”
張亞勤強(qiáng)調(diào),深度學(xué)習(xí)其實(shí)是需要很強(qiáng)很強(qiáng)的算力。而摩爾定律過去兩年左右是要雙倍算力的,其實(shí)這已經(jīng)是在放緩了。但是深度學(xué)習(xí)對(duì)算力要求每年差不多是將近10倍的增長。“所以說Jeff dean在谷歌就說三要素,數(shù)據(jù)算法算力三要素等于數(shù)據(jù)加上100倍算力,就是說算力比算法更重要。我個(gè)人并不完全同意這個(gè)觀點(diǎn)。”張亞勤表示,算力在過去這幾年是整個(gè)深度學(xué)習(xí)發(fā)展快速的一個(gè)大的最重要的因素,大數(shù)據(jù)超算的能力以及很大的模型。但人工智能有很多不同的算法。
不過,張亞勤同意“AI也催生了新的產(chǎn)業(yè),大家經(jīng)常把它叫做第四次工業(yè)革命”這個(gè)觀點(diǎn)。他表示,人工智能是第四次工業(yè)革命一個(gè)很重要的技術(shù)方面的引擎,很多產(chǎn)業(yè)都會(huì)被改變,都會(huì)產(chǎn)生。他認(rèn)為有三個(gè)方面會(huì)產(chǎn)生變革:第一個(gè)是自動(dòng)駕駛。第二個(gè)是工業(yè)物聯(lián)網(wǎng)。第三個(gè)是AI+醫(yī)療、生物計(jì)算。(子健)
以下是張亞勤演講實(shí)錄:
大家好,我是張亞勤,來自清華大學(xué)智能產(chǎn)業(yè)研究院。很高興參加這次人工智能的互聯(lián)網(wǎng)峰會(huì),也感謝大會(huì)的組委會(huì)和網(wǎng)信辦邀請(qǐng)。我今天想談一下智能技術(shù)發(fā)展的一些趨勢,如果看下過去的三十年,我們整個(gè)IT產(chǎn)業(yè)發(fā)生最重要的事無疑是數(shù)字化。第一波的數(shù)字化是80年代中期是就開始了,那時(shí)候主要是內(nèi)容數(shù)字化,我們聲音、音樂、圖片和視頻大量的數(shù)字化,我們的文檔在數(shù)字化。
第二波的數(shù)字化是90年代中期開啟了,一開始是企業(yè)的數(shù)字化ERP、CRM、Supply Chain,還包括BI工作流,后來就是大型的數(shù)據(jù)倉庫以及云計(jì)算,同時(shí)由于大量的數(shù)字內(nèi)容,加上HTML、HTTP,消費(fèi)互聯(lián)網(wǎng)開始爆發(fā),到了后期移動(dòng)互聯(lián)網(wǎng)像移動(dòng)支付、數(shù)字貨幣、共享經(jīng)濟(jì),中國其實(shí)是走在前列的。不管是用戶的體驗(yàn)或者是大規(guī)模的應(yīng)用。
我們現(xiàn)在是進(jìn)入數(shù)字化的3.0。它是信息,物理和生物世界的一種融合。首先是物理世界的數(shù)字化,我們的車、街道、交通燈和整個(gè)城市在數(shù)字化;我們的電網(wǎng),我們的工廠,我們的機(jī)器在數(shù)字化;我們的家庭,各種家電在數(shù)字化;同時(shí)生物世界也在數(shù)字化;我們的大腦,身體各個(gè)器官DNA、RNA、蛋白質(zhì)都在數(shù)字化,通過新的傳感器,一些芯片。
那么這次數(shù)字化和過去那兩次有很大的不同。首先是量高了很多數(shù)量級(jí),比如說無人車每天所產(chǎn)生的數(shù)據(jù)就是5到10個(gè)T。我們的基因測序每一次就差不多3T左右。所以這個(gè)數(shù)量級(jí)是高了很多,可能是上千或者上萬倍。
另外一點(diǎn)這次數(shù)據(jù)更多的是給機(jī)器看的,而不是給人看的。機(jī)器要做決策,機(jī)器要進(jìn)行更多的智能決策。那么過去1.0、2.0更多是給人所看的,同時(shí)我們看到人工智能的算法有很大的進(jìn)展。人工智能并不是一個(gè)嶄新的概念,已經(jīng)有60多年的歷史了。那么從早期的符號(hào),邏輯推理,專家系統(tǒng),數(shù)據(jù)來驅(qū)動(dòng),到過去這10年,特別是過去這5年機(jī)器學(xué)習(xí),深度學(xué)習(xí)的快速崛起。我們可以看到許多特別令人興奮的一些進(jìn)展以及應(yīng)用到AlphaGO、AlphaGOZero。到后來的AlphaFold把深度學(xué)習(xí)用在不同的領(lǐng)域,特別用到生物計(jì)算和醫(yī)藥的領(lǐng)域。
其實(shí)人工智能有很多不同的算法,我這是佩德羅?多明戈斯劃分的5個(gè)不同學(xué)派,未來發(fā)展肯定要融合這些不同學(xué)派的優(yōu)勢,使得我們目前用大數(shù)據(jù)所驅(qū)動(dòng)的深度學(xué)習(xí)有更好的透明性、好的應(yīng)用性以及有更好的可解釋性。
那么深度學(xué)習(xí)確實(shí)取得很大的進(jìn)展,算法從RNN、LSTM到CNN,到過去這兩年的GAN和BERT還有GPT-3,可以說從我們感知方面語音、人臉、物體的分類,已經(jīng)和人達(dá)到同樣的水平,甚至超過人了。
那么在認(rèn)證方面還有一些距離,自然語言處理,機(jī)器翻譯視頻內(nèi)容化和知識(shí)理解還有一定距離,但是也有很大的進(jìn)展。但是深度學(xué)習(xí)我們大家都知道,它其實(shí)是需要很強(qiáng)很強(qiáng)的算力的。摩爾定律過去兩年左右是要雙倍算力的,其實(shí)這已經(jīng)是在放緩了。但是深度學(xué)習(xí)對(duì)算力要求每年差不多是將近10倍的增長,所以說Jeff dean的谷歌就說三要素,數(shù)據(jù)算法算力三要素等于數(shù)據(jù)加上100倍算力,就是說算力比算法更重要。
我個(gè)人并不完全同意這個(gè)觀點(diǎn),但是不管怎么講算力在過去這幾年是整個(gè)深度學(xué)習(xí)發(fā)展快速的一個(gè)大的最重要的因素,大數(shù)據(jù)超算的能力以及很大的模型。舉例比如說GPT-3目前已經(jīng)有1700億的參數(shù)模型有上萬臺(tái)GPU,200多K或者說20多萬的CPU的Core。每次做Pre-train的話也要差不多要上千萬美金,這個(gè)量已經(jīng)很大了。那么如何能夠繼續(xù)保持這么快的一個(gè)算力?我們看一下我們?cè)趥鹘y(tǒng)計(jì)算和通訊的范式里三個(gè)基本原理。
首先是香農(nóng)定律。香農(nóng)定律定義了信息熵,定義了信道的容量,定義了速率失真的理論。其實(shí)是三個(gè)不同的極限。另外一個(gè)是馮諾依曼架構(gòu),是我們計(jì)算的架構(gòu),十分的簡潔很美的一個(gè)架構(gòu)。過去的60年是我們整個(gè)計(jì)算架構(gòu)的主要原則。另外一個(gè)是摩爾定律。
那么現(xiàn)在呢這三個(gè)定律架構(gòu)都遇到了瓶頸,所以要大幅度的提高這個(gè)算力的話,我們需要來突破這三個(gè)瓶頸。比如說在信息的表示方面,我們需要有新的一個(gè)理論框架以及算法。我這張圖是講的一個(gè)例子。最近有一個(gè)機(jī)構(gòu)叫MPAI,這個(gè)機(jī)構(gòu)就希望把人工智能算法用到我們目前的信息的表征,同時(shí)的話又希望找到新的算法來對(duì)人工智能有更快的推進(jìn)。
另外一點(diǎn)也可以看到最近有許多新的創(chuàng)新在計(jì)算的架構(gòu)方面。在通訊的架構(gòu)方面,比如說我們深度學(xué)習(xí),其實(shí)它需要有特別高速的數(shù)據(jù)傳輸,他們有一些新的相量,需要有先進(jìn)代數(shù),有波爾代數(shù),這種優(yōu)化的這些算法。這個(gè)和我們現(xiàn)在傳統(tǒng)的馮諾依曼架構(gòu)是格格不入的,就是需要有新的架構(gòu)。
所以看到我們比如說有,在過去這5年吧,有很多加速器,就是AI的加速器出現(xiàn),像SPG、GPU,最近幾年也有這種ASIC專用的AI芯片出現(xiàn),這種芯片因?yàn)閷?duì)這些算法,對(duì)工作流,對(duì)workload可以提高CPU提高很多倍,從整個(gè)的性能、效率來講。
那么同時(shí)也可以看到不僅僅是傳統(tǒng)的芯片公司,像因特爾、AMD等公司做芯片,現(xiàn)在新的公司也在不斷的創(chuàng)新,比如說寒武紀(jì)、地平線,華為,也包括其他公司像谷歌和百度也在自己做芯片。做芯片算法也好,架構(gòu)也好有很大的工作流,所以他可以對(duì)這些進(jìn)行優(yōu)化。
我們可以看到有很多很多的這些芯片、軟件、架構(gòu)以及算法方面的快速進(jìn)展。那么這些進(jìn)展帶來很多產(chǎn)業(yè)的新機(jī)遇。首先對(duì)我們IT的產(chǎn)業(yè)有一個(gè)提升的作用,新的數(shù)據(jù),新的算法,新的場景,然后不斷的快速迭代,所以提升我們的IT產(chǎn)業(yè),同時(shí)更重要的是改變甚至顛復(fù)我們現(xiàn)在的傳統(tǒng)產(chǎn)業(yè),教育、醫(yī)療、金融、制造、交通,可以說每一個(gè)產(chǎn)業(yè)都被人工智能所改變。
同時(shí)AI也催生了新的產(chǎn)業(yè),大家經(jīng)常把它叫做第四次工業(yè)革命,我的確同意這個(gè)觀點(diǎn)。就是人工智能是第四次工業(yè)革命一個(gè)很重要的技術(shù)方面的引擎,很多產(chǎn)業(yè)都會(huì)被改變,都會(huì)產(chǎn)生。我自己認(rèn)為有三個(gè)方面是比較感興趣的:第一個(gè)是自動(dòng)駕駛。第二個(gè)是工業(yè)物聯(lián)網(wǎng)。第三個(gè)是AI+醫(yī)療、生物計(jì)算。當(dāng)然也很有很多很多別的產(chǎn)業(yè),這也是為什么我們成立了一個(gè)智能產(chǎn)業(yè)研究院的大背景。這當(dāng)然是在清華大學(xué)整個(gè)學(xué)校大框架下面,因?yàn)榭梢院颓迦A大學(xué)各個(gè)院系密切合作,智能產(chǎn)業(yè)的英文簡稱(AIR),使命是用人工智能技術(shù)賦能產(chǎn)業(yè)推動(dòng)社會(huì)的進(jìn)步,目標(biāo)是面向第四次工業(yè)革命,是一個(gè)國際化,智能化,產(chǎn)業(yè)化的應(yīng)用研究機(jī)構(gòu)。實(shí)現(xiàn)這個(gè)目標(biāo)有幾個(gè)戰(zhàn)略:首先是要吸引培養(yǎng)國際視野的技術(shù)領(lǐng)軍人物。第二點(diǎn)是要實(shí)現(xiàn)關(guān)鍵核心技術(shù)方面的突破,更重要的是有了技術(shù)以后,我們要賦能產(chǎn)業(yè),通過轉(zhuǎn)化孵化公司的方式,把這些技術(shù)能夠?qū)Ξa(chǎn)業(yè)有更多的影響力。所以我們的研究領(lǐng)域目前集中在三個(gè)方面。
剛才我提到的三個(gè)方面:智能交通、工業(yè)互聯(lián)網(wǎng)、AI+IoT以及智慧醫(yī)療AI+IoT,特別是生物計(jì)算,那么垂直的這三個(gè)行業(yè)是對(duì)一些基礎(chǔ)的平臺(tái)所支撐的共有模塊所支撐,叫做“ABCD”。AI的一些算法、Big data的模型加上云Cloud和Device這種新機(jī)構(gòu)。我希望通過我們的研究院新的技術(shù)能和產(chǎn)業(yè)去合作,對(duì)中國和全球人工智能產(chǎn)業(yè),第四次工業(yè)革命都做出貢獻(xiàn)。謝謝大家,祝我們?yōu)蹑?zhèn)互聯(lián)網(wǎng)峰會(huì)圓滿成功!
責(zé)任編輯:PSY
-
算法
+關(guān)注
關(guān)注
23文章
4625瀏覽量
93140 -
人工智能
+關(guān)注
關(guān)注
1793文章
47536瀏覽量
239370 -
工業(yè)物聯(lián)網(wǎng)
+關(guān)注
關(guān)注
25文章
2383瀏覽量
64623 -
自動(dòng)駕駛
+關(guān)注
關(guān)注
784文章
13905瀏覽量
166745 -
算力
+關(guān)注
關(guān)注
1文章
1008瀏覽量
14889
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論