問
“ChatGPT,人工智能會如何發展?”
答
“人工智能的行業落地將繼續加速,今后會更加廣泛應用于工業、消費、金融、醫療、交通、教育、政府等多個領域。”
今天,你和ChatGPT聊天了嗎?它僅僅開發13天就匆匆上線,卻在兩個月就獲得過億用戶。這一基于AI的產品持續火熱出圈,在社會各界引發越來越多的熱情。以此為契機,業界對于人工智能技術也展開新討論,特別是大模型的創建和學習能力成為關注的焦點。
一
目前,預訓練技術(Pre-Trained Model)是人工智能研究的重要突破口。傳統的研究方法中,標注成本一直是阻礙AI算法推向更大數據集合的障礙;預訓練技術不依賴數據標注,就可以訓練出一個大規模深度學習模型。全球AI團隊選擇兒童電視節目《芝麻街》中的木偶人物來命名各種新預訓練算法,比如Elmo、Bert、Ernie等。
在對預訓練模型的各種不同的技術評測中,算法性能展示了一個規律:數據規模越大、預訓練模型參數越多,算法輸出精度往往也越高。隨著技術的突破,模型規模的不斷增長,其展現出的能力潛力和豐富的應用場景激發了更多的企業和研究機構投身其中。超級模型除了可以消化更大規模的數據,也需要消耗更高的算力。
OpenAI公司對人工智能算法訓練所消耗的算力做了一個統計,結果發現,從2012年到2020年,人工智能模型訓練消耗的算力增長了三十萬倍,平均每3.4個月翻一番,這超過了摩爾定律的每18個月翻番的增長速率,人工智能技術成為推動IT技術發展的新的動力引擎。
二
全球AI技術發展格局:中美領跑
從2019年開始,AI大模型突然爆發,參數規模以指數級的快速增長。從2014年到2018年,AI模型參數規模還在一億的數量級上下浮動。
2019年2月,OpenAI的GPT-2達到了15億參數規模
2020年6月,GPT-3達到了1750億參數的規模
2021年1月,谷歌大腦推出了1.6萬億參數規模超級模型,再次刷新規模記錄
中國本土技術團隊也加入到這一場人工智能技術競賽中。阿里巴巴達摩院在2020年初啟動中文多模態預訓練模型M6項目,同年6月推出3億參數的基礎模型。2021年1月,模型參數規模到達百億,已經成為世界上最大的中文多模態模型;2021年5月,具有萬億參數規模的模型正式投入使用,追上了谷歌的發展腳步;2020年10月,M6的參數規模擴展到10萬億,成為當時全球最大的AI預訓練模型[1]。
不少中國企業和研究機構也積極研發投入中文預訓練大模型項目。在人工智能超級大模型的這條數據、算法和算力三輪同時驅動的技術賽道上,中美兩國技術團隊已經形成了“兩架馬車”的發展模式,不斷刷新人工智能能力規模上的邊界線。
基于AMiner科技情報系統的數據[2],根據AIGC領域知識圖譜(AIGC領域知識圖譜及關鍵詞參見附件1)進行檢索,利用文獻計量方法,我們對2012年到2021年期間全球發表的AIGC高質量論文(論文引用量排名前1%)做比較,共計1,646篇論文入選。在AIGC高質量論文領域,中國和美國數量幾乎持平,并大幅度領先其他國家。
數據來源:AMiner科技情報平臺
從發展趨勢上看,在AIGC領域,中國有后來者居上、超越美國的趨勢。
數據來源:AMiner科技情報平臺
在更大的數字技術領域,中國在高價值論文部分,同發達國家仍有不小差距[3],未來需要產、學、研一起努力,共同推動中國數字技術向價值鏈高端躍升。
說明:論文檢索時間范圍為2012年1月至2021年12月
數據來源:AMiner科技情報平臺
三
AI產業發展:資本與人才
深藍打敗了卡什帕羅夫、AlphaGo戰勝了李世石……對于業內人士來說,這些曾經轟動一時的現象級技術進步,僅僅是完成固定任務的弱人工智能。開發具有跨領域學習能力的強人工智能技術才是人類努力的終極目標。常識學習、跨領域模型遷移、小樣本和零樣本學習……一個個技術的攔路虎擋在通往強人工智能的技術道路上,而人工智能超級模型給這條道路照亮了前方。
OpenAI為訓練GPT-3超級模型投入了1200萬美元的成本。在人工智能超級模型的賽道上,賽手需要掌握海量的數據、超大規模的人工智能計算平臺以及掌握核心技術能力的算法團隊,三者缺一不可。這也許側面解釋了在追求人工智能技術最前沿的賽道上,目前只出現了美國和中國技術團隊的身影。中美兩國在人工智能技術領域形成了激烈的競爭格局。數據、算法和算力是這一輪人工智能技術浪潮的三輪驅動引擎。中國擁有全世界最大的互聯網和移動互聯網用戶規模,在數據領域讓我國具有毋庸置疑的領先地位,互聯網平臺企業也構建出極具競爭力的算力平臺和算法團隊。
在斯坦福大學HAI研究所發布的2021 全球AI指數報告中[4],2020年全球盡管受新冠疫情拖累,在各方面的經濟發展都受到極其負面的影響。人工智能領域的發展卻一枝獨秀,相關投資仍然在大幅增加,2020年私人資本在人工智能領域的投資比前一年增加了9.3%,遠高于疫情前2019年5.7%的增長率。在資金方面,美國仍然是人工智能私人資本的最大目的地,2020年總投資超過230億美元,是中國相關資金99億美元的兩倍多。
圖表5 全球數字科技人才數量前 10 強機構
數據來源:AMiner科技情報平臺。
近日發布的《2023全球數字科技發展研究——科技人才儲備實力研究報告》[5],對包括AI在內的各國數字科技人才儲備情況做了全面比較。結果顯示,與美國相比,中國數字科技人才基數大,但存在高層次人才少、凈流出數量多以及人才集中在高校而不是企業等問題,中國在鞏固數字科技人才方面的工作任重道遠。
四
ChatGPT的未來:腦力的解放
OpenAI公司應該也沒有想到ChatGPT會一夜爆紅,這款對話機器人(chatbot)產品不僅開發時間短,模型也沒有構建在OpenAI即將發布的最新一代GPT4模型之上,而是采用了上一代的GPT3的增強模型[6]。
不過,從生成式AI技術(Generative AI或AIGC)的發展趨勢來看,ChatGPT這一類現象級應用的橫空出世與迅速爆紅卻并不意外。隨著AI大模型技術的不斷成熟,AIGC技術已經走出實驗室,應用場景也已經從初始的文本生成發展到多模態領域:
谷歌旗下的Deepmind公司推出了自主編程應用AlphaCode,在 Codeforces 舉辦的編程比賽中,超過了 45.7% 的人類參賽者[7]
OpenAI開發的另一款圖片生成應用DALL·E-2,入選了時代雜志評選的2022年度最佳發明[8]
英偉達開發了一款3D模型生成工具Magic3D,用戶輸入文本描述就可以自動生成結構極其復雜的3D模型[9]
阿里巴巴達摩院多模態大模型M6,利用文本輸入可以自動驅動人體3D模型的動作合成[10]
在圖文創作、代碼生成、3D模型設計、3D動畫制作等領域,生成式AI技術展示著深厚的潛力,其應用邊界也將隨著技術的進步與成本的降低擴展到更多領域。
高科技投機機構方舟投資(ARK Invest)發布的報告[11]預測,以AIGC為代表的新一代人工智能技術將輔助知識工作者(包括教師、律師、醫生、財務、程序員等白領職業)提高工作效率。報告預測,到 2030 年,AI 將大幅提高知識工作者的工作效率,平均工作效率增加140%,新一代人工智能技術將有可能大幅度降低腦力勞動者的工作強度。如果這一切成為現實,或將是繼人類歷史上由于動力革命而擺脫繁重的體力勞動之后,人類社會發生的又一次偉大的技術革命。
附件1. AIGC領域知識圖譜及關鍵詞
審核編輯 :李倩
-
人工智能
+關注
關注
1791文章
47336瀏覽量
238696 -
ai技術
+關注
關注
1文章
1279瀏覽量
24332 -
ChatGPT
+關注
關注
29文章
1563瀏覽量
7743
原文標題:?中國何時能有ChatGPT?“現象級”產品背后的AI技術發展與展望
文章出處:【微信號:IndustryIOT,微信公眾號:工業互聯網前線】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論