作者:劉鋒
2022年11月份以來,以ChatGPT為代表的大模型成為世界數字科技領域的新熱點。在ChatGPT上線的2個月內,其月活用戶已經突破1億,在不到一年時間里全球的大模型數量已經超過百個,從全球已經發布的大模型分布來看,中美兩國數量合計占全球總數的超 80%,據不完全統計,到2023年7月中國 10 億參數規模以上的大模型已發布 79 個。
8月31日,國內首批八家大模型通過《生成式人工智能服務管理暫行辦法》備案,包括百度、智譜、百川、字節、商湯、中科院(紫東太初)、MiniMax、上海人工智能實驗室等8個企業/機構的大模型可正式上線面向公眾提供服務。其中當天開放的文心一言等大模型。據百度官方平臺數據顯示,24小時內文心一言回答網友超3342萬個問題。
一般而言,大模型(Large Language Models)指的是包含超大規模參數的神經網絡模型。大模型通常能夠學習到更細微的模式和規律,具有更強的泛化能力和表達能力。大模型代表了AI和深度學習在自然語言處理領域的最新進展。目前在機器翻譯、語言理解、聊天機器人、圖像識別,圖像視頻生成、語音識別、語音合成,推薦系統等等領域都獲得了革命性的進步。
微軟公司創始人比爾·蓋茨公開表示,自1980年首次看到圖形用戶界面以來,以GPT為代表的大模型模型是他所見過的最具革命性的技術進步。對于大模型未來的產業發展趨勢和面臨的挑戰究竟如何,我們將從三個方面進行探討。
我們在《崛起的超級智能:互聯網大腦如何影響科技未來》一書中提出,生物的競爭本質上是種群知識庫的的競爭。在過去的幾億年里,恐龍因為滅絕導致種群知識庫消失為0,鯊魚一直保持在海洋中游蕩,種群知識庫沒有發生大的變化,熊貓因為趨于滅絕從而種群知識庫不斷萎縮。
只有人類在近200萬年里,在知識和智慧上不斷擴展和加速,在最近數百年里隨著蒸汽機、工業革命、核能的出現。人類種群知識庫出現了巨大的增長。特別是互聯網的誕生后,第一次將人類的種群知識庫外化成一個基于網絡的龐大知識庫,通過萬維網的發明進一步促使人類種群知識庫急劇擴容。表現在科技領域就是21世紀大量新科技新概念不斷涌現。
面對海量的互聯網公共知識,如何索引就成了人類必須解決的重要課題,因此到20世紀90年代,搜索引擎出現了蓬勃發展,其中優秀和典型的代表分別是谷歌和百度。它們成長背后的推動力也是人類種群知識庫發展的必然要求。
在互聯網知識庫被索引之后,如何智能化也就成為了一個重要議題。在過去的近30年里,以谷歌、百度為代表的搜索引擎公司加大了將互聯網知識庫進行智能化的步伐,人工智能的興起也于此有密切的關系。在國內過去的近10年時間里,百度通過百度大腦、小度、自動駕駛等產品不斷推動人工智能的產業化應用。
2022年OpenAI的Chatgpt成功引發了大模型的興起,標志著互聯網這個外化的人類種群知識庫完成了從索引化到智能化的轉變。但不能忘記的是,OpenAI Chatgpt的成功離不開谷歌提出的Transformer注意力機制模型,也離不開微軟通過Bing搜索引擎提供的海量數據和巨大資金支持。在中國,2019年百度推出了文心大模型,并在2023年在國內率先推出了大模型消費級產品-文心一言,并與其搜索引擎做了深度結合,另一家中國搜索引擎公司奇虎360也在2023年推出了大模型產品360智腦,搜狗創始人王小川建立的百川智能成為中國首批通過審核的大模型之一,它們在各項評測中都取得了不俗的成果。
從搜索引擎的發展看,通過激烈的競爭,搜索引擎最終形成了若干個巨頭公司為人類提供互聯網海量數據的索引服務,同樣我們認為作為搜索引擎的升級版,人類社會也不需要很多大模型提供同質的服務。包括搜索引擎、大數據、社交網絡等領域擁有優質大數據、人工智能技術積累和廣泛應用場景的巨頭或創業公司,在大模型的產業競爭中將具有更強的競爭力,并在未來的競爭中脫穎而出一家或若干家為人類提供集中統一的智能服務。
二.行業垂直大模型建設思路:繼續提升通用大模型智能水平
應該指出,當前,人類社會對大模型充滿了熱情,特別在中國,很多人希望大模型能夠與金融、法律、工業、農業、電力、建筑等等行業領域結合,從而實現彎道超車,但我們必須考慮大模型的特點,需要在大模型的垂直化和行業化過程中保持謹慎。
大模型的成功并不僅僅是參數量大,而是用大規模預訓練+微調的方式,對海量的跨領域知識進行學習時涌現出來新的能力,而且這些新的能力往往與創新有關,如翻譯,創作文章,創作圖像、編寫詩歌,編寫程序等,然而這種創新能力在工作時產生的結果并不穩定,會出現“幻覺”和胡編亂造的情況。同時由于神經網絡本身的特點,其內部運行機制的可解釋性問題也一直沒有解決,因此對于需要精密控制或精確結果的產業領域,大模型并不是可靠的工具和技術。
另外一個誤區,認為用大模型的訓練方法加上行業產業的大數據就可以形成高質量的行業大模型。這個觀點并不符合大模型涌現出創新能力的規律,過于單一領域的知識反而會降低大模型的涌現出新能力的水平,導致無法有效應用到行業產業中。因此應繼續提高Chatgpt,文心一言、Llama、智譜、百川等等通用大模型的智能水平,通過這些通用大模型平臺與其他可靠性高的人工智能技術協同工作,并與各個行業結合,這種路徑要比建設專門的行業大模型更為穩健和有效。
三.值得期待的大模型未來
當然,大模型并不是人工智能的全部,也不是數字科技的全部,它只是其中一個當前活躍的重要技術和產品。應避免大數據熱時,一切皆大數據;元宇宙熱時,一切皆元宇宙;大模型熱時,一切皆大模型,大模型需要與其他技術和產品結合才能發揮更大的作用。
大模型的不斷發展和與其他技術產品結合的過程將是持續探索和嘗試的過程。無論如何,大模型的出現的確是一個革命性的突破,有很多科學家認同Chatgpt等大模型已經可以突破圖靈測試,未來在智能和意識的基礎原理上也將帶來更多突破性的啟發。
在產業應用上,大模型與其他不同類型的人工智能技術、網絡技術、大數據技術結合,與不同的辦公、學習、生產、生活結合會持續產生出具有非凡想象力的應用。例如微軟辦公Office 接入GPT-4,百度利用文心一言重構包括搜索、文庫、如流、智能云等業務產品。未來還會發生怎樣的革命性變化,我們還需要耐心等待大模型的持續發育和成長,畢竟它還是一個出生來到全人類面前還不到1年的嬰兒,(從以ChatGPT3.5為代表的大模型大規模向人類提供服務算起)。
編輯:黃飛
-
神經網絡
+關注
關注
42文章
4774瀏覽量
100894 -
語音識別
+關注
關注
38文章
1742瀏覽量
112717 -
人工智能
+關注
關注
1792文章
47425瀏覽量
238948 -
GPT
+關注
關注
0文章
354瀏覽量
15433 -
大模型
+關注
關注
2文章
2489瀏覽量
2857
原文標題:大模型的產業未來發展趨勢與挑戰
文章出處:【微信號:AI智勝未來,微信公眾號:AI智勝未來】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論