電子發燒友網報道(文/梁浩斌)只要會說話,就能成為開發者?在4月16日的Create 2024百度AI開發者大會上,百度創始人、董事長兼首席執行官李彥宏提出了一個觀點:“未來,自然語言將成為新的通用編程語言,你只要會說話,就可以成為一名開發者,用自己的創造力改變世界?!?/p>
那么要如何實現“人人都是開發者”的世界?李彥宏在大會上也給出了他的答案。
大模型和生成式AI將徹底改變開發者群體
以往,開發者的門檻都普遍較高,需要學習計算機編程語言,才能通過代碼來創造一個應用。而在AI大模型的發展下,計算機能夠理解自然語言,并將其轉換成對應的代碼而構建一個應用。
于是,在強大的AI大模型基礎下,自然語言就將成為新的通用編程語言。開發者不需要具備寫代碼能力、不需要編程能力,只需要將應用需求用自然語言表達出來,就能創造一個應用。開發門檻降低的同時,也就大幅提高了生產力。
而這并不是未來,在今天AI就已經開始幫助企業開發者進行工作?;谖男拇竽P偷?a target="_blank">智能代碼助手Comate,不僅支持100多種語言和所有主流IDE平臺,可以推薦代碼、生成代碼注釋、查找代碼缺陷、給出優化方案。此外,它還可以深度解讀代碼庫、關聯私域知識生成新的代碼。
李彥宏透露,在推出一年多的時間里,Comate已經走入了喜馬拉雅、三菱電梯、軟通動力等上萬家企業。它的生成的代碼采納率達到了46%,百度每天新增的代碼中,已經有27%是由Comate生成的。
就如同短視頻的興起,其中也得益于視頻制作的便利性,短視頻平臺提供了豐富的視頻制作工具,擺脫了以往視頻制作需要專業軟件的門檻,讓每個人都能成為視頻創作者。
如今生成式AI,也為應用開發帶來了革命性的變化,開發應用不再需要代碼、編程等能力,在AI的幫助下開發應用就像拍短視頻一樣簡單,只需要創意和靈感,每個人都能成為開發者。
未來AI原生應用發展趨勢:MoE、小模型、智能體
“大語言模型本身并不直接創造價值,基于大模型開發出來的AI應用,才是能夠真正滿足市場需求的東西”。
關于AI原生應用,李彥宏分享了基于百度過去一年的實踐,總結出的基于大模型開發AI原生應用的具體思路和工具。
首先,李彥宏認為,未來大型的AI原生應用基本都是MoE架構。MoE是指大小模型混用,未來AI應用不會依賴單一模型來解決所有問題,但其中的難點在于,什么時候調用小模型、什么時候調用大模型、什么時候不調用模型,這些策略都需要針對應用的不同場景做匹配。
其次,另一個趨勢是小模型?!靶∧P屯评沓杀镜停憫俣瓤?,在一些特定場景中,經過SFT精調后的小模型,它的使用效果可以媲美大模型?!?/p>
據介紹,百度通過大模型,壓縮蒸餾出來一個基礎模型,然后再用數據去訓練,這要比基于開源模型訓練出的模型效果更好、速度更快、成本更低。而百度也為此推出了Speed,Lite、Tiny三個輕量模型。
第三個趨勢是智能體,智能體的機制包括理解、規劃、反思和進化,令機器像人一樣思考和行動,完成自我迭代和進化,不斷催生出大量的新應用。
三大AI原生應用開發工具“開箱即用”
在AI原生應用MoE、小模型、智能體的趨勢下,百度就提供了智能體開發工具AgentBuilder、AI原生應用開發工具AppBuilder和各種尺寸的模型定制工具ModelBuilder,來為AI原生應用提供完備的工具。
其中,AgentBuilder是一款面向所有人的開發工具,用戶只需在設定中明確智能體所需具備的能力,系統就能自動完成其余工作。如果要讓智能體更加專業,則需要將資料添加到知識庫,讓智能體自動進行更新;或是添加一些第三方的服務工具,讓智能體具備更全面的功能。
AppBuilder作為AI原生應用開發工具,為了降低開發門檻,百度在AppBuilder中提前封裝和預置了開發AI原生應用所需的各種組件和框架,通過自然語言開發AI原生應用,開發步驟最快被壓縮到三步。
比如在華北電力大學的AI助理應用中,利用AppBuilder創建的第一步是為應用設置名稱、簡介、頭像等基本信息;第二步是通過自然語言在角色令中描述具體要求,包括任務、組件能力、要求與限制;第三步是插入自定義的圖書借閱查詢、課表查詢、學生成績查詢等組件,再加入開場白就完成了應用的構建。
而ModelBuilder則是一款面向專業開發者的工具,可以根據開發者的需求定制任意尺寸的模型。同時,根據細分場景對模型進一步精調SFT,掌握模型精調方法也是用好大模型的關鍵。
ModelBuilder可以基于文心大模型,根據需求裁剪出適合不同場景的小模型,同時支持精調和post pretrain。而ModelBuilder預置了包括ERNIE3.5和ERNIE4.0的大模型,以及ERNIE Speed、Lite、Tiny三個輕量級大模型,另外還有兩個垂直場景的模型:適合角色扮演的ERNIE Character,以及適合對話或問答場景中的外部工具使用和業務函數調用的ERNIE Functions。甚至還支持國內外多達77個第三方主流模型,是國內擁有大模型數量最多的開發平臺。
前面也提到,通過大模型壓縮出的小模型,效果要比基于開源模型訓練出的模型更好。
李彥宏在這里也提出了一個觀點:“大家以前用開源覺得開源便宜,其實在大模型場景下,開源是最貴的。所以開源模型將會越來越落后?!?/p>
文心大模型推理成本下降99%
文心一言自去年3月發布以來,就成為國產大語言模型應用的代表之一。據介紹,截至目前文心一言的用戶數突破了2億,API日均調用量也突破了2億,服務的客戶數達到了8.5萬,利用千帆平臺開發的AI原生應用數超過了19萬。
作為文心一言背后的支撐,文心大模型在過去一年里經歷了從3.0版本到3.5,再到4.0的進化。而近幾個月來,文心大模型在代碼生成、代碼解釋、代碼優化等通用能力方面實現了進一步的顯著提升,達到國際領先水平。
在這次開發者大會上,百度還正式推出了文心大模型4.0的工具版。所謂工具版,即提供了文檔問答、數據分析、代碼執行等功能,通過自然語言交互就能實現對復雜數據和文件的處理和分析。
同時,相比文心大模型3.0,目前4.0版本的算法訓練效率提升到了原來的5.1倍,周均訓練有效率達到98.8%,推理性能提升了105倍,推理的成本降到了原來的1%,也就是成本下降了99%。
據稱,成本的下降,得益于百度在芯片、框架、模型、應用這四層架構上有著全棧的布局,通過端到端優化,來降低大模型的使用成本。
視覺大模型的最大應用場景是自動駕駛
大語言模型之外,多模態大模型,比如文字、圖片、語音、視頻等多模態的融合,是基礎模型的長期發展方向,是通往AGI的必經之路。李彥宏判斷,其中視覺大模型最大的應用場景將會是自動駕駛。
在自動駕駛方面,百度實際上也是國內最早布局的廠商之一。基于超過1億公里的、中國復雜城市道路測試里程數據,百度訓練出來了Apollo視覺感知大模型。它具備檢測、跟蹤、理解、建圖四大基礎能力。這讓百度擁有了更智能、適應性更強、更安全的自動駕駛方案。
而在商業落地上,百度旗下的自動駕駛出行平臺蘿卜快跑已經在北京、上海、廣州、深圳、重慶、武漢等多個城市開放運營Robotaxi,部分還已經實現無安全員運行。
今年春節后,蘿卜快跑將武漢的服務區域從長江北岸延伸到了南岸,在武漢的部分區域,蘿卜快跑已經實現了7X24小時的全天候運營,還計劃年內在武漢部署1000臺無人駕駛車輛。
“這是自動駕駛走向真正商業化的一個標志性事件,它不再僅僅是區域性的示范,而是進入到了城市級應用示范的新階段。蘿卜快跑在武漢覆蓋了3000多平方公里、770萬人口,是全球范圍內最大規模的自動駕駛運營區域。”
寫在最后
AI被認為是未來人類生產力提升的關鍵技術,從開發者的角度,百度文心大模型系列以及這次推出的三個開發工具,大大降低了應用開發的門檻,真正實現了“人人都能成為開發者”的愿景。而通過更多人的想象力和創造力,通過AI開發的應用,也將很大程度上提升各行各業的生產力。
正如李彥宏所說:“今天,人人都可以成為開發者。而未來,也必將是一個由開發者一起創造出來的未來!”
-
AI
+關注
關注
87文章
31230瀏覽量
269579 -
百度
+關注
關注
9文章
2272瀏覽量
90538 -
李彥宏
+關注
關注
2文章
92瀏覽量
14530 -
代碼
+關注
關注
30文章
4807瀏覽量
68787 -
開發者
+關注
關注
1文章
585瀏覽量
17046
發布評論請先 登錄
相關推薦
評論