2024年,是大模型翻天覆地的一年。
“百模大戰”爆發不久,大模型價格戰隨之而來,成本高昂的大模型幾乎進入了免費時代。大模型從龐大的實驗室工具,轉變為高效靈活的應用助手,以狂飆猛進的速度在眾多行業落地生根。
不再有人質疑大模型是“拿著錘子找釘子”,更急迫的需求來自市場端。行業對大模型應用的渴望推動著AI Agent走向前臺,圍繞AI Agent的混戰已然開啟。
與此同時,大模型的技術范式飛速演進,以視頻生成模型Sora為代表的多模態技術逐漸成熟,為人們帶來了巨大的想象空間。
這一年,大模型領域充滿著混亂和興奮,技術和應用彼此成就,共同推動著市場快速前行。
回顧2024年大模型產業發展,我們看到了一條逐漸清晰的演進路徑:低成本降低了大模型落地的門檻;AI Agent提供了大模型絕佳的應用方式;多模態直接拓寬了大模型的能力邊界,這一切都為大模型產業落地按下了加速鍵。
如果說“成本、AI Agent、多模態”三個關鍵詞,代表著2024年大模型的進化方向,那么它們也代表著大模型邁向產業落地的關鍵節點。
隨著新一年的到來,這一發展趨勢是否會在2025年延續下去?大模型產業落地又將卷向何方?
成本:打通大模型落地的卡點
過去一年,大模型來到了更務實的落地階段,但落地始終繞不過一個卡點——成本。
大模型參數高達千億級別,一次訓練所需要的資金,是絕大多數企業都“燒不起”的。因此企業在選擇模型時,除了看重效果,對成本的考慮,更是決策的重要一環。
這種變化來自市場對大模型的真實需求。2024年,在市場需求和激烈競爭的雙重推動下,大模型的價格戰提前來臨,國內最頭部的大模型廠商幾乎都卷入了這場降價潮,價格被打到了不可思議的地步。但在某種意義上,價格戰也最大程度降低了大模型的接入門檻,企業不會因為價格而猶豫了。
與此同時,大模型的落地推進,讓越來越多企業意識到,在具體場景上或許并不需要跑出通用大模型的計算量。
“大模型不是參數規模越大越好”,一位金融科技負責人在落地大模型項目后發現,在很多垂類場景中,更輕量的大模型也能達到通用大模型的效果,而推理成本更低,使用更簡單。
隨之而來的趨勢是,輕量級大模型開始流行。
在海外,Google發布了從20 億到70 億參數輕量級模型Gemma;Meta發布了Llama系列模型,從70億、130億、330億到700億,不同場景選擇不同的模型組合,效果都已被驗證。
在國內,百度發布了三款輕量級模型,由大到小是ERNIE Speed、ERNIE Lite、ERNIE Tiny,由百度智能云千帆大模型平臺對外提供模型調用服務,核心理念是幫助客戶降本增效,在特定的場景下通過精調,使小尺寸的模型也能夠達到千億級別大模型的效率。
在經歷過這一系列大模型需求的變化后,百度智能云千帆產品負責同學有感而發,“在極致關注成本的狀態下,大家對大模型的期待就變成了‘不用給我最大的參數規模和最貴的模型’,而是‘在我的場景下效果最好的模型’,不再追求一個模型去解決所有問題”。
杭州全診醫學采用的就是“性價比”更高的ERNIE Speed。通過使用20萬份精標病歷數據對大模型進行精調,使AI醫療助理的醫學用語更準確、更規范,病歷生成的準確度提升了45%,醫生的接診量提高了20%。
在這一過程中,模型蒸餾、混合專家模型(MoE)等創新技術層出不窮,為的就是在保留大模型性能的同時,減少模型的計算資源消耗。
但極致的降本不止于此。在實際業務中,企業往往需要針對特定場景定制模型,以實現成本效益最大化。
寧波傳媒就利用大模型定制開發了一套甬派記者作文AI點評助手系統?!靶∮浾邆兺秮?萬多篇投稿,寧波晚報的記者老師眼睛都要看花了,好在現在有了百度智能云的千帆ModelBuilder平臺開發的智能作文批改系統,可以直接提高作文的篩選和批改效率,還可以對作文進行AI點評,也能提出改進意見”,寧波晚報某技術負責人表示。
這套系統的背后,是基于百度智能云千帆ModelBuilder提供的模型精調模版——作文點評樣板間來實施的,同時還輔以全流程的模型訓練和精調工具鏈,以提高模型的運行效率。
不僅如此,千帆ModelBuilder也提供一站式的數據洞察和處理平臺,企業可以構建自身的數據飛輪,讓模型越用越聰明;其底層則通過百舸平臺為千帆平臺的模型訓練及模型推理提供穩定高效的算力支撐,確保穩定、極速的性能。
這些技術演進,都進一步為企業帶來了降本增效,推動著大模型的產業落地。
沙利文聯合頭豹發布的《2024年中國行業大模型市場報告》顯示,2023年中國行業大模型市場規模達105億元人民幣,2024年市場規模約為165億元,同比增長達57%,2028年市場規模有望達到624億元人民幣。
總的來看,2024年行業內通過降價、工具鏈、定制模型等一系列措施,成功打通了大模型落地的卡點,用超高的性價比迎來了產業落地需求的爆發。在這一過程中,企業對大模型成本極致的追求,也在逐步升級為提升業務的效率和核心收益,大模型技術正在走入更大的商業世界。
AI Agent:大模型應用的場景化突破
伴隨AI產業競爭進入“落地賽”的下半場,業界將目光從模型本身投向了AI應用。
2024年上半年,國內大模型項目中標大多還圍繞智算中心、模型中臺建設,從下半年起,眾多企業的招標內容全都轉向了應用,且越來越細分。
百度創始人、董事長兼首席執行官李彥宏曾公開表示,基礎模型本身是需要靠應用才能顯現出來價值。那么,AI時代應用的核心載體應該是什么?這個問題一度成為業內熱議的焦點。
在百度世界2024大會上,李彥宏公開表示“智能體是AI應用的最主流形態,即將迎來爆發點”。盡管業界對于AI Agent的定義尚未達成共識,但李彥宏的發言讓行業對AI應用的發展方向更篤定了。過去一年,國內外的云廠商、大模型廠商、運營商、軟件廠商紛紛涌入賽道,誰也不想錯過這個“香饃饃”。
毫無疑問,AI Agent成為了2024年大模型領域最耀眼的存在,其數量一度呈爆發式增長。數據顯示,截至2024年11月,千帆大模型平臺上已經幫助客戶精調了3.3萬個模型、開發了77萬個企業應用。
更讓人興奮的是,AI Agent的爆發并非虛假的繁榮,而是具備真實的市場基礎。相比大模型的昂貴,能用得起的企業并不多,AI Agent更像是一個輕量化的AI解決方案,具備自主思考、自主編排、記憶、反思等能力,能夠針對具體場景,解決特定業務問題,為企業帶來最真實的降本增效。但企業級業務容不得大的偏差。如何按照設定好的工作流來執行任務,并保證輸出的可靠性和個性化,是企業級Agent全面落地的一個巨大挑戰。
例如,在保險行業的車險續保業務場景中,讓Agent替代真人銷售就涉及很多業務難點:面對客戶最初的拒絕態度如何化解和引導?如何根據客戶歷史車險情況給出優惠政策?如何按照工作流成功引導客戶續保?
為了解決這些問題,百度智能云基于千帆AppBuilder工作流Agent探索,通過工作流編排的形式和大模型的能力,來落地車險續保售前數字員工。
這樣的工作流Agent,可以很好地避免大模型憑空發揮,同時輔以人工編排,提升執行的穩定性和可控性,在規劃調度方面的準確率能達到95%。同時,工作流Agent還具備隨時學習新知識和記憶回溯的能力,記憶準確率可達96%+,為用戶提供個性化的服務。
過去公司要培養一位這樣合格的金牌銷售至少要一兩年,但現在打造這樣一個“數字員工”,最快卻只需要一小時。這樣的工作流Agent還可以快速集成到百度搜索、微信公眾號、企業官網等業務系統中,便利觸達用戶。
當AI Agent達到了企業級的要求,一些過去AI不太可能實現的業務場景就照進了現實。而更具市場想象力的,是多Agent協作產品的推出。
2024年11月,百度發布的無代碼開發工具“秒噠”就極具代表性,由大模型直接生成代碼,不需要人寫,它門檻很低,人人可上手;通過文心大模型的思考和規劃能力,實現對不同Agent的調度和編排,這意味著每個人自己就能指揮多個Agent來協同完成任務,不用寫一行代碼,只需要用自然語言就能直接生成代碼、創建應用程序。李彥宏更是宣稱“我們將迎來一個前所未有的只靠想法就能賺錢的時代”。
“秒噠” 產品的發布,標志著AI Agent走入大眾視野中。當越來越多的人意識到AI Agent有用,應用爆發的速度就會非常快。據銀河證券研報預計,到2028年,中國AI Agent市場規模將激增至8520億元,年復合增長率達72.7%。
如果將2024年看作是AI Agent爆發前夜,那么2025年將是AI Agent落地元年。對于企業而言,會更看重AI Agent在業務場景中的效果;對于大模型廠商而言,AI Agent技術及工具鏈的支撐能力成為基本要求。
多模態:原生融合的AI交互方式
2024年,AI領域迎來了一個重要的轉折點——多模態大模型的興起。
視頻生成模型Sora的誕生,OpenAI多模態AI大模型GPT-4o的到來,百度百舸支持國內第一個全自研視頻大模型Vidu的發布等代表性事件,都讓業界看到了AI發展的新方向,多模態一下躍升為全球大模型廠商競爭的重點。
從技術上看,多模態增強了AI系統處理復雜任務的能力。比起單模態,融合了文本、圖像、音頻、視頻等多類型數據的多模態大模型,能夠提供更全面、更準確的理解和響應。
不僅如此,多模態大模型極大拓寬了AI的應用領域。過去一年,基于多模態大模型技術的創業公司如雨后春筍般誕生,文生圖片、文生視頻、文生3D、文生音樂、文生代碼等多模態應用層出不窮,智能硬件更是基于多模態煥發了新生,為市場帶來了巨大的想象空間。盡管多模態大模型勾勒的未來非常美好,但也必須承認,多模態離產業落地還有很長的一段距離。
李彥宏在百度世界2024大會上發表了類似的觀點:“過去24個月,大模型最大的變化就是基本消除了‘幻覺’,今天文字層面的RAG已經做得很好,讓大模型變得可用、可被信賴。但圖像等多模態技術要實用,也需要準確性和可控性”。
這番發言印證了業內新的探索方向:消除多模態生成幻覺,進一步提升多模態生成的可用性。
目前,iRAG是業內公認的提升模型能力的技術方向,是一種通過引入外部知識的檢索增強生成技術,能夠更好地去掉大模型的幻覺。在全球范圍內,百度的這項能力是最領先的,基于檢索增強的文生圖技術iRAG,將百度搜索的億級圖片資源跟強大的基礎模型能力相結合,可以生成各種超真實的圖片。在影視作品、漫畫作品、連續畫本、海報制作等應用場景中,iRAG可以大幅降低創作成本。
近日,百度智能云千帆大模型平臺全面上線iRAG功能,用戶可通過千帆ModelBuilder直接調用使用iRAG接口;與此同時,千帆AppBuilder提供iRAG圖片生成、文生視頻、圖生視頻等豐富的多模態組件以及數字人能力,可以在Agent中定制屬于自己的智能體分身;截止目前,千帆AppBuilder已提供90多個如百度搜索、百度地圖這樣的高質量官方組件,讓AI用上更多工具,進一步提升AI能力;消除大模型的幻覺,是AI應用爆發的基礎。展望2025年多模態大模型的發展趨勢,或許可以用一句話來總結:離幻覺更遠,離落地更近。
AI落地:從產業到行業
過去一年的激蕩,讓人們充分感受到,2024年是大模型改變世界的一年。模型能力的持續迭代與訓練成本的持續降低,智能體的蓬勃發展,多模態市場的快速增長,都在宣告一個新時代的到來。
來自市場的數據,直觀呈現出過去一年中國大模型的落地爆發。百度數據顯示,截至11月初,百度文心大模型的日均調用量超15億,相較5月披露的2億,增長7.5倍,相較一年前首次披露的5000萬次,更是增長約30倍。李彥宏感慨“這個增速超出預期”,這條陡峭的增長曲線,說明AI是真需求。
根據公開招投標數據,2024年國內大模型中標項目數量和金額都呈現大幅度增長。2024年1至11月,大模型中標項目共728個,是2023年全年的3.6倍;中標金額17.1億元,是2023年全年的2.6倍。
數據激增的背后,是AI的價值開始被看見。尤其作為領頭羊的央國企,已開始進入到更深層次的產業落地。
國家電網聯合百度打造國內首個千億級多模態電力行業大模型,為電網安全穩定運行、促進新能源消納、做好供電服務提供“超級大腦”。山東港口聯合百度打造全球首個落地應用的港口大模型,將智能化服務深入到港口管理的各個環節,打造車船貨全鏈條智能服務網絡,提升了物流供應鏈客戶服務效率。數據顯示,超過六成的央企在聯合百度智能云進行AI創新。
不僅如此,各個行業的頭部企業都在陸續跟進,許多上半年在觀望的企業,下半年開始主動尋求已成功落地的解決方案,希望在自己的業務中復制。
蔚來汽車攜手百度智能云千帆平臺共同打造了端云多模態大模型,研發了人工智能助手NOMI的問答功能,讓NOMI成為一個更懂用戶、更聰明的座艙AI伙伴?!拔覀儧]有把它當語音助手,而是人工智能的伙伴”,蔚來汽車座艙人工智能研發負責人高杰表示,隨著大模型技術的出現,NOMI的能力得到了進一步提升。
2024年,大模型已經在多個行業中實現了廣泛而深入的落地,為各行各業帶來了顯著的價值。正如百度集團執行副總裁、百度智能云事業群總裁沈抖所說,過去的一年,是大模型從技術變革走向產業變革的關鍵一年。大模型重構一切,為每個企業提供平等的增長機會。
在這輪產業變革中,大模型廠商們也迅速構建了自己的技術能力、打法體系,以百度智能云為代表的頭部廠商都構建了端到端、全鏈路的體系,從大模型底座,到企業級大模型開發平臺及全鏈條工具,再到多樣化的AI應用,充分應對用戶對大模型整體解決方案的需求。
公開數據顯示,2024年,百度智能云大模型在中標項目數、行業覆蓋數、央國企中標項目數這三個維度里均為第一,在能源、政務、金融這三個行業的中標項目數位于所有廠商第一,成為企業級應用大模型落地的主力軍。
如今,大模型仍然在快速滲透進各個行業。IDC預計,到2025年,中國的生成式AI軟件市場規模將達到35.4億美元。隨著大模型產業以驚人的速度繼續向前演進,2025年大模型市場格局必將發生新的變化,或許會帶來人類歷史上的又一次生產力躍遷。
(部分素材來源官方媒體/網絡新聞)
【關于科技云報到】
企業級IT領域Top10新媒體。聚焦云計算、人工智能、大模型、網絡安全、大數據、區塊鏈等企業級科技領域。原創文章和視頻獲工信部權威認可,是世界人工智能大會、數博會、國家網安周、可信云大會與全球云計算等大型活動的官方指定傳播媒體之一。
審核編輯 黃宇
-
AI
+關注
關注
87文章
31490瀏覽量
269931 -
大模型
+關注
關注
2文章
2541瀏覽量
3030
發布評論請先 登錄
相關推薦
評論