如果有人問,AI大模型行業(yè),最近的風(fēng)向是什么?相信很多人都會說,是“內(nèi)卷”。
近段時間,“降價”成了大模型的第一關(guān)鍵詞。各大云服務(wù)商爭相加入AI降價潮,甚至有公司模型降價達(dá)到了97%的驚人幅度。加上廠商搶卡、模型開發(fā)者套殼,種種痕跡似乎印證著AI大模型迎來了極度“內(nèi)卷”的新風(fēng)向。
但是,這種“內(nèi)卷”的盡頭一定是不健康的。原因很簡單,我們只需要問目前的產(chǎn)業(yè)形態(tài)幾個問題:大模型的核心技術(shù)成長了嗎?大模型落地應(yīng)用更容易了嗎?產(chǎn)業(yè)中那些棘手的問題解決了嗎?如果答案都是否定的,那么以降價和內(nèi)耗為代名詞的內(nèi)卷之路,前途注定是灰暗的。
然而任何風(fēng)潮中也總有逆行者。與同質(zhì)化內(nèi)卷相對應(yīng)的,是AI大模型領(lǐng)域也潛藏著反內(nèi)卷的力量。去解決問題,去做實事的反內(nèi)卷AI之路,雖然更難,但卻更有必要。在HDC 2024,我們就看到了一朵逆行的云,一條逆行的AI之路。
(華為常務(wù)董事、華為云CEO張平安)
6月21日,華為開發(fā)者大會 2024(HDC 2024)在東莞籃球中心揭幕。期間,華為常務(wù)董事、華為云CEO張平安發(fā)布了盤古大模型5.0,在全系列、多模態(tài)、強(qiáng)思維三個方面全新升級。同時,張平安還分享了盤古大模型在自動駕駛、工業(yè)設(shè)計、建筑設(shè)計、具身智能、媒體內(nèi)容生產(chǎn)和應(yīng)用、高鐵、鋼鐵、氣象等領(lǐng)域的豐富創(chuàng)新應(yīng)用和落地實踐,持續(xù)深入行業(yè)解難題。此外,華為諾亞方舟實驗室主任姚駿、華為云CTO張宇昕分別就盤古大模型5.0訓(xùn)練過程解密和華為云全棧系統(tǒng)性創(chuàng)新發(fā)表主題演講,詳細(xì)解讀華為云在AI領(lǐng)域的全棧創(chuàng)新。
從發(fā)布盤古5.0,到展示包括AI原生基礎(chǔ)設(shè)施、AI開發(fā)平臺在內(nèi)的AI全棧創(chuàng)新,我們能夠看到華為云選擇了做AI大模型領(lǐng)域最難的事,把AI能力從紙面引到真實的生產(chǎn)場景中來。這種行動方案,可以總結(jié)為用技術(shù)能力的外溢,反對零和博弈的內(nèi)卷。
以前有句歌詞,叫做“走的是人間的道,扛的是頂風(fēng)的旗”。
想要AI走人間的道,需要云廠商扛起頂風(fēng)的旗。
AI大潮前:順風(fēng)內(nèi)卷,還是逆風(fēng)扛旗?
目前階段,AI大模型技術(shù)已經(jīng)成為各國競爭的科技戰(zhàn)略高點,同時也成為科技企業(yè)通向下一個時代的船票。全球范圍內(nèi),可謂無地不AI,無行業(yè)不AI。
但在熱潮之下,一系列由過快增長帶來的“內(nèi)卷”現(xiàn)象卻表現(xiàn)得淋漓盡致。
首先,各大云服務(wù)商掀起了大模型價格戰(zhàn),以非常不健康的降價模式期望短期內(nèi)聚攏用戶,實現(xiàn)行業(yè)競爭的目標(biāo)。在這背后,是大模型難以真正走入企業(yè)應(yīng)用,不能解決實際的產(chǎn)業(yè)問題,進(jìn)而導(dǎo)致商業(yè)空間受限,云廠商不得已轉(zhuǎn)向以低價換規(guī)模的策略。
其次,在大模型降價的態(tài)勢下,廠商能夠投入的技術(shù)研發(fā)能力越來越少,變成了惡性循環(huán),導(dǎo)致出現(xiàn)了大量以開源模型相互套殼等不良競爭現(xiàn)象。這些極端現(xiàn)象所折射的,是模型同質(zhì)化過高,核心技術(shù)缺乏發(fā)展路徑,進(jìn)而出現(xiàn)了不卷能力,不卷應(yīng)用,只卷面數(shù)據(jù)和價格現(xiàn)象。
此外,整個中國AI產(chǎn)業(yè)面對著AI算力供應(yīng)短缺,AI算力基礎(chǔ)設(shè)施進(jìn)口限制不斷加碼的問題。整個產(chǎn)業(yè)出現(xiàn)了長期的AI算力荒,亟需可持續(xù)供應(yīng)的自主AI算力。
上游基礎(chǔ)設(shè)施不穩(wěn)定,中間層核心技術(shù)不發(fā)展,下游產(chǎn)業(yè)場景進(jìn)不去。在這種情況下,AI大模型領(lǐng)域的“順風(fēng)局”開始變味。似乎大模型不是為了用,而僅僅是為了行業(yè)競爭而存在。
這個時候,我們也都知道產(chǎn)業(yè)需要一些逆行者站出來,來實際解決全行業(yè)面對的共性問題,來引導(dǎo)大模型核心技術(shù)與產(chǎn)業(yè)需求對齊,通過技術(shù)能力外溢的方式來拓展大模型的產(chǎn)業(yè)邊界。
想要實現(xiàn)這個“逆行”,就必須把一面旗幟打出來。
這面旗幟,就是AI核心技術(shù)的自主創(chuàng)新,是從算力到工具,再到模型和行業(yè)場景的全棧AI能力建設(shè)。
華為云,選擇逆行于AI行業(yè)的“內(nèi)卷”之風(fēng),選擇讓全棧AI的旗幟獵獵作響。
智能要致用:推動盤古5.0升級
大模型內(nèi)卷嚴(yán)重,最核心的問題在于模型能力的高度同質(zhì)化,而大模型之間的雷同感,問題根源在于缺少升級的方向。大家只能參考海外比較流行的大模型能力,最終導(dǎo)致能力差異化被稀釋。
而華為云在打造盤古大模型過程中的不同之處在于,是他們找到了源源不斷的AI能力升級目標(biāo),那就是“用”,是千行萬業(yè)的真實的智能化需求。不能讓大模型停留于測試和理念,要讓它走出去,走向行業(yè)場景,走向企業(yè)需求,然后才能厘清AI的價值是什么,問題是什么,進(jìn)而找到行之有效的升級之路。
在盤古大模型從3.0到5.0版本的升級過程中,進(jìn)一步印證了以深入行業(yè)場景為目標(biāo)的大模型升級思路。整體而言,盤古5.0在三方面實現(xiàn)升級:
1.多模態(tài)能力提升。
盤古大模型5.0能夠更好更精準(zhǔn)地理解物理世界,包括文本、圖片、視頻、雷達(dá)、紅外、遙感等更多模態(tài)。在圖片和視頻識別方面,可支持10K超高分辨率;在內(nèi)容生成方面,采用業(yè)界首創(chuàng)的STCG(Spatio Temporal Controllable Generation,可控時空生成)技術(shù),聚焦自動駕駛、工業(yè)制造、建筑等多個行業(yè)場景,可生成更加符合物理規(guī)律的多模態(tài)內(nèi)容。
比如盤古5.0可以通過輸入華為公司的年度報表,準(zhǔn)確回答華為云的收入和增長情況。通過衛(wèi)星圖片找到細(xì)微的地表變化,通過巨大的病理照片找到我們想要的病菌的數(shù)量級。同時,盤古5.0還可以基于多種模態(tài)的輸入信息來思考,并且支持將輸入的2D圖片在3D空間中進(jìn)行推理。
升級多模態(tài)能力的核心驅(qū)動力,在于真實的行業(yè)場景就是多模態(tài)的。只有讓大模型看懂物理世界,看懂圖標(biāo)和數(shù)據(jù),在巨大信息中尋求細(xì)節(jié),大模型才能真正成為生產(chǎn)中的作業(yè)工具,成為能夠沉浸到行業(yè)需求中的智能化引擎。
2.全系列模型打造。
在HDC 2024期間,華為終端、鴻蒙操作系統(tǒng)與盤古大模型5.0的結(jié)合備受矚目。背后的技術(shù)升級在于,盤古5.0推出了不同參數(shù)規(guī)格的模型,可以適配不同的業(yè)務(wù)場景。十億級參數(shù)的Pangu E系列可支撐手機(jī)、PC等端側(cè)的智能應(yīng)用;百億級參數(shù)的Pangu P系列,適用于低時延、高效率的推理場景;千億級參數(shù)的Pangu U系列適用于處理復(fù)雜任務(wù);萬億級參數(shù)的Pangu S系列超級大模型能夠幫助企業(yè)處理更為復(fù)雜的跨領(lǐng)域多任務(wù)。
在真實的應(yīng)用場景中,企業(yè)需要在不同類型、不同環(huán)境中部署大模型,并且需要進(jìn)行比較復(fù)雜的跨領(lǐng)域協(xié)同。盤古5.0的全系列模型打造,也讓其能力進(jìn)一步深入行業(yè)場景,成為更加可用的大模型體系。
3.著重強(qiáng)化思維能力。
盤古5.0還在邏輯推理方面進(jìn)行了極大升級,將思維鏈技術(shù)與策略搜索深度結(jié)合,極大提升了數(shù)學(xué)能力、復(fù)雜任務(wù)規(guī)劃能力,以及工具調(diào)用能力。思維鏈幫助智能體(如機(jī)器人)更好地理解和預(yù)測環(huán)境變化,而“策略搜索”是智能體用來適應(yīng)這些變化并做出決策的過程。兩者共同作用,使得智能體能夠在復(fù)雜環(huán)境中進(jìn)行有效地學(xué)習(xí)和決策。對于真實的生產(chǎn)場景來說,任務(wù)往往是復(fù)雜多樣,且需要隨時調(diào)整的。大模型必須具有足夠復(fù)雜的思維推理能力,才能夠真正走向企業(yè)的核心生產(chǎn)環(huán)節(jié)。
總結(jié)一下,我們可以發(fā)現(xiàn)盤古5.0做了這樣三件事:
適配行業(yè)需求,提升AI理解物理世界的核心能力。
適配應(yīng)用場景,打造多樣化的模型參數(shù)規(guī)格。
適配企業(yè)業(yè)務(wù),實現(xiàn)思維推理能力的升級進(jìn)化。
這些能力都以在真正的行業(yè)與企業(yè)中“能用”“好用”“有用”為目標(biāo),進(jìn)而來驅(qū)動智能化的前進(jìn)。
張平安強(qiáng)調(diào),一直以來,華為云盤古大模型都堅定的聚焦行業(yè),在解難題、做難事的道路上不斷攻堅克難,砥礪前行,重塑千行萬業(yè)。華為云將與所有的客戶、伙伴和開發(fā)者一起,創(chuàng)新不止,攀登不止,讓云無處不在,讓智能無所不及,加速千行萬業(yè)的智能升級。
久久方為功:扛起全棧創(chuàng)新的旗幟
在模型適配行業(yè)場景的同時,企業(yè)面對的另一個問題在于基礎(chǔ)設(shè)施的薄弱。算力匱乏、工具缺失、基礎(chǔ)設(shè)施能力不匹配,每一項缺口都可能造成大模型落地過程中的木桶效應(yīng)。反而言之,如果云計算廠商不能夠解決這些核心問題,一味“內(nèi)卷”大模型的價格與紙面上的創(chuàng)新,也只會讓大模型距離真正的商業(yè)閉環(huán)越來越遠(yuǎn),進(jìn)而造成技術(shù)與應(yīng)用的脫節(jié)。
唯有AI全棧創(chuàng)新,才是大模型發(fā)展的正道,也是反內(nèi)卷的旗幟。
今天的華為云,更加堅定地舉起了這面旗幟,帶來了包括昇騰AI云服務(wù)、AI原生基礎(chǔ)設(shè)施、AI開發(fā)平臺在內(nèi)的AI全棧創(chuàng)新。
在算力層面,華為云對昇騰AI云服務(wù)進(jìn)行持續(xù)優(yōu)化,打造了貴州、內(nèi)蒙古和安徽三大核心樞紐,構(gòu)建了算力一張網(wǎng),以此滿足全國的算力需求。
同時,昇騰AI云服務(wù)可以做到40天萬億參數(shù)模型訓(xùn)練無中斷,遠(yuǎn)超業(yè)界普遍水平的2.8天,集群故障恢復(fù)速度只需10分鐘,遠(yuǎn)低于業(yè)界的60分鐘。目前,昇騰AI云服務(wù)已經(jīng)服務(wù)超過600家企業(yè)客戶,全面適配100個行業(yè)主流大模型,以云服務(wù)的方式破解了AI算力匱乏與缺乏自主化的難題。
而在AI全棧創(chuàng)新層面,華為云希望通過云系統(tǒng)創(chuàng)新,打造AI Native的云。
華為云CTO張宇昕表示,通過全棧系統(tǒng)性創(chuàng)新,能夠讓大模型的數(shù)據(jù)準(zhǔn)備、訓(xùn)練、推理、應(yīng)用實現(xiàn)全流程的高效率和高性能。華為云的全棧系統(tǒng)性創(chuàng)新覆蓋了數(shù)據(jù)中心、云平臺架構(gòu)和基礎(chǔ)設(shè)施服務(wù),為 AI 開發(fā)提供 AI Native 的基礎(chǔ)設(shè)施。
一方面,華為云踐行“Cloud for AI”,通過全棧系統(tǒng)性創(chuàng)新,實現(xiàn)大模型的數(shù)據(jù)準(zhǔn)備、訓(xùn)練、推理、應(yīng)用的全流程高效率和高性能。華為云的創(chuàng)新覆蓋了數(shù)據(jù)中心、云平臺架構(gòu)和基礎(chǔ)設(shè)施服務(wù),為AI開發(fā)提供AI Native的基礎(chǔ)設(shè)施。
另一方面,華為云還希望做到“AI for Cloud”,華為云將盤古大模型和華為在產(chǎn)品研發(fā)、數(shù)據(jù)治理、安全防護(hù)、業(yè)務(wù)運維等各個領(lǐng)域積累的數(shù)據(jù)和經(jīng)驗相結(jié)合,將華為云的服務(wù)重塑、升級,讓華為云更智能、更高效。
圍繞AI Native的云這一目標(biāo),在基礎(chǔ)設(shè)施方面,華為云打造了下一代云基礎(chǔ)設(shè)施CloudMatrix,其能夠改變傳統(tǒng)數(shù)據(jù)中心的架構(gòu)和算力供給模式,將傳統(tǒng)的以CPU為中心的主從架構(gòu),演進(jìn)為多元算力對等全互聯(lián)架構(gòu),并通過高速互聯(lián)網(wǎng)絡(luò)協(xié)議,將CPU、NPU、GPU等算力資源全部互聯(lián)和池化,從而把AI算力從單體算力演進(jìn)到矩陣算力。在存儲方面,華為云首創(chuàng)的EMS彈性內(nèi)存存儲服務(wù),通過在NPU卡和持久化存儲兩層間增加彈性內(nèi)存存儲層,基于Memory Pooling專利技術(shù),通過顯存擴(kuò)展、算力卸載、以存代算等三大手段來打破內(nèi)存墻,釋放極致算力。
從算力到存儲,從開發(fā)工具到大模型本身,華為云已經(jīng)構(gòu)筑起了全棧創(chuàng)新,沒有短板的AI基礎(chǔ)設(shè)施能力。
面向真行業(yè),解決真問題,實現(xiàn)真落地。這或許是華為云的“逆行”,卻是千行萬業(yè)的渴望。
人間是盛景:讓AI走上行業(yè)的道
如今,華為云的AI能力服務(wù)范疇正在不斷拓展,從AI大模型風(fēng)潮中收益的行業(yè)和企業(yè),正在與日俱增。
在HDC 2024,我們又可以看到一些全新的行業(yè)完成了基于華為云AI全棧創(chuàng)新的智能化飛躍。
比如說,在鋼鐵領(lǐng)域大名鼎鼎的寶武鋼鐵,就通過攜手華為云打造鋼鐵大模型,實現(xiàn)了智能化水平的極大提升。
鋼鐵生產(chǎn)流程主要包括高爐、轉(zhuǎn)爐、連鑄、軋制工藝流程,目前華為云的AI方案在高爐煉鐵和熱軋鋼帶兩個環(huán)節(jié)中已經(jīng)得到了有效利用。寶武集團(tuán)跟華為云合作,用AI大模型實現(xiàn)高爐指標(biāo)預(yù)測,高爐爐況評估,進(jìn)而實現(xiàn)對高爐工況進(jìn)行優(yōu)化,降低高爐能耗,提升高爐產(chǎn)能。雙方團(tuán)隊合作之下,就大模型在高爐煉鐵的應(yīng)用梳理出了7大場景,包括焦煤配煤優(yōu)化、高爐爐溫預(yù)測、燃料配比優(yōu)化等。最終實踐表明,盤古大模型在高爐爐況優(yōu)化場景預(yù)計每年可以為寶鋼降本超過10億元。
高鐵已經(jīng)是我們每個人生活的一部分。截至2023年底,中國高鐵里程達(dá)到4.5萬公里,居世界第一。在高鐵運營工作中,動車巡檢需要人工實施,涉及眾多檢查項,工作量巨大。
一列16編組動車有超過3.2萬個故障檢測項點,覆蓋了8大類型、350多種故障,諸如變形、異物、松動、丟失、斷裂、擦傷、漏油、超限等故障,傳統(tǒng)的故障識別方法需要大量人工工作。
北鐵所與華為云攜手,將華為云盤古鐵路大模型應(yīng)用于高鐵巡檢機(jī)器人,實現(xiàn)了動車檢測的智能化落地,為動車檢測帶來了更多價值,不僅將巡檢工人從繁重的勞動中解放出來,還大幅提升了檢測效率和檢測準(zhǔn)確率。
北鐵所聯(lián)合華為云采用國內(nèi)首創(chuàng)的二維圖片+三維點云+激光光譜等多模態(tài)融合診斷技術(shù),能精準(zhǔn)識別超限、異物等各種復(fù)雜故障。多模態(tài)融合診斷比起單模態(tài),故障識別準(zhǔn)確率可提升到98%以上,為鐵路行業(yè)帶來了一種全新的發(fā)展思路。
在工業(yè)、礦山、媒體、生物制藥等領(lǐng)域,都可以見到華為云的AI能力深入其中,為行業(yè)帶來直觀且清晰的價值。
對于大模型來說,紙上談兵只能曇花一現(xiàn)。只有深入行業(yè),深入真正的人間煙火,才能激活獨屬于它的盛景。華為云或許逆行于大模型的“內(nèi)卷”之風(fēng),但行走在千行萬業(yè)的智能化正道。
讓雙手做事,讓雙腳沾泥。
讓全棧AI的旗幟獵獵作響。
智能化不是在狹小的空間中零和博弈,而是要用技術(shù)去丈量四野八荒。
審核編輯 黃宇
-
AI
+關(guān)注
關(guān)注
87文章
30887瀏覽量
269068 -
華為云
+關(guān)注
關(guān)注
3文章
2491瀏覽量
17426 -
昇騰
+關(guān)注
關(guān)注
1文章
136瀏覽量
6605 -
大模型
+關(guān)注
關(guān)注
2文章
2448瀏覽量
2701
發(fā)布評論請先 登錄
相關(guān)推薦
評論