9月12日,由工業(yè)和信息化新聞宣傳中心承辦的“算力服務(wù)高質(zhì)量發(fā)展論壇”在2024中國國際服務(wù)貿(mào)易交易會期間召開,九章云極DataCanvas公司AI首席科學(xué)家繆旭受邀出席論壇,并發(fā)表“大模型后訓(xùn)練時代的算力服務(wù)思考”主旨演講。
本次論壇以“以算凝力,融創(chuàng)未來”為主題,匯聚來自政、產(chǎn)、學(xué)、研界多位重量嘉賓,剖析算力產(chǎn)業(yè)最發(fā)展新趨勢,分享算力基礎(chǔ)設(shè)施建設(shè)實踐經(jīng)驗,共同探討算力服務(wù)高質(zhì)量發(fā)展之道。
論壇上,繆旭先生在演講中表示,隨著基礎(chǔ)模型面臨的挑戰(zhàn)不斷升級與復(fù)雜化,大模型后訓(xùn)練模式正在崛起,成為應(yīng)對上述挑戰(zhàn)的關(guān)鍵路徑。然而后訓(xùn)練模式的復(fù)雜性與高度定制化需求,對算力資源的精準調(diào)度、靈活配置和高效利用提出了前所未有的高標(biāo)準挑戰(zhàn),企業(yè)亟需高質(zhì)量、高效能、更經(jīng)濟、更好用的算力服務(wù)新范式。
九章云極DataCanvas公司AI首席科學(xué)家繆旭發(fā)表演講
更自動、更高效、更精準,大模型后訓(xùn)練模式崛起
繆旭指出,當(dāng)前基礎(chǔ)模型發(fā)展迅猛,擁有廣泛的行業(yè)應(yīng)用潛力,但也面臨著提示詞工程復(fù)雜度高、難以規(guī)避的幻覺問題、規(guī)劃能力不足以及高昂的成本負擔(dān)等核心挑戰(zhàn)??娦癖硎?,通過大模型后訓(xùn)練策略的補足,可以有效應(yīng)對上述瓶頸。
大模型后訓(xùn)練的核心策略為,在大模型基礎(chǔ)訓(xùn)練完成后,通過使用新的數(shù)據(jù)集或任務(wù)對模型進行再次訓(xùn)練,以提高模型的適應(yīng)性和性能。這個過程通常包含提示詞設(shè)計、模型微調(diào)、embedding優(yōu)化及調(diào)度優(yōu)化等多個環(huán)節(jié)。
具體而言,大模型后訓(xùn)練的過程如下:將復(fù)雜的業(yè)務(wù)邏輯梳理并封裝成獨立的、可管理的任務(wù)模塊;隨后針對每個單一任務(wù)模塊實施精準的后訓(xùn)練微調(diào),以增強其針對特定任務(wù)的適應(yīng)性和性能。在完成模塊集成重組后,結(jié)合業(yè)務(wù)系統(tǒng)及用戶的互動反饋,持續(xù)進行自我學(xué)習(xí)和自我增強,最終實現(xiàn)模型性能自動、高效的持續(xù)提升。
大模型后訓(xùn)練方法的補足
新標(biāo)準、新需求、新模式,普惠算力開啟AI新時代
在大模型后訓(xùn)練的過程中,算力調(diào)度尤為關(guān)鍵,包括訓(xùn)練期的數(shù)據(jù)準備調(diào)度、微調(diào)任務(wù)編排,以及推理階段的動態(tài)加載和異構(gòu)算力管理。通過在調(diào)度過程中引入可訓(xùn)練的調(diào)度模型,在優(yōu)化目標(biāo)時增加效率和成本計算,結(jié)合線上、線下收集的數(shù)據(jù)持續(xù)優(yōu)化調(diào)度模型,可以從軟件層面有效提升算力調(diào)度能力,并降低計算成本,使算力應(yīng)用更加貼近實際應(yīng)用場景。
不同任務(wù)工作流的安排調(diào)度
在數(shù)據(jù)存儲與處理的關(guān)鍵環(huán)節(jié),大模型后訓(xùn)練模式對系統(tǒng)的安全性提出了更高要求,以確保算力資源能夠無縫且安全地融入各類業(yè)務(wù)系統(tǒng)。依托業(yè)務(wù)系統(tǒng)與互聯(lián)網(wǎng)的海量數(shù)據(jù)資源,以任務(wù)為驅(qū)動,大模型可以智能識別任務(wù)需求,自動收集并處理所需數(shù)據(jù),生成高質(zhì)量的微調(diào)數(shù)據(jù)集。此外,應(yīng)用存算一體架以構(gòu)可以有效降低數(shù)據(jù)傳輸?shù)膸捪?,提升?shù)據(jù)處理的整體效率與安全性。
面對不同行業(yè)、不同場景的多樣化大模型后訓(xùn)練需求,基于Alaya NeW高效的算力管理內(nèi)核,九章云極DataCanvas公司提出國際首創(chuàng)的算力服務(wù)新范式,憑借統(tǒng)一性能基準、資源管理優(yōu)化、方便估算成本收益、算力一體化等優(yōu)勢,提出了統(tǒng)一的算力服務(wù)計量單位“度”(DCU),并用其實現(xiàn)標(biāo)準化的算力計量計費,讓算力消費者輕松獲得好用、經(jīng)濟、普惠的算力服務(wù),實現(xiàn)算力資源0浪費。此外,通過提供完整的大模型+Agent開發(fā)工具鏈,Alaya NeW為各行業(yè)用戶提供靈活的大模型和AI Agent定制能力,加速人工智能技術(shù)在各領(lǐng)域的深度融合與廣泛應(yīng)用。
作為國內(nèi)領(lǐng)先的人工智能基礎(chǔ)設(shè)施提供商,九章云極DataCanvas公司將繼續(xù)堅持AI技術(shù)的自主創(chuàng)新,以領(lǐng)先的AI智算產(chǎn)品推動算力服務(wù)向更高質(zhì)量、更高水平邁進,深度賦能千行百業(yè)的數(shù)智化轉(zhuǎn)型。
-
AI
+關(guān)注
關(guān)注
87文章
30896瀏覽量
269108 -
算力
+關(guān)注
關(guān)注
1文章
977瀏覽量
14822 -
大模型
+關(guān)注
關(guān)注
2文章
2451瀏覽量
2714
發(fā)布評論請先 登錄
相關(guān)推薦
評論