最近,國(guó)產(chǎn)第一部3A游戲大作《黑神話:悟空》問(wèn)世,引發(fā)了全網(wǎng)熱潮。游戲中的主角,重走西游之路,克服重重難關(guān),向世界展現(xiàn)了中國(guó)文化的絕美與中國(guó)科技的自信。
而在現(xiàn)實(shí)當(dāng)中,通往產(chǎn)業(yè)智能化的AI之路,同樣可以說(shuō)是一條取經(jīng)之路。廣大行業(yè)大模型開(kāi)發(fā)者,也像“取經(jīng)人”一樣需要跨越重重難關(guān),克服九九八十一難。那么,誰(shuí)能來(lái)幫助他們攻克艱險(xiǎn),踏上靈山?
9月4日,天翼云在線上舉辦了息壤一體化智算服務(wù)平臺(tái)大模型訓(xùn)推服務(wù)能力升級(jí)發(fā)布會(huì)。面向行業(yè)大模型的真實(shí)開(kāi)發(fā)需求與應(yīng)用場(chǎng)景,天翼云將2023年推出的智算服務(wù)平臺(tái)進(jìn)行了升級(jí)與革新,從而能夠?yàn)榇竽P烷_(kāi)發(fā)訓(xùn)練、行業(yè)模型微調(diào)提供全生命周期的工具鏈。
經(jīng)過(guò)一年的精進(jìn),天翼云智算服務(wù)平臺(tái)具有全流程覆蓋、全方位支持、適配國(guó)內(nèi)行業(yè)大模型AI開(kāi)發(fā)需求的特性。旨在簡(jiǎn)化大模型從訓(xùn)練到部署整個(gè)流程的息壤一體化智算服務(wù)平臺(tái),已經(jīng)可以在AI取經(jīng)之路上,助力每一位行業(yè)大模型開(kāi)發(fā)者“取經(jīng)人”。
作為云服務(wù)國(guó)家隊(duì),天翼云所打造的息壤一體化智算服務(wù)平臺(tái)訓(xùn)推服務(wù)能力的躍遷,正在幫助中國(guó)AI開(kāi)發(fā)者踏上智能化之路,盎然西行,直面天命。
就像西天取經(jīng)之路一樣,大模型開(kāi)發(fā)者與千行百業(yè)的AI進(jìn)階之路,需要面臨重重艱險(xiǎn)。從AI大模型訓(xùn)練所需的數(shù)據(jù)準(zhǔn)備,到模型訓(xùn)練、推理部署,每一個(gè)環(huán)節(jié)對(duì)于行業(yè)大模型開(kāi)發(fā)者來(lái)說(shuō)都蘊(yùn)藏著不小的挑戰(zhàn)。我們可以揀選具有代表性的幾個(gè)“AI取經(jīng)難關(guān)”進(jìn)行討論:
1.數(shù)據(jù)的黑風(fēng)山。
AI大模型訓(xùn)練需要大量高質(zhì)量數(shù)據(jù),但對(duì)于行業(yè)大模型開(kāi)發(fā)者來(lái)說(shuō),AI所需的優(yōu)質(zhì)數(shù)據(jù)獲取難度其實(shí)是非常大的。在各行各業(yè)中,數(shù)據(jù)資源呈現(xiàn)出極其有限,且分布非常分散的特點(diǎn)。在收集到一定的數(shù)據(jù)之后,開(kāi)發(fā)者還需要面對(duì)數(shù)據(jù)標(biāo)注、數(shù)據(jù)清洗等一系列工作,開(kāi)發(fā)成本極大。除此之外,行業(yè)大模型開(kāi)發(fā)者還需要與行業(yè)內(nèi)的專家緊密配合,從而將專業(yè)知識(shí)與AI算法進(jìn)行緊密結(jié)合。這些行業(yè)數(shù)據(jù)相關(guān)的難題,構(gòu)成了一座重重險(xiǎn)阻的“黑風(fēng)山”,成為阻擋開(kāi)發(fā)者踏上AI取經(jīng)路的第一道難關(guān)。
2.訓(xùn)練的獅駝嶺。
在化解數(shù)據(jù)難題之后,開(kāi)發(fā)者還需要面對(duì)AI大模型訓(xùn)練這個(gè)關(guān)鍵環(huán)節(jié),而這個(gè)環(huán)節(jié)也是綜合成本開(kāi)銷最大,且不確定性最高的一個(gè)。
對(duì)于行業(yè)大模型開(kāi)發(fā)者來(lái)說(shuō),大模型訓(xùn)練面臨著AI算力稀缺的核心問(wèn)題,而在極高的AI算力成本之下,還需要應(yīng)對(duì)傳統(tǒng)算子運(yùn)行效率差、訓(xùn)練集群故障多、故障定位與恢復(fù)時(shí)間漫長(zhǎng)等重重困難。極高的訓(xùn)練難度和訓(xùn)練穩(wěn)定性,成為困擾大模型智能化發(fā)展的高山。
3.模型的通天河。
對(duì)于眾多行業(yè)領(lǐng)域來(lái)說(shuō),進(jìn)行獨(dú)立的大模型研發(fā)并非唯一選擇,如果能夠基于先進(jìn)、成熟的大模型再結(jié)合自身行業(yè)所需進(jìn)行“定制化”開(kāi)發(fā)可取得事半功倍的效果。然而在這種需求下,行業(yè)模型開(kāi)發(fā)者也面臨著業(yè)界優(yōu)秀的模型與模型應(yīng)用實(shí)踐難以獲取,模型的本地化水平低等問(wèn)題。模型的應(yīng)用部署,限制住了大模型在行業(yè)智能化的“最后一公里”。
能不能找到一個(gè)方法,連續(xù)攻克這重重難關(guān),給予行業(yè)大模型開(kāi)發(fā)者一站式的幫助?
面對(duì)這個(gè)問(wèn)題,能夠一站式全流程覆蓋的智算服務(wù)平臺(tái)成為關(guān)鍵的答案。天翼云對(duì)息壤一體化智算服務(wù)平臺(tái)訓(xùn)推服務(wù)能力的升級(jí),就是希望瞄準(zhǔn)真實(shí)的行業(yè)大模型開(kāi)發(fā),與開(kāi)發(fā)者一起踏破AI取經(jīng)的九九八十一難。
西天取經(jīng)需要一步步走,一關(guān)關(guān)過(guò)。對(duì)行業(yè)大模型開(kāi)發(fā)的賦能,也需要了解每個(gè)環(huán)節(jié)行業(yè)大模型開(kāi)發(fā)者真正面對(duì)的挑戰(zhàn),給出具有突破性的解決方案。
息壤一體化智算服務(wù)平臺(tái)訓(xùn)推服務(wù)能力升級(jí)的特點(diǎn),就是洞察真實(shí)的行業(yè)AI大模型開(kāi)發(fā)工作的訴求,針對(duì)每個(gè)環(huán)節(jié)都給出對(duì)應(yīng)的解法。我們可以將天翼云息壤一體化智算服務(wù)平臺(tái)訓(xùn)推服務(wù)能力的演進(jìn),分為多個(gè)層面進(jìn)行理解。看看天翼云如何幫助AI路上的“取經(jīng)人”,一步步踏碎AI難關(guān),走上陽(yáng)關(guān)大道。
1.筋斗云,翻越模型天塹。
智算服務(wù)平臺(tái)對(duì)行業(yè)智能化的賦能,首先需要提供完善、優(yōu)質(zhì)的大模型。天翼云在息壤一體化智算服務(wù)平臺(tái)打造的大模型庫(kù),擁有國(guó)內(nèi)領(lǐng)先的豐富大模型。其中包含Llama系列、Qwen系列、智譜系列、書(shū)生浦語(yǔ)系列等眾多主流大模型,涵蓋不同參數(shù)量級(jí),供用戶靈活選擇。在原來(lái)29個(gè)模型的基礎(chǔ)之上,本次新增上線重量級(jí)商業(yè)閉源大語(yǔ)言模型Baichuan4、主流開(kāi)源大語(yǔ)言模型書(shū)生浦語(yǔ)2系列的InternLM2-Chat-7B和InternLM2-Chat-20B、圖文多模態(tài)大模型Qwen-VL-Chat,以及Qwen2系列、Qwen1.5系列和Llama3系列的諸多模型。在這樣的大模型陣容下,各行業(yè)可以輕松調(diào)用到符合自身需求的大模型,快速實(shí)現(xiàn)大模型到行業(yè)場(chǎng)景的孵化。
2.七十二變,化身數(shù)據(jù)萬(wàn)千。
在困擾行業(yè)大模型開(kāi)發(fā)者的數(shù)據(jù)工作中,息壤一體化智算服務(wù)平臺(tái)內(nèi)置了專業(yè)的大模型數(shù)據(jù)集。中國(guó)電信在數(shù)據(jù)發(fā)展上開(kāi)展的算數(shù)融合工程,首批推出超120萬(wàn)對(duì)文本和語(yǔ)義識(shí)別類通用大模型訓(xùn)練所必需的問(wèn)答對(duì)數(shù)據(jù),主要面向客服問(wèn)答場(chǎng)景,解決了大量中小型企業(yè)訓(xùn)練數(shù)據(jù)不足的難題。
尤其需要注意的是,息壤一體化智算服務(wù)平臺(tái)內(nèi)置的數(shù)據(jù)集,在數(shù)據(jù)來(lái)源上經(jīng)過(guò)了嚴(yán)格的審核,可以確保數(shù)據(jù)的準(zhǔn)確性與真實(shí)性,并且通過(guò)多維度的數(shù)據(jù)驗(yàn)證,確保了數(shù)據(jù)集的完整性與一致性。行業(yè)大模型開(kāi)發(fā)者可以獲得高質(zhì)量的數(shù)據(jù)支持,并且在該平臺(tái)中直接將數(shù)據(jù)應(yīng)用到訓(xùn)練、推理任務(wù)中。化身千萬(wàn)的數(shù)據(jù)集,就像齊天大圣的七十二變,可以帶來(lái)堪稱神奇的大模型訓(xùn)練效果。
3.金箍棒,打出最強(qiáng)訓(xùn)練。
面對(duì)開(kāi)發(fā)者在大模型訓(xùn)練中的系列痛點(diǎn), 天翼云在北京、上海建成兩個(gè)萬(wàn)卡規(guī)模的公共智算中心,并在其資源池上搭載了息壤一體化智算服務(wù)平臺(tái),使其成為國(guó)內(nèi)首個(gè)單集群萬(wàn)卡國(guó)產(chǎn)化全功能預(yù)訓(xùn)練云服務(wù)平臺(tái),可支持目前業(yè)內(nèi)最大參數(shù)規(guī)模開(kāi)源單體稠密模型Llama3 405B在內(nèi)的大模型訓(xùn)練。訓(xùn)練測(cè)試結(jié)果顯示,Llama3 405B模型集群有效計(jì)算效率MFU在國(guó)產(chǎn)化萬(wàn)卡規(guī)模情況下達(dá)到43%,達(dá)到業(yè)界領(lǐng)先水平。
息壤一體化智算服務(wù)平臺(tái)具有全鏈路故障感知和恢復(fù)、全鏈路日志監(jiān)控和斷點(diǎn)續(xù)訓(xùn)等核心技術(shù),能夠?qū)崿F(xiàn)1分鐘檢測(cè)、5分鐘定位、1分鐘內(nèi)告警,本次平臺(tái)升級(jí)還增加了網(wǎng)絡(luò)I/O監(jiān)控,為訓(xùn)練穩(wěn)定性添加了保障。在斷點(diǎn)續(xù)訓(xùn)方面,在Llama2-70b模型萬(wàn)卡規(guī)模測(cè)試場(chǎng)景下,在主機(jī)故障、NPU卡故障、進(jìn)程退出故障、網(wǎng)絡(luò)超時(shí)故障四大類具體場(chǎng)景下斷點(diǎn)續(xù)訓(xùn)測(cè)試平均秒級(jí)故障檢測(cè),分鐘級(jí)故障定位和自動(dòng)化處理,分鐘級(jí)訓(xùn)練恢復(fù),其能力達(dá)到行業(yè)前沿水平。此次平臺(tái)升級(jí)還新增了對(duì)芯片故障的優(yōu)雅容錯(cuò),能夠做到無(wú)需重調(diào)度直接修復(fù)節(jié)點(diǎn)故障。目前,智算服務(wù)平臺(tái)已經(jīng)應(yīng)用于大量用戶的訓(xùn)推場(chǎng)景,如深圳市智算中心、人工智能實(shí)驗(yàn)室等。
4、火眼金睛,勘破場(chǎng)景應(yīng)用。
面對(duì)不同行業(yè)、不同企業(yè)的多樣化大模型應(yīng)用場(chǎng)景,息壤一體化智算服務(wù)平臺(tái)做了深度的洞察,就像點(diǎn)亮了“火眼金睛”,看到不同行業(yè)與企業(yè)對(duì)大模型的真實(shí)期待。
無(wú)論是具備深厚專業(yè)背景的行業(yè)客戶,還是對(duì)大模型推訓(xùn)能力有嚴(yán)格要求的大模型廠商,都可以通過(guò)息壤一體化智算服務(wù)平臺(tái)獲得準(zhǔn)確的支持,可通過(guò)直接調(diào)用預(yù)置的大模型服務(wù),使得開(kāi)發(fā)者能夠輕松地將先進(jìn)的AI技術(shù)集成到自己的業(yè)務(wù)中。
如今,AI取經(jīng)之路上行者不絕,息壤一體化智算服務(wù)平臺(tái)訓(xùn)推服務(wù)能力也為諸多“取經(jīng)人”提供了深層次的幫助。
比如說(shuō),中醫(yī)與大模型的結(jié)合,是近段時(shí)期的產(chǎn)業(yè)熱點(diǎn)話題。中國(guó)中醫(yī)科學(xué)院中醫(yī)藥信息研究所與天翼云合作,共同探索AI+中醫(yī)藥應(yīng)用創(chuàng)新。在中醫(yī)垂類大模型的微調(diào)、應(yīng)用發(fā)布平臺(tái)等環(huán)節(jié)中,天翼云提供的息壤一體化智算服務(wù)平臺(tái)為中醫(yī)藥信息研究所提供了多樣化的算法支持與模型優(yōu)化工具,幫助大模型能夠更好地挖掘中醫(yī)藥數(shù)據(jù)的潛在價(jià)值,實(shí)現(xiàn)中醫(yī)瑰寶與AI技術(shù)的融合發(fā)展。
這些真實(shí)的大模型落地場(chǎng)景,證明了息壤一體化智算服務(wù)平臺(tái)為行業(yè)智能化帶來(lái)的有力推助。作為國(guó)家云的天翼云,正在通過(guò)智算服務(wù)踏碎AI難關(guān),助力行業(yè)大模型開(kāi)發(fā)順利西行。
讓每一位“AI取經(jīng)人”都找到契合的產(chǎn)業(yè)助力,離不開(kāi)圍繞智算平臺(tái)的生態(tài)建設(shè)。基于平臺(tái)能力,天翼云聯(lián)合伙伴上線了魔樂(lè)(Modelers.cn)開(kāi)發(fā)者社區(qū)。
魔樂(lè)開(kāi)發(fā)者社區(qū)真實(shí)貼合了中國(guó)的產(chǎn)業(yè)智能化環(huán)境,以及中國(guó)AI開(kāi)發(fā)者的需求。就像《黑神話:悟空》展示的中國(guó)文化底蘊(yùn)那樣,天翼云承載國(guó)家云之責(zé),不斷加速構(gòu)建滿足AI產(chǎn)業(yè)發(fā)展所需的智算社區(qū)。具體而言,社區(qū)具有三大特色:
1.極致易用的工具鏈。
魔樂(lè)開(kāi)發(fā)者社區(qū)能夠提供高易用性的API,快速實(shí)現(xiàn)開(kāi)發(fā)者和研究人員的創(chuàng)意,并且支持千款大模型一鍵式離線復(fù)現(xiàn),使能開(kāi)發(fā)者快速搭建開(kāi)發(fā)環(huán)境,構(gòu)建AI應(yīng)用。
2.中文優(yōu)質(zhì)AI資源。
魔樂(lè)開(kāi)發(fā)者社區(qū)已經(jīng)擁有超過(guò)1000個(gè)大模型,構(gòu)建了5大專區(qū),能夠?yàn)殚_(kāi)發(fā)者提供通義千問(wèn)、chatGLM、百川、書(shū)生系列、星辰Telechat等主流中文大模型資源。
3.國(guó)產(chǎn)化算力使能。
面對(duì)國(guó)產(chǎn)化AI算力需求的發(fā)展,魔樂(lè)開(kāi)發(fā)者社區(qū)還構(gòu)建了體驗(yàn)空間,提供限時(shí)免費(fèi)的國(guó)產(chǎn)化算力資源,支持MindSpeed、Accelerator等加速庫(kù),應(yīng)對(duì)大模型時(shí)代分布式訓(xùn)練的挑戰(zhàn),顯著提升大模型訓(xùn)練效率。
面向著數(shù)據(jù)、訓(xùn)練、推理的重重AI難關(guān),天翼云選擇步步前行,關(guān)關(guān)踏破。
經(jīng)過(guò)不斷的精進(jìn)升級(jí),天翼云智算服務(wù)平臺(tái)已經(jīng)在技術(shù)能力、資源積累、生態(tài)構(gòu)建等方面展露出了極高的產(chǎn)業(yè)化水準(zhǔn)。伴隨各個(gè)領(lǐng)域的行業(yè)大模型開(kāi)發(fā)者對(duì)智算服務(wù)平臺(tái)的深度應(yīng)用,產(chǎn)業(yè)智能化的路途正在變得愈發(fā)順?biāo)欤巴靖庸饷鳌?/p>
踏智能路,選國(guó)家云。隨著天翼云的息壤一體化智算服務(wù)平臺(tái)訓(xùn)推服務(wù)能力的不斷升級(jí)完善,會(huì)讓每一位行業(yè)大模型開(kāi)發(fā)者在AI世界中,都成為自己故事中的“取經(jīng)人”。
審核編輯 黃宇
-
AI
+關(guān)注
關(guān)注
87文章
30887瀏覽量
269070 -
AI算力
+關(guān)注
關(guān)注
0文章
72瀏覽量
8676 -
大模型
+關(guān)注
關(guān)注
2文章
2448瀏覽量
2703
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論