完美世界辰东,完美的世界 1993 电影,风凌天下

在10月29日由中國(guó)電子工業(yè)標(biāo)準(zhǔn)化技術(shù)協(xié)會(huì)舉辦的數(shù)據(jù)存儲(chǔ)專業(yè)委員會(huì)（簡(jiǎn)稱“數(shù)據(jù)存儲(chǔ)專委會(huì)”）成立大會(huì)上，匯聚了產(chǎn)業(yè)界代表、專委會(huì)成員及多位院士專家，共逾百人，共同探討了數(shù)據(jù)存儲(chǔ)產(chǎn)業(yè)的發(fā)展，并見(jiàn)證了數(shù)據(jù)存儲(chǔ)專業(yè)委員會(huì)的正式成立。會(huì)上，中國(guó)工程院院士、數(shù)據(jù)存儲(chǔ)專委會(huì)名譽(yù)會(huì)長(zhǎng)鄭緯民發(fā)表了題為“AI存儲(chǔ)：人工智能大模型的基石”的主旨演講。

鄭緯民院士指出，人工智能進(jìn)入大模型時(shí)代展現(xiàn)出兩大特征：一是基礎(chǔ)大模型邁入多模態(tài)時(shí)代，實(shí)現(xiàn)了從單一文本到圖片、視頻等多模態(tài)信息的綜合應(yīng)用；二是大模型已在金融、醫(yī)療、智能制造等多個(gè)領(lǐng)域得到實(shí)際應(yīng)用。

針對(duì)大模型的四個(gè)關(guān)鍵環(huán)節(jié)，鄭緯民院士詳細(xì)闡述了存儲(chǔ)在大模型訓(xùn)練和推理應(yīng)用中所面臨的挑戰(zhàn)及相關(guān)技術(shù)：

首先，數(shù)據(jù)獲取階段，大模型訓(xùn)練需要海量的原始數(shù)據(jù)，這些數(shù)據(jù)需被存儲(chǔ)設(shè)備妥善保存。隨著大模型從單模態(tài)向多模態(tài)發(fā)展，產(chǎn)生了數(shù)以百億計(jì)的小文件，這對(duì)文件系統(tǒng)的目錄擴(kuò)展性、讀寫速度以及存儲(chǔ)的低延遲和高可擴(kuò)展性提出了更高要求。

其次，數(shù)據(jù)預(yù)處理階段，由于原始數(shù)據(jù)質(zhì)量參差不齊，存在大量重復(fù)和低質(zhì)量數(shù)據(jù)，因此需要進(jìn)行預(yù)處理以提升數(shù)據(jù)質(zhì)量。以ChatGPT4級(jí)別的大模型為例，其訓(xùn)練過(guò)程可能需要1萬(wàn)塊A100顯卡耗時(shí)11個(gè)月，其中數(shù)據(jù)預(yù)處理可能占據(jù)一半以上的時(shí)間，這與數(shù)據(jù)存儲(chǔ)的性能密切相關(guān)。

再次，模型訓(xùn)練階段，大規(guī)模訓(xùn)練系統(tǒng)（如10萬(wàn)塊顯卡組成的系統(tǒng)）的可靠性難以保證，頻繁出現(xiàn)故障，導(dǎo)致集群可用度低下。為了快速恢復(fù)訓(xùn)練，需要依賴高性能的存儲(chǔ)系統(tǒng)來(lái)快速讀取CheckPoint數(shù)據(jù)。華為與清華大學(xué)MADSys實(shí)驗(yàn)室聯(lián)合開發(fā)的高性能AI存儲(chǔ)系統(tǒng)在此方面表現(xiàn)出色，曾在國(guó)際權(quán)威機(jī)構(gòu)MLPerf Storage基準(zhǔn)評(píng)測(cè)中獲得第一名，性能密度是第二名的兩倍。

最后，模型推理階段，這是與AI應(yīng)用最直接相關(guān)的環(huán)節(jié)。更高效的人工智能需要處理更多數(shù)據(jù)、使用更大模型以及更長(zhǎng)的上下文窗口，但這同時(shí)也帶來(lái)了極重的推理負(fù)載。模型參數(shù)以及推理過(guò)程中產(chǎn)生的KV-Cache需要巨大的存儲(chǔ)空間。為此，國(guó)內(nèi)優(yōu)秀的大模型應(yīng)用Kimi與清華大學(xué)MADSys實(shí)驗(yàn)室共同推出了Mooncake分離式推理架構(gòu)，通過(guò)保存共享的KV-Cache，采用以存換算的策略大幅提升系統(tǒng)吞吐。

鄭緯民院士強(qiáng)調(diào)，模型推理過(guò)程是一個(gè)復(fù)雜的存儲(chǔ)系統(tǒng)工程，關(guān)鍵在于存儲(chǔ)容量大、傳輸速度快以及性價(jià)比高。清華大學(xué)MADSys實(shí)驗(yàn)室聯(lián)合華為數(shù)據(jù)存儲(chǔ)、9#AISoft、阿里云、面壁、趨境等公司共同開發(fā)的高性能內(nèi)存型長(zhǎng)記憶存儲(chǔ)系統(tǒng)即將開源發(fā)布，該系統(tǒng)能夠?qū)崿F(xiàn)大范圍全局共享與持久化KV-Cache，以存換算，共同構(gòu)建大模型時(shí)代下的高性能內(nèi)存型長(zhǎng)記憶存儲(chǔ)系統(tǒng)生態(tài)。

最后，鄭緯民院士總結(jié)指出，AI存儲(chǔ)是人工智能大模型的基石，貫穿于大模型生命周期的每一個(gè)環(huán)節(jié)。通過(guò)以存強(qiáng)算、以存換算，先進(jìn)的AI存儲(chǔ)能夠提升訓(xùn)練集群的可用度，降低推理成本，提升用戶體驗(yàn)。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

存儲(chǔ)

存儲(chǔ)

+關(guān)注

關(guān)注
13

文章
4341

瀏覽量
86030
AI

AI

+關(guān)注

關(guān)注
87

文章
31338

瀏覽量
269746
人工智能

人工智能

+關(guān)注

關(guān)注
1793

文章
47539

瀏覽量
239392

評(píng)論

相關(guān)推薦

AI驅(qū)動(dòng)新型存儲(chǔ)器技術(shù)，國(guó)內(nèi)新興存儲(chǔ)企業(yè)進(jìn)階

生成式AI對(duì)于算力、運(yùn)力和存力的需求與日俱增，如何打破“存儲(chǔ)墻”成為存儲(chǔ)行業(yè)面臨的挑戰(zhàn)與機(jī)會(huì)。從因AI訓(xùn)練而爆紅的HBM，再到DDR5、PC

發(fā)表于 10-16 08:10 ?1037次閱讀

<b class='flag-5'>AI</b>驅(qū)動(dòng)新型<b class='flag-5'>存儲(chǔ)</b>器技術(shù)，國(guó)內(nèi)新興<b class='flag-5'>存儲(chǔ)</b>企業(yè)進(jìn)階

蘇茨克維預(yù)測(cè)：推理型AI將帶來(lái)不可預(yù)測(cè)性

未來(lái)的人工智能將展現(xiàn)出類似人類的推理能力。蘇茨克維強(qiáng)調(diào)，隨著AI推理能力的提升，事情將變得更加難以預(yù)測(cè)。他解釋說(shuō)，推理能力的增強(qiáng)意味著AI

發(fā)表于 12-17 09:55 ?237次閱讀

知存科技啟動(dòng)首屆存內(nèi)計(jì)算創(chuàng)新大賽

存內(nèi)計(jì)算作為一項(xiàng)打破“內(nèi)存墻”“功耗墻”的顛覆性技術(shù)，消除了存與算的界限，相比CPU或GPU能夠?qū)崿F(xiàn)更高計(jì)算并行度、更大專用算力，達(dá)成數(shù)量級(jí)的能效提升。在AI加速落地的

發(fā)表于 11-21 10:44 ?277次閱讀

華為發(fā)布數(shù)據(jù)通信未來(lái)技術(shù)趨勢(shì)報(bào)告

近日，CCF中國(guó)網(wǎng)絡(luò)大會(huì)（CCF ChinaNet 2024）期間，由中國(guó)計(jì)算機(jī)學(xué)會(huì)主辦的“算網(wǎng)融合·數(shù)智賦能·發(fā)展新質(zhì)生產(chǎn)力”主題論壇成功舉辦。論壇邀請(qǐng)了鄔江興、吳建平、鄭緯民、張宏科多位

發(fā)表于 11-18 11:28 ?483次閱讀

王耀南院士：AI大模型賦能人形機(jī)器人及未來(lái)趨勢(shì)

研究現(xiàn)狀，關(guān)鍵技術(shù)賦能具身智能人形機(jī)器人，以及未來(lái)的發(fā)展趨勢(shì)與展望四個(gè)方面進(jìn)行匯報(bào)。王院士認(rèn)為人工智能大模型推動(dòng)人形機(jī)器人在感知、認(rèn)知、思考、分析、判斷、推理、交互的智能自主作業(yè)方向發(fā)展。隨后

發(fā)表于 11-08 11:03 ?842次閱讀

王耀南<b class='flag-5'>院士</b>：<b class='flag-5'>AI</b>大模型賦能人形機(jī)器人及未來(lái)<b class='flag-5'>趨勢(shì)</b>

面向未來(lái)數(shù)據(jù)中心的存儲(chǔ)平臺(tái)技術(shù)挑戰(zhàn)與探索

近日，中國(guó)計(jì)算機(jī)學(xué)會(huì)第十三期CCF秀湖會(huì)議在蘇州CCF業(yè)務(wù)總部&學(xué)術(shù)交流中心正式拉開帷幕。本次會(huì)議就“新應(yīng)用與硬件驅(qū)動(dòng)下的存儲(chǔ)技術(shù)創(chuàng)新”主題進(jìn)行深入交流和探討。中國(guó)工程院院士、清華大學(xué)鄭緯

發(fā)表于 11-06 10:43 ?256次閱讀

AMD助力HyperAccel開發(fā)全新AI推理服務(wù)器

HyperAccel 是一家成立于 2023 年 1 月的韓國(guó)初創(chuàng)企業(yè)，致力于開發(fā) AI 推理專用型半導(dǎo)體器件和硬件，最大限度提升推理工作負(fù)載的存儲(chǔ)

發(fā)表于 09-18 09:37 ?394次閱讀

智馭未來(lái)，AI拼才會(huì)贏—鄭弘孟董事長(zhǎng)寄語(yǔ)工業(yè)富聯(lián)，拼搏共贏新篇章

奧運(yùn)會(huì)馬上就要開始，F(xiàn)ii工業(yè)富聯(lián)發(fā)布《鄭弘孟董事長(zhǎng)致工業(yè)富聯(lián)全體同仁的一封信》，在全球AI競(jìng)賽浪潮中，AI已經(jīng)成為公司未來(lái)發(fā)展的核心驅(qū)動(dòng)力，如何讓

發(fā)表于 07-14 08:33 ?489次閱讀

AI浪潮下的十大消費(fèi)者新趨勢(shì)

人工智能已經(jīng)風(fēng)靡全球，當(dāng)我們沉浸在AI技術(shù)為辦公與生活帶來(lái)的各種便利時(shí)，一些人也會(huì)質(zhì)疑：AI 真的能為我們描繪出更美好的未來(lái)畫卷嗎？ AI 賦能的十大消費(fèi)者趨勢(shì) 愛(ài)立信消費(fèi)者實(shí)驗(yàn)室的最

發(fā)表于 06-05 10:30 ?376次閱讀

第十三期CCF秀湖會(huì)議：共話未來(lái)數(shù)據(jù)中心的存儲(chǔ)平臺(tái)技術(shù)挑戰(zhàn)與探索

、清華大學(xué)鄭緯民教授，華中科技大學(xué)金海教授，清華大學(xué)舒繼武教授，浪潮存儲(chǔ)產(chǎn)品線總經(jīng)理李輝等20余位專家出席會(huì)議。秀湖會(huì)議AC主席、CCF副理事長(zhǎng)

發(fā)表于 06-04 16:33 ?396次閱讀

英特爾助力京東云用CPU加速AI推理，以大模型構(gòu)建數(shù)智化供應(yīng)鏈

英特爾助力京東云用CPU加速AI推理，以大模型構(gòu)建數(shù)智化供應(yīng)鏈

發(fā)表于 05-27 11:50 ?566次閱讀

知存科技助力AI應(yīng)用落地：WTMDK2101-ZT1評(píng)估板實(shí)地評(píng)測(cè)與性能揭秘

計(jì)算：近存計(jì)算：在近存計(jì)算中，計(jì)算單元與高速存儲(chǔ)單元（如高速緩存）緊密集成。這意味著處理器和高速存儲(chǔ)單元之間的距離很近，可以快速訪問(wèn)數(shù)據(jù)并進(jìn)行計(jì)算，減少了數(shù)據(jù)從

發(fā)表于 05-16 16:38

存內(nèi)計(jì)算WTM2101編譯工具鏈資料

存內(nèi)計(jì)算是突破物理極限的下一代算力技術(shù)- AIGC等人工智能新興產(chǎn)業(yè)的快速發(fā)展離不開算力，算力的基礎(chǔ)是人工智能芯片。當(dāng)前CPU/GPU在執(zhí)行計(jì)算密集型任務(wù)時(shí)需要將海量參數(shù)（ωij）從內(nèi)存

發(fā)表于 05-16 16:33

如何看待半導(dǎo)體行業(yè)未來(lái)的新趨勢(shì)

如何看待半導(dǎo)體行業(yè)未來(lái)的新趨勢(shì)

發(fā)表于 04-25 11:38 ?783次閱讀

AI時(shí)代，存強(qiáng)則強(qiáng)

以存強(qiáng)算，以存強(qiáng)訓(xùn)，以存強(qiáng)安

發(fā)表于 03-22 09:17 ?2205次閱讀