近日,2023中國算力大會在寧夏銀川舉行,沐曦集成電路(上海)有限公司(下稱“沐曦”)聯(lián)合創(chuàng)始人、CTO兼首席硬件架構(gòu)師彭莉受邀出席由中國信息通信研究院、中國互聯(lián)網(wǎng)協(xié)會聯(lián)合舉辦的智能計算論壇,并擔任演講嘉賓,探討后GPT時代算力需求激增帶來的挑戰(zhàn)以及GPU如何突破算力供需瓶頸、推動人工智能產(chǎn)業(yè)普惠化發(fā)展。
沐曦聯(lián)合創(chuàng)始人、CTO兼首席硬件架構(gòu)師彭莉
發(fā)表主題演講
在題為“后GPT時代的算力需求”的演講中,彭莉預(yù)測大模型商業(yè)模式將分為通用計算市場和專用定制化市場兩大類:在通用計算市場,大語言模型將終結(jié)多數(shù)NLP任務(wù),NLP技術(shù)水平被強行拉平,通用大模型或被大廠“壟斷”;而在專用定制化市場,開源大模型將呈現(xiàn)百花齊放的發(fā)展態(tài)勢,可針對私有數(shù)據(jù)、敏感數(shù)據(jù)進行快速定制和領(lǐng)域?qū)R,大模型開發(fā)和部署能力將趨于普及化。
彭莉指出,區(qū)別于傳統(tǒng)AI,生成式AI技術(shù)可以借助接入類ChatGPT應(yīng)用發(fā)揮顯著的技術(shù)優(yōu)勢,為大語言模型的開發(fā)降本增效,同時也對算力提出更高和更迫切的要求。由于大模型訓(xùn)練的一次性成本被大規(guī)模推理攤薄,大模型盈利的一大難點是降低推理成本。沐曦致力于打造高效通用的GPU芯片及軟硬件一體的生態(tài)解決方案,通過GPU軟件生態(tài)優(yōu)勢、硬件架構(gòu)優(yōu)勢、先進封裝等方面全面提升GPU算力,降低大模型訓(xùn)練和推理的算力成本,在產(chǎn)品路線和生態(tài)戰(zhàn)略上均可滿足大模型對算力基礎(chǔ)設(shè)施的大規(guī)模需求,為推進智能產(chǎn)業(yè)可持續(xù)發(fā)展打造堅實的算力底座。
審核編輯:彭菁
-
集成電路
+關(guān)注
關(guān)注
5388文章
11556瀏覽量
361974 -
gpu
+關(guān)注
關(guān)注
28文章
4742瀏覽量
128976 -
硬件
+關(guān)注
關(guān)注
11文章
3341瀏覽量
66251 -
沐曦
+關(guān)注
關(guān)注
0文章
26瀏覽量
1166 -
大模型
+關(guān)注
關(guān)注
2文章
2474瀏覽量
2773
發(fā)布評論請先 登錄
相關(guān)推薦
評論