盡管富士通的富岳超級計算機不再是超級計算機500強名單中最快的機器,但它仍然是一個非常強大的系統(tǒng),A64FX處理器的多功能性允許將其用于各種工作負(fù)載,例如AI。本周,富士通發(fā)布了Fugaku-LLM,這是一個具有高級日語處理能力的大型語言模型,專為研究和商業(yè)應(yīng)用而設(shè)計。
富士通的Fugaku-LLM在富岳超級計算機的13,824個節(jié)點上使用3800億個符記進(jìn)行訓(xùn)練,該超級計算機基于A64FX處理器,支持FP64、FP32、FP16和INT8模式,適用于各種AI和傳統(tǒng)超級計算機應(yīng)用。Fugaku-LLM的訓(xùn)練利用了針對超級計算機架構(gòu)和互連優(yōu)化的分布式并行學(xué)習(xí)技術(shù)。
Fugaku-LLM 有 130 億個參數(shù),與 GPT-4 的 1750 億個參數(shù)相比顯得蒼白無力,不過,F(xiàn)ugaku-LLM是日本有史以來訓(xùn)練量的最大 LLM。富士通表示,其130億參數(shù)的LLM不需要大量的計算資源來推理,這對日本的企業(yè)和研究人員來說是最佳選擇。大約 60% 的訓(xùn)練數(shù)據(jù)是日語,40% 的數(shù)據(jù)是英語、數(shù)學(xué)和代碼數(shù)據(jù)。
這種廣泛的以日語為中心的訓(xùn)練使其有別于其它主要在英語數(shù)據(jù)集上訓(xùn)練的日語模型。因此,F(xiàn)ugaku-LLM擁有卓越的日語水平,在日語MT-Bench上獲得了5.5的平均分,這是使用日本原始數(shù)據(jù)訓(xùn)練的公開可用模型中的最高分。根據(jù)富士通的數(shù)據(jù),它在人文和社會科學(xué)方面尤其出色,取得了令人印象深刻的 9.18 分的基準(zhǔn)分?jǐn)?shù)。
Fugaku-LLM計劃是由東京工業(yè)大學(xué)、東北大學(xué)、富士通株式會社、RIKEN、名古屋大學(xué)、CyberAgent和Kotoba Technologies等日本領(lǐng)先機構(gòu)之間的合作推動的。他們合作的原因之一是通常用于訓(xùn)練和推理 AI 模型的 GPU 短缺。另一個原因是,該模型可以與富士通的下一代 150 核 Monaka 數(shù)據(jù)中心 CPU 一起使用,該 CPU 針對 AI 和 HPC 工作負(fù)載進(jìn)行了優(yōu)化。
Fugaku-LLM現(xiàn)在可以在GitHub和Hugging Face的指定許可條款下用于學(xué)術(shù)和商業(yè)目的(盡管富士通沒有提供任何鏈接)。此外,它從2024年5月10日起通過富士通研究門戶網(wǎng)站提供。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。
舉報投訴
相關(guān)推薦
云端超級計算機是一種基于云計算的高性能計算服務(wù),它將大量計算資源和存儲資源集中在一起,通過網(wǎng)絡(luò)向用戶提供按需的
發(fā)表于 12-17 10:19
?121次閱讀
? 今年10月,富士通發(fā)布了 《富士通綜合報告(Fujitsu Integrated Report 2024)》 。這份報告詳細(xì)介紹了有關(guān)富士通的業(yè)務(wù)經(jīng)營情況,以及創(chuàng)新的價值創(chuàng)造舉措,旨在與所有
發(fā)表于 12-11 17:31
?446次閱讀
訓(xùn)練自己的大型語言模型(LLM)是一個復(fù)雜且資源密集的過程,涉及到大量的數(shù)據(jù)、計算資源和專業(yè)知識。以下是訓(xùn)練LLM模型的一般步驟,以及一些關(guān)
發(fā)表于 11-08 09:30
?549次閱讀
、超大規(guī)模的 AI 工廠提供卓越性能而設(shè)計的 RDMA(Remote Direct Memory Access)網(wǎng)絡(luò)。 ? Colossus 是世界上最大的 AI 超級計算機,目前正被用于訓(xùn)練 xAI 的 Grok 系列大語言模
發(fā)表于 10-30 09:33
?153次閱讀
近日,丹麥正式推出了該國首臺人工智能超級計算機,命名為Gefion,以紀(jì)念丹麥神話中的女神。此次揭幕儀式由英偉達(dá)首席執(zhí)行官黃仁勛與丹麥國王共同出席,彰顯了該項目的重要性和影響力。 Gefion AI
發(fā)表于 10-29 15:13
?396次閱讀
這臺丹麥最大的超級計算機由該國政府與丹麥 AI 創(chuàng)新中心共同建設(shè),是一臺 NVIDIA DGX SuperPOD 超級計算機。
發(fā)表于 10-27 09:42
?441次閱讀
云端超級計算機是一種基于云計算的高性能計算服務(wù),它將大量計算資源和存儲資源集中在一起,通過網(wǎng)絡(luò)向用戶提供按需的
發(fā)表于 10-18 10:14
?154次閱讀
科學(xué)期刊《自然》(Nature)本月早些時候發(fā)表了一項研究,通過使用 NVIDIA 驅(qū)動的超級計算機,驗證了量子計算的商業(yè)化途徑。
發(fā)表于 07-25 09:55
?520次閱讀
富士通(Fujitsu)與總部位于多倫多與舊金山的頂尖安全及數(shù)據(jù)隱私人工智能企業(yè)Cohere Inc.攜手宣布建立深度戰(zhàn)略合作伙伴關(guān)系,共同致力于大型語言模型(LLM)的創(chuàng)新與開發(fā),旨在為企業(yè)界帶來前所未有的日語處理能力,進(jìn)而優(yōu)化客戶與員工體驗。
發(fā)表于 07-16 16:55
?492次閱讀
富士通近日發(fā)布了《富士通技術(shù)與服務(wù)愿景2024(Fujitsu Technology and Service Vision 2024,簡稱FT&SV 2024)》,闡述了對未來商業(yè)和社會的愿景。
發(fā)表于 05-29 17:07
?551次閱讀
在昨日公布的新聞稿中,研究團隊表示他們成功發(fā)掘了富岳超級計算機的潛能,使矩陣乘法運算速度提升六倍,通信速度提高三倍,從而證實大型純CPU超級計算機
發(fā)表于 05-11 17:07
?911次閱讀
自2023年5月起,F(xiàn)ugaku-LLM模型的開發(fā)工作開始展開,最初參與團隊包括富士通、東京工業(yè)大學(xué)、日本東北大學(xué)以及日本理化學(xué)研究所(簡稱理研)。
發(fā)表于 05-11 10:05
?405次閱讀
量子計算領(lǐng)域的最新進(jìn)展包括分子研究、部署巨型超級計算機,以及通過一項新的學(xué)術(shù)計劃培養(yǎng)量子從業(yè)人員。
發(fā)表于 03-22 10:05
?429次閱讀
大語言模型訓(xùn)練會是一個怎樣的情景。。。。。。
希望量子計算機盡快走出實驗室,能夠早日進(jìn)入尋常百姓家,更希望我國的量子計算機取得突破,蓬勃發(fā)展,也能遙遙領(lǐng)先!
今天先研讀至此,后續(xù)所讀所感將繼續(xù)分享。
附
發(fā)表于 03-05 17:37
霍楚爾表示,此次項目投資為5億美元,并將同時在紐約州立大學(xué)建設(shè)另一臺獨立的AI超級計算機。“我很榮幸地告訴大家,特斯拉將在布法羅投資5億美元,用于其新一代超級計算機的建設(shè)”,她說道。
發(fā)表于 01-29 10:58
?410次閱讀
評論