英偉達推出歸一化Transformer，革命性提升LLM訓練速度

英偉達團隊近日在AI領域投下了一枚震撼彈，他們提出了一種全新的神經網絡架構——歸一化Transformer(nGPT)。這一創新架構基于超球面(hypersphere)進行表示學習，為AI領域帶來了新的突破。

相較于傳統的Transformer架構，nGPT在保持原有精度的同時，直接將大型語言模型(LLM)的訓練速度提升了高達20倍。這一顯著的性能提升，無疑將極大地推動AI技術的發展和應用。

在nGPT中，所有的向量(包括嵌入向量、多層感知機(MLP)向量、注意力矩陣向量以及隱藏狀態向量)都被歸一化為單位范數(unit norm)。這一設計不僅簡化了模型訓練過程，還提高了模型的穩定性和泛化能力。

英偉達團隊的這一創新成果，無疑為AI領域注入了新的活力。nGPT架構的提出，不僅將推動AI技術的進一步發展，還將為各種應用場景提供更加高效、準確的解決方案。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

神經網絡

神經網絡

+關注

關注
42

文章
4771

瀏覽量
100766
英偉達

英偉達

+關注

關注
22

文章
3776

瀏覽量
91103
Transformer

Transformer

+關注

關注
0

文章
143

瀏覽量
6006
LLM

LLM

+關注

關注
0

文章
288

瀏覽量
335

什么是LLM？LLM在自然語言處理中的應用

隨著人工智能技術的飛速發展，自然語言處理（NLP）領域迎來了革命性的進步。其中，大型語言模型（LLM）的出現，標志著我們對語言理解能力的一次飛躍。LLM通過深度學習和海量數據

發表于 11-19 15:32 ?584次閱讀

如何訓練自己的LLM模型

訓練自己的大型語言模型（LLM）是一個復雜且資源密集的過程，涉及到大量的數據、計算資源和專業知識。以下是訓練LLM模型的

發表于 11-08 09:30 ?549次閱讀

LLM和傳統機器學習的區別

和訓練方法 LLM：預訓練和微調： LLM通常采用預訓練（Pre-training）和微調（Fine-tuning）的方法。預

發表于 11-08 09:25 ?456次閱讀

英偉達Blackwell可支持10萬億參數模型AI訓練，實時大語言模型推理

、NVLink交換機、Spectrum以太網交換機和Quantum InfiniBand交換機。 ? 英偉達稱，Blackwell擁有6項革命性技術，可支持多達10萬億參數的模型進行AI訓練

發表于 09-04 09:10 ?2904次閱讀

英偉達推出創新液冷技術

英偉達，這家領先的AI芯片制造商，近期在散熱技術上實現了重大突破，推出了創新的液冷技術。其即將問世的GB200服務器機架，將采用革命性的液體冷卻方式，摒棄傳統空氣冷卻，通過液體在硬件管

發表于 08-13 15:24 ?801次閱讀

llm模型訓練一般用什么系統

LLM（Large Language Model，大型語言模型）是近年來在自然語言處理領域取得顯著成果的一種深度學習模型。它通常需要大量的計算資源和數據來進行訓練。以下是關于LLM模型

發表于 07-09 10:02 ?413次閱讀

llm模型有哪些格式

：基于Transformer的模型 Transformer是一種基于自注意力機制的模型，廣泛應用于NLP領域。基于Transformer的LLM

發表于 07-09 09:59 ?624次閱讀

英偉達推出AI模型推理服務NVIDIA NIM

英偉達近日宣布推出一項革命性的AI模型推理服務——NVIDIA NIM。這項服務將極大地簡化AI模型部署過程，為全球的2800萬

發表于 06-04 09:15 ?682次閱讀

【大規模語言模型：從理論到實踐】- 每日進步一點點

的訓練效率、穩定性和泛化能力。以下是關于大模型訓練歸一化的詳細介紹：一、歸一化的目的和重要

發表于 05-31 19:54

進一步解讀英偉達 Blackwell 架構、NVlink及GB200 超級芯片

2024年3月19日，[英偉達]CEO[黃仁勛]在GTC大會上公布了新一代AI芯片架構BLACKWELL，并推出基于該架構的超級芯片GB200，將助推數據處理、工程模擬、電子設計自動

發表于 05-13 17:16

英偉達推出有2080億晶體管的GB200處理器

英偉達在最新一屆的GTC大會上隆重推出了全新的GB200處理器，這款處理器基于革命性的Blackwell架構，并配備了驚人的2080億個晶體

發表于 03-20 11:10 ?790次閱讀

英偉達發布新一代AI芯片B200

在美國加州圣何塞舉辦的英偉達GTC生態大會上，英偉達CEO黃仁勛以一場震撼人心的演講，正式推出了

發表于 03-20 10:07 ?975次閱讀

英偉達發布性能大幅提升的新款B200 AI GPU

英偉達宣稱，B200在性能上比以往最好的GPU快30倍不止。由它構成的服務器集群相比上一代，運算能力飛躍性提升，甚至能使大語言模型的

發表于 03-20 09:37 ?800次閱讀

長電科技推出了一項革命性的高精度熱阻測試與仿真模擬驗證技術

在芯片封裝技術日益邁向高密度、高性能的今天，長電科技引領創新，推出了一項革命性的高精度熱阻測試與仿真模擬驗證技術。

發表于 03-08 13:33 ?548次閱讀

英偉達推出新產品，助力AIPC實現革命性升級

一直以來，英偉達的競爭對手如英特爾與AMD均對“AI PC”寄予厚望。他們認為，AI軟件在PC端運行會比依賴網絡更為安全且響應速度更快。由此可見，英

發表于 01-09 14:43 ?619次閱讀

科技綠洲
專欄

0 文章 0 閱讀 0 粉絲 0 點贊

關注個人主頁

Hot javascript的成熟分類
Hot java和javaweb和javascript的區別

New 京瓷發布高效復合機，助力企事業單位降本增效
New OpenAI宣布API恢復運行，ChatGPT正在逐步回歸

精選推薦
更多

文章

資料

帖子

2024過去了，留下十個科技記憶

腦極體
22小時前

504 閱讀

兩款VR頭顯大拆解，都用了哪些芯片？

拍明芯城
1天前

379 閱讀

屏蔽柵MOSFET技術簡介

翠展微電子
1天前

379 閱讀

基于LKS32MC07x系列MCU的超高速清潔電器解決方案

晶豐明源
1天前

404 閱讀

基于瑞薩電子RA6T2 MCU的電機控制讓吸塵器更智能

瑞薩MCU小百科
1天前

339 閱讀

多路遙控報警器電路圖

麻醬
1320

3積分

16下載

TCL王牌LCD37VSH液晶彩電圖紙

神之小風
1.43 MB

10積分

286下載

基于FPGA的ROM實現

遠不及你
2.04MB

2積分

6下載

Klipse交互式代碼片段嵌入插件

陳艷
30.63 MB

2積分

2下載

V類抗輻射高速PWM控制器UC1825A-SP數據表

鄒倆珍
1.29MB

免費

0下載

【飛凌嵌入式OK3588J-C開發板體驗】OK3588J-C開發板的ffmpeg編解碼、HDMI輸入及編碼

dutong0321
1天前

71 閱讀

采集值突然驟降

塵埃sawdsa
17小時前

82 閱讀

2024 電機控制年度技術分享會來啦！！！

ElecFans小喇叭
1天前

405 閱讀

[廣東龍芯2K1000/2K500開發板] OpenWRT 使用說明

jf_38522704
10月前

5387 閱讀

使用單片機驅動DAC088S085無反應

jf_68383328
1天前

546 閱讀

推薦專欄
更多

在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

搜索歷史

英偉達推出歸一化Transformer，革命性提升LLM訓練速度

評論

什么是LLM？LLM在自然語言處理中的應用

如何訓練自己的LLM模型

LLM和傳統機器學習的區別

英偉達Blackwell可支持10萬億參數模型AI訓練，實時大語言模型推理

英偉達推出創新液冷技術

llm模型訓練一般用什么系統

llm模型有哪些格式

英偉達推出AI模型推理服務NVIDIA NIM

【大規模語言模型：從理論到實踐】- 每日進步一點點

進一步解讀英偉達 Blackwell 架構、NVlink及GB200 超級芯片

英偉達推出有2080億晶體管的GB200處理器

英偉達發布新一代AI芯片B200

英偉達發布性能大幅提升的新款B200 AI GPU

長電科技推出了一項革命性的高精度熱阻測試與仿真模擬驗證技術

英偉達推出新產品，助力AIPC實現革命性升級