電子發燒友網報道(文/李彎彎)近一年多時間,隨著大模型的發展,GPU在AI領域的重要性再次凸顯。雖然相比英偉達等國際大廠,國產GPU起步較晚、聲勢較小。不過近幾年,國內不少GPU廠商成長非常快,并且不斷推出新品,產品也逐漸在各個領域取得應用,而且在大模型的訓練和推理方面,也有所建樹。
國產GPU在大模型上的應用進展
電子發燒友此前就統計過目前國內主要的GPU廠商,也介紹了這些廠商主要的產品及產品發布、量產進展情況。可以看到,其實近幾年已經有不少產品面世并應用。
如沐曦集成,其N系列用于AI推理的GPU芯片早已量產。去年9月,該公司宣布,其與眸瑞科技聯合發布了首個AI模型“貼圖超分”技術。該技術依托曦思N系列AI推理GPU首款產品曦思N100的強大算力,結合眸瑞科技豐富的算法庫資源和先進的AI超分算法,首次將AI超分成功應用到了3D模型領域。
曦思N100是沐曦面向人工智能推理場景推出的高效能GPU產品,針對AI推理及AI應用場景中大量的視頻圖像處理任務,提供強大的AI算力和視頻/圖像編解碼功能。據稱,目前沐曦已聯合合作伙伴打造了多種基于曦思N100 的解決方案,如高密度視頻結構化分析解決方案、高并發智能轉碼解決方案、光電混合異構計算解決方案等,這些方案可廣泛應用于城市安防、智慧交通、工業視覺、短視頻、云計算和智算中心等多個領域。
再如天數智芯,其提供的算力集群具有支持百億級參數大模型訓練的能力。早前有消息,天數智芯與智源研究院、愛特云翔合作,開展基于自主通用GPU的大模型CodeGen(高效編碼)項目,通過中文描述來生成可用的C、Java、Python代碼以實現高效編碼。
智源研究院負責算法設計、訓練框架開發、大模型的訓練與調優,天數智芯負責提供天垓100加速卡、構建算力集群及全程技術支持,愛特云翔負責提供算存網基礎硬件及智能化運維服務。在天垓100加速卡的算力集群,基于智源研究院70億參數的Aquila語言基礎模型,使用代碼數據進行繼續訓練,穩定運行19天,模型收斂效果符合預期。
近一年多來,隨著大模型的發展,國產GPU公司都在朝著大模型領域布局。摩爾線程此前也透露,公司已經可以支持3億參數量模型的訓練,2022年底就提前布局了自然語言模型預訓練,自研了MusaBert模型。
還有登臨科技,該公司此前也表示,公司首款產品Goldwasser已規模化運用在多家行業知名企業的主營業務中,新一代Goldwasser產品針對基于Transformer的網絡和生成式AI類大模型的應用在性能有大幅提升。
國產GPU應用于AI領域的多個方面
除了上述談到應用案例,國產GPU在AI領域的應用案例還有很多,主要涉及到深度學習、自然語言處理以及計算機視覺等多個方面。
如,在計算機視覺領域,國產GPU被廣泛應用于圖像識別和目標檢測等任務。例如,利用GPU加速的深度學習模型可以大幅提升算法的準確性和實時性,這在安防監控、自動駕駛等實際應用中具有重要的價值。
在自然語言處理方面,國產GPU也在發揮重要作用。通過GPU加速的循環神經網絡、Transformer等模型,可以實現高效的機器翻譯、文本生成等任務。這對于提升智能客服、智能寫作等應用的性能具有關鍵作用。
國產GPU還在強化學習領域得到了應用。強化學習是AI領域的一個重要分支,其目標是通過與環境的交互來學習策略。GPU加速的價值網絡、策略網絡等模型可以應用于游戲AI、機器人控制等領域,從而提高智能體的學習效率和性能。
另外值得關注的還有,國產GPU在自動駕駛領域的應用也比較多。自動駕駛系統需要處理大量的傳感器數據,包括來自攝像頭、雷達、激光雷達等的信息。GPU通過其強大的并行計算能力和高效的內存管理,可以實時處理這些數據,并為自動駕駛系統提供準確的決策依據。
例如,一些國產汽車廠商已經開始在其自動駕駛系統中采用國產GPU。這些GPU不僅用于圖像處理和計算機視覺任務,如目標檢測、車道線識別等,還用于深度學習模型的推理和決策。通過GPU的加速,自動駕駛系統可以更快地識別交通信號、障礙物以及其他重要信息,從而提高行車安全性。
此外,國產GPU還在自動駕駛的地圖構建和定位方面發揮了重要作用。通過利用GPU進行高效的地圖數據處理和實時定位計算,自動駕駛系統可以更加準確地感知周圍環境,并實現精確的導航和路徑規劃。
具體來說,百度Apollo、小馬智行等自動駕駛技術公司,都在其自動駕駛解決方案中采用了國產GPU。這些解決方案不僅應用于乘用車,還擴展到商用車、物流車等多個領域。
寫在最后
從目前的情況來看,國內外GPU廠商都在追逐大模型應用帶來的機會。當前無論是大模型訓練還是推理,英偉達GPU都占據了絕大部分市場。對于國產廠商來說,為了在大模型方面擁有更多自主權,仍然需要持續在大模型訓練方面發力,同時相對大模型訓練來說,大模型接下來大面積的部署,對于推理芯片的需要將會很大,這將是一個更容易把握的機會。
國產GPU在大模型上的應用進展
電子發燒友此前就統計過目前國內主要的GPU廠商,也介紹了這些廠商主要的產品及產品發布、量產進展情況。可以看到,其實近幾年已經有不少產品面世并應用。
如沐曦集成,其N系列用于AI推理的GPU芯片早已量產。去年9月,該公司宣布,其與眸瑞科技聯合發布了首個AI模型“貼圖超分”技術。該技術依托曦思N系列AI推理GPU首款產品曦思N100的強大算力,結合眸瑞科技豐富的算法庫資源和先進的AI超分算法,首次將AI超分成功應用到了3D模型領域。
曦思N100是沐曦面向人工智能推理場景推出的高效能GPU產品,針對AI推理及AI應用場景中大量的視頻圖像處理任務,提供強大的AI算力和視頻/圖像編解碼功能。據稱,目前沐曦已聯合合作伙伴打造了多種基于曦思N100 的解決方案,如高密度視頻結構化分析解決方案、高并發智能轉碼解決方案、光電混合異構計算解決方案等,這些方案可廣泛應用于城市安防、智慧交通、工業視覺、短視頻、云計算和智算中心等多個領域。
再如天數智芯,其提供的算力集群具有支持百億級參數大模型訓練的能力。早前有消息,天數智芯與智源研究院、愛特云翔合作,開展基于自主通用GPU的大模型CodeGen(高效編碼)項目,通過中文描述來生成可用的C、Java、Python代碼以實現高效編碼。
智源研究院負責算法設計、訓練框架開發、大模型的訓練與調優,天數智芯負責提供天垓100加速卡、構建算力集群及全程技術支持,愛特云翔負責提供算存網基礎硬件及智能化運維服務。在天垓100加速卡的算力集群,基于智源研究院70億參數的Aquila語言基礎模型,使用代碼數據進行繼續訓練,穩定運行19天,模型收斂效果符合預期。
近一年多來,隨著大模型的發展,國產GPU公司都在朝著大模型領域布局。摩爾線程此前也透露,公司已經可以支持3億參數量模型的訓練,2022年底就提前布局了自然語言模型預訓練,自研了MusaBert模型。
還有登臨科技,該公司此前也表示,公司首款產品Goldwasser已規模化運用在多家行業知名企業的主營業務中,新一代Goldwasser產品針對基于Transformer的網絡和生成式AI類大模型的應用在性能有大幅提升。
國產GPU應用于AI領域的多個方面
除了上述談到應用案例,國產GPU在AI領域的應用案例還有很多,主要涉及到深度學習、自然語言處理以及計算機視覺等多個方面。
如,在計算機視覺領域,國產GPU被廣泛應用于圖像識別和目標檢測等任務。例如,利用GPU加速的深度學習模型可以大幅提升算法的準確性和實時性,這在安防監控、自動駕駛等實際應用中具有重要的價值。
在自然語言處理方面,國產GPU也在發揮重要作用。通過GPU加速的循環神經網絡、Transformer等模型,可以實現高效的機器翻譯、文本生成等任務。這對于提升智能客服、智能寫作等應用的性能具有關鍵作用。
國產GPU還在強化學習領域得到了應用。強化學習是AI領域的一個重要分支,其目標是通過與環境的交互來學習策略。GPU加速的價值網絡、策略網絡等模型可以應用于游戲AI、機器人控制等領域,從而提高智能體的學習效率和性能。
另外值得關注的還有,國產GPU在自動駕駛領域的應用也比較多。自動駕駛系統需要處理大量的傳感器數據,包括來自攝像頭、雷達、激光雷達等的信息。GPU通過其強大的并行計算能力和高效的內存管理,可以實時處理這些數據,并為自動駕駛系統提供準確的決策依據。
例如,一些國產汽車廠商已經開始在其自動駕駛系統中采用國產GPU。這些GPU不僅用于圖像處理和計算機視覺任務,如目標檢測、車道線識別等,還用于深度學習模型的推理和決策。通過GPU的加速,自動駕駛系統可以更快地識別交通信號、障礙物以及其他重要信息,從而提高行車安全性。
此外,國產GPU還在自動駕駛的地圖構建和定位方面發揮了重要作用。通過利用GPU進行高效的地圖數據處理和實時定位計算,自動駕駛系統可以更加準確地感知周圍環境,并實現精確的導航和路徑規劃。
具體來說,百度Apollo、小馬智行等自動駕駛技術公司,都在其自動駕駛解決方案中采用了國產GPU。這些解決方案不僅應用于乘用車,還擴展到商用車、物流車等多個領域。
寫在最后
從目前的情況來看,國內外GPU廠商都在追逐大模型應用帶來的機會。當前無論是大模型訓練還是推理,英偉達GPU都占據了絕大部分市場。對于國產廠商來說,為了在大模型方面擁有更多自主權,仍然需要持續在大模型訓練方面發力,同時相對大模型訓練來說,大模型接下來大面積的部署,對于推理芯片的需要將會很大,這將是一個更容易把握的機會。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。
舉報投訴
-
gpu
+關注
關注
28文章
4739瀏覽量
128941 -
AI
+關注
關注
87文章
30887瀏覽量
269066 -
大模型
+關注
關注
2文章
2448瀏覽量
2701 -
AI大模型
+關注
關注
0文章
316瀏覽量
308
發布評論請先 登錄
相關推薦
云知聲榮登甲子光年“2024中國AI大模型領域最具商業潛力榜”
科技產業投資榜】三大行業榜單。云知聲憑借卓越的技術實力、創新的場景應用以及廣闊的市場前景,榮登“2024中國AI大模型領域最具商業潛力榜”。
訓練AI大模型需要什么樣的gpu
訓練AI大模型需要選擇具有強大計算能力、足夠顯存、高效帶寬、良好散熱和能效比以及良好兼容性和擴展性的GPU。在選擇時,需要根據具體需求進行權衡和選擇。
【「大模型時代的基礎架構」閱讀體驗】+ 未知領域的感受
”,好奇于這種大模型算力中心到底是如何建設的,用什么設備、什么架構建設的?對這些問題真是一無所知,甚至都沒有想過,帶著這份好奇開始閱讀。
先瀏覽目錄,共分十三章,目錄中出現最多的就是GPU,比如機器學習
發表于 10-08 10:40
人工智能ai4s試讀申請
目前人工智能在繪畫對話等大模型領域應用廣闊,ai4s也是方興未艾。但是如何有效利用ai4s工具助力科研是個需要研究的課題,本書對ai4s基本原理和原則,方法進行描訴,有利于總結經驗,擬
發表于 09-09 15:36
智譜AI正研發對標Sora的國產文生視頻模型
智譜AI,這家國內估值超過200億的AI大模型獨角獸企業,正全力投入研發一款與OpenAI的Sora相媲美的國產文生視頻
FPGA在深度學習應用中或將取代GPU
上漲,因為事實表明,它們的 GPU 在訓練和運行 深度學習模型 方面效果明顯。實際上,英偉達也已經對自己的業務進行了轉型,之前它是一家純粹做 GPU
發表于 03-21 15:19
谷歌發布基礎世界模型Genie,世界模型領域競爭升溫
繼OpenAI和Meta之后,谷歌也在世界模型領域公布了其最新進展。據谷歌官網介紹,Genie是一個基于互聯網視頻訓練的基礎世界模型,能夠從合成圖像、照片、草圖等多種來源生成多種動作可控的環境。
評論