3 月 5 日,據報道,微軟將 ONNX Runtime Web 與 WebGPU 進行集成,旨在提升網絡瀏覽器中復雜機器學習模型的運行效率。當前階段,Chromium 和 Edge 瀏覽器已加入初步支持。
作為微軟的 JavaScript 庫,ONNX Runtime Web 使得網絡開發者能在瀏覽器環境下部署機器學習模型,并提供多種硬件加速的后端支持。
WebGPU 則是一種設計用于網絡瀏覽器的,為機器學習模型提供硬件加速的 API。在此前,因算力限制,復雜機器學習模型尤其是大規模生成模型無法在網頁瀏覽器中有效運行。如今,WebGPU 得以充分利用設備 GPU 的潛力來解決這一問題,大幅改善運行效果。
微軟指出:
借助計算著色器等創新技術,WebGPU 能夠更為高效地應對復雜機器學習工作負載。其對半精度(FP16)的支持,不僅降低 GPU 內存占用及帶寬需求,還提升運算速度。WebGPU 借助 GPU 并行處理的優勢,輕松實現高效且具有擴展性的機器學習應用。
所有版本的 Chrome 113、Edge 113、適用于 Mac、Windows、ChromeOS 的 Chrome 以及適用于 Android 的 Chrome 121 均默認為WebGPU 做好準備,開發者可通過 ONNX Runtime Web 調用 WebGPU 以提高運行效率。
-
微軟
+關注
關注
4文章
6598瀏覽量
104087 -
gpu
+關注
關注
28文章
4741瀏覽量
128963 -
模型
+關注
關注
1文章
3247瀏覽量
48855 -
機器學習
+關注
關注
66文章
8419瀏覽量
132672
發布評論請先 登錄
相關推薦
評論