在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

欲把AI計算成本打下來,谷歌高效益TPU正式開放

E4Life ? 來源:電子發燒友網 ? 作者:周凱揚 ? 2023-11-14 00:18 ? 次閱讀

電子發燒友網報道(文/周凱揚)對于每個想要自己開發和部署AI模型的應用開發者來說,硬件和服務器支出都是一筆不小的費用。就以英偉達GPU為例,即便是消費級的GPU,最近也迎來了一波漲價潮,更不用爆火的A100/H100等型號了。

即便是租賃服務器,基于這些熱門硬件的服務器也遠算不上便宜,因此不少云服務廠商為了進一步拉攏更多AI應用開發者,紛紛推出了性價比更高的選項。這些選項有的是基于CPU的AI計算服務器,有的是基于第三方AI加速器打造的服務器,還有的則是由云服務廠商基于自研加速器打造且獨家提供的服務器。

谷歌高性價比TPU面世

谷歌在今年8月底發布了第五代的自研TPU,TPU v5e。谷歌稱該加速器實現了性能與成本效益的平衡。相比上一代TPU v4,TPU V5e提供了同成本下兩倍的訓練性能,以及針對LLM和生成式AI模型2.5倍的推理性能。

wKgaomVR-HqAJvSzAABXKc7C2hk445.png
TPU v5e架構


單個TPU v5e Pod由256個芯片互聯,總帶寬超過400Tb/s,INT8總算力達100petaOps。而且谷歌為TPU v5e采用了更靈活的配置選項,其支持8個不同的虛擬機配置,單個切片支持單芯片到250多個芯片,如此一來客戶就可以根據自己的模型大小來選擇合適的配置。

而且過去借助谷歌TPU進行的訓練負載只局限于單個切片中,谷歌為此開發了Multislice技術,可通過芯片間互聯以及數據中心網絡中的多個TPU Pod相連,從而將訓練工作擴展到數萬個芯片上。

為了進一步擴大對開發生態的支持,TPU v5e還內置了對JAX、Pytorch和Tensorflow等領先AI框架,以及 Hugging Face 的 TransformersAccelerate、PyTorch Lightning 和 Ray等一系列常用開源工具的支持。

開放使用與自用

近日,谷歌終于宣布TPU v5e進入公用階段,且在最新的MLPerf訓練3.1測試中,TPUv5e獲得了更好的表現。在該測試中,谷歌改進了創新的混合精度訓練算法,除了原生支持的BF16外,還用到了INT8精度格式。這意味著客戶在提高了模型準確性的同時,將花費更少的成本。

wKgZomVR-IOANSMPAAIyMIzn61I221.png
從谷歌云對于TPU v5e的定價表來看,v5e在成本效益上確實有著極大的優勢。不過需要注意的是,v5e與v2、v3 Pod類似,每個芯片中只有一個TensorCore,而v4 Pod的每個芯片中有兩個TensorCore。這也是為何v5e的單芯片峰值算力為197TFLOPS,而v4的單芯片峰值算力為275TFLOPS,可即便如此,在按芯片小時的定價下,其所需成本依然低于v4。

在如此高的性價比下,谷歌不僅將TPU提供給外部開發者使用,其內部一些開發項目也開始用上TPU v5e。比如其PaLM模型的創建,就用到了上文提到的Multislice技術,谷歌的Bard團隊同樣在用TPU v5e訓練這一生成式AI聊天機器人。

寫在最后

其實在TPUv5e開放使用之前,谷歌也正式開放了A3 VM這類GPU加速虛擬機的使用。這也是多數云服務廠商采用的多方案供應策略,其自研加速器只需要為客戶提供一個高性價比的方案,而追求更高性能的客戶,依然可以選擇基于H100 GPU打造的服務器。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    87

    文章

    30998

    瀏覽量

    269305
收藏 人收藏

    評論

    相關推薦

    SiC價格打下來!兩年內擬降30%,市場加速滲透

    過去,SiC的晶體生長速度慢、良率低,導致生產成本較高,一直限制了SiC的普及。 ? 不過在近期據媒體報道,有業內人士預計,未來兩年SiC芯片價格將下降達30%,原因在于越來越多的本地廠商開始獲得電動汽車認證并擴大了其制造能力。SiC芯片將
    的頭像 發表于 08-03 00:59 ?4485次閱讀

    如何分析美國站群服務器的成本效益?

    美國站群服務器的成本效益分析是一個復雜但至關重要的過程,它涉及到多個方面的考量。主機推薦小編為您推薦美國站群服務器成本效益的詳細分析。
    的頭像 發表于 10-30 11:23 ?121次閱讀

    成本高效益 | 自連醫療設備無線化改造實例匯集

    原文標題:低成本高效益 | 自連醫療設備無線化改造實例匯集 文章出處:【微信公
    的頭像 發表于 10-24 17:25 ?182次閱讀

    黃仁勛:AI未來關鍵在于推理,芯片成本驟降成核心要素

     英偉達CEO黃仁勛近期強調,人工智能(AI)的未來趨勢將聚焦于具備“推理”能力的服務,但這一愿景的實現需以降低計算成本為前提。這一觀點是在他與Arm首席執行官Rene Haas的對話中提出的,該對話由Arm在其官方網站上發布。
    的頭像 發表于 10-10 14:35 ?418次閱讀

    谷歌發布革命性AI游戲引擎GameNGen

    谷歌近期震撼推出全球首款完全由人工智能驅動的游戲引擎——GameNGen,這一創新技術標志著游戲開發領域的新紀元。GameNGen憑借其強大的計算能力,能夠在單個TPU上實現每秒20幀的實時游戲生成,每一幀畫面均源自精密的擴散模
    的頭像 發表于 08-29 18:07 ?893次閱讀

    TPU v1到Trillium TPU,蘋果等科技公司使用谷歌TPU進行AI計算

    ,在訓練尖端人工智能方面,大型科技公司正在尋找英偉達以外的替代品。 ? 不斷迭代的谷歌TPU 芯片 ? 隨著機器學習算法,特別是深度學習算法在各個領域的廣泛應用,對于高效、低功耗的AI
    的頭像 發表于 07-31 01:08 ?3393次閱讀

    價格打下來了,只要9.9萬,人形機器人的春天來了嗎?

    不久前,國內機器人公司宇樹科技在其官方公眾號推送了一篇名為《UnitreeG1人形智能體AI化身¥9.9萬元起》的文章,宣布其推出了一款9.9萬的人形智能機器人。十萬不到的價格,瞬間讓人有一種科幻
    的頭像 發表于 05-25 08:05 ?448次閱讀
    價格<b class='flag-5'>打下來</b>了,只要9.9萬,人形機器人的春天來了嗎?

    谷歌發布新一代TPU芯片,挑戰OpenAI,挑戰語音助手市場

    當日,谷歌在年度I/O開發者大會上展示了一系列人工智能產品,包括新增的旗艦級Gemini AI模型Gemini 1.5 Flash以及AI搜索引擎等,進一步鞏固了其在網絡搜索領域的領先地位。
    的頭像 發表于 05-17 09:36 ?443次閱讀

    谷歌推出Trillium AI芯片,性能提高近5倍

    谷歌推出了其最新的人工智能數據中心芯片——Trillium。這款芯片是谷歌的第六代產品,與上一代TPU v5e相比,Trillium在每個芯片上的峰值計算性能提高了4.7倍,節能67%
    的頭像 發表于 05-16 10:39 ?789次閱讀

    谷歌推新AI音樂工具,發布第六代TPU芯片

    谷歌近日宣布與YouTube合作,推出全新音樂工具Music AI Sandbox。這款AI音樂創作工具將與傳統AI音樂應用如Suno等展開競爭,為用戶提供更多元化的音樂創作體驗。
    的頭像 發表于 05-16 09:44 ?399次閱讀

    谷歌將推出第六代數據中心AI芯片Trillium TPU

    在今日舉行的I/O 2024開發者大會上,谷歌公司震撼發布了其第六代數據中心AI芯片——Trillium Tensor處理器單元(TPU)。據谷歌首席執行官皮查伊透露,這款新型
    的頭像 發表于 05-15 11:18 ?641次閱讀

    risc-v多核芯片在AI方面的應用

    應用中的成本。 最后,RISC-V多核芯片不僅可以應用于AI邊緣計算領域,還可以擴展到其他領域,如數據中心、云計算、自動駕駛、機器人等,為這些領域提供
    發表于 04-28 09:20

    谷歌AI大模型Gemma全球開放使用

    谷歌公司近日宣布,其全新的AI大模型Gemma現已在全球范圍內開放使用。這一重要舉措不僅彰顯了谷歌AI領域的領先地位,還為其在全球范圍內的
    的頭像 發表于 02-28 18:12 ?1159次閱讀

    Groq推出大模型推理芯片 超越了傳統GPU和谷歌TPU

    Groq推出了大模型推理芯片,以每秒500tokens的速度引起轟動,超越了傳統GPU和谷歌TPU。
    的頭像 發表于 02-26 10:24 ?1055次閱讀
    Groq推出大模型推理芯片 超越了傳統GPU和<b class='flag-5'>谷歌</b><b class='flag-5'>TPU</b>

    谷歌宣布Gemma大模型全球開放使用

    谷歌公司近日宣布,其先進的AI大模型Gemma即日起在全球范圍內開放使用。這一新模型由谷歌DeepMind和其他團隊合作開發,并與其最大的AI
    的頭像 發表于 02-23 10:41 ?791次閱讀
    主站蜘蛛池模板: 青草91| 操碰人人| 日本a级影院| 青草视频网站在线观看| 免费看大尺度视频在线观看| 狠狠插狠狠插| 77788色淫网站女女免费视频| 国产精品手机在线| 久久人视频| 国产欧美色图| 最近在线视频免费观看2019| 午夜看看| 一级午夜免费视频| 天天天色| 国产免费福利网站| 成人午夜大片免费7777| 性欧美1819hd| 国产成+人+综合+亚洲欧美丁香花| aa视频免费| 日本不卡在线观看免费v| 亚洲ol| 全国男人的天堂天堂网| 国产一区美女| 天天好比| 欧美性极品高清| 最近2018年中文字幕免费图片| 四虎永久网址在线观看| 美女网站黄在线看| 一级视频免费观看| 国产a一级毛片午夜剧场14| 亚洲二区在线观看| 亚洲欧美精品一区二区| 人与性www| 成年女人毛片免费视频| 看片在线| 日本a级特黄三级三级三级 | 91po狼人社在线观看| 美女视频久久| 人人澡人人添| 全日本爽视频在线| 一级片免费视频|