在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

Neuchips展示大模型推理ASIC芯片

SSDFans ? 來源:SSDFans ? 2025-01-06 17:30 ? 次閱讀

領先的AI專用集成電路ASIC)解決方案提供商Neuchips在CES 2024上展示了其革命性的Raptor Gen AI加速芯片(以前稱為N3000)和Evo PCIe加速卡LLM解決方案。新的芯片解決方案Raptor使企業能夠以現有解決方案的一小部分成本部署大型語言模型(LLM)推理。

NeuchipsCEO Ken Lau表示:“我們很高興在CES 2024上向業界展示我們的Raptor芯片和Evo卡。Neuchips的解決方案代表了自然語言處理在性價比上的巨大飛躍。有了Neuchips,任何組織都可以在廣泛的AI應用中從LLM中獲得力量。”

LLM民主化

Raptor和Evo共同提供了一個優化的堆棧,使企業可以輕松訪問市場領先的LLM。與現有解決方案相比,Neuchips的AI解決方案顯著降低了硬件成本。高能效也最大限度地減少了用電量,進一步降低了總擁有成本。

在CES 2024上,Neuchips展示了Raptor和Evo,在個人AI助理應用程序上加速Whisper和LlamaAI聊天機器人。該解決方案突出了LLM推理對實際業務需求的強大功能。

其他技術會議將展示Raptor和Evo如何削減語音到文本應用程序的部署成本。

Raptor GenAI加速器為突破LLM性能提供動力

Raptor每個芯片的運算速度高達每秒200TOPS。它在AI推理操作(如矩陣乘法、向量和嵌入表查找)方面的出色性能適用于Gen-AI和基于變壓器的AI模型。這一突破性的吞吐量是通過Neuchips為神經網絡量身定制的專利壓縮和效率優化來實現的。

Evo第5代PCIe卡為加速和低功耗設定新標準

與Raptor互補的是Neuchips的超低功耗Evo加速卡。Evo結合了8通道PCIe Gen 5和32GB LPDDR5,實現64 GB/s主機I/O帶寬和1.6 Tbps每秒的內存帶寬,每卡僅55瓦。

正如DLRM所展示的那樣,Evo還具有100%的可擴展性,允許客戶通過添加更多芯片來線性提高性能。這種模塊化設計確保了對未來AI工作負載的投資保護。

公司2024年下半年推出了HHHL(half-height half-length)外形產品Viper,提供更大的部署靈活性。新系列在緊湊的設計中帶來了數據中心級的AI加速。

原文鏈接:

https://www.techpowerup.com/317298/neuchips-to-showcase-industry-leading-gen-ai-inferencing-accelerators-at-ces-2024


聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • ASIC芯片
    +關注

    關注

    2

    文章

    92

    瀏覽量

    23825
  • LLM
    LLM
    +關注

    關注

    0

    文章

    298

    瀏覽量

    361

原文標題:Neuchips展示大模型推理ASIC芯片!

文章出處:【微信號:SSDFans,微信公眾號:SSDFans】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    智譜推出深度推理模型GLM-Zero預覽版

    近日,智譜公司正式發布了其深度推理模型GLM-Zero的預覽版——GLM-Zero-Preview。這款模型標志著智譜在擴展強化學習技術訓練推理模型方面的重大突破,成為其首個專注于增強AI推理
    的頭像 發表于 01-03 10:42 ?155次閱讀

    智譜GLM-Zero深度推理模型預覽版正式上線

    近日,智譜公司宣布其深度推理模型GLM-Zero的初代版本——GLM-Zero-Preview已正式上線。這款模型是智譜首個基于擴展強化學習技術訓練的推理模型,標志著智譜在AI推理領域
    的頭像 發表于 01-02 10:55 ?153次閱讀

    如何開啟Stable Diffusion WebUI模型推理部署

    如何開啟Stable Diffusion WebUI模型推理部署
    的頭像 發表于 12-11 20:13 ?146次閱讀
    如何開啟Stable Diffusion WebUI<b class='flag-5'>模型</b><b class='flag-5'>推理</b>部署

    阿里云開源推理模型QwQ

    推理能力,尤其在數學和編程方面表現突出。其整體推理水平已經可以與OpenAI的o1模型相媲美,這充分展示了QwQ的強大實力和潛力。 QwQ(Qwen with Questions)是通
    的頭像 發表于 11-29 11:30 ?603次閱讀

    使用vLLM+OpenVINO加速大語言模型推理

    隨著大語言模型的廣泛應用,模型的計算需求大幅提升,帶來推理時延高、資源消耗大等挑戰。
    的頭像 發表于 11-15 14:20 ?505次閱讀
    使用vLLM+OpenVINO加速大語言<b class='flag-5'>模型</b><b class='flag-5'>推理</b>

    高效大模型推理綜述

    模型由于其在各種任務中的出色表現而引起了廣泛的關注。然而,大模型推理的大量計算和內存需求對其在資源受限場景的部署提出了挑戰。業內一直在努力開發旨在提高大模型
    的頭像 發表于 11-15 11:45 ?528次閱讀
    高效大<b class='flag-5'>模型</b>的<b class='flag-5'>推理</b>綜述

    FPGA和ASIC在大模型推理加速中的應用

    隨著現在AI的快速發展,使用FPGA和ASIC進行推理加速的研究也越來越多,從目前的市場來說,有些公司已經有了專門做推理ASIC,像Groq的LPU,專門針對大語言
    的頭像 發表于 10-29 14:12 ?646次閱讀
    FPGA和<b class='flag-5'>ASIC</b>在大<b class='flag-5'>模型</b><b class='flag-5'>推理</b>加速中的應用

    澎峰科技高性能大模型推理引擎PerfXLM解析

    自ChatGPT問世以來,大模型遍地開花,承載大模型應用的高性能推理框架也不斷推出,大有百家爭鳴之勢。在這種情況下,澎峰科技作為全球領先的智能計算服務提供商,在2023年11月25日發布了針對大語言
    的頭像 發表于 09-29 10:14 ?538次閱讀
    澎峰科技高性能大<b class='flag-5'>模型</b><b class='flag-5'>推理</b>引擎PerfXLM解析

    OpenAI即將發布“草莓”推理模型

    科技界迎來新動態,據可靠消息透露,OpenAI正緊鑼密鼓地籌備著一項重大發布——預計在兩周內,將正式推出名為“草莓”的新型AI推理模型,并將其無縫融入ChatGPT服務中。這款以卓越推理能力為核心的大模型,旨在突破現有GPT-4
    的頭像 發表于 09-11 16:53 ?555次閱讀

    LLM大模型推理加速的關鍵技術

    LLM(大型語言模型)大模型推理加速是當前人工智能領域的一個研究熱點,旨在提高模型在處理復雜任務時的效率和響應速度。以下是對LLM大模型
    的頭像 發表于 07-24 11:38 ?968次閱讀

    如何加速大語言模型推理

    的主要挑戰。本文將從多個維度深入探討如何加速大語言模型推理過程,以期為相關領域的研究者和開發者提供參考。
    的頭像 發表于 07-04 17:32 ?602次閱讀

    【大語言模型:原理與工程實踐】揭開大語言模型的面紗

    用于文本生成,根據提示或上下文生成連貫、富有創造性的文本,為故事創作等提供無限可能。大語言模型也面臨挑戰。一方面,其計算資源需求巨大,訓練和推理耗時;另一方面,模型高度依賴數據,需要大規模訓練數據才能
    發表于 05-04 23:55

    模型推理顯卡選購指南:4090顯卡為何成為不二之選

    眾所周知,在人工智能領域,尤其是在模型訓練和推理階段,顯卡的性能至關重要。隨著模型的規模越來越大,對算力的需求也會倍增。因此,如何選擇合適的顯卡,魚(性能)和性價比(熊掌)是否可以兼得,是許多
    的頭像 發表于 04-11 11:00 ?822次閱讀
    大<b class='flag-5'>模型</b><b class='flag-5'>推理</b>顯卡選購指南:4090顯卡為何成為不二之選

    Groq LPU崛起,AI芯片主戰場從訓練轉向推理

    人工智能推理的重要性日益凸顯,高效運行端側大模型及AI軟件背后的核心技術正是推理。不久的未來,全球芯片制造商的主要市場將全面轉向人工智能推理
    的頭像 發表于 02-29 16:46 ?1236次閱讀

    Groq推出大模型推理芯片 超越了傳統GPU和谷歌TPU

    Groq推出了大模型推理芯片,以每秒500tokens的速度引起轟動,超越了傳統GPU和谷歌TPU。
    的頭像 發表于 02-26 10:24 ?1095次閱讀
    Groq推出大<b class='flag-5'>模型</b><b class='flag-5'>推理</b><b class='flag-5'>芯片</b> 超越了傳統GPU和谷歌TPU
    主站蜘蛛池模板: 成人午夜剧场| 欧美大狠狠大臿蕉香蕉大视频| 久久久黄色大片| 7799国产精品久久久久99| 高清毛片aaaaaaaaa片| 福利片欧美| 69成人免费视频| 天天综合五月天| 免费高清特黄a 大片| 国产精品久久久福利| 黄色hd| 欧美精品一区二区三区在线播放| 国产免费亚洲| 四虎永久在线免费观看| 欧美性色xo影院在线观看| www.午夜视频| 日本不卡一区二区三区在线观看| 日本高清一区二区三区不卡免费 | 美国激情ap毛片| 久久男人精品| 免费 的黄色| 国产农村一级特黄α真人毛片| 六月色| 国产伦子一区二区三区| 亚洲va欧美va国产综合久久| 九九热最新| 国产性猛交xx乱| 伊人久久大香线焦在观看| 日韩欧美色图| 东方天堂网| 失禁h啪肉尿出来高h男男| 色www国产阿娇| 爱逼色| 怡红院网址| 日韩免费网站| 大尺度视频在线观看| 喷潮白浆直流在线播放| 亚洲资源在线观看| 天堂网址| 国产精品一区电影| 久久91精品牛牛|