在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

完善資料讓更多小伙伴認識你，還能領取20積分哦，立即完善>

3天內不再提示

Neuchips展示大模型推理ASIC芯片

領先的AI專用集成電路（ASIC）解決方案提供商Neuchips在CES 2024上展示了其革命性的Raptor Gen AI加速芯片（以前稱為N3000）和Evo PCIe加速卡LLM解決方案。新的芯片解決方案Raptor使企業能夠以現有解決方案的一小部分成本部署大型語言模型（LLM）推理。

NeuchipsCEO Ken Lau表示：“我們很高興在CES 2024上向業界展示我們的Raptor芯片和Evo卡。Neuchips的解決方案代表了自然語言處理在性價比上的巨大飛躍。有了Neuchips，任何組織都可以在廣泛的AI應用中從LLM中獲得力量。”

LLM民主化

Raptor和Evo共同提供了一個優化的堆棧，使企業可以輕松訪問市場領先的LLM。與現有解決方案相比，Neuchips的AI解決方案顯著降低了硬件成本。高能效也最大限度地減少了用電量，進一步降低了總擁有成本。

在CES 2024上，Neuchips展示了Raptor和Evo，在個人AI助理應用程序上加速Whisper和LlamaAI聊天機器人。該解決方案突出了LLM推理對實際業務需求的強大功能。

其他技術會議將展示Raptor和Evo如何削減語音到文本應用程序的部署成本。

Raptor GenAI加速器為突破LLM性能提供動力

Raptor每個芯片的運算速度高達每秒200TOPS。它在AI推理操作（如矩陣乘法、向量和嵌入表查找）方面的出色性能適用于Gen-AI和基于變壓器的AI模型。這一突破性的吞吐量是通過Neuchips為神經網絡量身定制的專利壓縮和效率優化來實現的。

Evo第5代PCIe卡為加速和低功耗設定新標準

與Raptor互補的是Neuchips的超低功耗Evo加速卡。Evo結合了8通道PCIe Gen 5和32GB LPDDR5，實現64 GB/s主機I/O帶寬和1.6 Tbps每秒的內存帶寬，每卡僅55瓦。

正如DLRM所展示的那樣，Evo還具有100%的可擴展性，允許客戶通過添加更多芯片來線性提高性能。這種模塊化設計確保了對未來AI工作負載的投資保護。

該公司2024年下半年推出了HHHL(half-height half-length)外形產品Viper，提供更大的部署靈活性。新系列在緊湊的設計中帶來了數據中心級的AI加速。

原文鏈接：

https://www.techpowerup.com/317298/neuchips-to-showcase-industry-leading-gen-ai-inferencing-accelerators-at-ces-2024

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

ASIC芯片

ASIC芯片

+關注

關注
2

文章
92

瀏覽量
23825
LLM

LLM

+關注

關注
0

文章
298

瀏覽量
361

原文標題：Neuchips展示大模型推理ASIC芯片！

文章出處：【微信號：SSDFans，微信公眾號：SSDFans】歡迎添加關注！文章轉載請注明出處。

智譜推出深度推理模型GLM-Zero預覽版

近日，智譜公司正式發布了其深度推理模型GLM-Zero的預覽版——GLM-Zero-Preview。這款模型標志著智譜在擴展強化學習技術訓練推理模型方面的重大突破，成為其首個專注于增強AI推理

發表于 01-03 10:42 ?155次閱讀

智譜GLM-Zero深度推理模型預覽版正式上線

近日，智譜公司宣布其深度推理模型GLM-Zero的初代版本——GLM-Zero-Preview已正式上線。這款模型是智譜首個基于擴展強化學習技術訓練的推理模型，標志著智譜在AI推理領域

發表于 01-02 10:55 ?153次閱讀

如何開啟Stable Diffusion WebUI模型推理部署

如何開啟Stable Diffusion WebUI模型推理部署

發表于 12-11 20:13 ?146次閱讀

阿里云開源推理大模型QwQ

推理能力，尤其在數學和編程方面表現突出。其整體推理水平已經可以與OpenAI的o1模型相媲美，這充分展示了QwQ的強大實力和潛力。 QwQ(Qwen with Questions)是通

發表于 11-29 11:30 ?603次閱讀

使用vLLM+OpenVINO加速大語言模型推理

隨著大語言模型的廣泛應用，模型的計算需求大幅提升，帶來推理時延高、資源消耗大等挑戰。

發表于 11-15 14:20 ?505次閱讀

高效大模型的推理綜述

大模型由于其在各種任務中的出色表現而引起了廣泛的關注。然而，大模型推理的大量計算和內存需求對其在資源受限場景的部署提出了挑戰。業內一直在努力開發旨在提高大模型

發表于 11-15 11:45 ?528次閱讀

FPGA和ASIC在大模型推理加速中的應用

隨著現在AI的快速發展，使用FPGA和ASIC進行推理加速的研究也越來越多，從目前的市場來說，有些公司已經有了專門做推理的ASIC，像Groq的LPU，專門針對大語言

發表于 10-29 14:12 ?646次閱讀

澎峰科技高性能大模型推理引擎PerfXLM解析

自ChatGPT問世以來，大模型遍地開花，承載大模型應用的高性能推理框架也不斷推出，大有百家爭鳴之勢。在這種情況下，澎峰科技作為全球領先的智能計算服務提供商，在2023年11月25日發布了針對大語言

發表于 09-29 10:14 ?538次閱讀

OpenAI即將發布“草莓”推理大模型

科技界迎來新動態，據可靠消息透露，OpenAI正緊鑼密鼓地籌備著一項重大發布——預計在兩周內，將正式推出名為“草莓”的新型AI推理模型，并將其無縫融入ChatGPT服務中。這款以卓越推理能力為核心的大模型，旨在突破現有GPT-4

發表于 09-11 16:53 ?555次閱讀

LLM大模型推理加速的關鍵技術

LLM（大型語言模型）大模型推理加速是當前人工智能領域的一個研究熱點，旨在提高模型在處理復雜任務時的效率和響應速度。以下是對LLM大模型

發表于 07-24 11:38 ?968次閱讀

如何加速大語言模型推理

的主要挑戰。本文將從多個維度深入探討如何加速大語言模型的推理過程，以期為相關領域的研究者和開發者提供參考。

發表于 07-04 17:32 ?602次閱讀

【大語言模型：原理與工程實踐】揭開大語言模型的面紗

用于文本生成，根據提示或上下文生成連貫、富有創造性的文本，為故事創作等提供無限可能。大語言模型也面臨挑戰。一方面，其計算資源需求巨大，訓練和推理耗時；另一方面，模型高度依賴數據，需要大規模訓練數據才能

發表于 05-04 23:55

大模型推理顯卡選購指南：4090顯卡為何成為不二之選

眾所周知,在人工智能領域,尤其是在模型訓練和推理階段,顯卡的性能至關重要。隨著模型的規模越來越大,對算力的需求也會倍增。因此,如何選擇合適的顯卡,魚(性能)和性價比(熊掌)是否可以兼得,是許多

發表于 04-11 11:00 ?822次閱讀

Groq LPU崛起，AI芯片主戰場從訓練轉向推理

人工智能推理的重要性日益凸顯，高效運行端側大模型及AI軟件背后的核心技術正是推理。不久的未來，全球芯片制造商的主要市場將全面轉向人工智能推理

發表于 02-29 16:46 ?1236次閱讀

Groq推出大模型推理芯片超越了傳統GPU和谷歌TPU

Groq推出了大模型推理芯片，以每秒500tokens的速度引起轟動，超越了傳統GPU和谷歌TPU。

發表于 02-26 10:24 ?1095次閱讀

SSDFans
專欄

0 文章 0 閱讀 0 粉絲 0 點贊

關注個人主頁

Hot 碎屏手機數據導出方案
Hot 什么是UFS？為什么說UFS是手機存儲的未來？

New 2025年人工智能會發生哪些變化
New ST汽車MCU：FD-SOI+PCM相變存儲

精選推薦
更多

文章

資料

帖子

功率半導體器件的雙脈沖測試方案

泰克科技
15小時前

268 閱讀

國產AI卷翻硅谷，奧特曼發文“陰陽”，類o1模型都在卷什么？

腦極體
17小時前

448 閱讀

FPGA實現AXI4總線的讀寫

FPGA設計論壇
17小時前

274 閱讀

一種新型RDL PoP扇出晶圓級封裝工藝芯片到晶圓鍵合技術

深圳市賽姆烯金科技有限公司
17小時前

330 閱讀

如何使用EPC9176評估板設計真空吸塵器電機驅動逆變器

eeDesigner
18小時前

340 閱讀

S7-400FH系統在14萬噸硫磺回收聯合裝置中的應用

張國厚
454

5積分

33下載

電磁兼容（EMC）設計典型電路匯總

9.52 MB

10積分

127下載

大電流電感CSCM1480H-3R5M-CODACA科達嘉.pdf

CODACA科達嘉電感
1.23 MB

免費

6下載

JPImageresizerView簡易的裁剪圖片工具

李濤
12.39 MB

2積分

4下載

LMR SDR收發器10到160米波段V1.6開源

1123127317
0.01 MB

免費

0下載

迎新春，蓋樓搶好禮！歡張飛實戰電子入駐電子發燒友社區！

ElecFans小喇叭
1天前

405 閱讀

新春有獎活動！金蛇迎春，蛇年大吉，留言分享贏取精美禮品！

ElecFans小喇叭
1天前

538 閱讀

電子發燒友社區2025年春節放假通知！

ElecFans小喇叭
1天前

575 閱讀

飛凌嵌入式ElfBoard ELF 1板卡-移植前準備之git管理內核源碼

jf_13411809
1天前

479 閱讀

spectre和hpeesofsim仿真直流電壓結果不同

jf_73144026
2天前

847 閱讀

推薦專欄
更多

在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

搜索歷史

Neuchips展示大模型推理ASIC芯片

評論

智譜推出深度推理模型GLM-Zero預覽版

智譜GLM-Zero深度推理模型預覽版正式上線

如何開啟Stable Diffusion WebUI模型推理部署

阿里云開源推理大模型QwQ

使用vLLM+OpenVINO加速大語言模型推理

高效大模型的推理綜述

FPGA和ASIC在大模型推理加速中的應用

澎峰科技高性能大模型推理引擎PerfXLM解析

OpenAI即將發布“草莓”推理大模型

LLM大模型推理加速的關鍵技術

如何加速大語言模型推理

【大語言模型：原理與工程實踐】揭開大語言模型的面紗

大模型推理顯卡選購指南：4090顯卡為何成為不二之選

Groq LPU崛起，AI芯片主戰場從訓練轉向推理

Groq推出大模型推理芯片超越了傳統GPU和谷歌TPU