神武八荒一颗小说,将夜猫腻小说,手机推荐排行榜

大語言模型（LLM）在企業組織中的應用日益廣泛，許多企業都將其整合到 AI 應用中。雖然從基礎模型著手十分高效，但需要花費一定的精力才能將它們整合到生產就緒型環境中。NVIDIA NIM簡化了這一過程，使企業能夠在數據中心、云、工作站和 PC 等任何位置運行 AI 模型。

專為企業設計的 NIM 提供一整套預構建云原生微服務，這些微服務能夠被輕松地整合到現有基礎設施中。這些微服務經過精心的維護和持續的更新，具有開箱即用的性能，并確保您能夠獲得 AI 推理技術的最新進展。

適用于大語言模型的全新 NVIDIA NIM

基礎模型的增長源于其能夠滿足各種企業需求的能力，但沒有任何一個單一的模型能夠完全滿足企業的需求，企業通常會根據特定的數據需求和 AI 應用工作流，在其用例中使用不同的基礎模型。

考慮到企業需求的多樣化，我們擴大了 NIM 的陣容，涵蓋了Mistral-7B、Mixtral-8x7B和Mixtral-8x22B，這三個基礎模型在特定任務中的表現都十分出色。

圖 1. 新的 Mixtral 8x7B Instruct NIM

可從 NVIDIA API 中獲取

Mistral 7B NIM

Mistral 7B Instruct 模型在文本生成和語言理解任務中表現出色。該模型可在單個 GPU 上運行，非常適合語言翻譯、內容生成和聊天機器人等應用。將 Mistral 7B NIM 部署至 NVIDIA 數據中心 GPU 后，開發者在內容生成任務中可實現的開箱即用性能（token/秒），其性能最多可提升至沒有使用 NIM 時的 2.3 倍。

圖 2. Mistral 7B NIM 提高了內容生成的吞吐量

基于 1 個 NVIDIA Tensor Core GPU，輸入 500 個 token，輸出 2,000 個 token。NIM 開啟時：FP8。吞吐量為 5,697 token/秒，TTFT 為 0.6 秒，ITL 為 26 毫秒。NIM 關閉時：FP16。吞吐量為 2,529 token/秒，TTFT 為 1.4 秒，ITL 為 60 毫秒。

Mixtral-8x7B和

Mixtral-8x22B NIM

Mixtral-8x7B 和 Mixtral-8x22B 模型采用混合專家（MoE）架構提供快速且經濟高效的推理。這兩個模型在總結、問題解答和代碼生成等任務中表現出色，非常適合需要實時響應的應用。

相較無 NIM 運行的情況，NIM 可以提高這兩種模型的開箱即用性能。當用于內容生成且在 1 個 NVIDIA Tensor Core GPU 上運行時，Mixtral-8x7B NIM 的吞吐量最多可提高 4.1 倍。在內容生成和翻譯用例中，Mixtral-8x22B NIM 的吞吐量最多可提高 2.9 倍。

圖 3. Mixtral 8x7B NIM

提高了內容生成的吞吐量

輸入 500 個 token，輸出 2,000 個 token。200 個并發請求。NIM 開啟時：FP8。吞吐量為 9,410 token/秒。TTFT 為 740 毫秒，ITL 為 21 毫秒。NIM 關閉時：FP16。吞吐量為 2,300 token/秒，TTFT 為 1,321 毫秒，ITL 為 86 毫秒。

圖 4. Mixtral 8x22B NIM

提高了內容生成和翻譯的吞吐量

輸入 1,000 個 token，輸出 1,000 個 token。250 個并發請求。NIM 開啟時：吞吐量為 6,070 token/秒，TTFT 為 3 秒，ITL 為 38 毫秒。NIM 關閉時：吞吐量為 2,067 token/秒，TTFT 為 5 秒，ITL 為 116 毫秒。

借助 NVIDIA NIM 加速 AI 應用部署

開發者可以使用 NIM 縮短構建適用于生產部署的 AI 應用所需的時間，同時還能提高 AI 推理效率，并降低運營成本。借助 NIM，經過優化的 AI 模型實現了容器化，為開發者帶來了以下優勢：

性能和規模

這些云驅動的微服務可提供低延遲、高吞吐量并可以輕松擴展的 AI 推理，使用 Llama 3 70B NIM，最多可將吞吐量提高 5 倍。NIM 還支持精確的微調模型，無需從頭開始構建即可實現超高的準確性，進一步提高了 AI 推理性能。

易于使用

通過簡化與現有系統的整合來加快進入市場的速度，并在 NVIDIA 加速基礎設施上提供最佳性能。借助專為企業使用而設計的 API 和工具，開發者可以實現其 AI 能力的最大化。

安全性和易管理性

確保您的 AI 應用和數據具有強大的可控性和安全性。通過NVIDIA AI Enterprise，NIM 支持在任何基礎設施上的靈活自托管部署，提供企業級軟件、嚴格的驗證以及與 NVIDIA AI 專家的直接連線。

AI 推理的前景：

NVIDIA NIM 及其他延伸

NVIDIA NIM 代表了 AI 推理領域的重大進步。隨著各行各業對 AI 應用需求的日益增長，高效部署這些應用變得至關重要。想要利用 AI 變革力量的企業可以使用 NVIDIA NIM，將預構建的云原生微服務輕松整合到現有系統中，以此加快產品推出速度，保持在創新領域的領先地位。

未來的 AI 推理將超越單個 NVIDIA NIM。隨著對先進 AI 應用的需求不斷增長，連接多個 NVIDIA NIM 將變得至關重要。這種微服務網絡將帶來能夠協同工作和適應各種任務的高度智能化應用，從而深入改變我們使用技術的方式。如要在您的基礎設施上部署 NIM 推理微服務，請查看“使用 NVIDIA NIM 部署生成式 AI 的簡單指南”:

NVIDIA 定期發布新的 NIM，為企業提供最強大的 AI 模型，助企業應用一臂之力。請訪問API 目錄，查找適用于 LLM、視覺、檢索、3D 和數字生物學模型的最新 NVIDIA NIM。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

NVIDIA

NVIDIA

+關注

關注
14

文章
4986

瀏覽量
103046
AI

AI

+關注

關注
87

文章
30887

瀏覽量
269063
模型

模型

+關注

關注
1

文章
3243

瀏覽量
48836
微服務

微服務

+關注

關注
0

文章
137

瀏覽量
7348

原文標題：全新 NVIDIA NIM：可適用于 Mistral 和 Mixtral 模型并為您的 AI 項目賦能

文章出處：【微信號：NVIDIA-Enterprise，微信公眾號：NVIDIA英偉達企業解決方案】歡迎添加關注！文章轉載請注明出處。

NVIDIA數字人技術加速部署生成式AI驅動的游戲角色

NVIDIA 在 GDC 2024 大會上宣布，Inworld AI 等領先的 AI 應用程序開發者，正在使用 NVIDIA 數字人技術加速

發表于 04-09 10:08 ?669次閱讀

<b class='flag-5'>NVIDIA</b>數字人技術<b class='flag-5'>加速</b><b class='flag-5'>部署</b>生成式<b class='flag-5'>AI</b>驅動的游戲角色

NVIDIA AI微服務現已與AWS集成，加速藥物研發和數字醫療

NVIDIA NIM 使數千家使用 AWS 的醫療和生命科學公司能夠快速、輕松開發和部署生成式 AI。

發表于 05-09 09:21 ?1559次閱讀

NVIDIA NIM 革命性地改變模型部署，將全球數百萬開發者轉變為生成式 AI 開發者

部署在云、數據中心或工作站上。借助 NVIDIA NIM，開發者能夠輕松地為 copilots、聊天機器人等構建生成式 AI 應用，所需時間

發表于 06-03 09:12 ?227次閱讀

<b class='flag-5'>NVIDIA</b> <b class='flag-5'>NIM</b> 革命性地改變模型<b class='flag-5'>部署</b>，將全球數百萬開發者轉變為生成式 <b class='flag-5'>AI</b> 開發者

英偉達推出AI模型推理服務NVIDIA NIM

英偉達近日宣布推出一項革命性的AI模型推理服務——NVIDIA NIM。這項服務將極大地簡化AI模型部署過程，為全球的2800萬英偉達開發者

發表于 06-04 09:15 ?679次閱讀

英偉達推出全新NVIDIA AI Foundry服務和NVIDIA NIM推理微服務

NVIDIA 宣布推出全新 NVIDIA AI Foundry 服務和 NVIDIA NIM 推理微服務，與同樣剛推出的 Llama 3.1

發表于 07-25 09:48 ?706次閱讀

NVIDIA NIM:打造AI領域的AI-in-a-Box,提高AI開發與部署的高效性

據7月30日官方發布的資訊顯示，在全球備受矚目的計算機圖形學盛會——SIGGRAPH 2024上，NVIDIA公司對外展示了其在諸如渲染、仿真及生成式AI等前沿領域所取得的卓越成果，而其中最為引人注目的便是NVIDIA

發表于 07-30 16:27 ?678次閱讀

全新NVIDIA NIM微服務將生成式AI引入數字環境

生成式物理 AI NIM 微服務以及 NVIDIA Metropolis 參考工作流旨在協助創建智能的沉浸式工作環境。

發表于 08-02 15:20 ?545次閱讀

借助NVIDIA NIM微服務助力可口可樂公司擴展生成式AI內容

借助 NVIDIA NIM 微服務 USD Search 和 USD Code，市場營銷領導者 WPP 幫助飲料公司在全球范圍內加速創意活動的迭代。

發表于 08-13 16:16 ?568次閱讀

NVIDIA 攜手全球合作伙伴推出 NIM Agent Blueprints，助力企業打造屬于自己的 AI

可定制工作流目錄加快核心生成式 AI 用例的部署速度。首批用例包括客戶服務、藥物研發和 PDF 數據提取，未來將加入更多用例企業可以使用 NIM Agent Blueprints 以及

發表于 08-28 10:10 ?218次閱讀

<b class='flag-5'>NVIDIA</b> 攜手全球合作伙伴推出 <b class='flag-5'>NIM</b> Agent Blueprints，助力企業打造屬于自己的 <b class='flag-5'>AI</b>

NVIDIA與思科合作打造企業級生成式AI基礎設施

由 NVIDIA 加速計算平臺、NVIDIA AI Enterprise 軟件和 NVIDIA NIM

發表于 10-10 09:35 ?353次閱讀

NVIDIA NIM助力企業高效部署生成式AI模型

Canonical、Nutanix 和 Red Hat 等廠商的開源 Kubernetes 平臺集成了 NVIDIA NIM，將允許用戶通過 API 調用來大規模地部署大語言模型。

發表于 10-10 09:49 ?395次閱讀

日本企業借助NVIDIA產品加速AI創新

日本領先企業和大學正在使用 NVIDIA NeMo、NIM 微服務和 NVIDIA Isaac 加速 AI 創新。

發表于 11-19 14:34 ?299次閱讀

NVIDIA加速AI在日本各行各業的應用

企業借助基于 NVIDIA AI Enterprise 與 Omniverse 工業 AI 構建的創新中心和服務加速

發表于 11-19 15:45 ?232次閱讀

NVIDIA推出適用于網絡安全的NIM Blueprint

德勤使用適用于容器安全的 NVIDIA NIM Agent Blueprint 幫助企業利用開源軟件構建安全的 AI。

發表于 11-20 09:58 ?223次閱讀

全新NVIDIA NIM微服務實現突破性進展

全新 NVIDIA NIM 微服務實現突破性進展，可助力氣象技術公司開發和部署 AI 模型，實現對降雪、結冰和冰雹的預測。

發表于 11-21 10:07 ?208次閱讀

在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

搜索歷史

借助NVIDIA NIM加速AI應用部署

評論

NVIDIA數字人技術加速部署生成式AI驅動的游戲角色

NVIDIA AI微服務現已與AWS集成，加速藥物研發和數字醫療

NVIDIA NIM 革命性地改變模型部署，將全球數百萬開發者轉變為生成式 AI 開發者

英偉達推出AI模型推理服務NVIDIA NIM

英偉達推出全新NVIDIA AI Foundry服務和NVIDIA NIM推理微服務

NVIDIA NIM:打造AI領域的AI-in-a-Box,提高AI開發與部署的高效性

全新NVIDIA NIM微服務將生成式AI引入數字環境

借助NVIDIA NIM微服務助力可口可樂公司擴展生成式AI內容

NVIDIA 攜手全球合作伙伴推出 NIM Agent Blueprints，助力企業打造屬于自己的 AI

NVIDIA與思科合作打造企業級生成式AI基礎設施

NVIDIA NIM助力企業高效部署生成式AI模型

日本企業借助NVIDIA產品加速AI創新

NVIDIA加速AI在日本各行各業的應用

NVIDIA推出適用于網絡安全的NIM Blueprint

全新NVIDIA NIM微服務實現突破性進展