在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

全新 NVIDIA NeMo Retriever微服務大幅提升LLM的準確性和吞吐量

NVIDIA英偉達企業解決方案 ? 來源:NVIDIA英偉達企業解決方案 ? 2024-07-26 11:13 ? 次閱讀

企業能夠通過提供檢索增強生成功能的生產就緒型 NVIDIA NIM 推理微服務,充分挖掘業務數據的價值。這些微服務現已集成到 Cohesity、DataStax、NetApp 和 Snowflake 平臺中。

如果缺乏準確性,生成式 AI 應用不但無法產生價值,有時甚至還會產生負價值。而準確性的根源在于數據。

為幫助開發者高效獲取最佳的專有數據,以便為他們的 AI 應用生成知識淵博的回答,NVIDIA 宣布推出四項全新的 NVIDIA NeMo Retriever NIM 推理微服務。

Llama 3.1 模型集也同期發布。當與適用于該模型集的 NVIDIA NIM 推理微服務相結合時,NeMo Retriever NIM 推理微服務不僅能夠使企業擴展到代理式 AI 工作流(在此工作流中,AI 應用可以在最少的干預或監督下準確運行),還能夠提供極為精準的檢索增強生成(RAG)。

通過 NeMo Retriever,企業可以將自定義模型與各種業務數據無縫連接,并使用 RAG 為 AI 應用作出高度準確的回答。這套生產就緒型微服務實際上為創建高度準確的 AI 應用提供了非常精準的信息檢索功能。

例如當開發者創建 AI 智能體和客服聊天機器人、分析安全漏洞或從復雜的供應鏈信息中提取洞察時,NeMo Retriever 能夠大幅提高模型的準確性和吞吐量。

NIM 推理微服務實現了高性能、易于使用的企業級推理。開發者能夠使用 NeMo Retriever NIM 微服務并充分利用自己的數據,來獲得這一切。

已正式發布的全新 NeMo Retriever 向量化和重排序 NIM 微服務如下:

NV-EmbedQA-E5-v5:一個常用社區基礎向量化模型,針對文本問答檢索進行了優化

NV-EmbedQA-Mistral7B-v2:一個常用多語言社區基礎模型,針對文本向量化功能進行了微調,以實現高度準確的問答

Snowflake-Arctic-Embed-L:一個經過優化的社區模型

NV-RerankQA-Mistral4B-v3:一個常用社區基礎模型,針對文本重排功能進行了微調,以實現高度準確的問答

這些模型加入到 NIM 微服務集中,可通過 NVIDIA API 目錄輕松訪問。

向量化和重排序模型

NeMo Retriever NIM 微服務包含兩種模型——向量化和重排序模型,以及確保透明度和可靠性的開放式和商業化服務。

2b24405a-4a67-11ef-b8af-92fbcf53809c.png

RAG 管線示例:使用了適用于 Llama 3.1 的 NVIDIA NIM 微服務以及適用于客服 AI 聊天機器人應用的 NeMo Retriever 向量化和重排序 NIM 微服務

向量化模型在將文本、圖像、圖表和視頻等各種數據轉化為數字向量,并存儲在向量數據庫中的同時,獲取其含義和細微差別。與傳統的大語言模型(LLM)相比,向量化模型速度更快且計算成本更低。

重排序模型可獲取數據和查詢,隨后根據數據與查詢的相關性對數據進行評分。與向量化模型相比,這類模型雖然計算復雜且速度較慢,但能大幅提高準確性。

NeMo Retriever 提供了兩全其美的解決方案。開發者可以充分利用 NeMo Retriever 建立一個能夠給企業提供最有用、最準確結果的流程。該流程先通過向量化 NIM 檢索巨大的數據網,然后使用重排序 NIM 篩選結果的相關性。

通過 NeMo Retriever,開發者能夠使用先進的開源商業模型,構建極為精準的文本問答檢索管線。與其他模型相比,NeMo Retriever NIM 微服務在企業問答中提供的不準確答案減少了 30%。

2b430cba-4a67-11ef-b8af-92fbcf53809c.png

NeMo Retriever 向量化 NIM 和向量化 + 重排序 NIM 微服務性能與詞法搜索和替代向量的對比。

熱門用例

無論是 RAG 和 AI 智能體解決方案,還是數據驅動的分析,NeMo Retriever 都能夠為各種 AI 應用提供助力。

這套微服務可用于創建能夠作出準確、情境感知響應的智能聊天機器人、幫助分析海量數據以識別安全漏洞、從復雜的供應鏈信息中提取洞察等。它們還能勝任許多其他任務,比如幫助 AI 賦能的零售業購物顧問提供自然、個性化的購物體驗。

針對這些用例的 NVIDIA AI 工作流為開發生成式 AI 賦能的技術提供了一個簡單且能夠獲得支持的起點。

數十家 NVIDIA 數據平臺合作伙伴正在使用 NeMo Retriever NIM 微服務提高其 AI 模型的準確性和吞吐量。

DataStax 在其 Astra DB 和超融合平臺中集成了 NeMo Retriever 向量化 NIM 微服務,使企業能夠為客戶提供準確的、經過生成式 AI 增強的 RAG 功能,并加快產品上市時間。

Cohesity 將在其 AI 產品 Cohesity Gaia 中集成 NVIDIA NeMo Retriever 微服務,以便幫助客戶通過 RAG 將自己的數據用于驅動富有洞察力和變革性的生成式 AI 應用。

Kinetica 將使用 NVIDIA NeMo Retriever 開發 LLM 智能體。這些智能體能夠通過自然語言與復雜的網絡進行交互,從而對中斷或漏洞作出更快的響應,將洞察轉化為即時行動。

NetApp 正在與 NVIDIA 合作,將 NeMo Retriever 微服務連接到其智能數據基礎設施上的 EB 級數據。所有 NetApp ONTAP 客戶都將能夠“與他們的數據無縫對話”,在不影響數據安全或隱私的情況下獲得專屬的業務洞察。

NVIDIA 全球系統集成商合作伙伴包括埃森哲、德勤、Infosys、LTTS、Tata Consultancy Services、Tech Mahindra 和 Wipro 等,以及服務交付合作伙伴 Data Monsters、EXLService (愛爾蘭) Limited、Latentview、Quantiphi、Slalom、SoftServe 和 Tredence 正在開發各種服務,幫助企業將 NeMo Retriever NIM 微服務添加到他們的 AI 管線中。

與其他 NIM 微服務一起使用

NeMo Retriever NIM 微服務可與 NVIDIA Riva NIM 微服務一起使用。后者為各行各業的語音 AI 應用提供強大助力,增強了客戶服務并且讓數字人變得栩栩如生。

即將以 Riva NIM 微服務形式推出的新模型包括:適用于文本轉語音應用的 FastPitch 和 HiFi-GAN;適用于多語言神經機器翻譯的 Megatron;以及適用于自動語音識別的破紀錄 NVIDIA Parakeet 系列模型。

NVIDIA NIM 微服務既可以組合使用,也可以單獨使用,為開發者提供構建 AI 應用的模塊化方法。這些微服務還可以在云端、本地或混合環境中與社區模型、NVIDIA 模型或用戶自定義模型集成,為開發者帶來了更大的靈活性。

NVIDIA NIM 微服務現在可在 ai.nvidia.com 上獲取。企業可通過 NVIDIA AI Enterprise 軟件平臺使用 NIM 將 AI 應用部署到生產中。

NIM 微服務可在客戶首選的加速基礎設施上運行,包括亞馬遜科技、谷歌云、Microsoft Azure 和 Oracle Cloud Infrastructure 的云實例,以及思科、戴爾科技、慧與、聯想和 Supermicro 等全球服務器制造合作伙伴的 NVIDIA 認證系統。

NVIDIA 開發者計劃會員很快將能夠免費使用 NIM,以在他們首選的基礎設施上進行研究、開發和測試。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 機器人
    +關注

    關注

    211

    文章

    28557

    瀏覽量

    207684
  • NVIDIA
    +關注

    關注

    14

    文章

    5049

    瀏覽量

    103349
  • AI
    AI
    +關注

    關注

    87

    文章

    31262

    瀏覽量

    269620
  • LLM
    LLM
    +關注

    關注

    0

    文章

    296

    瀏覽量

    356

原文標題:上吧,AI!全新 NVIDIA NeMo Retriever 微服務大幅提升 LLM 的準確性和吞吐量

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業解決方案】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    數據吞吐量提升!面向下一代音頻設備,藍牙HDT、星閃、Wi-Fi、UWB同臺競技

    電子發燒友網報道(文/莫婷婷)音頻設備數據吞吐量提升是當前無線通信領域的一個重要發展趨勢,藍牙、Wi-Fi和UWB作為三種主要的無線通信技術,在這一趨勢中扮演著關鍵角色。 ? 數據吞吐量指的是在
    的頭像 發表于 12-25 01:22 ?1777次閱讀

    全新NVIDIA NIM微服務實現突破進展

    全新 NVIDIA NIM 微服務實現突破進展,可助力氣象技術公司開發和部署 AI 模型,實現對降雪、結冰和冰雹的預測。
    的頭像 發表于 11-21 10:07 ?261次閱讀

    日本企業借助NVIDIA產品加速AI創新

    日本領先企業和大學正在使用 NVIDIA NeMo、NIM 微服務NVIDIA Isaac 加速 AI 創新。
    的頭像 發表于 11-19 14:34 ?347次閱讀

    如何提升ASR模型的準確性

    提升ASR(Automatic Speech Recognition,自動語音識別)模型的準確性是語音識別技術領域的核心挑戰之一。以下是一些提升ASR模型準確性的關鍵方法: 一、優化數
    的頭像 發表于 11-18 15:14 ?1054次閱讀

    TMS320VC5510 HPI吞吐量和優化

    電子發燒友網站提供《TMS320VC5510 HPI吞吐量和優化.pdf》資料免費下載
    發表于 10-16 09:35 ?0次下載
    TMS320VC5510 HPI<b class='flag-5'>吞吐量</b>和優化

    TMS320C6474模塊吞吐量

    電子發燒友網站提供《TMS320C6474模塊吞吐量.pdf》資料免費下載
    發表于 10-15 13:52 ?0次下載
    TMS320C6474模塊<b class='flag-5'>吞吐量</b>

    NVIDIA NIM微服務帶來巨大優勢

    服務通過熱門 AI 模型為數百萬開發者帶來高達 5 倍的 token 效率提升,使他們能夠立即訪問在 NVIDIA DGX Cloud 上運行的 NIM 微服務
    的頭像 發表于 08-23 15:20 ?519次閱讀

    全新NVIDIA NIM微服務將生成式AI引入數字環境

    生成式物理 AI NIM 微服務以及 NVIDIA Metropolis 參考工作流旨在協助創建智能的沉浸式工作環境。
    的頭像 發表于 08-02 15:20 ?569次閱讀

    采用OpenUSD和NVIDIA NIM微服務創建精準品牌視覺

    全球領先的創意和制作服務機構率先采用 OpenUSD 和 NVIDIA NIM 微服務來創建精準的品牌視覺。
    的頭像 發表于 08-01 14:33 ?448次閱讀

    英偉達推出全新NVIDIA AI Foundry服務NVIDIA NIM推理微服務

    NVIDIA 宣布推出全新 NVIDIA AI Foundry 服務NVIDIA NIM 推理微服務
    的頭像 發表于 07-25 09:48 ?739次閱讀

    NVIDIA AI Foundry 為全球企業打造自定義 Llama 3.1 生成式 AI 模型

    Retriever 微服務,以實現準確響應 埃森哲率先使用新服務,為客戶創建自定義 Llama 3.1 模型;Aramco、ATT 和優步。 ? Llama 3.1 多語種大語言模型
    發表于 07-24 09:39 ?727次閱讀
    <b class='flag-5'>NVIDIA</b> AI Foundry 為全球企業打造自定義 Llama 3.1 生成式 AI 模型

    求助,關于使用iperf測量mesh節點吞吐量問題求解

    輸出,只能手動ctrl+]退出,服務端收數據這邊吞吐量歸零,正常走完iperf測試時間(我設定的15s)后出現W (897098) iperf: tcp server recv error, error
    發表于 07-23 06:59

    利用NVIDIA組件提升GPU推理的吞吐

    本實踐中,唯品會 AI 平臺與 NVIDIA 團隊合作,結合 NVIDIA TensorRT 和 NVIDIA Merlin HierarchicalKV(HKV)將推理的稠密網絡和熱 Embedding 全置于 GPU 上進行
    的頭像 發表于 04-20 09:39 ?774次閱讀

    如何提高CYBT-243053-02吞吐量

    你好我們一直在使用“EZ-Serial Firmware: v1.4.13.13 Sep 22 2023 10:24:41”測試“CYBT-243053-02”,我們得到的吞吐量比 PUART 高
    發表于 02-27 06:56

    利用NVIDIA產品技術組合提升用戶體驗

    UTalk-Doc 將用戶指令識別服務吞吐量提升了 5 倍,單個請求響應時間縮減了三分之一,大幅提升
    的頭像 發表于 01-17 09:30 ?726次閱讀
    主站蜘蛛池模板: 2017天天天天做夜夜夜做| 四虎一区二区三区精品| 加勒比精品视频| 国产精品天天影视久久综合网| 加勒比在线一区| 性欧美处| 97爱sese| 久99热| 一二三四日本视频社区| 泰剧天堂| 女人特黄大aaaaaa大片| 国产怡红院| 97色涩| 天天爱天天做天天干| 国产午夜精品一区二区| 黄 在线| 2021国产成人精品国产| 特级aaa毛片| 免费看黄色网页| 复古毛片| 日日操夜夜操天天操| 2020狠狠操| 国产在线精品一区二区夜色| 特黄特黄视频| 九色在线播放| 天天影院网| 日本亚洲高清乱码中文在线观看| 牛仔裤美女国产精品毛片| 国产精品免费看久久久久| 亚洲一一在线| 午夜宅男在线| 久久久久久噜噜噜久久久精品 | 男人和女人做爽爽视频在线观看| 亚洲一区二区欧美| 午夜免费看片| 毛片特黄| 天天干天天操天天| www.欧美黄色| 天天更新影院| 国产三级在线看| 精品久久香蕉国产线看观看亚洲|