在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA推出開放式Llama Nemotron系列模型

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來源:NVIDIA英偉達(dá)企業(yè)解決方案 ? 2025-01-09 11:11 ? 次閱讀

作為 NVIDIA NIM 微服務(wù),開放式 Llama Nemotron 大語言模型和 Cosmos Nemotron 視覺語言模型可在任何加速系統(tǒng)上為 AI 智能體提供強(qiáng)效助力。

人工智能正在進(jìn)入一個(gè)全新的時(shí)代——代理式 AI。在這個(gè)時(shí)代,專業(yè)智能體團(tuán)隊(duì)可以幫助人們解決復(fù)雜的問題并自動執(zhí)行重復(fù)任務(wù)。

借助定制 AI 智能體,各行各業(yè)的企業(yè)可以構(gòu)建智能解決方案,從而獲得前所未有的生產(chǎn)力。這些先進(jìn)的 AI 智能體需要一個(gè)多樣化生成式 AI 模型系統(tǒng),并且這些模型要針對代理式 AI 功能和能力進(jìn)行優(yōu)化。這樣的復(fù)雜程度意味著企業(yè)對強(qiáng)大、高效的企業(yè)級模型產(chǎn)生了極大的需求。

為了給企業(yè)代理式 AI 奠定基礎(chǔ),NVIDIA 宣布推出開放式大語言模型 (LLM) 的 Llama Nemotron 系列。該模型基于 Llama 構(gòu)建,可以幫助開發(fā)者在一系列應(yīng)用中創(chuàng)建和部署 AI 智能體,包括客戶支持、欺詐檢測產(chǎn)品供應(yīng)鏈和庫存管理優(yōu)化。

許多 AI 智能體不僅需要語言技能,還需要感知世界并采取適當(dāng)行動的能力,以更有效地發(fā)揮其作用。

借助全新的NVIDIA Cosmos Nemotron視覺語言模型 (VLM) 以及面向視頻搜索和摘要的NVIDIA NIM微服務(wù),開發(fā)者可以構(gòu)建智能體,分析來自自主機(jī)器、醫(yī)院、商店和倉庫的圖像和視頻以及體育賽事、電影和新聞,并對其做出響應(yīng)。針對希望為機(jī)器人自動駕駛汽車領(lǐng)域生成物理感知視頻的開發(fā)者,NVIDIA 還宣布推出 NVIDIA Cosmos世界基礎(chǔ)模型。

開放式 Llama Nemotron 模型

優(yōu)化了 AI 智能體的計(jì)算效率和精度

NVIDIA Llama Nemotron模型基于 Llama 基礎(chǔ)模型而構(gòu)建,為 AI 智能體開發(fā)提供經(jīng)過優(yōu)化的基礎(chǔ)模組。Llama 基礎(chǔ)模型是最熱門的商用開源模型集合之一,下載次數(shù)超過 6.5 億次。這一成果建立在 NVIDIA 致力于開發(fā)前沿模型的基礎(chǔ)之上,例如 Llama 3.1 Nemotron 70B,現(xiàn)在可通過 NVIDIA API 目錄獲取。

Llama Nemotron 模型使用 NVIDIA 最新技術(shù)和高質(zhì)量數(shù)據(jù)集進(jìn)行剪枝和訓(xùn)練,可增強(qiáng)代理式 AI 功能。它們在指令遵循、聊天、函數(shù)調(diào)用、編碼和數(shù)學(xué)方面表現(xiàn)出色,同時(shí)經(jīng)過尺寸優(yōu)化,可在廣泛的 NVIDIA 加速計(jì)算資源上運(yùn)行。

Meta 副總裁兼 GenAI 負(fù)責(zé)人 Ahmad Al-Dahle 表示:“代理式 AI 是 AI 開發(fā)的下一個(gè)前沿,為了抓住這次機(jī)會,需要在 LLM 系統(tǒng)中進(jìn)行全棧優(yōu)化,以提供高效、準(zhǔn)確的 AI 智能體。通過與 NVIDIA 的合作,以及我們對開放模型的共同承諾,基于 Llama 構(gòu)建的 NVIDIA Llama Nemotron 系列可以助力企業(yè)快速構(gòu)建自己的定制 AI 智能體。”

包括 SAP 和 ServiceNow 在內(nèi)的領(lǐng)先 AI 智能體平臺提供商,有望成為首批使用全新 Llama Nemotron 模型的企業(yè)。

SAP 首席人工智能官 Philipp Herzig 表示:“能夠跨多個(gè)業(yè)務(wù)線協(xié)作解決復(fù)雜任務(wù)的 AI 智能體將會超越當(dāng)今的生成式 AI 場景,將企業(yè)生產(chǎn)力提升到一個(gè)全新的水平。借助 SAP 的 Joule,數(shù)億企業(yè)用戶能夠與這些智能體進(jìn)行交互,以前所未有的速度實(shí)現(xiàn)他們的目標(biāo)。NVIDIA 的全新開放式 Llama Nemotron 模型系列將推動多個(gè)專用 AI 智能體的開發(fā),助力業(yè)務(wù)流程轉(zhuǎn)型。”

ServiceNow 平臺 AI 副總裁 Jeremy Barnes 表示:“AI 智能體使企業(yè)組織能夠事半功倍,為業(yè)務(wù)轉(zhuǎn)型樹立了新的標(biāo)準(zhǔn)。NVIDIA 開放式 Llama Nemotron 模型性能和精度的提升有助于構(gòu)建先進(jìn)的 AI 智能體服務(wù),以解決各行業(yè)中各種職能的復(fù)雜問題。”

NVIDIA Llama Nemotron 模型使用NVIDIA NeMo進(jìn)行蒸餾、剪枝和對齊。使用這些技術(shù)可以將這些模型保持較小的規(guī)模,以便在各種計(jì)算平臺上運(yùn)行,并在提供高精度的同時(shí)提高模型吞吐量。

Llama Nemotron 模型系列將以可下載模型和 NVIDIA NIM 微服務(wù)的形式提供,可輕松部署在云端、數(shù)據(jù)中心、PC 和工作站。它們可以為企業(yè)提供業(yè)界領(lǐng)先的性能,并且能夠可靠、安全且無縫地集成到其代理式 AI 應(yīng)用工作流中。

使用 NVIDIA NeMo 定制

并接入業(yè)務(wù)知識

Llama Nemotron 和 Cosmos Nemotron 模型系列將提供 Nano、Super 和 Ultra 三種規(guī)模,為部署各種規(guī)模的 AI 智能體提供廣泛選擇。

Nano:成本效益最高的模型,針對實(shí)時(shí)應(yīng)用進(jìn)行了優(yōu)化,延遲低,非常適合部署在 PC 和邊緣設(shè)備上。

Super:高精度模型,可在單個(gè) GPU 上提供卓越的吞吐量。

Ultra:精度最高的模型,專為需要超高性能的數(shù)據(jù)中心級應(yīng)用而設(shè)計(jì)。

企業(yè)還可以使用 NVIDIA NeMo 微服務(wù)為其特定用例和領(lǐng)域定制模型,以簡化數(shù)據(jù)管護(hù)、加速模型定制和評估,還可以應(yīng)用護(hù)欄,以確保響應(yīng)正常。

借助NVIDIA NeMo Retriever,開發(fā)者還可以集成檢索增強(qiáng)生成功能,將模型與企業(yè)數(shù)據(jù)連接起來。

使用面向代理式 AI 的NVIDIA Blueprint,企業(yè)可以利用 NVIDIA 先進(jìn)的 AI 工具和端到端開發(fā)專長,快速構(gòu)建自己的應(yīng)用。事實(shí)上,NVIDIA Cosmos Nemotron、NVIDIA Llama Nemotron 和 NeMo Retriever 將為今天發(fā)布的面向視頻搜索和摘要的全新 NVIDIA Blueprint 提供強(qiáng)效助力。

NeMo、NeMo Retriever 和 NVIDIA Blueprint 均可通過 NVIDIA AI Enterprise 軟件平臺使用。

可用性

Llama Nemotron 和 Cosmos Nemotron 模型將以托管應(yīng)用編程接口的形式提供,可通過NVIDIA 官網(wǎng)和 Hugging Face 下載。

NVIDIA 開發(fā)者計(jì)劃的成員均可免費(fèi)訪問開發(fā)、測試和研究資源。

在生產(chǎn)中,企業(yè)可以使用 NVIDIA AI Enterprise 軟件平臺在加速數(shù)據(jù)中心和云計(jì)算基礎(chǔ)設(shè)施上運(yùn)行 Llama Nemotron 和 Cosmos Nemotron NIM 微服務(wù)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5021

    瀏覽量

    103257
  • 人工智能
    +關(guān)注

    關(guān)注

    1792

    文章

    47425

    瀏覽量

    238962
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3267

    瀏覽量

    48924

原文標(biāo)題:CES 2025 | NVIDIA 宣布推出 Nemotron 模型系列,推動代理式 AI 發(fā)展

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    NVIDIA推出多個(gè)生成AI模型和藍(lán)圖

    NVIDIA 宣布推出多個(gè)生成 AI 模型和藍(lán)圖,將 NVIDIA Omniverse 一體化進(jìn)一步擴(kuò)展至物理 AI 應(yīng)用,如機(jī)器人、自動
    的頭像 發(fā)表于 01-08 10:48 ?91次閱讀

    Meta推出Llama 3.3 70B,AI大模型競爭白熱化

    在今年的AI領(lǐng)域,Meta也不甘落后,推出了其壓軸之作——Llama 3.3 70B大模型。與此同時(shí),馬斯克的xAI也宣布其Grok模型從今天起全球免費(fèi)
    的頭像 發(fā)表于 12-09 14:50 ?409次閱讀

    使用NVIDIA TensorRT提升Llama 3.2性能

    Llama 3.2 模型集擴(kuò)展了 Meta Llama 開源模型集的模型陣容,包含視覺語言模型
    的頭像 發(fā)表于 11-20 09:59 ?256次閱讀

    英偉達(dá)發(fā)布AI模型 Llama-3.1-Nemotron-51B AI模型

    英偉達(dá)公司宣布推出 Llama-3.1-Nemotron-51B AI 模型,這個(gè)AI大模型是源自 Meta 公司的 Llama-3.1-7
    的頭像 發(fā)表于 09-26 17:30 ?627次閱讀

    NVIDIA Nemotron-4 340B模型幫助開發(fā)者生成合成訓(xùn)練數(shù)據(jù)

    Nemotron-4 340B 是針對 NVIDIA NeMo 和 NVIDIA TensorRT-LLM 優(yōu)化的模型系列,該
    的頭像 發(fā)表于 09-06 14:59 ?340次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>Nemotron</b>-4 340B<b class='flag-5'>模型</b>幫助開發(fā)者生成合成訓(xùn)練數(shù)據(jù)

    紫光同芯推出開放式架構(gòu)安全芯片E450R

    2024紫光同芯合作伙伴大會在北京璀璨啟幕,會上紫光同芯震撼發(fā)布了其最新技術(shù)結(jié)晶——全球首顆融合開放式硬件與軟件架構(gòu)的安全芯片E450R。這款芯片以其獨(dú)特的雙開放設(shè)計(jì),即開放式硬件架構(gòu)搭配開放
    的頭像 發(fā)表于 08-28 16:28 ?637次閱讀

    Meta Llama 3.1系列模型可在Google Cloud上使用

    我們很高興宣布,Llama 3.1 系列模型已添加到 Vertex AI Model Garden,這包括全新的 405B,即 Meta 迄今為止功能最強(qiáng)大、用途最廣泛的模型。這些
    的頭像 發(fā)表于 08-02 15:42 ?402次閱讀

    NVIDIA攜手Meta推出AI服務(wù),為企業(yè)提供生成AI服務(wù)

    NVIDIA近日宣布了一項(xiàng)重大舉措,正式推出NVIDIA AI Foundry服務(wù)與NVIDIA NIM(NVIDIA Inference
    的頭像 發(fā)表于 07-25 16:57 ?561次閱讀

    英偉達(dá)推出全新NVIDIA AI Foundry服務(wù)和NVIDIA NIM推理微服務(wù)

    NVIDIA 宣布推出全新 NVIDIA AI Foundry 服務(wù)和 NVIDIA NIM 推理微服務(wù),與同樣剛推出
    的頭像 發(fā)表于 07-25 09:48 ?731次閱讀

    NVIDIA AI Foundry 為全球企業(yè)打造自定義 Llama 3.1 生成 AI 模型

    借助 NVIDIA AI Foundry,企業(yè)和各國現(xiàn)在能夠使用自有數(shù)據(jù)與 Llama 3.1 405B 和 NVIDIA Nemotron 模型
    發(fā)表于 07-24 09:39 ?723次閱讀
    <b class='flag-5'>NVIDIA</b> AI Foundry 為全球企業(yè)打造自定義 <b class='flag-5'>Llama</b> 3.1 生成<b class='flag-5'>式</b> AI <b class='flag-5'>模型</b>

    英偉達(dá)開源Nemotron-4 340B系列模型,助力大型語言模型訓(xùn)練

    近日,英偉達(dá)宣布開源了一款名為Nemotron-4 340B的大型模型,這一壯舉為開發(fā)者們打開了通往高性能大型語言模型(LLM)訓(xùn)練的新天地。該系列
    的頭像 發(fā)表于 06-17 14:53 ?580次閱讀

    Meta推出最強(qiáng)開源模型Llama 3 要挑戰(zhàn)GPT

    公司這次開源了Llama 3 8B與70B兩款不同規(guī)模的模型,開發(fā)者可以免費(fèi)使用,而Meta公司還將陸續(xù)推出系列具備多模態(tài)、多語言對話、更長上下文窗口等能力的新
    的頭像 發(fā)表于 04-19 17:00 ?853次閱讀

    PLC以太網(wǎng)開放式通信概述

    以太網(wǎng)開放式通信概述:   1、以太網(wǎng)開放式通信,即就是通信協(xié)議是由用戶自由定義的;   2、以太網(wǎng)開放式通信是基于TCP、UDP運(yùn)輸層的一種軟件通信協(xié)議;   3、各個(gè)PLC可使
    發(fā)表于 04-16 12:06 ?1110次閱讀
    PLC以太網(wǎng)<b class='flag-5'>開放式</b>通信概述

    小米新款開放式耳機(jī)引領(lǐng)舒適潮流

    IDC報(bào)告指出,用戶對舒適度的追求推動了開放式耳機(jī)市場快速發(fā)展。今年,開放式耳機(jī)銷量達(dá)652萬臺,同比增長130.2%。這對于真無線及頸戴耳機(jī)領(lǐng)域具有一定的分流影響,并折射出用戶需求的轉(zhuǎn)變和技術(shù)創(chuàng)新帶來的發(fā)展空間。
    的頭像 發(fā)表于 04-08 10:09 ?1217次閱讀

    Meta發(fā)布開源大模型Code Llama 70B

    近日,Meta宣布推出了一款新的開源大模型Code Llama 70B,這是其“Code Llama家族中體量最大、性能最好的模型版本”。這
    的頭像 發(fā)表于 01-31 09:24 ?964次閱讀
    主站蜘蛛池模板: 免费在线观看的网站| 亚洲第一区在线| 欧美成人免费午夜全| 日本在线视| 国产永久免费爽视频在线| 福利视频免费看| 888米奇在线视频四色| 亚洲福利一区二区| 91久久澡人人爽人人添| 亚洲成年人网| 日韩三级在线观看视频| 欧美四虎| 国产精品久久久亚洲| 中文字幕自拍| 人人干国产| 久久xxxx| 国产精品久久久久久久成人午夜 | 亚洲福利午夜| 人人干人人上| 欧美色人阁| 国产精品免费一级在线观看| 午夜两性色视频免费网站| 日本大片免a费观看在线| 久操福利视频| 夜夜操夜夜爽| 国产精品久久1024| 香蕉成人国产精品免费看网站| 在线日韩一区| 日本三级欧美三级香港黄| 国产美女一级ba大片免色| 午夜精品久久久久久久| yy6080亚洲半夜理论一级毛片| 亚洲一二三四| 婷婷丁香久久| 精品三级内地国产在线观看| 亚洲成网站www久久九| 国产精品久久1024| 久久国产99| 日本aaaa视频| 6080伦理久久亚洲精品| 九九热在线视频观看这里只有精品|