英偉達(dá)公司宣布推出 Llama-3.1-Nemotron-51B AI 模型,這個(gè)AI大模型是源自 Meta 公司的 Llama-3.1-70B大模型,基于使用了神經(jīng)架構(gòu)搜索(NAS)方法,推理速度比原70B大模型提升2.2倍,具備更準(zhǔn)確和更高效的運(yùn)算效率;能夠大幅降低運(yùn)行成本。
通過NAS技術(shù)微調(diào);大幅降低了內(nèi)存消耗、計(jì)算復(fù)雜性;Llama-3.1-Nemotron-51B AI 模型在單個(gè)H100 GPU上的表現(xiàn)非常優(yōu)秀,在推理過程中可以在單個(gè) GPU 上運(yùn)行 4 倍以上的工作負(fù)載。這使得單片H100 GPU即可處理更大型的推理任務(wù);這無疑是顯著的降低了訓(xùn)練成本。這為AI提供了高效、經(jīng)濟(jì)的方案。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。
舉報(bào)投訴
相關(guān)推薦
? 電子發(fā)燒友網(wǎng)報(bào)道(文/梁浩斌)過去幾年中爆發(fā)的AI算力需求,英偉達(dá)GPU成為了最大的贏家,無論是自動(dòng)駕駛還是AI大模型,比如特斯拉、小鵬
發(fā)表于 08-05 06:07
?4001次閱讀
新的高度。 一,技術(shù)突破:開源智能的新高度 Llama 3.3 70B 模型的發(fā)布,標(biāo)志著開源AI模型
發(fā)表于 12-18 16:46
?123次閱讀
在今年的AI領(lǐng)域,Meta也不甘落后,推出了其壓軸之作——Llama 3.3 70B大模型。與此同時(shí),馬斯克的xAI也宣布其Grok模型從今
發(fā)表于 12-09 14:50
?375次閱讀
在人工智能(AI)的快速發(fā)展中,開源AI模型扮演著越來越重要的角色。它們不僅推動(dòng)了技術(shù)的創(chuàng)新,還促進(jìn)了全球開發(fā)者社區(qū)的合作。Llama 3,作為一個(gè)新興的
發(fā)表于 10-27 14:42
?371次閱讀
Llama 3模型與其他AI工具的對(duì)比可以從多個(gè)維度進(jìn)行,包括但不限于技術(shù)架構(gòu)、性能表現(xiàn)、應(yīng)用場景、定制化能力、開源與成本等方面。以下是對(duì)Llama 3
發(fā)表于 10-27 14:37
?388次閱讀
Nemotron-4 340B 是針對(duì) NVIDIA NeMo 和 NVIDIA TensorRT-LLM 優(yōu)化的模型系列,該系列包含最先進(jìn)的指導(dǎo)和獎(jiǎng)勵(lì)模型,以及一個(gè)用于生成式
發(fā)表于 09-06 14:59
?314次閱讀
8月23日,英偉達(dá)宣布,其全新AI模型面世,該模型參數(shù)規(guī)模高達(dá)80億,具有精度高、計(jì)算效益大等優(yōu)勢,適用于GPU加速的數(shù)據(jù)中心、云及工作站環(huán)
發(fā)表于 08-23 16:08
?739次閱讀
我們很高興宣布,Llama 3.1 系列模型已添加到 Vertex AI Model Garden,這包括全新的 405B,即 Meta 迄
發(fā)表于 08-02 15:42
?395次閱讀
科技巨頭Meta近期震撼發(fā)布了其最新的開源人工智能(AI)模型——Llama 3.1,這一舉措標(biāo)志著Meta在
發(fā)表于 07-24 18:25
?1440次閱讀
借助 NVIDIA AI Foundry,企業(yè)和各國現(xiàn)在能夠使用自有數(shù)據(jù)與 Llama 3.1 405B 和 NVIDIA Nemotron
發(fā)表于 07-24 09:39
?710次閱讀
在人工智能領(lǐng)域的激烈競爭中,Meta公司再次擲出重磅炸彈,宣布將于7月23日正式發(fā)布其最新力作——Llama 3-405B,一個(gè)擁有驚人4050億參數(shù)的開源大模型。這一舉措不僅標(biāo)志著M
發(fā)表于 07-18 09:58
?994次閱讀
近日,英偉達(dá)宣布開源了一款名為Nemotron-4 340B的大型模型,這一壯舉為開發(fā)者們打開了通往高性能大型語言
發(fā)表于 06-17 14:53
?567次閱讀
英偉達(dá)近日宣布推出一項(xiàng)革命性的AI模型推理服務(wù)——NVIDIA NIM。這項(xiàng)服務(wù)將極大地簡化AI模型
發(fā)表于 06-04 09:15
?680次閱讀
近來,以ChatGPT為代表的AI聊天機(jī)器人已經(jīng)導(dǎo)致英偉達(dá)AI芯片供應(yīng)緊張。然而,隨著能夠創(chuàng)造視頻并進(jìn)行近似人類交流的新型AI
發(fā)表于 05-24 10:04
?504次閱讀
Meta近日宣布了其最新版本的AI代碼生成模型Code Llama70B,并稱其為“目前最大、最優(yōu)秀的模型”。這一更新標(biāo)志著Meta在AI代
發(fā)表于 01-30 18:21
?1449次閱讀
評(píng)論