在全球人工智能技術(shù)飛速發(fā)展的今天,模型的快速迭代與高效部署成為各大科技企業(yè)競(jìng)相追逐的焦點(diǎn)。華為DCS AI全棧解決方案中的重要產(chǎn)品—ModelEngine AI平臺(tái),全面支持DeepSeek大模型R1&V3和蒸餾系列模型的本地部署與優(yōu)化,加速客戶AI應(yīng)用快速落地。
ModelEngine作為大模型訓(xùn)練、推理和應(yīng)用開發(fā)的AI平臺(tái),提供從數(shù)據(jù)預(yù)處理到模型訓(xùn)練、優(yōu)化及部署的一站式服務(wù)。此次ModelEngine基于昇騰AI芯片,通過(guò)推理框架優(yōu)化和MoE存算協(xié)同,提供動(dòng)態(tài)換入換出和全局統(tǒng)一緩存,實(shí)現(xiàn)推理高并發(fā)和低時(shí)延,用戶通過(guò)ModelEngine體驗(yàn)DeepSeek更加快速高效的推理能力。
靈活部署:ModelEngine全面支持DeepSeek系列模型R1&V3 671B以及蒸餾系列模型,開發(fā)者可通過(guò)ModelEngine實(shí)現(xiàn)“一鍵部署”,省去硬件選型、兼容性驗(yàn)證和環(huán)境配置等繁瑣步驟,大幅降低企業(yè)AI應(yīng)用門檻。此外,ModelEngine通過(guò)其高度的開放性和模塊化設(shè)計(jì),極大地縮短了DeepSeek的本地部署時(shí)間。
企業(yè)級(jí)穩(wěn)定性:ModelEngine提供負(fù)載均衡、模型安全接入、多用戶配額管理等高階特性,支持大規(guī)模生產(chǎn)環(huán)境下的穩(wěn)定運(yùn)行。某證券公司引入DCS AI全棧解決方案后,運(yùn)維成本降低42%。
DCS AI全棧解決方案近期將上線DeepSeek體驗(yàn)環(huán)境,敬請(qǐng)期待。
下面以DeepSeek-R1為例,基于ModelEngine 3步快速完成部署模型
1. 登錄ModelEngine模型管理頁(yè)面,上傳DeepSeek-R1 FP8權(quán)重,然后進(jìn)行模型權(quán)重格式轉(zhuǎn)換,將FP8精度模型權(quán)重轉(zhuǎn)換為BF16精度模型權(quán)重;
2. 在模型服務(wù)頁(yè)面,選擇BF16精度的模型權(quán)重版本,下發(fā)推理服務(wù),啟動(dòng)任務(wù)部署;
3. ModelEngine使用MindIE推理框架啟動(dòng)DeepSeek-R1推理服務(wù)后,支持OpenAI API 調(diào)用風(fēng)格的推理服務(wù)接口和訪問(wèn)方式;
4. ModelEngine 啟動(dòng) DeepSeek-R1 推理服務(wù)后,平臺(tái)支持 OpenAI API 調(diào)用風(fēng)格的推理服務(wù)接口和訪問(wèn)方式,用戶可以將該 API 集成到對(duì)話、RAG 以及 Agent 應(yīng)用。
到這里,基于ModelEngine私有化本地部署的DeepSeek-R1完整版推理服務(wù)API已經(jīng)就緒了,可以將推理服務(wù)API集成到對(duì)話應(yīng)用、RAG或者Agent應(yīng)用中,在保證數(shù)據(jù)安全的前提下,讓DeepSeek-R1媲美世界頭部頂流閉源大模型服務(wù)智能的能力,助力客戶AI業(yè)務(wù)升級(jí)。
-
華為
+關(guān)注
關(guān)注
216文章
34736瀏覽量
253957 -
大模型
+關(guān)注
關(guān)注
2文章
2823瀏覽量
3462 -
DeepSeek
+關(guān)注
關(guān)注
1文章
654瀏覽量
472
原文標(biāo)題:華為ModelEngine支持DeepSeek全系列本地部署!
文章出處:【微信號(hào):HWS_yunfuwu,微信公眾號(hào):華為數(shù)字中國(guó)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
HarmonyOS NEXT開發(fā)實(shí)戰(zhàn):DevEco Studio中DeepSeek的使用
中軟國(guó)際Lumi智能體開發(fā)平臺(tái)支持DeepSeek
鴻蒙原生應(yīng)用開發(fā)也可以使用DeepSeek了
添越智創(chuàng)基于 RK3588 開發(fā)板部署測(cè)試 DeepSeek 模型全攻略
黑芝麻智能芯片全面兼容DeepSeek模型推理
曙光云全面支持DeepSeek大模型
了解DeepSeek-V3 和 DeepSeek-R1兩個(gè)大模型的不同定位和應(yīng)用選擇
【實(shí)測(cè)】用全志A733平板搭建一個(gè)端側(cè)Deepseek算力平臺(tái)
端側(cè)AI元年爆發(fā)!廣和通AI模組及解決方案全面支持DeepSeek-R1蒸餾模型

訊飛開放平臺(tái)支持DeepSeek
寧暢AI服務(wù)器全面支持DeepSeek大模型
扣子平臺(tái)支持DeepSeek R1與V3模型
華為ModelEngine AI平臺(tái)全面支持DeepSeek全系列本地部署
“兆瀚”算力產(chǎn)品強(qiáng)力支持DeepSeek,共筑國(guó)產(chǎn)AI新生態(tài)!

評(píng)論