英偉達近日宣布,其DeepSeek R1 671b版本已正式上線英偉達NIM(NVIDIA Inference Microservices)平臺,并以預覽版的形式在build.nvidia.com網站上發布。
據悉,DeepSeek R1 NIM微服務是英偉達在人工智能領域的一項重要創新,旨在為用戶提供高效、精準的推理服務。在單個英偉達HGX H200系統上,該微服務每秒最多可處理3872個token,展現出強大的處理能力和高效性。
此次上線的DeepSeek R1 NIM微服務預覽版,允許開發人員對其進行測試和實驗,以更好地了解其性能和功能。英偉達表示,未來該API將作為英偉達AI Enterprise軟件平臺的一部分,以可下載的NIM微服務形式正式推出,為用戶提供更加便捷、高效的使用體驗。
英偉達一直致力于推動人工智能技術的發展和應用,此次發布的DeepSeek R1 NIM微服務預覽版,不僅展示了英偉達在人工智能領域的強大技術實力,也為用戶提供了更加高效、精準的推理服務。
-
軟件
+關注
關注
69文章
5068瀏覽量
88476 -
NIM
+關注
關注
0文章
10瀏覽量
8146 -
人工智能
+關注
關注
1800文章
48132瀏覽量
242407 -
英偉達
+關注
關注
22文章
3874瀏覽量
92500 -
DeepSeek
+關注
關注
1文章
638瀏覽量
431
發布評論請先 登錄
相關推薦
顯存也能疊疊樂,雙 Intel Arc A770 顯卡低成本部署 DeepSeek R1 32B 蒸餾模型體驗

研華發布昇騰AI Box及Deepseek R1模型部署流程
OpenAI O3與DeepSeek R1:推理模型性能深度分析
研華邊緣AI Box MIC-ATL3S部署Deepseek R1模型

IBM在watsonx.ai平臺推出DeepSeek R1蒸餾模型
了解DeepSeek-V3 和 DeepSeek-R1兩個大模型的不同定位和應用選擇
景嘉微完成DeepSeek R1系列模型適配
DeepSeek4J開源:高效解決DeepSeek R1集成挑戰

Deepseek R1大模型離線部署教程

部署DeepSeek R1于AX650N與AX630C平臺

扣子平臺支持DeepSeek R1與V3模型
Krea發布Deepseek R1驅動的Chat功能
云天勵飛上線DeepSeek R1系列模型

評論