穿越小说完本 ,懒人听书,旷世神医

電子發(fā)燒友網(wǎng)報道（文 / 吳子鵬）北京時間 2 月 24 日凌晨 3 點，全球最大開源平臺之一 huggingface 聯(lián)合創(chuàng)始人兼首席執(zhí)行官 Clement Delangue 發(fā)布的最新數(shù)據(jù)顯示，中國開源大模型 DeepSeek-R1 在 huggingface 平臺上超過 150 萬個模型中脫穎而出，成為該平臺最受歡迎的開源大模型，點贊數(shù)突破 1 萬。

目前，DeepSeek 已在全球范圍內成為爆火的 AI 大模型。1 月 26 日，DeepSeek 首次登上蘋果 App Store 全球榜首并持續(xù)領先。上線 18 天，其下載量達到 1600 萬次，幾乎是同期 ChatGPT 下載量的兩倍，其中印度是新用戶增長的最大來源地。據(jù)統(tǒng)計，DeepSeek 目前在全球 140 多個國家的 App 榜單中位居第一。

在流量方面，2025 年 1 月，DeepSeek 網(wǎng)站的桌面和移動訪問量飆升至 2.78 億次，而2024年12月僅為 1200 萬次。中國貢獻了近四分之一的桌面流量，美國、巴西、印度、德國等國家也占據(jù)一定比例。

此前，Clement 特意發(fā)文祝賀 DeepSeek-R1 下載量突破 1000 萬次，這一成績也創(chuàng)造了 huggingface 平臺有史以來最受歡迎模型的記錄。

那么，DeepSeek 究竟給開源大模型的發(fā)展帶來了什么，使其如此火爆？

DeepSeek 給開源大模型發(fā)展帶來的影響

DeepSeek 通過技術創(chuàng)新和商業(yè)策略的突破，重塑了開源大模型行業(yè)的競爭格局，為開源 AI 大模型的發(fā)展帶來了積極影響。

帶動技術創(chuàng)新
DeepSeek 在模型訓練中采用強化學習和模型蒸餾技術，在減少模型參數(shù)規(guī)模的同時提升性能。例如，R1 模型在數(shù)學推理任務中的準確率高達 97.3%。在架構設計方面，以 DeepSeek-V3 為例，其首創(chuàng)多頭潛注意力機制，有效解決了長文本推理時的顯存效率瓶頸問題，還革新了動態(tài)路由算法，提高了專家利用率。

降低成本
DeepSeek 降低了開源大模型的訓練成本、推理成本和模型使用成本。其采用的混合專家模型（MoE）架構利用動態(tài)冗余策略，將計算成本降低至傳統(tǒng)模型的 1/10。結合自研的稀疏結構（MLA 架構），提升了推理效率，實現(xiàn)了性能與成本的平衡。通過純深度學習方法，DeepSeek 使 AI 涌現(xiàn)出自發(fā)推理能力，在數(shù)學、代碼、自然語言推理等任務上達到國際頂尖水平（如比肩 GPT-4/o1）。借助這些創(chuàng)新，DeepSeek 將大模型訓練成本壓縮至 560 萬美元量級，僅為美國同類模型的 1/100，打破了動輒數(shù)億美元投入的行業(yè)慣例。同時，DeepSeek 通過開源以及提供低成本的 API，開發(fā)者可以自由定制和二次開發(fā)。其 API 定價親民，僅為 OpenAI 同類產(chǎn)品的 1/10，讓中小企業(yè)能夠以較低成本進入 AI 領域，推動了大模型在更多領域的應用和創(chuàng)新。

拓展應用邊界
DeepSeek 拓展了開源大模型新的應用邊界，使 AI 大模型得以廣泛落地。DeepSeek 采用免費商用開源策略，完全開放模型源碼并支持衍生開發(fā)，推動開發(fā)者生態(tài)快速擴張。這種 “零門檻 + 零成本” 模式直接導致行業(yè)價格體系崩塌，API 使用成本降至 OpenAI 的 5%，最終引領市場進入 “按厘計價” 甚至零成本時代。這一舉措激發(fā)了全球開發(fā)者的熱情，推動了技術共享與社區(qū)協(xié)作。眾多開發(fā)者基于 DeepSeek 的模型進行創(chuàng)新，加速了垂直領域小模型的發(fā)展。同時，DeepSeek 憑借模型壓縮等技術，成功適配智能眼鏡、工業(yè)終端等邊緣設備。在金融交易、工業(yè)質檢、醫(yī)療影像分析等眾多垂直領域展現(xiàn)出獨特的應用優(yōu)勢，為各行業(yè)的數(shù)字化轉型提供了強大動力，極大地拓展了開源大模型的應用場景。

推動模型融合
DeepSeek 推動了開源大模型和閉源大模型的融合。其開源模型 R1 發(fā)布后，迫使阿里、騰訊等巨頭跟進降價，同時刺激全球開發(fā)者社區(qū)加速創(chuàng)新。在這個過程中，相當一部分閉源大模型選擇與 DeepSeek 進行融合。例如，2025 年 2 月，文心一言（現(xiàn)更名為 “文小言”）App 的 4.9.0 版本更新，接入了 DeepSeek-R1 開源大模型，借助該模型優(yōu)化了拍照解題功能，通過 “思維鏈” 技術將解題過程可視化；2 月 6 日，吉利汽車宣布將自研的星睿車控 FunctionCall 大模型、汽車主動交互端側大模型等與 DeepSeek R1 大模型深度融合，以重新定義智能汽車的人機交互及智能駕駛；醫(yī)渡科技的 “AI 醫(yī)療大腦” YiduCore、智云健康的 “智云大腦” 等醫(yī)療領域的閉源模型也接入了 DeepSeek-R1 模型，用于升級智能預問診、病歷生成與質控等核心醫(yī)療 AI 應用。DeepSeek 的成功促使其他大模型開發(fā)者如 OpenAI、百度等開始重新審視開源策略，對整個行業(yè)的發(fā)展起到了積極的推動作用。

毫無疑問，DeepSeek 改變了 AI 大模型的市場格局。憑借低成本、高性能、全國產(chǎn)的特點，引發(fā)人工智能產(chǎn)業(yè)生態(tài)巨變，在一定程度上沖擊了 OpenAI 等巨頭主導的市場格局，加快形成大模型市場的新增長極，推動了整個行業(yè)的創(chuàng)新發(fā)展。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

DeepSeek

DeepSeek

+關注

關注
1

文章
698

瀏覽量
585

如何使用OpenVINO運行DeepSeek-R1蒸餾模型

DeepSeek-R1在春節(jié)期間引發(fā)了全球科技界的熱度，DeepSeek-R1 是由 DeepSeek 開發(fā)的開源推理模型，用于解決需要邏輯

發(fā)表于 03-12 13:45 ?890次閱讀

如何使用OpenVINO運行<b class='flag-5'>DeepSeek</b>-R1蒸餾<b class='flag-5'>模型</b>

HarmonyOS NEXT開發(fā)實戰(zhàn)：DevEco Studio中DeepSeek的使用

隨著HarmonyOS Next的持續(xù)發(fā)布，鴻蒙系統(tǒng)對AI能力的支持顯著增強。本文將深入探討如何在鴻蒙應用中集成AI模型，結合接入DeepSeek，一起來探索開發(fā)鴻蒙原生應用的更多可能吧！第一步

發(fā)表于 03-07 14:56

聆思CSK6大模型語音開發(fā)板接入DeepSeek資料匯總（包含深度求索/火山引擎/硅基流動華為昇騰滿血版）

本帖最后由 jf_40317719 于 2025-3-6 21:20 編輯近期也有不少開發(fā)者想把自己的智能硬件接入DeepSeek大模型，本篇就以聆思CSK6大模型開發(fā)板接入DeepS

發(fā)表于 03-06 17:02

RK3588開發(fā)板上部署DeepSeek-R1大模型的完整指南

DeepSeek作為國產(chǎn)AI大數(shù)據(jù)模型的代表，憑借其卓越的推理能力和高效的文本生成技術，在全球人工智能領域引發(fā)廣泛關注。DeepSeek-R1作為該系列最新迭代版本，實現(xiàn)了長文本處理效

發(fā)表于 02-27 16:45

鴻蒙原生應用開發(fā)也可以使用DeepSeek了

近期DeepSeek火爆全球，那一樣很火的開發(fā)鴻蒙原生應用的DevEco Studio如果把它接入，會發(fā)生什么“化學反應”呢？下面我們將詳細分享如何在DevEco Studio中利用CodeGPT

發(fā)表于 02-20 18:06

開源大模型DeepSeek的開放內容詳析

當大家討論為什么 DeepSeek 能夠形成全球刷屏之勢，讓所有廠商、平臺都集成之時，「開源」成為了最大的關鍵詞之一，圖靈獎得主 Yann LeCun 稱其是「開源的勝利」。模型開源一直備受關注，從

發(fā)表于 02-19 09:48 ?812次閱讀

添越智創(chuàng)基于 RK3588 開發(fā)板部署測試 DeepSeek 模型全攻略

在 AI 技術日新月異的當下，新的模型與突破不斷涌現(xiàn)。近期，DeepSeek（深度求索）模型以其卓越性能和親民成本，迅速在全球開發(fā)者圈子里引發(fā)熱議。作為一款強大的語言

發(fā)表于 02-14 17:42

了解DeepSeek-V3 和 DeepSeek-R1兩個大模型的不同定位和應用選擇

DeepSeek-V3 和 DeepSeek-R1 是深度求索公司（DeepSeek）推出的兩個不同定位的大模型，其核心差異主要體現(xiàn)在目標場

發(fā)表于 02-14 02:08

【實測】用全志A733平板搭建一個端側Deepseek算力平臺

? 隨著DeepSeek 的蒸餾技術的橫空出世，端側 SoC 芯片上運行大模型成為可能。那么端側芯片跑大模型的效果如何呢？本文將在全志 A733 芯片平臺上部署一個

發(fā)表于 02-13 10:19

Deepseek R1大模型離線部署教程

。作為國產(chǎn)AI大數(shù)據(jù)模型的代表，憑借其卓越的推理能力和高效的文本生成技術，在全球人工智能領域引發(fā)廣泛關注。本文主要說明DeepSeek-R1如何離線運行在EASY-EAI-Orin-Nano(RK3576)硬件上, RK357

發(fā)表于 02-12 09:37 ?1170次閱讀

DeepSeek本地部署硬件配置推薦

近日，關于 DeepSeek 的話題如同一場風暴，席卷了整個大語言模型領域。

發(fā)表于 02-11 10:54 ?2269次閱讀

萬里紅全面支持DeepSeek系列大模型

新年伊始，DeepSeek大模型及其應用橫空出世，憑借著出色的推理能力，迅速激發(fā)了千行百業(yè)的使用熱情。萬里紅積極響應市場需求，快速迭代大模型知識應用系統(tǒng)，最新版本已全面支持私有化部署

發(fā)表于 02-10 10:45 ?328次閱讀

商湯大裝置接入DeepSeek系列模型

即日起，企業(yè)客戶和開發(fā)者可在商湯大裝置萬象平臺中，快速部署DeepSeek-V3、DeepSeek-R1等模型，可享受3個月內1000

發(fā)表于 02-10 10:16 ?353次閱讀

在龍芯3a6000上部署DeepSeek 和 Gemma2大模型

serve 2.運行deepseek-r1大模型到以下網(wǎng)站選擇不同參數(shù)的大模型 https://ollama.com/library/deepseek-r1 新開一

發(fā)表于 02-07 19:35

采用FP8混合精度，DeepSeek V3訓練成本僅557.6萬美元！

一，前言? ? 在AI領域，訓練一個大型語言模型（LLM）是一個耗時且復雜的過程。根據(jù)之前在《從零開始訓練一個大語言模型需要投資多少錢？》

發(fā)表于 01-13 11:12 ?926次閱讀

在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

搜索歷史

超過150萬個大模型，DeepSeek全球最受歡迎

評論

如何使用OpenVINO運行DeepSeek-R1蒸餾模型

HarmonyOS NEXT開發(fā)實戰(zhàn)：DevEco Studio中DeepSeek的使用

聆思CSK6大模型語音開發(fā)板接入DeepSeek資料匯總（包含深度求索/火山引擎/硅基流動華為昇騰滿血版）

RK3588開發(fā)板上部署DeepSeek-R1大模型的完整指南

鴻蒙原生應用開發(fā)也可以使用DeepSeek了

開源大模型DeepSeek的開放內容詳析

添越智創(chuàng)基于 RK3588 開發(fā)板部署測試 DeepSeek 模型全攻略

了解DeepSeek-V3 和 DeepSeek-R1兩個大模型的不同定位和應用選擇

【實測】用全志A733平板搭建一個端側Deepseek算力平臺

Deepseek R1大模型離線部署教程

DeepSeek本地部署硬件配置推薦

萬里紅全面支持DeepSeek系列大模型

商湯大裝置接入DeepSeek系列模型

在龍芯3a6000上部署DeepSeek 和 Gemma2大模型

采用FP8混合精度，DeepSeek V3訓練成本僅557.6萬美元！

電子發(fā)燒友