作者:算力魔方創始人/英特爾創新大使劉力
最近,DeepSeek-R1 可是火遍了全網,號稱“超越人類專家”,數學競賽奪冠、代碼能力碾壓人類開發者……聽起來是不是很厲害?但別急著被這些光環迷了眼,這款被吹上天的 AI,其實也有不少能力局限呢。今天,咱們就拋開那些營銷濾鏡,根據官方論文《DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning》以及我多年的產品設計經驗,來好好聊聊 DeepSeek-R1 的那些“小秘密”!
一,“低情商偏科王”:只會做題,不會“溝通”
DeepSeek-R1 在數學、編程這些“考試型任務”上確實表現驚艷,可一旦到了跟人溝通的場景,那可就翻車翻得一塌糊涂了。DeepSeek 團隊自曝:它的訓練數據主要集中在學術領域,這就導致它像個“書呆子”,只知道悶頭解決問題,卻不懂得怎么跟人打交道。
大家都知道,溝通可是一門溫暖的藝術,可不是一堆冰冷的技術。就像在咱們日常的管理工作中,都是先處理情緒再處理問題。DeepSeek-R1 這樣的“書呆子”,要是用在需要提供情緒價值的產品上,那可就慘了。試想一下,當客戶氣沖沖地打來投訴電話,你的“智能客服”卻跟客戶有條不紊地分析問題的根因和解決方法,客戶能不氣得更厲害嗎?
現在很多自媒體都在嘲笑 OpenAI 發布的最新模型 GPT-4.5,說它卷不動數學,開始走高情商路線了。但我反倒覺得,從產品的角度來看,OpenAI 選擇的大模型能力發展方向才是正確且極有價值的呢。著名產品人梁寧在《給溫度以技術,給商業以文明》的演講里也提到:下一個時代,比拼的就是情緒價值。DeepSeek-R1 這種“低情商偏科王”,在情緒價值方面可就差得遠了。
二,小語種能力不足:除了中文和英文,它可能“胡言亂語”
雖說 DeepSeek-R1 支持多語言,但 DeepSeek 團隊也坦白了,它的訓練語料里小語種語料少得可憐。小語種,就是除了聯合國六大通用語種(漢語、英語、法語、西班牙語、俄語、阿拉伯語)之外的其他語言。要是用小語種讓 DeepSeek-R1 去思考數學或者解決推理問題,那可就真要鬧笑話了,搞不好就會“胡言亂語”。
那些做小語種國家產品的人可得注意了,可不是像很多自媒體說的那樣,把產品接入 DeepSeek-R1 就萬事大吉了。比如馬來西亞人日常說的馬來西亞式英語,那可是一種獨特的英語變體,它把馬來語、漢語(包括普通話和方言)等語言的語法和詞匯都混在了一起,一句話里可能夾雜著普通話、馬來語和粵語。要是你直接把接入了 DeepSeek-R1 的產品出口到馬來西亞,那面對這種“夾雜英語、普通話、馬來語和粵語”的問題,DeepSeek-R1 恐怕就得傻眼了。
三,“玻璃心”:面對有示例的提示詞,智商暴跌50%
DeepSeek-R1 對提示詞可是很挑剔的!官方明確指出,要是提示詞里帶有示例,也就是少樣本提示詞(few-shot prompt),它會先從示例里學習,然后再回答,這樣一來,答案的準確率可能就會從 90% 直接掉到 40%。
官方建議:直接用零樣本提示詞(Zero-shot Prompt),不要加入任何示例。這樣一來,DeepSeek-R1 就能發揮出它應有的水平了。
四,職場“菜鳥”:代碼寫得好,但做工程就是個“實習生”
DeepSeek-R1 在 Codeforces 競賽里擊敗了 96% 的人類,這代碼能力看起來確實很厲害。可一到真實的軟件工程里,它就露餡了:
復雜項目管理:它壓根兒就不懂“模塊化開發”“版本控制”這些概念,面對復雜項目,估計得一頭霧水。
跨團隊協作:DeepSeek-R1 只能獨自編程,完全不會團隊協作,要是放到一個需要多人協作的項目里,那可就麻煩了。
玄學 debug:遇到 bug 時,它可能還會給出“重啟試試”這種無厘頭的解決方案,這可真是讓人哭笑不得。
為啥會出現這種情況呢?原因就在于 DeepSeek-R1 在 RL 訓練中缺乏真實工程數據,所以它雖然能解題,但真到了工程項目里,可就不是那么回事兒了,說白了,它就是一個“解題高手”,但不是工程項目高手。
五,結語:AI 的未來,在清醒認知中前行
DeepSeek-R1 的突破確實值得喝彩,但它絕對不是完美的“通用人工智能”。這些能力局限的存在,正好說明了 AI 的“智能”依然是“窄化”的,還遠遠無法替代人類的綜合能力。不過好消息是,DeepSeek 團隊已經知道這些局限的存在了,他們已經在著手解決這些問題了。
在這里,我要友情提示大家一句:當你看到“AI 秒殺人類”這種驚悚新聞的時候,可千萬別被嚇到了,這可能只是特定場景下的“販賣焦慮”。真正的 AGI 革命,還在路上呢。那么,你有沒有發現 DeepSeek-R1 的其他短板呢?歡迎在評論區一起聊聊呀!
如果你有更好的文章,歡迎投稿!
稿件接收郵箱:nami.liu@pasuntech.com
更多精彩內容請關注“算力魔方?”!
審核編輯 黃宇
-
DeepSeek
+關注
關注
1文章
673瀏覽量
517
發布評論請先 登錄
相關推薦
如何使用OpenVINO運行DeepSeek-R1蒸餾模型

RK3588開發板上部署DeepSeek-R1大模型的完整指南
Infinix AI接入DeepSeek-R1滿血版
了解DeepSeek-V3 和 DeepSeek-R1兩個大模型的不同定位和應用選擇
超星未來驚蟄R1芯片適配DeepSeek-R1模型
OPPO Find N5將接入DeepSeek-R1,可直接語音使用
AIBOX 全系產品已適配 DeepSeek-R1

DeepSeek-R1本地部署指南,開啟你的AI探索之旅

deepin UOS AI接入DeepSeek-R1模型
芯動力神速適配DeepSeek-R1大模型,AI芯片設計邁入“快車道”!

網易有道全面接入DeepSeek-R1大模型
原生鴻蒙版小藝App上架DeepSeek-R1, AI智慧體驗更豐富
用DeepSeek-R1實現自動生成Manim動畫

行業首家!數勢科技SwiftAgent全面接入DeepSeek-R1

對標OpenAI o1,DeepSeek-R1發布

評論