91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

DeepSeek-R1:別被它的光環(huán)迷了眼,這些能力局限你得知道!

jf_23871869 ? 來源:劉力 ? 作者:劉力 ? 2025-03-11 17:19 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

作者:算力魔方創(chuàng)始人/英特爾創(chuàng)新大使劉力

最近,DeepSeek-R1 可是火遍了全網,號稱“超越人類專家”,數學競賽奪冠、代碼能力碾壓人類開發(fā)者……聽起來是不是很厲害?但別急著被這些光環(huán)迷了眼,這款被吹上天的 AI,其實也有不少能力局限呢。今天,咱們就拋開那些營銷濾鏡,根據官方論文《DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning》以及我多年的產品設計經驗,來好好聊聊 DeepSeek-R1 的那些“小秘密”!

wKgZPGfP_-OAaRY4AABkUQX_07s545.png

一,“低情商偏科王”:只會做題,不會“溝通”


DeepSeek-R1 在數學、編程這些“考試型任務”上確實表現驚艷,可一旦到了跟人溝通的場景,那可就翻車翻得一塌糊涂了。DeepSeek 團隊自曝:它的訓練數據主要集中在學術領域,這就導致它像個“書呆子”,只知道悶頭解決問題,卻不懂得怎么跟人打交道。

大家都知道,溝通可是一門溫暖的藝術,可不是一堆冰冷的技術。就像在咱們日常的管理工作中,都是先處理情緒再處理問題。DeepSeek-R1 這樣的“書呆子”,要是用在需要提供情緒價值的產品上,那可就慘了。試想一下,當客戶氣沖沖地打來投訴電話,你的“智能客服”卻跟客戶有條不紊地分析問題的根因和解決方法,客戶能不氣得更厲害嗎?

現在很多自媒體都在嘲笑 OpenAI 發(fā)布的最新模型 GPT-4.5,說它卷不動數學,開始走高情商路線了。但我反倒覺得,從產品的角度來看,OpenAI 選擇的大模型能力發(fā)展方向才是正確且極有價值的呢。著名產品人梁寧在《給溫度以技術,給商業(yè)以文明》的演講里也提到:下一個時代,比拼的就是情緒價值。DeepSeek-R1 這種“低情商偏科王”,在情緒價值方面可就差得遠了。

wKgZO2fP_-iAUKKGABYpWa6f9Ns518.png

二,小語種能力不足:除了中文和英文,它可能“胡言亂語”


雖說 DeepSeek-R1 支持多語言,但 DeepSeek 團隊也坦白了,它的訓練語料里小語種語料少得可憐。小語種,就是除了聯合國六大通用語種(漢語、英語、法語、西班牙語、俄語、阿拉伯語)之外的其他語言。要是用小語種讓 DeepSeek-R1 去思考數學或者解決推理問題,那可就真要鬧笑話了,搞不好就會“胡言亂語”。

那些做小語種國家產品的人可得注意了,可不是像很多自媒體說的那樣,把產品接入 DeepSeek-R1 就萬事大吉了。比如馬來西亞人日常說的馬來西亞式英語,那可是一種獨特的英語變體,它把馬來語、漢語(包括普通話和方言)等語言的語法和詞匯都混在了一起,一句話里可能夾雜著普通話、馬來語和粵語。要是你直接把接入了 DeepSeek-R1 的產品出口到馬來西亞,那面對這種“夾雜英語、普通話、馬來語和粵語”的問題,DeepSeek-R1 恐怕就得傻眼了。

wKgZPGfP_-qAI4s2AABjDgqlFDU167.png

三,“玻璃心”:面對有示例的提示詞,智商暴跌50%


DeepSeek-R1 對提示詞可是很挑剔的!官方明確指出,要是提示詞里帶有示例,也就是少樣本提示詞(few-shot prompt),它會先從示例里學習,然后再回答,這樣一來,答案的準確率可能就會從 90% 直接掉到 40%。

官方建議:直接用零樣本提示詞(Zero-shot Prompt),不要加入任何示例。這樣一來,DeepSeek-R1 就能發(fā)揮出它應有的水平了。

wKgZO2fP_-6AJNqhAAtTULCNEyY545.png

四,職場“菜鳥”:代碼寫得好,但做工程就是個“實習生”


DeepSeek-R1 在 Codeforces 競賽里擊敗了 96% 的人類,這代碼能力看起來確實很厲害??梢坏秸鎸嵉能浖こ汤?,它就露餡了:

復雜項目管理:它壓根兒就不懂“模塊化開發(fā)”“版本控制”這些概念,面對復雜項目,估計得一頭霧水。

跨團隊協作:DeepSeek-R1 只能獨自編程,完全不會團隊協作,要是放到一個需要多人協作的項目里,那可就麻煩了。

玄學 debug:遇到 bug 時,它可能還會給出“重啟試試”這種無厘頭的解決方案,這可真是讓人哭笑不得。

為啥會出現這種情況呢?原因就在于 DeepSeek-R1 在 RL 訓練中缺乏真實工程數據,所以它雖然能解題,但真到了工程項目里,可就不是那么回事兒了,說白了,它就是一個“解題高手”,但不是工程項目高手。

五,結語:AI 的未來,在清醒認知中前行


DeepSeek-R1 的突破確實值得喝彩,但它絕對不是完美的“通用人工智能”。這些能力局限的存在,正好說明了 AI 的“智能”依然是“窄化”的,還遠遠無法替代人類的綜合能力。不過好消息是,DeepSeek 團隊已經知道這些局限的存在了,他們已經在著手解決這些問題了。

在這里,我要友情提示大家一句:當你看到“AI 秒殺人類”這種驚悚新聞的時候,可千萬別被嚇到了,這可能只是特定場景下的“販賣焦慮”。真正的 AGI 革命,還在路上呢。那么,你有沒有發(fā)現 DeepSeek-R1 的其他短板呢?歡迎在評論區(qū)一起聊聊呀!

如果你有更好的文章,歡迎投稿!

稿件接收郵箱:nami.liu@pasuntech.com

更多精彩內容請關注“算力魔方?”!

審核編輯 黃宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯系本站處理。 舉報投訴
  • DeepSeek
    +關注

    關注

    2

    文章

    835

    瀏覽量

    3249
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    百度騰訊搶灘布局!DeepSeek-R1升級和開源背后,國產AI的逆襲之路

    電子發(fā)燒友網報道(文/李彎彎)日前,DeepSeek官方宣布DeepSeek-R1模型已完成小版本試升級,當前版本為DeepSeek-R1-0528。次日,DeepSeek-R1-05
    的頭像 發(fā)表于 06-03 06:34 ?6181次閱讀

    DeepSeek R1 MTP在TensorRT-LLM中的實現與優(yōu)化

    TensorRT-LLM 在 NVIDIA Blackwell GPU 上創(chuàng)下了 DeepSeek-R1 推理性能的世界紀錄,Multi-Token Prediction (MTP) 實現了大幅提速
    的頭像 發(fā)表于 08-30 15:47 ?4443次閱讀
    <b class='flag-5'>DeepSeek</b> <b class='flag-5'>R1</b> MTP在TensorRT-LLM中的實現與優(yōu)化

    速看!EASY-EAI教你離線部署Deepseek R1大模型

    1.Deepseek簡介DeepSeek-R1,是幻方量化旗下AI公司深度求索(DeepSeek)研發(fā)的推理模型。DeepSeek-R1采用強化學習進行后訓練,旨在提升推理
    的頭像 發(fā)表于 07-25 15:22 ?1365次閱讀
    速看!EASY-EAI教你離線部署<b class='flag-5'>Deepseek</b> <b class='flag-5'>R1</b>大模型

    【「DeepSeek 核心技術揭秘」閱讀體驗】書籍介紹+第一章讀后心得

    相對策略優(yōu)化**(GRPO)算法、獎勵模型**等關鍵技術的深入剖析,可以幫助讀者了解 DeepSeek 在強化學習領域的創(chuàng)新性探索。對DeepSeek-R1 的訓練過程和推理能力的蒸餾等內容的詳細闡述
    發(fā)表于 07-17 11:59

    Arm Neoverse N2平臺實現DeepSeek-R1滿血版部署

    頗具優(yōu)勢。Arm 攜手合作伙伴,在 Arm Neoverse N2 平臺上使用開源推理框架 llama.cpp 實現 DeepSeek-R1 滿血版的部署,目前已可提供線上服務。
    的頭像 發(fā)表于 07-03 14:37 ?1234次閱讀
    Arm Neoverse N2平臺實現<b class='flag-5'>DeepSeek-R1</b>滿血版部署

    NVIDIA Blackwell GPU優(yōu)化DeepSeek-R1性能 打破DeepSeek-R1在最小延遲場景中的性能紀錄

    本文將探討 NVIDIA TensorRT-LLM 如何基于 8 個 NVIDIA Blackwell GPU 的配置,打破 DeepSeek-R1 在最小延遲場景中的性能紀錄:在 GTC 2025
    的頭像 發(fā)表于 07-02 19:31 ?3288次閱讀
    NVIDIA Blackwell GPU優(yōu)化<b class='flag-5'>DeepSeek-R1</b>性能 打破<b class='flag-5'>DeepSeek-R1</b>在最小延遲場景中的性能紀錄

    【書籍評測活動NO.62】一本書讀懂 DeepSeek 全家桶核心技術:DeepSeek 核心技術揭秘

    ,或者偏離人們習慣的表達方式。 因此,在訓練 DeepSeek-R1 時,DeepSeek 研究團隊對模型進行了兩次額外的調整: 第一次是喂給它一些冷啟動的例子 ,相當于給模型打好基礎,讓
    發(fā)表于 06-09 14:38

    【幸狐Omni3576邊緣計算套件試用體驗】CPU部署DeekSeek-R1模型(1B和7B)

    優(yōu)化:動態(tài)分配計算資源至關鍵token 中文優(yōu)化:在Wudao Corpus等中文數據集上強化訓練 技術突破: 相比傳統LLM,DeepSeek-R1通過以下創(chuàng)新實現低資源部署: MoE架構:專家混合層
    發(fā)表于 04-21 00:39

    香橙派發(fā)布OrangePi RV2本地部署Deepseek-R1蒸餾模型指南

    繼香橙派昇騰系列產品、OrangePi5系列產品完成與DeepSeek模型的深度適配之后,香橙派日前官方發(fā)布OrangePiRV2運行Deepseek-R1蒸餾模型實操指南。OrangePiRV2
    的頭像 發(fā)表于 03-28 11:55 ?1696次閱讀
    香橙派發(fā)布OrangePi RV2本地部署<b class='flag-5'>Deepseek-R1</b>蒸餾模型指南

    NVIDIA RTX 5880 Ada顯卡部署DeepSeek-R1模型實測報告

    DeepSeek-R1 模型在 4 張 NVIDIA RTX 5880 Ada 顯卡配置下,面對短文本生成、長文本生成、總結概括三大實戰(zhàn)場景,會碰撞出怎樣的性能火花?參數規(guī)模差異懸殊的 70B
    的頭像 發(fā)表于 03-17 11:12 ?3072次閱讀
    NVIDIA RTX 5880 Ada顯卡部署<b class='flag-5'>DeepSeek-R1</b>模型實測報告

    如何使用OpenVINO運行DeepSeek-R1蒸餾模型

    DeepSeek-R1在春節(jié)期間引發(fā)了全球科技界的熱度,DeepSeek-R1 是由 DeepSeek 開發(fā)的開源推理模型,用于解決需要邏輯推理、數學問題解決和實時決策的任務。
    的頭像 發(fā)表于 03-12 13:45 ?2370次閱讀
    如何使用OpenVINO運行<b class='flag-5'>DeepSeek-R1</b>蒸餾模型

    在英特爾哪吒開發(fā)套件上部署DeepSeek-R1的實現方式

    隨著人工智能技術的快速發(fā)展,企業(yè)對 AI 模型的部署方式有了更多選擇。本地部署 DeepSeek-R1 模型具有以下顯著優(yōu)勢,使其成為許多企業(yè)和開發(fā)者的首選。
    的頭像 發(fā)表于 03-12 13:38 ?1113次閱讀
    在英特爾哪吒開發(fā)套件上部署<b class='flag-5'>DeepSeek-R1</b>的實現方式

    在 MAC mini4 上使用 VSCode 和 Cline 插件對接 Deepseek-R1:32b 的完整指南

    作者:算力魔方創(chuàng)始人/英特爾創(chuàng)新大使劉力 一,前言 Deepseek-R1:32b 是一款高性能的 AI 模型,適用于多種編程和開發(fā)任務。通過將其與 VSCode 和 Cline 插件結合,開發(fā)者
    的頭像 發(fā)表于 03-11 17:14 ?1732次閱讀
    在 MAC mini4 上使用 VSCode 和 Cline 插件對接 <b class='flag-5'>Deepseek-R1</b>:32b 的完整指南

    HarmonyOS NEXT開發(fā)實戰(zhàn):DevEco Studio中DeepSeek的使用

    /completions; 點擊Body將model修改為deepseek-chat(對應DeepSeek-V3)或者deepseek-reasoner(對應DeepSeek-R1
    發(fā)表于 03-07 14:56

    實戰(zhàn)案例 | 299元國產工業(yè)級AI核心板部署DeepSeek-R1

    前言:在AIoT領域,搭載Ubuntu系統的眺望T527開發(fā)板,僅憑2GB內存便成功運行15億參數的DeepSeek-R1輕量級大模型!在邊緣端上演一場算力革命,這一突破性進展不僅刷新了邊緣AI設備
    的頭像 發(fā)表于 03-06 08:30 ?1438次閱讀
    實戰(zhàn)案例 | 299元國產工業(yè)級AI核心板部署<b class='flag-5'>DeepSeek-R1</b>