IPP薦書｜丁磊：DeepSeek爆火，你不知道的AI真相

2025-03-05 19:19:17　來源: IPP評論

廣東舉報(bào)

分享至

IPP評論是國家高端智庫華南理工大學(xué)公共政策研究院（IPP）官方微信平臺。

導(dǎo)語：

過去的2024年，可以說是人工智能發(fā)展的分水嶺，是大模型技術(shù)從量變到質(zhì)變的關(guān)鍵一年。無數(shù)大模型正在以肉眼可見的速度滲透進(jìn)各行各業(yè)的“毛細(xì)血管”中。眾多互聯(lián)網(wǎng)產(chǎn)品都嵌入了AI功能模塊，技術(shù)突破、應(yīng)用普及以及開源與商業(yè)化并行發(fā)展……這種技術(shù)創(chuàng)新和產(chǎn)業(yè)落地的雙螺旋演進(jìn)，標(biāo)志著人工智能已然進(jìn)入了一個(gè)全新的時(shí)代。

2025年新年伊始，DeepSeek大模型橫空出世，一舉成為了國內(nèi)外用戶關(guān)注的焦點(diǎn)。在大模型技術(shù)產(chǎn)品林立的當(dāng)下，DeepSeek憑什么還能“玩出更新的花樣”，吸引這么多人的目光？

DeepSeek的爆火核心在于八字秘笈：低成本、高性能、開源。這種技術(shù)躍進(jìn)打破了“算力即王權(quán)”的行業(yè)定律，不僅能以更低成本實(shí)現(xiàn)預(yù)期效果，還能減少對高端芯片的依賴，而算力成本的下降往往會帶領(lǐng)技術(shù)普及進(jìn)入下一個(gè)拐點(diǎn)。

在鋪天蓋地的海量信息之中，我們到底應(yīng)該怎樣理解當(dāng)下的AI？全民AI的智能化時(shí)代難道真的要來了嗎？為了回答這些問題，中信書院特邀人工智能專家、《生成式人工智能》作者丁磊博士，以資深從業(yè)者的視角，從AI的底層邏輯出發(fā)，為我們正本清源，理清思路。

一、祛魅：大模型不能為我們做什么？

紅線

大模型如此火爆，讓不少人都以為它真的“無所不能”，普遍對它預(yù)期過高。我們先來客觀、理性地拆解一下，究竟哪些是大模型不能解決的問題。

下面就來看兩個(gè)通用大模型無法解決的問題——

第一個(gè)問題：求解復(fù)雜的數(shù)獨(dú)

如果我們給大模型出了這樣一個(gè)較為復(fù)雜的數(shù)獨(dú)題目，并要求它幫我們解答出來：

大模型就會像人類一樣，開始煞有介事地一步步描述解題過程：

“填充第一宮（左上角）：

第一行缺少的數(shù)字是 1, 2, 4, 6, 8, 9。

通過排除法，可以確定：

(1,3) = 4

(1,4) = 6

(1,6) = 2

(1,7) = 8

(1,8) = 9

(1,9) = 1

等到描述完全部9宮的推理過程之后，輸出了一個(gè)它認(rèn)為正確的答案：

此外還對最后結(jié)果進(jìn)行了點(diǎn)評： “因每一行、每一列和每一個(gè) 3x3 宮都包含數(shù)字 1 到 9，且沒有重復(fù)。解答正確！”

但顯然，不完全正確！

我們先不去嘗試解讀每一步的推理是否合理，僅最后的結(jié)果就已經(jīng)發(fā)現(xiàn)不盡如人意：除了第1宮（左上）、第4宮（左中）、第7宮（左下）外，其余6宮都沒能正確解出、存在數(shù)值沖突，甚至模型自檢時(shí)居然將錯(cuò)誤的答案判定為正確——大模型居然連數(shù)獨(dú)結(jié)果是否正確都無法判斷。

經(jīng)本次實(shí)驗(yàn)驗(yàn)證，當(dāng)前主流大模型在復(fù)雜數(shù)獨(dú)題中的表現(xiàn)令人深思。

這個(gè)結(jié)果如同拼圖中缺失的關(guān)鍵塊，揭示了大模型的局限性，它可以輔助我們解決簡單的數(shù)獨(dú)問題，但在面對需要嚴(yán)密邏輯推導(dǎo)的復(fù)雜題目時(shí)，它的能力還遠(yuǎn)遠(yuǎn)不夠，錯(cuò)漏百出。因此高難度的數(shù)獨(dú)題目或者其他需要邏輯推導(dǎo)的高階謎題仍然需要人類玩家或?qū)ｉT的數(shù)獨(dú)求解工具來完成。

第二個(gè)問題：研發(fā)新能源汽車

我們向大模型再次提出要求：“請?jiān)O(shè)計(jì)出一款比電動(dòng)車更加環(huán)保的汽車，而且要前所未有，不能回答已有研究成果。”

大模型交出了一份頗具科幻色彩的答卷，設(shè)計(jì)方案是這樣的：

“汽車名稱：光合動(dòng)力車（Photosynth Car）

核心概念：

光合動(dòng)力車是一種通過模擬植物光合作用，將陽光、二氧化碳和水直接轉(zhuǎn)化為動(dòng)力的汽車，真正實(shí)現(xiàn)負(fù)碳排放。

工作原理：

1）光合能量轉(zhuǎn)換系統(tǒng)：

仿生葉膜：車頂和車身覆蓋仿生葉膜，內(nèi)含人工光合作用催化劑，可將陽光、二氧化碳和水轉(zhuǎn)化為氧氣和液態(tài)燃料（如甲醇）。

能量存儲：生成的液態(tài)燃料存儲在車載燃料箱中，為車輛提供動(dòng)力。

2）碳捕獲與轉(zhuǎn)化：

碳捕獲裝置：車輛前端裝有高效碳捕獲裝置，可吸收空氣中的二氧化碳。

碳轉(zhuǎn)化系統(tǒng)：捕獲的二氧化碳與仿生葉膜生成的水結(jié)合，通過催化反應(yīng)轉(zhuǎn)化為燃料。

3）動(dòng)力系統(tǒng)：

甲醇燃料電池：使用仿生葉膜生成的甲醇作為燃料，通過燃料電池發(fā)電驅(qū)動(dòng)電機(jī)。

輔助電池：配備小型鋰電池，存儲多余電能，供夜間或陰天使用。

大模型看似提出了突破性的汽車能源構(gòu)想，但我們查閱資料后發(fā)現(xiàn)，早在10多年前就有相關(guān)文章描述過光合作用動(dòng)能車的概念。大模型仿佛一個(gè)龐大信息拼圖師，還是如我們所預(yù)期的那樣，將海量數(shù)據(jù)資料中的陳舊碎片，重組為它認(rèn)為“前所未有”的信息。

在后續(xù)的反復(fù)測試中，我們多次嘗試了同樣的要求，大模型陸續(xù)輸出生物動(dòng)能車、生態(tài)動(dòng)力車等方案，經(jīng)查證既有的案例庫，這些方案也都能在過往的文獻(xiàn)中找到原型，或是直接照搬，根本不符合“不能回答已有成果”的要求。

關(guān)于大模型目前存在的短板，我們來總結(jié)一下，上面的兩個(gè)問題其實(shí)分別屬于：

1.通用大模型無法求解復(fù)雜邏輯問題。

比如，系統(tǒng)證明數(shù)學(xué)定理或者城市交通網(wǎng)絡(luò)的動(dòng)態(tài)優(yōu)化，面對這種問題，就像計(jì)算器無法代替數(shù)學(xué)家思考一樣，大模型會過度依賴統(tǒng)計(jì)規(guī)律生成的答案，在需要抽象推理的情境下中遭遇瓶頸。

它像是一位博學(xué)的圖書館管理員，雖然能快速整理千萬冊書籍中的信息，卻難以完成復(fù)雜的邏輯思考。

2.通用大模型無法進(jìn)行創(chuàng)造性工作。

在創(chuàng)造性領(lǐng)域，大模型也更像拼貼藝術(shù)家，而不是真正的創(chuàng)作大師。它可能能夠重組達(dá)芬奇遺失的手稿片段，卻無法創(chuàng)作出《蒙娜麗莎》般顛覆藝術(shù)史的偉大作品。

當(dāng)我們要求大模型設(shè)計(jì)開創(chuàng)性的科技產(chǎn)品時(shí)，它給出的往往是既有專利文獻(xiàn)的整合性碎片。這提醒我們既要善用大模型的“超強(qiáng)記憶力”，也要清醒地認(rèn)識到它的局限性。

但在當(dāng)下，很多人陷入了大模型的應(yīng)用怪圈，很多人希望它解決如上所述的問題。大模型的優(yōu)勢在于基于海量數(shù)據(jù)生成合理文本，而不是邏輯推演或者核查事實(shí)。這種特性會導(dǎo)致它在處理精確數(shù)值計(jì)算、實(shí)時(shí)信息更新，或者需要專業(yè)判斷的任務(wù)時(shí)，混淆概念邊界，給出看似合理實(shí)際上漏洞百出的答案。

我們需要重新認(rèn)識到大模型的局限性，面對大模型時(shí)不要期待過高，不用大模型處理它不擅長的問題。

下面我們來客觀分析一下，大模型的能力天花板到底在哪里。

二、正本：人類的已知、未知和大模型

紅線

我們從兩個(gè)關(guān)鍵維度來剖析大模型的真實(shí)能力邊界：知識儲備和邏輯推演。

大模型擁有海量知識庫，能快速檢索數(shù)萬億字的人類智慧結(jié)晶，它能把書籍吃透的程度，決定了理解事物的深度，它能給到你想要的知識，卻很難辨別真?zhèn)巍６鎸壿嬐蒲荩?strong>大模型在思考時(shí)展現(xiàn)出的邏輯鏈條像是拼圖游戲，只會遵循固有模式，卻缺乏創(chuàng)造力，可以說是被困在了“信息繭房”中。

第一，大模型的知識基礎(chǔ)。

大模型展現(xiàn)的知識儲備看似包羅萬象，其實(shí)就像被時(shí)空框定在某個(gè)位置的“數(shù)字琥珀”，其訓(xùn)練數(shù)據(jù)和認(rèn)知邊界會被訓(xùn)練數(shù)據(jù)的時(shí)空范圍框定，它是無法突破訓(xùn)練數(shù)據(jù)的局限的。而人類社會所留存的知識，遠(yuǎn)不能涵蓋物理世界運(yùn)行的所有范疇。

一起來看下面這張圖，會發(fā)現(xiàn)大模型的知識體系主要由下面兩大支柱組成：

1、數(shù)字原生內(nèi)容：互聯(lián)網(wǎng)上的內(nèi)容和人類典籍的總和，這些是語言類大模型訓(xùn)練的主要數(shù)據(jù)，構(gòu)成了大模型的基礎(chǔ)認(rèn)知，也對應(yīng)了通用大模型所能解決問題的主要類型。

2、符號知識內(nèi)容：經(jīng)過精心設(shè)計(jì)的數(shù)理邏輯訓(xùn)練，會通過專門的數(shù)據(jù)讓大模型建構(gòu)起數(shù)學(xué)、物理等專業(yè)符號化知識體系，這類技能（例如：求解數(shù)學(xué)競賽題）雖然看似高深，但仍屬于人類現(xiàn)有知識范疇內(nèi)。

與實(shí)際應(yīng)用情況不同的是，很多人想解決的問題偏偏屬于特定的物理空間或業(yè)務(wù)場景，不論是相關(guān)術(shù)語、概念還是具體的業(yè)務(wù)數(shù)據(jù)，在圖中所述的“數(shù)字空間”中都不存在精準(zhǔn)的內(nèi)容指向，即尚未形成“數(shù)字孿生”。這種情況下，你提出的問題自然不會得到完美的解決方案。

假如你是一位建筑學(xué)家，計(jì)劃設(shè)計(jì)出一座可容納5萬人的地下體育館，想讓大模型優(yōu)化你的設(shè)計(jì)初稿，需要它精確地規(guī)劃動(dòng)線、劃分場地功能區(qū)等，面對這種需要場景化知識的需求，大模型給出的答案往往不盡如人意。

第二，大模型的推理能力

在“吃透”海量知識的基礎(chǔ)上，大模型又是如何發(fā)揮它的推理能力呢？

在探索大模型的實(shí)際應(yīng)用中，我們常發(fā)現(xiàn)一個(gè)耐人尋味的現(xiàn)象：它展現(xiàn)著驚人的知識儲備，卻在簡單問題上頻頻“露怯”。這與其內(nèi)在的學(xué)習(xí)邏輯密不可分——模型通過數(shù)萬億參數(shù)捕捉詞語間的關(guān)聯(lián)規(guī)律，就像編織了一張巨大而精密的語言網(wǎng)絡(luò)。當(dāng)面對需要層層推演的復(fù)雜問題或精確度要求極高的任務(wù)時(shí)，僅靠這種經(jīng)驗(yàn)式的關(guān)聯(lián)匹配就會顯露出局限性。

知識的廣度不等同于理解的深度，系統(tǒng)可能給出語法通順、看似正確的回答，但在核心邏輯或關(guān)鍵數(shù)據(jù)上存在經(jīng)不起推敲的破綻。這種非故意但脫離現(xiàn)實(shí)的輸出現(xiàn)象可以形象地稱為“幻覺”，提醒我們既要善用其知識儲備，也要清醒認(rèn)識到它的認(rèn)知邊界。

為了解決這個(gè)問題，推理型大模型（例如，DeepSeek-R1）應(yīng)運(yùn)而生，它和普通大模型的差異如下圖。

從圖中我們可以看到，推理型大模型在拆解問題、思考流程上都有顯著的躍升。普通大模型通常直接輸出結(jié)果，而正在崛起的推理型大模型卻展現(xiàn)出更接近人類思維的特質(zhì)。

這類模型會采用“思維鏈”的思考方式（Chain-of-Thought），如同解題高手在草稿紙上演算，會先把問題拆解為多個(gè)邏輯步驟。相比于普通大模型直接拋出結(jié)論的“填鴨式回答”，推理型模型更注重展示完整的解題思路——就像訓(xùn)練有素的教師既給出答案，更耐心演示每個(gè)推演環(huán)節(jié)。

三、未來：面向場景的大模型應(yīng)用模式

紅線

大模型的能力邊界始終是行業(yè)關(guān)注的焦點(diǎn)，在上面的論述中，我們從多維度剖析了大模型的強(qiáng)勢和弱勢區(qū)間。

現(xiàn)在讓我們切換視角觀察這個(gè)命題，以通用大模型DeepSeek-V3為例，其預(yù)訓(xùn)練數(shù)據(jù)量高達(dá)驚人的14.8萬億token（詞元），雖然實(shí)際要解決的問題復(fù)雜度往往低于這個(gè)量級，但要求大模型對某些問題領(lǐng)域有更精準(zhǔn)、更深入的理解也是應(yīng)有之意。

應(yīng)用大模型必須深入理解業(yè)務(wù)場景的核心需求，在既定的業(yè)務(wù)和模型框架下，通過不斷訓(xùn)練和定制，使其在業(yè)務(wù)場景下精準(zhǔn)解決問題，才能實(shí)現(xiàn)真正的能力躍遷。

以下我們勾勒了未來企業(yè)從定制大模型中獲益的三種可能模式：

第一，領(lǐng)域定向微調(diào)（DSFT，Domain-Specific Fine Tuning）

如同為不同崗位培養(yǎng)不同類型的專業(yè)人才，DSFT會通過針對性訓(xùn)練，讓通用大模型精通特定領(lǐng)域，相當(dāng)于為大模型進(jìn)行定向的“職業(yè)技能培訓(xùn)”，這將讓大模型在醫(yī)療、法律等專業(yè)垂直領(lǐng)域具備深度理解和解決問題的能力，DSFT適用于需要高度專業(yè)化輸出的場景，如醫(yī)學(xué)影像分析、法律文書生成等。

第二，檢索增強(qiáng)生成（RAG，Retrieval Augmented Generation）

仿佛給AI配置了實(shí)時(shí)更新的百科全書，RAG通過連接外部知識庫，讓模型在回答問題時(shí)能實(shí)時(shí)查閱資料，在思考過程中增加了一環(huán)“事實(shí)核查環(huán)節(jié)”。RAG非常適合需要結(jié)合私有數(shù)據(jù)的應(yīng)用場景，如智能客服系統(tǒng)或企業(yè)知識系統(tǒng)等。

第三，檢索增強(qiáng)微調(diào)（RAFT，Retrieval Augmented Fine Tuning）

RAFT結(jié)合了這兩者的優(yōu)勢，既對大模型進(jìn)行定向培訓(xùn)，也給它提供外部知識庫，但通過一種特定的訓(xùn)練模式，能顯著提升大模型在復(fù)雜環(huán)境中篩選相關(guān)信息的能力，自動(dòng)忽略不相關(guān)的知識庫內(nèi)容。因此，RAFT適用于對大模型回答的精準(zhǔn)性要求高的行業(yè)和場景。

隨著技術(shù)的持續(xù)迭代，未來大模型定制化方案將呈現(xiàn)更精細(xì)的融合創(chuàng)新趨勢。在現(xiàn)有技術(shù)基礎(chǔ)上，算法架構(gòu)的進(jìn)化將催生出更多新范式，通過多模態(tài)數(shù)據(jù)融合與增量式訓(xùn)練策略，使模型具備持續(xù)進(jìn)化的領(lǐng)域認(rèn)知能力，構(gòu)建兼具專業(yè)深度與跨領(lǐng)域遷移能力的智能體。

在這個(gè)方向上，企業(yè)不僅能實(shí)現(xiàn)單點(diǎn)任務(wù)的精準(zhǔn)突破，更能打造覆蓋業(yè)務(wù)全鏈條的智能體系。這種從“工具賦能”到“系統(tǒng)進(jìn)化”的躍遷，將推動(dòng)大模型在產(chǎn)業(yè)實(shí)踐中釋放出指數(shù)級價(jià)值，助力企業(yè)在AI浪潮中構(gòu)筑核心競爭力。

四、拋棄幻想，實(shí)事求是

紅線

任何工具都有自己的適用范圍，大模型也不例外，不要有不切實(shí)際的幻想，但是可以通過多種高級的使用方法來獲得超額收益。

首先，大模型就像我們生活中常見的瑞士軍刀——看似功能全面，但真正要削蘋果皮還是得用水果刀，開紅酒還得選專用的開瓶器。很多人覺得接上大模型就能解決所有問題，但顯然不太現(xiàn)實(shí)。只有先弄明白大模型最適合在哪些情況下使用，我們才能在實(shí)際應(yīng)用中選對工具，讓它真正幫我們解決問題、創(chuàng)造價(jià)值。

其次，無論是前文中我們論述的“調(diào)教”大模型的方法，還是未來可能出現(xiàn)的更加有效的方案，都需要基于特定行業(yè)和場景的數(shù)據(jù)，構(gòu)建起大模型對特定語義的理解和知識儲備，使其針對具體業(yè)務(wù)需求不斷訓(xùn)練和反饋，優(yōu)化場景適配性和內(nèi)容合規(guī)性。在這個(gè)過程中，我們需要注意數(shù)據(jù)質(zhì)量和訓(xùn)練規(guī)則的優(yōu)化，最終實(shí)現(xiàn)場景落地與持續(xù)迭代。

最后，當(dāng)企業(yè)級定制彰顯著大模型深度價(jià)值的同時(shí)，普通用戶也在與它展開多維互動(dòng)。現(xiàn)在很多人把大模型當(dāng)作搜索引擎用，可以試試讓它扮演不同角色：當(dāng)需要商業(yè)分析時(shí)就設(shè)定成“有十年經(jīng)驗(yàn)的市場總監(jiān)”，處理情感問題就切換成“心理咨詢師”模式。對當(dāng)代使用者而言，掌握“提示詞”這類技巧如同獲得了大模型的導(dǎo)航系統(tǒng)，讓大模型實(shí)現(xiàn)從“能用”到“好用”的跨越。

總之，在這個(gè)技術(shù)快速迭代的時(shí)代，理解工具的邊界往往比盲目追求突破更重要——正如愛因斯坦所說：“想象力比知識更重要”，但正確使用工具才是連接兩者的橋梁。

新書信息

《生成式人工智能：AIGC的邏輯與應(yīng)用》

【作者】丁磊

【出版時(shí)間】2023年5月

【出版社】中信出版社

【ISBN】9787521755992

【內(nèi)容簡介】

以這些技術(shù)為代表的生成式人工智能（AIGC）是否為新一輪的技術(shù)革命？它到底能做什么，具有哪些優(yōu)勢和場景應(yīng)用趨勢？面對新技術(shù)，未來商業(yè)的機(jī)會在哪里，對我們個(gè)人又有著什么樣的影響？……這些問題對于我們理解當(dāng)下，面向未來都十分重要。本書基于作者的專業(yè)背景和長期實(shí)踐，系統(tǒng)介紹生成式人工智能的內(nèi)在邏輯與應(yīng)用，并將其與產(chǎn)業(yè)發(fā)展，理論和實(shí)際相結(jié)合，幫助讀者從本源了解生成式人工智能，結(jié)合未來趨勢和發(fā)展為讀者指明方向。

【作者簡介】

丁磊，美國俄亥俄州立大學(xué)人工智能專業(yè)博士，美國哥倫比亞大學(xué)博士后。人工智能商業(yè)化落地先行者，曾為PayPal創(chuàng)立人工智能平臺，歷任百度金融首席數(shù)據(jù)科學(xué)家、PayPal全球消費(fèi)者數(shù)據(jù)科學(xué)部創(chuàng)始負(fù)責(zé)人等職務(wù)，曾在IBM Watson研究院和美國伊利諾伊大學(xué)貝克曼研究所從事研究。在IEEE會刊等發(fā)表高質(zhì)量論文20余篇，獲授權(quán)專利30余項(xiàng)。

幫助企業(yè)運(yùn)用人工智能提升效益，與中國農(nóng)業(yè)銀行、中國電信、萬科集團(tuán)、聯(lián)合利華、億客行等行業(yè)巨頭深度合作，推動(dòng)人工智能落地。領(lǐng)導(dǎo)研發(fā)的營銷和風(fēng)控決策系統(tǒng)、精準(zhǔn)服務(wù)智能機(jī)器人平臺在多個(gè)行業(yè)成功應(yīng)用。2018年被第一財(cái)經(jīng)評為中國“數(shù)據(jù)科學(xué)50人”。

鄭永年教授最新力作——《中等技術(shù)陷阱：經(jīng)濟(jì)持續(xù)增長的關(guān)鍵挑戰(zhàn)》，直面中國科技發(fā)展重要議題！

IPP薦書｜與大衛(wèi)·哈維共讀馬克思

IPP薦書｜特朗普再上臺，出海或?qū)⒊蔀橹袊?jīng)濟(jì)關(guān)鍵！

關(guān)于IPP

華南理工大學(xué)公共政策研究院（IPP）是一個(gè)獨(dú)立、非營利性的知識創(chuàng)新與公共政策研究平臺。IPP圍繞中國的體制改革、社會政策、中國話語權(quán)與國際關(guān)系等開展一系列的研究工作，并在此基礎(chǔ)上形成知識創(chuàng)新和政策咨詢協(xié)調(diào)發(fā)展的良好格局。IPP的愿景是打造開放式的知識創(chuàng)新和政策研究平臺，成為領(lǐng)先世界的中國智庫。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

手機(jī) / 數(shù)碼

房產(chǎn) / 家居

IPP薦書｜丁磊：DeepSeek爆火，你不知道的AI真相