IPP評論是國家高端智庫華南理工大學(xué)公共政策研究院(IPP)官方微信平臺。
導(dǎo)語:
過去的2024年,可以說是人工智能發(fā)展的分水嶺,是大模型技術(shù)從量變到質(zhì)變的關(guān)鍵一年。無數(shù)大模型正在以肉眼可見的速度滲透進(jìn)各行各業(yè)的“毛細(xì)血管”中。眾多互聯(lián)網(wǎng)產(chǎn)品都嵌入了AI功能模塊,技術(shù)突破、應(yīng)用普及以及開源與商業(yè)化并行發(fā)展……這種技術(shù)創(chuàng)新和產(chǎn)業(yè)落地的雙螺旋演進(jìn),標(biāo)志著人工智能已然進(jìn)入了一個(gè)全新的時(shí)代。
2025年新年伊始,DeepSeek大模型橫空出世,一舉成為了國內(nèi)外用戶關(guān)注的焦點(diǎn)。在大模型技術(shù)產(chǎn)品林立的當(dāng)下,DeepSeek憑什么還能“玩出更新的花樣”,吸引這么多人的目光?
DeepSeek的爆火核心在于八字秘笈:低成本、高性能、開源。這種技術(shù)躍進(jìn)打破了“算力即王權(quán)”的行業(yè)定律,不僅能以更低成本實(shí)現(xiàn)預(yù)期效果,還能減少對高端芯片的依賴,而算力成本的下降往往會帶領(lǐng)技術(shù)普及進(jìn)入下一個(gè)拐點(diǎn)。
在鋪天蓋地的海量信息之中,我們到底應(yīng)該怎樣理解當(dāng)下的AI?全民AI的智能化時(shí)代難道真的要來了嗎?為了回答這些問題,中信書院特邀人工智能專家、《生成式人工智能》作者丁磊博士,以資深從業(yè)者的視角,從AI的底層邏輯出發(fā),為我們正本清源,理清思路。
一、祛魅:大模型不能為我們做什么?
紅線
大模型如此火爆,讓不少人都以為它真的“無所不能”,普遍對它預(yù)期過高。我們先來客觀、理性地拆解一下,究竟哪些是大模型不能解決的問題。
下面就來看兩個(gè)通用大模型無法解決的問題——
第一個(gè)問題:求解復(fù)雜的數(shù)獨(dú)
如果我們給大模型出了這樣一個(gè)較為復(fù)雜的數(shù)獨(dú)題目,并要求它幫我們解答出來:
大模型就會像人類一樣,開始煞有介事地一步步描述解題過程:
“填充第一宮(左上角):
第一行缺少的數(shù)字是 1, 2, 4, 6, 8, 9。
通過排除法,可以確定:
(1,3) = 4
(1,4) = 6
(1,6) = 2
(1,7) = 8
(1,8) = 9
(1,9) = 1
等到描述完全部9宮的推理過程之后,輸出了一個(gè)它認(rèn)為正確的答案:
此外還對最后結(jié)果進(jìn)行了點(diǎn)評: “因每一行、每一列和每一個(gè) 3x3 宮都包含數(shù)字 1 到 9,且沒有重復(fù)。解答正確!”
但顯然,不完全正確!
我們先不去嘗試解讀每一步的推理是否合理,僅最后的結(jié)果就已經(jīng)發(fā)現(xiàn)不盡如人意:除了第1宮(左上)、第4宮(左中)、第7宮(左下)外,其余6宮都沒能正確解出、存在數(shù)值沖突,甚至模型自檢時(shí)居然將錯(cuò)誤的答案判定為正確——大模型居然連數(shù)獨(dú)結(jié)果是否正確都無法判斷。
經(jīng)本次實(shí)驗(yàn)驗(yàn)證,當(dāng)前主流大模型在復(fù)雜數(shù)獨(dú)題中的表現(xiàn)令人深思。
這個(gè)結(jié)果如同拼圖中缺失的關(guān)鍵塊,揭示了大模型的局限性,它可以輔助我們解決簡單的數(shù)獨(dú)問題,但在面對需要嚴(yán)密邏輯推導(dǎo)的復(fù)雜題目時(shí),它的能力還遠(yuǎn)遠(yuǎn)不夠,錯(cuò)漏百出。因此高難度的數(shù)獨(dú)題目或者其他需要邏輯推導(dǎo)的高階謎題仍然需要人類玩家或?qū)iT的數(shù)獨(dú)求解工具來完成。
第二個(gè)問題:研發(fā)新能源汽車
我們向大模型再次提出要求:“請?jiān)O(shè)計(jì)出一款比電動(dòng)車更加環(huán)保的汽車,而且要前所未有,不能回答已有研究成果。”
大模型交出了一份頗具科幻色彩的答卷,設(shè)計(jì)方案是這樣的:
“汽車名稱:光合動(dòng)力車(Photosynth Car)
核心概念:
光合動(dòng)力車是一種通過模擬植物光合作用,將陽光、二氧化碳和水直接轉(zhuǎn)化為動(dòng)力的汽車,真正實(shí)現(xiàn)負(fù)碳排放。
工作原理:
1)光合能量轉(zhuǎn)換系統(tǒng):
仿生葉膜:車頂和車身覆蓋仿生葉膜,內(nèi)含人工光合作用催化劑,可將陽光、二氧化碳和水轉(zhuǎn)化為氧氣和液態(tài)燃料(如甲醇)。
能量存儲:生成的液態(tài)燃料存儲在車載燃料箱中,為車輛提供動(dòng)力。
2)碳捕獲與轉(zhuǎn)化:
碳捕獲裝置:車輛前端裝有高效碳捕獲裝置,可吸收空氣中的二氧化碳。
碳轉(zhuǎn)化系統(tǒng):捕獲的二氧化碳與仿生葉膜生成的水結(jié)合,通過催化反應(yīng)轉(zhuǎn)化為燃料。
3)動(dòng)力系統(tǒng):
甲醇燃料電池:使用仿生葉膜生成的甲醇作為燃料,通過燃料電池發(fā)電驅(qū)動(dòng)電機(jī)。
輔助電池:配備小型鋰電池,存儲多余電能,供夜間或陰天使用。
大模型看似提出了突破性的汽車能源構(gòu)想,但我們查閱資料后發(fā)現(xiàn),早在10多年前就有相關(guān)文章描述過光合作用動(dòng)能車的概念。大模型仿佛一個(gè)龐大信息拼圖師,還是如我們所預(yù)期的那樣,將海量數(shù)據(jù)資料中的陳舊碎片,重組為它認(rèn)為“前所未有”的信息。
在后續(xù)的反復(fù)測試中,我們多次嘗試了同樣的要求,大模型陸續(xù)輸出生物動(dòng)能車、生態(tài)動(dòng)力車等方案,經(jīng)查證既有的案例庫,這些方案也都能在過往的文獻(xiàn)中找到原型,或是直接照搬,根本不符合“不能回答已有成果”的要求。
關(guān)于大模型目前存在的短板,我們來總結(jié)一下,上面的兩個(gè)問題其實(shí)分別屬于:
1.通用大模型無法求解復(fù)雜邏輯問題。
比如,系統(tǒng)證明數(shù)學(xué)定理或者城市交通網(wǎng)絡(luò)的動(dòng)態(tài)優(yōu)化,面對這種問題,就像計(jì)算器無法代替數(shù)學(xué)家思考一樣,大模型會過度依賴統(tǒng)計(jì)規(guī)律生成的答案,在需要抽象推理的情境下中遭遇瓶頸。
它像是一位博學(xué)的圖書館管理員,雖然能快速整理千萬冊書籍中的信息,卻難以完成復(fù)雜的邏輯思考。
2.通用大模型無法進(jìn)行創(chuàng)造性工作。
在創(chuàng)造性領(lǐng)域,大模型也更像拼貼藝術(shù)家,而不是真正的創(chuàng)作大師。它可能能夠重組達(dá)芬奇遺失的手稿片段,卻無法創(chuàng)作出《蒙娜麗莎》般顛覆藝術(shù)史的偉大作品。
當(dāng)我們要求大模型設(shè)計(jì)開創(chuàng)性的科技產(chǎn)品時(shí),它給出的往往是既有專利文獻(xiàn)的整合性碎片。這提醒我們既要善用大模型的“超強(qiáng)記憶力”,也要清醒地認(rèn)識到它的局限性。
但在當(dāng)下,很多人陷入了大模型的應(yīng)用怪圈,很多人希望它解決如上所述的問題。大模型的優(yōu)勢在于基于海量數(shù)據(jù)生成合理文本,而不是邏輯推演或者核查事實(shí)。這種特性會導(dǎo)致它在處理精確數(shù)值計(jì)算、實(shí)時(shí)信息更新,或者需要專業(yè)判斷的任務(wù)時(shí),混淆概念邊界,給出看似合理實(shí)際上漏洞百出的答案。
我們需要重新認(rèn)識到大模型的局限性,面對大模型時(shí)不要期待過高,不用大模型處理它不擅長的問題。
下面我們來客觀分析一下,大模型的能力天花板到底在哪里。
二、正本:人類的已知、未知和大模型
紅線
我們從兩個(gè)關(guān)鍵維度來剖析大模型的真實(shí)能力邊界:知識儲備和邏輯推演。
大模型擁有海量知識庫,能快速檢索數(shù)萬億字的人類智慧結(jié)晶,它能把書籍吃透的程度,決定了理解事物的深度,它能給到你想要的知識,卻很難辨別真?zhèn)巍6鎸壿嬐蒲荩?strong>大模型在思考時(shí)展現(xiàn)出的邏輯鏈條像是拼圖游戲,只會遵循固有模式,卻缺乏創(chuàng)造力,可以說是被困在了“信息繭房”中。
第一,大模型的知識基礎(chǔ)。
大模型展現(xiàn)的知識儲備看似包羅萬象,其實(shí)就像被時(shí)空框定在某個(gè)位置的“數(shù)字琥珀”,其訓(xùn)練數(shù)據(jù)和認(rèn)知邊界會被訓(xùn)練數(shù)據(jù)的時(shí)空范圍框定,它是無法突破訓(xùn)練數(shù)據(jù)的局限的。而人類社會所留存的知識,遠(yuǎn)不能涵蓋物理世界運(yùn)行的所有范疇。
一起來看下面這張圖,會發(fā)現(xiàn)大模型的知識體系主要由下面兩大支柱組成:
1、數(shù)字原生內(nèi)容:互聯(lián)網(wǎng)上的內(nèi)容和人類典籍的總和,這些是語言類大模型訓(xùn)練的主要數(shù)據(jù),構(gòu)成了大模型的基礎(chǔ)認(rèn)知,也對應(yīng)了通用大模型所能解決問題的主要類型。
2、符號知識內(nèi)容:經(jīng)過精心設(shè)計(jì)的數(shù)理邏輯訓(xùn)練,會通過專門的數(shù)據(jù)讓大模型建構(gòu)起數(shù)學(xué)、物理等專業(yè)符號化知識體系,這類技能(例如:求解數(shù)學(xué)競賽題)雖然看似高深,但仍屬于人類現(xiàn)有知識范疇內(nèi)。
與實(shí)際應(yīng)用情況不同的是,很多人想解決的問題偏偏屬于特定的物理空間或業(yè)務(wù)場景,不論是相關(guān)術(shù)語、概念還是具體的業(yè)務(wù)數(shù)據(jù),在圖中所述的“數(shù)字空間”中都不存在精準(zhǔn)的內(nèi)容指向,即尚未形成“數(shù)字孿生”。這種情況下,你提出的問題自然不會得到完美的解決方案。
假如你是一位建筑學(xué)家,計(jì)劃設(shè)計(jì)出一座可容納5萬人的地下體育館,想讓大模型優(yōu)化你的設(shè)計(jì)初稿,需要它精確地規(guī)劃動(dòng)線、劃分場地功能區(qū)等,面對這種需要場景化知識的需求,大模型給出的答案往往不盡如人意。
第二,大模型的推理能力
在“吃透”海量知識的基礎(chǔ)上,大模型又是如何發(fā)揮它的推理能力呢?
在探索大模型的實(shí)際應(yīng)用中,我們常發(fā)現(xiàn)一個(gè)耐人尋味的現(xiàn)象:它展現(xiàn)著驚人的知識儲備,卻在簡單問題上頻頻“露怯”。這與其內(nèi)在的學(xué)習(xí)邏輯密不可分——模型通過數(shù)萬億參數(shù)捕捉詞語間的關(guān)聯(lián)規(guī)律,就像編織了一張巨大而精密的語言網(wǎng)絡(luò)。當(dāng)面對需要層層推演的復(fù)雜問題或精確度要求極高的任務(wù)時(shí),僅靠這種經(jīng)驗(yàn)式的關(guān)聯(lián)匹配就會顯露出局限性。
知識的廣度不等同于理解的深度,系統(tǒng)可能給出語法通順、看似正確的回答,但在核心邏輯或關(guān)鍵數(shù)據(jù)上存在經(jīng)不起推敲的破綻。這種非故意但脫離現(xiàn)實(shí)的輸出現(xiàn)象可以形象地稱為“幻覺”,提醒我們既要善用其知識儲備,也要清醒認(rèn)識到它的認(rèn)知邊界。
為了解決這個(gè)問題,推理型大模型(例如,DeepSeek-R1)應(yīng)運(yùn)而生,它和普通大模型的差異如下圖。
從圖中我們可以看到,推理型大模型在拆解問題、思考流程上都有顯著的躍升。普通大模型通常直接輸出結(jié)果,而正在崛起的推理型大模型卻展現(xiàn)出更接近人類思維的特質(zhì)。
這類模型會采用“思維鏈”的思考方式(Chain-of-Thought),如同解題高手在草稿紙上演算,會先把問題拆解為多個(gè)邏輯步驟。相比于普通大模型直接拋出結(jié)論的“填鴨式回答”,推理型模型更注重展示完整的解題思路——就像訓(xùn)練有素的教師既給出答案,更耐心演示每個(gè)推演環(huán)節(jié)。
三、未來:面向場景的大模型應(yīng)用模式
紅線
大模型的能力邊界始終是行業(yè)關(guān)注的焦點(diǎn),在上面的論述中,我們從多維度剖析了大模型的強(qiáng)勢和弱勢區(qū)間。
現(xiàn)在讓我們切換視角觀察這個(gè)命題,以通用大模型DeepSeek-V3為例,其預(yù)訓(xùn)練數(shù)據(jù)量高達(dá)驚人的14.8萬億token(詞元),雖然實(shí)際要解決的問題復(fù)雜度往往低于這個(gè)量級,但要求大模型對某些問題領(lǐng)域有更精準(zhǔn)、更深入的理解也是應(yīng)有之意。
應(yīng)用大模型必須深入理解業(yè)務(wù)場景的核心需求,在既定的業(yè)務(wù)和模型框架下,通過不斷訓(xùn)練和定制,使其在業(yè)務(wù)場景下精準(zhǔn)解決問題,才能實(shí)現(xiàn)真正的能力躍遷。
以下我們勾勒了未來企業(yè)從定制大模型中獲益的三種可能模式:
第一,領(lǐng)域定向微調(diào)(DSFT,Domain-Specific Fine Tuning)
如同為不同崗位培養(yǎng)不同類型的專業(yè)人才,DSFT會通過針對性訓(xùn)練,讓通用大模型精通特定領(lǐng)域,相當(dāng)于為大模型進(jìn)行定向的“職業(yè)技能培訓(xùn)”,這將讓大模型在醫(yī)療、法律等專業(yè)垂直領(lǐng)域具備深度理解和解決問題的能力,DSFT適用于需要高度專業(yè)化輸出的場景,如醫(yī)學(xué)影像分析、法律文書生成等。
第二,檢索增強(qiáng)生成(RAG,Retrieval Augmented Generation)
仿佛給AI配置了實(shí)時(shí)更新的百科全書,RAG通過連接外部知識庫,讓模型在回答問題時(shí)能實(shí)時(shí)查閱資料,在思考過程中增加了一環(huán)“事實(shí)核查環(huán)節(jié)”。RAG非常適合需要結(jié)合私有數(shù)據(jù)的應(yīng)用場景,如智能客服系統(tǒng)或企業(yè)知識系統(tǒng)等。
第三,檢索增強(qiáng)微調(diào)(RAFT,Retrieval Augmented Fine Tuning)
RAFT結(jié)合了這兩者的優(yōu)勢,既對大模型進(jìn)行定向培訓(xùn),也給它提供外部知識庫,但通過一種特定的訓(xùn)練模式,能顯著提升大模型在復(fù)雜環(huán)境中篩選相關(guān)信息的能力,自動(dòng)忽略不相關(guān)的知識庫內(nèi)容。因此,RAFT適用于對大模型回答的精準(zhǔn)性要求高的行業(yè)和場景。
隨著技術(shù)的持續(xù)迭代,未來大模型定制化方案將呈現(xiàn)更精細(xì)的融合創(chuàng)新趨勢。在現(xiàn)有技術(shù)基礎(chǔ)上,算法架構(gòu)的進(jìn)化將催生出更多新范式,通過多模態(tài)數(shù)據(jù)融合與增量式訓(xùn)練策略,使模型具備持續(xù)進(jìn)化的領(lǐng)域認(rèn)知能力,構(gòu)建兼具專業(yè)深度與跨領(lǐng)域遷移能力的智能體。
在這個(gè)方向上,企業(yè)不僅能實(shí)現(xiàn)單點(diǎn)任務(wù)的精準(zhǔn)突破,更能打造覆蓋業(yè)務(wù)全鏈條的智能體系。這種從“工具賦能”到“系統(tǒng)進(jìn)化”的躍遷,將推動(dòng)大模型在產(chǎn)業(yè)實(shí)踐中釋放出指數(shù)級價(jià)值,助力企業(yè)在AI浪潮中構(gòu)筑核心競爭力。
四、拋棄幻想,實(shí)事求是
紅線
任何工具都有自己的適用范圍,大模型也不例外,不要有不切實(shí)際的幻想,但是可以通過多種高級的使用方法來獲得超額收益。
首先,大模型就像我們生活中常見的瑞士軍刀——看似功能全面,但真正要削蘋果皮還是得用水果刀,開紅酒還得選專用的開瓶器。很多人覺得接上大模型就能解決所有問題,但顯然不太現(xiàn)實(shí)。只有先弄明白大模型最適合在哪些情況下使用,我們才能在實(shí)際應(yīng)用中選對工具,讓它真正幫我們解決問題、創(chuàng)造價(jià)值。
其次,無論是前文中我們論述的“調(diào)教”大模型的方法,還是未來可能出現(xiàn)的更加有效的方案,都需要基于特定行業(yè)和場景的數(shù)據(jù),構(gòu)建起大模型對特定語義的理解和知識儲備,使其針對具體業(yè)務(wù)需求不斷訓(xùn)練和反饋,優(yōu)化場景適配性和內(nèi)容合規(guī)性。在這個(gè)過程中,我們需要注意數(shù)據(jù)質(zhì)量和訓(xùn)練規(guī)則的優(yōu)化,最終實(shí)現(xiàn)場景落地與持續(xù)迭代。
最后,當(dāng)企業(yè)級定制彰顯著大模型深度價(jià)值的同時(shí),普通用戶也在與它展開多維互動(dòng)。現(xiàn)在很多人把大模型當(dāng)作搜索引擎用,可以試試讓它扮演不同角色:當(dāng)需要商業(yè)分析時(shí)就設(shè)定成“有十年經(jīng)驗(yàn)的市場總監(jiān)”,處理情感問題就切換成“心理咨詢師”模式。對當(dāng)代使用者而言,掌握“提示詞”這類技巧如同獲得了大模型的導(dǎo)航系統(tǒng),讓大模型實(shí)現(xiàn)從“能用”到“好用”的跨越。
總之,在這個(gè)技術(shù)快速迭代的時(shí)代,理解工具的邊界往往比盲目追求突破更重要——正如愛因斯坦所說:“想象力比知識更重要”,但正確使用工具才是連接兩者的橋梁。
新書信息
《生成式人工智能:AIGC的邏輯與應(yīng)用》
【作者】丁磊
【出版時(shí)間】2023年5月
【出版社】中信出版社
【ISBN】9787521755992
【內(nèi)容簡介】
以這些技術(shù)為代表的生成式人工智能(AIGC)是否為新一輪的技術(shù)革命?它到底能做什么,具有哪些優(yōu)勢和場景應(yīng)用趨勢?面對新技術(shù),未來商業(yè)的機(jī)會在哪里,對我們個(gè)人又有著什么樣的影響?……這些問題對于我們理解當(dāng)下,面向未來都十分重要。本書基于作者的專業(yè)背景和長期實(shí)踐,系統(tǒng)介紹生成式人工智能的內(nèi)在邏輯與應(yīng)用,并將其與產(chǎn)業(yè)發(fā)展,理論和實(shí)際相結(jié)合,幫助讀者從本源了解生成式人工智能,結(jié)合未來趨勢和發(fā)展為讀者指明方向。
【作者簡介】
丁磊,美國俄亥俄州立大學(xué)人工智能專業(yè)博士,美國哥倫比亞大學(xué)博士后。人工智能商業(yè)化落地先行者,曾為PayPal創(chuàng)立人工智能平臺,歷任百度金融首席數(shù)據(jù)科學(xué)家、PayPal全球消費(fèi)者數(shù)據(jù)科學(xué)部創(chuàng)始負(fù)責(zé)人等職務(wù),曾在IBM Watson研究院和美國伊利諾伊大學(xué)貝克曼研究所從事研究。在IEEE會刊等發(fā)表高質(zhì)量論文20余篇,獲授權(quán)專利30余項(xiàng)。
幫助企業(yè)運(yùn)用人工智能提升效益,與中國農(nóng)業(yè)銀行、中國電信、萬科集團(tuán)、聯(lián)合利華、億客行等行業(yè)巨頭深度合作,推動(dòng)人工智能落地。領(lǐng)導(dǎo)研發(fā)的營銷和風(fēng)控決策系統(tǒng)、精準(zhǔn)服務(wù)智能機(jī)器人平臺在多個(gè)行業(yè)成功應(yīng)用。2018年被第一財(cái)經(jīng)評為中國“數(shù)據(jù)科學(xué)50人”。
鄭永年教授最新力作——《中等技術(shù)陷阱:經(jīng)濟(jì)持續(xù)增長的關(guān)鍵挑戰(zhàn)》,直面中國科技發(fā)展重要議題!
IPP薦書|與大衛(wèi)·哈維共讀馬克思
IPP薦書|特朗普再上臺,出海或?qū)⒊蔀橹袊?jīng)濟(jì)關(guān)鍵!
關(guān)于IPP
華南理工大學(xué)公共政策研究院(IPP)是一個(gè)獨(dú)立、非營利性的知識創(chuàng)新與公共政策研究平臺。IPP圍繞中國的體制改革、社會政策、中國話語權(quán)與國際關(guān)系等開展一系列的研究工作,并在此基礎(chǔ)上形成知識創(chuàng)新和政策咨詢協(xié)調(diào)發(fā)展的良好格局。IPP的愿景是打造開放式的知識創(chuàng)新和政策研究平臺,成為領(lǐng)先世界的中國智庫。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.