99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

IPP薦書|丁磊:DeepSeek爆火,你不知道的AI真相

0
分享至

IPP評論是國家高端智庫華南理工大學(xué)公共政策研究院(IPP)官方微信平臺。

導(dǎo)語:

過去的2024年,可以說是人工智能發(fā)展的分水嶺,是大模型技術(shù)從量變到質(zhì)變的關(guān)鍵一年。無數(shù)大模型正在以肉眼可見的速度滲透進(jìn)各行各業(yè)的“毛細(xì)血管”中。眾多互聯(lián)網(wǎng)產(chǎn)品都嵌入了AI功能模塊,技術(shù)突破、應(yīng)用普及以及開源與商業(yè)化并行發(fā)展……這種技術(shù)創(chuàng)新和產(chǎn)業(yè)落地的雙螺旋演進(jìn),標(biāo)志著人工智能已然進(jìn)入了一個(gè)全新的時(shí)代。

2025年新年伊始,DeepSeek大模型橫空出世,一舉成為了國內(nèi)外用戶關(guān)注的焦點(diǎn)。在大模型技術(shù)產(chǎn)品林立的當(dāng)下,DeepSeek憑什么還能“玩出更新的花樣”,吸引這么多人的目光?

DeepSeek的爆火核心在于八字秘笈:低成本、高性能、開源。這種技術(shù)躍進(jìn)打破了“算力即王權(quán)”的行業(yè)定律,不僅能以更低成本實(shí)現(xiàn)預(yù)期效果,還能減少對高端芯片的依賴,而算力成本的下降往往會帶領(lǐng)技術(shù)普及進(jìn)入下一個(gè)拐點(diǎn)。

在鋪天蓋地的海量信息之中,我們到底應(yīng)該怎樣理解當(dāng)下的AI?全民AI的智能化時(shí)代難道真的要來了嗎?為了回答這些問題,中信書院特邀人工智能專家、《生成式人工智能》作者丁磊博士,以資深從業(yè)者的視角,從AI的底層邏輯出發(fā),為我們正本清源,理清思路。

一、祛魅:大模型不能為我們做什么?

紅線

大模型如此火爆,讓不少人都以為它真的“無所不能”,普遍對它預(yù)期過高。我們先來客觀、理性地拆解一下,究竟哪些是大模型不能解決的問題。

下面就來看兩個(gè)通用大模型無法解決的問題——

第一個(gè)問題:求解復(fù)雜的數(shù)獨(dú)

如果我們給大模型出了這樣一個(gè)較為復(fù)雜的數(shù)獨(dú)題目,并要求它幫我們解答出來:


大模型就會像人類一樣,開始煞有介事地一步步描述解題過程:

“填充第一宮(左上角):

第一行缺少的數(shù)字是 1, 2, 4, 6, 8, 9。

通過排除法,可以確定:

(1,3) = 4

(1,4) = 6

(1,6) = 2

(1,7) = 8

(1,8) = 9

(1,9) = 1

等到描述完全部9宮的推理過程之后,輸出了一個(gè)它認(rèn)為正確的答案:


此外還對最后結(jié)果進(jìn)行了點(diǎn)評: “因每一行、每一列和每一個(gè) 3x3 宮都包含數(shù)字 1 到 9,且沒有重復(fù)。解答正確!”

但顯然,不完全正確!

我們先不去嘗試解讀每一步的推理是否合理,僅最后的結(jié)果就已經(jīng)發(fā)現(xiàn)不盡如人意:除了第1宮(左上)、第4宮(左中)、第7宮(左下)外,其余6宮都沒能正確解出、存在數(shù)值沖突,甚至模型自檢時(shí)居然將錯(cuò)誤的答案判定為正確——大模型居然連數(shù)獨(dú)結(jié)果是否正確都無法判斷。

經(jīng)本次實(shí)驗(yàn)驗(yàn)證,當(dāng)前主流大模型在復(fù)雜數(shù)獨(dú)題中的表現(xiàn)令人深思。

這個(gè)結(jié)果如同拼圖中缺失的關(guān)鍵塊,揭示了大模型的局限性,它可以輔助我們解決簡單的數(shù)獨(dú)問題,但在面對需要嚴(yán)密邏輯推導(dǎo)的復(fù)雜題目時(shí),它的能力還遠(yuǎn)遠(yuǎn)不夠,錯(cuò)漏百出。因此高難度的數(shù)獨(dú)題目或者其他需要邏輯推導(dǎo)的高階謎題仍然需要人類玩家或?qū)iT的數(shù)獨(dú)求解工具來完成。

第二個(gè)問題:研發(fā)新能源汽車

我們向大模型再次提出要求:“請?jiān)O(shè)計(jì)出一款比電動(dòng)車更加環(huán)保的汽車,而且要前所未有,不能回答已有研究成果。”

大模型交出了一份頗具科幻色彩的答卷,設(shè)計(jì)方案是這樣的:

“汽車名稱:光合動(dòng)力車(Photosynth Car)

核心概念:

光合動(dòng)力車是一種通過模擬植物光合作用,將陽光、二氧化碳和水直接轉(zhuǎn)化為動(dòng)力的汽車,真正實(shí)現(xiàn)負(fù)碳排放。

工作原理:

1)光合能量轉(zhuǎn)換系統(tǒng):

仿生葉膜:車頂和車身覆蓋仿生葉膜,內(nèi)含人工光合作用催化劑,可將陽光、二氧化碳和水轉(zhuǎn)化為氧氣和液態(tài)燃料(如甲醇)。

能量存儲:生成的液態(tài)燃料存儲在車載燃料箱中,為車輛提供動(dòng)力。

2)碳捕獲與轉(zhuǎn)化:

碳捕獲裝置:車輛前端裝有高效碳捕獲裝置,可吸收空氣中的二氧化碳。

碳轉(zhuǎn)化系統(tǒng):捕獲的二氧化碳與仿生葉膜生成的水結(jié)合,通過催化反應(yīng)轉(zhuǎn)化為燃料。

3)動(dòng)力系統(tǒng):

甲醇燃料電池:使用仿生葉膜生成的甲醇作為燃料,通過燃料電池發(fā)電驅(qū)動(dòng)電機(jī)。

輔助電池:配備小型鋰電池,存儲多余電能,供夜間或陰天使用。

大模型看似提出了突破性的汽車能源構(gòu)想,但我們查閱資料后發(fā)現(xiàn),早在10多年前就有相關(guān)文章描述過光合作用動(dòng)能車的概念。大模型仿佛一個(gè)龐大信息拼圖師,還是如我們所預(yù)期的那樣,將海量數(shù)據(jù)資料中的陳舊碎片,重組為它認(rèn)為“前所未有”的信息。

在后續(xù)的反復(fù)測試中,我們多次嘗試了同樣的要求,大模型陸續(xù)輸出生物動(dòng)能車、生態(tài)動(dòng)力車等方案,經(jīng)查證既有的案例庫,這些方案也都能在過往的文獻(xiàn)中找到原型,或是直接照搬,根本不符合“不能回答已有成果”的要求。

關(guān)于大模型目前存在的短板,我們來總結(jié)一下,上面的兩個(gè)問題其實(shí)分別屬于:

1.通用大模型無法求解復(fù)雜邏輯問題。

比如,系統(tǒng)證明數(shù)學(xué)定理或者城市交通網(wǎng)絡(luò)的動(dòng)態(tài)優(yōu)化,面對這種問題,就像計(jì)算器無法代替數(shù)學(xué)家思考一樣,大模型會過度依賴統(tǒng)計(jì)規(guī)律生成的答案,在需要抽象推理的情境下中遭遇瓶頸。

它像是一位博學(xué)的圖書館管理員,雖然能快速整理千萬冊書籍中的信息,卻難以完成復(fù)雜的邏輯思考。

2.通用大模型無法進(jìn)行創(chuàng)造性工作。

在創(chuàng)造性領(lǐng)域,大模型也更像拼貼藝術(shù)家,而不是真正的創(chuàng)作大師。它可能能夠重組達(dá)芬奇遺失的手稿片段,卻無法創(chuàng)作出《蒙娜麗莎》般顛覆藝術(shù)史的偉大作品。

當(dāng)我們要求大模型設(shè)計(jì)開創(chuàng)性的科技產(chǎn)品時(shí),它給出的往往是既有專利文獻(xiàn)的整合性碎片。這提醒我們既要善用大模型的“超強(qiáng)記憶力”,也要清醒地認(rèn)識到它的局限性。

但在當(dāng)下,很多人陷入了大模型的應(yīng)用怪圈,很多人希望它解決如上所述的問題。大模型的優(yōu)勢在于基于海量數(shù)據(jù)生成合理文本,而不是邏輯推演或者核查事實(shí)。這種特性會導(dǎo)致它在處理精確數(shù)值計(jì)算、實(shí)時(shí)信息更新,或者需要專業(yè)判斷的任務(wù)時(shí),混淆概念邊界,給出看似合理實(shí)際上漏洞百出的答案。

我們需要重新認(rèn)識到大模型的局限性,面對大模型時(shí)不要期待過高,不用大模型處理它不擅長的問題。

下面我們來客觀分析一下,大模型的能力天花板到底在哪里。

二、正本:人類的已知、未知和大模型

紅線

我們從兩個(gè)關(guān)鍵維度來剖析大模型的真實(shí)能力邊界:知識儲備和邏輯推演。

大模型擁有海量知識庫,能快速檢索數(shù)萬億字的人類智慧結(jié)晶,它能把書籍吃透的程度,決定了理解事物的深度,它能給到你想要的知識,卻很難辨別真?zhèn)巍6鎸壿嬐蒲荩?strong>大模型在思考時(shí)展現(xiàn)出的邏輯鏈條像是拼圖游戲,只會遵循固有模式,卻缺乏創(chuàng)造力,可以說是被困在了“信息繭房”中。

第一,大模型的知識基礎(chǔ)。

大模型展現(xiàn)的知識儲備看似包羅萬象,其實(shí)就像被時(shí)空框定在某個(gè)位置的“數(shù)字琥珀”,其訓(xùn)練數(shù)據(jù)和認(rèn)知邊界會被訓(xùn)練數(shù)據(jù)的時(shí)空范圍框定,它是無法突破訓(xùn)練數(shù)據(jù)的局限的。而人類社會所留存的知識,遠(yuǎn)不能涵蓋物理世界運(yùn)行的所有范疇。

一起來看下面這張圖,會發(fā)現(xiàn)大模型的知識體系主要由下面兩大支柱組成:


1、數(shù)字原生內(nèi)容:互聯(lián)網(wǎng)上的內(nèi)容和人類典籍的總和,這些是語言類大模型訓(xùn)練的主要數(shù)據(jù),構(gòu)成了大模型的基礎(chǔ)認(rèn)知,也對應(yīng)了通用大模型所能解決問題的主要類型。

2、符號知識內(nèi)容:經(jīng)過精心設(shè)計(jì)的數(shù)理邏輯訓(xùn)練,會通過專門的數(shù)據(jù)讓大模型建構(gòu)起數(shù)學(xué)、物理等專業(yè)符號化知識體系,這類技能(例如:求解數(shù)學(xué)競賽題)雖然看似高深,但仍屬于人類現(xiàn)有知識范疇內(nèi)。

與實(shí)際應(yīng)用情況不同的是,很多人想解決的問題偏偏屬于特定的物理空間或業(yè)務(wù)場景,不論是相關(guān)術(shù)語、概念還是具體的業(yè)務(wù)數(shù)據(jù),在圖中所述的“數(shù)字空間”中都不存在精準(zhǔn)的內(nèi)容指向,即尚未形成“數(shù)字孿生”。這種情況下,你提出的問題自然不會得到完美的解決方案。

假如你是一位建筑學(xué)家,計(jì)劃設(shè)計(jì)出一座可容納5萬人的地下體育館,想讓大模型優(yōu)化你的設(shè)計(jì)初稿,需要它精確地規(guī)劃動(dòng)線、劃分場地功能區(qū)等,面對這種需要場景化知識的需求,大模型給出的答案往往不盡如人意。

第二,大模型的推理能力

在“吃透”海量知識的基礎(chǔ)上,大模型又是如何發(fā)揮它的推理能力呢?

在探索大模型的實(shí)際應(yīng)用中,我們常發(fā)現(xiàn)一個(gè)耐人尋味的現(xiàn)象:它展現(xiàn)著驚人的知識儲備,卻在簡單問題上頻頻“露怯”。這與其內(nèi)在的學(xué)習(xí)邏輯密不可分——模型通過數(shù)萬億參數(shù)捕捉詞語間的關(guān)聯(lián)規(guī)律,就像編織了一張巨大而精密的語言網(wǎng)絡(luò)。當(dāng)面對需要層層推演的復(fù)雜問題或精確度要求極高的任務(wù)時(shí),僅靠這種經(jīng)驗(yàn)式的關(guān)聯(lián)匹配就會顯露出局限性。

知識的廣度不等同于理解的深度,系統(tǒng)可能給出語法通順、看似正確的回答,但在核心邏輯或關(guān)鍵數(shù)據(jù)上存在經(jīng)不起推敲的破綻。這種非故意但脫離現(xiàn)實(shí)的輸出現(xiàn)象可以形象地稱為“幻覺”,提醒我們既要善用其知識儲備,也要清醒認(rèn)識到它的認(rèn)知邊界。

為了解決這個(gè)問題,推理型大模型(例如,DeepSeek-R1)應(yīng)運(yùn)而生,它和普通大模型的差異如下圖。


從圖中我們可以看到,推理型大模型在拆解問題、思考流程上都有顯著的躍升。普通大模型通常直接輸出結(jié)果,而正在崛起的推理型大模型卻展現(xiàn)出更接近人類思維的特質(zhì)。

這類模型會采用“思維鏈”的思考方式(Chain-of-Thought),如同解題高手在草稿紙上演算,會先把問題拆解為多個(gè)邏輯步驟。相比于普通大模型直接拋出結(jié)論的“填鴨式回答”,推理型模型更注重展示完整的解題思路——就像訓(xùn)練有素的教師既給出答案,更耐心演示每個(gè)推演環(huán)節(jié)。

三、未來:面向場景的大模型應(yīng)用模式

紅線

大模型的能力邊界始終是行業(yè)關(guān)注的焦點(diǎn),在上面的論述中,我們從多維度剖析了大模型的強(qiáng)勢和弱勢區(qū)間。

現(xiàn)在讓我們切換視角觀察這個(gè)命題,以通用大模型DeepSeek-V3為例,其預(yù)訓(xùn)練數(shù)據(jù)量高達(dá)驚人的14.8萬億token(詞元),雖然實(shí)際要解決的問題復(fù)雜度往往低于這個(gè)量級,但要求大模型對某些問題領(lǐng)域有更精準(zhǔn)、更深入的理解也是應(yīng)有之意。

應(yīng)用大模型必須深入理解業(yè)務(wù)場景的核心需求,在既定的業(yè)務(wù)和模型框架下,通過不斷訓(xùn)練和定制,使其在業(yè)務(wù)場景下精準(zhǔn)解決問題,才能實(shí)現(xiàn)真正的能力躍遷。

以下我們勾勒了未來企業(yè)從定制大模型中獲益的三種可能模式:

第一,領(lǐng)域定向微調(diào)(DSFT,Domain-Specific Fine Tuning)

如同為不同崗位培養(yǎng)不同類型的專業(yè)人才,DSFT會通過針對性訓(xùn)練,讓通用大模型精通特定領(lǐng)域,相當(dāng)于為大模型進(jìn)行定向的“職業(yè)技能培訓(xùn)”,這將讓大模型在醫(yī)療、法律等專業(yè)垂直領(lǐng)域具備深度理解和解決問題的能力,DSFT適用于需要高度專業(yè)化輸出的場景,如醫(yī)學(xué)影像分析、法律文書生成等。

第二,檢索增強(qiáng)生成(RAG,Retrieval Augmented Generation)

仿佛給AI配置了實(shí)時(shí)更新的百科全書,RAG通過連接外部知識庫,讓模型在回答問題時(shí)能實(shí)時(shí)查閱資料,在思考過程中增加了一環(huán)“事實(shí)核查環(huán)節(jié)”。RAG非常適合需要結(jié)合私有數(shù)據(jù)的應(yīng)用場景,如智能客服系統(tǒng)或企業(yè)知識系統(tǒng)等。

第三,檢索增強(qiáng)微調(diào)(RAFT,Retrieval Augmented Fine Tuning)

RAFT結(jié)合了這兩者的優(yōu)勢,既對大模型進(jìn)行定向培訓(xùn),也給它提供外部知識庫,但通過一種特定的訓(xùn)練模式,能顯著提升大模型在復(fù)雜環(huán)境中篩選相關(guān)信息的能力,自動(dòng)忽略不相關(guān)的知識庫內(nèi)容。因此,RAFT適用于對大模型回答的精準(zhǔn)性要求高的行業(yè)和場景。

隨著技術(shù)的持續(xù)迭代,未來大模型定制化方案將呈現(xiàn)更精細(xì)的融合創(chuàng)新趨勢。在現(xiàn)有技術(shù)基礎(chǔ)上,算法架構(gòu)的進(jìn)化將催生出更多新范式,通過多模態(tài)數(shù)據(jù)融合與增量式訓(xùn)練策略,使模型具備持續(xù)進(jìn)化的領(lǐng)域認(rèn)知能力,構(gòu)建兼具專業(yè)深度與跨領(lǐng)域遷移能力的智能體。

在這個(gè)方向上,企業(yè)不僅能實(shí)現(xiàn)單點(diǎn)任務(wù)的精準(zhǔn)突破,更能打造覆蓋業(yè)務(wù)全鏈條的智能體系。這種從“工具賦能”到“系統(tǒng)進(jìn)化”的躍遷,將推動(dòng)大模型在產(chǎn)業(yè)實(shí)踐中釋放出指數(shù)級價(jià)值,助力企業(yè)在AI浪潮中構(gòu)筑核心競爭力。

四、拋棄幻想,實(shí)事求是

紅線

任何工具都有自己的適用范圍,大模型也不例外,不要有不切實(shí)際的幻想,但是可以通過多種高級的使用方法來獲得超額收益。

首先,大模型就像我們生活中常見的瑞士軍刀——看似功能全面,但真正要削蘋果皮還是得用水果刀,開紅酒還得選專用的開瓶器。很多人覺得接上大模型就能解決所有問題,但顯然不太現(xiàn)實(shí)。只有先弄明白大模型最適合在哪些情況下使用,我們才能在實(shí)際應(yīng)用中選對工具,讓它真正幫我們解決問題、創(chuàng)造價(jià)值。

其次,無論是前文中我們論述的“調(diào)教”大模型的方法,還是未來可能出現(xiàn)的更加有效的方案,都需要基于特定行業(yè)和場景的數(shù)據(jù),構(gòu)建起大模型對特定語義的理解和知識儲備,使其針對具體業(yè)務(wù)需求不斷訓(xùn)練和反饋,優(yōu)化場景適配性和內(nèi)容合規(guī)性。在這個(gè)過程中,我們需要注意數(shù)據(jù)質(zhì)量和訓(xùn)練規(guī)則的優(yōu)化,最終實(shí)現(xiàn)場景落地與持續(xù)迭代。

最后,當(dāng)企業(yè)級定制彰顯著大模型深度價(jià)值的同時(shí),普通用戶也在與它展開多維互動(dòng)。現(xiàn)在很多人把大模型當(dāng)作搜索引擎用,可以試試讓它扮演不同角色:當(dāng)需要商業(yè)分析時(shí)就設(shè)定成“有十年經(jīng)驗(yàn)的市場總監(jiān)”,處理情感問題就切換成“心理咨詢師”模式。對當(dāng)代使用者而言,掌握“提示詞”這類技巧如同獲得了大模型的導(dǎo)航系統(tǒng),讓大模型實(shí)現(xiàn)從“能用”到“好用”的跨越。

總之,在這個(gè)技術(shù)快速迭代的時(shí)代,理解工具的邊界往往比盲目追求突破更重要——正如愛因斯坦所說:“想象力比知識更重要”,但正確使用工具才是連接兩者的橋梁。

新書信息


《生成式人工智能:AIGC的邏輯與應(yīng)用》

【作者】丁磊

【出版時(shí)間】2023年5月

【出版社】中信出版社

【ISBN】9787521755992

【內(nèi)容簡介】

以這些技術(shù)為代表的生成式人工智能(AIGC)是否為新一輪的技術(shù)革命?它到底能做什么,具有哪些優(yōu)勢和場景應(yīng)用趨勢?面對新技術(shù),未來商業(yè)的機(jī)會在哪里,對我們個(gè)人又有著什么樣的影響?……這些問題對于我們理解當(dāng)下,面向未來都十分重要。本書基于作者的專業(yè)背景和長期實(shí)踐,系統(tǒng)介紹生成式人工智能的內(nèi)在邏輯與應(yīng)用,并將其與產(chǎn)業(yè)發(fā)展,理論和實(shí)際相結(jié)合,幫助讀者從本源了解生成式人工智能,結(jié)合未來趨勢和發(fā)展為讀者指明方向。

【作者簡介】

丁磊,美國俄亥俄州立大學(xué)人工智能專業(yè)博士,美國哥倫比亞大學(xué)博士后。人工智能商業(yè)化落地先行者,曾為PayPal創(chuàng)立人工智能平臺,歷任百度金融首席數(shù)據(jù)科學(xué)家、PayPal全球消費(fèi)者數(shù)據(jù)科學(xué)部創(chuàng)始負(fù)責(zé)人等職務(wù),曾在IBM Watson研究院和美國伊利諾伊大學(xué)貝克曼研究所從事研究。在IEEE會刊等發(fā)表高質(zhì)量論文20余篇,獲授權(quán)專利30余項(xiàng)。

幫助企業(yè)運(yùn)用人工智能提升效益,與中國農(nóng)業(yè)銀行、中國電信、萬科集團(tuán)、聯(lián)合利華、億客行等行業(yè)巨頭深度合作,推動(dòng)人工智能落地。領(lǐng)導(dǎo)研發(fā)的營銷和風(fēng)控決策系統(tǒng)、精準(zhǔn)服務(wù)智能機(jī)器人平臺在多個(gè)行業(yè)成功應(yīng)用。2018年被第一財(cái)經(jīng)評為中國“數(shù)據(jù)科學(xué)50人”。

鄭永年教授最新力作——《中等技術(shù)陷阱:經(jīng)濟(jì)持續(xù)增長的關(guān)鍵挑戰(zhàn)》,直面中國科技發(fā)展重要議題!


IPP薦書|與大衛(wèi)·哈維共讀馬克思


IPP薦書|特朗普再上臺,出海或?qū)⒊蔀橹袊?jīng)濟(jì)關(guān)鍵!

關(guān)于IPP


華南理工大學(xué)公共政策研究院(IPP)是一個(gè)獨(dú)立、非營利性的知識創(chuàng)新與公共政策研究平臺。IPP圍繞中國的體制改革、社會政策、中國話語權(quán)與國際關(guān)系等開展一系列的研究工作,并在此基礎(chǔ)上形成知識創(chuàng)新和政策咨詢協(xié)調(diào)發(fā)展的良好格局。IPP的愿景是打造開放式的知識創(chuàng)新和政策研究平臺,成為領(lǐng)先世界的中國智庫。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

IPP評論 incentive-icons
IPP評論
扎根真實(shí)世界,回應(yīng)中國問題。
1910文章數(shù) 84238關(guān)注度
往期回顧 全部

專題推薦

強(qiáng)軍之路

無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 望城县| 辉县市| 崇仁县| 白朗县| 江都市| 宣武区| 辽阳县| 隆化县| 凤山市| 佛坪县| 河西区| 留坝县| 喀喇沁旗| 雷波县| 昌吉市| 张掖市| 潼关县| 富宁县| 色达县| 云和县| 溧水县| 友谊县| 沭阳县| 读书| 炉霍县| 青冈县| 绿春县| 乌恰县| 鹤庆县| 奉化市| 雷州市| 呼和浩特市| 沧州市| 苍南县| 怀来县| 乌鲁木齐县| 绥棱县| 靖边县| 黎川县| 甘谷县| 宜黄县|