99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

深度思考:現(xiàn)在的AI模型真的在進行推理嗎?

0
分享至

最近,OpenAI、DeepSeek、谷歌、Anthropic都推出新模型,它們都宣稱模型已經(jīng)具備真正的推理能力,也就是人類解決問題時運用的思維方式,但問題在于:AI大模型所說的推理真的和人一樣嗎?



現(xiàn)在的模型可以將復(fù)雜問題分解成小問題,然后逐步解決小問題再給出回應(yīng),業(yè)界將這個過程稱為“思維鏈推理”。這些模型有時表現(xiàn)讓人驚嘆,可以解決邏輯謎題和數(shù)學(xué)難題,能夠快速寫出完美代碼,但有時面對極為簡單的問題卻顯得蠢笨。

于是乎,反對者認(rèn)為所謂的“思維鏈推理”根本不算推理,而支持者卻認(rèn)為是推理,雖然不如人類靈活,但它正在朝著真正的推理前進。

反對者:只是用啟發(fā)式原則猜測答案

科學(xué)家一直在研究人腦是如何運行的,目前大家一致認(rèn)為大腦存在多種不同的推理類型。

推理有演繹推理,即從一個一般性的陳述出發(fā),得出一個具體的結(jié)論。還有歸納推理,利用具體的觀察結(jié)果來做出更廣泛的概括。除此還有類比推理、因果推理、常識推理。

與人腦推理相比,目前的AI推理還很狹隘。

圣塔菲研究所(SFI,Santa Fe Institute,SFI)教授梅蘭妮·米切爾(Melanie Mitchell)曾在一篇論文中寫道:“從有限的數(shù)學(xué)和經(jīng)驗中找到一條規(guī)則或者一套模型,將它應(yīng)用于新的未曾見過的情境中,在現(xiàn)實世界,我們非常看重這樣的推理。即使是非常小的孩子,也能從幾個例子中學(xué)習(xí)并發(fā)現(xiàn)抽象規(guī)則。”

孩子能做到,現(xiàn)在的AI能嗎?許多人持懷疑態(tài)度。

愛丁堡大學(xué)技術(shù)哲學(xué)家肖恩·瓦洛爾(Shannon Vallor)在談到OpenAI o1時表示:“AI所做的只是一種元擬態(tài)行為(meta-mimicry)。”

什么意思?就是說以前的ChatGPT舊模型會模仿其訓(xùn)練數(shù)據(jù)中人類所寫的陳述內(nèi)容,新的o1可以模仿人類得出陳述內(nèi)容的過程,雖然o1輸出的結(jié)果會讓人覺得它在推理,但這不是真正意義上的推理。



舉個例子,問ChatGPT一個問題:“1個人帶1匹狼、1只羊、1捆草過河。如果人在場,狼不敢吃羊、羊不敢吃草,可是小河邊的船每次只能讓人帶一種東西過河。那么,如何用最少的渡河次數(shù)把所有東西都帶到河對岸呢?”

雖然o1相比舊版有所改進,但架構(gòu)并未有太大變動,它在回答問題時出現(xiàn)失誤。瓦洛爾認(rèn)為:“在回答問題失敗時,我們會看到一個事實,即模型并沒有進行真正的推理。”

隨后推出的o3讓米切爾感到驚訝,但她更讓他吃驚的是o3在解決問題時消耗的算力如此巨大。由于OpenAI內(nèi)部運作并不透明,人們無從知曉大模型用這些算力做了什么。如果OpenAI不能做到公開透明,便無法確定模型真的將大問題分解成若干步驟,然后給出一個更完美的整體答案。

去年紐約大學(xué)在一篇名為《Let’s Think Dot by Dot》的論文中質(zhì)疑過AI推理,研究人員發(fā)現(xiàn),把思維鏈(Chain-of-Thought,CoT)推理中的具體步驟,替換成毫無意義的“...”(點號),產(chǎn)生的推理結(jié)果也大差不差。

米切爾認(rèn)為:“AI更像是一個啟發(fā)式原則構(gòu)成的集合,不是推理模型。”啟發(fā)式原則能幫你猜出問題的正確答案,但它并非真正通過思考獲得答案。

又例如,研究人員曾開發(fā)一個視覺模型,用來分析皮膚癌。初看時,模型似乎能判斷皮膚上的斑點是否為惡性病變,但事實證明,在訓(xùn)練數(shù)據(jù)中惡性斑點照片旁邊往往有了標(biāo)尺信息,模型只是因為標(biāo)尺信息的存在將斑點判定為惡性病變,這是一種啟發(fā)式思考。

由此可以懷疑,看起來AI似乎在用“推理”解決問題,但實際上只是在利用“記憶信息”進行啟發(fā)式探索。

支持者:不是純粹推理但也不是背誦

Redwood Research致力于降低人工智能風(fēng)險,該公司首席科學(xué)家瑞安·格林布拉特(Ryan Greenblatt)認(rèn)為,當(dāng)前的AI明顯是在進行某種形式的推理。

格林布拉特說:“機器的處理方式不像人類那樣具有普遍性,它們更多依賴記憶和知識,而非人類那樣依靠推理和判斷,但機器仍在進行處理。”

既然AI模型可以解答超出樣本范圍的難題,而且表現(xiàn)出色,就可以說它們是在進行某種推理。

“過河問題”是一個很經(jīng)典的問題,在訓(xùn)練數(shù)據(jù)中,AI應(yīng)該已經(jīng)學(xué)習(xí)過很多次。但當(dāng)用戶提出問題時,AI并沒有給出正確答案,它可能知道答案,只是進行了復(fù)雜的不必要的“思考”,人有時也會犯這種錯誤。



格林布拉特舉例說,如果你花一個月時間學(xué)習(xí)色彩理論,從互補色到不同色調(diào)的心理影響,再到文藝復(fù)興時期某些顏料的歷史意義。學(xué)完之后參加測試,試題問:“這幅風(fēng)景畫中為什么要把天空畫成藍色?”你可能會被誤導(dǎo),寫出極為復(fù)雜但沒有必要的答案,比如你可能會說藍色代表神圣的天空,說畫是清晨完成的,象征著新生……實際上答案很簡單:因為天空就是藍色的。

Open Philanthropy分析師阿杰亞·科特拉(Ajeya Cotra)認(rèn)為,有些活動被人類稱為推理,在這一范疇內(nèi),AI將會表現(xiàn)得越來越好。人類說AI只是在進行“元擬態(tài)”活動,重點不在于“元擬態(tài)”,而在于“只是”。人類的意思可能是它不會對世界產(chǎn)生重大影響,我們離超級人工智能還有很遠,這種斷定值得懷疑。

再比如,在一堂大學(xué)物理課上,面對問題時學(xué)生的表現(xiàn)參差不齊。有人作弊,直接給出答案。有人是天才,無需思考公式的內(nèi)容,憑借深刻的理解與直覺給出答案。大多學(xué)生憑借記憶記住公式,努力思考用哪個公式解答問題。

科特拉認(rèn)為,現(xiàn)在的AI和大多學(xué)生一樣,它會將記憶內(nèi)容與一些推理內(nèi)容結(jié)合起來。AI可能不太聰明,但它很勤奮,能記住無數(shù)方程式。它將強大的記憶與少量理解結(jié)合,找出針對某個問題的方程式組合,然后給出答案。

乍一看,AI和天才學(xué)生一樣極為聰明,但細細分析就會發(fā)現(xiàn)答案中的漏洞,盡管如此,并不意味著AI沒有推理。

換句話說,這些模型既不是純粹地進行推理,也不是純粹地進行背誦。

科特拉說:“我認(rèn)為這是處于兩者之間的一種狀態(tài)。人們對此感到困惑,因為他們想要將其歸入某一類別,要么說是單純的記憶,要么說是真正意義上的深入推理。但實際上,推理的深度是有一定范圍的。”

結(jié)語:鋸齒狀智能

研究人員用“鋸齒狀智能”這一術(shù)語能描述今天的AI,就是說它既能出色解決一些數(shù)學(xué)問題,碰到簡單問題時又會變得愚蠢。

人類總是喜歡將AI的智能與人類智能類比,或者我們應(yīng)該換個角度看待,將人工智能視為“與眾不同”的智能,不要糾結(jié)于“比人類更聰明”或者“比人類更愚笨”。

人工智能正在進化,某一天也許變得無比強大,能夠囊括人類所有的智能,甚至還有余力,這種變革值得期待。(小刀)

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
樊福太,被查

樊福太,被查

新京報政事兒
2025-04-25 19:32:02
法裔修女在禁區(qū)淚別教皇:跨越禮儀的生死告別,56年情誼催人淚下

法裔修女在禁區(qū)淚別教皇:跨越禮儀的生死告別,56年情誼催人淚下

譯言
2025-04-26 16:48:55
已釋懷!王菲去看謝霆鋒演唱會,同天張柏芝戴千萬珠寶拍大片

已釋懷!王菲去看謝霆鋒演唱會,同天張柏芝戴千萬珠寶拍大片

明月聊史
2025-04-26 17:46:49
瑾汐認(rèn)親后續(xù)!親生父母產(chǎn)業(yè)曝光,二姐抵達機場,哥哥身份大反轉(zhuǎn)

瑾汐認(rèn)親后續(xù)!親生父母產(chǎn)業(yè)曝光,二姐抵達機場,哥哥身份大反轉(zhuǎn)

小米亞的故事
2025-04-26 16:36:47
“特朗普虛晃一招,中國沒上鉤”

“特朗普虛晃一招,中國沒上鉤”

觀察者網(wǎng)
2025-04-26 10:05:04
直擊教皇葬禮:威廉盡顯未來君主風(fēng)范,夏琳王妃、萊后優(yōu)雅搶鏡

直擊教皇葬禮:威廉盡顯未來君主風(fēng)范,夏琳王妃、萊后優(yōu)雅搶鏡

曉徙娛樂
2025-04-26 18:24:32
孫銘徽傷情動態(tài)更新!不打算核磁共振,只是有點腫,下場能打!

孫銘徽傷情動態(tài)更新!不打算核磁共振,只是有點腫,下場能打!

籃球資訊達人
2025-04-26 22:44:54
過安檢能讓多少人“身敗名裂”?網(wǎng)友分享太炸裂,一看一個不吱聲

過安檢能讓多少人“身敗名裂”?網(wǎng)友分享太炸裂,一看一個不吱聲

奇特短尾矮袋鼠
2024-06-26 20:24:41
OK鏡,賣不動了

OK鏡,賣不動了

健識局
2025-04-26 13:25:33
特朗普談印巴局勢,罕見局面出現(xiàn):中國不動,俄不動,美國就不動

特朗普談印巴局勢,罕見局面出現(xiàn):中國不動,俄不動,美國就不動

振華觀史
2025-04-26 20:32:48
逾20萬人參與!示威群眾嗆賴清德下臺,人潮碾壓綠營“419游行”

逾20萬人參與!示威群眾嗆賴清德下臺,人潮碾壓綠營“419游行”

海峽導(dǎo)報社
2025-04-26 16:38:06
廣廈大勝后瘋狂慶祝!楊鳴賽后疑似甩鍋 專家:遼籃連青島都不如

廣廈大勝后瘋狂慶祝!楊鳴賽后疑似甩鍋 專家:遼籃連青島都不如

籃球快餐車
2025-04-27 01:28:14
董明珠發(fā)現(xiàn)了海歸“行淫之具”

董明珠發(fā)現(xiàn)了海歸“行淫之具”

不正確
2025-04-26 23:02:51
90后攝影師鏡頭下的重慶再被外交部發(fā)言人全球推薦:外交部特別寵愛重慶風(fēng)光

90后攝影師鏡頭下的重慶再被外交部發(fā)言人全球推薦:外交部特別寵愛重慶風(fēng)光

上游新聞
2025-04-26 21:25:21
反轉(zhuǎn)大瓜?劉國梁或升任總局副局長,分管乒乓球和籃球?

反轉(zhuǎn)大瓜?劉國梁或升任總局副局長,分管乒乓球和籃球?

體育有點水
2025-04-26 12:16:59
閑魚變“黃魚”,表面賣女生自用自行車,實則做著見不得人的交易

閑魚變“黃魚”,表面賣女生自用自行車,實則做著見不得人的交易

西齋青簡
2024-05-07 11:55:02
隨著湖人1-2落后森林狼,快船2-1掘金,雷霆3-0,西部4強基本出爐

隨著湖人1-2落后森林狼,快船2-1掘金,雷霆3-0,西部4強基本出爐

球場沒跑道
2025-04-26 12:58:14
歐美高科技為啥不賣給中國?荷蘭:我70萬的平衡車,他們600拿下

歐美高科技為啥不賣給中國?荷蘭:我70萬的平衡車,他們600拿下

看世界的人
2025-04-26 11:21:26
周末大雷,萬億市值中字頭利潤暴降81%,12個中字頭股票集體暴雷

周末大雷,萬億市值中字頭利潤暴降81%,12個中字頭股票集體暴雷

鵬哥投研
2025-04-26 16:38:42
深夜打虎,侯有龍被查!

深夜打虎,侯有龍被查!

魯中晨報
2025-04-26 09:36:03
2025-04-27 05:32:49
極客網(wǎng) incentive-icons
極客網(wǎng)
科技使能新商業(yè)
2449文章數(shù) 2554關(guān)注度
往期回顧 全部

科技要聞

百度心響實測:“能用版Manus”開了個好頭

頭條要聞

特朗普將舉行集會慶祝執(zhí)政100天 美媒:時機不妙

頭條要聞

特朗普將舉行集會慶祝執(zhí)政100天 美媒:時機不妙

體育要聞

廣廈19分勝遼寧獲開門紅 孫銘徽13分3助崴腳

娛樂要聞

金掃帚獎出爐,包貝爾意外獲“影帝”

財經(jīng)要聞

韓國的"宇樹科技" 是怎樣被財閥毀掉的?

汽車要聞

充電5分鐘續(xù)航100公里 探訪華為兆瓦超充站

態(tài)度原創(chuàng)

數(shù)碼
時尚
親子
房產(chǎn)
公開課

數(shù)碼要聞

AMD修補高危安全漏洞!歷代Zen架構(gòu)CPU 100%中招

她美得好邪乎,讓人又怕又愛

親子要聞

這首歌是為有兒子的家庭量身打造的吧? 楊雪呀

房產(chǎn)要聞

教育理念再進階!解碼新世界星輝如何構(gòu)筑「家校社成長生態(tài)圈」!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版 主站蜘蛛池模板: 和顺县| 石渠县| 连城县| 庆元县| 漳平市| 延庆县| 长宁县| 北流市| 北海市| 巧家县| 蒙阴县| 北流市| 九江市| 桃源县| 额济纳旗| 吉林市| 安阳市| 岑溪市| 昆山市| 衡水市| 阜新| 定南县| 政和县| 巩留县| 泗洪县| 乐都县| 云和县| 女性| 赞皇县| 明星| 长治县| 舟曲县| 平塘县| 台山市| 台湾省| 甘泉县| 民丰县| 黑河市| 奈曼旗| 高陵县| 吉安市|