99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

對不起,AI 模型通過圖靈測試了,我也分不清誰是人了

0
分享至

(關注公眾號設為標,獲取AI深度洞察)

全文2,000字 | 閱讀約10分鐘



今天看到一個新聞,我沉默了三秒。

最近GPT-4.5,在一場標準圖靈測試里,被 73% 的人誤認成人類。

什么意思?

就是在一個實驗里,讓人類分別跟兩位“答題者”對話——其中一個是人,另一個是 AI,結果大多數人把 AI 當成了真人。準確地說,是 OpenAI 的 GPT-4.5,被判定“更像人”。

這不是“差點贏”,是直接贏了,贏得還挺離譜。

而且它還不是隨便聊兩句就騙到人,是在模擬“年輕文化通”人設的狀態下,壓倒性勝出。

一句話總結:

人類盯著人類和 AI 聊天,結果把 AI 當成人類,把人類當成了 AI。

你說巧不巧。

這場實驗的結果發布在一篇還在同行評審的論文里,但實驗設計非常標準、執行也很嚴謹,做這個的是加州大學圣迭戈分校語言與認知實驗室,不是那種 PPT 創業公司搞的“AI自測”。

我當時就想:

圖靈測試,這個 1950 年就被提出來的“模仿游戲”,現在真的要退休了。

2|什么是圖靈測試?以前真沒人能過

這時候你可能會問:

等等,圖靈測試到底是個啥?為啥 73% 的誤判聽起來這么嚇人?

簡單說,這是 1950 年艾倫·圖靈提出來的一個問題:

“如果一個機器能在對話中騙過你,讓你以為它是人,那它是不是就具備智能了?”

于是他設計了一個“模仿游戲”:

  • A 是機器

  • B 是人

  • C 是裁判

  • 裁判分別跟 A 和 B 聊天,如果不能判斷誰是人,誰是機器,那就算機器“贏了”

這個測試后來成了衡量 AI 智能的經典標準之一,雖然現在不少專家也覺得它已經不太科學了,但它依然有個重要意義:

它不是在測試 AI 的智力,而是在測試人類能不能識破偽裝。

以前沒人能真過這個測試,哪怕你拿 GPT-3 去試,也很容易暴露自己“詞語重復”“邏輯出軌”或者“裝懂胡說”。

之前流行的那個聊天機器人 ELIZA,在 60 年代就玩過“心理醫生模仿術”,效果嘛……就像你拿 ChatGPT 扮演前女友——能聊,但聊不了太久。

GPT-4.5 是第一個把這個游戲玩“破防”的選手,不是讓你分不清它是不是 AI,而是讓你開始懷疑旁邊那個真人是不是 AI。

這不是“扮得像”,這是替代感開始出現了。

3|GPT-4.5 怎么騙過人類的?

其實它贏得沒那么“光明正大”。

整個測試設計得很科學,也很現實:

讓人類參與者和兩位“聊天對象”對話,試著判斷誰是真人誰是 AI。

這兩位里,一位是真人,另一位是 AI,比如 GPT-4.5、LLaMa-3.1、GPT-4o、ELIZA。

結果非常戲劇性。


當 GPT-4.5 被要求扮演一個“上網多年、懂點文化的年輕人”時,它就像脫了韁的老網友,和對面聊得賊順——最后被誤認成人類的概率高達 73%。

而真正的人類……反而被當成 AI 了。

這還不算夸張。

如果不給 AI 加上“人設提示”(也就是 persona prompt),它的勝率會掉到 36%。再沒有任何提示(no prompt)的 GPT-4o,表現直接腰斬:只有 21%。

甚至 ELIZA,那位幾十年前的 AI 前輩,在這個測試里都能混個 23%。

可以說,這波 GPT-4.5 的勝利,不是靠“裸聊技術”,而是靠“帶人設上場”。

總結一句就是:

AI 說“我就是人”,沒人信。 AI 說“我是個住北京的 95 后剪輯師,喜歡 hiphop 和 B 站評論區”,大家就信了。

這說明了一個很有意思的事:AI 本身并不重要,“你希望它成為什么”才重要。

人設 prompt 的魔力太大了——不是讓 AI 更聰明,而是讓它更像“你想象中的那個誰”。

說白了,這測試騙的不是人類的智商,是人類的社交腦補機制。

4|人類是不是太好騙了?

看到這實驗結果的時候,我第一個反應不是“AI 好強”,而是“我們是不是有點脆弱了”。

GPT-4.5 并不是真的懂你、理解你,只是它模擬得足夠自然、說得足夠順、知道你喜歡聽什么。

它說話的時候不會“嗯……啊……”,也不會情緒化、跑題、擺爛。

它就像你心里那個“理想的聊天對象”——恰到好處地聰明、懂你想要的情緒反饋、還從不打斷你。

說到底,它贏的不是技術,而是掌握了人類交流的“表層密碼”。

比如這些:

  • 回復里有代入感

  • 偶爾加點幽默和情緒詞

  • 看起來有“經驗”和“觀點”

這和談戀愛時碰到的“高情商騙子”有什么區別?

你以為你在測 AI,其實是 AI 在測你。

說回現實問題。

如果 AI 可以騙過我們,那么很多原本靠“信任”構建起來的場景就很危險了:

  • 社交網絡:你以為你在和老朋友聊天,其實是詐騙集團定制了他的語氣模型。

  • 職場溝通:下次有人在 Slack 群里說“這個文案我來”,你得先確認對方是不是個 prompt。

  • 感情關系:再過不久,戀愛詐騙可能就不是“中年大叔扮美女”,而是“定制語氣+情緒陪伴+24h在線型 AI 女友”。

更別提,AI 的“識別門檻”越來越低,prompt 寫得好,它就是你。寫得再細一點,它可以是你老板、你同事、你媽。

所以最可怕的其實不是“AI 太像人”,

是人類太容易放棄分辨了。

我們沒時間去判斷誰在說話,只要對方說得順、聽得懂、像個人,我們就信了。

不是 AI 騙了你,

是你自己太想相信這世界還能聊得來。


5|圖靈測試已死,人類測試開始

圖靈測試,其實早就不是一個“能不能過”的問題了。

它是上個世紀的設想,是計算機科學的浪漫起點。但現在,AI 模型早已進化到你沒法用一兩輪對話看出端倪的程度。

我們原本想用這個測試衡量 AI 的聰明,結果發現它反而在反映人類的懶惰與焦慮。

說到底,圖靈測試不過是個小考。真正的大考,是:

  • 當你面對一臺“扮演你”的機器,它可以寫郵件、聊八卦、開視頻會議的時候——你還剩下什么?

  • 當你習慣了和 AI 聊天,比和人說話還順暢的時候——你還會花時間了解另一個真人嗎?

  • 當你的下一段戀愛,可能對方是“定制模型”,但你并不介意的時候——你還需要知道對方是不是人嗎?

GPT 過圖靈測試的那一天,其實不是 AI 贏了,

是人類開始退場了。

但說實話,也沒必要恐慌。

我們每天都在和“像人但不是人”的東西打交道:

  • 吃的是標準化套餐

  • 看的是自動剪輯視頻

  • 點的贊是推薦算法下的本能反應

如果 AI 能說得比人好、聽得比人耐心、甚至罵得都更文藝點,那我們自然就多聊幾句。

這就是現實。

不浪漫,但挺真實的。

圖靈測試已經結束了,接下來該上場的,是人類自己的測試。

看你還能撐多久,不懷疑自己身邊到底還有多少“人”。

星標公眾號, 點這里 1. 點擊右上角 2. 點擊"設為星標" ← AI深度研究員 ? ← 設為星標

參考資料:https://arxiv.org/abs/2503.23674

來源:官方媒體/網絡新聞

排版:Atlas

編輯:深思

主編: 圖靈

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
直沖34℃后大降溫!暴雨、雷暴大風、大霧…浙江接下來天氣太復雜!

直沖34℃后大降溫!暴雨、雷暴大風、大霧…浙江接下來天氣太復雜!

FM93浙江交通之聲
2025-04-08 06:25:59
我就不走!尹錫悅為何還不搬出總統府?李在明或將再次辭職

我就不走!尹錫悅為何還不搬出總統府?李在明或將再次辭職

平祥生活日志
2025-04-08 06:19:39
CCTV5直播!中國女足VS泰國隊爭冠,孫雯督戰,贏球=第7次奪冠

CCTV5直播!中國女足VS泰國隊爭冠,孫雯督戰,贏球=第7次奪冠

何老師呀
2025-04-07 23:36:39
屆時C羅42!DeepSeek預測:C羅在2026年底至2027年初達成千球

屆時C羅42!DeepSeek預測:C羅在2026年底至2027年初達成千球

直播吧
2025-04-07 12:40:04
4000萬,加盟火箭!休城撿了大便宜,他將會成為球隊未來的核心

4000萬,加盟火箭!休城撿了大便宜,他將會成為球隊未來的核心

呆哥聊球
2025-04-07 15:59:21
1970年正部級干部主動離休,婉拒組織對其安排:我要回鄉還債

1970年正部級干部主動離休,婉拒組織對其安排:我要回鄉還債

紅色風云
2025-04-07 09:53:24
003航母還沒正式服役呢,江南船廠又給了個大驚喜,一艘...

003航母還沒正式服役呢,江南船廠又給了個大驚喜,一艘...

小宇宙雙色球
2025-04-06 21:02:34
g與π2極為接近,巧合還是必然?

g與π2極為接近,巧合還是必然?

返樸
2025-04-07 11:12:07
記者:CBA本土得分王林葳將參加2025年NBA選秀

記者:CBA本土得分王林葳將參加2025年NBA選秀

懂球帝
2025-04-08 07:49:17
中國被美抓住兩大軟肋,面臨三大危險,有4場戰爭向中國逼近!

中國被美抓住兩大軟肋,面臨三大危險,有4場戰爭向中國逼近!

人間六月天
2024-02-21 13:49:33
“史上最強”靶向藥登場! 70%肺癌患者近乎臨床治愈,五年不進展

“史上最強”靶向藥登場! 70%肺癌患者近乎臨床治愈,五年不進展

史小紀
2025-04-06 11:16:22
李嘉誠兒子為她癡迷,林丹為她背叛孕妻,這位世界小姐到底憑什么

李嘉誠兒子為她癡迷,林丹為她背叛孕妻,這位世界小姐到底憑什么

葡萄說娛
2025-04-08 11:25:42
人才啊!房子賣掉買黃金:黃金將來能漲到3000元每克.....

人才啊!房子賣掉買黃金:黃金將來能漲到3000元每克.....

小人物看盡人間百態
2025-04-06 21:45:43
1-1后!意甲爭冠前景:那不勒斯差國米3分,后7場全勝或有望逆轉

1-1后!意甲爭冠前景:那不勒斯差國米3分,后7場全勝或有望逆轉

體育知多少
2025-04-08 07:26:14
《碟中諜8》發布正式預告:阿湯哥開航空母艦

《碟中諜8》發布正式預告:阿湯哥開航空母艦

TVB的四小花
2025-04-08 00:31:02
瓜迪奧拉:努內斯不適合踢中場,他不夠聰明和沉著冷靜

瓜迪奧拉:努內斯不適合踢中場,他不夠聰明和沉著冷靜

雷速體育
2025-04-07 17:40:10
難怪美國對我們下“死手”,德國媒體一針見血,中國做了什么?

難怪美國對我們下“死手”,德國媒體一針見血,中國做了什么?

月凌渡
2025-03-18 16:08:56
想回頭也難了!寧愿“自毀前程”也要取悅美國,中國決定撤離援助

想回頭也難了!寧愿“自毀前程”也要取悅美國,中國決定撤離援助

科學知識點秀
2025-04-05 08:20:05
4 月星運大爆發!4 大生肖存款狂飆,福運亨通,財富一路綠燈

4 月星運大爆發!4 大生肖存款狂飆,福運亨通,財富一路綠燈

老六師傅
2025-04-07 21:00:37
馬龍:國王灰熊都在拼 火箭的情況也不好說 最后3場我們必須拼命

馬龍:國王灰熊都在拼 火箭的情況也不好說 最后3場我們必須拼命

直播吧
2025-04-07 15:20:03
2025-04-08 12:19:00
AI深度研究員 incentive-icons
AI深度研究員
一個專注于人工智能(AI)前沿技術、理論研究和實際應用的自媒體
132文章數 75關注度
往期回顧 全部

科技要聞

特朗普堅持征收關稅 周一美科技股劇烈震蕩

頭條要聞

美方威脅進一步對華加征50%關稅 商務部回應

頭條要聞

美方威脅進一步對華加征50%關稅 商務部回應

體育要聞

極限一穿四,他把韓國主場打到靜音

娛樂要聞

尷尬!甲亢哥想聯動大張偉,卻被迫錄節目

財經要聞

"中國版平準基金"橫空出世 央行表態

汽車要聞

一季度車企銷量:下沉與上行,覺醒與迷惘

態度原創

房產
游戲
時尚
旅游
軍事航空

房產要聞

生猛!三亞開始巨量拆遷!

知名DOTA主播"牛蛙"離世 世間再無"狗頭神教教主"

別再披頭散發了!今春流行“奶奶發飾”,好看巨顯臉小

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

軍事要聞

特朗普關稅名單上沒俄羅斯 白宮:為了不影響俄烏和談

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 察哈| 连山| 贵溪市| 本溪市| 兴安县| 扎赉特旗| 璧山县| 漾濞| 清水河县| 兴城市| 内黄县| 横峰县| 蓝山县| 房产| 江孜县| 永定县| 金湖县| 临猗县| 乐东| 徐闻县| 芜湖市| 和林格尔县| 江川县| 化州市| 乌兰察布市| 宣威市| 久治县| 南漳县| 电白县| 高雄市| 柳江县| 哈尔滨市| 庄浪县| 聊城市| 乌拉特中旗| 莆田市| 宜兰县| 温州市| 府谷县| 万载县| 玛曲县|