不用喂數(shù)據(jù)，AI也能玩懂《逆轉(zhuǎn)裁判》了

2025-04-26 12:35:38　來源: 游研社

貴州舉報

分享至

這些年來，AI打游戲的出色表現(xiàn)已經(jīng)讓人見怪不怪了。

2018年《星際爭霸》舉辦了AI挑戰(zhàn)賽，參賽隊伍八仙過海、各顯神通；2019年，《王者榮耀》的絕悟在世界冠軍杯表演賽中打贏了五個現(xiàn)役職業(yè)選手；2022年，《暗區(qū)突圍》推出了號稱全球首個能用語音指揮的AI 隊友F.A.C.U.L.，直接拉滿了競技類游戲的最高配置。

不搶資源、配合指揮，而且會講冷笑話，簡直情緒價值拉滿

不過，這些AI玩家都屬于“單游戲智能體”，專門針對單一游戲訓練，且需要海量數(shù)據(jù)支持。

說人話就是，這些AI必須提前學習識別場景中的建筑、物體、裝飾、可交互物件，對局中的微操和戰(zhàn)術(shù)配合，也只能靠人工標記和強化訓練，投入游戲中使用還會耗費大量算力。

即便是谷歌2022年推出的多游戲智能體Transformer，能玩41款雅達利游戲，但也依賴于大量預先學習的數(shù)據(jù)。

說白了，它們都必須模仿人類，需要靠“看攻略”來維持智商。

但最近，加州大學圣地亞哥分校的Hao AI實驗室進行了一項特別的AI推理能力測試，他們選取了四個不同的AI模型，在沒有任預先前訓練的情況下，直接讓它們玩《逆轉(zhuǎn)裁判》——四位“參賽選手”分別是Gemini 2.5 Pro、Claude 3.7 Sonnet、Llama-4 Maverick以及OpenAI o1。

換句話說，整個過程需要AI自主理解游戲畫面、劇情與機制，并推動游戲進程——幾乎和第一次接觸這款游戲的新玩家沒什么區(qū)別。

而最終的結(jié)果也令人意外：Llama-4 Maverick在游戲一開始就早早出局，Gemini 2.5 Pro和Claude 3.7 Sonnet進入了第二章《逆轉(zhuǎn)姐妹》，而OpenAI o1則是一口氣打到了第二集結(jié)尾，雖然沒有完全通關，但表現(xiàn)令人稱道。

四個模型同臺競技最終成績

為什么選擇《逆轉(zhuǎn)裁判》來考驗AI？

根據(jù)Hao AI實驗室的解釋，主要目的有三個：一是為了考驗AI的長語境推理能力，《逆轉(zhuǎn)裁判》需要AI交叉引用先前的對話和證據(jù)，發(fā)現(xiàn)其中的矛盾；二是考驗視覺理解能力，觀察AI能否辨認出、反駁虛假陳述的圖像；三是考驗動態(tài)決策能力，何時施壓、出示證據(jù)或隱瞞，AI需要在有限的試錯次數(shù)內(nèi)做出正確的選擇。

而最終，AI也的確僅依靠自身的推理能力，就能夠表現(xiàn)出了接近人類的理解和處理問題能力。

AI能理解證詞中的漏洞，自主決定打開菜單、出示證物

在打游戲這件事上，AI顯然變得越來越聰明了。

五個月前，在《精靈寶可夢紅/綠》的測試中，Claude 3.0 Sonnet還沒法走出真新鎮(zhèn)，如今迭代過的Claude 3.7 Sonnet，已經(jīng)能在游戲中完成超過30000次互動，并自主擊敗三位道館館長。可以想見，OpenAI通關《逆轉(zhuǎn)裁判》大概也只是時間問題。

Claude 3.7 Sonnet玩《精靈寶可夢紅/綠》的數(shù)據(jù)

X軸為交互次數(shù)，y軸為進度成就，包括收集道具、抵達區(qū)域或擊敗BOSS

武能架槍丟手雷，文能拍桌喊異議，隨著AI特定游戲走向跨游戲泛用，或許在不久的未來，我們真能擁有一個全能的AI隊友，既能在FPS里“指哪打哪”，又能一起在RPG里推理解謎，不拖后腿、不吵架、不掉線，最重要的是——永遠不會放你鴿子。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.