這些年來,AI打游戲的出色表現(xiàn)已經(jīng)讓人見怪不怪了。
2018年《星際爭霸》舉辦了AI挑戰(zhàn)賽,參賽隊伍八仙過海、各顯神通;2019年,《王者榮耀》的絕悟在世界冠軍杯表演賽中打贏了五個現(xiàn)役職業(yè)選手;2022年,《暗區(qū)突圍》推出了號稱全球首個能用語音指揮的AI 隊友F.A.C.U.L.,直接拉滿了競技類游戲的最高配置。
不搶資源、配合指揮,而且會講冷笑話,簡直情緒價值拉滿
不過,這些AI玩家都屬于“單游戲智能體”,專門針對單一游戲訓練,且需要海量數(shù)據(jù)支持。
說人話就是,這些AI必須提前學習識別場景中的建筑、物體、裝飾、可交互物件,對局中的微操和戰(zhàn)術(shù)配合,也只能靠人工標記和強化訓練,投入游戲中使用還會耗費大量算力。
即便是谷歌2022年推出的多游戲智能體Transformer,能玩41款雅達利游戲,但也依賴于大量預先學習的數(shù)據(jù)。
說白了,它們都必須模仿人類,需要靠“看攻略”來維持智商。
但最近,加州大學圣地亞哥分校的Hao AI實驗室進行了一項特別的AI推理能力測試,他們選取了四個不同的AI模型,在沒有任預先前訓練的情況下,直接讓它們玩《逆轉(zhuǎn)裁判》——四位“參賽選手”分別是Gemini 2.5 Pro、Claude 3.7 Sonnet、Llama-4 Maverick以及OpenAI o1。
換句話說,整個過程需要AI自主理解游戲畫面、劇情與機制,并推動游戲進程——幾乎和第一次接觸這款游戲的新玩家沒什么區(qū)別。
而最終的結(jié)果也令人意外:Llama-4 Maverick在游戲一開始就早早出局,Gemini 2.5 Pro和Claude 3.7 Sonnet進入了第二章《逆轉(zhuǎn)姐妹》,而OpenAI o1則是一口氣打到了第二集結(jié)尾,雖然沒有完全通關,但表現(xiàn)令人稱道。
四個模型同臺競技最終成績
為什么選擇《逆轉(zhuǎn)裁判》來考驗AI?
根據(jù)Hao AI實驗室的解釋,主要目的有三個:一是為了考驗AI的長語境推理能力,《逆轉(zhuǎn)裁判》需要AI交叉引用先前的對話和證據(jù),發(fā)現(xiàn)其中的矛盾;二是考驗視覺理解能力,觀察AI能否辨認出、反駁虛假陳述的圖像;三是考驗動態(tài)決策能力,何時施壓、出示證據(jù)或隱瞞,AI需要在有限的試錯次數(shù)內(nèi)做出正確的選擇。
而最終,AI也的確僅依靠自身的推理能力,就能夠表現(xiàn)出了接近人類的理解和處理問題能力。
AI能理解證詞中的漏洞,自主決定打開菜單、出示證物
在打游戲這件事上,AI顯然變得越來越聰明了。
五個月前,在《精靈寶可夢 紅/綠》的測試中,Claude 3.0 Sonnet還沒法走出真新鎮(zhèn),如今迭代過的Claude 3.7 Sonnet,已經(jīng)能在游戲中完成超過30000次互動,并自主擊敗三位道館館長。可以想見,OpenAI通關《逆轉(zhuǎn)裁判》大概也只是時間問題。
Claude 3.7 Sonnet玩《精靈寶可夢 紅/綠》的數(shù)據(jù)
X軸為交互次數(shù),y軸為進度成就,包括收集道具、抵達區(qū)域或擊敗BOSS
武能架槍丟手雷,文能拍桌喊異議,隨著AI特定游戲走向跨游戲泛用,或許在不久的未來,我們真能擁有一個全能的AI隊友,既能在FPS里“指哪打哪”,又能一起在RPG里推理解謎,不拖后腿、不吵架、不掉線,最重要的是——永遠不會放你鴿子。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.