在當今數字化時代,創意產業正經歷著一場由生成式人工智能(AI)引發的變革。從文本、圖像到音頻、視頻,AI 正以前所未有的速度和規模生成各種內容,為創意工作者提供了全新的工具和思路。
然而,將這些技術無縫融入創意實踐并非易事,尤其是在游戲開發這一復雜且富有創意的領域
游戲開發不僅需要生成新穎的內容,更需要在保持游戲世界一致性多樣性和用戶修改持續性方面達到高度平衡。
近日,一篇發表在 Nature 上的研究論文 World and Human Action Models towards Gameplay Ideation 揭示了如何利用生成式 AI 模型推動游戲玩法創意的生成
論文鏈接:
https://www.nature.com/articles/s41586-025-08600-3
論文報道了一個由微軟研究院領導的研究團隊,開發的可協助電子游戲設計師迭代設計游戲的生成式 AI 模型——世界與人類行動模型(World and Human Action Model,WHAM),其生成的魯棒 3D 世界能遵循設計用于電子游戲的機制。
他們認為,考慮到由于WHAM 無需任何先前知識,僅通過玩游戲的訓練就能學會生成序列,這個工具或能輕松轉換用于生成來自其他電子游戲的關卡,為游戲開發行業帶來新的可能。
視頻|WHAM 生成的一致性、多樣性和持久性的實例以及WHAM演示器的功能。
AI 還可以做好游戲創意開發?
電子游戲在娛樂產業中占最大份額,全球有數十億人玩和購買電子游戲。然而,游戲開發是一個涉及多學科、多技能的復雜過程,從概念設計、角色建模到關卡設計、游戲機制編程,每一個環節都需要創意人員投入大量的時間和精力。傳統的游戲開發流程往往受限于人力和時間成本,難以快速迭代和生成多樣化的游戲內容。
生成式 AI 為解決這一問題提供了可能。通過訓練 AI 模型學習大量的游戲數據,理論上可以生成新的游戲玩法序列、關卡設計甚至角色行為,從而輔助創意人員更高效地進行游戲開發。
然而,現有的生成式 AI 模型在游戲開發領域的應用仍面臨諸多挑戰,如生成內容的一致性、多樣性以及對用戶修改的持續性支持不足等。
因此,在這項工作中,研究團隊旨在開發一種能夠更好地支持游戲開發創意實踐的生成式 AI 模型。
為了深入了解游戲開發創意人員的實際需求,研究團隊邀請了來自不同游戲工作室創意團隊的 27 名電子游戲設計師,開展了半結構化訪談,這些電子游戲設計師涵蓋了游戲開發的多個領域,包括工程、設計和藝術等。
在訪談過程中,研究團隊使用了一種名為“設計探針”的工具,通過模擬一個虛構但具體的游戲開發場景,激發參與者對生成式 AI 在游戲創意中的潛在應用的思考。
參與者們積極分享了他們對 AI 輔助游戲創意的看法和期望,認為當前用于打造電子游戲的 AI 方案缺乏生成許多不同創意(發散性思維)的能力,并強調在保持游戲世界一致性的同時,實現多樣化創意的重要性,以及通過設計過程來持續微調游戲各方面(迭代實踐)的重要性。
具體來說,參與者們認為,生成式 AI 應該能夠幫助他們在游戲開發過程中實現以下幾個目標:
提供多樣化的內容:AI 模型應該能夠生成多種不同的游戲玩法序列和關卡設計,以激發創意人員的靈感;
保持一致性:生成的內容應該與游戲的整體風格和機制保持一致,避免出現與游戲世界不協調的元素;
支持迭代實踐:創意人員希望能夠通過直接修改生成的內容來進行迭代,而不是僅僅依賴于文本提示;
持續性:用戶對生成內容的修改應該能夠持續地保留,而不是在后續生成過程中消失。
基于用戶需求調研的結果,研究團隊開發了 WHAM。
圖|WHAM 模型(來源:論文)
WHAM 模型使用了 3D 多玩家戰斗模擬器《嗜血邊緣》中大量的人類玩家玩法數據,包括游戲視覺畫面和控制器動作。采用 Transformer 架構作為其序列預測的骨干網絡,并使用 VQGAN 圖像編碼器將圖像編碼為離散的 token 序列,通過對真實人類游戲玩法數據的訓練,WHAM 能夠準確預測游戲環境的 3D 結構、控制器動作的效果以及游戲的時空結構。
為游戲開發提供一種全新工具
研究團隊發現,WHAM 能夠設計出符合《嗜血邊緣》預存在機制的復雜 3D 電子游戲序列,其關卡設計也具有明顯的多樣性,且創意人員可對輸出進行迭代調整。他們還開發了 WHAM 示范器,作為供用戶操作和自定義 WHAM 輸出的一個可視化界面。
為了評估 WHAM 的性能,他們還提出了一套針對生成式 AI 模型的評估方法,重點關注模型在一致性、多樣性和持續性這三個關鍵能力上的表現。
在一致性評估方面,他們使用 Fréchet Video Distance(FVD)指標來衡量生成的游戲玩法與真實游戲玩法在視覺和時空動態上的一致性。通過將 WHAM 生成的游戲畫面與真實玩家的游戲畫面進行對比,發現隨著模型規模的增大和計算資源的增加,FVD 分數逐漸降低,表明模型生成的內容與真實游戲數據的一致性不斷提高。
在多樣性評估方面,他們采用 Wasserstein 距離來衡量模型生成的動作分布與真實玩家動作分布之間的差異。結果表明,WHAM 能夠生成與真實玩家行為相似的動作序列,且在訓練過程中,Wasserstein 距離逐漸減小,說明模型在保持一致性的同時,能夠生成多樣化的游戲玩法。
圖|WHAM 模型的多樣性評估
在持續性評估方面,研究人員通過手動編輯游戲圖像,插入不同的游戲元素(如道具、角色和地圖元素),并讓 WHAM 在這些編輯后的圖像條件下生成新的游戲畫面,來評估模型對用戶修改的持續性支持。實驗結果顯示,當模型基于更多的編輯后的圖像進行生成時,插入的元素在生成畫面中持續存在的比例顯著提高,表明 WHAM 能夠較好地將用戶的修改融入到生成的游戲內容中。
總體而言,研究團隊通過深入的用戶需求調研和嚴謹的模型開發與評估,成功開發出了一種能夠支持游戲開發創意實踐的生成式 AI 模型。該模型在一致性、多樣性和持續性這三個關鍵能力上表現出色,能夠生成與真實游戲玩法高度一致且多樣化的游戲內容,并有效地支持用戶對生成內容的修改和迭代。
研究團隊指出,WHAM 的出現為游戲開發行業提供了一種全新的工具,能夠生成多樣化、一致性強的游戲內容,激發創意人員的靈感,有望在未來的游戲中創造出更加豐富、創新的游戲體驗。同時,該研究也為生成式 AI 在其他創意領域的應用提供了有益的借鑒和啟示,推動了 AI 技術與人類創意的深度融合。
雖然 WHAM 在游戲開發領域的應用已經取得了顯著的成果,但也存在著一些局限性和挑戰。例如,收集和處理大量真實人類游戲玩法數據是一項復雜且耗時的任務,需要投入大量的時間和資源;而且,訓練和優化生成式 AI 模型需要大量的計算資源和專業知識,對研究團隊的技術能力也提出了較高的要求。
不過,研究團隊也指出,隨著 AI 技術的不斷發展,WHAM 的模型架構和訓練方法也可以進一步改進,不僅能夠低成本高效率地以生成更加復雜、智能的游戲內容,還可以探索如何將 WHAM 與其他游戲開發工具和流程更好地集成,以提高整個游戲開發流程的效率和創意性。
我們有理由相信,在不久的將來,AI 將在游戲開發乃至整個創意產業中發揮更加重要的作用。
作者:木木
如需轉載或投稿,請直接在公眾號內留言
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.