近日,外媒The Verge獲得一份由匿名人士提供的索尼內部視頻,曝光了PlayStation團隊正在開發《地平線:西之絕境》女主角埃洛伊的AI驅動版本。這段時長1分鐘的演示視頻中,玩家可通過語音指令與NPC展開實時對話,引發業界對AI技術顛覆傳統游戲交互模式的關注。
索尼互娛軟件工程總監Sharwin Raghoebardajal在視頻中親自解說,這位掌管PlayStation Studios前沿技術部門(涵蓋AI、計算機視覺等領域)的負責人展示了突破性成果:基于AI驅動的埃洛伊不僅能理解玩家語音提問,還能通過合成語音與動態面部表情即時回應。
技術展示:角色正在和玩家實時對話,能做出相應的嘴型和表情回應
值得注意的是,該原型系統已實現與《地平線:西之絕境》實際游戲場景的融合,不過索尼強調這僅是和Guerrilla Games合作開發的原型內部技術驗證演示。
AI驅動的NPC
技術架構顯示,索尼采用"語音識別-智能決策-語音合成-面部渲染"四步走方案:首先通過OpenAI的Whisper將玩家語音轉為文字,隨后調用GPT-4和Llama3雙引擎進行決策和生成對話內容,再經由自研情感語音系統(EVS)輸出擬真聲線,最終通過同樣是自研的Mockingbird技術將音頻實時轉化為角色面部動畫。
雖然這次演示是在PC上運行的,但是據透露,該技術已在PS5主機完成適配測試,額外的運行效能損耗"幾乎可忽略不計"。索尼首次在內部展示該技術是在一年前,隨后在11月的東京索尼技術交流展(STEF)上展示了更新版本。
索尼表示這個演示“只是探索可能性的冰山一角”,因為這項技術對于游戲的實際意義仍然在研究中。
例如,玩家在《地平線:西之絕境》中扮演的就是埃洛伊,那么與她對話的意義是什么?或許當玩家對著PS5喊出"埃洛伊,談談我們的使命"時,得到的不再是預設臺詞,而是由大語言模型生成的獨特回應。當NPC學會"思考",游戲開發者將如何規劃它們的“意識”。配音演員又該何去何從?
AI對游戲行業的影響
除了索尼,一些大廠也在AI領域有所投入。英偉達推出的ACE技術同樣支持玩家與NPC自由對話,其與Inworld AI合作的《Covert Protocol》曾在去年有過多次可玩演示;微軟也和Inworld AI聯手,打造Xbox生態的生成式AI角色系統,并自研Muse AI模型輔助開發者快速構建游戲場景,以便進行原型設計和構思。
英偉達ACE技術展示
隨著游戲行業裁員潮持續,AI技術的突飛猛進加劇從業者擔憂。2024年游戲開發者大會(GDC)的一項調查報告顯示,49%受訪者表示其工作場所正在使用生成式AI工具,31%受訪者表示其個人也正在使用相關技術。
恰逢此次索尼技術泄露也在GDC大會前夕,勢必將在GDC期間引發更多的相關技術討論。The Verge表示多次聯系索尼就泄露視頻發表評論,盡管索尼對此保持沉默,但版權代理已火速下架泄露視頻。
https://www.theverge.com/news/626695/sony-playstation-ai-characters-aloy-horizon-forbidden-west-prototype
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.