出品 | 網易科技《態度》欄目
采訪 | 楊霞清
作者 | 李姝
編輯 | 丁廣勝
“What’s Next in AI Starts Here”,在硅谷圣何塞會議中心涌動的科技熱浪中,英偉達2025GTC大會(當地時間3月17日-3月21日)再次成為全球AI技術演進的“風向標”。
黃仁勛長達兩小時的主題演講里,“具身智能”與“AI Agent”成為貫穿始終的技術注腳,當機器人Blue作為壓軸角色精彩亮相時,會場爆發的掌聲昭示著AI技術從數字世界向物理世界突破的臨界點到來。
作為連續兩年入選英偉達初創企業展示的中國XR技術公司,網易科技對七維科技CEO殷元江進行了一次專訪。
以下是網易科技和殷元江的對話,在不改變原意的基礎上進行編輯整理。
生態共振,中國企業的創新解法
網易科技:作為連續兩年參加GTC的企業,今年感受到哪些技術演進的關鍵信號?
殷元江:2025英偉達 GTC大會以“AI的下一步從這里開始”為主題,彰顯了GTC作為AI時代開發者盛會的核心地位。今年的大會尤為顯著地體現了AI技術從基礎模型層面向各垂直領域的深入滲透。展臺上不僅展示了醫療、教育等行業專用的AI Agent,還推出了諸如AI產品經理等創新應用。這一“行業Agent化”的趨勢雖在去年已初見端倪,而今年則在功能的完整性和場景覆蓋度上實現了質的飛躍。
此外,值得注意的是,具身智能機器人已開始規模化落地,我們在GTC現場目睹了手術機器人、物流機器人等實體化應用的展示,這與軟件層面的Agent形成了虛實結合的技術格局。在黃仁勛演講的最后,還展示了機器人Blue,相較于去年壓軸亮相的人形機器人軍團,其能力在今年顯然有了顯著提升。這一切的背后,是CUDA計算架構與Isaac機器人平臺技術的強力支撐與共振。
網易科技:在今年的Startup Pitch環節中,七維作為唯一入選的中國XR技術企業,目前與英偉達有哪些具體的合作?
殷元江:英偉達以GPU為核心,構建了一個涵蓋API、SDK等在內的全棧式技術生態系統。我們的軟件產品在各個功能模塊上,廣泛運用了英偉達的多種技術能力。具體而言,在Omniverse的合作中,這種雙向合作頗具代表性:一方面,通過采用USD標準,我們整合了仿真級的3D資產管理能力;另一方面,我們將XR渲染技術與Omniverse的渲染引擎進行對接,并基于CUDA架構實現了計算力的優化。
此外,我們的數字人技術也融入了Audio2Face等先進技術。英偉達推出的Holoscan for Media實時AI平臺,也已被我們整合到產品中,以增強其實時處理能力。在影視媒體領域,特別是在傳輸環節,我們采用了英偉達Rivermax技術,它提供了超高帶寬、低延遲、GPU Direct以及零內存復制的優勢。在顯卡應用方面,我們大量使用了RTX A5000專業卡,這些顯卡不僅能夠高效進行三維渲染和視頻加速,還在一定程度上實現了AI功能的集成。
總體而言,我們的產品在軟件與硬件層面都與英偉達的技術實現了深度結合。每個軟件授權都捆綁了一到多張RTX顯卡的銷售,同時,每個銷售方案中也包含了一個Omniverse的授權,這種結合確保了我們的產品在性能上的卓越表現。
AI加持,起底七維科技的技術邏輯
網易科技:您談到“2.5D環境生成”目前僅需5步,能否展開講一講其技術邏輯與應用?
殷元江:實際上,2.5D生成是一種巧妙的做法,為什么這么說呢?在傳統虛擬場景構建過程中,效率常常成為瓶頸——手工建模需要數周時間,而3D掃描方案則成本高昂。我們的方法則另辟蹊徑:首先生成或拍攝一張2D圖片,隨后利用AI技術進行圖像擴展,提升其畫幅和分辨率,并估算深度信息。
盡管這種基于AI算法得出的深度信息無法與掃描或手工建模的精度相媲美,但在XR虛擬制作流程中,由于攝影機多在前方的30至45度之間移動,這種深度已經足以營造出空間感和體積感。通過這種方式,我們能夠將原本需要數周的建模時間壓縮至幾天甚至更短,極大地幫助內容生產者和創作者實現了降本增效。
XR的應用十分廣泛,例如,在北京電視臺和影視基地等機構中,XR被用于虛擬場景的合成渲染,使得直播和交互成為可能,而無需外景拍攝。在高校如傳媒大學,XR則作為一種教學工具,為不同專業的學生提供接觸新一代技術和實踐操作的機會。
網易科技:此次GTC上七維還展示了AI故事板生成產品ViStoryboard,可否具體結合客戶的案例來說明下這個產品的應用情況?
殷元江:AI故事板是我們AI Studio中極具創新性的一個模塊。AI Studio作為一個全面且強大的工具集合,以AI為驅動力,為我們帶來了前所未有的新功能。通過這一平臺,客戶能夠從最初的文本劇本處理開始,逐步進行分鏡故事板的精細制作,再到創意圖的生成以及視頻的制作。如果涉及虛擬拍攝,AI Studio可以進一步創建虛擬拍攝環境,隨后結合時間線編輯器,將所有步驟無縫串聯,提供全棧式的便捷服務。
故事板在影視、廣告、游戲等內容的創作過程中,起著至關重要的作用,它不僅是前期創意構思的核心工具,也為實際拍攝提供了寶貴的指導。AI故事板的生成工具ViStoryboard,通過用戶輸入的文字劇本,自動依據預設的風格和模板,生成一系列分鏡畫面。這些畫面清晰地展示了場景布局、角色動作、鏡頭運動等關鍵信息,極大地提升了制作效率。目前,這一先進的產品工具已經在光線傳媒、十月文化等知名客戶中得到了成功驗證,并取得了顯著成效。
網易科技:目前生成式AI賽道競爭激烈,七維科技的技術護城河是什么?與競品相比,差異化體現在哪些環節?
殷元江:七維雖非大模型廠商,但我們與眾多模型開發商建立了深厚的合作關系。在AI studio的產品陣容中,我們不僅整合了Deepseek、Stable Diffusion、SAM(Segment Anything Model)等多種先進模型,還致力于將其打造為最貼近用戶需求的內容創作工具。通過與影視工作室、媒體機構和高等院校的緊密合作,我們能夠獲取最前沿的市場需求反饋,從而不斷優化產品功能。我們的目標是與Adobe等業界領袖看齊,讓用戶在我們的產品下拉菜單中便能輕松調用任何所需的模型,始終堅持以產品和客戶需求為導向。
我每年參加GTC的主要原因有兩點。首先是與英偉達的研發負責人溝通,了解他們今年的開發路線圖,探討即將推出的新功能和變化,并確定其中哪些對我們有用。其次,是在英偉達的大會展廳中,與其他創業公司進行交流。
遠征計劃,XR技術的全球化滲透
網易科技:除影視和廣電領域,七維科技的技術未來還在哪些垂直場景中應用?海外拓展有哪些具體的計劃?
殷元江:我們在教育行業的各個院系和專業領域已廣泛應用,同時在文旅展覽陳列,特別是政府和企業展示方面也有眾多應用。我們自身的部分工具將全面實現Web化和輕服務化,旨在覆蓋更小的內容生產機構和個體創作者。我們的產品內核涵蓋廣泛,從媒體、娛樂到教育,再到政府企業的泛內容場景,直至面向更小型內容創作者的Indie Studio。
去年是我們的出海元年,目前我們正處于全球市場開拓階段。美國、加拿大、韓國已有部分客戶,日本市場也在初步推進中,接下來我們將進一步擴展滲透歐美,中東,東南亞等市場。我們在海外市場的投入是堅定且持續的。
網易科技:七維科技目前的商業模式是怎么樣的?包括軟件授權、硬件銷售及解決方案服務?未來是否會向內容聚合平臺轉型?目前的營收情況怎么樣?
殷元江:我們擁有核心的軟件授權,并提供軟硬一體的解決方案,此外還有一些租賃和服務收入。今年,我們的發展重點是拓展線下VR大空間和XR院線的票務收入模式。公司去年已成功參與多個具有標志性的項目,例如北京大學武漢人工智能研究院的“文明一萬年”項目。今年,我們將進一步與不同的科技館、博物館以及影視IP衍生的場景展開合作。目前,公司正處于盈利狀態。
未來三年,公司計劃在技術產品上實現輕量化、AI化和全球化,同時在業務方面加強國內垂直行業的布局,拓展海外市場和渠道建設。此外,我們還將探索To B和To C的業務模式,以輕量化產品面向“小B”和專業用戶,推動線下大空間和XR院線業務的發展。
網易科技:您認為生成式AI對XR虛擬拍攝和數字內容生產流程有怎樣的影響?是否可能取代傳統3D建模?版權溯源難的問題如何解決?
殷元江:AI會加持XR虛擬拍攝和制作的進度與周期。XR其實理解是把虛擬場景實時渲染和真人表演實時合成的和實時交互的一個流程,只要是涉及到這塊,那它始終會存在。未來會有更多的比例和環節來AI化。AI有望在生成簡單模型和道具方面取代傳統3D建模,從而加速精細化模型和場景的創建。
AI將在XR虛擬拍攝和制作過程中發揮重要作用,加速項目進度并縮短制作周期。XR技術,即通過實時渲染虛擬場景并與真人表演進行合成及互動,在未來的應用中將有更多環節實現AI化。AI在創建簡單模型和道具方面展現出巨大的潛力,有望取代傳統的3D建模,從而加速精細化模型和場景的構建。
然而,在處理定制化和復雜內容時,AI目前仍無法實現完全可控的流程,特別是在游戲和影視制作中,制作人和導演對內容的精細度和可控性有極高的要求。盡管如此,AI在2D轉3D、點云處理等環節的潛力不容忽視,它能夠幫助降低制作成本并提升效率。
面對生成式AI帶來的版權溯源挑戰,目前行業尚處于初期的混沌階段。然而,值得關注的是,Getty Images和Shutterstock等國外公司已在積極應對,他們在推出AI生成技術和服務時,強調其生成內容基于自有版權數據。我們不僅與這些公司展開合作,同時也在建設自己的資產庫,目前已擁有數千個完整的3D資產和10萬G的3D模型。盡管與Getty Images和Shutterstock相比,我們的資產量仍較小,但我們正在不斷積累和擴展。