長久以來,人類對自身的起源充滿了各種想象和好奇。中國有盤古開天辟地,女媧摶土造人;西方《圣經》中,有上帝七天創世,并在第六天創造了亞當與夏娃……
創世神話是人類關于起源思考的開始,而且這種對自身探索的渴望和向往,如同血液一樣流淌在體內。
直到科技日漸發達的今天,人類自己也成為了“造物主”。我們不僅從根源上正確認識了人類起源,而且還在嘗試用科技來創造出“人”。這個“人”就是數字人,它是通過各種技術結合形成,并生活在數字世界中的“人”。
數字人的概念起源于上世紀80年代,隨著CG技術、3D、AI技術等的不斷發展,如今數字人整體素質得到了極大提升。
伴隨著元宇宙概念的興起,數字人也被認為是其重要的入口。數字人的浪潮再次掀起,可以看到越來越多的公司參與進來,其中就包括數字栩生,這家成立于2021年的公司,雖然時間不長,但團隊在數字人領域已經深耕多年。
今天來看,數字人的競爭早已進入了白熱化。但數字人技術上難點在哪里,未來會如何改變我們的生活,以及數字人可能面臨的問題等。我們試圖從數字栩生找到對應的答案。
飛娛財經「公司觀察」第20 篇。
? 主筆/ WX
? 文章架構師/ 花哥
? 出品/ 飛娛財經
01
一家走在時代前的“弄潮兒”
虛擬數字人并無確定性定義,一般性來說,虛擬數字人指存在于非物理世界中,由計算機圖形學、圖形渲染、動作捕捉、深度學習、語音合成等計算機手段創造及使用,并具有多重人類特征包括外貌特征、人類表演能力、人類交互能力等的綜合產物。
當下在元宇宙、web3.0等加持下,企業與資本紛紛布局虛擬數字人領域。
據雷報不完全統計,2022年開年以來,“虛擬人”領域共計發生22起相關投融資事件,投資總額超百億元,而2021年全年為25起。另外天眼查顯示,我國現有“虛擬數字人”相關企業約30萬家,近5年新增注冊企業增速復合增長率近60%。
在眾多創業大軍之中,數字栩生則是其中之一。數字栩生成立于2021年,致力于提供優質的數字人創建服務,并針對行業提供配套的數字人應用解決方案。
作為一家技術為先的公司,團隊來自北理工、中科院自動化所、北京電影學院高精尖中心等科研機構。而在公司成立之前,團隊已經在探索高逼真數字人的采集與AI驅動近5年時間。
如今數字栩生掌握光場重建核心技術,采用三維引擎支持的實時化渲染技術,可實現超逼真的外貌表現,并可無縫的與現有智能系統連接,為用戶提供最優質的數字人創建服務,并針對行業提供配套的數字人應用解決方案。
行業內不僅有像BAT這樣的巨頭,也有實力不俗的創業團隊涌入數字人賽道。在強者如林的市場中,成立一年多的數字栩生,不僅在今年10月完成數千萬元天使輪融資,聯想創投領投,而且在眾多場景落地上實現突破。
引用聯想創投集團總裁賀志強一句話:數字栩生團隊除了在光學、圖形計算等基礎技術領域具備5年的豐厚技術積累外,還對商業化進行了前瞻性布局,以技術落地數字人場景為前提打磨產品,充分實現數字人經濟體系中“人、貨、場”多個要素的同步提升,這也使他們能更好賦能各行各業。
02
技術公司用技術說話
制作一個虛擬數字人,說它不難,是因為這項技術早在20世紀八十年代就已經出現了。
說它難,是因為人們對數字人要求越來越高,不僅要在外貌上像人,比如臉、眉毛、眼等;還要在行為像人,比如對話交互、思考等。
數字栩生CTO翁冬冬稱,在學術界和工業界,做數字人一般會使用微妙這個詞,因為一個微小的差別,都能被感覺到。這個詞也最準確地描述了做人的難度。
如今虛擬人的制作流程涵蓋了諸多技術,制作方式仍在逐步進化中,某些步驟互相融合的趨,不同玩家之間技術路線也不盡相同。
比如在數字人建模制作上,靜態掃描模型技術是目前的主流,具體細分為結構光掃描重建與相機陣列掃描重建等,其中相機陣列掃描應用最為廣泛。
與靜態掃描模型技術相對應則是動態光場重建技術。相比之下,光場重建技術不僅可以重建人物的幾何模型,還可一次性獲取動態的人物模型數據,并高品質重現不同視角下觀看人體的光影效果,具有高視覺保真度。
動態光場重建技術是目前重點發展的方向,但光場重建技術對技術、算力有著更高的要求,技術門檻也就高。在明知山有虎,偏向虎山行。數字栩生采取了光場重建技術,選擇了走最難的路。
在不斷技術投入和研發之后,數字栩生自主研發了人臉光照數據采集系統LightBall,該系統搭建了156組可編程LED燈源,對用戶多種表情進行采集,得到不同光照,不同視角,不同偏振狀態的圖像數據,構建個人完整的形象數據集。
升級的光場采集系統實現超寫實效果,不但包含了幾何的特征,也包含了皮膚高光、漫反射、粗糙度等紋理的細節。據了解目前該系統已迭代到第六代。
翁冬冬解釋,通俗的說,傳統方式更像畫家在畫畫,而我們采用的方式是造一臺照相機來快速拍照,同樣也可以得到漂亮的畫面。目前會更關注如何把流程更標準化、質量可控、時間可控。
目前數字栩生已經構建起三大核心技術:
一、超寫實面部。采用三維引擎支撐的實時化渲染技術,可實現超逼真的外貌表現,并可無縫的與現有智能系統相連接,通過自研光場重建結合智能解耦解決了數字人逼真程度低的行業問題;
二、制作效率高,動態豐富表情。通過四維采集結合自動解算,利用自研的高逼真面部綁定和驅動插件進行實時驅動進行快速內容生產,相比傳統手工制作方式,面部動態效果能夠明顯提高,同時也積累了大量的人物面部數據,為AIGC的數據積累打做好了數據準備。
三、智能交互。探索AIGC技術場景,構建數字智人的基礎云平臺Genesis OS,數字栩生提出了“數字小腦”概念,用來在AI大腦和數字人表現之間搭起一座橋梁。結合AI合成、實時動作捕捉等技術,可以更加智能、實時地與我們進行語言、表情、動作的互動交流,真正實現了數字人的個性化定制和千人千面。
數字栩生形成了完整自主知識產權的數字人解決方案技術體系,沉淀了豐富的技術實力。通過核心數字光場重建技術,實現業內質量高、周期短的工業化超寫實數字人生產流水線,提供完整的數字人資產制作和數字人解決方案服務。
03
AI驅動,數字人“千人千面”
在行業里有個共識,所有和「做」人相關的行業,一定會遇到恐怖谷理論。
恐怖谷效應在 1970 年提出,指人們對機器人的正面情感隨著其類人程度增加而增高,但當達到一個較高的臨界點時,其殘存的非類人特征會變得十分顯眼,引起人們強烈的不適感。
數字人如何穿過恐怖谷理論?這就要求數字人不僅外貌、表情要像人,數字人的交互、動作也要像人,這就需要獲得智能的驅動。
據數字栩生介紹,當前的智能系統大多為第三方的AI大腦驅動,主要輸入輸出以文本和語音為主,但是數字人本身其實包含了非常多個通道,包括他的眼神表情、口型肢體動作等信息,在傳統的AI系統里面是沒有的。
具體來說,就是借助第三方的平臺實現對數字人功能的提升。但目前這些平臺對數字人的支持還比較初期,其對單模態的處理比較良好,針對數字人的多模態呈現還比較不足。
基于此,數字栩生引入“AI小腦”理念,提出大小腦分離的思路。為現有AI大腦平臺與數字人的驅動間搭建“橋梁”,全維度豐富數字人的信息靈敏度與范圍,解決數字人感情表達難題。
數字栩生CEO宋震表示:我們非常看好AI和數字人的結合,以AI技術賦能數字人的各個環節,用數字小腦去驅動數字人,讓數字人不再是千篇一律,而是千人千面,每個數字人都有自己的獨立個性和特征。
目前,數字栩生形成臉部光場信息處理、自動表情綁定、面部微結構捕捉等關鍵技術,奠定“超寫實+實時”數字人技術領域地位。
此外為了進一步完善產業生態,數字栩生還打造了快速服務生產管線,構建數字智人的基礎云平臺Genesis OS,成功完成數字人創作的標準化和自動化流程搭建,大大提升創作效率及減少對人工的依賴性。
04
技術需要場景落地
虛擬數字人并不是新事物,在早期虛擬數字人主要被應用在娛樂領域,而到如今文娛領域仍然是應用最為廣泛的。
除了初音未來、洛天依等早期虛擬數字人,如今更是涌現了諸如虛擬偶像女團A-SOUL、東方佳人花西子、時尚博主AYAY、美妝達人柳夜熙等。尤其是數字人“柳夜熙”,僅出道三天便收獲百萬粉絲。
近兩年,隨著理論與技術的革新,虛擬數字人層出且應用范圍不斷擴大。AI數字人希加加、數字航天員小諍、騰訊3D手語數智人“聆語”、氣象服務虛擬人“馮小殊”等紛紛“上崗”就業。
任何一項技術終歸要回到場景,才能創造價值,數字栩生也在不斷加快技術落地的應用。
比如數字栩生基于實體雕像掃描數據,構建高精度三維數字模型,以真實立裁為基礎構建高保真服飾,成功“復活”中國京劇藝術大師——梅蘭芳,進行跨越時空的對話,領悟戲曲的魅力。
數字手語主持人“千言”是數字栩生的另一個典型案例,千言可以實現電視轉播手語的自動生成,可以完成從漢語到手語、手語到漢語的雙向翻譯,實現聽障聾人群的信息無障礙交流。
如今千言現在已經簽了幾百家電視臺,做手語主播,還有一些教育場景,比如給聾啞人進行教學的時候使用。此外,還有政府的無障礙通道,如果聾啞人去辦事,千言可以擔任AI翻譯。
任何時候,閉門造車都是不可取的。如今數字栩生也在充實自己的合作伙伴。前數字栩生已與微軟、英偉達、虛幻引擎、騰訊、字節跳動、愛奇藝、芒果衛視等達成合作,創建專屬的數字人IP。
數字栩生一邊在拓展、夯實,服務更多客戶的同時,也在探索數字人在不同領域的可能性。
05
數字人不可掩蓋的問題
據量子位智庫發布的《虛擬數字人深度產業報告》預測,2030年,我國虛擬數字人整體市場規模將達到2700億。
數字人賺足了市場和資本的注意力,成為崛起的新風口。不過同樣也不能掩蓋數字人存在的問題以及面臨的挑戰。
首先是技術上的問題。數字人達到完全真人的形態,外表和靈魂一個都不能少。目前來說技術還處于發展的早期階段。當下數字人雖然在外表已經接近人,但真人的靈魂諸如情感、感知互動、表情管理等元素存在嚴重的缺失。數字人的內核,遠還沒有達到一個真人的狀態,甚至說接近真人的狀態。
諸如《頭號玩家》、《銀翼殺手2049》等電影,給數字人帶來很多期待。但事實上,不論是Meta、希壤等平臺,還是其他數字人,目前體驗來說還不夠完整,沉浸感有限,技術還需要進一步提升。
其次數字人同質化嚴重。從當下的數字人來看,一個賽道扎推大量的同類型數字人,很少有公司具備碾壓性的技術優勢,缺少差異化的體驗,大部分數字人在運營、內容上“換湯不換藥”。從整個市場來說,數字人的價值并沒有完全發揮出來,玩法多集中在直播帶貨、流量偶像等形式上。
最后是在成本上,制作數字人的成本事實上非常高。數字人從最初的設計到3D建模,再到AI技術的投入,每個環節的要求都非常高且需要重金砸入,尤其是超寫實數字人成本會更高。
以柳夜熙為例,背后公司創壹科技CEO梁子康透露:“2018、2019年,我們每一秒的視頻價格比1克黃金還貴,現在每一秒價格相當于2到3克的黃金制作水準和制作成本,其核心是建立壁壘。”背后涉及到的創作團隊人數超百人,數字人可謂是十足的吞金獸。
當然還有法律層面問題,比如在國內的知識產權中,數字人還沒有專屬的類別。它不是軟件,因為只是數據集,那么只能按照作品版權進行處理,相關的版權上會有一些爭議。
這些客觀問題的存在,仍需要包括數字栩生在內的行業從業者給出解題的答案。
? 「飛娛財經」用心出品
文娛產業觀察
01.
02.
03.
05.
06.
07.
08.
09.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
數字產業觀察
01.
02.
03.
04.
05.
06.
07.
08.
項目觀察
01.
明星公司觀察
01.
02.
04.
05.
06.
07.
08.
09.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
爆款IP觀察
01.
02.
「飛娛財經」——打造文娛及元宇宙產業最火的社群矩陣。目前已組建39個精準社群,匯聚15000+文娛行業創始人、投資人、文娛及元宇宙相關從業者,全部100%實名制。請加飛娛財經運營合伙人@淑華 微信,實名驗證后一起進群交流學習。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.