很多朋友不知道的是,數字人以及相關的虛擬主播、虛擬主持等概念由來已久。幾十年來,我們都在暢想能不能讓數字人帶來普惠的社會經濟價值。
早在20世紀90年代CG技術開始成熟,就有人設想過讓數字人融入產業(yè);2007年初音未來的走紅,又將市場對數字人的期待拉高;時間來到最近幾年,AIGC給數字人帶來了新的想象空間,恰好遇上直播電商熱潮,大家認為數字人終于找到了用武之地。
但現(xiàn)實總是很骨感,數字人在直播電商產業(yè)中扮演的角色,更多還是停留在“嘗鮮”階段,距離大規(guī)模的產業(yè)化應用還有距離。那么,能夠撬動商家全面接納數字人的核心要素是什么?
3月28日,百度慧播星發(fā)布了“真人一鍵克隆”數字人直播功能,可以實現(xiàn)無需專業(yè)設備、無需真人值守、無需運營團隊、上傳視頻即可同步復刻聲音、形象、裝修,一鍵打造數字人直播間。
我們就以“真人一鍵克隆”為線索,一起來破解數字人融入直播電商的產業(yè)難題。
百度慧播星帶來的數字人變革,正在構成一個行業(yè)奇點。奇點之后,數字人全面進軍電商直播間的產業(yè)新階段,宣告正式到來。
事實上,一直以來直播電商行業(yè)對數字人都有著旺盛的需求。根據中研普華發(fā)布的《2025—2030年中國直播電商行業(yè)深度分析及發(fā)展前景預測報告》顯示,2025年全國直播電商交易規(guī)模將突破4萬億元,保持25%左右的年復合增長率。但在旺盛的市場活動之下,是電商主播人才不足、工作過于飽和、同質化嚴重等一系列問題。大電商主播不夠用,中小型電商無力開直播。
以AIGC模式驅動的數字人,在理論上可以顯著解決這個問題。但傳統(tǒng)意義上的AI數字人在很多方面并不成熟,比如應變能力較差,需要專業(yè)運營團隊和專人值守,反而增加了用人成本;互動效果與擬真能力不足,不僅無法滿足用戶需求,反而容易激發(fā)“恐怖谷效應”;數字人從生成到使用,都需要專業(yè)的技術能力與設備,給企業(yè)帶來了門檻等。除此之外,數字人解決方案高昂的價格更讓電商企業(yè)望而卻步。以我們曾經采訪過的一個案例為代表,某企業(yè)希望使用3D數字人進行直播,但相關報價普遍在幾萬元每分鐘,最終導致企業(yè)用戶望而卻步。
這些難題的存在,讓廣大直播電商在真人主播與數字人解決方案之間左右為難。而想要破除這個難題,讓數字人真正能夠融入業(yè)務一線,核心就在于兩個詞:實用、低成本。?
3月28日,百度慧播星數字人上線了域內免費的“真人一鍵克隆”功能。這對直播電商為代表的用戶來說,真正做到了實用性與低成本的融合。
首先來看低成本?!罢嫒艘绘I克隆”只需要上傳最低3分鐘的真人直播回放或真人錄制的短視頻,無需專業(yè)錄制,就可以通過慧播星生成專屬的數字人直播。用戶可以通過此前的直播回放視頻來同步復刻聲音、形象、裝修;而不像其他數字人平臺需要分別復刻這些要素,并且不支持大幅度動作。如此一來,用戶的應用成本就被降到了最低。
除此之外,真人一鍵克隆還能在百度域內免費使用,實現(xiàn)真正無資金門檻的0成本啟動。而在使用方法上,用戶只需要登錄慧播星官網,選擇數字人>真人一鍵克隆>立即制作就可以進行體驗,做到了“零門檻”使用。
從實際應用中可以看到,“真人一鍵克隆”可以用非常簡單的方式生成數字人,完全顛覆了傳統(tǒng)數字人解決方案需要操作多個步驟的專業(yè)門檻。而在低成本之外,可以看到“真人一鍵克隆”的實用性。
數字人進行電商直播,最佳狀態(tài)就是能夠復刻真人直播間。而百度慧播星的“真人一鍵克隆”擁有業(yè)界領先的唇動生成技術,能夠實現(xiàn)精準的口型匹配。同時還支持360°大角度側轉、手持商品細節(jié)展示、復雜動作呈現(xiàn)等能力,從而去除了傳統(tǒng)數字人呆板、生硬、動作與聲音不同步等問題,讓數字人的實用性極大增強。
“真人一鍵克隆”的另一重實用性,來自其可以進行矩陣規(guī)?;膫鞑ィ?strong>只需要一個主播素材,就可以生成N個差異化腳本,進而裂變出N個數字人直播間,滿足商家多樣性、多渠道覆蓋的電商直播需求。
完美復刻、低成本應用、高效率傳播,這三點讓“真人一鍵克隆”極致演繹了數字人的降本增效,讓數字人大規(guī)模融入直播電商產業(yè)成為可能。
而在這場“克隆之戰(zhàn)”背后,是數字人領域正在發(fā)生整體迭代。一個全新的數字人時代,正在悄然降臨。
一般意義上來說,我們可以將數字人發(fā)展分為三個階段:視效驅動,以初音未來為代表的數字人1.0時代;能夠進行AI互動,但成本較高,體驗較生硬的數字人2.0時代;以及今天正在到來的,以大模型驅動數字人發(fā)展的3.0時代。
數字人3.0時代的整體特征,是大模型技術全方位滲透到了數字人的形象生成、腳本定制以及互動體驗升級過程中,從而在各個維度剔除掉數字人的粗糙與簡陋感,成為產業(yè)級的創(chuàng)新應用。
百度慧播星正是“大模型數字人”的代表?!罢嫒艘绘I克隆”功能是其智能主播能力的一部分,非常代表性地展示了百度的大模型技術如何與數字人應用緊密結合。除了智能主播之外,百度慧播星還打造了一系列以智能化技術為底座的數字人創(chuàng)新,比如說:
智能腳本。基于文心大模型,慧播星可以實現(xiàn)個性化的全文生成、精準局部定制,從而讓商家可以快速獲得符合自身需求的數字人直播腳本,實現(xiàn)更好的直播效果。
智能展現(xiàn)。除了數字人自身外,百度慧播星還能提供直播間的豐富展現(xiàn)風格,從而實現(xiàn)對商品的多樣性展示,比如PPT模式的展示功能等等。這讓傳統(tǒng)意義上直播間需要花費大量成本進行搭建的展示能力也可以由AI來進行生成。
智能互動。數字人最需增強的就是互動能力。而百度慧播星可以讓數字人吃透商品信息,做到與用戶進行積極、友好、有深度的互動,最終促進下單轉化。
可以看到,百度慧播星實現(xiàn)了從數字人生成、直播間打造、腳本創(chuàng)作,再到互動效果提升等能力的全面創(chuàng)新。從各個維度上引入大模型能力,在不同環(huán)節(jié)上都實現(xiàn)了數字人的降本增效。
數字人“大模型時代”,就在這種全面升級中到來。
以“真人一鍵克隆”為代表的數字人創(chuàng)新,已經在實踐中給商家與個人創(chuàng)作者帶來了極大便利。回到我們在開頭討論過的問題,數字人正在跨越多重限制,真正走到直播電商這個舞臺的中央。
比如說,我們可以看到,通過百度慧播星的數字人方案,傳統(tǒng)有直播能力與習慣的商家,可以利用“真人一鍵克隆”能力,只需要用過往的直播回放就完成數字人生成,從而讓真人主播下播后的時間也得到充分利用,實現(xiàn)24小時的不間斷直播帶貨。
目前,“真人一鍵克隆”已吸引1000余家中小商家完成內測,涵蓋教育、酒水、生鮮、旅游等10多個細分領域。內測數據顯示,酒水商家醉美江湖通過該功能實現(xiàn)7×24小時無人直播,并進行多矩陣分發(fā),訂單增長10倍;教培機構子賢講學習則克隆名師分身進行批量答疑,直播間ROI提升超170%,轉化率提升50%以上,均停留時長達到了5分鐘;遵義供銷社銷售直接售出4.8萬余斤粉紅水晶蜜柚,幫助400+農戶增收。
另外,值得關注的是,該功能也將于今年4月中下旬在APP端開放,人人可用,在直播電商之外,普通消費者也可以打造自己專屬的數字人形象,滿足更多元化的直播需求,體驗新奇的賽博之旅。
在大模型能力與數字人應用的全面融合下,數字人終于完成了從能看的1.0、能互動的2.0,到低成本、高實用性的3.0時代的跨越。
整體來看,百度慧播星帶來的數字人變革,有著多方面的行業(yè)意義。首先從數字人領域本身來看,大模型+數字人的3.0跨越是眾望所歸,也是數字人走向大規(guī)模產業(yè)化應用的起點。而從更廣義的AI技術發(fā)展脈絡上來看,數字人是一種絕佳的AI應用形態(tài),百度慧播星已經形成了大模型的領先應用,可以通過應用形態(tài)變遷牽引AI技術發(fā)展,讓大模型未來升級有的放矢。而從產業(yè)需求層面來看,直播電商在刺激消費,構建國內市場大循環(huán)的政策下獲得了巨大的發(fā)展利好。而數字人的迭代與創(chuàng)新,恰好可以應對直播電商高速發(fā)展的需求,為直播電商帶來極大的生產力解放。
綜合了提振消費、自主創(chuàng)新的政策因素,直播電商快速發(fā)展的產業(yè)因素,以及應用形態(tài)牽引AI發(fā)展的技術因素,百度慧播星可謂占據天時地利人和。讓數字人大規(guī)模融入經濟活動,以數字人釋放新質生產力的產業(yè)變革契機已經到來。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.