“創業要做非共識但正確的事。”張一鳴的這句話,曾影響了無數字節系創業者,其中也包括前字節AI大將王長虎。
作為字節跳動視頻生態崛起的關鍵人物之一,2017年王長虎加入當時還被稱作“今日頭條”的字節跳動,出任AI Lab總監,完整參與了抖音和TikTok兩大現象級產品從0到1的建設。
在2023年視頻生成賽道尚處“非共識”階段時,王長虎卻繞開彼時如火如荼的文生文大模型賽道,押注視覺大模型,并先做海外市場。
“當時支撐我們的信念就是,我們堅信我們做的事情是非共識的、但正確的事情。”這也正是王長虎在字節期間,經常聽張一鳴強調的觀點。
見證過抖音在移動互聯網時代的顛覆,王長虎堅信視頻生成賽道存在平臺級產品的機會。“UGC 到 AIGC,變的是U和AI,最主要的視覺難題不盡相同,但系統性地解決視覺問題所需要的核心技術能力卻一脈相承。”王長虎想做的是一款讓普通人也能輕松玩轉AI視頻創作的全民應用。
直到2024年初Sora橫空出世,大眾對視頻生成的熱情被點燃,也讓王長虎走到了聚光燈下。
Sora 發布后,一張梗圖流傳于社交媒體:Sora 是坐在寶座上的巨大神像,下面跪著一眾渺小的膜拜者,包括 Runway、Pika、SVD、PixVerse 等十多個視頻生成模型或產品。
由王長虎開發的PixVerse, 是 “膜拜者” 中唯一一個由中國公司開發的產品。
看到這張圖后,王長虎的心情很復雜,對于“跪”在了第一排,跟Runway、Pika、SVD等當時最好的視頻生成產品放到一起,王長虎是感到榮幸的,但更多的是遺憾,“如果我們過去一年有更多的投資和算力資源,有可能最先做出Sora的不是美國人,有可能是我們。”
近日,王長虎創辦的愛詩科技剛剛完成A5輪融資,累計融資金額超4億元,成為中國視頻大模型領域融資規模最大的創業公司。
但隨著老東家字節也開始殺入視頻生成賽道,當愛詩科技押注的非共識成為大廠新共識之后,王長虎的新挑戰也隨之展開。
01
Sora橫空出世的第二天,王長虎一大早就被微信吵醒了,投資人、朋友、家人、同事紛紛問他“如何看待Sora?”還有人問他,超越、追趕Sora的最佳窗口期是多長時間?
王長虎的答案是一年前的2023年,“是在視頻生成行業很冷的那一年”。也正是在那一年,在幾乎所有人都不看好視頻生成賽道的情況下,王長虎創辦了愛詩科技。
甚至,在還沒拿到天使投資的時候,王長虎就收到了投資人朱嘯虎的勸退:“你還是回去上班吧,大模型在中國沒有機會”。
但作為一名技術理想主義者,親歷深度學習與計算機視覺兩次技術浪潮,王長虎認為生成式AI是“10年一遇的機會”,不愿錯過時代變革。
20年前,王長虎做的第一個研究,就和AIGC有關。2004年,王長虎還是中國科學技術大學電子工程與信息科學系的一名大四學生,他做了人生首個研究,就是根據一張或多張人臉圖片,生成該人臉的3D模型。
同年,王長虎進入微軟亞洲研究院實習,并在中科大博士畢業后轉為正式員工。期間,王長虎的工作內容也有不少與AIGC相關,但13年后他還是離開微軟去了字節跳動。
“在微軟可以做世界上最頂尖前沿的科學研究,但科研項目應用到公司產品需要的周期特別長。”在王長虎記憶中,自己二零零幾年做的工作,若干年后才真正應用在必應搜索引擎,新技術很難在第一時間影響用戶。
不同于其他大廠在產品成熟后才建立AI部門,字節跳動一邊開發短視頻類產品,一邊組建AI Lab部門。也正因如此,2017年加入字節跳動后,王長虎完整參與了抖音和TikTok等短視頻類產品從0到1的建設和發展,并為集團各產品提供AI技術支撐和業務解決方案。
然而當抖音、TikTok等核心應用取得具有絕對優勢的市場地位、開始步入“流量如何商業化”的階段,AI Lab在字節的位置松動了。這一點從AI Lab負責人馬維英的匯報對象從張一鳴變為當時的抖音負責人張楠中就能窺見端倪,這意味著AI Lab不再是個集團級的前瞻性項目,變成了服務于抖音這一應用的技術團隊。
2021年,王長虎離開了字節跳動。離開的原因,用王長虎自己的話說是“發現自己進入了舒適區,想要挑戰新的事物。”
王長虎 圖源:愛詩科技官網
王長虎是一直有創業情結的,從字節離開后他不是沒想過直接創業,但當時生成式AI技術的進步還不足以對整個產業產生巨大影響。
直到Stable Diffusion、ChatGPT出來之后,王長虎意識到新的AI時代到來了。
見證過抖音在移動互聯網時代的顛覆,王長虎堅信視頻生成賽道存在平臺級產品的機會。
2023年 4 月,王長虎找到現在的合伙人、之前在光源資本TMT/AI方向負責人謝旭璋,并拿到超過五千萬的天使輪融資,隨即宣布成立了新公司“愛詩科技”。
同年6 月,數名核心人員就位,核心成員中大都是跟隨王長虎在字節跳動打過硬仗的。團隊成立第一天的時候,王長虎就將目標客戶群定位為每天玩抖音、TikTok的用戶,“我們的基因是伴隨抖音、TikTok成長起來的,肯定主要還是to C 。”
02
直到2024 年初,一款名為 PixVerse 的 AI 視頻生成產品在海外突然爆火,首月訪問量便突破120萬,這一數字超過了硅谷同期明星初創產品Pika上線三個月后的200萬月訪問量。
這是王長虎創業半年交出的答卷,但與此同時,一場視頻生成領域的巨變正在醞釀之中。
一個月后,Sora震撼發布,雖然只是預覽版本,但還是憑借60秒一鏡到底的高清生成能力和三維空間動態連貫性,迅速引爆科技圈,不少業內人士將Sora視為AI視頻界的ChatGPT時刻。
AI視頻生成的戰場,因為Sora的到來,開始真正熱了起來。
提前搶跑的王長虎也因此受到關注。“Sora的出現恰恰驗證了我們一開始制訂的技術路線是正確的。”在王長虎看來,Sora的技術發展相當于在GPT-2和GPT-3之間,還沒到GPT-4的水平,留給市場的空間很大。“我們有信心在3-6個月之內就可以追趕上Sora目前的水平。”
不只王長虎,面對彼時尚處于“期貨”的Sora,國外Runway、Luma AI等一批初創企業均推出了最新的視頻生成模型,阿里、騰訊等國內巨頭也紛紛發布基于各自優勢的視頻生成模型,不少大模型企業都將研發“國產Sora”擺在了優先戰略級。
王長虎的老東家字節跳動也殺了進來。 事實上,Sora發布前,抖音前CEO張楠剛剛轉崗剪映,正準備在AI視頻生成領域大干一番。Sora的出現,加快了字節AI生成視頻產品的研發速度,當月,剪映推出名為Dreamina的AI繪畫工具。3個月后,剪映Dreamina正式更名為“即夢”,上線AI作圖和AI視頻生成功能,生成時長為3-12秒。
立足海外的王長虎,和老東家的首次交鋒發生在國外市場。PixVerse發布半年后,字節旗下的 AI 視頻生成產品 Dreamina(國內版名為“即夢”)登上了 CapCut (海外版“剪映”)的主頁面。
如今,老東家親自下場,不僅在資源上對王長虎形成碾壓,更在用戶觸達上構建起難以逾越的生態壁壘。
剪映海外版CapCut上線于2020年。隨著TikTok席卷全球,與之深度綁定的CapCut也搭上了順風車。根據移動數據監測公司SensorTower的數據,CapCut的MAU已超4億,占據全球移動視頻剪輯市場逾八成份額。
龐大的用戶基礎下,字節跳動從UGC邁向AIGC,似乎更加水到渠成。CapCut 可以輕松地將新的 AIGC 功能通過 TikTok 的各種推廣渠道觸達用戶,再通過TikTok發起特效全球挑戰賽,這種“AI工具-內容裂變-流量反哺”的飛輪效應,正是初創公司難以復制的生態優勢。
“抖音也是在巨頭圍堵過程中成長起來的。”在王長虎看來,小公司有小公司的優勢,比如決策流程很快,可以聚焦做一件事情。“在視頻生成這個方向,我們一方面是有先發優勢,一方面我們有信心持續走在最前面。”
然而現實遠比理想殘酷。截至目前,國內AI視頻生成賽道擠入近20家創業公司,但巨頭的生態絞殺從未停止,字節跳動通過CapCut免費開放部分基礎 AI 功能,阿里云視頻生成大模型萬相2.1已經開源……初創公司不僅要證明自己比巨頭更快,更要在用戶心智被占領前,找到巨頭“不愿彎腰撿硬幣”的垂直縫隙。
03
前有Sora需要追趕,后有巨頭來勢洶洶。王長虎也加快了產品迭代的速度。
從 2024 年初上線至今,PixVerse 模型的版本已經更新了 6 次,憑借“毒液”“機器人變身”等特效在社交媒體頻頻出圈。截至目前,PixVerse的全球用戶量已突破4000萬,單月月活躍用戶(MAU)達1500萬。
但百度董事長兼CEO李彥宏率先給視頻生成賽道潑了盆冷水。“Sora這種視頻生成的投入周期太長了,10年、20年都可能拿不到業務收益,那么無論多么火爆,百度都不去做”,2024年三季度總監會上,李彥宏明確表態道。
Sora成本究竟有多高?市場研究機構Factorial Funds給出過一份報告,Sora模型至少需要用掉4200~10500塊英偉達H100,想要大范圍應用,還需要再增添約72萬張英偉達H100,單論GPU投入費用,就需要超200億美元。
面對巨頭碾壓和有限的資源,王長虎也在不斷降低訓練成本。在字節期間主導構建的視頻AI中臺的經驗,使其團隊掌握了從海量數據中篩選出一小部分高質量數據來訓練更優秀的模型的能力,“訓練成本僅為大廠的十分之一甚至更低”。
而經過一年的蓄力,去年12月,Sora正式版終于姍姍來遲,但效果卻不盡如人意,被不少用戶吐槽“不如一個中國的開源模型”,價格同樣槽點滿滿,Pro版要200美元一個月。
隨著Sora熱度降溫,資本對AI視頻生成領域的投資愈發謹慎。在AI這個快速迭代的領域,市場瞬息萬變,錢的流向也隨之發生變化。年初DeepSeek掀起一場算力革命,加速了推理大模型的研發,近日Manus的出圈則點燃了Agent生態。
與此同時,行業競爭加劇,AI視頻生成工具之間差異化越來越小,用戶增長乏力已成為不爭的事實。
王長虎的 PixVerse 也未能逃脫訪問量下滑的趨勢。根據 aig crank 數據,2025 年 2 月,PixVerse 訪問量出現下滑,環比下降 14%。另據SimilarWeb統計,位居全球前列的AI視頻生成企業Luma AI、Pika的月總訪問量都出現了環比下跌。
當行業陷入同質化競爭,王長虎也準備將戰場轉向國內,以開辟更大的潛在用戶。據悉,PixVerse國內版本已進入籌備階段,預計將于近期上線網頁端及APP產品。
“視頻生成技術離流量和商業化很近,國內市場的用戶基數與應用場景有更多發展和實踐的可能。” 在用戶付費意愿高的國外市場,王長虎付費訂閱的商業化得到了驗證。
但在國內,免費與開源的視頻生成工具已在市場中占據了一定的市場份額。老東家字節跳動旗下剪映已集成AI視頻生成功能;騰訊智影、百度AI創作平臺通過云服務生態持續蠶食企業級市場;而開源社區中,阿里ModelScope、清華VideoGPT等國產模型不斷迭代,正在消解技術壁壘。
更嚴峻的是,國內用戶對AI工具付費意愿僅為北美市場的三分之一,超60%的創作者首選免費基礎功能——這與PixVerse在海外賴以生存的訂閱制商業模式形成沖突。
當技術護城河遭遇生態碾壓,轉戰國內的王長虎需要證明的是:在算力與流量的雙重絞殺下,小而美的故事如何繼續講下去。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.