圖源:使用Dreamina生成
文生視頻大模型Sora已經發布一個多月,其所帶來的震撼依然在業內延續。這是繼ChatGPT后,OpenAI再次向行業投入一枚深水炸彈。
據介紹,Sora可以根據簡單提示生成最長一分鐘,多種風格、不同畫幅、多視角的高清圖片。在廣為流傳的一則Sora生成的視頻中,一個穿著時尚的女子走在東京街頭,背景中繁華街景、女人墨鏡反射的細節、皮膚的瑕疵都清晰可見,該視頻包含中景、近景、遠景等多個鏡頭,展示的效果相比其他的文生視頻模型如Runway、Pika等有了顯著提升。
圖源:OpenAI官網截圖
“Sora這類視頻生成模型是世界的模擬器。”OpenAI在報告中說道,這種模擬能力使 Sora 能夠生成更加接近真實世界運行的視頻內容。
這枚炸彈的威力仍在緩慢釋放,百模大戰仍在繼續。數月前,艾倫人工智能研究所發布新一代大模型,Unified-IO 2。數日前,被稱為“OpenAI 最強競爭對手之一”的Anthropic發布了最新人工智能Claude 3系列模型(包括了 Opus、Sonnet、Haiku 三款產品),其中功能最強大的Opus智能程度堪比人類。此外,業界也在翹首期盼GPT-5的到來。
這場無法忽視的技術革命,給技術領域和視頻領域帶來的沖擊也是無法忽視的,尤其是以抖音為代表的短視頻領域,Sora一旦投入使用必將對眼下短視頻的內容和商業模式產生一定的影響。
面對技術浪潮,抖音也沒有被動“躺平”。抖音正嘗試突破慣性的力量,10年元老員工張楠辭去抖音集團CEO一職,全力聚焦剪映,這也讓原本一直“默默無聞”的剪映逐漸走進大眾視線;此外,字節跳動加大對AI的投入力度,成立新AI部門Flow,抽調多個業務部門人才加入,接連推出一系列AI產品。
字節跳動的危機感、國際視野和創新意識在Sora到來之際,全面顯現。
主筆/ 李言愷
文章架構師/ 楓葉
出品/ 飛娛財經
抖音的焦慮
盡管Sora并不完美,但沒有人能否認它的出現是AI領域的一次新的革命。首先,它生成視頻時長最長可達60秒,遠超市面上主流的如Runway、Pika、SVD等AI視頻生成工具。
其次,Sora生成的視頻畫面復雜度和精細度令人震撼。飄落的櫻花落在行人的肩頭,形成了細碎的櫻花雪。小船在波濤中打轉,卷起的浪隨漩渦運動,蕩出泡沫樣的浪花……這都表明,Sora不僅對提示詞有著精準的理解力,同時邏輯上靠近現實的物理世界。
圖源:OpenAI官網截圖
對于內容和商業生態高度依賴短視頻的抖音而言,Sora的出現就像異星文明登陸,難免心生恐慌。“公司層面的半年度技術回顧,直到2023年才開始討論GPT,而業內做得比較好的大模型創業公司都是在2018年至2021年創立的。”字節跳動舉行2024年年度全員會時,CEO梁汝波表達了對新技術的焦慮。
梁汝波的焦慮并非沒有原因。一方面,對于抖音和TikTok而言,1分鐘以內視頻占內容池大多數。一個可供參考的數據是,目前抖音上短劇的單集時長就是1分鐘上下,介乎內容推進和用戶耐性閾值之間。作為內容平臺,抖音和TikTok很難被替代,但其內容生態勢必將被Sora和其他文生視頻產品輸出的內容震蕩。
更重要的影響在創作端,Sora對傳統的剪輯產品將形成降維打擊,Sora本質上降低了視頻的創作門檻,用戶可以通過其生產大量內容,這種基于語言交互界面和對話結果產生方式將改變以往專業操作所需的流程,并且生成的視頻充滿細節。而Sora開源后,用戶貢獻的素材內容能豐富數據資源增加訓練樣本,Sora表現將更加驚 艷。
這意味著未來內容和剪輯可能合二為一,AI將重塑內容產品形態與功能,單一性功能工具產品的市場空間會受到影響,也就是說,抖音目前面臨的競爭對手不僅僅是騰訊和阿里,還包括Sora。
事實上,在Sora出現之前,抖音已經著手AI領域的“再次創業”。梁汝波在全員會的講話上多次提到危機感,他特別提到公司喪失對機會的敏感度。
張楠與剪映率先沖鋒
實際上,讓剪映再次受到關注的是今年年初的一則消息,張楠辭去抖音CEO,把精力聚焦在剪映的發展上,親自帶隊尋求在AI輔助創作上有所突破。
剪映于2019年上線,2021年剪映專業版 Windows正式上線,自此剪映實現全終端覆蓋。公開信息顯示,上線三年里剪映相關產品高速發展,截至2021年,剪映的月活用戶已經突破1億,是國內最大的移動視頻編輯產品。
剪映最開始被視為一個依附于抖音的工具App,除視頻剪輯、編輯等基本功能之外,剪映還通過提供剪輯模板,豐富的素材庫以及視頻創作課堂,來降低視頻創作成本并向新手提供專業教學,實現邊學邊剪,同時還能激發用戶創意。隨著剪映功能逐漸強大,其已經成為視頻剪輯最常用的工具之一。
創業者出身、從0到1推出了抖音的字節跳動十年元老張楠確實是上佳人選。在她的帶領下,抖音成為一款國民級的短視頻產品,深度改造了國內的娛樂內容生態。此外,她也明確表達出“重新創業”的意愿,在內部信中展現出將突破AI視為使命的態度,在她看來,AI不是要艱難攻克的某項技術,而是必須要抓住的風口,不可錯過的機遇。
張楠在內部信中提到,AI圖像生成對她產生了“很大的觸動”,她認為這項技術將給內容創作工具行業帶來巨大的變化和可能性,改變創作者橫跨多個產品、經過復雜的編輯才能完成表達的現狀。同時,她在個人朋友圈中也表示,2024年是她加入公司的第十年,希望在下一個十年再折騰一些熱愛的事情,跟著這個AI時代一起成長。
如果說,張楠是最佳人選,剪映就是抖音突圍Sora的最佳產品抓手。
目前,國內短視頻行業觸達天花板,中國互聯網絡信息中心2023年3月發布的第51次《中國互聯網絡發展狀況統計報告》顯示,中國網民規模達10.67億,短視頻用戶規模達10.12億,滲透率高達94.8%。
正如抖音、快手曾經沖擊增長見頂的愛優騰,引發一場用戶時間爭奪的大戰那樣,文生圖、文生視頻、甚至AGI,將是未來互聯網內容平臺、科技公司未來的競爭籌碼,將重塑下一輪平臺競爭的格局。
AI在視頻創作與在線視頻廣告中都起到了重要的推動作用,而這兩個領域都是抖音的護城河,因此抖音選擇從剪映入手加強在AI領域的布局也被認為是理所當然的一個選擇,同時,這也可能是抖音在信息平臺和電商業務之外尋找新的增長點的一個嘗試。
目前,剪映已經擁有了相當體量的用戶,剪映一側綁定創作者生態,另一側綁與內容生產、視頻平臺深度鏈接,實現了工具-內容-產品的閉環。
實際上,張楠在卸任抖音CEO前一年已經將精力傾斜到剪映上,從成果來看,過去一年剪映推出了一鍵成片、AI克隆音色、數字人口播等AI功能,為創作者提供智能寫文案、智能匹配素材和配音,大大提高制作效率、降低成本。
剪映新功能
此外,去年AI圖片創作和繪畫工具“Dreamina”開始內測,它能根據用戶文字提示,快速生成四幅由AI創造的圖片,這些圖片展現出不同的風格,支持修整圖片大小比例和模板類型。最近這一產品又開始邀請AI視頻創作者內測文生視頻,Dreamina AI 視頻功能有望后續上線。
圖源:Dreamina官網
剪映是否會被取代
就在張楠上任剪映一周后,OpenAI正式推出Sora,有聲音認為,剪映將成為中國 AI 應用最先爆發的產品。
盡管Sora有著無可匹敵的技術條件,但是Sora無法取代抖音和剪映。一方面,Sora仍然存在明顯的缺陷,翻看OpenAI發布的一系列視頻,可以發現Sora在理解物理運動規律上仍有缺陷,這個問題具體表現為東京街頭時尚女人錯誤的腳步交錯、人物靠近燃燒的蠟燭火苗卻紋絲不動等。
另一方面,抖音上線近10年,構建了龐大的創作者生態和內容生態,背后基于生活的經驗與敘事,很難被輕易取代。一個可供參考的態度是,好萊塢影視創作者認為,Sora影響的將是視覺特效和動畫行業,它目前更像一個科技公司的產品演示,而不是一個可以敘事的作品。
更從底層的邏輯而言,剪映與Sora并不是一類產品,使用場景不同。前者基于圖片和視頻編輯,用戶使用需要一定的時間和精力成本。后者大大降低不同內容形式間轉化的門檻,不少專業人士認為Sora的應用層面超越工具,將很快走入更專業的影視創作、視覺特效等創作行業。
對于Sora是否會取代剪映的問題,DCCI互聯網研究院院長劉興亮在參與《Sora出圈,普通人如何挖到“第一桶金”?》的討論時也給出了否定答案,他指出,剪映和Sora是兩個不同的工具,在視頻制作過程中有各自的應用場景。雖然可以使用Sora生成視頻素材,并結合其他工具進行整合編輯,但這并不能替代專業操作所需的剪映軟件。
盡管,Sora 并不能取代剪映,但是剪映也必須作出改變,如果剪映不能跟隨技術的趨勢作出改變,必將被其他競品所取代,剪映也看到了這一危機。
從剪映陸續推出的新功能來看,它未來更可能成為一款集成式的AIGC創作工具,降低不同形式內容的創作及轉化門檻,或將成為下一款超級APP。
重點布局AI賽道
梁汝波曾在發言中多次提及“危機感”,并將“加強危機感”列入年度目標,他表示,最大的危機感,是擔心字節作為一個組織,正在變得平庸,無法取得新的突破。
慣性是互聯網大廠的通病,在上一個十年,字節跳動憑借抖音打破BAT的內容生產慣性,電商、長視頻和信息流等產業都被深度重塑。而當下,BAT均已加入生成式AI的洪流,字節跳動卻落后一步。
2023年3月,百度率先發布文心一言,同年10月便迭代至4.0版,全面提升理解、生成、邏輯和記憶四大人工智能基礎能力,年底用戶規模突破1億。阿里的通義千問于同年4月面世,而相對保守的字節跳動和騰訊,都直到2023年下半年才分別發布云雀大模型和混元助手。
圖源:使用文心一言生成
關于“危機感”,梁汝波給出了解題思路,字節跳動2024年的關鍵詞是“始終創業,逃逸平庸的重力”。
目前字節跳動正在加大對AI的研發投入。據悉,去年年底字節跳動成立了一個專注于 AI 創新業務的新部門 Flow,并且抽調了內部高層管理與業務骨干擔任該部門的相應負責人。Flow部門目前已經上線了豆包、Coze/扣子、AI角色互動APP“話爐”等AI產品,此外,由Flow部門打造的AI產品“PicPic”,也于日前在海外正式上線。
在移動互聯網,字節跳動以驚人的速度崛起成為行業里的后起之秀,在短短幾年的時間里,成為了讓阿里與騰訊都無法忽視的存在,在新時代,字節跳動采用了同樣的打法,字節跳動能否再打造出一個像抖音一樣的“爆款”,我們拭目以待。
? 「飛娛財經」用心出品
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.