“正版 Sora” 震撼發布
等了將近10個月,OpenAI終于給大家帶來了旗下視頻生成大模型Sora的消息。
就在今天(12月10日)凌晨,OpenAI再次震驚世界,以一場直播宣布了正式向用戶開放其人工智能視頻生成模型Sora。
圖源:直播截圖
Sora直播發布會的嘉賓由OpenAI CEO山姆·奧特曼(Sam Altman)、Sora團隊負責人比爾·皮布爾斯(Bill Peebles)和阿迪亞·拉梅什(Aditya Ramesh)三人組成,共進行了一場約20分鐘的直播。
在這場直播中,他們不僅詳細介紹了Sora的新功能,更是展示了AI技術在視頻創作上的無限可能。
據直播介紹,此次推出的 Sora 不同于 2 月份的演示版本,而是更高級的新版本Sora Turbo;
該版本稱較2月版本生成速度顯著加快,并且可以生成最長達20秒的視頻,還能提供這些視頻的多種變體。
據悉,新版Sora具有替換、刪除或新增元素、重新剪輯、擴展及合并視頻等功能。
具體操作中,OpenAI把他們分成了多個“按鈕”。
比如,Remix(重混)功能允許用戶替換、刪除或重構視頻中的元素,為視頻創作提供了更多的靈活性。
Re-cut(重新切割)功能則能夠讓用戶找到最佳的一幀視頻,并在此基礎上進行延展,創造出全新的視頻內容。
圖源:OpenAI直播
Loop(混合)功能則可以將兩個視頻進行無縫合并剪輯,創造出流暢的視頻過渡效果。
Storyboard(故事板剪輯)功能則允許用戶精準指定每個幀的輸入,為視頻創作提供了更高的精確度。
而Style presets(風格預設)功能則允許用戶預設視頻的風格,一鍵生成具有特定風格的視頻內容……
Sora一經發布,OpenAI的服務器瞬間就被“擠爆”,官方網站(Sora.com)甚至直接崩潰,停止一切注冊登錄。
而已經開始使用的網友也發現了在發布會直播結束后,Sora的視頻生成速度開始明顯變慢。
對此,Altman 急忙出面安撫用戶:“由于需求超出預期,我們將不得不間歇性地關閉新用戶注冊,并且生成內容的速度會在一段時間內減慢。我們正在全力以赴!”
圖源:X
回顧今年2月,OpenAI首次發布有關Sora的預告,聲稱Sora是一項理解和模擬現實的基礎性AI技術,是開發能夠與物理世界互動模型的重要一步。
然而,在早期測試中,Sora卻表現出了一些明顯的局限性。
例如,在物理模擬方面,模型對物體運動的理解還不夠深入,常常出現動作不協調、一些物體突然消失等問題。
此外,還有信息透露在某一次測試中,Sora存在“多余肢體”的問題,生成的生物不是多一只手指就是少一只眼睛。
另一方面,此次Sora的發布可以說只是OpenAI為期12天的產品直播活動的其中一個部分。
上周,OpenAI剛推出了更昂貴的ChatGPT Pro訂閱選項,可無限制訪問OpenAI最強大的AI模型。
至于Sora的收費方面,官方介紹顯示:即日起,Sora Turbo已向訂閱OpenAI Plus和Pro的會員開放全部功能,無需額外付費。
不過,不同的會員所擁有的使用額度則不太一致。
圖源:ChatGPT官網
據悉,官方頁面顯示,每月付費20美元的OpenAI Plus會員,單月共有50次視頻生成額度(1000積分),生成的視頻分辨率最高為720p,單條視頻時長為5秒;
而每月付費200美元的Pro會員,單月可慢速無限次生成視頻,加速生成視頻500次(10000積分),并且Pro會員可同時生成5條視頻,分辨率最高可達到1080p,時長則提升到20秒。
Altman自己也發文宣傳:“初期Sora的使用仍然受限,ChatGPT Plus訂閱用戶可以每月生成50個低分辨率視頻,而ChatGPT Pro訂閱用戶則可以無限制地‘較慢’生成高分辨率視頻,以及500個快速生成的視頻。”
簡單來說,就是會員通用,購買了ChatGPT的會員也可以使用對應的Sora Turbo。
此外,有不少朋友可能注意到了,或許是受其他競品的啟發,此次OpenAI對Sora采用了靈活的積分制定價策略。
據了解,如果你已是 ChatGPT Plus 和 Pro 會員,那么當你需要生成一個 480p、5s 的視頻只需要消耗 25 個積分;
生成 480p、20s 的視頻則需要 150 個積分;
生成所需積分 | 圖源:ChatGPT官網
此外,當你使用Re-cut、Remix、Blend或者Loop這些功能或生成的作品超過5s時,需要支付額外積分,功能用得越多、時長越長扣得也越多。
額外所需積分 | 圖源:ChatGPT官網
因此,縱使Sora帶來了許多顛覆性的AI功能,想要注意體驗也需要付出一定的代價。
有些用過多家視頻AI的用戶則表示,Sora是他們用過最貴的文生視頻大模型。
“對標 Sora”成為現實
隨著Sora Turbo的正式發布,“對標Sora”的話題又一次引起了關注。
自2月份Sora預告發布以來,Sora一度銷聲匿跡,OpenAI對外界也一直保持沉默。
與此同時,國內市場上卻涌現出了眾多文生視頻大模型,如快手可靈AI、智譜清影AI、海螺AI等。
在這些國產視頻AI發布時,不少科技媒體第一時間將它們廣泛地與Sora進行對比,并打上了“對標Sora”、“國產Sora”等標簽。
但一些業內人士對此并不認同,他們始終認為,這些AI與Sora并非同一概念,之間有著本質上的差別。
如今,隨著更高級的Sora Turbo正式亮相,是時候通過具體的效果展示為這場"對標"爭論畫一個句號。
那就先來聚焦官方的直播演示。
在長達數十分鐘Sora的功能展示中,OpenAI通過直播向外界展示了Sora的強大能力:
能夠生成最高1080p分辨率、最長20秒、支持16:9/1:1/9:16等多種畫面比例的視頻。
圖源:Sora官網
用戶可以輸入文字或上傳圖像,利用全新上線的UI界面對生成的視頻進行修改、創建、擴展、循環、混合,甚至完全基于文本生成全新的內容。
OpenAI強調,Sora無法實現一鍵生成一段故事片,而是需要不斷優化。
例如,如果用戶需要生成一段較長的視頻,則需要打開分鏡(Storyboard)功能,該功能打開后將在頁面上展示四個視頻,用戶可以從不同視角了解視頻細節。
圖源:OpenAI直播
點擊分鏡中的視頻,用戶可以在描述框輸入具體的提示詞,也可以設置風格、畫面比例、時長、分鏡個數、分辨率等元素。
一切就緒后,一條完整的視頻隨即就能生成。
如果說聽上去依然很空洞,別著急,接下來給大家展示OpenAI直播中演示的具體案例。
直播中,OpenAI團隊在描述框中輸入了“一只黃尾白鶴站在小溪里”的提示詞,并把生成出的視頻放在了時間軸的前面部分;
隨后,他們又在新的描述框中輸入提示詞“這只鶴將頭探入水中并叼出一條魚”,并把這段視頻放在了同一個時間軸的后半部分。
兩段視頻并不連續,但Sora可以自行生成中間的過渡片段,使之成為一段完整的視頻。
圖源:OpenAI直播
在另一個演示中,OpenAI展示了如何用Remix工具改變視頻中的物體,從而優化你想要的視頻。
例如,在前面分鏡部分的演示中,OpenAI給出的提示詞為“長毛猛犸象走過沙漠景觀”;
而在后續的優化提示框中,可以直接輸入“把猛犸象變成「機械猛犸」”,就得到了下面這樣一條視頻。
圖源:OpenAI直播
更多奇妙的功能等待著用戶們自行去探索,這里不做過多贅述。
小編更希望聊一聊的是,Sora是否真的“遠遠超越”咱們國產自己的視頻AI。
事實上,好奇這一點的網友非常多,在短短不到一天的體驗中,外網就爆出了不少Sora的不足之處:
在用戶輸入提示詞“一只鵜鶘沿著俯瞰港口的沿海小徑騎自行車”后,Sora對應生成了一段視頻,但在該視頻畫面中,鵜鶘卻像突然吃了云南菌子一樣,在中途莫名其妙地變為向相反的方向騎行。
圖源:網易新聞
還有外網網友爆料,Sora對于性別的概念比較模糊,當提示詞過長的時候,會出現把“一男一女”生成為“兩個女孩”的畫面。
不過,當我們把同一段提示詞交給各家AI進行生成時,它們各自的問題也隨之暴露。
據了解,有用戶反饋,當提示詞為“維京演員的情感表演。當演員皺眉時,鏡頭推到臉上”,Sora、快手可靈、MiniMax海螺表現各有不同。
具體來說,Sora的視頻鏡頭氛圍出色,粗看有電影大片風范,但無法體現“演員皺眉”、“鏡頭推到臉上”。
圖源:Sora
快手可靈AI的表現則較為嚴謹,基本一比一根據提示詞生成視頻,但畫面也相對較為死板。
圖源:可靈AI
而MiniMax海螺生成的視頻也有好有壞,亮點在于表情變化更加明顯,缺點則是運鏡提示詞完全理解錯誤,變成了“鏡頭逐漸拉遠”。
圖源:海螺AI
總的來說,這些視頻大模型都具有各自的優勢,當然也存在屬于它們自己的不足等待被解決。
隨著Sora Turbo的正式發布,國內外視頻AI的競爭將更加激烈。
哪怕是OpenAI,也需要繼續學習與進步,讓技術優勢變成真正的產品優勢。
作者 | 劉峰
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.