AI會像美圖軟件中的磨皮功能一樣,把皺紋全部去掉,導致人物臉部沒有細節,看上去很假……所以AI換臉后,這些細節只能靠人工把它加回來,即人工+智能。”
和朋友走進影院看完唐季禮執導、成龍主演的新片《傳說》后,卡茲克的“職業病”犯了,忍不住連夜寫起AI換臉的科普文。
他是知名公眾號“數字生命卡茲克”的主理人,原名張仁杰,是個95后大男孩。一年前,他是個酷愛打游戲的普通上班族。現在,他是AIGC世界影響力最大的KOL之一。
用200篇原創
打造一個“數字分身”
除了是《神話》的續集,暑期檔電影《傳說》另一大宣傳亮點,是利用AI換臉技術,使27歲成龍的面容重返大銀幕。
然而,這個最大賣點,也成了部分網友觀影后的吐槽點:總覺得哪里不太對,不夠自然。
本應咬緊牙關的表情,效果卻有點像露齒一笑。
“AI在影視劇的運用也不是第一次,《流浪地球2》劉德華和吳京年輕時的樣貌就是用了AI”,“哪些是肌肉產生的褶皺,哪些是年齡產生的皮膚紋理,在AI換臉后,一點點重新做回去……最終的結果就是AI在不同鏡頭里幫《流浪地球2》劇組完成三成到七成的工作,剩下的全靠人手動調節”。
當在鍵盤上敲下最后一個標點符號,卡茲克看了眼編號,這篇關于AI換臉的科普文章剛好是他的第200篇原創,前面199篇也全部和AI相關。其中涉及了很多使用AI的小技巧,像是怎么讓老照片動起來,怎么用AI生成音樂,等等。
最近,卡茲克決定將在公眾號里引入AI智能體,讓它根據網友的提問,基于過往科普文章中的知識點進行解答,將這些干貨精準地推給網友。
“類似于打造一個數字生命版的我。”卡茲克是手游《英雄聯盟》中張仁杰最愛的角色,一個靈活的打野刺客;數字生命是《流浪地球2》的概念設定,紅極一時。
《流浪地球2》中的數字生命
去年2月,當他以“數字生命卡茲克”的身份踏上這段AI科普的旅程,不會想到自己這么快會迎來一個“數字分身”。
參加頒獎典禮前面坐著張藝謀
介紹卡茲克,繞不開他和AI共創的《流浪地球3》“預告片”。
2023年的暑期檔,AI視頻生成工具在全世界人的面前初秀肌肉。刷屏的《芭比海默》讓正在熱映的《芭比》真人電影和《奧本海默》跨時空碰撞,激發了卡茲克的創作靈感。他花5個晚上,用AI繪畫和視頻生成工具,分別生成693張圖和185個鏡頭,最后選出60個鏡頭,剪輯成《流浪地球3》的“預告片”。
《芭比海默》
現在回看這段1分12秒的“預告片”,更像是動態版PPT。但在那時,它足夠驚艷到被郭帆導演看到。
《流浪地球3》AI“預告片”
此后,卡茲克與郭帆數次碰面,聊得最多的是AI技術:“郭導迫切想了解AI對影視行業會產生什么影響,能否有一些賦能。他還去了趟硅谷進行‘特種兵’式考察拜訪,去了OpenAI、Meta、Pika等公司。”
去年11月,郭帆團隊與華為、小米等達成合作,共同探索用AI技術打造電影工業化3.0。
郭帆和卡茲克(右)
今年2月16日,他一早在公眾號發布通宵創作的《OpenAI全新發布文生視頻模型Sora:現實,不存在了》,迅速收獲幾百萬閱讀,在朋友圈實現了現象級刷屏。
一個月后,央視電影頻道向他拋出荊楚文化的“命題作文”。卡茲克和小伙伴“肝”了10天的AI短片《玉覆荊楚》,入圍央視電影頻道首度推出的“AI影像人才優選計劃”。
《玉覆荊楚》
在頒獎典禮上,坐在卡茲克前面的,是烏爾善、張藝謀、成龍等,讓他一陣陣恍惚。但一個初出茅廬,沒什么導演和剪輯經驗的“外行”,能創作出令大導演也驚嘆的作品,卻是AI時代最好的注解。
AI殿堂的門童
凌晨三四點睡下,中午十一二點起床后開始一天的工作:實測各種AI工具;用AI進行創作;撰寫當天的科普文;拜訪各大互聯網公司、創業團隊……這是卡茲克的日常。
睡得晚,是因為眼下AI行業的不少熱點來自大洋彼岸;頻繁的交流拜訪,則是由于每天都要對外“輸出”,自己首先得有足夠的“輸入”。雖然連軸轉,但他樂在其中。
這趟AI奇幻之旅的起點,是興趣。
1995年,卡茲克出生在安徽的一個普通家庭。他從小成績一般,并不是傳統意義上“別人家的孩子”,但對很多事有好奇心,動手能力強,愛搗鼓,喜歡拆東西。
就讀廣東湛江師范學院的4年,卡茲克主修視覺傳達設計,大二開始自學UI(用戶界面設計)和用戶交互體驗。
大學畢業后,他成為“北漂”,先后在金融貸款公司和互聯網基金信息服務平臺,干過用戶體驗設計師,也當過設計總監。
2022年底,隨著ChatGPT和AI繪畫工具的出圈,卡茲克發現它們非常適合追求效率的“懶人”,于是開始沉迷于探索各種AI工具。
“AI可比游戲好玩多了。洛丹倫的雪,史東薇爾的風,海拉魯的草原,瓦洛蘭的虛空(都是游戲中的地名),都不及你親手造一個世界來得有趣。”今年3月,卡茲克正式離職,當起了AI博主。
他說,從一開始給自己的定位,就是AI這個神圣殿堂的門童。“門童,就是將門打開,把人引進去。順便做一些小小的講解,讓大家看看,這殿堂里有風有雪,有愛有光。它能讓你的想象變成現實,讓皮卡丘和路飛共舞,讓弗洛伊德和喬布斯握手……”
對話“新青年”
AI視頻生成技術
國內外公司目前能打平手
九千光年:怎么看AI生成視頻在這一年里的進步?
卡茲克:我們通常將Sora的發布作為一個分水嶺。它發布前的1.0時代,AI生成的只是一個4秒動態PPT,大場景的動態,不涉及具體人物的動作。它發布后的2.0時代,一些簡單的人物動作可以實現了,比如讓一個人跳舞。
Sora生成效果
可能到了3.0時代,AI更能理解運動中的物理規律,生成的視頻可以呈現人與人之間復雜的交互,比如打斗戲。
九千光年:這輪多模態大模型的“激戰”,國內大廠和創業公司的表現如何?
卡茲克:去年下半年,我們一度以為在AI視頻領域,就和AI繪畫一樣,國內外會存在大差距,很難去追。
今年2月Sora發布,震驚世界,不過至今它還是期貨狀態,真正展現實力并開放給大家使用的,是快手的可靈。 其他一些國產視頻模型也在落地,這時大家發現,技術上我們已經可以跟國外打個平手。
可靈生成效果
比如,現在有個可控性很強的功能叫首尾幀控制,即上傳視頻首幀和尾幀圖片,模型可補全視頻中間內容,就是國內公司率先推出的。
遠不是一鍵成片那么簡單
九千光年:具體到影視行業,AI視頻生成技術的應用可以到哪個階段?
卡茲克:AI大模型的涌現讓影像的制作門檻變低了。我一個人“肝”上幾天,就能做出一段幾分鐘的科幻短片,這在傳統影視工業里屬于不可能完成的任務。
不過,這與大家想象中的“一鍵生成一個片子”完全不一樣。我在復盤《玉覆荊楚》時也提過,當時的劇本、分鏡幾乎都是人工完成的。在AI出圖階段,一些需要局部重繪的,也是直接掏出了PS、AE等工具,比如當時AI死活不知道什么叫“一幢只開著一盞燈的辦公樓”。
AI當時沒能生成“一幢只開著一盞燈的辦公樓”
用PS搞定
至于配音、音效、音樂、剪輯,那次幾乎沒有用到任何AI流程,在這些領域,現在的AI還達不到80分作品所需的水平。
影視從業者:從焦慮到實踐
九千光年:你和許多影視從業者有過交流,他們對于AI技術持什么態度?
卡茲克:起初明顯可以感覺到大家普遍存在很焦慮的心態,不知道AI技術到底是輔助利器,還是會徹底顛覆行業,改變游戲規則。
但從去年底開始,一些影視從業者陸續將AI當作一個實用的工具,可以整合進影視制作流程,降本增效。
打算做一部科幻題材AI長篇劇集
九千光年:能介紹一下你7月17日上線的AI預告片《末日之旅》嗎?
卡茲克:這可能是我想做的第一部AI長篇劇集。科幻、克魯蘇、末日題材,始終有著讓人無法抗拒的吸引力,不過目前只有“克魯蘇統治者古神意外復蘇,引發一場波及全球的浩劫”這樣一個大背景,其他還沒想過。
跟此前作品相比,特別之處在于它是我花了3個晚上,全程用文生視頻完成的,想讓大家了解這個功能目前可以達到的能力上限。
AI預告片《末日之旅》
培養主動尋求AI解決方式的思維
比買課更重要
九千光年:可以推薦幾款你覺得國內相對好用的AI工具嗎?
卡茲克:日常用得比較多的AI助手是月之暗面的Kimi、抖音的豆包。AI繪畫工具方面,快手的可圖、商湯的秒畫不錯;AI聲音工具,出門問問的魔音工坊;AI音樂工具,天工SkyMusic;數字人的話,商湯的如影。
九千光年:作為資深實踐者,對于那些剛開始接觸AIGC的新手,有沒有什么入門的建議?
卡茲克:就我的體會,AI本身不是一個需要入門的東西。根據實際場景,比如工作生活中遇到什么痛點,你就可以嘗試上網去搜索借助AI的解決方法。
換個說法吧。過去我們遇到問題,會想著問親朋好友,去找搜索引擎,那么現在可以多一種選擇:看看有沒有現成的AI方案可以幫忙解決。
AI變化很快且應用端很龐雜,所以我覺得培養自己主動搜索和尋求AI解決方式的這種意識和能力,可能比買課上培訓班,單純知道幾個知識點更為重要。
文 | 童蔚
海報 | 李前芳
VIEW MORE
@不死癌癥“狙擊手” >>
@85后二孩爸爸爆改舊玩具 >>
@被AI追著,他們越跑越快 >>
@云設計“破風手” >>
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.