做表情包一度是很多文生圖、文生視頻應用的場景。Pika 在去年就靠魔法貓,在國外出圈了一把。
然后 Pika 就走上了一條新賽道,開始深耕表情包制作。
雖然有點一言難盡吧,不過也不算脫離常規(guī):都是已有的素材,讓 AI 來實現(xiàn)動態(tài)化調(diào)整——如果 AI 自己就能做表情包了呢?
瑞典皇家理工大學聯(lián)合德國兩所大學最近的一項研究顯示,AI 不僅懂表情包,甚至還能「做」表情包。
出梗不只靠天賦,AI 也可以懂
有一說一,上網(wǎng)沖浪久的都知道,表情包想要真正傳播開來,光靠動效本身是不夠的。動不動態(tài)、一不一致,并不是決定性的——對表情包來說,最重要的還是得好笑。
那么就回到那個經(jīng)典問題了:人工智能懂什么是幽默嗎?
研究人員們就好好鉆研了一下這個問題:他們把 AI 和人放在一起,比賽誰能把表情包做得好笑。
在研究中,用到的是相對比較簡單的表情包「公式」: 底圖+字。比如以下這些經(jīng)典作品
這種類型的表情包就是 開局一張圖,剩下全靠字。字加好了,才稱得上是表情包,否則就是一個帶字的圖片罷了。
因此也最適合用來檢測 AI「懂不懂幽默」。除了讓 AI 生成,還有一隊人類參與者加入創(chuàng)作作為對照,另外還有一組是和 AI 合作共創(chuàng),最后再由人來打分。
研究結果里沒有把所有的表情包都放出來,只選擇了個別案例。從這些案例里能見到 AI「懂」了,但不太多。再碰上個不太懂玩梗的人類,那差距確實就不太大了。
整體來看,LLM 獨立生成的表情包,在「有趣」「創(chuàng)意性」上的得分,都超過人類作品。 唯一例外的是「可分享性」,即是否愿意分享和傳播。在這個維度上,AI 生成的表情圖得分并不特別高于人機共創(chuàng)。
能不能刺激分享欲,是表情包很重要的價值,是它能作為互聯(lián)網(wǎng)通用語言的核心原因。
同時它最好得是搞笑的。西班牙一所大學的教授,研究了在 2020 年國外面臨大規(guī)模封鎖時的表情包分享,結果發(fā)現(xiàn)「幽默」,是表情包傳播的核心特征。尤其在疫情期間,幽默能夠緩解恐懼和不確定性。
這些也是為什么長久以來, 喜劇和幽默內(nèi)容創(chuàng)作,被視為 AI 不可能染指的地盤:大模型既不能和人一起「經(jīng)歷」點兒什么,也不會理解「好笑」這種情緒和感覺。硅基生物跟碳基生物,始終是不一樣的。
但是,這并不能阻止 AI 搞抽象。
AI 會搞抽象,但不完全會
去年夏天,南加大就發(fā)布過他們的發(fā)現(xiàn): ChatGPT 生成的笑話,已經(jīng)比人寫的更好笑了。
在實驗中,幾乎有 70% 的參與者認為 ChatGPT 的笑話比普通人寫的更有趣。相比之下,25% 的人更喜歡人類創(chuàng)作的笑話,5% 的人認為兩者一樣有趣。
「幽默」作為一種情緒和感受,或許是硅基生物擁有不了的。但是 幽默文本, 是可以被拆解和學習的。
2023 年的國際計算創(chuàng)造力大會上,喜劇編劇 Joe Toplyn 發(fā)表了他的喜劇內(nèi)容生成系統(tǒng) Witscript。
具體來說,這就是通過使用已在電視節(jié)目上播出的搞笑內(nèi)容,做成數(shù)據(jù)集,再進行微調(diào)的預訓練神經(jīng)網(wǎng)絡語言模型。通過填補 prompt 的空白來完成笑話,返送給用戶,配套還做了一個產(chǎn)品。
免費試用都沒有,上來就要付費,也不知道是不是真的那么搞笑。
開發(fā)者 Joe Toplyn 是職業(yè)喜劇編劇,他給各種喜劇、脫口秀節(jié)目寫段子,拿過四次艾美獎,并且擔任過兩檔頂級深夜秀的首席編劇。
他認為,能職業(yè)化的寫作都是有公式可以套用的, 只要數(shù)據(jù)足夠,大模型也可以學會寫段子。
悉尼大學學報也發(fā)過一篇文章認為,通過跟蹤用戶消費數(shù)字內(nèi)容時的行為,比如循環(huán)播放視頻的次數(shù)、滾動瀏覽特定內(nèi)容的速度,以及我們是否被特定類別的效果和聲音所吸引,算法可以推斷出我們是不是認為某些內(nèi)容有趣。
甚至,我們在使用「哭笑」這個 emoji,作為對視頻內(nèi)容的反應時,也是一種強化學習的過程。
壞就壞在,即便大模型真的可以寫段子,觀眾可能并不喜歡。
呼蘭在一檔綜藝節(jié)目上,現(xiàn)場讓 AI 寫了一個脫口秀段子,要求跟人工智能相關,要「好笑,幽默,非常好笑」。
結果就是一點都不好笑……如果不是由呼蘭讀出這些段子,那更加是毫無任何效果可言。
喜劇效果很大程度上依賴于脫口秀的表達方式,僅僅是作為文字時,段子的魅力會大大流失。 就算 AI 掌握了喜劇寫作的方式,但那也只是幽默的一小部分。
歸根到底,幽默是一個成分非常復雜的東西: 一個人的笑點,很大程度上受到所處的文化、社會的影響。這也是為什么在外國人大量涌入小紅書時,首先要學的是怎么各個表情包的使用。
如果用不明白這些表情包,上小紅書沖浪的樂趣就大大減少。可是要弄懂這些表情包,就要理解背后的文化含義,不然就會出現(xiàn)下面的情況
那更別提還沒有深度參與人類生活的 AI 了。在這次實驗中 ,人類創(chuàng)作的表情包在幽默性上,表現(xiàn)是最好的。
人機協(xié)作可以有效提高產(chǎn)出的數(shù)量,但并不一定就能提高質(zhì)量。
從根本上講,沒有一個表情包是孤島。在表情包里,不僅可以看到網(wǎng)友們在「網(wǎng)絡」這個公共場合表達自己的方式,還可以看到一些共有的主題,比如焦慮或者人生煩惱,所有這些復雜的問題都能反映在一個簡單的表情包里面。
大多數(shù)成功的表情包,尤其是傳播范圍廣的,都具有這些關鍵屬性。比如某一段時間內(nèi)流行的,通常是公眾記憶中最近發(fā)生的事情。
盡管一些大模型應用,數(shù)據(jù)好訓練好,確實可以寫出跟人類不相上下的段子。但它們始終無法捕捉不同情境下,人類幽默的深度和多樣性——共同的經(jīng)驗和記憶,才最能引發(fā)共鳴。
我們正在招募伙伴
簡歷投遞郵箱
hr@ifanr.com
?? 郵件標題
「姓名+崗位名稱」(請隨簡歷附上項目/作品或相關鏈接)
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.