99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

AI也會“喵喵叫”:MIT團隊讓機器學會模仿聲音

0
分享至


(來源:MIT Technology Review)

無論是描述故障汽車發動機的聲音,還是模仿鄰居家貓咪的叫聲,當語言難以準確傳達時,聲音模仿反而是一種更為生動有效的表達方式。

聲音模仿就像是用隨手涂鴉來表達你眼中的景象,不同之處在于,它依靠聲道來模擬聲音,而非用鉛筆繪圖。雖然這種方式看似復雜,但其實每個人都會自然而然地這樣做。不妨親自嘗試一下,試著用你的聲音模仿救護車的警笛聲、烏鴉的叫聲或鐘聲。

受到人類交流方式和認知科學的啟發,MIT 計算機科學與人工智能實驗室的研究人員開發出一種 AI 系統,無需額外訓練,即便從未“聽過”人類的聲音模仿,也能生成類似人類的聲音模仿。

為實現這一目標,研究人員設計了一個模擬人類聲道的系統,能夠再現聲帶振動如何通過喉嚨、舌頭和嘴唇的形狀變化發出聲音。隨后,他們采用一種受認知啟發的 AI 算法來控制該聲道模型,使其能夠根據人類在不同情境下選擇的表達方式,生成相應的聲音模仿。

該模型能夠高效地將各種真實世界的聲音轉化為類似人類的模仿聲,包括樹葉沙沙作響、蛇的嘶嘶聲以及救護車接近時的警笛聲。此外,這一模型還可以“反向”工作,通過人類的聲音模仿推測真實世界中的聲音。這種方式類似于某些計算機視覺系統能夠根據草圖還原高清圖像。例如,該模型可以準確地區分人類模仿貓發出的“喵喵叫”和“嘶嘶聲”。

未來,這一模型有望催生更直觀的“基于模仿”的聲音設計界面、更具擬人化特點的虛擬現實 AI 角色,甚至應用于幫助學生學習新語言的方法。

該研究的共同第一作者包括 MIT 博士生 Kartik Chandra、博士生 Karima Ma 以及本科研究員 Matthew Caren。他們指出,計算機圖形學領域的研究人員早已認識到,真實感并不是視覺表達的終極目標。例如,一幅抽象畫或孩子用蠟筆隨手涂鴉的作品,往往能與照片一樣富有表現力。

Chandra 表示:“過去幾十年,素描算法的進步不僅帶來了新的藝術工具,還推動了 AI 和計算機視覺的突破,甚至深化了我們對人類認知的理解。正如素描是對圖像的抽象和非真實寫實的表現形式,我們的方法同樣捕捉了人類在表達所聽聲音時的抽象、通過擬聲詞等語言來形容的方式。這讓我們得以更深入地理解聽覺抽象的過程。”

Matthew Caren 對此補充道:“這個項目旨在理解聲音模仿的本質,并通過計算機模型對其進行模擬。我們將聲音模仿視為聽覺領域中類似于‘視覺領域素描’的一種表達方式。”



模仿藝術三步走

研究團隊開發了三個層次逐步遞進的模型版本,以便將其與人類的聲音模仿進行比較。首先,他們構建了一個基線模型,旨在盡可能生成與真實世界聲音相似的模仿聲音。然而,這個模型與人類的模仿方式存在較大差距。

接著,研究人員設計了一個溝通型模型。根據 Caren 的解釋,這個模型會考慮聽眾對某種聲音的獨特感知特征。例如,你可能會通過模仿引擎的轟鳴聲來表現摩托艇的聲音,因為這種聲音最具辨識度,盡管它可能不是最響亮的部分,如水花四濺的聲音。這個改進后的模型生成的聲音模仿比基線模型更貼近人類的表達方式,但研究團隊仍希望進一步優化。

為此,研究人員在模型中引入了推理層。Chandra 表示:“聲音模仿的效果會受到投入的努力程度影響。要生成完全準確的聲音,需要付出時間和精力。”因此,升級后的模型會避免產生過于快速、響亮或音調極高或極低的聲音,因為人們在日常對話中通常不會這樣表達。最終,這一改進模型生成的聲音模仿更加符合人類特點,更真實地反映了人們在模仿同一聲音時所做出的選擇。

在模型構建完成后,研究團隊開展了一項行為實驗,測試人類評審如何看待 AI 生成與人類生成的聲音模仿,并評估哪種更受歡迎。值得注意的是,實驗結果顯示,參與者在25%的情況下更偏好 AI 模型生成的聲音。尤其是在模仿摩托艇聲音時,AI 模型的偏好率高達 75%,而在模仿槍聲時,這一偏好率達到 50%。



邁向更具表現力的聲音技術

Caren 對音樂和藝術領域的技術充滿熱情,他設想這一模型可以幫助藝術家更高效地與計算系統溝通聲音,并為電影制作人和其他內容創作者提供更貼合特定情境的細膩AI聲音。這項技術還可能使音樂家通過模仿那些難以用文字描述的聲音,快速檢索聲音數據庫,提升創作效率。

與此同時,Caren、Chandra和 Ma 正積極探索該模型在其他領域的潛在應用,例如語言的發展過程、嬰兒如何學習說話,甚至是鸚鵡和鳴禽等鳥類的模仿行為。

不過,該模型的當前版本仍有改進空間。例如,它在處理某些如“z”的輔音時存在困難,導致對蜜蜂嗡嗡聲等聲音的模仿不夠準確。此外,該模型尚無法復現人類對語音、音樂,或在不同語言中對某些聲音,比如心跳聲,進行不同方式模仿的能力。

斯坦福大學語言學教授 Robert Hawkins 指出,語言中充滿了擬聲詞和模仿但并不完全復制所描述事物的詞匯,比如 “meow” 這個詞與貓咪真實的叫聲就不完全一致。Hawkins 表示:“從真實的貓叫聲到 ‘meow’ 這個詞的形成過程,揭示了在語言進化中生理機制、社會推理和交流之間復雜的相互作用。” Hawkins 并未參與這項研究,但他認為:“這個模型是將這些過程的理論形式化并加以驗證的重要一步,展示了人類聲道的物理限制和社交交流的壓力共同作用,解釋了聲音模仿的分布現象。”

Caren、Chandra 和 Ma 與另外兩位 MIT 計算機科學與人工智能實驗室的成員共同撰寫了這篇論文,他們是 MIT 電氣工程與計算機科學系副教授 Jonathan Ragan-Kelley,以及MIT 大腦與認知科學系教授、Brains, Minds, and Machines 中心成員 Joshua Tenenbaum。該研究得到了赫茲基金會和美國國家科學基金會的部分資助,并在 12 月初發表在 SIGGRAPH Asia 會議上。

https://news.mit.edu/2025/teaching-ai-communicate-sounds-humans-do-0109

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
剛剛,全面崩跌!美聯儲,大消息!風暴還在后頭?

剛剛,全面崩跌!美聯儲,大消息!風暴還在后頭?

證券時報
2025-04-08 15:32:06
就業率超98%!中產家庭開始送孩子去日本留學了

就業率超98%!中產家庭開始送孩子去日本留學了

看看新聞Knews
2025-04-08 11:53:08
收評:上證50指數漲超2% 全市場逾百股漲停

收評:上證50指數漲超2% 全市場逾百股漲停

財聯社
2025-04-08 15:04:09
臺海上空發生摩擦,48小時內美軍機三次逼近,立刻遭到我軍機驅離

臺海上空發生摩擦,48小時內美軍機三次逼近,立刻遭到我軍機驅離

空天力量
2025-04-08 19:07:05
特朗普再發威脅,中國強勢回應,對美國投降的國家,在談判桌上不叫談判,叫收割

特朗普再發威脅,中國強勢回應,對美國投降的國家,在談判桌上不叫談判,叫收割

中國日報網
2025-04-08 19:49:13
歐盟:要和全球伙伴多做生意,美國除外

歐盟:要和全球伙伴多做生意,美國除外

新京報
2025-04-08 17:05:14
同濟博導隱居同里當木匠?我找到了他的店鋪

同濟博導隱居同里當木匠?我找到了他的店鋪

澎湃新聞
2025-04-07 15:26:36
這情商…維尼修斯輸球后立即發進球紀錄,社媒被皇馬球迷沖爛

這情商…維尼修斯輸球后立即發進球紀錄,社媒被皇馬球迷沖爛

直播吧
2025-04-08 20:04:04
特朗普僅給中國1天時間考慮:明天前撤回34%關稅,否則再加稅50%

特朗普僅給中國1天時間考慮:明天前撤回34%關稅,否則再加稅50%

叮當當科技
2025-04-08 05:09:38
網傳小米內部通知:對外社媒可逐步恢復正常運營,但避免使用“慶祝”一詞

網傳小米內部通知:對外社媒可逐步恢復正常運營,但避免使用“慶祝”一詞

可達鴨面面觀
2025-04-08 16:02:30
歐盟宣布對美國加稅,印度宣布對歐盟降稅,美國宣布再次提升對華關稅

歐盟宣布對美國加稅,印度宣布對歐盟降稅,美國宣布再次提升對華關稅

遠方青木
2025-04-08 01:13:27
中國誠通宣布增持1000億元

中國誠通宣布增持1000億元

澎湃新聞
2025-04-08 18:21:06
美國54%關稅下,我國這5大行業深受打擊,中國老百姓的錢包要癟?

美國54%關稅下,我國這5大行業深受打擊,中國老百姓的錢包要癟?

振華觀史
2025-04-08 17:57:15
倫敦、巴黎、柏林 全球抗議大爆發!

倫敦、巴黎、柏林 全球抗議大爆發!

每日經濟新聞
2025-04-08 14:33:14
股價創新低,還在跌停的12只股票,跌停原因各不相同!

股價創新低,還在跌停的12只股票,跌停原因各不相同!

歷史阿務
2025-04-08 16:45:30
網約車女司機吐槽遲到女乘客,引大量私信辱罵:仇女、騷貨、社會底層

網約車女司機吐槽遲到女乘客,引大量私信辱罵:仇女、騷貨、社會底層

西虹市閑話
2025-04-08 17:24:29
沒想到“甲亢哥”的中國行“爛尾”了,網友:很真實,意料之中

沒想到“甲亢哥”的中國行“爛尾”了,網友:很真實,意料之中

娛樂故事
2025-04-08 13:41:41
當特朗普宣布再對中國加征50%關稅時,我反而平靜了下來!

當特朗普宣布再對中國加征50%關稅時,我反而平靜了下來!

李光滿說
2025-04-08 20:29:00
記者實探三河市,有部分商家不聽勸阻沒有改門頭

記者實探三河市,有部分商家不聽勸阻沒有改門頭

映射生活的身影
2025-04-08 16:56:09
美軍轟炸機就位,伊朗發出戰爭警告,不到48小時,中方奔赴莫斯科

美軍轟炸機就位,伊朗發出戰爭警告,不到48小時,中方奔赴莫斯科

文雅筆墨
2025-04-08 13:32:36
2025-04-08 23:20:49
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技評論獨家合作
15037文章數 513525關注度
往期回顧 全部

科技要聞

iPhone在美會賣2萬元上嗎?在中國會漲價嗎

頭條要聞

25歲"世紀嬰兒"千千去世鑒定結果已出 母親發聲

頭條要聞

25歲"世紀嬰兒"千千去世鑒定結果已出 母親發聲

體育要聞

100%當選狀元,但弗拉格不想進NBA?

娛樂要聞

尷尬!甲亢哥想聯動大張偉,卻被迫錄節目

財經要聞

"中國版平準基金"橫空出世 央行表態

汽車要聞

一季度車企銷量:下沉與上行,覺醒與迷惘

態度原創

數碼
游戲
教育
健康
軍事航空

數碼要聞

酷比魔方掌玩 mini 3 Ultra 平板規格公布,國補后 1400 元

《馬車世界》大量新情報:相比前作的大規模升級

教育要聞

允許孩子小錯不斷,他才能大錯不犯

在中國,到底哪些人在吃“偉哥”?

軍事要聞

特朗普對俄不滿 指責俄持續襲擊烏克蘭

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 大渡口区| 进贤县| 曲靖市| 右玉县| 潢川县| 定兴县| 祁连县| 姜堰市| 额敏县| 阿勒泰市| 鄂尔多斯市| 咸丰县| 皮山县| 陇南市| 元阳县| 神农架林区| 商南县| 成都市| 江津市| 广宁县| 莱西市| 成安县| 延庆县| 达州市| 安徽省| 东方市| 富裕县| 和田县| 松江区| 共和县| 吉林省| 罗平县| 冀州市| 湘阴县| 定日县| 肥东县| 垫江县| 天气| 丰顺县| 甘孜县| 荔波县|