99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

Nature重磅:科幻“巴別魚”真來了?AI實現人類101種語言語音互譯

0
分享至


《銀河系漫游指南》中的神奇“巴別魚”,賦予了人們瞬間跨越語言鴻溝的能力,是無數人心中「高效語言交流」的終極形式。

如今,我們距離實現這一夢想或許不遠了

就在今天,權威科學期刊 Nature 報道了由 Meta 開發的開源多語言、多模態機器翻譯模型 SeamlessM4T,其突破性地實現了 100 多種語言在語音-語音、語音-文本和文本-語音方面的高效翻譯,為全球語言溝通帶來了新的可能。


具體而言,SeamlessM4T 能夠接受這些語言中的任何一種的文本或語音輸入,并將其翻譯為文本,還可以直接將語音翻譯為 36 種語言的語音。

不僅如此,SeamlessM4T 在處理語音到文本任務時,抵御背景噪音和適應說話者變化的能力也比其他系統平均高出約 50%,展現出強大的魯棒性。

對此,塔林理工大學語言處理教授 Tanel Alum?e 在評論文章中表示,“作者利用現實世界數據的方法將為語音技術開辟一條充滿希望的道路,有望與科幻作品中的技術相媲美。”

他還寫道,“這項工作最大的優點并非提出的想法或方法,而是運行和優化該技術的所有數據和代碼都可公開獲取,盡管模型本身僅可用于非商業用途。研究人員將他們的翻譯模型描述為‘基礎模型’,這意味著它可以在精心策劃的數據集上進行微調,以實現特定目的,例如提高某些語言對或專業術語的翻譯質量。”

當前,在這項研究的基礎上,Meta 基于 UnitY2 架構,運用層級字符到單元的上采樣和非自回歸文本到單元的解碼方法,訓練出了改進版本 SeamlessM4T V2,在保持高準確率的同時,加快了生成語音和文本翻譯結果的速度。

AI 正在打破人類語言壁壘

盡管當前的機器翻譯技術已經取得顯著進展,但大多局限于文本翻譯,語音到語音翻譯(S2ST)面臨諸多挑戰。

現有的多語種翻譯系統通常依賴于級聯系統,通過多個子模型串聯完成復雜任務,不僅翻譯效率低,而且主要適應于少數幾種語言,在面對背景噪音和說話人變化等不穩定因素時,魯棒性不足。

為了解決這些問題,SeamlessM4T 應運而生。該模型基于 SONAR 多語言和多模態嵌入空間架構,將語音、文本的處理能力有效結合,并通過海量原始語音和文本數據自動挖掘對齊資源,實現了翻譯的準確性和流暢性提升。

另外,研究團隊還采用自監督和半監督學習方法訓練模型,使其能從大量原始數據中學習,減少了對人工特定標簽的依賴。


圖 | SEAMLESSM4T-V2 系統架構

在數據層面,SeamlessM4T 通過新的語言識別(LID)模型識別 100 多種語言。在研究過程中,Meta 團隊基于 SONAR 嵌入空間為 200 種語言提供了單一的文本編碼器和解碼器,并為 37 種語言提供了語音編碼器,且通過文本到文本翻譯(T2TT)任務,證明注意力機制并非實現合理翻譯準確率的必要條件。利用 SONAR 的文本和語音編碼器,Meta 團隊挖掘出三種對齊數據,構建了涵蓋 37 種語言、時長超 47 萬小時的 SeamlessAlign 語料庫。

SeamlessM4T 在多個翻譯任務中的表現顯著超過了傳統的級聯模型,在語言覆蓋和任務處理速度等方面優勢顯著。與 AudioPaLM、WHISPER 等大型語音理解和生成模型相比,SeamlessM4T 優勢明顯。

在語音到文本翻譯(S2TT)任務的 X-eng 方向,SeamlessM4T-V2 的 BLEU 得分比傳統級聯系統提高了 4.6 分,性能提升顯著;對比 AudioPaLM 2 - 8B AST 等直接 S2TT 模型,提高了 6.9 分,展現出其在多語種翻譯中的強大優勢。

在語音到語音翻譯(S2ST)任務中,SeamlessM4T-LARGE 比兩階段級聯模型的 ASR-BLEU 得分高出 8 分,改進以后的SeamlessM4T-V2 進一步提升了 3.9 分,顯著領先于其他同類系統。

在語音到文本翻譯的 CVSS 任務中,SeamlessM4T - V2 相較于兩階段級聯模型,ASR - BLEU 得分提高了 9.6 分。


圖 | SOTA 語音到文本翻譯/語音到語音翻譯模型

在零樣本文本到語音翻譯(T2ST)任務中,SeamlessM4T - LARGE V2 部分語言方向的表現與級聯模型相當,甚至更優,體現了模型強大的通用性和靈活性。

這表明,SeamlessM4T 在沒有訓練數據的情況下,仍然能夠提供準確的翻譯結果,進一步提升了模型的通用性和靈活性。

SeamlessM4T 在抗噪聲和適應說話人變化方面也實現了技術突破。在背景噪音和說話人變化的實驗中,SeamlessM4T - V2 比 WHISPER - LARGE - V2 的表現提升近 50%。

在語音到語音翻譯任務中,SeamlessM4T - V2 抗背景噪聲能力提高 42%,對說話人變化的適應性提升 66%。這些改進使 SeamlessM4T 在嘈雜環境等實際應用場景中,仍能保證高效、精確的翻譯表現。


圖 | 多任務處理結果

此外,隨著 AI 技術的廣泛應用,機器翻譯模型中的毒性和偏見問題備受關注。Meta 團隊對 SeamlessM4T 進行了嚴格的毒性和性別偏見評估,并采取了緩解措施。


圖 | 語音到文本翻譯和語音到語音翻譯在添加了毒性考量的 28 種語言方向上的平均結果

在毒性檢測方面,他們采用 ETOX、MuTox 和 Mintox 等工具,排除訓練中的有害數據,減少模型產生有毒輸出的概率,為用戶提供健康的交流環境;在性別偏見方面,研究團隊通過 BLASER 2.0 等工具對 SeamlessM4T 進行檢測和優化,SeamlessM4T 在處理性別變化時比之前版本表現出更強的魯棒性,尤其是在 S2ST 任務中的性別變化魯棒性顯著提升。

警惕潛在風險

盡管 SeamlessM4T 已經可以翻譯約 100 種語言,但仍然存在一些局限性。

世界上約有 7000 種語言,該工具在許多人類易處理的場景中仍面臨困難。而且,在實際應用中,SEAMLESSM4T 系統的 ASR 性能受用戶性別、種族、口音和語言差異影響,導致識別和翻譯不準確,限制了其在多元化人群中的應用。

在處理俚語和專有名詞時,該系統在不同資源程度語言中的翻譯質量參差不齊;在實時交互場景中,由于語音交流對即時反饋要求高,用戶難以評估輸出質量,誤譯或毒性內容風險較高,且無法像書面交流那樣修改。同時,語音的韻律和情感信息在當前系統輸出中未得到充分體現,影響信息準確傳達。

研究人員表示,未來將進一步研究語音的韻律和情感,讓翻譯后的語音輸出更加自然生動。另一方面,低延遲語音翻譯和流式翻譯技術成為關鍵突破點,低延遲可減少翻譯時間差,使交流更流暢。

在評論文章中,康奈爾大學助理教授 Allison Koenecke 則從安全方面提出了擔憂,“基于語音的技術越來越多地用于高風險任務,例如在醫療檢查中做筆記或轉錄法律程序,像 Meta 團隊開發的模型正在加速這一領域的進展。但是,這些模型的用戶(例如醫生和法庭官員)以及提供語音輸入的個人,都應該意識到語音技術的易錯性。”

Koenecke 提到,鑒于現有模型的性能在不同語言之間差異很大,必須格外小心,以確保模型能夠熟練翻譯或轉錄某些語言中的特定術語。這方面的努力應與計算機視覺研究人員的工作同步進行,后者正在努力改善圖像識別模型在代表性不足群體中的不佳表現,并防止模型做出冒犯性預測。

此外,她還認為,未來有必要運用以設計為導向的思維,確保用戶能夠正確理解這些質量參差不齊的模型所提供的翻譯。開發者還應該考慮如何告知模型的局限性。這可能包括在準確性存疑時完全放棄輸出,或者為低質量的輸出配上書面警告或視覺提示。也許最重要的是,如果用戶愿意,他們應該能夠選擇不使用語音技術,如在醫療或法律環境中。

https://www.nature.com/articles/s41586-024-08359-z

https://www.nature.com/articles/d41586-024-04095-6

作者:田小婷

如需轉載或投稿,請直接在公眾號內留言

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
1-0到1-3!丁俊暉3局0分,斯佳輝被罰7分,或首敗塞爾比終結者?

1-0到1-3!丁俊暉3局0分,斯佳輝被罰7分,或首敗塞爾比終結者?

劉姚堯的文字城堡
2025-04-27 03:27:14
特朗普上臺將滿100天,金融市場給“差評”!電商平臺集體漲價,機構稱“破產咨詢激增”!關稅暴漲44倍,企業主起訴政府

特朗普上臺將滿100天,金融市場給“差評”!電商平臺集體漲價,機構稱“破產咨詢激增”!關稅暴漲44倍,企業主起訴政府

每日經濟新聞
2025-04-27 00:05:07
特朗普示弱,“窮寇” 真能不追?七年前的巴掌猶在臉畔!

特朗普示弱,“窮寇” 真能不追?七年前的巴掌猶在臉畔!

貓眼觀史
2025-04-26 01:07:13
今夏流行“不穿褲子”!洋氣顯瘦顯腿長,誰穿誰好看!

今夏流行“不穿褲子”!洋氣顯瘦顯腿長,誰穿誰好看!

Yuki女人故事
2025-04-25 22:30:18
0-7慘敗!韓媒怒斥:亞冠已徹底喪失公平,冠軍就是為沙特定做的

0-7慘敗!韓媒怒斥:亞冠已徹底喪失公平,冠軍就是為沙特定做的

直播吧
2025-04-26 16:57:12
南京淪陷后,日軍舉行慶祝活動,高級軍官鞠躬時腦袋被砍

南京淪陷后,日軍舉行慶祝活動,高級軍官鞠躬時腦袋被砍

阿七說史
2025-04-25 23:52:40
劉爽下場開撕董明珠:若不收回成命,劉氏與赫舍里家族將抵制格力

劉爽下場開撕董明珠:若不收回成命,劉氏與赫舍里家族將抵制格力

剛哥說法365
2025-04-26 21:04:23
美國拒發簽證,中國代表無法入境,耿爽發聲,聯合國搬遷勢在必行

美國拒發簽證,中國代表無法入境,耿爽發聲,聯合國搬遷勢在必行

說天說地說實事
2025-04-27 02:53:11
廣廈主場19分大勝遼籃,全隊卻不開心!遼籃輸球只因一人不在狀態

廣廈主場19分大勝遼籃,全隊卻不開心!遼籃輸球只因一人不在狀態

生活新鮮市
2025-04-27 00:49:13
特朗普還是贏了?美聯儲連夜“投降”,半小時內美國股市全面大漲

特朗普還是贏了?美聯儲連夜“投降”,半小時內美國股市全面大漲

肆時說
2025-04-26 19:03:47
搬磚9年攢200萬元蓋了別墅!90后男子說自己很后悔

搬磚9年攢200萬元蓋了別墅!90后男子說自己很后悔

新民周刊
2025-04-26 18:07:26
回不來了!臺積電張忠謀正式表態,國內院士:放棄一切幻想

回不來了!臺積電張忠謀正式表態,國內院士:放棄一切幻想

Thurman在昆明
2025-04-27 00:49:43
張柏芝淪為笑話?就算謝霆鋒向王菲示愛100次,她也是“大贏家”

張柏芝淪為笑話?就算謝霆鋒向王菲示愛100次,她也是“大贏家”

春序娛樂
2025-04-26 20:17:52
笑噴!廣西人工降雨結果打到廣東,廣東網友: 表,別打了都快淹了

笑噴!廣西人工降雨結果打到廣東,廣東網友: 表,別打了都快淹了

有趣的火烈鳥
2025-04-26 17:26:07
海關總署:4月22日起,允許符合相關要求的阿根廷牛黃進口

海關總署:4月22日起,允許符合相關要求的阿根廷牛黃進口

每日經濟新聞
2025-04-26 21:57:06
歐洲裁判不慣著楊鳴!繼偉夢回國際賽場,廣廈造19分慘案1-0遼寧

歐洲裁判不慣著楊鳴!繼偉夢回國際賽場,廣廈造19分慘案1-0遼寧

后仰大風車
2025-04-26 21:52:11
澤連斯基“讓步”了

澤連斯基“讓步”了

環球時報新聞
2025-04-26 17:01:11
曝中日友好醫院外科醫生出軌:護士長兩次懷孕,與小三曖昧照流出

曝中日友好醫院外科醫生出軌:護士長兩次懷孕,與小三曖昧照流出

博士觀察
2025-04-26 08:57:28
2011年,她全裸接受記者采訪,并稱:我敢看你們,你們敢看我嗎?

2011年,她全裸接受記者采訪,并稱:我敢看你們,你們敢看我嗎?

芳芳歷史燴
2025-04-24 15:23:20
沒人結婚,成都崇州最豪華的喜宴中心倒閉了,才開業一年多

沒人結婚,成都崇州最豪華的喜宴中心倒閉了,才開業一年多

小人物看盡人間百態
2025-04-26 20:42:11
2025-04-27 05:20:49
學術頭條
學術頭條
致力于學術傳播和科學普及,重點關注人工智能、生命科學等前沿科學進展。
1247文章數 5069關注度
往期回顧 全部

科技要聞

百度心響實測:“能用版Manus”開了個好頭

頭條要聞

特朗普將舉行集會慶祝執政100天 美媒:時機不妙

頭條要聞

特朗普將舉行集會慶祝執政100天 美媒:時機不妙

體育要聞

廣廈19分勝遼寧獲開門紅 孫銘徽13分3助崴腳

娛樂要聞

金掃帚獎出爐,包貝爾意外獲“影帝”

財經要聞

韓國的"宇樹科技" 是怎樣被財閥毀掉的?

汽車要聞

充電5分鐘續航100公里 探訪華為兆瓦超充站

態度原創

藝術
房產
游戲
數碼
公開課

藝術要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

房產要聞

教育理念再進階!解碼新世界星輝如何構筑「家校社成長生態圈」!

夢幻西游:出了雙固傷玉魄卻難過,口袋版成刷80級環裝首選

數碼要聞

AMD修補高危安全漏洞!歷代Zen架構CPU 100%中招

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 航空| 仲巴县| 沅陵县| 阜宁县| 霍州市| 綦江县| 武清区| 无棣县| 会泽县| 北京市| 鸡西市| 泉州市| 祁东县| 兴文县| 皋兰县| 大兴区| 阜城县| 肇源县| 鹿泉市| 绥棱县| 惠安县| 文安县| 鄂州市| 珠海市| 肇庆市| 灵璧县| 峡江县| 繁昌县| 哈尔滨市| 海阳市| 商城县| 剑河县| 永平县| 日喀则市| 阜康市| 三亚市| 祁东县| 唐海县| 新兴县| 无棣县| 裕民县|