新智元報道
編輯:編輯部 HNZY
【新智元導讀】AI音樂,從此進入「會思考」的時代!剛剛,昆侖萬維扔出一枚重磅炸彈——全球首款音樂推理大模型Mureka O1橫空出世,實力碾壓Suno,強勢登頂TOP 1。
國內首個音樂ChatGPT,剛剛又迎來了震撼升級。
就在剛剛,昆侖萬維發布了全球首款音樂推理大模型Mureka O1,一舉把Suno拉下王座,登頂TOP 1。
可以說,這個全球首發的模型,自今日起直接開啟了AI音樂的工業革命,徹底重塑了音樂創作范式!
首先,這次的基座模型Mureka V6,就已經大大優化。
而在此基礎上,它的推理優化版本Mureka O1更是強到發指,因為它融入了CoT技術,學會了思考!
學會思考的音樂AI模型,當然比普通的音樂AI,更多了那么一絲「人味」。
基座模型Mureka V6:引入ICL技術,聲場更開闊,人聲質感和混音設計強化
首款音樂推理大模型Mureka O1:學會思考,音樂的結構連貫性、樂器編排精準度大提升
更勁爆的是,Mureka V6如今還能支持10種語言,基本把全球主要國家和用戶一網打盡。可以想見,它離引爆全球音樂市場的一天,已經不遠了!
而現在,AI也能獨立出專輯了!《Mureka》AI音樂人MV全網首發,該作品由AI生成,Mureka負責聲樂,SkyReels操刀動畫。
從音樂到數字人的形象,可與韓國女團同臺PK,簡直聲畫雙絕。
音樂創作范式,徹底重塑
為什么說,Mureka即將成為一匹行業黑馬,徹底顛覆音樂創作范式?
答案,就寫在它的工作流中。
· 多語言創作,文化壁壘徹底打破
想象一下,從此音樂人們再也不必受語言的限制,可以使用全球10種主流語言盡情創作音樂,這將賦予音樂人多么廣闊的創作空間!
支持美歐亞主流語言歌詞和音樂的Mureka,能讓人盡情揮灑創作靈感,將事業空間拓展到國際舞臺。
無論熱情的拉丁節奏,還是深沉的電子音樂,抑或是古香古色的傳統國風,O1能讓你真正成為音樂王國的世界公民。
更厲害的是,這10種語言已經覆蓋了全球大部分國家和地區,它在全球音樂市場掀起的影響力,著實不可小覷。
斷眉和維茲的《See You Again》,是一首在國內家喻戶曉的流行金曲,我們貼上中文歌詞,直接就能來一個漢化版。
· 爆改網絡紅曲,花樣玩法多
前者可以讓我們上傳一首歌后,以不同語言重新填詞,這樣就能保留原曲旋律,生成自己的歌。
電影《哪吒之魔童鬧海》的角色曲《就是哪吒》,此前就在網上掀起了一股翻唱的風潮。
再讓我們試試,讓Mureka生成它的英文歌翻唱版。
果然,這首《就是哪吒》英文版,同樣旋律激昂,歌詞充滿力量,很有一股「將這混沌的世界翻個天」的感覺。
· 一段Prompt,一鍵定制想要的BGM
需輸入場景描述性Prompt,即可生成與特定場景完美契合的完整背景音樂。
現在,只要輸入一個場景的描述性Prompt,O1就能根據你的需求,生成與特定場景完美契合的完整BGM了。
電影、游戲、廣告行業,無疑將迎來大震蕩級的劇變。
· 音軌分離下載,創作更自由
更妙的是,O1還能提供多軌音頻輸出——人聲、伴奏、吉他、鼓點……每一層都能獨立下載!
這就意味著,我們可以自由進行混音、二次創作、重新編排,甚至把它做成屬于自己的獨特作品。
對于音樂制作人,甚至是想要自制單曲的小白,這項功能都太強大了。
此外,O1系統還支持行業最好的音色克隆功能。它會精準模擬歌手音色,一鍵生成個性化專屬作品。
一手實測,好聽到上頭
接下來,就是一大波更多實測來襲!
現在,打開官網www.mureka.ai,每個人都可以上手實測了。Mureka O1和Mureka V6兩款模型全量上線,可自由切換。
不論是哪款模型,都支持20多種歌曲創作曲風和情緒,包括爵士、電子、流行、鄉村、R&B等,情緒快樂、放縱、神秘、充滿活力、悲傷等。
Mureka O1:替代人類音樂家,不是說說而已
不管是人聲還是伴奏,Mureka O1做出的音樂,基本做到完全去「AI味」,基本很難聽出是AI模型生成的了。
· 經典華語金曲,衍生出全新歌曲
接下來,讓我們重點實測一番Mureka的根據參考歌曲生成新歌的功能。
要知道,將音樂本身作為提示,要比文本提示更加精準,可直接上傳音頻/粘貼YouTube鏈接即可。
這里,我們選擇了周杰倫的流行樂——「最長的電影」作為參考歌曲,然后讓AI自動生成一段歌詞。
AI幫忙創作出了一段愛而不得的經典系列,一首「錯身」留足了遺憾感的空間。
接下來,點擊創作,一首衍生曲就誕生了!
前調有點「彩虹」、「晴天」的味道,全曲將周董那種細膩的憂傷感,充分地刻畫了出來。
根據「知否知否」的旋律,配上「獨上西樓」的歌詞,竟然出來一首別有韻味的古香古色的歌曲,相當可圈可點。
· Soul、R&B、Pop,爆款音樂風格一網打盡
首先來聽一首Soul,開頭幾句就被驚艷到了,味兒非常純正。
轉音如此絲滑,完全可媲美人類歌手。B段的前幾個樂句十分抓耳,已經有了爆款流行曲的潛質。
總的來說,整首歌無論是旋律、配樂還是演唱,都堪稱上乘。
再來一首R&B。
一首好的R&B,是節奏、旋律、情感表達和歌手演唱技巧天衣無縫的完美融合。而Mureka O1創作的這首R&B,在各方面都可以說拿到了高分。
從一開始,這首歌的旋味就非常強,充滿了呼吸感,節奏、律動和樂器配合出了非常愜意和帶勁的絲滑感。
尤其把我們抓住的,是從46秒開始的一段前奏,結合鼓點的設計,一下子讓人耳朵一亮。
要說最能考驗AI音樂模型的功力,大概就Pop了。這是最主流的音樂形式之一,普通大眾覺得好聽,才能流行起來。
那讓我們看看,Mureka O1寫出的Pop,能成為人類世界大街小巷的爆款當紅曲目嗎?
可以說,這首已經算一首合格的流行音樂了,十分符合大眾審美。
旋律抓耳又流暢,曲調輕松愉悅,十分有公路氛圍,跟乘車兜風的場景不要太適配。疊加了不同音色的編曲營造出動態的層次感,演唱者的音色、咬字、情緒感染力也很強。
一首Rock曲風的中文歌,仿佛狂野里的疾馳,編曲很炸,歌詞很燃,旋律帶著吶喊青春的倔強和熱血。
而這首歡快的流行歌,從前奏就能感受到夏天的味道。愜意輕快的小調,讓人一瞬間擁有了度假的明亮心情。
· Mureka O1 PK SUNO V4:大獲全勝
在實測中可以發現,Mureka O1已經完勝了Suno V4。
仔細聽就會發現,Suno V4生成的人聲有些不自然,人聲也比較遠。
而Mureka O1的音樂不僅一耳朵聽上去質量就很高,人聲也更自然,離耳朵也近。
Mureka V6:一鍵十種語言,BGM隨心造
而對于那些對音頻質量要求沒那么高、又想嘗試玩一把音樂的人,選用最新升級后的Mureka V6就夠了。
它最大的亮點在于,可支持純音樂的生成,以及10種語言的AI音樂創作,包括英語、西班牙語、中文、日語、韓語、葡萄牙語、德語、意大利語、法語、俄語。
同時,相較于上一代V5.5,在人聲清晰度、專業混音、編曲歌詞等方面,得到了顯著提升。
Mureka V6一次就可以生成4.5分鐘的音頻,足夠一首歌的時間了。
現在,就讓我們來上手實測一番它的音樂創作功能。
文本框內輸入「Latin song」,拉丁風的音樂《Amores Meos》就快速生成了!
每次Mureka V6都會一次性生成兩首音樂,這次一共有一首純音樂,一首西語歌曲。
風格熱情奔放,節奏明快,一秒就能把你帶到灑著陽光的地中海海岸線,隨著街拍自由舞動。
再試一試,讓V6生成一首浪漫夢幻的法語香頌,果然充滿了法式的優雅和浪漫,旋律輕柔迷人,讓人仿佛漫步在月光下的塞納河畔。
前面已經提過,只要一句Prompt,Mureka V6就能一鍵定制與想要場景契合的BGM。
比如可以讓它為一段電影生成帶有銅管和弦樂的史詩般管弦樂高潮,用于英雄時刻的鏡頭。
它生成的這段BGM,由恢宏激越轉向平靜浪漫,又逐漸高潮迭起,一層一層將情緒推向最高潮。
讓我們再試試它為Vlog配音的效果,用歡快的尤克里里配以輕柔的鋼琴,為生活和烹飪Vlog生成一段BGM。
果然,這段旋律輕松愜意,仿佛充滿陽光,畫面感十足。
超越Suno,Mureka O1穩坐AI音樂王座
不久以前,DeepSeek-R1憑借思維鏈(CoT)技術顯著提升了模型的智能水平,迅速火爆全球。
那你能想到,當CoT被應用到音樂領域,會創造出怎樣的奇跡嗎?
當CoT首次應用到音樂
今天,Mureka O1全球首次將CoT用到了音樂生成領域,這一創舉徹底顛覆了傳統AI音樂生成范式。
CoT的核心在于「思考與優化」,它讓模型在生成音樂之前,先進行多步驟推理和自我批判。
這種「類人腦」的生成邏輯,使得Mureka O1在歌詞旋律契合度、演唱準確性、藝術表現力上達到前所未有的高度。
從技術演進上看,Mureka O1并非一蹴而就。
去年,Mureka團隊發布了初代Mureka V1(SkyMusic),并在近一年時間里持續迭代升級。
如今,全新基座模型Mureka V6橫空出世,首次引入ICL(in-context learning)后,顯著強化了聲場開闊度、人聲質感、混音設計。
而Mureka O1正是基于Mureka V6之上的「推理增強版」,在CoT加持下,將音樂品質推向極致。
在與主流音樂模型Suno V4等主流客觀評測中,O1以壓倒性優勢,證明了自己的王者地位。
評測選用了100條英文Prompt,每款模型在相同的提示下,分別生成100條英文歌曲進行橫向對比。
結果可以看出,Mureka O1在發音錯詞率、樂段準確率、制作質量等客觀指標,在行業中處于領先位置。
Mureka O1在文本生成音樂的客觀測評中得分
當然,音樂的魅力最終取決于人的聆聽體驗,因此主觀與客觀評價缺一不可。
主觀測評中,Mureka O1以出色的音樂品質全面超越Suno V4,尤其在整體聽感上占據優勢。
而且,其樂器演奏的多樣性與配器設計的精妙程度遠超對手,同時在音質、人聲表現,以及BGM質感上實現顯著提升。
Mureka O1在主觀測評中整體聽感超越Suno V4
不僅如此,O1/V6的生成速度,也令人嘆服。
不管是生成音樂的耗時,還是可完整下載的耗時,它們皆能完勝對手,能提供即時、高質量的創作體驗。
Mureka O1實現了行業領先的低延時音樂生成
無論是發音清晰程度,還是生成樂段的精準度與自然結束率,Mureka O1都穩穩占據AI音樂的「C位」。
能夠碾壓Suno V4,它的秘密武器是什么?
業界首創MusiCoT框架
Mureka O1的背后,是團隊傾力打造的MusiCoT框架。
這不僅是CoT在音樂領域的首次應用,更是一次結構化生成的革命性嘗試。
論文地址:MusiCoT.github.io
MusiCoT跳脫了傳統模型的局限,先通過全局視角預生成音樂結構,在精細化填充音頻細節。
具體來說,從主歌、副歌到過渡段,再到細粒度音頻token的填充中。
這種「從宏觀到微觀」的生成邏輯,確保了音樂在連貫性、層次感、藝術性上的極致表現。
更令人驚嘆的是,MusiCoT基于CLAP模型構建,無需人工標注即具備高擴展性,大幅提升生成音樂可解釋性與藝術感染力。
只需要輸入一個場景提示,Mureka O1幾秒內即可輸出媲美專業水準的音樂作品。
Mureka O1還提供獨立的人聲、伴奏等多軌輸出,極大方便用戶后續混音與二次創作。
可以說,MusiCoT為高保真AI音樂生成開辟了全新路徑,推動音樂AI創作邁入結構化時代。
開放API,共建AI音樂開發者生態
面向企業和開發者,Mureka同時開放兩大類靈活的API服務,不僅包括音樂音頻生成API,還有語音合成API。
1. 音樂API
標準音樂生成API:支持多種輸入包括文本提示、音色參考、音頻參考的音樂生成,歌詞創作。通過不同維度的輸入,系統可生產多風格音樂及純音樂,適用于內容創作、游戲配樂、短視頻等多場景應用
精調私有曲庫API:上傳私有曲庫定制專屬風格,模型精調技術深度解析每一首旋律風格偏好,無需音樂知識也可輕松定制品牌音樂、個人專輯等專屬內容
2. 語音API
AI語音播客、精品說話人、音色克隆等API,用于語音播客、預制精品音色語音合成、音色克隆等場景
不僅如此,Mureka也同步開發前沿語音合成API:Mureka TTS。
Mureka TTS在與ElevenLabs、OpenAI、微軟的橫向評測中表現出色,對話聊天類全場景效果與一線廠商不相上下。
在聊天對話類文本數據上,Mureka TTS整體聽感達到了4.34分
Mureka成為全球首個開放模型微調的AI音樂平臺,并開放了基于最新V6模型微調服務。
開發者可上傳私有數據,訓練專屬模型,而且數據嚴格保密,不會被用于基座模型的訓練。
有了這項功能,不論是音樂人、制作人,還是品牌與游戲開發者,都能打造出獨一無二的專輯。
要知道,Mureka的10種語言,基本包圓了全球大部分國家和地區。
而這,就意味著ToB巨大的市場規模!
目前,Mureka已經擁有了超過100多個國家和地區的用戶。而在以往的出海經驗中,昆侖萬維已經觀察到,內容、娛樂賽道的用戶和收入增長都十分明顯。
其實在這方面,昆侖萬維已經擁有了成功先例,比如之前推出的一款K歌產品Star Maker,已經在海外幾十個國家上線,歷史注冊用戶直接突破3.1億。
而內容和娛樂賽道C端應用的特點,就是用戶對AI輸出容錯率較高,因此也擁有極高的市場上限。全球80億人即使只有1%的用戶買單,也會形成驚人的規模收入!
一句話就是,Mureka的商業化前景,潛力驚人。
AI音樂市場爆發,Mureka解鎖新世界
音樂是人類情感的共鳴,而AI正在讓它變得更豐富、更觸手可及。
市場數據,也從印證了AI生成音樂領域的無限潛力。
Fortune Business Insights數據顯示,2023年全球數字音頻工作站(DAW)市場規模已達約30億美元,預計到2026年,約70%的DAW企業將使用AI技術輔助音樂創作。
進一步市場研究表明,GlobeNewswire預測全球DAW市場規模到2032年將超過66.2億美元,2024年-2032年的復合年增長率為8.6%。
昆侖萬維敏銳地捕捉這一風口,以「All in AGI與AIGC」戰略驅動,在實現AGI道路上步履不停。
Mureka正是這一布局的明星選手,它不僅體現了昆侖萬維將技術轉化為生產力的決心,也讓我們看到一個更宏大的愿景——讓每個人更好地塑造和表達自我。
值得一提的是,Mureka的名字源自「Music」和「Eureka」的結合,寓意靈感迸發的「尤里卡時刻」。
它不僅僅是一款工具,更是AI音樂浪潮中的先行者,賦能每個人成為創作者。
如今,Mureka已蓄勢待發,等你來解鎖它的無限可能。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.