99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

7B模型搞定AI視頻通話,阿里最新開源炸場,看聽說寫全模態(tài)打通

0
分享至

西風(fēng) 明敏 發(fā)自 凹非寺
量子位 | 公眾號(hào) QbitAI

深夜重磅!阿里發(fā)布并開源首個(gè)端到端全模態(tài)大模型——

通義千問Qwen2.5-Omni-7B,來了。

僅靠一個(gè)一體式模型,就能搞定文本、音頻、圖像、視頻全模態(tài),并實(shí)時(shí)生成文本和自然語音。

堪稱7B模型的全能冠軍。

你的iPhone搭載的很可能就是它!

現(xiàn)在打開Qwen Chat,就能直接和它實(shí)時(shí)進(jìn)行視頻或語音交互:



話不多說,先來看一波能力展示。

在大街上同它視頻通話,它能正確識(shí)別周圍環(huán)境,按照你的需求為你推薦餐館:



視頻鏈接:https://mp.weixin.qq.com/s/VkJP89bpgZaxaKz-1wav9A

走進(jìn)廚房,它又化身“智能菜譜”,一步步指導(dǎo)你變成大廚:



視頻鏈接:https://mp.weixin.qq.com/s/VkJP89bpgZaxaKz-1wav9A

在多模態(tài)任務(wù)OmniBench評(píng)測中,Qwen2.5-Omni表現(xiàn)刷新記錄拿下新SOTA,遠(yuǎn)超谷歌Gemini-1.5-Pro等同類模型。

在單模態(tài)的語音識(shí)別、翻譯、音頻理解、圖像推理、視頻理解、語音生成任務(wù)中,Qwen2.5-Omni的全維度表現(xiàn)也都優(yōu)于類似大小的單模態(tài)模型以及閉源模型。

在seed-tts-eval語音生成基準(zhǔn)中,Qwen2.5-Omni展現(xiàn)出與人類水平相當(dāng)?shù)恼Z音合成能力。



這意味著Qwen2.5-Omni-7B能很好地和世界進(jìn)行實(shí)時(shí)交互,甚至能輕松識(shí)別音視頻情緒。

再來敲重點(diǎn):

模型非常輕量,手機(jī)等終端都可輕松部署運(yùn)行,且開源用的是寬松的Apache2.0協(xié)議,開發(fā)者、企業(yè)現(xiàn)在都可免費(fèi)在魔搭社區(qū)或Hugging Face下載商用

Qwen2.5-Omni-7B一開源,網(wǎng)友直呼這才是真正的OpenAI(doge)。



網(wǎng)友紛紛表示可以直接拿來裝到智能眼鏡上了:

這可能是智能眼鏡的完美模型。



7B模型的新紀(jì)錄!



目前,在Qwen Chat上即可體驗(yàn)該模型支持的AI語音和視頻通話功能。

更多實(shí)例,一起來看~

實(shí)測效果驚艷

首先,Qwen2.5-Omni-7B能勝任免費(fèi)的數(shù)學(xué)家教。

它能像人類老師一樣,看到題目、聽懂問題,并且一步一步耐心講解。



視頻鏈接:https://mp.weixin.qq.com/s/VkJP89bpgZaxaKz-1wav9A

更復(fù)雜的論文它也看得懂。

只需共享屏幕,然后將論文從上至下滑動(dòng),“給它看一遍”。

它就能通俗解釋論文內(nèi)容。

比如PPT、網(wǎng)頁資料等,也能找它做講解。



而且它還有一定藝術(shù)見解,比如可以陪著你畫畫,然后給出指導(dǎo)建議。



或者聽你演奏的音樂,給出更好的改進(jìn)建議。



我們還進(jìn)行了一手實(shí)測,在Qwen Chat上每天可使用語音和視頻聊天10次。



實(shí)測中,模型能很好地理解商品界面和優(yōu)惠政策。

響應(yīng)速度也很快,并且會(huì)引導(dǎo)人類繼續(xù)問下去、很有耐心。

需要注意的是,當(dāng)前視頻通話還只是Beta測試版,每次通話限時(shí)3分鐘。



視頻鏈接:https://mp.weixin.qq.com/s/VkJP89bpgZaxaKz-1wav9A

Hugging Face的產(chǎn)品負(fù)責(zé)人Jeff Boudier也第一時(shí)間上手試玩。

模型的英文能力一樣出眾,而且它不僅回答看到了杯子,還細(xì)致描述了杯子上的笑臉花紋。



視頻鏈接:https://mp.weixin.qq.com/s/VkJP89bpgZaxaKz-1wav9A

首創(chuàng)Thinker-Talker雙核架構(gòu)

目前官方已放出Qwen2.5-Omni技術(shù)Blog和論文。

Qwen2.5-Omni采用通義團(tuán)隊(duì)首創(chuàng)的全新架構(gòu)——Thinker-Talker雙核架構(gòu)

其中,Thinker就像“大腦”,負(fù)責(zé)處理和理解來自文本、音頻、視頻等多模態(tài)的輸入信息,生成高層語義表征以及對(duì)應(yīng)的文本內(nèi)容。

Talker則更像“嘴巴”,以流式的方式接收由Thinker實(shí)時(shí)輸出的語義表征與文本,并流暢地合成離散語音tokens。

具體來說,Thinker基于Transformer解碼器架構(gòu),融合音頻/圖像編碼器進(jìn)行特征提取。

而Talker采用雙軌自回歸Transformer解碼器設(shè)計(jì),在訓(xùn)練和推理過程中直接接收來自Thinker的高維表征,并共享Thinker的全部歷史上下文信息。因此,整個(gè)架構(gòu)作為一個(gè)緊密結(jié)合的單一模型運(yùn)行,支持端到端的訓(xùn)練和推理。

與此同時(shí),團(tuán)隊(duì)還提出了一種新的位置編碼算法TMRoPE(Time-aligned Multimodal RoPE)以及Position Embedding(位置嵌入)融合音視頻技術(shù)

TMRoPE編碼多模態(tài)輸入的三維位置信息,即多模態(tài)旋轉(zhuǎn)位置嵌入(M-RoPE),并結(jié)合絕對(duì)時(shí)間位置,通過將原始旋轉(zhuǎn)嵌入分解為時(shí)間、高度和寬度三個(gè)部分實(shí)現(xiàn)。



另外值得一提的是,從技術(shù)層面來看,Qwen2.5-Omni和一般的視頻/語音理解模型以及其相應(yīng)的視頻/語音對(duì)話的AI功能,也有本質(zhì)性區(qū)別。

在傳統(tǒng)語音理解大模型的人機(jī)交互場景里,一般運(yùn)用 ASR(Automatic Speech Recognition,自動(dòng)語音識(shí)別)技術(shù),把人類語音轉(zhuǎn)換為文字文本,隨后將其交給大語言模型處理,最終生成的內(nèi)容借助 TTS(Text-to-Speech,語音合成)技術(shù)轉(zhuǎn)化為語音反饋給用戶。

而視頻理解模型是基于圖片、視頻進(jìn)行大模型理解,并以文字形式輸出反饋。

這兩種模型均屬于相互獨(dú)立的單鏈路模型。在一些AI應(yīng)用中,甚至?xí)?lián)多個(gè)模型來實(shí)現(xiàn)類似功能,如此一來,鏈路變得更長,效率大打折扣。

Qwen2.5-Omni-7B的特點(diǎn)在于,它原生支持視頻、圖片、語音、文字等多模態(tài)輸入,并能原生生成語音及文字等多模態(tài)輸出

也就是說,一個(gè)模型就能通過“看”、“聽”、“閱讀”等多種方式來綜合思考。



所以Qwen2.5-Omni得以在一系列同等規(guī)模的單模態(tài)模型權(quán)威基準(zhǔn)測試中,拿下最強(qiáng)全模態(tài)性能,在語音理解、圖片理解、視頻理解、語音生成等領(lǐng)域的測評(píng)分?jǐn)?shù),均領(lǐng)先于專門的音頻(Audio)或視覺語言(VL)模型。

搶先看到Apple Intelligence?

一個(gè)月前,阿里公開確認(rèn)與蘋果合作,宣布通義千問將為國行iPhone用戶提供AI功能,此消息一經(jīng)披露,便在科技圈引發(fā)熱議。

而這次Qwen2.5-Omni開源,就是奔著端側(cè)部署來的,7B尺寸使其具備直接嵌入手機(jī)的可行性,仿佛提前看到了Apple Intelligence,讓大家看到多模態(tài)大模型上手機(jī)都能有哪些效果。

不只是蘋果,據(jù)量子位了解,這種端側(cè)部署能力已吸引超90%國產(chǎn)手機(jī)品牌接入通義千問,包括OPPO、vivo、榮耀、傳音等,還有眾多汽車品牌、AI硬件產(chǎn)品選擇與之?dāng)y手。

為啥都選通義千問?

梳理通義千問的最新發(fā)展動(dòng)態(tài),答案便不難理解。

首先,通義千問Qwen目前已穩(wěn)居全球最大AI大模型族群。

僅在最近一個(gè)月的時(shí)間里,就接連推出了一系列具有競爭力的模型:推理模型Max旗艦版QwQ-Max-Preview、視頻生成模型Wan 2.1、推理模型QwQ-32B、視覺語言模型Qwen2.5-VL-32B-Instruct……

實(shí)際上,2023年至今,阿里通義團(tuán)隊(duì)已累計(jì)開源200多款模型,涵蓋從0.5B到110B全尺寸范圍,模型類型覆蓋文本生成、視覺理解與生成、語音理解與生成、文生圖及視頻模型等全模態(tài)領(lǐng)域,應(yīng)用場景也極為豐富。

在海內(nèi)外開源社區(qū)中,通義千問Qwen衍生模型數(shù)量更是一路飆升,現(xiàn)已超過10萬,超越Llama系列。

根據(jù)Hugging Face 在2月10日發(fā)布的最新全球開源大模型榜單,排名前十的開源大模型無一例外,全部是基于通義千問Qwen開源模型二創(chuàng)的變體模型。



其次,阿里巴巴通過開源等一系列積極舉措,成功構(gòu)建起一個(gè)豐富且活躍的大模型生態(tài)。

阿里不僅將開源進(jìn)行到底,更向大模型公司提供了全方位的服務(wù)支持,其中包括算力資源以及開發(fā)工具等,阿里云已成為中國大模型領(lǐng)域的公共AI算力底座。

截至2025年2月中旬,阿里魔搭社區(qū)ModelScope的模型總量已超4萬個(gè),服務(wù)超1000萬開發(fā)者。

那么通義千問Qwen團(tuán)隊(duì)下一步要干啥?

期待聽到您的反饋,并看到您使用Qwen2.5-Omni開發(fā)的創(chuàng)新應(yīng)用。
在不久的將來,將著力增強(qiáng)模型對(duì)語音指令的遵循能力,并提升音視頻協(xié)同理解能力。還將持續(xù)拓展多模態(tài)能力邊界,發(fā)展全面的通用模型。



感興趣的友友不如一起來上手試試吧~

Qwen Chat:https://chat.qwenlm.ai

Hugging Face:https://huggingface.co/Qwen/Qwen2.5-Omni-7B

ModelScope:https://modelscope.cn/models/Qwen/Qwen2.5-Omni-7B

DashScope:https://help.aliyun.com/zh/model-studio/user-guide/qwen-omni

GitHub:https://github.com/QwenLM/Qwen2.5-Omni

Demo體驗(yàn):https://modelscope.cn/studios/Qwen/Qwen2.5-Omni-Demo

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
女單世界亞軍被淘汰!0:3不敵韓國申裕斌,冠軍賽女單8強(qiáng)出爐6席

女單世界亞軍被淘汰!0:3不敵韓國申裕斌,冠軍賽女單8強(qiáng)出爐6席

國乒二三事
2025-04-04 18:39:12
寧波63歲老太太查出艾滋病,尋找感染源頭,醫(yī)生發(fā)現(xiàn)了特別之處

寧波63歲老太太查出艾滋病,尋找感染源頭,醫(yī)生發(fā)現(xiàn)了特別之處

黑貓故事所
2025-04-03 11:52:35
頭一回見買家秀居然能把賣家秀比下去

頭一回見買家秀居然能把賣家秀比下去

小光侃娛樂
2025-03-21 15:40:03
阿諾21歲前交過3個(gè)外國男友,都沒董力靠譜,她碩士畢業(yè)精明的很

阿諾21歲前交過3個(gè)外國男友,都沒董力靠譜,她碩士畢業(yè)精明的很

阿鳧愛吐槽
2025-04-04 17:49:21
全球震感強(qiáng)烈,只有中國挺住了

全球震感強(qiáng)烈,只有中國挺住了

新浪財(cái)經(jīng)
2025-04-04 09:14:03
仁川冠軍賽冷門不斷,國乒一喜、日乒一憂!

仁川冠軍賽冷門不斷,國乒一喜、日乒一憂!

田先生籃球
2025-04-03 22:41:57
房琪嫌棄葉童年紀(jì)大拒絕組隊(duì),葉童霸氣反擊,謝娜齊思鈞力挺葉童

房琪嫌棄葉童年紀(jì)大拒絕組隊(duì),葉童霸氣反擊,謝娜齊思鈞力挺葉童

涵豆說娛
2025-04-04 14:40:42
12幅扎心漫畫,12個(gè)深刻道理,值得收藏!

12幅扎心漫畫,12個(gè)深刻道理,值得收藏!

詩詞天地
2025-04-02 06:01:34
國務(wù)院副總理、國務(wù)委員共同出席會(huì)議,聚焦“重中之重”

國務(wù)院副總理、國務(wù)委員共同出席會(huì)議,聚焦“重中之重”

政知新媒體
2025-04-03 22:31:26
菲律賓的商鞅:永別了,老杜!

菲律賓的商鞅:永別了,老杜!

今日養(yǎng)生之道
2025-03-20 06:44:35
17+6正負(fù)值全場最高!別再拿余嘉豪碰瓷楊瀚森 他的舞臺(tái)在NBA

17+6正負(fù)值全場最高!別再拿余嘉豪碰瓷楊瀚森 他的舞臺(tái)在NBA

大嘴爵爺侃球
2025-04-04 23:42:22
3比0橫掃!伊藤美誠王者歸來強(qiáng)勢殺入8強(qiáng),淘汰王藝迪沖擊冠軍?

3比0橫掃!伊藤美誠王者歸來強(qiáng)勢殺入8強(qiáng),淘汰王藝迪沖擊冠軍?

體壇知道分子
2025-04-04 09:49:01
山西沁源平遙交界處發(fā)生山火 搶險(xiǎn)工作連夜進(jìn)行

山西沁源平遙交界處發(fā)生山火 搶險(xiǎn)工作連夜進(jìn)行

環(huán)球網(wǎng)資訊
2025-04-04 21:54:51
清明節(jié)“白天無禁忌,晚上6注意”,今日清明節(jié),晚上注意什么?

清明節(jié)“白天無禁忌,晚上6注意”,今日清明節(jié),晚上注意什么?

智慧生活筆記
2025-04-04 13:55:59
大陸發(fā)兵圍臺(tái)第二天,美軍機(jī)來了,爆發(fā)激烈對(duì)峙,解放軍遠(yuǎn)火亮相

大陸發(fā)兵圍臺(tái)第二天,美軍機(jī)來了,爆發(fā)激烈對(duì)峙,解放軍遠(yuǎn)火亮相

DS北風(fēng)
2025-04-02 17:57:27
美股開盤繼續(xù)重挫超2%

美股開盤繼續(xù)重挫超2%

財(cái)聯(lián)社
2025-04-04 21:32:01
女裁判波茲諾娃將執(zhí)裁斯諾克世錦賽決賽,將執(zhí)裁過全部三大賽決賽

女裁判波茲諾娃將執(zhí)裁斯諾克世錦賽決賽,將執(zhí)裁過全部三大賽決賽

直播吧
2025-04-04 10:36:23
馬斯克:是的,假新聞

馬斯克:是的,假新聞

新京報(bào)政事兒
2025-04-04 07:18:03
漲價(jià)的迪卡儂,賣不動(dòng)了

漲價(jià)的迪卡儂,賣不動(dòng)了

源Sight
2025-04-03 15:56:48
又兩起!突然燒成一片!北京近期高發(fā),千萬別再這樣做!

又兩起!突然燒成一片!北京近期高發(fā),千萬別再這樣做!

掌上 北京
2025-04-04 08:02:51
2025-04-05 00:15:00
量子位 incentive-icons
量子位
追蹤人工智能動(dòng)態(tài)
10270文章數(shù) 176077關(guān)注度
往期回顧 全部

科技要聞

DeepSeek提出新方法 或?qū)?yīng)用于R2

頭條要聞

美媒感慨:特朗普給了中國黃金機(jī)遇 讓他們贏得全世界

頭條要聞

美媒感慨:特朗普給了中國黃金機(jī)遇 讓他們贏得全世界

體育要聞

挑對(duì)手!恩怨局!CBA季后賽故事可太多了

娛樂要聞

汪小菲懶理S媽暗諷,帶孩子戶外散步

財(cái)經(jīng)要聞

中方多箭齊發(fā)!對(duì)美加征34%關(guān)稅

汽車要聞

別克GL8陸尚內(nèi)飾官圖發(fā)布 有望上海車展亮相

態(tài)度原創(chuàng)

數(shù)碼
本地
時(shí)尚
教育
公開課

數(shù)碼要聞

小米米家智能嵌入式洗碗機(jī) P20(18 套)上架,5999 元

本地新聞

我在新昌當(dāng)女主|大佛寺氛圍感拉滿 古偶頂流機(jī)位GET

在春天,遇見最美的配色

教育要聞

辛集市第二實(shí)驗(yàn)學(xué)校燃烽火!620名青少年逐鹿乒乓球邀請(qǐng)賽

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 涿鹿县| 珠海市| 定安县| 洛宁县| 新河县| 凉城县| 平远县| 库尔勒市| 外汇| 南皮县| 晋中市| 桃园县| 五峰| 安西县| 隆德县| 囊谦县| 安多县| 遂宁市| 云梦县| 张家港市| 阿巴嘎旗| 额济纳旗| 吉林市| 文昌市| 永兴县| 上杭县| 安义县| 长子县| 会宁县| 改则县| 始兴县| 兴隆县| 湛江市| 吉林市| 渝北区| 将乐县| 维西| 安化县| 长治市| 铜鼓县| 米泉市|