99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

阿里深夜開源推理模型QwQ-32B,性能比肩R1滿血版。

0
分享至

今夜,Manus發布之后,隨之而來趕到戰場的,是阿里。


凌晨3點,阿里開源了他們全新的推理模型。

QwQ-32B。

本來還有點意識模糊,當看到他們發出來的性能比對圖,我人傻了。


不是,我沒看懂,這特么是個什么怪物。

在幾乎所有數據集里,QwQ-32B 都已經能跟滿血版DeepSeek R1(671B)表現相當了。尤其是作為QwQ-32B 的主攻方向的數學和代碼。

而且,QwQ-32B在基準測試上的性能跑分,幾乎拉開o1-mini一個身位。

我人已傻。

今天這夜,對我的沖擊有一點大。

GPT4.5剛剛證明傳統的那套快撞墻了,轉頭阿里就來給你掏個大的,說,你看,強化學習還是能卷的,這條路,遠遠還沒到頭。

這么令人詫異的性能表現,其實也跟這兩天在arxiv出來的一篇爆火論文互相印證了。

一堆斯坦福教授集中討論,為什么Qwen-2.5-3B一開始就能自己檢查自己的答案,Llama-3.2-3B卻不行。

最后的原因還是落在了Qwen團隊的強化學習上。因為,這能讓模型自己學會一些關鍵的“思考習慣”。


沒啥可說的,阿里NB。QwenNB。

QwQ-32B開源鏈接在此:

魔搭開源鏈接:https://modelscope.cn/models/Qwen/QwQ-32B

huggingface開源鏈接:https://huggingface.co/Qwen/QwQ-32B

當然如果想直接上手體驗,官方也給出了在線體驗的地址:

https://chat.qwen.ai/?models=Qwen2.5-Plus

左上角模型選擇Qwen2.5-Plus,然后開啟Thinking(QwQ),就能用QwQ-32B了。


我這邊也第一時間在AutoDL租了一臺A800-80G的顯卡,然后把模型下載了下來,并部署測試了一下這個怪物。綜合體驗下來,本地部署版和網頁版其實是一樣的。


性能曲線是這樣的。


我也做了一些測試。

首先就是,我覺得賽博半仙易主了。這回的QwQ-32B真的能當八字算命大師了。

懂得都懂,AI自媒體人的命也是命,它掐指一算,就知道我經常熬大夜,狂肝文章。下半年家里那些雞毛蒜皮的事就別提了,為了搭我的攝影棚,把景深弄得更到位,我是真得搬家啊。。。


當然,AI算命只能算是個開胃菜,接下來還是得認真測下QwQ-32B的數學能力。

然后就是拿我的著名的國慶調休題來難為下這類推理模型了:

這是中國2024年9月9日(星期一)開始到10月13日的放假調休安排:上6休3上3休2上5休1上2休7再上5休1。請你告訴我除了我本來該休的周末,我因為放假多休息了幾天?

比如Grok3這種,開了推理還是直接炸了。


答案明明是4天,你咋獨自加了3天。。。

而看看QwQ-32B,在一頓小推理之后。


最后答案,完全正確。


要知道,這可只是一個32B的小模型啊。。

然后我還試了一下代碼能力。我就直接去Leetcode找了一道困難級別的算法題,解數獨。

可能有人不知道Leetcode是啥,LeetCode 是一個全球知名的在線編程練習平臺,這個平臺有大量不同難度的算法題庫,從簡單到困難的各種編程題都有。

我直接把解數獨的題目還有代碼模板丟給QwQ-32B,讓它給出最優解的代碼:

編寫一個程序,通過填充空格來解決數獨問題。

數獨的解法需遵循如下規則:

數字 1-9 在每一行只能出現一次。

數字 1-9 在每一列只能出現一次。

數字 1-9 在每一個以粗實線分隔的 3x3 宮內只能出現一次。(請參考示例圖)

數獨部分空格內已填入了數字,空白格用 '.' 表示。

然后給定你一個類,給我一個比較好的方案:

class Solution(object):

def solveSudoku(self, board):

:type board: List[List[str]]

:rtype: None Do not return anything, modify board in-place instead.

經過幾分鐘的思考,這道題的完整最優解代碼也是被QwQ-32B成功給出。


我把這段代碼粘貼到了Leetcode平臺上,直接提交,沒想到這段代碼竟然完美的通過了全部測試用例嗎,而且執行用時才127ms,擊敗了93%的在這個算法題庫做嘗試的人。

說實話,這個結果讓我挺驚訝的,畢竟127ms的用時,看平均的用時基本都在1691ms左右。


很強,但是我覺得最強的,還是它未來的生態。

32B和671B,對于本地算力的要求,或者是云服務的成本來說,差別實在是太大太大了。

671B,在FP16精度下需要1400G的顯存,這個門檻有多高大家懂得都懂。

而現在,32B的QwQ,4張4090就能跑,這是將近15倍的差距。

而且,智能水平差不多。

這也意味著很多普通企業還有普通開發者,可以直接拿到一個足以對標DeepSeek R1的邏輯推理、數學推理、代碼思考能力的大模型,而且還開源,能在自家環境中任意調試、微調、二次開發。

更何況,阿里云上的資源、ModelScope、Hugging Face鏡像都能對接,瞬間就把部署壁壘降到幾乎為零。

對于那些創新型創業者、小型團隊,或者想要做專業AI應用的公司而言,我說實話,這就是天降神兵。

對于大多數的企業垂直場景,一個優秀的32B的模型真的已經足以應付很很多,沒必要非得上600多億參數、又燒又貴的巨無霸。

這波QwQ-32B開源的意義,還是非常強的。

它用實力證明RLHF路線還能玩出花,打破了一些人對GPT4.5撞墻后的過度悲觀。

用中等規模卻拿到高級性能,給開源界注入了強大信心,你也不必搞那種天價設備和超大規模,也有機會跟國際巨頭同場競技。

真的,昨夜爆火的Manus,在技術架構上,也是Claude+很多微調的Qwen小模型。

那這次QwQ-32B,又是一次智能的提升。

每個大廠、每個團隊都在全力沖刺,新的風暴還會一個接一個出現。

睡前一抬頭,日歷翻到新的數字。

又是個不眠之夜。

阿里NB,QwenNB。

我們中國的團隊。

就是NB。

愿我們都能見證更多奇跡。

晚安,或者早安吧。

以上,既然看到這里了,如果覺得不錯,隨手點個贊、在看、轉發三連吧,如果想第一時間收到推送,也可以給我個星標?~謝謝你看我的文章,我們,下次再見。

>/ 作者:卡茲克、芝蘭山、wei

>/ 投稿或爆料,請聯系郵箱:wzglyay@gmail.com

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
鄧亞萍去洛陽賞牡丹, 她漢服造型遭吐槽, 網友:第一眼以為是潘長江

鄧亞萍去洛陽賞牡丹, 她漢服造型遭吐槽, 網友:第一眼以為是潘長江

草莓解說體育
2025-04-14 00:13:05
美前財長耶倫倒戈,表示特朗普應向中國低頭,以換取中國的諒解!

美前財長耶倫倒戈,表示特朗普應向中國低頭,以換取中國的諒解!

大道無形我有型
2025-04-15 18:34:49
經此一戰,中國國際威望大增,全世界的人態度都變了

經此一戰,中國國際威望大增,全世界的人態度都變了

華山穹劍
2025-04-15 20:25:15
央視主持張宏民被逼婚:64歲單身的他,卻被一個遼寧大姐瘋狂追求

央視主持張宏民被逼婚:64歲單身的他,卻被一個遼寧大姐瘋狂追求

混沌錄
2025-04-15 17:44:05
奧運冠軍陳曉敏:這輩子最正確的決定,就是以399萬賣掉所有金牌

奧運冠軍陳曉敏:這輩子最正確的決定,就是以399萬賣掉所有金牌

八斗小先生
2025-04-14 17:05:39
暴跌51%!!鄭州大幅降價

暴跌51%!!鄭州大幅降價

河南交通廣播1041
2025-04-15 11:47:07
城中村里的男女關系亂到啥程度?網友:男人的天堂,女人的樂園

城中村里的男女關系亂到啥程度?網友:男人的天堂,女人的樂園

解讀熱點事件
2025-04-10 00:15:04
均價18.34萬/平方米 保利世博天悅“樓王”漲價入市

均價18.34萬/平方米 保利世博天悅“樓王”漲價入市

觀點機構
2025-04-15 00:20:04
美暈了!今起正式開放!每天限800人,票價公布;網友:“再次被上海震撼到”

美暈了!今起正式開放!每天限800人,票價公布;網友:“再次被上海震撼到”

新民晚報
2025-04-15 13:21:14
注銷必查三年賬?稅局明確!4月15日起,企業注銷必須這樣辦,否則后果嚴重!

注銷必查三年賬?稅局明確!4月15日起,企業注銷必須這樣辦,否則后果嚴重!

祥順財稅俱樂部
2025-04-15 09:08:56
男子花費88萬,包酒店頂層為87歲老母慶生,事后母子雙雙跳樓

男子花費88萬,包酒店頂層為87歲老母慶生,事后母子雙雙跳樓

罪案洞察者
2025-04-11 16:23:36
網友:無錫這樓盤房價降得很猛啊!100多萬說虧就虧,還不算利息

網友:無錫這樓盤房價降得很猛啊!100多萬說虧就虧,還不算利息

火山詩話
2025-04-15 09:46:16
1-3!24場不敗慘遭終結 10.2億豪門仍晉級歐冠4強 上屆亞軍出局

1-3!24場不敗慘遭終結 10.2億豪門仍晉級歐冠4強 上屆亞軍出局

狍子歪解體壇
2025-04-16 05:12:44
河南制造之痛:已沒落的鄭州少林客車廠,中巴客車曾做到全國第一

河南制造之痛:已沒落的鄭州少林客車廠,中巴客車曾做到全國第一

小鵬財經
2025-04-15 17:13:02
蘇州市一級高級警長擬任新職

蘇州市一級高級警長擬任新職

警界君
2025-04-15 21:40:10
南海改個名,就歸菲律賓了?谷歌地圖將南海改名,外交部反將一軍

南海改個名,就歸菲律賓了?谷歌地圖將南海改名,外交部反將一軍

二大爺觀世界
2025-04-16 00:22:29
上海最新人事!他們的新職務明確

上海最新人事!他們的新職務明確

小陸搞笑日常
2025-04-16 00:50:01
《奔跑吧》定檔海報引熱議,太不尊重白鹿了,粉絲要求節目組道歉

《奔跑吧》定檔海報引熱議,太不尊重白鹿了,粉絲要求節目組道歉

農村教育光哥
2025-04-15 09:31:38
三河市綠招牌后續!換顏色原因曝光,各大官媒怒批,負責人已被免

三河市綠招牌后續!換顏色原因曝光,各大官媒怒批,負責人已被免

派大星紀錄片
2025-04-15 12:03:20
所有的明星,都在閑魚標注好了價格

所有的明星,都在閑魚標注好了價格

藍鯨新聞
2025-04-15 15:28:13
2025-04-16 06:11:00
數字生命卡茲克 incentive-icons
數字生命卡茲克
反復橫跳于不同的AI領域,努力分享一些很酷的AI干貨
283文章數 386關注度
往期回顧 全部

科技要聞

小鵬汽車MPV車型改款上市,35.98萬起

頭條要聞

中國不理他特朗普破防了 稱中國為"敵對貿易國家"

頭條要聞

中國不理他特朗普破防了 稱中國為"敵對貿易國家"

體育要聞

惡性循環!錫伯杜的壓榨哲學是對是錯?

娛樂要聞

娛樂圈模范夫妻塌房?私生活曝光!

財經要聞

李強:以更大力度促進消費擴大內需

汽車要聞

19.99萬起 廣汽本田P7能在新能源分一杯羹?

態度原創

親子
本地
數碼
公開課
軍事航空

親子要聞

寶寶為了吃冰淇淋有多努力,還會提前查看媽媽是否睡著。

本地新聞

云游湖北|相約安陸,解鎖限定版粉色春天

數碼要聞

Beats 推出全新充電線系列

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

烏遭俄導彈襲擊 澤連斯基喊話特朗普訪烏

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 阳西县| 望城县| 濮阳县| 鲁甸县| 醴陵市| 三穗县| 集安市| 富源县| 林甸县| 桂平市| 罗城| 偃师市| 卫辉市| 天峻县| 和龙市| 松滋市| 凌海市| 许昌市| 德清县| 仁布县| 邛崃市| 福泉市| 从化市| 鄯善县| 东城区| 柳林县| 和林格尔县| 湘潭县| 丰顺县| 雅江县| 澄迈县| 海丰县| 永泰县| 蛟河市| 北安市| 吉林市| 子洲县| 阿图什市| 木里| 淅川县| 铜山县|