網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

Qwen3深夜正式開源，小尺寸也能大力出奇跡。

2025-04-29 08:11:26　來源: 數(shù)字生命卡茲克

天津舉報

分享至

小道消息一直在說，昨天深夜或者今天凌晨，阿里會發(fā)Qwen3。

然后我特意早早的睡了一兩小時，凌晨1點起床，就為了等Qwen3發(fā)。

結果這一等，就是好幾個小時。。。

不過，功夫不負有心人。

凌晨5點，我眼睛都睜不開的時候，終于等到了。

Qwen你賠我睡眠。。。

把報告看完，我總結一下，覺得最大的亮點有6個：

1. 模型能力登頂全球，這個沒啥可說的，就是No.1。

2. 第一個開源的混合推理模型。

3. 8個不同尺寸的模型，幾乎覆蓋了所有場景。

4. 成本很低， 旗艦模型235B參數(shù)部署成本只要DeepSeek R1的三分之一。

5. 支持MCP協(xié)議。

6. 居然還支持了119種語言。

一起說吧。

這次發(fā)了8個模型，Qwen3-0.6B、1.7B、4B、8B、14B、32B，這6個都是Dense稠密模型。

還有兩個重量級MoE模型，Qwen3-30B-A3B，和旗艦版的Qwen3-235B-A22B。

這次Qwen采用了新的命名方式，Qwen3-0.6B、1.7B、32B這種沒啥可說的，大家都理解。

兩個MoE模型，把激活的參數(shù)寫在后面， Qwen3-235B-A22B的意思就是235B的參數(shù)，但是在推理時只激活22B。

Qwen3-30B-A3B就是總參數(shù)量為30B，激活參數(shù)3B，這個還蠻有意思的。

而且，所有的模型，都是混合推理模型。

大概的意思就是，你既可以把它當不會長思考沒有思維鏈的普通模型用，也可以直接開啟推理模式，變成一個推理模型。

可以簡單的理解為，把DeepSeek V3和R1直接揉在了一起。

就像我們其實都知道，DeepSeek這個深度思考，你打開的時候，是R1模型，但是你關掉，其實用的是v3來給你回答。

但是Qwen3，是一體的。

是一個模型，只不過支持了兩種模式，這個不管對于開發(fā)者還是使用者，都方便很多。

整體上，8個模型，誠意足到爆炸，小到0.6B，大到235B，能打手機端側，也能打旗艦體驗，全部一次性開源了，而且都是Apache 2.0協(xié)議，想怎么用就怎么用，想商用就商用，沒啥顧慮。

Qwen3-0.6B~4B的最大Token都是32K，其他的都是128K。

性能上，稍微有點離譜。

Qwen3-4B的小模型，就已經(jīng)能和上一代QwQ-32B這玩意打得有來有回。而Qwen3-30B-A3B，更是幾乎就比QwQ-32B全方位的強。

至于最牛逼的那個 Qwen3-235B-A22B，他們甚至沒只跟開源模型比，比的全都是最頂級的閉源模型。

最主要的是，這玩意部署成本，大概只有DeepSeek R1的三分之一啊。。。

什么叫便宜大碗，這就是。

但是這么一對比，忽然發(fā)現(xiàn)，Gemini2.5-Pro，好像有點猛。。。

同時，在性能水桶式提升的背景下，也有了更強的Agent能力，也支持MCP了。

他們官方自己放了一段視頻。

我也隨手把即夢接了進去，可以直接用Qwen3來調用即夢畫圖了。。。

就還真的，挺好玩，你的下一個即夢，又何必是即夢呢（狗頭。

除了這些模型的能力，Qwen3這次還有一個很有趣的東西。

就是語言。

上一代的Qwen2.5，只支持包括中文、英文、法文、西班牙文、葡萄牙文、德文、意大利文、俄文、日文、韓文、越南文、泰文、阿拉伯文等 29 種語言。

而這一次，支持119種語言了。

不是，到底誰才是真正的OpenAI啊。

這妥妥是為世界人民謀福利好吧。。。

項目地址都在這了。

Blog: https://qwenlm.github.io/blog/qwen3/

GitHub: https://github.com/QwenLM/Qwen3

你牛逼的話可以自己部署，我5080勉強跑個Qwen3-8B，實在跑不起。

想體驗的話，可以直接去通義和Qwen Chat，都可以。

通義： https://www.tongyi.com/qianwen/

Qwen Chat： https://chat.qwen.ai/

我自己直接在Qwen Chat上面實測了一波，一進來左上角就默認是旗艦版Qwen3。

嗯，就是比較抽象的是，提示語都居然都變成早上好，卡茲克了。。。

你可以在左上角，切換3個這次Qwen3比較有代表的模型來進行對比。

左下角的深度思考，就能是否開啟推理的開關。

而且這個開關還能拖動滑塊，決定它的最大思考長度，雖然這個功能很極客，但是還有意思。

我自己的實測結論就是：水桶級別，中等偏上。

比如讓它給我生成一個登錄頁。

效果很不錯，能直接干出一個很酷的界面。

https://us4mpg09fz.app.yourware.so/

或者做藏師傅搞得可交互的網(wǎng)頁，把吃瓜PDF變成在線時間線。

這時候你就會發(fā)現(xiàn)，審美會差一點，豐富度也會不是特別狗，稍微有一點點勉強了。

而如果再讓它寫一個之前我在文章里放的洛小山的彈球游戲的Prompt：

我會給你一個文件，分析內容，并將其轉化為美觀漂亮的中文可視化網(wǎng)頁作品集：
## 內容要求
- 保持原文件的核心信息，但以更易讀、可視化的方式呈現(xiàn)
- 在頁面底部添加作者信息區(qū)域，包含：    
 * 作者姓名: [作者姓名]
 * 社交媒體鏈接: 至少包含Twitter/X：  
- 版權信息和年份
## 設計風格
- 整體風格參考Linear App的簡約現(xiàn)代設計
- 使用清晰的視覺層次結構，突出重要內容
- 配色方案應專業(yè)、和諧，適合長時間閱讀
## 技術規(guī)范
- 使用HTML5、TailwindCSS 3.0+（通過CDN引入）和必要的JavaScript
- 實現(xiàn)完整的深色/淺色模式切換功能，默認跟隨系統(tǒng)設置
- 代碼結構清晰，包含適當注釋，便于理解和維護
## 響應式設計
- 頁面必須在所有設備上（手機、平板、桌面）完美展示
- 針對不同屏幕尺寸優(yōu)化布局和字體大小
- 確保移動端有良好的觸控體驗
## 媒體資源
- 使用文檔中的Markdown圖片鏈接（如果有的話）
- 使用文檔中的視頻嵌入代碼（如果有的話）
## 圖標與視覺元素
- 使用專業(yè)圖標庫如Font Awesome或Material Icons（通過CDN引入）
- 根據(jù)內容主題選擇合適的插圖或圖表展示數(shù)據(jù)
- 避免使用emoji作為主要圖標
## 交互體驗
- 添加適當?shù)奈⒔换バЧ嵘脩趔w驗：    
 * 按鈕懸停時有輕微放大和顏色變化    
 * 卡片元素懸停時有精致的陰影和邊框效果    
 * 頁面滾動時有平滑過渡效果    
 * 內容區(qū)塊加載時有優(yōu)雅的淡入動畫
## 性能優(yōu)化
- 確保頁面加載速度快，避免不必要的大型資源
- 實現(xiàn)懶加載技術用于長頁面內容
## 輸出要求
- 提供完整可運行的單一HTML文件，包含所有必要的CSS和JavaScript
- 確保代碼符合W3C標準，無錯誤警告
- 頁面在不同瀏覽器中保持一致的外觀和功能
請根據(jù)上傳文件的內容類型（文檔、數(shù)據(jù)、圖片等），創(chuàng)建最適合展示該內容的可視化網(wǎng)頁。

確實沒有那么亮眼，在游玩的時候還有一些些BUG。

但是畢竟這個游戲還是太復雜了，人模型的尺寸也沒那么大，也沒法既要又要。

如果是做稍微簡單一點的連連看游戲，就還是比較簡單了。

             
    div>，所有的游戲文字都是英文

除了代碼，邏輯問題，現(xiàn)在基本也不太能難道現(xiàn)在的推理大模型了。

不過在遇到一些非常離奇非正常的測試prompt時，還是會有一點點掉智。

文筆的話，親測會比DeepSeek好一些。

但是略遜于GPT-4o。

如果你還想玩一點花活，還能跟即夢打通做結合。

就能實現(xiàn)類似于那種原生多模態(tài)模型，圖文混排的效果。

還是超級有意思的。

總之，這次Qwen3的發(fā)布，真的有點像是深夜街頭，突然亮起的那盞霓虹燈。

不僅亮，還便宜。

不僅便宜，還能庫庫的切換顏色。

這一波下來，阿里確實是拿出了一種很阿里的態(tài)度。

8點了，天也亮了。

該去睡覺了。

最后。

Qwen3，歡迎來到這個荒誕又燦爛的時代。

咱們，下個奇點見。

以上，既然看到這里了，如果覺得不錯，隨手點個贊、在看、轉發(fā)三連吧，如果想第一時間收到推送，也可以給我個星標?～謝謝你看我的文章，我們，下次再見。

>/ 作者：卡茲克、dongyi

>/ 投稿或爆料，請聯(lián)系郵箱：wzglyay@virxact.com

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.