小道消息一直在說,昨天深夜或者今天凌晨,阿里會發Qwen3。
然后我特意早早的睡了一兩小時,凌晨1點起床,就為了等Qwen3發。
結果這一等,就是好幾個小時。。。
不過,功夫不負有心人。
凌晨5點,我眼睛都睜不開的時候,終于等到了。
Qwen你賠我睡眠。。。
把報告看完,我總結一下,覺得最大的亮點有6個:
1. 模型能力登頂全球,這個沒啥可說的,就是No.1。
2. 第一個開源的混合推理模型。
3. 8個不同尺寸的模型,幾乎覆蓋了所有場景。
4. 成本很低, 旗艦模型235B參數部署成本只要DeepSeek R1的三分之一。
5. 支持MCP協議。
6. 居然還支持了119種語言。
一起說吧。
這次發了8個模型,Qwen3-0.6B、1.7B、4B、8B、14B、32B,這6個都是Dense稠密模型。
還有兩個重量級MoE模型,Qwen3-30B-A3B,和旗艦版的Qwen3-235B-A22B。
這次Qwen采用了新的命名方式,Qwen3-0.6B、1.7B、32B這種沒啥可說的,大家都理解。
兩個MoE模型,把激活的參數寫在后面, Qwen3-235B-A22B的意思就是235B的參數,但是在推理時只激活22B。
Qwen3-30B-A3B就是總參數量為30B,激活參數3B,這個還蠻有意思的。
而且,所有的模型,都是混合推理模型。
大概的意思就是,你既可以把它當不會長思考沒有思維鏈的普通模型用,也可以直接開啟推理模式,變成一個推理模型。
可以簡單的理解為,把DeepSeek V3和R1直接揉在了一起。
就像我們其實都知道,DeepSeek這個深度思考,你打開的時候,是R1模型,但是你關掉,其實用的是v3來給你回答。
但是Qwen3,是一體的。
是一個模型,只不過支持了兩種模式,這個不管對于開發者還是使用者,都方便很多。
整體上,8個模型,誠意足到爆炸,小到0.6B,大到235B,能打手機端側,也能打旗艦體驗,全部一次性開源了,而且都是Apache 2.0協議,想怎么用就怎么用,想商用就商用,沒啥顧慮。
Qwen3-0.6B~4B的最大Token都是32K,其他的都是128K。
性能上,稍微有點離譜。
Qwen3-4B的小模型,就已經能和上一代QwQ-32B這玩意打得有來有回。而Qwen3-30B-A3B,更是幾乎就比QwQ-32B全方位的強。
至于最牛逼的那個 Qwen3-235B-A22B,他們甚至沒只跟開源模型比,比的全都是最頂級的閉源模型。
最主要的是,這玩意部署成本,大概只有DeepSeek R1的三分之一啊。。。
什么叫便宜大碗,這就是。
但是這么一對比,忽然發現,Gemini2.5-Pro,好像有點猛。。。
同時,在性能水桶式提升的背景下,也有了更強的Agent能力,也支持MCP了。
他們官方自己放了一段視頻。
我也隨手把即夢接了進去,可以直接用Qwen3來調用即夢畫圖了。。。
就還真的,挺好玩,你的下一個即夢,又何必是即夢呢(狗頭。
除了這些模型的能力,Qwen3這次還有一個很有趣的東西。
就是語言。
上一代的Qwen2.5,只支持包括 中文、英文、法文、西班牙文、葡萄牙文、德文、意大利文、俄文、日文、韓文、越南文、泰文、阿拉伯文等 29 種語言。
而這一次,支持119種語言了。
不是,到底誰才是真正的OpenAI啊。
這妥妥是為世界人民謀福利好吧。。。
項目地址都在這了。
Blog: https://qwenlm.github.io/blog/qwen3/
GitHub: https://github.com/QwenLM/Qwen3
你牛逼的話可以自己部署,我5080勉強跑個Qwen3-8B,實在跑不起。
想體驗的話,可以直接去通義和Qwen Chat,都可以。
通義: https://www.tongyi.com/qianwen/
Qwen Chat: https://chat.qwen.ai/
我自己直接在Qwen Chat上面實測了一波,一進來左上角就默認是旗艦版Qwen3。
嗯,就是比較抽象的是,提示語都居然都變成早上好,卡茲克了。。。
你可以在左上角,切換3個這次Qwen3比較有代表的模型來進行對比。
左下角的深度思考,就能是否開啟推理的開關。
而且這個開關還能拖動滑塊,決定它的最大思考長度,雖然這個功能很極客,但是還有意思。
我自己的實測結論就是:水桶級別,中等偏上。
比如讓它給我生成一個登錄頁。
效果很不錯,能直接干出一個很酷的界面。
https://us4mpg09fz.app.yourware.so/
或者做藏師傅搞得可交互的網頁,把吃瓜PDF變成在線時間線。
這時候你就會發現,審美會差一點,豐富度也會不是特別狗,稍微有一點點勉強了。
而如果再讓它寫一個之前我在文章里放的洛小山的彈球游戲的Prompt:
我會給你一個文件,分析內容,并將其轉化為美觀漂亮的中文可視化網頁作品集:
## 內容要求
- 保持原文件的核心信息,但以更易讀、可視化的方式呈現
- 在頁面底部添加作者信息區域,包含:
* 作者姓名: [作者姓名]
* 社交媒體鏈接: 至少包含Twitter/X:
- 版權信息和年份
## 設計風格
- 整體風格參考Linear App的簡約現代設計
- 使用清晰的視覺層次結構,突出重要內容
- 配色方案應專業、和諧,適合長時間閱讀
## 技術規范
- 使用HTML5、TailwindCSS 3.0+(通過CDN引入)和必要的JavaScript
- 實現完整的深色/淺色模式切換功能,默認跟隨系統設置
- 代碼結構清晰,包含適當注釋,便于理解和維護
## 響應式設計
- 頁面必須在所有設備上(手機、平板、桌面)完美展示
- 針對不同屏幕尺寸優化布局和字體大小
- 確保移動端有良好的觸控體驗
## 媒體資源
- 使用文檔中的Markdown圖片鏈接(如果有的話)
- 使用文檔中的視頻嵌入代碼(如果有的話)
## 圖標與視覺元素
- 使用專業圖標庫如Font Awesome或Material Icons(通過CDN引入)
- 根據內容主題選擇合適的插圖或圖表展示數據
- 避免使用emoji作為主要圖標
## 交互體驗
- 添加適當的微交互效果提升用戶體驗:
* 按鈕懸停時有輕微放大和顏色變化
* 卡片元素懸停時有精致的陰影和邊框效果
* 頁面滾動時有平滑過渡效果
* 內容區塊加載時有優雅的淡入動畫
## 性能優化
- 確保頁面加載速度快,避免不必要的大型資源
- 實現懶加載技術用于長頁面內容
## 輸出要求
- 提供完整可運行的單一HTML文件,包含所有必要的CSS和JavaScript
- 確保代碼符合W3C標準,無錯誤警告
- 頁面在不同瀏覽器中保持一致的外觀和功能
請根據上傳文件的內容類型(文檔、數據、圖片等),創建最適合展示該內容的可視化網頁。
確實沒有那么亮眼,在游玩的時候還有一些些BUG。
但是畢竟這個游戲還是太復雜了,人模型的尺寸也沒那么大,也沒法既要又要。
如果是做稍微簡單一點的連連看游戲,就還是比較簡單了。
div>,所有的游戲文字都是英文
除了代碼,邏輯問題,現在基本也不太能難道現在的推理大模型了。
不過在遇到一些非常離奇非正常的測試prompt時,還是會有一點點掉智。
文筆的話,親測會比DeepSeek好一些。
但是略遜于GPT-4o。
如果你還想玩一點花活,還能跟即夢打通做結合。
就能實現類似于那種原生多模態模型,圖文混排的效果。
還是超級有意思的。
總之,這次Qwen3的發布,真的有點像是深夜街頭,突然亮起的那盞霓虹燈。
不僅亮,還便宜。
不僅便宜,還能庫庫的切換顏色。
這一波下來,阿里確實是拿出了一種很阿里的態度。
8點了,天也亮了。
該去睡覺了。
最后。
Qwen3,歡迎來到這個荒誕又燦爛的時代。
咱們,下個奇點見。
以上,既然看到這里了,如果覺得不錯,隨手點個贊、在看、轉發三連吧,如果想第一時間收到推送,也可以給我個星標?~謝謝你看我的文章,我們,下次再見。
>/ 作者:卡茲克、dongyi
>/ 投稿或爆料,請聯系郵箱:wzglyay@virxact.com
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.