從4月中旬就在傳聞將上線的阿里新一代通義千問模型Qwen3,終于在4月29日凌晨發布了。
Qwen3可以說是阿里大模型的集大成者,在全球開發者社區GitHub發布四個小時后,便獲得了1.7萬個星標,刷新了開源大模型的熱度紀錄。
此次Qwen3一共開源了8款“混合推理模型”。其中包括兩款MoE(混合專家)模型:Qwen3-235B-A22B(2350多億總參數、 220多億激活參),以及Qwen3-30B-A3B(300億總參數、30億激活參數)。以及六個Dense(稠密)模型:Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B和Qwen3-0.6B。
其中,Qwen3-235B-A22B是Qwen3系列模型中性能最強的。阿里Qwen3技術文檔披露,它在基準測試中的得分,和DeepSeek-R1、OpenAI旗下的o1、o3-mini,谷歌的 Gemini-2.5-Pro等全球一流大模型不相上下。
作為一款“混合推理模型”,Qwen3將“快思考”與“慢思考”集成進同一個模型,對簡單需求可低算力“秒回”答案。特別是對復雜問題可多步驟“深度思考”,節省算力消耗。
Qwen3總參數量235B,激活僅需22B。阿里稱,僅需4張H20即可部署Qwen3滿血版,顯存占用僅為性能相近模型的三分之一。
同時,Qwen3模型也支持119種語言和方言,意味著Qwen 3瞄準了國際應用。
Qwen3也為即將到來的智能體Agent和大模型應用爆發提供了更好的支持。在評估模型Agent能力的BFCL評測中,Qwen3創下70.8的新高,超越Gemini2.5-Pro、OpenAI-o1等頂尖模型,這將大幅降低Agent調用工具的門檻。
同時,Qwen3也原生支持MCP協議,并具備強大的工具調用能力,結合封裝了工具調用模板和工具調用解析器的Qwen-Agent框架。這將大大降低編碼復雜性,實現高效的手機及電腦Agent操作等任務。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.