4月29日凌晨,阿里云正式開源Qwen3系列大模型,包括2個MoE模型和6個稠密模型。發布僅2小時,Qwen3已在GitHub收獲超16.9k顆Star。
據介紹,旗艦模型Qwen3-235B-A22B在編程、數學、通用能力等基準測試中登頂全球,超越DeepSeek-R1、OpenAI o1、Grok-3等主流模型。
Qwen3系列是全球首個開源的混合推理(混合思考模式)大模型。也就是說它可根據任務自由切換“思考模式”和“非思考模式”,在不同推理深度下優化輸出效果和效率。
新一代Qwen3提供8個不同尺寸的模型,覆蓋0.6B到235B參數規模,幾乎適配從輕量端到旗艦部署的各類應用場景。旗艦模型Qwen3-235B-A22B在推理成本上也顯著優化,部署成本僅為DeepSeek R1的三分之一。
此外,在功能擴展上,Qwen3全面支持MCP(模型上下文協議),使大模型能夠與外部數據源、工具系統深度集成,提升Agent復雜任務處理能力。
同時,Qwen3模型支持119種語言和方言,進一步強化了全球適配性。
目前,Qwen3系列已在Hugging Face、ModelScope和Kaggle等平臺開源,遵循Apache 2.0協議。(袁寧)