網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

阿里秘密研發(fā)新模型將發(fā)布，影響力指標成最重要考核

2025-04-02 00:39:02　來源: 虎嗅APP

北京舉報

分享至

出品｜虎嗅商業(yè)消費組

作者｜苗正卿

題圖｜視覺中國

虎嗅獨家獲悉，阿里即將在2025年4月第二周發(fā)布新模型Qwen3，這將是阿里在2025年上半年最重要的模型產(chǎn)品，距離2024年9月阿里在云棲大會上發(fā)布Qwen2.5過去了大約七個月的時間。

據(jù)虎嗅獨家了解，在2024年發(fā)布Qwen2.5后，阿里云內(nèi)部的基礎(chǔ)模型團隊已經(jīng)開始推動Qwen3相關(guān)項目。但2025年初DeepSeek的火爆，改變了團隊的部分思路與重心。“2024年四季度，圈內(nèi)已經(jīng)意識到模型的推理能力很重要，但還不能說是最重要的方向，DeepSeek火爆后，推理能力已經(jīng)成為繞不開的關(guān)鍵能力。”知情人士告訴虎嗅，DeepSeek-R1發(fā)布后，阿里云基礎(chǔ)模型團隊把策略中心進一步向模型的推理能力傾斜。

值得注意的是，在2024年下半年，阿里云基礎(chǔ)模型團隊對標的競品模型主要是OpenAI的o1，而在DeepSeek-R1發(fā)布后，DeepSeek-R1已經(jīng)成為了另一個主要對標模型。

虎嗅獨家獲悉，在阿里內(nèi)部，基礎(chǔ)模型團隊最重要的考核維度是“模型影響力”。在內(nèi)部，高層希望團隊可以在業(yè)內(nèi)成功塑造“最強模型”的心智。阿里集團CEO吳泳銘同時兼任阿里云CEO，據(jù)悉吳泳銘頻繁參與到基礎(chǔ)模型團隊的業(yè)務溝通之中，并密切留意模型團隊的各種進展。

兩個具體的維度，被視為阿里基礎(chǔ)模型團隊的考核點：其一是衍生模型量，其二是在開發(fā)者社區(qū)的受歡迎度。

由于阿里采取模型開源策略，基于Qwen開源模型的衍生模型總量，被視為一個關(guān)鍵指標。截至目前，這一數(shù)據(jù)已經(jīng)超過10萬。而在開發(fā)者社區(qū)的歡迎度，阿里會考慮多個具體指標，比如開源模型下載量等。虎嗅獲悉，2024年Qwen系列模型在開發(fā)者社區(qū)的下載量超過了2億。

“在開發(fā)者社區(qū)之中，一個模型的影響力，主要有兩個維度：一個是下載量，一個是衍生模型數(shù)。基于下載的開源模型，微調(diào)而成新的衍生模型后，需要重新上傳至開發(fā)者社區(qū)。所以這兩個維度可以比較好地反映一個開源模型的人氣。”一位知情人士告訴虎嗅，在阿里內(nèi)部針對全球開發(fā)者的模型影響力相關(guān)心智指標，從2024年開始就被高度重視，這和吳泳銘等技術(shù)出身的高管熟稔技術(shù)圈文化有關(guān)。

虎嗅另外獨家獲悉，2025年阿里模型團隊也意識到了諸如智駕、AI Agent、AI硬件等機會風口的存在。為了更好地契合這些場景，基礎(chǔ)模型團隊依然會采取“多尺寸”策略。2024年發(fā)布的Qwen2系列，總共發(fā)布了7種不同的模型尺寸，而即將發(fā)布的Qwen3尺寸類型可能會更多。

值得注意的是，伴隨Qwen3發(fā)布，阿里正在開啟史上最大規(guī)模的校招，而虎嗅獲悉，校招的HC之中涉及到基礎(chǔ)模型團隊的崗位量也達到史上最高。和以往不同的是，目前基礎(chǔ)模型團隊在招人過程中，更看重人才的“AI原生”，也就是說更希望引入一開始接觸的就是大語言模型的人才，而非傳統(tǒng)的NLP人才（自然語言模型）。

本文來自虎嗅，原文鏈接：https://www.huxiu.com/article/4187485.html?f=wyxwapp

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.