出品|虎嗅商業(yè)消費組
作者|苗正卿
題圖|視覺中國
虎嗅獨家獲悉,阿里即將在2025年4月第二周發(fā)布新模型Qwen3,這將是阿里在2025年上半年最重要的模型產(chǎn)品,距離2024年9月阿里在云棲大會上發(fā)布Qwen2.5過去了大約七個月的時間。
據(jù)虎嗅獨家了解,在2024年發(fā)布Qwen2.5后,阿里云內(nèi)部的基礎(chǔ)模型團隊已經(jīng)開始推動Qwen3相關(guān)項目。但2025年初DeepSeek的火爆,改變了團隊的部分思路與重心。“2024年四季度,圈內(nèi)已經(jīng)意識到模型的推理能力很重要,但還不能說是最重要的方向,DeepSeek火爆后,推理能力已經(jīng)成為繞不開的關(guān)鍵能力。”知情人士告訴虎嗅,DeepSeek-R1發(fā)布后,阿里云基礎(chǔ)模型團隊把策略中心進一步向模型的推理能力傾斜。
值得注意的是,在2024年下半年,阿里云基礎(chǔ)模型團隊對標的競品模型主要是OpenAI的o1,而在DeepSeek-R1發(fā)布后,DeepSeek-R1已經(jīng)成為了另一個主要對標模型。
虎嗅獨家獲悉,在阿里內(nèi)部,基礎(chǔ)模型團隊最重要的考核維度是“模型影響力”。在內(nèi)部,高層希望團隊可以在業(yè)內(nèi)成功塑造“最強模型”的心智。阿里集團CEO吳泳銘同時兼任阿里云CEO,據(jù)悉吳泳銘頻繁參與到基礎(chǔ)模型團隊的業(yè)務溝通之中,并密切留意模型團隊的各種進展。
兩個具體的維度,被視為阿里基礎(chǔ)模型團隊的考核點:其一是衍生模型量,其二是在開發(fā)者社區(qū)的受歡迎度。
由于阿里采取模型開源策略,基于Qwen開源模型的衍生模型總量,被視為一個關(guān)鍵指標。截至目前,這一數(shù)據(jù)已經(jīng)超過10萬。而在開發(fā)者社區(qū)的歡迎度,阿里會考慮多個具體指標,比如開源模型下載量等。虎嗅獲悉,2024年Qwen系列模型在開發(fā)者社區(qū)的下載量超過了2億。
“在開發(fā)者社區(qū)之中,一個模型的影響力,主要有兩個維度:一個是下載量,一個是衍生模型數(shù)。基于下載的開源模型,微調(diào)而成新的衍生模型后,需要重新上傳至開發(fā)者社區(qū)。所以這兩個維度可以比較好地反映一個開源模型的人氣。”一位知情人士告訴虎嗅,在阿里內(nèi)部針對全球開發(fā)者的模型影響力相關(guān)心智指標,從2024年開始就被高度重視,這和吳泳銘等技術(shù)出身的高管熟稔技術(shù)圈文化有關(guān)。
虎嗅另外獨家獲悉,2025年阿里模型團隊也意識到了諸如智駕、AI Agent、AI硬件等機會風口的存在。為了更好地契合這些場景,基礎(chǔ)模型團隊依然會采取“多尺寸”策略。2024年發(fā)布的Qwen2系列,總共發(fā)布了7種不同的模型尺寸,而即將發(fā)布的Qwen3尺寸類型可能會更多。
值得注意的是,伴隨Qwen3發(fā)布,阿里正在開啟史上最大規(guī)模的校招,而虎嗅獲悉,校招的HC之中涉及到基礎(chǔ)模型團隊的崗位量也達到史上最高。和以往不同的是,目前基礎(chǔ)模型團隊在招人過程中,更看重人才的“AI原生”,也就是說更希望引入一開始接觸的就是大語言模型的人才,而非傳統(tǒng)的NLP人才(自然語言模型)。
本文來自虎嗅,原文鏈接:https://www.huxiu.com/article/4187485.html?f=wyxwapp
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.