阿里云徐棟：大模型開源益處多

2025-04-10 14:23:35　來源: 中國商報

北京舉報

分享至

中國商報（記者趙熠如文/圖）4月9日，阿里云在北京召開AI勢能大會。阿里云通義大模型業(yè)務(wù)總經(jīng)理徐棟在大會上表示，大模型開源對于吸引優(yōu)秀人才、提升阿里云業(yè)務(wù)銷售收入、提升模型能力來說有很多好處。同時，他提出，“多快好省”、全模態(tài)融合、推理能力是大模型產(chǎn)業(yè)落地的關(guān)鍵方向。

阿里云通義大模型業(yè)務(wù)總經(jīng)理徐棟。

“首先，模型開源對于人才招聘以及品牌技術(shù)重塑很有利。Meta、Google開源的策略是吸引更多優(yōu)秀的人才，DeepSeek開源很久后，其優(yōu)秀人才的密度也非常高。所以，模型開源對人才建設(shè)是很有幫助的。第二，模型和云服務(wù)是一個‘硬幣’的正反面。通義大模型開源后，對阿里云銷售的提升作用是顯而易見的。我們通過開源的方式，降低了所有國內(nèi)外開發(fā)者使用模型的門檻。在使用模型的過程中，開發(fā)者自然而然會選擇最大的云廠商。第三，開源之后，我們得到開發(fā)者社區(qū)里面的很多反饋，包括國內(nèi)科研機構(gòu)以及很多頭部互聯(lián)網(wǎng)公司的建議。這些反饋告訴我們，模型輸出的穩(wěn)定性是否有一些小的corner case（極端情況或特殊情況），我們也可以快速調(diào)整在某些數(shù)據(jù)上的表現(xiàn)?！毙鞐澱f。

徐棟認為，如果開源模型做不到業(yè)內(nèi)SOTA（當(dāng)前最佳技術(shù)），做不到趕超閉源模型，那么開源模型也沒有意義。

“所以，這反過來加強了整體團隊的模型迭代速度和能力的建設(shè)。”徐棟表示，“模型開源打開了面向開發(fā)者的溝通渠道，基于開發(fā)者的反饋，來幫助模型建立更好的鏈路，這對于模型能力的提升是非常有幫助的。”

徐棟認為，“多快好省”的效率提升、Omni（全模態(tài)融合）、Reasoning（推理能力），是大模型與產(chǎn)業(yè)落地緊密掛鉤的三個方向。

“模型發(fā)展的主脈絡(luò)是提高精度、降低成本，這是客戶最希望用到的模型，簡單來說就是‘多快好省’。與此同時，客戶越來越希望使用全模態(tài)模型，且客服場景、消費電子交互場景等都需要全模態(tài)交互?！毙鞐澅硎?。近日，魅族宣布其新機Note16系列將成為首個深度接入Qwen2.5-Omni的終端。

“在Reasoning（推理）方面，我們會把工具調(diào)用也放到模型推理過程中，即模型在展開思考時，發(fā)現(xiàn)自己的知識不夠，它會調(diào)取第三方工具，基于這些結(jié)果再進行思考。這是推理模型長期發(fā)展的很重要趨勢。”徐棟說。據(jù)悉，國家天文臺、中國科學(xué)院青藏高原研究所、中國科學(xué)院南海海洋研究所等多個中國科學(xué)院研究機構(gòu)的科研項目已接入阿里通義千問QwQ-32B，用推理大模型提升科研效率。

據(jù)悉，截至2025年1月底，阿里云百煉平臺中調(diào)用通義API的企業(yè)和開發(fā)者已超過29萬，用AI重構(gòu)代碼開發(fā)、硬件制造、智能座艙、金融服務(wù)、藥物研發(fā)、太空探索等場景，AI的行業(yè)化應(yīng)用經(jīng)驗正在迅速積累與沉淀。

“我們一開始做的是通用模型，未來應(yīng)該會基于客戶去迭代，有可能從單一的客戶項目，變得相對規(guī)?；?、產(chǎn)品化?！毙鞐澱f，“我們認為，深度強化學(xué)習(xí)在未來會非常有前景，而這件事情是跟客戶的SOP（標準作業(yè)程序）、業(yè)務(wù)流緊密掛鉤的。我們也期待在這個領(lǐng)域能有更多合作?！?/p>

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.