中國商報(記者 趙熠如 文/圖)4月9日,阿里云在北京召開AI勢能大會。阿里云通義大模型業(yè)務(wù)總經(jīng)理徐棟在大會上表示,大模型開源對于吸引優(yōu)秀人才、提升阿里云業(yè)務(wù)銷售收入、提升模型能力來說有很多好處。同時,他提出,“多快好省”、全模態(tài)融合、推理能力是大模型產(chǎn)業(yè)落地的關(guān)鍵方向。
阿里云通義大模型業(yè)務(wù)總經(jīng)理徐棟。
“首先,模型開源對于人才招聘以及品牌技術(shù)重塑很有利。Meta、Google開源的策略是吸引更多優(yōu)秀的人才,DeepSeek開源很久后,其優(yōu)秀人才的密度也非常高。所以,模型開源對人才建設(shè)是很有幫助的。第二,模型和云服務(wù)是一個‘硬幣’的正反面。通義大模型開源后,對阿里云銷售的提升作用是顯而易見的。我們通過開源的方式,降低了所有國內(nèi)外開發(fā)者使用模型的門檻。在使用模型的過程中,開發(fā)者自然而然會選擇最大的云廠商。第三,開源之后,我們得到開發(fā)者社區(qū)里面的很多反饋,包括國內(nèi)科研機構(gòu)以及很多頭部互聯(lián)網(wǎng)公司的建議。這些反饋告訴我們,模型輸出的穩(wěn)定性是否有一些小的corner case(極端情況或特殊情況),我們也可以快速調(diào)整在某些數(shù)據(jù)上的表現(xiàn)?!毙鞐澱f。
徐棟認為,如果開源模型做不到業(yè)內(nèi)SOTA(當(dāng)前最佳技術(shù)),做不到趕超閉源模型,那么開源模型也沒有意義。
“所以,這反過來加強了整體團隊的模型迭代速度和能力的建設(shè)。”徐棟表示,“模型開源打開了面向開發(fā)者的溝通渠道,基于開發(fā)者的反饋,來幫助模型建立更好的鏈路,這對于模型能力的提升是非常有幫助的。”
徐棟認為,“多快好省”的效率提升、Omni(全模態(tài)融合)、Reasoning(推理能力),是大模型與產(chǎn)業(yè)落地緊密掛鉤的三個方向。
“模型發(fā)展的主脈絡(luò)是提高精度、降低成本,這是客戶最希望用到的模型,簡單來說就是‘多快好省’。與此同時,客戶越來越希望使用全模態(tài)模型,且客服場景、消費電子交互場景等都需要全模態(tài)交互?!毙鞐澅硎?。近日,魅族宣布其新機Note16系列將成為首個深度接入Qwen2.5-Omni的終端。
“在Reasoning(推理)方面,我們會把工具調(diào)用也放到模型推理過程中,即模型在展開思考時,發(fā)現(xiàn)自己的知識不夠,它會調(diào)取第三方工具,基于這些結(jié)果再進行思考。這是推理模型長期發(fā)展的很重要趨勢。”徐棟說。據(jù)悉,國家天文臺、中國科學(xué)院青藏高原研究所、中國科學(xué)院南海海洋研究所等多個中國科學(xué)院研究機構(gòu)的科研項目已接入阿里通義千問QwQ-32B,用推理大模型提升科研效率。
據(jù)悉,截至2025年1月底,阿里云百煉平臺中調(diào)用通義API的企業(yè)和開發(fā)者已超過29萬,用AI重構(gòu)代碼開發(fā)、硬件制造、智能座艙、金融服務(wù)、藥物研發(fā)、太空探索等場景,AI的行業(yè)化應(yīng)用經(jīng)驗正在迅速積累與沉淀。
“我們一開始做的是通用模型,未來應(yīng)該會基于客戶去迭代,有可能從單一的客戶項目,變得相對規(guī)?;?、產(chǎn)品化?!毙鞐澱f,“我們認為,深度強化學(xué)習(xí)在未來會非常有前景,而這件事情是跟客戶的SOP(標準作業(yè)程序)、業(yè)務(wù)流緊密掛鉤的。我們也期待在這個領(lǐng)域能有更多合作?!?/p>
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.