豆包大模型1.5Pro正式發(fā)布

2025-01-22 15:37:31　來源: 產(chǎn)業(yè)家

山東舉報

分享至

今天，豆包大模型1.5Pro版本正式和大家見面。

新模型綜合能力顯著增強，低訓(xùn)練/推理成本，高效模型結(jié)構(gòu)，全面提升多模態(tài)能力、推理能力，多項公開評測基準(zhǔn)上全球領(lǐng)先。模型訓(xùn)練過程中，未使用任何其他模型生成的數(shù)據(jù)，扎實不走“捷徑”。

完整版Blog可在豆包大模型團(tuán)隊官網(wǎng)查看（可直接點擊文末“閱讀原文”）：

https://team.doubao.com/doubao_1_5_pro

目前，Doubao-1.5-pro已在豆包APP灰度上線，接受海量請求效果出色，同時，開發(fā)者也可在火山引擎直接調(diào)用API。

綜合能力領(lǐng)先

豆包大模型1.5Pro在知識(MMLU_PRO、GPQA)、代碼(McEval、FullStackBench)、推理(DROP)、中文(CMMLU、C-Eval)等多項公開測評基準(zhǔn)上成績?nèi)蝾I(lǐng)先。詳見文末表格。

高效模型結(jié)構(gòu)，超低成本

豆包大模型1.5Pro使用較小的激活參數(shù)進(jìn)行預(yù)訓(xùn)練，訓(xùn)練成本極低，但性能不打折，采用大規(guī)模稀疏MoE架構(gòu)，等效7倍激活參數(shù)的Dense模型性能，遠(yuǎn)超業(yè)內(nèi)MoE架構(gòu)約3倍杠桿的常規(guī)效率。

憑借自研服務(wù)器集群方案，靈活支持低成本芯片，硬件成本比行業(yè)方案大幅度降低。

自研網(wǎng)卡和網(wǎng)絡(luò)協(xié)議，顯著優(yōu)化小包通訊效率，算子層計算與通信的高效交疊，保證了多機分布式推理的穩(wěn)定和高效；通過精細(xì)量化和PD分離等方案，靈活使用算力和多任務(wù)混合調(diào)度，實現(xiàn)更高效算力利用。

多模態(tài)能力全面提升

新版豆包視覺理解模型Doubao-1.5-vision-pro，視覺理解能力全球領(lǐng)先。詳見文末表格。

全新的豆包實時語音模型Doubao-1.5-realtime-voice-pro，采用Speech2Speech端到端框架，表現(xiàn)力實現(xiàn)質(zhì)的飛躍，真正做到會哭會笑、能說方言會唱歌。該模型已在豆包App全量上線，歡迎體驗。

更強的深度思考能力

基于豆包1.5基座模型，通過RL算法的突破和工程優(yōu)化，在未使用其他模型數(shù)據(jù)的情況下，研發(fā)豆包深度思考模型。階段性進(jìn)展Doubao-1.5-Pro-AS1-Preview在AIME上已取得了業(yè)內(nèi)領(lǐng)先的成績。詳見文末表格。

扎實不走“捷徑”

所有模型訓(xùn)練過程中，未使用任何其他模型生成的數(shù)據(jù)。

豆包大模型構(gòu)建自主的數(shù)據(jù)生產(chǎn)體系，以標(biāo)注團(tuán)隊與模型selfplay技術(shù)相結(jié)合，高效優(yōu)化數(shù)據(jù)質(zhì)量，提升數(shù)據(jù)標(biāo)注多樣性和難度，確保數(shù)據(jù)來源的獨立性和可靠性。

向無盡的未知進(jìn)發(fā)

字節(jié)豆包大模型團(tuán)隊鼓勵探索更長周期、具有不確定性的研究課題，也鼓勵挑戰(zhàn)跨模態(tài)、跨方向的高難度課題交叉合作。歡迎有志研究人員加盟了解。

附：

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.