今天,豆包大模型1.5Pro版本正式和大家見面。
新模型綜合能力顯著增強,低訓(xùn)練/推理成本,高效模型結(jié)構(gòu),全面提升多模態(tài)能力、推理能力,多項公開評測基準(zhǔn)上全球領(lǐng)先。模型訓(xùn)練過程中,未使用任何其他模型生成的數(shù)據(jù),扎實不走“捷徑”。
完整版Blog可在豆包大模型團(tuán)隊官網(wǎng)查看(可直接點擊文末“閱讀原文”):
https://team.doubao.com/doubao_1_5_pro
目前,Doubao-1.5-pro已在豆包APP灰度上線,接受海量請求效果出色,同時,開發(fā)者也可在火山引擎直接調(diào)用API。
綜合能力領(lǐng)先
豆包大模型1.5Pro在知識(MMLU_PRO、GPQA)、代碼(McEval、FullStackBench)、推理(DROP)、中文(CMMLU、C-Eval)等多項公開測評基準(zhǔn)上成績?nèi)蝾I(lǐng)先。詳見文末表格。
高效模型結(jié)構(gòu),超低成本
豆包大模型1.5Pro使用較小的激活參數(shù)進(jìn)行預(yù)訓(xùn)練,訓(xùn)練成本極低,但性能不打折,采用大規(guī)模稀疏MoE架構(gòu),等效7倍激活參數(shù)的Dense模型性能,遠(yuǎn)超業(yè)內(nèi)MoE架構(gòu)約3倍杠桿的常規(guī)效率。
憑借自研服務(wù)器集群方案,靈活支持低成本芯片,硬件成本比行業(yè)方案大幅度降低。
自研網(wǎng)卡和網(wǎng)絡(luò)協(xié)議,顯著優(yōu)化小包通訊效率,算子層計算與通信的高效交疊,保證了多機分布式推理的穩(wěn)定和高效;通過精細(xì)量化和PD分離等方案,靈活使用算力和多任務(wù)混合調(diào)度,實現(xiàn)更高效算力利用。
多模態(tài)能力全面提升
新版豆包視覺理解模型Doubao-1.5-vision-pro,視覺理解能力全球領(lǐng)先。詳見文末表格。
全新的豆包實時語音模型Doubao-1.5-realtime-voice-pro,采用Speech2Speech端到端框架,表現(xiàn)力實現(xiàn)質(zhì)的飛躍,真正做到會哭會笑、能說方言會唱歌。該模型已在豆包App全量上線,歡迎體驗。
更強的深度思考能力
基于豆包1.5基座模型,通過RL算法的突破和工程優(yōu)化,在未使用其他模型數(shù)據(jù)的情況下,研發(fā)豆包深度思考模型。階段性進(jìn)展Doubao-1.5-Pro-AS1-Preview在AIME上已取得了業(yè)內(nèi)領(lǐng)先的成績。詳見文末表格。
扎實不走“捷徑”
所有模型訓(xùn)練過程中,未使用任何其他模型生成的數(shù)據(jù)。
豆包大模型構(gòu)建自主的數(shù)據(jù)生產(chǎn)體系,以標(biāo)注團(tuán)隊與模型selfplay技術(shù)相結(jié)合,高效優(yōu)化數(shù)據(jù)質(zhì)量,提升數(shù)據(jù)標(biāo)注多樣性和難度,確保數(shù)據(jù)來源的獨立性和可靠性。
向無盡的未知進(jìn)發(fā)
字節(jié)豆包大模型團(tuán)隊鼓勵探索更長周期、具有不確定性的研究課題,也鼓勵挑戰(zhàn)跨模態(tài)、跨方向的高難度課題交叉合作。歡迎有志研究人員加盟了解。
附:
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.