網(wǎng)易首頁 > 網(wǎng)易科技 > 網(wǎng)易科技 > 正文

訊飛星火X1升級(jí)突破：推理性能比肩全球一流水平

2025-04-21 17:06:28　來源: 網(wǎng)易科技報(bào)道

北京舉報(bào)

分享至

4月20日，科大訊飛深度推理大模型——訊飛星火X1迎來全新升級(jí)；訊飛方面表示，升級(jí)后的星火X1在數(shù)學(xué)、代碼、邏輯推理、文本生成、語言理解、知識(shí)問答等通用任務(wù)上效果顯著提升，在模型參數(shù)比業(yè)界同類模型小一個(gè)數(shù)量級(jí)的情況下，整體效果對(duì)標(biāo)OpenAI o1和DeepSeek R1。

訊飛方面表示，星火X1除了在常見通用任務(wù)取得顯著進(jìn)步之外，由于融入了更多場(chǎng)景復(fù)雜類型數(shù)據(jù)，模型的泛化性也取得了進(jìn)步，在教育、醫(yī)療、司法等領(lǐng)域表現(xiàn)明顯。

面向企業(yè)和廣大開發(fā)者，訊飛星火X1首發(fā)“快思考、慢思考統(tǒng)一模型”，全新升級(jí)模型定制優(yōu)化工具鏈，進(jìn)一步降低大模型私有化部署和定制門檻；同時(shí)，訊飛星火X1 API已上線訊飛開放平臺(tái)開放服務(wù)，作為首個(gè)支持全國產(chǎn)算力微調(diào)的推理大模型，訊飛星辰MaaS平臺(tái)同步上線了星火X1微調(diào)服務(wù)。

據(jù)訊飛方面表示，升級(jí)后的星火X1在多個(gè)任務(wù)上效果繼續(xù)突破，展現(xiàn)出優(yōu)異的性能，根據(jù)最新測(cè)試集評(píng)測(cè)結(jié)果，星火X1在通用任務(wù)效果評(píng)測(cè)中全面對(duì)標(biāo)OpenAI o1和DeepSeek R1，在數(shù)學(xué)、知識(shí)問答等方面表現(xiàn)突出。

數(shù)學(xué)答題和復(fù)雜的數(shù)理邏輯推理方面，星火X1能夠準(zhǔn)確識(shí)別出復(fù)雜的數(shù)學(xué)公式，不僅給出完整的解題思路，輸出結(jié)果也嚴(yán)謹(jǐn)清晰；在邏輯推理時(shí)全方位思考，思考可能出現(xiàn)的每一種假設(shè)，表現(xiàn)出更強(qiáng)的嚴(yán)謹(jǐn)性和準(zhǔn)確性。代碼能力上，星火X1不僅提高了代碼生成的準(zhǔn)確率，對(duì)生成代碼邏輯理解也進(jìn)一步提升，能夠應(yīng)對(duì)更復(fù)雜的編程需求，思考問題的多種可能性，幫助開發(fā)者快速實(shí)現(xiàn)功能。在語言理解方面，模型輸出內(nèi)容、格式更加符合用戶指令要求，能夠給到更加準(zhǔn)確且深度思考的結(jié)果，生成內(nèi)容更加連貫、準(zhǔn)確。

此外，星火X1的長思維鏈能力支持圖像輸入，可以對(duì)輸入的圖像進(jìn)行關(guān)聯(lián)思考，對(duì)于圖像中的多種復(fù)雜元素，探究可能的含義和目的，進(jìn)行更深層次的信息整合和推理。

本次星火X1升級(jí)不僅提升了通用能力，也同步增強(qiáng)了面向行業(yè)的解決方案能力；以司法行業(yè)為例，對(duì)于行業(yè)專業(yè)需求，例如根據(jù)材料總結(jié)案件事實(shí)以及判決理由，升級(jí)后的星火X1能夠精準(zhǔn)把握用戶指令，詳細(xì)分析爭議點(diǎn)，快速定位關(guān)鍵信息，并輸出準(zhǔn)確內(nèi)容，為行業(yè)用戶提供專業(yè)、可靠的智能支持。

在技術(shù)創(chuàng)新和模型部署方面，星火X1首發(fā)“快思考、慢思考統(tǒng)一模型”，由一個(gè)模型同時(shí)支持兩種思考模式，提升了模型處理不同復(fù)雜度任務(wù)的能力，滿血版星火X1僅需4張卡（華為910B）即可部署，簡化了私有化部署流程。

同時(shí)，星火X1還全新升級(jí)了模型定制優(yōu)化工具鏈，支持SFT（監(jiān)督微調(diào)）、強(qiáng)化學(xué)習(xí)兩種模型定制優(yōu)化方案，只需16張卡（華為910B）即可完成行業(yè)定制優(yōu)化，有效降低了企業(yè)AI的定制門檻。

訊飛星火X1的全新升級(jí)背后，是一系列獨(dú)特的技術(shù)創(chuàng)新與理念突破。

首先，提出基于問題難度的大規(guī)模多階段強(qiáng)化學(xué)習(xí)方法，在復(fù)雜推理、數(shù)學(xué)、代碼、語言理解等場(chǎng)景全面提升模型效果及泛化性；同時(shí)提出強(qiáng)化學(xué)習(xí)動(dòng)態(tài)更新算法，基于樣本采樣長度動(dòng)態(tài)調(diào)整強(qiáng)化學(xué)習(xí)更新速度，進(jìn)一步提升深度思考強(qiáng)化學(xué)習(xí)效率及效果。

其次，統(tǒng)一模型下的快慢思考混合訓(xùn)練方法，充分發(fā)揮快慢思考數(shù)據(jù)相互促進(jìn)作用，實(shí)現(xiàn)基于系統(tǒng)指令控制模型是否深度思考，支撐下游更高效便捷地部署使用；

第三，實(shí)現(xiàn)多項(xiàng)工程技術(shù)創(chuàng)新，顯存動(dòng)態(tài)卸載技術(shù)大幅提升長文本推理并發(fā)、訓(xùn)推共卡協(xié)同實(shí)現(xiàn)高效訓(xùn)推資源轉(zhuǎn)換、推理引擎冬眠機(jī)制實(shí)現(xiàn)快速拉起和恢復(fù)，實(shí)現(xiàn)國產(chǎn)算力平臺(tái)上高效和穩(wěn)定的強(qiáng)化學(xué)習(xí)訓(xùn)練全流程。

訊飛表示，在中美科技競爭日趨激烈的背景下，星火X1選擇的全國產(chǎn)化技術(shù)路徑更具深遠(yuǎn)意義。最近，科大訊飛與華為昇騰聯(lián)合團(tuán)隊(duì)在前期工作基礎(chǔ)上再獲突破，升級(jí)MoE模型的PD分離+大規(guī)模專家并行系統(tǒng)方案，實(shí)現(xiàn)了集群推理性能翻番，包括PD分離部署提升20%+性能、MTP多token預(yù)測(cè)技術(shù)提升30%+整體性能、專家負(fù)載均衡算法優(yōu)化使集群吞吐提升30%+，以及異步雙發(fā)射技術(shù)降低服務(wù)請(qǐng)求調(diào)度耗時(shí)提升10%系統(tǒng)性能。（平章）