4月20日,科大訊飛深度推理大模型——訊飛星火X1迎來全新升級(jí);訊飛方面表示,升級(jí)后的星火X1在數(shù)學(xué)、代碼、邏輯推理、文本生成、語言理解、知識(shí)問答等通用任務(wù)上效果顯著提升,在模型參數(shù)比業(yè)界同類模型小一個(gè)數(shù)量級(jí)的情況下,整體效果對(duì)標(biāo)OpenAI o1和DeepSeek R1。
訊飛方面表示,星火X1除了在常見通用任務(wù)取得顯著進(jìn)步之外,由于融入了更多場(chǎng)景復(fù)雜類型數(shù)據(jù),模型的泛化性也取得了進(jìn)步,在教育、醫(yī)療、司法等領(lǐng)域表現(xiàn)明顯。
面向企業(yè)和廣大開發(fā)者,訊飛星火X1首發(fā)“快思考、慢思考統(tǒng)一模型”,全新升級(jí)模型定制優(yōu)化工具鏈,進(jìn)一步降低大模型私有化部署和定制門檻;同時(shí),訊飛星火X1 API已上線訊飛開放平臺(tái)開放服務(wù),作為首個(gè)支持全國產(chǎn)算力微調(diào)的推理大模型,訊飛星辰MaaS平臺(tái)同步上線了星火X1微調(diào)服務(wù)。
據(jù)訊飛方面表示,升級(jí)后的星火X1在多個(gè)任務(wù)上效果繼續(xù)突破,展現(xiàn)出優(yōu)異的性能,根據(jù)最新測(cè)試集評(píng)測(cè)結(jié)果,星火X1在通用任務(wù)效果評(píng)測(cè)中全面對(duì)標(biāo)OpenAI o1和DeepSeek R1,在數(shù)學(xué)、知識(shí)問答等方面表現(xiàn)突出。
數(shù)學(xué)答題和復(fù)雜的數(shù)理邏輯推理方面,星火X1能夠準(zhǔn)確識(shí)別出復(fù)雜的數(shù)學(xué)公式,不僅給出完整的解題思路,輸出結(jié)果也嚴(yán)謹(jǐn)清晰;在邏輯推理時(shí)全方位思考,思考可能出現(xiàn)的每一種假設(shè),表現(xiàn)出更強(qiáng)的嚴(yán)謹(jǐn)性和準(zhǔn)確性。代碼能力上,星火X1不僅提高了代碼生成的準(zhǔn)確率,對(duì)生成代碼邏輯理解也進(jìn)一步提升,能夠應(yīng)對(duì)更復(fù)雜的編程需求,思考問題的多種可能性,幫助開發(fā)者快速實(shí)現(xiàn)功能。在語言理解方面,模型輸出內(nèi)容、格式更加符合用戶指令要求,能夠給到更加準(zhǔn)確且深度思考的結(jié)果,生成內(nèi)容更加連貫、準(zhǔn)確。
此外,星火X1的長思維鏈能力支持圖像輸入,可以對(duì)輸入的圖像進(jìn)行關(guān)聯(lián)思考,對(duì)于圖像中的多種復(fù)雜元素,探究可能的含義和目的,進(jìn)行更深層次的信息整合和推理。
本次星火X1升級(jí)不僅提升了通用能力,也同步增強(qiáng)了面向行業(yè)的解決方案能力;以司法行業(yè)為例,對(duì)于行業(yè)專業(yè)需求,例如根據(jù)材料總結(jié)案件事實(shí)以及判決理由,升級(jí)后的星火X1能夠精準(zhǔn)把握用戶指令,詳細(xì)分析爭議點(diǎn),快速定位關(guān)鍵信息,并輸出準(zhǔn)確內(nèi)容,為行業(yè)用戶提供專業(yè)、可靠的智能支持。
在技術(shù)創(chuàng)新和模型部署方面,星火X1首發(fā)“快思考、慢思考統(tǒng)一模型”,由一個(gè)模型同時(shí)支持兩種思考模式,提升了模型處理不同復(fù)雜度任務(wù)的能力,滿血版星火X1僅需4張卡(華為910B)即可部署,簡化了私有化部署流程。
同時(shí),星火X1還全新升級(jí)了模型定制優(yōu)化工具鏈,支持SFT(監(jiān)督微調(diào))、強(qiáng)化學(xué)習(xí)兩種模型定制優(yōu)化方案,只需16張卡(華為910B)即可完成行業(yè)定制優(yōu)化,有效降低了企業(yè)AI的定制門檻。
訊飛星火X1的全新升級(jí)背后,是一系列獨(dú)特的技術(shù)創(chuàng)新與理念突破。
首先,提出基于問題難度的大規(guī)模多階段強(qiáng)化學(xué)習(xí)方法,在復(fù)雜推理、數(shù)學(xué)、代碼、語言理解等場(chǎng)景全面提升模型效果及泛化性;同時(shí)提出強(qiáng)化學(xué)習(xí)動(dòng)態(tài)更新算法,基于樣本采樣長度動(dòng)態(tài)調(diào)整強(qiáng)化學(xué)習(xí)更新速度,進(jìn)一步提升深度思考強(qiáng)化學(xué)習(xí)效率及效果。
其次,統(tǒng)一模型下的快慢思考混合訓(xùn)練方法,充分發(fā)揮快慢思考數(shù)據(jù)相互促進(jìn)作用,實(shí)現(xiàn)基于系統(tǒng)指令控制模型是否深度思考,支撐下游更高效便捷地部署使用;
第三,實(shí)現(xiàn)多項(xiàng)工程技術(shù)創(chuàng)新,顯存動(dòng)態(tài)卸載技術(shù)大幅提升長文本推理并發(fā)、訓(xùn)推共卡協(xié)同實(shí)現(xiàn)高效訓(xùn)推資源轉(zhuǎn)換、推理引擎冬眠機(jī)制實(shí)現(xiàn)快速拉起和恢復(fù),實(shí)現(xiàn)國產(chǎn)算力平臺(tái)上高效和穩(wěn)定的強(qiáng)化學(xué)習(xí)訓(xùn)練全流程。
訊飛表示,在中美科技競爭日趨激烈的背景下,星火X1選擇的全國產(chǎn)化技術(shù)路徑更具深遠(yuǎn)意義。最近,科大訊飛與華為昇騰聯(lián)合團(tuán)隊(duì)在前期工作基礎(chǔ)上再獲突破,升級(jí)MoE模型的PD分離+大規(guī)模專家并行系統(tǒng)方案,實(shí)現(xiàn)了集群推理性能翻番,包括PD分離部署提升20%+性能、MTP多token預(yù)測(cè)技術(shù)提升30%+整體性能、專家負(fù)載均衡算法優(yōu)化使集群吞吐提升30%+,以及異步雙發(fā)射技術(shù)降低服務(wù)請(qǐng)求調(diào)度耗時(shí)提升10%系統(tǒng)性能。(平章)