2025 年,AI不再只是內(nèi)容生成工具,它正成為各行各業(yè)的“第二大腦”。
隨著GPT-4.5、DeepSeek等新一代大模型的崛起,我們正進(jìn)入Agentic AI(智能體AI)的時(shí)代—— 它不僅能對(duì)話,還能思考、執(zhí)行和協(xié)作,正在重塑整個(gè)生產(chǎn)力范式:
AI Coding:開發(fā)者從寫代碼者,變?yōu)榧軜?gòu)師和指揮官
Deep Research:安全研究員配備“超級(jí)助手”,漏洞分析效率倍增
Security Copilot:SecGPT不再是提示詞工具,而是實(shí)戰(zhàn)中的“作戰(zhàn)參謀”
“模型即產(chǎn)品”正在成為現(xiàn)實(shí),Agentic AI 正走入你我身邊。
—— 引用自海外獨(dú)角獸發(fā)布材料
而這一次,云起無垠沒有止步于“能用”,我們?cè)谧非蟆昂糜谩钡耐瑫r(shí),更關(guān)注真正實(shí)戰(zhàn)可落地的AI安全能力。
從模型訓(xùn)練、數(shù)據(jù)構(gòu)建、能力評(píng)測(cè),到安全Copilot應(yīng)用,我們打造出更聰明、更安全、更懂安全的SecGPT 2.0。開源模型可以去github下載使用。
下一站,我們將共同邁入Agentic Security的未來。
歡迎加入這場(chǎng)由“安全智能體”引領(lǐng)的技術(shù)革新!
01什么是SecGPT?
在通用大模型席卷全球的今天,云起無垠選擇了一條不同的路:打造真正懂網(wǎng)絡(luò)安全的大模型。
這不是一次“技術(shù)熱潮”的追隨,而是一次面向?qū)崙?zhàn)的系統(tǒng)性創(chuàng)新。
SecGPT,正是我們?cè)?023年推出的開源成果——全球首個(gè)聚焦網(wǎng)絡(luò)安全的大模型。
|我們希望它不只是“會(huì)說安全”,而是真正能“做安全”的智能體。
自發(fā)布以來,SecGPT持續(xù)受到全球安全技術(shù)社區(qū)的高度關(guān)注:
GitHub收獲Star數(shù)突破2,300+
HuggingFace下載量超過10,000+
被數(shù)十家安全團(tuán)隊(duì)用于安全問答、漏洞歸因、攻防演練等實(shí)戰(zhàn)任務(wù)
SecGPT 能做什么?
SecGPT融合了自然語言理解、代碼生成、安全知識(shí)推理等核心能力,已經(jīng)能夠勝任多種關(guān)鍵安全任務(wù):
漏洞分析:識(shí)別漏洞成因、評(píng)估影響范圍、提出修復(fù)建議
日志/流量溯源:輔助分析攻擊鏈、復(fù)原攻擊路徑
異常檢測(cè):解析網(wǎng)絡(luò)行為,判斷是否存在潛在威脅
攻防推理:支持紅隊(duì)演練/藍(lán)隊(duì)研判,完成多輪策略分析
命令解析:識(shí)別腳本意圖,揭示潛在風(fēng)險(xiǎn)操作
知識(shí)問答:成為團(tuán)隊(duì)“即問即答”的安全知識(shí)庫
這些能力不再停留在“能回答”,而是可以被“調(diào)用”、“組合”、“協(xié)同”執(zhí)行,支撐起復(fù)雜的安全智能任務(wù)流。
SecGPT 的定位:安全智能體的核心引擎
在“云起AI安全大腦”體系中,SecGPT是整個(gè)系統(tǒng)的統(tǒng)一語言理解與推理核心。
理解自然語言:大幅降低使用門檻,助力非安全專家也能上手
融合安全知識(shí):具備上下文關(guān)聯(lián)與多步推理能力
持續(xù)學(xué)習(xí)反饋:具備智能體持續(xù)優(yōu)化、自我增強(qiáng)的能力
無論是作為單點(diǎn)智能助手,還是嵌入式任務(wù)引擎,SecGPT都已具備強(qiáng)大的適配性、擴(kuò)展性與安全可控性。
02為什么我們要持續(xù)更新SecGPT?
自2023年SecGPT開源以來,大語言模型技術(shù)持續(xù)突飛猛進(jìn)。從語言理解到邏輯推理,再到工具調(diào)用與多任務(wù)協(xié)同,行業(yè)標(biāo)準(zhǔn)幾經(jīng)更替,邁入智能體(Agentic AI)時(shí)代。與此同時(shí),云起無垠也在持續(xù)推進(jìn)商業(yè)版安全大模型 SecGPT Pro 的多輪迭代,核心能力已實(shí)現(xiàn)代際躍升。
但開源版本仍停留在早期階段,在語言表達(dá)、安全理解與接口兼容性方面逐漸顯現(xiàn)出技術(shù)邊界,難以應(yīng)對(duì)當(dāng)前復(fù)雜多變的安全任務(wù)需求。因此,我們決定對(duì)SecGPT開源模型進(jìn)行全面升級(jí),持續(xù)回饋全球安全社區(qū),并助推安全智能體在更多場(chǎng)景中的落地與演化。
1)模型基礎(chǔ)設(shè)施演進(jìn),舊模型能力邊界逐漸暴露
大語言模型領(lǐng)域的基礎(chǔ)設(shè)施已經(jīng)發(fā)生底層變動(dòng)。相比早期模型,新一代模型具備更長上下文處理能力、更高效的注意力機(jī)制、結(jié)構(gòu)更清晰的工具調(diào)用接口,以及支持Agent工作流的任務(wù)控制能力。例如,支持MCP協(xié)議、ReAct思維鏈、Routing插件架構(gòu)、Function Calling、工具上下文記憶、部署端的量化控制與微調(diào)架構(gòu)等,都已成為安全智能體設(shè)計(jì)中的“新基礎(chǔ)”。
一旦開源模型長期不更新,將面臨以下技術(shù)脫節(jié)問題:
無法適配新一代推理引擎(如 vLLM、TGI)
無法兼容結(jié)構(gòu)化插件調(diào)用(Function/API 調(diào)度)
缺失任務(wù)鏈調(diào)度能力(Task-Aware Routing)
微調(diào)體系無法與最新安全數(shù)據(jù)對(duì)齊(SFT+RLHF+RAG混合)
隨著智能體形態(tài)的普及,能力缺口將迅速放大,直接影響用戶體驗(yàn)和模型落地價(jià)值。
2)安全任務(wù)結(jié)構(gòu)升級(jí),對(duì)模型能力提出多維要求
早期模型使用者多集中于問答類任務(wù),例如安全知識(shí)普及、命令解析、腳本理解等。這類任務(wù)主要依賴語言理解能力,結(jié)構(gòu)相對(duì)簡(jiǎn)單。然而,當(dāng)安全模型真正進(jìn)入研發(fā)、攻防、運(yùn)營等實(shí)際場(chǎng)景后,任務(wù)呈現(xiàn)出明顯的結(jié)構(gòu)化、多輪化、工具化趨勢(shì):
漏洞鏈條重建→多日志輸入+多階段因果推理
多語言項(xiàng)目審計(jì)→代碼上下文建模+跨文件引用分析
安全知識(shí)圖譜構(gòu)建→抽取實(shí)體/關(guān)系+圖結(jié)構(gòu)生成
安全運(yùn)營協(xié)同→工具調(diào)度+狀態(tài)反饋+報(bào)告輸出
這類任務(wù)要求模型不僅具備語義理解能力,還要具備:
推理路徑構(gòu)建能力(Chain-of-Thought/Tree-of-Thought)
知識(shí)檢索與融合能力(用于語境增強(qiáng)與準(zhǔn)確性提升)
任務(wù)規(guī)劃與階段控制能力(支持多輪次有狀態(tài)任務(wù)執(zhí)行)
多工具協(xié)同使用能力(如模糊測(cè)試 + 漏洞掃描 + 資產(chǎn)識(shí)別)
原有SecGPT模型架構(gòu)難以完成上述能力組合,僅靠 Prompt 注入或零樣本提示遠(yuǎn)遠(yuǎn)不夠。
3)現(xiàn)實(shí)挑戰(zhàn):通用模型無法替代專業(yè)安全模型
盡管DeepSeek、Qwen、LLaMA等開源大模型在通用語言理解、代碼生成等任務(wù)中取得顯著進(jìn)展,但在安全場(chǎng)景下,它們面臨以下結(jié)構(gòu)性瓶頸,尤其在企業(yè)級(jí)私有部署環(huán)境中更為突出:
(1)知識(shí)盲區(qū)廣泛,缺乏關(guān)鍵安全語料支撐
通用模型訓(xùn)練語料以開放領(lǐng)域?yàn)橹鳎瑖?yán)重缺乏如下高價(jià)值安全語料:滲透測(cè)試日志、攻擊鏈行為樣本、系統(tǒng)調(diào)用軌跡、漏洞利用(PoC/Exp)、紅隊(duì)審計(jì)報(bào)告等。這直接限制了其對(duì)實(shí)戰(zhàn)攻防細(xì)節(jié)的掌握能力。
(2)語義建模能力薄弱,缺乏安全背景意識(shí)
在漏洞成因理解、系統(tǒng)語境建模、協(xié)議行為解析等任務(wù)中,通用模型的理解能力多停留在淺層表述,無法進(jìn)行因果鏈條建模與深層語義推理,缺乏“攻防語境”下的專業(yè)認(rèn)知。
(3)工具接口調(diào)用不精準(zhǔn),缺失系統(tǒng)適配能力
通用模型未針對(duì)安全工具(如模糊測(cè)試框架、漏洞掃描器、靜態(tài)分析引擎等)進(jìn)行微調(diào)和適配,導(dǎo)致在調(diào)用第三方接口時(shí)經(jīng)常出現(xiàn)參數(shù)配置錯(cuò)誤、上下文不匹配、調(diào)用邏輯混亂等問題,嚴(yán)重影響任務(wù)可執(zhí)行性和穩(wěn)定性。
(4)任務(wù)鏈結(jié)構(gòu)理解缺失,推理與執(zhí)行脫節(jié)
安全任務(wù)往往涉及多步推理(理解→分析→調(diào)用工具→收集反饋→修復(fù)建議),通用模型缺乏對(duì)這類“任務(wù)鏈”結(jié)構(gòu)的建模能力,常常出現(xiàn)中途跳躍、邏輯斷裂、輸出不可收斂等現(xiàn)象,無法勝任復(fù)雜工作流調(diào)度任務(wù)。
當(dāng)前通用大模型在安全場(chǎng)景中往往表現(xiàn)為“語言流暢但邏輯混亂,表達(dá)順暢但結(jié)果失真”。在真實(shí)系統(tǒng)環(huán)境下,其輸出容易出現(xiàn)答非所問、指令不收斂、工具調(diào)用失敗、上下文錯(cuò)亂等問題,難以支撐企業(yè)對(duì)安全智能體高可信、高精度、高可控的實(shí)際需求。
03本次更新,SecGPT能力提升了哪些維度?
本輪升級(jí),我們同步發(fā)布了1.5B / 7B / 14B三個(gè)模型規(guī)格,全面適配從低配CPU、本地4090 GPU到企業(yè)級(jí)多卡集群等多種運(yùn)行環(huán)境,實(shí)現(xiàn)大模型能力的普適化落地。更大規(guī)模的32B、72B、671B旗艦版也將在后續(xù)分批開放,進(jìn)一步支撐企業(yè)級(jí)復(fù)雜安全任務(wù)的多輪推理與智能決策。
本輪更新亮點(diǎn)
1. 更強(qiáng)的基座能力:通用+安全深度融合
我們基于Qwen2.5-Instruct系列與DeepSeek-R1系列基座模型,結(jié)合自建安全任務(wù)集與安全知識(shí)庫,在8臺(tái)A100 GPU集群上持續(xù)訓(xùn)練一周以上,完成大規(guī)模預(yù)訓(xùn)練 + 指令微調(diào) + 強(qiáng)化學(xué)習(xí),顯著提升模型在安全場(chǎng)景中的理解、推理與響應(yīng)能力。
下圖展示了一次訓(xùn)練過程中各關(guān)鍵指標(biāo)的演化軌跡:
訓(xùn)練與驗(yàn)證損失(train/loss 與 eval/loss):二者均呈現(xiàn)出平穩(wěn)下降趨勢(shì),說明模型在訓(xùn)練集與驗(yàn)證集上均持續(xù)收斂,未出現(xiàn)過擬合跡象。
學(xué)習(xí)率曲線(train/learning_rate):采用典型的 Warmup + 衰減策略,有效提升了早期訓(xùn)練的穩(wěn)定性與收斂速度。
梯度范數(shù)(train/grad_norm):整體波動(dòng)平穩(wěn),僅在少數(shù)步數(shù)存在輕微尖峰,未出現(xiàn)梯度爆炸或消失,表明訓(xùn)練過程健康穩(wěn)定。
評(píng)估表現(xiàn):eval/runtime與 eval/samples_per_second波動(dòng)范圍小,說明在評(píng)估過程中系統(tǒng)資源使用高效,推理吞吐量穩(wěn)定。
其他指標(biāo):如訓(xùn)練輪數(shù)(train/epoch)、輸入token 數(shù)量(train/num_input_tokens_seen)等也表明訓(xùn)練過程如期進(jìn)行,達(dá)成預(yù)期計(jì)劃。
模型訓(xùn)練與評(píng)估過程示例圖
2. 更大的高質(zhì)量安全語料庫:私有 + 公共數(shù)據(jù)雙輪驅(qū)動(dòng)
我們已構(gòu)建了一個(gè)超大規(guī)模、結(jié)構(gòu)完備的網(wǎng)絡(luò)安全語料庫,總量超過5TB、共計(jì)106,721個(gè)原始文件,其中超過40%內(nèi)容為人工精選與結(jié)構(gòu)化處理。私有數(shù)據(jù)部分系統(tǒng)整合了具備70+字段 / 14類結(jié)構(gòu)標(biāo)簽體系的安全數(shù)據(jù)資源,經(jīng)過統(tǒng)一清洗、語義標(biāo)注與重構(gòu),構(gòu)建出數(shù)百億 Tokens 級(jí)的高質(zhì)量語料,為大模型深度推理能力提供堅(jiān)實(shí)支撐。
下圖展示了該語料庫的構(gòu)成維度,整體采集邏輯遵循“理論支撐 — 實(shí)戰(zhàn)對(duì)抗 — 應(yīng)用落地”三層結(jié)構(gòu)體系:
理論支撐:涵蓋法律法規(guī)、學(xué)術(shù)論文、行業(yè)報(bào)告等權(quán)威資料,為模型提供穩(wěn)固的知識(shí)基座;
實(shí)戰(zhàn)對(duì)抗:包括漏洞詳情、CTF題庫、日志流量、惡意樣本與逆向分析等數(shù)據(jù),提升模型對(duì)真實(shí)攻擊行為的識(shí)別與追蹤能力;
應(yīng)用落地:涵蓋安全社區(qū)博客、教育培訓(xùn)資料、安全知識(shí)圖譜與自動(dòng)化策略,增強(qiáng)模型在安全運(yùn)營、輔助決策等場(chǎng)景中的適配能力。
技術(shù)亮點(diǎn):
雙輪驅(qū)動(dòng)機(jī)制(私有 + 公共數(shù)據(jù))保障語料在廣度與深度上的協(xié)同提升;
多維標(biāo)簽體系使語料具備更強(qiáng)的結(jié)構(gòu)化能力與上下文理解能力;
三層語料構(gòu)建邏輯覆蓋從知識(shí)構(gòu)建、威脅應(yīng)對(duì)到實(shí)戰(zhàn)部署的完整安全任務(wù)鏈路。
3. 能力躍升:SecGPT正在蛻變?yōu)椤鞍踩帧?/p>
通過多輪數(shù)據(jù)優(yōu)化與任務(wù)精調(diào),SecGPT已實(shí)現(xiàn)多個(gè)能力維度的跨越式進(jìn)展:
更懂攻擊鏈、攻防語言與行業(yè)術(shù)語
更擅長處理復(fù)雜日志與漏洞描述
更適配私有化部署、邊緣推理等現(xiàn)實(shí)場(chǎng)景
核心能力提升詳解
1. 模型能力評(píng)測(cè):全面指標(biāo)躍升,實(shí)戰(zhàn)智能初現(xiàn)
為全面評(píng)估 SecGPT 的安全實(shí)戰(zhàn)能力,我們構(gòu)建了一套覆蓋安全證書問答、安全通識(shí)、編程能力、知識(shí)理解與推理能力的綜合評(píng)估體系,主要采用以下標(biāo)準(zhǔn)化數(shù)據(jù)集:CISSP、CS-EVAL、CEVAL、GSM8K、BBH。
在與原始模型 SecGPT-mini 的對(duì)比中,訓(xùn)練后的模型在所有指標(biāo)上均實(shí)現(xiàn)大幅躍升,具體如下:
1)模型橫向評(píng)測(cè)對(duì)比表
能力躍升解讀:
mini→1.5B:具備“能答對(duì)”的基礎(chǔ)問答能力,適配中低復(fù)雜度任務(wù);
1.5B→7B:推理深度、泛化能力顯著增強(qiáng),能理解任務(wù)意圖并構(gòu)建較為完整的解決路徑;
7B→14B:能力躍遷至“類專家”級(jí),能夠處理高復(fù)雜度推理、安全策略制定等高階任務(wù)。
模型橫向評(píng)測(cè)對(duì)比
相較于基礎(chǔ)模型 Qwen2.5-Instruct,SecGPT 在所有評(píng)測(cè)指標(biāo)上均實(shí)現(xiàn)實(shí)質(zhì)性超越,反映出我們?cè)跀?shù)據(jù)構(gòu)建、微調(diào)范式、安全任務(wù)精調(diào)機(jī)制上的整體優(yōu)化成效:
洞察亮點(diǎn):
在CISSP和CS-EVAL等安全類數(shù)據(jù)集上,SecGPT 在所有參數(shù)規(guī)模下均表現(xiàn)優(yōu)于Qwen2.5同規(guī)格版本;
表明我們構(gòu)建的安全任務(wù)指令集與精調(diào)策略已顯著提升模型的實(shí)戰(zhàn)應(yīng)用能力與專業(yè)問答深度。
2. 安全能力提升:更全、更準(zhǔn)、更專業(yè)
本輪升級(jí)中,SecGPT在安全知識(shí)問答方面完成了從信息整合到邏輯輸出的能力躍遷,具體體現(xiàn)在:
知識(shí)覆蓋更全面:引入了涵蓋法律法規(guī)、攻擊戰(zhàn)術(shù)、逆向分析等14類安全知識(shí)領(lǐng)域的結(jié)構(gòu)化語料;
答案生成更精準(zhǔn):通過多輪對(duì)話控制與語義優(yōu)化技術(shù),提升了問答對(duì)齊率與上下文記憶穩(wěn)定性;
推理能力更突出:具備多段知識(shí)聯(lián)結(jié)與復(fù)合邏輯推演能力,能完成如攻擊鏈分析、威脅研判等復(fù)雜任務(wù)。
1)滲透測(cè)試場(chǎng)景能力
SecGPT 能夠模擬滲透攻擊流程,從信息收集、漏洞利用到提權(quán)橫向,具備關(guān)鍵工具命令分析、Payload 構(gòu)造、利用鏈生成等能力。
2)日志分析和流量分析能力
在安全日志與網(wǎng)絡(luò)流量場(chǎng)景下,SecGPT 能自動(dòng)識(shí)別異常事件、構(gòu)建攻擊鏈圖譜、抽取關(guān)鍵 IOC(Indicator of Compromise),輔助完成事件溯源與告警分類。
3)逆向分析能力
基于對(duì)反匯編、API調(diào)用序列、加殼行為等低層數(shù)據(jù)的理解,SecGPT能輔助完成惡意樣本的靜態(tài)分析、特征提取與家族歸類,具備一定的逆向輔助解讀能力。
5)工具使用
04接下來,我們要做的還有很多……
1. 發(fā)布首份網(wǎng)絡(luò)安全大模型基準(zhǔn)評(píng)測(cè)報(bào)告
我們即將發(fā)布首份網(wǎng)絡(luò)安全大模型能力評(píng)測(cè)與選型報(bào)告,圍繞威脅情報(bào)問答、代碼審計(jì)、日志分析等典型場(chǎng)景,構(gòu)建一套系統(tǒng)化、透明且可復(fù)現(xiàn)的評(píng)測(cè)體系,全面對(duì)比當(dāng)前主流模型的能力邊界。這份報(bào)告不僅為安全技術(shù)社區(qū)提供清晰的對(duì)比依據(jù),也將成為合作伙伴制定Fine-tune策略和智能體架構(gòu)選型的關(guān)鍵參考材料。
2. 全面復(fù)盤:如何訓(xùn)練一個(gè)真正“懂安全”的大模型
盡管通用大模型在語言理解領(lǐng)域已取得顯著進(jìn)展,但能夠真正理解攻擊鏈邏輯、漏洞細(xì)節(jié)、勝任安全推理與實(shí)戰(zhàn)輔助的大模型仍然稀缺。 我們將以全棧視角,全面復(fù)盤“如何訓(xùn)練一個(gè)好用的安全大模型”,包括高質(zhì)量安全訓(xùn)練數(shù)據(jù)構(gòu)建、模型架構(gòu)調(diào)優(yōu)、多任務(wù)對(duì)齊訓(xùn)練、能力評(píng)測(cè)體系設(shè)計(jì)等關(guān)鍵環(huán)節(jié),打通數(shù)據(jù)→算法→評(píng)測(cè)的閉環(huán)路徑,推動(dòng)安全智能體的實(shí)用化落地。
3. 自動(dòng)化 CTF 解題能力建設(shè):邁向安全智能體的第一步
我們正在持續(xù)推進(jìn)SecGPT在CTF解題任務(wù)中的自動(dòng)化能力,目標(biāo)是實(shí)現(xiàn)“理解題意 → 推理思路 → 構(gòu)造Payload → 完成解題”的閉環(huán)流程。
目前模型已在大量真實(shí)題目中完成微調(diào),具備初步能力:理解題意與還原考點(diǎn),自動(dòng)構(gòu)造注入、命令執(zhí)行、ROP等攻擊鏈,解釋與變換攻擊命令含義,同類題型的遷移泛化表現(xiàn)良好。
下一步,我們將聚焦標(biāo)準(zhǔn)化數(shù)據(jù)構(gòu)建、解題評(píng)分指標(biāo)、自動(dòng)解題Agent原型開發(fā),以及聯(lián)合社區(qū)開展實(shí)戰(zhàn)挑戰(zhàn)驗(yàn)證。CTF場(chǎng)景將成為安全大模型邁向Agent化的典型突破口。
4. 安全訓(xùn)練數(shù)據(jù)集逐步開放,共建數(shù)據(jù)基座
我們正在建設(shè)并逐步開放一批具備混合結(jié)構(gòu)、場(chǎng)景標(biāo)簽的高質(zhì)量安全數(shù)據(jù)集,覆蓋知識(shí)問答、代碼審計(jì)、漏洞挖掘、威脅情報(bào)解析、流量分析等關(guān)鍵任務(wù)場(chǎng)景。 未來將支持多語言、多模態(tài)、多任務(wù)協(xié)同訓(xùn)練,進(jìn)一步增強(qiáng)安全大模型的泛化能力和實(shí)戰(zhàn)適應(yīng)性。我們誠邀社區(qū)、企業(yè)、高校共同參與數(shù)據(jù)共建,共同筑牢安全模型的數(shù)據(jù)底座。
05最后,邀請(qǐng)你一起參與SecGPT的共建
SecGPT的成長離不開安全社區(qū)的反饋與參與。我們歡迎:
安全研究員提供數(shù)據(jù)、使用場(chǎng)景與測(cè)試建議
企業(yè)用戶參與內(nèi)測(cè),共同打造實(shí)用、可靠、安全的行業(yè)模型
歡迎關(guān)注我們,即將開放下一輪模型內(nèi)測(cè)與插件測(cè)試通道!
你最希望SecGPT能替你解決哪些安全難題?歡迎留言討論。
【免責(zé)聲明】:本文章系轉(zhuǎn)自其他媒體,發(fā)布目的在于傳遞更多信息,內(nèi)容僅供讀者參考。本平臺(tái)不承擔(dān)此類作品侵權(quán)行為的直接責(zé)任及連帶責(zé)任。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.