網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

智譜發(fā)布AutoGLM沉思版：推動(dòng)AI Agent進(jìn)入「邊想邊干」階段

2025-03-31 12:16:26　來源: IPO早知道

上海舉報(bào)

分享至

全球首個(gè)集深度研究與實(shí)際操作能力于一體的Agent。

本文為IPO早知道原創(chuàng)

作者｜Stone Jin

據(jù)IPO早知道消息，智譜于3月31日在中關(guān)村論壇上正式發(fā)布AutoGLM沉思，這一全新智能體不僅具備深度研究能力（Deep Research），還能實(shí)現(xiàn)實(shí)際操作（Operator），真正推動(dòng)AI Agent進(jìn)入“邊想邊干”的階段。

AutoGLM沉思的技術(shù)演進(jìn)路徑包括：GLM-4基座模型 → GLM-Z1推理模型 → GLM-Z1-Rumination沉思模型 → AutoGLM模型。其中核心鏈路的模型和技術(shù)， 4月14日，智譜將正式開源，以推動(dòng)行業(yè)生態(tài)發(fā)展。

“讓機(jī)器像人一樣思考”，智譜始終專注于AGI的基座模型研發(fā)，目前已經(jīng)探索到L3-Agentic LLM階段。在行業(yè)生態(tài)方面，智譜堅(jiān)持和行業(yè)伙伴共創(chuàng)，用其在大模型研發(fā)上的積累幫助行業(yè)伙伴成功，合力做出成功的大模型應(yīng)用。智譜也積極推動(dòng)中國(guó)AI解決方案出海，幫助“一帶一路”國(guó)家構(gòu)建自主、可控、無幻覺的國(guó)家級(jí)/區(qū)域級(jí)自主大模型。

全球首個(gè)集深度研究與實(shí)際操作能力于一體

在AI Agent的發(fā)展過程中，智譜始終在不斷探索和創(chuàng)新。從最早推出具備Function Call能力的智譜清言（2023.10），到率先上線支持智能體編排的GLMs（2024.1），再到推出全球首個(gè)設(shè)備操控智能體AutoGLM（2024.10），智譜一直引領(lǐng)AI Agent 上界的探索。

值得一提的是，智譜推出全新的AutoGLM沉思模型，全球首個(gè)集深度研究與實(shí)際操作能力于一體的Agent。這是自主智能體技術(shù)的一次重要進(jìn)步，也是設(shè)備操控智能體的進(jìn)一步升級(jí)。

這一能力的實(shí)現(xiàn)依賴于三個(gè)關(guān)鍵特性：

?深度思考：能夠模擬人類在面對(duì)復(fù)雜問題時(shí)的推理與決策過程。

?感知世界：能夠像人一樣獲取并理解環(huán)境信息。

?工具使用：能夠像人一樣調(diào)用和操作工具，完成復(fù)雜任務(wù)。

AutoGLM沉思融合了以上三大能力。與OpenAI 的 Deep Research不同，它不僅能深入研究，還能真正執(zhí)行任務(wù)，推動(dòng)AI Agent從單純的思考者，進(jìn)化為能交付結(jié)果的智能執(zhí)行者。

「AutoGLM 沉思」背后的模型，則是智譜全新推出的Agent大腦——沉思模型，即通過強(qiáng)化學(xué)習(xí)，讓模型學(xué)會(huì)自我批評(píng)、反思、甚至沉思，并通過更長(zhǎng)的深度思考時(shí)間換取更優(yōu)的效果。沉思突破了實(shí)時(shí)聯(lián)網(wǎng)搜索、動(dòng)態(tài)工具調(diào)用、深度分析和自我驗(yàn)證，實(shí)現(xiàn)真正的長(zhǎng)程推理和任務(wù)執(zhí)行。

值得一提的是，智譜的AutoGLM系列再次取得重要進(jìn)展。

在斯坦福大模型中心《AI指數(shù)2024》選定的智能體基準(zhǔn)評(píng)測(cè)AgentBench上，AutoGLM系列模型在5個(gè)測(cè)試環(huán)境中也取得了 SOTA的成績(jī)。其中，在Phone Use基準(zhǔn)（AndroidLab & AndroidWorld）中，AutoGLM-Phone的任務(wù)成功率較此前最佳成績(jī)提升超過20%；在Browser Use基準(zhǔn)上，AutoGLM-Web也全面超越OpenAI GPT-4o和Anthropic Claude-3.5-Sonnet，展現(xiàn)了在網(wǎng)頁交互場(chǎng)景中的領(lǐng)先能力。

在GUI智能體領(lǐng)域，智譜自研模型GLM-PC（CogAgent）在多個(gè)權(quán)威評(píng)測(cè)榜單上取得SOTA 成績(jī)。憑借僅9B的參數(shù)，CogAgent超越了包括GPT-4o + UGround、Claude Computer Use等更大規(guī)模的同類模型或商用API。

得益于自主研發(fā)的全棧大模型技術(shù)

進(jìn)一步來講，「AutoGLM沉思」模型的背后，是智譜自主研發(fā)的全棧大模型技術(shù)，融合了GLM-4的通用能力、GLM-Z1的反思能力、GLM-Z1-Rumination的沉思能力，以及AutoGLM的自動(dòng)執(zhí)行能力。

1、新版基座模型

基于最新的技術(shù)積累，智譜重新訓(xùn)練了一個(gè)320億參數(shù)的基座模型 GLM-4-Air-0414，在預(yù)訓(xùn)練階段加入了更多的代碼類、推理類數(shù)據(jù)，并在對(duì)齊階段針對(duì)智能體能力進(jìn)行了優(yōu)化，模型在工具調(diào)用、聯(lián)網(wǎng)搜索、代碼等智能體任務(wù)上的能力得到大大加強(qiáng)。

GLM-4-Air-0414 以 32B 參數(shù)量比肩更大參數(shù)量的國(guó)內(nèi)外主流模型，這使得模型在適配智能體任務(wù)方面特別有效。這是因?yàn)橹悄荏w任務(wù)往往涉及多輪復(fù)雜交互，32B的參數(shù)量使得 GLM-4-Air-0414 能快速執(zhí)行復(fù)雜任務(wù)，為 AI 智能體的真正大規(guī)模落地應(yīng)用提供了堅(jiān)實(shí)基礎(chǔ)。

2、新版推理模型

基于 GLM-4-Air-0414，智譜引入了更多推理類數(shù)據(jù)，并在對(duì)齊階段深度優(yōu)化了通用能力，推出了全新的深度思考模型 GLM-Z1-Air。

在性能表現(xiàn)上，可以與DeepSeek-R1（671B，激活37B）媲美。智譜在 AIME 24/25、LiveCodeBench、GPQA 等基準(zhǔn)測(cè)試中對(duì) GLM-Z1-Air 進(jìn)行了評(píng)估，評(píng)估結(jié)果顯示 GLM-Z1-Air 展現(xiàn)了較為強(qiáng)大的數(shù)理推理能力，為更多復(fù)雜任務(wù)的解決提供了支持：

在推理速度上，GLM-Z1-Air相比 R1 提升了8倍，成本可以降低至1/30，實(shí)現(xiàn)高性能與高性價(jià)比的雙重突破。

此外，GLM-Z1-Air可在消費(fèi)級(jí)顯卡上運(yùn)行。為了更進(jìn)一步解放開發(fā)者在硬件方面的限制。

智譜亦在MAAS平臺(tái)上將免費(fèi)模型 GLM-4-Flash 的基座版本更新至 GLM-4-Flash-0414，并推出了對(duì)應(yīng)的推理版本 GLM-Z1-Flash，在保留大部分效果的情況下更輕量級(jí)、更高速，完全免費(fèi)調(diào)用，以適用于更廣泛的應(yīng)用場(chǎng)景。

3、沉思模型

基于GLM-Z1，智譜通過擴(kuò)展強(qiáng)化學(xué)習(xí)訓(xùn)練，提升了模型結(jié)合工具使用完成長(zhǎng)程推理能力，訓(xùn)練出沉思模型GLM-Z1-Rumination。

該模型突破了傳統(tǒng)AI單純依賴內(nèi)部知識(shí)推理的局限，創(chuàng)新性地結(jié)合實(shí)時(shí)聯(lián)網(wǎng)搜索、動(dòng)態(tài)工具調(diào)用、深度分析和自我驗(yàn)證，形成完整的自主研究流程：

?實(shí)時(shí)搜索：主動(dòng)獲取最新信息，突破信息孤島。

?深度分析：進(jìn)行多角度邏輯推理，避免單一思維路徑。

?動(dòng)態(tài)驗(yàn)證：不斷修正假設(shè)，提高研究的準(zhǔn)確性與邏輯性。

GLM-Z1-Rumination 能夠主動(dòng)理解用戶需求，在復(fù)雜任務(wù)中不斷優(yōu)化推理、反復(fù)驗(yàn)證與修正假設(shè)，使研究成果更具可靠性與實(shí)用性。相比于傳統(tǒng)的推理模型，智譜期待沉思模型引領(lǐng)AI助手進(jìn)入一個(gè)“高智商”到“高智商+高自主”的階段，能夠自主完成更復(fù)雜、更深入的研究任務(wù)。

上述模型將于4月14日開源，并將在未來兩周內(nèi)陸續(xù)上線MaaS平臺(tái)（bigmodel.cn）。

全力推動(dòng)AI新變革的落地與發(fā)展

不可否認(rèn)的是，2025年無疑是AI Agent的爆發(fā)之年，智譜將戰(zhàn)略聚焦Agentic GLM的研發(fā)，以推動(dòng)智能體技術(shù)的快速發(fā)展。

在技術(shù)方面，智譜將依托原創(chuàng)自主大模型技術(shù)，持續(xù)推動(dòng)具備邏輯推理和深度思考能力的Agent基座模型與通用基座模型的研發(fā)，再到智能體框架與Agent應(yīng)用，朝著讓機(jī)器像人一樣思考和行動(dòng)的目標(biāo)不斷前進(jìn)。

智譜還將搭建Agentic LLM平臺(tái)，助力生態(tài)合作伙伴利用智譜模型與智能體的強(qiáng)大能力，構(gòu)建行業(yè)、地域與場(chǎng)景深度融合的智能體應(yīng)用。

在行業(yè)生態(tài)方面，智譜將作為模型廠商，始終致力于幫助應(yīng)用合作伙伴在GLM模型上實(shí)現(xiàn)成功的大模型應(yīng)用。目前，智譜已攜手金融、教育、醫(yī)療、政務(wù)、企服等領(lǐng)域的合作伙伴，共同推進(jìn)Agentic LLM的落地應(yīng)用。

同時(shí)，智譜也相繼與北京、杭州、上海、成都、珠海等城市達(dá)成合作，與當(dāng)?shù)佚堫^企業(yè)攜手推動(dòng)當(dāng)?shù)卮竽Ｐ蛻?yīng)用生態(tài)的建設(shè)。

作為一家朝向 AGI 的公司，智譜不僅致力于推動(dòng)國(guó)產(chǎn)大模型技術(shù)的發(fā)展，也希望能為世界貢獻(xiàn)中國(guó)AI力量——智譜正在積極推動(dòng)中國(guó)原創(chuàng)大模型及解決方案出海，幫助“一帶一路”國(guó)家構(gòu)建自主、可控、無幻覺的國(guó)家級(jí)/區(qū)域級(jí)的自主大模型。由智譜主導(dǎo)，來自東盟十國(guó)及“一帶一路”沿線的10個(gè)國(guó)家共同發(fā)起了“自主大模型國(guó)際共建聯(lián)盟”正式成立，幫助“一帶一路”國(guó)家建立自主AI，構(gòu)建可控的國(guó)家級(jí)AI基礎(chǔ)設(shè)施。

AI的下一個(gè)應(yīng)用范式正在加速形成，智譜將全力投入，推動(dòng)這一變革的落地與發(fā)展。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.