智東西(公眾號:zhidxcom)
編輯 程茜
智東西3月31日消息,今天,智譜在中關村論壇上正式發布AutoGLM沉思,這也是全球首個集深度研究與實際操作能力于一體的Agent。
AutoGLM沉思突破了實時聯網搜索、動態工具調用、深度分析和自我驗證,實現了真正的長程推理和任務執行,這也是國內首個正式開放的Deep Research功能。
經智譜內部評估,AutoGLM沉思背后的深度思考模型GLM-Z1-Air,在性能表現上可以與DeepSeek-R1(671B,激活37B)媲美。
目前,該功能已經正式上線智譜清言網頁端、PC端和手機App,免費、不限量地開放。智譜此次發布的為preview版本,核心支持research場景;在未來兩周,其將進一步擴展更多智能體執行能力,包括推出“虛擬機”版本。
其技術演進路徑包括:GLM-4基座模型 →GLM-Z1推理模型→GLM-Z1-Rumination沉思模型→AutoGLM模型。其中核心鏈路的模型和技術,智譜將于4月14日正式開源,并將在未來兩周內陸續上線MaaS平臺。
體驗地址:https://autoglm-research.zhipuai.cn/?channel=autoglm_android
一、AutoGLM沉思三大關鍵特性,讓機器“邊想邊干”
智譜打造AutoGLM沉思的目標就是:讓機器不僅能夠思考,還能主動行動,實現“邊想邊干”。
這一能力的實現依賴于三個關鍵特性:
深度思考能夠模擬人類在面對復雜問題時的推理與決策過程;感知世界能夠像人一樣獲取并理解環境信息;工具使用能夠像人一樣調用和操作工具,完成復雜任務。
AutoGLM沉思融合了以上三大能力。與OpenAI的Deep Research不同,它不僅能深入研究,還能真正執行任務,推動AI Agent從單純的思考者,進化為能交付結果的智能執行者。
AutoGLM沉思模型的背后,是智譜自主研發的全棧大模型技術,融合了GLM-4的通用能力、GLM-Z1的反思能力、GLM-Z1-Rumination的沉思能力,以及AutoGLM的自動執行能力。
1、新版基座模型
基于最新的技術積累,智譜重新訓練了320億參數的基座模型GLM-4-Air-0414,在預訓練階段加入了更多的代碼類、推理類數據,并在對齊階段針對智能體能力進行了優化,模型在工具調用、聯網搜索、代碼等智能體任務上的能力得到大大加強。
GLM-4-Air-0414以32B參數量比肩更大參數量的國內外主流模型,這使得模型在適配智能體任務方面特別有效,是因為智能體任務往往涉及多輪復雜交互,32B的參數量使得GLM-4-Air-0414能快速執行復雜任務。
2、新版推理模型
基于GLM-4-Air-0414,智譜引入了更多推理類數據,并在對齊階段深度優化了通用能力,推出了全新的深度思考模型GLM-Z1-Air。
在性能表現上,GLM-Z1-Air可以與DeepSeek-R1(671B,激活37B)媲美。智譜在AIME 24/25、LiveCodeBench、GPQA等基準測試中對GLM-Z1-Air進行了評估,評估結果顯示GLM-Z1-Air展現了較為強大的數理推理能力,為更多復雜任務的解決提供了支持:
在推理速度上,GLM-Z1-Air相比R1提升了8倍,成本可以降低至1/30。
此外,GLM-Z1-Air可在消費級顯卡上運行。
智譜還在MAAS平臺上將免費模型GLM-4-Flash的基座版本更新至GLM-4-Flash-0414,并推出了對應的推理版本GLM-Z1-Flash,在保留大部分效果的情況下更輕量級、更高速,完全免費調用。
3、沉思模型
基于GLM-Z1,智譜通過擴展強化學習訓練,提升了模型結合工具使用完成長程推理能力,訓練出沉思模型GLM-Z1-Rumination。
該模型突破了傳統AI單純依賴內部知識推理的局限,結合實時聯網搜索、動態工具調用、深度分析和自我驗證,形成完整的自主研究流程:
實時搜索可以主動獲取最新信息,突破信息孤島;深度分析進行多角度邏輯推理,避免單一思維路徑;動態驗證可以不斷修正假設,提高研究的準確性與邏輯性。
GLM-Z1-Rumination能夠主動理解用戶需求,在復雜任務中不斷優化推理、反復驗證與修正假設,使研究成果更具可靠性與實用性。
4、AutoGLM
智譜的AutoGLM系列再次取得重要進展。
在斯坦福大模型中心《AI指數2024》選定的智能體基準評測AgentBench上,AutoGLM系列模型在5個測試環境中也取得了SOTA的成績。其中,在Phone Use基準(AndroidLab & AndroidWorld)中,AutoGLM-Phone的任務成功率較此前最佳成績提升超過20%;在Browser Use基準上,AutoGLM-Web也全面超越OpenAI GPT-4o和Anthropic Claude-3.5-Sonnet,展現了在網頁交互場景中的領先能力。
在GUI智能體領域,智譜自研模型GLM-PC(CogAgent)在多個權威評測榜單上取得SOTA成績。憑借9B參數規模,CogAgent超越了包括GPT-4o+UGround、Claude Computer Use等更大規模的同類模型或商用API。
二、聚焦Agentic GLM研發,聯手金融、教育、醫療、政務、企服賽道
智譜在AI Agent領域的研發,包括從最早推出具備Function Call能力的智譜清言,到率先上線支持智能體編排的GLMs,再到推出全球首個設備操控智能體AutoGLM。
2025年,智譜將戰略聚焦Agentic GLM的研發。
在技術方面,智譜將依托原創自主大模型技術,持續推動具備邏輯推理和深度思考能力的Agent基座模型與通用基座模型的研發,再到智能體框架與Agent應用,朝著讓機器像人一樣思考和行動的目標不斷前進。
智譜還將搭建Agentic LLM平臺,助力生態合作伙伴利用智譜模型與智能體的強大能力,構建行業、地域與場景深度融合的智能體應用。
在行業生態方面,智譜將作為模型廠商,幫助應用合作伙伴在GLM模型上實現成功的大模型應用。目前,智譜已攜手金融、教育、醫療、政務、企服等領域的合作伙伴,共同推進Agentic LLM的落地應用。
與此同時,智譜也相繼與北京、杭州、上海、成都、珠海等城市達成合作,與當地龍頭企業攜手推動當地大模型應用生態的建設。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.