年前AI圈混戰,熱鬧程度不亞于23年3月,一個個都卷麻了。
OpenAI半泄漏半預熱搞了半天的Agent產品Operator還沒來。
智譜的新版Agent GLM-PC悄無聲息的憋了個大的,直接先來了。
昨天夜里,智譜突然讓我幫忙試一下他們的Agent。
真的是夜里。。。
AI圈好熱鬧,但是作為一個自媒體,我的肝好想說:
求求了,大過年的,放過我吧。。。
沒辦法,為了首發,咋辦呢,只能熬夜一個通宵,肝他娘的。
還好,在體驗了一夜后,GLM-PC 1.1版本,沒有讓我失望。
雖然小問題還是有一些,但,前路已明。
可以說,如今AI領域,最讓我興奮、最讓我覺得科幻的,也只有Agent了。
也給大家簡單過一下他們Agent的歷史。
2024年10月25日,智譜在CNCC發布了第一款手機自主人工智能,AutoGLM,直接在行業內和金融市場上掀起了風暴。
2024年11月29日,智譜在Agent OpenDay上,宣布升級版的AutoGLM,還有電腦版本的自主人工智能,GLM-PC 1.0內測版。
但是那時候,GLM-PC還是非常不成熟的,我也在當時的發布會現場寫到:
終于,兩個月以后,GLM-PC 1.1正式版,來了。
復雜任務拆解能力大幅強化,任務成功率比1.0高太多太多了,操作速度直逼人類,每步操作幾乎都在1.5s以內,雖然別看只是0.1版本的升級,但我覺得他們內部對比版本號命名還是保守了,其實完全可以叫2.0的,再不濟1.5也是可以的。。。
而且,Mac和Windows,全都都可用了。
跨越時空,智譜AI也完成了7年前,老羅在鳥巢那個“理解萬歲”的夢。
也不知道,老羅看著如今的GLM-PC 1.1版本,會不會也搖著扇子,感慨到:我當年那個TNT也是很酷的啊,就是這么想的啊...如果我們晚做7年...可惜啊,沒有如果。
網址在此:https://cogagent.aminer.cn/home
下載注冊以后,就會來到首頁。
雖然我也不知道智譜他們為啥要給GLM-PC取名叫牛牛,可能,是因為GLM-PC作為新時代的Agent代表,可以堪稱賽博牛馬?...
這次最大的功能更新,是他們加入的深度思考。
類似于OpenAI o1那種做法,你給GLM-PC發一個任務,他會給你先生成一套非常詳細的思維鏈,自己給自己想明白以后,再去執行。
比如說給微信上的“熬夜測試”群的所有群成員發送2025年新春祝福語。
他會一步一步思考、拆解、返回結果,即使失敗了也會自己PUA自己來進行重新反思。
而且最特別的是,跟手機端的AutoGLM不一樣,這次更新明顯不只是純視覺方案了,還引入了代碼機制。
生成的內容,是函數,在上圖中,能看到兩個GLM-PC定義的函數LAUNCH_APP和CogAgent。
這個點非常有意思,代碼是極度嚴謹、規范、正確率高的方式,他們拋棄了傳統的思維鏈,而是使用代碼式的思維鏈,在我幾個小時的體驗里,明顯能感覺到,在這套邏輯的加持下,GLM-PC對復雜任務的規劃、推理、和反思的能力,得到了明顯的強化。
之前GLM-PC 1.0版本的模型,是智譜在2023年就開始做的多模態GUI Agent - CogAgent,去年12月20他們也直接開源出去了,能感知和理解交互界面中的視覺元素與布局,模擬人類做出任意元操作,就比如點擊、鍵盤輸入、懸浮、拖拽那些。
而這次加入代碼后,通過代碼思維框架和圖形界面的結合,有點像神經心理學理論中的左右腦,為右腦補齊了理性的左腦,成了一個真正完整的智能。
看看上面這個case的實際運行效果。視頻為了大家觀感,我都做了2倍速處理。
整體上,一氣呵成,直接給我測試群里四個人,全部發了一個新春祝賀,甚至還是定制化的,每個人都寫了名字,內容還不一樣。
我還能說什么好呢?
真的,玩AI這么久,體驗了幾百款AI產品,我已經很久沒有被AI所震撼了。
但是當這種任務,在電腦上,AI理解我的意圖后,自動化完美的處理完成的時候,我才真真切切的感受到。
科幻變成現實的感覺。
全世界,智譜,是第一個做到的。
這一刻,怎么吹國產AI,我覺得都不為過。
2025,必是真正的Agent之年。
我也希望,是屬于智譜Agent,璀璨的一年。
除了單純的發微信文字消息,你還可以讓AI,給你制作圖片和視頻,自動發送過去。
比如,我想讓GLM-PC,給微信上的“鮮蝦包”發送2025年新春祝福語,再給他制作一個新春圖片和一個新春祝賀視頻,發送給他。
不止發文字,GLM-PC還直接調用智譜自己的接口,創作了圖和視頻,發給了鮮蝦包。
太太太太牛逼了。
這個圖片和視頻的美感雖然確實有點不太好看,但是不妨礙作為Agent的這個能力,直接酷到爆炸好吧。
又比如我還可以讓它:
直接一氣呵成。
雖然最后出現了BUG,一直卡死在時間循環那了,因為調用錯了時間,且飛書日歷只有半點和整點,時間匹配不上,所以沒能成功。
但是在我看來,依然瑕不掩瑜。
整體測試上,在多步任務上表現還算是比較穩定的。
比如馬上春節了,我們可以讓它:打開小紅書,在小紅書搜索春節習俗,獲取前三篇的圖片和文字介紹,擴寫成一篇文章,保存到桌面Word文件。
可以看到,這些任務都執行的很好,把前三篇的文章都保存下來了,還能擴寫,word文件也保存的很好。
你什么都不需要干,只需要一句話,一篇word就完事了。
這一瞬間,我感覺,我看見了未來。
我腦子里莫名其妙想到的一個場景。
我穿越回到了1976年,在加州那個著名的車庫里,我面前站著喬布斯和沃茲尼亞克,看著他們正在焊那個具有革命意義的Apple I,我拉著他們走到旁邊,說:
嘿,給你們看一個神跡。
這叫,人工智能。
你看,我也見證了一個新的時代,見證了人機交互的又一次變革。
GLM-PC 1.1的出現,固然還有很多不足之處,比如任務成功率不是百分百,有時候也會陷入死循環。還會對著屏幕亂點,屏幕尺寸的支持也不是很好,我的帶魚屏直接沒法用,只能拔了外接屏幕用我的筆記本標準分辨率的屏幕。
甚至,在我們的幻想里,真正的Agent,應該是可以打開剪映給我們自動剪個片子,打開Blendr自動建個模,它應該是個無所不能的超人。
當然,今天,AI還沒有達到這一步。
但是永遠不要懷疑,AI的潛力。
凌晨5點,我合上電腦,關燈入眠。
隱約中,我仿佛看到了一束光。
想來,當它再次亮起的時候。
我或許會跟著它一起,走得更遠,更深。
走向那個,與現在相連的未來。
>/ 作者:卡茲克、dongyi
>/ 投稿或爆料,請聯系郵箱:wzglyay@gmail.com
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.