網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

為什么不能把控制權(quán)交給AI智能體？

2025-03-26 17:29:12　來源: DeepTech深科技

北京舉報(bào)

分享至

AI 智能體正掀起一場(chǎng)全新的人機(jī)交互革命。

與傳統(tǒng)的 AI 聊天機(jī)器人不同，這種開創(chuàng)性的系統(tǒng)突破了聊天對(duì)話框的限制，能夠自主在電腦多個(gè)應(yīng)用程序間來回穿梭執(zhí)行更為復(fù)雜的任務(wù)

舉個(gè)例子，用戶只需簡單說一句“幫我安排明天的會(huì)議”，AI 智能體就能自動(dòng)協(xié)調(diào)日程、發(fā)送邀請(qǐng)、預(yù)訂會(huì)議室，甚至根據(jù)會(huì)議主題自動(dòng)生成一份議程。它像一位全能管家，通過整合搜索引擎、辦公軟件、電商網(wǎng)站等各種工具，實(shí)現(xiàn)“一句話完成一百步操作”。

隨著 AI 智能體“功力見長”，一個(gè)根本性問題浮出水面：我們究竟該賦予它們多少自主權(quán)？又該如何衡量技術(shù)便利與潛在風(fēng)險(xiǎn)的代價(jià)

（來源：MIT Technology Review）

有業(yè)內(nèi)專家曾直言：“這類‘能自主行動(dòng)的 AI’正在突破數(shù)字與物理世界的邊界，一旦失控將釀成災(zāi)難性后果。”

比如，學(xué)生讓 AI“幫我應(yīng)付無聊的課”，結(jié)果 AI 竟生成威脅電話，這其實(shí)是源于它機(jī)械執(zhí)行的字面指令，卻完全忽視了社會(huì)倫理；再比如，手機(jī) AI 智能體依賴系統(tǒng)級(jí)“無障礙功能”權(quán)限，可訪問銀行密碼、聊天記錄等敏感信息，而這可能成為黑客竊取數(shù)據(jù)的關(guān)鍵漏洞。

逐步放棄控制權(quán)：自主與失控的博弈

當(dāng)前，AI 智能體的技術(shù)迭代速度驚人，幾乎每周都有新框架和新功能發(fā)布。企業(yè)更是不遺余力地宣傳其“解放人類雙手”的美好愿景，幫助人們?nèi)プ瞿切]時(shí)間做或不想做的事情，從而讓生活變得更輕松愜意。

最典型的代表就是“Computer Use”（計(jì)算機(jī)使用）功能，它讓 Anthropic 公司的 Claude像人一樣使用電腦，直接代替你在執(zhí)行各種操作。近期還有一款名為 Manus 的通用 AI 智能體，它也可以利用各種工具完成多種任務(wù)，比如搜集整理人物資料或?qū)ふ曳吭吹取?/p>

值得一提的是，AI 智能體還能夠提升殘障人士的生活質(zhì)量，比如通過語音指令讓智能體完成網(wǎng)購、訂餐以及查詢資料等一系列任務(wù)。此外，在一些緊急情況下，比如災(zāi)難發(fā)生時(shí)，AI 智能體還可以協(xié)調(diào)大規(guī)模人群疏散，通過引導(dǎo)交通幫助人們逃離危險(xiǎn)區(qū)域。

這些 AI 智能體被設(shè)計(jì)的初衷是用來幫助甚至替代人類執(zhí)行操作，這個(gè)愿景非常令人向往，畢竟誰不希望有人幫忙處理繁瑣的任務(wù)呢？但是，技術(shù)狂奔背后暗藏隱憂，在追求更大自主性的過程中，AI 智能體的這一愿景也帶來了巨大的風(fēng)險(xiǎn)。

Hugging Face 的一個(gè)研究小組長期專注于智能體的開發(fā)和研究。在他們看來，AI 智能體最引人注目的特質(zhì)，恰恰也是最令人警惕的矛盾點(diǎn)：人類為了獲得更高效的服務(wù)，不得不逐步交出對(duì)它的控制權(quán)

AI 智能體建立在大語言模型的基礎(chǔ)之上并通過模型獲得“自主決策”能力，但是大語言模型目前仍然存在“黑箱”和“幻覺”缺陷，意味著它們可能做出人類無法預(yù)見的行動(dòng)。

舉個(gè)例子，OpenAI 推出的首款 AI 智能體“Operator”，它通過強(qiáng)化學(xué)習(xí)獲得操作瀏覽器的能力，但其“感知-推理-操作”的循環(huán)機(jī)制也存在風(fēng)險(xiǎn)，當(dāng)它誤判用戶指令時(shí)，可能會(huì)像人類一樣犯錯(cuò)，比如將“刪除草稿文件”誤解為“永久刪除所有文件”，導(dǎo)致數(shù)據(jù)全部丟失。

進(jìn)一步講，傳統(tǒng) AI 聊天機(jī)器人若是出現(xiàn)錯(cuò)誤則僅限于“對(duì)話框內(nèi)”，而智能體的“物理級(jí)”操作能力則將風(fēng)險(xiǎn)進(jìn)行了指數(shù)級(jí)放大

比如，一個(gè)管理日程的 AI 智能體，可能在“優(yōu)化效率”的邏輯下，擅自取消了用戶與客戶的會(huì)議。更危險(xiǎn)的是，某些“完全自主智能體”能夠自主編寫并執(zhí)行代碼，若被惡意利用，可能像病毒般自我復(fù)制，甚至突破安全邊界。

很大程度上，AI 智能體的核心，即減少人類干預(yù)，這恰恰是其最大的安全隱患

（來源：MIT Technology Review）

為了全面了解整體風(fēng)險(xiǎn)收益情況，Hugging Face 的研究團(tuán)隊(duì)根據(jù)自主性程度對(duì) AI 智能體系統(tǒng)劃分成五類。隨著層級(jí)的升高，人類控制權(quán)的逐步減少，直至消失。

最低層級(jí)就像是“處理器”，是指那些對(duì)程序流程沒有影響的智能體，比如企業(yè)客服聊天機(jī)器人，僅執(zhí)行預(yù)設(shè)指令，完全受人類控制。

中間的層級(jí)，則包括類似于“路由器”（決定執(zhí)行哪些步驟，但需人類確認(rèn)關(guān)鍵操作）、“工具調(diào)用智能體”（能調(diào)用第三方工具，但依賴人類編寫的核心邏輯）以及“多步執(zhí)行智能體”（自主規(guī)劃任務(wù)流程，但需在敏感操作時(shí)交出控制權(quán)）。

最高層級(jí)則是“完全自主智能體”，它們可以在沒有人類約束或監(jiān)督的情況下編寫并執(zhí)行新代碼，即使你沒有提出要求，它們也能采取行動(dòng)（比如移動(dòng)文件、更改記錄、發(fā)送郵件等），甚至還能繞過人類監(jiān)督。

AI 智能體的“全能”特性使其成為隱私泄露的溫床。例如，一個(gè)分析用戶社交關(guān)系的 AI 智能體，可能需要訪問通訊記錄、瀏覽歷史等敏感數(shù)據(jù)。

同時(shí)，若 AI 智能體能夠同時(shí)控制多個(gè)信息源時(shí)，潛在的危害將急劇增加。例如，一個(gè)管理日程的 AI 智能體若同時(shí)訪問社交媒體，可能將私人行程發(fā)布到公開平臺(tái)，或根據(jù)“優(yōu)化社交形象”的邏輯，自動(dòng)生成并發(fā)布虛假動(dòng)態(tài)。

未來，我們或許會(huì)經(jīng)常聽到這樣的辯解：“這不是我本人做的，而是我智能體所為！”

有業(yè)內(nèi)專家曾指出：“當(dāng)智能體能同時(shí)控制你的電腦、手機(jī)和物聯(lián)網(wǎng)設(shè)備時(shí)，它就是你生活中的‘?dāng)?shù)字暴君’。”

掌握控制權(quán)：人類監(jiān)督的生死防線

事實(shí)上，人類對(duì)技術(shù)失控的恐懼并非空穴來風(fēng)。

早在 1980 年，計(jì)算機(jī)系統(tǒng)曾錯(cuò)誤地顯示有超 2,000 枚蘇聯(lián)導(dǎo)彈正飛向北美，這觸發(fā)了緊急程序，幾乎將人類推向了災(zāi)難的邊緣，最終確認(rèn)是系統(tǒng)故障。

這一事件成為人類監(jiān)督技術(shù)的重要轉(zhuǎn)折點(diǎn)，如果決策權(quán)完全交給追求“速度優(yōu)先”的自主系統(tǒng)后果將不堪設(shè)想。業(yè)內(nèi)專家表示：“技術(shù)的致命缺陷在于，它既沒有恐懼，也沒有道德感。”

一些人或許會(huì)反駁說，“它所帶來的益處大于風(fēng)險(xiǎn)，那就值得去冒險(xiǎn)。”但 Hugging Face 的研究人員認(rèn)為，保持人類控制權(quán)與享受技術(shù)便利并不沖突

開源 AI 智能體系統(tǒng)是應(yīng)對(duì)風(fēng)險(xiǎn)的一種方法，因?yàn)檫@類系統(tǒng)能讓人類更清楚地了解系統(tǒng)能做什么、不能做什么，從而加強(qiáng)對(duì)其的監(jiān)督。

研究人員以他們開發(fā)的 Smolagents 開源框架為例，其提供了一個(gè)“沙盒式”的安全環(huán)境，讓開發(fā)者構(gòu)建以透明性為核心的 AI 智能體，這樣任何獨(dú)立團(tuán)隊(duì)都可以驗(yàn)證是否存在適當(dāng)?shù)娜祟惪刂啤?/p>

這種透明性與閉源 AI 形成鮮明對(duì)比，后者通過層層專有技術(shù)掩蓋其決策過程，導(dǎo)致安全性根本無法得到保障。畢竟，當(dāng) AI 的決策過程像迷霧一樣不可見時(shí)，安全就無從談起。

研究人員最后強(qiáng)調(diào)，在開發(fā)日益復(fù)雜的 AI 智能體的過程中，人類必須認(rèn)識(shí)到，它們是工具而非決策者、是助手而非替代者。盡管人類的判斷力也并不完美，但仍然是確保這些系統(tǒng)服務(wù)于人類的利益而不是破壞人類利益的關(guān)鍵所在。

1.https://www.technologyreview.com/2025/03/24/1113647/why-handing-over-total-control-to-ai-agents-would-be-a-huge-mistake/

2.https://huggingface.co/learn/agents-course/unit0/introduction

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.