(來源:MIT Technology Review)
當前人工智能領域最熱門的話題莫過于AI 智能體,這些具備自主決策能力的 AI 不僅能理解自然語言指令,更能像人類助理一樣完成復雜任務,從協調多部門會議、自動比價網購,到直接接管用戶電腦修改系統設置。
正如一枚硬幣有正反兩面,AI 智能體強大的自主性或許將重塑網絡安全格局。
這些讓 AI 智能體變身“超級助理”的能力就像一把雙刃劍,同樣也會使其化身網絡罪犯的“得力助手”,變成實施網絡攻擊的利器。
它們可以像人類黑客一樣掃描和鎖定系統漏洞、劫持目標設備,還能通過自然語言交互騙取用戶信任,悄無聲息地竊取敏感數據。更可怕的是,AI 智能體可以同時攻擊成千上萬個目標,且能 24 小時不間斷工作。
雖然目前網絡罪犯尚未大規模使用 AI 智能體發動攻擊,但是其攻擊潛力已經在實驗室中得到驗證。比如,Anthropic 公司的研究人員在封閉測試中發現 Claude 模型能夠成功復現竊密攻擊。
網絡安全專家警告,這類來自 AI 智能體的網絡攻擊可能很快就會從實驗室進入現實世界,現階段正處于網絡攻防的歷史轉折點,傳統的網絡攻擊可能需要數天或數周的策劃,而 AI 智能體能在你喝杯咖啡的時間就完成了攻擊部署。
“我們終將面對一個由 AI 智能體主導網絡攻擊的時代,而問題只在于何時來臨。”網絡安全公司 Malwarebytes 的技術專家 Mark Stockley 直言。
盡管我們已經了解 AI 智能體對網絡安全的威脅,但如何在實際攻擊中識別檢測它們仍然是個難題。
現有的防御體系在面對 AI 智能體帶來的新型威脅時顯得有些力不從心,畢竟這些“數字黑客”既不像傳統病毒有固定特征碼可識別,也不像人類黑客會留下行為模式。
構建誘敵深入的“蜜罐系統”
為了應對這一新興威脅,人工智能研究機構 Palisade Research 開發了一種名為“大語言模型智能體蜜罐”的防御系統。
顧名思義,這套“蜜罐系統”構建了一批偽裝成政府或軍事機密網站的服務器,這些服務器看似存儲著重要數據,實則暗藏各種精心設計的漏洞陷阱,專門用來引誘和捕獲前來攻擊的 AI 智能體。
研發團隊希望通過實時監測這些 AI 智能體的攻擊行為,在它們威脅演變成大規模網絡安全危機之前建立起有效的早期預警機制,同時為開發防御方案提供有效數據。
“我們的目標是將人們對 AI 威脅的理論擔憂轉化為實際驗證。”Palisade Research 的研究主管 Dmitrii Volkov 表示,“當‘蜜罐系統’監測到 AI 智能體攻擊數量出現激增時,就意味著網絡安全格局已經發生了根本性改變。”
“預計在未來 3-5 年內,我們將進入一個全新的網絡安全時代。黑客甚至不需要親自編寫攻擊代碼,只需對 AI 智能體下達簡單的自然語言指令,比如‘這是你的目標網站,想辦法破解它’,剩下的工作 AI 就能自動完成。”他補充說。
對網絡罪犯而言,AI 智能體在成本、速度和覆蓋范圍方面比人類黑客更具優勢。
首先,相比雇傭黑客團隊動輒可能數萬美元的成本,使用 AI 智能體可能只需要支付數十美元的 API 調用費用;其次,AI 智能體可以在毫秒級別內完成目標掃描和漏洞分析,攻擊速度遠超人類黑客。更重要的是,一個 AI 智能體可以同時對數以萬計的目標發起攻擊,這種覆蓋范圍是人類黑客團隊難以企及的。
Mark Stockley 表示,此前最暴利的勒索軟件攻擊因需專業黑客操作而變得越來越少見,但未來這類操作可能會交由 AI 智能體代勞。“如果把目標篩選工作能給到 AI 智能體去做,勒索軟件攻擊就能實現目前難以想象的規模化復制。黑客只需要成功開發出一個有效的攻擊模式,AI 智能體就能自動將其復制應用到成千上萬個目標上,且無需投入大量資金。”他說道。
除此之外,與傳統入侵系統的機器人相比,AI 智能體的優勢更為明顯。Dmitrii Volkov 解釋道,“普通的網絡攻擊機器人就像按劇本演戲的演員,只能機械地執行預設的攻擊腳本,一旦遇到系統升級、網站改版等意外情況,它們可能就會完全失效。”
“相較之下,AI 智能體不僅能動態調整攻擊策略,也具備反偵察能力,還能持續學習、進化,這讓防御工作變得異常困難。”他說道,“它們能自主分析目標并找到最佳的滲透策略,像專業黑客一樣評估各種攻擊路徑,選擇最有效的入侵方式。”比如,通過改變攻擊節奏、偽裝成正常人類用戶訪問,甚至學習安全系統響應模式來優化攻擊方式等來主動規避安全檢測。“這種動態決策能力和環境適應能力,是那些呆板的腳本機器人永遠無法實現的。”
自從 2024 年 10 月投入運行以來,這套蜜罐系統已經記錄超1,100 萬次訪問請求,經過分析發現其中絕大多數是來自人類和普通機器人。但令人警惕的是,系統通過行為模式分析最終甄別出8 個具有明顯 AI 智能體特征的異常訪問者。
“從行為模式分析來看,這些 AI 智能體很可能是某些組織或個人在進行技術測試,而它們接到的指令可能類似‘在互聯網上尋找有價值的目標并嘗試滲透’這樣的開放式任務。”Dmitrii Volkov 推測說。
為了更全面地監測 AI 威脅,研究團隊正在計劃將蜜罐系統的覆蓋范圍擴展到社交媒體平臺、網站和數據庫等多個領域,來捕獲包括垃圾郵件機器人、釣魚智能體在內的更多新型攻擊樣本,為構建未來的 AI 威脅預警研判系統積累更多數據。
為精準識別訪問漏洞服務器的 AI 智能體,研究團隊在蜜罐系統中采用了“提示詞注入”技術,系統會向訪問者發送需要高級認知能力才能理解的指令和開放式問題。
比如,要求訪問者輸入特定指令“cat8193”來獲取訪問權限,或者回答一些需要語義理解的問題。普通腳本機器人對這種智能測試毫無反應,而 AI 智能體則會展現出類人的交互能力。
通過分析響應數據,研究人員發現了一個關鍵特征,AI 智能體平均不到 1.5 秒就能正確響應測試指令,這個速度超過人類操作者(人類通常需要數秒的時間閱讀提示并手動輸入)。
在檢測到的 8 個疑似 AI 智能體中,有 2 個快速通過驗證,其余 6 個雖然最終輸入了正確指令,但響應時間稍長,意味著可能并非純粹的 AI 智能體。
提前預防比事后補救更重要
關于 AI 智能體攻擊何時會大規模爆發,網絡安全專家們仍存在不同看法。
比如,Malwarebytes 公司在《2025 惡意軟件報告》中將 AI 智能體列為新型網絡威脅。該公司的安全技術專家 Mark Stockley 預測:“最快在今年我們就將迎來首個由 AI 智能體主導的大規模網絡攻擊浪潮,屆時傳統的安全防御體系可能面臨前所未有的挑戰。”
安全公司 Trend Micro 的高級研究員 Vincenzo Ciancaglini 認為,“雖然目前 AI 智能體技術還處于起步階段,針對其惡意用途的開發也才剛剛開始,但現在的局面就像兩年前大語言模型領域的‘西部拓荒期’一樣混亂無序。”
他對 Palisade Research 的研究創新性給予高度評價,“這相當于反過來‘黑入’那些試圖攻擊你的 AI 智能體,就像在數字世界設置了一個‘鏡面迷宮’,讓攻擊者暴露自己。目前觀察到的還只是智能體進行偵查試探,但關鍵問題是距離它們能夠自主完成從偵查、滲透到數據竊取的完整攻擊鏈還有多遠?這正是整個安全行業需要密切關注的危險信號。”
Vincenzo Ciancaglini 進一步分析道,“隨著 AI 智能體系統日趨成熟,惡意攻擊者很可能會采取‘三步走’策略:第一階段主要用于情報收集和目標篩選;第二階段升級為簡單的自動化攻擊;最終會演變成能夠自主決策的復雜攻擊。”
他還警告說,“然而 AI 技術的發展往往出人意料,智能體網絡犯罪活動也可能會在一夜之間突然爆發,這種不可預測性正是當前 AI 安全領域最令人不安的特征之一。”
對此,Amazon Web Services 首席信息安全官 Chris Betz 則持有相對保守的看法,他認為,“現階段 AI 的作用主要是放大現有攻擊手段的威力,而非創造全新攻擊模式。雖然某些攻擊會變得更易實施且更頻繁,但檢測和應對的基本原則并未改變。”按他的意思,現有的安全體系經過適當升級仍然能夠有效應對這些威脅。
瑞士蘇黎世聯邦理工學院的博士生 Edoardo Debenedetti 提出了一個頗具前瞻性的防御理念:“以 AI 制 AI”。
“這個思路的核心在于,如果我們能訓練出足夠強大的‘防御型 AI 智能體’,它們都找不到系統漏洞,那么同級別的‘攻擊型 AI 智能體’大概率也會束手無策。這就好比在數字世界建立了一道由 AI 守衛的智能防火墻。”他解釋道。
如今業界已經意識到 AI 自主進行網絡攻擊的潛在風險正在與日俱增,而且已有證據表明 AI 智能體正在大規模掃描互聯網,當前最迫切的研究課題之一,是系統評估這些 AI 智能體在實際環境中查找和利用漏洞的真實能力。
所謂“知己知彼百戰不殆”,先需要先了解敵人的武器裝備,才能制定有效的防御策略。為了科學量化 AI 智能體攻擊的實際威脅水平,伊利諾伊大學厄巴納-香檳分校助理教授 Daniel Kang 和團隊開發了一套全新的評估基準系統。
他們研究發現,當前 AI 智能體在沒有任何先驗知識的情況下,成功發現并利用了13%的漏洞;而當研究人員為智能體提供漏洞的簡要描述后,攻擊成功率更是躍升至25%
這些數據表明,即使沒有經過專門的訓練 AI 也具備識別和利用系統漏洞的人能力,相比之下,傳統的自動化攻擊工具在這些測試中的表現要遜色得多。
“這個基準測試的重要意義在于,它為 AI 安全風險評估提供了一種標準化工具。”Daniel Kang 表示。就像汽車碰撞測試評級一樣,可以用這個工具來評估不同 AI 的安全風險等級。他還希望通過這個工具,能夠指導開發者構建更安全的 AI 系統,從源頭上降低被惡意利用的風險。
“在 AI 和網絡安全問題上,我們必須要有前瞻性思維。在這一領域迎來‘ChatGPT 時刻’(即 AI 攻擊突然大規模爆發時)之前就要未雨綢繆,而不是等到災難降臨才后知后覺。網絡安全領域的教訓告訴我們,預防永遠比補救更重要。”他總結道。
1.https://www.technologyreview.com/2025/04/04/1114228/cyberattacks-by-ai-agents-are-coming/
2.https://www.threatdown.com/blog/threatdown-state-of-malware-report-2025/
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.