99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

<legend id="5fefj"><track id="5fefj"></track></legend>

<s id="5fefj"><li id="5fefj"><menuitem id="5fefj"></menuitem></li></s>

<cite id="5fefj"></cite>

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

AI爬蟲肆虐，OpenAI等大廠不講武德！開發者打造「神級武器」宣戰

2025-04-06 18:04:15　來源: 新智元

北京舉報

0

分享至

新智元報道

編輯：定慧

【新智元導讀】AI爬蟲是互聯網最頑固的「蟑螂」，不講規則、壓垮網站，令開發者深惡痛絕。面對這種AI時代的「DDoS攻擊」，極客們用智慧反擊：或設「神之審判」Anubis，或制造數據陷阱，以幽默和代碼讓機器人自食其果。這場攻防戰，正演變成一場精彩絕倫的網絡博弈。

AI網絡爬蟲是互聯網上的「蟑螂」，幾乎所有軟件開發者都會這樣認為的。

「爬蟲」是一種網絡自動程序，用來瀏覽互聯網、獲取網頁內容。

而在AI時代，爬蟲的威脅到了讓開發者不得不封鎖掉某個地區所有人的訪問。

Triplegangers是一家僅僅由七名員工運營的公司，他們花費十多年時間建立了自稱是網絡上最大的「人類數字替身」的數據庫，即從實際人體掃描得到的3D圖像文件。

2025年2月10日，公司CEO Oleksandr Tomchuk突然發現他們公司的電商網站「崩了」。

「OpenAI使用了600個IP來抓取數據，日志還在分析中，可能遠不止這些」，Tomchuk最終發現，導致他們網站崩潰的元兇竟然是OpenAI的爬蟲機器人。

「他們的爬蟲正在壓垮我們的網站，這就是一次DDoS攻擊！」

OpenAI沒有回應此次事件，該事件過去僅僅不到兩個月，但AI爬蟲機器人仍然活躍在網絡上。

AI爬蟲不遵循「古老傳統」，阻止他們是徒勞的

其實爬蟲最早并不是AI時代為了獲取訓練語料而誕生的。

早在搜索引擎時代，就已經有「搜索引擎機器人」，那個「古老年代」的機器人還約定俗成的遵循各個網站上會存在的一份文件——robots.txt。

這個文件告訴了機器人不要爬取哪些內容，哪些內容可以爬取。

但這份傳統隨著互聯網的發展似乎已經被遺忘，爬蟲和發爬蟲也演變為一場攻防戰役。

而到了如今的「大模型時代」，互聯網的信息已經被LLMs吞噬一空。

阻止AI爬蟲機器人是徒勞的，因為它們會撒謊、更改用戶代理、使用住宅IP地址作為代理來騙過網絡「防守」。

「他們會不斷地抓取你的網站，直到它崩潰，然后還會繼續抓取。他們會點擊每一個頁面上的每一個鏈接上，一遍又一遍地查看相同的頁面」，開發者在帖子中寫道。

AI機器人除了「免費」爬取信息外，還會額外增加所爬網站企業的運營費用——在這個云服務的時代，幾乎所有被爬取的企業都在云上，大量的爬蟲流量不僅無法帶來收益，還會增加他們的云服務器賬單。

更加無法預料的一點是，對于那些被「白嫖」的網站來說，甚至確切的知道被白嫖了哪些信息。

一些開發者決定開始以巧妙且幽默的方式進行反擊。

程序員打造爬蟲的「神之墓地」

FOSS開發者Xe Iaso在博客中描述了AmazonBot如何不斷攻擊一個Git服務器網站，導致DDoS停機。

所以Iaso決定用智慧反擊，他構建了一個名為Anubis的工具。

Anubis是一個工作量證明檢查的反向代理，請求必須通過該檢查才能訪問Git服務器。

它阻止機器人，但允許人類操作的瀏覽器通過。

Iaso關于Anubis工作原理的簡單介紹。

本質上，Anubis確保的是「真實人類使用的瀏覽器」在訪問目標網站，而不是AI爬蟲——除非這個爬蟲偽裝的足夠「先進」，就像通過圖靈測試一樣。

有趣的部分是：Anubis是埃及神話中引導死者接受審判的神的名字。

「Anubis稱量了你的靈魂（心臟），如果它比一根羽毛重，你的心臟就會被吃掉，然后你就徹底死了」。

這個項目的名字帶有諷刺意味，在自由開源軟件社區中像風一樣傳播開來。

Iaso在3月19日將其分享到GitHub上，僅幾天時間就獲得了2000個星標、20位貢獻者和39個分支。

用「復仇」的方式防御AI爬蟲

Anubis的迅速流行表明Iaso的痛苦并非個例。事實上，還有很多故事：

SourceHut的創始人兼CEO Drew DeVault描述說，他每周要花費「20% 到 100% 的時間來大規模緩解過于激進的 LLM 爬蟲」，并且「每周經歷數十次短暫的服務中斷」。
Jonathan Corbet，一位著名的FOSS開發者，他運營著Linux行業新聞網站 LWN，警告稱他的網站正受到「來自 AI 抓取機器人的 DDoS 級別的流量」影響而變慢。
Kevin Fenzi，龐大的Linux Fedora項目的系統管理員，表示AI抓取機器人變得如此激進，他不得不封鎖整個巴西的訪問。

除了像Anubis一樣「衡量」網絡請求者的靈魂外，其他開發者認為復仇是最好的防御。

幾天前在Hacker News上，用戶xyzal建議用「大量關于喝漂白劑好處的文章」或「關于感染麻疹對床上表現的積極影響的文章」來加載robots.txt禁止的頁面。

這樣AI爬蟲獲取的信息都是這種大量且無用的「替代品」。

「我們認為需要讓機器人訪問我們的陷阱時獲得負的效用值，而不僅僅是零價值」，xyzal 解釋說。

一月份，一位名為Aaron的匿名創作者發布了一個名為Nepenthes的工具，其目的正是如此。

它將爬蟲困在一個無盡的虛假內容迷宮中，無法像爬蟲「主人」返回任何信息。

而作為網友心目中的「賽博菩薩」的Cloudflare，也許是提供多種工具來抵御AI爬蟲的最大商業玩家，上周發布了一個名為AI Labyrinth的類似工具。

它的目的是「減慢、迷惑并浪費不遵守禁止爬取指令的AI爬蟲和其他機器人的資源」，Cloudflare 在其博客文章中描述道。

「當AI爬蟲跟隨這些鏈接時，它們會浪費寶貴的計算資源處理無關內容，而不是提取合法網站數據。這大大降低了它們收集足夠有用信息以有效訓練模型的能力」。

相比起反擊，另一種觀點是「Nepenthes有一種令人滿意的正義感，因為它向爬蟲提供無意義的內容并污染它們的數據源，但最終Anubis是對網站有效的解決方案」。

拒絕或者反擊也許都不是最佳的途徑。

DeVault也公開發出了一則誠懇的請求，希望有一個更直接的解決辦法：「請停止將LLMs或AI圖像生成器任何這類垃圾合法化。懇求停止使用它們，停止談論它們，停止制造新的，就這么停下」。

但是，想讓LLM廠商主動停止爬蟲這種情況的可能性幾乎為零。

畢竟AI的「智能」都來自于不斷「吞噬」互聯網上的各種數據和信息。

不論是給禁止AI爬蟲訪問網站、給AI「投喂垃圾」還是將AI爬蟲拉入「無線虛空」。

開發者們，尤其是在開源軟件領域，正在用智慧和「極客幽默」進行反擊。

如果你是網站管理者和開發者，你會如何「出招」？

參考資料：

https://techcrunch.com/2025/03/27/open-source-devs-are-fighting-ai-crawlers-with-cleverness-and-vengeance/

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

宇樹科技VS云深處，誰是國產機器人之王

華商韜略 2025-03-17 13:06:16
0 跟貼 0
北京人形機器人天團來了！

智東西 2025-02-19 16:29:42
0 跟貼 0

國產機器人深圳街頭散步爆火！超自然步態嚇呆國外網友

量子位 2025-01-10 16:29:56
798 跟貼 798

人形機器人狂奔！山地、草地、公路無障礙，原速演示全程高能

量子位 2024-10-14 13:19:05
1234 跟貼 1234
宇樹科技G1機器人展示武打動作：算法升級任意動作任意學

財聯社 2025-02-25 23:59:43
0 跟貼 0

深圳南山，藏著中國機器人天團

華商韜略 2025-03-11 11:00:31
0 跟貼 0

參觀火、融資火、訂單火，機器人公司門檻被踏破

每日經濟新聞 2025-03-12 19:07:58
0 跟貼 0
Llama 4重磅來襲，Meta叫板OpenAI

虎嗅APP 2025-04-07 01:35:01
0 跟貼 0

“我把4500多篇NeurIPS 2024論文，做成了AI搜索”

量子位 2024-12-10 16:39:32
1 跟貼 1
讓ChatGPT不敢開口的名字！神秘bug引馬斯克圍觀

量子位 2024-12-02 19:33:09
189 跟貼 189
世界上第一個熟練使用筷子的機器人亮相！

財聯社 2025-02-27 12:54:44
0 跟貼 0
人形機器人組隊進廠打工！5只Figure 02在寶馬工廠

量子位 2024-11-22 10:57:40
0 跟貼 0
全球最遠1.4米！國產宇樹創人形機器人跳遠紀錄，外網驚嘆碾壓特斯拉

量子位 2024-10-19 12:16:06
0 跟貼 0
馬斯克擎天柱機器人表演單手接網球！

每日經濟新聞 2024-11-30 19:47:57
0 跟貼 0
告別屈膝小碎步讓機器人像人一樣走路國產團隊造出“鋼鐵俠”

量子位 2024-10-24 11:42:12
0 跟貼 0
Claude腦回路被開盒：AI會撒謊和暗中計劃

量子位 2025-04-04 12:20:26
0 跟貼 0
豪擲36億！傳OpenAI收購AI硬件公司，前蘋果首席設計師創辦

智東西 2025-04-07 20:02:36
1 跟貼 1
微軟AI模型MatterGen能根據需求生成新材料

量子位 2025-01-21 18:07:40
29 跟貼 29
聊天機器人有時候會“胡說八道”，GPT等模型的“幻覺率”有多高？

醫咖會 2025-02-02 19:05:14
1 跟貼 1
估值615億美元的AI巨頭盯上高等教育

芥末堆看教育 2025-04-07 18:44:48
0 跟貼 0
為了難倒AI，人類想出了什么變態考題？

量子位 2025-02-27 12:11:03
0 跟貼 0
4o生圖前端效果騙了太多人，網友扒出逐行生成的演示當不得真

量子位 2025-04-02 21:22:14
0 跟貼 0
奧特曼力挺年輕人「套殼」，25年程序員效率暴增10倍！GPT-4o狂造十億圖像

新智元 2025-04-07 16:56:21
10 跟貼 10
DeepSeek開口說話了反應超神無限打斷只要兩行代碼15分鐘

量子位 2025-03-07 14:20:34
0 跟貼 0
爆火開源工具Browser Use，能讓AI操作瀏覽器找工作

量子位 2025-01-13 09:50:42
0 跟貼 0
DeepSeek的橫空出世，讓AI+騰訊云數據庫產生了什么化學反應？

量子位 2025-03-04 20:07:47
0 跟貼 0
一句話讓DeepSeek控制你的電腦！微軟開源神器OmniParser V2

量子位 2025-02-18 20:48:36
0 跟貼 0
“AI眼鏡的終極功能，是AI+社交” | 對話影目科技創始人

量子位 2025-04-07 21:46:09
0 跟貼 0
反向傳播、前向傳播都不要，這種無梯度學習方法是Hinton想要的嗎

機器之心Pro 2025-04-07 14:55:47
1 跟貼 1
企業落地AI，只靠DeepSeek還不夠

虎嗅APP 2025-03-11 20:52:07
0 跟貼 0
OpenAI放大招：免費開放ChatGPT搜索，無需注冊

每日經濟新聞 2025-02-06 10:49:09
0 跟貼 0
DeepSeek之后，SaaS沒死

鈦媒體APP 2025-04-07 11:16:09
3 跟貼 3
肌肉骨骼居然和人類一樣。外網爆火的克隆機器人，靈活性超高，胸腔里還復刻了人類的心臟瓣膜，宛如《西部世

量子位 2024-10-26 12:28:00
0 跟貼 0
DeepSeek引爆AI革命，誰能笑到最后？

量子位 2025-03-11 17:16:22
0 跟貼 0
ICLR2025｜從探索到掌握：使大模型通過自我驅動的交互掌握工具

DeepTech深科技 2025-02-10 17:06:25
3 跟貼 3
阿里萬相秒殺Sora，4070就能跑

量子位 2025-02-26 17:08:09
0 跟貼 0
o1竟在用中文思考？網友新發現外網熱議

量子位 2025-01-22 11:13:04
0 跟貼 0
AI生成視頻復刻動作，上傳視頻+一句話即可

量子位 2025-02-04 12:32:15
0 跟貼 0
實測訊飛曉醫VS DeepSeek-R1，誰是更懂你的家庭健康助手？

量子位 2025-03-08 19:20:56
0 跟貼 0
吳恩達預言成真？AI運維專家橫掃職場，精準解決80%運維難題

量子位 2025-01-10 16:51:31
0 跟貼 0

“甲亢哥”長沙直播，誤食路人給的檳榔，在車上捂喉嚨難受大叫！

“甲亢哥”長沙直播，誤食路人給的檳榔，在車上捂喉嚨難受大叫！

小蘿卜絲

2025-04-07 17:31:53

小米股價暴跌！11個交易日跌幅已超33%，網友：別墅靠海的機會來了

小米股價暴跌！11個交易日跌幅已超33%，網友：別墅靠海的機會來了

魯中晨報

2025-04-07 18:11:11

大瓜！北京網友曝伊能靜婚變實錘，透露細節秦昊疑北京密會女人

大瓜！北京網友曝伊能靜婚變實錘，透露細節秦昊疑北京密會女人

鄭丁嘉話

2025-04-07 16:39:30

川川瘋了！美國德州禁止中國人買房、租房，清除中國留學生……

川川瘋了！美國德州禁止中國人買房、租房，清除中國留學生……

小人物看盡人間百態

2025-04-07 10:13:17

官方公告：王力宏，取消！

浙江之聲

2025-04-07 21:41:19

中國女婿！馬布里社媒官宣與汪妤凌登記結婚！

中國女婿！馬布里社媒官宣與汪妤凌登記結婚！

直播吧

2025-04-07 19:17:08

支付寶今天史詩級更新，網友炸了

支付寶今天史詩級更新，網友炸了

鋒潮評測

2025-04-07 18:30:10

納指跌幅擴大至5% 特斯拉跌超10%

納指跌幅擴大至5% 特斯拉跌超10%

財聯社

2025-04-07 21:46:11

油價比電價貴，為啥有人還是不換電車？網友：買拖拉機也不買電車

油價比電價貴，為啥有人還是不換電車？網友：買拖拉機也不買電車

娛樂圈人物大賞

2025-04-06 00:15:04

北京時間深夜美國發出威脅將給中國關稅增加50％撤回條件已開好！

北京時間深夜美國發出威脅將給中國關稅增加50％撤回條件已開好！

小宇宙雙色球

2025-04-08 01:43:34

對等關稅生效！世界各國開始站隊，不過24小時，美發布涉華公告！

對等關稅生效！世界各國開始站隊，不過24小時，美發布涉華公告！

凡知

2025-04-07 15:56:01

中美領導人近期是否會就關稅問題舉行會談？外交部回應

中美領導人近期是否會就關稅問題舉行會談？外交部回應

財聯社

2025-04-07 15:57:59

商戶門頭牌匾禁用“紅、黑、藍”三底色？三河市城管部門：是城市規劃要求，文件還沒發布

商戶門頭牌匾禁用“紅、黑、藍”三底色？三河市城管部門：是城市規劃要求，文件還沒發布

大風新聞

2025-04-07 14:58:04

中共中央批準，開除李剛黨籍

新京報

2025-04-07 16:26:25

劉維偉結束青島生涯？CBA官方臨時變更名單青島臨場主帥變劉明濤

劉維偉結束青島生涯？CBA官方臨時變更名單青島臨場主帥變劉明濤

醉臥浮生

2025-04-07 19:28:07

卡住馬六甲咽喉？解放軍迎來歷史性一天，第二個海外基地掛牌！

卡住馬六甲咽喉？解放軍迎來歷史性一天，第二個海外基地掛牌！

戰爭史

2025-04-07 13:32:18

秋后算賬！加州30多名留學生簽證被吊銷，已經工作了也驅逐出境

秋后算賬！加州30多名留學生簽證被吊銷，已經工作了也驅逐出境

大洛杉磯LA

2025-04-08 02:26:04

難怪俄烏打了3年，美媒公開后普京才知道，美軍“殺死”上萬俄軍

難怪俄烏打了3年，美媒公開后普京才知道，美軍“殺死”上萬俄軍

空天力量

2025-04-07 19:10:45

馬英九：若大陸統一臺灣的手段不和平，過程不民主，臺灣人不接受

馬英九：若大陸統一臺灣的手段不和平，過程不民主，臺灣人不接受

紅色鑒史官

2025-04-06 19:10:03

人民日報深夜發文，隨時降準降息，房貸又降了，每月有能少還了！

人民日報深夜發文，隨時降準降息，房貸又降了，每月有能少還了！

明月聊史

2025-04-07 20:52:41

AI產業主平臺領航智能+時代

12486文章數 66006關注度

往期回顧全部

科技要聞

Llama 4發布36小時差評如潮！匿名員工爆料

頭條要聞

三大央企增持中國股票資產央媒：政策工具箱還很充足

頭條要聞

三大央企增持中國股票資產央媒：政策工具箱還很充足

體育要聞

刷屏中文互聯網，甲亢哥是怎么火的？

娛樂要聞

汪小菲身旁的朋友，對馬筱梅的評價

財經要聞

美股巨震！特朗普關稅，又有新變化？

汽車要聞

途昂Pro的五套組合拳打完看清油車的自我救贖

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

健康

手機

數碼

公開課

軍事航空

在中國，到底哪些人在吃“偉哥”？

手機要聞

iPhone 17 Air/17 Pro Max厚度對比：Air版薄到無敵

數碼要聞

小米米家冰箱三門 215L 上市：五檔電子調溫，899 元

公開課

李玫瑾：為什么性格比能力更重要？

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
中國最大沙漠中唯一的城市，周邊300公里被黃沙覆蓋
李彥宏：百度離破產30天

軍事要聞

特朗普關稅名單上沒俄羅斯白宮：為了不影響俄烏和談

© 1997-2025 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版主站蜘蛛池模板：平陆县| 黄石市| 永寿县| 本溪| 郑州市| 万宁市| 平乡县| 滕州市| 哈密市| 襄城县| 榆中县| 瓦房店市| 连南| 阿拉善右旗| 资源县| 楚雄市| 东丽区| 阜城县| 嫩江县| 鸡西市| 徐汇区| 甘德县| 南通市| 安福县| 安岳县| 沭阳县| 梨树县| 栾城县| 浪卡子县| 灵山县| 登封市| 定州市| 黑水县| 泰顺县| 镇宁| 平安县| 竹溪县| 南开区| 平阴县| 山东| 东方市|

<strike id="fojt5"><p id="fojt5"><tt id="fojt5"></tt></p></strike>

<p id="fojt5"></p>

<blockquote id="fojt5"><rt id="fojt5"><noscript id="fojt5"></noscript></rt></blockquote>

<p id="fojt5"></p>