網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

變態(tài)驗(yàn)證碼，為啥還沒(méi)淘汰？

2024-10-09 14:32:56　來(lái)源: IC實(shí)驗(yàn)室

浙江舉報(bào)

分享至

在互聯(lián)網(wǎng)上，沒(méi)人知道你是一條狗。

如果你用過(guò)多鄰國(guó)學(xué)語(yǔ)言，可能從沒(méi)有想過(guò)這個(gè)軟件，還能和（萬(wàn)惡的）驗(yàn)證碼有關(guān)系。

它的創(chuàng)始人，路易斯·馮·安，還有一個(gè)響亮的名號(hào)：那就是驗(yàn)證碼之父。

01

反向圖靈測(cè)試

驗(yàn)證碼這東西，看起來(lái)不起眼，但背后有一個(gè)很終極的問(wèn)題：在互聯(lián)網(wǎng)上，如何證明你是一個(gè)人。

在這個(gè)問(wèn)題上，最有發(fā)言權(quán)的必然是計(jì)算機(jī)科學(xué)之父阿蘭·圖靈。他老人家在 1950 年提出的「圖靈測(cè)試」，即使到了大語(yǔ)言模型時(shí)代，依然被 AI 研究者們視為評(píng)估機(jī)器智能的重要方式之一。總之，把AI做得越來(lái)越像人類，一直是計(jì)算機(jī)科學(xué)家們的目標(biāo)。

但反過(guò)來(lái)，如何把人類和計(jì)算機(jī)區(qū)分開(kāi)來(lái)，一直是個(gè)少有人研究的問(wèn)題。尤其是上個(gè)世紀(jì)，人工智障水準(zhǔn)還差太遠(yuǎn)，這基本上屬于一個(gè)不成問(wèn)題的問(wèn)題。

直到2000年前后，互聯(lián)網(wǎng)浪潮來(lái)襲，人們工作生活中很多部分都被搬上互聯(lián)網(wǎng)，于是灰黑產(chǎn)應(yīng)運(yùn)而生。

早年最常見(jiàn)的灰黑產(chǎn)就是腳本機(jī)器人，攻擊者們用它來(lái)海量注冊(cè)賬號(hào)，郵箱賬號(hào)可以用來(lái)發(fā)垃圾郵件，PayPal賬號(hào)可以用來(lái)盜刷信用卡，以及擾亂各種網(wǎng)絡(luò)民調(diào)、幫助黃牛攻破在線購(gòu)票平臺(tái)。

腳本機(jī)器人雖然壓根算不上人工智能，但怎么攔住它，并且不影響活人用戶，成了個(gè)問(wèn)題。

2001年，PayPal的聯(lián)合創(chuàng)始人兼CTO麥克斯·拉夫琴（Max Levchin）發(fā)現(xiàn)，機(jī)器無(wú)法識(shí)別經(jīng)過(guò)一定扭曲的字符文本。于是，他們?cè)谧?cè)流程里，加入了識(shí)別扭曲字符的要求，成功降低了詐騙賬號(hào)的數(shù)量。

這是驗(yàn)證碼在商業(yè)社會(huì)的第一次亮相，首戰(zhàn)告捷。

它的底層邏輯，就是人類與計(jì)算機(jī)在認(rèn)知能力上存在差距。尤其是在復(fù)雜扭曲的圖形環(huán)境里識(shí)別字母和物體，在嘈雜的場(chǎng)景識(shí)別語(yǔ)音，在視頻動(dòng)畫(huà)里識(shí)別特定圖案，以及對(duì)自然語(yǔ)言和邏輯的認(rèn)知，很長(zhǎng)時(shí)間里機(jī)器都做不到。

但我們現(xiàn)在通用的驗(yàn)證碼方案并不來(lái)自PayPal。而是來(lái)自卡內(nèi)基·梅隆大學(xué)的一個(gè)研究團(tuán)隊(duì)，路易斯·馮·安正好是這個(gè)團(tuán)隊(duì)的一員。

1995年，馮老師去了美國(guó)杜克大學(xué)學(xué)習(xí)數(shù)學(xué)，然后又跑去了計(jì)算機(jī)強(qiáng)校卡內(nèi)基·梅隆大學(xué)，拜入圖靈獎(jiǎng)得主，有密碼學(xué)之父稱號(hào)的曼紐爾·布盧姆門下。

馮老師和驗(yàn)證碼的緣分，源自系里舉行的一次活動(dòng)。2003年，雅虎的首席科學(xué)家來(lái)學(xué)校做了一場(chǎng)名為《我們無(wú)法解決的十大問(wèn)題》的講座，他提到，很多不法分子會(huì)用機(jī)器人自動(dòng)注冊(cè)郵箱賬戶，來(lái)發(fā)送垃圾郵件。

馮老師聽(tīng)了講座，覺(jué)得這事兒用密碼學(xué)可以解決啊，于是他回去和導(dǎo)師說(shuō)了這事兒。幾個(gè)人在一起，鼓搗出一篇論文。

在論文中，他們提出了一個(gè)全新的概念：分辨人類與電腦的全自動(dòng)公共圖靈測(cè)試（Completely Automated Public Turing test to tell Computers and Humans Apart），就是讓計(jì)算機(jī)自主生成一些測(cè)試方案，比如在隨機(jī)生成的文本上添加一些失真的效果，或者將一些動(dòng)物的圖片進(jìn)行扭曲。

這些測(cè)試?yán)铮祟惪梢暂p松識(shí)別出正確的文本和動(dòng)物的種類，但計(jì)算機(jī)卻搞不定。這樣一來(lái)，這個(gè)測(cè)試就可以作為一種自動(dòng)化識(shí)別人類和電腦的方案。某種程度來(lái)說(shuō)，它是一種「反向圖靈測(cè)試」。

這個(gè)概念縮寫(xiě)為「CAPTCHA」，也就是我們現(xiàn)在說(shuō)的驗(yàn)證碼。

馮老師也不藏著掖著，把這套方案免費(fèi)送給了雅虎，雅虎一看，如獲至寶，我先用為敬。

隨著雅虎率先在自家郵箱產(chǎn)品里應(yīng)用了CAPTCHA，很快就解決了垃圾郵箱的問(wèn)題。此后越來(lái)越多的開(kāi)發(fā)者們開(kāi)始使用這套方案去識(shí)別機(jī)器人和真實(shí)用戶。

02

人類可以給機(jī)器打工嗎？

驗(yàn)證碼的出現(xiàn)，的確解決了很多網(wǎng)絡(luò)安全問(wèn)題，但代價(jià)也不是沒(méi)有。

一個(gè)核心問(wèn)題，如果驗(yàn)證碼，用戶覺(jué)得很容易，那機(jī)器人大概率也會(huì)覺(jué)得它不難。但如果把驗(yàn)證碼做得非常扭曲，安全性是上來(lái)了，那用戶可能就要罵人了。

流暢的用戶體驗(yàn)和靠譜的安全性是很難共存的。

這個(gè)事情讓路易斯·馮·安非常困擾，馮老師很早就對(duì)媒體表示過(guò)：每天全球幾億人在使用驗(yàn)證碼，每天輸入驗(yàn)證碼的時(shí)間就要花掉50萬(wàn)小時(shí)，而一個(gè)人的一生差不多也只有70萬(wàn)的小時(shí)。可以說(shuō)，每天驗(yàn)證碼就要耗掉一條生命。

為此，他開(kāi)始思考如何讓驗(yàn)證碼產(chǎn)生更多社會(huì)價(jià)值，抵消它的浪費(fèi)。

2005年，馮老師完成了他的博士論文，他的論文內(nèi)容是一項(xiàng)名叫「ESP Game」的游戲。

這個(gè)游戲類似于你畫(huà)我猜，或者綜藝?yán)锏牟略~游戲。登錄后，系統(tǒng)會(huì)隨機(jī)匹配兩位玩家，給雙方相同的圖片，要求雙方輸入一些單詞去描述這張圖片。

在不能交流的情況下，兩位玩家只有對(duì)同一張圖片輸入了同一個(gè)單詞描述才算過(guò)關(guān)。兩位玩家要在兩分半的時(shí)間里完成15張圖片的匹配。

而在馮老師看來(lái)，互聯(lián)網(wǎng)公司完全可以利用這樣的游戲，對(duì)數(shù)據(jù)庫(kù)里的圖片打標(biāo)簽，實(shí)現(xiàn)更準(zhǔn)確的圖片搜索。

這個(gè)思路，被他總結(jié)為「人類計(jì)算(Human Computation)」概念。也就是把傳統(tǒng)的，人類用計(jì)算機(jī)解決問(wèn)題的流程倒過(guò)來(lái)，由計(jì)算機(jī)出題，讓一群人來(lái)解決那些計(jì)算機(jī)搞不定的問(wèn)題，并且收集、整合他們的解決方案。

這篇論文不僅幫他拿下了學(xué)位，「ESP Game」還被谷歌收購(gòu)，成為馮老師第一個(gè)變現(xiàn)的項(xiàng)目。

回到驗(yàn)證碼，馮老師覺(jué)得，同樣是「人類計(jì)算」，既然可以用在圖片領(lǐng)域，也可以用在文字領(lǐng)域。

00年代初期，很多公益組織開(kāi)始嘗試將書(shū)籍進(jìn)行數(shù)字化，把舊書(shū)掃描成電子版。但褪色的墨水的褶皺的紙張，都會(huì)讓文字扭曲模糊，導(dǎo)致電腦無(wú)法識(shí)別文字。

于是，馮老師開(kāi)發(fā)了一個(gè)名叫reCAPTCHA的全新驗(yàn)證碼系統(tǒng)。

和傳統(tǒng)的單一驗(yàn)證碼不同， reCAPTCHA一次會(huì)要求用戶輸入兩個(gè)單詞，一個(gè)是常規(guī)的驗(yàn)證碼，另一個(gè)則是在書(shū)籍?dāng)?shù)字化的過(guò)程中難以識(shí)別的單詞。

只要用戶輸入正確的常規(guī)碼，那么他在第二個(gè)單詞里輸入的答案就會(huì)被計(jì)算機(jī)讀取，和其他用戶對(duì)同一個(gè)單詞的識(shí)別進(jìn)行比對(duì)，如果同一率高，就會(huì)被當(dāng)成正確的文字，拿去進(jìn)行書(shū)籍的數(shù)據(jù)化。既讓用戶做了驗(yàn)證，又幫助文獻(xiàn)數(shù)字化，為知識(shí)的傳播做了貢獻(xiàn)，一舉兩得。

這個(gè)系統(tǒng)發(fā)明出來(lái)，立刻吸引了《紐約時(shí)報(bào)》的注意。當(dāng)時(shí)《紐約時(shí)報(bào)》正在做一個(gè)舊報(bào)紙數(shù)字化的項(xiàng)目，想把過(guò)去130年的內(nèi)容全部都數(shù)字化。借助reCAPTCHA的力量，一千多萬(wàn)篇內(nèi)容很快完成了識(shí)別。

隨后，各種各樣的組織找上門，都希望用reCAPTCHA來(lái)做書(shū)籍?dāng)?shù)字化。

這套由人類和計(jì)算機(jī)共同形成的「大規(guī)模分布式計(jì)算網(wǎng)絡(luò)」，在推出的第一年，就正確破譯和轉(zhuǎn)錄了超過(guò)4.4億個(gè)單詞，相當(dāng)于17600本書(shū)。

馮老師徹底賺麻了，每隔幾個(gè)禮拜就有支票寄到學(xué)校請(qǐng)他簽收。

這么一來(lái)，學(xué)校不爽了，你在外面接私活也就算了，還這么高調(diào)賺大錢，你讓其他教職員工怎么想？于是取消了他的職位。眼看著鐵飯碗沒(méi)了，馮老師心一橫：老子不奉陪了。

當(dāng)了兩年人民教師，2007年，路易斯·馮·安下海創(chuàng)業(yè)建立了自己的公司。

誰(shuí)知這次創(chuàng)業(yè)只堅(jiān)持了兩年，馮老師，哦不，馮老板就再次收到谷歌的收購(gòu)要約，含淚賣掉公司成為千萬(wàn)富翁，并且加入谷歌成為大廠打工人。

話說(shuō)回來(lái)路易斯·馮·安提出的「人類計(jì)算」，聽(tīng)起來(lái)非常性感，但實(shí)際上也是一個(gè)古老的概念，我們通常稱其為「眾包」，也就是企業(yè)把過(guò)去由員工完成的工作，外包給不特定的大眾網(wǎng)絡(luò)。

每個(gè)使用驗(yàn)證碼的用戶，其實(shí)都在不知不覺(jué)中，為驗(yàn)證碼背后的工作充當(dāng)了免費(fèi)勞動(dòng)力。

但路易斯·馮·安覺(jué)得，眾包模式還有其他的可能性。

雖然他本人屬于含著金湯匙出身的一批人，但馮老師屬于比較懂事的那種，加上母國(guó)危地馬拉又是個(gè)窮國(guó)家，馮老師很早就注意到，像他這樣從小接受英語(yǔ)教育，長(zhǎng)大還能跑到美國(guó)上大學(xué)的屬于萬(wàn)中無(wú)一，大部分都困在「低收入-低教育水平-低收入」的循環(huán)里。

他覺(jué)得，也許眾包模式能解決這個(gè)問(wèn)題。

于是2011年，當(dāng)了幾年大廠高級(jí)打工仔的馮老師宣布重回學(xué)校，并且和他的學(xué)生一起帶來(lái)了一個(gè)全新的產(chǎn)品：

免費(fèi)語(yǔ)言學(xué)習(xí)平臺(tái)多鄰國(guó)（Duolingo）。

成立初期的多鄰國(guó)和現(xiàn)在那個(gè)背單詞打卡完全不是一個(gè)物種，它主要的業(yè)務(wù)是眾包翻譯平臺(tái)。

也就是它會(huì)將需要翻譯的頁(yè)面內(nèi)容拆解出來(lái)，給學(xué)習(xí)者去翻譯，然后將反饋回來(lái)的翻譯內(nèi)容利用后臺(tái)算法比對(duì)篩選，找出最佳翻譯組合，最后將翻譯內(nèi)容以遠(yuǎn)低于人工翻譯的價(jià)格提供給網(wǎng)站客戶。

某種程度上，和reCAPTCHA又異曲同工之妙。

通過(guò)眾包翻譯的模式，學(xué)習(xí)者可以免費(fèi)在這里學(xué)習(xí)語(yǔ)言，客戶付費(fèi)獲取廉價(jià)的翻譯服務(wù)，多鄰國(guó)作為中介平臺(tái)實(shí)現(xiàn)營(yíng)收。

但和驗(yàn)證碼不一樣，馮老師的「眾包教育」之路沒(méi)有走通。這套模式并不足以讓多鄰國(guó)實(shí)現(xiàn)盈利。盡管一口氣融到D輪，但投資人是要看到回報(bào)的。

于是在2015年，多鄰國(guó)放棄翻譯服務(wù)，轉(zhuǎn)而開(kāi)發(fā)用戶價(jià)值，陸續(xù)上線了App內(nèi)購(gòu)，廣告，會(huì)員服務(wù)等等等等，也就有了如今我們看到，那個(gè)擅長(zhǎng)PUA用戶，賤兮兮的綠色貓頭鷹App。

到2021年，多鄰國(guó)在納斯達(dá)克上市，馮老師再次步入人生巔峰。

如今的多鄰國(guó)，是一個(gè)靠著6%的付費(fèi)用戶，貢獻(xiàn)70%營(yíng)收的公司，看似已經(jīng)變成一個(gè)用戶付費(fèi)主導(dǎo)的平臺(tái)了，但事實(shí)上我們都知道，在一個(gè)游戲化的設(shè)計(jì)里，免費(fèi)玩家本身就是付費(fèi)玩家用戶體驗(yàn)的一部分。

路易斯·馮·安自己也承認(rèn)，免費(fèi)用戶的存在，能幫助公司省下大量的營(yíng)銷、增長(zhǎng)和促活費(fèi)用。

只要大家還有攀比心，還有收集癖和上進(jìn)的動(dòng)力，多鄰國(guó)就能用精妙的運(yùn)營(yíng)手段，從用戶身上獲取價(jià)值。

畢竟他最擅長(zhǎng)的事情，就是讓用戶免費(fèi)為他打工。

03

驗(yàn)證碼的無(wú)盡戰(zhàn)爭(zhēng)

盡管路易斯·馮·安早早地就離開(kāi)了reCAPTCHA，但此后，這家公司依然是這個(gè)市場(chǎng)上最重要的玩家。

誰(shuí)叫它背后，站著谷歌這么個(gè)巨頭呢？

而且在他走后，驗(yàn)證碼的江湖更加精彩。

畢竟驗(yàn)證碼就在那兒，總會(huì)有人想方設(shè)法去破解它。

技術(shù)含量最低的，也是最容易想到的方式，就是人工暴力破解，只要你能找到價(jià)格足夠低的人力，雇人填寫(xiě)驗(yàn)證碼就是一項(xiàng)劃得來(lái)的生意。

你要做的只是做一個(gè)API接口，把驗(yàn)證碼轉(zhuǎn)發(fā)給打碼平臺(tái)，平臺(tái)就會(huì)把任務(wù)分配給身處世界各地的打碼工，打碼工識(shí)別后把答案?jìng)骰厝ィ湍軐?shí)現(xiàn)自動(dòng)化的操作了。

但人工破解并不完美，2013年，斯坦福大學(xué)一項(xiàng)研究演示，主流網(wǎng)站上的驗(yàn)證碼解決準(zhǔn)確率大約只有85%，當(dāng)研究人員給三個(gè)不同的人提供相同的驗(yàn)證碼時(shí)，三人同時(shí)輸入正確的比例，只有71%。況且，人工破解的速度也并不夠快。

要打敗這套「反向圖靈測(cè)試」，還得靠足夠強(qiáng)大的AI。

2014年，谷歌內(nèi)部專家提出了一套基于強(qiáng)化學(xué)習(xí)的驗(yàn)證碼解決算法，可以用99.8%的準(zhǔn)確率解決最困難的扭曲文本變體。

這個(gè)準(zhǔn)確率有多恐怖，研究人員找來(lái)活人，讓他們識(shí)別同樣難度的驗(yàn)證碼，人類的正確率也只有33% 。

人類一敗涂地啊。

到這個(gè)階段，傳統(tǒng)驗(yàn)證碼對(duì)AI來(lái)說(shuō)已經(jīng)如土雞瓦狗，冢中枯骨了。

谷歌覺(jué)得，是時(shí)候給破解者們上上強(qiáng)度了。

2012年，reCAPTCHA開(kāi)始探索圖片驗(yàn)證碼，它要求用戶從谷歌街景的圖片中，識(shí)別人行橫道，路燈和其他物品。延續(xù)了reCAPTCHA的作風(fēng)，用戶的標(biāo)記會(huì)被拿去發(fā)揮余熱，為谷歌地圖和搜索訓(xùn)練模型。

到2014年，谷歌正式推出了全新的驗(yàn)證碼解決方案No-CAPTCHA。也就是我們熟悉的「我不是機(jī)器人」按鈕。

正如這個(gè)方案的名稱，No-CAPTCHA不再使用傳統(tǒng)的驗(yàn)證碼來(lái)考察人類的認(rèn)知能力，而是對(duì)用戶的交互方式展開(kāi)分析，觀察鼠標(biāo)運(yùn)動(dòng)軌跡，分析用戶之前訪問(wèn)過(guò)的頁(yè)面，從而判斷訪問(wèn)者是不是活人。

到2017年，谷歌更是推出了全新的reCAPTCHA v3。

這個(gè)版本對(duì)用戶來(lái)說(shuō)，幾乎完全取消了驗(yàn)證碼環(huán)節(jié)，直接通過(guò)后臺(tái)分析用戶戶行為進(jìn)行判斷，只有在無(wú)法判斷時(shí)，才會(huì)彈出傳統(tǒng)的圖形驗(yàn)證碼來(lái)輔助進(jìn)一步驗(yàn)證。

除了谷歌和reCAPTCHA之外，也有其他的開(kāi)發(fā)者在試圖平衡驗(yàn)證碼的安全性和易用性。

有人希望用硬件進(jìn)行安全驗(yàn)證，登錄注冊(cè)的時(shí)候插一個(gè)U盤到電腦里。

有人希望用面部識(shí)別驗(yàn)證，讓攝像頭證明你生而為人。

至于常見(jiàn)的「拼圖」式驗(yàn)證碼、旋轉(zhuǎn)式驗(yàn)證碼，則是另一個(gè)流派。這類游戲驗(yàn)證碼并不會(huì)給出明確的任務(wù)指示，AI很難搞清楚要怎么做，但人類只要看到這些游戲，本能的就能理解它的邏輯。

甚至還有更走火入魔的，利用一些高語(yǔ)境問(wèn)題來(lái)做驗(yàn)證。

比如拿「宮廷玉液酒」做驗(yàn)證碼，可能只有中國(guó)用戶才能填出「一百八一杯」。這就已經(jīng)違背了驗(yàn)證碼作為區(qū)分人和機(jī)器的初心了。

當(dāng)然，我們也必須承認(rèn)，如今AI的發(fā)展一夜千里，無(wú)論防御手段如何進(jìn)化，只要通過(guò)條件是已知的，那任何反向圖靈測(cè)試本質(zhì)上都是可以被破解的。

但如果我們用另一種方式去解讀，驗(yàn)證碼的意義，從來(lái)不止于網(wǎng)絡(luò)安全。

至少路易斯·馮·安和reCAPTCHA，從一開(kāi)始就沒(méi)有單純把它當(dāng)成一種安全策略。

相反，無(wú)論是「反向圖靈測(cè)試」還是「人類計(jì)算」，reCAPTCHA都認(rèn)為，驗(yàn)證碼與人工智能息息相關(guān)，他們從一開(kāi)始就承認(rèn)，驗(yàn)證碼是一種非常優(yōu)雅的人工智能訓(xùn)練工具，因此任何給定的測(cè)試都只能是暫時(shí)的。

更重要的是，驗(yàn)證碼身上還有著諸多限制，為了讓驗(yàn)證碼能夠適配不同教育水平，不同國(guó)族文化，不同生活經(jīng)驗(yàn)的用戶，它必須被設(shè)計(jì)為獨(dú)立于一定語(yǔ)境之外的，無(wú)需事先訓(xùn)練或者長(zhǎng)期培養(yǎng)才能通過(guò)的。比如看圖識(shí)字母，比如選擇圖片。

從這個(gè)角度看，驗(yàn)證碼就像一場(chǎng)注定失敗的戰(zhàn)役，它想要分辨人類與機(jī)器，但它所考察的，卻是那些最不能體現(xiàn)「生而為人」特質(zhì)的。

這就是驗(yàn)證碼的悖論所在，它試圖用一項(xiàng)任務(wù)衡量人性含量，但人性恰好是無(wú)法通過(guò)高效完成任務(wù)去驗(yàn)證的，不確定，不精確，才是人的特征。

谷歌放棄識(shí)別型驗(yàn)證碼，轉(zhuǎn)而從用戶行為去做驗(yàn)證，也必然是看到了這條悖論。

正如谷歌前員工，負(fù)責(zé)打擊點(diǎn)擊欺詐的舒曼所言：真正的人類無(wú)法很好地控制自己的運(yùn)動(dòng)功能，無(wú)法在多次交互中以相同的方式多次移動(dòng)鼠標(biāo)。

他說(shuō)：「人類行為具有難以欺騙的‘熵’。」

但更終極的問(wèn)題在于，當(dāng)人工智能更進(jìn)一步，學(xué)會(huì)模仿人類行為上的不精確，不穩(wěn)定之后，又有什么能證明人類與機(jī)器的差異？

而這一切，都無(wú)數(shù)次的回應(yīng)了《紐約客》那個(gè)著名的互聯(lián)網(wǎng)格言：

「在互聯(lián)網(wǎng)上，沒(méi)人知道你是一條狗」。

關(guān)注IC實(shí)驗(yàn)室視頻號(hào)

B站：IC實(shí)驗(yàn)室

微博：IC實(shí)驗(yàn)室

公眾號(hào)：IC實(shí)驗(yàn)室

全網(wǎng)同名，歡迎來(lái)撩？

商業(yè)世界的有趣就在這里。

關(guān)注大眾消費(fèi)，互聯(lián)網(wǎng)商業(yè)和流行文化，分享拙見(jiàn)與觀察。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.