驗(yàn)證碼的末日:AI識別準(zhǔn)確率首次達(dá)到100%
很多網(wǎng)站服務(wù)會要求用戶從一堆圖片中選擇特定物體,以此來驗(yàn)證用戶是否真人。這種圖片識別驗(yàn)證碼(CAPTCHA)最常見的形式是在復(fù)雜的街景照片中識別自行車、斑馬線、交通燈等日常物體。然而,最近有研究指出,一些本地運(yùn)行的AI機(jī)器人使用特別訓(xùn)練的圖像識別模型,已經(jīng)做到100%的成功率,達(dá)到甚至超過了人類水平!
驗(yàn)證碼殺手:YOLO模型
ETH蘇黎世的博士生安德烈亞斯·普萊斯納(Andreas Plesner)及其同事的最新研究聚焦于谷歌的reCAPTCHA v2,這一系統(tǒng)要求用戶在圖片網(wǎng)格中識別出包含諸如自行車、斑馬線或交通燈等物體的街景圖像。盡管谷歌幾年前已經(jīng)開始逐步淘汰該系統(tǒng),轉(zhuǎn)而采用“隱形”的reCAPTCHA v3以分析用戶行為,但reCAPTCHA v2仍被全球數(shù)百萬網(wǎng)站廣泛使用,尤其在v3系統(tǒng)對用戶的“人類”可信度打分過低時(shí),常作為備用驗(yàn)證手段。
研究團(tuán)隊(duì)為了破解reCAPTCHA v2,使用了開源的YOLO(You Only Look Once)目標(biāo)識別模型,這一模型因其實(shí)時(shí)檢測物體的能力而備受青睞,甚至早在電子游戲作弊機(jī)器人中就得到了應(yīng)用。研究者將這一模型進(jìn)行了微調(diào),使用了1.4萬張標(biāo)記過的交通圖像進(jìn)行訓(xùn)練,最后得到了一個(gè)能夠?qū)︱?yàn)證碼網(wǎng)格圖像進(jìn)行精準(zhǔn)識別的系統(tǒng)。
為了規(guī)避谷歌對機(jī)器人行為的檢測,研究團(tuán)隊(duì)采取了多種措施,比如使用VPN來避免因IP地址重復(fù)嘗試而被發(fā)現(xiàn),同時(shí)還設(shè)計(jì)了一個(gè)特殊的鼠標(biāo)移動模型,以模擬人類用戶的活動。另外,自動化代理也利用了真實(shí)瀏覽器和瀏覽歷史中的cookie信息,使其表現(xiàn)得更加“人性化”。
驗(yàn)證碼全面淪陷
研究顯示,根據(jù)不同的物體類別,YOLO模型對驗(yàn)證碼的識別準(zhǔn)確率從69%(摩托車)到100%(消防栓)不等。綜合這些措施,機(jī)器人成功地一次次突破了驗(yàn)證碼防線,有時(shí)候甚至比人類挑戰(zhàn)的次數(shù)更少。盡管這種提升對比人類并無顯著統(tǒng)計(jì)學(xué)意義,但也足以證明這項(xiàng)技術(shù)的有效性。
過去,學(xué)術(shù)界曾多次嘗試?yán)脠D像識別模型來破解reCAPTCHA,但成功率大多在68%到71%之間浮動。而此次AI識別驗(yàn)證碼的成功率首次達(dá)到100%,標(biāo)志著我們正式進(jìn)入了“后驗(yàn)證碼時(shí)代”。
然而,這并不是驗(yàn)證碼的首次“淪陷”。早在2008年,研究人員就展示了如何訓(xùn)練機(jī)器人突破專為視覺障礙用戶設(shè)計(jì)的音頻驗(yàn)證碼;到了2017年,神經(jīng)網(wǎng)絡(luò)也已經(jīng)能夠破解那些要求用戶輸入亂碼字體中字母的文本驗(yàn)證碼。
如今,隨著本地運(yùn)行的AI也能輕松破解基于圖像的驗(yàn)證碼,人類身份識別的技術(shù)將繼續(xù)轉(zhuǎn)向更微妙的設(shè)備指紋識別方法。谷歌云的一位發(fā)言人向《新科學(xué)家》表示:“我們非常專注于幫助客戶保護(hù)用戶,同時(shí)盡量不顯示視覺挑戰(zhàn),這也是為什么我們在2018年推出了reCAPTCHA v3。今天,reCAPTCHA在全球700萬個(gè)網(wǎng)站上的大部分保護(hù)機(jī)制已經(jīng)完全‘隱形化’。我們正在持續(xù)提升reCAPTCHA的能力?!?
人與機(jī)器的識別邊界正在模糊
隨著人工智能系統(tǒng)在越來越多的任務(wù)上逐步逼近甚至超越人類能力,確保網(wǎng)絡(luò)另一端的用戶是一個(gè)真人變得越來越難。
正如論文作者所寫:“從某種意義上說,一個(gè)好的驗(yàn)證碼可以在最智能的機(jī)器與最不智能的人類之間劃分精確界限。”而隨著機(jī)器學(xué)習(xí)模型逐漸接近人類能力,找到一個(gè)“好”的驗(yàn)證碼(技術(shù))變得越來越困難。