自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開(kāi)發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問(wèn)答課堂專欄直播

51CTO

鴻蒙開(kāi)發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開(kāi)發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開(kāi)發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

賬號(hào)設(shè)置退出

人類與機(jī)器博弈下，為何驗(yàn)證碼越來(lái)越難了？

作者：大數(shù)據(jù)文摘 2020-11-11 14:36:33

企業(yè)動(dòng)態(tài)

由于驗(yàn)證碼是一個(gè)十分優(yōu)雅的人工智能訓(xùn)練工具，所以任何給定的測(cè)試都只能是暫時(shí)的，驗(yàn)證碼的發(fā)明者從一開(kāi)始就承認(rèn)了這一點(diǎn)。

大數(shù)據(jù)文摘出品

來(lái)源：theverge

編譯：吳瑕

谷歌、新浪的登錄頁(yè)面一直以來(lái)都在要求人們證明自己是人類，最近，這樣的考題更是來(lái)勢(shì)洶洶。

那個(gè)原本十分可愛(ài)的“我不是機(jī)器人”按鈕，追加了越來(lái)越多證明不是機(jī)器人的要求——在一系列圖像中選出含有交通燈、人行道和店面的圖片。很快，交通燈被遠(yuǎn)處的樹(shù)葉遮蓋了，人行道變得彎曲并且會(huì)有一半消失在拐角處，店面的招牌也被模糊處理并換成了韓文。特別是像12306這樣的購(gòu)票網(wǎng)站出現(xiàn)的驗(yàn)證碼堪比連連看，每年都能難倒一大批登錄者。

這些測(cè)試被稱為CAPTCHA，是Completely Automated Public Turing test to tell Computers and Humans Apart(區(qū)分電腦和人的完全自動(dòng)化公共圖靈測(cè)試)的首字母縮寫，這些測(cè)試水平早前就已經(jīng)達(dá)到了不可思議的高度。

在21世紀(jì)初，簡(jiǎn)單的文字圖片就足以讓大多數(shù)垃圾郵件程序束手無(wú)策。但是十年后，當(dāng)谷歌從卡內(nèi)基梅隆大學(xué)的研究人員那里購(gòu)買了這個(gè)程序，并用來(lái)使谷歌圖書(Google Books)實(shí)現(xiàn)數(shù)字化時(shí)，文本就必須變得越來(lái)越扭曲和模糊，以便保持領(lǐng)先于改進(jìn)的光學(xué)字符識(shí)別程序(所有參與CAPTCHA測(cè)試的人都在間接地幫助改進(jìn)此程序)。

這就是人類與機(jī)器博弈的終局。

由于驗(yàn)證碼是一個(gè)十分優(yōu)雅的人工智能訓(xùn)練工具，所以任何給定的測(cè)試都只能是暫時(shí)的，驗(yàn)證碼的發(fā)明者從一開(kāi)始就承認(rèn)了這一點(diǎn)。在人們研究人工智能應(yīng)用的初期，許多研究人員、騙子和普通人解決了數(shù)以億計(jì)的謎題，當(dāng)時(shí)機(jī)器似乎將要超越人類。2014年，為解決最扭曲的文本驗(yàn)證碼問(wèn)題(驗(yàn)證時(shí)，計(jì)算機(jī)的正確率為99.8%，而人類的正確率僅為33%)，谷歌用一種機(jī)器學(xué)習(xí)算法與人類進(jìn)行了一場(chǎng)對(duì)決。

隨后谷歌轉(zhuǎn)向NoCaptcha ReCaptcha方式，通過(guò)觀察用戶數(shù)據(jù)和行為，讓部分人通過(guò)點(diǎn)擊“我不是機(jī)器人”按鈕通過(guò)驗(yàn)證，而要求另一些人進(jìn)行我們今天看到的圖片驗(yàn)證。但機(jī)器再次迎頭趕上。那些遮陽(yáng)棚到底是不是商店?這就是人類與機(jī)器博弈的終局。

伊利諾斯大學(xué)芝加哥分校(University of Illinois at Chicago)的計(jì)算機(jī)科學(xué)教授杰森·波拉基斯(Jason Polakis)認(rèn)為驗(yàn)證碼難度的增加是由個(gè)人信貸導(dǎo)致的。2016年，他發(fā)表了一篇論文，文中使用現(xiàn)成的圖片識(shí)別工具(包括谷歌自己的反向圖片搜索工具)去解決谷歌的圖像驗(yàn)證問(wèn)題，準(zhǔn)確率達(dá)到70%。還有一些研究人員用谷歌自己的音頻識(shí)別程序，在谷歌的驗(yàn)證碼挑戰(zhàn)中取得了突破。

波拉基斯指出，在基本的文本、圖像和聲音識(shí)別任務(wù)上，機(jī)器學(xué)習(xí)如今已經(jīng)能達(dá)到與人類一樣的水平。事實(shí)上，算法可能比人類更擅長(zhǎng)此類任務(wù)。“如今正處在這樣一個(gè)階段：為軟件增加難度，最后會(huì)讓很多人覺(jué)得難度太大。我們需要一些替代方案，但還沒(méi)有具體的計(jì)劃。

如今驗(yàn)證碼測(cè)試存在的問(wèn)題并不一定是機(jī)器人太聰明，而是人類做得太差勁了

關(guān)于驗(yàn)證碼的文獻(xiàn)從一開(kāi)始就是錯(cuò)的，而且還在進(jìn)行著奇怪的嘗試，尋找除文本或圖像識(shí)別(這些方面人類普遍擅長(zhǎng)，機(jī)器卻很難識(shí)別)之外的方式。研究人員曾嘗試讓用戶根據(jù)面部表情、性別和種族對(duì)人的圖像進(jìn)行分類(不難想象，人們?cè)谶@方面做得很好)。有人提議使用瑣碎的驗(yàn)證碼，以及基于用戶成長(zhǎng)地區(qū)常見(jiàn)童謠的驗(yàn)證碼。這種文化驗(yàn)證碼針對(duì)的不僅是機(jī)器人，還有在海外驗(yàn)證碼農(nóng)場(chǎng)工作的人，讓他們用不到一分錢的代價(jià)來(lái)解決難題。人們嘗試用各種方法增加圖片識(shí)別難度，比如讓用戶識(shí)別豬，但把豬做成卡通樣式，并給豬戴上太陽(yáng)鏡。研究人員還嘗試要求用戶魔術(shù)眼狀斑點(diǎn)圖中的物品。此外，還有一個(gè)有趣的驗(yàn)證碼變種，研究人員在2010年提出使用驗(yàn)證碼來(lái)索引古代巖畫，因?yàn)橛?jì)算機(jī)不太擅長(zhǎng)解讀洞穴壁畫上的馴鹿的示意草圖。

最近還有人在嘗試開(kāi)發(fā)游戲類驗(yàn)證碼，通過(guò)要求用戶旋轉(zhuǎn)物體到特定角度或?qū)⑵磮D塊拖至正確位置，所給出的指示不是文字形式而是符號(hào)形式，或游戲板的背景暗示。人們希望人類可以理解拼圖的邏輯，但在沒(méi)有明確指示的情況下，計(jì)算機(jī)會(huì)被難住。其他一些研究人員試圖利用人類擁有身體這一事實(shí)，通過(guò)設(shè)備攝像頭或增強(qiáng)現(xiàn)實(shí)技術(shù)進(jìn)行互動(dòng)，證明人類的存在。

這些驗(yàn)證碼測(cè)試存在的問(wèn)題并不一定是機(jī)器人太聰明，而是人類做得太差勁了。這并不是說(shuō)人類愚蠢，而是因?yàn)槿祟愒谡Z(yǔ)言、文化和經(jīng)歷上存在多種差異。一旦你脫離所有這些東西，去制作一個(gè)任何人不需要事先訓(xùn)練或思考都能通過(guò)的測(cè)試，那就只能選擇像圖像處理這樣的不用動(dòng)腦的任務(wù)，而這樣的任務(wù)正是為人工智能量身定做的。

怎樣才能區(qū)分人和機(jī)器?

波拉基斯表示：“驗(yàn)證碼測(cè)試受到人類能力的限制，除了身體上的能力外，還需要一些(能夠)跨文化跨語(yǔ)言的東西，需要一些通用的驗(yàn)證方式，讓希臘、芝加哥、南非、伊朗和澳洲人都能通過(guò)驗(yàn)證。” 而這樣的驗(yàn)證方式必須獨(dú)立于文化的復(fù)雜性和差異性之外。我們需要設(shè)置的是對(duì)一般人來(lái)說(shuō)很容易的驗(yàn)證方式，不應(yīng)該局限于特定的人群，但這樣的驗(yàn)證方式對(duì)計(jì)算機(jī)來(lái)說(shuō)還必須是困難的。我們實(shí)際能做的事情是非常有限的，而這樣的事還必須是人類能夠快速完成的，而且不會(huì)令人心煩。”

要搞清楚如何解決這些模糊圖像驗(yàn)證問(wèn)題，就要進(jìn)入到哲學(xué)領(lǐng)域：什么樣的人類共性，可以向機(jī)器展示，但沒(méi)有機(jī)器可以模仿?人類到底是什么?

不過(guò)，或許我們的人性不是通過(guò)如何完成一項(xiàng)任務(wù)來(lái)衡量，而是通過(guò)我們?nèi)绾卧谶@個(gè)世界上的移動(dòng)軌跡——或者在互聯(lián)網(wǎng)中的移動(dòng)軌跡來(lái)衡量的。Shuman Ghosemajumder曾在谷歌負(fù)責(zé)打擊點(diǎn)擊詐騙，后來(lái)成為了機(jī)器人檢測(cè)公司Shape Security的首席技術(shù)官，他認(rèn)為，無(wú)論你設(shè)計(jì)的是游戲驗(yàn)證碼、視頻驗(yàn)證碼或者任何其他類型的驗(yàn)證碼測(cè)試，最終都會(huì)以失敗收?qǐng)觥１绕饻y(cè)試，他更喜歡“持續(xù)認(rèn)證”，即觀察用戶的行為并尋找自動(dòng)操作的跡象。” Ghosemajumder指出：“一個(gè)真正的人，無(wú)法很好地控制自己的運(yùn)動(dòng)機(jī)能，所以無(wú)論人們?nèi)绾闻L試，他們都無(wú)法在多次交互中多次以同樣的方式移動(dòng)鼠標(biāo)。” Ghosemajumder表示，機(jī)器人不需要移動(dòng)鼠標(biāo)就能與頁(yè)面進(jìn)行交互，或者能夠精確地移動(dòng)鼠標(biāo)，而人類的行為具有難以模仿的“熵”。

谷歌自身的驗(yàn)證碼團(tuán)隊(duì)也在思考類似的問(wèn)題，去年年底發(fā)布的最新版本reCaptcha v3，使用“自適應(yīng)風(fēng)險(xiǎn)分析”，根據(jù)看起來(lái)可疑的程度對(duì)信息流量進(jìn)行評(píng)分，然后，網(wǎng)站所有者可以選擇對(duì)粗選出來(lái)的用戶進(jìn)行驗(yàn)證，比如要求其填寫密碼或進(jìn)行雙重認(rèn)證。驗(yàn)證碼團(tuán)隊(duì)的產(chǎn)品經(jīng)理Cy Khormaee表示，谷歌不會(huì)公布影響評(píng)分的因素，但谷歌會(huì)觀察一個(gè)網(wǎng)站上的“良好流量”的特征，然后用這些特征來(lái)檢測(cè)“糟糕流量”。安全研究人員表示，谷歌可能會(huì)綜合運(yùn)用信息記錄程序(cookie)、瀏覽器屬性、流量模式和其他因素進(jìn)行評(píng)分。新型機(jī)器人檢測(cè)方式的一個(gè)缺點(diǎn)是，它會(huì)導(dǎo)致人們?yōu)g覽網(wǎng)頁(yè)時(shí)無(wú)法擺脫被監(jiān)視感，因?yàn)樘摂M專用網(wǎng)和反跟蹤擴(kuò)展程序的使用可能會(huì)讓你被標(biāo)記為可疑或有威脅。

谷歌驗(yàn)證碼團(tuán)隊(duì)的工程主管Aaron Malenfant指出，放棄圖靈測(cè)試是為了回避人類不斷輸?shù)舻母?jìng)爭(zhēng)。“隨著人們?cè)跈C(jī)器學(xué)習(xí)上投入的資金越來(lái)越多，這類挑戰(zhàn)對(duì)人類來(lái)說(shuō)將會(huì)變得越來(lái)越難，這就是我們推出CAPTCHA V3的原因，為了走在這條曲線的前面。” Malenfant 指出，5到10年后，驗(yàn)證碼挑戰(zhàn)可能會(huì)變得完全不可行。然而，很多網(wǎng)站后臺(tái)將會(huì)運(yùn)行恒定、隱秘的圖靈測(cè)試。

布萊恩·克里斯汀(Brian Christian)在所著的The Most Human Human一書中，作為人類替身參加了圖靈測(cè)試比賽，他發(fā)現(xiàn)在交談中要證明你的人性是相當(dāng)困難的。另一方面，機(jī)器人制造商發(fā)現(xiàn)更容易通過(guò)測(cè)試的不是口才最好、最有智慧的健談?wù)撸怯貌缓线壿嫷男υ捇乇軉?wèn)題、拼寫錯(cuò)誤的人，或者像2014年圖靈競(jìng)賽中獲勝的機(jī)器人那樣，自稱是一名英語(yǔ)很差的13歲烏克蘭男孩。

畢竟，人孰能無(wú)過(guò)。驗(yàn)證碼作為世界上使用最廣泛的圖靈測(cè)試，可能也會(huì)面臨類似的未來(lái)。這是一場(chǎng)新的軍備競(jìng)賽，這不是為了創(chuàng)造出在圖像標(biāo)記和文本解析方面超越人類的機(jī)器人，而是為了制造出會(huì)出錯(cuò)、會(huì)錯(cuò)過(guò)按鈕、會(huì)分心、會(huì)切換標(biāo)簽的機(jī)器人。Ghosemajumder說(shuō)：“我想人們已經(jīng)意識(shí)到有一種應(yīng)用程序可以模擬普通人類用戶或者愚蠢的人類用戶。”

驗(yàn)證碼測(cè)試可能也會(huì)在這個(gè)世界上繼續(xù)存在。亞馬遜在2017年獲得了一項(xiàng)方案專利，該方案涉及視覺(jué)錯(cuò)覺(jué)和人類難以破譯的邏輯謎題。通過(guò)失敗響應(yīng)圖靈測(cè)試，唯一通過(guò)的方法就是給出錯(cuò)誤答案。

相關(guān)報(bào)道：

https://www.theverge.com/2019/2/1/18205610/google-captcha-ai-robot-human-difficult-artificial-intelligence

【本文是51CTO專欄機(jī)構(gòu)大數(shù)據(jù)文摘的原創(chuàng)譯文，微信公眾號(hào)“大數(shù)據(jù)文摘（ id: BigDataDigest）”】

戳這里，看該作者更多好文

責(zé)任編輯：趙寧寧來(lái)源： 51CTO專欄

驗(yàn)證碼人工智能 AI

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開(kāi)發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營(yíng)

^{<sub id="tuffn"></sub>}