自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

人類與機(jī)器博弈下,為何驗(yàn)證碼越來(lái)越難了?

企業(yè)動(dòng)態(tài)
由于驗(yàn)證碼是一個(gè)十分優(yōu)雅的人工智能訓(xùn)練工具,所以任何給定的測(cè)試都只能是暫時(shí)的,驗(yàn)證碼的發(fā)明者從一開(kāi)始就承認(rèn)了這一點(diǎn)。

[[351676]]

大數(shù)據(jù)文摘出品

來(lái)源:theverge

編譯:吳瑕

谷歌、新浪的登錄頁(yè)面一直以來(lái)都在要求人們證明自己是人類,最近,這樣的考題更是來(lái)勢(shì)洶洶。

那個(gè)原本十分可愛(ài)的“我不是機(jī)器人”按鈕,追加了越來(lái)越多證明不是機(jī)器人的要求——在一系列圖像中選出含有交通燈、人行道和店面的圖片。很快,交通燈被遠(yuǎn)處的樹(shù)葉遮蓋了,人行道變得彎曲并且會(huì)有一半消失在拐角處,店面的招牌也被模糊處理并換成了韓文。特別是像12306這樣的購(gòu)票網(wǎng)站出現(xiàn)的驗(yàn)證碼堪比連連看,每年都能難倒一大批登錄者。

 

這些測(cè)試被稱為CAPTCHA,是Completely Automated Public Turing test to tell Computers and Humans Apart(區(qū)分電腦和人的完全自動(dòng)化公共圖靈測(cè)試)的首字母縮寫,這些測(cè)試水平早前就已經(jīng)達(dá)到了不可思議的高度。

在21世紀(jì)初,簡(jiǎn)單的文字圖片就足以讓大多數(shù)垃圾郵件程序束手無(wú)策。但是十年后,當(dāng)谷歌從卡內(nèi)基梅隆大學(xué)的研究人員那里購(gòu)買了這個(gè)程序,并用來(lái)使谷歌圖書(Google Books)實(shí)現(xiàn)數(shù)字化時(shí),文本就必須變得越來(lái)越扭曲和模糊,以便保持領(lǐng)先于改進(jìn)的光學(xué)字符識(shí)別程序(所有參與CAPTCHA測(cè)試的人都在間接地幫助改進(jìn)此程序)。

這就是人類與機(jī)器博弈的終局。

由于驗(yàn)證碼是一個(gè)十分優(yōu)雅的人工智能訓(xùn)練工具,所以任何給定的測(cè)試都只能是暫時(shí)的,驗(yàn)證碼的發(fā)明者從一開(kāi)始就承認(rèn)了這一點(diǎn)。在人們研究人工智能應(yīng)用的初期,許多研究人員、騙子和普通人解決了數(shù)以億計(jì)的謎題,當(dāng)時(shí)機(jī)器似乎將要超越人類。2014年,為解決最扭曲的文本驗(yàn)證碼問(wèn)題(驗(yàn)證時(shí),計(jì)算機(jī)的正確率為99.8%,而人類的正確率僅為33%),谷歌用一種機(jī)器學(xué)習(xí)算法與人類進(jìn)行了一場(chǎng)對(duì)決。

隨后谷歌轉(zhuǎn)向NoCaptcha ReCaptcha方式,通過(guò)觀察用戶數(shù)據(jù)和行為,讓部分人通過(guò)點(diǎn)擊“我不是機(jī)器人”按鈕通過(guò)驗(yàn)證,而要求另一些人進(jìn)行我們今天看到的圖片驗(yàn)證。但機(jī)器再次迎頭趕上。那些遮陽(yáng)棚到底是不是商店?這就是人類與機(jī)器博弈的終局。

伊利諾斯大學(xué)芝加哥分校(University of Illinois at Chicago)的計(jì)算機(jī)科學(xué)教授杰森·波拉基斯(Jason Polakis)認(rèn)為驗(yàn)證碼難度的增加是由個(gè)人信貸導(dǎo)致的。2016年,他發(fā)表了一篇論文,文中使用現(xiàn)成的圖片識(shí)別工具(包括谷歌自己的反向圖片搜索工具)去解決谷歌的圖像驗(yàn)證問(wèn)題,準(zhǔn)確率達(dá)到70%。還有一些研究人員用谷歌自己的音頻識(shí)別程序,在谷歌的驗(yàn)證碼挑戰(zhàn)中取得了突破。

波拉基斯指出,在基本的文本、圖像和聲音識(shí)別任務(wù)上,機(jī)器學(xué)習(xí)如今已經(jīng)能達(dá)到與人類一樣的水平。事實(shí)上,算法可能比人類更擅長(zhǎng)此類任務(wù)。“如今正處在這樣一個(gè)階段:為軟件增加難度,最后會(huì)讓很多人覺(jué)得難度太大。我們需要一些替代方案,但還沒(méi)有具體的計(jì)劃。

如今驗(yàn)證碼測(cè)試存在的問(wèn)題并不一定是機(jī)器人太聰明,而是人類做得太差勁了

關(guān)于驗(yàn)證碼的文獻(xiàn)從一開(kāi)始就是錯(cuò)的,而且還在進(jìn)行著奇怪的嘗試,尋找除文本或圖像識(shí)別(這些方面人類普遍擅長(zhǎng),機(jī)器卻很難識(shí)別)之外的方式。研究人員曾嘗試讓用戶根據(jù)面部表情、性別和種族對(duì)人的圖像進(jìn)行分類(不難想象,人們?cè)谶@方面做得很好)。有人提議使用瑣碎的驗(yàn)證碼,以及基于用戶成長(zhǎng)地區(qū)常見(jiàn)童謠的驗(yàn)證碼。這種文化驗(yàn)證碼針對(duì)的不僅是機(jī)器人,還有在海外驗(yàn)證碼農(nóng)場(chǎng)工作的人,讓他們用不到一分錢的代價(jià)來(lái)解決難題。人們嘗試用各種方法增加圖片識(shí)別難度,比如讓用戶識(shí)別豬,但把豬做成卡通樣式,并給豬戴上太陽(yáng)鏡。研究人員還嘗試要求用戶魔術(shù)眼狀斑點(diǎn)圖中的物品。此外,還有一個(gè)有趣的驗(yàn)證碼變種,研究人員在2010年提出使用驗(yàn)證碼來(lái)索引古代巖畫,因?yàn)橛?jì)算機(jī)不太擅長(zhǎng)解讀洞穴壁畫上的馴鹿的示意草圖。

最近還有人在嘗試開(kāi)發(fā)游戲類驗(yàn)證碼,通過(guò)要求用戶旋轉(zhuǎn)物體到特定角度或?qū)⑵磮D塊拖至正確位置,所給出的指示不是文字形式而是符號(hào)形式,或游戲板的背景暗示。人們希望人類可以理解拼圖的邏輯,但在沒(méi)有明確指示的情況下,計(jì)算機(jī)會(huì)被難住。其他一些研究人員試圖利用人類擁有身體這一事實(shí),通過(guò)設(shè)備攝像頭或增強(qiáng)現(xiàn)實(shí)技術(shù)進(jìn)行互動(dòng),證明人類的存在。

這些驗(yàn)證碼測(cè)試存在的問(wèn)題并不一定是機(jī)器人太聰明,而是人類做得太差勁了。這并不是說(shuō)人類愚蠢,而是因?yàn)槿祟愒谡Z(yǔ)言、文化和經(jīng)歷上存在多種差異。一旦你脫離所有這些東西,去制作一個(gè)任何人不需要事先訓(xùn)練或思考都能通過(guò)的測(cè)試,那就只能選擇像圖像處理這樣的不用動(dòng)腦的任務(wù),而這樣的任務(wù)正是為人工智能量身定做的。

怎樣才能區(qū)分人和機(jī)器?

[[351678]] 

波拉基斯表示:“驗(yàn)證碼測(cè)試受到人類能力的限制,除了身體上的能力外,還需要一些(能夠)跨文化跨語(yǔ)言的東西,需要一些通用的驗(yàn)證方式,讓希臘、芝加哥、南非、伊朗和澳洲人都能通過(guò)驗(yàn)證。” 而這樣的驗(yàn)證方式必須獨(dú)立于文化的復(fù)雜性和差異性之外。我們需要設(shè)置的是對(duì)一般人來(lái)說(shuō)很容易的驗(yàn)證方式,不應(yīng)該局限于特定的人群,但這樣的驗(yàn)證方式對(duì)計(jì)算機(jī)來(lái)說(shuō)還必須是困難的。我們實(shí)際能做的事情是非常有限的,而這樣的事還必須是人類能夠快速完成的,而且不會(huì)令人心煩。”

要搞清楚如何解決這些模糊圖像驗(yàn)證問(wèn)題,就要進(jìn)入到哲學(xué)領(lǐng)域:什么樣的人類共性,可以向機(jī)器展示,但沒(méi)有機(jī)器可以模仿?人類到底是什么?

不過(guò),或許我們的人性不是通過(guò)如何完成一項(xiàng)任務(wù)來(lái)衡量,而是通過(guò)我們?nèi)绾卧谶@個(gè)世界上的移動(dòng)軌跡——或者在互聯(lián)網(wǎng)中的移動(dòng)軌跡來(lái)衡量的。Shuman Ghosemajumder曾在谷歌負(fù)責(zé)打擊點(diǎn)擊詐騙,后來(lái)成為了機(jī)器人檢測(cè)公司Shape Security的首席技術(shù)官,他認(rèn)為,無(wú)論你設(shè)計(jì)的是游戲驗(yàn)證碼、視頻驗(yàn)證碼或者任何其他類型的驗(yàn)證碼測(cè)試,最終都會(huì)以失敗收?qǐng)觥1绕饻y(cè)試,他更喜歡“持續(xù)認(rèn)證”,即觀察用戶的行為并尋找自動(dòng)操作的跡象。” Ghosemajumder指出:“一個(gè)真正的人,無(wú)法很好地控制自己的運(yùn)動(dòng)機(jī)能,所以無(wú)論人們?nèi)绾闻L試,他們都無(wú)法在多次交互中多次以同樣的方式移動(dòng)鼠標(biāo)。” Ghosemajumder表示,機(jī)器人不需要移動(dòng)鼠標(biāo)就能與頁(yè)面進(jìn)行交互,或者能夠精確地移動(dòng)鼠標(biāo),而人類的行為具有難以模仿的“熵”。

谷歌自身的驗(yàn)證碼團(tuán)隊(duì)也在思考類似的問(wèn)題,去年年底發(fā)布的最新版本reCaptcha v3,使用“自適應(yīng)風(fēng)險(xiǎn)分析”,根據(jù)看起來(lái)可疑的程度對(duì)信息流量進(jìn)行評(píng)分,然后,網(wǎng)站所有者可以選擇對(duì)粗選出來(lái)的用戶進(jìn)行驗(yàn)證,比如要求其填寫密碼或進(jìn)行雙重認(rèn)證。驗(yàn)證碼團(tuán)隊(duì)的產(chǎn)品經(jīng)理Cy Khormaee表示,谷歌不會(huì)公布影響評(píng)分的因素,但谷歌會(huì)觀察一個(gè)網(wǎng)站上的“良好流量”的特征,然后用這些特征來(lái)檢測(cè)“糟糕流量”。安全研究人員表示,谷歌可能會(huì)綜合運(yùn)用信息記錄程序(cookie)、瀏覽器屬性、流量模式和其他因素進(jìn)行評(píng)分。新型機(jī)器人檢測(cè)方式的一個(gè)缺點(diǎn)是,它會(huì)導(dǎo)致人們?yōu)g覽網(wǎng)頁(yè)時(shí)無(wú)法擺脫被監(jiān)視感,因?yàn)樘摂M專用網(wǎng)和反跟蹤擴(kuò)展程序的使用可能會(huì)讓你被標(biāo)記為可疑或有威脅。

谷歌驗(yàn)證碼團(tuán)隊(duì)的工程主管Aaron Malenfant指出,放棄圖靈測(cè)試是為了回避人類不斷輸?shù)舻母?jìng)爭(zhēng)。“隨著人們?cè)跈C(jī)器學(xué)習(xí)上投入的資金越來(lái)越多,這類挑戰(zhàn)對(duì)人類來(lái)說(shuō)將會(huì)變得越來(lái)越難,這就是我們推出CAPTCHA V3的原因,為了走在這條曲線的前面。” Malenfant 指出,5到10年后,驗(yàn)證碼挑戰(zhàn)可能會(huì)變得完全不可行。然而,很多網(wǎng)站后臺(tái)將會(huì)運(yùn)行恒定、隱秘的圖靈測(cè)試。

布萊恩·克里斯汀(Brian Christian)在所著的The Most Human Human一書中,作為人類替身參加了圖靈測(cè)試比賽,他發(fā)現(xiàn)在交談中要證明你的人性是相當(dāng)困難的。另一方面,機(jī)器人制造商發(fā)現(xiàn)更容易通過(guò)測(cè)試的不是口才最好、最有智慧的健談?wù)撸怯貌缓线壿嫷男υ捇乇軉?wèn)題、拼寫錯(cuò)誤的人,或者像2014年圖靈競(jìng)賽中獲勝的機(jī)器人那樣,自稱是一名英語(yǔ)很差的13歲烏克蘭男孩。

畢竟,人孰能無(wú)過(guò)。驗(yàn)證碼作為世界上使用最廣泛的圖靈測(cè)試,可能也會(huì)面臨類似的未來(lái)。這是一場(chǎng)新的軍備競(jìng)賽,這不是為了創(chuàng)造出在圖像標(biāo)記和文本解析方面超越人類的機(jī)器人,而是為了制造出會(huì)出錯(cuò)、會(huì)錯(cuò)過(guò)按鈕、會(huì)分心、會(huì)切換標(biāo)簽的機(jī)器人。Ghosemajumder說(shuō):“我想人們已經(jīng)意識(shí)到有一種應(yīng)用程序可以模擬普通人類用戶或者愚蠢的人類用戶。”

驗(yàn)證碼測(cè)試可能也會(huì)在這個(gè)世界上繼續(xù)存在。亞馬遜在2017年獲得了一項(xiàng)方案專利,該方案涉及視覺(jué)錯(cuò)覺(jué)和人類難以破譯的邏輯謎題。通過(guò)失敗響應(yīng)圖靈測(cè)試,唯一通過(guò)的方法就是給出錯(cuò)誤答案。

相關(guān)報(bào)道:

https://www.theverge.com/2019/2/1/18205610/google-captcha-ai-robot-human-difficult-artificial-intelligence

【本文是51CTO專欄機(jī)構(gòu)大數(shù)據(jù)文摘的原創(chuàng)譯文,微信公眾號(hào)“大數(shù)據(jù)文摘( id: BigDataDigest)”】

戳這里,看該作者更多好文

 

責(zé)任編輯:趙寧寧 來(lái)源: 51CTO專欄
相關(guān)推薦

2021-04-15 13:48:08

視頻監(jiān)控視頻分析智能安防

2024-10-29 11:05:26

2012-01-12 09:19:27

2021-11-14 22:04:55

iPhone安卓手機(jī)

2013-07-22 14:49:32

創(chuàng)業(yè)公司URL

2023-04-25 07:48:01

顯示器屏幕數(shù)字化

2012-04-27 15:22:46

存儲(chǔ)虛擬化障礙

2017-12-26 15:34:55

2023-03-02 08:00:55

包管理工具pnpm 包

2020-07-21 09:30:04

互聯(lián)網(wǎng)

2024-06-28 14:59:08

2020-11-16 07:28:53

驗(yàn)證碼

2023-12-12 13:15:00

模型訓(xùn)練

2021-08-03 11:09:41

智能手機(jī)功能技術(shù)

2017-10-27 12:28:14

云端遷移云計(jì)算

2022-05-27 11:44:53

JS代碼

2022-05-17 09:17:45

JS 代碼越來(lái)越難讀

2024-02-21 09:44:33

Rust前端

2021-12-14 22:20:04

手機(jī)廠商內(nèi)卷

2019-01-23 17:48:29

人工智能機(jī)器學(xué)習(xí)技術(shù)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)