你可能正在制造一個(gè)人工智能,而你卻不知道
我們對于驗(yàn)證碼都不陌生,reCAPTCHA 就是一種 Google 的驗(yàn)證碼,用來區(qū)分人和機(jī)器。reCAPTCHA 就是以兩個(gè)混雜的單詞的形式出現(xiàn),然后要求你辨認(rèn)出這兩個(gè)詞才可以訪問相應(yīng)的頁面。Google 在開始掃描全世界的書籍后的第 3 年發(fā)布了這個(gè) reCAPTCHA,他們利用***的 OCR (光學(xué)字符識別)技術(shù)來完成這一壯舉,然而這并不***。因?yàn)樵谶@自動(dòng)轉(zhuǎn)錄過程中會(huì)有許多小錯(cuò)誤,但是如果要通過人工手段來全部瀏覽這些文本來找出錯(cuò)誤,幾乎是不現(xiàn)實(shí)的。同時(shí),計(jì)算機(jī)編寫的腳本機(jī)器人(bots)開始成為一個(gè)頭疼的問題,一種能區(qū)分真實(shí)用戶和機(jī)器人的手段變得非常必要。
reCAPTCHA 最初是由一位卡耐基梅隆大學(xué)(CMU)的學(xué)生開發(fā)的,隨后被 Google 應(yīng)用。這個(gè)想法很簡單,就是一張圖片上有一個(gè)常用的單詞和一個(gè)未知的單詞,讓用戶把它們謄寫下來。一旦有很多用戶解決了這個(gè) reCAPTCHA,那個(gè)單詞就會(huì)被收錄。
這樣一來,就有了大量的人來免費(fèi)轉(zhuǎn)錄書籍和報(bào)紙內(nèi)容。當(dāng)然,并不是所有人都對這個(gè)滿意,有些人甚至上訴狀告 Google 利用他們作為免費(fèi)勞動(dòng)力。然而問題不止在于這里,隨著 OCR 技術(shù)的不斷改進(jìn),機(jī)器人對于破解 reCAPTCHA 也有了 99% 的準(zhǔn)確率。所以 Google 將它更新迭代了,如今我們有了新的 noCAPTCHA reCAPCTHA,它會(huì)要求用戶從 9 張圖片中識別出指定的圖像內(nèi)容。
起初,這些圖像是一些門牌號碼,可能是為了幫助 Google 地圖在街景地圖中找到地址。然而最近大部分圖片變成了路標(biāo),這讓我們可以有足夠的理由相信我們正在教會(huì)未來的司機(jī)們(自動(dòng)駕駛模型)如何去識別路標(biāo),如何在路上正確地駕駛。誰知道接下去驗(yàn)證碼還會(huì)變成什么?或許,會(huì)讓我們?nèi)プR別路面上潛在的危險(xiǎn)?