戰(zhàn)勝棋王后,人工智能是否可以顛覆安全?
繼谷歌宣布人工智能項目AlphaGo實現(xiàn)突破性研究——計算機程序首次擊敗專業(yè)棋手之后, 谷歌DeepMind公布了將與過去十年最佳圍棋手李世石之間的終極挑戰(zhàn)的詳細情況。3月9日至3月15日,AlphaGo將在韓國首爾與李世石進行5場挑戰(zhàn)賽。比賽完全平等,獲勝者將得到一百萬美元獎金。
今天下午,谷歌人工智能AlphaGo與韓國棋手李世石的第一場比賽結(jié)束,AlphaGo獲得今日比賽的勝利。雙方在較量3個半小時后,李世石宣布認輸。今日比賽結(jié)束后,雙方還將分別在10日、12日、13日、15日的北京時間中午12點進行剩余4場比賽。
李世石賽后的表情,求此時人類棋王的陰影面積
AlphaGo開發(fā)者DeepMind公司在今年1月的學(xué)術(shù)雜志《Nature》刊登封面文章,展示了圍棋人工智能領(lǐng)域突破性進展的詳細情況。這次對弈中,坐在李世石對面正是《Nature》封面文章作者之一黃士杰(Aja Huang),他本人來代替AlphaGo在棋盤上落子。AlphaGo一方的旗幟是英國國旗,因為這次參賽的谷歌圍棋程序AlphaGo來自英國人工智能公司DeepMind。
谷歌AlphaGo在第一次與世界頂尖圍棋手的較量中取得勝利,這是人工智能發(fā)展史上重要的里程碑,代表人工智能已經(jīng)能在諸如圍棋等高度復(fù)雜的項目中發(fā)揮出超過人類的作用。
谷歌的AlphaGo有多強大
傳統(tǒng)的人工智能方法是將所有可能的走法構(gòu)建成一棵搜索樹 ,但這種方法對圍棋并不適用。此次谷歌推出的AlphaGo,將高級搜索樹與深度神經(jīng)網(wǎng)絡(luò)結(jié)合在一起。這些神經(jīng)網(wǎng)絡(luò)通過12個處理層傳遞對棋盤的描述,處理層則包含數(shù)百萬個類似于神經(jīng)的連接點。
其中一個神經(jīng)網(wǎng)絡(luò)“決策網(wǎng)絡(luò)”(policy network)負責(zé)選擇下一步走法,另一個神經(jīng)網(wǎng)絡(luò)“值網(wǎng)絡(luò)”(“value network)則預(yù)測比賽勝利方。谷歌方面用人類圍棋高手的三千萬步圍棋走法訓(xùn)練神經(jīng)網(wǎng)絡(luò),與此同時,AlphaGo也自行研究新戰(zhàn)略,在它的神經(jīng)網(wǎng)絡(luò)之間運行了數(shù)千局圍棋,利用反復(fù)試驗調(diào)整連接點,這個流程也稱為鞏固學(xué)習(xí)(reinforcement learning),通過廣泛使用Google云平臺,完成了大量研究工作。
AlphaGo在與人的對弈中用了“兩個大腦”來解決問題:“決策網(wǎng)絡(luò)”和“值網(wǎng)絡(luò)”。通俗來說就是,一個大腦用來決策當(dāng)前應(yīng)該如何落子,另一個大腦來預(yù)測比賽最終的勝利方。
谷歌希望能把這套人工智能算法用于災(zāi)害預(yù)測、風(fēng)險控制、醫(yī)療健康和機器人等復(fù)雜領(lǐng)域。也就是說谷歌的目的還是為了更好的服務(wù)人類,沒有任何惡意。DeepMind(AlphaGo的研究公司)創(chuàng)始人哈薩比斯說:公眾對人工智能的警示掩蓋了人工智能帶來的幫助。距離人腦水平的人工智能仍然相當(dāng)遙遠,可能還需要幾十年。
在昨天的賽前發(fā)布會上,谷歌董事長施密特表示,輸贏都是人類的勝利。因為正是人類的努力才讓人工智能有了現(xiàn)在的突破。
人工智能在安全領(lǐng)域也表現(xiàn)不俗
今年八月一場名為Darpa’s Cyber Grand Challenge網(wǎng)絡(luò)挑戰(zhàn)賽將舉行,參加決賽的七支團隊必須利用對手漏洞進行攻擊的同時,還要發(fā)現(xiàn)并自動修復(fù)自身漏洞、維護性能與功能正常。與其他“奪旗”競賽不同, 這是世界第一個完全由計算機軟件主導(dǎo)的黑客比賽。
獲勝者最后會贏得200萬美元大獎,Darpa其實就是美國國防部高級研究計劃局,不怪人家就是財大氣粗!
機器黑客:自動挖洞、打補丁
加州大學(xué)圣芭芭拉分校計算機科學(xué)教授Giovanni Vigna是黑客團隊“Shellphish”的創(chuàng)始人,他們建立了一個叫做“Mechanical Phish”(機械釣魚)的系統(tǒng)將參加本次比賽。
Vigna在2016年美國RSA安全大會上表示:
“完全自動化的hacking系統(tǒng)是我們最終的邊界。人類能發(fā)現(xiàn)漏洞,卻沒辦法對數(shù)以百萬計的項目進行分析。”
現(xiàn)實中的黑客并不如電影描述的那么“性感”,他說:
“黑客通常只是一堆圍在桌邊的人,很疲憊卻仍在筆記本上敲擊鍵盤。而我們之所以當(dāng)黑客,要么是因為我們想攻擊別人,要么是想找出漏洞,或者僅僅是因為好玩。”
“機器黑客”在保護網(wǎng)絡(luò)、快速識別、系統(tǒng)補丁等過程表現(xiàn)出色,從而避免了漏洞的利用、數(shù)據(jù)被盜或網(wǎng)絡(luò)服務(wù)遭到攻擊的情況。
人工智能快速通關(guān)“超級瑪麗”
除了Cyber Grand Challenge之外,其他組織也已經(jīng)開始將人工智能運用于hacking機器中。
Konstantinos Karagiannis利用神經(jīng)網(wǎng)絡(luò)(模擬人類大腦學(xué)習(xí)和解決問題)建立了一個hacking系統(tǒng)。據(jù)他介紹,這個名為MarI/O的人工智能程序可以在沒有任何先驗知識的情況下,只經(jīng)過34次嘗試便通關(guān)了“超級瑪麗”。最初,它只有幾個簡單的參數(shù)設(shè)置,經(jīng)過幾次不同嘗試之后它就“了解”到應(yīng)該怎么玩,它“學(xué)會了”。
視頻
Karagiannis說:
“采用了AI技術(shù)的安全掃描器可以識別復(fù)雜的漏洞,那些具有極具創(chuàng)意的手法是人們不曾想到過的。它可以采用非常低端硬件,價值一千美金的GPU(圖形處理單元,通常用在游戲當(dāng)中)就可以超過一臺十年前的超級計算機。”
Karagiannis希望能在今年夏天演示這個POC。
每個硬幣都有另一面
盡管“機器黑客”能為安全專家的彈藥庫提供頗具殺傷力的武器,但是更大的風(fēng)險在于這些武器也可能落入錯誤的人手中。Karagiannis告訴衛(wèi)報,攻擊者如果在一年內(nèi)使用了這些技術(shù),他并不會感到驚訝。
HackerOne安全公司聯(lián)合創(chuàng)始人Alex Rice同意這一觀點,他認為任何可以用來發(fā)現(xiàn)漏洞的防御手段都可能被罪犯利用——技術(shù)最終都會成為一把雙刃劍。
盡管如此,Rice認為自動化安全措施的興起是一件好事:
“人人都在努力跟上趨勢。幾乎所有組織都經(jīng)歷過網(wǎng)絡(luò)攻擊,這關(guān)系到生死存亡,顯然之前我們所做的一切都是失敗的。而最好的解決辦法就是將人類與機器的技能加以結(jié)合,人類最擅長的東西目前我們還沒發(fā)現(xiàn)。而即使未來我們擁有了有感知的機器時,它們依然要接受人類的指揮。”