47000名開發(fā)者每月產(chǎn)生30000個漏洞 微軟是如何用AI排查的
目前微軟共有47000多名開發(fā)人員,每月會產(chǎn)生將近30000個漏洞,而這些漏洞會存儲在100多個AzureDevOps和GitHub倉庫中,以便于在被黑客利用之前快速發(fā)現(xiàn)關(guān)鍵的漏洞。
微軟的高級安全項目經(jīng)理Scott Christiansen,大量的半策展(semi-curated)數(shù)據(jù)非常適合機器學習。自2001年以來,微軟已經(jīng)收集了1300萬個工作項目和BUG。
Christiansen表示:“我們利用這些數(shù)據(jù)開發(fā)了一個流程和機器學習模型,它能在99%的時間內(nèi)正確區(qū)分出安全和非安全漏洞,并能準確識別出關(guān)鍵的、高優(yōu)先級的安全漏洞,97%的時間內(nèi)準確識別出關(guān)鍵的、高優(yōu)先級的安全漏洞。”
微軟構(gòu)建的機器學習模型中,旨在幫助開發(fā)者準確識別和優(yōu)先處理需要修復的關(guān)鍵安全問題,并對其進行優(yōu)先級排序。Christiansen表示:“我們的目標是建立一個機器學習系統(tǒng),以盡可能接近安全專家的準確度將BUG分為安全/非安全和關(guān)鍵/非關(guān)鍵”。
為了實現(xiàn)這個目標,微軟對學習模型進行了諸多培訓,提供了很多標記為安全的BUG以及其他標記為不安全的BUG。該模型經(jīng)過訓練之后,能夠基于掌握的信息來給沒有被預先分類的數(shù)據(jù)打上標簽。