MLCommons宣布成立人工智能安全工作組
人工智能基準(zhǔn)組織MLCommons宣布成立人工智能安全(AIS:AI Safety)工作組。AIS將開發(fā)一個(gè)平臺和來自許多貢獻(xiàn)者的測試庫,以支持不同用例的人工智能安全基準(zhǔn)。
人工智能系統(tǒng)為社會(huì)提供了巨大利益的潛力,但它們并非沒有風(fēng)險(xiǎn),如有害性、錯(cuò)誤信息和偏見。與其他復(fù)雜技術(shù)一樣,社會(huì)需要行業(yè)標(biāo)準(zhǔn)的安全測試來實(shí)現(xiàn)效益,同時(shí)將風(fēng)險(xiǎn)降至最低。
新平臺將支持定義從測試庫中選擇的基準(zhǔn),并將輸出匯總為有用的、可理解的分?jǐn)?shù)——類似于其他行業(yè)的標(biāo)準(zhǔn),如汽車安全測試評級和能源星級分?jǐn)?shù)。
這項(xiàng)工作的當(dāng)務(wù)之急是支持更嚴(yán)格、更可靠的人工智能安全測試技術(shù)的快速發(fā)展。AIS工作組將利用其成員和更大的人工智能社區(qū)的技術(shù)和運(yùn)營專業(yè)知識,幫助指導(dǎo)和創(chuàng)建人工智能安全基準(zhǔn)技術(shù)。
埃因霍溫理工大學(xué)機(jī)器學(xué)習(xí)(ML)副教授Joaquin Vanschoren表示:“廣泛的人工智能社區(qū)正在制定的安全基準(zhǔn)具有開放性和動(dòng)態(tài)性,這為制定和實(shí)現(xiàn)共同目標(biāo)創(chuàng)造了真正的激勵(lì)?!薄叭绻魏稳丝吹轿唇鉀Q的安全問題,他們都可以提出新的測試。我們有一些世界上最聰明的人聚在一起實(shí)際解決這些問題,使用基準(zhǔn)意味著我們將清楚地了解哪些人工智能模型最能解決安全問題。”
初始重點(diǎn)將是開發(fā)大型語言模型(LLM)的安全基準(zhǔn),以斯坦福大學(xué)基礎(chǔ)模型研究中心(CRFM)及其語言模型整體評估(HELM)的研究人員所做的開創(chuàng)性工作為基礎(chǔ)。除了建立在HELM框架的基礎(chǔ)上并納入其許多安全相關(guān)測試外,工作組還希望一些公司將其內(nèi)部用于專有目的的人工智能安全測試外部化,并與MLCommons社區(qū)公開分享,這將有助于加快創(chuàng)新步伐。
基礎(chǔ)模型研究中心主任Percy Liang表示:“我們開發(fā)HELM這一模塊化評估框架已經(jīng)有大約2年的時(shí)間了。我很高興能與MLCommons合作,利用HELM進(jìn)行人工智能安全評估,這是我思考了7年的課題,隨著強(qiáng)大的基礎(chǔ)模型的興起,這一課題變得極其緊迫?!?/span>
AIS工作組認(rèn)為,隨著測試的成熟,標(biāo)準(zhǔn)的人工智能安全基準(zhǔn)將成為人工智能安全方法的重要組成部分。這與負(fù)責(zé)任的人工智能技術(shù)發(fā)展和基于風(fēng)險(xiǎn)的政策框架相一致,例如幾家科技公司于2023年7月向美國白宮做出的關(guān)于安全、安保和信任的自愿承諾、NIST的人工智能風(fēng)險(xiǎn)管理框架以及歐盟即將出臺的《人工智能法》。
MLCommons支持行業(yè)和學(xué)術(shù)界的廣泛利益相關(guān)者開發(fā)共享數(shù)據(jù)、工具和基準(zhǔn),以更有效地構(gòu)建和測試人工智能系統(tǒng)。MLCommons執(zhí)行董事David Kanter表示:“我們很高興能與會(huì)員合作?!髂辏覀儗W⒂跇?gòu)建和部署人工智能安全基準(zhǔn),首先從開源模型開始,目的是在初步方法得到驗(yàn)證后,將基準(zhǔn)更廣泛地應(yīng)用于其他LLM?!?/span>
首次參與AIS工作組的包括一個(gè)由人工智能專家組成的多學(xué)科小組,包括:Anthropic、Coactive AI、Google、Inflection、Intel、Meta、Microsoft、NVIDIA、OpenAI、高通,以及埃因霍溫理工大學(xué)的學(xué)者Joaquin Vanstoren、斯坦福大學(xué)的Percy Liang和芝加哥大學(xué)的Bo·Li。學(xué)術(shù)界和產(chǎn)業(yè)界的研究人員和工程師以及民間社會(huì)和公共部門的領(lǐng)域?qū)<揖蓞⒓庸ぷ鹘M。點(diǎn)擊閱讀原文,了解如何參與AIS工作組。
關(guān)于MLCommons
MLCommons是構(gòu)建人工智能基準(zhǔn)的世界領(lǐng)導(dǎo)者組織。它是一個(gè)開放的工程聯(lián)盟,其使命是通過基準(zhǔn)和數(shù)據(jù)讓每個(gè)人都能更好地進(jìn)行機(jī)器學(xué)習(xí)。MLCommons的基礎(chǔ)始于2018年的MLPerf基準(zhǔn),該基準(zhǔn)作為一組行業(yè)指標(biāo)迅速擴(kuò)展,以衡量機(jī)器學(xué)習(xí)性能并提高機(jī)器學(xué)習(xí)技術(shù)的透明度。MLCommons與其125多名成員、全球技術(shù)提供商、學(xué)者和研究人員合作,專注于通過基準(zhǔn)和指標(biāo)、公共數(shù)據(jù)集和最佳實(shí)踐為整個(gè)機(jī)器學(xué)習(xí)行業(yè)構(gòu)建工具的協(xié)同工程工作。