自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

微軟發(fā)布PyRIT,用于識別生成式AI系統(tǒng)中的風險

人工智能
隨著人工智能的發(fā)展,不是把數(shù)據(jù)交給算法,而是算法去處理數(shù)據(jù),從而實現(xiàn)一個全新的洞察力水平。

2月26日消息,據(jù)外媒報道,微軟發(fā)布了一個名為PyRIT的開放訪問自動化框架,用于主動識別生成式AI系統(tǒng)中的風險。

微軟人工智能紅色團隊負責人Ram?Shankar?Siva?Kumar表示,紅色團隊工具旨在“使全球每個組織都能利用最新的人工智能進步進行負責任的創(chuàng)新”。

該公司表示,PyRIT可用于評估大型語言模型(LLM)端點對不同傷害類別的穩(wěn)健性,如捏造、濫用和禁止內(nèi)容。并且還能用于識別從惡意軟件生成到越獄的安全危害,以及身份盜竊等隱私危害。

PyRIT有五個接口:目標、數(shù)據(jù)集、評分引擎、支持多種攻擊策略的能力,以及包含一個內(nèi)存組件,該組件可以采用JSON或數(shù)據(jù)庫的形式來存儲中間輸入和輸出交互。

評分引擎還提供了兩種不同的選項來對目標人工智能系統(tǒng)的輸出進行評分,允許Red?Team使用經(jīng)典的機器學習分類器或利用LLM端點進行自我評估。

微軟表示:“目標是讓研究人員能夠?qū)λ麄兊哪P秃驼麄€推理管道在不同傷害類別下的表現(xiàn)有一個基線,并能夠?qū)⒃摶€與他們模型的未來迭代進行比較?!?/p>

“這使他們能夠獲得關(guān)于他們的模型目前運行情況的經(jīng)驗數(shù)據(jù),并根據(jù)未來的改進檢測性能的任何下降?!睋Q言之,該工具旨在通過生成提示來突出風險“熱點”,這些提示可用于評估人工智能系統(tǒng)并標記需要進一步調(diào)查的領(lǐng)域。

微軟進一步承認,Red?Team生成式AI系統(tǒng)需要同時探測安全性和負責任的人工智能風險,這項工作更具概率性,同時也指出了生成式AI體系結(jié)構(gòu)的巨大差異。

責任編輯:龐桂玉 來源: 比特網(wǎng)
相關(guān)推薦

2024-02-27 11:26:47

2023-11-07 16:03:46

人工智能

2023-04-10 10:28:33

ChatGPTAI風險管理計劃

2023-12-01 15:34:34

人工智能

2025-04-15 08:35:00

網(wǎng)絡(luò)安全LLM威脅企業(yè)安全

2023-12-06 13:10:07

2023-03-22 11:06:32

2023-02-03 08:00:00

人工智能ChatGP開發(fā)

2023-09-27 09:47:51

SAPJoule

2023-03-17 11:05:44

微軟Copilot生成式AI助手

2023-08-11 17:02:57

2023-08-30 13:24:00

AI工具

2023-12-20 14:04:47

2023-08-10 07:37:53

NVIDIAAIOpenUSD

2023-08-08 15:58:03

2023-06-18 12:18:57

2025-02-04 15:14:34

2023-12-13 16:28:02

2024-03-11 09:55:51

點贊
收藏

51CTO技術(shù)棧公眾號