首個生成式 AI 安全指導性文件來了,你讀懂了嗎?
10 月 11 日,全國信息安全標準化技術委員會官網發(fā)布《生成式人工智能服務安全基本要求》(征求意見稿),面向社會公開征求意見。
公告原文:https://www.tc260.org.cn/front/postDetail.html?id=20231011143225
這是國內首個專門面向生成式 AI 安全領域的規(guī)范意見稿,也是對 7 月網信辦等七部門推出的《生成式人工智能服務管理暫行辦法》的支撐。
征求意見稿首次提出生成式 AI 服務提供者需遵循的安全基本要求,涉及語料安全、模型安全、安全措施、安全評估等方面。
下文介紹了該文件部分要點。
要求:提供者不應使用未經主管部門備案的基礎模型進行研發(fā)。在訓練過程中,應將生成內容安全性作為評價生成結果優(yōu)劣的主要考慮指標之一。
在每次對話中,應對使用者輸入信息進行安全性檢測,引導模型生成積極正向內容。
《要求》提出,建立語料來源黑名單,不得使用黑名單來源的數據進行訓練。應對各來源語料進行安全評估,單一來源語料內容含違法不良信息超 5% 應將其加入黑名單。
應使用包含個人信息的語料時,獲得對應個人信息主體的授權同意,或滿足其他合法使用該個人信息的條件。
應使用包含人臉等生物特征信息的語料時,獲得對應個人信息主體的書面授權同意,或滿足其他合法使用該生物特征信息的條件。
在訓練過程中,應將生成內容安全性作為評價生成結果優(yōu)劣的主要考慮指標之一。
全文:https://www.tc260.org.cn/upload/2023-10-11/1697008495851003865.pdf