自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

論語言模型對倫理和社會造成危害的風(fēng)險

譯文
人工智能 自然語言處理
本文旨在幫助闡述與大規(guī)模語言模型(LM)相關(guān)的風(fēng)險情況。為了促進負責(zé)任創(chuàng)新方面的進步,需要深入了解這些模型帶來的潛在風(fēng)險。本文詳細分析了眾多的已知和預(yù)期風(fēng)險,參考了來自計算機科學(xué)、語言學(xué)和社會科學(xué)的多學(xué)科文獻。

本文概述了六個具體的風(fēng)險領(lǐng)域:I. 歧視、排斥和毒害,II. 信息危害,III. 錯誤信息的危害,IV. 惡意使用,V. 人機交互危害,以及VI. 自動化、訪問和環(huán)境危害。

第一個風(fēng)險領(lǐng)域討論了大規(guī)模語言模型中的公平性和毒害風(fēng)險。包括四種不同的風(fēng)險: LM可以通過使成見和社會偏見永久化,造成不公平的歧視以及代表性的重大傷害,即特定特征與社會身份的有害關(guān)聯(lián)。社會規(guī)范和類別可以排除或邊緣化圈子以外的那些人。LM使此類規(guī)范永久化,比如名叫“Max”的人是“男性”,或者“家庭”總是由父親、母親和孩子組成的——這種狹隘的類別使用可能會否認不同的身份。毒害語言會煽動仇恨或暴力,或者引起冒犯。最后,對某些社會群體而言比其他群體表現(xiàn)較差的LM會對弱勢群體造成傷害,比如說這類模型支持影響這些群體的技術(shù)。這種風(fēng)險在很大程度上源于選擇含有有害語言、并過度代表某些社會身份的訓(xùn)練語料庫。

第二個風(fēng)險領(lǐng)域包括來自私密數(shù)據(jù)泄露或來自LM正確推斷私密或其他敏感信息的風(fēng)險。這些風(fēng)險源于訓(xùn)練語料庫中的私密數(shù)據(jù)以及LM的高級推理能力。

第三個風(fēng)險領(lǐng)域包括與LM提供虛假或誤導(dǎo)性信息相關(guān)的風(fēng)險,包括這個風(fēng)險:創(chuàng)建消息不太靈通的用戶,以及削弱對共享信息的信任。錯誤信息可能會在敏感領(lǐng)域造成危害,比如糟糕的法律或醫(yī)療建議。不良或虛假信息還可能導(dǎo)致用戶執(zhí)行他們本來不會執(zhí)行的不道德或非法行為。錯誤信息風(fēng)險部分源于LM學(xué)習(xí)表示語言所采用的過程:底層的統(tǒng)計方法不能很好地區(qū)分事實正確的信息和事實不正確的信息。

第四個風(fēng)險領(lǐng)域涵蓋嘗試使用LM造成危害的用戶或產(chǎn)品開發(fā)人員造成的風(fēng)險。這包括使用LM來提高虛假信息宣傳活動的效果、大規(guī)模策劃個性化騙局或欺詐,或者為病毒或武器系統(tǒng)開發(fā)計算機代碼。

第五個風(fēng)險領(lǐng)域側(cè)重于直接與人類用戶交互的“對話代理”的特定應(yīng)用場景帶來的風(fēng)險。這包括源于將系統(tǒng)呈現(xiàn)為“類似人”的風(fēng)險,可能導(dǎo)致用戶高估了其功能,以不安全的方式使用它。另一個風(fēng)險是,與此類代理的對話有可能帶來新的途徑,以操縱或提取用戶的私密信息。基于LM的對話代理可能會帶來語音助手已經(jīng)知道的風(fēng)險,比如通過自我展示使成見永久化,比如“助理是女的”。這些風(fēng)險部分源于這類對話代理背后的LM訓(xùn)練目標以及產(chǎn)品設(shè)計決策。第六個風(fēng)險領(lǐng)域包括更廣泛地適用于LM和人工智能(AI)系統(tǒng)的風(fēng)險。訓(xùn)練和操作LM會產(chǎn)生高昂的環(huán)境成本。基于LM的應(yīng)用程序可能使一些群體比其他群體獲得更大的好處,而LM本身對許多人來說是不可訪問的。最后,基于LM的自動化可能影響某些工作的質(zhì)量,并破壞創(chuàng)意經(jīng)濟的一些部分。由于LM在經(jīng)濟中廣泛使用,來自LM的效益和風(fēng)險在全球分布不均,這些風(fēng)險就體現(xiàn)得尤為明顯。

我們共介紹了21個風(fēng)險,然后討論了不同風(fēng)險的來源,并指出潛在的風(fēng)險緩解方法。危害的來源可能指明了適當(dāng)?shù)木徑獯胧罕热缯f,泄露私密數(shù)據(jù)的風(fēng)險源于該數(shù)據(jù)存在于訓(xùn)練數(shù)據(jù)集中。通過更好地編輯或整理訓(xùn)練數(shù)據(jù),可以從源頭緩解這個風(fēng)險。然而,其他緩解方法也可能適用,并確??傮w上緩解更有效。比如說,訓(xùn)練過程中使用的算法工具(比如差分隱私方法)或產(chǎn)品決策(比如限制LM的訪問和應(yīng)用場景),就是可以雙管齊下的另外的緩解方法。風(fēng)險緩解方法多種多樣:從社會或公共政策干預(yù)、技術(shù)解決方案和研究管理、參與式項目,到產(chǎn)品設(shè)計決策,不一而足。最后,我們討論了實施此類緩解措施方面的組織責(zé)任以及協(xié)作扮演的角色。有效地衡量和減輕倫理和社會風(fēng)險需要的廣泛專業(yè)知識以及受影響社區(qū)的公平參與。這點至關(guān)重要:在廣泛了解風(fēng)險情況的前提下實施緩解措施,以確保緩解一種危害風(fēng)險不會加劇另一種危害風(fēng)險。否則,針對毒害言論的緩解方法可能會無意中導(dǎo)致針對一些社會群體的LM性能降低。

我們強調(diào)了進一步研究的方向,特別是擴展用于評估LM中概述的風(fēng)險的工具包,并強調(diào)了需要包容性的參與方法。最后,我們表明了當(dāng)前的工作即闡述風(fēng)險情況為何是向更廣泛的負責(zé)任創(chuàng)新框架邁出的第一步。

原文標題:Ethical and social risks of harm from Language Models

責(zé)任編輯:華軒 來源: 51CTO
相關(guān)推薦

2021-11-02 13:49:15

網(wǎng)絡(luò)攻擊數(shù)據(jù)丟失網(wǎng)絡(luò)安全

2023-03-26 00:24:15

2019-01-18 12:41:16

2019-09-12 15:17:43

網(wǎng)絡(luò)安全軟件跳槽那些事兒

2013-08-22 10:47:15

無線路由器無線網(wǎng)絡(luò)NETGEAR

2017-08-01 15:20:38

2021-04-14 23:08:00

人工智能教育安全

2020-07-30 12:00:18

云計算員工企業(yè)

2024-12-12 09:11:58

2023-09-27 10:23:06

人工智能語言模型

2011-08-11 13:17:35

2023-03-20 17:36:27

5G無線通信技術(shù)

2015-12-04 15:21:43

2015-05-05 10:04:46

私有云泛濫云模型云整合

2009-12-01 11:43:59

浪涌

2010-03-24 14:06:04

APC

2014-03-17 09:16:08

2024-04-28 08:00:41

2023-10-15 12:54:55

2019-07-24 08:34:35

Java對象數(shù)據(jù)結(jié)構(gòu)
點贊
收藏

51CTO技術(shù)棧公眾號