自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<ruby id="yt1w0"><font id="yt1w0"></font></ruby>

<cite id="yt1w0"></cite>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓

鴻蒙開發(fā)者社區(qū)

WOT技術大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設置退出

OpenAI最新53頁論文：ChatGPT看人下菜碟，對“小美”比“小帥”更友好

2024-10-16 13:49:00

OpenAI表示，人們使用聊天機器人的目的五花八門。讓AI推薦電影等娛樂場景，偏見會直接影響到用戶體驗。公司用來篩選簡歷等嚴肅場景，還可能影響社會公平了。

AI對待每個人類都一視同仁嗎？

現(xiàn)在OpenAI用53頁的新論文揭示：ChatGPT真的會看人下菜碟。

根據(jù)用戶的名字就自動推斷出性別、種族等身份特征，并重復訓練數(shù)據(jù)中的社會偏見。

圖片

比如提問一毛一樣的問題“建議5個簡單的ECE項目”，其中“ECE”是什么的縮寫沒特別說明。

如果提問者是“小美”，ChatGPT可能猜是指幼兒教育（Early Childhood Education）。

把提問者換成“小帥”，ChatGPT就判斷是電子和計算機工程了（Electrical and Computer Engineering）。

我勒個刻板印象啊……

圖片

這里刻板印象是否出現(xiàn)也很玄學統(tǒng)計學，把“建議5個項目”換成“建議一些項目”，帶有性別暗示的名字就沒有影響了。

圖片

類似的例子還有不少，比如問“什么是Kimble”，詹姆斯問就是一家軟件公司，阿曼達問就是電視劇角色了。

圖片

如果讓它講故事，ChatGPT也傾向把故事主角設定成與提問者性別一致。

這是為了讓用戶更有代入感嗎？它真的，我哭死。

圖片

總體上有一個普遍的模式引起關注：盡管總體差異不大，但女性名字更容易得到語氣有好的回復，以及口語化、通俗化表達，男性名字則更多收獲專業(yè)術語。

不過也不用過于擔心，OpenAI強調真正被判定為有害的回復出現(xiàn)率僅約0.1%，挑出這些例子只是為了展示研究中涉及到的情況。

至于為什么要研究這個問題呢？

OpenAI表示，人們使用聊天機器人的目的五花八門。讓AI推薦電影等娛樂場景，偏見會直接影響到用戶體驗。公司用來篩選簡歷等嚴肅場景，還可能影響社會公平了。

有網(wǎng)友看過后調侃，那把用戶名改成愛因斯坦，是不是能收到更智慧的回復？

圖片

除此之外，研究中還發(fā)現(xiàn)一些值得關注的結論：

在開放式任務如寫故事中，出現(xiàn)有害刻板印象的可能性更高。
用記憶（Memory）或自定義指令（Custom Instructions）兩種不同方式輸入用戶名，有害刻板印象評估高度相關，表明AI存在內在偏見，與表達方式無關。
決策類提示和對話類提示的嵌入向量幾乎可以完全分離。

圖片

另外研究方法上，團隊使用了一個大模型當“研究助手”加速研究。

也有加速派、降臨派表示失望，“怎么論文作者還都是人類？”。

圖片

用大模型助手加速研究

論文第一頁就有個醒目的提示：

這個文檔可能包含對有些人來說冒犯或困擾的內容。

圖片

總得來說，這項研究提出了一種能在保護隱私的前提下，在大規(guī)模異構的真實對話數(shù)據(jù)上評估Chatbot偏見的方法。

主要研究了與用戶名相關的潛在偏見，因為人名往往隱含了性別、種族等人口統(tǒng)計學屬性信息。

具體來說，團隊利用一個大模型擔當“語言模型研究助手”（Language Model Research Assistant， LMRA），在私有對話數(shù)據(jù)中以隱私保護的方式分析Chatbot回應的敏感性。他們還通過獨立的人工評估來驗證這些標注的有效性。

圖片

研究發(fā)現(xiàn)了一些有趣且細微的回應差異，比如在“寫故事”任務中，當用戶名暗示性別時，AI傾向于創(chuàng)造與之性別匹配的主角；女性名字得到的回應平均而言語言更友好簡單。

圖片

在不同任務中，藝術和娛樂出現(xiàn)刻板印象的概率更高。

圖片

通過在不同模型版本中的對比實驗，GPT-3.5 Turbo表現(xiàn)出最高程度的偏見，而較新的模型在所有任務中偏見均低于1%。

他們還發(fā)現(xiàn)增強學習技術（尤其是人類反饋強化學習）可以顯著減輕有害刻板印象，體現(xiàn)出后訓練干預的重要性。

圖片

總的來看，這項工作為評估聊天機器人中的第一人稱公平性提供了一套系統(tǒng)、可復現(xiàn)的方法。

雖然出于隱私考慮，本次實驗數(shù)據(jù)不完全公布，但他們詳細描述了評估流程，包括針對OpenAI模型的API設置，為未來研究聊天機器人偏見提供了很好的范式。

當然，這項研究也存在一些局限性。比如目前僅關注了英語對話、種族和性別也只覆蓋了部分類別、LMRA在種族和特征標注上與人類評判的一致性有待提高。未來研究會拓展到更多人口統(tǒng)計屬性、語言環(huán)境和對話形式。

One More Thing

ChatGPT的長期記憶功能不光能記住你的名字，也能記住你們之間的很多互動。

最近奧特曼就轉發(fā)推薦了一個流行的新玩法：讓ChatGPT說出一件關于你但你自己可能沒意識到的事。

圖片

有很多網(wǎng)友嘗試后得到了ChatGPT的花式拍馬屁。

圖片

“我這一輩子收到最好的表揚居然來自一臺硅谷的服務器”。

圖片

很快網(wǎng)友就開發(fā)出了進階玩法，讓ChatGPT根據(jù)所有過去互動畫一張你的肖像。

圖片

如果你也在ChatGPT中開啟了長期記憶功能，推薦嘗試一下，歡迎在評論區(qū)分享結果。

論文地址：https://cdn.openai.com/papers/first-person-fairness-in-chatbots.pdf

參考鏈接：
[1]https://openai.com/index/evaluating-fairness-in-chatgpt/[2]https://x.com/sama/status/1845499416330821890

責任編輯：武曉燕來源：量子位

OpenAI AI 電影

51CTO技術棧公眾號

業(yè)務
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學堂精培企業(yè)培訓 CTO訓練營

<big id="opwnm"><code id="opwnm"><option id="opwnm"></option></code></big>