谷歌 AI 聊天機器人 Bard 審核員稱壓力大,只有三分鐘審核答案
7 月 13 日消息,據(jù)彭博社報道,谷歌的人工智能聊天機器人 Bard 是由數(shù)千名合同工(Contractor)在壓力下訓練的,他們只有 3 分鐘的時間來審核 Bard 生成的回答。
據(jù)報道,這些合同工來自 Appen 和埃森哲等公司,他們只接受了最低限度的培訓,時薪只有 14 美元(IT之家備注:當前約 100 元人民幣)。他們的工作是評估 Bard 的回答是否可靠和準確。
雖然像 Bard 和 ChatGPT 這樣的聊天機器人依賴于底層的大型語言模型來生成回答,但是人類也參與了回答的審核過程,以確保它們是可靠和準確的。然而據(jù)彭博社報道,根據(jù)內(nèi)部文件和六名合同工的說法,審核 Bard 回答的人類工作量變得越來越大和復雜。
一名合同工稱,“就目前情況而言,人們感到害怕、壓力大、工資低,不知道發(fā)生了什么。這種恐懼文化不利于我們提高質(zhì)量和團隊合作?!?/span>
合同工的任務之一就是根據(jù)回答來評價其“有用性”,并在“一點也沒有用”到“非常有用”的范圍內(nèi)打分。
谷歌發(fā)言人在一份聲明中稱:“讓人們獲得高質(zhì)量的信息是我們使命的核心。我們進行了大量的工作來負責任地構(gòu)建我們的人工智能產(chǎn)品,包括多年來我們不斷完善的嚴格測試、培訓和反饋過程,以強調(diào)事實性和減少偏見。人工評估,包括來自谷歌內(nèi)部和外部的個人,是我們用來改進產(chǎn)品的眾多方法之一?!?/p>
該發(fā)言人還稱,“評分并不直接影響我們模型的輸出,它們也絕不是我們提高準確性的唯一方式?!?/p>