自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

微軟、Anthropic正在拉滿大模型的情緒價值 原創(chuàng)

發(fā)布于 2024-11-21 13:52
瀏覽
0收藏

編輯 | 星璇

出品 | 51CTO技術(shù)棧(微信號:blog51cto)

再過3天,ChatGPT 就要迎來它的第二個生日了,GPT 推出也已經(jīng)6年了。

到目前為止,大型語言模型 (LLM) 一直在有效發(fā)展。它們真實、敏捷且足智多謀。甚至可以說它們在檢索信息方面接近完美。但是作為“信息傳遞工具”,又如何呢?

在最近接受 Reid Hoffman 采訪時,Microsoft AI 首席執(zhí)行官 Mustafa Suleyman 表示:“AI 研究人員通常傾向于忽視信息傳遞工具的重要性。

考慮到理解和響應人類情感的能力如何成為一個關(guān)鍵的差異化因素,Mustafa 預測 AI 公司現(xiàn)在將根據(jù)其前沿模型的情商相互“角力”。

微軟、Anthropic正在拉滿大模型的情緒價值-AI.x社區(qū)圖片

1.C端AI,情商很關(guān)鍵

Mustafa 強調(diào),消費者通常更看重這些模型的語氣和情商,以及它們設法反映用戶獨特語言風格的方式,而不僅僅是提供客觀的、百科全書式的維基百科反芻。

在 GPT 4o 中推出高級語音功能后,OpenAI 今年的重點領域之一是集成類似人類的語音對話工具。同樣,當 Google 的 NotebookLM 推出一款精致的文本轉(zhuǎn)播客工具“Deep Dive”時,AI 社區(qū)很快就接受了這個沒有噱頭的工具。

計算機科學家 Andrej Karpathy 表達了他對該工具的贊賞,甚至使用 NotebookLM 發(fā)布了一個 10 集的整個播客系列。“NotebookLM 播客劇集生成可能觸及了一個極具吸引力的 LLM 產(chǎn)品格式的全新領域。感覺讓人想起 ChatGPT。也許我反應過度了,“他說。

2.新方向:摸索大模型的“情商規(guī)律”

不僅僅是 AI 領域的行業(yè)巨頭。今年三個月后,被稱為“情商人工智能”的 Hume AI 在由 EQT 風險投資領投的 B 輪融資中獲得了 5000 萬美元的資金。9 月,他們發(fā)布了最新的 EVI 2 模型,該模型通過專門的情商訓練適應用戶偏好。

今年早些時候,研究人員探索了 LLM 的情商。EmoBench 是一個流行的基準,它評估了這種能力。結(jié)果表明,OpenAI 的 GPT 4 在“情感理解和情感應用”方面最接近人類。然而,所評估的模型在今天已成為過去。

最近,一項研究使用 Python 庫測量了 LLM 的“表現(xiàn)力”。研究人員還進行了一項實驗,涉及以詩歌風格根據(jù)情緒生成詩歌,包括遺憾、喜悅和懊悔的感覺。雖然 LLM 的表現(xiàn)令人滿意,但結(jié)果表明,在表達具有相似含義的情緒時存在混淆。

“所有 GPT 模型在被提示表示不贊成時通常會表示贊同。這是一個重要的例子,兩種含義相互沖突的情緒經(jīng)常被誤解,“他們說。

當這些 LLM 的任務是生成 34 位不同詩人風格的詩歌時,GPT 4o 顯示出最高的表現(xiàn)力。然而,這些模型在負責識別女性詩人時表現(xiàn)出困惑,這可能在一定程度上表明了性別偏見。

在常規(guī)對話中,表現(xiàn)力逐漸下降。也就是說,盡管有局限性,但 Llama 3 的表現(xiàn)最好。應該注意的是,當提供有關(guān)主題、專業(yè)或角色的額外背景時,這些 LLM 的表現(xiàn)會更好。

“對于專業(yè)信號,LLM 表現(xiàn)出一致且不斷增長的表達水平。相反,對于情緒信號,LLM 的表達性變化更大,隨著模型根據(jù)不斷變化的情緒背景調(diào)整和改變其反應,準確性會波動,“研究人員補充道。

3.Anthropic目前的目標:提高模型情商

Anthropic 認為情商是提高 Claude 的重要因素。哲學家兼 Anthropic 技術(shù)人員 Amanda Askell 在接受 Lex Fridman 采訪時說:“我的主要想法一直是試圖讓 Claude 的行為方式,如果他們處于 Claude 的位置,你希望任何人都能理想地表現(xiàn)。

“所以想象一下,我?guī)б粋€人去,他們知道他們將與可能有數(shù)百萬人交談,這樣他們所說的話就會產(chǎn)生巨大的影響,你希望他們在這種真正豐富的意義上表現(xiàn)良好,”Askell 說。

對于更新的模型,Anthropic 正在努力幫助 Claude 以細致入微的情緒和表情做出回應。這涉及塑造模型以了解何時關(guān)心、何時表現(xiàn)得幽默、何時尊重意見以及何時確定自主程度。

她還解決了 LLM 中的阿諛奉承問題,即使他們是正確的,他們也傾向于糾正他們的輸出,只是為了服從人類輸入所說的。“如果 Claude 真的確信這不是真的,Claude 應該說,'我不這么認為。也許你有更多最新的信息',“Askell 補充道。

Askell 還提到,她想提高 Claude 在對話中提出相關(guān)后續(xù)問題的能力??偟膩碚f,Anthropic 目前的目標是在 Claude 內(nèi)心灌輸真實的個性,而不是推遲或霸道地對待人類。雖然關(guān)于 LLM 碰壁并達到其可擴展性極限的討論和爭論不斷涌現(xiàn),但調(diào)整這些模型以提高情商是一種選擇。

但是,需要注意的是。今年早些時候,OpenAI 發(fā)布了一張“系統(tǒng)卡”,警告人們可能會過度依戀情商高的 AI。

“使用 AI 模型進行類人社交可能會產(chǎn)生影響人與人互動的外部性。例如,用戶可能會與 AI 建立社交關(guān)系,減少他們對人際互動的需求,可能會使孤獨的人受益,但可能會影響健康的人際關(guān)系,“OpenAI 在報告中指出。

微軟、Anthropic正在拉滿大模型的情緒價值-AI.x社區(qū)圖片

不幸的是,據(jù)之前的一個報道,一位14歲的少年由于對 CharacterAI 中的某個角色產(chǎn)生了深深的情感依戀,最終導致其自殺身亡。

由此可見,提高 AI 模型中的情商還有很多工作需要做,也有許多問題需要解決。開發(fā)面向消費者層面上 AI 互動技術(shù)無疑是一個明確的趨勢,但在讓大模型在同理心和責任感之間取得平衡,更加至關(guān)重要。

本文轉(zhuǎn)載自51CTO技術(shù)棧,作者:星璇

?著作權(quán)歸作者所有,如需轉(zhuǎn)載,請注明出處,否則將追究法律責任
收藏
回復
舉報
回復
相關(guān)推薦