自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

微軟、Anthropic正在拉滿大模型的情緒價(jià)值

原創(chuàng) 精選
人工智能
提高 AI 模型中的情商還有很多工作需要做,也有許多問(wèn)題需要解決。開(kāi)發(fā)面向消費(fèi)者層面上 AI 互動(dòng)技術(shù)無(wú)疑是一個(gè)明確的趨勢(shì),但在讓大模型在同理心和責(zé)任感之間取得平衡,更加至關(guān)重要。?

編輯 | 星璇

出品 | 51CTO技術(shù)棧(微信號(hào):blog51cto)

再過(guò)3天,ChatGPT 就要迎來(lái)它的第二個(gè)生日了,GPT 推出也已經(jīng)6年了。

到目前為止,大型語(yǔ)言模型 (LLM) 一直在有效發(fā)展。它們真實(shí)、敏捷且足智多謀。甚至可以說(shuō)它們?cè)跈z索信息方面接近完美。但是作為“信息傳遞工具”,又如何呢?

在最近接受 Reid Hoffman 采訪時(shí),Microsoft AI 首席執(zhí)行官 Mustafa Suleyman 表示:“AI 研究人員通常傾向于忽視信息傳遞工具的重要性。

考慮到理解和響應(yīng)人類情感的能力如何成為一個(gè)關(guān)鍵的差異化因素,Mustafa 預(yù)測(cè) AI 公司現(xiàn)在將根據(jù)其前沿模型的情商相互“角力”。

圖片圖片

1.C端AI,情商很關(guān)鍵

Mustafa 強(qiáng)調(diào),消費(fèi)者通常更看重這些模型的語(yǔ)氣和情商,以及它們?cè)O(shè)法反映用戶獨(dú)特語(yǔ)言風(fēng)格的方式,而不僅僅是提供客觀的、百科全書式的維基百科反芻。

在 GPT 4o 中推出高級(jí)語(yǔ)音功能后,OpenAI 今年的重點(diǎn)領(lǐng)域之一是集成類似人類的語(yǔ)音對(duì)話工具。同樣,當(dāng) Google 的 NotebookLM 推出一款精致的文本轉(zhuǎn)播客工具“Deep Dive”時(shí),AI 社區(qū)很快就接受了這個(gè)沒(méi)有噱頭的工具。

計(jì)算機(jī)科學(xué)家 Andrej Karpathy 表達(dá)了他對(duì)該工具的贊賞,甚至使用 NotebookLM 發(fā)布了一個(gè) 10 集的整個(gè)播客系列?!癗otebookLM 播客劇集生成可能觸及了一個(gè)極具吸引力的 LLM 產(chǎn)品格式的全新領(lǐng)域。感覺(jué)讓人想起 ChatGPT。也許我反應(yīng)過(guò)度了,“他說(shuō)。

2.新方向:摸索大模型的“情商規(guī)律”

不僅僅是 AI 領(lǐng)域的行業(yè)巨頭。今年三個(gè)月后,被稱為“情商人工智能”的 Hume AI 在由 EQT 風(fēng)險(xiǎn)投資領(lǐng)投的 B 輪融資中獲得了 5000 萬(wàn)美元的資金。9 月,他們發(fā)布了最新的 EVI 2 模型,該模型通過(guò)專門的情商訓(xùn)練適應(yīng)用戶偏好。

今年早些時(shí)候,研究人員探索了 LLM 的情商。EmoBench 是一個(gè)流行的基準(zhǔn),它評(píng)估了這種能力。結(jié)果表明,OpenAI 的 GPT 4 在“情感理解和情感應(yīng)用”方面最接近人類。然而,所評(píng)估的模型在今天已成為過(guò)去。

最近,一項(xiàng)研究使用 Python 庫(kù)測(cè)量了 LLM 的“表現(xiàn)力”。研究人員還進(jìn)行了一項(xiàng)實(shí)驗(yàn),涉及以詩(shī)歌風(fēng)格根據(jù)情緒生成詩(shī)歌,包括遺憾、喜悅和懊悔的感覺(jué)。雖然 LLM 的表現(xiàn)令人滿意,但結(jié)果表明,在表達(dá)具有相似含義的情緒時(shí)存在混淆。

“所有 GPT 模型在被提示表示不贊成時(shí)通常會(huì)表示贊同。這是一個(gè)重要的例子,兩種含義相互沖突的情緒經(jīng)常被誤解,“他們說(shuō)。

當(dāng)這些 LLM 的任務(wù)是生成 34 位不同詩(shī)人風(fēng)格的詩(shī)歌時(shí),GPT 4o 顯示出最高的表現(xiàn)力。然而,這些模型在負(fù)責(zé)識(shí)別女性詩(shī)人時(shí)表現(xiàn)出困惑,這可能在一定程度上表明了性別偏見(jiàn)。

在常規(guī)對(duì)話中,表現(xiàn)力逐漸下降。也就是說(shuō),盡管有局限性,但 Llama 3 的表現(xiàn)最好。應(yīng)該注意的是,當(dāng)提供有關(guān)主題、專業(yè)或角色的額外背景時(shí),這些 LLM 的表現(xiàn)會(huì)更好。

“對(duì)于專業(yè)信號(hào),LLM 表現(xiàn)出一致且不斷增長(zhǎng)的表達(dá)水平。相反,對(duì)于情緒信號(hào),LLM 的表達(dá)性變化更大,隨著模型根據(jù)不斷變化的情緒背景調(diào)整和改變其反應(yīng),準(zhǔn)確性會(huì)波動(dòng),“研究人員補(bǔ)充道。

3.Anthropic目前的目標(biāo):提高模型情商

Anthropic 認(rèn)為情商是提高 Claude 的重要因素。哲學(xué)家兼 Anthropic 技術(shù)人員 Amanda Askell 在接受 Lex Fridman 采訪時(shí)說(shuō):“我的主要想法一直是試圖讓 Claude 的行為方式,如果他們處于 Claude 的位置,你希望任何人都能理想地表現(xiàn)。

“所以想象一下,我?guī)б粋€(gè)人去,他們知道他們將與可能有數(shù)百萬(wàn)人交談,這樣他們所說(shuō)的話就會(huì)產(chǎn)生巨大的影響,你希望他們?cè)谶@種真正豐富的意義上表現(xiàn)良好,”Askell 說(shuō)。

對(duì)于更新的模型,Anthropic 正在努力幫助 Claude 以細(xì)致入微的情緒和表情做出回應(yīng)。這涉及塑造模型以了解何時(shí)關(guān)心、何時(shí)表現(xiàn)得幽默、何時(shí)尊重意見(jiàn)以及何時(shí)確定自主程度。

她還解決了 LLM 中的阿諛?lè)畛袉?wèn)題,即使他們是正確的,他們也傾向于糾正他們的輸出,只是為了服從人類輸入所說(shuō)的?!叭绻?Claude 真的確信這不是真的,Claude 應(yīng)該說(shuō),'我不這么認(rèn)為。也許你有更多最新的信息',“Askell 補(bǔ)充道。

Askell 還提到,她想提高 Claude 在對(duì)話中提出相關(guān)后續(xù)問(wèn)題的能力??偟膩?lái)說(shuō),Anthropic 目前的目標(biāo)是在 Claude 內(nèi)心灌輸真實(shí)的個(gè)性,而不是推遲或霸道地對(duì)待人類。雖然關(guān)于 LLM 碰壁并達(dá)到其可擴(kuò)展性極限的討論和爭(zhēng)論不斷涌現(xiàn),但調(diào)整這些模型以提高情商是一種選擇。

但是,需要注意的是。今年早些時(shí)候,OpenAI 發(fā)布了一張“系統(tǒng)卡”,警告人們可能會(huì)過(guò)度依戀情商高的 AI。

“使用 AI 模型進(jìn)行類人社交可能會(huì)產(chǎn)生影響人與人互動(dòng)的外部性。例如,用戶可能會(huì)與 AI 建立社交關(guān)系,減少他們對(duì)人際互動(dòng)的需求,可能會(huì)使孤獨(dú)的人受益,但可能會(huì)影響健康的人際關(guān)系,“OpenAI 在報(bào)告中指出。

圖片圖片

不幸的是,據(jù)之前的一個(gè)報(bào)道,一位14歲的少年由于對(duì) CharacterAI 中的某個(gè)角色產(chǎn)生了深深的情感依戀,最終導(dǎo)致其自殺身亡。

由此可見(jiàn),提高 AI 模型中的情商還有很多工作需要做,也有許多問(wèn)題需要解決。開(kāi)發(fā)面向消費(fèi)者層面上 AI 互動(dòng)技術(shù)無(wú)疑是一個(gè)明確的趨勢(shì),但在讓大模型在同理心和責(zé)任感之間取得平衡,更加至關(guān)重要。


責(zé)任編輯:武曉燕 來(lái)源: 51CTO技術(shù)棧
相關(guān)推薦

2024-11-05 19:10:17

2025-01-10 10:30:00

大模型統(tǒng)計(jì)評(píng)估

2023-11-05 15:09:35

模型AI

2024-08-28 17:36:35

AI模型開(kāi)發(fā)

2021-04-19 22:55:45

人工智能人臉識(shí)別技術(shù)

2025-04-18 15:53:03

2023-10-28 13:32:57

谷歌模型

2024-10-31 13:40:24

GitHubCopilot人工智能

2024-07-03 13:32:28

2024-07-16 13:09:09

2010-08-31 09:25:08

虛擬化微軟VMware

2021-05-20 10:17:59

編程語(yǔ)言javaPython

2024-10-31 15:00:00

AI模型

2009-12-10 16:43:03

戴爾服務(wù)

2012-05-23 11:20:48

IBM云計(jì)算云驅(qū)動(dòng)業(yè)務(wù)模型

2019-10-15 14:53:54

戴爾

2024-04-11 13:34:37

大語(yǔ)言模型

2024-07-08 13:11:40

2023-09-27 14:04:42

2023-12-13 12:55:39

模型數(shù)據(jù)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)