第一個能聽懂人類語氣的AI火了,網(wǎng)友:感覺在和真人交談
第一個能聽懂你說話的語氣、有“情商”的AI火了!
這個AI名為EVI(Empathic Voice Interface),它不僅能夠能夠理解用戶的語氣,還會為每個詞增加意義。
對話中的每句話,它都能可視化含驚訝量、含悲傷量、含興奮量……
然后根據(jù)用戶的聲音信號來變換自己的語音語調,給出高情商回答。
EVI發(fā)布后,網(wǎng)友再次沸騰,稱其為“語音交互的游戲規(guī)則改變者”。
知名科技博主,曾是微軟最著名博客人的Robert Scoble也下場體驗了,讓EVI講起了笑話:
網(wǎng)友看了EVI的一系列效果后也坐不住了:
除了ChatGPT,第二個讓我深感震驚的demo就是這。
還有網(wǎng)友表示自己用ChatGPT語音對話時,就預想到了這樣的功能體驗,現(xiàn)在想法變成了現(xiàn)實。
確實,ChatGPT、訊飛星火等語音對話都是直接將對話內容轉換成文字,語氣停頓都不能保留。
知心大姐/哥EVI來了
目前,官方放出了demo,大伙兒可以試玩。
不過由于太火,有時也會出現(xiàn)被擠爆情況。
已經(jīng)玩上的網(wǎng)友開始詢問它各種問題。
比如討論冬天天氣嚴寒,是否要給樓房建造項目增加隔熱材料。
有網(wǎng)友用不同語調來測試它,EVI都能識別并變換多種情緒回應。
還有網(wǎng)友開始整花活,讓兩個EVI對話,不斷讓它們互相打斷對話,然后兩個EVI都開始“請,繼續(xù)”、“我洗耳恭聽”。
再來看官方的介紹,總的來說,EVI是一個基于自研的具有同理心的大模型“eLLM”驅動的API,4月份將正式發(fā)布。
有這么幾個特點:
- 根據(jù)你的情緒以類似人類的語調作出回應。
- 針對你的需求,使用能夠提高滿意度的語言反應。
- 知道何時講話,利用你的語調精準判斷對話輪次結束。
- 若被打斷會停止發(fā)言,并能從中斷點恢復對話。
- 通過分析你的反饋逐漸自我優(yōu)化,增強你的幸福感。
通過申請,開發(fā)者可以提前獲得開發(fā)訪問權限,將EVI集成到各種應用中。此外,EVI還可以融合外部大模型API的回應,而demo融入了Claude 3 Haiku。
不少開發(fā)者已經(jīng)在評論區(qū)開要權限:
背后公司Hume AI
打造出EVI的,是一家名為Hume AI的實驗室/科技公司。目前團隊共有30人,已在頂刊發(fā)表了超8篇學術文章。
CEO兼首席科學家Alan Cowen是前谷歌研究員。
他的主要研究是利用計算方法來探討情感行為如何被激發(fā)、概念化、參數(shù)化、預測、注釋和轉化。
據(jù)了解,他提出的語義空間理論(semantic space theory),是Hume AI用來捕捉和理解人類表達和溝通中復雜微妙細節(jié)的數(shù)據(jù)驅動方法的基礎。
此外,Hume AI還有加州大學伯克利分校心理學教授Dacher Keltner助陣,COO是前Ageis Ventures合伙人Janet Ho。
就在幾天前,Hume AI完成了5000萬美元的新一輪融資。
之前,Hume AI還推出了Expression Measurement API,一個用于測量人類情感表達的高級工具包,以及Custom Models,它使用這些測量的遷移學習來預測人類的偏好。
那么對于新發(fā)布的EVI,你覺得它的效果如何?
參考鏈接:
[1]https://x.com/hume_ai/status/1773017055974789176?s=20。
[2]https://x.com/hume_ai/status/1773418096499257528?s=20。
[3]https://x.com/AviSchiffmann/status/1773070097210335336?s=20。
[4]https://x.com/catherineols/status/1773222122430550336?s=20。
[5]https://x.com/mohakmangal/status/1773187272881357192?s=20。