自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

豆包App更新實時語音通話功能,中文對話斷崖式領(lǐng)先,人機難辨!

新聞
1月20日,豆包APP更新實時語音通話功能,面向所有用戶開放。?該功能基于最新豆包實時語音大模型(Doubao Realtime Voice Model)。更新后,豆包中文場景的對話能力在語音真實感和“喜怒哀樂”的情緒表現(xiàn)上近乎達到“人機難辨”的AI交互效果,可以模仿不同聲線,并且在“邏輯思考”和“情緒感知”上有明顯提升。

1月20日,豆包APP更新實時語音通話功能,面向所有用戶開放。

該功能基于最新豆包實時語音大模型(Doubao Realtime Voice Model)。更新后,豆包中文場景的對話能力在語音真實感和“喜怒哀樂”的情緒表現(xiàn)上近乎達到“人機難辨”的AI交互效果,可以模仿不同聲線,并且在“邏輯思考”和“情緒感知”上有明顯提升。

記者測試發(fā)現(xiàn),產(chǎn)品表現(xiàn)上,豆包App全新實時語音通話做到了“人機難辨”的真人級交互程度,其語音表現(xiàn)和智力的擬人性方面有了質(zhì)的提升。相比大多數(shù)語音系統(tǒng)還在語氣層面進行粗線條變化,豆包全新實時語音通話功能可以根據(jù)場景自動對節(jié)奏、兒化音、音量、氣音等細節(jié)精準把控,甚至能跟你“說”悄悄話。

此外,豆包在喜怒哀樂情緒表現(xiàn)方面也頗為亮眼,還掌握了部分方言與英語對話、多角色模仿,甚至部分歌曲演唱能力。在日常使用中,它既可以是英語陪練老師、講故事高手,也可以是一位即興唱作者。

過去,傳統(tǒng)語音對話任務(wù)系統(tǒng)采用ASR+LLM+TTS的級聯(lián)模式,無法滿足真人級語音對話對理解的完整度、生成的自然度、交互的低延時等各維度的要求。而豆包全新語音能力基于創(chuàng)新的端到端框架,使用原生方法深度融合語音與文本模態(tài)進行統(tǒng)一建模。最終可實現(xiàn)從多模態(tài)輸入直接到多模態(tài)輸出的效果,賦予AI語音對話“靈魂”。

豆包相關(guān)負責人介紹,交付體驗上,豆包語音對話在確保模型具備強大理解和邏輯能力,能聯(lián)網(wǎng)回答時效性問題的同時,還具備超低延時和流暢打斷能力。

豆包全新實時語音通話功能與同類產(chǎn)品拉開明顯差距,中文對話斷崖式領(lǐng)先,同時,情商智商雙雙在線。據(jù)外部真實反饋,用戶對豆包此次上線的全新語音通話功能整體滿意度為4.36/5,對GPT-4o語音對話滿意度則為3.18/5,尤其語音語氣自然度和情緒飽滿度方面,豆包有明顯優(yōu)勢。

目前,豆包App全新實時語音通話功能已經(jīng)全量上線,用戶下載并升級豆包APP至7.2.0新春版即可體驗。

責任編輯:鳶瑋 來源: 字節(jié)跳動
相關(guān)推薦

2012-03-08 21:51:45

Siri

2017-08-17 12:14:59

谷歌智能音箱

2015-11-03 16:31:28

搜狗

2009-04-30 08:42:23

微軟手機語音搜索移動OS

2015-04-09 09:49:35

微軟SkypeSkype Trans

2017-12-22 21:06:55

語音視頻SDK聽聲辨位

2023-06-08 14:35:48

AI語音

2021-01-06 19:48:40

QQQQ PC版

2018-09-17 11:02:18

亞馬遜AWSAmazon Poll

2021-09-28 15:25:26

微信 iOS 騰訊

2014-10-31 10:56:21

即時通訊移動互聯(lián)網(wǎng)app

2010-01-06 14:52:20

Nuance
點贊
收藏

51CTO技術(shù)棧公眾號