自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

Siri越來越“大眾”,未來智能語音會有哪些突破?

原創(chuàng)
人工智能 語音識別
語音交流對于社會生活的重要性不言而喻。

對于人機(jī)交互來說,如何讓機(jī)器具備良好的聽覺,一直是近些年來 AI 領(lǐng)域不懈追求的目標(biāo)。2009 年前后,深度學(xué)習(xí)模型用于開始走出學(xué)術(shù)界,而以語音喚醒、識別、增強(qiáng)和合成為代表的智能語音技術(shù),也逐漸走向成熟。

一個早期典型的例子是,2011 年 siri 的誕生。智能語音成了人與機(jī)器之間的溝通交互方式的新躍遷。而后經(jīng)過十余年的發(fā)展,"嘿,siri"式的人機(jī)問答已經(jīng)不再局限于移動終端設(shè)備,走進(jìn)千家萬戶,廣泛應(yīng)用于各個場景:家居陪伴智能音箱,方便網(wǎng)購的天貓精靈,會議上的同聲翻譯,出行時的車載語音導(dǎo)航助手等等。

隨著越來越多的互聯(lián)網(wǎng)企業(yè)及上游廠商在智能語音賽道的積極布局,智能語音客服、對話式 AI 應(yīng)用、AI 虛擬助手等產(chǎn)品的取得了進(jìn)一步質(zhì)量提升,響應(yīng)語音更自然,理解問題更準(zhǔn)確,并且有了自己的"小情緒"。

身處數(shù)字化浪潮的時代,萬物互聯(lián)的趨勢不可阻擋。而智能語音作為當(dāng)下人機(jī)交互的關(guān)鍵接口,正處于與實(shí)體經(jīng)濟(jì)深度融合碰撞的時期。隨著應(yīng)用場景的進(jìn)一步下沉和拓展,我們也看到不少挑戰(zhàn)性的問題,比如:如何識別說話人身份、如何識別方言、如何消除歧義等等都是最新的研究熱點(diǎn)。

一項(xiàng)技術(shù)走向成熟的背后,往往蘊(yùn)含著一些潛質(zhì),這其中包括它在實(shí)際應(yīng)用中的創(chuàng)新能力,以及它更有潛力的演進(jìn)方向。展望下一個階段,智能語音技術(shù)也必會出現(xiàn)新的演進(jìn)趨勢,例如:深度集成的AI語音芯片能否取代云端運(yùn)行模型的模式?多模態(tài)融合、無監(jiān)督學(xué)習(xí)、腦學(xué)科交叉融合的創(chuàng)新研究能否取得突破性成果?我們拭目以待。

那么,智能語音技術(shù)在各大企業(yè)中實(shí)踐探索中都遇到了哪些真實(shí)的生產(chǎn)問題?又是如何解決的?取得了哪些進(jìn)展?行業(yè)出現(xiàn)了哪些新變化?下一步的發(fā)展趨勢又會有哪些?"AISummit全球人工智能技術(shù)大會"智能語音技術(shù)專場帶給你深度思考!

8月7日,51CTO傾力打造的“AISummit全球人工智能技術(shù)大會”智能語音專場重磅來襲!

專場有哪些你感興趣的專題內(nèi)容?

專題一:作業(yè)幫語音技術(shù)實(shí)踐

1.語音識別技術(shù)探索:分享端到端、高效利用數(shù)據(jù)等大規(guī)模實(shí)際應(yīng)用場景下的語音識別技術(shù),并提出了基于前綴自動機(jī)的熱詞技術(shù)方案。

2.語音評測技術(shù)實(shí)踐:語音發(fā)音糾錯技術(shù)方面結(jié)合作業(yè)幫的高并發(fā)場景,提出了多任務(wù)知識遷移、多模態(tài)特征融融合方案,很大程度上提升提升模型的因素區(qū)分能力和噪聲環(huán)境下的檢錯能力。并針對語音評測落地難的痛點(diǎn),提出了高性能的云端一體化測評技術(shù)。

3.語音合成技術(shù)框架:分享作業(yè)幫基于現(xiàn)有的小數(shù)據(jù)量語音技術(shù)框架進(jìn)一步改進(jìn)的思考與實(shí)踐。

專題二:字節(jié)語音識別技術(shù)在飛書中的應(yīng)用

1.語音識別技術(shù)在辦公場景中的應(yīng)用進(jìn)程:辦公郵件、即時通訊中的語音輸入辦公語音助手、實(shí)時字幕&會后轉(zhuǎn)寫。

2.解決思考:會議智能化、效率提升。

3.挑戰(zhàn)與機(jī)遇:語音識別任務(wù)的挑戰(zhàn)、下游任務(wù)帶來的挑戰(zhàn)、會議提供額外的信息。

4.重點(diǎn)算法工作介紹(端到端語音識別系統(tǒng)):Transducer & CIF、動態(tài)+靜態(tài)熱詞、Context-aware。

專題三:構(gòu)建高水平的語音合成系統(tǒng)實(shí)踐

1.高水平語音合成系統(tǒng)背景介紹及問題分析。

2.高水平語音合成系統(tǒng)設(shè)計思考與實(shí)現(xiàn)。

3.實(shí)驗(yàn)評估。

4.未來工作展望。

專題四:SOUL社交場景下的智能語音技術(shù)實(shí)踐之路

1.SOUL社交元宇宙場景下的端到端語音識別

2.多模態(tài)語音合成技術(shù)的構(gòu)建路線

3.在語音安全和語音交互等業(yè)務(wù)場景下的應(yīng)用

專題五:端到端語音識別技術(shù)在58同城的探索實(shí)踐

1.語音識別在58同城的應(yīng)用場景:AI智能語音應(yīng)用、語音識別鏈路介紹、挑戰(zhàn)與技術(shù)路線

2.基于WeNet的模型優(yōu)化工作:半監(jiān)督訓(xùn)練、Efficient Conformer、模型壓縮

3.端到端語音識別的部署方案:自研引擎架構(gòu)、Wenet解碼服務(wù)部署、流式/非流式解碼性能測試

都有哪些重量級嘉賓?

一、宋旸,作業(yè)幫首席算法專家、智能中臺負(fù)責(zé)人、專場出品人

宋旸在百度工作7年,從事算法研發(fā)工作。2015年加入作業(yè)幫,為智能中臺部負(fù)責(zé)人,為公司各業(yè)務(wù)輸出包括數(shù)據(jù)挖掘、NLP、語音在內(nèi)的中臺技術(shù)能力,先后負(fù)責(zé)搜索答疑、個性化推薦、智能質(zhì)檢、語音評測、服務(wù)智能化調(diào)度等方向。

二、王強(qiáng)強(qiáng),作業(yè)幫語音技術(shù)團(tuán)隊負(fù)責(zé)人

在加入作業(yè)幫之前,王強(qiáng)強(qiáng)曾任職于清華大學(xué)電子工程系語音處理與機(jī)器智能實(shí)驗(yàn)室,負(fù)責(zé)語音識別算法落地,搭建工業(yè)級解決方案。2018 年加入作業(yè)幫,負(fù)責(zé)語音相關(guān)算法研究和落地,主導(dǎo)了語音識別、評測、合成等算法在作業(yè)幫的落地實(shí)踐, 為公司提供整套語音技術(shù)解決方案。

三、張駿,字節(jié)跳動AI Lab語音識別算法研究員

張駿長期從事語音識別、語音喚醒等語音算法研究與應(yīng)用,經(jīng)驗(yàn)豐富。2018 年加入字節(jié)跳動AI Lab智能語音團(tuán)隊,目前主要負(fù)責(zé)智能辦公、智能硬件、智能客服等方向的語音技術(shù)方案建設(shè)。

四、譚旭,微軟亞洲研究院主管研究員

譚旭,研究領(lǐng)域包括深度學(xué)習(xí)、自然語言/語音/音樂、AI內(nèi)容生成等。研發(fā)的機(jī)器翻譯和語音合成系統(tǒng)獲得多項(xiàng)比賽冠軍并在學(xué)術(shù)評測集上達(dá)到人類水平,研究工作如預(yù)訓(xùn)練語言模型MASS、語音合成模型FastSpeech/NaturalSpeech、AI音樂項(xiàng)目Muzic受到業(yè)界廣泛關(guān)注。

五、劉忠亮,SOUL語音算法負(fù)責(zé)人

劉忠亮碩士畢業(yè)于中科院研究生院,目前在SOUL擔(dān)任語音算法負(fù)責(zé)人,曾任職于搜狗AI交互部和陌陌大數(shù)據(jù)部。近10年主要從事語音喚醒、語音識別、語音合成、音頻音樂理解等語音技術(shù)體系的研發(fā)工作,主要應(yīng)用于輸入法、手機(jī)助手、智能硬件、語音安全等語音交互和語音理解業(yè)務(wù)場景,致力于打造最好的可落地的語音技術(shù)。

六、周維,58同城 AI Lab語音算法部負(fù)責(zé)人、算法架構(gòu)師

周維,58同城AI Lab語音算法部負(fù)責(zé)人、算法架構(gòu)師,負(fù)責(zé)語音識別、語音合成算法研發(fā)。2016年碩士畢業(yè)于中國科學(xué)院大學(xué),畢業(yè)后參與對話式AI產(chǎn)品方向創(chuàng)業(yè),2018年5月加入58同城,曾先后參與智能客服、智能外呼、智能寫稿等AI項(xiàng)目的NLP算法研發(fā),2019年開始主攻語音算法方向,帶領(lǐng)團(tuán)隊從0到1自主研發(fā)58同城語音處理引擎中的語音算法。

還有哪些精彩活動?

除了精彩的AI技術(shù)大咖的精彩的實(shí)踐創(chuàng)新干貨分享外,AISummit全球人工智能技術(shù)大會還為與會的朋友們準(zhǔn)備了豐富的場前、場中互動福利。加入這場盛會,在拓展技術(shù)能力和人脈資源的同時,順便驚喜禮品帶回家!

活動包括"當(dāng)人不讓"、"工享幸運(yùn)"、"智同道合"等四大妙趣橫生的互動游戲,總有一款精美禮品驚艷到你!那么,傳說中神秘的終極大獎會是什么呢?等待熱愛技術(shù)的你來現(xiàn)場揭秘?。≒S:聽說越早預(yù)約報名,中大獎幾率越高哦?。?/span>

 

怎么快速預(yù)約報名?

點(diǎn)擊進(jìn)入??AISummit 全球人工智能技術(shù)大會?? 官方網(wǎng)站,按提示完整填寫、提交信息即可完成報名。

掃碼加入大會官方群,參與抽獎,贏取SONY音響、冰墩墩、AI技術(shù)書籍等精美禮品,還有紅包雨掉落。

責(zé)任編輯:薛彥澤 來源: 51CTO
相關(guān)推薦

2021-04-15 13:48:08

視頻監(jiān)控視頻分析智能安防

2011-12-01 09:33:17

Google微軟

2021-01-18 08:23:09

大數(shù)據(jù)AI人工智能

2022-12-13 11:13:34

數(shù)據(jù)傳感器

2024-02-21 14:28:09

智能家居物聯(lián)網(wǎng)安全

2022-07-14 15:21:06

AI技術(shù)

2017-12-26 15:34:55

2017-12-04 08:48:50

數(shù)據(jù)存儲基礎(chǔ)

2021-08-03 11:09:41

智能手機(jī)功能技術(shù)

2017-10-27 12:28:14

云端遷移云計算

2022-05-27 11:44:53

JS代碼

2022-05-17 09:17:45

JS 代碼越來越難讀

2024-02-21 09:44:33

Rust前端

2021-08-24 00:18:17

人工智能語言編碼

2021-04-02 13:00:51

大數(shù)據(jù)數(shù)據(jù)采集

2023-02-21 09:29:57

ChatGPT人工智能

2020-09-02 09:25:23

遷移公共云數(shù)據(jù)

2018-04-27 14:52:21

2018-08-23 07:24:40

MEC多接入邊緣計算網(wǎng)絡(luò)邊緣

2010-07-08 09:03:20

openSUSE 11Fedora
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號