自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

概述語音識別技術的發(fā)展及其應用

譯文
人工智能 語音識別
在我們的生活中交流起著重要的作用。人類從符號開始,然后發(fā)展到用語言交流,再后來出現(xiàn)了計算和通信技術。在某些情況下,機器不僅與人類交流,也與機器之間交流。計算機和通信技術創(chuàng)造了互聯(lián)網(wǎng)世界,正如我們所知的物聯(lián)網(wǎng)(IoT)。

[[280529]]

【51CTO.com快譯】在我們的生活中交流起著重要的作用。人類從符號開始,然后發(fā)展到用語言交流,再后來出現(xiàn)了計算和通信技術。在某些情況下,機器不僅與人類交流,也與機器之間交流。計算機和通信技術創(chuàng)造了互聯(lián)網(wǎng)世界,正如我們所知的物聯(lián)網(wǎng)(IoT)。下面是涉及機器學習的語音識別技術的發(fā)展。

語音識別技術和機器學習的發(fā)展

互聯(lián)網(wǎng)催生了使用數(shù)據(jù)的新方式,這就是機器學習。我們可以通過訓練機器直接或間接地與它們交流。在此之前,我們必須訪問計算機來與機器通信。

人們開始研究消除單純依賴計算機的技術,這種技術稱為自動語音識別。基于自然語言處理(NLP),我們可以在很大程度上直接與機器交互。

語音識別領域的初步研究已經(jīng)取得了成功。從那時起,語音科學家和工程師就致力于優(yōu)化語音識別引擎。根據(jù)實際情況優(yōu)化機器的交互,從而降低錯誤率,提高效率。

一些機構(gòu)已經(jīng)開始開發(fā)微調(diào)語音識別技術。十多年來,位于弗吉尼亞州的GoVivace公司一直致力于語音識別技術和解決方案的設計和開發(fā)。

自動語音識別及其應用

自動語音識別(ASR)技術是計算機科學和語言學兩個不同分支的結(jié)合。計算機科學用于設計算法和編寫程序;語言學用于創(chuàng)建單詞,句子和短語的字典。

生成語音音標

開發(fā)的第一個階段是從語音轉(zhuǎn)錄開始的,在這里音頻被轉(zhuǎn)換成文本——語音到文本的轉(zhuǎn)換。之后,系統(tǒng)過濾去除不需要的信號或噪聲。當我們說一個單詞或句子時,我們有不同的語速,因此語音識別模型還需要考慮這些語速的變化。

隨后,信號被進一步劃分以識別音素。音素是具有相同氣流水平的字母,如“b”和“p”。程序會通過與存儲在語言學詞典中的單詞和句子進行比較,來試圖匹配準確的單詞。

語音識別系統(tǒng)目前有兩種類型。

一種類型的系統(tǒng)是通過學習模式來完成的,另一種是作為人的依賴系統(tǒng)來完成的。隨著人工智能(AI)和大數(shù)據(jù)的發(fā)展,語音識別技術達到了一個新的水平。一種被稱為長短時記憶的特殊神經(jīng)結(jié)構(gòu)在這一領域取得了顯著的進步。在全球范圍內(nèi),很多機構(gòu)正在利用不同層次的語言能力來完成各種各樣的任務。

語音文本軟件可以將音頻文件轉(zhuǎn)換到文本文件。

許多國家沒有語言嵌入式鍵盤,大多數(shù)人都不知道如何使用特定的語言鍵盤,盡管他們在語言方面很擅長。在這種情況下,語音轉(zhuǎn)錄幫助它們將語音轉(zhuǎn)換成任何語言的文本。

實時字幕系統(tǒng)。

這是一個實時的應用系統(tǒng)。實時翻譯技術被稱為計算機輔助實時翻譯。它基本上是一個實時操作的語音到文本系統(tǒng)。世界各地舉辦各種會議都會應用。

為了最大限度地吸引全球觀眾的參與,他們采用了直播字幕系統(tǒng)。實時字幕系統(tǒng)將語音轉(zhuǎn)換為文本并顯示在屏幕上。它可以將一種語言的演講翻譯成其他語言的文本,還可以幫助記錄會議或演講。這些系統(tǒng)將語音轉(zhuǎn)換成文本,使聽力受限的人也能閱讀和理解。

語音生物識別系統(tǒng)

除了語音到文本,該技術還將其分支擴展到生物識別系統(tǒng),從而為用戶身份驗證創(chuàng)建了語音生物識別技術。語音生物識別系統(tǒng)分析說話人的聲音,這取決于音調(diào)、發(fā)音和其他因素。

在這些系統(tǒng)中,首先分析語音樣本并存儲為模板。當用戶說出短語或句子時,語音生物識別系統(tǒng)會將其與存儲的模板進行比較,并提供身份驗證。然而,這些系統(tǒng)面臨著許多挑戰(zhàn)。我們的聲音總是受到身體因素或情緒狀態(tài)的影響。

生物語音系統(tǒng)的最新發(fā)展是通過將短語與樣本進行匹配來實現(xiàn)的。然后,結(jié)合心理和行為語音信號分析語音模式。此外,語音生物識別技術的發(fā)展將有助于那些數(shù)據(jù)安全備受關注的企業(yè)。

使用語音進行分析

分析在語音識別技術的發(fā)展中起著至關重要的作用。大數(shù)據(jù)分析創(chuàng)造了存儲語音數(shù)據(jù)的需求。呼叫中心開始使用電話錄音來培訓他們的員工。因為客戶滿意度現(xiàn)在是全球機構(gòu)的首要關注點?,F(xiàn)在,機構(gòu)希望跟蹤和分析主管和客戶之間的對話。

使用呼叫分析應用程序,相關機構(gòu)可以監(jiān)視和測量呼叫的質(zhì)量。這種呼叫分析解決方案提高了呼叫中心提供的服務質(zhì)量。通過分析可以分類他們的客戶,可以更好地為客戶提供更快和更好的反饋。

語音識別技術還有很長的路要走

語音識別技術的研究任重而道遠。到目前為止,程序只能執(zhí)行指令。人類的交流感覺并不完全存在于機器中。研究人員正試圖向機器灌輸人類的反應能力。它們在語音識別技術創(chuàng)新方面還有很長的路要走。

研究的主要特點集中在如何使語音識別技術更加準確。對于人類的語言理解,我們需要更多的準確性。例如,一個人提出了一個問題,“我如何改變相機的燈光設置?”這個問題在技術上意味著個人想要調(diào)整相機的閃光燈。因此,在回答具體問題之前,要先集中精力理解人類的自由語言。

因此,總的來說,機器學習和語音識別技術已經(jīng)進入全球范圍,并開始提供有效的運用和高效的服務。很快,我們將會看到自動速記員得到普遍提升,并在各大會議演講中扮演重要的角色。

原文標題:Evolution of Speech Recognition Technology,作者:Sahil Chauhan

【51CTO譯稿,合作站點轉(zhuǎn)載請注明原文譯者和出處為51CTO.com】

 

責任編輯:龐桂玉 來源: 51CTO
相關推薦

2021-11-17 10:37:39

語音識別技術人工智能

2022-08-29 10:57:09

語音識蘋果頻率

2011-05-23 16:04:48

接入ADSLCable Modem

2022-09-08 12:29:37

掌靜脈識別應用生物識別

2017-03-19 16:09:00

語音識別

2017-10-27 16:19:23

語音識別CNN

2022-12-01 07:03:22

語音識別人工智能技術

2021-04-14 14:49:47

語音識別技術人工智能

2024-03-11 11:32:38

語音識別

2011-08-03 11:10:03

布線管理軟件綜合布線

2009-08-21 15:28:23

C#英文

2013-11-22 09:43:21

SDN技術影響

2022-07-06 13:21:52

語音識別

2023-02-28 12:12:21

語音識別技術解碼器

2023-09-14 15:41:22

2024-03-12 09:08:36

可穿戴技術人工智能

2023-09-01 15:37:56

2022-03-30 09:00:00

物聯(lián)網(wǎng)行為互聯(lián)網(wǎng)設備

2017-09-27 09:29:58

SDN技術應用

2018-09-30 00:00:00

點贊
收藏

51CTO技術棧公眾號