Amazon Transcribe簡介
Amazon Transcribe 是一項自動語音識別 (ASR) 服務,使開發(fā)人員能夠輕松地為其應用程序添加語音轉(zhuǎn)文本功能。通過使用 Amazon Transcribe API,您可以分析 Amazon S3 中存儲的音頻文件,并讓該服務返回一個轉(zhuǎn)錄的語音文本文件。
Amazon Transcribe 可用于很多常見應用程序,包括客戶服務通話轉(zhuǎn)錄,以及在音頻和視頻內(nèi)容上生成字幕。該服務可以轉(zhuǎn)錄以常見格式(例如 WAV 和 MP3)存儲的音頻文件,并為每個詞附加時間戳,以便您可以通過搜索文本輕松找到原始源中的音頻。Amazon Transcribe 正在不斷學習和改進,以跟上語言的發(fā)展。
主要功能
便于閱讀的轉(zhuǎn)錄
大多數(shù)語音識別系統(tǒng)輸出的都是一連串沒有標點符號的文本。Amazon Transcribe 采用深度學習功能自動添加標點符號和格式,從而使輸出內(nèi)容更容易理解,無需進一步編輯即可直接使用。
自定義詞匯表
使用 Amazon Transcribe,您可以擴展和自定義語音識別詞匯表。您可以將新詞添加到基本詞匯表中,并生成特定于使用案例的高準確轉(zhuǎn)錄,例如產(chǎn)品名稱、域特定術(shù)語或個人姓名。
生成時間戳
Amazon Transcribe 會為每個詞返回時間戳,以便您可以通過搜索文本輕松找到原始錄音中的音頻。
識別多個講話者
Amazon Transcribe 能夠識別出講話者的變化,并相應地確定轉(zhuǎn)錄文本的歸屬。這樣可以顯著減少轉(zhuǎn)錄具有多個講話者的音頻(例如電話、會議和電視節(jié)目)所需的工作量。
支持廣泛的使用案例
Amazon Transcribe 旨在為各種質(zhì)量的音頻提供準確的自動轉(zhuǎn)錄。您可以為任何視頻或音頻文件生成字幕,甚至可以轉(zhuǎn)錄低質(zhì)量的電話錄音,例如客戶服務電話。
聲道合成(即將推出)
Amazon Transcribe 將每個講話人的聲音都錄制在不同的聲道中,從而更好地處理音頻。聯(lián)絡中心可以將單個音頻文件提交到 Amazon Transcribe,后者會識別并分解出兩個聲道,轉(zhuǎn)錄每個聲道的講話內(nèi)容,然后使用聲道標簽制作協(xié)調(diào)的合并腳本,從而令聯(lián)絡中心受益匪淺。
使用案例
Amazon Transcribe 可以為廣泛的使用案例提供轉(zhuǎn)錄服務,包括客戶服務、字幕、搜索與合規(guī)性。
改善客戶服務
通過將音頻輸入轉(zhuǎn)換成文本,Amazon Transcribe 可幫助您構(gòu)建能夠搜索和分析語音輸入的文本分析應用程序。客戶聯(lián)絡中心可以使用 Amazon Transcribe 轉(zhuǎn)錄語音通話,并借助其他 AWS 產(chǎn)品 (例如 Amazon Comprehend) 挖掘數(shù)據(jù)以提取對話中的含義和意圖,從而獲取見解。
字幕工作流
Amazon Transcribe 可以自動生成帶時間戳的字幕 (隨視頻內(nèi)容一起顯示),從而幫助內(nèi)容生成和媒體發(fā)行者提高到達率和訪問量。
音頻存檔分類
借助該服務,您可以將音頻和視頻資源轉(zhuǎn)錄成完全可搜索的存檔,以便進行合規(guī)性監(jiān)控和風險管理??蛻艨梢允褂?Amazon Transcribe 將音頻轉(zhuǎn)換成文本,使用 Amazon ElasticSearch Service 在音頻/視頻庫內(nèi)編寫索引并執(zhí)行基于文本的搜索。