調(diào)整音頻模型以實(shí)現(xiàn)更好的語(yǔ)音識(shí)別
作者:佚名
處理一個(gè)準(zhǔn)備不充足的音頻模型可能會(huì)令人感到沮喪,特別是對(duì)于語(yǔ)音識(shí)別領(lǐng)域的初學(xué)者,他們習(xí)慣使用自己的口音相關(guān)模型。不像鍵盤和鼠標(biāo)輸入那樣行動(dòng)相對(duì)比較積極且易于操作系統(tǒng)解釋,將音頻輸入到語(yǔ)音識(shí)別器就不那么積極了,嚴(yán)重依賴音頻模型的廣度和深度。編程人員可以通過(guò)提供工具來(lái)簡(jiǎn)化分析識(shí)別錯(cuò)誤過(guò)程。一個(gè)合理的目標(biāo)是,將錯(cuò)誤率從 5/10 減少到不到 1/1000:了解如何使用 Python 和 PostgreSQL 構(gòu)造的工具。
責(zé)任編輯:凌云
來(lái)源:
IBMDW