虛擬講堂進入演講
講 題語言障礙者之中文語音辨識
講 者國立臺北大學資訊工程學系 林柏榆
日 期2018/10/24長 度00:10:13人 氣94 次
摘 要
近年來,語音辨識軟體的技術越來越近步,
像是 Google 語音與 Apple Siri。但是這些語音辨識
工具對於「語言障礙者」的辨識率卻非常低,所
以我們想要開發一套屬於該類患者的語音辨識工
具。由於語言障礙者無法有效辨識中文音節聲調,
所以會以基本音節做為整合的基準並存入訓練的
資料庫中。而本研究會使用 Tensorflow 做為開發平
台,使用 Google 的 KWS 卷積神經網路做為語音辨
識的聲學模型,並且使用「捷徑連結」的方式去
改進。而在傳統聲學模型中,基於語言障礙者的
聲學模型辨識率較為低落,所以本研究利用資料
增強的方式,創建了「音節分層式聲學模型」,此
新模型可以提升音節準確度高達10%左右。此外我
們還開發了一套完整的語音障礙者的語音辨識系
統,可以讓患者方便的使用與溝通,並且還可以
進行系統上的即時調整。
提 供TANET台灣網際網路研討會-TANET2018
進入演講