知識大講堂

虛擬講堂

進入演講

講題

語言障礙者之中文語音辨識

講者

國立臺北大學資訊工程學系林柏榆

日期

2018/10/24

長度

00:10:13

人氣

126 次

摘要

近年來，語音辨識軟體的技術越來越近步，
像是 Google 語音與 Apple Siri。但是這些語音辨識
工具對於「語言障礙者」的辨識率卻非常低，所
以我們想要開發一套屬於該類患者的語音辨識工
具。由於語言障礙者無法有效辨識中文音節聲調，
所以會以基本音節做為整合的基準並存入訓練的
資料庫中。而本研究會使用 Tensorflow 做為開發平
台，使用 Google 的 KWS 卷積神經網路做為語音辨
識的聲學模型，並且使用「捷徑連結」的方式去
改進。而在傳統聲學模型中，基於語言障礙者的
聲學模型辨識率較為低落，所以本研究利用資料
增強的方式，創建了「音節分層式聲學模型」，此
新模型可以提升音節準確度高達10%左右。此外我
們還開發了一套完整的語音障礙者的語音辨識系
統，可以讓患者方便的使用與溝通，並且還可以
進行系統上的即時調整。

提供

TANET台灣網際網路研討會-TANET2018

進入演講