虛擬講堂進入演講
講 題應用雜訊強健性之語音特徵於低音框率隱藏式馬可夫模型辨識
講 者國立暨南國際大學 王上瑜
日 期2015/10/23長 度00:26:02人 氣335 次
摘 要
Session Q2:多媒體通訊與訊號處理

論文作者:王上瑜、洪志偉

在本篇論文中,我們提出將各種強健性技術所 強化後的語音特徵,使用於低音框率之隱藏式馬可 夫語音辨識模型,藉此降低雜訊對於語音辨識效能 的干擾、同時兼顧在現今雲端語音辨識架構中傳輸 的效能。在強健化技術上,我們分別使用了倒頻譜 之平均值消去法、平均值與變異數正規化法與統計 圖等化法等,藉此建立較不受雜訊干擾之語音特徵, 藉著用訓練語料庫之語音特徵完整音框率之建立 隱藏式馬可夫語音模型,進而將這些語音模型之狀 態轉移參數加以調適,使原始完整音框率模型轉變 成為能夠有效地辨識低音框率的語音特徵。由實驗 結果顯示,上述所提出的新方法,可以使傳輸語音 至雲端伺服器之語音模型辨識時,傳輸效率高達2-4 倍,然因模型調適之演算法,低至1/4 傳輸量之語 音特徵,與原始傳輸量的語音特徵,辨識率不相上 下,而配合語音特徵強健技術,更可以有效降低雜 訊干擾,使整體辨識效率與效能兼顧、達到滿意的 辨識精確度。
提 供TANET台灣網際網路研討會-TANET2015
進入演講