虛擬講堂進入演講
講 題利用自然語言處理進行自動新聞分類之研究
講 者國立臺東大學資訊工程學系 吳孟瑾, 傅詞源, 李佳衛, 張耀中
日 期2019/09/27長 度00:09:18人 氣134 次
摘 要
近年來,由於人工智慧(Artificial Intelligence, AI)崛起,使得機器具有更好的判斷能力,甚至優 於人類。本論文是利用人工智慧的方法訓練機器, 使得機器能夠依據文章的內容,將文章分類為哪一 種類別的新聞。如此一來,在校稿過程中如果發現 有未標記或標記錯誤的問題,就可以快速標記正確 的新聞分類,以減少人力及時間的耗費。此外,也 可以為社群網站建立自有的新聞分類系統,將來自 不同媒體的新聞資料,依據自有的分類方式進行分 類,提供社群成員新聞資料。本論文分別利用爬蟲 (web crawler)技術、資料前處理、結巴中文斷詞法 來訓練電腦。經過多次的訓練及大量的訓練資料, 實驗結果顯示新聞分類的準確率為 97.42%。
提 供TANET台灣網際網路研討會-TANET2019
進入演講