| 講 題 | 利用自然語言處理進行自動新聞分類之研究 | | 講 者 | 國立臺東大學資訊工程學系 吳孟瑾, 傅詞源, 李佳衛, 張耀中 | | 日 期 | 2019/09/27 | 長 度 | 00:09:18 | 人 氣 | 134 次 | | | 近年來,由於人工智慧(Artificial Intelligence, AI)崛起,使得機器具有更好的判斷能力,甚至優 於人類。本論文是利用人工智慧的方法訓練機器, 使得機器能夠依據文章的內容,將文章分類為哪一 種類別的新聞。如此一來,在校稿過程中如果發現 有未標記或標記錯誤的問題,就可以快速標記正確 的新聞分類,以減少人力及時間的耗費。此外,也 可以為社群網站建立自有的新聞分類系統,將來自 不同媒體的新聞資料,依據自有的分類方式進行分 類,提供社群成員新聞資料。本論文分別利用爬蟲 (web crawler)技術、資料前處理、結巴中文斷詞法 來訓練電腦。經過多次的訓練及大量的訓練資料, 實驗結果顯示新聞分類的準確率為 97.42%。
| | 提 供 | TANET台灣網際網路研討會-TANET2019 | | |
|