虛擬講堂進入演講
講 題預測維基百科網站流量趨勢
講 者國立交通大學資訊技術服務中心 尤淑芬
日 期2018/10/25長 度00:08:48人 氣97 次
摘 要
透過網頁瀏覽與查找各種資訊是現今人們日
常隨時隨地的自然行為,這些瀏覽網頁的點擊次
數,隨著時間留下龐大和複雜的資訊,而維基百
科是世界上最常瀏覽網站前十名之一,本研究運
用資料探勘與機器學習方法,針對維基媒體網頁
每天被瀏覽的記錄,由時間、語系等屬性來預測
未來的網頁流量趨勢,以提供維基媒體類型網站
軟體公司運作時,規劃服務資源的參考。首先透
過分析資料的描述統計、前處理與特徵的萃取,
找出影響未來流量的重要衍生屬性與時間特徵,
再分別以隨機森林、支持向量迴歸、線性迴歸等
演算法建立預測模型,預測未來的維基網頁流量,
最後得到實驗結果顯示支持向量迴歸的表現較佳。
提 供TANET台灣網際網路研討會-TANET2018
進入演講