| 透過網頁瀏覽與查找各種資訊是現今人們日
常隨時隨地的自然行為,這些瀏覽網頁的點擊次
數,隨著時間留下龐大和複雜的資訊,而維基百
科是世界上最常瀏覽網站前十名之一,本研究運
用資料探勘與機器學習方法,針對維基媒體網頁
每天被瀏覽的記錄,由時間、語系等屬性來預測
未來的網頁流量趨勢,以提供維基媒體類型網站
軟體公司運作時,規劃服務資源的參考。首先透
過分析資料的描述統計、前處理與特徵的萃取,
找出影響未來流量的重要衍生屬性與時間特徵,
再分別以隨機森林、支持向量迴歸、線性迴歸等
演算法建立預測模型,預測未來的維基網頁流量,
最後得到實驗結果顯示支持向量迴歸的表現較佳。 |