虛擬講堂進入演講
講 題資料探勘於用戶密碼(password)之研究
講 者李鴻璋, 張家祥, 陳應華
日 期2018/10/25長 度00:10:47人 氣115 次
摘 要
本文利用資料探勘,試圖找出用戶密碼(password)建構規則,並利用其所發現之規則,建構出破解密碼的模型。用戶密碼結構分析中,發現英文小寫文字(Lower case letter) 與數字(Number)單獨或交錯的三種原始結構(L+D+、L+、D+)約佔76%。其中在英文小寫字串後附加數字的密碼結構規則(L+D+)佔33.02%。經統計分析得出「數字字串」、「英文小寫字串」與其所在位置幾乎是沒有關係,符合Context-Free Grammar描述。而所使用之「英文小寫字串」(Lower case string) ,與dic-0294字典比對之後,在字串長度從3增長為5時,有意義的字串比例卻從98.91%降為20.35%;在連續的英文小寫字串「後」增加連續的數字字串,有意義的字串比例卻提升為99.07%至58.46%。
進而我們分析這些知識規則所建構之密碼之複雜度。分析後發現,低於240有77.04%,低於280有99.94%。我們設計一種稱為KDT破解模型:利用訓練子集合時所產生的密碼建構規則以及該規則下的元素集合(Knowledge Set)、搭配廣泛的字典(Dictionary)用於測試集(Testing Set)來進行密碼破解效果的測試。在生成漫碼(Ramble)的數量位於50~450百萬之間,KDT模型對MySpace的命中率是27-33%,對Phpbb是26-31%,對Rockyou28是20-28%。
提 供TANET台灣網際網路研討會-TANET2018
進入演講