知識大講堂

虛擬講堂

進入演講

講題

資料探勘於用戶密碼(password)之研究

講者

李鴻璋, 張家祥, 陳應華

日期

2018/10/25

長度

00:10:47

人氣

115 次

摘要

本文利用資料探勘，試圖找出用戶密碼(password)建構規則，並利用其所發現之規則，建構出破解密碼的模型。用戶密碼結構分析中，發現英文小寫文字(Lower case letter) 與數字(Number)單獨或交錯的三種原始結構(L+D+、L+、D+)約佔76%。其中在英文小寫字串後附加數字的密碼結構規則(L+D+)佔33.02%。經統計分析得出「數字字串」、「英文小寫字串」與其所在位置幾乎是沒有關係，符合Context-Free Grammar描述。而所使用之「英文小寫字串」(Lower case string) ，與dic-0294字典比對之後，在字串長度從3增長為5時，有意義的字串比例卻從98.91%降為20.35%；在連續的英文小寫字串「後」增加連續的數字字串，有意義的字串比例卻提升為99.07%至58.46%。
進而我們分析這些知識規則所建構之密碼之複雜度。分析後發現，低於240有77.04%，低於280有99.94%。我們設計一種稱為KDT破解模型:利用訓練子集合時所產生的密碼建構規則以及該規則下的元素集合(Knowledge Set)、搭配廣泛的字典(Dictionary)用於測試集(Testing Set)來進行密碼破解效果的測試。在生成漫碼(Ramble)的數量位於50~450百萬之間，KDT模型對MySpace的命中率是27-33％，對Phpbb是26-31％，對Rockyou28是20-28％。

提供

TANET台灣網際網路研討會-TANET2018

進入演講