虛擬講堂進入演講
講 題從Erica到AlphaGo戰勝棋王之道
講 者林順喜教授 國立臺灣師範大學資訊工程學系
日 期2017/03/17長 度01:51:04人 氣665 次
摘 要
AlphaGo打敗人類棋王是一個令入驚嘆的時刻,它也代表了人工智慧一個歷史性的成就時刻。在此演講中,我將談一談從Erica奪奧金、到AlphaGo打敗棋王李世石的一些技術。
劫爭在圍棋裏佔據了十分重要的位置,然而早期的電腦圍棋程式大都不具備打劫的能力。在2001年我們(我和黃士傑)在台灣師大就開始研究這個困難的問題,利用賽局理論,我們得出本劫最佳的打劫策略,使得電腦圍棋程式在處理本劫時,能在局部求得獲利最大或損失最小的下法。
在2011年,我們(黃士傑、Rémi Coulom和我)針對「蒙地卡羅樹搜尋」提出一些新的啟發式演算法,成功的將「模擬平衡化」(Simulation Balancing)應用到圍棋。另提出各種不同之時間控制的方法。所有的實驗都是執行在我們的圍棋程式 ERICA,而 ERICA 正是得益於這些啟發式演算法、各種改良方案與實驗結果,成功取得了2010年在日本舉辦的電腦奧林匹亞的19路圍棋金牌。許多技術如「蒙地卡羅樹搜尋」及「棋型權重訓練」仍被用於AlphaGo。精心整合並改進了「蒙地卡羅樹搜索」、「大數據」、「深度卷積神經網路」、「監督式學習」、「強化學習」、「分散式高性能計算」等技術,這些更進一步被成功地應用在Alphago的程式中以提升其棋力。
由於這些傑出的技術研發成果,在這10年中,我們在台灣師大偶然地造出了一條道路,促進了AlphaGo的誕生,終於打敗了人類的棋王李世石。
提 供週末Let’s go 分享大師視野-106春
本講座係由科技部補助舉辦
進入演講