知識大講堂

虛擬講堂

進入演講

講題

從Erica到AlphaGo戰勝棋王之道

講者

林順喜教授國立臺灣師範大學資訊工程學系

日期

2017/03/17

長度

01:51:04

人氣

665 次

摘要

AlphaGo打敗人類棋王是一個令入驚嘆的時刻，它也代表了人工智慧一個歷史性的成就時刻。在此演講中，我將談一談從Erica奪奧金、到AlphaGo打敗棋王李世石的一些技術。
劫爭在圍棋裏佔據了十分重要的位置，然而早期的電腦圍棋程式大都不具備打劫的能力。在2001年我們(我和黃士傑)在台灣師大就開始研究這個困難的問題，利用賽局理論，我們得出本劫最佳的打劫策略，使得電腦圍棋程式在處理本劫時，能在局部求得獲利最大或損失最小的下法。
在2011年，我們(黃士傑、Rémi Coulom和我)針對「蒙地卡羅樹搜尋」提出一些新的啟發式演算法，成功的將「模擬平衡化」(Simulation Balancing)應用到圍棋。另提出各種不同之時間控制的方法。所有的實驗都是執行在我們的圍棋程式 ERICA，而 ERICA 正是得益於這些啟發式演算法、各種改良方案與實驗結果，成功取得了2010年在日本舉辦的電腦奧林匹亞的19路圍棋金牌。許多技術如「蒙地卡羅樹搜尋」及「棋型權重訓練」仍被用於AlphaGo。精心整合並改進了「蒙地卡羅樹搜索」、「大數據」、「深度卷積神經網路」、「監督式學習」、「強化學習」、「分散式高性能計算」等技術，這些更進一步被成功地應用在Alphago的程式中以提升其棋力。
由於這些傑出的技術研發成果，在這10年中，我們在台灣師大偶然地造出了一條道路，促進了AlphaGo的誕生，終於打敗了人類的棋王李世石。

提供

週末Let’s go 分享大師視野-106春

本講座係由科技部補助舉辦

進入演講