知識大講堂

虛擬講堂

進入演講

講題

強化學習之發展:以船行路徑最佳化為例

講者

國家高速網路與計算中心

日期

2019/09/25

長度

00:12:54

人氣

76 次

摘要

本研究以強化學習與深度學習技術為基礎，建立台灣海域之船隻航行路徑最佳化規劃模式。以台灣海洋模式數據，建構台灣海域的海洋資訊網格地圖，作為強化學習模式Deep Q-Network(DQN)互動與訓練的環境。DQN以代理人代表海洋資訊網格地圖環境中的船隻，環境會因時間的推進而變動，代理人藉由觀測目前環境的狀態，選擇前進方位的行動，環境則依狀態及選擇的行動給予代理人對應的報酬，藉由如此反覆訓練，DQN將學習到一套決策模式，以確保前進到目的地的過程中每一步選擇的行動累積報酬會是最高，即船隻最佳航行路徑。

提供

TANET台灣網際網路研討會-TANET2019

進入演講