| 講 題 | 強化學習之發展:以船行路徑最佳化為例 | | 講 者 | 國家高速網路與計算中心 | | 日 期 | 2019/09/25 | 長 度 | 00:12:54 | 人 氣 | 76 次 | | | 本研究以強化學習與深度學習技術為基礎,建立台灣海域之船隻航行路徑最佳化規劃模式。以台灣海洋模式數據,建構台灣海域的海洋資訊網格地圖,作為強化學習模式Deep Q-Network(DQN)互動與訓練的環境。DQN以代理人代表海洋資訊網格地圖環境中的船隻,環境會因時間的推進而變動,代理人藉由觀測目前環境的狀態,選擇前進方位的行動,環境則依狀態及選擇的行動給予代理人對應的報酬,藉由如此反覆訓練,DQN將學習到一套決策模式,以確保前進到目的地的過程中每一步選擇的行動累積報酬會是最高,即船隻最佳航行路徑。 | | 提 供 | TANET台灣網際網路研討會-TANET2019 | | |
|