虛擬講堂進入演講
講 題強化學習之發展:以船行路徑最佳化為例
講 者國家高速網路與計算中心
日 期2019/09/25長 度00:12:54人 氣76 次
摘 要
本研究以強化學習與深度學習技術為基礎,建立台灣海域之船隻航行路徑最佳化規劃模式。以台灣海洋模式數據,建構台灣海域的海洋資訊網格地圖,作為強化學習模式Deep Q-Network(DQN)互動與訓練的環境。DQN以代理人代表海洋資訊網格地圖環境中的船隻,環境會因時間的推進而變動,代理人藉由觀測目前環境的狀態,選擇前進方位的行動,環境則依狀態及選擇的行動給予代理人對應的報酬,藉由如此反覆訓練,DQN將學習到一套決策模式,以確保前進到目的地的過程中每一步選擇的行動累積報酬會是最高,即船隻最佳航行路徑。
提 供TANET台灣網際網路研討會-TANET2019
進入演講