課程名稱 | 【竹科管理局線上補助課程】深度增強式學習與其應用 |
課程內容 | 1.Markov Decision Process (MDP) 講述MDP的基本概念,增強式學習的基本架構與問題假設,簡介何謂Reward、Environment、Value、Policy等概念。 2.Value Function Approximation 講述價值函數 (Value Function) 之概念,說明價值State Value Function與State-Action Value Function之差異,以及價值函數之逼近方法。 3.Policy Learning and Actor Critic 講述增強式學習中,策略 (Policy) 如何經由迭代 (Iteration) 的方式改善,以及如何從價值函數中推導而得。理解了價值函數與策略的學習,課程將更進一步,講述如何將策略 (Actor) 與價值 (Critic) 函數一同學習的方式,稱之為Actor-Critic。 4.Exploration Technique 講述探索 (Exploration) 在深度增強式學習中的重要性,其如何影響價值函數與策略之學習等。探索技術著重於如何有效率地造訪狀態空間 (State Space),鼓勵增強式學習代理人盡力收集多樣化的訓練經驗,以助其學習。 5.Important Deep Reinforcement Learning Methodologies 講述重要且經典的深度增強式學習演算法。至今為止已有相當多深度增強式學習演算法問世,其中有數種經典的演算法常常被研究學者及業界開發者使用。本課程將對這些演算法逐一概述,並說明其優缺點與特性等。 6.Deep Reinforcement Learning in Robotics 本課程的最後將講述如何將深度增強式學習技術,應用於智慧型機器人上,與智慧型機器人之視覺模組相結合。本課程亦將講述智慧型機器人之概要,以及其上搭載之相關深度學習技術。 |
先修課程 |
上課日期 | 上課時段 | 授課老師 | 報名截止日 | 上課地點 | 報名 | 課程費用 |
---|---|---|---|---|---|---|
20240524-20240527 | 週一、五,09:30-16:30 | 李教授 | 20240522 | 網路線上 | 報名已截止 | 3000 |