課程名稱
【竹科管理局線上補助課程】深度增強式學習與其應用
課程內容 1.Markov Decision Process (MDP)
講述MDP的基本概念,增強式學習的基本架構與問題假設,簡介何謂Reward、Environment、Value、Policy等概念。
2.Value Function Approximation
講述價值函數 (Value Function) 之概念,說明價值State Value Function與State-Action Value Function之差異,以及價值函數之逼近方法。
3.Policy Learning and Actor Critic
講述增強式學習中,策略 (Policy) 如何經由迭代 (Iteration) 的方式改善,以及如何從價值函數中推導而得。理解了價值函數與策略的學習,課程將更進一步,講述如何將策略 (Actor) 與價值 (Critic) 函數一同學習的方式,稱之為Actor-Critic。
4.Exploration Technique
講述探索 (Exploration) 在深度增強式學習中的重要性,其如何影響價值函數與策略之學習等。探索技術著重於如何有效率地造訪狀態空間 (State Space),鼓勵增強式學習代理人盡力收集多樣化的訓練經驗,以助其學習。
5.Important Deep Reinforcement Learning Methodologies
講述重要且經典的深度增強式學習演算法。至今為止已有相當多深度增強式學習演算法問世,其中有數種經典的演算法常常被研究學者及業界開發者使用。本課程將對這些演算法逐一概述,並說明其優缺點與特性等。
6.Deep Reinforcement Learning in Robotics
本課程的最後將講述如何將深度增強式學習技術,應用於智慧型機器人上,與智慧型機器人之視覺模組相結合。本課程亦將講述智慧型機器人之概要,以及其上搭載之相關深度學習技術。
先修課程  
總筆數[ 1 ]   每頁 20 筆,第 頁 / 共 1
上課日期 上課時段 授課老師 報名截止日 上課地點 報名 課程費用
20240524-20240527 週一、五,09:30-16:30 李教授 20240522 網路線上 我要報名 3000
總筆數[ 1 ]   每頁 20 筆,第 頁 / 共 1