科技人才學習網

課程總覽

Home
課程總覽

課程名稱	【竹科管理局線上補助課程】深度增強式學習與其應用
課程內容	1.Markov Decision Process (MDP) 講述MDP的基本概念，增強式學習的基本架構與問題假設，簡介何謂Reward、Environment、Value、Policy等概念。 2.Value Function Approximation 講述價值函數 (Value Function) 之概念，說明價值State Value Function與State-Action Value Function之差異，以及價值函數之逼近方法。 3.Policy Learning and Actor Critic 講述增強式學習中，策略 (Policy) 如何經由迭代 (Iteration) 的方式改善，以及如何從價值函數中推導而得。理解了價值函數與策略的學習，課程將更進一步，講述如何將策略 (Actor) 與價值 (Critic) 函數一同學習的方式，稱之為Actor-Critic。 4.Exploration Technique 講述探索 (Exploration) 在深度增強式學習中的重要性，其如何影響價值函數與策略之學習等。探索技術著重於如何有效率地造訪狀態空間 (State Space)，鼓勵增強式學習代理人盡力收集多樣化的訓練經驗，以助其學習。 5.Important Deep Reinforcement Learning Methodologies 講述重要且經典的深度增強式學習演算法。至今為止已有相當多深度增強式學習演算法問世，其中有數種經典的演算法常常被研究學者及業界開發者使用。本課程將對這些演算法逐一概述，並說明其優缺點與特性等。 6.Deep Reinforcement Learning in Robotics 本課程的最後將講述如何將深度增強式學習技術，應用於智慧型機器人上，與智慧型機器人之視覺模組相結合。本課程亦將講述智慧型機器人之概要，以及其上搭載之相關深度學習技術。
先修課程

總筆數[ 1 ] 每頁 20 筆，第頁 / 共 1 頁

上課日期	上課時段	授課老師	報名截止日	上課地點	報名	課程費用
20240524-20240527	週一、五，09:30-16:30	李教授	20240522	網路線上	我要報名	3000

總筆數[ 1 ] 每頁 20 筆，第頁 / 共 1 頁