-
- 주제분류
- 공학
-
- 강의학기
- 2025년
-
- 조회수
- 644
-
■ 학습 목표: 인공지능 기계학습 분야 중 하나인 강화학습의 수학적 기초와 알고리듬에 대한 이해■ 수업 내용: 본 강의는 인공지능의 주요분야 중 하나인 강화학습(reinforcement learning) 방법론의 기본 수학적 개념과 원리를 다루고 있습니다. 강화학습의 최신이론을 설명하는 것 대신, 강화학습을 구성하는 기본적인 원리의 이해를 돕기 위해 강화학습의 수학적인 근간이 되는 '동적계획법', '마르코브 과정', '마르코브 의사결정 프로세스' 등에 대해 그 개념을 예시와 함께 설명하고, 이를 바탕으로 강화학습 방법론들에 대해 보다 쉽게, 깊은 이해를 할 수 있도록 도움을 주는 강의입니다. ■ 추천 학습 대상 체크리스트1. 인공지능에 관심이 있다.2. 강화학습의 원리를 이해하고 싶다.3. 인공지능 분야의 기초지식을 쌓고 싶다.4. 강화학습의 주요 원리인 동적계획법, 마르코프 체인, 몬테카를로 알고리듬 등을 체계적으로 이해하고 싶다.한 가지라도 해당된다면 이 강좌를 추천합니다! 강의계획표 주차 주제 강의명 1주차 강화학습의 이해 1.1 강화학습 개요 1.2 Multi-armed Bandit 문제 1.3 강화학습 맛보기 2주차 동적계획법 - 1 2.1 문제해결전략과 동적 계획법 2.2 동적 계획법의 주요개념(1) 최적화의 원리 2.3 동적 계획법의 주요개념(2) 중첩되는 부분문제와 역진귀납법 3주차 동적계획법 - 2 3.1 최단거리 문제 (Shortest Path) 3.2 방문판매원 문제(Traveling Salesman Problem, TSP) 3.3 배낭문제 (Knapsack Problem) 4주차 마르코브 과정 4.1 마르코브 프로세스 개요 4.2 마르코브 프로세스 예시 4.3 마르코브 보상 프로세스 5주차 마르코브 결정 프로세스 - 1 5.1 MDP 개요 5.2 MDP 예시 - Examples of Markov Decision Process 6주차 마르코브 결정 프로세스 - 2 6.1 MDP 가치함수 6.2 Infinite-horizon MDP 7주차 마...
연관 자료







