◾Intro

🔻references

◾Main

🔻강화학습이란?

🔻강화학습의 배경

🔸마르코프 의사결정 (MDP : Markov Decision Process)

🔻강화학습에서의 평가(evaluation)

🔸상태 가치 함수 State-Value Function (V function)

🔸상태-행동 가치 함수 Action-Value Function (Q function)