Markov Chain
Markov chain 은 일련의 이벤트를 통해 state 간의 전이 확률을 나타낸 확률적 모델 (stochastic model) 이다.

Markov Chain 은 transition Matrix 을 이용해 표현된다.
Markov chain 을 이해하는 것이 MDP 의 근간을 이해하는 것이다.
2. States 에 따른 분류
2.1. Communicate
state 에서 로 도달할 수 있다면, reachable 하다고 표현한다. 만약, 에서 로도 도달할 수 있다면 이는 communicate 하다고 표현한다.
2.2. Irreducible
만약, 마르코프 체인의 모든 state 가 서로 communicate 하는 경우, 그 체인은 irreducible 하다고 할 수 있다.
2.3. Absorbing
반대로, 어떤 state 에서 움직일 수 없는 경우 () 이를 absorbing(terminal) state 라고 표현한다.
2.4. Recurrent State
state 에서 로 단방향 접근만 가능할 경우 transient state 라고 표현한다. 그리고 어떤 state 가 transient 이 아닐경우 recurrent state 라고 불린다.
2.5. Periodic and Aperiodic State
어떤 state 에서 출발하여 steps 이후 다시 로 돌아올 수 있는 경우, state 가 periodic 하다고 표현한다. recurrent state 는 aperiodic 한데, 이는 인 경우를 의미한다.

2.6. Ergodicity
Markov chain 의 모든 state 가 다음 조건을 만족한다면 체인 자체가 ergodic 하다고 불린다.
- 서로 communicate 하다 (irreducible)
- recurrent 하다.
- aperiodic 하다.
ergodic markov chain 은 충분히 긴 시간이 지날 경우, 시스템 내 어떤 state 에 위치할 확률을 계산할 수 있다. 이를 steady state 확률 분포라 부른다.
3. Transition Probability
state (row) 에서 state (column) 갈 확률을 나타내는 matrix
만약 steps 이후 state 에 위치할 확률은 다음과 같이 계산된다.
여기서 는 초기 확률 분포를 의미하며, 은 전이 확률 행렬에 승을 곱한것이다. 그리고 는 state 에서 시작하여 steps 이후 state 에 위치할 확률을 의미하게 된다.
4. Semi-Markov Process
steps 대신 시간 이후의 transition 확률을 계산할 수 있는 시스템으로, 이 시스템은 discrete time step 대신 continuous 한 time step 을 고려한다.
예시) queuing system (고객 센터에서 손님이 언제든 껴들을 수 있음)