Advantage Function
advantage function 은 q-value 값과 state-value function 값의 차이를 의미한다.
이 함수는 를 만족하는 특징이 있다.
advantage 함수는 각 action 의 상대적 중요성을 판단하기 위해 사용하는 값이다.
advantage function 은 q-value 값과 state-value function 값의 차이를 의미한다.
이 함수는 를 만족하는 특징이 있다.
advantage 함수는 각 action 의 상대적 중요성을 판단하기 위해 사용하는 값이다.