Zzong's Notes

Home

❯

RL

45개의 글

action-value function
- reinforcement_learning
Actor–Critic Method
- reinforcement_learning
advantage function
- reinforcement_learning
asynchronous dynamic programming
- reinforcement_learning DP
Bellman Equation
- reinforcement_learning
- linear_algebra
Bellman optimality equation
- reinforcement_learning
Deep Q-Network
- reinforcement_learning
- deep_learning
Deep Reinforcement Learning with Double Q-Learning
- reinforcement_learning Google y2016 AAAI
discount factor
- reinforcement_learning
DP (Reinforcement Learning)
- reinforcement_learning
dynamics
- reinforcement_learning
epsilon-greedy algorithm
every-visit MC
- reinforcement_learning
EXP3
- reinforcement_learning
- MAB
expected return
- reinforcement_learning
Expected SARSA
- reinforcement_learning
exploration
- reinforcement_learning
Exploration and Exploitation trade-off
- MAB
- reinforcement_learning
Exploring Starts
- reinforcement_learning
first-visit MC
- reinforcement_learning
Gittins index
Human-level control through deep reinforcement learning
- reinforcement_learning
- deep_learning
Incremental Implementation
- reinforcement_learning
- algorithm
Markov Chain
- reinforcement_learning
- probability_distribution
Markov Decision Process
- reinforcement_learning
Markov property
- reinforcement_learning
Markov Reward Process
- reinforcement_learning
Monte Carlo Method(RL)
- reinforcement_learning
partially observable Markov decision process
- reinforcement_learning
policy
- reinforcement_learning
policy evaluation
- reinforcement_learning
Policy Gradient
- reinforcement_learning
policy improvement
- reinforcement_learning
policy iteration
- reinforcement_learning
- DP
Q-learning
- reinforcement_learning
REINFORCE
- reinforcement_learning
Reinforcement Learning
- reinforcement_learning
- MAB
S-MDP
- reinforcement_learning
SARSA
- reinforcement_learning
state-value function
- reinforcement_learning
temporal difference
- reinforcement_learning
value function
- reinforcement_learning
value iteration
- reinforcement_learning
- DP
value-based method
- reinforcement_learning
visit
- reinforcement_learning
- word

탐색기

RL