Zzong's Notes
Search
검색
다크 모드
라이트 모드
탐색기
MAB
16건의 항목
2026년 6월 14일
EXP3
reinforcement_learning
MAB
2026년 6월 14일
Reinforcement Learning
reinforcement_learning
MAB
2026년 6월 14일
epsilon-greedy algorithm
reinforcement_learning
algorithm
MAB
2026년 6월 14일
UCB
MAB
reinforcement_learning
2026년 6월 14일
A Contextual-Bandit Approach to Personalized News Article Recommendation
MAB
bandit
linear_regression
paper_review
recommendation_system
2026년 6월 14일
An Asymptotically Optimal Primal-Dual Incremental Algorithm for Contextual Linear Bandits
MAB
NIPS
bandit
contextual_bandit
linear_regression
paper_review
y2020
2026년 6월 14일
Burst-induced Multi-Armed Bandit for Learning Recommendation
MAB
RecSyS
bandit
paper_review
2026년 6월 14일
Deep Bayesian Bandits Showdown - An Empirical Comparison of Bayesian Deep Networks for Thompson Sampling
Google
ICLR
MAB
bandit
deep_learning
paper_review
y2018
2026년 6월 14일
Optimal Regret Analysis of Thompson Sampling in Stochastic Multi-armed Bandit Problem with Multiple Plays
MAB
bandit
paper_review
2026년 6월 14일
Recommender systems using LinUCB - A contextual multi-armed bandit approach
MAB
bandit
paper_review
recommendation_system
thompson_sampling
2026년 6월 14일
Exploring compact reinforcement-learning representations with linear regression
MAB
linear_regression
paper_review
reinforcement_learning
2026년 6월 14일
Mortal Multi Armed Bandit (2008)
recoteam
MAB
2026년 6월 14일
Multi-Armed Bandit
MAB
reinforcement_learning
2026년 6월 14일
Chernoff bounds
MAB
2026년 6월 14일
method of moments
MAB
reinforcement_learning
2026년 6월 14일
추천시스템에서 Unbiased Offline Evaluation
MAB
evaluation
kakao
offline_evaluation
paper_review
recoteam