Zzong's Notes

❯

recommendation_system

❯

counterfactual learning

counterfactual learning

2026년 6월 14일1 min read

Counterfactual Learning

추천 시스템의 학습은 supervised learning 과 다르다. 추천 시스템은 오직 사용자가 선택한 결과만을 가지고 학습하기 때문에, log data 는 partial information 형식을 지닌다. 반면 지도 학습은 그 사용자에 대해서 가장 적합한 best ranking items 전체를 학습하기 원한다 (from full-information feedback).

Related

Counterfactual Risk Minimization: Learning from Logged Bandit Feedback
Counterfactual learning for recommender system

References

함께 보면 좋은 글

Counterfactual learning for recommender system

Abstract counterfactual learning technologies for tackling the bias problem in recommendation.

federated learning

Federated Learning 데이터를 하나의 저장소로 모으지 않고 모델을 학습할 수 없을까? 데이터를 특정 서버에 모으지 않고 개인 디바이스에서 학습하는 방식으로, 데이터 이동 이슈를 해소하기 위한 방안으로 많이 연구되고 있다.

Matthew effect

Matthew Effect 유명한 아이템은 더 많이 노출되어서 학습 데이터의 밸런스가 더욱 무너지는 현상.

userKNN

userKNN B) Related C) References A Troubling Analysis of Reproducibility and Progress in Recommender Systems Research, TOIS, 2021.

batch inference

Batch Inference Batch inference is a process of aggregating inference requests and sending this aggregated requests through the ML/DL framework for inference all at once.

metric learning

Metric Learning A.1) 정의 metric learning 은 데이터 포인트 간의 거리를 측정하는 방법을 학습하는 기법입니다.

offline evaluation

Offline Evaluation 현실에 직접 적용하는 대신 정해진 데이터셋에서 성능 평가를 하는 것 일반적으로 사용자들이 관측하지 않은 콘텐츠에 대한 반응을 유추하여 평가하나, 실제 데이터를 사용하지 않았기 때문에 정확한 성능 비교가 어렵다.

Alternating Least Squares

collaborative filtering 의 MF 기법은 gradient descent update 를 이용하여 user 와 item 의 latent vector 를 찾아내는데, 이러한 최적화 과정은 너무 느리고 많은 반복이 필요하다.

challenges of RS

Challenge of RS 추천 시스템에서 발생할 수 있는 문제점들 nosiy data 일반적으로 historical 데이터는 모두 사용자의 성향을 반영한다고 가정하지만, 사용자는 자신이 선택한 아이템을 좋아하지 않을 수 있다.

exposure bias

Exposure Bias Exposure bias 는 사용자가 모든 item 을 본 것이 아니라, 노출된 item 에 대해서만 feedback 을 남긴다는 데서 생기는 bias 다.

Counterfactual Learning
Related
References