Abstract

(a) investigate evaluation bias of AOA(Average-Over-All) evaluator
(b) an unbiased and practical offline evaluator for implicit MNAR datasets 를 제안
- the Inverse-Propensity-Scoring ([IPS](inverse propensity score)) technique 을 사용

B) Introduction

task: unbiased evaluation of recommendation performance offline
- 해당 task 를 해결하기 위해 많은 방법이 제안되었지만, 대부분 explicit feedback 을 위한 것이고, implicit feedback 에는 적합하지 않음

biased feedback 으로 실험하고 unbiased evaluator 를 사용함

실제 추천시스템에서 popularity bias 가 어느정도 확인되는지 조사하는 실험으로, 두 가지 종류의 bias 를 조사함

그런데 어차피 사용자는 보이는 것만 상호작용 하기 때문에, interaction bais 와 presentation bias 를 나누기가 어렵다. 그래서 둘의 joint effect 를 확인할 수 있는 $n_{i}^{*}$ 의 분포를 확인하려 함

직관적으로 봤을때, 편향없는 플랫폼이라면 사용자를 좀 더 다양하게 상호작용 시켜야 할 것 이다 (Gini index.