Abstract

본 논문은 hierarchical Poisson matrix factorization(HPF) 모델을 제안.

HDF?

HDF 는 sparse user & item matrix 를 학습하는데 목적을 두었다. 또한, HDF 는 explicit 그리고 implicit feedback 을 모두 다룰 수 있다.

또한 대용량 데이터에서 posterior inference 를 approximate 할 수 잇는 a variational algorithm 을 제안했다.

실험에서 non-negative matrix factorization 이나 PMF 그리고 topic modeling 대상으로 모두 성능상 우위를 보인다고 한다.

Introduction

Poisson factorization is a probabilistic model of users and items.

Poisson factorization 는 non-negative matrix factorization 에서 파생되었음

GaP - a factor model for discrete data

Poisson Recommendation

  • 유저 의 아이템 에 대한 상호작용 implicit feedback 으로 가정 (1 값은 클릭, 0 은 무시)
  • 그리고 는 Poisson 으로 모델링:
    • 각 아이템 차원의 latent vector (item attributes) 로 표현되고, 각 사용자 차원의 latent vector (user preferences) 로 표현됨
    • 위 식은 Probabilistic Matrix Factorization 의 variants 로, 각 user 와 Item 의 weight 가 양수고, Gaussian 이 Poisson 으로 바뀐것으로 생각할 수 있음
  • Gamma prior 를 계층적으로 설계하여, 사용자들의 diversity 를 확인할 수 있도록 했음
    • Gamma priors on the latent attributes and latent preferences
  • the generative process of the hierarchical Poisson factorization model (HPF) is as follows:
    • For each user :
      • Sample activity
      • For each component , sample preference
    • For each item :
      • Sample popularity
    • 각 사용자 와 아이템 에 대해, rating 을 sampling 한다:
  • 유저 당 latent 그리고 아이템 당 structure 에 대한 조건부 분포 를 추정하기 위해, variational methods 를 이용하여 posterior inference 를 수행한다.
  • posterior 를 구한 이후, HPF 를 통한 prediction 은 다음과 같이 계산된다:
  • Properties of HPF

    • HPF captures sparse factors
    • HPF models the long-tail of users and items
      • posterior predictive check(PPC)
        • a technique for model assessment from the Bayesian statistics literature
    • HPF downweights the effect of zeros
      • Classical MF is based on Gaussian likelihoods (i.e., squared loss), which gives equal weight to consumed and unconsumed items
    • Fast inference with sparse matrices
      •   - $0!=1$
        

  • Inference with variational method

  • As for many Bayesian models, the exact posterior is computationally intractable.
  • We show how to efficiently approximate the posterior with mean-field variational inference
  • Variational inference for Poisson factorization
  • 모든 사용자와 아이템에 대해서, user parameters 그리고 item parameters 는 prior 로 사용하기 위해 초기화
  • user activity 그리고 item popularity shape parameters 는 다음과 같이 설정:
    • 은 모두 0.3 으로 설정
  • 이후 수렴될때까지 아래의 과정을 반복
    • 를 만족하는 각 사용자/아이템에 대하여,다음의 [multinomial](multinomial distribution) 을 업데이트

:

* 각 사용자에 대해, user weight 와 activity parameters를 업데이트

	* $\gamma_{uk}^{\mathrm{shp}}=a+\sum_{i}y_{ui}\phi_{uik}$

	* $\displaystyle\gamma_{uk}^{\mathrm{rte}}=\frac{\kappa_{u}^{\mathrm{shp}}}{\kappa_{u}^{\mathrm{rte}}}+\sum_{i}\lambda_{ik}^{\mathrm{shp}}/\lambda_{ik}^{\mathrm{rte}}$

	* $\displaystyle\kappa_{u}^{\mathrm{rte}}=\frac{a^{\prime}}{b^{\prime}}+\sum_{k}\frac{\gamma_{uk}^{\mathrm{shp}}}{\gamma_{uk}^{\mathrm{rte}}}$

		* $b^{\prime}=1$로 설정

* 각 아이템에 대해, item weight와 popularity parameter들을 업데이트

	* $\lambda_{ik}^{\mathrm{shp}}=c+\sum_{u}y_{ui}\phi_{uik}$

	* $\displaystyle\lambda_{ik}^{\mathrm{rte}}=\frac{\tau_{i}^{\mathrm{shp}}}{\tau_{i}^{\mathrm{rte}}}+\sum_{u}\gamma_{uk}^{\mathrm{shp}}/\gamma_{uk}^{\mathrm{rte}}$

	* $\displaystyle\tau_{i}^{\mathrm{rte}}=\frac{c^{\prime}}{d^{\prime}}+\sum_{k}\frac{\lambda_{ik}^{\mathrm{shp}}}{\lambda_{ik}^{\mathrm{rte}}}$

		* $d^{\prime}=1$로 설정

* 수렴 여부는 validation set에 대한 예측 precision으로 확인

	* 구체적으로는 validation ratings에 대한 predictive log likelihood의 평균을 계산하고, 이전 iteration의 log likelihood와 비교했을 때 변화가 0.0001% 미만이면 종료

Related

References