Generalized Linear Model

feature vector 가 주어졌을 때 observation 는 평균이 exponential family 분포를 따른다.

  • mean function 그리고 가 모델 parameters.
  • 여기서 sigmoid function 인 경우 logistic regression 으로 해석할 수 있다.

A.1) Likelihood

  • 개의 observation 들의 집합이라고 하자.
  • model parameter 에 대한 의 negative log likelihood 는 다음과 같다.
  • 는 real function
  • 는 이차 연속 미분이 가능하고, 미분한 결과가 mean function() 인 함수
  1. gradient of with respect to
  1. Hessian of with respect to

의 미분이고, 는 increasing 하므로 의 값은 항상 양수다.

B) Related Algorithms

B.1) GLM-TSL

  • a variant of Thompson sampling where the posterior of is approximated by its Laplace approximation.
  • 임의의 parameter vector 는 Laplace approximation 에서 샘플링된다.
      • 는 tunable parameter
  • GLM-FPL(follow-the-perturbed-leader)
    • 임의의 parameter vector 는 Gaussian noise 가 추가된 까지의 reward 들로 부터 MLE 를 수행한 결과다.
        • 는 normal random variables (매 round 마다 resampling 됨)
          • 는 tunable parameter
  • Computationally-Efficient Implementations
  • 위의 식에서 사용되는 MLE 는 Newton-Raphson method 를 사용하는 Iteratively Reweighted Least Squares (IRLS) 를 통해 계산될 수 있다.
  • Roughly speaking, each step of IRLS multiplies the inverse of and .
  • 즉, 의 경우는 로 계산하고, 의 경우는 형태로 계산할 수 있다고 한다.
    • 가 history 에서 발생한 횟수고, 는 보상이라고 하는데, 이 둘은 incrementally update 될 수 있다.
  • 잘 모르겠는 부분
    • 차원 벡터인데, 어떻게 inverse 계산을 할 수 있을까?

C) Related

D) References