Generalized Linear Model
feature vector 가 주어졌을 때 observation 는 평균이 인 exponential family 분포를 따른다.
- 는 mean function 그리고 가 모델 parameters.
- 여기서 는 sigmoid function 인 경우 logistic regression 으로 해석할 수 있다.
A.1) Likelihood
- 가 개의 observation 들의 집합이라고 하자.
- model parameter 에 대한 의 negative log likelihood 는 다음과 같다.
- 는 real function
- 는 이차 연속 미분이 가능하고, 미분한 결과가 mean function() 인 함수
- gradient of with respect to
- Hessian of with respect to
는 의 미분이고, 는 increasing 하므로 의 값은 항상 양수다.
- Maximum Likelihood Estimation of model parameters 는 를 만족하는 vector 를 찾는 것이다.
B) Related Algorithms
B.1) GLM-TSL
- a variant of Thompson sampling where the posterior of is approximated by its Laplace approximation.
- 임의의 parameter vector 는 Laplace approximation 에서 샘플링된다.
-
- 는 tunable parameter
-
- GLM-FPL(follow-the-perturbed-leader)
- 임의의 parameter vector 는 Gaussian noise 가 추가된 까지의 reward 들로 부터 MLE 를 수행한 결과다.
-
- 는 normal random variables
(매 round 마다 resampling 됨)
- 는 tunable parameter
- 는 normal random variables
(매 round 마다 resampling 됨)
-
- 임의의 parameter vector 는 Gaussian noise 가 추가된 까지의 reward 들로 부터 MLE 를 수행한 결과다.
- Computationally-Efficient Implementations
- 위의 식에서 사용되는 MLE 는 Newton-Raphson method 를 사용하는 Iteratively Reweighted Least Squares (IRLS) 를 통해 계산될 수 있다.
- Roughly speaking, each step of IRLS multiplies the inverse of and .
- 즉, 의 경우는 로 계산하고, 의 경우는 형태로 계산할 수 있다고 한다.
- 는 가 history 에서 발생한 횟수고, 는 보상이라고 하는데, 이 둘은 incrementally update 될 수 있다.
- 잘 모르겠는 부분
- 는 차원 벡터인데, 어떻게 inverse 계산을 할 수 있을까?