티스토리 뷰
MLE VS MAP
Maximum Likelihood Estimation (MLE) 와 Maximum A Posteriori (MAP)는 확률 분포 또는 그래픽 모델의 parameter를 추정 하는 방법임
- MLE: Likelihood functio을 최대화 시키는
- MAP: Posterior(Product of likelihood and prior)를 최대화 시키는
Thompson Sampling
Contextual badits의 Thompson sampling의 경우도 그 원리는 같고, 기존에 가진 정보(X)를 통해 Reward 분포를 모델링(Linear Regression, Logistic Regression) 하게 된다. Linear Regression을 사용할 경우 likelihood는 정규 분포, prior는 conjugator 관계인 정규분포를 사용하여 쉽게 Posterior를 구할 수 있다. 하지만 logistic, FM(factorization)을 사용할 경우 Posterior를 쉽게 구할 수 없게 되며, Laplace Approximation을 사용하여 정규분포인 posterior를 이용하다.
Laplace Approximation
Laplace Approximation은 모든 posterior를 정규 분포로 apprioximation시키는 방법이다.
이때(3)의 평균은 logf(w)를 최대/최소 화 시키는 w0이고 분산은 두번 logf(w)를 두번 미분한 함수에 w0을 대입 시켜 구할 수 있다.
1. 
3.
Thompson Sampling for Logistic regression
Common Notation
1. 
2. F는 weights와 features의 dot function으로 linear, FM, FFM에 따라 달라 진다.
3. log-likelihood는 다음과 같이 정의 할 수 있음, 2번에 F에 따라 Mu는 달라 짐
Laplac Apprximation
Bayesian Logistic Regression
1.
Bayesian Logistic Regression-Thompson Sampling
For each new batch of training data
- Find
maximizing equation by numerical optimization.
- Compute for each weight according to equation.
- Update the weight distribution:
-
Bayesian Factorization Machines
1.
Bayesian Factorization Machines-Thompson Sampling
- Initialize the prior on each weight with , .
- Initialize the prior on each element with , .
For each new batch of training data
- Find
maximizing equation by numerical optimization.
- Compute for each weight according to equation
- Compute for each element of
- Update the weight distribution:
-
reference:
- https://ufal.mff.cuni.cz/~jurcicek/NPFL108-BI-2014LS/04-approximate-inference-laplace-approximation.pdf
- https://wiseodd.github.io/techblog/2017/01/01/mle-vs-map/
- https://www.linkedin.com/pulse/bayesian-bandits-via-thompson-sampling-dave-golland-phd/
- http://proceedings.mlr.press/v23/agrawal12/agrawal12.pdf
- http://norman3.github.io/prml/docs/chapter03/3.html
- http://tech.adroll.com/blog/data-science/2017/03/06/thompson-sampling-bayesian-factorization-machines.html
- https://papers.nips.cc/paper/4321-an-empirical-evaluation-of-thompson-sampling.pdf