AB Test 개념 정리


CTR(Click-Through Rate) 예측 기반 A/B 테스트에서 A 로직이 B 로직보다 통계적으로 유의미하게 우수함을 증명하려면?

A와 B의 CTR 차이가 통계적으로 유의미한지 확인 (예: 95% 신뢰수준).

  • 대상: 무작위로 분할된 사용자 그룹 (A/B 그룹).

Notation

  • $CTR_A$ = A 그룹 클릭 수 / A 그룹 노출 수
  • $CTR_B$ = B 그룹 클릭 수 / B 그룹 노출 수

통계적 검정

  • 귀무가설 (H₀): $CTR_A = CTR_B$ (A와 B의 성능 차이 없음).
  • 대립가설 (H₁): $CTR_A > CTR_B$ (A가 B보다 우수함).

수식: Z-검정

Z-검정은 표본 분포가 정규분포를 따른다는 가정 아래 수행됩니다. CTR과 같은 비율 데이터는 본질적으로 이항분포(Binomial Distribution)를 따르지만, 중심극한정리(Central Limit Theorem) 덕분에 표본 크기가 충분히 클 경우 정규분포로 근사할 수 있습니다.

\[z=\frac{(\mathrm{A} \text { 의 CTR }-\mathrm{B} \text { 의 CTR) }}{\text { 표준 오차(Standard Error) }}=\frac{C T R_A-C T R_B}{\sqrt{p_{\text {pooled }} \cdot\left(1-p_{\text {pooled }}\right) \cdot\left(\frac{1}{n_A}+\frac{1}{n_B}\right)}}\]
  • $p_{\text {pooled }}=\frac{\text { 클릭 총합}}{\text { 노출 총합}}=\frac{C_A+C_B}{N_A+N_B}$
    • $p_{\text {pooled }} \cdot\left(1-p_{\text {pooled }}\right)$ : CTR의 분산 (비율의 변동성).
  • $n_A, n_B: \mathrm{A} / \mathrm{B}$ 그룹 노출 수
    • $\frac{1}{n_A}+\frac{1}{n_B}$ : 표본 크기가 클수록 분산이 작아짐.

수식 해석

  • 분자: A와 B의 CTR 차이 (실제 관측된 차이).
  • 분모: “우연히 발생할 수 있는 차이의 평균적인 크기” (표준 오차). → Z값이 크다 = 관측된 차이가 우연보다 의미 있다!
    • 표준 오차는 “비율 차이가 우연히 변동할 수 있는 정도”를 나타냅니다.
    • 두 그룹의 데이터가 많을수록(표본 크기 ↑), 표준 오차는 작아집니다.
  • Z값은 표준 정규 분포 (평균 0, 표준편차 1)와 비교됩니다.
    • 임계값: 95% 신뢰수준에서 1.645 (단측 검정 기준).
    • 즉, Z값이 1.645 보다 크면 귀무가설 기각 성공 (A와 B의 차이는 통계적으로 유의미하다).



    Enjoy Reading This Article?

    Here are some more articles you might like to read next:

  • Deepseek-R1 모델
  • 학습할때 메모리가 터진다고? Cut Your Losses!
  • GRPO 대신 DAPO: RL 최적화로 LLM 추론 능력 끌어올리기
  • DeepSeek-V3 기술 요약
  • python accelerate 라이브러리 함수 조사기