KS

콜모고로프 - 스미르노프 지표.

예측 모델을 검증하는 데 사용되는 가장 중요한 메트릭 중 하나입니다.

특히 Banking, Financial services and Insurance (BFSI) 도메인에서 자주 사용됩니다.

K-S 통계량은 우량 집단과 불량집단의 누적 분포 (CDF) 의 차이를 나타내는 지표로 신용평가모형의 변별력 평가 시 주요 판별 통계량으로 활용됩니다.

간단하게 말하면, 2 개의 집단이 동일한 분포를 이루고 있는 지를 검증하는 검증 지표이다. 즉, 두 집단의 분포가 얼마가 차이가 나는 지를 통계적으로 알 수 있고, 이것을 통해 두 집단을 얼마나 잘 구별할 수 있는 지를 이해할 수 있다.

B) Application

KS 통계량 같은 경우 신용 평가 모형에 대한 성능 측정 지표로 사용

신용 평가 모형이란?

  • 과거의 신용 거래 행위를 기반으로 빌린 돈을 미래에 잘 상환할 가능성을 예측하는 모형
  • (NICE 기준) 신용 평점 모형은 개인의 과거와 현재의 신용정보를 바탕으로 향후 1 년내 90 일 이상 장기연체 등 신용위험이 발생할 가능성을 예측하는 모형
  • 좋은 신용평가 모형이라는 것은
    • 미래에 돈을 갚지 않은 고객들은 신용점수가 낮은 부분에 집중되어 있어야 하고,
    • 미래에 돈을 잘 갚은 고객들은 신용점수가 높은 부분에 집중되어야 합니다.

C) 통계량에 따른 등급 (일반적 사용)

기준등급
0.2 이하판별력 낮은 모형
0.2 ~ 0.4적정한 모형
0.4 ~ 0.5판별록이 좋은 모형
0.5 이상판별력이 아주 좋은 모형

 정규 분포를 가정해서 한 것이기 때문에, 실제 현실 분포랑은 많은 괴리가 있는 판단 기준일 수 있다.

D) Related

E) References