Study Record/AI Data Science

Variance Inflation Factor (VIF)

Sungyeon Kim 2024. 6. 19. 17:16

1. VIF

회귀 분석에서 특정 변수의 다중공선성을 측정하는 방법. 즉, 다른 독립 변수들과의 상관관계를 기반으로 특정 변수가 모델에 얼마나 중복되는지를 나타냄.

***다중공선성: 회귀분석에서 두 개 이상의 독립 변수가 서로 강한 상관관계를 가지는 현상

 

2. 계산

특정 변수의 VIF는 그 변수를 종속 변수로 두고 나머지 변수들을 독립 변수로 사용하여 회귀 분석을 수행한 후 결정계수 R^2를 사용하여 계산.

 

3. 판단 기준

일반적으로 VIF 값이 5를 초과하면 다중공선성이 높은 것으로 간주. -> 해당 변수를 모델에서 제