1. IQR(Interquartile Range) 방법
- IQR = 데이터의 1사분위수(Q1)와 3사분위수(Q3) 사이의 범위
- 이상치 = IQR을 벗어나는 값 = 아래 or Q3+1.5×IQR 위인 값
2. Z-Score 방법
- Z = ( x - 평균 ) / 표준편차
- Z-Score = 데이터가 평균으로부터 얼마나 떨어져 있는지를 표준 편차 단위로 나타낸 방법
- 이상치 = Z-Score가 +3 위 or -3 아래인 값
3. Box Plot 분석
- Box Plot = 데이터의 중앙값, 사분위수, 이상치를 시각적으로 표현한 그래프
- 이상치 = 그래프에서 동그란 점들
4. Scatter Plot 분석
- 두 개의 연속형 변수를 시각화한 산점도를 통해 이상치 찾기
- 이상치 = 대부분의 데이터가 특정 패턴을 형성할 때, 그 패턴에서 크게 벗어난 점들
5. 밀도 기반 이상치 탐지(DBSCAN)
- 밀도 = 데이터 포인트 주변 일정 거리 내 몇 개의 다른 데이터 포인트가 있는지