MCAR

결측이 다른 데이터에 영향이 없는 것이다.

 

MAR

결측이 특정 변수와 관련되어 발생하지만 결과에는 영향이 없는 것이다.

 

NMAR

결측이 다른 데이터에 영향이 있는 것이다.

 

결측값 처리 방법

단순 대치법

완전분석, 평균 대치법, 회귀 대치법, 단순확률 대치법, 최근접 대치법

 

다중 대치법

단순 대치법을 복수로 실행하는 것이다. 

 

이상치

데이터 전처리 과정에서 정상의 범주에서 벗어난 값을 의미한다.