MCAR
결측이 다른 데이터에 영향이 없는 것이다.
MAR
결측이 특정 변수와 관련되어 발생하지만 결과에는 영향이 없는 것이다.
NMAR
결측이 다른 데이터에 영향이 있는 것이다.
결측값 처리 방법
단순 대치법
완전분석, 평균 대치법, 회귀 대치법, 단순확률 대치법, 최근접 대치법
다중 대치법
단순 대치법을 복수로 실행하는 것이다.
이상치
데이터 전처리 과정에서 정상의 범주에서 벗어난 값을 의미한다.
'자격증 > 빅데이터분석기사' 카테고리의 다른 글
빅데이터 탐색 / 데이터 탐색 / 데이터 탐색의 기초 (0) | 2024.08.26 |
---|---|
빅데이터 탐색 / 데이터 전처리 / 분석 변수 처리 (0) | 2024.08.20 |
빅데이터분석기획 / 데이터 수집 및 저장 계획 / 데이터 적재 및 저장 (0) | 2024.08.20 |
빅데이터분석기획 / 데이터 수집 및 저장 계획 / 데이터 수집 및 전환 (0) | 2024.08.19 |
빅데이터분석기획 / 데이터 분석 계획 / 분석 작업 계획 (0) | 2024.08.19 |