자격증/빅데이터분석기사

빅데이터 탐색 / 데이터 전처리 / 분석 변수 처리

tacoyaggi 2024. 8. 20. 08:46

회귀

변수 X와 Y의 관계를 함수식으로 설명하는 통계적 방법이다.

 

상관계수

두 변수 간 연관성을 나타내는 수치이다.

 

차원축소

특정 목적에 따라서 변수(데이터 종류)의 양을 중이는 것이다.

 

과적합

학습 데이터를 과하게 학습하는 것이다.

 

주성분 분석 (PCA : Principal Component Analysis)

 

파생변수

기존의 변수를 조합하여 만들어진 새로운 변수이다.

 

인코딩

레이블 인코딩(Label Encoding), 원-핫 인코딩(One-Hot Encoding), 타깃 인코딩(Target Encoding)