자격증/빅데이터분석기사
빅데이터 탐색 / 데이터 전처리 / 분석 변수 처리
tacoyaggi
2024. 8. 20. 08:46
회귀
변수 X와 Y의 관계를 함수식으로 설명하는 통계적 방법이다.
상관계수
두 변수 간 연관성을 나타내는 수치이다.
차원축소
특정 목적에 따라서 변수(데이터 종류)의 양을 중이는 것이다.
과적합
학습 데이터를 과하게 학습하는 것이다.
주성분 분석 (PCA : Principal Component Analysis)
파생변수
기존의 변수를 조합하여 만들어진 새로운 변수이다.
인코딩
레이블 인코딩(Label Encoding), 원-핫 인코딩(One-Hot Encoding), 타깃 인코딩(Target Encoding)