회귀
변수 X와 Y의 관계를 함수식으로 설명하는 통계적 방법이다.
상관계수
두 변수 간 연관성을 나타내는 수치이다.
차원축소
특정 목적에 따라서 변수(데이터 종류)의 양을 중이는 것이다.
과적합
학습 데이터를 과하게 학습하는 것이다.
주성분 분석 (PCA : Principal Component Analysis)
파생변수
기존의 변수를 조합하여 만들어진 새로운 변수이다.
인코딩
레이블 인코딩(Label Encoding), 원-핫 인코딩(One-Hot Encoding), 타깃 인코딩(Target Encoding)
'자격증 > 빅데이터분석기사' 카테고리의 다른 글
빅데이터 탐색 / 데이터 탐색 / 고급 데이터 탐색 (0) | 2024.08.26 |
---|---|
빅데이터 탐색 / 데이터 탐색 / 데이터 탐색의 기초 (0) | 2024.08.26 |
빅데이터 탐색 / 데이터 전처리 / 데이터 정제 (0) | 2024.08.20 |
빅데이터분석기획 / 데이터 수집 및 저장 계획 / 데이터 적재 및 저장 (0) | 2024.08.20 |
빅데이터분석기획 / 데이터 수집 및 저장 계획 / 데이터 수집 및 전환 (0) | 2024.08.19 |