독립변수
종속변수에 영향을 줄 것으로 예상되거나 종속 변수의 변화를 예측할 수 있다고 여겨지는 변수이다.
종속변수
독립변수의 변화에 의해 영향을 받을 것으로 기대되는 변수이다.
다중회귀(Multiple Regression)
독립변수가 2개 이상인 회귀모형을 지칭하며 각 독립변수는 종속변수와 선형관계가 있다고 가정한다.
로지스틱 회귀(Logistic Regression)
.종속변수가 이항형 문제를 지칭할 때 사용한다.
분산분석(ANOVA:Analysis of Variance)
공분산(Covariance)
두 개의 확률 변수의 상관정도를 나타내는 값으로 공분산이 0이면 두 변수 간의 선형적인 관계가 없음을 의미하나 두 변수가 완전히 독립적이라는 것은 아니다.
군집분석(Cluster Analysis)
모집단 또는 범주에 대한 사전정보가 없는 경우에 관측값들 사이의 거리를 이용하여 변수 또는 개체들을 자연스럽게 군집으로 나누는 분석기법이다. 대표적인 비지도학습이며 각 데이터의 유사성을 측정하여 군집 간 상이성을 확인한다.
비정형 데이터(Unstructured Data)
데이터 구조가 없어 그 자체만으로 내용에 대한 질의 처리를 할 수 없다. 따라서 데이터의 특징을 추출하여 반정형 또는 정형으로 변환하는 전처리가 필요하다.
데이터 마이닝(Data Mining)
대규모 데이터들 속에서 통계적 규칙이나 패턴을 분석하여 가치 있는 정보를 추출하는 것이다. 종류로는 텍스트 마이닝(Text Mining), 오피니언 마이닝(Opinion Mining), 웹 마이닝(Web Mining)이 있다.
'자격증 > 빅데이터분석기사' 카테고리의 다른 글
빅데이터 탐색 / 통계기법의 이해 / 기술통계 (0) | 2024.08.26 |
---|---|
빅데이터 탐색 / 데이터 탐색 / 고급 데이터 탐색 (0) | 2024.08.26 |
빅데이터 탐색 / 데이터 탐색 / 데이터 탐색의 기초 (0) | 2024.08.26 |
빅데이터 탐색 / 데이터 전처리 / 분석 변수 처리 (0) | 2024.08.20 |
빅데이터 탐색 / 데이터 전처리 / 데이터 정제 (0) | 2024.08.20 |