ML 개념 정리

SW 기능/ML

ML 개념 정리

tacoyaggi ㅣ 2024. 6. 10. 08:51

머신러닝

머신러닝은 인공지능을 구현하는 대표적인 방법 중 하나 입니다.

딥러닝은 머신러닝의 여러 방법 중 하나의 알고리즘 입니다.

인공지능 안에 머신러닝이 있고 머신러닝 안에 딥러닝이 존재 합니다.

일반적으로 머신러닝은 알고리즘을 이용하여 데이터를 분석하고 분석 결과를 스스로 학습한 후

이를 기반으로 어떠한 판단이나 예측을 하는 것을 의미 합니다.

지도 학습 (Supervised Learning)

지도 학습은 정답을 알려주고 학습시키는 머신러닝 학습 방법 입니다.

지도 학습에는 데이터에 대해 여러 개의 값 중 하나의 답을 도출해내는 분류와 데이터 분석을 통해 특징으로 답을 도출해내는 회귀가 있습니다.

분류 모델

Logistic Regression (로지스틱 회귀) : 연속된 입력 값을 사용해 이진 분류 문제를 해결하는 모델 입니다.
k-NN : 가장 가까운 k개의 데이터 포인트를 기반으로 클래스를 예측하는 모델 입니다.
SVM (서포트 벡터 머신) : 고차원 공간에서 데이터 포인트르 ㄹ분리하는 최적의 초평면을 찾는 모델 입니다.
Decision Tree (결정 트리)
Random Forest
Naive Bayes
Neural Networks (신경망)

회귀 모델

Linear Regression (선형 회귀)
Polynomial Regression (다항 회귀)
Random Forest
Ridge / Lasso
Elastic Net Regression
SVR (서포트 벡터 회귀)
Decision Tree Regression (의사결정 나무 회귀)

비지도 학습

비지도 학습은 머신러닝의 한 유형으로, 레이블된 데이터 없이 입력 데이터의 구조와 패턴을 학습하는 방법 입니다.

비지도 학습은 군집화와 차원 축소 기법을 통해 데이터를 분석 합니다.

군집

k-평균
계층적 군집화
DBSCAN

차원 축소

주성분 분석
t-SNE
LDA

강화 학습

강화학습은 행동에 대한 보상을 받으면서 학습하여 어떤 환경 안에서 선택 가능한 해동들 중 보상을 최대화 하는 행동 또는 행동 순서를 선택하는 방법 입니다. 현재의 상태를 관찰하여 선택할 수 있는 행동들 중에서 가장 최대의 보상을 가져다주는 행동이 무엇인지를 학습하는 것 입니다.

ML 프로세스

문제정의
EDA
데이터 전처리
모델 학습
예측

기본 용어

target, label

데이터 포인트가 속하는 클래스 또는 카테고리 입니다.

과일을 사과와 배로 분류하는 경우 "사과"와 "배"가 레이블이 됩니다.

feature

분류에 사용되는 데이터의 속성 또는 특성 입니다.

과일의 색깔, 당도, 크기 등이 feature가 될 수 있습니다.

Training Dataset

모델을 학습시키기 위해 사용되는 데이터셋으로, 각 데이터 포인트는 feature와 label로 구성 됩니다.

Validation Dataset

모델의 성능을 평가하기 위해 사용되는 데이터셋으로, 학습 과정 중에 모델의 과적합을 방지하기 위해 사용 합니다.

Test Dataset

학습이 완료된 모델의 최종 성능을 평가하기 위해 사용되는 데이터셋 입니다.

EDA (Exploratory Data Analysis)

탐색적 데이터 분석이라고도 부르며 데이터 구조를 이해하고 패턴을 발견하며 통계적 요약 및 시각화를 통해 데이터의 특성을 탐색하는 과정 입니다. EDA는 데이터 분석 및 머신러닝 모델링의 중요한 초기 단계로 데이터의 품질을 평가하고 적절한 전처리 과정을 결정하는데 도움이 됩니다.

결측치

결측값이라고도 불리며 알려지지 않고 수립되지 않은 잘못 입력된 데이터 값을 의미 합니다.

일반적으로 null 이라고도 표현 합니다.

과소적합(underfitting)

머신러닝 모델이 충분히 복잡하지 않아 학습 데이터의 구조/패턴을 정확히 반영하지 못하는 문제 입니다.

과대적합(overfitting)

모델을 지나치게 복잡하게 학습하여 학습 데이터셋에서는 모델 성능이 높게 나타나지만 정작 새로운 데이터가 주어졌을 때 정확한 예측/분류를 수행하지 못하는 문제 입니다.

저작자표시 (새창열림)

'SW 기능 > ML' 카테고리의 다른 글

jupyter notebook (주피터 노트북), pandas (판다스) (0)	2024.06.12

타코야끼 기술 블로그

ML 개념 정리

머신러닝

지도 학습 (Supervised Learning)

분류 모델

회귀 모델

비지도 학습

군집

차원 축소

강화 학습

ML 프로세스

기본 용어

target, label

feature

Training Dataset

Validation Dataset

Test Dataset

EDA (Exploratory Data Analysis)

결측치

과소적합(underfitting)

과대적합(overfitting)

'SW 기능 > ML' 카테고리의 다른 글

티스토리툴바