jupyter notebook (주피터 노트북)

jupyter notebook은 코드 작성, 데이터 분석, 시각화, 문서화를 하나의 환경에서 할 수 있게 해주는 대화형 컴퓨팅 도구 입니다. 

 

pandas (판다스)

pandas는 파이썬 프로그래밍 언어를 위한 데이터 조작과 분석을 위한 라이브러리 입니다. 

주로 구조화된 데이터를 처리하는데 사용되며, DataFrame이라는 자료구조를 중심으로 작동 합니다. 

DataFrame (데이터프레임)

행과 열이 있는 테이블 형식의 데이터 구조 입니다.

각 열은 서로 다른 유형의 데이터를 포함할 수 있습니다. 

DataFrame은 SQL 테이블이나 Excel 시트와 유사한 형태를 가지고 있습니다. 

 

Series (시리즈)

DataFrame의 열을 나타내는 객체 입니다. 

 

 

 

head(), tail()

데이터 샘플을 확인할 수 있는 함수. head()는 앞에서 tail()은 뒤에서 시작 한다. 

파라미터 정수 값에 따라서 갯수가 달라진다.

 

 

조건문

변수를 선언하고 DataFrame안에 넣어줘야 DataFrame이 출력 됩니다. 

isin() 함수는 DataFrame에서 인자가 포함하는 값을 가진 Series를 추출 합니다. 

 

Indexing (인덱싱)

 

Slicing (슬라이싱)

 

replace

 

 

'SW 기능 > ML' 카테고리의 다른 글

ML 개념 정리  (0) 2024.06.10