[AI] 데이터 전처리
1. 개념데이터 분석, 머신러닝(딥러닝)을 수행하기 전에 데이터를 가공, 변경, 정체하는 일련의 과정ML 모델에 적용하려면 데이터셋은 다음 조건을 갖춰야 함결측치(NULL) 값이 허용되지 않음문자열도 허용되지 않음2. 유형결측치 처리결측된 데이터가 너무 많은 경우 -> 열 전체를 삭제결측된 데이터가 일부인 경우 -> 다른 값(평균값, 최빈값 등)으로 대체데이터 인코딩(Label Encoding, One-hot Encoding)문자열은 변환이 필요Label Encoding : 범주형 데이터를 숫자로 일대일 매핑(ex. 조류: 1, 포유류: 2)One-hot Encoding : 피처 값의 유형에 따라 새로운 피처를 추가해 고유 값에 해당하는 칼럼에만 1을 표시하고 나머지 칼럼에는 0을 표시하는 방법스케일링(..
2024.12.28