[AI] 데이터 전처리
1. 개념데이터 분석, 머신러닝(딥러닝)을 수행하기 전에 데이터를 가공, 변경, 정체하는 일련의 과정ML 모델에 적용하려면 데이터셋은 다음 조건을 갖춰야 함결측치(NULL) 값이 허용되지 않음문자열도 허용되지 않음2. 유형결측치 처리결측된 데이터가 너무 많은 경우 -> 열 전체를 삭제결측된 데이터가 일부인 경우 -> 다른 값(평균값, 최빈값 등)으로 대체데이터 인코딩(Label Encoding, One-hot Encoding)문자열은 변환이 필요Label Encoding : 범주형 데이터를 숫자로 일대일 매핑(ex. 조류: 1, 포유류: 2)One-hot Encoding : 피처 값의 유형에 따라 새로운 피처를 추가해 고유 값에 해당하는 칼럼에만 1을 표시하고 나머지 칼럼에는 0을 표시하는 방법스케일링(..
2024.12.28
[AI] 회귀분석
1. 개념입력변수(독립 변수)에 기초하여 출력변수(종속 변수)을 설명하거나 예측하는 통계적 모델오차를 최소화 할 수 있는 기울기와 절편을 계산하는 과정회귀분석은 입력변수와 출력변수에 선형적 관계가 존재해야 예측 성능이 좋음2. 유형단순 선형회귀(Simple Regression) : 입력변수가 1개다중 선형회귀 : 입력변수가 k개다항선형회구 : 입력변수와 출력변수와의 관계가 1차 함수 이상인 관계로지스틱 회귀(Logistic Regression) : 회귀식을 이용한 분류모델(이진분류)페널티(정규화, Regulization) 기법을 사용한 회귀분석오버피팅을 막기 위한 방법Redgie, Lasso, elasticNet 등비선형 회귀 : 입력과 출력이 비선형 관계3. 모델 이해3.1 기본 표현식y = b + W..
2024.12.28
no image
[AI] 인공지능 기본
머신러닝이란인공지능 : 지능적인 기계 / 프로그램의 제작과 관련된 분야, 인터넷과 GPU의 발전으로 주목받기 시작머신러닝 : 주어진 데이터를 분석하여 별도의 명시적인 프로그래밍 없이 규칙이나 지식을 스스로 추출하는 방법을 개발하는 연구 분야딥러닝 : 심층 신경망에 기반한 학습 방법※ 심층 신경망 : 인간의 뇌 세포 상호작용(다수의 이전 뉴런으로부터 입력을 받아 합을 구하고 임계치를 넘으면 다음 뉴런에 전달)을 모방처리 과정1. 학습 과정 : 입출력의 관계를 알려주는 모델을 찾는 과정2. 추론 과정 : 실제 데이터에 모델을 적용해 결과를 얻는 과정시스템 개발 과정1. 문제 파악2. 데이터(학습 데이터 및 테스트 데이터) 수집 및 이해3. 전처리 : 입력 데이터에 대해 중복 및 불필요 데이터를 제거4. 특징..
2024.06.05