본문 바로가기

분류 전체보기365

AI 6일차 (2023-05-15) 인공지능 기초 _머신러닝 - Ensemble 모델 : RandomForestClassifier, RandomForestRegressor Random Forest ㄴ 여러 개의 결정 트리들을 임의적으로 학습하는 방식의 앙상블 방법 ㄴ 여러가지 학습기들을 생성한 후 이를 선형 결합하여 최종 학습기를 만드는 방법 ㄴ 특징 ㄴ 임의성 : 서로 조금씩 다른 특성의 트리들로 구성 ㄴ 비상관화 : 각 트리들의 예측이 서로 연관되지 않음 ㄴ 견고성 : 오류가 전파되지 않아 노이즈에 강함 ㄴ 일반화 : 임의화를 통한 과적합 문제 극복 ㄴ 여러 개의 기본 모델을 조합하여 예측을 수행하는 방법 RandomForestClassifier ㄴ 분류 문제를 해결하기 위한 앙상블 모델 ㄴ 여러 개의 의사 결정 트리(Decision Tree)를 생성하고, 각각의 트리에서 예측한 결과를 다수결 투표 방식으로 종합하여 최종 예측을 수행합니다. 각 트리는 부트스트랩 샘플링.. 2023. 5. 15.
AI 6일차 (2023-05-15) 인공지능 기초 _머신러닝 - Tree 모델 : DecisionTreeClassifier, DecisionTreeRegressor Decision Tree ㄴ 뷴류와 회귀 문제에 널리 사용하는 모델 ㄴ 기본적으로 결정 트리는 결정에 다다르기 위해 예/아니오 질문을 이어 나가면서 학습 ㄴ scikit-learn에서 결정 트리는 DecisionTreeRegressor와 DecisionTreeClassifier에 구현되어 있음 DecisionTreeClassifier ml04_tree_iris.py # 1. iris import numpy as np from sklearn.svm import SVC, LinearSVC from sklearn.tree import DecisionTreeClassifier from sklearn.metrics import accuracy_score from sklearn.datasets import load.. 2023. 5. 15.
AI 6일차 (2023-05-15) 인공지능 기초 _머신러닝 - 스케일링 (Scaling) 스케일링 (Scaling) Normalization (정규화) ㄴ 특성들을 특정 범위(주로 [0,1]) 로 스케일링 하는 것 ㄴ 가장 작은 값은 0, 가장 큰 값은 1 로 변환되므로, 모든 특성들은 [0, 1] 범위를 갖게 됨 Standardization (표준화) ㄴ 특성들의 평균을 0, 분산을 1 로 스케일링 하는 것 ㄴ 즉, 특성들을 정규분포로 만드는 것 주의사항 ㄴ 훈련 데이터에는 fit_transform() 메서드를 적용 --> fit() + transform() ㄴ 테스트 데이터에는 transform() 메서드를 적용 scaler = MinMaxScaler() scaler.fit(x_train) # train 은 fit, transform 모두 해줘야 함 x_train = scaler.tran.. 2023. 5. 15.
AI 6일차 (2023-05-15) 인공지능 기초 _머신러닝 - Linear 모델과 SVM 모델 : SVC, SVR Linear 모델 Perceptron ㄴ 가장 간단한 형태의 인공 신경망 모델 ㄴ 이진 분류 문제를 해결하기 위해 사용 ㄴ 입력 데이터에 대해 가중치를 적용하고, 이를 활성화 함수를 통과시켜 예측을 수행 ㄴ 예측 결과를 기반으로 모델의 가중치를 업데이트하여 오분류를 최소화하도록 학습 Logistic Regression (분류 모델) ㄴ 분류 문제를 해결하기 위한 선형 모델 ㄴ 입력 데이터에 대해 선형 가중치를 적용한 후, 시그모이드(sigmoid) 함수를 통과시켜 확률값을 출력함 ㄴ 이진 분류 뿐만 아니라 다중 클래스 분류에도 적용할 수 있음 ㄴ 로그 손실 함수를 최소화하는 방식으로 학습되며, 경사 하강법 등의 최적화 알고리즘을 사용함 Linear Regression (회귀 모델) ㄴ 회귀 문제를 해결하.. 2023. 5. 15.
AI 6일차 (2023-05-15) 인공지능 기초 _머신러닝 - 퍼셉트론의 과제 : XOR 문제의 해결 퍼셉트론의 과제 XOR 문제 ㄴ 직선을 하나 그어서 직선의 한쪽 편에는 검은 점, 다른 한쪽에는 흰 점만 있도록 해보자. = > 이것이 퍼셉트론의 한계를 설명할 때 등장하는 XOR(exclusive OR) 문제 --> 반으로 접으면 되지 않을까? = > 차원 변경 AND 게이트 OR 게이트 XOR 게이트 x 1 x 2 결과 값 x 1 x 2 결과 값 x 1 x 2 결과 값 0 0 0 0 0 0 0 0 0 0 1 0 0 1 1 0 1 1 1 0 0 1 0 1 1 0 1 1 1 1 1 1 1 1 1 0 And ml01_and.py import numpy as np from sklearn.linear_model import Perceptron from sklearn.svm import LinearSVC, Li.. 2023. 5. 15.
AI 5일차 (2023-05-12) 인공지능 기초 - pandas pandas ㄴ 데이터 처리와 분석을 위해 사용되며, 표 형태의 데이터를 다루기에 용이 ㄴ Boston 데이터 다운로드하여 준비 해두기 tf01_pd01_boston.ipynb import numpy as np import pandas as pd from keras.models import Sequential from keras.layers import Dense from sklearn.model_selection import train_test_split from sklearn.metrics import r2_score # 1. 데이터 path = './_data/' x_train = pd.read_csv(path + 'train-data.csv')# cvs 파일 불러오는 코드 y_train = pd... 2023. 5. 14.