본문 바로가기

네이버클라우드202

AI 6일차 (2023-05-15) 인공지능 기초 _머신러닝 - 퍼셉트론의 과제 : XOR 문제의 해결 퍼셉트론의 과제 XOR 문제 ㄴ 직선을 하나 그어서 직선의 한쪽 편에는 검은 점, 다른 한쪽에는 흰 점만 있도록 해보자. = > 이것이 퍼셉트론의 한계를 설명할 때 등장하는 XOR(exclusive OR) 문제 --> 반으로 접으면 되지 않을까? = > 차원 변경 AND 게이트 OR 게이트 XOR 게이트 x 1 x 2 결과 값 x 1 x 2 결과 값 x 1 x 2 결과 값 0 0 0 0 0 0 0 0 0 0 1 0 0 1 1 0 1 1 1 0 0 1 0 1 1 0 1 1 1 1 1 1 1 1 1 0 And ml01_and.py import numpy as np from sklearn.linear_model import Perceptron from sklearn.svm import LinearSVC, Li.. 2023. 5. 15.
AI 5일차 (2023-05-12) 인공지능 기초 - pandas pandas ㄴ 데이터 처리와 분석을 위해 사용되며, 표 형태의 데이터를 다루기에 용이 ㄴ Boston 데이터 다운로드하여 준비 해두기 tf01_pd01_boston.ipynb import numpy as np import pandas as pd from keras.models import Sequential from keras.layers import Dense from sklearn.model_selection import train_test_split from sklearn.metrics import r2_score # 1. 데이터 path = './_data/' x_train = pd.read_csv(path + 'train-data.csv')# cvs 파일 불러오는 코드 y_train = pd... 2023. 5. 14.
AI 5일차 (2023-05-12) 인공지능 기초 - Imdb 와 Rueters Imdb ㄴ IMDB(Internet Movie Database) ㄴ 긍정 부정 영화 리뷰(이진분류) ㄴ 각 리뷰에 대한 긍정 또는 부정의 감성을 예측하는 감성 분석 문제를 풀기 위한 데이터셋 ㄴ 훈련용(train) 리뷰 25,000개와 테스트용(test) 리뷰 25,000개로 구성 ㄴ 각각 50%는 긍정 리뷰와 50%는 부정 리뷰입 VSCode 이용 tf21_embedding_imdb.py import numpy as np from keras.models import Sequential from keras.layers import Dense, LSTM, Embedding, Dropout from keras.datasets import imdb from keras.preprocessing.text imp.. 2023. 5. 12.
AI 5일차 (2023-05-12) 인공지능 기초 - Tokenizer 와 Embedding Tokenizer from keras.preprocessing.text import Tokenizer # 예시 문장들 sentences = ['The cat sat on the chair.', 'The dog ate my food.'] # 토크나이저 인스턴스 생성 후, 텍스트 데이터에 대해 단어 인덱스 생성 tokenizer = Tokenizer() tokenizer.fit_on_texts(sentences) # 생성된 단어 인덱스 확인 print(tokenizer.word_index) # {'the': 1, 'cat': 2, 'sat': 3, 'on': 4, 'chair': 5, 'dog': 6, 'ate': 7, 'my': 8, 'food': 9} # 문장을 시퀀스로 변환 sequences = tok.. 2023. 5. 12.
AI 5일차 (2023-05-12) 인공지능 기초 - 자연어처리(NLP) 기초 워드 임베딩(Word Embedding) ㄴ 단어나 문구를 벡터 공간에 매핑하는 기술 ㄴ 텍스트를 컴퓨터가 이해할 수 있도록 숫자로 변환 ㄴ 단어를 표현하는 방법에 따라서 자연어 처리의 성능이 크게 달라짐 ㄴ 각 단어를 인공 신경망 학습을 통해 벡터(Vector)화하는 방법 ㄴ 케라스에서 제공하는 Embedding() => 단어를 랜덤한 값을 가지는 벡터로 변환한 뒤에, 인공 신경망의 가중치(W)를 학습 인공지능에서 벡터(vector)란 ㄴ 인공지능 분야에서 벡터는 대개 고차원의 숫자 배열(array)을 의미함 ㄴ 이미지 데이터의 벡터는 각 픽셀(pixel)의 색상 값을 숫자로 표현하고, 이러한 숫자들을 배열 형태로 나열한 것 (예를 들어, 28 x 28 픽셀의 흑백 이미지는 784차원의 벡터) ㄴ 텍스.. 2023. 5. 12.
AI 4일차 (2023-05-11) 인공지능 기초 - 이미지 분석 : 데이터 셋 ** Jupiter notebook 이용 MNIST 손글씨 이미지 분류하기 ㄴ 0∼9까지 10가지로 분류될 수 있는 손글씨 ㄴ 숫자 이미지 70,000개 ㄴ train-set 60,000개, test-set 10,000개로 구성 ㄴ 28x28 픽셀로 구성되어 있음 ㄴ 0∼255 사이의 숫자 행렬로 표현됨 mnist 데이터에서 5만 출력 mnist_imshow01.ipynb import numpy as np from keras.datasets import mnist# 손글씨 이미지 데이터 import matplotlib.pyplot as plt# 시각화 (x_train, y_train), (x_test, y_test) = mnist.load_data() # x_train :이미지, y_train : 라벨.. 2023. 5. 11.