ML

머신러닝 / 딥러닝 스터디 정리
ML/혼자 공부하는 머신러닝 + 딥러닝

[혼공머신] 03. 회귀 알고리즘과 모델 규제 - k-최근접 이웃 회귀

핵심 키워드 #회귀 #k-최근접 이웃 회귀 #결정계수 #과대적합과 과소적합 지도 학습의 한 종류인 회귀 문제를 이해하고 k-최근접 이웃 알고리즘을 사용해 농어의 무게를 예측하는 회귀 문제를 풀어보자 k-최근접 이웃 회귀 농어의 무게를 예측하라 농어의 길이, 높이, 두께를 측정한 데이터가 있으면 농어의 무게를 예측할 수 있을까? k-최근접 이웃 회귀 지도 학습 알고리즘은 크게 분류와 회귀로 나누어짐 분류는 샘플을 몇 개의 클래스 중 하나로 분류하는 문제이며, 회귀는 임의의 어떤 숫자를 예측하는 문제 회귀는 정해진 클래스가 없고 임의의 수치를 출력하며, 농의의 무게인 타킷(임의의 수치)을 예측하는 것도 회귀 k-최근접 이웃 분류 알고리즘은 예측하려는 샘플에 가장 가까운 샘플 k개를 선택하여 이 샘플들의 클래..

ML/혼자 공부하는 머신러닝 + 딥러닝

[혼공머신] 02. 데이터 다루기 - 데이터 전처리

핵심 키워드 #데이터 전처리 #표준 점수 #브로드캐스팅 올바른 결과 도출을 위해서 데이터를 사용하기 전에 데이터 전처리 과정을 거치므로 전처리 과정을 거친 데이터로 훈련했을 때의 차이를 알고 표준점수로 특성의 스케일을 변환하는 방법을 배우자 넘파이로 데이터 준비하기 나는 누구인가? 길이가 25cm이고 무게가 150g이면 도미인데 지금까지의 모델은 빙어라고 예측을 한다 무엇이 잘못된 걸까? 넘파이로 데이터 준비하기 도미와 빙어 데이터를 준비하는데 전에는 파이썬 리스트를 순회하면서 원소를 하나씩 꺼내 생선 하나의 길이와 무게를 리스트 안의 리스트로 직접 구성했음 하지만 이제 넘파이를 배웠으므로 훨씬 간편하게 생선 데이터를 준비 넘파이의 column_stack() 함수는 전달받은 리스트를 일렬로 세운 다음 차..

ML/혼자 공부하는 머신러닝 + 딥러닝

[혼공머신] 02. 데이터 다루기 - 훈련 세트와 테스트 세트

핵심 키워드 #지도 학습 #비지도 학습 #훈련 세트 #테스트 세트 지도 학습과 비지도 학습의 차이를 배운 후 모델을 훈련 시키는 훈련 세트와 모델을 평가하기 위한 테스트 세트로 데이터를 나눠서 학습하자 지도 학습과 비지도 학습 머신러닝 알고리즘은 지도 학습과 비지도 학습으로 나눌 수 있음 지도 학습 알고리즘 훈련하기 위한 데이터와 정답이 필요하며 데이터와 정답을 입력과 타깃이라고 부르며, 이 둘을 합쳐 훈련 데이터라고 부름 정답(타깃)이 있으니 알고리즘이 정답을 맞히는 것을 학습 예) 도미인지 빙어인지 구분하는 k-최근접 이웃 알고리즘 비지도 학습 알고리즘 타깃 없이 입력 데이터만 사용하며 정답을 사용하지 않으므로 무언가를 맞힐 수 없음 예) 특성의 개수를 줄이거나, 비슷한 샘플을 모으는 작업을 수행하여..

ML/혼자 공부하는 머신러닝 + 딥러닝

[혼공머신] 01. 나의 첫 머신러닝 - 마켓과 머신러닝

핵심 키워드 #특성 #훈련 #k-최근접 이웃 알고리즘 #모델 #정확도 가장 간단한 머신러닝 알고리즘 중 하나인 k-최근접 이웃을 사용하여 2개의 종류를 분류하는 머신러닝 모델을 훈련하자 생선 분류 문제 한빛 마켓에서 팔기 시작한 생선은 '도미', '곤들매기', '농어', '강꼬치고기', '로치', '빙어', '송어' 일 때 이 생선들을 프로그램으로 분류한다고 가정하면 어떻게 프로그램을 만들어야 할까? 전통적인 프로그램 도미를 잘 아는 김팀장이 생선 길이가 30cm 이상이면 도미라는 규칙을 알려주어 이를 바탕으로 파이썬 프로그램을 작성 하지만 30cm보다 큰 생선이 무조건 도미라고 말할 수 없음 머신러닝은 누구도 알려주지 않는 기준을 찾아서 일을 하여 규칙을 찾으므로 이러한 문제를 머신러닝으로 해결할 수 ..

ML/혼자 공부하는 머신러닝 + 딥러닝

[혼공머신] 01. 나의 첫 머신러닝 - 코랩과 주피터 노트북

핵심 키워드 #코랩 #노트북 #구글드라이브 웹 브라우저에서 파이썬 코드를 실행할 수 있는지 구글 코랩에 대해 소개하고 간단한 사용법을 익히자 구글 코랩 웹 브라우저에서 무료로 파이썬 프로그램을 테스트하고 저장할 수 있는 서비스로 텍스트와 파이썬 코드를 함께 쓸 수 있는 무료 서비스 구글 계정만 있다면 누구나 무료로 코랩을 사용할 수 있음 CPU 뿐만 아니라 GPU까지 무료로 제공 다양한 라이브러리 제공 (sklearn, tesoflow) 코랩 파일을 노트북 혹은 코랩 노트북이라고 부르며 노트북은 여러 개의 코드 셀과 텍스트 셀로 이루어짐 텍스트 셀 코드처럼 실행되는 것이 아니기 때문에 자유롭게 사용 가능 텍스트 셀에서는 HTML과 마크다운을 혼용해서 사용할 수 있음 텍스트 셀의 수정을 끝내려면 ESC 키..

ML/혼자 공부하는 머신러닝 + 딥러닝

[혼공머신] 01. 나의 첫 머신러닝 - 인공지능과 머신러닝, 딥러닝

핵심 키워드 #인공지능 #머신러닝 #딥러닝 인공지능, 머신러닝, 딥러닝이 무엇인지 알아보고 그 차이를 살펴보자 인공지능이란 사람처럼 학습하고 추론할 수 있는 지능을 가진 컴퓨터 시스템을 만드는 기술 인공지능의 역사 인공지능 태동기 워런 매컬러와 월터 피츠의 최초의 뇌의 뉴런 개념인 MCP 뉴런 앨런 튜링의 튜링 테스트 다트머스 AI 컨퍼런스 인공지능 황금기 프랑크 로젠블라트의 퍼셉트론 데이비드 허블과 토르스텐 비셀의 고양이를 사용한 시각 피질 뉴런 기능 연구 컴퓨터 성능의 한계로 인해 첫 번째 AI 겨울 전문가 시스템의 등장으로 두 번째 AI 붐 전문가 시스템 실패로 두 번째 AI 겨울 이 시기를 극복한 후엥 인공지능은 다시 각광받기 시작 손글씨 숫자를 인식하는 최초의 합성곱 신경망 LeNet-5 이미지..