머신러닝(4)
-
Clustering(군집화)
※ 본 카테고리의 글은 책 및 다른 자료들을 참고하여 작성되었습니다. ※ code in github:github.com/chaeyeongyoon/PythonML_Study chaeyeongyoon/PythonML_Study Contribute to chaeyeongyoon/PythonML_Study development by creating an account on GitHub. github.com Clustering은 비지도 학습 중 하나로, data를 몇 개의 cluster(부분 그룹)으로 나누는 과정을 의미합니다. 클러스터 내부 멤버들 사이는 서로 가깝게, 서로 다른 두 클러스터 사이의 멤버 간에는 서로 멀게 하는 것이 클러스터링의 목표입니다. 1. K-means algorithm clusterin..
2020.12.15 -
Regression (회귀)
Regression이란 데이터값이 평균과 같은 일정한 값으로 돌아가려는 경향을 이용한 통계학적 기법으로, 여러개의 독립변수와 하나의 종속변수의 상관관계를 알아냅니다. ● Linear Regression( 선형 회귀 ) 학습을 통해 회귀선을 구한다. 회귀선이 직선형태인 것이 선형 회귀이다. Linear regression의 hypothesis H(x) = Wx + b 학습을 통해 최적의 W와 b를 알아냅니다. 최적의 W와 b를 알아내는 데에는 Gradient Descent Algorithm을 사용합니다. cost는 보통 RSS를 사용합니다. 선형회귀 몇몇 알고리즘을 소개하겠습니다. ● 회귀모델 평가 지표 1. MAE( Mean Absolute Error) 2. MSE( Mean Squared Error) ..
2020.12.14 -
Classification
※ 본 카테고리의 글은 책 및 다른 자료들을 참고하여 작성되었습니다. ※ github:github.com/chaeyeongyoon/PythonML_Study chaeyeongyoon/PythonML_Study Contribute to chaeyeongyoon/PythonML_Study development by creating an account on GitHub. github.com 지도학습 중 하나인 Classification ( 분류 ) 에 대해서 알아보겠습니다. Naive Bayes, Logistic Regression, Decision Tree, Support Vector Machine, Nearest Neighbor, Neural Network, Ensemble 등의 알고리즘이 있습니다. 1...
2020.12.14 -
머신러닝 기초 지식
※ 본 카테고리의 글은 책 및 다른 자료들을 참고하여 작성되었습니다. ※ github:github.com/chaeyeongyoon/PythonML_Study chaeyeongyoon/PythonML_Study Contribute to chaeyeongyoon/PythonML_Study development by creating an account on GitHub. github.com 기본적으로 머신러닝은 dataset분리 ( train, test ) Machine Learning Algorithm 적용 ( model training ) prediction evaluation 순으로 진행됩니다. 크게 지도학습과 비지도학습으로 분리됩니다. ● 교차검증 ( Cross Validation ) overfitti..
2020.12.14