machine learning(5)
-
Clustering(군집화)
※ 본 카테고리의 글은 책 및 다른 자료들을 참고하여 작성되었습니다. ※ code in github:github.com/chaeyeongyoon/PythonML_Study chaeyeongyoon/PythonML_Study Contribute to chaeyeongyoon/PythonML_Study development by creating an account on GitHub. github.com Clustering은 비지도 학습 중 하나로, data를 몇 개의 cluster(부분 그룹)으로 나누는 과정을 의미합니다. 클러스터 내부 멤버들 사이는 서로 가깝게, 서로 다른 두 클러스터 사이의 멤버 간에는 서로 멀게 하는 것이 클러스터링의 목표입니다. 1. K-means algorithm clusterin..
2020.12.15 -
차원축소 (Demension Reduction)
비지도 학습 중 하나로 , 다차원의 dataset에서 차원을 축소해 새로운 dataset을 생성하는 것입니다. 다차원이면 data point간 거리가 기하급수적으로 멀어지고 sparse한 구조가 되므로 예측 신뢰도가 떨어집니다. 개별 피쳐간 상관관계가 높을 가능성이 커지기 때문입니다. 개별피쳐간 상관관계가 높다 = 다중공선성 존재 선형모델에서는 다중공선성 (Multicollinearity)이 존재하면 모델의 예측 성능이 떨어집니다. 이럴 때 차원을 축소시켜주면 직관적인 해석이 가능해집니다. 즉, 시각적표현이나 학습 처리가 편리해진다는 것 입니다. 차원축소에는 크게 Feature Selection, Feature Extraction이 있습니다. Feature Selection 특정 feature에 종속성 ..
2020.12.14 -
Regression (회귀)
Regression이란 데이터값이 평균과 같은 일정한 값으로 돌아가려는 경향을 이용한 통계학적 기법으로, 여러개의 독립변수와 하나의 종속변수의 상관관계를 알아냅니다. ● Linear Regression( 선형 회귀 ) 학습을 통해 회귀선을 구한다. 회귀선이 직선형태인 것이 선형 회귀이다. Linear regression의 hypothesis H(x) = Wx + b 학습을 통해 최적의 W와 b를 알아냅니다. 최적의 W와 b를 알아내는 데에는 Gradient Descent Algorithm을 사용합니다. cost는 보통 RSS를 사용합니다. 선형회귀 몇몇 알고리즘을 소개하겠습니다. ● 회귀모델 평가 지표 1. MAE( Mean Absolute Error) 2. MSE( Mean Squared Error) ..
2020.12.14 -
Classification
※ 본 카테고리의 글은 책 및 다른 자료들을 참고하여 작성되었습니다. ※ github:github.com/chaeyeongyoon/PythonML_Study chaeyeongyoon/PythonML_Study Contribute to chaeyeongyoon/PythonML_Study development by creating an account on GitHub. github.com 지도학습 중 하나인 Classification ( 분류 ) 에 대해서 알아보겠습니다. Naive Bayes, Logistic Regression, Decision Tree, Support Vector Machine, Nearest Neighbor, Neural Network, Ensemble 등의 알고리즘이 있습니다. 1...
2020.12.14 -
머신러닝 기초 지식
※ 본 카테고리의 글은 책 및 다른 자료들을 참고하여 작성되었습니다. ※ github:github.com/chaeyeongyoon/PythonML_Study chaeyeongyoon/PythonML_Study Contribute to chaeyeongyoon/PythonML_Study development by creating an account on GitHub. github.com 기본적으로 머신러닝은 dataset분리 ( train, test ) Machine Learning Algorithm 적용 ( model training ) prediction evaluation 순으로 진행됩니다. 크게 지도학습과 비지도학습으로 분리됩니다. ● 교차검증 ( Cross Validation ) overfitti..
2020.12.14