본문 바로가기

프로그래밍/Scikit-Learn30

[Scikit-Learn] 30. Isolation Forest (feat. IsolationForest) Isolation Forest는 이진 탐색 나무를 이용하여 데이터의 이상치 여부를 판단하게 해주는 알고리즘이다. Scikit-Learn(sklearn)에서는 IsolationForest 클래스를 이용하면 Isolation Forest 알고리즘을 수행할 수 있다. 이번 포스팅에서는 IsolationForest의 사용법을 알아본다. Isolation Forest에 대한 개념은 아래 포스팅을 참고하기 바란다. 44. Isolation Forest에 대해서 알아보자. 44. Isolation Forest에 대해서 알아보자. 이번 포스팅에서는 모델 기반 이상치 탐지 방법인 Isolation Forest에 대해서 알아보고자 한다. - 목차 - 1. Isolation Forest이란 무엇인가? 2. Isolation.. 2023. 5. 21.
[Scikit-Learn] 29. Local Outlier Factor 계산하기 (feat. LocalOutlierFactor) Local Outlier Factor(LOF)는 밀도 기반 이상치 지표로써 이상치를 판별하고자 하는 점 주변의 밀도와 그 주변에 있는 점들의 밀도를 고려하여 이상치 여부를 판단하게 해주는 지표로 많이 활용된다. Scikit-Learn(sklearn)에서는 LocalOutlierFactor 클래스를 이용하여 LOF를 계산할 수 있다. 따라서 이번 포스팅에서는 LocalOutlierFactor 클래스 사용법을 알아보고자 한다. LOF에 대한 개념은 아래 포스팅에 자세히 정리해두었으니 궁금하신 분들은 참고하면 좋다. 42. Local Outlier Factor(LOF)에 대해서 알아보자 with Python 42. Local Outlier Factor(LOF)에 대해서 알아보자 with Python 이번 포스.. 2023. 5. 14.
[Scikit-Learn] 28. One-class SVM(1-SVM) 모형 학습하기 (feat. OneClassSVM) One-class SVM(1-SVM)은 정상 데이터 중에서 이상치를 예측할 때 많이 활용되는 모형으로 Scikit-Learn(sklearn)에서는 OneClassSVM 클래스를 이용하여 One-class SVM(1-SVM) 모형을 학습할 수 있다. 이번 포스팅에서는 Scikit-Learn(sklearn)에서 제공하는 OneClassSVM의 기본적인 사용방법을 알아보고자 한다. One-class SVM(1-SVM)에 대한 개념은 아래 포스팅을 참고하기 바란다. 41. One-class Support Vector Machine(1-SVM)에 대하여 알아보자 with Python 41. One-class Support Vector Machine(1-SVM)에 대하여 알아보자 with Python 이번 포스팅에.. 2023. 5. 12.
[Scikit-Learn] 27. Factor Analysis(인자 분석) 해보기 (feat. FactorAnalysis) 인자 분석은 변수들의 상관 구조를 공통 인자를 이용하여 분석하는 방법이다. 이번 포스팅에서는 Scikit-Learn(sklearn)에서 인자 분석(Factor Analysis)을 수행하는 데 필요한 인자 적재 행렬과 인자 점수를 계산하는 방법에 대해서 알아보려고 한다. 인자 분석에 대한 개념은 아래 포스팅을 참고하기 바란다. 40. 인자 분석(Factor Analysis)에 대해서 알아보자 with Python 40. 인자 분석(Factor Analysis)에 대해서 알아보자 with Python 이번 포스팅에서는 다변량 분석 기법의 하나인 인자 분석(Factor Analysis)에 대한 개념과 파이썬으로 구현하는 방법에 대해서 알아보고자 한다. - 목차 - 1. 인자 분석(Factor Analysis).. 2023. 5. 5.
[Scikit-Learn] 26. Canonical Correlation Analysis(정준 상관 분석) (feat. CCA) 이번 포스팅에서는 Scikit-Learn(sklearn)을 이용하여 정준 상관 분석(Canonical Correlation Analysis)을 수행하는 방법을 알아보려고 한다. 정준 상관 분석(Canonical Correlation Analysis)에 대한 개념은 아래 포스팅을 참고하기 바란다. 39. 정준 상관 분석(Canonical Correlation Analysis)에 대해서 알아보자 with Python 39. 정준 상관 분석(Canonical Correlation Analysis)에 대해서 알아보자 with Python 이번 포스팅에서는 다변량 분석 방법 중 하나인 정준 상관 분석(Canonical Correlation Analysis : CCA)에 대한 개념과 파이썬 구현 방법에 대해서 알아.. 2023. 5. 5.
[Scikit-Learn] 25. One-Hot Encoding 변환하기 (feat. OneHotEncoder) Scikit-Learn에서는 OneHotEncoder 클래스를 이용하여 범주형 변수를 One-Hot Encoding으로 변환할 수 있다. 이번 포스팅에서는 OneHotEncoder을 이용하여 One-Hot Encoding을 수행하는 방법을 알아본다. OneHotEncoder 사용법 여기서는 붓꽃 데이터의 붓꽃 범주를 One-Hot Encoding으로 변환해보고자 한다. OneHotEncoder는 범주형 변수가 반드시 2차원 배열로 되어있어야 한다. import numpy as np from sklearn.preprocessing import OneHotEncoder from sklearn.datasets import load_iris iris = load_iris() category = np.array(.. 2023. 4. 9.
[Scikit-Learn] 24. Partial Least Square Regression 모형 적합하기 (feat. PLSRegression) Scikit-Learn에서는 PLSRegression 클래스를 이용하여 부분 최소 제곱 회귀(Partial Least Square Regression : PLSR) 모형을 학습할 수 있다. 이번 포스팅에서는 PLSRegression 클래스의 기본적인 사용법에 대해서 알아본다. 부분 최소 제곱 회귀(Partial Least Square Regression : PLSR) 모형에 대한 개념은 아래 포스팅을 참고하면 된다. 38. 부분 최소 제곱 회귀(Partial Least Square Regression : PLSR)에 대해서 알아보자 with Python 38. 부분 최소 제곱 회귀(Partial Least Square Regression : PLSR)에 대해서 알아보자 with Python 이번 포스팅에.. 2023. 4. 8.
[Scikit-Learn] 23. 주성분 분석(Principal Component Analysis) (feat. PCA) 주성분 분석(Principal Component Analysis)은 예측 모형에 사용될 변수를 새롭게 만들거나 차원 축소를 통한 데이터 요약을 위해 많이 사용된다. Scikit-Learn(sklearn)에서는 PCA 객체를 이용하여 주성분 분석을 할 수 있다. 이번 포스팅에서는 PCA에 대한 사용법을 알아보고자 한다. 주성분 분석(Principal Component Analysis)에 대한 개념은 아래 포스팅에 정리해 두었으니 참고하면 된다. 37. 주성분 분석(Principal Component Analysis : PCA)에 대해서 알아보자 with Python 37. 주성분 분석(Principal Component Analysis : PCA)에 대해서 알아보자 with Python 이번 포스팅에서는 .. 2023. 4. 2.
[Scikit-Learn] 22. ROC 곡선과 AUC (feat. roc_score, RocCurveDisplay, roc_auc_score, auc) ROC(Receiver Operating Characteristic) 곡선과 AUC(Area Under the Curve)은 2 분류 예측 모형의 성능을 평가할 때 사용된다. Scikit-Learn(sklearn)에서는 ROC 곡선을 그리고 AUC 값을 계산할 수 있는 함수를 제공하는데 roc_score, RocCurveDisplay, roc_auc_score, auc, 가 오늘의 주인공이다. 이번 포스팅에서는 roc_score, RocCurveDisplay, roc_auc_score, auc의 사용법을 알아보고자 한다. ROC 곡선과 AUC에 대한 개념이 궁금하면 아래 포스팅을 참고하면 된다. 34. ROC(Receiver Operating Characteristic) 곡선과 AUC(Area Under.. 2023. 2. 2.
[Scikit-Learn] 21. Gaussian Mixture Model 클러스터링 (feat. GaussianMixture) Scikit-Learn(sklearn)에서는 가우시안 혼합 모형(Gaussian Mixture Model) 클러스터링 알고리즘을 수행할 수 있는 클래스를 구현하였다. GaussianMixture가 바로 그것이다. 이번 포스팅에서는 GaussianMixture를 이용한 가우시안 혼합 모형(Gaussian Mixture Model) 클러스터링을 해보고자 한다. 가우시안 혼합 모형(Gaussian Mixture Model) 클러스터링 알고리즘의 개념은 아래 포스팅을 참고하기 바란다. 12. Gaussian Mixture Model(가우시안 혼합 모형) 클러스터링(군집 분석)에 대해서 알아보자 with Python 12. Gaussian Mixture Model(가우시안 혼합 모형) 클러스터링(군집 분석)에 대.. 2023. 1. 22.

맨 위로