본문 바로가기

통계/머신러닝50

17. Dunn Index와 실루엣(Silhouette) 계수를 이용하여 최적 클러스터(군집, Cluster)개수 정하기 with Python 클러스터링 문제에서는 최적 클러스터(군집, Cluster) 개수를 정하는 것이 문제가 된다. 이번 포스팅에서는 Dunn Index와 실루엣(Silhouette) 계수를 이용하여 클러스터(군집, Cluster) 개수를 정하는 방법에 대해서 알아본다. - 목차 - 1. 데이터 준비 2. 최적 클러스터 개수 선정하기 이번 포스팅을 읽기에 앞서 Dunn Index와 실루엣(Silhouette) 계수에 대해서 생소하다면 아래 포스팅에 설명해 두었으니 참고하기 바란다. 12. 클러스터링(군집화) 평가 지표 Dunn Index with Python 12. 클러스터링(군집화) 평가 지표 Dunn Index with Python 이번 포스팅에서는 클러스터링(군집화)이 잘되었는지 정량적으로 확인할 수 있는 평가 지표로 D.. 2022. 5. 7.
16. 선형 회귀(Linear Regression) 모형에 대해서 알아보자 with Python 머신러닝 관련 포스팅을 하면서 아주 기본적이지만 이론적으로 강력한 선형 회귀 관련 내용을 포스팅하지 않았다는 것에 매우 놀랐다. 이번 포스팅에서는 선형 회귀 모형에 대해서 알아보고 파이썬(Python)을 이용하여 구현해보는 방법을 알아보려고 한다. 여기서 다루는 내용은 다음과 같다. 1. 선형 회귀(Linear Regression) 모형이란? 2. 선형 회귀(Linear Regression) 파이썬(Python) 구현하기 이 곳은 꽁냥이가 머신러닝을 공부한 내용을 정리하는 곳입니다. 이 포스팅에서는 수식을 포함하고 있습니다. 티스토리 피드에서는 수식이 제대로 표시되지 않을 수 있으니 웹브라우저 또는 모바일 웹브라우저로 보시길 바랍니다. 1. 선형 회귀(Linear Regression) 모형이란? - 정의.. 2022. 5. 6.
15. AdaBoost(Adaptive Boost) 알고리즘에 대해서 알아보자 with Python 이번 포스팅에서는 부스팅 알고리즘의 하나인 AdaBoost 알고리즘에 대해서 공부한 내용을 정리하고 직접 구현을 해보려고 한다. 또한 sklearn에서 제공하는 AdaBoost 알고리즘과 성능을 비교해보고자 한다. 이 글을 읽기 전에 의사결정나무에 대한 내용 정도는 알고 오면 좋다. 아래에 포스팅한 것이 있으니 참고하면 좋다. 9. 의사결정나무(Decision Tree) 에 대해서 알아보자 with Python 9. 의사결정나무(Decision Tree) 에 대해서 알아보자 with Python 이 곳은 꽁냥이가 머신러닝을 공부한 내용을 정리하는 곳입니다. 이 포스팅에서는 수식을 포함하고 있습니다. 티스토리 피드에서는 수식이 제대로 표시되지 않을 수 있으니 웹브라우저 또는 모 zephyrus1111.ti.. 2022. 5. 6.
14. 클러스터링(군집화) 평가지표 Silhouette(실루엣) 지수(계수)에 대해서 알아보자 with Python 이번 포스팅에서는 클러스터링(군집화)이 잘되었는지 정량적으로 확인할 수 있는 Silhouette(실루엣) 지수(계수)에 대해서 알아보고 파이썬(Python)으로 구현하는 방법에 대해서 알아보려고 한다. 또한 실제 샘플용 데이터를 이용하여 클러스터링(군집화) 결과를 평가해보려고 한다. 클러스터링(군집화) 결과를 평가할 수 있는 또 다른 유명한 지표로 Dunn Index가 있는데 이는 이전 포스팅에서 소개했는데 여기에 클러스터링(군집화)에 대한 필요성도 같이 설명하고 있으니 읽고 오면 좋다. 이번 포스팅에서 다룰 내용은 다음과 같다. 1. Silhouette(실루엣) 지수(계수) 란? 2. Silhouette(실루엣) 지수(계수) 파이썬(Python) 구현 이 곳은 꽁냥이가 머신러닝을 공부한 내용을 정리하는.. 2022. 5. 1.
13. Box-Cox Transformation(변환)에 대해서 알아보자 with Python 이번 포스팅에서는 Box-Cox Transformation(변환)에 대한 개념과 파이썬(Python)을 이용하여 어떻게 구현하는지 알아본다. 그리고 실제 데이터에 적용하여 Box - Cox Transformation(변환)이 어떻게 사용되는지 살펴보자. 여기서 다룰 내용은 다음과 같다. 1. Box-Cox Transformation(변환)이란? 2. Box-Cox Transformation(변환) 모수 추정 3. Box-Cox Transformation(변환) 장단점 4. 파이썬(Python) 구현 5. 실제 데이터 적용 이 곳은 꽁냥이가 머신러닝을 공부한 내용을 정리하는 곳입니다. 이 포스팅에서는 수식을 포함하고 있습니다. 티스토리 피드에서는 수식이 제대로 표시되지 않을 수 있으니 웹브라우저 또는 모바.. 2022. 5. 1.
12. Gaussian Mixture Model(가우시안 혼합 모형) 클러스터링(군집 분석)에 대해서 알아보자 with Python 이번 포스팅에서는 K-Means 클러스터링과 더불어 군집 분석에서 자주 사용되는 Gaussian Mixture Model 클러스터링(가우시안 혼합 모형 군집화)에 대해서 알아보고 파이썬(Python)으로 구현해보고자 한다. 1. Gaussian Mixture Model(가우시안 혼합 모형) 클러스터링이란? 2. Gaussian Mixture Model(가우시안 혼합 모형) 클러스터링 알고리즘 3. Gaussian Mixture Model(가우시안 혼합 모형) 클러스터링 장단점 4. Gaussian Mixture Model(가우시안 혼합 모형) 파이썬 구현 본 포스팅에서는 수식을 포함하고 있습니다. 티스토리 피드에서는 수식이 제대로 표시되지 않을 수 있으니 PC 웹 브라우저 또는 모바일 웹 브라우저에서 보.. 2022. 4. 25.
12. 클러스터링(군집화) 평가 지표 Dunn Index with Python 이번 포스팅에서는 클러스터링(군집화)이 잘되었는지 정량적으로 확인할 수 있는 평가 지표로 Dunn Index를 소개하려고 한다. 또한 Dunn Index를 파이썬(Python)으로 구현해보고자 한다. 1. 클러스터링(군집화) 평가의 필요성 2. Dunn Index 이 곳은 꽁냥이가 머신러닝을 공부한 내용을 정리하는 곳입니다. 이 포스팅에서는 수식을 포함하고 있습니다. 티스토리 피드에서는 수식이 제대로 표시되지 않을 수 있으니 웹브라우저 또는 모바일 웹브라우저로 보시길 바랍니다. 1. 클러스터링(군집화) 평가의 필요성 왜 클러스터링(군집화) 결과를 평가해야 할까? 1) 클러스터링(군집화) 알고리즘의 성능을 비교하기 위해서이다. 여러 다른 클러스터링 알고리즘을 이용하여 클러스터링 결과를 얻었다고 하자. 결과.. 2022. 4. 22.
11. K-Means 클러스터링(Clustering, 군집화)에 대해서 알아보자 with Python 이번 포스팅에서는 클러스터링(Clustering, 군집화)의 대표적인 알고리즘 중에 하나로 K-Means 클러스터링에 대해서 알아보려고 한다. 여기서 다루는 내용은 다음과 같다. 1. K-Means 클러스터링(Clustering, 군집화)이란? 2. K-Means 클러스터링(Clustering, 군집화) 알고리즘 3. K-Means 클러스터링(Clustering, 군집화) 장단점 4. K-Means 클러스터링(Clustering, 군집화) 파이썬 구현 본 포스팅에서는 수식을 포함하고 있습니다. 티스토리 피드에서는 수식이 제대로 표시되지 않을 수 있으니 PC 웹 브라우저 또는 모바일 웹 브라우저에서 보시기 바랍니다. 1. K-Means 클러스터링(Clustering, 군집화)이란? - 정의 - K-Mean.. 2022. 4. 21.
10. 가지치기(Pruning)에 대해서 알아보자 with Python 의사결정나무는 그 자체로 해석이 쉽다는 장점과 모형을 나무 형태로 보여줄 수 있다는 장점 덕분에 많이 사용한다. 하지만 잘못하면 너무 깊은(사이즈가 큰) 나무가 생성되어 모형의 과적합(Overfitting)을 유발할 수 있다. 이때 가지치기(Post Pruning)를 통하여 과적합을 방지하는데 이번 포스팅에서는 이러한 가지치기(Post Pruning)에 대해서 알아보고자 한다. 여기서 다루는 내용은 다음과 같다. 1. Cost Complexity Pruning 2. Reduced Error Pruning 3. 구현하기(Implementation) 4. 데이터에 적용해보기 본 포스팅을 읽어보기 전에 의사결정나무에 대한 내용을 이전 포스팅에서 정리해두었으니 먼저 읽어보자. 또한 노드와 마디는 같은 뜻이니 상.. 2021. 7. 5.
9. 의사결정나무(Decision Tree) 에 대해서 알아보자 with Python 이번 포스팅에서는 모형의 해석이 쉽다는 장점을 가진 의사결정나무를 공부한 내용을 포스팅하려고 한다. 의사결정이 무엇인지 알아보고 의사결정나무 모형을 직접 구현하는 방법을 소개하고 마지막에 실제 데이터를 이용하여 앞서 만든 모형이 잘 동작하는지 확인해볼 것이다. 또한 sklearn을 이용하는 방법도 소개한다. 여기서 다루는 내용은 다음과 같다. 1. 의사결정나무란? 2. 의사결정나무 모형 만들기 3. 의사결정나무 구현하기 4. 예제 with Python 1. 의사결정나무란? - 정의 - 의사결정나무(Decision Tree)는 입력값에 대한 예측값을 나무 형태로 나타내어주는 모형이다. - 용어 정리 - 먼저 의사결정나무에서 사용되는 주요 용어를 살펴보자. 뿌리 마디(root node) : 시작되는 마디로 .. 2021. 6. 10.

맨 위로