본문 바로가기

전체523

16. 선형 회귀(Linear Regression) 모형에 대해서 알아보자 with Python 머신러닝 관련 포스팅을 하면서 아주 기본적이지만 이론적으로 강력한 선형 회귀 관련 내용을 포스팅하지 않았다는 것에 매우 놀랐다. 이번 포스팅에서는 선형 회귀 모형에 대해서 알아보고 파이썬(Python)을 이용하여 구현해보는 방법을 알아보려고 한다. 여기서 다루는 내용은 다음과 같다. 1. 선형 회귀(Linear Regression) 모형이란? 2. 선형 회귀(Linear Regression) 파이썬(Python) 구현하기 이 곳은 꽁냥이가 머신러닝을 공부한 내용을 정리하는 곳입니다. 이 포스팅에서는 수식을 포함하고 있습니다. 티스토리 피드에서는 수식이 제대로 표시되지 않을 수 있으니 웹브라우저 또는 모바일 웹브라우저로 보시길 바랍니다. 1. 선형 회귀(Linear Regression) 모형이란? - 정의.. 2022. 5. 6.
15. AdaBoost(Adaptive Boost) 알고리즘에 대해서 알아보자 with Python 이번 포스팅에서는 부스팅 알고리즘의 하나인 AdaBoost 알고리즘에 대해서 공부한 내용을 정리하고 직접 구현을 해보려고 한다. 또한 sklearn에서 제공하는 AdaBoost 알고리즘과 성능을 비교해보고자 한다. 이 글을 읽기 전에 의사결정나무에 대한 내용 정도는 알고 오면 좋다. 아래에 포스팅한 것이 있으니 참고하면 좋다. 9. 의사결정나무(Decision Tree) 에 대해서 알아보자 with Python 9. 의사결정나무(Decision Tree) 에 대해서 알아보자 with Python 이 곳은 꽁냥이가 머신러닝을 공부한 내용을 정리하는 곳입니다. 이 포스팅에서는 수식을 포함하고 있습니다. 티스토리 피드에서는 수식이 제대로 표시되지 않을 수 있으니 웹브라우저 또는 모 zephyrus1111.ti.. 2022. 5. 6.
Multi-class AdaBoost 이번 포스팅은 기존 이진(Binary Class) 분류를 위한 AdaBoost 알고리즘을 Multi class AdaBoost로 확장시킨 Zhu, H. Zou, S. Rosset, T. Hastie의 논문 "Multi-class AdaBoost"를 리뷰하려고 한다. - 목차 - 1. Introduction 2. Statistical Justification 3. Numerical Results 4. Discussion 본 포스팅에서는 수식을 포함하고 있습니다. 티스토리 피드에서는 수식이 제대로 표시되지 않을 수 있으니 PC 웹 브라우저 또는 모바일 웹 브라우저에서 보시기 바랍니다. 1. Introduction 부스팅(Boosting)은 2 클래스 분류 문제에서 만큼은 아주 성공적인 알고리즘이었다. 반면 .. 2022. 5. 3.
14. 클러스터링(군집화) 평가지표 Silhouette(실루엣) 지수(계수)에 대해서 알아보자 with Python 이번 포스팅에서는 클러스터링(군집화)이 잘되었는지 정량적으로 확인할 수 있는 Silhouette(실루엣) 지수(계수)에 대해서 알아보고 파이썬(Python)으로 구현하는 방법에 대해서 알아보려고 한다. 또한 실제 샘플용 데이터를 이용하여 클러스터링(군집화) 결과를 평가해보려고 한다. 클러스터링(군집화) 결과를 평가할 수 있는 또 다른 유명한 지표로 Dunn Index가 있는데 이는 이전 포스팅에서 소개했는데 여기에 클러스터링(군집화)에 대한 필요성도 같이 설명하고 있으니 읽고 오면 좋다. 이번 포스팅에서 다룰 내용은 다음과 같다. 1. Silhouette(실루엣) 지수(계수) 란? 2. Silhouette(실루엣) 지수(계수) 파이썬(Python) 구현 이 곳은 꽁냥이가 머신러닝을 공부한 내용을 정리하는.. 2022. 5. 1.
[Python] 단어 집합(리스트, 튜플)에서 특정 단어와 가장 유사한 단어 찾기 difflib.get_close_matches 이번 포스팅에서는 여러 단어 집합(리스트, 튜플)에서 특정 단어와 가장 유사한 단어를 파이썬(Python)을 이용해서 찾는 방법을 소개한다. 이전 포스팅에서는 단어와 단어의 유사도를 계산하는 방법을 알아보았는데 이번에는 단어 집합 속에서 특정 단어와 가장 유사한 단어를 찾는다는 점에서 차이가 있다. 파이썬 내장 모듈 difflib의 get_close_matches를 이용하면 특정 단어와 가장 유사한 단어를 집합에서 빼내올 수 있다. difflib.get_close_matches 사용법 get_close_matches는 word, possibilities, n, cutoff 총 4개의 인자를 가지며 의미는 다음과 같다. word = 비교 기준이 되는 단어 possibilities = 비교하려는 단어 집합 .. 2022. 5. 1.
[Python] difflib.SequenceMatcher 두 문자열(단어)의 유사도(Similarity) 계산하기 코딩을 하다가 파이썬(Python)으로 두 문자열(단어)의 유사도(Similarity)를 계산해야할 일이 있어서 이를 어찌할까 검색해보다가 Stackoverflow 에서 고수분이 알려주신 테크닉을 여기에 적어보려고 한다. 두 문자열(단어) 유사도 계산 difflib은 파이썬 내장 모듈이다. 여기에 SequenceMatcher를 이용하면 두 단어의 유사도를 알 수 있다. 이때 두 단어의 유사도는 ratio라는 메서드를 이용하면 되는데 이를 이용하여 두 문자열(단어)의 유사도(Similarity)를 계산하는 함수를 만들었다. from difflib import SequenceMatcher def similar(a, b): return SequenceMatcher(None, a, b).ratio() 이제 ma.. 2022. 5. 1.
13. Box-Cox Transformation(변환)에 대해서 알아보자 with Python 이번 포스팅에서는 Box-Cox Transformation(변환)에 대한 개념과 파이썬(Python)을 이용하여 어떻게 구현하는지 알아본다. 그리고 실제 데이터에 적용하여 Box - Cox Transformation(변환)이 어떻게 사용되는지 살펴보자. 여기서 다룰 내용은 다음과 같다. 1. Box-Cox Transformation(변환)이란? 2. Box-Cox Transformation(변환) 모수 추정 3. Box-Cox Transformation(변환) 장단점 4. 파이썬(Python) 구현 5. 실제 데이터 적용 이 곳은 꽁냥이가 머신러닝을 공부한 내용을 정리하는 곳입니다. 이 포스팅에서는 수식을 포함하고 있습니다. 티스토리 피드에서는 수식이 제대로 표시되지 않을 수 있으니 웹브라우저 또는 모바.. 2022. 5. 1.
Profile Likelihood 란 무엇인가?! 이번 포스팅은 Profile Likelihood란 무엇인지 알아보려고 한다. 여기서 다루는 내용은 다음과 같다. 1. Profile Likelihood 추정법 2. Profile Likelihood 예제 본 포스팅에서는 수식을 포함하고 있습니다. 티스토리 피드에서는 수식이 제대로 표시되지 않을 수 있으니 PC 웹 브라우저 또는 모바일 웹 브라우저에서 보시기 바랍니다. 1. Profile Likelihood 추정법 - Profile Likelihood 탄생 배경 - 먼저 표본 $X_i, i=1, \ldots, n$이 독립이고 동일한 확률 밀도 함수 $f_{\theta}$로부터 추출되었다고 하자. 즉, $$X_i \sim \text{ i.i.d } f_{\theta}$$ 이다. 우리의 목표는 데이터를 이용하.. 2022. 4. 30.
A Method for Computing Profile-Likelihood-Based Confidence Intervals 개인적으로 Profile Likelihood(PL)를 공부하다가 PL을 이용한 신뢰구간을 어떻게 계산하는지 궁금해서 찾아본 논문이 'A Method for Computing Profile-Likelihood-Based Confidence Intervals'이었다. 이번 포스팅에서는 이 논문을 읽고 요약한 내용을 정리하려고 한다. 1. 'Profile-Likelihood-Based' Confidence Intervals 2. Basis of the Algorithm 3. Performance in Simulations 4. Examples 5. Discussion 본 포스팅에서는 수식을 포함하고 있습니다. 티스토리 피드에서는 수식이 제대로 표시되지 않을 수 있으니 PC 웹 브라우저 또는 모바일 웹 브라우저.. 2022. 4. 30.
bar_chart_race 패키지로 움직이는 막대 그래프(Bar Chart, 바 차트) 그려보기 with Python 안녕하세요~ 꽁냥이에요. 최근에 움직이는 막대그래프에 관심이 생겼는데요. 왜냐하면 시간에 따라서 막대그래프들이 순위 경쟁을 통하여 위치가 바뀌는 것이 신기하더라고요. 움직이는 막대들이 마치 race를 한다고 해서 이러한 차트를 Race Bar Chart라고 합니다. 이러한 움직이는 막대그래프(Race Bar Chart)는 파이썬(Python)으로 어떻게 구현하는지 궁금하여 관련 내용을 찾아보다가 아주 좋은 패키지를 발견해서 공유해드리려고 해요. 바로 bar_chart_race라는 패키지인데요. 이게 정말 사용하기 쉽고 다양한 기능을 조절할 수 있어서 너무 좋더라고요. 따라서 이번 포스팅에서는 움직이는 막대그래프(Race Bar Chart)를 그려주는 파이썬(Python) 패키지 bar_chart_race.. 2022. 4. 28.

맨 위로