본문 바로가기

통계95

47. Boruta에 대해서 알아보자. 이번 포스팅에서는 R 패키지인 Boruta의 변수 선택 알고리즘에 대한 개념을 알아보고자 한다. - 목차 - 1. Boruta란 무엇인가? 2. Boruta 변수 선택 알고리즘 3. 장단점 이번 포스팅은 랜덤 포레스트(Random Forest)의 대한 개념을 알아야 이해하는데 수월하다. 랜덤 포레스트(Random Forest)에 대한 개념을 잘 모르는 분들은 아래 포스팅을 참고하면 이해하는데 도움이 될 것이다. 24. 랜덤 포레스트(Random Forest)에 대해서 알아보자 24. 랜덤 포레스트(Random Forest)에 대해서 알아보자 이번 포스팅에서는 랜덤 포레스트(Random Forest)에 대해서 알아보고자 한다. 랜덤 포레스트(Random Forest)의 개념, 알고리즘, 여러 고려사항 및 .. 2023. 5. 27.
46. Extremely Randomized Tree(ERT)에 대해서 알아보자. 이번 포스팅에서는 랜덤 포레스트(Random Forest) 보다 더한층 Randomness를 강화한 Extremely Randomized Tree(ERT)에 대해서 알아보고자 한다. - 목차 - 1. Extremely Randomized Tree(ERT)이란 무엇인가? 2. Extremely Randomized Tree(ERT) 알고리즘 3. 장단점 이번 포스팅은 랜덤 포레스트에 대한 내용을 알면 도움이 된다. 랜덤 포레스트에 대한 개념을 잘 모르는 분들은 아래 포스팅에 잘 정리해 두었으니 참고하면 된다. 24. 랜덤 포레스트(Random Forest)에 대해서 알아보자 24. 랜덤 포레스트(Random Forest)에 대해서 알아보자 이번 포스팅에서는 랜덤 포레스트(Random Forest)에 대해서 .. 2023. 5. 26.
45. Extended Isolation Forest에 대해서 알아보자. 이번 포스팅에서는 기존 Isolation Forest의 단점을 극복한 Extended Isolation Forest에 대한 내용을 정리해보고자 한다. - 목차 - 1. Extended Isolation Forest이란 무엇인가? 2. Extended Isolation Forest 알고리즘 3. 장단점 이번 포스팅은 Isolation Forest에 대한 내용을 알아야 하므로 Isolation Forest를 잘 모르는 분들은 아래 포스팅을 참고하기 바란다. 44. Isolation Forest에 대해서 알아보자. 44. Isolation Forest에 대해서 알아보자. 이번 포스팅에서는 모델 기반 이상치 탐지 방법인 Isolation Forest에 대해서 알아보고자 한다. - 목차 - 1. Isolation.. 2023. 5. 21.
44. Isolation Forest에 대해서 알아보자. 이번 포스팅에서는 모델 기반 이상치 탐지 방법인 Isolation Forest에 대해서 알아보고자 한다. - 목차 - 1. Isolation Forest이란 무엇인가? 2. Isolation Forest 알고리즘 3. 예제 3. 장단점 1. Isolation Forest이란 무엇인가? 1) 정의 Isolation Forest는 이상치는 정상 데이터에 비하여 이진 탐색 나무(Binary Search Tree)로 고립이 잘될 것이라는 아이디어에 착안하여 개발된 알고리즘이다. Isolation Forest는 각 데이터에 대하여 이상치 점수를 계산하고 점수가 높을수록 이상치라고 판단한다. 2) 파헤치기 위 정의를 하나씩 파헤쳐보자. a. Isolation Forest는 이상치는 정상 데이터에 비하여 이진 탐색 .. 2023. 5. 20.
43. Support Vector Data Description(SVDD)에 대해서 알아보자 with Python 이번 포스팅에서는 One-class SVM(1-SVM)과는 다른 방식으로 서포트 벡터 머신 기법을 이용하여 이상치 탐지를 수행하는 Support Vector Data Description(SVDD)에 대해서 알아보고자 한다. 여기서는 Support Vector Data Description(SVDD)의 개념과 파이썬 구현 방법에 대해서 다룬다. - 목차 - 1. Support Vector Data Description(SVDD)이란 무엇인가? 2. SVDD 구(Ball) 추정 방법 3. 파이썬 구현 4. 예제 5. 장단점 서포트 벡터 머신(SVM)에 대한 내용을 알면 SVDD를 이해하는 데 도움이 된다. 서포트 벡터 머신에 대한 개념은 아래 포스팅을 참고하면 알 수 있다. 19. 서포트 벡터 머신(Sup.. 2023. 5. 13.
42. Local Outlier Factor(LOF)에 대해서 알아보자 with Python 이번 포스팅에서는 밀도 기반 이상치 여부를 판단하는 지표인 Local Outlier Factor(LOF)에 대한 개념과 파이썬으로 구현해 보는 방법에 대해서 알아보고자 한다. - 목차 - 1. Local Outlier Factor란? 2. 파이썬 구현 3. 예제 4. 장단점 1. Local Outlier Factor란? 1) 정의 Local Outlier Factor(LOF)는 주어진 데이터가 이상치라면 해당 데이터의 밀도가 주변 이웃의 밀도보다 작을 것이라는 아이디어에 착안하여 만들어진 밀도 기반 이상치 탐지 지표이다. 2) 파헤치기 Local Outlier Factor(LOF)에 대하여 하나씩 살펴보자. LOF의 수학적 정의를 위해 필요한 사전 정의들을 먼저 알아보고 그에 대한 의미를 하나씩 알아보도.. 2023. 5. 13.
41. One-class Support Vector Machine(1-SVM)에 대하여 알아보자 with Python 이번 포스팅에서는 모델 기반 이상치 탐지 방법론 중에 하나인 One-class Support Vector Machine(1-SVM)에 대해 알아보고자 한다. 여기에서는 One-class Support Vector Machine(1-SVM)의 개념과 파이썬 구현 방법을 소개한다. - 목차 - 1. One-class Support Vector Machine(1-SVM)란 무엇인가? 2. 1-SVM 평면 추정 방법 3. 파이썬 구현 4. 예제 5. 장단점 이번 포스팅은 지도학습으로써의 서포트 벡터 머신 내용을 알면 도움이 된다. 이에 대한 내용은 아래 포스팅을 참고하면 된다. 19. 서포트 벡터 머신(Support Vector Machine)에 대해서 알아보자 with Python 19. 서포트 벡터 머신(S.. 2023. 5. 12.
40. 인자 분석(Factor Analysis)에 대해서 알아보자 with Python 이번 포스팅에서는 다변량 분석 기법의 하나인 인자 분석(Factor Analysis)에 대한 개념과 파이썬으로 구현하는 방법에 대해서 알아보고자 한다. - 목차 - 1. 인자 분석(Factor Analysis)이란? 2. 인자 분석(Factor Analysis) 과정 3. 파이썬 구현 4. 예제 5. 장단점 1. 인자 분석(Factor Analysis)이란? 1) 정의 인자 분석(Factor Analysis)이란 변수들이 갖고 있는 상관 구조를 잠재적인 공통인자를 이용하여 설명하는 다변량 분석 기법이다. 인자 분석에서는 변수와 잠재적인 공통인자 사이의 관계를 나타내는 통계적 모형을 설정하여 변수들 간 상호 관계를 잠재적인 공통인자를 찾아내어 해석한다. 2) 파헤치기 앞에서 정의한 내용을 구체적으로 파헤쳐.. 2023. 5. 3.
39. 정준 상관 분석(Canonical Correlation Analysis)에 대해서 알아보자 with Python 이번 포스팅에서는 다변량 분석 방법 중 하나인 정준 상관 분석(Canonical Correlation Analysis : CCA)에 대한 개념과 파이썬 구현 방법에 대해서 알아보고자 한다. - 목차 - 1. 정준 상관 분석이란? 2. 분석 절차 3. 파이썬 구현 4. 예제 5. 장단점 1. 정준 상관 분석이란? 1) 정의 정준 상관 분석(Canonical Correlation Analysis : CCA)이란 종속 변수 집단과 설명 변수 집단(또는 독립 변수 집단)의 상관 구조를 잘 설명하는 종속 변수 선형 결합과 설명 변수 선형 결합을 찾고 이러한 선형 결합들을 이용하여 두 변수 집단의 상관성을 효과적으로 분석하는 방법론을 말한다. 2) 파헤치기 앞에서 정의한 내용을 좀 더 자세하게 알아보자. a. CC.. 2023. 4. 23.
38. 부분 최소 제곱 회귀(Partial Least Square Regression : PLSR)에 대해서 알아보자 with Python 이번 포스팅에서는 부분 최소 제곱 회귀(Partial Least Square Regression : PLSR)에 대한 개념과 파이썬 구현 방법을 알아보고자 한다. - 목차 - 1. 부분 최소 제곱 회귀(Partial Least Square Regression : PLSR)란? 2. 파이썬 구현 3. 예제 4. 장단점 PLSR을 이해하기 위해선 주성분 분석에 대한 이해가 필요하다. 아래 포스팅에 주성분 분석에 대한 내용을 정리해 두었으니 참고하면 된다. 37. 주성분 분석(Principal Component Analysis : PCA)에 대해서 알아보자 with Python 37. 주성분 분석(Principal Component Analysis : PCA)에 대해서 알아보자 with Python 이번 포스.. 2023. 4. 8.

맨 위로