본문 바로가기

전체 글523

47. Boruta에 대해서 알아보자. 이번 포스팅에서는 R 패키지인 Boruta의 변수 선택 알고리즘에 대한 개념을 알아보고자 한다. - 목차 - 1. Boruta란 무엇인가? 2. Boruta 변수 선택 알고리즘 3. 장단점 이번 포스팅은 랜덤 포레스트(Random Forest)의 대한 개념을 알아야 이해하는데 수월하다. 랜덤 포레스트(Random Forest)에 대한 개념을 잘 모르는 분들은 아래 포스팅을 참고하면 이해하는데 도움이 될 것이다. 24. 랜덤 포레스트(Random Forest)에 대해서 알아보자 24. 랜덤 포레스트(Random Forest)에 대해서 알아보자 이번 포스팅에서는 랜덤 포레스트(Random Forest)에 대해서 알아보고자 한다. 랜덤 포레스트(Random Forest)의 개념, 알고리즘, 여러 고려사항 및 .. 2023. 5. 27.
46. Extremely Randomized Tree(ERT)에 대해서 알아보자. 이번 포스팅에서는 랜덤 포레스트(Random Forest) 보다 더한층 Randomness를 강화한 Extremely Randomized Tree(ERT)에 대해서 알아보고자 한다. - 목차 - 1. Extremely Randomized Tree(ERT)이란 무엇인가? 2. Extremely Randomized Tree(ERT) 알고리즘 3. 장단점 이번 포스팅은 랜덤 포레스트에 대한 내용을 알면 도움이 된다. 랜덤 포레스트에 대한 개념을 잘 모르는 분들은 아래 포스팅에 잘 정리해 두었으니 참고하면 된다. 24. 랜덤 포레스트(Random Forest)에 대해서 알아보자 24. 랜덤 포레스트(Random Forest)에 대해서 알아보자 이번 포스팅에서는 랜덤 포레스트(Random Forest)에 대해서 .. 2023. 5. 26.
[Matplotlib] 눈금 라벨(Tick Label) 폰트 사이즈, 굵기 설정하기 안녕하세요~ 꽁냥이에요. 이번 포스팅에서는 지난 포스팅에서 다룬 tick_params를 이용한 눈금 라벨 꾸미기에서 다루지 못했던 내용을 소개하려고 합니다. 여기서는 간단하게 tick_params를 쓰지 않고 눈금 라벨 폰트 사이즈를 바꾸는 방법과 굵기(예: 볼드) 설정 방법에 대해서 알아보겠습니다. tick_params를 이용한 눈금 및 눈금 라벨 꾸미기(라벨 회전, 크기, 색상 등)에 대한 내용은 아래 포스팅을 참고해 주세요. [Matplotlib] 눈금과 눈금 라벨 꾸미기 (feat. tick_params) [Matplotlib] 눈금과 눈금 라벨 꾸미기 (feat. tick_params) 안녕하세요~ 꽁냥이입니다. 데이터 시각화를 하다 보면 좌표의 눈금과 눈금 라벨을 커스터마이징하고 싶을 때가 있.. 2023. 5. 24.
45. Extended Isolation Forest에 대해서 알아보자. 이번 포스팅에서는 기존 Isolation Forest의 단점을 극복한 Extended Isolation Forest에 대한 내용을 정리해보고자 한다. - 목차 - 1. Extended Isolation Forest이란 무엇인가? 2. Extended Isolation Forest 알고리즘 3. 장단점 이번 포스팅은 Isolation Forest에 대한 내용을 알아야 하므로 Isolation Forest를 잘 모르는 분들은 아래 포스팅을 참고하기 바란다. 44. Isolation Forest에 대해서 알아보자. 44. Isolation Forest에 대해서 알아보자. 이번 포스팅에서는 모델 기반 이상치 탐지 방법인 Isolation Forest에 대해서 알아보고자 한다. - 목차 - 1. Isolation.. 2023. 5. 21.
[Scikit-Learn] 30. Isolation Forest (feat. IsolationForest) Isolation Forest는 이진 탐색 나무를 이용하여 데이터의 이상치 여부를 판단하게 해주는 알고리즘이다. Scikit-Learn(sklearn)에서는 IsolationForest 클래스를 이용하면 Isolation Forest 알고리즘을 수행할 수 있다. 이번 포스팅에서는 IsolationForest의 사용법을 알아본다. Isolation Forest에 대한 개념은 아래 포스팅을 참고하기 바란다. 44. Isolation Forest에 대해서 알아보자. 44. Isolation Forest에 대해서 알아보자. 이번 포스팅에서는 모델 기반 이상치 탐지 방법인 Isolation Forest에 대해서 알아보고자 한다. - 목차 - 1. Isolation Forest이란 무엇인가? 2. Isolation.. 2023. 5. 21.
44. Isolation Forest에 대해서 알아보자. 이번 포스팅에서는 모델 기반 이상치 탐지 방법인 Isolation Forest에 대해서 알아보고자 한다. - 목차 - 1. Isolation Forest이란 무엇인가? 2. Isolation Forest 알고리즘 3. 예제 3. 장단점 1. Isolation Forest이란 무엇인가? 1) 정의 Isolation Forest는 이상치는 정상 데이터에 비하여 이진 탐색 나무(Binary Search Tree)로 고립이 잘될 것이라는 아이디어에 착안하여 개발된 알고리즘이다. Isolation Forest는 각 데이터에 대하여 이상치 점수를 계산하고 점수가 높을수록 이상치라고 판단한다. 2) 파헤치기 위 정의를 하나씩 파헤쳐보자. a. Isolation Forest는 이상치는 정상 데이터에 비하여 이진 탐색 .. 2023. 5. 20.
[Matplotlib] 메인 눈금(Major Tick), 서브 눈금(Minor Tick) 라벨 따로 지정하기 (feat. MultipleLocator) 안녕하세요~ 꽁냥이에요. 꽁냥이가 시각화를 하다가 메인 눈금(Major Tick), 서브 눈금(Minor Tick)에 라벨을 따로 설정해야 할 일이 생겼는데 이게 꽤나 번거로운 작업이어서 이번 포스팅에 정리해보려고 합니다. 메인 눈금(Major Tick), 서브 눈금(Minor Tick) 라벨 따로 지정 먼저 아래 코드는 A, B Class에서 5명의 수학, 역사, 컴퓨터 성적을 박스 플롯으로 그린 것입니다. 그러고 나서 A, B Class는 서브 눈금(Minor Tick) 라벨로하고 과목은 메인 눈금(Major Tick) 라벨로 설정할 것입니다. 여기서는 핵심적인 부분만 설명하기로 하고 나머지는 주석을 참고해 주세요. import pandas as pd import numpy as np import m.. 2023. 5. 18.
[Scikit-Learn] 29. Local Outlier Factor 계산하기 (feat. LocalOutlierFactor) Local Outlier Factor(LOF)는 밀도 기반 이상치 지표로써 이상치를 판별하고자 하는 점 주변의 밀도와 그 주변에 있는 점들의 밀도를 고려하여 이상치 여부를 판단하게 해주는 지표로 많이 활용된다. Scikit-Learn(sklearn)에서는 LocalOutlierFactor 클래스를 이용하여 LOF를 계산할 수 있다. 따라서 이번 포스팅에서는 LocalOutlierFactor 클래스 사용법을 알아보고자 한다. LOF에 대한 개념은 아래 포스팅에 자세히 정리해두었으니 궁금하신 분들은 참고하면 좋다. 42. Local Outlier Factor(LOF)에 대해서 알아보자 with Python 42. Local Outlier Factor(LOF)에 대해서 알아보자 with Python 이번 포스.. 2023. 5. 14.
43. Support Vector Data Description(SVDD)에 대해서 알아보자 with Python 이번 포스팅에서는 One-class SVM(1-SVM)과는 다른 방식으로 서포트 벡터 머신 기법을 이용하여 이상치 탐지를 수행하는 Support Vector Data Description(SVDD)에 대해서 알아보고자 한다. 여기서는 Support Vector Data Description(SVDD)의 개념과 파이썬 구현 방법에 대해서 다룬다. - 목차 - 1. Support Vector Data Description(SVDD)이란 무엇인가? 2. SVDD 구(Ball) 추정 방법 3. 파이썬 구현 4. 예제 5. 장단점 서포트 벡터 머신(SVM)에 대한 내용을 알면 SVDD를 이해하는 데 도움이 된다. 서포트 벡터 머신에 대한 개념은 아래 포스팅을 참고하면 알 수 있다. 19. 서포트 벡터 머신(Sup.. 2023. 5. 13.
42. Local Outlier Factor(LOF)에 대해서 알아보자 with Python 이번 포스팅에서는 밀도 기반 이상치 여부를 판단하는 지표인 Local Outlier Factor(LOF)에 대한 개념과 파이썬으로 구현해 보는 방법에 대해서 알아보고자 한다. - 목차 - 1. Local Outlier Factor란? 2. 파이썬 구현 3. 예제 4. 장단점 1. Local Outlier Factor란? 1) 정의 Local Outlier Factor(LOF)는 주어진 데이터가 이상치라면 해당 데이터의 밀도가 주변 이웃의 밀도보다 작을 것이라는 아이디어에 착안하여 만들어진 밀도 기반 이상치 탐지 지표이다. 2) 파헤치기 Local Outlier Factor(LOF)에 대하여 하나씩 살펴보자. LOF의 수학적 정의를 위해 필요한 사전 정의들을 먼저 알아보고 그에 대한 의미를 하나씩 알아보도.. 2023. 5. 13.

맨 위로