본문 바로가기

전체523

[Pandas] 26. 단순 이동 평균 계산하기 feat. rolling.mean() 안녕하세요~ 꽁냥이에요. 이번 포스팅에서는 Pandas에서 단순 이동 평균값을 계산하는 방법에 대해서 알아보려고 합니다. 주식하시는 분들은 아시겠지만 차트를 보실 때 이동 평균선을 같이 보실 텐데요. 이동 평균선이라는 것이 결국 주가의 단순 이동 평균값을 계산하는 것이므로 이번 포스팅에서 그 방법을 숙지하시면 이러한 이동 평균선들도 시각화할 수 있습니다. 여기서 다루는 내용은 다음과 같습니다. 1. 단순 이동 평균이란? 2. Pandas 단순 이동 평균 계산하기 3. 주가 데이터를 이용하여 이동 평균선 그려보기. 1. 단순 이동 평균이란? 먼저 (이미 알고계시겠지만) 단순 이동 평균의 정의를 잠깐 알아보고 가려고 합니다. 데이터(특히 시계열 데이터) $y_1, y_2, \ldots, y_n$이 있다고 했.. 2022. 5. 11.
[Pandas] pandas-datareader를 이용하여 주식(주가) 데이터 가져오기! 반갑습니다~ 꽁냥이입니다. 이번 포스팅에서는 pandas_datareader를 이용하여 주식(주가) 데이터를 가져오는 방법에 대해서 소개하려고 합니다. 여기서 다루는 내용은 다음과 같습니다. 1. pandas-datareader 설치 2. pandas-datareader를 이용한 주식(주가) 데이터 가져오기 1. pandas-datareader 설치 pandas_datareader는 주식뿐만 아니라 여러 통계 데이터들을 가져올 수 있는 api를 제공하는 강력한 모듈입니다. 설치법은 pip 명령을 이용하여 설치하면 됩니다. pip install pandas-datareader 2. pandas-datareader를 이용한 주식(주가) 데이터 가져오기 이제 주가 데이터를 불러봅시다~~ 꽁냥이는 애플을 좋아해.. 2022. 5. 11.
18. 다중 클래스(Multi-Class) 분류를 위한 One vs Rest, One vs One 방법을 알아보자. 이진(Binary) 클래스에서는 잘 동작하는 분류기(모형)들이 다중 클래스(Multi-Class) 분류 문제로 확장하기가 어려운 경우가 있다. 이때에는 다중 클래스(Multi-Class) 분류 문제를 여러 개의 이진 분류 문제로 쪼개서 해결할 수 있다. 다중 클래스(Multi-Class)에서 한 클래스를 1 나머지를 0으로 코딩하여 이진 분류기를 여러개 생성하는 One vs Rest 방법이 있고 다중 클래스 문제를 서로 다른 모든 클래스의 쌍으로 쪼개서 푸는 One vs One 방법이 있다. 이번 포스팅에서는 이 방법에 대한 내용을 소개한다. - 목차 - 1. One vs Rest 2. One vs One 이곳은 꽁냥이가 머신러닝을 공부한 내용을 정리하는 곳입니다. 이 포스팅에서는 수식을 포함하고 있습니.. 2022. 5. 9.
[python] lstrip, rstrip을 이용한 문자 제거 요즘 자연어 처리 관련 강의를 듣고 있는데 코드 실습에서 배운 여러 가지 파이썬 기능들을 복습하고 있다. 복습하는 김에 여기에다가 적어두면 기억이 더 오래갈 것 같아서 포스팅하려고 한다. 이번 포스팅에서는 lstrip과 rstrip을 이용하여 문자를 제거하는 방법에 대해서 알아본다. - 목차 - 1. lstrip - 문자열 왼쪽(앞쪽) 문자 제거 2. rstrip - 문자열 오른쪽(뒷쪽) 문자 제거 1. lstrip - 문자열 왼쪽(앞쪽) 문자 제거 lstrip은 입력 문자를 넣어주면 문자열의 왼쪽(앞쪽)에서 매칭되는 부분을 제거해준다. 입력 문자를 넣어주지 않으면 공백 문자를 제거한다. 아래 코드를 보면 감이 올 것이다. string1 = ' 안녕하세요~~' string2 = '\t\t\t 안녕하세요~.. 2022. 5. 8.
[statsmodels] 1. 선형 회귀 모형(Linear Regression) 적합하기 statsmodels는 통계적 모델링을 위한 강력한 기능을 제공하며 여러 가지 통계 결과를 알려준다. 이번 포스팅에서는 statsmodels를 이용하여 선형 회귀 모형을 적합하는 과정을 알아본다. - 목차 - 1. 데이터 준비 2. 선형 회귀 모형(Linear Regression) 적합하기 선형 회귀 모형에 대한 개념은 아래 포스팅을 참고하기 바란다. 16. 선형 회귀(Linear Regression) 모형에 대해서 알아보자 with Python 16. 선형 회귀(Linear Regression) 모형에 대해서 알아보자 with Python 머신러닝 관련 포스팅을 하면서 아주 기본적이지만 이론적으로 강력한 선형 회귀 관련 내용을 포스팅하지 않았다는 것에 매우 놀랐다. 이번 포스팅에서는 선형 회귀 모형에 .. 2022. 5. 7.
[Scikit-Learn] 1. sklearn을 이용하여 선형 회귀 모형(Linear Regression) 적합하기 이번 포스팅에서는 Scikit-Learn(sklearn)을 이용하여 선형 회귀 모형을 적합하는 방법을 알아본다. - 목차 - 1. 데이터 준비 2. sklearn을 이용한 선형 회귀 모형 적합 선형 회귀 모형에 대한 개념은 아래 포스팅을 참고하기 바란다. 16. 선형 회귀(Linear Regression) 모형에 대해서 알아보자 with Python 16. 선형 회귀(Linear Regression) 모형에 대해서 알아보자 with Python 머신러닝 관련 포스팅을 하면서 아주 기본적이지만 이론적으로 강력한 선형 회귀 관련 내용을 포스팅하지 않았다는 것에 매우 놀랐다. 이번 포스팅에서는 선형 회귀 모형에 대해서 알아보고 파 zephyrus1111.tistory.com 1. 데이터 준비 여기서는 보스턴 .. 2022. 5. 7.
[Python] os와 shutil 모듈을 사용하여 파일 삭제(제거), 폴더 삭제(제거) 하기 파이썬(Python)으로 파일, 폴더 복사뿐 아니라 삭제도 할 수 있다. 이번 포스팅에서는 shutil과 os 모듈을 이용하여 파일, 폴더 삭제하는 방법에 대해서 알아본다. - 목차 - 1. os 모듈을 이용한 파일 삭제(제거) 2. os 모듈을 이용한 폴더 삭제(제거) feat. shutil 1. os 모듈을 이용한 파일 삭제(제거) os.remove를 사용하면 파일을 제거할 수 있다. 사용법은 제거할 파일(위치+파일명)을 넣어주면 된다. import os # 파일 삭제 remove_file_path = '../test_folder/folder1/sample_02.txt' # 제거할 파일 os.remove(remove_file_path) 만약 없는 파일을 제거하려고 하면 다음과 같은 FileNotFou.. 2022. 5. 7.
[Python] shutil을 이용한 파일 복사(File Copy), 폴더 복사(Folder Copy) 하기 (feat. distutils) 파이썬(Python)을 이용하면 파일과 폴더를 복사할 수 있다. shutil이라는 모듈을 이용하면 된다. 이번 포스팅에서는 파이썬(Python) 내장 모듈인 shutil를 이용하여 파일과 폴더를 복사하는 방법을 알아본다. - 목차 - 1. shutil을 이용한 파일 복사 2. shutil을 이용한 폴더 복사 (feat. distutils) 1. shutil을 이용한 파일 복사 shutil.copy, shutil.copyfile, shutil.copy2를 이용하면 파일을 복사할 수 있다. 이들의 사용법은 첫 번째 인자에는 복사할 파일 위치, 두 번째 인자에는 복사 위치 + 파일명을 넣어주면 된다. 이때 기존 파일과 동일한 명으로 복사 파일명을 지정했다면 덮어쓰기(Overwriting)가 된다. 아래 코드를.. 2022. 5. 7.
17. Dunn Index와 실루엣(Silhouette) 계수를 이용하여 최적 클러스터(군집, Cluster)개수 정하기 with Python 클러스터링 문제에서는 최적 클러스터(군집, Cluster) 개수를 정하는 것이 문제가 된다. 이번 포스팅에서는 Dunn Index와 실루엣(Silhouette) 계수를 이용하여 클러스터(군집, Cluster) 개수를 정하는 방법에 대해서 알아본다. - 목차 - 1. 데이터 준비 2. 최적 클러스터 개수 선정하기 이번 포스팅을 읽기에 앞서 Dunn Index와 실루엣(Silhouette) 계수에 대해서 생소하다면 아래 포스팅에 설명해 두었으니 참고하기 바란다. 12. 클러스터링(군집화) 평가 지표 Dunn Index with Python 12. 클러스터링(군집화) 평가 지표 Dunn Index with Python 이번 포스팅에서는 클러스터링(군집화)이 잘되었는지 정량적으로 확인할 수 있는 평가 지표로 D.. 2022. 5. 7.
[Python] 리스트(튜플, 배열)에서 비복원(without replacement) 추출과 복원(with replacement) 추출하기 머신러닝을 구현함에 있어서 학습 데이터를 재추출(Resampling)할 필요가 있었는데 파이썬에서 재추출하는 방법이 있어서 적어두려고 한다. 내가 필요했던 것은 복원(with replacement) 추출이었는데 정리하는 김에 비복원 추출 방법도 적어둬야겠다. 나중에 필요할 수도 있으니까. 1. 비복원(without replacement) 추출 2. 복원(with replacement) 추출 1. 비복원(without replacement) 추출 비복원 추출(without replacement) 방법은 내장 모듈인 random과 외장모듈인 numpy를 이용한 방법 2가지가 있다. 각각에 대해서 알아보자. 1) random.sample을 이용하는 방법 random.sample을 이용하면 리스트(또는 튜플)에.. 2022. 5. 7.

맨 위로