본문 바로가기

프로그래밍167

[Scikit-Learn] 4. 서포트 벡터 머신 모형 만들기. feat SVC, SVR 이번 포스팅에서는 Scikit-Learn(sklearn)에서 서포트 벡터 머신을 학습하는 방법에 대해서 알아본다. 여기서는 분류 서포트 벡터 머신과 회귀 서포트 벡터 머신을 나누어 살펴보겠다. 1. Scikit-Learn 분류 서포트 벡터 머신(SVC) 2. Scikit-Learn 회귀 서포트 벡터 머신(SVR) 서포트 벡터 머신에 대한 개념은 아래를 참고하기 바란다. 19. 서포트 벡터 머신(Support Vector Machine)에 대해서 알아보자 with Python 19. 서포트 벡터 머신(Support Vector Machine)에 대해서 알아보자 with Python 딥러닝이 나타나기 전에 전성기를 구가했던 서포트 벡터 머신(Support Vector Machine)에 대해서 공부한 내용을 .. 2022. 5. 27.
[Scikit-Learn] 3. 데이터 칼럼 표준화하기 feat. StandardScaler 이번 포스팅에서는 Scikit-Learn(sklearn)을 이용하여 데이터 칼럼을 표준화하는 방법을 알아보려고 한다. 표준화는 데이터를 주어진 평균과 표준편차를 갖도록 변환하는 것이다. Scikit-Learn에서는 StandardScaler를 통해 데이터를 표준화할 수 있다. StandardScaler를 이용한 표준화 변환 과정은 지난 포스팅에서 다룬 MinMaxScaler를 이용한 Min Max 변환 과정과 동일하므로 아래 포스팅을 참고하면 좋다. [Scikit-Learn] 2. Min Max 변환하기 feat. MinMaxScaler [Scikit-Learn] 2. Min Max 변환하기 feat. MinMaxScaler 예측 모델링을 할 때 학습 데이터에 대하여 변환하는 경우가 굉장히 많다. 그중에.. 2022. 5. 27.
[Scikit-Learn] 2. 최대 최소(Min Max) 변환하기 feat. MinMaxScaler 예측 모델링을 할 때 학습 데이터에 대하여 변환하는 경우가 굉장히 많다. 그중에서 각 데이터를 특정 범위로 제한시키는 Min Max 변환을 많이 사용한다. 최대 최소(Min Max) 변환은 원 데이터를 우리가 지정한 범위 내로 변환시키는 것이다. Scikit-Learn(sklearn)에서는 Min Max 변환을 위한 클래스인 MinMaxScaler를 제공한다. 이번 포스팅에서는 그 사용법을 알아본다. 1. Scikit-Learn(sklearn) MinMaxScaler 변환 과정 2. Scikit-Learn(sklearn) MinMaxScaler 사용법 1. Scikit-Learn(sklearn) MinMaxScaler 변환 과정 먼저 MinMaxScaler를 사용하여 데이터를 변환하는 과정은 다음과 같다.. 2022. 5. 27.
[Python] 파이썬 모듈(라이브러리, 패키지) 버전 확인하기(__version__, pip) 이따금씩 내 컴퓨터에 설치된 파이썬 모듈(라이브러리, 패키지)의 버전을 확인해야 할 필요가 있다. 이번 포스팅에서는 파이썬에서 모듈(라이브러리, 패키지)의 버전을 확인하는 방법에 대해서 소개한다. - 목차 - 1. __version__ 이용하기 2. pip list show 이용하기 1. __version__ 이용하기 파이썬 모듈(라이브러리, 패키지)에는 __version__이라는 속성을 갖도록 권장하고 있다. 따라서 __version__을 이용하면 해당 모듈(라이브러리, 패키지)의 버전을 확인할 수 있다. import pandas as pd import numpy as np print('Pandas Version :', pd.__version__) print('Numpy Version :', np.__.. 2022. 5. 11.
[python] lstrip, rstrip을 이용한 문자 제거 요즘 자연어 처리 관련 강의를 듣고 있는데 코드 실습에서 배운 여러 가지 파이썬 기능들을 복습하고 있다. 복습하는 김에 여기에다가 적어두면 기억이 더 오래갈 것 같아서 포스팅하려고 한다. 이번 포스팅에서는 lstrip과 rstrip을 이용하여 문자를 제거하는 방법에 대해서 알아본다. - 목차 - 1. lstrip - 문자열 왼쪽(앞쪽) 문자 제거 2. rstrip - 문자열 오른쪽(뒷쪽) 문자 제거 1. lstrip - 문자열 왼쪽(앞쪽) 문자 제거 lstrip은 입력 문자를 넣어주면 문자열의 왼쪽(앞쪽)에서 매칭되는 부분을 제거해준다. 입력 문자를 넣어주지 않으면 공백 문자를 제거한다. 아래 코드를 보면 감이 올 것이다. string1 = ' 안녕하세요~~' string2 = '\t\t\t 안녕하세요~.. 2022. 5. 8.
[statsmodels] 1. 선형 회귀 모형(Linear Regression) 적합하기 statsmodels는 통계적 모델링을 위한 강력한 기능을 제공하며 여러 가지 통계 결과를 알려준다. 이번 포스팅에서는 statsmodels를 이용하여 선형 회귀 모형을 적합하는 과정을 알아본다. - 목차 - 1. 데이터 준비 2. 선형 회귀 모형(Linear Regression) 적합하기 선형 회귀 모형에 대한 개념은 아래 포스팅을 참고하기 바란다. 16. 선형 회귀(Linear Regression) 모형에 대해서 알아보자 with Python 16. 선형 회귀(Linear Regression) 모형에 대해서 알아보자 with Python 머신러닝 관련 포스팅을 하면서 아주 기본적이지만 이론적으로 강력한 선형 회귀 관련 내용을 포스팅하지 않았다는 것에 매우 놀랐다. 이번 포스팅에서는 선형 회귀 모형에 .. 2022. 5. 7.
[Scikit-Learn] 1. sklearn을 이용하여 선형 회귀 모형(Linear Regression) 적합하기 이번 포스팅에서는 Scikit-Learn(sklearn)을 이용하여 선형 회귀 모형을 적합하는 방법을 알아본다. - 목차 - 1. 데이터 준비 2. sklearn을 이용한 선형 회귀 모형 적합 선형 회귀 모형에 대한 개념은 아래 포스팅을 참고하기 바란다. 16. 선형 회귀(Linear Regression) 모형에 대해서 알아보자 with Python 16. 선형 회귀(Linear Regression) 모형에 대해서 알아보자 with Python 머신러닝 관련 포스팅을 하면서 아주 기본적이지만 이론적으로 강력한 선형 회귀 관련 내용을 포스팅하지 않았다는 것에 매우 놀랐다. 이번 포스팅에서는 선형 회귀 모형에 대해서 알아보고 파 zephyrus1111.tistory.com 1. 데이터 준비 여기서는 보스턴 .. 2022. 5. 7.
[Python] os와 shutil 모듈을 사용하여 파일 삭제(제거), 폴더 삭제(제거) 하기 파이썬(Python)으로 파일, 폴더 복사뿐 아니라 삭제도 할 수 있다. 이번 포스팅에서는 shutil과 os 모듈을 이용하여 파일, 폴더 삭제하는 방법에 대해서 알아본다. - 목차 - 1. os 모듈을 이용한 파일 삭제(제거) 2. os 모듈을 이용한 폴더 삭제(제거) feat. shutil 1. os 모듈을 이용한 파일 삭제(제거) os.remove를 사용하면 파일을 제거할 수 있다. 사용법은 제거할 파일(위치+파일명)을 넣어주면 된다. import os # 파일 삭제 remove_file_path = '../test_folder/folder1/sample_02.txt' # 제거할 파일 os.remove(remove_file_path) 만약 없는 파일을 제거하려고 하면 다음과 같은 FileNotFou.. 2022. 5. 7.
[Python] shutil을 이용한 파일 복사(File Copy), 폴더 복사(Folder Copy) 하기 (feat. distutils) 파이썬(Python)을 이용하면 파일과 폴더를 복사할 수 있다. shutil이라는 모듈을 이용하면 된다. 이번 포스팅에서는 파이썬(Python) 내장 모듈인 shutil를 이용하여 파일과 폴더를 복사하는 방법을 알아본다. - 목차 - 1. shutil을 이용한 파일 복사 2. shutil을 이용한 폴더 복사 (feat. distutils) 1. shutil을 이용한 파일 복사 shutil.copy, shutil.copyfile, shutil.copy2를 이용하면 파일을 복사할 수 있다. 이들의 사용법은 첫 번째 인자에는 복사할 파일 위치, 두 번째 인자에는 복사 위치 + 파일명을 넣어주면 된다. 이때 기존 파일과 동일한 명으로 복사 파일명을 지정했다면 덮어쓰기(Overwriting)가 된다. 아래 코드를.. 2022. 5. 7.
[Python] 리스트(튜플, 배열)에서 비복원(without replacement) 추출과 복원(with replacement) 추출하기 머신러닝을 구현함에 있어서 학습 데이터를 재추출(Resampling)할 필요가 있었는데 파이썬에서 재추출하는 방법이 있어서 적어두려고 한다. 내가 필요했던 것은 복원(with replacement) 추출이었는데 정리하는 김에 비복원 추출 방법도 적어둬야겠다. 나중에 필요할 수도 있으니까. 1. 비복원(without replacement) 추출 2. 복원(with replacement) 추출 1. 비복원(without replacement) 추출 비복원 추출(without replacement) 방법은 내장 모듈인 random과 외장모듈인 numpy를 이용한 방법 2가지가 있다. 각각에 대해서 알아보자. 1) random.sample을 이용하는 방법 random.sample을 이용하면 리스트(또는 튜플)에.. 2022. 5. 7.

맨 위로