본문 바로가기

프로그래밍167

파이썬(Python) 폴더와 파일 다루기 (feat. os, pathlib) 파이썬(Python)의 내장 모듈 os와 pathlib은 폴더(디렉토리)의 생성 및 삭제 그리고 파일의 존재 유무 등을 알 수 있는 기능을 제공한다. 폴더와 파일 삭제에 대한 내용은 여기에 포스팅해두었으니 이번 포스팅에서는 os와 pathlib에서 기존에 다루지 않았지만 많이 활용되는 기능에 대해서 알아보고자 한다. os, pathlib 사용법 os와 pathlib은 서로 공통된 기능을 많이 제공한다. 다만 os는 문자열을 통해 폴더(또는 파일)경로를 다루지만 pathlib은 Path 객체를 통해 경로를 다루는 차이점이 있다. 여기서 다루는 내용을 요약하면 다음과 같다. 이제 각각의 방법을 각각 알아보자. 1) 현재 폴더(디렉토리) 확인하기 현재 폴더(디렉토리)란 코드를 실행하는 파일을 포함하고 있는 폴.. 2023. 4. 14.
[Scikit-Learn] 25. One-Hot Encoding 변환하기 (feat. OneHotEncoder) Scikit-Learn에서는 OneHotEncoder 클래스를 이용하여 범주형 변수를 One-Hot Encoding으로 변환할 수 있다. 이번 포스팅에서는 OneHotEncoder을 이용하여 One-Hot Encoding을 수행하는 방법을 알아본다. OneHotEncoder 사용법 여기서는 붓꽃 데이터의 붓꽃 범주를 One-Hot Encoding으로 변환해보고자 한다. OneHotEncoder는 범주형 변수가 반드시 2차원 배열로 되어있어야 한다. import numpy as np from sklearn.preprocessing import OneHotEncoder from sklearn.datasets import load_iris iris = load_iris() category = np.array(.. 2023. 4. 9.
[Scikit-Learn] 24. Partial Least Square Regression 모형 적합하기 (feat. PLSRegression) Scikit-Learn에서는 PLSRegression 클래스를 이용하여 부분 최소 제곱 회귀(Partial Least Square Regression : PLSR) 모형을 학습할 수 있다. 이번 포스팅에서는 PLSRegression 클래스의 기본적인 사용법에 대해서 알아본다. 부분 최소 제곱 회귀(Partial Least Square Regression : PLSR) 모형에 대한 개념은 아래 포스팅을 참고하면 된다. 38. 부분 최소 제곱 회귀(Partial Least Square Regression : PLSR)에 대해서 알아보자 with Python 38. 부분 최소 제곱 회귀(Partial Least Square Regression : PLSR)에 대해서 알아보자 with Python 이번 포스팅에.. 2023. 4. 8.
[Scikit-Learn] 23. 주성분 분석(Principal Component Analysis) (feat. PCA) 주성분 분석(Principal Component Analysis)은 예측 모형에 사용될 변수를 새롭게 만들거나 차원 축소를 통한 데이터 요약을 위해 많이 사용된다. Scikit-Learn(sklearn)에서는 PCA 객체를 이용하여 주성분 분석을 할 수 있다. 이번 포스팅에서는 PCA에 대한 사용법을 알아보고자 한다. 주성분 분석(Principal Component Analysis)에 대한 개념은 아래 포스팅에 정리해 두었으니 참고하면 된다. 37. 주성분 분석(Principal Component Analysis : PCA)에 대해서 알아보자 with Python 37. 주성분 분석(Principal Component Analysis : PCA)에 대해서 알아보자 with Python 이번 포스팅에서는 .. 2023. 4. 2.
shapely 모듈에 대해서 알아보자 - 응용편 지난 포스팅에서는 shapely 모듈의 기본적인 사용법과 도형을 그리는 방법을 알아보았다. 하지만 shapely는 더 놀라운 기능을 가지고 있다. 이번 포스팅에서는 shapely 모듈로 할 수 있는 일들에 대해서 알아본다. shapely 모듈 응용하기 1) 원 또는 타원 그리기 : Point a. 원 shapely는 원(또는 타원)을 나타내는 객체가 없어서 직접적으로 호출할 수는 없다. 하지만 Point 객체를 이용하면 만들 수 있다. 먼저 Point 객체를 생성하여 원의 중심을 설정하고 buffer에 반지름 길이를 넣어주면 원을 만들 수 있다. 아래 그림은 Point를 이용하여 원을 만들고 그림을 그린다. import matplotlib.pyplot as plt plt.rcParams['axes.uni.. 2023. 3. 30.
shapely 모듈에 대해서 알아보자 - 기본편 파이썬(Python)에서 shapely 모듈을 이용하면 (1) 기본적인 도형과 도형의 특성(길이, 넓이 등)을 계산할 수 있고 (2) 도형을 그릴 수도 있다. 이번 포스팅에서는 shapely 기본편으로써 도형을 생성하고 특성을 계산하는 것과 도형을 그리는 방법에 대해서 알아본다. shapely 모듈 사용하기 shapely는 외장 모듈이므로 아래 명령어를 통하여 설치를 해줘야 한다. pip install shapely 설치가 완료되었다면 이제 shapely에서 가장 많이 사용하는 객체에 대해서 알아본다. 1) 기본 a. Point Point는 말 그대로 점을 의미한다. Point는 x, y 좌표를 순서대로 넣어주면 되고 필요에 따라서 z 좌표도 넣을 수 있다. x, y좌표를 접근할 수 있는 속성 그리고 길.. 2023. 3. 29.
dateutil 모듈을 이용하여 datetime 객체 다루기 dateutil 모듈은 파이썬(Python)에서 제공하는 datetime 객체를 다루기 위한 여러 가지 유틸 함수를 제공한다. 이번 포스팅에서는 dateutil과 관련하여 자주 사용하는 몇 가지 함수를 알아보려고 한다. dateutil 모듈 사용법 1) 날짜 계산 : relativedelta a. 특정 날짜를 기준으로 과거 또는 미래 날짜 계산하기 relativedelta 객체를 이용하면 특정 날짜를 기준으로 과거 또는 미래 날짜를 계산할 수 있다. 아래 코드는 현재 시점을 기준으로 과거 또는 미래 시점을 연, 월, 일 단위로 계산한다. from datetime import datetime from dateutil.relativedelta import relativedelta now = datetime... 2023. 3. 25.
파이썬(Python) statistics 모듈을 이용한 통계량 계산하기 파이썬(Python)에서 statistics 모듈을 사용하면 여러 가지 통계량을 계산할 수 있다. 이번 포스팅에서는 statistics 모듈을 이용하여 어떤 것들을 할 수 있는지 알아보자. statistics 모듈 statistics 모듈은 파이썬 버전이 변함에 따라서 새로운 기능이 추가되었다. 이 포스팅은 파이썬 버전 3.11.2를 기준으로 작성한 것이다. 1) 통계량 계산하기 아래 코드는 statistics 모듈을 이용하여 계산할 수 있는 통계량들이다. statistics가 제공하는 더 자세한 통계량들을 알고 싶다면 statistics 개발 문서를 참고하기 바란다. import statistics as st a = [1,2,4,5,5,6] b = [3,6,6,8,9,10] print() print('.. 2023. 3. 25.
[XGBoost] XGBoost의 개별 트리로부터 여러 정보(변수 출현 빈도, 예측) 계산하기(feat. get_boost) XGBoost 모듈을 이용하면 XGBoost 모형 학습과 예측을 쉽게 해 줄 수 있다. XGBoost 모형을 학습하면 여러개의 트리로 구성되어 있는데 개별 트리로부터 정보를 얻고 싶을 수 있다. 예를 들면 (1) 특정 개별 트리에서 분리 변수의 출현 빈도 또는 (2) 개별 트리의 예측값을 알고 싶을 때가 있다. 이때 get_booster라는 녀석을 사용하면 이러한 정보들을 얻을 수 있다. 이번 포스팅에서는 get_booster를 이용하여 얻은 개별 트리의 분리 변수 출현 빈도, 예측값을 계산하는 방법을 알아보고자 한다. XGBoost의 개념과 XGBoost 모듈에 대한 기본적인 사용법이 궁금하신 분들은 아래 포스팅을 참고하면 된다. [XGBoost] XGBoost 모형 학습하기 (feat. XGBClas.. 2023. 3. 24.
파이썬(Python) time 모듈을 이용하여 시간 정보 가져오기 파이썬(Python) 내장 모듈인 time 모듈을 이용하면 현재 시간, 프로그램 수행 시간과 같은 시간 정보를 알아낼 수 있다. 이번 포스팅에서는 time 모듈을 이용하여 할 수 있는 것들에 대해서 알아본다. time 모듈 1) GMT 기준 현재 시간, 타임존, 로컬 시차 time 모듈에서 time 함수는 1970년 1월 1일 0시 0분 0초에서 시작하여 GMT 기준으로 현재 시간을 초단위로 나타낸다. tzname 변수는 타임존을 알려주고 timezone 변수는 로컬 타임 즉, 대한민국과 GMT 기준과의 시차를 초단위로 알려준다. from time import time, tzname, timezone print(time()) ## gmt 기준 print(tzname) ## 타임존 이름 print(time.. 2023. 3. 22.

맨 위로