본문 바로가기

pandas6

[Pandas] 26. 단순 이동 평균 계산하기 feat. rolling.mean() 안녕하세요~ 꽁냥이에요. 이번 포스팅에서는 Pandas에서 단순 이동 평균값을 계산하는 방법에 대해서 알아보려고 합니다. 주식하시는 분들은 아시겠지만 차트를 보실 때 이동 평균선을 같이 보실 텐데요. 이동 평균선이라는 것이 결국 주가의 단순 이동 평균값을 계산하는 것이므로 이번 포스팅에서 그 방법을 숙지하시면 이러한 이동 평균선들도 시각화할 수 있습니다. 여기서 다루는 내용은 다음과 같습니다. 1. 단순 이동 평균이란? 2. Pandas 단순 이동 평균 계산하기 3. 주가 데이터를 이용하여 이동 평균선 그려보기. 1. 단순 이동 평균이란? 먼저 (이미 알고계시겠지만) 단순 이동 평균의 정의를 잠깐 알아보고 가려고 합니다. 데이터(특히 시계열 데이터) $y_1, y_2, \ldots, y_n$이 있다고 했.. 2022. 5. 11.
[Pandas] 25. 데이터(칼럼, 열) 변환 하기 (feat. columns, dtype, map, apply) 안녕하십니까?! 꽁냥이입니다. 이번 포스팅에서는 Pandas에서 데이터 칼럼(열)을 변환하는 방법에 대해서 알아보려고 합니다. 데이터 분석을 하는 경우 문자형 숫자(예 '1', '1.1' 등)를 숫자로 바꿔주는 데이터 타입(Type) 변환이 필요합니다. 또한 예측 모델링을 하는 경우 주어진 학습 데이터를 그대로 이용하기보다는 원(Raw) 데이터를 변환(로그 변환, 절대값 변환 등)하여 학습을 진행하기도 합니다. 따라서 이번 포스팅에서는 Pandas에서 이러한 데이터 칼럼(열)을 변환하는 방법을 소개합니다. 여기서 다루는 내용은 다음과 깉습니다. 1. 데이터 타입(Type) 변환 2. 데이터 칼럼에 수치 함수 적용 3. 데이터 칼럼에 내가 만든 함수 적용 1. 데이터 타입(Type) 변환 Pandas에서는.. 2022. 4. 16.
[Modin] Pandas 보다 빠른 Modin 소개 이번 포스팅에서는 Pandas 보다 빠른 처리 속도를 자랑하는 Modin에 대해서 알아보고자 한다. Pandas는 내 주력 모듈(라이브러리)이다. 하지만 가끔 답답한 속도와 메모리 뻥튀기 현상 때문에 애를 먹은 적이 많다. R에서는 data.table이라는 라이브러리가 있어서 같은 기능이지만 Pandas보다 훨씬 빨라서 의아한 적이 있었다. R에서는 데이터 처리 속도를 향상시키기 위한 라이브러리들이 개발되었는데 도대체 파이썬에서는 Pandas를 대체할 뭔가가 없는지 찾아보다가 Modin이라는 친구를 만났다. 이게 기존 Pandas DataFrame과 호환이 잘되고 함수 사용법 또한 거의 같다고 한다. 뭔가 Modin이 획기적이라는 생각이 들어서 홈페이지 개발 문서를 보고 공부하면서 사용법과 Pandas와.. 2022. 4. 15.
[Pandas] 23. 데이터 유일(유니크, unique)값과 개수 구하기 안녕하세요~ 꽁냥이입니다. 이번 포스팅에서는 Pandas에서 칼럼이 갖고 있는 유일(유니크, unique)한 값과 그 개수를 얻는 방법에 대해서 소개하려고 합니다. 1. 데이터 만들기 2. 하나의 칼럼 속 데이터 유일(유니크, unique)값과 개수 3. 데이터프레임에서 칼럼 별 데이터 유일(유니크, unique) 값의 개수 1. 데이터 만들기 먼저 이번 포스팅에서 사용할 데이터를 만들어 줄 거예요. import pandas as pd import numpy as np df = pd.DataFrame() df['A'] = [1, 2, 3, np.nan, 7, 7] df['B'] = ['b', 'b', 'b', 'c', np.nan, 'd'] 2. 하나의 칼럼 속 데이터 유일(유니크, unique) 값과 .. 2022. 4. 7.
[Pandas] 12. 행 추가/삭제하기 안녕하세요~ 꽁냥이에요. 이번 포스팅은 Pandas에서 새로운 행 데이터를 데이터프레임에 추가, 삭제하는 방법에 대해서 알아보려고 합니다. 1. Pandas 행 추가하기 2. Pandas 행 삭제하기 1. Pandas 행 추가하기 먼저 예제용 데이터를 만들어줄게요. import pandas as pd data = { '이름' : ['꽁냥이','옹냥이'], '나이' : [22, 16], '키' : [183, 181] } df = pd.DataFrame(data) ## 데이터 꽁냥이는 아래의 데이터를 추가할 거예요. 아이린, 26, 160 Pandas에서는 행 삽입하는 여러가지 기능을 제공하고 있습니다. 여기서는 위의 행 데이터를 삽입하는 방법 3가지를 소개합니다. concat 이용하기 append 이용하기.. 2020. 9. 30.
[Pandas] 1. DataFrame 생성하기 안녕하세요~~ 꽁냥이에요! Pandas는 데이터를 행과 열로 이루어진 우리에게 익숙한 테이블 형태로 제공하고요. 데이터 조회, 데이터 변환, 칼럼 추출, 결측치 처리 등 데이터 전처리에 필요한 강력한 기능을 제공하고 있어서 데이터를 분석한다면 Pandas를 필수적으로 다룰 수 있어야해요. 또한 Pandas의 문서는 자세한 설명과 다양한 예제를 제공하고 있어서 모르는 것이 있다면 관련 내용을 빠르게 찾고 쉽게 이해할 수 있어요. Pandas 문서 : pandas documentation — pandas 1.0.5 documentation API reference The reference guide contains a detailed description of the pandas API. The refere.. 2020. 7. 30.

맨 위로