본문 바로가기

데이터 분석175

[Pandas] 34. 데이터 재구조화(Reshape)하기 (feat. crosstab) 안녕하세요~ 꽁냥이에요. 지난 포스팅에서는 Pandas의 wide_to_long 메서드를 이용한 데이터 재구조화 방법을 알아보았는데요. Pandas에서는 crosstab을 이용하여 교차표(Cross Table)을 만들 수 있는데요. 교차표 또한 데이터 재구조화의 한 방법이라 할 수 있습니다. 이번 포스팅에서는 Pandas crosstab을 이용한 데이터 재구조화 방법을 알아보겠습니다. [Pandas] 30. 데이터 재구조화(Reshape) 하기 (feat. melt) [Pandas] 31. 데이터 재구조화(Reshape)하기 (feat. pivot, pivot_table) [Pandas] 32. 데이터 재구조화(Reshape)하기 (feat. stack, unstack) [Pandas] 33. 데이터 재.. 2022. 11. 21.
[Pandas] 33. 데이터 재구조화(Reshape)하기 (feat. wide_to_long) 반갑습니다~ 꽁냥이입니다. 지난 포스팅에서는 Pandas의 stack, unstack 메서드를 이용한 데이터 재구조화 방법을 알아보았는데요. 이번 포스팅에서는 wide_to_long 메서드를 이용한 데이터 재구조화 방법을 알아보겠습니다. [Pandas] 30. 데이터 재구조화(Reshape) 하기 (feat. melt) [Pandas] 31. 데이터 재구조화(Reshape)하기 (feat. pivot, pivot_table) [Pandas] 32. 데이터 재구조화(Reshape)하기 (feat. stack, unstack) [Pandas] 34. 데이터 재구조화(Reshape)하기 (feat. crosstab) 데이터 재구조화(Reshape)하기 (feat. wide_to_long) 아래 그림은 wide.. 2022. 11. 21.
[Pandas] 32. 데이터 재구조화(Reshape)하기 (feat. stack, unstack) 안녕하세요~ 오늘도 꽁냥이 인사드립니다. 지난 포스팅에서는 Pandas pivot, pivot_table을 이용한 데이터 재구조화(Reshape) 방법을 알아보았는데요. 이번 포스팅에서는 stack, unstack 메서드를 이용한 데이터 재구조화(Reshape) 방법을 알아보겠습니다. [Pandas] 30. 데이터 재구조화(Reshape) 하기 (feat. melt) [Pandas] 31. 데이터 재구조화(Reshape)하기 (feat. pivot, pivot_table) [Pandas] 33. 데이터 재구조화(Reshape)하기 (feat. wide_to_long) [Pandas] 34. 데이터 재구조화(Reshape)하기 (feat. crosstab) 데이터 재구조화(Reshape)하기 (feat. .. 2022. 11. 19.
[Pandas] 31. 데이터 재구조화(Reshape)하기 (feat. pivot, pivot_table) 안녕하세요~ 꽁냥이에요. 지난 포스팅에서는 Pandas의 melt 메서드를 이용하여 데이터를 재구조화하는 방법을 알아보았습니다. 이번 포스팅에서는 pivot과 pivot_table 메서드를 이용한 데이터 재구조화 방법에 대해서 알아보겠습니다. [Pandas] 30. 데이터 재구조화(Reshape) 하기 (feat. melt) [Pandas] 32. 데이터 재구조화(Reshape)하기 (feat. stack, unstack) [Pandas] 33. 데이터 재구조화(Reshape)하기 (feat. wide_to_long) [Pandas] 34. 데이터 재구조화(Reshape)하기 (feat. crosstab) pivot, pivot_table을 이용한 데이터 재구조화(Reshape) 아래 그림은 pivot .. 2022. 11. 19.
[Pandas] 30. 데이터 재구조화(Reshape) 하기 (feat. melt) 반갑습니다. 꽁냥이입니다. 이번 포스팅에서는 Pandas에서 데이터 재구조화할 때 사용되는 melt 메서드 사용법을 알아보겠습니다. [Pandas] 31. 데이터 재구조화(Reshape)하기 (feat. pivot, pivot_table) [Pandas] 32. 데이터 재구조화(Reshape)하기 (feat. stack, unstack) [Pandas] 33. 데이터 재구조화(Reshape)하기 (feat. wide_to_long) [Pandas] 34. 데이터 재구조화(Reshape)하기 (feat. crosstab) melt를 이용한 데이터 Reshape(재구조화) melt는 필수적으로 id_vars 인자를 받게 되어 있습니다. 이 인자에는 데이터프레임 칼럼 이름이 들어가는데요. melt는 id_va.. 2022. 11. 18.
[Pandas] 29. 데이터 프레임을 칼럼 폭 조절, 첫 행 고정, 필터 추가하여 엑셀 저장하기 (feat. ExcelWriter) 안녕하세요~ 꽁냥이에요. Pandas에서는 ExcelWriter를 이용하여 데이터 프레임을 단순히 엑셀로 저장할 뿐 아니라 여러 가지 옵션을 추가한 상태로 저장할 수 있어요. 이번 포스팅에서는 ExcelWriter을 이용하여 Pandas 데이터 프레임을 1) 칼럼 이름에 따라 엑셀 칼럼 폭을 조정하고 2) 첫 행을 고정시키며 3) 필터를 추가한 상태로 엑셀(Excel)로 저장하는 방법을 알아보겠습니다. ExcelWriter을 이용한 엑셀 파일 저장 ExcelWriter는 첫 번째 인자로 엑셀 파일을 저장할 경로를 받습니다. 그리고 engine 인자는 엑셀 전용 모듈을 선택하는데 'openpyxl' 또는 'xlsxwriter'를 주로 사용합니다. 꽁냥이는 'xlsxwriter'를 주로 사용합니다. 왜냐하면.. 2022. 11. 16.
[Pandas] 28. 데이터 필터링 하기 (feat. filter) 안녕하세요~ 꽁냥이에요. Pandas에서는 filter 메서드를 이용하여 특정 조건에 맞는 칼럼과 행으로 필터링할 수 있습니다. 이번 포스팅에서는 Pandas의 filter 메서드 사용법을 알아보겠습니다. filter 사용법 먼저 이번 포스팅에서 사용할 데이터를 만들어 보겠습니다. import pandas as pd data = { 'PROCESS_A':[1, 0, 0, 0], 'PROCESS_B':[0, 1, 1, 0], 'PROCESS_C':[0, 1, 1, 1], 'SUB_A':[3, 5, 3, 3], 'SUB_B':[1, 7, 6, 2] } df = pd.DataFrame(data) df.index = ['PRODUCT_A', 'PRODUCT_B', 'PRODUCT_C', 'PRODUCT_D'] .. 2022. 11. 15.
[Matplotlib] 여러 그래프 그릴 때 x축 , y축 범위 공유하기 (feat. sharex, sharey) 안녕하세요~ 꽁냥이입니다. 여러 그래프를 그릴 때 때로는 y축(또는 x축)의 범위를 통일시킬 필요가 있습니다. 같은 스케일에서 비교를 용이하게 하기 위함이지요. Matplotlib에서는 sharex, sharey를 이용하여 축 범위를 통일시킬 수 있습니다. 이번 포스팅에서는 Matplotlib에서 여러 그래프를 그릴 때 x축, y축 범위를 공유하는 방법을 알아보겠습니다. 축 범위 공유하기 (feat. sharex, sharey) 우선 여러 그래프를 그릴 때에는 subplots를 사용하는데 sharex, sharey 인자는 각각 x, y축 범위를 통일시킬 수 있게하는 인자입니다. sharex(또는 sharey)는 부울(bool) 값을 받거나 'none', 'all', 'row', 'col' 4가지 타입의 .. 2022. 11. 5.
[Matplotlib] 한 라인에 컬러 맵(Color Map) 적용하기 (feat. LineCollection) 안녕하세요~ 꽁냥이에요. 이번 포스팅에서는 Matplotlib의 선 그래프에서 한 라인에 컬러 맵을 적용하는 방법을 알아보려고 합니다. 한 라인에 컬러 맵(Color Map) 적용하기 (feat. LineCollection) 한 라인에 컬러 맵을 적용하는 것은 LineCollection 클래스를 이용하면 됩니다. 아래 코드는 컬러 맵 'bwr'이라는 것을 사인(sin) 곡선에 적용한 것입니다. 코드 설명은 핵심 부분만 하겠습니다. 나머지는 주석을 참고해주세요. import numpy as np import matplotlib.pyplot as plt plt.rcParams['axes.unicode_minus'] = False import matplotlib as mpl import pandas as pd.. 2022. 10. 30.
[Matplotlib] 한 라인에 여러 색상 적용하기 (feat. LineCollection) 안녕하세요~ 꽁냥이에요. 보통 선 그래프에서 라인 하나에는 하나의 색을 갖게 되는 것이 일반적인데요. 가끔씩 특정 구간 별로 색을 다르게 하는 것처럼 라인 하나에 여러 색상을 적용할 수도 있을 것입니다. 따라서 이번 포스팅에서는 Matplotlib에서 라인 하나에 여러 색상을 적용하는 방법을 소개하려고 합니다. 한 라인에 여러 색상 적용하기 (feat. LineCollection) 한 라인에 여러 색상을 적용하는 방법은 아래의 2단계를 거치면 됩니다. 1 단계) 라인 하나를 색상을 적용할 단위로 나눈다. 2 단계) 1 단계에서 나뉜 라인들을 LineCollection 클래스에 segments인자에 넘겨주고 color인자에 라인 개수만큼 색상을 리스트에 담아서 넘겨준다. 3 단계) add_collectio.. 2022. 10. 30.

맨 위로