본문 바로가기

데이터 분석/데이터 전처리56

[Pandas] 35. 데이터 구간 나누기 (feat. cut, qcut) 안녕하세요~ 꽁냥이에요. 데이터 분석을 하다 보면 데이터를 특정 칼럼값을 기준으로 구간을 나누어야 할 때가 있는데요. Pandas에서 제공하는 cut과 qcut을 이용하면 쉽게 구간을 나눌 수 있어요. 이번 포스팅에서는 Pandas에서 cut과 qcut 사용법을 알아보고 이를 응용하는 방법도 알아보려고 합니다. 데이터 구간 나누기 (feat. cut, qcut) 1) 데이터를 구간 길이에 따라 나누어 보자 : cut a. 기본 사용법 데이터를 구간 길이에 따라 나눌 때에는 cut을 사용합니다. cut 함수의 사용법은 다음과 같습니다. cut( array, bins, labels) cut 함수는 나누고자하는 숫자값을 포함하는 배열을 첫 번째 인자로 받습니다. bins는 나누고자 하는 방식인데 bins에 양.. 2023. 1. 17.
[Pandas] Tip!! 데이터프레임(Data Frame)을 필터, 칼럼 폭 조정, 첫 행 고정 옵션을 적용하여 엑셀로 저장하기(feat. xlsxwriter) 안녕하세요~ 꽁냥이에요. 이번 포스팅에서는 Pandas 데이터프레임(Data Frame)을 엑셀 파일에 필터, 칼럼 폭 조정, 첫 행 고정 적용하는 방법을 소개합니다. 이러한 설정 옵션을 적용하면 엑셀 파일을 열고 분석할 때 편의성이 높아지지요. 데이터프레임(Data Frame) 필터, 칼럼 폭 조정, 첫 행 고정 적용하기(feat. xlsxwriter) 먼저 예제용 데이터를 만들고 바로 엑셀로 저장해보겠습니다. import pandas as pd ## 예제 데이터 test_data = { '회계연도':[2002, 2003, 2004, 2005], '도미니카 공화국':[10, 20, 30, 40], } test_df = pd.DataFrame(test_data) ## 엑셀 저장 test_df.to_exc.. 2022. 12. 7.
[Pandas] 34. 데이터 재구조화(Reshape)하기 (feat. crosstab) 안녕하세요~ 꽁냥이에요. 지난 포스팅에서는 Pandas의 wide_to_long 메서드를 이용한 데이터 재구조화 방법을 알아보았는데요. Pandas에서는 crosstab을 이용하여 교차표(Cross Table)을 만들 수 있는데요. 교차표 또한 데이터 재구조화의 한 방법이라 할 수 있습니다. 이번 포스팅에서는 Pandas crosstab을 이용한 데이터 재구조화 방법을 알아보겠습니다. [Pandas] 30. 데이터 재구조화(Reshape) 하기 (feat. melt) [Pandas] 31. 데이터 재구조화(Reshape)하기 (feat. pivot, pivot_table) [Pandas] 32. 데이터 재구조화(Reshape)하기 (feat. stack, unstack) [Pandas] 33. 데이터 재.. 2022. 11. 21.
[Pandas] 33. 데이터 재구조화(Reshape)하기 (feat. wide_to_long) 반갑습니다~ 꽁냥이입니다. 지난 포스팅에서는 Pandas의 stack, unstack 메서드를 이용한 데이터 재구조화 방법을 알아보았는데요. 이번 포스팅에서는 wide_to_long 메서드를 이용한 데이터 재구조화 방법을 알아보겠습니다. [Pandas] 30. 데이터 재구조화(Reshape) 하기 (feat. melt) [Pandas] 31. 데이터 재구조화(Reshape)하기 (feat. pivot, pivot_table) [Pandas] 32. 데이터 재구조화(Reshape)하기 (feat. stack, unstack) [Pandas] 34. 데이터 재구조화(Reshape)하기 (feat. crosstab) 데이터 재구조화(Reshape)하기 (feat. wide_to_long) 아래 그림은 wide.. 2022. 11. 21.
[Pandas] 32. 데이터 재구조화(Reshape)하기 (feat. stack, unstack) 안녕하세요~ 오늘도 꽁냥이 인사드립니다. 지난 포스팅에서는 Pandas pivot, pivot_table을 이용한 데이터 재구조화(Reshape) 방법을 알아보았는데요. 이번 포스팅에서는 stack, unstack 메서드를 이용한 데이터 재구조화(Reshape) 방법을 알아보겠습니다. [Pandas] 30. 데이터 재구조화(Reshape) 하기 (feat. melt) [Pandas] 31. 데이터 재구조화(Reshape)하기 (feat. pivot, pivot_table) [Pandas] 33. 데이터 재구조화(Reshape)하기 (feat. wide_to_long) [Pandas] 34. 데이터 재구조화(Reshape)하기 (feat. crosstab) 데이터 재구조화(Reshape)하기 (feat. .. 2022. 11. 19.
[Pandas] 31. 데이터 재구조화(Reshape)하기 (feat. pivot, pivot_table) 안녕하세요~ 꽁냥이에요. 지난 포스팅에서는 Pandas의 melt 메서드를 이용하여 데이터를 재구조화하는 방법을 알아보았습니다. 이번 포스팅에서는 pivot과 pivot_table 메서드를 이용한 데이터 재구조화 방법에 대해서 알아보겠습니다. [Pandas] 30. 데이터 재구조화(Reshape) 하기 (feat. melt) [Pandas] 32. 데이터 재구조화(Reshape)하기 (feat. stack, unstack) [Pandas] 33. 데이터 재구조화(Reshape)하기 (feat. wide_to_long) [Pandas] 34. 데이터 재구조화(Reshape)하기 (feat. crosstab) pivot, pivot_table을 이용한 데이터 재구조화(Reshape) 아래 그림은 pivot .. 2022. 11. 19.
[Pandas] 30. 데이터 재구조화(Reshape) 하기 (feat. melt) 반갑습니다. 꽁냥이입니다. 이번 포스팅에서는 Pandas에서 데이터 재구조화할 때 사용되는 melt 메서드 사용법을 알아보겠습니다. [Pandas] 31. 데이터 재구조화(Reshape)하기 (feat. pivot, pivot_table) [Pandas] 32. 데이터 재구조화(Reshape)하기 (feat. stack, unstack) [Pandas] 33. 데이터 재구조화(Reshape)하기 (feat. wide_to_long) [Pandas] 34. 데이터 재구조화(Reshape)하기 (feat. crosstab) melt를 이용한 데이터 Reshape(재구조화) melt는 필수적으로 id_vars 인자를 받게 되어 있습니다. 이 인자에는 데이터프레임 칼럼 이름이 들어가는데요. melt는 id_va.. 2022. 11. 18.
[Pandas] 29. 데이터 프레임을 칼럼 폭 조절, 첫 행 고정, 필터 추가하여 엑셀 저장하기 (feat. ExcelWriter) 안녕하세요~ 꽁냥이에요. Pandas에서는 ExcelWriter를 이용하여 데이터 프레임을 단순히 엑셀로 저장할 뿐 아니라 여러 가지 옵션을 추가한 상태로 저장할 수 있어요. 이번 포스팅에서는 ExcelWriter을 이용하여 Pandas 데이터 프레임을 1) 칼럼 이름에 따라 엑셀 칼럼 폭을 조정하고 2) 첫 행을 고정시키며 3) 필터를 추가한 상태로 엑셀(Excel)로 저장하는 방법을 알아보겠습니다. ExcelWriter을 이용한 엑셀 파일 저장 ExcelWriter는 첫 번째 인자로 엑셀 파일을 저장할 경로를 받습니다. 그리고 engine 인자는 엑셀 전용 모듈을 선택하는데 'openpyxl' 또는 'xlsxwriter'를 주로 사용합니다. 꽁냥이는 'xlsxwriter'를 주로 사용합니다. 왜냐하면.. 2022. 11. 16.
[Pandas] 28. 데이터 필터링 하기 (feat. filter) 안녕하세요~ 꽁냥이에요. Pandas에서는 filter 메서드를 이용하여 특정 조건에 맞는 칼럼과 행으로 필터링할 수 있습니다. 이번 포스팅에서는 Pandas의 filter 메서드 사용법을 알아보겠습니다. filter 사용법 먼저 이번 포스팅에서 사용할 데이터를 만들어 보겠습니다. import pandas as pd data = { 'PROCESS_A':[1, 0, 0, 0], 'PROCESS_B':[0, 1, 1, 0], 'PROCESS_C':[0, 1, 1, 1], 'SUB_A':[3, 5, 3, 3], 'SUB_B':[1, 7, 6, 2] } df = pd.DataFrame(data) df.index = ['PRODUCT_A', 'PRODUCT_B', 'PRODUCT_C', 'PRODUCT_D'] .. 2022. 11. 15.
[Pandas Tip] 엑셀(Excel) 행과 열 고정하여 저장하기 (feat freeze_panes) 안녕하세요~ 꽁냥이에요. 오늘은 Pandas에 대한 간단한 팁을 소개하는 시간인데요. Pandas에서 엑셀을 저장할 때 특정 행과 열을 고정시킬 수 있다는 사실 아셨나요? 꽁냥이는 이번에 알게 돼서 이번 포스팅에서 공유하려고 해요. freeze_panes 인자 사용하기 먼저 샘플용 데이터를 만들어 보겠습니다. import pandas as pd df = pd.DataFrame() df['No'] = [1,2,3,4,5] df['Name'] = ['꽁냥이', '김태홍', '이준정', '이규진', '이승범'] df['Age'] = [27, 33, 38, 51, 44] freeze_panes는 to_excel 함수에 있는 인자로 2차원 튜플을 넘겨주게 됩니다. 사용법은 아래와 같습니다. to_excel( fr.. 2022. 9. 29.

맨 위로