본문 바로가기
데이터 분석/시각화

[Seaborn] 11. 카테고리(범주, Category) 변수 시각화하기 (feat. catplot)

by 부자 꽁냥이 2022. 8. 13.

반갑습니다~!! 꽁냥이입니다. Seaborn에는 catplot을 이용하여 카테고리(범주, Category) 변수를 시각화하는 그래프를 그릴 수 있습니다. 이번 포스팅에서는 catplot 사용법에 대해 알아보겠습니다.

 

- 목차 -

Seaborn catplot 사용법


   Seaborn catplot 사용법

catplot은 data인자에 데이터프레임 구조를 갖는 데이터를 넣어주고, x, y인자에 칼럼명을 설정합니다(catplot이므로 둘 중하나는 범주형 변수 타입이어야되지요). 그리고 col 인자에 범주형 칼럼명을 지정하여 해당 칼럼 범주 수만큼 그래프를 분할하여 그려주게 됩니다.

 

import seaborn as sns
sns.set_theme(style='ticks')
tip_df = sns.load_dataset('tips')
sns.catplot(x='day', y='total_bill',data=tip_df,
            col='smoker',
            )

 

그래프 종류는 디폴트로 Strip Plot입니다. 그래프 종류를 바꾸고 싶다면 kind 인자를 쓰면 됩니다. 꽁냥이는 박스 플롯으로 바꾸었어요. kind 인자에 들어갈 수 있는 것들이 무엇인지 궁금하신 분들은 여기를 참고하시면 됩니다.

 

sns.catplot(x='day', y='total_bill',data=tip_df,
            col='smoker',
            kind='box'
            )

 

또한 hue 인자에 범주형 칼럼을 지정하여 그래프를 한번 더 세분화 할 수 있습니다. hue_order를 통해 색상 적용 순서도 바꿀 수 있습니다.

 

sns.catplot(x='day', y='total_bill',data=tip_df,
            col='smoker',
            kind='box',
            hue='sex',
            hue_order=['Female', 'Male']
            )

 

 

또한 height, aspect를 통해 각 그래프 사이즈를 조절할 수 있습니다. 아래 그림은 height를 5, aspect=0.8로 하여 사이즈를 조절했습니다. 이때 aspect=width/hegith로 이 경우 width=0.8*height = 4가 됩니다.

 

sns.catplot(x='day', y='total_bill',data=tip_df,
            col='smoker',
            kind='violin',
            hue='sex',
            hue_order=['Female', 'Male'],
            height=5,
            aspect=.8
            )

 


오늘은 Seaborn catplot을 이용한 범주형 변수를 갖는 데이터 시각화 방법에 대해서 알아보았습니다. 범주별로 그래프 그리는 것은 실제로 많이 활용되므로 꼭 알아두시기 바랍니다. 여기서 소개되지 않은 catplot의 기능은 여기를 참고해주세요.

 

부디 이번 포스팅이 많은 분들께 도움이 되시길 바라며 이상 포스팅 마치겠습니다.

 


댓글


맨 위로