반갑습니다~!! 꽁냥이입니다. Seaborn에는 catplot을 이용하여 카테고리(범주, Category) 변수를 시각화하는 그래프를 그릴 수 있습니다. 이번 포스팅에서는 catplot 사용법에 대해 알아보겠습니다.
- 목차 -
Seaborn catplot 사용법
Seaborn catplot 사용법
catplot은 data인자에 데이터프레임 구조를 갖는 데이터를 넣어주고, x, y인자에 칼럼명을 설정합니다(catplot이므로 둘 중하나는 범주형 변수 타입이어야되지요). 그리고 col 인자에 범주형 칼럼명을 지정하여 해당 칼럼 범주 수만큼 그래프를 분할하여 그려주게 됩니다.
import seaborn as sns
sns.set_theme(style='ticks')
tip_df = sns.load_dataset('tips')
sns.catplot(x='day', y='total_bill',data=tip_df,
col='smoker',
)
그래프 종류는 디폴트로 Strip Plot입니다. 그래프 종류를 바꾸고 싶다면 kind 인자를 쓰면 됩니다. 꽁냥이는 박스 플롯으로 바꾸었어요. kind 인자에 들어갈 수 있는 것들이 무엇인지 궁금하신 분들은 여기를 참고하시면 됩니다.
sns.catplot(x='day', y='total_bill',data=tip_df,
col='smoker',
kind='box'
)
또한 hue 인자에 범주형 칼럼을 지정하여 그래프를 한번 더 세분화 할 수 있습니다. hue_order를 통해 색상 적용 순서도 바꿀 수 있습니다.
sns.catplot(x='day', y='total_bill',data=tip_df,
col='smoker',
kind='box',
hue='sex',
hue_order=['Female', 'Male']
)
또한 height, aspect를 통해 각 그래프 사이즈를 조절할 수 있습니다. 아래 그림은 height를 5, aspect=0.8로 하여 사이즈를 조절했습니다. 이때 aspect=width/hegith로 이 경우 width=0.8*height = 4가 됩니다.
sns.catplot(x='day', y='total_bill',data=tip_df,
col='smoker',
kind='violin',
hue='sex',
hue_order=['Female', 'Male'],
height=5,
aspect=.8
)
오늘은 Seaborn catplot을 이용한 범주형 변수를 갖는 데이터 시각화 방법에 대해서 알아보았습니다. 범주별로 그래프 그리는 것은 실제로 많이 활용되므로 꼭 알아두시기 바랍니다. 여기서 소개되지 않은 catplot의 기능은 여기를 참고해주세요.
부디 이번 포스팅이 많은 분들께 도움이 되시길 바라며 이상 포스팅 마치겠습니다.
'데이터 분석 > 시각화' 카테고리의 다른 글
[Matplotlib] 선 그래프(라인 차트, Line Chart)에 Errorbar 추가하기 (feat. errobar) (0) | 2022.08.15 |
---|---|
[Seaborn] 12. 변수 간 상관성 확인하기 (feat. relplot) (0) | 2022.08.13 |
[Seaborn] 10. 산점도와 회귀 직선을 동시에 그리기 (feat. lmplot) (0) | 2022.08.13 |
[Seaborn] 9. Swarm Plot 그리기 (feat. swarmplot) (0) | 2022.08.12 |
[Seaborn] 8. Strip Plot(Jitter Plot) 그리기 (feat. stripplot) (0) | 2022.08.12 |
댓글