반갑습니다~!! 꽁냥이입니다. Seaborn에는 relplot을 이용하여 변수간 상관성을 시각화하는 그래프를 그릴 수 있으며 여러 범주로 세분화하여 시각화할 수도 있습니다. 이번 포스팅에서는 relplot 사용법에 대해 알아보겠습니다.
- 목차 -
Seaborn relplot 사용법
Seaborn catplot 사용법
relplot은 data인자에 데이터프레임 구조를 갖는 데이터를 넣어주고, x, y인자에 칼럼명을 설정합니다. 그리고 col 인자에 범주형 칼럼명을 지정하여 해당 칼럼 범주 수만큼 그래프를 분할하여 그려주게 됩니다.
import seaborn as sns
sns.set_theme(style='ticks')
tip_df = sns.load_dataset('tips')
sns.relplot(x='total_bill', y='tip',data=tip_df,
col='smoker'
)
그래프 종류는 디폴트로 산점도 입니다. 그래프 종류를 바꾸고 싶다면 kind 인자를 쓰면 됩니다. 꽁냥이는 박스 라인 차트(선 그래프)으로 바꾸었어요. kind 인자에 들어갈 수 있는 것들 'scatter', 'line' 두 개뿐입니다.
sns.relplot(x='total_bill', y='tip',data=tip_df,
col='smoker',
kind='line'
)
또한 hue 인자에 범주형 칼럼을 지정하여 더 세분화된 그래프를 그릴 수 있습니다. hue_order를 통해 색상 적용 순서도 바꿀 수 있습니다.
sns.relplot(x='total_bill', y='tip',data=tip_df,
col='smoker',
kind='scatter',
hue='sex',
hue_order=['Female', 'Male']
)
또한 height, aspect를 통해 각 그래프 사이즈를 조절할 수 있습니다. 아래 그림은 height를 5, aspect=0.8로 하여 사이즈를 조절했습니다. 이때 aspect=width/hegith로 이 경우 width=0.8*height = 4가 됩니다.
sns.relplot(x='total_bill', y='tip',data=tip_df,
col='smoker',
kind='scatter',
hue='sex',
hue_order=['Female', 'Male'],
height=5,
aspect=.8
)
오늘은 Seaborn catplot을 이용한 변수간 상관성을 시각적으로 잘 파악할 수 있게 해주는 replot 사용법에 대해서 알아보았습니다. 오늘 배운 내용은 실제로 시각화할 때 많이 사용되므로 꼭 알아두세요!! 여기서 소개하지 않은 replot의 기능은 여기를 참고해주세요.
지금까지 꽁냥이었습니다. 안녕히 계세요~!!
댓글