본문 바로가기

데이터 분석175

[Matplotlib] 눈금 라벨(Tick Label) 폰트 사이즈, 굵기 설정하기 안녕하세요~ 꽁냥이에요. 이번 포스팅에서는 지난 포스팅에서 다룬 tick_params를 이용한 눈금 라벨 꾸미기에서 다루지 못했던 내용을 소개하려고 합니다. 여기서는 간단하게 tick_params를 쓰지 않고 눈금 라벨 폰트 사이즈를 바꾸는 방법과 굵기(예: 볼드) 설정 방법에 대해서 알아보겠습니다. tick_params를 이용한 눈금 및 눈금 라벨 꾸미기(라벨 회전, 크기, 색상 등)에 대한 내용은 아래 포스팅을 참고해 주세요. [Matplotlib] 눈금과 눈금 라벨 꾸미기 (feat. tick_params) [Matplotlib] 눈금과 눈금 라벨 꾸미기 (feat. tick_params) 안녕하세요~ 꽁냥이입니다. 데이터 시각화를 하다 보면 좌표의 눈금과 눈금 라벨을 커스터마이징하고 싶을 때가 있.. 2023. 5. 24.
[Matplotlib] 메인 눈금(Major Tick), 서브 눈금(Minor Tick) 라벨 따로 지정하기 (feat. MultipleLocator) 안녕하세요~ 꽁냥이에요. 꽁냥이가 시각화를 하다가 메인 눈금(Major Tick), 서브 눈금(Minor Tick)에 라벨을 따로 설정해야 할 일이 생겼는데 이게 꽤나 번거로운 작업이어서 이번 포스팅에 정리해보려고 합니다. 메인 눈금(Major Tick), 서브 눈금(Minor Tick) 라벨 따로 지정 먼저 아래 코드는 A, B Class에서 5명의 수학, 역사, 컴퓨터 성적을 박스 플롯으로 그린 것입니다. 그러고 나서 A, B Class는 서브 눈금(Minor Tick) 라벨로하고 과목은 메인 눈금(Major Tick) 라벨로 설정할 것입니다. 여기서는 핵심적인 부분만 설명하기로 하고 나머지는 주석을 참고해 주세요. import pandas as pd import numpy as np import m.. 2023. 5. 18.
[Pandas] 41. dfply를 이용하여 데이터프레임 쉽게 다루기 안녕하세요~ 꽁냥이에요. R을 이용하시는 분들은 데이터 테이블을 파이프라인 연산자 '%>%'을 이용하여 쉽게 전처리 코딩을 할 수 있습니다. 하지만 파이썬(Python)에서도 Pandas의 데이터프레임을 파이프라인 연산자 '>>' 또는 '>>='을 이용하여 전처리를 쉽게 할 수 있다는 것을 알고 계셨나요? 바로 오늘 소개할 dfply을 이용하면 이것이 가능합니다. 이번 포스팅에서는 dfply 사용법에 대해서 알아보겠습니다. - 목차 - 1. dfply 기본 2. 칼럼 선택 및 제외 3. 행 필터링 4. 데이터 변환(칼럼 생성) 5. 윈도우 함수와 요약 함수 6. 그룹별 집계 7. 재구조화 8. 결합 9. 집합 연산과 바인딩 1. dfply 기본 1) 설치 먼저 dfply를 pip 명령어를 통해 설치해 줍.. 2023. 5. 5.
[Numpy] 원-핫 인코딩(One-Hot Encoding) 간단하게 해보기 (feat. eye) 안녕하세요~ 꽁냥이에요. 데이터 전처리시 범주형 변수가 있는 경우 이를 One-Hot Encoding으로 변환하는 경우가 많은데요. Numpy에서 제공하는 eye 함수를 이용하면 One-Hot Encoding을 쉽게 할 수 있는데요. 이번 포스팅에서는 Numpy를 이용한 One-Hot Encoding 방법을 알아보고 나만의 One-Hot Encoder를 만들어보는 방법에 대해서 알아보겠습니다. 원-핫 인코딩(One-Hot Encoding) 구현 1) numpy를 이용한 One-Hot Encoding : eye 만약 범주가 0부터 시작하는 숫자로 되어 있는 경우 Numpy의 eye 함수를 이용하여 One-Hot Encoding을 할 수 있습니다. eye 함수는 숫자를 인자로 받고 해당 숫자만큼의 행을 갖는.. 2023. 4. 16.
[Matplotlib] 눈금과 눈금 라벨 꾸미기 (feat. tick_params) 안녕하세요~ 꽁냥이입니다. 데이터 시각화를 하다 보면 좌표의 눈금과 눈금 라벨을 커스터마이징하고 싶을 때가 있습니다. 예를 들면 x축에 날짜가 들어가서 가로로 쓰면 오버랩이 발생하여 90도 회전한다거나 눈금 라벨을 크게 하는 것처럼 말이죠. Matplotlib에서 tick_params를 이용하면 눈금과 눈금 라벨을 변경할 수 있는데요. 이번 포스팅에서는 tick_params의 사용법을 알아보겠습니다. tick_params 사용법 tick_params는 눈금과 눈금 라벨을 꾸미는 기능을 제공하는데요. 여기서는 꽁냥이가 많이 사용하는 기능 위주로 소개하겠습니다. 1) 눈금 라벨 회전 : rotation or labelrotation tick_params에서 rotation 또는 labelrotation 인자.. 2023. 4. 12.
[Pandas Tip] 오류 해결 - SettingWithCopyWarning 안녕하세요~ 꽁냥이에요. Pandas로 특정 조건에 맞는 행을 추출해서 만든 데이터를 가지고 새로운 칼럼을 만들거나 특정 셀 값을 변경하려고 할 때 종종 SettingWithCopyWarning 경고가 나타나는 것을 알 수 있습니다. 이번 포스팅에서는 이러한 오류가 나는 이유를 예제와 함께 살펴보고 해결방법 또한 소개하겠습니다. SettingWithCopyWarning SettingWithCopyWarning은 Chained Assignment인 경우와 Hidden Chaining의 경우에 따라 해결 방법이 다르므로 각각에 대해서 살펴보겠습니다. 또한 경고창을 끄는 방법도 살펴보겠습니다. 1) Chained Assignment Chained Assignment를 알아보기 전에 Assignment와 Acc.. 2023. 2. 10.
[Matplotlib] 시간에 따른 선 그래프(Line Chart)와 박스 플롯(Box Plot, 상자 수염 그림) 같이 그리기 안녕하세요~ 꽁냥이에요. 박스 플롯이나 선 그래프 둘 다 그 자체로도 훌륭한 시각화 수단이지만 같이 사용하게 되었을 경우 더 많은 정보를 한눈에 보여줄 수 있습니다. 이번 포스팅에서는 Matplotlib을 이용하여 박스 플롯과 선 그래프를 같이 그려보는 방법에 대해서 알아보겠습니다. Matplotlib을 이용한 선 그래프나 박스 플롯을 그리는 방법은 아래 포스팅을 참고해 주세요. [상자 수염 그림(Box and Whisker Plot)] 1. Matplotlib을 이용하여 상자 수염 그림 그리기 [상자 수염 그림(Box and Whisker Plot)] 2. Matplotlib을 이용하여 그룹 상자 수염 그림(박스 플롯) 그리기 [선 그래프(Line graph)] 1. Matplotlib을 이용하여 선 .. 2023. 2. 10.
[Pandas Tip] 오류 해결 - PerformanceWarning: DataFrame is highly fragmented. This is usually the result of calling `frame.insert` many times, which has poor performance. Consider joining all columns at once using pd.concat(axis=1) instead 안녕하세요~ 꽁냥이에요. Pandas 데이터프레임(DataFrame)에 칼럼을 for loop를 이용하여 대량으로 추가한다면 종종 아래와 같은 경고를 볼 수 있습니다. PerformanceWarning: DataFrame is highly fragmented. This is usually the result of calling `frame.insert` many times, which has poor performance. Consider joining all columns at once using pd.concat(axis=1) instead 이번 포스팅에서는 해당 경고가 나오는 이유와 해결 방법에 대해서 알아보겠습니다. PerformanceWarning: DataFrame is highly fragm.. 2023. 2. 3.
[Matplotlib] 분봉 차트(Candle Chart, 캔들 차트) 그리기 반갑습니다~ 꽁냥이입니다. 주가를 보다 보면 분봉 차트(Candle Chart, 캔들 차트)를 많이 보게 되는데요. 꽁냥이는 Matplotlib으로 분봉 차트(Candle Chart, 캔들 차트)를 그려보고 싶다는 생각이 들어서 이번 기회에 도전해 보았습니다. 이번 포스팅에서는 분봉 차트(Candle Chart, 캔들 차트)를 Matplotlib만을 이용하여 그리는 방법과 mpl_finance 모듈을 이용하여 그리는 방법을 알아보겠습니다. - 목차 - 1. Matplotlib으로 그리기 2. mpl_finance 이용하기 1. Matplotlib으로 그리기 먼저 데이터를 불러옵니다. import FinanceDataReader as fdr import matplotlib.pyplot as plt from.. 2023. 1. 22.
[Pandas] 40. 데이터프레임(DataFrame)의 특정 칼럼으로 데이터 순위 매기기 (feat. rank) 안녕하세요~ 꽁냥이에요. 데이터 분석을 하다 보면 특정 칼럼에 어떤 값을 기준으로 순위(Rank)를 매겨야 할 때가 있는데요. Pandas에서는 rank라는 함수를 이용하여 데이터프레임(DataFrame)의 특정 칼럼으로 데이터의 순위를 매길 수 있습니다. 이번 포스팅에서는 데이터 rank를 이용한 순위를 구하는 방법에 대해서 알아보겠습니다. 데이터프레임(DataFrame)의 특정 칼럼으로 데이터 순위 매기기 1) 데이터프레임(DataFrame)의 특정 칼럼을 기준으로 순위 매기기 먼저 숫자 값을 갖고있는 배열의 순위(Rank)를 매기는 방식을 알아보겠습니다. 먼저 배열을 오름차순(또는 내림차순)으로 정렬한 뒤 맨 첫 원소의 1을 부여하고 다음 원소로 갈수록 1씩 증가시켜 순위(Rank)를 부여합니다. .. 2023. 1. 21.

맨 위로