본문 바로가기

전체523

[Matplotlib Tip] 2. 산점도에 회귀 직선(곡선) 포함시키기 안녕하세요~ 꽁냥이에요. 은근 많이 써먹을 것 같은 Matplotlib 관련 소소한 팁 2번째 시간인데요. 산점도를 그려볼 때 일반적인 트렌드를 확인하거나 변수간 상관관계를 보기 위하여 회귀 직선을 같이 그리기도 하지요. 이번 포스팅에서는 산점도(산포도)에 회귀 직선을 그려보는 방법을 알아보겠습니다. 산점도에 회귀 직선 추가하기 먼저 산점도를 그릴 데이터를 생성하고 데이터를 만들어보겠습니다. 산점도를 그리는 방법은 아래 포스팅에서 꽁냥이가 설명해놓았으니 참고하세요. [산점도(Scatter Plot)] 1. Matplotlib을 이용하여 산점도 그리기 [산점도(Scatter Plot)] 2. Matplotlib을 이용하여 산점도 멋지게 만들어보기 import matplotlib.pyplot as plt i.. 2021. 5. 28.
[Pandas Tip] 1. Pandas Tip 안녕하세요~ 꽁냥이에요. Pandas의 데이터프레임(DataFrame)은 엑셀과 비슷한 기능을 제공합니다. 셀 안에 막대그래프를 넣는 것, 소수점 자리수 조절, 칼럼 숨기기 등과 같은 것처럼 말이죠. 이번 포스팅에서는 이러한 기능을 소개하려고 합니다. 여기서 다루는 내용은 다음과 같아요. 1. 데이터프레임(DataFrame)에 바 차트 넣기 2. 소수점 자리수 조절하여 표시하기 3. 칼럼 숨기기 1. 데이터프레임(DataFrame)에 바 차트 넣기 엑셀에서 셀 안에 막대 그래프(또는 바 차트)를 넣는 것처럼 데이터프레임에도 셀 안에 바 차트를 넣을 수 있습니다. 먼저 이번 포스팅에서 필요한 Pandas와 Numpy를 임포트해줍니다. import pandas as pd import numpy as np 다.. 2021. 5. 27.
[Matplotlib Tip] 1. subplot 겹치지 않게 하기 안녕하세요~ 꽁냥이에요. 시각화 작업을 하다 보면 종종 여러 개 subplot을 그려야 하는 경우가 있을 것입니다. 아래처럼 말이죠. 위 그림에서는 4개의 subplot을 그린 것입니다. 별로 문제될 건 없어 보입니다. 하지만 아래와 같은 경우는 어떨까요? 보시는 바와 같이 subplot들이 겹쳐있습니다. 이번 포스팅에서는 subplot들이 겹쳐 있는 경우 어떻게 해결하는지 알아보겠습니다. 여기서 소개할 방법은 2가지이며 다음과 같습니다. 1. tight_layout을 이용하는 방법 2. subplots_adjust을 이용하는 방법 1. tight_layout을 이용하는 방법 Matplotlib에서는 tight_layout을 이용하여 subplot들이 겹치지 않도록 최소한의 여백을 만들어주는 역할을 합니.. 2021. 5. 26.
8. 연관 규칙 분석(Association Rule Analysis) with Python 이번 포스팅에서는 데이터 간의 관계를 탐색하기 위한 방법으로 마케팅 분야에서 많이 활용되고 있는 연관 규칙 분석(마케팅에서는 장바구니 분석이라고도 한다) 대해서 알아보고자 한다. 여기서 다루는 내용은 다음과 같다. 1. 연관 규칙 분석이란 무엇인가? 2. 연관 규칙 분석 방법 3. 고려 사항 4. 예제 with Python 1. 연관 규칙 분석이란 무엇인가? - 정의 - 연관 규칙 분석(Association Rule Analysis : ARA)은 항목(item)들 관계를 If-Then 형식으로 찾아나가는 분석 방법을 말하며 일종의 규칙 기반 학습(Rule-Based Learning) 방법이다. 특히 마케팅에서는 고객들의 상품 구매 데이터를 이용하여 품목 간의 연관성을 알아본다는 의미에서 장바구니 분석(M.. 2021. 5. 23.
[블로거 한마디] 전체 방문자 10만 명을 달성했습니다. 안녕하세요. 꽁냥이에요. 어제 드디어 전체 방문자 10만 명을 달성했어요. 하루 방문수도 처음엔 50~100명 정도였는데 이제는 주중 방문수가 1100~1300명 정도로 늘어났어요. 꽁냥이 블로그를 많이 이용해주셔서 감사합니다. 블로그 초기에는 열심히 포스팅했는데 지금은 일이 바빠 많이 못하고 있어요. 포스팅할 것은 중간중간 메모하고 있지만 계속 쌓이기만 하네요. 공부할 건 많고 시간은 없고 ㅠ.ㅠ 꽁냥이는 시간은 걸릴지라도 계획한 것을 하나씩 하나씩 포스팅하려고 해요. 포스팅 하나하나가 저의 인생 작품, 저의 얼굴이라는 마음으로요. 다시 한번 꽁냥이의 블로그를 이용해주셔서 감사합니다. 2021. 5. 23.
[산점도(Scatter Plot)] 2. Matplotlib을 이용하여 산점도 멋지게 만들어보기 안녕하세요~ 꽁냥이에요. 저번 포스팅에서는 산점도를 그리고 꾸며보는 방법에 대해서 알아보았습니다. [산점도(Scatter Plot)] 1. Matplotlib을 이용하여 산점도 그리기 "저번 포스팅에서 산점도 꾸미는 방법을 이미 알아보았는데 무슨 또 꾸미고 있느냐?"라고 하실지 모르겠지만 꽁냥이는 아직 뭔가 부족하다고 생각했어요. 그래서 이번 포스팅에서는 좀 더 고급(?)스럽게 보이기 위하여 산점도를 꾸미는 방법에 대해서 알아보려고 합니다. 여기서 다루는 내용은 다음과 같습니다. 1. 예제 2. 산점도에 컬러맵 적용하기 3. 텍스트 표시하기 1. 예제 먼저 다음의 상황을 생각해봅시다~ 나팀장 : 꽁냥씨~ 어디 가나요? 꽁냥이 : 네 팀장님. 이제 퇴근하려고 합니다. 나팀장 : 방금 카페 위치와 매출액 데.. 2021. 5. 22.
[산점도(Scatter Plot)] 1. Matplotlib을 이용하여 산점도 그리기 안녕하세요~ 꽁냥이에요. 데이터 분석 시 두 개의 연속형 변수가 있을 때 이들의 분포를 보기 위하여 산점도를 그립니다. 산점도는 각 변수의 분포뿐 아니라 두 변수간 상관관계도 시각적으로 파악할 수 있다는 장점이 있습니다. 이번 포스팅에서는 Matplotlib을 이용하여 산점도 그리는 방법을 알아보겠습니다. 여기서 다루는 내용은 다음과 같습니다. 1. 기본적인 산점도 그리기 2. 산점도 꾸미기 3. 산점도 여러개 겹쳐 그리기 1. 기본적인 산점도 그리기 Matplotlib에서는 scatter 함수를 이용하여 산점도를 그릴 수 있습니다. scatter 함수의 기본적인 사용법은 x축에 들어갈 데이터를 첫 번째 인자, y축에 들어갈 데이터를 두 번째 인자로 넣어주는 것입니다. scatter(x, y) 이제 코드.. 2021. 5. 21.
[Pandas] 19. concat vs append 성능 차이 알아보기 안녕하세요~ 꽁냥이에요. 칼럼이 같은 여러 개 데이터프레임을 세로로 결합할 때 concat 또는 append를 많이 쓰지요. append는 세로로만 결합할 수 있지만 concat는 가로, 세로 모두 결합할 수 있지요. 하지만 이외에도 concat 함수가 더 빠르다는 것을 알고 있나요? 이번 포스팅에서는 append와 concat의 성능 차이를 알아보겠습니다. 여기서 다루는 내용은 다음과 같습니다. 1. append vs concat 2. concat 제대로 활용하기 append vs concat 먼저 필요한 모듈을 임포트하고 여기서 사용할 데이터 생성 함수를 정의해줍니다. import pandas as pd import numpy as np from tqdm import tqdm def generate_.. 2021. 5. 20.
[병렬 프로그래밍] 4. Multi-Process 응용 with Python 이 포스팅은 꽁냥이가 병렬 프로그래밍 공부한 내용을 포스팅하는 곳입니다. 지난 포스팅에서는 파이썬(Python)으로 멀티 프로세스(Multi Process)를 사용하는 방법과 이를 언제 사용하면 좋은지에 대해서 알아봤다. [병렬 프로그래밍] 3. Multi-Process 사용하기 with Python 이번 포스팅에서는 멀티 프로세스를 이용하여 시간을 단출시킬 수 있는 (실제 쓰일 법한) 예제를 알아보려고 한다. Corey Schafer 님의 Python Tutorial Multi Processing 영상을 참고했다. 여기서 다루는 내용은 다음과 같다. 1. 이미지 처리 2. csv 파일 저장 1. 이미지 처리 여기서는 꽤 용량이 있는 이미지의 처리를 멀티 프로세스를 사용하지 않는 경우와 사용하는 경우에 .. 2021. 5. 17.
[병렬 프로그래밍] 3. Multi-Process 사용하기 with Python 이 포스팅은 꽁냥이가 병렬 프로그래밍 공부한 내용을 포스팅하는 곳입니다. 이번 포스팅에서는 멀티 프로세스(Multi-Process)를 사용하는 기본적인 방법에 대해서 소개하려고 한다. 이번 포스팅에서도 Corey Schafer 님의 Python Multiprocessing 강의 영상을 (아주 많이) 참고했다. 여기서 다루는 내용은 다음과 같다. 1. 예제 2. multiprocessing 모듈 사용하기 3. concurrent 모듈 이용하기 4. 멀티 프로세스은 언제 써야 할까? 1. 예제 아래의 함수를 4번 실행한다고 생각해보자. 이 함수는 1초간 잠들었다가 깨어나는 동작을 수행한다. def do_something(): print('1초간 잠을 잡니다...') time.sleep(1) print('잠에.. 2021. 5. 16.

맨 위로