본문 바로가기

전체523

[Python] 함수 내부 코드 가져오기 반갑습니다~ 꽁냥이입니다~ 코딩을 하다 보면(특히 알고리즘을 구현하려고 할 때) 특정 라이브러리가 제공하는 함수가 어떻게 동작하는지 알고 싶을 때가 있습니다. 이를 위해 함수 내부 코드를 알아야 할 필요가 있지요. 파이썬에서는 inspect라는 모듈을 사용하여 특정 함수 내부 코드를 알아낼 수 있습니다(매우 유용한 기능입니다). inspect 모듈 내 getsource라는 함수를 이용하면 함수 내부 코드를 알아낼 수 있습니다. 예를 들어 넘파이(Numpy)의 평균을 계산하는 함수 내부 코드를 알고 싶다면 다음과 같이 해주세요. 이때 print를 꼭 써주세요. 안 그러면 이스케이프 문자(\n, \t 등)가 그대로 출력되어 가독성이 떨어집니다. import numpy as np import inspect p.. 2022. 4. 3.
제 3회 빅데이터 분석기사 준비 과정 및 합격 후기 !! 안녕하세요~ 꽁냥이에요. 굉장히 오랜만에 글을 쓰네요~~ 다름이 아니오라 2022년도 4월 9일에 제4회 빅데이터 분석기사 필기시험이 있는데요. 이번 포스팅에서는 빅데이터 분석기사 시험이 무엇인지 그리고 혹시라도 시험을 준비하는 분들께 도움이 될까 싶어서 꽁냥이의 시험 준비과정을 소개하려고 해요. 1. 필기 시험 2. 실기 시험 1. 필기시험 1) 시험 개요 먼저 빅데이터 분석기사 필기시험에 대한 정보를 알려드릴게요. 공식 사이트에서도 확인 가능해요. a. 접수처 데이터자격검정센터(https://www.dataq.or.kr) b. 시험 과목 빅데이터 분석기사 필기시험은 아래와 같습니다. 보시는 바와 같이 총 4과목으로 이루어져 있습니다. 만만치 않은 양이지요. c. 검정방법 및 합격기준 검정방법 및 합격.. 2022. 4. 2.
[오류 해결] Pandas data cast to numpy dtype of object. Check input data with np.asarray(data) 꽁냥이가 회귀 분석을 하다가 아래와 같은 오류를 발생했어요. Pandas data cast to numpy dtype of object. Check input data with np.asarray(data) 해당 오류는 숫자값이 들어가야 할 자리에 다른 타입의 데이터, 예를 들면 문자열 데이터가 들어와서 발생하는 오류인데요. 아래 예제 코드를 통해서 확인해보겠습니다. import pandas as pd import statsmodels.api as sm df = pd.DataFrame() df['y'] = [1,1,2,3,2,4,5,2,3] df['x1'] = ['3','2','2','4','6','5','7','3','1'] df['x2'] = [3.3,1.2,7.7,3.3,2.1,5.7,7.1,0.3.. 2021. 11. 5.
[Numpy] 4. 통계량 구하기 안녕하세요~ 꽁냥이에요. 이번 포스팅에서는 꽁냥이가 자주 쓰는 통계량을 구해주는 Numpy 함수들을 소개하려고 합니다. 아래 테이블에 함수를 소개했고 테이블에서 data는 1차원 배열로 이루어진 데이터를 의미합니다. 실제 사용법은 코드를 참고해주세요. 1. 대표값 평균 np.mean(data) 중앙값 np.median(data) 최빈값 np.bincount(data).argmax() 제 1 사분위수 np.quantile(data, 0.25) 제 2 사분위수 np.quantile(data, 0.5) 제 3 사분위수 np.quantile(data, 0.75) 2. 최대, 최소 최대값 np.max(data) 최소값 np.min(data) 3. 산포 통계량 표본 표준편차(자유도)(*) np.std(data, d.. 2021. 10. 29.
Plotly를 이용하여 모션 버블 차트 만들기 반갑습니다~ 꽁냥이 블로그에 오신 것을 환영합니다. 지난 포스팅에서는 3~4차원 데이터를 2차원 평면으로 시각화한 것이 버블 차트이며 Matplotlib을 이용하여 그려보는 방법에 대해서 알아보았습니다. Matplotlib을 이용하여 버블 차트(Bubble Chart) 그리기 Matplotlib을 이용하여 버블 차트(Bubble Chart) 그리기 안녕하세요~ 꽁냥이에요. 오늘은 버블 차트에 대해서 알아보려고 하는데요. 버블 차트는 3차원 데이터를 2차원의 형태로 한눈에 볼 수 있는 차트입니다. 또한 색상 정보를 이용하면 4차원 데이터 zephyrus1111.tistory.com 모션 버블 차트는 시간이라는 변수가 추가되어 시간에 따라 동적으로 움직이는 버블 차트입니다. 이렇게 시간에 따라 움직이는 버블.. 2021. 10. 28.
[시계열 분석] 8. Random Walk와 단위근 검정(Unit Root Test)에 대해서 알아보자. 이번 포스팅에서는 비정상(Non-stationary) 시계열 중 하나인 Random Walk 시계열에 대해서 포스팅하려고 한다. 여기서 다루는 내용은 다음과 같다. 1. Random Walk 란? 2. 단위근 검정(Unit Root Test) 1. Random Walk 란? 1.1 정의 시계열 데이터 $X_t$가 아래와 같은 모형을 따른다고 해보자. $$X_t = X_{t-1}+Z_t\tag{1.1}$$ $$X_t = \mu+ X_{t-1}+Z_t\tag{1.2}$$ 여기서 $Z_t$는 평균이 0이고 분산은 $\sigma^2$인 백색 잡음(White Noise)이며 $X_0$는 초기값으로 실수값으로 간주하자. 또한 $\mu=E(X_t-X_{t-1})$이다. 이때 식 (1.1)을 Random Walk 모형.. 2021. 9. 24.
[Numpy] 3. 배열 연산(Operation) 반갑습니다~ 꽁냥이입니다~!! 저번 포스팅에서는 Numpy 배열의 Slicing 방법을 알아보았는데요. [Numpy] 2. Numpy 배열 Slicing [Numpy] 2. Numpy 배열 Slicing 안녕하세요~ 꽁냥이에요. 요즘 Numpy에 대한 글을 포스팅하고 있는데요. [Numpy] 1. Numpy 배열 생성하기 [Numpy] 1. Numpy 배열 생성하기 안녕하세요~ 꽁냥이에요. Numpy 모듈은 배열의 조작 및 연산에 최적 zephyrus1111.tistory.com 이번 포스팅에서는 배열의 연산에 대해서 알아보겠습니다. 여기서 다루는 내용은 다음과 같습니다. 1. 사칙 연산 및 행렬 곱 2. 삽입, 삭제, 수정, 결합 1. 사칙 연산 및 행렬 곱 1.1 사칙 연산 먼저 배열 간 사칙 연산에.. 2021. 9. 21.
[Numpy] 2. Numpy 배열 Slicing 안녕하세요~ 꽁냥이에요. 요즘 Numpy에 대한 글을 포스팅하고 있는데요. [Numpy] 1. Numpy 배열 생성하기 [Numpy] 1. Numpy 배열 생성하기 안녕하세요~ 꽁냥이에요. Numpy 모듈은 배열의 조작 및 연산에 최적화되어 있을 뿐만 아니라 각종 통계량 계산, 결측값 처리 그리고 집계 등 데이터 전처리&분석과 관련된 유용한 기능을 제공합니 zephyrus1111.tistory.com 이번에는 Numpy 배열 Slicing에 대해서 포스팅해보려고 합니다. 배열 Slicing은 배열에 포함된 원소 개별값 또는 부분 집합을 추출하는 뜻이에요. 여기에서는 1차원 배열에 대해서 중점적으로 다룹니다. 1. Index를 통한 Slicing 2. 조건문을 통한 Slicing 1. Index를 통한 S.. 2021. 9. 21.
[Numpy] 1. Numpy 배열 생성하기 안녕하세요~ 꽁냥이에요. Numpy 모듈은 배열의 조작 및 연산에 최적화되어 있을 뿐만 아니라 각종 통계량 계산, 결측값 처리 그리고 집계 등 데이터 전처리&분석과 관련된 유용한 기능을 제공합니다. 따라서 데이터 분석과 관련된 여러가지 유용한 Numpy 기능과 예제를 소개하려고 합니다. 이번 포스팅에서는 배열 생성에 대한 내용을 다루려고 합니다. 여기서 다루는 내용은 다음과 같습니다. 1. 기본 2. 특수 배열 생성하기 1 기본 배열을 생성하는 기본적인 방법은 array를 이용하는 방법입니다. array에는 리스트나 튜플 객체를 인자로 받습니다. 아래 코드는 원소가 3개인 1차원 배열을 생성합니다. a = np.array([1,2,3]) ## 또는 np.array((1,2,3)) Numpy는 1차원뿐만 .. 2021. 9. 20.
가설 검정과 P Value(유의 확률)에 대하여 알아보자. 얼마전 회사에서 기초통계 강의를 했었다. 강의 주제는 가설 검정이었는데 그 중에서 P Value는 중요하다고 생각해서 여기에도 포스팅하려고 한다. 가설 검정은 일반적인 내용을 소개하고 모평균 검정, 독립 이표본 평균 비교 검정 등의 특수한 내용은 추후 따로 포스팅하겠다. 먼저 P Value를 알기 위해선 가설 검정과 그 절차를 알아야한다. 이에 대해 알아보자. 1. 가설 검정 이란? 가설 검정은 다음과 같이 정의할 수 있다. 모수에 대한 가설을 모집단으로부터 추출된 표본의 통계량을 이용하여 검정하는 일련의 과정이다. 아래 그림은 가설 검정의 예를 나타낸 것이다. 위 예를 이용하여 가설 검정 절차는 다음과 같다. 1) 만약 어느 초등학교의 3학년 수학 평균이 80점이라는 주장 또는 가설을 세웠다고 하자. .. 2021. 9. 20.

맨 위로