본문 바로가기

데이터 분석/데이터 전처리56

[Pandas] 6. 특정 문자를 포함하는/특정 문자와 일치하는 행 추출하기 안녕하세요~ 꽁냥이에요! 크기가 큰 데이터에서는 모든 데이터가 필요하지 않고 일부 조건 맞는 데이터를 추출해야 하는데요. 특히 모든 행(레코드라고도 합니다)에서 조건에 맞는 일부 행만 추출하는 경우가 상당히 많은데요. 이번 포스팅에서는 특정 문자와 일치하는 행을 추출하는 방법과 특정 문자를 포함하는 방법에 대해서 소개하려고 합니다. 1. 특정 문자와 일치하는 행 추출하기 2. 특정 문자열을 포함하는 행 추출하기 1. 특정 문자와 일치하는 행 추출하기 먼저 이번 포스팅에서 사용할 데이터를 만들어 줄게요. import pandas as pd ## 데이터 생성 data = { '이름' : ['아이린','한예슬','다현','김사랑','강민경'], '주소' : ['서울 마포구','서울 은평구','서울 노원구','.. 2020. 9. 6.
[Pandas] 5. 데이터프래임(DataFrame) 모든 행, 모든 열 출력하기 안녕하세요. 꽁냥이에요~ 크기가 큰 데이터를 Pandas 데이터프래임(DataFrame)에 넣으면 아래의 빨간색으로 표시한 것처럼 중간 부분은 잘려서 나오게 됩니다. 하지만 상황에 따라서 중간에 잘린 데이터를 봐야하는 경우가 생깁니다. 특히, 모든 칼럼(열)을 보고 싶은 경우가 많이 있는데요. Pandas에서 중간에 잘린 데이터를 모두 볼 수 있도록 옵션을 지정할 수 있어요. 모든 열을 보고자 할 때 : pd.set_option('display.max_columns', None) 모든 행을 보고자 할 때 : pd.set_option('display.max_rows', None) 우선 이번 포스팅을 위한 임시데이터를 만들어보았습니다. 필요하신 분은 다운 받아주세요. 먼저 모든 열을 출력해보도록 하겠습니다... 2020. 8. 31.
[Pandas] 4. 필요한 열(Column) 추출하기 안녕하세요~ 꽁냥이에요! 데이터의 크기가 클 경우에는 모든 데이터를 다루기보다 필요한 열(Column)을 추출하여 데이터의 크기를 줄인다면 더 빠르게 데이터 분석을 수행할 수 있을 거예요. 이번 포스팅에서는 데이터프래임에서 원하는 칼럼을 추출하는 방법에 대해서 알아보겠습니다(상황에 따라 칼럼 또는 열이라는 단어를 사용할게요). Pandas에서는 필요한 칼럼을 추출하는 방법을 여러 가지 제공하고 있어요. 여기서는 칼럼 이름을 사용하는 방법, iloc 함수를 이용하는 방법, drop 함수를 이용하는 방법 총 3가지를 알아보겠습니다. 1. 칼럼 이름을 사용하는 방법 2. iloc를 이용하여 원하는 칼럼 추출하기 3. drop을 이용하여 원하는 칼럼 추출하기 1. 칼럼 이름을 사용하는 방법 먼저 칼럼 이름을 이.. 2020. 8. 26.
[Pandas] 3. csv 파일 불러오기/저장하기 안녕하세요~ 꽁냥이에요!! 이번 포스팅에서는 판다스(Pandas)에서 csv파일을 불러오고 저장하는 방법에 대해서 알아보겠습니다. 방법은 저번 포스팅에서 텍스트(txt) 파일을 불러오고 저장했던 방법과 동일합니다. 1. Pandas에서 csv 파일 일기(불러오기) 2. Pandas에서 데이터프레임(DataFrame)을 csv 파일로 저장하기 1. Pandas에서 csv 파일 읽기(불러오기) 여기서는 csv 파일 안에 헤더(칼럼)가 있는 경우와 없는 경우에 대해서 나눠서 설명하겠습니다. 먼저 헤더가 있는 경우에 대해서 살펴보겠습니다. 꽁냥이는 다음과 같은 텍스트 파일을 불러오려고 합니다. 번호,이름,성별,비고 1,아이린,여자,존예 2,박보검,남자,존잘 3,유민상,남자,재미있음 4,꽁냥이,남자,착함 위의 c.. 2020. 8. 25.
[Pandas] 2. 텍스트 파일(.txt) 불러오기/저장하기 안녕하세요~~ 꽁냥이에요! 저번 포스팅에서는 Pandas에서 DataFrame을 생성하는 방법에 대해서 알아보았습니다. 실무에서는 DataFrame을 직접 생성하지 않고 외부 데이터 파일을 읽어서 이를 DataFrame으로 만들어주는 작업을 더 많이 하지요. 그리고 전처리 과정을 거친 데이터 또는 데이터 분석 결과를 외부에 파일 형태로 저장하기도 합니다. 데이터를 저장하는 파일 형식 중에 하나로 텍스트(txt) 파일이 있습니다. 텍스트 파일에 데이터를 저장할 때에는 기본적으로 구분자를 함께 넣어줍니다. 구분자는 쉼표나 세미콜론 또는 tab이 될 수 있지요. 파이썬(Python)에서는 '텍스트 파일 읽기/쓰기'에 대한 방법이 여러가지가 있어요. Pandas에서도 텍스트를 읽고 저장하는 함수를 제공하고 있는.. 2020. 8. 12.
[Pandas] 1. DataFrame 생성하기 안녕하세요~~ 꽁냥이에요! Pandas는 데이터를 행과 열로 이루어진 우리에게 익숙한 테이블 형태로 제공하고요. 데이터 조회, 데이터 변환, 칼럼 추출, 결측치 처리 등 데이터 전처리에 필요한 강력한 기능을 제공하고 있어서 데이터를 분석한다면 Pandas를 필수적으로 다룰 수 있어야해요. 또한 Pandas의 문서는 자세한 설명과 다양한 예제를 제공하고 있어서 모르는 것이 있다면 관련 내용을 빠르게 찾고 쉽게 이해할 수 있어요. Pandas 문서 : pandas documentation — pandas 1.0.5 documentation API reference The reference guide contains a detailed description of the pandas API. The refere.. 2020. 7. 30.

맨 위로