본문 바로가기
블로거 한마디

제 3회 빅데이터 분석기사 준비 과정 및 합격 후기 !!

by 부자 꽁냥이 2022. 4. 2.

안녕하세요~ 꽁냥이에요.

굉장히 오랜만에 글을 쓰네요~~

 

다름이 아니오라 2022년도 4월 9일에 제4회 빅데이터 분석기사 필기시험이 있는데요. 이번 포스팅에서는 빅데이터 분석기사 시험이 무엇인지 그리고 혹시라도 시험을 준비하는 분들께 도움이 될까 싶어서 꽁냥이의 시험 준비과정을 소개하려고 해요.

 

1. 필기 시험

2. 실기 시험


   1. 필기시험

1) 시험 개요

먼저 빅데이터 분석기사 필기시험에 대한 정보를 알려드릴게요. 공식 사이트에서도 확인 가능해요.

a. 접수처

데이터자격검정센터(https://www.dataq.or.kr)

b. 시험 과목

빅데이터 분석기사 필기시험은 아래와 같습니다.

 

빅데이터 분석기사 필기 시험 과목

보시는 바와 같이 총 4과목으로 이루어져 있습니다. 만만치 않은 양이지요.

c. 검정방법 및 합격기준

검정방법 및 합격기준은 아래와 같습니다.

빅데이터 분석 기사 검정 방법 및 합격 기준

문항은 모두 객관식이며 총 80문항, 과목당 20문항입니다. 그리고 시험시간은 2시간입니다.

한 문제를 1.5분(120분/80문제)에 풀어야 합니다. 또한 주의할 것은 합격기준은 100점 만점 기준 평균 60점 이상이어야 하며 한 과목당 최소 40점은 넘겨야 합니다.

d. 응시자격

빅데이터 분석기사는 아무나 볼 수 있는 시험은 아니더라고요 ㄷㄷ;;

응시자격은 아래와 같으며 이 중 하나의 조건만 만족해도 시험을 볼 수 있습니다.

빅데이터 분석기사 응시자격

e. 응시료

필기시험의 경우 응시료는 17,800원입니다.


2) 준비 과정

꽁냥이의 경우 필기시험은 시험 3주 전부터 열심히 달렸어요. 

 

교재는 시대고시기획에서 출판한 "빅데이터 분석기사 필기 한 권으로 끝내기"를 이용했어요. 가격은 35,000원이에요~

 

꽁냥이가 사용한 교재

 

3주 동안 이 책에 있는 내용은 빠짐없이 읽고 문제도 모두 한번 이상 풀었고요.

 

꽁냥이는 빅데이터 탐색, 모델링, 결과 해석 부분은 아는 내용이 좀 있어서 한번 훑어보는 식으로 했고 잘 모르는 빅데이터 분석 기획을 더 많이 보았어요.

 

이 책에는 각 과목별로 요약정리(위에서 오른쪽 그림)가 잘되어 있어서 시험 2일 전 그리고 당일에는 이 부분만 봤어요.


3) 필기시험 후기

시험 볼 때 시간은 그렇게 촉박하다는 생각은 들지 않았고요.

 

빅데이터 탐색, 모델링, 결과 해석 부분은 이 책이 많은 도움이 되었는데 빅데이터 분석기획에서는 이 책에서 다루지 않은 내용들도 문제가 나왔어요. 제가 기억나는 건 EU GDPR(General Data Protection Regulation)가 문제로 나왔는데 요 책에서는 이걸 배운 적이 없었어요.(참고로 EU GDPR은 2018년 5월 25일부터 시행되는 EU의 개인정보보호법령입니다.)

 

그리고 통계량 계산하는 문제랑 딥러닝 문제(입력값이 주어질 때 주어진 가중치를 이용하여 출력 값 계산)도 나왔어요. 계산 문제는 손으로 계산해야 해요(계산기는 사용할 수 없어요). 시험 본 지 좀 오래돼서 많이 알려드리지 못하네요 ㅠㅠ.

 

시험을 다 보고 나서 빅데이터 분석기획 부분이 가장 불안했어요. 그렇게 불안에 떨다가 시험 결과를 보았지요.

 

시험결과

역시 예상대로 분석기획에서 점수가 가장 낮았지만 과락은 면해서 어찌어찌 합격했습니다~

 

이번 시험 준비하면서 느낀 점은 막 몇 달 전부터 빡세게 할 필요는 없고 틈틈이 시간 내서 한 달 정도면 누구나 시험 합격할 수 있다는 것이었어요. 

 

얼마 남지 않은 필기시험 모두 화이팅 하시고 좋은 결과 있길 바랍니다~


   2. 실기 시험

1) 시험 개요

이번엔 빅데이터 분석기사 실기시험에 대한 정보를 알려드릴게요. 공식사이트에서도 확인 가능해요.

a. 접수처

데이터자격검정센터(https://www.dataq.or.kr)

b. 시험 과목

빅데이터 분석기사 실기시험은 아래와 같아요.

빅데이터 분석기사 실기시험 시험과목

c. 검정방법 및 합격기준

다음은 검정방법 및 합격기준인데요.

빅데이터 분석기사 실기시험 검정방법 및 합격기준

시험은 모두 주관식이며 필답형과 작업형이 있습니다. 필답형은 그냥 주관식이라고 생각하시면 되고요. 작업형은 코딩을 통해 결과를 도출해야 하는 것이라고 생각하면 됩니다.

 

그리고 작업형에도 1 유형과 2 유형으로 나누어지는데요. 각각 3문제, 1문제가 출제됩니다.

 

작업형 1 유형은 주로 통계량 계산 및 데이터 전처리하여 조건을 만족하는 데이터의 개수(행 개수)를 출력하는 문제가 주로 나와요.

 

작업형 2 유형은 주어진 데이터를 이용하여 예측 모형을 구축하고 예측값(또는 예측 확률)을 계산하여 csv로 출력하는 문제예요.

 

실기 시험의 경우 시험 시간은 3시간(180분)입니다.

 

합격기준은 100점 만점에 60점을 넘겨야 되지요~

d. 응시료

실기 시험 응시료는 40,800원입니다.

e. 제출 서류

실기 시험의 경우 아래의 제출 서류를 준비해야합니다.

제출 서류를 다 내실 필요는 없고 응시자격에 해당하는 증빙서류 하나면 됩니다. 꽁냥이의 경우 대학졸업에 해당하기 때문에 졸업증명서만 내면 되었지요.


2) 준비 과정

필기시험 때와 마찬가지로 실기 시험도 3주 정도 준비했어요.

 

교재는 건기원에서 출판한 "수제비 2022"로 해서 공부했어요. 가격은 30,000원이에요.

 

수제비 2022

사실 실기 시험 관련 교재가 이거밖에 없어서 산거긴 한데 기출문제와 모의고사가 3회씩 있다는 점이 좋았어요.

 

공부 시작 첫 주에는 필답형을 준비하는데 주력했고요.

 

2주부터는 필답형과 더불어 작업형을 위해 필요한 코딩 연습을 시작했어요.

 

마지막 3주 차에는 모든 모의고사를 풀어보면서 틀린 문제를 위주로 복습하고 기본적인 파이썬 패키지 사용법을 익히는데 주력했어요.

 

모의고사 열심히 푼 흔적들

그리고 작업형의 경우 R과 파이썬 둘 중 하나를 사용하여 문제를 풀어야 해요.

 

꽁냥이의 경우 파이썬을 주력으로 하다 보니 파이썬을 선택했고요. 코딩 환경은 구름(?)을 이용하더라고요. 구름은 시험 전에 연습할 수 있도록 안내를 해준답니다. 당황하지 않도록 꼭 연습해보세요.

 

구름의 큰 단점은 코딩 자동완성이 되지 않는다는 것인데요. 따라서 함수의 인자, 사용법을 알려주는 help, 클래스 안에 어떤 메서드가 있는지 알려주는 dir을 꼭 활용하셔야 해요. 그리고 이들을 사용할 때에는 print와 같이 써주셔야 해요. 

 

예를 들어 넘파이(Numpy)에서 평균을 구하는 함수의 사용법을 알고 싶다면 아래와 같이 해주세요.

 

import numpy as np

print(help(np.mean))

 

 

그리고 dir를 이용하여 Scikit-Learn에서 제공하는 AdaBoostClassifier클래스의 메서드를 보고 싶다면 아래와 같이 해주세요.

 

from sklearn.ensemble import AdaBoostClassifier
clf = AdaBoostClassifier()
print(dir(clf))

 


3) 실기 시험 후기

필답형은 공부한 내용과 기존에 알고 있었던 상식 수준에서 나왔어요.

 

딥러닝 문제도 나왔어요. 입력값과 가중치가 주어졌을 때 출력값 계산하는 문제요.

 

작업형 1 유형의 경우 Pandas, Numpy를 이용하여 집계하거나 새로운 칼럼 만들기 그리고 전처리해서 걸러진 데이터 행 개수 출력 문제가 나왔던 거 같아요.

 

작업형 2 유형의 경우 학습 데이터를 이용하여 2 분류 모델을 학습하고 주어진 테스트 데이터의 예측 확률을 계산하여 csv로 저장하는 문제가 나왔어요.

 

꽁냥이는 우선 학습 데이터를 7:3 비율로 학습 데이터 1과 테스트 데이터 1로 쪼갰어요.

 

그다음 로지스틱 분류 모형, 앙상블(Adaptive Boosting, Random Forest) 모형을 각각 학습하고 테스트 데이터 1을 통해 모형의 성능을 체크했지요. 이 중에서 Adaptive Boosting 모형이 가장 성능이 좋아서 이 모형을 선택했어요.

 

그리고 최종 테스트 데이터를 통해 예측 확률을 계산하여 csv로 저장하고 마무리했지요.

 

모형 성능을 평가할 때에는 예측 확률이 비교적 잘 분리가 되었어요. 즉, 예측 확률이 0에 가깝거나 1에 가까운 식으로 예측 확률이 잘 분리가 되었지만 최종 테스트 데이터에서는 기껏해야 0.4~0.6 정도에서 왔다 갔다 해서 내 모형이 틀렸나 하는 생각도 들어서 당황스러웠어요.

그래서 코딩을 한 줄 한 줄 실행해보면서 체크해보니 잘못된 부분은 없어서 csv 파일을 최종 제출하고 나왔지요.

 

시험이 다 끝났다는 후련함과 함께 디아블로 2 레저렉션을 하면서 결과를 기다렸어요.

 

 

작업형 제2유형에서 만점을 받은 거 보니 원래 예측 확률이 이상하게 나오는 게 맞았나 봐요. 근데 다 맞을 것 같았던 제1유형에서는 10점이 깎였어요 ㅠㅠ.

 

어찌 됐든 합격돼서 너무 기쁜 순간이었어요.

 

사실 미래를 위해 자격증 하나 마련해놓자는 마음으로 가볍게 준비했는데 합격하니 너무 기분이 좋았어요.

 

실기 시험의 경우 코딩이 어느 정도 능숙하고 교재 하나 사서 3주 정도 공부하고 코딩 연습하면 충분히 합격할 수 있는 난이도였다고 생각해요.

 

빅데이터 분석기사 준비하시는 분들 모두 화이팅하시고 좋은 결과 있었으면 좋겠습니다.

 


댓글


맨 위로