본문 바로가기

통계95

[머신 러닝] 1. 소개 이번 포스팅에서는 머신러닝이 무엇인지 생각하고 적어보았다. -- 목차 -- 1. 머신러닝이란? 2. 머신러닝의 종류 3. 통계학 vs 머신러닝 1. 머신러닝이란? 머신러닝은 데이터로부터 패턴을 인식하고 이를 바탕으로 스스로 의사 결정할 수 있는 알고리즘을 개발하는 학문 분야이다. 2. 머신러닝의 종류 2-1. 지도 학습(Supervised Learning) - 지도 학습 - 성별과 몸무게를 이용하여 그 사람의 키를 예측하는 것, 해당 메일의 텍스트를 파악하여 스팸인지 아닌지 예측하는 것과 같이 주어진 데이터를 이용하여 예측하고 싶은 변수가 있다고 하자. 여기서 예측하고 싶은 변수를 $y$라하고 $y$에 영향을 주리라고 생각하는 데이터를 $X$라 하자. 쉽게 말하면, $X$와 $y$는 각각 입력값과 그에 .. 2020. 11. 27.
[일반화 선형 모형(Generalized Linear Model)] 3. 우도방정식과 모형 적합(Model Fitting) 이번 포스팅에서는 일반화선형모형(Generalized Linear Model : GLM)에 대한 우도방정식(Likelihood Equation)과 반응(Response) 변수의 확률밀도함수가 Exponential Dispersion Family일때 일반화 선형 모형을 적합하는 과정에 대해서 정리하겠다. Exponential Dispersion Family에 대한 설명은 여기를 참고하기 바란다. 이번 포스팅을 이해하기 위해서 이전 포스팅을 복습하고 오면 좋다. [일반화 선형 모형(Generalized Linear Model)] 2. Exponential Dispersion Family에 대하여 [일반화 선형 모형(Generalized Linear Model)] 1. 일반화 선형 모형 소개 목차 1. 우도 .. 2020. 11. 21.
[일반화 선형 모형(Generalized Linear Model)] 2. Exponential Dispersion Family에 대하여 이번 포스팅에서는 Exponential Dispersion Family에 대해서 공부한 내용이다. 여기서 다루는 내용은 다음과 같다. 1. Exponential Dispersion Family의 정의 2. Exponential Dispersion Family의 예 1. Exponetial Dispersion Family의 정의 Exponential Dispersion Family는 모수적 확률분포(Parametric Probability Distribution)의 모임으로써 확률밀도함수가 다음과 같은 형태를 취한다. $$f(y ; \theta, \phi) = \exp \{[y\theta-b(\theta)]/a(\phi)+c(y,\phi)\}\tag{1}$$ 여기서 $\theta$는 natural para.. 2020. 9. 20.
자유도에 대해서 정확하게 파헤쳐 보자! 학부시절 교수님이 자유도에 대해서 들려주신 에피소드가 있었다. 자유도가 무엇인지 몰랐던 학생이 있었다. 궁금증을 참지 못했던 학생은 교수님께 편지를 보냈다. "교수님 자유도가 무엇인가요?" 얼마 후 교수님께 답장이 왔다. 편지에는 이렇게 적혀있었다. "자유도는 degree of freedom이야." 그러자 학생은 다시 교수님께 편지를 보냈다. "교수님 그렇다면 degree of freedom은 무엇입니까?" 또 얼마 뒤 교수님께 답장이 왔다. "degree of freedom은 자유도란다." 이 웃지못할 에피소드가 말해주는 것은 자유도라는 개념이 어려워 말로 풀어쓰기 어렵다는 뜻이라고 나는 생각했다. 이번 포스팅에서는 일반화 선형 모형을 공부하는 과정에서 자유도에 대해서 다시 한번 복습할 겸 최대한 이해.. 2020. 8. 23.
[일반화 선형 모형(Generalized Linear Model)] 1. 일반화 선형 모형 소개 오늘은 일반화 선형 모형(Generalized Linear Model : GLM)에 대해서 알아보려고 한다. 1. 정의 2. 구성 요소 이 포스팅은 꽁냥이가 일반화 선형 모형에 대해 공부한 내용을 정리하는 곳입니다~~ 본 포스팅에서는 수식을 포함하고 있습니다. 티스토리 피드에서는 수식이 제대로 표시되지 않을 수 있으니 웹 브라우저 또는 모바일 웹에서 보시기바랍니다. 1. 정의 먼저 일반화 선형 모형(Generalized Linear Model : GLM)의 정의를 내리기 전에 우리가 잘 알고 있는 선형 회귀 모형에 대해서 생각해보자. 일반적인 선형 회귀 모형은 다음과 같은 가정을 한다. 1) 반응 변수의 평균과 설명 변수 사이의 관계는 선형이다. 2) 반응 변수의 분포는 정규분포를 따른다. 이를 수식으로.. 2020. 7. 14.

맨 위로