Son's Data story

글

7월, 2018의 게시물 표시

최소제곱법 개요

최소제곱법 한 시점의 설명변수 벡터(특정변수 벡터, x)에 대한 목적변수(f(x), y) 사이의 다음 모형을 설정합니다. $$f(x) =w_0+w_1x+x_2x^2+\cdots+w_m x^{m-1} = \sum^M_{m=0}w_mx^M$$ 이 식에 의한 예측값과 실측값 사이의 차의 제곱을 오차라고 합니다. 이 오차값이 작아지고 0에 근접한다면 위 모형이 실측값에 근접한다는 것을 의미하지요. 오차에 대한 지표를 설정하기 위해 오차제곱의 합과 그 값을 반으로 나눈것을 "오차 ED"라고 정의합니다. $$E=\frac{1}{2}\sum^N_{n=1}(f(x)-y)^2$$ $$E_D=\frac{1}{2}\sum^{N_n=1}(f(x)-y)^2$$ 실제로 오차를 최소하는 조건을 위한 지표로 위 두 식 중 어떤 것을 사용해도 상관없습니다. 위 식에 f(x)를 설정한 모형으로 대체하면 다음과 같이 정리 됩니다. $$E_D=\frac{1}{2}\sum^{N_n=1} (\sum^M_{m=0}w_mx^M-y)^2$$ 위의 E_D 즉, 오차제곱을 최소로 하는 것이 최종목표이며 이러한 기법을 최소제곱법이라 합니다. 위의 E_D를 오차함수라고 합니다. 설명변수가 n개이고 m차 까지로 한다면 행렬로 나타내면 아래와 같이 설명변수 행렬 X의 차원은 n $\times$ m가 됩니다. (아래 행렬의 각 행의 원소들은 $x^0, x^1, \cdots, x^{M+1}$을 가지므로 열의 차원이 m은 M이 아니라 M+1이 됩니다.) $$ X=\left[\begin{array}{rrrr}x_{11}&x_{12}&\cdots&x_{1m}\\x_{21}&x_{22}&\cdots&x_{2m}\\ \vdots&\vdots&\cdots&\vdots\\x_{n1}&x_{n2}&\cdots&x_{nm}\end{array}\right]$$ 각 설명변수에

자세한 내용 보기

Son's Data story

이 블로그 검색

글

통계관련 함수와 메서드 사전

최소제곱법 개요