[data analysis]정규성검정(Normality Test)

정규성검정(Normality Test)

관련된 내용

Q-Q plot
shapiro-Wilk test
Kolmogorov-Smirnov Test
Anderson-Darling 검정
Jarque-Bera test

중심극한정리에 의해 자료의 샘플 수가 증가할수록 정규분포에 근접합니다. 특히 표본평균들의 분포인 표본분포는 정규분포에 부합합니다. 그러나 평균이 아닌 원시데이터(raw data)의 경우 정규분포에 부합여부가 중요한 경우가 있습니다. 예를 들어 회귀분석의 경우 관찰값과 회귀 모형에 의한 예측값들의 차이를 잔차(residuals)라고 하는데 잔차가 정규분포에 부합한다는 가정하에 실시됩니다. 그 가정에 부합하는가의 여부가 성립된 모형의 적합도를 결정할 판단근거가 됩니다.

정규성 검정은 다음 방법을 사용합니다.

Quantile-Quantile plot: 시각적 분석에 의한 결정
Shaprio-Wilks test: 표본수(n < 2000)인 경우에 주로 사용
Kolmogoroves-Smrinov test: n > 2000인 경우에 사용
Jarque-Bera Test

sons dataStory

이 블로그 검색

[matplotlib]quiver()함수

[data analysis]정규성검정(Normality Test)

정규성검정(Normality Test)

관련된 내용

태그

댓글

댓글 쓰기

이 블로그의 인기 게시물

[Linear Algebra] 유사변환(Similarity transformation)

[sympy] Sympy객체의 표현을 위한 함수들

sympy.solvers로 방정식해 구하기