기본 콘텐츠로 건너뛰기

라벨이 임계치인 게시물 표시

[matplotlib]quiver()함수

[data analysis] 가설검정(Hypothesis test)

가설검정(Hypothesis test) 통계적 추론은 표본에서 계산된 통계량을 기반으로 모집단의 모수에 대한 잠정적인 가설을 설정하는 단계와 그 가설을 채택 또는 기각하기 위한 검정 단계로 구성됩니다. 검정 단계에서 판단의 기준이 되는 통계량을 검정통계량 이라고 합니다. 그 검정 통계량을 기준으로 더 극단적인 통계량이 나타날 확률을 유의확률(p-value) 이라 합니다. p-value와 유의수준을 비교하여 그 통계량의 채택 또는 기각이 결정됩니다. p-value < 유의수준 : 참(true)으로 가정하는 가설을 기각(신뢰구간의 외부에 존재) p-value > 유의수준 : 참(true)으로 가정하는 가설을 기각하지 못함 [검정력(Power)과 표본수(Sample size)] 검정력은 잘못된 가설을 기각할 수 있는 확률을 의미합니다. 예를 들어 검정력이 90 %일 경우 잘못된 가설을 채택할 확률이 10 %가 존재함을 나타냅니다. 이것은 표 1에서 나타낸 제2종 오류입니다. 이러한 검정력은 표본수가 커지면 증가합니다. 그러므로 원하는 검정력을 얻기 위해서 적정한 표본수를 확보해야 합니다. 표 1 오류의 종류 H0 진실 H0 거짓 H0 채택 옳은 결정 제2종오류(type II error) H0 기각 제1종오류(type I error, α) 옳은 결정 귀무가설과 대립가설 분석자는 표본평균들의 평균을 모평균의 추정치로 사용한다는 가설을 세우고 이 가설에 대한 통계적 타당성을 검정할 수 있습니다. 이 가설이 통계적으로 유의한 차이를 보이지 않기 때문에 기각되지 않을 것으로 예상합니다. 이러한 가설을 귀무가설(null hypothesis, H0) 이라합니다. 반대로 기각 될 것으로 예상되는 가설을 대립가설(alternative hypothesis, H1) 이라 합니다. 귀무가설의 검정은 표본의 정보 즉, 검정통계량을 기반합니다. 이 통계적 분석을 가설검정이라 하며 표 1에서 나타낸 제1종 ...