Fligner 검정
관련된 내용
- Bartlett 검정
- Fligner 검정
- Levene Test
- Breusch-Pegan 검정
데이터의 정규성을 파악할 수 없는 경우 비모수 방법인 Fligner 검정으로 등분산성을 검정할 수 있습니다. Fligner-Killeen 중앙값 검정은 정규성에서 벗어나는 자료들에 대해 분산의 동질성에 대한 검정입니다(Conover et al.(1981), [CON1]). 즉, 데이터의 순위를 이용하여 검정하는 것으로 검정통계량은 식 1과 같이 정의됩니다.
\begin{align}FK &= \frac{\sum^k_{j=1} n_j(\bar{a_j}-\bar{a})}{s^2} \\& k: \,\text{비교할 그룹(변수)의 수} \\& \bar{a_j} : \,\text{j 그룹의 표준점수의 평균} \\& \bar{a}: \,\text{모든 표준점수의 평균} \\& s^2: \,\text{모든 표준점수의 분산} \end{align} | (식 1) |
식 1의 FK 검정통계량은 자유도 k-1의 χ2 분포를 따릅니다. 즉, 표준정규분포에 부합하는 각 변수들의 제곱에 대한 분포를 따른다면 분산은 같습니다. 그러므로 이 분석의 귀무가설과 대립가설은 다음과 같습니다.
귀무가설(H0): 집단들의 분산이 같다. |
대립가설(Ha): 최소한 두 집단간의 분산이 다르다. |
stats.fligner() 함수를 사용합니다.
예 1)
일정기간의 코스피지수, 코스탁지수, 다우존스지수, 원-달러 환율의 일일 종가의 변화율 자료들의 Fligner 등분산성 검정을 실시합니다.
kos | kq | dj | WonDol | |
1 | 0.016 | 0.008 | 0.006 | 0.002 |
2 | -0.007 | -0.004 | 0.014 | -0.000 |
3 | 0.021 | 0.008 | 0.007 | 0.000 |
4 | 0.040 | -0.001 | 0.002 | 0.006 |
5 | -0.001 | -0.011 | -0.003 | -0.000 |
⋮ | ⋮ | ⋮ | ⋮ | ⋮ |
이 자료는 다음 코드에 의해 호출하고 계산합니다.
st=pd.Timestamp(2021,1, 1) et=pd.Timestamp(2024, 5, 30) code=["KS11", "KQ11", "DJI", "USD/KRW"] nme=['kos','kq','dj','WonDol'] da=pd.DataFrame() for i in code: x=fdr.DataReader(i,st, et)['Close'] x1=x.pct_change() da=pd.concat([da, x1], axis=1) da.columns=nme da.index=range(len(da)) da1=da.dropna()
st, pV=stats.fligner(da1['kos'], da1['kq'], da1['dj'], da1['WonDol']) print(f'통계량: {round(st, 3)}, p-value: {round(pV, 3)}')
통계량: 335.333, p-value: 0.0
위 결과의 매우 낮은 유의확률은 귀무가설을 기각할 수 있음을 나타냅니다. 즉, 4개 그룹에 대한 등분산성을 가정할 수 없습니다.
댓글
댓글 쓰기