[data analysis] Fligner 검정

Fligner 검정

관련된 내용

데이터의 정규성을 파악할 수 없는 경우 비모수 방법인 Fligner 검정으로 등분산성을 검정할 수 있습니다. Fligner-Killeen 중앙값 검정은 정규성에서 벗어나는 자료들에 대해 분산의 동질성에 대한 검정입니다(Conover et al.(1981), [CON1]). 즉, 데이터의 순위를 이용하여 검정하는 것으로 검정통계량은 식 1과 같이 정의됩니다.

\begin{align}FK &= \frac{\sum^k_{j=1} n_j(\bar{a_j}-\bar{a})}{s^2} \\& k: \,\text{비교할 그룹(변수)의 수} \\& \bar{a_j} : \,\text{j 그룹의 표준점수의 평균} \\& \bar{a}: \,\text{모든 표준점수의 평균} \\& s^2: \,\text{모든 표준점수의 분산} \end{align}

(식 1)

식 1의 FK 검정통계량은 자유도 k-1의 χ² 분포를 따릅니다. 즉, 표준정규분포에 부합하는 각 변수들의 제곱에 대한 분포를 따른다면 분산은 같습니다. 그러므로 이 분석의 귀무가설과 대립가설은 다음과 같습니다.

귀무가설(H0): 집단들의 분산이 같다.

대립가설(Ha): 최소한 두 집단간의 분산이 다르다.

stats.fligner() 함수를 사용합니다.

예 1)

일정기간의 코스피지수, 코스탁지수, 다우존스지수, 원-달러 환율의 일일 종가의 변화율 자료들의 Fligner 등분산성 검정을 실시합니다.

	kos	kq	dj	WonDol
1	0.016	0.008	0.006	0.002
2	-0.007	-0.004	0.014	-0.000
3	0.021	0.008	0.007	0.000
4	0.040	-0.001	0.002	0.006
5	-0.001	-0.011	-0.003	-0.000
⋮	⋮	⋮	⋮	⋮

이 자료는 다음 코드에 의해 호출하고 계산합니다.

st=pd.Timestamp(2021,1, 1)
et=pd.Timestamp(2024, 5, 30)
code=["KS11", "KQ11", "DJI", "USD/KRW"]
nme=['kos','kq','dj','WonDol']
da=pd.DataFrame()
for i in code:
    x=fdr.DataReader(i,st, et)['Close']
    x1=x.pct_change()
    da=pd.concat([da, x1], axis=1)
da.columns=nme
da.index=range(len(da))
da1=da.dropna()

st, pV=stats.fligner(da1['kos'], da1['kq'], da1['dj'], da1['WonDol'])
print(f'통계량: {round(st, 3)}, p-value: {round(pV, 3)}')

통계량: 335.333, p-value: 0.0

위 결과의 매우 낮은 유의확률은 귀무가설을 기각할 수 있음을 나타냅니다. 즉, 4개 그룹에 대한 등분산성을 가정할 수 없습니다.

sons dataStory

이 블로그 검색

pandas_ta를 적용한 통계적 인덱스 지표

[data analysis] Fligner 검정

Fligner 검정

관련된 내용

태그

댓글

댓글 쓰기

이 블로그의 인기 게시물

[Linear Algebra] 유사변환(Similarity transformation)

유리함수 그래프와 점근선 그리기

[sympy] Sympy객체의 표현을 위한 함수들