기본 콘텐츠로 건너뛰기

라벨이 등분산성Leven 검정인 게시물 표시

통계관련 함수와 메서드 사전

A B C d E F G H I K L M N O P Q R S T U V W Z A statsmodels.ap.stats.anova_lm(x) statsmodels.formula.api.ols 에 의해 생성되는 모형 즉, 클래스 인스턴스(x)를 인수로 받아 anova를 실행합니다. np.argsort(x, axis=-1, kind=None) 객체 x를 정렬할 경우 각 값에 대응하는 인덱스를 반환합니다. Axis는 기준 축을 지정하기 위한 매개변수로서 정렬의 방향을 조정할 수 있음(-1은 기본값으로 마지막 축) pandas.Series.autocorr(lag=1) lag에 전달한 지연수에 따른 값들 사이의 자기상관을 계산 B scipy.stats.bernoulli(x, p) 베르누이분포에 관련된 통계량을 계산하기 위한 클래스를 생성합니다. x: 랜덤변수 p: 단일 시행에서의 확률 scipy.stats.binom(x, n, p) 이항분포에 관련된 통계량을 계산하기 위한 클래스를 생성합니다. x: 랜덤변수 n: 총 시행횟수 p: 단일 시행에서의 확률 C scipy.stats.chi2.pdf(x, df, loc=0, scale=1) 카이제곱분포의 확률밀도함수를 계산 $$f(x, k) =\frac{1}{2^{\frac{k}{2}−1}Γ(\frac{k}{2})}x^{k−1}\exp\left(−\frac{x^2}{2}\right)$$ x: 확률변수 df: 자유도 pd.concat(objs, axis=0, join=’outer’, …) 두 개이상의 객체를 결합한 새로운 객체를 반환. objs: Series, DataFrame 객체. Axis=0은 행단위 즉, 열 방향으로 결합, Axis=1은 열단위 즉, 행 방향으

R 등분산성( Homoscedasticity)

Bartlett 검정 Fligner 검정 Leven 검정 등분산성( Homoscedasticity) Bartlett 검정 Bartlett 검정은 집단간 분산에 대해 등분산성을 검정합니다. 이 검정은 두 집단 이상의 자료형식에서도 적용할 수 있으므로 t-검정 또는 일원분산분석에 적용할 자료의 등분산성 가정을 위한 검정에 사용합니다. 이 검정은 정규성에 부합하는 자료에만 적용될 수 있습니다. 검정 통계량은 다음과 같습니다. $$T=\frac{(N-k)\ln(s^2_p)-\sum^k_{i=1}(N_i-1)\ln(s^2_i)}{1+\frac{1}{3(k-1)}\left(\left(\sum^k_{i=1}\frac{1}{N_i-1}\right) - \frac{1}{N-k}\right)}$$ s 2 i : i 레벨(그룹)의 분산 N: 자료의 크기 k: 레벨(집단)dml tn s 2 p : 합동분산(pooled variance) $$s^2_p=\sum^k_{i=1}\frac{N_i-1}{N-k}s^2_i$$ 검정의 가설은 다음과 같습니다. 귀무가설(H0): 집단간 분산이 같다. 대립가설(Ha): 최소한 두 집단간의 분산이 다르다. multcomp 패키지의 데이터 셋 choloesterol을 대상으로 이 검정을 실시 합니다. 이 데이터는 다음과 같이 요인변수인 trt와 연속형 변수인 response로 구성됩니다. 요인은 5개의 수준(그룹)을 포함합니다. 그러므로 각 그룹 대응한 response 값들에 대한 등분산성을 평가합니다. library(tidyverse) library(rstatix) library(multcomp) chol %>% sample_n_by(trt, size=1) # A tibble: 5 × 2 trt response 1 1time 2.71 2 2times 8.60 3 4times 12.4 4 drugD 17.6 5 drugE 21.5