기본 콘텐츠로 건너뛰기

라벨이 distribution인 게시물 표시

통계관련 함수와 메서드 사전

A B C d E F G H I K L M N O P Q R S T U V W Z A statsmodels.ap.stats.anova_lm(x) statsmodels.formula.api.ols 에 의해 생성되는 모형 즉, 클래스 인스턴스(x)를 인수로 받아 anova를 실행합니다. np.argsort(x, axis=-1, kind=None) 객체 x를 정렬할 경우 각 값에 대응하는 인덱스를 반환합니다. Axis는 기준 축을 지정하기 위한 매개변수로서 정렬의 방향을 조정할 수 있음(-1은 기본값으로 마지막 축) pandas.Series.autocorr(lag=1) lag에 전달한 지연수에 따른 값들 사이의 자기상관을 계산 B scipy.stats.bernoulli(x, p) 베르누이분포에 관련된 통계량을 계산하기 위한 클래스를 생성합니다. x: 랜덤변수 p: 단일 시행에서의 확률 scipy.stats.binom(x, n, p) 이항분포에 관련된 통계량을 계산하기 위한 클래스를 생성합니다. x: 랜덤변수 n: 총 시행횟수 p: 단일 시행에서의 확률 C scipy.stats.chi2.pdf(x, df, loc=0, scale=1) 카이제곱분포의 확률밀도함수를 계산 $$f(x, k) =\frac{1}{2^{\frac{k}{2}−1}Γ(\frac{k}{2})}x^{k−1}\exp\left(−\frac{x^2}{2}\right)$$ x: 확률변수 df: 자유도 pd.concat(objs, axis=0, join=’outer’, …) 두 개이상의 객체를 결합한 새로운 객체를 반환. objs: Series, DataFrame 객체. Axis=0은 행단위 즉, 열 방향으로 결합, Axis=1은 열단위 즉, 행 방향으

카이제곱분포(chi-squared distribution)

카이제곱 분포(Chi-square distribution) 이항분포는 두 개의 상호 배타적인 (독립인) 변수들에 적용되며 근사적으로 정규분포로 전환될 수 있습니다. 이러한 이항분포와 정규분포를 따르는 2개 이상의 독립된 변수들에 확장할 수 있는 분포를 카이제곱($\chi^2$)분포 라고 합니다. $\chi^2$분포 Z 1 , Z 2 , Z 3 , …가 독립이고 표준 정규분포를 따르는 확률변수라면 그들의 합으로 구성된 확률변수 X는 다음과 같이 정의됩니다. $$X=Z^2_1+Z^2_2+\cdots+Z^2_k$$ 위와 같이 정의된 확률변수 X는 자유도 k를 가진 $\chi^2$분포를 따릅니다. 이를 다음과 같이 나타냅니다. $$X \sim \chi^2_k$$ 카이-제곱 분포는 X 1 및 X 2 가 각각 k 1 및 k 2 자유도를 갖는 독립적인 카이-제곱 확률 변수인 경우 X 1 +X 2 가 k 1 + k 2 자유도를 갖는 카이-제곱이라는 가산 특성을 갖습니다. 이것은 모멘트 생성 함수를 사용하거나 가장 쉽게 X 1 + X 2 가 k 1 + k 2 독립 표준 정규의 제곱의 합이므로 k 1 + k 2 자유도의 카이-제곱 분포를 갖는다는 점에 주목함으로써 공식적으로 나타낼 수 있습니다. X가 자유도가 n인 카이제곱 확률 변수인 경우 임의의 α ∈(0, 1)에 대해 양 $\chi^2_{\alpha, n}$은 다음과 같이 정의됩니다. $$P\{X \ge \chi^2_{\alpha, k}\} = \alpha$$ $\chi^2$분포는 scipy.stats 모듈의 chi() 클래스로 구현할 수 있으며 이 클래스내의 다양한 메소드를 적용하여 이 분포의 통계량들을 계산할 수 있습니다. import numpy as np import pandas as pd import matplotlib.pyplot as plt from scipy import stats 다음은 자유도 3