기본 콘텐츠로 건너뛰기

라벨이 significance_level인 게시물 표시

통계관련 함수와 메서드 사전

A B C d E F G H I K L M N O P Q R S T U V W Z A statsmodels.ap.stats.anova_lm(x) statsmodels.formula.api.ols 에 의해 생성되는 모형 즉, 클래스 인스턴스(x)를 인수로 받아 anova를 실행합니다. np.argsort(x, axis=-1, kind=None) 객체 x를 정렬할 경우 각 값에 대응하는 인덱스를 반환합니다. Axis는 기준 축을 지정하기 위한 매개변수로서 정렬의 방향을 조정할 수 있음(-1은 기본값으로 마지막 축) pandas.Series.autocorr(lag=1) lag에 전달한 지연수에 따른 값들 사이의 자기상관을 계산 B scipy.stats.bernoulli(x, p) 베르누이분포에 관련된 통계량을 계산하기 위한 클래스를 생성합니다. x: 랜덤변수 p: 단일 시행에서의 확률 scipy.stats.binom(x, n, p) 이항분포에 관련된 통계량을 계산하기 위한 클래스를 생성합니다. x: 랜덤변수 n: 총 시행횟수 p: 단일 시행에서의 확률 C scipy.stats.chi2.pdf(x, df, loc=0, scale=1) 카이제곱분포의 확률밀도함수를 계산 $$f(x, k) =\frac{1}{2^{\frac{k}{2}−1}Γ(\frac{k}{2})}x^{k−1}\exp\left(−\frac{x^2}{2}\right)$$ x: 확률변수 df: 자유도 pd.concat(objs, axis=0, join=’outer’, …) 두 개이상의 객체를 결합한 새로운 객체를 반환. objs: Series, DataFrame 객체. Axis=0은 행단위 즉, 열 방향으로 결합, Axis=1은 열단위 즉, 행 방향으

추론통계(Inferential Statistics)

내용 모집단과 표본 표본 추출 분포(Sampling distribution) 신뢰구간(confidence interval) 유의수준(significance level) 추론통계(Inferential Statistics) 모집단과 표본 통계적 추론(statistical inference)은 부분(표본, sample) 으로 전체(모집단, population) 의 모수를 추정하는 통계 분석 방법입니다. 일반적으로 여러 조건의 제약에 의해 모집단의 조사는 어렵거나 불가능한 경우가 대부분입니다. 이러한 경우 모수(population parameter)를 알 수 없기 때문에 이들을 추정해야 됩니다. 예를 들어 거래되는 모든 주가 데이터를 획득하는 것은 어렵습니다. 그러므로 그 모집단에서 생성될 수 있는 또는 그 모집단과 유사한 특성을 가진 표본의 평균, 분산과 같은 통계량이 모수와 비슷할 것이라는 가정 하에 다양한 분석을 진행할 수 있습니다. 이 경우 표본의 통계량이 모수와 유사하다고 하는 가설의 합리성에 대한 판단이 필요하며 이러한 판단의 근거는 통계적 추론에 의해 결정할 수 있습니다. 예를 들어 초등학교 6학년의 평균신장을 측정하는 연구에서 대상은 국가 내의 모든 6학년 학생이 될 것입니다. 그러나 제한된 연구 시간과 비용은 모든 대상에 대한 조사를 어렵게 만들 수 있습니다. 이런 경우 모집단의 통계량을 계산할 수 없기 때문에 각 지역별로 임의적으로 작은 그룹을 선택하여 측정한 결과들의 평균으로 모평균을 대신할 수 있을 것입니다. 표 1에서 나타낸 것과 같이 이 연구의 경우 모든 대상이 모집단(population) 이 되고 선택한 부분들이 표본(sample) 이 됩니다. 표 1. 모집단과 표본 모집단(population) 연구의 모든 대상 표본(sample) 연구를 위해 실제 측정 또는 관찰되는 부분 그림 1. 모집단과 표본의 관계. 그림 1에서 나타낸 것과 같이 표본으로부터의 결론은 다시 모집단