기본 콘텐츠로 건너뛰기

라벨이 짝비교인 게시물 표시

통계관련 함수와 메서드 사전

A B C d E F G H I K L M N O P Q R S T U V W Z A statsmodels.ap.stats.anova_lm(x) statsmodels.formula.api.ols 에 의해 생성되는 모형 즉, 클래스 인스턴스(x)를 인수로 받아 anova를 실행합니다. np.argsort(x, axis=-1, kind=None) 객체 x를 정렬할 경우 각 값에 대응하는 인덱스를 반환합니다. Axis는 기준 축을 지정하기 위한 매개변수로서 정렬의 방향을 조정할 수 있음(-1은 기본값으로 마지막 축) pandas.Series.autocorr(lag=1) lag에 전달한 지연수에 따른 값들 사이의 자기상관을 계산 B scipy.stats.bernoulli(x, p) 베르누이분포에 관련된 통계량을 계산하기 위한 클래스를 생성합니다. x: 랜덤변수 p: 단일 시행에서의 확률 scipy.stats.binom(x, n, p) 이항분포에 관련된 통계량을 계산하기 위한 클래스를 생성합니다. x: 랜덤변수 n: 총 시행횟수 p: 단일 시행에서의 확률 C scipy.stats.chi2.pdf(x, df, loc=0, scale=1) 카이제곱분포의 확률밀도함수를 계산 $$f(x, k) =\frac{1}{2^{\frac{k}{2}−1}Γ(\frac{k}{2})}x^{k−1}\exp\left(−\frac{x^2}{2}\right)$$ x: 확률변수 df: 자유도 pd.concat(objs, axis=0, join=’outer’, …) 두 개이상의 객체를 결합한 새로운 객체를 반환. objs: Series, DataFrame 객체. Axis=0은 행단위 즉, 열 방향으로 결합, Axis=1은 열단위 즉, 행 방향으

R t-검정

내용 Independence t-test Dependebt r-test(짝비교) t-tests 두 그룹을 비교하는 연구에서 사용합니다. 범주형 변수의 경우 χ 2 분석이나 상관성 분석으로 진행할 수 있습니다. MASS 패키지와 함께 배포되는 UScrime 데이터 세트를 사용합니다. 여기에는 1960년 미국 47개 주에서 범죄율에 대한 처벌 제도의 영향에 대한 정보가 포함되어 있습니다. 관심 결과 변수는 Prob(수감 가능성), U1(14~24세 도시 남성의 실업률) 및 U2( 35-39세 도시 남성의 실업률). 범주형 변수 So(남부 주에 대한 지표 변수)는 그룹화 변수로 사용됩니다. library(MASS) head(UScrime, 2) M So Ed Po1 Po2 LF M.F Pop NW U1 U2 GDP Ineq Prob Time y 1 151 1 91 58 56 510 950 33 301 108 41 394 261 0.084602 26.2011 791 2 143 0 113 103 95 583 1012 13 102 96 36 557 194 0.029599 25.2999 1635 aggregate(Prob~So, data=UScrime, length) So Prob 1 0 31 2 1 16 Independence t-test 남부에서 범죄를 저지르면 투옥될 가능성이 더 높습니까? 관심 대상의 비교는 변수 So와 Prob입니다. 독립 t-검정은 두 모집단 평균이 같다는 가설을 검정하는 데 사용할 수 있습니다. 여기에서는 두 그룹이 독립적이고 데이터가 정규 모집단에서 추출되었다고 가정합니다. t 검정은 다음의 함수를 적용합니다. t.test(y~x, data) y는 숫자이고 x는 이분형 변수입니다. t.test(y1, y2) y1, y2 모두 숫자형 벡터로서 각 그룹의 결과변수 data는 변수들을 포함하는 matrix 또는 dataframe R의