기본 콘텐츠로 건너뛰기

라벨이 summary인 게시물 표시

통계관련 함수와 메서드 사전

A B C d E F G H I K L M N O P Q R S T U V W Z A statsmodels.ap.stats.anova_lm(x) statsmodels.formula.api.ols 에 의해 생성되는 모형 즉, 클래스 인스턴스(x)를 인수로 받아 anova를 실행합니다. np.argsort(x, axis=-1, kind=None) 객체 x를 정렬할 경우 각 값에 대응하는 인덱스를 반환합니다. Axis는 기준 축을 지정하기 위한 매개변수로서 정렬의 방향을 조정할 수 있음(-1은 기본값으로 마지막 축) pandas.Series.autocorr(lag=1) lag에 전달한 지연수에 따른 값들 사이의 자기상관을 계산 B scipy.stats.bernoulli(x, p) 베르누이분포에 관련된 통계량을 계산하기 위한 클래스를 생성합니다. x: 랜덤변수 p: 단일 시행에서의 확률 scipy.stats.binom(x, n, p) 이항분포에 관련된 통계량을 계산하기 위한 클래스를 생성합니다. x: 랜덤변수 n: 총 시행횟수 p: 단일 시행에서의 확률 C scipy.stats.chi2.pdf(x, df, loc=0, scale=1) 카이제곱분포의 확률밀도함수를 계산 $$f(x, k) =\frac{1}{2^{\frac{k}{2}−1}Γ(\frac{k}{2})}x^{k−1}\exp\left(−\frac{x^2}{2}\right)$$ x: 확률변수 df: 자유도 pd.concat(objs, axis=0, join=’outer’, …) 두 개이상의 객체를 결합한 새로운 객체를 반환. objs: Series, DataFrame 객체. Axis=0은 행단위 즉, 열 방향으로 결합, Axis=1은 열단위 즉, 행 방향으

R DataFrame(데이터 프레임)

내용 Data frames Data frames 데이터 프레임은 다른 열에 다른 데이터 모드(숫자, 문자 등)가 포함될 수 있다는 점에서 행렬보다 더 일반적입니다. 데이터 프레임은 R에서 다룰 가장 일반적인 데이터 구조입니다. 여러 데이터 모드가 존재하는 경우 행렬로 나타낼 수 없습니다. data.frame() 함수로 데이터 프레임이 생성됩니다. ID<-c(1,2,3,4) age<-c(25, 34, 28, 52) diabetes<-c('type1','type1','type2','type1') stats<-c('poor','improved','excellent','poor') data<-data.frame(ID,age, diabetes, stats) data ID age diabetes stats 1 1 25 type1 poor 2 2 34 type1 improved 3 3 28 type2 excellent 4 4 52 type1 poor 하나의 열에는 하나의 모드로만 구성되지만 열마다 모드는 다를 수도 있습니다. 일반적으로 각 열은 각 변수에 대한 값으로 열(column)을 변수(variable)로 나타내기도 합니다. 데이터 프레임에서 요소를 호출하는 다양한 방법이 있습니다. 먼저 벡터나 행렬과 같이 인덱스를 사용합니다. 데이터프레임 역시 행렬구조이므로 각 요소의 인덱스는 행과 열을모두 포함합니다. 그러나 하나의 인덱스만을 표시할 경우 열을 나타냅니다. data[1,2] [1] 25 data[1,] ID age diabetes stats 1 1 25 type1 poor data[,2] [1] 25 34 28 52 data[