A B C d E F G H I K L M N O P Q R S T U V W Z A statsmodels.ap.stats.anova_lm(x) statsmodels.formula.api.ols 에 의해 생성되는 모형 즉, 클래스 인스턴스(x)를 인수로 받아 anova를 실행합니다. np.argsort(x, axis=-1, kind=None) 객체 x를 정렬할 경우 각 값에 대응하는 인덱스를 반환합니다. Axis는 기준 축을 지정하기 위한 매개변수로서 정렬의 방향을 조정할 수 있음(-1은 기본값으로 마지막 축) pandas.Series.autocorr(lag=1) lag에 전달한 지연수에 따른 값들 사이의 자기상관을 계산 B scipy.stats.bernoulli(x, p) 베르누이분포에 관련된 통계량을 계산하기 위한 클래스를 생성합니다. x: 랜덤변수 p: 단일 시행에서의 확률 scipy.stats.binom(x, n, p) 이항분포에 관련된 통계량을 계산하기 위한 클래스를 생성합니다. x: 랜덤변수 n: 총 시행횟수 p: 단일 시행에서의 확률 C scipy.stats.chi2.pdf(x, df, loc=0, scale=1) 카이제곱분포의 확률밀도함수를 계산 $$f(x, k) =\frac{1}{2^{\frac{k}{2}−1}Γ(\frac{k}{2})}x^{k−1}\exp\left(−\frac{x^2}{2}\right)$$ x: 확률변수 df: 자유도 pd.concat(objs, axis=0, join=’outer’, …) 두 개이상의 객체를 결합한 새로운 객체를 반환. objs: Series, DataFrame 객체. Axis=0은 행단위 즉, 열 방향으로 결합, Axis=1은 열단위 즉, 행 방향으
평균과 공분산 관측값의 샘플을 $p \times N$ 차원의 행렬로 고려합니다. $\left[\begin{array}{rrrr}X_1 & X_2 & \cdots & X_N \end{array}\right]$ X: 열벡터 이 샘플 평균(sample mean, M)은 $M=\frac{1}{M}(X_1+X_2+\cdots+X_N)$ 평균은 모든 관찰값들의 중간(center)를 나타냅니다. 각 값들에 대한 평균과의 차이를 다음과 같이 나타냅니다. $\hat{X}_k = X_k-M \qquad k=1, \cdots, N$ 위 식은 결과적으로 평균을 0로 하기 위해 모든 관찰값들을 평균 만큼 이동시킨 것으로 관찰값들과 동일한 차원의 행렬 B로 생성됩니다. 이 행렬은 평균-편차 형태(mean-deviation form)이라고 합니다. $B=\left[\begin{array}{rrrr}X_1 & X_2 & \cdots & X_N \end{array}\right]$ 정방행렬이 아닌 행렬은 그 행렬의 전치행렬과의 곱으로 생성할 수 있으며 이것은 이차형태 를 나타내는 기본 구조입니다. 이것을 적용하여 샘플 공분산 행렬(sample covariance matrix)는 다음과 같이 $p \times p$ 행렬 S로 정의 됩니다. $S=\frac{1}{N-1} BB^T$ 위 식에서 $BB^T$는 0을 포함하여 항상 양수이므로 semidefinite 이므로 S 역시 semidefinite입니다. >>> import numpy as np >>> import numpy.linalg as LA >>> import pandas as pd >>> from sympy import * >>> np.set_printoptions(precision=4, suppress=True) 1. 다음행렬의 평균과 공분산 행렬? $X_1=\left[\b