기본 콘텐츠로 건너뛰기

라벨이 statsmodels인 게시물 표시

통계관련 함수와 메서드 사전

A B C d E F G H I K L M N O P Q R S T U V W Z A statsmodels.ap.stats.anova_lm(x) statsmodels.formula.api.ols 에 의해 생성되는 모형 즉, 클래스 인스턴스(x)를 인수로 받아 anova를 실행합니다. np.argsort(x, axis=-1, kind=None) 객체 x를 정렬할 경우 각 값에 대응하는 인덱스를 반환합니다. Axis는 기준 축을 지정하기 위한 매개변수로서 정렬의 방향을 조정할 수 있음(-1은 기본값으로 마지막 축) pandas.Series.autocorr(lag=1) lag에 전달한 지연수에 따른 값들 사이의 자기상관을 계산 B scipy.stats.bernoulli(x, p) 베르누이분포에 관련된 통계량을 계산하기 위한 클래스를 생성합니다. x: 랜덤변수 p: 단일 시행에서의 확률 scipy.stats.binom(x, n, p) 이항분포에 관련된 통계량을 계산하기 위한 클래스를 생성합니다. x: 랜덤변수 n: 총 시행횟수 p: 단일 시행에서의 확률 C scipy.stats.chi2.pdf(x, df, loc=0, scale=1) 카이제곱분포의 확률밀도함수를 계산 $$f(x, k) =\frac{1}{2^{\frac{k}{2}−1}Γ(\frac{k}{2})}x^{k−1}\exp\left(−\frac{x^2}{2}\right)$$ x: 확률변수 df: 자유도 pd.concat(objs, axis=0, join=’outer’, …) 두 개이상의 객체를 결합한 새로운 객체를 반환. objs: Series, DataFrame 객체. Axis=0은 행단위 즉, 열 방향으로 결합, Axis=1은 열단위 즉, 행 방향으

자기상관분석(Autocorrelation Analysis)

자기상관분석 상관성(correlation) 은 두 변수간의 관계를 나타내는 것에 반해 자기상관(autocorrelation) 은 한 변수내에 시간 차이에 따른 값들 사이의 관계를 파악하는 것입니다. 다시말하면 행렬의 형태로 표현되는 자료에서 행들의 값들 사이의 관계가 상관성이라면 자기상관성은 하나의 열 내에 존재하는 값들 사이의 관계를 나타내는 것이라 할 수 있습니다. 자기상관의 정도는 자기상관 계수($R_h$)로 나타냅니다. $$\begin{align}\tag{1}R_h& =\frac{ \text{Autocovariance}}{\text{Variance}}\\ &=\frac{\sum^{N-h}_{t=1} (x_t-\bar{x})(x_{t+h}-\bar{x})}{\sum^N_{i=1}(x_t-\bar{x})^2}\end{align}$$ 식 1의 자기상관계수는 statsmodels.tsa.stattool의 acf(x, nlags) 함수를 사용합니다. 이 함수의 인자 중 nlags는 x t 와 x t+h 의 차이인 h의 연속값의 수입니다. 이 값을 별도로 지정하지 않은 경우 (10 * np.log10(nobs), nobs - 1)중 최소값이 자동으로 지정됩니다. 예  다음은 코스피 주가 자료 중 종가(Close)의 lag=1에 대한 자기상관계수를 계산해 봅니다. import numpy as np import pandas as pd import matplotlib.pyplot as plt import FinanceDataReader as fdr st=pd.Timestamp(2020,1,3) et=pd.Timestamp(2022, 1, 14) ks=fdr.DataReader('KS11', st, et)["Close"] ks.tail(3) Date 2022-01-12 2972.48 2022-01-13 2962.09 2022-01-14 2921.92 Name: Close, dtype: f