Son's Data story

글

라벨이 statsmodels인 게시물 표시

자기상관분석(Autocorrelation Analysis)

자기상관분석 상관성(correlation) 은 두 변수간의 관계를 나타내는 것에 반해 자기상관(autocorrelation) 은 한 변수내에 시간 차이에 따른 값들 사이의 관계를 파악하는 것입니다. 다시말하면 행렬의 형태로 표현되는 자료에서 행들의 값들 사이의 관계가 상관성이라면 자기상관성은 하나의 열 내에 존재하는 값들 사이의 관계를 나타내는 것이라 할 수 있습니다. 자기상관의 정도는 자기상관 계수($R_h$)로 나타냅니다. $$\begin{align}\tag{1}R_h& =\frac{ \text{Autocovariance}}{\text{Variance}}\\ &=\frac{\sum^{N-h}_{t=1} (x_t-\bar{x})(x_{t+h}-\bar{x})}{\sum^N_{i=1}(x_t-\bar{x})^2}\end{align}$$ 식 1의 자기상관계수는 statsmodels.tsa.stattool의 acf(x, nlags) 함수를 사용합니다. 이 함수의 인자 중 nlags는 x t 와 x t+h 의 차이인 h의 연속값의 수입니다. 이 값을 별도로 지정하지 않은 경우 (10 * np.log10(nobs), nobs - 1)중 최소값이 자동으로 지정됩니다. 예 다음은 코스피 주가 자료 중 종가(Close)의 lag=1에 대한 자기상관계수를 계산해 봅니다. import numpy as np import pandas as pd import matplotlib.pyplot as plt import FinanceDataReader as fdr st=pd.Timestamp(2020,1,3) et=pd.Timestamp(2022, 1, 14) ks=fdr.DataReader('KS11', st, et)["Close"] ks.tail(3) Date 2022-01-12 2972.48 2022-01-13 2962.09 2022-01-14 2921.92 Name: Close, dtype: f

자세한 내용 보기

Son's Data story

이 블로그 검색

글

통계관련 함수와 메서드 사전

자기상관분석(Autocorrelation Analysis)