rolling 통계량: 이동평균
날짜 또는 시간 차이에 따른 통계량을 계산하기 위해 pd.DataFrame 클래스이 메서드인 pd객체.rolling(widnow, …)
메서드를 적용합니다. 메서드의 인수 window는 날짜 또는 시간 차이입니다. 이 메서드는 하위 메서드인 mean(), var(), min(), max()
등과 함께 사용합니다.
다음은 yfinance 패키지를 적용하여 kospi 지수의 일일자료를 호출하여 사용합니다.
import numpy as np import pandas as pd from sklearn.preprocessing import StandardScaler import yfinance as yf import matplotlib as mpl import matplotlib.pyplot as plt plt.rcParams['font.family'] ='NanumGothic' plt.rcParams['axes.unicode_minus'] =False import seaborn as sns %matplotlib inline fontdict={"fontsize":12, 'fontweight': "bold"}
st=pd.Timestamp(2023, 10, 17) et=pd.Timestamp(2024, 10, 26) kos=yf.download("^KS11",st, et) kos=kos.drop('Adj Close', axis=1) kos.index=pd.DatetimeIndex(kos.index.date) kos.columns=kos.columns.levels[0][1:] kos.tail(3)
Price | Close | High | Low | Open | Volume |
---|---|---|---|---|---|
2024-10-23 | 2599.620117 | 2607.790039 | 2567.419922 | 2575.250000 | 352400 |
2024-10-24 | 2581.030029 | 2600.260010 | 2578.800049 | 2591.689941 | 343100 |
2024-10-25 | 2583.270020 | 2611.270020 | 2577.000000 | 2597.439941 | 462900 |
X=kos[["Open", "Close"]].rolling(5) X.mean().head(6)
Price | Open | Close |
---|---|---|
2023-10-17 | NaN | NaN |
2023-10-18 | NaN | NaN |
2023-10-19 | NaN | NaN |
2023-10-20 | NaN | NaN |
2023-10-23 | 2419.943994 | 2414.118018 |
2023-10-24 | 2403.426025 | 2398.786035 |
X.std().head(6)
Price | Open | Close |
---|---|---|
2023-10-17 | NaN | NaN |
2023-10-18 | NaN | NaN |
2023-10-19 | NaN | NaN |
2023-10-20 | NaN | NaN |
2023-10-23 | 37.542557 | 48.126188 |
2023-10-24 | 36.899093 | 41.548898 |
다음은 5일과 20일 이동평균을 계산한 것입니다.
ma_5=kos.Close.rolling(5).mean().dropna() ma_20=kos.Close.rolling(20).mean().dropna() plt.figure(figsize=(7, 3)) sns.lineplot(x=kos.index, y=kos.Close, color="b", label="Close") sns.lineplot(x=ma_5.index, y=ma_5, color="r", lw=3, ls="dashed", label="3일 이동평균") sns.lineplot(x=ma_20.index, y=ma_20, color="g",lw=3, ls="dashed", label="20일 이동평균") plt.xlabel("day", fontdict=fontdict) plt.ylabel("Price", fontdict=fontdict) plt.show()
위 그림은 다음 그림과 같이 pd.DataFrame.plot()
함수를 적용하여 간편하게 작성할 수 있습니다.
kos["ma_5"]=kos.Close.rolling(5).mean().dropna() kos["ma_20"]=kos.Close.rolling(20).mean().dropna() kos[["Close", "ma_5", "ma_20"]].plot(figsize=(7, 3)) plt.xlabel("Day", fontdict=fontdict) plt.ylabel("Price", fontdict=fontdict) plt.show()
이동평균은 주식 자료의 분석에서 많이 사용됩니다. 위에서 계산된 통계량은 단순이동평균(simple mean average)으로 지정한 기간의 평균을 계산하는 것으로 단기간의 sma와 장기간의 sma를 비교하여 예측을 위해 적용합니다. 단기ma이 장기ma를 초과하는 지점을 골드클로스(gold cross), 반대 지점을 데드크로스(dead cross)라고 합니다.
- ma_5 > ma_20 → 1
- ma_5 < ma_20 → -1
kos["position"]=np.where(kos["ma_5"]>kos["ma_20"], 1, -1) ax=kos[["Close", "ma_5", "ma_20", "position"]].plot(figsize=(7, 3), secondary_y="position") ax.get_legend().set_bbox_to_anchor((1.05, 0.9)) plt.show()
현 주가에 영향을 주는 정도는 그 자료의 시간에 근접할수록 클것이지만 단순이동평균의 경우 일정기간 내에 있는 모든 자료에 영향정도는 균일하게 부여합니다. 이러한 점을 고려한 것이 다음 식과 같이 계산되는 지수이동평균(Exponential mean average, ema)입니다.
EMA = price(t) × α + EMA(y) × (1-α) |
price(t):오늘 가격 |
EMA(y): 어제의 EMA |
$\alpha=\frac{2}{span+1}$: smoothing factor |
smoothing factor인 α는 평활화하기 위한 기간(span)을 기준으로 설정합니다. pandas.DataFame의 메서드인 .ewm(span, adjust=True)
를 적용합니다. 이 메서드의 인수 span은 평활화팩터인 α를 계산하기 위해 지정하는 것으로 다른 인수 com, halflife, alpha의 인수로 지정할 수 있습니다. 각 인수에 전달하여 최종적으로 적용되는 평활화팩터는 다릅니다. 다른 인수 adjust는 True일 경우 가중이동평균(EWA), False일 경우(EMA)를 계산합니다.
kos["ema_5"]=kos.Close.ewm(span=5, adjust=False).mean() kos["ema_20"]=kos.Close.ewm(span=20, adjust=False).mean() kos["position2"]=np.where(kos["ema_5"]>kos["ema_20"], 1, -1) ax=kos[["Close", "ema_5", "ema_20", "position2"]].plot(figsize=(7, 3), secondary_y="position2") ax.get_legend().set_bbox_to_anchor((1.05, 0.9)) plt.show()
댓글
댓글 쓰기