기본 콘텐츠로 건너뛰기

라벨이 histplot인 게시물 표시

[matplotlib]quiver()함수

[seaborn] 이변량 분포의 시각화

이변량 분포의 시각화 그래프를 작성하기 위해 kospi 지수의 일일자료를 호출하여 사용합니다. import numpy as np from sklearn.datasets import make_blobs import pandas as pd from sklearn.preprocessing import StandardScaler import matplotlib.pyplot as plt plt.rcParams['font.family'] ='NanumGothic' plt.rcParams['axes.unicode_minus'] =False import seaborn as sns import yfinance as yf from scipy import stats st=pd.Timestamp(2023, 10, 17) et=pd.Timestamp(2024, 10, 17) kos=yf.download("^KS11",st, et) kos=kos.drop('Adj Close', axis=1) kos.columns=kos.columns.levels[0][1:] scaler=StandardScaler().fit(kos) kos1=scaler.transform(kos) kos1df=pd.DataFrame(kos1) kos1df.columns=kos.columns kos1df['coChg']=pd.qcut(np.ravel((kos1df.Close-kos1df.Open)/kos1df.Open*100), 10, range(10)) kos1df['volChg']=pd.qcut(np.ravel(kos1df.Volume.pct_change()), 5, range(5)) kos1df=kos1df.dropna() kos1df.head(3) Price Close High Low Open Volume ...

[seaborn] 데이터분포의 시각화 1(histplot & displot)

데이터분포의 시각화(histplot & displot) 데이터 분포의 이해는 다양한 통계 분석의 기반이 됩니다. seaborn의 figure-level 함수인 displot(), jointplot(), pairplot()와 axes-level 함수인 hisplot(), kedplot(), ecdplot(), rugplot()으로 분포를 시각화 할 수 있습니다 Figure-level과 Axes-level 함수 그리고 히스토그램 참조). 분포의 시각화에 가장 일반적인 접근은 히스토그램(histogram)입니다. 히스토그램은 일정한 구간(bin)으로 그룹화한 변수를 기준으로 각 구간의 빈도수 또는 밀도를 대응시킨 bar plot입니다. 이 기사에서는 각 빈도에 빈도수(Count)를 나타내기 위해 histplot() 과 displot() 으로 작성에 대해 소개합니다. import numpy as np from sklearn.datasets import make_blobs import pandas as pd from sklearn.preprocessing import StandardScaler import matplotlib.pyplot as plt plt.rcParams['font.family'] ='NanumGothic' plt.rcParams['axes.unicode_minus'] =False import seaborn as sns import yfinance as yf 히스토그램을 작성하기 위한 데이터로 코스피 지수의 일일자료(^KS11)를 모듈 yfiance를 사용하여 호출합니다. 그 자료에서 에 대해 일일변화율(시가에 대한 종가의 변화율)과 일간 거래량(Volume)의 변화율을 목록화하여 첨가하여 다음코드의 결과인 kos1df 자료를 생성합니다. st=pd.Timestamp(2023, 10, 17) et=pd.Timestamp(2024, 10, 17) kos=yf.download("^K...

[seaborn] 다중 플롯 작성

다중 플롯 작성 Figure-level 함수 는 유사한 종류의 플롯을 작성할 수 있으므로 다른 종류 예를 들어 산점도와 히스토그램을 동시에 작성하기 위해서는 axes-level 함수를 사용해야 합니다. 또한 이 레벨의 함수는 matplotlib에 의존하므로 플롯의 레이아웃을 설정하기 위해 subplots() 함수를 적용할 수 있습니다. import numpy as np import pandas as pd import matplotlib.pyplot as plt plt.rcParams['font.family'] ='NanumGothic' plt.rcParams['axes.unicode_minus'] =False import seaborn as sns pen=sns.load_dataset("penguins") fig, axs=plt.subplots(1,2, figsize=(8,3), gridspec_kw=dict(width_ratios=[4,3])) sns.scatterplot(data=pen, x="flipper_length_mm", y="bill_length_mm", hue="species", ax=axs[0]) sns.histplot(data=pen, x="species", hue="species", shrink=.8, alpha=.8, legend=False, ax=axs[1]) fig.tight_layout() 위 코드에서 plt.subplots() 함수의 인수 gridspec_kw는 각 subplots의 레이아웃에 대한 값들을 사전(dictionary)형식으로 지원하기 위한 매개변수입니다. figure-level 함수는 다른 종류의 그래프들로 구성된 다중 플롯을 작성 할 수 없습니다. 즉, 이 수준의 함수는 초기화를 포함하여 자신의 플롯을 독점적으로 소유하므로 위의 axes-level 함수...