sons dataStory

통계 검정에 관련된 그래프

다음 그래프들은 전자책 파이썬과 함께하는 통계이야기 5 장에 수록된 그림들의 코드들입니다. import numpy as np import pandas as pd from scipy import stats from sklearn.preprocessing import StandardScaler import FinanceDataReader as fdr import yfinance as yf import matplotlib.pyplot as plt import seaborn as sns sns.set_style("darkgrid") #fig 511 st=pd.Timestamp(2024, 4,20) et=pd.Timestamp(2024, 5, 30) da1=fdr.DataReader('091160', st, et)["Close"] da2=fdr.DataReader('005930', st, et)["Close"] da1=da1.pct_change()[1:]*100 da2=da2.pct_change()[1:]*100 da=pd.DataFrame([da1, da2], index=['data1', 'data2']).T da.index=range(len(da1)) mu1, sd1, n1=np.mean(da1), np.std(da1, ddof=1), len(da1) mu2, sd2, n2=np.mean(da2), np.std(da2, ddof=1), len(da2) s_p=np.sqrt(((n1-1)*sd1**2+(n2-1)*sd2**2)/(n1+n2-2)) se=s_p*np.sqrt((1/n1+1/n2)) se=s_p*np.sqrt((1/n1+1/n2)) df=n1+n2-2 mu=mu1-mu2 ci=stats.t.interval(0.95, df, mu, se) testStatic=((mu1-mu2)-0)/se x=np.linspace(-3, 3, 500) ...

[data analysis] scipy.stats 모듈

scipy.stats 파이썬의 모듈 scipy.stats는 이산변수와 연속변수에 대한 거의 모든 확률분포를 나타낼 수 있는 질량(밀도)함수, 누적함수, 기본통계량, 모멘트 등의 함수들을 제공합니다. 표 1는 scipy.stats 모듈에서 제공하는 확률분포와 각 클래스 명칭을 나타낸 것입니다. 표 1 확률분포 클래스 종류 클래스 이름 확률분포 이산 bernoulli 베르누이분포 binom 이항 분포 연속 uniform 균일 분포 norm 가우시안 정규 분포 beta 베타 분포 gamma 감마 분포 t 스튜던트 t 분포 chi2 카이 제곱 분포 f F 분포 dirichlet 디리클리 분포 multivariate_normal 다변수 가우시안 정규 분포 표 1의 각 클래스는 분포의 다양한 통계량들을 계산하기 위한 메서드들을 포함합니다(표 2). 또한 확률 분포의 객체를 생성하기 위해 전달할 모수(parameter)는 표 3과 같습니다. 메서드마다 요구되는 모수가 다르므로 scipy.stats의 각 분포의 설명을 참조합니다. 예를 들어 정규분포의 경우는 scipy.stats.norm 참조합니다. 표 2 분포 클래스의 메소드 메서드 기능 rvs 분포에 부합하는 랜덤 샘플 생성 (random variable sampling) pmf 확률 질량 함수 (probability mass function) pdf 확률 밀도 함수 (probability density function) logpmf, logpdf 로그확률 밀도 함수 cdf 누적 분포 함수 (cumulative distribution function) logcdf 누적분포함수의 로그화 값 sf 생존함수(survial function)=1-cdf ppf 누적확률에 해당하는 값을 반환 isf 생존함수의 역수 moment ...

sons dataStory

이 블로그 검색

글

[matplotlib]quiver()함수

통계 검정에 관련된 그래프

[data analysis] scipy.stats 모듈