기본 콘텐츠로 건너뛰기

라벨이 normal_distribution인 게시물 표시

통계관련 함수와 메서드 사전

A B C d E F G H I K L M N O P Q R S T U V W Z A statsmodels.ap.stats.anova_lm(x) statsmodels.formula.api.ols 에 의해 생성되는 모형 즉, 클래스 인스턴스(x)를 인수로 받아 anova를 실행합니다. np.argsort(x, axis=-1, kind=None) 객체 x를 정렬할 경우 각 값에 대응하는 인덱스를 반환합니다. Axis는 기준 축을 지정하기 위한 매개변수로서 정렬의 방향을 조정할 수 있음(-1은 기본값으로 마지막 축) pandas.Series.autocorr(lag=1) lag에 전달한 지연수에 따른 값들 사이의 자기상관을 계산 B scipy.stats.bernoulli(x, p) 베르누이분포에 관련된 통계량을 계산하기 위한 클래스를 생성합니다. x: 랜덤변수 p: 단일 시행에서의 확률 scipy.stats.binom(x, n, p) 이항분포에 관련된 통계량을 계산하기 위한 클래스를 생성합니다. x: 랜덤변수 n: 총 시행횟수 p: 단일 시행에서의 확률 C scipy.stats.chi2.pdf(x, df, loc=0, scale=1) 카이제곱분포의 확률밀도함수를 계산 $$f(x, k) =\frac{1}{2^{\frac{k}{2}−1}Γ(\frac{k}{2})}x^{k−1}\exp\left(−\frac{x^2}{2}\right)$$ x: 확률변수 df: 자유도 pd.concat(objs, axis=0, join=’outer’, …) 두 개이상의 객체를 결합한 새로운 객체를 반환. objs: Series, DataFrame 객체. Axis=0은 행단위 즉, 열 방향으로 결합, Axis=1은 열단위 즉, 행 방향으

정규분포(Normal Distribution)

내용 정규분포 중심극한정리 표준화(standardization) 표준정규분포(Standard Normal Distribution) 평균과 분산 누적분포함수(CDF) 정규분포(Normal (Gaussian) Distribution) 정규분포 여러 현상들에 대해 큰 규모의 자료를 조사하면 평균에서 가장 높은 확률을 보이며 그 평균을 중심으로 양쪽으로 같은 정도로 확률 감소를 보이는 종 모양의 형태를 보입니다. 이러한 분포를 정규분포 라고 합니다. 특히 큰 규모의 확률변수들의 분포는 그 변수들의 조건에 상관없이 정규분포에 근접하기 때문에 데이터들의 여러 특성들을 연구하는데 중심이 되는 분포입니다 그림 1은 특정기간의 삼성 전자의 주가데이터 중에서 2일간의 종가(Close price) 차이에 대한 것으로 이 데이터에 대한 빈도를 히스토그램(파란색)로, 평균과 분산을 매개변수로 하는 확률밀도함수(PDF)를 (빨간선)를 나타낸 것입니다. 이 데이터의 확률밀도함수는 scipy.stats 모듈의 norm.pdf() 메소드를 사용하여 산출하였습니다. import numpy as np import pandas as pd import matplotlib.pyplot as plt from scipy import stats from sympy import * import FinanceDataReader as fdr st=pd.Timestamp(2020,1, 1) et=pd.Timestamp(2022,2,3) data=fdr.DataReader('005930', st, et) close=data["Close"] close.tail(2) Date 2022-01-28 73300 2022-02-03 73300 Name: Close, dtype: int64 clsDiff=close.diff() clsdiff2=np.sort(clsDiff)[:-1] pdf=[stats.norm.pd

Uniform and Normal distribution

Contents Uniform Distribution Mean and Variance Normal (Gaussian) Distribution Possibility Desnity Function(PDF) Cumulative Distribution Function(CDF) Uniform Distribution If the probability density function of a random variable X is constant over the range [a, b] as in Equation 1, then the variable is said to be uniformly distributed. $$\begin{align}\tag{1}f(x)=\begin{cases}\frac{1}{b-a}& \quad a \lt x \lt b\\ 0&\quad \text{otherwise} \end{cases}\end{align}$$ A uniform distribution is expressed as $$X \sim \text{Uniform(a, b)}$$ Example 1)   If the variable X is uniformly distributed in the range [0,10], try calculating the following probabilities: $$\begin{align}&f(x)=\frac{1}{10-0}\\&F(x)=\int^b_a \frac{1}{10-0} \, dx \quad 0 \le a \lt b \le 10 \end{align}$$ import numpy as np import pandas as pd from sympy import * import matplotlib.pyplot as plt from scipy import stats a, b, x=symbols("a b x") f=Rational(1, 10) f $\quad \colo