기본 콘텐츠로 건너뛰기

라벨이 negative_binomial_distribution인 게시물 표시

통계관련 함수와 메서드 사전

A B C d E F G H I K L M N O P Q R S T U V W Z A statsmodels.ap.stats.anova_lm(x) statsmodels.formula.api.ols 에 의해 생성되는 모형 즉, 클래스 인스턴스(x)를 인수로 받아 anova를 실행합니다. np.argsort(x, axis=-1, kind=None) 객체 x를 정렬할 경우 각 값에 대응하는 인덱스를 반환합니다. Axis는 기준 축을 지정하기 위한 매개변수로서 정렬의 방향을 조정할 수 있음(-1은 기본값으로 마지막 축) pandas.Series.autocorr(lag=1) lag에 전달한 지연수에 따른 값들 사이의 자기상관을 계산 B scipy.stats.bernoulli(x, p) 베르누이분포에 관련된 통계량을 계산하기 위한 클래스를 생성합니다. x: 랜덤변수 p: 단일 시행에서의 확률 scipy.stats.binom(x, n, p) 이항분포에 관련된 통계량을 계산하기 위한 클래스를 생성합니다. x: 랜덤변수 n: 총 시행횟수 p: 단일 시행에서의 확률 C scipy.stats.chi2.pdf(x, df, loc=0, scale=1) 카이제곱분포의 확률밀도함수를 계산 $$f(x, k) =\frac{1}{2^{\frac{k}{2}−1}Γ(\frac{k}{2})}x^{k−1}\exp\left(−\frac{x^2}{2}\right)$$ x: 확률변수 df: 자유도 pd.concat(objs, axis=0, join=’outer’, …) 두 개이상의 객체를 결합한 새로운 객체를 반환. objs: Series, DataFrame 객체. Axis=0은 행단위 즉, 열 방향으로 결합, Axis=1은 열단위 즉, 행 방향으

기하분포와 음이항분포

내용 기하분포(Geometric distribution) 기하분포의 기대값과 분산 음이항분포(Negative Binomial Distribution) 음이항 분포의 기대값과 분산 기하분포(Geometric distribution) 베르누이 시행을 반복하여 첫번째로 성공이 나오는 경우까지의 확률변화의 분포를 기하분포(Geometric distribution) 라고 합니다. 예를 들어 성공확률이 p인 베르누이 시행을 반복시행하여 최초 성공(s)이 되는 경우를 확률변수 X로 하는 확률질량함수는 다음과 같이 될 것입니다. $$\begin{align}&R_x=\{1,\, 2,\, \cdots \}\\&f(1)=P(X=1)=p\\ &f(2)=P(X=2)=(1-p)p \\& \qquad \vdots\end{align}$$ 위의 결과를 일반화하면 기하분포의 확률질량함수는 식 1과 같이 공식화 할 수 있습니다. $$\begin{equation}\tag{1} f(x)=P(X=x)=(1-p)^{x-1}p\\ \end{equation}$$ 식 1과 같이 확률질량함수는 매개변수 p에만 의존합니다. 그러므로 모수 p를 가지는 기하분포는 다음과 같이 나타냅니다. X ∼ Geometric(p) 기하분포의 확률밀도함수는 scipy모듈의 stats.geom.pmf() 메소드로 계산할 수 있습니다. 그림 1은 기하분포의 모수에 따른 확률밀도의 변화를 나타낸 것입니다. import numpy as np import pandas as pd from scipy import stats import matplotlib.pyplot as plt from sympy import * plt.figure(dpi=100) for i in [0.1, 0.3, 0.5, 0.7]: p=[stats.geom.pmf(j, i) for j in range(10)] plt.plot(ran