기본 콘텐츠로 건너뛰기

라벨이 기대값인 게시물 표시

[matplotlib]quiver()함수

[data analyis] 확률과 주요통계량: 모멘트와 기대값 예제

예 1) 다음의 확률밀도함수(pdf)를 갖는 확률연속변수의 기대값은? $$f(x)=\begin{cases}c(x^3+x^2+1)& 0\lt x \lt 10\\ 0&\text{otherwise} \end{cases}$$ 위 함수에서 범위 (0, 10)에서의 적분값은 1이 되어야 합니다. 이 조건을 적용하여 상수 c가 계산될 수 있습니다. 적분 계산은 파이썬 라이브러리 sympy.integrate() 함수를 적용합니다. 또한 그 적분의 결과에서 표현되는 미지수 c는 sympy.solve() 함수를 사용하여 결정할 수 있습니다. c, x=symbols("c, x") f=c*(x**3+x**2+1) F=f.integrate((x, 0, 10)) print(F) 8530*c/3 C=solve(Eq(F, 1), c);C [3/8530] 위 결과를 c로 치환한 새로운 함수를 사용하여 기대값을 계산합니다. f=f.subs(c, C[0]) print(f) 3*x**3/8530 + 3*x**2/8530 + 3/8530 위 결과인 확률함수에 대한 기대값의 계산은 식 1과 같습니다. $$\tag{식 1}E(x) = \int^{10}_0 x\left(\frac{3}{8530}x^3+\frac{3}{8530}x+\frac{3}{8530} \right)$$ E=integrate(x*f, (x, 0, 10)) print(E) 6765/853 round(float(E), 3) 7.931 확률변수가 변수 x에 대한 함수 g(x)를 정의 할 수 있는 경우 기대값은 식 2와 같이 그 함수에 대한 확률 함수 f(x)와의 곱으로 계산할 수 있습니다. $$\tag{식 2}E(g(x))=\begin{cases}\sum_{x\in S}g(x)f(x)& x:\text{이산변수},\; S: \text{표본공간}\\ \int^\infty_{-\infty}g(x)f(x)\, dx& x:\text{연속변수}\end{cases}$...

[data analysis] 확률과 주요통계량: 모멘트와 기대값

확률과 주요통계량 내용 모멘트(Moment) 기대값(Expected Value) 기대값의 선형결합 확률과 주요통계량: 모멘트와 기대값 예제 모멘트(Moment) 확률변수와 확률 분포의 특징과 형태를 수학적으로 설명하기 위한 정량적 지표를 모멘트(moment) 라고 하며 식 1과 같이 정의합니다. $$\begin{align}\tag{식 1}&\text{n 차 모멘트}= E(x^n)\\ &n= 1, 2, \cdots \end{align}$$ 식 1에서 E(x)는 확률변수 x에 대한 기대값(평균)을 나타냅니다. 그러므로 모멘트(moment) 는 변형된 확률변수의 기대값을 의미합니다. 이러한 모멘트는 기술 통계에서 소개한 평균 , 분산 과 함께 왜도, 첨도 등 다양한 통계량의 유도에 사용됩니다. 기대값(Expected Value) 평균은 변수들의 특성을 파악하기 위해 가장 많이 사용되는 통계량입니다. 이 통계량은 각 변수값에 대한 확률을 고려하는 것으로 기대값(expected value, E(X)) 이라고 합니다. 확률변수 x에 대응되는 확률은 다른 변수들에 비해 그 변수가 나타날 상대 가능도(relative likelihood) 를 의미합니다. 많은 경우 확률변수와 확률의 관계는 함수로 특정할 수 있으며 그 함수를 확률함수라고 합니다. 확률함수는 변수가 이산형일경우에는 확률질량함수(probability mass function) , 연속형일 경우에는 확률밀도함수(probability density function) 로 구분합니다. 일반적으로 확률밀도(질량)함수는 f(x)로 나타내며 그 함수의 합(적분)인 누적확률함수는 F(x)로 표현합니다. 이 확률밀도(질량) 함수를 사용하여 1차모멘트인 평균은 식 2와 같이 계산할 수 있습니다. $$\tag{식 2}\mu=E(X)=\begin{cases}\sum^N_{i=0} x_iP(X=x_i)&x:\text{이산변수},\; N:\text{샘플 크기...