[data analysis]균일분포(Uniform Distribution)

균일분포(Uniform Distribution)

식 1은 구간 [a, b]에서 확률 변수 x는 일정한 확률밀도함수를 가지는 분포를 나타내는 것으로 균일분포라고 합니다.

X ~ Uniform(a, b)	(식 1)
$$f(x)=\begin{cases}\frac{1}{b-a}&a\le x \le b\\ 0& \text{otherwise} \end{cases}$$

예 1)

변수 X가 [0,10]의 범위에서 균일 분포를 이룬다면 다음 확률을 결정합니다.

$$f(x) = \frac{1}{10-0}$$

p(2 < x < 9)
p(1 < x < 4)
p(x > 6)

이 균일분포의 확률밀도함수는 다음과 같습니다.

a, b, x=symbols("a b x")
f=Rational(1, 10)
f

$\frac{1}{10}$

1) p(2 < x < 9)

F1=f.integrate((x, 2, 9))
F1

$\frac{7}{10}$

2) p(1 < x < 4)

F1=f.integrate((x, 1, 4))
F1

$\frac{3}{10}$

3) p(x > 6)

F1=f.integrate((x, 6, 10))
F1

$\frac{2}{5}$

예 2)

버스가 7시에 출발하여 특정 정거장에 정확히 15분 마다 정차한다고 가정합니다. 만약 승객이 7시와 7:30분 사이에 버스를 기다리는 경우 기다리는 시간에 대한 다음 확률을 결정합니다.

5분 미만
최소 12분

확률변수 X를 [0, 30] 사이의 분(minute)이라고 한다면 각 분에 승객이 정류장에 있을 확률은 ¹/₃₀으로 일정하므로 확률밀도함수 f(x) = ¹/₃₀인 균일 분포를 따른다고 할 수 있습니다.

P(X < 5분)의 경우 승객이 7시 10분 ~ 15분, 25분 ~ 30분 사이에 정류장에 있을 확률입니다. 즉, P(10 < x < 15) + P(25 < x < 30).

x=symbols("x")
f=Rational(1, 30)
f.integrate((x, 10, 15))+f.integrate((x, 25, 30))

$\frac{1}{3}$

2) 기다리는 시간이 최소 12분인 경우는 버스 출발후 승객이 정류장에 도착하는 시간이 3분보다 작은 경우입니다. 즉, P(0 < x < 3) + P(15 < x < 18).

f.integrate((x, 0, 3))+f.integrate((x, 15, 18))

$\frac{1}{5}$

평균과 분산

평균과 분산은 각각의 정의를 적용하여 식 2와 같이 계산됩니다. 물론 모멘트 생성함수를 사용하여 계산할 수 있습니다.

\begin{align}E(X)&=\int^b_a x\frac{1}{b-a}\,dx\\&=\frac{1}{b-a}\frac{x^2}{2}{\huge\vert}^b_a\\&=\frac{b+a}{2}\\\\ E(X^2)&=\int^b_a x^2\frac{1}{b-a}\,dx\\&=\frac{1}{b-a}\frac{x^3}{3}{\huge\vert}^b_a\\&=\frac{b^3-a^3}{3(b-a)}\\&=\frac{a^2+ab+b^2}{3}\\\\ \text{Var}(X)&=E(X^2)-(E(X))^2\\&=\frac{a^2+ab+b^2}{3}-\left(\frac{b+a}{2}\right)^2\\&=\frac{(b-a)^2}{12} \end{align}

(식 2)

a, b, x, t=symbols("a b x t")
f=1/(b-a)
E=integrate(x*f, (x, a, b))
factor(E)

$\frac{a + b}{2}$

Var=integrate(x**2*f, (x, a, b))-E**2
factor(Var)

$\frac{\left(a - b\right)^{2}}{12}$

위 코드에서 factor() 함수는 sympy에 의해 생성된 식을 인수분해된 형태로 나타내기 위해 사용합니다.

sons dataStory

이 블로그 검색

pandas_ta를 적용한 통계적 인덱스 지표

[data analysis]균일분포(Uniform Distribution)

균일분포(Uniform Distribution)

평균과 분산

태그

댓글

댓글 쓰기

이 블로그의 인기 게시물

[Linear Algebra] 유사변환(Similarity transformation)

유리함수 그래프와 점근선 그리기

부분분수의 미분