확률부등식 내용 마르코프 부등식(Markov's inequality) 체비셰프부등식(chebyshev's inequality) 확률변수의 각 요소와 그에 대응하는 확률의 관계를 함수로 나타낼 수 있으며 다양한 함수와 분포가 존재합니다. 이러한 확률분포로부터 다양한 통계량을 계산할 수 있으며 그들을 기반으로 어떠한 값이나 구간을 추정할 수 있습니다. 역으로 이 추정된 값이나 구간을 신뢰할 수 있는지를 검정해야 합니다. 이러한 구간을 신뢰구간이라 합니다. 이 기사에서 소개하는 마르코프와 체비셰프 부등식은 신뢰구간을 설정하는 이론적 근거가 되는 수학적 표현들입니다. 마르코프 부등식(Markov's inequality) 랜덤변수 x에 대해 g(x)가 음이 아닌 실수값 함수이면 임의의 양의 실수 c에 대해 식 1이 성립합니다. 이 식을 마르코프 부등식(Markov’s inequality) 이라고 합니다. $$p[g(x) \ge c] \le \frac{E[g(x)]}{c}$$ (식 1) 그림 1은 평균이 0이고 표준편차가 1인 표준정규분포 입니다. 이 분포에서 임의의 확률 변수 c이상의 확률은 그 확률분포 함수를 [c, ∞)에 대한 적분한 결과와 같습니다. 즉, 분포함수를 사용하여 지정된 구간의 누적확률을 계산할 수 있습니다. 그림 1. 정규분포(평균: 0, 표준편차: 1). fig, ax=plt.subplots(figsize=(4,3)) ax.plot(x, p, label="N(0, 1)") ax.fill_between(x[idx], p[idx], alpha=0.5) ax.spines['left'].set_position('center') ax.spines['right'].set_visible(False) ax.spines['top'].set_visible(False) ax.spines['bottom']....
python 언어를 적용하여 통계(statistics)와 미적분(Calculus), 선형대수학(Linear Algebra)을 소개합니다. 이 과정에서 빅데이터를 다루기 위해 pytorch를 적용합니다.