[data analysis] 변동: 분산계수(Variation Coefficient)

변동(Variation)

1.3.6 분산계수(Variation Coefficient)

분산계수(Cv)는 식 1과 같이 데이터 셋의 표준편차를 평균으로 나눈 값으로 평균을 중심으로 데이터들의 퍼짐의 정도를 수치적으로 보여 줍니다. 표준편차와 평균의 단위는 같습니다. 그러므로 이 계산 결과는 단위가 없는 값이므로 여러 그룹들의 변동의 정도를 비교하는 척도롤 사용할 수 있습니다.

\begin{align}\text{Cv}&=\frac{\sigma}{\mu}\quad \text{or} \quad \frac{s}{\bar{x}}\\&\mu:\text{모평균}, \quad \bar{x}: \text{표본 평균}\end{align}

(식 1)

예를 들어 한 그룹의 키와 몸무게의 평균과 표준편차는 다음과 같다고 합니다.

항목	평균	표준편차
키	165 cm	19 cm
몸무게	70 kg	12.9 kg

위 표에서 나타낸 것과 같이 키의 표준편차는 몸무게보다 큽니다. 그러나 두 데이터 간의 차이는 단위(cm와 kg)의 차이에 의한 영향을 일 수 있습니다. 그러므로 두 데이터의 비교를 위해서는 단위를 제거한 결과가 필요합니다.

다음은 각 데이터의 coefficient of variance를 계산한 것으로 몸무게에 비해 키의 변동의 큰 것을 알 수 있습니다. 이 결과는 위 표에서 제시한 표준편차들의 비교 결과를 보다 명확하게 나타냅니다.

키 :	$\frac{19 \,\text{cm}}{165 \,\text{cm}} = 0.185$
몸무게 :	$\frac{12.9 \,\text{kg}}{70 \,\text{kg}}= 0.115$

예)

다음을 계산하세요.

Cv = 0.872, µ = 7.2인 모집단의 표준편차
Cv = 0.52, σ = 18인 모집단의 평균

a) 표준편차;

cv=0.872
mu=7.2
std=cv*mu; std

6.2784

b) 평균;

cv=0.52
sigma=18
std=round(sigma/cv, 3); std

34.615

sons dataStory

이 블로그 검색

pandas_ta를 적용한 통계적 인덱스 지표

[data analysis] 변동: 분산계수(Variation Coefficient)

변동(Variation)

관련내용

1.3.6 분산계수(Variation Coefficient)

태그

댓글

댓글 쓰기

이 블로그의 인기 게시물

[Linear Algebra] 유사변환(Similarity transformation)

[sympy] Sympy객체의 표현을 위한 함수들

유리함수 그래프와 점근선 그리기