기본 콘텐츠로 건너뛰기

라벨이 중간값인 게시물 표시

[matplotlib]quiver()함수

[data analysis] 중심척도: 중간값(median)

중심척도 관련내용 최빈값(Mode) 평균(Mean) 중간값(Median) 중간값(Median) 데이터의 중심은 값들이 몰려있는 부분에 집중되는 지점입니다. 평균(mean) 은 그 지점을 결정하는 방법이지만 이상치의 존재 등으로 전체의 중심을 왜곡할 가능성이 존재합니다. 평균의 약점을 보완할 수 있는 다른 중심 측정치로 중간값(Median) 을 사용할 수 있습니다. 예를 들어 인원 9명인 그룹의 다이어트 처방을 위해 약함과 강함으로 분류하고자 할 경우 처방의 근거는 그 그룹의 평균 몸무게를 기준으로 구분할 수 있습니다. 그러나 다음의 결과와 같이 문제를 제시할 수 있습니다. weight=np.array([38, 35, 45, 30, 48, 33, 42, 39,100]) print(weight) [ 38, 35, 45, 30, 48, 33, 42, 39, 100] print('%.3f'%weight.mean()) 45.556 print('%.3f'%weight[:-1].mean())#이상치를 제외한 경우 38.750 위 코드에서 나타낸 것과 같이 그 그룹의 일원 중 한 명의 몸무게는 나머지에 비해 현격한 차이를 보입니다. 즉, 이상치인 값이 포함되어 있습니다. 이 상태에서 평균 몸무게는 약 45.6 kg 이지만 이상치를 제외한 경우 평균은 약 38.8 kg으로 상이한 차이가 존재합니다. 강한 또는 약한 처방의 기준이 위의 두 값 사이에 존재하는 경우 불필요한 처방이 이루어질 수 있습니다. 이와 같이 이상치가 존재할 경우 평균은 그 값에 매우 민감하므로 바람직하지 않은 판단의 근거로 작용할 가능성을 가집니다. 평균 대신 데이터들 중간에 위치한 값을 중심을 대표하는 위치값으로 사용할 수 있습니다. 이러한 측정치를 중간값 (median) 으로 정의합니다. [중간값(Median)] 데이터 셋의 중간에 위치하는 값으로 다음 과정으로 산출합니다. 모든 값을 올림차순 또는 내림차순으...