본문 바로가기
분석/통계.품질.6Sigma

평균 그리고 표준편차의 개념

by 여우요원 2016. 1. 7.
평균이라는 말은 주변에서 많이 쓰이기도 하며 보통 잘 알고 있는 수치입니다.
그런데 평균이라는 수치는 오해를 유발할 수 있는 약간 모자란 수치입니다.
 
예를 들어서 두 학급의 시험 성적을 예로 들어볼까요?
"1반과 2반의 중간고사 평균 점수가 똑같이 50점이 나왔다"고 생각을 해보면 두 반이 성적이 같네 라고 생각을 하게됩니다.
음~ 틀린말은 아니지만 맞는 말도 아니거든요.
 
아래의 그래프롤 한번 볼까요?
 

 

두 반 모두 평균은 50점 이지만, 1반(Group A)은 50점을 기준으로 많이 퍼져 있습니다. 고득점과 저득점으로 흩어져 있죠.

반면에 2반(Group B)은 거의 모든 학생들이 70점과 30점 사이에 몰려 있습니다.

 

이러한 형태에서 1반(Group A)을 보고 "흩어짐(표준편차)가 크네 " 라고 표현하고

2반(Group B)를 보고 "흩어짐(표준편차)가 작네" 라고 얘기를 합니다.

 
통계학에서는 평균을 위의 그래프에서 처럼  'u'자 처럼 생긴 글자 μ로 표현하고 "뮤~"라고 읽습니다.
표준편차는 6자 비슷하게 쓰며 "시그마~"라고 읽습니다.
 
그림으로 보자면 1반(Group A)는 평균이 50 이고, 표준편차는 20 이라 볼 수 있으며,
2반 (Group B)는 평균이 50 이고 표준편차는 10 이라고 합니다.
 
즉, 같은 평균이지만 표준편차를 보면, 그 각각의 구성이 많이 흩어져있구나, 중간에 몰려 있구나 하고 감을 잡을 수 있죠.
 
그러면 표준편차에 대해서 좀 더 살펴 볼까요?
표준편차를 알면 확률을 아주 쉽게 계산이 가능하거든요. (정말 쉬운가요??)
 
아래 하나의 그래프를 더 볼까요?
 

 

이렇게 종을 업어놓은것 처럼 생긴 그림을 '정규분포'라고 부르는데, 사회 현상에서 측정되는 많은 값들이 이 정규분포를 따릅니다.

 

그럼 위에서 얘기한 확률은 어떻게 쉽게 계산할 수 있냐구요?

위 그림에서 보면 평균 뮤(u)에서 양쪽으로 1시그마씩, 즉 평균을 중심으로 +- 1시그마(총 2시그마 범위)는 전체의 68.3 %가 항상 포함됩니다.
그리고 평균을 중심으로 +- 2시그마(총 4시그마 범위)에서는 95.5 %가 포함되구요.
평균을 중심으로 +- 3시그마(총 6시그마 범위) 사이에는 전체의 99.7 퍼센트가 포함되게 됩니다.
 

아직 좀 어렵죠?

다시 위의 학생들 점수로 돌아가서 생각해 볼께요.

전국의 학생들이 모이고사를 봤는데 평균이 75점이고 표준편차가 5 이라는 사실을 안다고 하면

"아하 ~ 70점에서 80점 사이에 전체 학생들 중에서 68.3 % 정도가 있겠구나. "

많이 1000명이 시험을 봤으면 683명정도가 70~80점을 맞았겠군.

 

위 표로 보면 "80점에서 85점 사이는 13.6 % 즉, 136명 정도가 있겠구나 "  

라고 계산이 가능합니다.

 

결론은 평균은 어떤 그룹의 중심은 알려주지만, 그 흩어짐을 알려면 표준편차라는 값이 있어야 하고

그 표준편차로 그 그룹의 흩어짐 정도를 유추할 수 있습니다.

 

[ 광고 ]

'분석 > 통계.품질.6Sigma' 카테고리의 다른 글

3시그마 규칙 ( 68-95-99.7 규칙 )  (0) 2020.02.20
공정능력 PP, PPK, 장기, 단기  (2) 2019.06.03
공정능력 CP, CPK, 시그마수준  (10) 2019.06.03
Nelson rules  (1) 2016.07.18
계수형 관리도의 정의  (1) 2016.07.18