具体例
・・・偏差値
高校のテスト結果などに偏差値が利用されているが、その計算方法はあまり知られていない。次のような例題で問題を解く。
(問)
一学期の中間試験と期末試験の20人の点数が次のようになった。A君の成績は中間試験は76点、期末試験は75点であった。A君の成績は下がったといえるだろうか?
中間 | 期末 | 中間 | 期末 | ||
A | 76 | 75 | K | 67 | 70 |
B | 56 | 76 | L | 83 | 74 |
C | 46 | 59 | M | 65 | 71 |
D | 65 | 70 | N | 43 | 60 |
E | 67 | 80 | O | 91 | 48 |
F | 56 | 45 | P | 45 | 56 |
G | 53 | 56 | Q | 61 | 45 |
H | 46 | 48 | R | 41 | 71 |
I | 84 | 58 | S | 57 | 73 |
J | 88 | 72 | T | 90 | 73 |
(解)
平均値を計算すると
中間:=(76+56+46+・・・+90)÷20=64
期末:=(75+76+59+・・・+73)÷20=64
となり、平均値は同じになる。その理由から期末テストより1点良い中間テストの方が良い成績として問題ないのだろうか?
データ分析には平均と同じくらい重要な分散という指標があり次のように計算できる。
中間:={(75-64)2+(57-64)2+(46-64)2+・・・+(90-64)2}÷(20-1)=273.26
期末:={(76-64)2+(75-64)2+(59-64)2+・・・+(73-64)2}÷(20-1)=129.26
(データ数−1)で割る理由
この結果を見ると中間試験の方が値が大きい。これは次の図ように表すことが出来る。分散の値が大きい方が分布の広がりが広くなる。
実際にこの図を見て考えると、中間の76点以上の割合(面積)と期末の75点以上の割合(面積)は前者の方が大きくなっている。実際に
中間でA君より成績が良い人数は5人で、一方期末でA君より良い人数は2人である。
もっとわかりやすくテストの点数を比較するために次の式に従い偏差値を計算する。
標準値=(点数−平均)÷分散の平方根
偏差値=50+10×標準値
標準化は平均が0で分散が1となるように変換したものである。偏差値はそれに10をかけて50を足している。このことは50を中心に数値を考え、バラツキがはっきりするように10倍している。20人の中間と期末の偏差値を計算すると次のように計算できる。
中間 | 期末 | 中間 | 期末 | ||
A | 57.26 | 59.68 | K | 51.81 | 55.28 |
B | 45.16 | 60.55 | L | 61.49 | 58.80 |
C | 39.11 | 45.60 | M | 50.60 | 56.16 |
D | 50.60 | 55.28 | N | 37.30 | 46.48 |
E | 51.81 | 64.07 | O | 66.33 | 35.93 |
F | 45.16 | 33.29 | P | 38.51 | 42.96 |
G | 43.35 | 42.96 | Q | 48.19 | 33.29 |
H | 39.11 | 35.93 | R | 36.09 | 56.16 |
I | 62.10 | 44.72 | S | 45.77 | 57.92 |
J | 64.52 | 57.04 | T | 65.73 | 57.92 |
この表からもA君は期末の方が相対的に成績が良いことがわかる。