具体例

・・・分散の比較

 2つのデータを比較するときに基本的には平均を考えるが、もしその平均値が同じだった場合似ているデータと考えて良いのだろうか?
 ここで次のような3つのデータA、B、Cで比較を行う。


A B C
1 1 2
2 1 3
3 1 3
4 1 3
5 11 4

まず、これら3つの平均を計算すると次のように等しくなる。

A:(1+2+3+4+5)÷5=3
B:(1+1+1+1+11)÷5=3
C:(2+3+3+3+4)÷5=3


 もし、このデータがA、B、C地点で営業しているファミリーレストランの一日の売上(単位:十万円)だと考えてみる。ファミリーレストランの場合、従業員の給料や料理を作るための食材費など毎日一定の費用がかかる。それなのにBのように一日10万円しか売上が無い場合が多い日は費用を無駄にする日が多くなる。逆にCのように一日の売上がさほど変わらない日が多い場合は、従業員のシフトや仕入れる食材についてある程度予想がつく。つまり、Bのようなレストランはリスクが大きく、逆にCのようなレストランはリスクが小さい。
 そこで、次のような分散と呼ばれる数値を計算してみる。

分散=(データ―平均)の2乗の和÷データ数

それぞれ計算すると

A:{(1-3)2+(2-3)2+(3-3)2+(4-3)2+(5-3)2}÷5=2
B:{(1-3)2+(1-3)2+(1-3)2+(1-3)2+(11-3)2}÷5=16
C:{(2-3)2+(3-3)2+(3-3)2+(3-3)2+(4-3)2}÷5=0.4


 この結果をみて一番リスクが高かったBが16で一番大きく、逆にリスクの低かったCが0.4と小さい値になっている。つまり、この分散は散らばり具合を計っていて、実際に金融工学の分野ではリスク=分散と考えて分析を行っている。


                                戻る