数学I 第6章データの分析(分散、標準偏差)

第6章 データの分析

6.3 データのちらばり具合

6.3.1 分散

分散とは、データがどれだけ平均から散らばっているかを表す値である。散らばっているほど、値は大きくなる。分散の求め方は、以下のとおりである。(高卒認定試験では、問題に書いてある場合もある。) 

まず、それぞれのデータから平均値を引き、平均値からの差を求める。
[math](x_1-\bar{x})[/math]

次に、これはデータが平均値[math]\bar{x}[/math]より大きい場合、小さい場合で、差がプラスだったり、マイナスだったりするので、2乗してプラスに統一する。[math](x_1-\bar{x})^2[/math]

さらに、平均値からの差の2乗した値を、すべてのデータ分足す。
[math](x_1-\bar{x})^2+(x_2-\bar{x})^2+ \cdots +(x_n-\bar{x})^2[/math]

最後に、データの数(n)で割って、1データあたりの平均値からの差の平均を求めている。
[math]\frac{(x_1-\bar{x})^2+(x_2-\bar{x})^2+ \cdots +(x_n-\bar{x})^2}{n}[/math]

6.3.2 標準偏差

標準偏差とは、分散の平方根である。
分散を求めるときに2乗していたので、平方根を取って元に戻す感じ。分母もルートの中に入っているのに注意。
[math]\sqrt{\frac{(x_1-\bar{x})^2+(x_2-\bar{x})^2+ \cdots +(x_n-\bar{x})^2}{n}}[/math]