第6章 データの分析
6.3 データのちらばり具合
6.3.1 分散
分散とは、データがどれだけ平均から散らばっているかを表す値である。散らばっているほど、値は大きくなる。分散の求め方は、以下のとおりである。(高卒認定試験では、問題に書いてある場合もある。)
まず、それぞれのデータから平均値を引き、平均値からの差を求める。
[math](x_1-\bar{x})[/math]
次に、これはデータが平均値[math]\bar{x}[/math]より大きい場合、小さい場合で、差がプラスだったり、マイナスだったりするので、2乗してプラスに統一する。[math](x_1-\bar{x})^2[/math]
さらに、平均値からの差の2乗した値を、すべてのデータ分足す。
[math](x_1-\bar{x})^2+(x_2-\bar{x})^2+ \cdots +(x_n-\bar{x})^2[/math]
最後に、データの数(n)で割って、1データあたりの平均値からの差の平均を求めている。
[math]\frac{(x_1-\bar{x})^2+(x_2-\bar{x})^2+ \cdots +(x_n-\bar{x})^2}{n}[/math]
6.3.2 標準偏差
標準偏差とは、分散の平方根である。
分散を求めるときに2乗していたので、平方根を取って元に戻す感じ。分母もルートの中に入っているのに注意。
[math]\sqrt{\frac{(x_1-\bar{x})^2+(x_2-\bar{x})^2+ \cdots +(x_n-\bar{x})^2}{n}}[/math]