標準偏差を関数で求める
「標準偏差」は、統計学における基本的な散布度を示す指標の一つで、データの値が平均値からどれだけ散らばっているかを示すものです。平均値がデータの「中心」を示すのに対し、標準偏差はデータの「散らばり」を示します。標準偏差が大きければ大きいほど、データの散らばりは大きいと言えます。
以下に、Excelで標準偏差を計算するための手順を説明します。例として、あるクラスの生徒10人のテストスコアが以下のように与えられたとします。
生徒 | スコア |
---|---|
生徒1 | 65 |
生徒2 | 75 |
生徒3 | 85 |
生徒4 | 95 |
生徒5 | 70 |
生徒6 | 80 |
生徒7 | 90 |
生徒8 | 55 |
生徒9 | 100 |
生徒10 | 60 |
このデータセットの標準偏差を求めるためには、次の手順を踏みます:
- エクセルでデータを列に入力します。例えば、スコアをB2セルからB11セルに入力します。
- 標準偏差を計算するために、他の空白のセル(例えば、D1セル)に
=STDEV.P(B2:B11)
と入力します。これにより、選択した範囲の標準偏差が計算されます。
以上の操作により、データセットの標準偏差をエクセルを用いて簡単に計算することができます。「STDEV.P」関数はエクセルに標準で組み込まれている関数で、各データの値が平均からどの程度離れているかを二乗した値の平均(分散)の平方根(標準偏差)を自動で計算してくれます。
このように全数の値が判明している状態から標準偏差を求める場合には「STDEV.P」を用います。
しかし非常に大きな標本を調査するケースで全数の値を取得することが難しいような場合には、「STDEV.S」関数を用います。
理解を深めるため、STDEV関数を使わずに計算する
エクセルのSTDEV.P
関数を使わずに標準偏差を計算する手順は少し複雑になりますが、以下のようになります。
- まず、各データから平均値を引いた値(偏差)を求めます。データがB2セルからB11セルに入っているとし、平均値がE1セルにあるとします(
=AVERAGE(B2:B11)
)。
この場合、E2セルに=B2-$E$1
と入力し、それをE3セルからE11セルまでコピーします。これにより各データの偏差が求まります。「各データの値が平均からどの程度離れているか」が判明します。 - 次に、これらの偏差を二乗します。F2セルに
=E2^2
と入力し、それをF3セルからF11セルまでコピーします。すべて正の値となりました。 - これらの偏差の二乗の和を求めます。G1セルに
=SUM(F2:F11)
と入力します。これにより偏差の二乗和が求まります。 - 偏差の二乗和をデータの数(この場合は10)で割ります。H1セルに
=G1/10
と入力します。これにより分散が求まります。またこれは「=AVERAGE(G2:G11)」と平均値で出しても同じです。 - 分散の平方根をSQRT関数を用いて取ります。J1セルに
=SQRT(H1)
と入力します。これが標準偏差です。「=H1^(1/2)
」の式でも平方根が取れます。
以上の操作により、STDEV.P
関数を使わずにエクセルで標準偏差を計算することができます。ただし、これらの操作は各データから平均値を引いた偏差、偏差の二乗、偏差の二乗和、分散、標準偏差といった標準偏差を求めるための中間的な値を直接計算していますので、手間がかかります。このため、通常はSTDEV.P
関数を使って一発で標準偏差を計算することが推奨されます。