「標準化」は、データの平均を0に、標準偏差を1に変換する処理を指します。これにより、データの「位置」を平均値で、データの「散らばり」を標準偏差で表すことができます。標準化されたデータ(Zスコアとも呼ばれる)は、異なる尺度のデータを比較する際や、多変量解析を行う際に用いられます。
STANDARDIZE関数を使わずに標準化の計算をする(仕組みの学習)
以下に、Excelを使用してデータを標準化する手順を詳しく説明します。例として、あるクラスの生徒10人のテストスコアが以下のように与えられたとします。
生徒 | スコア |
---|---|
生徒1 | 65 |
生徒2 | 75 |
生徒3 | 85 |
生徒4 | 95 |
生徒5 | 70 |
生徒6 | 80 |
生徒7 | 90 |
生徒8 | 55 |
生徒9 | 100 |
生徒10 | 60 |
このデータを標準化するには次の手順を踏みます:
- スコアをB2セルからB11セルに入力します。
- 平均値を計算します。D1セルに
=AVERAGE(B2:B11)
と入力します。 - 標準偏差を計算します。E1セルに
=STDEV.P(B2:B11)
と入力します。 - 各データを標準化します。C2セルに以下の公式を入力します:
= (B2-$D$1)/$E$1
。これにより、B2セルの値(生徒1のスコア)から平均値D1を引き、結果を標準偏差E1で割ります。これが生徒1のスコアの標準化値です。 - この公式をC3セルからC11セルまでコピーします。これにより、生徒2から生徒10までのスコアの標準化値が計算されます。
以上の手順により、スコアのデータセットが標準化されます。これにより、各生徒のスコアが全体の平均からどれだけ離れているか、また全体の散らばりの中でどの位置にあるかがわかります。たとえば、標準化値が0以上であればその生徒のスコアは平均以上で、標準化値が0未満であれば平均未満であるということがわかります。また、標準化値の絶対値が1以上であればその生徒のスコアは全体の散らばり(標準偏差)を超えているということがわかります。
STANDARDIZE関数を使って標準化の計算をする
ExcelのSTANDARDIZE
関数を使用すると、データの標準化を容易に行うことができます。
STANDARDIZE
関数の基本的な構造は以下の通りです: =STANDARDIZE(X, 平均, 標準偏差)
引数の説明は以下の通りです:
X
: 標準化を行いたいデータの値平均
: Xの平均値標準偏差
: Xの標準偏差
以下に、具体的な操作の手順を説明します:
- まず、データセットの平均値と標準偏差を計算します。例えば、データがB2セルからB11セルに格納されている場合、D1セルに
=AVERAGE(B2:B11)
と入力し、D2セルに=STDEV.P(B2:B11)
と入力します。 - 次に、各データを標準化します。E2セルに
=STANDARDIZE(B2, $D$1, $D$2)
と入力し、それをE3セルからE11セルまでコピーします。
以上の操作により、データの標準化が完成します。STANDARDIZE
関数を使用すると、各データの値が平均から何標準偏差離れているか(Zスコア)を計算できます。これにより、異なる尺度で測定されたデータを共通の尺度で比較することが可能になります。