標準化

「標準化」は、データの平均を0に、標準偏差を1に変換する処理を指します。これにより、データの「位置」を平均値で、データの「散らばり」を標準偏差で表すことができます。標準化されたデータ(Zスコアとも呼ばれる)は、異なる尺度のデータを比較する際や、多変量解析を行う際に用いられます。

STANDARDIZE関数を使わずに標準化の計算をする(仕組みの学習)

以下に、Excelを使用してデータを標準化する手順を詳しく説明します。例として、あるクラスの生徒10人のテストスコアが以下のように与えられたとします。

生徒スコア
生徒165
生徒275
生徒385
生徒495
生徒570
生徒680
生徒790
生徒855
生徒9100
生徒1060

このデータを標準化するには次の手順を踏みます:

  1. スコアをB2セルからB11セルに入力します。
  2. 平均値を計算します。D1セルに=AVERAGE(B2:B11)と入力します。
  3. 標準偏差を計算します。E1セルに=STDEV.P(B2:B11)と入力します。
  4. 各データを標準化します。C2セルに以下の公式を入力します:= (B2-$D$1)/$E$1。これにより、B2セルの値(生徒1のスコア)から平均値D1を引き、結果を標準偏差E1で割ります。これが生徒1のスコアの標準化値です。
  5. この公式をC3セルからC11セルまでコピーします。これにより、生徒2から生徒10までのスコアの標準化値が計算されます。

以上の手順により、スコアのデータセットが標準化されます。これにより、各生徒のスコアが全体の平均からどれだけ離れているか、また全体の散らばりの中でどの位置にあるかがわかります。たとえば、標準化値が0以上であればその生徒のスコアは平均以上で、標準化値が0未満であれば平均未満であるということがわかります。また、標準化値の絶対値が1以上であればその生徒のスコアは全体の散らばり(標準偏差)を超えているということがわかります。

STANDARDIZE関数を使って標準化の計算をする

ExcelのSTANDARDIZE関数を使用すると、データの標準化を容易に行うことができます。

STANDARDIZE関数の基本的な構造は以下の通りです: =STANDARDIZE(X, 平均, 標準偏差)

引数の説明は以下の通りです:

  • X: 標準化を行いたいデータの値
  • 平均: Xの平均値
  • 標準偏差: Xの標準偏差

以下に、具体的な操作の手順を説明します:

  1. まず、データセットの平均値と標準偏差を計算します。例えば、データがB2セルからB11セルに格納されている場合、D1セルに=AVERAGE(B2:B11)と入力し、D2セルに=STDEV.P(B2:B11)と入力します。
  2. 次に、各データを標準化します。E2セルに=STANDARDIZE(B2, $D$1, $D$2)と入力し、それをE3セルからE11セルまでコピーします。

以上の操作により、データの標準化が完成します。STANDARDIZE関数を使用すると、各データの値が平均から何標準偏差離れているか(Zスコア)を計算できます。これにより、異なる尺度で測定されたデータを共通の尺度で比較することが可能になります。