「歪度(わいど)」の概要
統計学における「歪度」(skewness)は、確率分布やデータの分布がどれくらい非対称であるかを示す数値です。言い換えると、データが中央値を中心に左右どちらに偏って分布しているかを示す指標の一つです。
以下の3つのパターンがあります:
- 歪度がゼロ(あるいは非常に小さい):これはデータが対称的に分布していることを意味します。ヒストグラムや度数分布表で見た場合、中央値を中心に左右対称な形になります。代表的な例としては、正規分布(ガウス分布)があります。
- 歪度が正(大きい):これはデータが左に偏っている(つまり、データの尾部が右側に長い)ことを意味します。ヒストグラムや度数分布表で見た場合、右側に長い尾を引いた形になります。この状況は、「右裾長い」または「右に歪んだ」分布とも表現されます。
- 歪度が負(小さい):これはデータが右に偏っている(つまり、データの尾部が左側に長い)ことを意味します。ヒストグラムや度数分布表で見た場合、左側に長い尾を引いた形になります。この状況は、「左裾長い」または「左に歪んだ」分布とも表現されます。
歪度は分布の形状について重要な情報を提供します。特に、平均値や中央値だけでは捉えることができない、分布の非対称性について理解するのに役立ちます。
Excelでの歪度の取り扱い
Excelでは、一連のデータセットの歪度を計算するための関数として「SKEW」または「SKEW.P」を提供しています。
- 「SKEW」関数:この関数は、サンプルデータの歪度を計算します。使用法は次のようになります。
=SKEW(数値1, [数値2], ...)
ここで、数値1、数値2、…は2つ以上の数値引数を指定します。引数は直接数値を入力することも、数値が入っているセル範囲を指定することもできます。
- 「SKEW.P」関数:この関数は、母集団データの歪度を計算します。使用法は次のようになります。
=SKEW.P(数値1, [数値2], ...)
同様に、数値1、数値2、…は2つ以上の数値引数を指定します。引数は直接数値を入力することも、数値が入っているセル範囲を指定することもできます。
サンプルデータを用いて実際の使用例を見てみましょう。例えば、セルA1からA10までに一連のデータが入っているとき、その歪度を計算するには次のようにします。
=SKEW(A1:A10)
または母集団の場合:
=SKEW.P(A1:A10)
これにより、データの分布が左に偏っている(負の歪度)、右に偏っている(正の歪度)、または対称である(歪度が0に近い)かを知ることができます。