相関(分析ツール)

エクセルの分析ツールアドインにある「相関」機能は、2つ以上のデータ群間の相関関係を分析するための便利なツールです。ここでは、「相関」機能の使用方法を丁寧に説明します。

基本的な使い方

まず、エクセルに「データ分析」ツールが追加されていることを確認しましょう。「データ」メニューの右側に「データ分析」ボタンが表示されているかを確認します。表示されていない場合は、「データ分析ツールパック」を追加する必要があります。

  1. 「データ分析ツールパック」の追加方法
    1. 「ファイル」をクリックし、「オプション」を選択します。
    2. 「エクセルのオプション」ダイアログボックスが開くので、「アドイン」を選択します。
    3. 「アドイン」の画面で、一番下の「管理」ボックスで「Excelアドイン」が選択されていることを確認し、「設定」ボタンをクリックします。
    4. 「アドイン」ダイアログボックスが開くので、「分析ツールパック」のチェックボックスをオンにして、「OK」をクリックします。
    5. これで、「データ」メニューに「データ分析」ボタンが追加されます。

次に、「相関」機能を使ったデータ分析の手順について説明します。

  1. 「相関」機能を使ったデータ分析の手順
    1. まず、分析したいデータを用意します。例えば、A列に1つ目のデータ群(例:売上)、B列に2つ目のデータ群(例:広告費)を入力します。
    2. 「データ」メニューから「データ分析」をクリックします。
    3. 「データ分析」ダイアログボックスが開きます。ここで、「相関」を選択し、「OK」をクリックします。
    4. 「相関」ダイアログボックスが開きます。ここで、「入力範囲」に分析対象のデータが含まれるセル範囲(例:A1:B100)を入力します。なお、「先頭行をラベルとして使用」ボックスがある場合、一行目にラベル(変数名など)がある場合は、このボックスをチェックします。
    5. 「出力範囲」に結果を出力したいセルを指定します。例えば、E1と入力します。
    6. 全ての入力が完了したら、「OK」をクリックします。

これで、指定した出力範囲のセルに相関係数が計算され、出力されます。相関係数は-1から1までの値を取り、1に近いほど強い正の相関(一方が増えるともう一方も増える傾向)、-1に近いほど強い負の相関(一方が増えるともう一方が減る傾向)、0に近いほど相関が弱いことを示します。

なお、この方法は2つのデータ群の相関を調べる基本的な方法ですが、3つ以上のデータ群の相関を調べる場合や、より詳細な相関分析を行いたい場合には、専門的な統計ソフトウェアを使用することをお勧めします。

練習1

以下に「月ごとの広告費」と「売上」の関係を示すサンプルデータを提示します。各月ごとに広告費と売上が記録されています。

月ごとの広告費売上
1月20008500
2月25009000
3月30009500
4月20009200
5月15008800
6月10008500
7月20008800
8月25009300
9月30009800
10月350010500
11月400011000
12月450011500

次に、このデータを使用して、エクセルの「相関」機能を使用する手順について説明します。

  1. データをエクセルに入力します。A列に月、B列に広告費、C列に売上を入力します。
  2. 「データ」メニューから「データ分析」をクリックします。
  3. 「データ分析」ダイアログボックスが開きます。ここで、「相関」を選択し、「OK」をクリックします。
  4. 「相関」ダイアログボックスが開きます。「入力範囲」には、広告費と売上が記載されたセル範囲(B2:C13)を入力します。なお、「先頭行をラベルとして使用」ボックスがある場合、一行目にラベル(変数名など)がある場合は、このボックスをチェックします。
  5. 「出力範囲」に結果を出力したいセル(例:E1)を指定します。もしくは新しいシートに出力します。
  6. 全ての入力が完了したら、「OK」をクリックします。

すると、E1セルに相関係数が計算されて表示されます。この数値は-1から1までの値で、1に近いほど強い正の相関があり(つまり、広告費が増えると売上も増える)、-1に近いほど強い負の相関があり(つまり、広告費が増えると売上が減る)、0に近いほど相関がない(つまり、広告費と売上には関係がない)ことを示します。

練習2

以下に「月」、「広告費」、「店頭プロモーション費」、「ウェブサイトの訪問者数」、「売上」の5つの項目を持つサンプルデータを示します。

広告費店頭プロモーション費ウェブサイトの訪問者数売上
1月2000300050009000
2月2500250055009300
3月3000200060009500
4月2000350045009200
5月1500400040008800
6月1000450035008500
7月2000300050008800
8月2500250055009300
9月3000200060009800
10月35003500650010500
11月40004000700011000
12月45004500750011500

次に、「相関」機能を使用して、これらのデータの間の相関を計算する手順を説明します。

  1. 上記のデータをエクセルに入力します。
  2. 「データ」タブをクリックし、さらに「データ分析」をクリックします。
  3. 「データ分析」ダイアログボックスで、「相関」を選択し、「OK」をクリックします。
  4. 「相関」ダイアログボックスで、「入力範囲」には、B2:E13(広告費、店頭プロモーション費、ウェブサイトの訪問者数、売上のデータがあるセル範囲)を入力します。「先頭行をラベルとして使用」ボックスがある場合、チェックを入れます。
  5. 「出力範囲」には結果を表示したいセル(例えば、G1)を指定します。もしくは新しいシートに出力します。
  6. 全ての情報を入力したら、「OK」をクリックします。

すると、指定した出力範囲に相関行列が表示されます。この行列は、各変数間の相関係数を表示しています。相関係数は-1から1までの値で、1に近いほど強い正の相関(一方が増えるともう一方も増える)、-1に近いほど強い負の相関(一方が増えるともう一方が減る)、0に近いほど相関がない(一方の動きがもう一方の動きと関連がない)を示します。