回帰分析(regression analysis)

回帰分析の概要

統計学における「回帰分析」は、変数間の関係を定量的に調査し、未来の予測や現象の理解に利用するための手法です。

具体的には、一つまたはそれ以上の変数(説明変数)から別の変数(目的変数)を予測することを目指します。例えば、広告費(説明変数)と商品の売上(目的変数)の関係を調査する場合、回帰分析を使用すると、広告費がどの程度売上に影響を与えるかを定量的に表現できます。

回帰分析の基本概念

単回帰分析と重回帰分析

単回帰分析は、一つの説明変数を用いて目的変数を予測します。一方、重回帰分析では、二つ以上の説明変数を用いて目的変数を予測します。

回帰係数

回帰係数は、説明変数の変化が目的変数にどれだけ影響を与えるかを表します。正の回帰係数は説明変数が増加すると目的変数も増加することを示し、負の回帰係数は説明変数が増加すると目的変数が減少することを示します。

決定係数

決定係数は、説明変数が目的変数の変動をどれだけ説明できるかを示す指標です。値は0から1までで、1に近いほど説明変数が目的変数の変動をよく説明していることを意味します。

回帰分析の手順

  1. 目的変数と説明変数の選択: 目的変数は予測したい変数、説明変数はその予測に用いる変数を選びます。
  2. モデルの構築: 最も一般的なモデルは線形回帰モデルですが、変数間の関係が複雑な場合には、非線形モデルも使用されます。
  3. モデルの推定: データを用いて、モデルのパラメータ(回帰係数)を推定します。これは通常、最小二乗法という手法を使用します。
  4. モデルの評価: 推定したモデルがデータをどれほどよく説明できているかを評価します。これは、決定係数や残差分析などの手法を使用します。
  5. 予測: 構築・推定・評価が終わったモデルを用いて、新たな説明変数の値から目的変数の値を予測します。

回帰分析は、データ分析や機械学習の分野で広く用いられています。しかし、誤った解釈を避けるためには、データの性質や仮定、限界を理解することが重要です。

Excelで回帰分析する際の流れ

Excelではデータ分析ツールパックという機能を使用して、回帰分析を行います。このツールパックを使用すると、変数間の関係を定量化したり、未来の予測を行ったりすることが可能になります。

以下に、Excelでの回帰分析の基本的な手順を示します:

  1. データ分析ツールパックの有効化: Excelの「ファイル」→「オプション」→「アドイン」を開き、「管理」の一覧で「Excelアドイン」を選択し、「設定」をクリックします。その後、「分析ツール」のチェックボックスをオンにし、「OK」をクリックします。これにより、「データ」タブに「データ分析」のオプションが追加されます。
  2. データの準備: 分析したいデータを準備します。目的変数(従属変数)と説明変数(独立変数)のデータ列を用意します。
  3. データ分析ツール・回帰分析の利用: 「データ」タブから「データ分析」を選択し、「回帰分析」を選び、「OK」をクリックします。
  4. 分析設定: 「入力Y範囲」に目的変数の範囲を、「入力X範囲」に説明変数の範囲を選択します。「ラベル」のチェックボックスをオンにすると、選択した範囲の最初の行をラベルとして認識します。「出力範囲」を指定すると、その範囲に分析結果が出力されます。
  5. 結果の解釈: 「OK」をクリックすると、回帰分析の結果が出力されます。この結果には、回帰係数、R平方(決定係数)、標準誤差などの情報が含まれています。

Excelでの回帰分析実習

以下に、Excelで回帰分析を行うためのサンプルデータとその手順を示します。このサンプルデータでは、広告費(説明変数)と売上(目的変数)の関係を分析します。

まず、以下のようなデータテーブルを考えます(「広告費」セルがA1とする):

広告費売上
120650
150700
170800
200850
230900
250950
270980
3001020
3301050
3601100

このデータをExcelに入力したら、以下の手順で回帰分析を行います:

  1. 「データ」タブから「データ分析」を選択します。
  2. データ分析ダイアログボックスが表示されるので、「回帰分析」を選択し、「OK」をクリックします。
  3. 「入力Y範囲」に目的変数(売上)の範囲を、「入力X範囲」に説明変数(広告費)の範囲を選択します。また、「ラベル」のチェックボックスをオンにすると、選択した範囲の最初の行をラベルとして認識します。
  4. 「出力範囲」を指定すると、その範囲に分析結果が出力されます。「新規ワークシート」を選択すると、新しいシートに結果が出力されます。
  5. 「OK」をクリックすると、回帰分析の結果が出力されます。

以上の手順で、広告費と売上の間の回帰分析を行うことができます。