二項分布

二項分布の概要

二項分布は統計学における重要な概念で、二つの結果(成功または失敗、オンまたはオフなど)を持つ試行をn回繰り返したときの成功回数の確率分布を表します。これらの試行は互いに独立であると仮定され、つまり一つの試行の結果が他の試行に影響を与えないと考えられます。また、各試行で成功する確率は一定です。

二項分布の具体的な例としては、コイン投げがよく挙げられます。コインを投げるとき、表または裏が出る2つの可能性があります。表が出る(これを「成功」と呼ぶことにします)確率は0.5で、これは一定です。コインを10回投げるとき、表がちょうど5回出る確率は二項分布を用いて計算することができます。

二項分布の確率は次の公式で計算されます:

P(X=k) = C(n, k) * (p^k) * ((1-p)^(n-k))

ここで、

  • P(X=k)は成功回数がk回となる確率
  • C(n, k)はn回の試行からk回の成功を選ぶ組み合わせの数
  • pは一回の試行で成功する確率
  • nは試行回数 です。

二項分布は、マーケティング調査、品質管理、選挙の予測など、多くの分野で応用されます。例えば、製品が不良品である確率が既知の場合、ランダムに選んだ100個の製品中に10個の不良品が含まれる確率を計算するために二項分布を用いることができます。

なお、大量の試行がある場合(nが大きい場合)や成功確率pが非常に小さい場合などには、二項分布の代わりにポアソン分布がしばしば用いられます。

二項分布:その他の使用具体例

考えられるシナリオとして、製造ラインで作られた部品が不良である確率を考えてみましょう。品質管理の目的で、ある特定の部品が不良である確率が0.01(1%)であると判明しているとします。

100個の部品を無作為に抽出し、その中に2個の不良品が含まれている確率を求めたいとしましょう。これは二項分布を用いて計算できます。

この場合、n(試行回数)は100、k(成功回数、ここでは「成功」は不良品を見つけることを意味します)は2、p(一回の試行で成功する確率、ここでは部品が不良である確率)は0.01です。

このように、二項分布は特定の試行(この例では部品の検査)をn回行ったときに、特定の結果(この例では不良品を見つける)がk回起こる確率を計算するために使用できます。

二項分布は、結果が2つの可能性しかない場合(成功または失敗、良品または不良品など)に適用可能であり、各試行が互いに独立していて結果が一定の確率で起こるという前提条件があるため、多くの実世界の問題に適用することができます。

エクセルでの二項分布の取扱

エクセルでは、二項分布を計算するために「BINOM.DIST」または「BINOM.DIST.RANGE」関数を使用することができます。以下に、それぞれの関数の使用方法を説明します。

  1. BINOM.DIST関数:BINOM.DIST関数は、二項分布の確率を計算します。具体的には、指定された試行回数内での成功回数の確率を計算します。

    使い方は以下の通りです:

    =BINOM.DIST(成功数, 試行回数, 成功率, 関数形式)

    ここで、

    • 「成功数」は成功と見なす事象が起きる回数(例:不良品が出る回数)です。
    • 「試行回数」は試行を行う回数(例:検査する製品の数)です。
    • 「成功率」は1回の試行で成功する確率(例:ある製品が不良品である確率)です。
    • 「関数形式」は論理値で、FALSEを指定すると確率密度関数(成功回数が指定した値と完全に一致する確率)が、TRUEを指定すると累積分布関数(成功回数が指定した値以下となる確率)が返されます。
  2. BINOM.DIST.RANGE関数:BINOM.DIST.RANGE関数は、二項分布の累積確率を計算します。具体的には、成功回数が指定した範囲内に収まる確率を計算します。

    使い方は以下の通りです:

    =BINOM.DIST.RANGE(試行回数, 成功率, 成功数, [成功数2])

    ここで、

    • 「試行回数」は試行を行う回数(例:検査する製品の数)です。
    • 「成功率」は1回の試行で成功する確率(例:ある製品が不良品である確率)です。
    • 「成功数」は成功と見なす事象が起きる最小回数(例:不良品が出る最小回数)です。
    • 「成功数2」は成功と見なす事象が起きる最大回数(例:不良品が出る最大回数)です。この引数はオプションで、指定しない場合は成功回数の最小値と同じ値が使われます。

これらの関数を利用することで、Excelを用いて二項分布の計算を行うことが可能です。

エクセルでの二項分布計算具体例

具体的な例を提示します。例えば、ある製造工程において、部品が不良である確率が0.01(1%)であるとします。100個の部品を無作為に抽出し、その中に2個の不良品が含まれている確率を求めたいとき、以下のようにエクセルの関数を使用します。

  1. BINOM.DIST関数を使用する場合:セルに次のように入力します:=BINOM.DIST(2, 100, 0.01, FALSE)

    これにより、100個の部品の中に正確に2個の不良品が含まれている確率が計算されます。

  2. BINOM.DIST.RANGE関数を使用する場合:セルに次のように入力します:=BINOM.DIST.RANGE(100, 0.01, 2)

    これにより、100個の部品の中に2個以下の不良品が含まれている確率が計算されます。

また、100個の部品の中に2個から4個の不良品が含まれている確率を求めたい場合は、=BINOM.DIST.RANGE(100, 0.01, 2, 4)と入力します。

これらのエクセルの関数を利用することで、様々な状況下での二項分布の確率を簡単に計算することができます。