累積分布の概要と確率変数
「累積分布」は統計学において非常に重要な概念で、ある確率変数が特定の値以下となる確率を表しています。正確には、確率変数Xがx以下となる確率を表す関数を累積分布関数(CDF:Cumulative Distribution Function)といいます。累積分布関数は通常、F(x)で表されます。
累積分布関数は、離散確率変数と連続確率変数の両方に適用可能です。
- 離散確率変数:離散確率変数の場合、累積分布関数は各値における確率を足し合わせることで計算されます。例えば、サイコロの目の累積分布関数は以下のようになります:F(1)=1/6、F(2)=2/6、F(3)=3/6、…、F(6)=1(全確率)。
- 連続確率変数:連続確率変数の場合、累積分布関数は確率密度関数を下からxまで積分することで得られます。つまり、F(x)は確率変数Xがx以下となる確率を表します。したがって、この関数の値は常に0から1までの範囲となります。
累積分布関数の重要な性質は以下の通りです:
- 単調増加:累積分布関数は、xの値が増加するにつれて単調に増加します。
- F(-∞) = 0:無限小の値の累積分布は0です。
- F(∞) = 1:無限大の値の累積分布は1です。
累積分布関数を用いると、確率変数がある範囲の値を取る確率を容易に計算することができます。具体的には、確率変数Xがa以上b以下の値を取る確率は、F(b) – F(a)となります。この特性は、統計的推論や確率論で頻繁に利用されます。
Excelでの累積分布の取り扱い
エクセルでは、組み込みの関数を用いて累積分布関数の値を計算することができます。これは主に以下の関数で行います。
- NORM.DIST関数:正規分布の累積分布関数の値を計算します。NORM.DIST(x, 平均, 標準偏差, TRUE)の形式で使用します。ここで、xは確率変数の値、平均は正規分布の平均、標準偏差は正規分布の標準偏差で、TRUEは累積分布関数を求めるための引数です。
- EXPONDIST関数:指数分布の累積分布関数の値を計算します。EXPONDIST(x, λ, TRUE)の形式で使用します。ここで、xは確率変数の値、λは分布のパラメータで、TRUEは累積分布関数を求めるための引数です。
- BINOM.DIST関数:二項分布の累積分布関数の値を計算します。BINOM.DIST(成功数, 試行回数, 成功確率, TRUE)の形式で使用します。
以上のように、各分布に対応するエクセルの関数を使用すれば、累積分布関数の値を求めることができます。ただし、これらの関数は特定の確率分布(正規分布、指数分布、二項分布など)に対するものであり、それ以外の確率分布に対しては適用できないことに注意してください。
また、確率変数の範囲を指定して累積確率を計算する場合、累積分布関数の差を取ることで求めることができます。例えば、正規分布に従う確率変数Xがa以上b以下の値を取る確率は、
=NORM.DIST(b, 平均, 標準偏差, TRUE) - NORM.DIST(a, 平均, 標準偏差, TRUE)
となります。