エクセルで指数分布を理解しよう!
データ分析において、ランダムなイベントの間隔や待ち時間の分析は一般的に行われます。これらはしばしば指数分布と呼ばれる特定の確率分布に従います。今回は、Excelを用いて指数分布を理解し、分析する方法を学びましょう。
指数分布とは何か?
指数分布は、ランダムに発生するイベント間の待ち時間を表す確率分布の一つです。例えば、コールセンターに電話がかかってくる間隔、バス停でバスが到着する間隔などは指数分布に従います。
Excelでの指数分布の取り扱い
Excelでは、指数分布に関する計算を行うためのEXPON.DIST
関数が提供されています。この関数を使うと、指数分布の確率密度関数(PDF)や累積分布関数(CDF)を計算することができます。
確率密度関数(PDF):関数形式- FALSE
指数分布の確率密度関数は、特定の値での確率を計算します。これはEXPON.DIST(x, λ, FALSE)
関数を使用して計算できます。ここで、x
は確率変数(例えば、待ち時間や間隔)、λ
はイベントが平均的に発生するレート(率)です。
累積分布関数(CDF):関数形式- TRUE
指数分布の累積分布関数は、特定の値以下になる確率を計算します。これはEXPON.DIST(x, λ, TRUE)
関数を使用して計算できます。ここで、x
は確率変数(例えば、待ち時間や間隔)、λ
はイベントが平均的に発生するレート(率)です。以下の具体例ではこちらを説明しています。
具体例で理解しよう
例えば、あるバス停でバスが平均して30分に1回到着するとします。次にバスが到着するまでに40分かかる確率、45分かかる確率はどのくらいでしょうか?
この問題は、EXPON.DIST
関数を使用して解くことができます。到着するレートλ
は30分に1回なので、1/30です。そして、待ち時間x
は40分です。したがって、この確率を計算するための関数は=EXPON.DIST(40, 1/30, TRUE)
となります(約73.64%)。この関数は、次のバスが40分以内に到着する確率を計算します。
=EXPON.DIST(45, 1/30, TRUE)
ならば次のバスが45分以内に到着する確率を計算します(約77.69%
)。ふたつを引けば次のバスが40~45分に到着する確率を求められますね(約4.05%)。
下記の表においてはB列に=EXPON.DIST(A列の値, 1/30, TRUE)
を入力しています。
次にくるバス | 累積分布関数 |
---|---|
5 | 15.35% |
10 | 28.35% |
15 | 39.35% |
20 | 48.66% |
25 | 56.54% |
30 | 63.21% |
35 | 68.86% |
40 | 73.64% |
45 | 77.69% |
50 | 81.11% |
55 | 84.01% |
60 | 86.47% |
まとめ
今回は、Excelを用いて指数分布を理解し、それを使って確率を計算する方法について学びました。待ち時間や間隔の分析は、様々なビジネスや科学の問題を解決するための重要なツールとなります。ExcelのEXPON.DIST
関数を使うと、これらの問題を簡単に解決することができます。
コメント