ExcelのCHISQ.DIST関数の使い方
CHISQ.DIST関数は、カイ二乗分布に基づいて、指定された確率密度関数(PDF)または累積分布関数(CDF)を計算するための関数です。この関数は、特に統計学やデータ分析でよく用いられます。
書式は以下のとおりです。
CHISQ.DIST(x, 自由度, 関数形式)
それぞれの引数について説明します。
- x:カイ二乗分布の値を指定します。0以上の数値で表現されます。
- 自由度:カイ二乗分布の自由度を指定します。1以上の整数で表現されます。
- 関数形式:確率密度関数(PDF)と累積分布関数(CDF)のどちらを計算するかを指定します。真(TRUE)または偽(FALSE)の値で表現されます。真の場合、累積分布関数を計算し、偽の場合、確率密度関数を計算します。
サンプル
例として、自由度が5のカイ二乗分布において、xが3のときの確率密度関数(PDF)と累積分布関数(CDF)を求めたい場合、以下のようにCHISQ.DIST関数を使用します。
=CHISQ.DIST(3, 5, FALSE) // 確率密度関数(PDF) =CHISQ.DIST(3, 5, TRUE) // 累積分布関数(CDF)
それぞれの計算式をExcelシートのセルに入力して実行すると、以下のような結果が得られます。
\ | A | B |
---|---|---|
1 | 確率密度関数(PDF) | 0.09022352 |
2 | 累積分布関数(CDF) | 0.4421746 |
これらの計算結果は、自由度が5のカイ二乗分布において、xが3のときの確率密度関数(PDF)が約0.0902、累積分布関数(CDF)が約0.4422であることを示しています。これらの値は、カイ二乗分布におけるデータの分布状況や、特定の範囲内のデータが含まれる確率などを評価する際に役立ちます。
より詳細なサンプル解説
仮に、ある市の住民の年齢層ごとの犯罪率について、データがカイ二乗分布に従うと仮定して、以下のようなデータが得られたとします。
\ | A | B | C |
---|---|---|---|
1 | 年齢層 | 犯罪率 | 自由度 |
2 | 20-29歳 | 3 | 5 |
3 | 30-39歳 | 4.5 | 5 |
4 | 40-49歳 | 6 | 5 |
このデータを使って、それぞれの年齢層における犯罪率の確率密度関数(PDF)と累積分布関数(CDF)を求める場合、以下のようにCHISQ.DIST関数を使用します。
=CHISQ.DIST(B2, C2, FALSE) // 20-29歳の年齢層の確率密度関数(PDF) =CHISQ.DIST(B2, C2, TRUE) // 20-29歳の年齢層の累積分布関数(CDF) =CHISQ.DIST(B3, C3, FALSE) // 30-39歳の年齢層の確率密度関数(PDF) =CHISQ.DIST(B3, C3, TRUE) // 30-39歳の年齢層の累積分布関数(CDF) =CHISQ.DIST(B4, C4, FALSE) // 40-49歳の年齢層の確率密度関数(PDF) =CHISQ.DIST(B4, C4, TRUE) // 40-49歳の年齢層の累積分布関数(CDF)
これらの計算式をExcelシートのセルに入力して実行すると、以下のような結果が得られます。
\ | A | B | C | D | E |
---|---|---|---|---|---|
1 | 年齢層 | 犯罪率 | 自由度 | 確率密度関数(PDF) | 累積分布関数(CDF) |
2 | 20-29歳 | 3 | 5 | 0.09022352 | 0.4421746 |
3 | 30-39歳 | 4.5 | 5 | 0.07508056 | 0.7162065 |
4 | 40-49歳 | 6 | 5 | 0.05549852 | 0.8773474 |
この結果により、それぞれの年齢層における犯罪率の確率密度関数(PDF)と累積分布関数(CDF)が計算できました。これらの値を使って、各年齢層における犯罪率の分布状況や特定の範囲内の犯罪率が含まれる確率などを評価することができます。
例えば、20-29歳の年齢層の累積分布関数(CDF)が約0.4422であることから、この年齢層で犯罪率が3以下である確率は約44.22%であると解釈できます。また、30-39歳の年齢層で犯罪率が4.5以下である確率は約71.62%、40-49歳の年齢層で犯罪率が6以下である確率は約87.73%であることがわかります。
このように、CHISQ.DIST関数を用いることで、カイ二乗分布に従うデータに対して確率密度関数や累積分布関数を計算し、データの特性や確率を評価することができます。