PERCENTRANK.INC 関数と PERCENTRANK.EXC 関数、ふたつの違い
Excelの PERCENTRANK.INC
関数と PERCENTRANK.EXC
関数は、ある値がデータセット内でどのパーセンタイルに位置するかを計算します。しかし、これら2つの関数の間の主な違いは、パーセンタイルの計算方法です。
PERCENTRANK.INC
は、”包括的(inclusive)”モードでパーセンタイルを計算します。つまり、データセットの最小値と最大値がそれぞれ0パーセンタイルと100パーセンタイルとなります。これは、データセットの最小値と最大値が全体の範囲に「含まれる」ことを意味します。PERCENTRANK.EXC
は、”排他的(exclusive)”モードでパーセンタイルを計算します。つまり、データセットの最小値は0より大きいパーセンタイルに、最大値は100より小さいパーセンタイルに対応します。これは、データセットの最小値と最大値が全体の範囲から「除外される」ことを意味します。
つまり、「包括的」モードではデータの最小値と最大値が100%の範囲に含まれ、「排他的」モードではそれらが100%の範囲から少し外れるという違いがあります。
したがって、PERCENTRANK.INC
と PERCENTRANK.EXC
の結果は、データセットの最小値と最大値に対して異なります。それ以外の値では、これら2つの関数の結果は同じまたは非常に近い結果になることが多いです。
この違いは、パーセンタイルがデータ分布の端(最小値と最大値)をどのように扱うかによります。PERCENTRANK.INC
は最小値と最大値を分布の一部と見なし、それに応じてパーセンタイルを計算します。一方、PERCENTRANK.EXC
は最小値と最大値を分布の一部とは見なさず、それらが分布の「外側」にあると見なします。このため、PERCENTRANK.EXC
の結果は最小値と最大値で0や1にはならず、代わりにそれよりわずかに大きいまたは小さい値を取ります。
PERCENTRANK.INC 関数と PERCENTRANK.EXC 関数でのサンプル表
D列の「今月成約数」を用い順位付けをしました。E列にはPERCENTRANK.INC
関数を使っています(0~1)。F列にはPERCENTRANK.EXC
関数を使っています(0.06~0.93)。
設定したのは以下のような計算式です。D2セルとE2セルへ作成し、下へコピーしました。
=PERCENTRANK.INC($D$2:$D$16,D2,2) =PERCENTRANK.EXC($D$2:$D$16,D2,2)
社員番号 | 氏名 | 部署 | 今月成約数 | 順位i | 順位e |
---|---|---|---|---|---|
1 | 中島 亮介 | 人事部 | 3 | 0.14 | 0.18 |
2 | 岡田 淳 | マーケティング部 | 8 | 0.42 | 0.43 |
3 | 橋本 明美 | 経理部 | 5 | 0.21 | 0.25 |
4 | 佐藤 花子 | 開発部 | 18 | 0.71 | 0.68 |
5 | 伊藤 直人 | 経理部 | 6 | 0.35 | 0.37 |
6 | 松本 舞 | 人事部 | 23 | 1 | 0.93 |
7 | 田中 健一 | マーケティング部 | 1 | 0 | 0.06 |
8 | 加藤 陽子 | 営業部 | 13 | 0.57 | 0.56 |
9 | 高橋 あすか | 経理部 | 21 | 0.92 | 0.87 |
10 | 斉藤 くみ子 | 営業部 | 1 | 0 | 0.06 |
11 | 長谷川 聡太郎 | マーケティング部 | 19 | 0.78 | 0.75 |
12 | 橋本 健一 | 人事部 | 8 | 0.42 | 0.43 |
13 | 小川 直子 | 営業部 | 19 | 0.78 | 0.75 |
14 | 山下 京助 | マーケティング部 | 5 | 0.21 | 0.25 |
15 | 伊藤 康弘 | 営業部 | 16 | 0.64 | 0.62 |
PERCENTRANK.EXC 関数の最小値、最大値の基準については以下の通りです。
PERCENTRANK.EXC(”排他的”パーセンタイル)はデータセットの最小値と最大値をパーセンタイルの範囲から除外します。具体的には、最小値は1/(n+1)パーセンタイル、最大値はn/(n+1)パーセンタイルとして扱われます。ここでnはデータセットの要素数です。
この例で言うと、データの数は15なので、最小値のパーセンタイルは1/(15+1) = 0.06、最大値のパーセンタイルは15/(15+1) = 0.9375となります。そのため、最小値と最大値がそれぞれ0.06、0.93と表示されているわけです。
PERCENTRANK.EXCはデータの分布をより詳細に理解するのに有用なツールであり、特にデータが少ない場合や極端な値が存在する場合に役立ちます。その一方で、最大値と最小値が0%と100%に対応しないため、一部のユーザーには直感的でないかもしれません。それぞれの関数には特性があり、用途によって適切な関数を選択することが重要です。
コメント