PERCENTRANK.INC 関数と PERCENTRANK.EXC 関数の違い

PERCENTRANK.INC 関数と PERCENTRANK.EXC 関数、ふたつの違い

Excelの PERCENTRANK.INC 関数と PERCENTRANK.EXC 関数は、ある値がデータセット内でどのパーセンタイルに位置するかを計算します。しかし、これら2つの関数の間の主な違いは、パーセンタイルの計算方法です。

  • PERCENTRANK.INC は、”包括的(inclusive)”モードでパーセンタイルを計算します。つまり、データセットの最小値と最大値がそれぞれ0パーセンタイルと100パーセンタイルとなります。これは、データセットの最小値と最大値が全体の範囲に「含まれる」ことを意味します。
  • PERCENTRANK.EXC は、”排他的(exclusive)”モードでパーセンタイルを計算します。つまり、データセットの最小値は0より大きいパーセンタイルに、最大値は100より小さいパーセンタイルに対応します。これは、データセットの最小値と最大値が全体の範囲から「除外される」ことを意味します。

つまり、「包括的」モードではデータの最小値と最大値が100%の範囲に含まれ、「排他的」モードではそれらが100%の範囲から少し外れるという違いがあります。

したがって、PERCENTRANK.INCPERCENTRANK.EXC の結果は、データセットの最小値と最大値に対して異なります。それ以外の値では、これら2つの関数の結果は同じまたは非常に近い結果になることが多いです。

この違いは、パーセンタイルがデータ分布の端(最小値と最大値)をどのように扱うかによります。PERCENTRANK.INC は最小値と最大値を分布の一部と見なし、それに応じてパーセンタイルを計算します。一方、PERCENTRANK.EXC は最小値と最大値を分布の一部とは見なさず、それらが分布の「外側」にあると見なします。このため、PERCENTRANK.EXC の結果は最小値と最大値で0や1にはならず、代わりにそれよりわずかに大きいまたは小さい値を取ります。

PERCENTRANK.INC 関数と PERCENTRANK.EXC 関数でのサンプル表

D列の「今月成約数」を用い順位付けをしました。E列にはPERCENTRANK.INC 関数を使っています(0~1)。F列にはPERCENTRANK.EXC 関数を使っています(0.06~0.93)。

設定したのは以下のような計算式です。D2セルとE2セルへ作成し、下へコピーしました。

=PERCENTRANK.INC($D$2:$D$16,D2,2)
=PERCENTRANK.EXC($D$2:$D$16,D2,2)
社員番号氏名部署今月成約数順位i順位e
1中島 亮介人事部30.140.18
2岡田 淳マーケティング部80.420.43
3橋本 明美経理部50.210.25
4佐藤 花子開発部180.710.68
5伊藤 直人経理部60.350.37
6松本 舞人事部2310.93
7田中 健一マーケティング部100.06
8加藤 陽子営業部130.570.56
9高橋 あすか経理部210.920.87
10斉藤 くみ子営業部100.06
11長谷川 聡太郎マーケティング部190.780.75
12橋本 健一人事部80.420.43
13小川 直子営業部190.780.75
14山下 京助マーケティング部50.210.25
15伊藤 康弘営業部160.640.62

PERCENTRANK.EXC 関数の最小値、最大値の基準については以下の通りです。

PERCENTRANK.EXC(”排他的”パーセンタイル)はデータセットの最小値と最大値をパーセンタイルの範囲から除外します。具体的には、最小値は1/(n+1)パーセンタイル、最大値はn/(n+1)パーセンタイルとして扱われます。ここでnはデータセットの要素数です。

この例で言うと、データの数は15なので、最小値のパーセンタイルは1/(15+1) = 0.06、最大値のパーセンタイルは15/(15+1) = 0.9375となります。そのため、最小値と最大値がそれぞれ0.06、0.93と表示されているわけです。

PERCENTRANK.EXCはデータの分布をより詳細に理解するのに有用なツールであり、特にデータが少ない場合や極端な値が存在する場合に役立ちます。その一方で、最大値と最小値が0%と100%に対応しないため、一部のユーザーには直感的でないかもしれません。それぞれの関数には特性があり、用途によって適切な関数を選択することが重要です。

コメント