度数分布表の概要
「度数分布表」は、データがどの程度散らばっているか、またはどの程度集中しているかを視覚的に理解するための表です。これは、データの頻度(度数)を表示するためのもので、データの値の範囲(階級)ごとにデータの数(度数)を数え、その結果を表にまとめたものです。
度数分布表の作り方は以下の通りです:
- データの範囲を決める: データの最小値と最大値を見つけ、その範囲を定めます。
- 階級を設定する: データの範囲をいくつかの等間隔の範囲(これを階級と言います)に分割します。一般的には、階級の数(つまり分割する範囲の数)は5から20の間で、階級の幅はデータの範囲と階級の数から決定します。
- 度数を計算する: 各階級に属するデータの数(度数)を数えます。
- 度数分布表を作成する: これらの情報(階級と度数)を表にまとめます。
度数分布表を作成することで、データの分布状態を把握することができます。例えば、データがどの範囲に最も集中しているか、あるいはどの範囲にデータがまばらに分布しているかなど、データ全体の傾向を視覚的に理解することが可能となります。
度数分布表は、データ分析の初期段階でデータの概要を把握するために用いられます。また、度数分布表はヒストグラムの作成の基礎ともなります。ヒストグラムは度数分布表をグラフにしたもので、データの分布を視覚的に表現します。
実習:エクセルで度数分布表を作成しよう(概要)
度数分布表を作成するためのサンプルデータとして、学生のテストのスコアを用意しました。このデータは20人の学生のスコアで、スコアは0から100の間で分布しています。このデータをセルA1:A21へセットしておきましょう。
スコア |
---|
65 |
88 |
90 |
45 |
70 |
75 |
55 |
100 |
68 |
75 |
82 |
91 |
66 |
70 |
58 |
65 |
90 |
72 |
81 |
75 |
上記のデータが提供できる範囲内で、各スコア範囲(例えば、60-70、70-80、80-90、90-100など)に属する学生の数(度数)を計算して、その結果を度数分布表として表現します。
このような度数分布表は、データの分布、特に集中する領域や散らばり具合を視覚的に理解するために役立ちます。また、テストのスコア分布を理解することで、全体的な学生のパフォーマンスを評価するための基礎情報を提供します。
次にエクセルで度数分布表を作る方法を解説します:
- データを整列させる:まずデータを昇順または降順に並べ替えます。これは「データ」メニューから「並べ替え」を選択することで可能です。ただし並べ替えをしなくても度数分布表は作成可能です。並べ替えをしておくとおおよそのデータの集まり具合がわかりやすくなります。
- 階級範囲を決める:スコアの最小値と最大値を見つけ、それを基に階級の範囲を決定します。ここでは、スコアは0から100なので、例えば10点ごとに階級を設定します。つまり、0-10、10-20、20-30、…、90-100とします。
- 度数を計算する:次に、各階級に該当するスコアを持つ学生の数を数えます。これはエクセルの「COUNTIFS」関数を使用することで可能です。
- 度数分布表を作る:階級とその度数を表にまとめます。表の左列に階級を、右列にそれぞれの階級の度数を入力します。これが度数分布表です。
以上がエクセルで度数分布表を作成するための基本的な手順です。この手順を元に実際に練習してみてください。
実習:エクセルで度数分布表を作成しよう(詳細手順)
- データのスコアをセルA1:A21に入力します。
- 度数分布表の「最小値」をセルC2からC11まで入力します。最小値は各階級の最低値です。この場合、最初の階級は0.0、次の階級は10.1、その次の階級は20.1、という具体的には以下のように入力します:
最小値 0.0 10.1 20.1 30.1 40.1 50.1 60.1 70.1 80.1 90.1 - 「最大値」をセルD2からD11まで入力します。最大値は各階級の最高値で、以下のように入力します:
最大値 10 20 30 40 50 60 70 80 90 100 - 「度数」をセルE2からE11まで計算します。度数は各階級に属するスコアの個数です。これを求めるには、ExcelのCOUNTIFS関数を用います。COUNTIFS関数は、複数の条件を満たすセルの数をカウントします。この場合、スコアが各階級の最小値以上かつ最大値以下のものをカウントします。具体的には、E2に以下の式を入力し、それをE3からE11までコピーします:
E2: =COUNTIFS($A$2:$A$21,">="&C2,$A$2:$A$21,"<="&D2)
- 「累積度数」をセルF2からF11まで計算します。累積度数は、各階級までの度数の累計です。これを求めるには、ExcelのSUM関数を用います。具体的には、F2に以下の式を入力し、それをF3からF11までコピーします:
F2: =SUM($E$2:E2)
- 「相対度数」をセルG2からG11まで計算します。相対度数は、各階級の度数が全体に占める割合(パーセンテージ)です。これを求めるには、各階級の度数を全体の度数(つまり全スコアの個数)で割り、それを100倍します。具体的には、G2に以下の式を入力し、それをG3からG11までコピーします:
G2: =E2/COUNT($A$2:$A$21)*100
- 完成図は以下の通りです(C1:G11、EFG列は上記の計算式)。
最小値 最大値 度数 累積度数 相対度数 0.0 10 0 0 0.0% 10.1 20 0 0 0.0% 20.1 30 0 0 0.0% 30.1 40 0 0 0.0% 40.1 50 1 1 5.0% 50.1 60 2 3 10.0% 60.1 70 6 9 30.0% 70.1 80 4 13 20.0% 80.1 90 5 18 25.0% 90.1 100 2 20 10.0%
以上が、Excelで度数分布表を作成する手順です。これにより、スコアの分布を視覚的に理解しやすくなります。