1. サンプリングとは?
サンプリングとは、大きなデータセットからランダムに一部のデータを抽出することを指します。この一部を「サンプル」といい、全体のデータを「母集団」と呼びます。Excelの分析ツールには、このサンプリングを手軽に行うための「サンプリング」ツールが用意されています。
2. Excelの「サンプリング」ツールの使い方
Excelの「サンプリング」ツールは、「データ」タブの「分析」グループにある「データ分析」をクリックすると表示される「データ分析」ダイアログボックスから選択できます。
- 入力範囲: まず、サンプリングを行いたいデータ範囲を選択します。
- ラベル: ラベルが含まれている場合は、このチェックボックスをオンにします。
- 標本の採取方法: 「周期変化」または「ランダム」を選択します。周期変化は一定の間隔でデータを抽出し、ランダムはランダムにデータを抽出します。
- 周期(周期変化の場合): 抽出するデータの間隔を指定します。例えば、周期を6に設定すると、6行ごとにデータが選ばれます(半年ごとなど)。
- データの個数(ランダムの場合): 抽出するデータの個数を指定します。
3. 「サンプリング」ツールの注意点
以下に、「サンプリング」ツールを使う際の注意点をいくつか挙げてみます。
- 数値データのみを処理します: 「サンプリング」ツールは数値データのみを処理します。数値以外のデータが含まれている場合、前処理を行って数値に変換する必要があります。
- 1つの列または行のデータのみを処理します: 「ラベル」オプションを使用している場合、1つの列または行のデータのみを処理します。複数の列または行のデータを一度に処理することはできません。
- 同じデータが選択される可能性があります: 「ランダム」抽出を選択した場合、同じデータが複数回選択されることがあります。これは「復元抽出」と呼ばれ、一部の統計分析では重要な特性となります。
- 抽出されるサンプルの数を適切に設定する: ランダムサンプリングを行う場合、抽出するサンプルの数を適切に設定することが重要です。抽出するサンプルの数が少なすぎると、結果として得られる統計値が元のデータを正確に反映しない可能性があります。一方、サンプル数が多すぎると、サンプリングの意味がなくなり、計算コストが増大します。
4.実習用データ
Excelへ下記の表をコピーし、B列のデータを使ってサンプリングを実施してみましょう。適当な数を抜き出してみましょう。
受験番号 | スコア |
---|---|
1 | 72 |
2 | 73 |
3 | 57 |
4 | 72 |
5 | 73 |
6 | 62 |
7 | 59 |
8 | 56 |
9 | 54 |
10 | 60 |
11 | 55 |
12 | 62 |
13 | 68 |
14 | 56 |
15 | 85 |
16 | 59 |
17 | 62 |
18 | 75 |
19 | 62 |
20 | 72 |
21 | 61 |
22 | 57 |
23 | 56 |
24 | 58 |
25 | 74 |
26 | 59 |
27 | 75 |
28 | 69 |
29 | 72 |
30 | 45 |
31 | 43 |
32 | 76 |
33 | 78 |
34 | 77 |
35 | 45 |
36 | 59 |
37 | 60 |
38 | 35 |
39 | 58 |
40 | 74 |
41 | 72 |
42 | 73 |
43 | 80 |
44 | 61 |
45 | 46 |
46 | 66 |
47 | 66 |
48 | 46 |
49 | 67 |
50 | 60 |
51 | 47 |
52 | 43 |
53 | 72 |
54 | 75 |
55 | 73 |
56 | 69 |
57 | 57 |
58 | 83 |
59 | 80 |
60 | 64 |
61 | 68 |
62 | 50 |
63 | 51 |
64 | 75 |
65 | 53 |
66 | 63 |
67 | 60 |
68 | 60 |
69 | 67 |
70 | 76 |
71 | 45 |
72 | 59 |
73 | 32 |
74 | 77 |
75 | 47 |
76 | 59 |
77 | 71 |
78 | 52 |
79 | 59 |
80 | 95 |
81 | 82 |
82 | 44 |
83 | 63 |
84 | 76 |
85 | 71 |
86 | 56 |
87 | 59 |
88 | 89 |
89 | 68 |
90 | 61 |
91 | 49 |
92 | 89 |
93 | 70 |
94 | 54 |
95 | 60 |
96 | 72 |
97 | 67 |
98 | 91 |
99 | 50 |
100 | 60 |