質的変数と量的変数

質的変数 (Categorical Variables): 質的変数はカテゴリーまたはグループに基づいてデータを分類します。これらの変数は数値ではありますが、その数値は量や大きさを表しているわけではなく、あくまでカテゴリーを区別するためのラベルとして機能します。例えば、「男性/女性」、「満足/不満」、「赤/青/緑」などの属性が質的変数の例です。また、質的変数はさらに名義尺度と順序尺度に分類されます。名義尺度は単にカテゴリーを区別するだけのもので(例えば性別)、順序尺度はカテゴリー間に順序またはランキングが存在するもの(例えば「良好/普通/悪い」)です。

量的変数 (Quantitative Variables): 量的変数は数値で表現され、その数値は実際の量や大きさを表します。この種類の変数を用いれば、比較、加算、減算などの算術操作が可能となります。例えば、人の年齢、身長、体重、テストスコアなどはすべて量的変数です。また、量的変数はさらに間隔尺度と比例尺度に分けられます。間隔尺度はゼロ点が任意のもの(例えば温度)、比例尺度は絶対的なゼロ点を持つもの(例えば距離、体重)です。

質的変数と量的変数の違いは、質的変数が「何であるか」を表し(例えば、ある人が男性であるか女性であるか)、量的変数が「どれだけあるか」を表す(例えば、ある人が何歳であるか)という点にあります。これらの変数の種類を理解しておくと、データ分析の際にどのような分析手法が適切かを判断するのに役立ちます。たとえば、質的変数には頻度表や棒グラフを、量的変数にはヒストグラムや箱ひげ図を用いることが多いです。