数学統計

ネイピア数

ネイピア数(Napier's constant)は、数学の様々な分野で重要な役割を果たす無理数です。記号 "e" で表されることが一般的であり、約 2...

続きを読む

外れ値

1. 序章:外れ値とは何か 外れ値とは、データセット内の他の値から大幅に離れた値のことを指します。たとえば、クラスのテストの点数が大半が70〜90点である中で、1つだけ10点のデ...

続きを読む

四分位数(しぶんいすう・Quartile)

「四分位数」は統計学における主要な概念で、データの分布を評価するための基本的な方法の一つです。「四分位数」はデータセットを四等分する3つの値(第1四分位数、第2四分位数(中央値)、...

続きを読む

構成比

「構成比」は全体に対する各部分の割合を示すもので、統計学で頻繁に使用されます。具体的には、全体を100%とした際の各部分のパーセントを示します。例えば、様々な商品の売上比率を調べる...

続きを読む

移動平均

「移動平均」は、時間を経て変化するデータセットでのパターンを理解するための有用なツールで、特に金融やマーケティング、予測モデリングなどの分野でよく使用されます。移動平均は一定の期間...

続きを読む

最頻値

「最頻値」は、統計学における重要な基本概念で、あるデータセットで最も頻繁に出現する値のことを指します。これは数値データだけでなく、カテゴリデータ(たとえば色やブランド名など)に対し...

続きを読む

増減数

「増減数」は、時間の経過とともにデータがどの程度増加または減少したかを示す数値です。これは一般的に経済学やビジネス分析、株価分析などでよく使われます。例えば、月ごとの売上データがあ...

続きを読む

増減率

「増減率」は、前の期間に比べて現在の値がどの程度増加または減少したかをパーセンテージで示す指標です。増減数が絶対的な変化を示すのに対し、増減率は相対的な変化を示します。経済学、ビジ...

続きを読む

相対度数

「相対度数」は、各データが全体に占める割合を表したもので、統計学において重要な概念です。具体的には、各データの度数(出現回数)を全データの度数の合計で割ったものが相対度数となります...

続きを読む

二項分布

二項分布の概要 二項分布は統計学における重要な概念で、二つの結果(成功または失敗、オンまたはオフなど)を持つ試行をn回繰り返したときの成功回数の確率分布を表します。これらの試行は...

続きを読む

ポアソン分布

ポアソン分布の概要 ポアソン分布は、ある特定の時間や空間内で一定の確率でランダムに発生する事象(例えば、ある時間内にサイトに訪れる人数や、ある面積内に生える木の数など)の確率を計...

続きを読む

指数分布

指数分布の概要 指数分布は確率論と統計学においてよく使われる確率分布の一つで、何らかの事象が一定の平均発生率でランダムに起こるとき、2つの事象の間の時間をモデル化します。一般的に...

続きを読む

中央値

「中央値」は統計学における基本的な位置指標の一つで、数値データを昇順または降順に並べた時に、中央に位置する値を指します。すなわち、データの「中央」を表す値です。中央値は、外れ値(特...

続きを読む

平均値

「平均値」は統計学における基本的な位置指標の一つで、データセット全体の総和をデータの数で割った値を指します。つまり、データの「平均」を表す値であり、一般的にデータの中心的な傾向を表...

続きを読む

標準偏差

標準偏差を関数で求める 「標準偏差」は、統計学における基本的な散布度を示す指標の一つで、データの値が平均値からどれだけ散らばっているかを示すものです。平均値がデータの「中心」を示...

続きを読む

標準化

「標準化」は、データの平均を0に、標準偏差を1に変換する処理を指します。これにより、データの「位置」を平均値で、データの「散らばり」を標準偏差で表すことができます。標準化されたデー...

続きを読む

季節調整

季節調整とは、季節性や周期性を持つ時系列データから、その季節性の影響を除去し、実質的なトレンドや変動を見るための手法です。これにより、例えば、暑い季節にアイスクリームの売上が増える...

続きを読む

移動分析

移動分析とは 「移動平均」または「rolling average」とは、統計学やデータ解析において一般的に使用される手法で、特定の期間にわたるデータセットの平均値を連続的に計算す...

続きを読む

レンジ(最大値-最小値)

レンジ:概要 統計学における「レンジ」(範囲)は、データセット内の最大値と最小値の差を指します。これはデータの分散度を示す最も基本的な指標の一つであり、データがどれだけ広がってい...

続きを読む

共分散(covariance)

共分散の概要 共分散(Covariance)は、統計学において2つの変数がどの程度一緒に動くかを測るための指標です。つまり、共分散は2つの変数間の関係性を量化するための手段となり...

続きを読む

信頼区間(Confidence Interval)

信頼区間(Confidence Interval)の概要 信頼区間(Confidence Interval)は、統計学において、母集団のパラメータ(平均や比率など)が存在すると推...

続きを読む

相関係数(correlation coefficient)

ピアソンの積率相関係数 相関係数にはいくつかあるのですが、通常は「ピアソンの積率相関係数」(Pearson product-moment correlation coeffici...

続きを読む

回帰分析(regression analysis)

回帰分析の概要 統計学における「回帰分析」は、変数間の関係を定量的に調査し、未来の予測や現象の理解に利用するための手法です。 具体的には、一つまたはそれ以上の変数(説明変数...

続きを読む

ラジアン(radian)

ラジアン(radian)は角度を測る単位で、円周上の長さが半径と等しい部分に相当する角度を1ラジアンと定義します。 角度の度数法と比較して、ラジアンは数学的な計算や理論に便利...

続きを読む

正弦(sine)

正弦の定義 正弦(sine)は三角関数の一つで、直角三角形における角の比率として定義されます。正弦の値は、ある角度(通常はラジアンで表現されますが、度数法でも表現できます)に対し...

続きを読む

正接(tangent)

正接の概要 「正接」(tangent)は、三角関数の一つであり、特定の角度における直角三角形の二つの辺の比を表します。具体的には、正接は直角をはさんだ二つの辺、すなわち「対辺」(...

続きを読む

余弦(cosine)

余弦(cosine)の概要 「余弦(cosine)」は三角関数の一つで、英語では "cosine" と表記します。三角関数は、直角三角形や円周上の点に関連する...

続きを読む

正割(secant)

三角関数には正弦(sin)、余弦(cos)、正接(tan)のほかにもいくつかの関数があり、その中の一つが「正割(Secant)」で、記号としては「sec」が使われます。 正割...

続きを読む

余割(cosecant)

「余割(cosecant)」は三角関数の一つで、正弦の逆数になります。つまり、ある角度における正弦の値がaである場合、その角度の余割の値は1/aになります。 たとえば、角度が...

続きを読む

余接(cotangent)

余接(cotangent)は、正接の逆数(あるいは、正弦の値を余弦の値で割った値)と定義されます。つまり、任意の角度 θ の余接は、その角度の正弦の値をその角度の余弦の値で割ったも...

続きを読む

近似曲線:線形近似

線形近似曲線の概要 「線形近似曲線」、または「最小二乗法による直線フィッティング」は、データのパターンを一本の直線で表現しようとする手法です。散布図上の各点からその直線までの垂直...

続きを読む

度数分布表

度数分布表の概要 「度数分布表」は、データがどの程度散らばっているか、またはどの程度集中しているかを視覚的に理解するための表です。これは、データの頻度(度数)を表示するためのもの...

続きを読む

質的変数と量的変数

質的変数 (Categorical Variables): 質的変数はカテゴリーまたはグループに基づいてデータを分類します。これらの変数は数値ではありますが、その数値は量や大きさを...

続きを読む

説明変数と目的変数

説明変数 (Explanatory Variables): 説明変数、または独立変数とも呼ばれます。これは分析の対象となる現象や状態に影響を与えると考えられる変数です。たとえば、生...

続きを読む

分散

「分散」の概要 統計学における「分散」は、データセットのばらつきや散らばり具合を数値で表現したものです。データの値が平均からどれだけ離れているか、つまりデータがどれほど分散してい...

続きを読む

歪度

「歪度(わいど)」の概要 統計学における「歪度」(skewness)は、確率分布やデータの分布がどれくらい非対称であるかを示す数値です。言い換えると、データが中央値を中心に左右ど...

続きを読む

尖度

「尖度(せんど)」の概要 「尖度」は、データ分布の鋭さ、あるいはピークの尖り具合を示す指標です。具体的には、確率変数の4次の中心モーメント(データの平均からの偏差の4乗の平均)を...

続きを読む

ヒストグラム

ヒストグラムの概要 ヒストグラムは統計学における重要な視覚化手法の一つで、大量の数値データがどのように分布しているかを視覚的に理解するのに役立ちます。ヒストグラムはバーチャートに...

続きを読む

ヒストグラムのビン/度数分布表の階級 の決め方(数と幅)

ビンと階級 ヒストグラムの「ビン」(あるいは「バケット」や「区間」)と度数分布表の「階級」は基本的に同じ概念を指します。どちらもデータを特定の範囲(またはクラス)に分類するための...

続きを読む

スタージェスの公式

スタージェスの公式の概要 スタージェスの公式は、データの分布を視覚化する際に最適なビン数(階級数)を推定するための公式です。この公式は k = 1 + 3.322 log(n) ...

続きを読む

パレート図

パレート図とは パレート図とは、品質管理やビジネス戦略の策定などで使用される視覚的な表現手段の一つです。これは、問題の原因や影響力を大きいものから順に表示し、最も重要な要素を特定...

続きを読む

折れ線グラフの特徴

どのシーンで折れ線グラフを使うべきか 「折れ線グラフ」は、データの連続的な変動を視覚化するためのグラフの一種です。時間の経過による値の変化(時間系列データ)を表現するのに特に適し...

続きを読む

散布図グラフの特徴

どのシーンで散布図グラフを使うべきか 散布図グラフは、二つの数値データセット間の関係性を視覚化するのに最も適しています。それぞれの点は一つの観察値を表し、一つの軸(通常はx軸)が...

続きを読む

確率密度

まずは「確率変数」の確認 まずはじめに「確率変数」について確認します。これは実験や調査、観察などによって得られる結果の数値化したものを指します。この確率変数には、「離散確率変数」...

続きを読む

累積分布

累積分布の概要と確率変数 「累積分布」は統計学において非常に重要な概念で、ある確率変数が特定の値以下となる確率を表しています。正確には、確率変数Xがx以下となる確率を表す関数を累...

続きを読む

幾何平均(相乗平均)

幾何平均とは 幾何平均は、数値が比率または積として表される場合、または数値が時間を通じて積み重ねて成長する場合に特に有用です。例えば、投資の年間リターンを計算する場合、各年のリタ...

続きを読む

調和平均

調和平均とは 調和平均(Harmonic Mean)は、一連の数値の逆数の算術平均の逆数として定義されます。これは各数値がある全体に対する「部分」や「割合」を表す場合、または数値...

続きを読む

トリム平均

トリム平均とは トリム平均(Trimmed Mean、 Truncated Mean、 または切り捨て平均)は、データの両端から一定の割合を切り捨てた残りのデータの平均を求める手...

続きを読む