統計学における変量と変数の違い

「RとS-PLUSによる多変量解析」という本を読んだ時のメモ。

以下、重回帰分析に関するくだりを引用。

重回帰分析は、単線形回帰モデルを一般化し、説明変数を二つ以上に拡張したモデルである。
この手法は、従属変数と複数の説明変数の間の関係を探るために使われる。
(中略)
ここで特に注意が必要なのは、説明変数は厳密に言うとまったくランダムな変数とは見なされないことであり、従って重回帰分析は、本質的には目的変数のみをランダム変数とする単変量の解析技術であることである。
そこでこの技術を、本来の多変量の分析手順と区別するため、多変数解析と呼ぶことがある。

「変量」というのは、「ランダムな変動を伴う変数」のこと。

統計学は、観測値からモデルを導き出すものであった。その観測値が不確定な偶然現象(ランダムな現象)によるものであれば、それは「変量」と呼ぶ。

英語での表記も書いておく。

  • 変量(variate)
  • 変数(variable)


同じように、変量の関係性についても、意識して使い分けるようにする。

  • 相関がある
  • 条件付けられる(因果関係がある)

説明変数は厳密には定数と仮定されている。すなわち、それらはランダム変数と見なされない。
ただし現実には、その仮定が満たされるのはまれであり、重回帰分析の結果は、説明変数の観測値に条件付けられていると解釈される。