ichou1のブログ

主に音声認識、時々、データ分析のことを書く

統計学における変量と変数の違い

「RとS-PLUSによる多変量解析」という本を読んだ時のメモ。

以下、重回帰分析に関するくだりを引用。
書籍では、二行目は「この手法は、従属変数と複数の説明変数の間の関係を探るために使われる」という記載であるが、「従属変数」を「目的変数」に書き換えた

重回帰分析は、単線形回帰モデルを一般化し、説明変数を二つ以上に拡張したモデルである。
この手法は、目的変数と複数の説明変数の間の関係を探るために使われる。
(中略)
ここで特に注意が必要なのは、説明変数は厳密に言うとまったくランダムな変数とは見なされないことであり、従って重回帰分析は、本質的には目的変数のみをランダム変数とする単変量の解析技術であることである。
そこでこの技術を、本来の多変量の分析手順と区別するため、多変数解析と呼ぶことがある。

「変量」というのは、「ランダムな変動を伴う変数」のこと。

統計学は、観測値からモデルを導き出すものであった。
その観測値が不確定な偶然現象(ランダムな現象)によるものであれば、それは「変量」と呼ぶ。
「変量」でなければ何なのか。さらに引用。

説明変数は厳密には定数と仮定されている
すなわち、それらはランダム変数と見なされない。
ただし現実には、その仮定が満たされるのはまれであり、重回帰分析の結果は、説明変数の観測値に条件付けられていると解釈される。

厳密には「定数」としての扱いになるようだが、実際には、「変数」の扱いでよさそう。
「重回帰分析」は「単変量多変数解析」にあたるということになる。

「変数」同士の関係性についても、意識して使い分けるようにする必要がある。

  • 条件付けられる(因果関係がある)
  • 相関がある

もう一度、同じ箇所を引用。

重回帰分析は、単線形回帰モデルを一般化し、説明変数を二つ以上に拡張したモデルである。
この手法は、目的変数と複数の説明変数の間の関係を探るために使われる。
(中略)
重回帰分析の結果は、説明変数の観測値に条件付けられていると解釈される。




最後に英語での表記も書いておく。

  • 変量(variate)
  • 変数(variable)

「variate」と出てきたら、意図して使い分けているのか注意が必要。