全4297文字

回帰分析の用語をマスターしよう

 回帰分析についてもう少し詳しく解説する前に、必要な用語を覚えておきましょう。先ほどの人材紹介会社の例で登場した式を思い出してください(図3)。

図3●先ほど人材紹介会社の例を参考に、回帰分析で使う用語を押さえよう
図3●先ほど人材紹介会社の例を参考に、回帰分析で使う用語を押さえよう
[画像のクリックで拡大表示]

 この式では、売り上げ金額は営業人数など式の右側にある数によってどう変化するかを「説明される」側の変数なので、「被説明変数」と呼びます。一方、営業人数は「説明する」側の変数なので、「説明変数」と呼びます。さらに、説明変数が被説明変数に及ぼす影響の大きさを表す係数を「回帰係数」と呼びます(これが直線の「傾き」に当たります)。今回の例では「営業人数が1人増えたら、平均的には回帰係数の分だけ売り上げが増加する」という意味になります。いずれも重要な用語なので、しっかり押さえておいてください。

複数の説明変数を使う重回帰分析ではより精密な予測が可能

 「ちょっと待って。売り上げ金額は営業人数だけで予測するのは不十分で、広告費や競合社数などもっと他に考慮すべき要因があるのでは?」と思った方は鋭いです。

 ここまで紹介してきた紹介した回帰分析は、説明変数が一つしかない「単回帰分析」と呼ばれる手法です。「分析対象が複雑で、たった一つの説明変数で予測するのは無理がある」場合は、複数の説明変数を使った「重回帰分析」と呼ばれる手法を採ります(図4)。

図4●単回帰分析と重回帰分析の違い
図4●単回帰分析と重回帰分析の違い
[画像のクリックで拡大表示]

 先ほどの人材紹介会社の例に戻り、各支店の売り上げ金額を説明する重回帰分析を作ってみましょう。今回の説明変数は以下のとおりです。

  • 営業人数
  • 広告費
  • 競合社数
  • 面談ブース(求職者と面談するためのブース)の数

 これらの説明変数を使って重回帰分析を実施すると、どのような結果が得られるでしょうか。重回帰分析では、それぞれの説明変数の「被説明変数に対する影響力(つまり回帰係数)」を求めます。次の図を見てください(図5)。

図5●複数の説明変数を使い、より精緻な予測をする重回帰分析
図5●複数の説明変数を使い、より精緻な予測をする重回帰分析
[画像のクリックで拡大表示]

 この図を式にすると、

売り上げ金額 = 200万円 × 営業人数
       + 120万円 × 広告費
       - 1000万円 × 競合社数
       - 20万円 × 面談ブースの数
       + 100万円

 ……となります。営業人数、広告費の説明変数は売り上げ金額にプラスになりますが、競合社数や面談ブースの数はマイナスの影響をもたらすという結果になりました。このように重回帰分析では複数の説明変数を使って、単回帰分析よりも精緻な予測ができます。