全4297文字

解答・解説

 この問題に解答するには、まず「不動産価格を予測する際の土地面積の影響」を考える必要があります。ビジネスの常識の観点からは、土地面積が広くなればなるほど不動産価格も上昇すると考えるのが普通です。つまり、「土地面積」という説明変数の回帰係数は正の値(符号はプラス)になるはずです。しかし、実際に推定された回帰係数は負の値(符号はマイナス)だったため、多重共線性の問題が疑われます。つまり1つの重回帰分析の中に相関の強い複数の説明変数が含まれ、回帰係数の「取り合い」が起きている可能性が高いのです。

 この場合、どの説明変数が多重共線性を起こしているのか確認するため、「土地面積」と相関が大きい、その他の説明変数を探します。「土地面積」と回帰係数の「取り合い」をしている相手方の説明変数を見つけようというアイデアです。選択肢A~Dの中で、このアイデアを実施しているDが正解となります。

 その他の選択肢がなぜ不正解なのかも見ておきましょう。Aでは土地面積の単位の問題を疑っていますが、単位は回帰係数の正負には影響を与えません。よってAは間違いです。

 Bはキーワードだけ見るといかにも正解のようですが、よく読めば間違いだとわかります。Bはあくまで「土地面積」以外の説明変数と、被説明変数である「不動産価格」との相関関係についての言及です。これは「土地面積」と関係ないので、間違いです。

 Cでは「不動産価格」を被説明変数、「土地面積」を説明変数とした単回帰モデルを作り、回帰係数を確認しています。しかし、これで分かるのは「不動産価格」と「土地面積」の相関関係だけです。「土地面積」が負の値になっている問題は解決できませんので、Cも間違いです。

堅田 洋資
データミックス 代表取締役社長/データサイエンティスト
堅田 洋資 University of San Francisco, M.S. in Analytics修了、一橋大学商学部卒業(統計学・データサイエンス専攻)。日本では数少ない米国大学のデータサイエンス修士号を保有。前職の白ヤギコーポレーションにて、社内のデータはもちろんクライアントのデータ分析を支援するコンサルタントとして活躍。これまで機械学習を用いたレコメンデーション、アプリユーザーの行動分析や機械学習を用いたプッシュ通知の最適化、交通系IoTのデータ分析、数理最適化などを担当。白ヤギコーポレーション参画前は、監査法人トーマツにてデータ分析コンサルタント、生体センサースタートアップでサービス・アルゴリズム開発の取締役、KPMG FASにて事業再生コンサルタント、外資系メーカーでの経理・マーケティングなど幅広い経験を持つ。