全4225文字

回答・解説

 正解はAです。この問題はデータの前処理として、どういう種類のデータにどのような処理をするかという問題です。

 (1)は多重共線性に関する問題です。問題文には、重回帰分析において互いにいくつかの変数を除外したとあります。互いに相関の大きい変数がある場合は多重共線性が疑われるため、このように変数を除外する処理を行います。そのため、(1)に当てはまる言葉は「大きい」です。

 (2)はデータの信頼性に関する問題です。事前に入力してもらった回答者情報と、後からそれを確認するような質問(ダミー質問)の回答が異なる場合は、回答者が矛盾した回答をしている可能性があります。こうしたデータは信頼性が高いとは言えないので、あらかじめ除外したうえで分析を実施します。そのため、(2)に当てはまる言葉は「ある」です。

 以上の(1)(2)を満たす選択肢はAとなります。

橋本 大佑(はしもと だいすけ)
データミックス データサイエンティスト
橋本 大佑(はしもと だいすけ) 北海道大学大学院農学院修了。大学院では統計学を専攻し、日本人の食生活の変化について研究。執筆した論文には、2018年度日本フードシステム学会大会で学会誌賞を受賞した「日本人の栄養素摂取バランスに関する時系列分析」がある。前職のデジタルデータソリューションでは、人事として採用や育成を担当。2020年5月にデータミックスに入社し、現在はデータサイエンティスト兼講師として法人研修やスクール事業に携わっている。