全5020文字

回答・解説

 正解はA、B、C、Dすべてです。

 この問題では、Pythonで書かれたプログラムが行っている処理の内容を確認しています。A~Dについて、どんな処理をしているのか順番に見ていきましょう。

 セルA(A In〔1〕)では、ライブラリーをインポートしています。1行目と2行目はpandasライブラリーと、osライブラリーをそれぞれ読み込んでいます。3行目の「getcwd()」は現在のディレクトリー(カレント・ディレクトリーまたは作業ディレクトリー)を出力する関数です。

 セルB(B In〔2〕)では、ファイルの読み込みとデータの変換を実施しています。1行目でファイルの場所とファイル名を指定し、2行目でCSVファイルを読み込み、3行目でデータフレーム型に型を変換しています。4行目は先頭データ、5行目はデータの要素数、6行目はデータの次元数、7行目はデータの列名をそれぞれ「print()」関数で出力しています。

 セルC(C In〔3〕)では、データの要約統計量を確認しています。「df.describe()」関数を使えば、データ数、平均値、標準偏差、最大値、最小値などが出力されます。

 セルD(D In〔4〕)では「df.info()」関数で、各変数の欠損値ではない有効な値の数と、データ型の確認をしています。

 以上から、A~Dいずれも適切な処理をしていると分かりますので、4種類の選択肢すべてを挙げるのが正解となります。

橋本 大佑(はしもと だいすけ)
データミックス データサイエンティスト
橋本 大佑(はしもと だいすけ) 北海道大学大学院農学院修了。大学院では統計学を専攻し、日本人の食生活の変化について研究。執筆した論文には、2018年度日本フードシステム学会大会で学会誌賞を受賞した「日本人の栄養素摂取バランスに関する時系列分析」がある。前職のデジタルデータソリューションでは、人事として採用や育成を担当。2020年5月にデータミックスに入社し、現在はデータサイエンティスト兼講師として法人研修やスクール事業に携わっている。