全1836文字
PR

人工知能(AI)の開発に重要な役割を果たすのが「データ」だ。注目のプログラミング言語「Python」と開発環境「Visual Studio Code(VSCode)」を使ってデータの加工や分析を行う方法を解説する。

【応用編】コードを整理する

 データ分析の作業でJupyterを使うと、一部のコードを何度も修正して試したり、途中にコードを追加して実行したりできるので、とても便利です。一方、あとで改めて実行し直そうとしたときに、無駄なコードが残ったままで、実行に時間がかかってしまうこともあります。

 この問題を助けてくれる、VSCodeのJupyter用拡張機能である「Gather」を紹介します。

拡張機能「Gather」

 Gatherは、ボタン1つでノートブックのセルの実行結果を解析します。そして、その実行結果を出すのに必要なコードだけを集めて新しいノートブックにコピーします。つまり、散らかったコードをまとめてくれるのです。試してみましょう。拡張機能アイコンから「Gather」を検索し、インストールしてください。

 インストールが終わったら、ここまでのデータ分析で使ったノートブックの続きにセルを追加し、リスト7を記述します。これは、先ほど出力した「demographics.csv」を読み込み、出生数でソートをかけて、横向きの棒グラフを描画するコードです。セルを実行したあとの画面を図27に示します。セルの左上に「Gather code」というアイコンが増えています。このアイコンを押すと、新しいノートブックが開き、3つのセルが表示されました(図28)。3つのセルにはそれぞれ、リスト1とリスト5とリスト7のコードの一部が入力されています。図27のグラフを表示するのに必要なコードだけが集められたのです。

リスト7●「demographics.csv」を読み込み、データをソートして横向きのグラフを描画するコード
リスト7●「demographics.csv」を読み込み、データをソートして横向きのグラフを描画するコード
[画像のクリックで拡大表示]
図27●リスト7を実行した画面
図27●リスト7を実行した画面
[画像のクリックで拡大表示]
図28●「Gather」でリスト7の実行結果に必要なコードが自動で集まった
図28●「Gather」でリスト7の実行結果に必要なコードが自動で集まった
[画像のクリックで拡大表示]

 このノートブックをdemographics.csvと同じフォルダーに保存し、実行ボタンを押すと、図27の実行結果のグラフと同じ実行結果が表示されました。

 対応しているPythonモジュールは限られるようですが、ごちゃごちゃになったノートブックを整理するのに便利な拡張機能です。


 実際のオープンデータを取り扱いながら、Pythonでデータ分析をする際に便利なVSCodeの拡張機能を紹介しました。本稿を読んで何か得られることがありましたら、これ以上の喜びはありません。