全5507文字
PR

 では、VSCode上で実行してみましょう。まず、Jupyterの動作環境(カーネル)を設定します。画面の右上で、Anacondaのベースの環境を選びます。ここでは「base (Python 3.9.7)」を指定します。カーネルの設定が完了したら、セルの左側にある実行ボタンか、ショートカットキーの[Ctrl]+[Alt]+[Enter]を押します。すると、このセルのコードを実行できます。

 実行結果は、セルのすぐ下に表示されます(図14)。変数dataの先頭5行が、表形式で現れました。データは0行目から始まっています。そして0行目の上には、0から始まる番号が書かれた灰色の行があります。これはDataFrameのカラム名(列名)です。リスト1で「header=None」を指定したので、ここでは列名ではなくて列番号が表示されています。あとで、0〜2行目の列名のデータを、DataFrameのカラム名に設定する方法を説明します。

図14●リスト1の実行結果がセルのすぐ下に表示された
図14●リスト1の実行結果がセルのすぐ下に表示された
[画像のクリックで拡大表示]

 では、このデータの先頭5行だけでなく、全体を確認してみます。VSCodeのJupyterには、このデータ全体をVSCode上で表示する「Data Viewer」という機能があります。Data Viewerを使ってみましょう。図14の画面右上の「Variables」というボタンを押すと、VSCodeの画面下部にパネルが現れます。ここでもう一度、先ほど入力したセルの実行ボタンを押します。すると、DataFrame形式の変数名である「data」が表示されました(図15)。この画面には、コードで使用している変数名の一覧が表示されます。変数名の左のアイコンを押すと、「Data Viewer」というタブが開きます。このタブに、変数dataの中身が、表形式ですべて表示されました(図16)。

図15●VSCodeの画面下部のパネルに「JUPYTER: VARIABLES」が表示される
図15●VSCodeの画面下部のパネルに「JUPYTER: VARIABLES」が表示される
[画像のクリックで拡大表示]
図16●「Data Viewer」のタブが開き、変数dataのデータ構造が表形式で表示された
図16●「Data Viewer」のタブが開き、変数dataのデータ構造が表形式で表示された
[画像のクリックで拡大表示]

 0〜2行目が列名のデータです。3行目が全国のデータで、4〜52行目が都道府県別のデータです。そして53〜73行目が東京都特別区と政令指定都市別のデータになっています。これで、正しくCSVファイルがDataFrame形式になったことが確認できました。

 Data Viewerは、変数の中身を確認できます。プログラムの実行後すぐに、DataFrameのような行と列の構造のデータの中身を確認できるので、とても便利です。各列の値を検索したり、並べ替えたりできます。VSCodeのタブはドラッグ&ドロップで画面分割することができるので、ノートブックとData Viewerを左右に並べるなど、自分が見やすい画面の配置にカスタマイズしてみてください(図17)。

図17●ノートブックと「Data Viewer」の画面を並べて使う
図17●ノートブックと「Data Viewer」の画面を並べて使う
[画像のクリックで拡大表示]