今や大人気のスクリプト言語「Python」は、PC内の処理はもちろんインターネットやクラウドとの親和性も高いという特徴を持つ。Pythonを使ってExcelファイルの変換などPC内で完結する処理から、クラウドを活用した各種自動化処理まで便利なスクリプトの数々を紹介する。
テキストファイルは、最も基本的でありながら、汎用的でさまざまなデータの基本となるフォーマットと言えます。本特集で扱うスクリプトのソースコード、HTMLやCSS、JSONやXML、CSVなどのデータファイル、文書記述に使うマークダウンもテキスト形式を基本としています。
ここでは、指定フォルダー以下にある大量のマークダウン形式のテキストファイル(拡張子".md")を正規表現で置換するPythonスクリプト「replace.py」を作りました(図1)。「2022/11/22」のような日付の表記形式を「2022年11月22日」のような年月日表記の形式に置換します。
こうしたテキストの置換で役に立つのが「正規表現」です。正規表現はファイル検索などに使う「ワイルドカード」をもっと強力にしたもので、文字列のパターンを記述して文字列を検索したり置換したりできます。今ではテキストエディタの他、大抵のプログラミング言語にも標準ライブラリとして搭載されています。もちろん、Pythonでも利用できます。