全3903文字
PR

人気を支えるもう1つの柱がデータ分析

 人気が沸騰したのはAIがきっかけだが、Python自体はあくまで汎用的な言語だ。データ分析で主要なプログラミング言語の一つになっているし、Webアプリケーション開発にも使われている。特にデータ分析はAIとともに現在のPython人気を支える要因となっている。

 データ分析もAIと同様に、オープンソースのライブラリーの豊富さが売りだ。数値計算の「NumPy(ナムパイ)」や「SciPy(サイパイ)」、表形式データの分析と処理を支援する「Pandas(パンダス)」、データをグラフ化する「matplotlib(マットプロットリブ)」の他、Webブラウザーを使って対話型でPythonコードを実行できるツール「Jupyter Notebook(ジュピター・ノートブック)」などがある。機械学習のscikit-learnもよく使われる。

 Pythonを使ったデータ分析や最適化を手掛けるビープラウドの斎藤努IT Consultantは「データ分析で注目されるようになったのは1995年に初版が開発されたNumPyがきっかけ。有償の数値計算ツール『MATLAB』に相当する計算ができ、実行速度が速く、かつ無料であるメリットに注目され、海外の大学の教員や学生を中心に利用が広がっていった」と話す。NumPyのユーザーが活用ノウハウを蓄積したり、新たなライブラリーを開発したりしてデータ分析でのPythonは存在感を高めていった。

 データ分析用途でのPythonのメリットは大きく2つある。一つはプログラミング言語もライブラリーもオープンソースであることだ。ブリヂストンの三枝幸夫Nest Lab.フェローは「面白いデータ分析ができると分かったとき、チームの他の人と簡単に共有できる。商用製品だとツールやライブラリーの購入にコストや時間がかかり、すぐに共有できない」と話す。

 もう一つは汎用的なプログラミング言語であるため、カバー範囲が広いことだ。データ分析で使われるプログラミング言語としてPythonと人気を二分する、オープンソースの言語「R(アール)」との比較でこの特徴が際立つ。

 ビープラウドの斎藤IT Consultantは「Rはデータ分析に特化している。Pythonは数理最適化や機械学習のライブラリーが充実していて、データ分析だけではなくデータの活用も一つの言語でカバーできる」と指摘する。

 Webアプリケーション開発では、オープンソースのWebアプリケーションフレームワークの「Django(ジャンゴ)」や「Flask(フラスク)」がある。プログラミング言語「Ruby(ルビー)」でいう「Ruby on Rails(ルビー・オン・レイルズ)」に相当するものだ。一般的にはDjangoが中大規模向け、Flaskが小規模向けとされる。

 フェイスブックが運営する写真SNS「Instagram(インスタグラム)」は、DjangoとPythonで構築されたWebサービスの代表例だ。日本の広報代理店を通じてコメントを求めたところ、フェイスブックは「Instagramは基本的に全てがPythonで実装されている。また、常にDjangoを使用している。時間をかけて調整してきたが、核となるのは現在もDjangoだ」と返答した。

課題は実行速度の遅さか

 AIやデータ分析に強みを持ち多くのエンジニアから支持を受けているPythonだが、もちろん万能ではない。例えば実行速度が遅い、Pythonを使った開発実務の経験者が少ないなどの課題が挙げられている。

 それでも今の人気ぶりを見ると、デメリットよりもメリットが大きく上回っていると言えるだろう。AIとデータ分析の活用はデジタル変革を推進する上で不可欠なだけに、Python人気は当面、上昇基調にありそうだ。