全1754文字
PR

プロジェクト単位にデータラボを用意

 新たなデータ活用環境は、開発用の「データ分析基盤」と本番用の「データ活用基盤」という2段構えにしている。

 データ分析基盤では、データ分析プロジェクトごとに「データラボ」と呼ぶ領域を用意し、PoC(概念実証)やテストなどを行う。ラボで利用するデータベース(DB)は、プロジェクトごとに必要なデータをデータレイクからコピーして作る。コンピュートリソースについては、将来はコンテナ利用を見据えるが、現在はEC2を利用。CPUベースの汎用インスタンスと、GPUベースの高速コンピューティングインスタンスについて標準マシンイメージを用意し、これらをベースに開発環境を効率的に整える。

 データラボには、Oracle DatabaseやBI(ビジネスインテリジェンス)ツールのほか、プログラミング言語の「Python」や「R」の利用環境なども用意した。今後は、機械学習モデルの構築支援サービス「Amazon SageMaker」も利用する予定だ。

 データラボでは機能検証だけでなく、性能検証も行う。木村氏は「データ分析は試行錯誤の繰り返しなので、データサイエンティストは自由に分析したいと考える。でもデータ活用基盤は本番環境なので、機械学習モデルで何十時間も回し続けるような負荷の高いクエリーを流されては困る。品質を確かめたうえで本番移行している」と話す。

 データ活用基盤では、既に幾つかのアプリが本番稼働している。BIサーバー上の主なアプリとして営業に関わる指標や各種数字を可視化するダッシュボードがある。AIアプリとしては「保険請求の不正検知アプリ」や「電話音声から会話のカテゴリーを予測する業務支援アプリ」などが稼働している。

 「現在も数十個のプロジェクトがデータラボで走っている」と村野IT企画部長。データ分析基盤は、今後もさまざまなアプリを生み出しそうだ。