全2731文字
PR

 マテリアルズ・インフォマティクス(MI)に取り組む日本の大手化学メーカーが、MI用の「データ・マネジメント・プラットフォーム(DMP)」の整備を急いでいる。MI用のDMPとは、社内で行った実験のデータなどを、機械学習モデルの開発に活用できる形で保存・蓄積するソフトウエアプラットフォームのことである。

 人工知能(AI)を活用して材料開発の効率を高めるMIの成否は、精度の高い機械学習モデルを開発できるか否かにかかっている。そのためには教師データとして、大量の実験データが必要だ。しかし本特集の第1回で見てきたように、多くの日本メーカーはこれまで実験データをあまり蓄積してこなかった。

 そこで現在、MIに取り組む日本のメーカーがDMPの整備を急いでいる。DMPを情報システム的な観点で説明すると、実験結果など数値化されたデータを蓄積するデータベース(DB)と、論文や実験ノートといった非構造化データを蓄積して検索可能にした検索エンジンを組み合わせたシステムである。

マテリアルズ・インフォマティクス(MI)用データ・マネジメント・プラットフォームの概念図
マテリアルズ・インフォマティクス(MI)用データ・マネジメント・プラットフォームの概念図
[画像のクリックで拡大表示]

 例えば旭化成は、過去の実験データに加えて、社内・社外から収集した論文や特許文書、製品カタログなどの技術文書、過去の実験ノートなどをDMPに蓄積して、必要に応じて検索、抽出できるようにしている。

 これに加えて旭化成は、DMPに蓄積した実験データを使って機械学習モデルを開発するためのツールである「IFX-Hub」も整備し、社内の研究者がWebブラウザーなどを使って材料候補のAIによる絞り込みなどを実行できるようにしている。

人間が読む実験ノートを構造化データに

 もちろん実験データをただ蓄積するだけでは、機械学習モデルの開発などに活用できない。コンピューターが実験の内容を理解できるよう、構造化して蓄積する必要がある。

 量子コンピューターを使った化学実験シミュレーションの手法やMI用のDMPなどを開発するスタートアップ、QunaSysの松岡智代COO(最高執行責任者)は実験データの構造化を「料理のレシピをコンピューターが理解できるよう変換するようなものだ」と例える。

データを構造化するイメージ
データを構造化するイメージ
[画像のクリックで拡大表示]

 日本メーカーの研究者はこれまで、実験の手順や結果を実験ノートに記録してきた。人間が読むことを想定して記述された実験ノートはいわば、料理のレシピのようなものだ。これをコンピューターが理解できるよう、作業の手順を分解したり、材料の名称や単位を統一したりした上で、表形式のデータに整理してやる必要がある。

 これまでは同一企業内でも部署などによって、実験で使用する物質の呼び方が違ったり、使用する単位が違ったりしていた。旭化成が構築したDMPはそうした様式や用語の違いを変換・吸収する辞書機能なども備えている。