わずか20回の実験で最適解を発見
住友化学の中で、最も成功した材料開発の事例を教えてください。
木全氏:耐熱性ポリマー(共重合体)の開発があります。モノマー種が13種ある中で、共重合体のモノマー組成比(量比)を最適化するのですが、その組み合わせがざっと100万通りもありました。この中から目標とする特性にミートするモノマー組成比を探すのですが、100万通りの実験を行うのは到底無理。
そこで、機械学習の一手法であり、説明変数の最適化に効果を発揮する「ベイズ最適化(Bayesian optimization)」を使ったMIを導入しました。これにより、組み合わせの中から良さそうなものをMIで見繕った上で、実際に実験(合成)して評価するというサイクルを回しました。その結果、わずか4サイクル目で望む特性を持つ共重合体を発見できたのです。実験回数は10~20件程度。すなわち、100万分の10~20の確率で効率的に素早く最適解を見つけたというわけです。
金子氏:しかも、この開発で面白かったのが、最後にうまくいったのが、研究者が思ってもみない組み合わせと量の配合だったことです。「え? まさかこれなの」と。これまで研究者たちが培ってきた実験による当たり外れの勘所から外れたものをMIが提案してきた。それを半信半疑ながら実験してみたら、うまくいったのです。
MIの利点を存分に引き出せた開発事例というわけですね。
金子氏:その通りです。MIの利点は大きく2つあります。1つは、実験回数を減らし、残りをデータ駆動で埋められるので、より早く最適解にたどり着けることです。要は、開発時間の短縮を図れます。
もう1つは、未知の領域に飛び込めるチャンスを与えてくれることです。多くの人がそうであるように、研究者も過去の実験や知見などから構築した思考領域を持っており、基本的にその範囲内でしか考えが及びません。自分が持つ思考領域から外れた所にあるアイデアは、なかなか思い浮かばないものです。これに対し、MIを使うと、狭い思考領域から解き放たれて未知の新しい領域を切り開ける可能性があるのです。つまり、研究者の想像を超えた最適解にたどり着くことができ、従来にない画期的な材料を生み出せるチャンスがあるというのが、MIのもう1つの利点なのです。
西野氏:開発時間の短縮という点では、初心者がMIを使うと、入社5年程度の中堅クラスと同水準の開発ができそうだという指標も得られています。データの扱い方さえ教えれば、初心者でも即戦力になり得るのです。
MIの威力を感じます。しかし、初心者でも即戦力になる可能性があるということは、みんながMIを使って材料開発を行うようになると、企業間で差が付かなくなるのではありませんか?
木全氏:その問いについては考えが分かれると思います。私は、ある領域においては、恐らくそれが現実になるのではないかと考えています。例えば、既にある製品が出来上がっていて、顧客のちょっとしたニーズやトラブルシューティングなどを行うテクニカルサービスの領域です。ここは比較的軽微なチューニングで済む領域なので、ベテランが勘で対応しているのであれば、若手社員や、もっと極端に言えば事務系の社員でも対応できるようになるかもしれません。客先で問題が生じたので、ちょっと材料組成を変えて提案するといった業務は、そのうち営業担当者でも対応可能になるかもしれない。
金子氏:過去のデータが全てそろっている中から最適解を探す作業は、MIは得意中の得意です。開発の経験がない人でも、機械学習的に最適解を提案できます。
材料メーカーの優位性は消えない
そんなことになれば、そのうち材料メーカーは競争力を失ってしまうのでは?
木全氏:いや、MIで差が付かなくなる可能性があると言ったのは、あくまでも既に存在する材料の中のちょっとした改良の領域にすぎません。材料開発に必要なツールはMIだけではありません。研究者は理論科学と実験科学、そして計算科学という3つのツールをこれまで使いこなしてきました。こうしてそろった4つのツールのうち、今は比較的新しいMIに注目が集まっています。しかし、MIだけでは本当の意味で新しい材料を生み出すことはできないのです。
材料開発では、実験で集めたデータをシミュレーションで増幅し、データ科学(MI)を使って次の実験範囲を囲い込んで、新しい材料を発見していきます。このうち、現在は最も良さそうな範囲に効率よく絞り込む作業にMIを使っています。しかし、こうして良さそうな範囲を見つけたとしても、それが本当に良いものかどうかは、理論科学によって原理・原則を理解していないと判断できません。すなわち、理論科学と実験科学、計算科学、そしてMIの4つがうまくリンクしてサイクルを回す開発をしないと、新しい材料を生み出すことはできないのです。
これら4つのうち、MIは先述の通り事務系社員でも対応が可能かもしれません。しかし、残りの3つは研究者でなければ不可能です。むしろ、4つのツールを身に付けて開発のサイクルを回せない研究者は、研究者とは呼べない時代がやってくる。その意味では今後、研究者の真価が問われることになるでしょう。
金子氏:顧客が望むのは常に新しいもの、すなわちデータベースの外側にある要求です。その要求が、データベースからちょっとだけ外れたものであれば、内側のデータを使ってMIで立てた予測式でも解を出せます。しかし、ずば抜けて違う要求にはやはり解を出せないのです。このときは理論科学で原理・原則に基づく判断が必要になる。我々は今、MIを社内で推進していますが、理論科学を軽視するようなことはありません。
MIはあくまでも材料開発のツールの1つというわけですね。MIがあれば、これまで培ってきた材料開発の知識や技術、ノウハウが不要になるというわけでないと。
木全氏:その通りです。MIは効率化や高速化のためのツールにすぎません。よくデータ人材の確保が大変だなどと言われますが、例えばフィンテックとMIとではデータサイエンティストに求められる質が全然違います。MIのデータサイエンティストは、基本的に材料の専門知識を持っていないと全く仕事になりません。
当社でもMIの導入初期の段階で、有機化学の知識のない人間にMIを使って分子構造を出してもらったことがあります。すると、炭素の結合の手が5個あるものを出してきた。しかも、本人は大真面目。笑い話のようですが、本当の話です。材料の専門知識が必要という点で、MIのデータサイエンティストは人材確保や育成の点で、経済分野や画像解析などのデータサイエンティストとは異なる難しさがあるのです。従って、情報系学科を出た人がMIの分野に飛び込んですぐに活躍できるかというと、恐らく難しいと思います。
金子氏:理論科学が分かっており、なおかつインフォマティクスができる人でなければ、当社のデータサイエンティストとしては活躍できません。従って、化学や物理を大学課程で履修してアカデミックな知識を持つ人材を当社は採用していきます。