全3009文字
PR

少ないデータで人間にも解釈可能なアウトプット

 AIと人間の関わりという文脈では近年「説明可能AI」が注目されている。深層学習(ディープラーニング)では解析過程がブラックボックス化されるため、なぜそうなったのかを説明できないことが多い。こうした課題を解決するべく、深層学習とは別のアプローチで創薬支援AIを構築するのがHACARUS(ハカルス、京都市)だ。

 HACARUSは「スパースモデリング」と呼ばれる技術をAIに応用している。スパースモデリングの最大の特徴は、深層学習で必要となるビッグデータが不要な点だ。限られたデータから必要な要素を学習させるために、「人間の脳と似たようなノウハウが入ったモデルになっている」とHACARUS代表取締役CEO(最高経営責任者)の藤原健真氏は説明する。

スパースモデリング技術は創薬だけでなく画像診断などへの応用も進む
スパースモデリング技術は創薬だけでなく画像診断などへの応用も進む
(出所:HACARUS)
[画像のクリックで拡大表示]

 例えば人間が他人の顔を識別するときに判断材料としているのは、目の形や顔の輪郭などの極めてわずかな情報だけであって、額やほほまで詳しく見ているわけではない。こうした人間的なノウハウをモデルに組み込むことで、「ここは重要ではないから見なくてもいい、というようにデータを節約して高速に計算することができる」(藤原氏)

 もう1つの特徴が、その結論に至った理由を人間に解釈可能な形で提供することだ。この理由は、深層学習とスパースモデリングでは計算の方向性が異なることに起因する。入力と出力を「y=f(x)」という関数で表したとすると、深層学習ではデータ「x」が与えられたときに予測値「y」を導くための方法「f」を見つけることが目的だ。一方のスパースモデリングは、観測値「y」が与えられたときにそれが得られた要因「x」を見つけることが目的で、もともと「なぜ」という問いに答えることを意識したアルゴリズムになっているといえる。

 スパースモデリングの拡張性は高く、画像や音声、時系列データなども解析対象となる。創薬過程への応用は始まったばかりだが、特に貢献が期待されるのは化合物スクリーニングのプロセスだ。2021年5月25日には田辺三菱製薬との共同プロジェクトの結果を発表した。田辺三菱製薬がもともと持っていた深層学習モデルによるスクリーニングでは1化合物あたり15~40分程度かかっていた時間を、スパースモデリングを用いることで約16秒にまで短縮することに成功したという。

 スパースモデリングは深層学習に取って代わる存在ではない。電子カルテなどデータの蓄積が十分にある場合は深層学習を用いればよいが、データがないからといってAI活用を諦める必要はないというのがHACARUSのスタンスだ。「他のAI開発企業と正面から競合するとは考えておらず、用意できるデータの量や目的に応じて使い分けることで共存していけるのではないか」(藤原氏)