全1725文字
PR

 「がんの特徴と抗がん剤が効かなくなることとの因果関係を網羅的に解析する技術が求められていた」(東京医科歯科大学M&Dデータ科学センターの宮野悟センター長)――。富士通と東京医科歯科大学が、現場のデータから新たな発見の手掛かりを提示する同社の技術「発見するAI」とスーパーコンピューター「富岳」を利用し、抗がん剤の効果が弱まるメカニズムなどを見つける技術を開発した。製薬企業や大学の研究者らに技術を使ってもらうことで、薬の研究開発に生かせる可能性がある。

富士通が開発した「発見するAI」のイメージ
富士通が開発した「発見するAI」のイメージ
(出所:富士通)
[画像のクリックで拡大表示]

 がん細胞は多様性に富み、体内でその性質を変化させることが知られている。そのため、治療初期は抗がん剤が効くものの、やがて効きにくくなる場合がある。がん細胞の多様性や性質の変化を知る手掛かりは、がん細胞の遺伝子発現を確認することにある。しかしヒトの遺伝子の組み合わせとその発現量について網羅的に解析し、因果関係を導くには解析方法と計算能力に限界があった。今回、富士通と東京医科歯科大学はその限界を突破すべく挑んだ。

 解析方法の限界については、富士通が開発した発見するAIで対応する。発見するAIとは、データから新発見の候補を探索するAI技術の集合だ。技術の中には、因果探索の技術や、判断根拠について説明可能な富士通のAI「Wide Learning」などが含まれる。

 がん研究に対して、発見するAIを応用する際の課題となったのは、因果探索を実施する変数の多さだ。それを説明する前にまずは発見するAIの仕組みをより詳細にみていこう。発見するAIは、あるデータ全体に共通する因果関係だけではなく、相関関係から分類したグループ内の特徴的な因果関係やメカニズムを網羅的に抽出できる。例えば1000人分のがん細胞のデータがあった場合、まずは1000人の中から遺伝子Aと遺伝子Bの発現量が低いといった条件をもつグループを見つけてから、そのグループに生じた事象について因果関係やメカニズムを解析していく。

 ヒトの遺伝子は約2万個あり、複数の遺伝子の発現量を組み合わせたパターン数は1000兆通りを超える。発見するAIを応用しようとすると、通常の計算機では計算するのに4000年以上かかるという。そこで今回はスーパーコンピューターの富岳を活用し、高速計算を実施した。高速計算するため並列処理しているが、各処理のスケジュールの組み方を工夫したという。担当した処理が早く終了した場合も「遊びの時間」がでないように最適化し、計算を止めないようにした。その結果、膨大な計算量を1日以内で処理可能になったとする。