九州大学などの研究グループは、人工知能(AI)を用いた新たな創薬研究手法を開発したと2021年9月27日に発表した。疾患の原因となっているたんぱく質のアミノ酸配列情報のみを用いて、そのたんぱく質をターゲットとする治療薬候補の化合物を見つけ出す。効果検証では新型コロナウイルス感染症の治療薬候補を発見したほか、がんや感染症など様々な疾患に応用可能で、今後の創薬研究の進め方を大きく変える可能性があるという。
発表したのは九州大学生体防御医学研究所の中山敬一主幹教授、米ハーバードメディカルスクール・システム生物学部門の清水秀幸リサーチフェロー、北海道大学人獣共通感染症国際共同研究所の沢洋文教授らの研究グループ。論文は同日付で査読前の論文を集約するbioRxivで公開された。
中山主幹教授らの研究グループが開発した創薬AI「LIGHTHOUSE (Lead Identification with GrapH-ensemble network for arbitrary Targets by Harnessing Only Underlying primary SEquence)」が教師データとするのは、STITCHと呼ばれるたんぱく質-化合物ペア間の相互作用に関するデータベースだ。
STITCHに格納されている100万以上の相互作用情報をLIGHTHOUSEに投入し、深層学習させている。そのうえで、創薬の対象としたい疾患について、原因となるたんぱく質を構成するアミノ酸配列をLIGHTHOUSEに入力する。LIGHTHOUSEは入力されたアミノ酸配列を基に、膨大な化合物データの中から治療薬候補となるものを絞り込んで提示する。
LIGHTHOUSEが実行するのは「一種の相性計算」(中山主幹教授)だ。LIGHTHOUSEの内部処理は2種類に大別される。1つはアミノ酸配列や化合物をその後の計算が可能な数値ベクトルの形に変換する処理、もう1つはその数値ベクトルに基づいてアミノ酸配列と化合物の「相性」を判定する処理である。目的の配列と相性が良い化合物ほど治療薬になる確率が高く、膨大な化合物群の中から相性スコアの高い化合物を絞り込んでいくことになる。
この計算過程で注目すべきは、計算するのはあくまでアミノ酸配列と化合物の相性であり、そのアミノ酸配列から成るたんぱく質の立体構造を考慮していない点だ。アミノ酸配列からダイレクトに治療薬候補の化合物を導けると、どのようなメリットがあるのだろうか。