全3793文字
PR

動物試験結果を機械学習してもブラックボックス

 ところが問題になるのが、機械学習によるモデルがブラックボックスになってしまうこと。化学構造と動物試験の結果の関係を機械学習したモデルは、毒性の有無は予測できるが、なぜ毒性が生じるかの情報を提供できない。「これでは開発者、研究者、規制当局ともに受け入れられない」(船津氏)

 米国が2008年から開始している毒性学の大規模共同研究プロジェクト「Tox21」では、数多くの化学物質についてタンパク質の反応性を試験などで調査し、ヒトでの有害性を評価しようと試みている。しかし、結局はヒトにとってどう毒性があるかのデータがないため、予測モデルを構築するのが難しいという。

* Tox21(Toxicology in the 21st Century) 米国NIEHS/NTP(国立環境健康科学研究所/国家毒性プログラム)、同NCATS(国立先進トランスレーショナル科学センター)、同FDA(食品医薬品局)、米国EPA(環境保護庁)/計算毒性学センターが参画する。

 船津氏によれば、化学物質と細胞内での反応やイベント(MIEやKEと呼ばれる)との関係は、試験管に化学物質と試験用細胞を入れる試験(インビトロ試験)によって観察できるし、化学物質と生体での毒性の関係も動物試験(インビボ試験)などで観察できる(図2)。問題は細胞内でのイベントと、生体での毒性の関係を直接観察する手段がないことだ。ここをコンピューターでモデル化できれば、化学物質、細胞内イベント、毒性発現の3つの関係を予測でき、少なくとも毒性が発現しているときにどの細胞内イベントが生じているかが分かる。

* MIE(Molecular Initiating Event)は化学物質が細胞に影響して発生する、分子レベルの最初のイベント。KE(Key Event)はMIE以後に細胞内で起こるイベント。
図2 化学物質-細胞内イベント-毒性発現の関係
図2 化学物質-細胞内イベント-毒性発現の関係
細胞内イベントと毒性発現の関係が試験では分からない。化学物質、細胞内イベント、毒性発現の3階層に分けるモデルは「船津の3層モデル」と呼ばれる。(AI-SHIPS Projectの資料を基に日経クロステックが作成)
[画像のクリックで拡大表示]

2段階のモデルで毒性を予測

 そこでAI-SHIPSでは、まず試験管試験の結果から細胞内イベントを予測するモデル(インビトロ予測モデル)をつくり、さらにこの予測結果から動物試験での毒性発現を予測するモデル(エンドポイント予測モデル)をつくるという、2段構えのモデルで毒性を予測する(図3)。併せて、化学物質が生体内にどの程度とどまるか(生物学的薬物動態、PBPK)を予測するシステムも構築している。

 開発したシステムの対象物質は、年間の製造・輸入量が10トンを超える一般工業用化学品と、生分解性試験で生じる分解物。これらを経口でラットに28日間反復して与えた際、肝臓に表れる毒性(肝毒性)6種類、腎臓に表れる毒性(腎毒性)1種類、血液に表れる毒性(血液毒性)2種類を予測項目とし、1日の体重1kg当たりの摂取量が30mgの場合と300mgの場合でそれぞれ毒性がないかを判定する

* 対象から外れる物質は、生分解性試験で無機化される物質、高分子物質(分子量1000未満の成分が1%以下)で安定しているもの、蓄積性の高い物質(濃縮度試験が必要になる)など。予測対象の肝毒性6種類は細胞障害・炎症、肝機能低下、肝機能亢進(こうしん)、胆管障害、肥大、脂質代謝異常で、血液毒性2種類は貧血、凝固異常。
図3 AI-SHIPSによる毒性予測の仕組み
図3 AI-SHIPSによる毒性予測の仕組み
細胞内でのイベントをまず予測し、その結果を使って動物試験での毒性発現を予測する。(AI-SHIPS Projectの資料を基に日経クロステックが作成)
[画像のクリックで拡大表示]

 モデルを構築するにあたってベースとしたのは、950物質について動物試験の毒性試験結果を集めたHESS(有害性評価支援システム統合プラットフォーム)データ。製品評価技術基盤機構(NITE)が12年から運用を始めたデータベースである。

 このHESSデータのうち358物質について、AI-SHIPSプロジェクト自身で新たに試験管試験を実施してデータを集め、さらにTox21での1万物質に及ぶ試験管試験のデータも利用した。開発したシステムには130個のインビトロ予測モデルを組み込んでいる。エンドポイント予測モデルの構築には、HESSデータのうち860物質に加えて化審法での新規審査のデータ、欧州の化学物質管理規則REACH(Registration、Evaluation、Authorization and Restriction of Chemicals)の登録情報から、合計約2200物質の毒性データ(動物試験の結果)を利用、これらの物質の試験管試験結果と組み合わせて学習させた。

 機械学習による推論であるため、計算量は多くはなく、一般的なパソコンを用いて1分間程度で結果を得られるという。20年8月には住友化学、三菱ケミカル、花王、DIC、サントリー、明治などの参加を得てユーザートライアルを実施し、約200件の要望や意見を受けて、システムに反映させた。22年4月からは、「事業者などへのシステムの普及に向けた課題などの調査」(経済産業省)を始めるとしており、希望者へのシステムの配布を活動の一環としていく予定だ。

* AI-SHIPSプロジェクトは奈良先端科学技術大学(20年度まで東京大学、プロジェクトリーダー船津氏の異動により移管)、昭和薬科大学、静岡県立大学、明治薬科大学、名古屋市立大学、産業技術総合研究所、化学物質評価研究機構、みずほリサーチ&テクノロジーズが参画。システム開発はシステム計画研究所、富士通が担当した。