PR
全3017文字

 「この技術で人工知能(AI)のブラックボックス問題に挑む――」。理化学研究所 革新知能統合研究センター(理研AIPセンター)病理情報学チームの山本陽一朗チームリーダーは自らが開発した「説明可能AI」について、熱を込めて語った。

研究成果を説明する理化学研究所 革新知能統合研究センター(理研AIPセンター)病理情報学チームの山本陽一朗チームリーダー
研究成果を説明する理化学研究所 革新知能統合研究センター(理研AIPセンター)病理情報学チームの山本陽一朗チームリーダー
[画像のクリックで拡大表示]

 理研AIPセンターや日本医科大学などの研究チームは2019年12月18日、病理画像を診断する画像認識AIの「説明可能性」を高める技術を開発したと発表した。英オンライン科学誌「Nature Communications」に同日掲載された論文の概要は「診断注釈(annotation)のない組織病理画像から、説明可能な機能を自動的に取得できることを示した」としている。

病理画像のうち、再発率の高い分類に属する画像パターンの箇所を赤く表示した
病理画像のうち、再発率の高い分類に属する画像パターンの箇所を赤く表示した
(出所:理化学研究所)
[画像のクリックで拡大表示]

 研究チームが開発したのは、前立腺がん組織を撮影した病理画像から、摘出後のがん再発の有無を予測するAI技術である。がん再発の予測は手術後の治療方針を決める重要な手掛かりになる。今回の研究成果のポイントは、従来の診断基準にはなかった、がん再発の予測精度を高める新たな知見をAIが見いだしたというものだ。

 これまで医療画像を診断するAIと言えば、画像から病変の有無や位置を判定できる一方、「なぜ病変と判定したのか」までは説明できないのが一般的だった。理研AIPセンターらの取り組みは「医師が納得する説明」をAIが見いだすとともに、既存の知識体系にはない新たなインサイト(洞察)を医師に示したといえる。

「教師なし学習」で病理画像を分類

 今回開発した機械学習モデルの特徴は、機械学習の前段、特にブラックボックス性の高い深層学習(ディープラーニング)を含む画像分類の学習について、再発の有無などの診断データを使わない「教師なし学習」で実施した点だ。

 共同研究チームはまず、日本医科大学で撮影された前立腺がん患者100人分の病理画像(1枚100億画素以上、数ギガバイト相当)を128×128画像単位で約11億枚分の画像に分割。これを教師なしの機械学習モデル「オートエンコーダ」に入力して学習させた。

 オートエンコーダは入力した画像とほぼ同じ画像を出力するようトレーニングさせた深層学習モデルで、中間層の次元を絞ることで画像の抽象的な特徴を自ら「発見」できるようになる。

 続いてオートエンコーダの中間層の出力、つまり画像の特徴を少ない次元で表現したベクトル値を、教師なしの非階層型クラスタリングで100の「特徴」に分類するモデルを構築した。この100の分類は、人間の病理医が見ても「病理学的に類似の特徴を持つ画像を分類している」と理解できるという。

 ここで初めて、がん再発に関するデータを使う。100人の患者の追跡調査で得た「1年以内のがん再発の有無」や「5年以内の再発の有無」などのデータを基に、分類ごとのがん再発率を、新たに開発した手法により自動で重みづけして算出した。この結果、多くの分類はがん再発との関連が少ない画像群だった一方、一部の分類についてがん再発率が極めて高い、あるいは極めて低いことを確認できた。

1年以内に再発した前立腺がんの病理画像は、再発率の高い分類に属する画像パターンを多く含む
1年以内に再発した前立腺がんの病理画像は、再発率の高い分類に属する画像パターンを多く含む
(出所:理化学研究所)
[画像のクリックで拡大表示]

 これらの分類の有用性を検証するため、研究チームは100の分類を基にがん再発の有無を予測するモデルを、サポートベクターマシン(SVM)やロジスティック回帰といった「教師あり」の学習で構築。これらの分類が高精度のがん再発予測を可能にすることを確認した。

 AI診断モデルの再発予測を、前立腺がん診断の世界標準である「グリソンスコア」に基づき人間の医師が診断した結果と比較したところ、AI診断モデルの方が高い精度で再発の有無を予測できたという。日本医科大学以外の病院で撮影した病理画像についても同様に高い精度で予測できた。

前立腺がんの予後や再発可能性の判断に使われるグリソンスコア
前立腺がんの予後や再発可能性の判断に使われるグリソンスコア
(出所:理化学研究所)
[画像のクリックで拡大表示]
AIによる再発予測の精度は人間の医師より高い
AIによる再発予測の精度は人間の医師より高い
(出所:理化学研究所)
[画像のクリックで拡大表示]

 さらに「再発あり」の画像を多く含む上位10分類を調べたところ、うち8個はグリソンスコアの算出に使う複数のがん細胞の特徴と一致。2個はグリソンスコアの算出に使われない「未知の診断基準」を示すもので、がん領域以外の間質の変化を捉えた分類が含まれていた。山本チームリーダーは「病理画像から人間が理解できる所見をAIが自力で獲得する技術を開発したことで、がんの再発にがん以外の組織が影響するという新たな知見が得られた」としている。

 これまで医療AIを含む深層学習の多くは、入力した画像から「病変あり」などの診断スコアを直接出力する、いわばend-to-end方式が採られていた。今回の研究チームはあえてend-to-end方式を採らず、「病理画像の分類」と「がん再発の予測」の各学習工程を分離することで、人間にとって解釈しやすい(解釈性の高い)AIモデルを構築した。

 深層学習におけるオートエンコーダはもともと、モデルの初期パラメーターを決める事前学習の手段として発明されたものだ。2006年にAI研究者のジェフリー・ヒントン氏が考案し、その後の深層学習ブームの端緒になった。現在も画像ノイズの除去や生成系AIの構築などに使われている。今回の発表で、AIの説明可能性を高める技術としての注目度も高まりそうだ。

この記事は有料会員限定です

日経クロステック有料会員になると…

専門雑誌8誌の記事が読み放題
注目テーマのデジタルムックが読める
雑誌PDFを月100pダウンロード

有料会員と登録会員の違い