PR

画像200枚を約36万枚に増やす

 学習用データが大量に準備できないという課題に対して共同研究チームは、ディープラーニングに分類される「畳み込みニューラルネットワーク(CNN)」に基づく、少ない学習用データで学習させる新たな方法を採用した。早期胃がんの領域を正解として与えた内視鏡による正解画像と正常画像それぞれ約100枚の画像情報から早期胃がんの判別モデルを作成した。

 約200枚の画像情報から「がんの部分」と「正常の部分」を確実に含む領域をランダムにそれぞれ約1万枚切り出し、合わせて約2万枚の画像を取得。その画像に対してデータ拡張という技術を用いて画像を約36万枚まで増やした。

 次に、CNNに早期胃がんの検出能力を持たせるため「転移学習」と呼ばれる学習法を適用し、約35万枚の画像を用いて早期胃がん検出のために再学習を実施した。また、再学習を終えたCNNに、学習に用いていない約1万枚の画像を使って、それぞれの画像について正しい判断ができるか検証した。

タイプ別の早期胃がんの自動検出例
タイプ別の早期胃がんの自動検出例
[画像のクリックで拡大表示]

 その結果、感度(「がん」画像中、正しく「がん」と判断した割合)は80.0%、特異度(「正常」画像中、正しく「正常」と判断した割合)は94.8%だったという。また、陽性的中率および陰性的中率が極めて高く、胃炎や胃潰瘍と特徴が似ているために判断が難しい例についても、高い確率で判断できることが分かったとしている。