100万もの症例画像を集め
AIの解析能力を上げる

――今回の研究開発事業はどんな特徴がありますか。

 これまでも医療画像解析は行なわれていますが、パートナーが特定の医療機関に限られていたため、多くの症例画像データを集めるのが困難でした。AIが学習するには、どうしても大量のデータが必要です。

 この点、今回の研究開発事業のパートナーは学会なので、傘下にある複数の病院や研究機関から大量の症例画像データを提供してもらうことができます。計画では、数100万に相当する症例画像を収集する予定。これは、一般的にAIを学習するために必要な件数に達していると考えられます。

 しかも、日本の病院は、最先端の検査機器の普及率が極めて高く、諸外国に比べて高品質の医療画像が集められる可能性があります。現在AI画像解析で圧倒的な解析精度を達成している技術であるディープラーニング(深層学習)の研究者にとっては、のどから手が出るほど欲しいデータの宝庫になるかもしれない。つまり、医療画像解析の成果が出やすい環境が整いつつあるということです。

――全国からスペシャリストが集結しているそうですね。

 はい。NIIには同じような研究センターが複数ありますが、NII外の研究者が参加するのは異例なことです。

 ディープニューラルネットワークの第一人者である東京大学の原田達也教授、パターン認識・機械学習の専門家である九州大学の内田誠一教授、そして日本を代表する医療画像分析の専門家である名古屋大学の森健策教授という、そうそうたるメンバーが集まっています。

 今後も、高品質の大量データを使って高度な画像分析の研究が行なえる場として、日本中から研究者が集まってきてくれることを期待しています。

――開発はどのような手順で行なわれるのでしょうか。

 AIに医療画像を判定する基準を持たせるには、まず医師の診断を学習させる必要があります。それには、症例画像の中のどこがその病気の根拠なのかがわかる学習用のデータを用意しなければなりません。これは医師にお願いするしかないので、症例の根拠と判断する部分をマーキングしてもらった症例画像を送ってもらっています。

 AIは学習すればするほど精度が高まるため、いかに大量の症例を学ばせるかがポイントになります。とはいえ、この学習用データを1枚つくるには、病理画像の例でいうと1時間、1万枚なら1万時間かかる。医師にとっては大変な負担になりますが、「AIを活用すれば医療のクオリティや効率を上げられるのではないか」という思いから協力していただいています。

 ご存知のように、ディープラーニングのブレイクスルーによって2012年に画像解析の性能が爆発的に向上しました。医療の世界でもこのAI技術が活用できるのではないかという機運が高まっています。