AI、ビッグデータといった技術の進展によって、膨大な生命情報を扱うことが容易になり、データサイエンスの医療・創薬への応用に期待が高まっている。特に創薬分野においては、薬剤―疾患―生体の複雑かつ超多次元にのぼるネットワーク情報をディープラーニングを用いて縮約することで、薬剤の効果を予測したり、薬剤が反応する標的分子を探すことも容易になった。AI創薬に取り組む東京医科歯科大学名誉教授の田中博氏に、これまでの歩みと、最新の成果について伺った。
薬剤-疾患-生体ネットワークのビッグデータを活用する計算創薬
――AIやビッグデータによって、データ駆動型医療の時代が到来したと言われますが、創薬の世界では、どのような応用が期待されていますか。

東京医科歯科大学 名誉教授・特任教授 東北大学 特任教授
東北メディカル・メガバンク機構 機構長特別補佐
1981年、東京大学医学系大学院博士課程修了。医学博士。1983年、同大学工学系大学院より工学博士。1987年、浜松医科大学医学部医療情報部助教授。1990年、米国マサチューセッツ工科大学(MIT)人工知能・計算科学研究室客員研究員。1991年、東京医科歯科大学難治疾患研究所生命情報学教授。1995年、同大学情報医科学センターセンター長併任。2003年、同大学大学院疾患生命科学研究部教授。2006~2010年、同大学大学院生命情報科学教育部教育部長・大学評議員併任。2015年、東京医科歯科大学名誉教授、東北大学東北メディカル・メガバンク機構機構長特別補佐。2017年、東京医科歯科大学医療データ科学推進室室長・特任教授。
ご存じの通り、新薬の開発には10年以上もの長い時間がかかります。基礎研究から始まり、こういう病気だったら、どういう生体分子をターゲットにすればいいかを決めて、有効な化合物を探して、それを最適化します。この間、動物実験や細胞を使った非臨床試験を行います。ここで残ったものだけが臨床試験に移り、健常な人に対して薬の動態を調べる第1相、少数の患者さんに適用する第2相を経て、第3相では何千人という大規模治験を行うのですが、第2相でほとんどが脱落してしまいます。これを「死の谷」と呼んでいます。現在、新薬の開発成功率は2万~3万分の1といわれ、開発費もどんどん増えて、1000億円の予算で開発できる薬の数は1個以下にまで低下しました。時間とお金ばかりかかっているというわけです。
創薬で一番重要なのは、非臨床試験の時に人に適用したらどうなるかを予測できることことです。そこで1つの方法としては、非臨床試験の時に人の情報が入ったセルライン(細胞株)を使うことが挙げられます。有名なiPS細胞です。患者から取ったiPS細胞は、疾患特異的な情報を持っています。これを使って、臨床予測を早期に実施しようというものです。
一方、人の薬剤-疾患-生体ネットワークのビッグデータはすでに存在しますから、これを研究開発の早期段階で使おうというのが計算創薬であり、ビッグデータ創薬と言っているものです。また、もう1つの方法として、最近話題のドラッグ・リポジショニングというものもあります。既承認薬の適用を変える、新しい薬理効果を発見し、別の病気の治療薬として開発する創薬戦略ですが、これもビッグデータを使えば、薬理効果を予測することが可能です。
計算創薬は「in silico創薬」といって、実は昔からありました。量子力学や古典力学を使って、受容体に化合物が入った時の化学反応を計算し、最適な分子結合構造を設計するもので、成功例としてインフルエンザ薬のタミフルがあります。ビッグデータ創薬やAI創薬は、これとは別物です。むしろ薬剤がターゲットとなる受容体に結合して、その作用が細胞内に広がっていくという、生体システムのゲノムワイドな反応・振る舞いに注目するものです。かつての計算創薬と区別するために、これを生体プロファイル型創薬と呼んでいます。
現在の計算創薬・ドラッグ・リポジショニングには2つのアプローチがあります。1つは、非学習的アプローチで、理論やモデルをつくって、その薬が効くかどうかを予測する演繹的な方法です。もう1つは、学習的アプローチです。薬として効いたものを学習して、そこから推論する帰納的な方法です。私の考え方では、モデルをつくる前者をビッグデータ創薬、学習サンプルを使う後者をAI創薬として厳密に分けています。