高品質なデータがなければ、企業のAIプロジェクトは成功しない
HBR Staff
サマリー:かつてのサブプライム住宅ローンによる金融危機の教訓として、データの品質がビジネスの成功に不可欠であることは疑いようのない事実である。そして今後のAIを用いたビジネスも、同様にデータの品質が成否を左右する... もっと見る。それにもかかわらず、企業はAI導入に際しデータ品質を無視しており、その結果、失敗することが多い。AIを適切に活用するためには、データ品質の改善や組織変革が必要である。本稿では、企業のAI活用において、誰が、どのような責任を負うべきかを解説する。 閉じる

企業が初めてAIプロジェクトに取り組む時に意識すべきこと

 20年前、不動産担保証券(MBS)と債務担保証券(CDO)が大流行した。これらの新しい金融商品は、最初のうちは驚異であった。おかげで何百万人もの人々が住宅を手に入れ、銀行は何十億ドルも儲けた。その後に恐ろしい事態へと発展し、世界経済を崩壊の瀬戸際に追い込んだ。

 2007~2009年の金融危機はさまざまな観点から研究されている。しかしデータサイエンスの観点から見ると、今日のAIと機械学習(本稿ではこれらを単にAIと呼ぶ)に対する教訓となる2つの洞察が得られる。

 第1に、住宅ローンを細分化して投資家のさまざまなリスク・リターン特性に見合った商品にするための分析作業は、実はかなり優れたものであった。しかしその結果は、データが高品質であることに依存していた。

 第2に、データは実際には高品質ではなかった。住宅ローン申請における誤った(時に不正な)情報、不正確なクレジットスコアや証券格付け、書類の紛失、銀行の負債の不透明性などを含め、すべての段階でデータの不備や欠落があった。低品質なデータが一因となって銀行はリスクを大幅に過小評価し、結果的に予想外に多くの差し押さえが生じ、銀行同士が互いの負債報告書を信用しなくなり、金融システムが凍結した。

 このストーリーの根幹にある教訓は単純だ。「優れたデータサイエンス+不良データ=低いビジネス成果」である。

 これはAIとどう関連するのだろうか。一つには、AIを取り巻く熱狂は、金融商品をめぐる熱狂よりも格段に大きく、より広範囲に及んでいる。そして、さらに悪いことがある。

・住宅ローンの細分化に用いられた数学は、十分に理解されていた。対照的に、AIの予測の理由は専門家でもよくわかっていない。