ローカルな知識を活用する

 ただし、収集するデータにはローカルな知識も含めるべきだ。

 ある菓子メーカーは、アルゴリズムを用いた分析により、ある種の休日に需要が増えると考えていた。しかし、筆者らが同社の営業部員と話してわかったのは、一部の地域では、ステートフェア(農産物品評会や仮設遊園地などが目玉の秋祭り)や釣り大会、野球のマイナーリーグの試合の影響のほうがもっと大きいということだった。

 この会社が築いていた機械学習に基づくモデルに、こうしたデータも投入すると、予測の正確性が大幅に向上した。予測の質が高まった結果、店舗からの返品、商品の廃棄、配送ドライバーの勤務時間を減らすことができた。コロナ禍以降、同社は過剰発注と在庫切れを減らすことにより、税引前利益を7500万ドル以上増やせた。

 ローカルな知識に加えて、企業は専門家の意見も仰ぐ場合がある。感染症の大流行のようなケースでは、疫学者に助言を求めたり、有力な専門家や業界団体の考えを尋ねたりする。

 専門家グループの意見を集約して未来予測を行う「デルファイ法」を用いれば、モデルが導き出す予測を修正するだけでなく、モデルの構築に用いるデータそのものに専門家の判断も織り込むことができる。

アンサンブル型のモデルづくりを受け入れる

 データを集めたあとは、モデルを改善しなくてはならない。ここでは、ハリケーン予報官のようなアプローチを用いるのが有益だ。

 不確実で変化の激しい環境では、単一の複雑なモデルに頼るより、いくつものシンプルなモデルを組み合わせるほうがうまくいく場合が多い。複雑なモデルは、現在のような状況では綻びを見せやすい。

 アンサンブル型のモデルを採用すれば、個々のモデルのデータが安定性を欠く場合でも、点推定、もしくは合理的な幅の推定を導き出せる。ハリケーン予報では、予報図の上にいくつかのモデルによる予測を集約し、ハリケーンの進路を示す。そうすることで、予報を見る人たちが中心傾向を理解しやすいようにしているのだ。

 コロナ禍の中で新製品を売り出すとしよう。あるモデルは、シンプルに売上高の移動平均を用いている。別のモデルは、同じカテゴリーに属する別の製品の過去の売上げデータを組み込んで、不安定な時期の売上げパターンを割り出そうとしている。また別のモデルは、ほかの似たような店舗でいま起きていることを予測に反映させる。

 こうしたモデルはそれぞれ、需要に関する別々の側面に光を当てるものなので、すべてのモデルによる予測が同じ方向を指し示していれば、予測の信頼性は非常に高くなる。一方、予測の方向が食い違う場合も、一つひとつのモデルがシンプルで透明性も高いため、どうしてそれぞれのモデルがそのような予測を導き出すのかは理解しやすい。

 新型コロナウイルスの感染拡大が始まった初期、あるヘルスケア企業は、コールセンターにかかってくる電話の件数を正確に予測できず、スタッフを多く配置しすぎて、人件費が過剰に膨らんでしまった。

 その企業は、予測ミスの原因を探り、電話が多くかかってくる時間帯と、電話してくる理由を予測するうえで有効な要素をいくつか特定できた。もっと早い時期に感染拡大を経験した国の状況や、治療法の事前承認の申請などの要素が予測の手掛かりになるとわかったのだ。

 新しい予測モデルは、コロナ禍以前に用いていたモデルと異なり、シンプルで透明性の高いモデルをいくつも組み合わせ、新しいデータと専門家の見解を取り込んで予測を導き出すものだった。新しいモデルを採用すると、同社はほどなく、予測ミスを大幅に減らすことができた。