第2のポイント:データに基づき、正しいアプローチを選択せよ
正しいデータ分析手法(アルゴリズム)を選択するということも重要である。当たり前のことであるが、意外にできていない。どうしても最先端の最新アルゴリズムや自分が得意なアルゴリズムを使うという傾向が散見され、明らかに頻度論統計でやるべきではない領域に、無理にそれを適用して機械学習の検討を放棄しているケース、あるいはその逆のケースなどはいくらでも見られる。
これはその企業が既に投資してきた領域に対する政治的な思惑もあるし、関わっている社外協力企業による、いわゆる「ベンダー・ロックイン」状態になっていることが原因のこともある。さらには、企業側のアナリティクスに対するリテラシーが低いことを逆手にとって、金科玉条の如く、それを強く推奨して説き伏せているというお粗末な状況もある。
前述のシルバー氏の引用の中にもあった「基本的なことを正しく行う」といったなかには、そもそも適切なアプローチをとるということ、の重要性も含まれていると考える。間違った手法を選択すると、投入したリソースに見合った効果はなかなかはじきだせないのだ。また、最適なアルゴリズム、アプローチを考える前に、そもそも対象とするデータについて、下記の点をしっかり確認する必要がある。
①予測対象となる正解付データがあり、バイアスなく用意されたデータかどうか?
②量が十分に大きい情報を獲得できるか?
データの状況によって、取るべきアプローチは変わってくる。データ分布のバランスが良いデータセットであれば話は別だが、処理可能なコンピューターリソースを限定しないならば、様々な時系列データでのノイズ排除のプロセスの精度もあがるため、経験上データセットはより大きいほうが望ましい結果を得られることが分かっている。
以上の点を踏まえ、取るべきアナリティクス・アプローチを選択することが肝要だ。アプローチは以下の2つに大別される。
温故知新型アプローチ
1つは過去履歴データから、基準を置いた予測変数に対して未来を予測する方法で、言うなれば「温故知新」の概念に近い。過去に学び、未来を知るという方法である。ここには大抵暗黙知なる仮説が現場の経験則やデータ分析から設定されていることが多い。前述のデータに関する確認①を満たすデータであれば、こうしたアプローチをとることが可能である。
温故知新型のアプローチであれば、例えば、コンビニのような多品種を取り扱う店舗で、過去の販売データなどに含まれる日付、時間帯、天気といった様々な予測変数から、明日の最適な発注量を予測することができる。あるいは医療機関においては、複数の投薬によってある時点から効果が激減するばかりでなく、負の副作用を発症するというような交互作用のケースに対し、有意性検定を用いて、事前にその投薬を避けるといったことも可能になる。
実際、アクセンチュア アナリティクス日本では、ウェアラブルデバイス等にそれらアラート機能を連携させることで、人間の目視や直感で判断を見落とすような状況を頻度論統計の結果をバッチ処理し、その判断ポイントを、ウェアラブルデバイス等を介して画像認識した際に、その場で知らせるような実証実験を行っている。
これは特に優れた発明をしなくても、これまでに存在する要素技術を組み合わせることで、今までにない検知能力を人間が身に着けたり、サービス提供できる可能性のある分野であり、筆者も注目している。
思索生知型アプローチ
もう1つは、理論形成が難しいパターンを検知したい場合など、試行を積み重ねながら、徐々に目的にある洞察を得ていくという「思索生知」の手法。このアプローチを採用するならば、前述のデータに関する確認②を満たさなければならない。精度に影響が出るうえ、十分なボリュームがないと試行錯誤のアプローチは取りづらいからだ。
思索生知型アプローチを使うと、例えば、心拍センサーから得られる秒速生成データをパターン認識させることで、幼児の不整脈を24時間監視、事前検知して医師にアラートしたりすることができる。ほかにも、検索エンジンでの変換予測などで使われる機械学習や、アマゾンなどで見られる、膨大なデータの中から類似性を見出し、ユーザーに適切なレコメンド(推奨)を行う協調フィルタリングの手法がこれに該当する。
ちなみに、東京にあるアクセンチュアのアナリティクスセンターでは、アクセンチュア・レコメンドサービスという、協調フィルタリングの手法を用いたレコメンド・エンジンを提供している。これは、アマゾンのような類似性から顧客の潜在需要を喚起させるサービスを実現させる機能のみならず、位置情報や顧客属性情報に基づいて、最適な場所やタイミングでマーケティング・キャンペーン情報を配信するとったサービスなども実現が可能だ。
これらのアプローチをうまく使い分け、また組み合わせることで、最適なサービスの提供につながるのである。