
データとAIで持続可能な競争優位が生まれる
ユーザーデータとAI(人工知能)を組み合わせると、データフィードバックループを生み出せることが多い。つまり、より多くの顧客データを集めて、機会学習アルゴリズムに読み込ませ、そこから得たインサイトを製品やサービスの改善につなげて、さらに多くの顧客を引き寄せ、さらに多くの顧客データを獲得するのだ。
たとえば、検索エンジンの場合、より多くの人がグーグル検索をして、表示されたリンクをクリックするほど、グーグルはより多くのデータを集めて、より正確で関連性の高い検索結果を表示するようアルゴリズムを改良でき、さらに多くの利用者と検索を獲得できる。
このようなデータフィードバックループは、一定の条件が揃えば、持続可能な競争優位を生み出す役に立つ。だが、その威力には大きな幅がある。したがって企業は、意識的な選択をすることで、製品やサービスを強化すべきだ。本稿ではその方法を紹介したい。
データフィードバックループの多様な価値
一部の製品は、強力なデータフィードバックループを持つ。たとえば、スマートサーモスタットは、ユーザーが温度を調整するたびに、より優れたパーソナライゼーションを可能にするデータを生み出す。グーグルマップでは、ユーザーが選択したルートと目的地までの所要時間が、推奨ルートや交通機関の混雑予測を改善するのに役立っている。スポティファイのレコメンド機能は、どのような曲をプレイリストに加え、どれほどの頻度で聴いているかというユーザーの選択から直接学習する。
これらのフィードバックループが非常に強力なのは、ユーザーが製品を自然に使う過程で、その人の好みを明確かつ明白に表示するシグナルとなることだ。そのデータが製品やサービスをいっそう改善するために活用されるのだ。
一方、データフィードバックループが弱い製品もある。利用状況が追跡しにくかったり、ユーザーの好みを把握できない製品、あるいはユーザーから有益なフィードバックを集めるのが困難だったり、時間がかかったりする製品がこれに当たる。
車や家具、衣服など伝統的に「スマートでない」製品がまさにそうだ。デジタルに接続されていないため、フォーカスグループやアンケート調査といった手作業でフィードバックを集めるしかなく、将来発売する製品にしか活用できない。つまり、現在ユーザーの手元にある製品を改善する役には立たない。
また、学習や改善に長い年月がかかるフィードバックループもある。金融機関の信用スコア(主なフィードバックは債務不履行によりもたらされるが、それまでには何年もかかる)や、ベンチャー投資(どのスタートアップが成功、失敗するか判明するのは何年も後になる)がその例だろう。
さほど明白ではないが、多くのユーザーデータを集めるデジタルプロダクトでも、データフィードバックループが弱いものがある。ほとんどの価値が、事前にプログラミングされた内部のデータ学習からもたらされ、ユーザーデータの学習によらない場合がこれに当たる。フィットビットや睡眠や休養に特化したフープ、食生活管理のニュートリセンス、スマートリングのオーラなどのウェアラブル端末は、多くのデータを集めてインサイトをもたらすものの、製品へのデータフィードバックループはかなり弱い。
フィットビットの最新版「チャージ5」を例に考えてみよう。たしかに心拍数や、移動のスピードと距離、睡眠、皮膚温度などを測定し、心拍の変動や、有酸素運動スコア、ワークアウト準備スコア、睡眠の質スコアのインサイトをもたらすなど、素晴らしい機能を備えている。しかしそれは、使用頻度やユーザー数を増やす役に立っていないようだ。そこに表示されるのは、測定されているデータのまとめ、あるいはユーザーデータにすぎず、フィットビットトラッカーが測定したユーザーデータと、あらかじめプログラムされた関連データとの比較結果にすぎない。
たとえばフィットビットは、「有酸素運動のフィットネススコアは、安静時の心拍数、年齢、性別、体重などのユーザーのデータに基づき算出される」と説明している。また、ワークアウト準備スコアは、ユーザーの最近の睡眠パターンと標準的な人のデータの比較に基づく。つまり、これらはユーザーの「真の」状態の推定値であり、使用データが増えるほど改善するわけではない。フィットビットは推定値がどれだけ「真の」状態に近いか把握したり、それに応じて推定値を調整したりはできないからだ。
もちろん、ウェアラブル端末が使用量などに基づきユーザーに提供する価値を高める限定的な方法はあるかもしれない。最も基本的なレベルでは、コネクテッドデバイスは何であれ、より魅力的なユーザーインターフェースはどれかを学ぶ(たとえば、A/Bテストによって)ことができる。これは厳密にはデータフィードバックループだが、ほとんどの製品にとっては、ごく基本的な要素にすぎない。
また、ウェアラブル端末は相関関係を分析して、特定の行動を推奨することもできる。たとえば、ユーザーの就寝時間と睡眠の質の相関関係に基づき、最適の就寝時間を推奨したり、運動時間と睡眠の質との相関関係に基づき、最適な運動時間を推奨したりできる。このような場合、ユーザーがその推奨に基づき行動を調整すると、ウェアラブル端末はそれが役に立っているかどうか一定のフィードバックを得ることができる。それでも、この種のプロセスには多くのユーザーから多くのデータを集める必要があり、ウェアラブル端末のプロバイダーは、どの程度の相関関係が因果関係といえるのかは知りえないだろう。
次に、オープンAIのチャットGPTやグーグルのバードのような大規模言語モデル(LLM)のデータフィードバックループを考えてみよう。これらのLLMは、インターネットから膨大な量のデータを取り込み、機械学習モデルを使ってユーザーの質問に対する答えを生成する。これらのモデルの初期バージョンでは、その能力はおおむね、リリース前の「社内」トレーニングとテストによって決まる。つまりユーザーや利用量が増えても、回答の質はそれなりにしか改善しない。本稿執筆時点では、LLM関連でデータフィードバックループを構築するメカニズムは主に2つある。
1. ユーザーが、回答の最後に表示されるサムズアップ(親指を立てる)かサムズダウン(親指を下げる)絵文字をクリックする(ほとんどのユーザーはどちらもクリックしない)。
2. ユーザーが追加質問をする。これは元の答えが満足のいくものだったか否かを示唆する可能性がある(ほとんどの場合、この推測は難しい)。
通常の検索エンジン(ビングやグーグル)との違いに注目してほしい。検索エンジンであれば、結果一覧からどのリンクがクリックされるかが把握できる。そのため、検索結果の関連性がより明確に示される。もちろん、LLMがアップデートされて、より信頼性の高いデータフィードバックループを生み出す方法を取り入れるようになれば、状況は劇的に変わる可能性がある。これは次のセクションで詳細に論じたい。