データフィードバックループを強化する方法
そうなると重要なのは、データを活用して学習するためのフィードバックループが、もともと強力でない製品の場合、どうすれば強化できるかということだ。
製品を設計あるいは再設計して、自然なデータフィードバックループを構築する
理想は、顧客が製品を自然に使用する過程で、その製品がどのくらい有用、あるいは有効かを示すデータが生み出されるように、製品やサービスを(再)設計することだ。このデータを利用すれば、製品やサービスの質を向上させることができる。
たとえば、ユーザーが最も役に立ったと思った回答をお気に入りフォルダーに保存して整理できたり、いらない回答を削除できたりする新しい機能(ブックマークと似た機能)をLLMに追加する。また、LLMの回答をコピーして編集できる文書作成機能(マイクロソフトワードに似ている)を追加してもよいだろう。また、チャレンジゲーム(AI対ユーザー)や、成績表(AIとユーザーが質問の答えを探し、ユーザーが回答に投票できる)を作成してもよいだろう。ポイントは、ユーザーがLLMの回答の質について、信頼できるシグナルを示す機会を作り、それをアルゴリズムの改善に役立てることだ。
フィットビットなどのウェアラブル端末は、標準化されたフィットネステストやチャレンジ(たとえば、1マイル走るとか、腹筋20回を3セットなど)を追加すれば、ユーザーの所要時間や心拍数などの生体データを測定できる。こうすれば、端末のAIはより多くのデータに基づき、ユーザーのワークアウトに対する準備状態をより正確に予測できるだろう。そうすれば、ユーザーはワークアウトのタイミングを決める時、もっとウェアラブル端末を頼りにするようになるに違いない。もちろん、これはまだ観察されていないユーザーの行動に関する推測に依存するが、重要なのは、デバイスの学習・改善につながるユーザーデータを集めるために、ユーザーに何らかの疑似実験をやってもらう必要があることだ。
別の製品と統合してデータフィードバックループをつくる
多くの場合、フィードバックループをつくるために既存の製品やサービスを再設計することは難しいかもしれない。前述したウェアラブル端末の例が示す通りだ。同じ目標を達成する別の方法は、顧客がすでに使っているか、使うことができる別の製品と統合することである。
たとえば、フィットビット(またはフープやオーラ)は、スマートサーモスタットと統合して、ユーザーの睡眠中にフィットビットが周囲の温度を自動制御するようにできる。すると、フィットビットのAIが温度を調整して、それがユーザーの睡眠の質に与える影響を測定できる。フィットビットの利用者(装着して眠る人)が増えるほど、どのようなユーザーにも理想的な温度パターンを提示できるようになる。これは、ユーザーが就寝中にさまざまな温度パターンを自動的に実験することで可能になる。
あるいは、フィットビットをフィットネスバイクのペロトンや、家庭用筋トレマシンのトーナルと統合すれば、フィットビットのAIがユーザーの生体情報とワークアウトのタイプやレベルを関連づけることもできる。こうしたオプション(ウェアラブル端末がユーザーに特定のワークアウトを実行するよう求めるだけ)の利点は、実際のワークアウト行動を観察できることだ。
同様に、LLMはその回答が使用されているソフトウェアやツールと統合できる。たとえば、コンテンツ作成・編集ソフト(グーグルドキュメント、サブスタック、セールスフォースなど)と統合すれば、LLMの回答のどの部分が、ユーザー作成コンテンツに使用されたかを把握し、そのデータに基づき回答を改善できる。
ユーザーの手間を最小限に抑えつつ、メリットを明らかにしてフィードバックを寄せてもらう
それでも多くの製品にとって、その使用を通じてユーザーのフィードバックを直接的に得たり、または別の製品を統合して得たりするのは難しい。あるいは不可能かもしれない。その場合、次善の策は、ユーザーに明示的にフィードバックを求めることだ。ほとんどのオンラインプロダクトやサービスは、多かれ少なかれこの方法を採用している。
前述したように、LLMは、回答を生成するたびに、ユーザーにサムアップかダウンを求める。ネットフリックスも、おすすめシステムの精度を高めるために、ユーザーが映画やドラマを視聴するたびにサムアップかダウンを求める。アマゾン・ドットコムは購入品の評価を求める。エアビーアンドビーは、旅行者とホストの両方に相手の評価を求める。
もちろん、明示的にフィードバックを求める時、難しいのはユーザーにあまり負担をかけないようにしつつ、有益な情報を引き出すことだ。「3分で終わります」と協力を求められたアンケートに、長時間頭を悩ませて回答したり、1画面ごとに必ず投票(「どのくらいのレベルで友だちに薦めますか」といった内容)を求められたりするのは、誰も嬉しくないだろう。
できるだけ簡単かつ軽い手間でフィードバックを寄せられるようにすると同時に、そのフィードバックがユーザー自身に恩恵をもたらすことを明らかにすると、有効な結果を得られるだろう。たとえば、「この映画を評価すると、ネットフリックスはあなたが気に入る映画をより正確におすすめできるようになります」といったメッセージを表示するのだ。これはユーザーが、正直なフィードバックを提供するインセンティブになるだろう。
人の手をループに加える
ユーザーの負担を最小限に抑えながらデータフィードバックループを構築する重要な工夫の一つは、フィードバックを補完(あるいは代替)するために、人の手を加えることだ。
その好例が、法律事務所向けに提供されているAI法務検索サービスのアレクシだろう。ユーザーが担当する案件の事実関係を添えて法的な質問をすると、アレクシは質問への回答と資料(関連する判例や訴訟の要約を含む)を返してくれる。この資料を作成するのはAIだが、その内容をアレクシの社内法務スタッフがチェックし、必要に応じて修正を加える。つまり、ループに人の手が入っているのだ。
このように、アレクシのAIは、顧客に負担をかけることなく、顧客の質問や社内チームの修正からもたらされる無言のフィードバックから学習できる。これがうまくいくのは、顧客が即座に回答を得ることを期待していない時だ。アレクシは24時間以内の回答を約束しており、サービスの内容を考えると非常に合理的な期限だろう。それにアレクシの顧客は、チャットGPTやバードのユーザーのように、1日に何百もの質問をするわけではない。
人間をループにうまく加えているもう一つの例は、AI作文アシスタントのグラマリーだろう。文法や綴り、句読点、スタイルの改善を助けてくれるサービスだ。グラマリーは、ユーザーがどのようなアプリあるいはサイト(ワープロ、メール、ソーシャルメディア、コミュニケーションアプリ)で文章を書いている場合でも、リアルタイムに提案をする。ユーザーは、提案された編集を受け入れるか拒否するかを選択でき、それがアルゴリズムの改良に役立ち、データフィードバックループを生み出す。ただ、グラマリーはユーザーにフィードバックを求めるのではなく、人間のレビュアーがAIモデルが生成した提案をチェックし、曖昧なケース(ユーザーが提案された編集を拒否したが、その理由が不明な場合など)をレビューする。
ユーザー・フィードバックを補完したり、それに代わって人間をループに組み込んだりしたAIプロダクトやサービスの例としては、ソーシャルメディアプラットフォームのコンテンツモデレーション(AIには難しい最も複雑なケースに人間のモデレーターが関与する)や、AI放射線診断サービスのグリーマー(人間の専門家がAI診断を補完し、問題点を修正する)、さらにはディープセンティネルのようなAIセキュリティサービス(AIが脅威を検出し、人間の警備員を配置すべきタイミングを決定し、のちにAIが正しい判断を下したかどうかを警備員が判断する)などがある。
もちろん、人間がループに加わる方法の最大の問題点は、顧客が数十万や数百万になったり、利用頻度が非常に高くなったり、迅速な回答が期待されたりするサービスには、うまく対応できないことだ。メタ・プラットフォームズはフェイスブックのために1万5000人以上のコンテンツモデレーターを雇っているが、これほどの投資をする余裕がある企業は多くない。だから、ループに人間を加えている企業のほとんどは、人間が必要とされる時間を最小限に抑えようとしている。それでも、製品やサービスの初期の学習曲線が最も急な段階では、人間がループに参加するアプローチは非常に有効になりうる。そこでは、AIが学習するにつれて、人間の関与する必要性が急速に縮小することが期待される。
* * *
機械学習アルゴリズムを含むAIが利用しやすくなってきたことは、ほとんどの製品やサービスで、データフィードバックループを意図的につくり出せるようになってきたことを意味する。だが、それが簡単にできる製品もあれば、かなりの工夫が必要な製品もある。たとえば、他の製品と統合したり、ユーザーに最小限の手間をかけてフィードバックを寄せてもらったりするといった工夫だ。
しかし強力なフィードバックループを構築すれば、一種のネットワーク効果(ユーザーが増えれば、もたらされるデータが増えて、製品がより改善され、さらに多くのユーザーを魅了する)を生み出し、複合的な競争優位を生み出せるはずだ。
"To Get Better Customer Data, Build Feedback Loops into Your Products," HBR.org, July 11, 2023.





