垂直方向に活用する

 LLMは、従来型の検索エンジンにおける特定の要素を強化することになりそうだが、現時点ではグーグル検索を王座から引きずり降ろせるとは思えない。ただし、ほかの種類の検索に変化をもたらすという点では、より破壊的で革命的な役割を果たすことができる。

 検索3.0の時代に起こる可能性が高いのは、垂直検索のために、意図的かつ透明な形でキュレーションされたデータで慎重に訓練されたLLMの台頭だ。つまり、専門化された、分野特化型の検索エンジンである。

 垂直検索はLLMの有力な用途であり、それにはいくつか理由がある。まず、垂直検索の焦点は特定の分野と用途、つまり狭く深い知識だ。このため、高度にキュレーションされたデータセットに基づいてLLMを訓練するのが容易になり、そのデータセットには出所とモデルの技術的詳細について説明した包括的なドキュメントを含めることができる。また、それらのデータセットを適切な著作権、知的所有権、プライバシーの法とルールと規制によって管理しやすくなる。

 加えて、より小規模で対象を絞った言語モデルであるため計算コストが下がり、より頻繁に再訓練できるようになる。最後に、これらのLLMは第三者の専門家による定期的な試験と監査を受けることになる。規制を受ける金融機関で使われる分析モデルが、厳格な試験要件を課されるのと同様だ。

 過去の事実とデータに根差した専門知識が仕事で重きを占める分野では、垂直型LLMは、人間をまったく新しい方法で補強する新世代の生産性ツールを提供することができる。

 次のように想像してみよう。査読付きの医学専門誌と医学教科書で訓練されたチャットGPTが、医療専門家の研究アシスタントとしてマイクロソフトオフィスに組み込まれる。あるいは、金融分野で一流のデータベースと専門誌からの、数十年分の金融データと金融論文で訓練されたチャットGPTを、銀行アナリストが研究のために使う。また、コードの作成やデバッグを行い、開発者からの質問に答えるようLLMを訓練するなども考えられる。

 企業と起業家は、LLMを垂直検索のアプリケーションに適用する有力な用途があるか否かを判断する際、5つの問いを自問するとよい。

1. 対象のタスクやプロセスは従来、綿密な調査・研究や、特定分野の深い専門知識を必要とするだろうか。

2. タスクの結果は、総合的な情報やインサイトや知識として提供され、ユーザーの行動や意思決定を後押しするだろうか。

3. AIを垂直検索領域の専門家にすべく訓練するための、過去の技術データや事実データは十分にあるだろうか。

4. LLMに最新の情報を提供させるために、新しい情報を用いて適切な頻度で訓練できるだろうか。

5. 訓練データに含まれる見解、仮説、情報をAIが学習し、複製して永続させることは、合法かつ倫理的だろうか。

 上記の問いに自信を持って答えるためには、ビジネス、テクノロジー、法律、財務、倫理の観点を結びつける学際的な視座が求められる。5つの問いすべての答えが「イエス」であれば、垂直型LLMの有力な用途が存在する可能性は高い。

騒ぎが落ち着いてから

 チャットGPTの背後にあるテクノロジーは素晴らしいが、独占的なものではなく、近いうちに容易に模倣可能となりコモディティ化する。チャットGPTのみごとな回答に対する世間の熱狂は時とともに薄れ、現実と限界が露呈し始めるだろう。

 したがって投資家とユーザーは、上記で論じてきた技術的、法的および倫理的課題への対処に注力している企業に注目すべきである。これらの領域は、プロダクトの差別化が起こりAI競争の勝者が最終的に決まる、最前線なのだ。


"Generative AI Won't Revolutionize Search - Yet," HBR.org, February 23, 2023.