AIによる株価予測で明らかになったLLMの限界
HBR Staff/young84/Getty Images
サマリー:金融分析におけるAI活用が加速する中、偏見や情報不足に起因する予測精度の低下が大きな課題となっている。ハーバード・ビジネス・スクールの研究によれば、チャットGPTが中国企業に対し過度に楽観的な予測を下した背景には、現地ニュースの欠落という「情報の非対称性」が存在することが判明した。AI依存のリスクを認識し、データの網羅性を精査する姿勢が不可欠である。本稿では、AIの「外国バイアス」の実態とその対策について紹介する。

AIモデルのバイアスに関する意外な結果

 本稿はハーバード・ビジネス・スクールのワーキング・ナレッジによって作成されたもので、教授のチャールズ C. Y. ワンの知見を紹介している。

 金融アナリストの間では、企業評価で優位に立つためにAIを活用する動きが急速に広がっている。しかし、大規模言語モデル(LLM)による銘柄推奨を鵜呑みにする前に、考慮すべきことがある。AIの分析には偏見や誤りが含まれている可能性があるということだ。

 ハーバード・ビジネス・スクール教授のチャールズ C. Y. ワンらの研究によると、米オープンAIが運営するチャットGPTは、中国のライバル企業ディープシークと比較して、中国の上場企業約5000社の評価においてはるかに楽観的な予測を下し、目標株価を高く見積もり、「買い」を推奨する比率も高かった。この驚くべき結果の背景には、情報の可用性の格差がある。チャットGPTは、中国メディアの報道を十分に網羅できていないと考えられるのだ。

 幅広い業界の企業がアルゴリズムによるスピードと効率化を求める中で、本研究の結果は警鐘を鳴らしている。欠落している可能性のあるデータを考慮せずにAIモデルに過度な依存をすることは、リスクを伴うということだ。ブルームバーグ・インテリジェンスによれば、金融業界におけるAIへの依存は加速しており、現在、世界の機関投資家の約40%が市場分析にAIを使用している。

「ミクロな視点で、我々はチャットGPTとディープシークにおける金融分析の違いを調査している。しかし、メタ的な視点に立てば、投資家やアナリストがグローバルな金融分析にこれらのツールを導入する際、何を意識すべきかという問題になる」と、タンドン・ファミリー記念講座教授で経営学を担当するワンは語る。

 ワンは、メリーランド大学准教授のショーン・カオ、香港理工大学助教授のイー・シャンと共同で、ワーキングペーパー“When LLMs Go Abroad: Foreign Bias in AI Financial Predictions”(未訳)を執筆した。

極めて強気なチャットGPT

 ワンの研究チームは、上海および深圳証券取引所に上場している4978社のデータベースを作成し、総資産、総資産利益率(ROA)、レバレッジなどのデータを入力した。これにより、両方のAIモデルが推奨を行うための同一の基礎データを用意した。

 両モデルの学習が終了した2024年6~7月頃、研究者らはチャットGPT-4.1とディープシーク-R1に対し、プロの金融アナリストになりきって半年後の2024年12月31日時点における各社の株価を予測するよう指示した。これにより、予測と実際の株価を照らし合わせることができる。また、各銘柄が上昇するか下落するかを予測させ、投資推奨の根拠とした。

 結果、以下のことが明らかになった。

チャットGPTは中国企業に対して特に強気であった。同モデルは、ディープシークよりも株価を約12.5%高く見積もり、「買い」を推奨する頻度も1.3パーセンテージポイント高かった。

チャットGPTの予測には誤りが多かった。投資家がそのアドバイスに従っていたら、期待外れの結果に終わっていただろう。実際の年末株価で検証したところ、チャットGPTの絶対予測誤差はディープシークより13%大きく、銘柄推奨の精度も低かった。