-
Xでシェア
-
Facebookでシェア
-
LINEでシェア
-
LinkedInでシェア
-
記事をクリップ
-
記事を印刷
AIモデルのバイアスに関する意外な結果
金融アナリストの間では、企業評価で優位に立つためにAIを活用する動きが急速に広がっている。しかし、大規模言語モデル(LLM)による銘柄推奨を鵜呑みにする前に、考慮すべきことがある。AIの分析には偏見や誤りが含まれている可能性があるということだ。
ハーバード・ビジネス・スクール教授のチャールズ C. Y. ワンらの研究によると、米オープンAIが運営するチャットGPTは、中国のライバル企業ディープシークと比較して、中国の上場企業約5000社の評価においてはるかに楽観的な予測を下し、目標株価を高く見積もり、「買い」を推奨する比率も高かった。この驚くべき結果の背景には、情報の可用性の格差がある。チャットGPTは、中国メディアの報道を十分に網羅できていないと考えられるのだ。
幅広い業界の企業がアルゴリズムによるスピードと効率化を求める中で、本研究の結果は警鐘を鳴らしている。欠落している可能性のあるデータを考慮せずにAIモデルに過度な依存をすることは、リスクを伴うということだ。ブルームバーグ・インテリジェンスによれば、金融業界におけるAIへの依存は加速しており、現在、世界の機関投資家の約40%が市場分析にAIを使用している。
「ミクロな視点で、我々はチャットGPTとディープシークにおける金融分析の違いを調査している。しかし、メタ的な視点に立てば、投資家やアナリストがグローバルな金融分析にこれらのツールを導入する際、何を意識すべきかという問題になる」と、タンドン・ファミリー記念講座教授で経営学を担当するワンは語る。
ワンは、メリーランド大学准教授のショーン・カオ、香港理工大学助教授のイー・シャンと共同で、ワーキングペーパー“When LLMs Go Abroad: Foreign Bias in AI Financial Predictions”(未訳)を執筆した。
極めて強気なチャットGPT
ワンの研究チームは、上海および深圳証券取引所に上場している4978社のデータベースを作成し、総資産、総資産利益率(ROA)、レバレッジなどのデータを入力した。これにより、両方のAIモデルが推奨を行うための同一の基礎データを用意した。
両モデルの学習が終了した2024年6~7月頃、研究者らはチャットGPT-4.1とディープシーク-R1に対し、プロの金融アナリストになりきって半年後の2024年12月31日時点における各社の株価を予測するよう指示した。これにより、予測と実際の株価を照らし合わせることができる。また、各銘柄が上昇するか下落するかを予測させ、投資推奨の根拠とした。
結果、以下のことが明らかになった。
・チャットGPTは中国企業に対して特に強気であった。同モデルは、ディープシークよりも株価を約12.5%高く見積もり、「買い」を推奨する頻度も1.3パーセンテージポイント高かった。
・チャットGPTの予測には誤りが多かった。投資家がそのアドバイスに従っていたら、期待外れの結果に終わっていただろう。実際の年末株価で検証したところ、チャットGPTの絶対予測誤差はディープシークより13%大きく、銘柄推奨の精度も低かった。







