生成AIは、いかにして「大量の文書」を価値あるインサイトに転換できるか
HBR Staff/Unsplash
サマリー:生成AIの進化は、膨大な非構造化データを意思決定に直結する資産へと変貌させている。特に米国の上場企業が証券取引委員会に義務として提出する年次報告書の「10-K」などの規制文書は、企業の真の戦略的活動を捉える「宝の山」であり、AIによる解析で競合比較や市場の収れん、経済的シグナルの抽出が可能となる。本稿では、気候変動ソリューションに関する研究を例に、AIがいかにして情報の質を高め、リーダーの事前信念をアップデートし、戦略的判断を支えるインサイトを生成するかを解説する。

生成AIは「テキストの山」を利用可能な情報に転換する

 適切な意思決定のためには、常に情報が必要不可欠だ。だが、社内や市場において最も価値ある情報の一部は、内容は濃いが構造化されていない文書に埋もれたままになっている。たとえば、年次報告書、契約書、顧客のフィードバック、技術マニュアル、社内メモなどだ。問題は、情報が存在しないことではない。多数の文書や企業、そして長い年月にまたがる情報を体系的に抽出することになれば、時間とコストがかかり、一貫性を保つのが難しい点にある。

 最近の生成AIは、その制約に変化をもたらしている。リーダーは最新のモデルを使用することで、「文書(テキスト)という宝の山」を、構造化された、すぐに意思決定に利用可能な情報へと転換できる。この情報は、経時的に追跡でき、同業者と比較でき、成果にも結びつく一貫した指標となる。

 それを具体的に示すために、筆者らは今日の最も重要な機会領域の一つである、気候変動ソリューションを研究することにした。気候変動ソリューションとは、脱炭素を可能にする製品やサービスのことで、さまざまな電池、電気自動車(EV)、エネルギー貯蔵、太陽光や風力による再生可能エネルギー、リサイクル素材、植物性プロテイン、エネルギー効率化ソリューション、バイオ燃料などが含まれる。

 だが、これらの分野で成長を促す新たな投資を検討している多くのリーダーは、こうした変化を認識してはいるものの、依然として基本的な問いにぶつかる。実際のところ、誰が気候変動ソリューションを構築し、販売しているのか。どこに機会が生じているのか。財務諸表を見ても、「気候変動ソリューションの収益」という項目は標準化されていないのだ。

 筆者らの最近の研究では、生成AIは規制文書(規制当局への提出が求められる、規制に準拠した文書)をデータとして処理することにより、その疑問に答えられることを明らかにした。具体的には、企業のフォーム10-K(公開企業が米国証券取引委員会への提出を義務づけられている年次報告書)の第1項(「事業の概要」)に、微調整したGPTモデルを適用して、企業の気候変動ソリューションの製品やサービスの開発や導入について、企業ごとに年間指標を作成した。第1項に注目した理由は、製品やサービスについての詳細な説明があること、そして毎年、米国のあらゆる公開企業についてこの情報を入手できることだ。10-Kは、AIによる系統的分析にとって望ましい3つの特徴を備えている。それはすべての意思決定者が留意すべきものだ。

・10-Kは標準化された、規制当局への提出書類であり、詳細な調査と経営幹部による認証の対象となるため、信用性が比較的高い。

・ほぼすべての上場企業が提出を義務づけられているので、選択バイアスという根本的な問題を防げる。情報が開示されていない場合でも、それが戦略的な非開示である可能性は、任意で開示されるデータと比べて低い。

・企業間、年次間で標準化されているので、AIシステムで大規模に処理することが可能であり、長期間にわたって反復的な測定ができる。

 次に私たちは、気候変動ソリューションに関連するセンテンスを検出するように、GPTモデルを微調整した。そこには一般的な気候変動関連のセンテンスは含まれない。たとえば、EVの販売は該当するが、EVを単に社用車として使用することは該当しないというように区別する。その微妙な差異をGPTモデルに把握させるため、各業界の文書から抽出した、3500件に及ぶ第1項のセンテンスのラベルつきデータセットによって微調整した。その後、このモデルを使用して、2005年から2022年までの米国企業4483社による3万9710件の10-K文書の第1項からすべてのセンテンスを分類した。全体として、約1000万個のセンテンスを処理した。

 筆者らは、『ネイチャー・コミュニケーションズ』誌に最近掲載された論文で、本件の手法、データ、調査結果を発表した。そして、この研究過程から、気候変動ソリューションの領域にかかわらず、生成AIが経営幹部の意思決定に用いられる情報の質をどのように高められるかについて、一般化できる3つの重要ポイントを特定した。AIは、競合他社、サプライヤー、顧客に関する規制対象の公開データが豊富にある環境で、実行可能なインサイトを生成する能力があることが、研究により明らかになった。リーダーはそうしたインサイトによって、競争環境の変化を迅速に察知し、より体系的で、エビデンスに基づいた戦略的判断を下すことができる。