次なるAIの飛躍的前進は言語領域で

 2010年代には、ウェブ上での高精度の画像検索や、医療関連の画像分析や製造・組み立て現場での欠陥品検出のためのコンピュータビジョンなど、視覚関連のテクノロジーが目覚ましい進歩を見せた。この点は、我々の著書で詳しく論じてきた通りだ。

 そして、オープンAIが開発したGPT-3を見る限り、2020年代には言語関連の課題処理で飛躍的な進歩が起きそうに見える。

 過去の言語処理モデルは、構文解析ルールの手動入力によるコーディングと、統計の手法を土台にしている。この10年ほどは次第に、人工ニューラルネットワークの活用も進んでいた。人工ニューラルネットワークは生データから学習することができ、日常的なデータラベリングと特徴量エンジニアリングの作業負担が既存の手法よりはるかに少なくて済む。

 GPT(事前学習済み生成システム)は、このさらに上を行く。これはトランスフォーマー、すなわちテキスト内の言葉と言葉の文脈上の関係を学習するアテンション機構を用いるものだ。

 GPT-3の非公開ベータ版へのアクセスを認められた研究者たちは、ショートストーリー、楽曲、プレスリリース、技術マニュアル、特定の作家の文体に準拠した文章、ギターの譜面、さらにはコンピュータのコードまで生み出すことができた。

 GPT-3は、完璧なテクノロジーとはとうてい言えない。欠点はきわめて多い。たとえば、意味不明な反応やバイアスに毒された反応を生み出したり、些細な質問に不正確な回答をしたり、もっともらしいけれど誤ったコンテンツを生み出したりする。

 オープンAIの上層部も、GPT-3への過剰な期待に釘を刺している。要するに、不十分な点がまだ非常に多い。それでも、大きな流れはもう変わらない。AIの新しいステージは、すぐそこまで来ているのだ。

 GPT-3は、いま登場しつつある高度なトランスフォーマーの中の一つにすぎない。マイクロソフト、グーグル、アリババ、フェイスブックといった企業はすべて、独自のトランスフォーマーの開発に取り組んでいる。

 これらのツールはクラウド上で学習を行い、クラウド上のアプリケーション・プログラミング・インターフェイス(API)を介してしか利用できない。次世代AIの能力を活用したい企業は、レガシーシステムではなく、GPT-3のようなクラウドのAIサービスにリソースを投入するように転換していくだろう。