データの利活用が意思決定の成否を左右するいま、良質なデータを大量に保有することは国と企業の競争力に直結する。筆者らは、これを国別で評価するという壮大な取り組みを実施した。その結果、デジタルエコノミーを基本とする新たな世界では、従来とは異なる勢力図が描かれることが判明した。


 データの生成でトップに立っている国はどこか。マッキンゼーの推定によれば、人工知能(AI)が搭載されたデータ主導型のアプリケーションは、2030年までに13兆ドルのグローバルな経済活動を新たに生み出すとされ、次の世界秩序はデータの生成によって決まる可能性がある。これは、20世紀の経済大国の出現に石油が果たした役割と同じである。

 AI超大国の座には、中国と米国が収まるのかもしれない。しかし石油主導型経済とは異なり、データソースを限られた地点に集中させることはできない。多種多様なソースが必要であり、未来のAI搭載アプリケーションが、予期せぬ新たなプレイヤーから出現することもある。とりわけ、データは驚異的なペースで生成されていることから、形成されつつある新しい世界秩序は、単純な二極構造より複雑なものになる可能性が高い。

 我々は以前、世界の国々をデジタルの進化競争力という観点でマッピングした。これを土台にして、有益なデータが最も濃密かつ広範に集まっているのはどこかを突き止めたいと考えていた。

 AIに欠かせない無数の機械学習モデルを実行するには、有益なデータが必要不可欠である。そのためには、生成されたままの未加工のデータ量と、我々が命名した測定基準である「データ総生産(gross data product)」、いわゆる新GDPは区別したほうがよい。

「データ総生産」でトップの国を特定するため、我々が提案したい基準は以下の4つである。

1. 使用量:各国で使用されているブロードバンドの絶対量。生成された未加工のデータ量を表す。
2. 利用人数:インターネット利用者数。利用行動やニーズ、背景の広がりを表す。
3. アクセシビリティ:データフローに対する制度上の開放性。国内で生成されたデータを、複数のAI研究者、イノベーター、アプリケーションが広範に利用しアクセスできるかを評価する手法。
4. 複雑さ:1人当たりのブロードバンド使用量。デジタル活動の高度さや複雑さを表す。

 ここには、注意すべき細かなポイントがいくつかある。

 第1に、世界でコンピュータがつくり出すデジタルトレースは幅広い活動にわたり、SMSのテキストメッセージの送信から金融取引にまで及ぶ。我々は世界中で同一条件による比較を可能にするため、そのような広範さや複雑さの指標として、1人当たりのブロードバンド使用量を用いた(全体の豊かさを表すために1人当たりの所得が使われるのと同じである)。

 第2に、政府機関の間で個人情報がどのように共有されるか、個人とデジタル活動を結び付けるのに役立つデジタル・アイデンティティの枠組みが備わっているか否かが、国によって異なる点だ。こうした制度的な要素によって、データが最終的にどう結びつけられるかが異なる場合があるが、我々はこの違いには留意していない。

 分析対象国は、次の事項を検討して決定した。(1)以前実施した「デジタル・エボリューション・インデックス」のスコアが高い、あるいはデジタル活動の勢いが強いという理由から、グローバルなデジタル経済への貢献度が大きい国、(2)地域や社会経済的地位の観点から、デジタルがある程度普及している国、(3)分析に必要となる確実なデータや証拠が手に入る国、である。

 最後に、アクセシビリティを判断するうえで重要な検討材料は、プライバシーである。プライバシー問題やデータ保護規制は、アルゴリズムによる新たな能力の構築を下支えする可能性もあれば、その妨げになる可能性もある。

 この分析において我々は、プライバシー確保やデータ保護の確立された枠組みと、データの移動に対する開放性は、それらを掛け合わせてもメリットのほうが大きく、長期的なAIの開発にとってプラスであるという立場をとっている。一例として、金融取引における不正検知の問題について考えてみよう。

 多様な立地や複数の利用形態から得られた知見を活用したアプリケーションは、信頼性のパターンを構築し、セキュリティリスクにフラグを立てる際に役立つ。このようなアプリケーションにとっては、アクセシビリティの基準を満たしたシステムが強みとなる。

 とはいえ、一部の国では近いうちに、国境をまたいだデータの可動性がほとんどなく、プライバシーや開放性で基準を下回っても、官民でのデータ共有が「壁に囲まれた庭(クローズド・プラットフォーム)」内でのアルゴリズムの強化に、しばしの強みを与える可能性があることを認識している。その突出した例が中国である。