SNS、電子マネー、GPSなどの普及によって、ビッグデータの収集は非常に容易になった。また、AI、ディープラーニングをはじめビッグデータを活用するための技術も飛躍的な進化を遂げている。ビッグデータの効果的な利活用が広がるにとによって、どんな未来が開けるのだろうか。ビッグデータ利活用技術研究の第一人者である国際大学グローバル・コミュニケーション・センター准教授の中西崇文氏に伺った。
インフラ、センサーから、エクスチェンジの時代

――「ビッグデータは次世代につないでいくための基礎技術」と位置づけていますが、そもそも「ビッグデータ」の本質とは何なのでしょうか。
「ビッグデータ」は3V(Volume/データ量、Velocity/発生頻度、Variety/多様性)によって語られますが、私は、ここから派生して「データが現実世界を表すだけの解像度を手に入れた」と説明しています。
従来のやり方と比較してみると、これまでは、何かを知ろうとした時には、まず仮説を立てる必要がありました。次に、その仮説を検証するために母集団からサンプリングしたデータを分析して、そこから現実社会を推定していました。これは、かなり大変な作業ですし、タイムラグもあります。
それに対して、ビッグデータは現実世界そのものなので、データが取れたら、すぐ分析できます。タイムラグはまったくない世界なのです。わかりやすい例はグーグルの渋滞予測でしょう。実は仕組みは簡単です。渋滞予測のアプリを立ち上げている人たちのGPS情報から、車がどのくらいの速度で走っているのかを割り出しているだけなのです。人間が推定などする必要はありません。上がってくるデータが、そのまま渋滞の現実だからです。
――従来のデータ分析の時代からビッグデータの時代に移行できた技術的なポイントを教えてください。
私はそれを「ビッグデータの波」と呼んでいます。第一の波では、データを保持したり、処理したりするための技術が急速に発達しました。代表例はクラウドコンピューティングや並列処理のHadoopなどです。また、キーバリュー型データストアという、これまでとは全然違うデータの保持の仕方も出てきました。第一の波を「インフラストラクチャーの波」と呼ぶこともあります。
第二の波は、「センサーデータの波」です。Suicaなどの電子マネー、スマホやカーナビなどに搭載されたGPSなど、データを集めるための技術が発展し、それが身近な場所に爆発的に普及してきたわけです。
第一の波で、すでにデータを保持したり、処理したりするインフラは整っていましたから、第二の波で集められるようになった膨大なデータは、いつでも活用できる状態になりました。現在は、集めたデータをどう利活用できるのかを考える時期に入ったのです。企業はさまざまなデータを持っているので、研究者の間でも、企業と組んで研究することが非常にホットなトピックになっています。
利活用の方法が確立されると、次は「エクスチェンジ」の波がやってくるはずです。それは企業同士でお互いが持つデータを交換したり、組み合わせたりすることで新たな価値を生み出すことです。