
質の低いデータが生産性の向上を妨げる
新しいテクノロジーは原則として、
たとえば、
そのうえ、
生産性の伸びが低い理由は諸説さまざまだが、筆者の考えでは、
すなわち、デジタル技術はデータによって支えられているが、
新しいテクノロジーの普及に対して、
データの良し悪しは何で決まるのか
オペレーション、意思決定、計画策定、データサイエンスにおいて意図された用途に適しているデータであることが、高品質のデータの定義である。この定義には多くの側面がある。各用途にはそれぞれ異なる要件があり、それらが満たされなければ生産性は下がる。例として、3つのシナリオを考えてみよう。
第1のシナリオでは、営業担当者はマーケティング部から提供されるリード(見込み客)データに依存して仕事を進めている。必要とされるのは比較的小規模なデータ(データ要素は約20項目程度)だが、記録は完全かつ正確でなくてはならない。
したがって、「連絡先の氏名」が抜けている場合、あるいは間違っているがその誤記が簡単に見つかる場合、営業担当者が氏名の特定や修正をしなければならない。これは大変な作業であり、かなりの時間を要する。さらに悪いことに、もし間違いを見逃せば売上げを失うことになりかねない。どちらの場合も生産性は下がる。
上記の「リードデータ」と「営業」は、「売上データ」と「オペレーション」、「在庫管理部の受注データ」と「財務」など、ある部門が別の部門のデータに依存する数百のパターンのどれにでも置き換え可能であることに留意してもらいたい。
第2のシナリオでは、マネジャーは予算を組むために、前四半期に自社が何人の新規顧客を獲得したかを知る必要がある。マネジャーは財務部からのデータと、顧客関係管理(CRM)システムのデータの両方を使う。この2つのデータを使う理由はどちらのデータも、あらゆる人が信頼できる答えを示すことがないからだ。
営業部は最初の契約が成立した時点で新規顧客の獲得を計上するのに対し、財務部は最初の請求が支払われる時まで新規顧客の獲得を計上しないという点も、さらなる問題が生じる原因となる。
ほとんどの四半期において数字は「おおむね一致する」が、食い違いが大きい場合、マネジャーは財務部とCRMシステムの両データを深く掘り下げて解決するよう部下に指示しなくてはならない。それでもなお、その「答え」はけっして完全には信頼できないため、新たな予算は実質的に、データよりも当て推量に基づくのが現実だ。予算が多すぎれば無駄に使われる金が増え、少なすぎれば機会を逃す。このシナリオも、細部は違えど本質部分は日々繰り返し起きている。
第3のシナリオでは、人工知能(AI)を使って顧客維持を強化するアルゴリズムの開発を行う。訓練データセットにはかなりの精度が求められ、さまざまなデータソースが整合していなければならない。そうでなければデータサイエンティストは、データの前処理をして整える作業に時間を費やすことを余儀なくされる。
加えて、それらのソースからバイアスを取り除く必要があるが、これは特にやっかいな作業になる可能性がある。バイアスは、新しいアルゴリズムが使われた後で初めて明らかになるからだ。そしてアルゴリズムの稼働後には、さらなるデータ要件が加わる。
このような課題のすべてに対処するコストは膨大になりうるが、機会損失によるコストのほうがさらに深刻だ。質の低いデータは、AIの活用とデジタル・トランスフォーメーション(DX)を困難にさせ、企業の生産性向上の可能性を奪う。