データの品質はチームの生産性に直結している膨大なコストの発生源を特定するアプローチ

Westend61/Getty Images

サマリー：質の低いデータの存在は、正確な分析や予測を行うために必要な情報を欠き、時間やリソースを無駄にすることにもなるため、生産性を低下させる可能性がある。本稿では、企業が用いているデータの品質が、高いのか低いのかを測定するための手法を解説する。さらにデータの品質を向上させるための4つのアプローチを提案する。データの品質と生産性は直結しており、データの品質向上への取り組みは地道なものになるが、その取り組みの価値は高いという。

質の低いデータが生産性の向上を妨げる

　新しいテクノロジーは原則として、企業の生産性向上に貢献するものだ。

　たとえば、物流システムは企業が必要とし適切な量を確保できるようにするし、オペレーションシステムは製品・サービスの生産と提供を自動化するために役立つ。意思決定支援システムによって、よりよい判断に必要な分析と予測がマネジャーの手元で行えるようになる。

　そのうえ、パンデミック下で多くの企業がデジタル化を加速させた。ならばその生産性はいちだんと高まったはずである。だが残念なことに、現実は違った。

　生産性の伸びが低い理由は諸説さまざまだが、筆者の考えでは、一つ根本的な原因がある。そして重要な点として、そこに生産性を高める方法が存在する。

　すなわち、デジタル技術はデータによって支えられているが、質の低いデータがあまりに多く、生産性向上の可能性を打ち消しているのだ。

　新しいテクノロジーの普及に対して、データ管理はそのペースに追いついておらず、膨大なコストと摩擦を生んでいる。生産性を上げるカギは、低品質のデータが発生する根本原因を取り除くことにある。

データの良し悪しは何で決まるのか

　オペレーション、意思決定、計画策定、データサイエンスにおいて意図された用途に適しているデータであることが、高品質のデータの定義である。この定義には多くの側面がある。各用途にはそれぞれ異なる要件があり、それらが満たされなければ生産性は下がる。例として、3つのシナリオを考えてみよう。

　第1のシナリオでは、営業担当者はマーケティング部から提供されるリード（見込み客）データに依存して仕事を進めている。必要とされるのは比較的小規模なデータ（データ要素は約20項目程度）だが、記録は完全かつ正確でなくてはならない。

　したがって、「連絡先の氏名」が抜けている場合、あるいは間違っているがその誤記が簡単に見つかる場合、営業担当者が氏名の特定や修正をしなければならない。これは大変な作業であり、かなりの時間を要する。さらに悪いことに、もし間違いを見逃せば売上げを失うことになりかねない。どちらの場合も生産性は下がる。

心理的安全性は高いほど好ましいとは限らない

組織文化/組織開発

Read now

　上記の「リードデータ」と「営業」は、「売上データ」と「オペレーション」、「在庫管理部の受注データ」と「財務」など、ある部門が別の部門のデータに依存する数百のパターンのどれにでも置き換え可能であることに留意してもらいたい。

　第2のシナリオでは、マネジャーは予算を組むために、前四半期に自社が何人の新規顧客を獲得したかを知る必要がある。マネジャーは財務部からのデータと、顧客関係管理（CRM）システムのデータの両方を使う。この2つのデータを使う理由はどちらのデータも、あらゆる人が信頼できる答えを示すことがないからだ。

　営業部は最初の契約が成立した時点で新規顧客の獲得を計上するのに対し、財務部は最初の請求が支払われる時まで新規顧客の獲得を計上しないという点も、さらなる問題が生じる原因となる。

　ほとんどの四半期において数字は「おおむね一致する」が、食い違いが大きい場合、マネジャーは財務部とCRMシステムの両データを深く掘り下げて解決するよう部下に指示しなくてはならない。それでもなお、その「答え」はけっして完全には信頼できないため、新たな予算は実質的に、データよりも当て推量に基づくのが現実だ。予算が多すぎれば無駄に使われる金が増え、少なすぎれば機会を逃す。このシナリオも、細部は違えど本質部分は日々繰り返し起きている。

　第3のシナリオでは、人工知能（AI）を使って顧客維持を強化するアルゴリズムの開発を行う。訓練データセットにはかなりの精度が求められ、さまざまなデータソースが整合していなければならない。そうでなければデータサイエンティストは、データの前処理をして整える作業に時間を費やすことを余儀なくされる。

　加えて、それらのソースからバイアスを取り除く必要があるが、これは特にやっかいな作業になる可能性がある。バイアスは、新しいアルゴリズムが使われた後で初めて明らかになるからだ。そしてアルゴリズムの稼働後には、さらなるデータ要件が加わる。

　このような課題のすべてに対処するコストは膨大になりうるが、機会損失によるコストのほうがさらに深刻だ。質の低いデータは、AIの活用とデジタル・トランスフォーメーション（DX）を困難にさせ、企業の生産性向上の可能性を奪う。