「市民」のスキルレベルを考える:何らかの形による市民データサイエンティストは、すでに定着しつつある。先に述べたように、本職のデータサイエンティストの数が足りていないため、稀少な人材にすべてのデータの問題を処理させることは持続不可能だ。

 さらに重要な点は、データの民主化が組織全体にアナリティクスの思考を植えつけるカギとなることである。よく知られているのはコカ・コーラの例で、同社はマネジャーやチームリーダーを訓練するデジタルアカデミーを開設し、プログラムの修了生には製造業務のさまざまな現場で、約20のデジタル、オートメーション、アナリティクスのイニシアティブを実施したと評価している。

 しかし、企業の業務を根本的に変えることもある予測モデルや高度なデータアナリティクスに携わるとなると「市民」のスキルレベルを考慮することが不可欠である。高性能のツールがデータサイエンティストの手に委ねられることには付加的な価値があるが、同じツールが単に「データをいじったことがある」程度の人の手に渡れば、エラーや不正確な予測、疑問の残る結果、アウトカムや結論の誤った解釈を招きかねない。

問題の重要性を評価する:企業にとって問題の重要性が高いほど、専門家によるデータアナリティクスが必須になる。たとえば、経時的な購入傾向の単純なグラフの作成ならば、おそらく、視覚的にアピールする形でデータをダッシュボードに表示できる人がいるだろう。しかし、企業の業務に重大な影響を及ぼす戦略的決断の場合は、専門知識と信頼に値する正確性が要求される。

 たとえば、保険会社がある保険契約の掛け金をいくらに設定するかは、ビジネスモデルそのものの根幹に深く関わるので、この仕事を専門家ではない人に委託するのは賢明ではないだろう。

問題の複雑さを判断する:複雑な問題を解決することは、一般的な市民データサイエンティストの能力を超えている。顧客セグメント間での顧客満足度のスコアの比較(単純、明確に定義された指標、低リスク)と、ディープラーニング(深層学習)による患者のがんの検知(複雑で高リスク)の違いを考えてみてほしい。後者のような複雑な問題を専門家ではない人に委ねて、浅はかな判断、ないしは誤っているかもしれない判断をさせてはいけない。データの民主化が理にかなうのは、問題が複雑ではなくリスクが低い場合である。

 筆者のクライアントであるフォーチュン500企業の例を挙げよう。同社は全業務をデータに基づいて運営している。数年前、筆者が実施した研修プログラムでは、4500人以上のマネジャーを少人数のチームに分け、各チームにアナリティクスによって解決できる重要なビジネス上の問題を明らかにするよう求めた。単純な問題であればソフトウェアのツールで解決する権限がチームにはあった。しかし、浮き彫りになった問題は、ほぼすべてが簡単に解決できるものではなかったのである。

 ここでマネジャーに課せられたのは、実際に難題を解決することではなく、データサイエンスのチームと協力することだった。こうして1000ものチームが1000件ものビジネスチャンスを特定し、アナリティクスが組織に貢献する1000通りもの方法を見出したことは、注目に値する。

特定領域の専門性のある人に権限を与える:もし、顧客Xは顧客Yよりもある商品を購入する可能性が高いというような「方向性」の知見を求めているならば、データの民主化と、やや低いレベルの市民データサイエンスでおそらく十分に対応できるだろう。実際、こうしたやや低いレベルのアナリティクスこそ、(顧客に最も近いという意味で)特定領域の専門性のある人が平易なデータツールを駆使するのに非常によい分野である。ただし、リスクが高く複雑な問題のように、より高い精度が必要な場合には、高度な専門性が要求される。

 最も切実に精度が要求されるのは、ある閾値(いきち)に基づいて高いリスクを伴う判断が成される場合である。たとえば、がんの可能性が30%を上回ったら相当な副作用を伴う積極的治療プランを適用する場合、29.9%と30.1%を区別することは重要である。特に医薬品や臨床業務、技術業務、そして非常に小さな利幅を大規模に獲得するために市場とリスクをかいくぐる金融業では、精度が物を言う。

バイアスは専門家に探らせる:高度なアナリティクスやAIは、「バイアスがある」と見なされる判断に至りやすい。アナリティクスの核心は「差別」すること、つまりある変数に基づいて選択し判断するという側面があるので、なかなか難しい問題である。(たとえば、このオファーをこの年配の男性には送るが、この若い女性には送らないというのは、異なる購買行動で反応すると思われるからである)。

 そこで重要なのは、どのような場合にそうした「差別」が容認され、適切とさえ見なされるか、そしてどのような場合に問題を抱え、不公平で、企業の評判を危険にさらすかを見極めることである。

 たとえばゴールドマン・サックスは、クレジットカードであるアップルカードの女性の信用限度額を男性よりも低く設定したことについて、差別として非難を浴びた。同社のモデルではジェンダーを基準としておらず、信用履歴と所得以外の要素は用いていないと、ゴールドマン・サックスは説明した。しかし、そもそも信用履歴と所得はジェンダーと相関関係があるので、こうした変数を用いることは、平均して男性よりも所得が低く、歴史的に見て信用を築く機会に恵まれなかった女性に罰を与えるものだという主張もできるだろう。

「差別」が生じるアウトプットを利用する時には、意思決定者もデータの専門家も、データ生成の経緯、データの相互関連性、待遇の格差などの計測方法、そのほかの多くのことを理解する必要がある。

 企業は、市民データサイエンティストのみにモデルのバイアスの有無に関する判断を委ねて、自社の評判を危険にさらすことがあってはならない。

 データの民主化には利点があるが、課題もある。すべての人にデータのキーを渡したからといって全員が専門家になるわけではなく、誤った知見が集まれば大惨事を招きかねない。新しいソフトウェアツールによって誰もがデータを利用できるようになっても、アクセスの普及と本物の専門性を取り違えてはならないのである。


"When to Give Employees Access to Data and Analytics," HBR.org, May 24, 2023.