マネジャーは社内のデータ・アナリストに
何をどう訊くべきか
2.データの分布に関する質問
マネジャーがすべき質問:「あなたが集めたデータはどのように分布していますか?」
回答を受け、考えるべきこと:分布について説明できないようなら、まともなアナリストとはいえない。よいアナリストなら、どんな変数に関してもデータの分布の視覚的な要素をすでに見ているはずだし、提示することができるはずだ。
ある変数が別の変数の予測因子であるかもしれないと思うのであれば、「散布図」を出すよう求め、データが線形のパターンで示されるかどうか確認するとよい。これは2つの変数間の強力な相関関係を表す(左の散布図のX軸は説明変数、Y軸は応答変数)。
確認すべきこと:「データは正規分布に従っていますか?」
回答を受け、考えるべきこと:データは正規分布していない(たとえば、釣鐘型曲線を描いていない)とアナリストが言うのなら、「ノンパラメトリック統計」と呼ばれる別の統計手法を適用する必要があり、標準偏差や相関のような一般的な手法は適切ではない(右は正規分布の例)。
分析結果を分布に基づいてどう調整したのか尋ねてもよい。たとえばノンパラメトリック検定は、同じ統計的信頼度を得るためにより多くのサンプルを必要とすることが多い。
さらに確認すべきこと:「明らかな異常値はありませんでしたか?」
データは正規分布しているが異常値(パターンに適合しない想定外の値)がいくつかある場合には、それが何を意味するのか、どう扱うつもりなのかを質問してみるとよい。場合によっては削除するのが妥当かもしれない(コーディングのエラーによる異常値など)。
おおむね、このような感じである。あなたがデータに関心があって、ある程度の知識があり、意思決定の成果を高めるために力を注いでいることを、問答を通して示すことが重要である。アナリストよりも自分のほうが知識があるとか、アナリストが何か隠そうとしているなどと指摘するために質問するのではない。こうした会話のキモは、決算報告を発表している部門長とCEOが交わす会話と同様である。穏やかに問いかけることが望ましい。
HBR.ORG原文:What to Ask Your "Numbers People" July 12、2013
■こちらの記事もおすすめします
データに基づく意思決定」はもはや競争優位の常識である
適切なデータ分析アプローチを選択せよ
ビッグデータのキーワードに振り回されないために

トーマス H.ダベンポート(Thomas H. Davenport)
バブソン大学の特別教授。情報技術・経営学を担当。マサチューセッツ工科大学センター・フォー・デジタル・ビジネスのリサーチ・フェロー。インターナショナル・インスティテュート・フォー・アナリティクスの共同創設者。デロイト・アナリティクスのシニア・アドバイザーも務める。
- 第11回 マネジャーは社内のデータ・アナリストに 何をどう訊くべきか (2014.03.05)
- 第10回 ビッグデータ時代のマネジャーに求められる、「データを伝える力」 (2014.02.24)
- 第9回 P&Gは情報をどうビジュアル化しているか (2014.02.07)
- 第8回 「サービス・プロフィット・チェーン」が 今なお重要である理由 (2014.01.31)
- 第7回 企業内でソーシャルツールを上手に活用する方法 (2013.02.13)