データサイエンティストが磨くべき4つのスキル
HBR Staff; Westend61/Getty Images; Unsplash
サマリー:データサイエンティストの役割は、データ分析や優れたモデルの構築と考える人は多いだろう。しかし実際、その役割は問題解決や戦略、意思決定などを含む、とても広範なものである。本稿では、現在と未来のデータサイ... もっと見るエンティストがビジネスに最大の価値をもたらす能力を磨くうえで役立つ、4つの重要なスキルと能力分野から成るフレームワークを紹介する。 閉じる

データサイエンティストが能力を見直すフレームワーク

 筆者は年に一度、データサイエンティスト志望者向けの講座を担当する。初回の授業の冒頭で、学生たちに何を学びたいか尋ねる。彼らの答えは「データ分析」や「優れたモデルの構築」が多い。

 これらの反応を、筆者が主催する現役データサイエンティスト向けのワークショップと比べてみよう。彼らは仕事について議論する時、学生たちとは異なる言葉を使い、自分たちの仕事を「問題解決」と呼ぶ。方向性は正しいが、彼らの役割を表すにはこれでも限定的すぎる。

 農業や製造業、ヘルスケア、金融サービスなどさまざまな業界で、データとアナリティクスへの依存が増し続けている。このため次世代のデータリーダーは、戦略、意思決定、オペレーションやその他無数の機能に影響を及ぼす広範な役割を担うことになるのは明らかだ。

 筆者はこの新たな人材の育成を後押しするために、現在と未来のデータサイエンティストがビジネスに最大の価値をもたらす能力を磨くうえで役立つ、4つの重要なスキルと能力分野から成るフレームワークを考案した。これは、データサイエンスの仕事が重要かつ不可欠であると事業部のリーダーに認識させることで達成される。

 現役のデータサイエンティスト、および今後この分野に進む人は、このフレームワークを用いるとともに、個々の事業分野で何が必要なのかに関する理解を深めることで、自分の知識と経験がどの程度なのか、そして強化すべき点はどこかを把握できる。

1. 問題の発見:真の問題を見極める

 データリーダーは事業全体のアナリティクスを詳細に探る中で、ほぼすべてのオペレーションと機能を間近で見ることになる。このため、問題解決だけでなく、新たな問題の発見にもつながる独特の視点を持つことができる。

 実例を見てみよう。ある中級ホテルチェーンのゲストリレーションズ(コンシェルジュ)責任者は、チェックイン手続きの評価が低いことで経営上層部から厳しく批判されていた。アンケートによると宿泊客は、チェックインの対応がお粗末で時間がかかりすぎ、望み通りの結果、つまりシームレスで快適な体験が提供されなかったと感じていた。また、チェックインを低く評価した人は、ホテルへのリピート率が低いことも経営陣は発見した。

 ゲストリレーションズ部門はチェックインの問題の根本を明らかにすべく、データ分析チームに接触した。宿泊客の人口統計的属性、希望する客室タイプ、チェックインした場所がフロントか、セルフチェックイン端末か、スマートフォンか、一日のどの時間か、一年のどの時期か、ロイヤルティプログラムの加入者か否か──これらを調べた後でも、データチームは根本原因を突き止められなかった。

 すると一人の従業員が、継続的に回収されている宿泊客アンケートを調べることを提案した。自然言語テキスト分析を何度か行うと、あるテーマが見えてきた。それは、ホテルのインフラが最適ではないということだ。Wi-Fiがつながりにくい、ルームキーが時折機能しない、家具が壊れている、到着時に部屋がきれいではない、といった問題に宿泊客は遭遇する可能性があった。

 これらの問題はチェックインと直接関係はなかったが、宿泊客はチェックイン手続きを記憶に残していたため、問題をチェックインに結びつけたのである。結果的に、問題はチェックイン手続きではなく、ホテルの管理状態であった。

 要点:目の前にある問題の解決は、ほかの方法による事業改善の機会を逃すことにつながる場合がある。

 データを扱う人は、事業のさまざまな側面に関する深くユニークな洞察に触れる機会が多い。データリーダーが問題発見の達人になるためには、全体像をとらえて深い洞察を得ると同時に、事業リーダーにとっての最重要事項に関して透明性を高める必要がある。それによって、通常ならば見落とされる問題を発見して価値をもたらすことができる。

2. 問題の範囲の設定:明確さと具体性を高める

 問題が見つかったら、次のステップではその範囲を決定する。つまり、問題の性質と、その解決に分析がどう役立つのかを明確にする。これが特に重要となるのは、事業リーダーがデータチームに持ちかけてきた懸念や課題が漠然としている場合だ。

 筆者の授業とワークショップでは、エクササイズを通じて範囲の設定を練習する。まず、製品や戦略やマーケティングのリーダーの役を筆者が引き受け、明確に定義された問題を頭の中で設定しておく。たとえば、筆者は顧客管理の担当者で、どの顧客がネット・プロモーター・スコア(NPS)を低くつける可能性があるのかを特定し、介入によって彼らの体験を改善したいと望んでいる。

 合理的なデータサイエンティストであれば、この問題を解決するために適切なデータとデータサイエンスの手法をどう選べばよいかがわかる。ところが事業リーダーは、上記のような言葉で説明することはめったにない。したがって筆者は、大げさな業界用語と過度に一般的な言葉を使って問題の範囲を設定する。たとえば次のような具合だ。

「我々は顧客満足度に関する目標の達成に苦労していて、市場進出戦略に焦点を絞る必要があります。パイプラインの問題かもしれませんが、連携がないのです。正しいサンドボックスを用いているは思います。後はただ『誰』と『なぜ』を知る必要があります。どうでしょうか」

 データサイエンティスト役の学生が、明確にするための問いかけを練習する。おそらく最初は、「『連携』とはどういう意味ですか」「顧客満足度の目標はどのように測定していますか」「成果の有無を示す指標は何ですか」などだろう。

 その後に続くのは、データ分析のツールとコンセプトによって解決可能な、明確に定義された問題を形成するための情報を引き出す反復的なプロセスだ。

 筆者が最高アナリティクス責任者としてクライアントと仕事をする中で、最も重要な、そして困難な部分の一つは、事業リーダーの頭の中に何があるのかを理解し、それを範囲が明確なビジネス課題に変換することだ。詳しく探るための質問のチェックリストを筆者は用意しており、たとえば以下が含まれる。

・私たちが解決しようとしている問題は、具体的に何なのか。

・どの結果が改善すれば、問題が実際に解決されたことになるのか。

・問題を解決するためにどのデータが入手できれば理想的なのか。実際に入手できているデータはどれか。

・分析を行うことで、どのように解決につながるのか。

 最後の問いに答えることは、間違いなく最も重要な部分である。これにより、適切な分析手法──いくつかの単純な洞察を引き出せばよいのか、より本格的な予測モデルや因果推論モデルを用いるのか──が決まるからだ。

 ここで筆者は、多くの仮定シナリオを事業チームと一緒に駆け足で考えていく。「もし分析の結果がこれを示したら、またはあれを示したら、どうなるのか。それはよりよい意思決定にどう役立つのか」などだ。

 事業リーダーは往々にして、このような問いを後回しにして、分析結果さえ出ればアクションを検討できると言う。それは間違っている。分析がどのように解決につながるのかを知っておくことは、分析計画を立てるうえで重要な要素なのだ。

 要点:データリーダーが問題の範囲設定に秀でるためには、優れたコミュニケーション能力が必要だ。問題について事業リーダーと話し合い、データ分析のツールとコンセプトで事業に有意義に貢献するために不可欠な具体性を得ることが求められる。そのうえで初めて、問題をデータチームが引き継いで分析できるようになる。