No.006 ”データでデザインする社会”
Topics
メディア

ビジネスにおけるデータ分析は、3つのポイントを
押さえるだけでいい

西内氏が提案するのは、科学の世界で研究者が使っている手法をもとにした、データ分析のフレームワーク。コツさえ覚えれば誰でもExcelですぐに実行できる。

ビジネスマンであればExcelでデータ処理を行うことは珍しくないから、何を今さらと思うかもしれない。人によっては、マーケティングリサーチの結果から「年齢や性別は、来店頻度と関係があるか」などといったことを調べることもあるだろう。しかし、これはデータ分析ではなく、自分の思い付きで立てた仮説を検証しているにすぎないのだ。このようなやり方では、データから思ってもいなかった意外な結果を発見することはできない。

西内氏が強調するのが、「仮説を立てることのナンセンスさ」だ。

「10年前なら解析するためのデータを集めるにもコストがかかりましたから、仮説を考え、必要なデータを集めて解析するのは合理的だったかもしれません。けれど、今はITの進化により多くのデータを低コストに集められるようになりました。ある仮説を考えてから解析するということは、せっかく集めたデータの一部しか見ないということでもあるのです。」(西内氏)

西内氏のフレームワークでは、「アウトカム」、「解析単位」、「説明変数」という3つのポイントを決め、定石に従って分析を進める。

「アウトカム」というのは、利益に直結する成果指標のこと。売上やコストに関係するデータ項目がアウトカムの候補になる。「解析単位」は、スタッフや店、期間、客など、アウトカムを比較する単位のことである。「説明変数」は、解析単位ごとのアウトカムに影響を与える要因だ。あらかじめ、最大化/最小化するとうれしいアウトカムを定め、どんな説明変数を変化させればアウトカムを期待通りに動かせるかを分析していくのである。

具体的な例を元に、説明しよう。事務機器販売会社の売上履歴データがあったりする。ここではアウトカムを売上とし、売上を最大化するにはどうすればよいのかを考えていく。

売上は、どういう基準で比較するのがよいだろう? よく売れている商品と普通の商品、よく商品を買ってくれる客と普通の客、よく商品を売るスタッフと普通のスタッフ、よく商品が売れる販売店と普通の販売店、よく商品が売れる期間と普通の期間……。これらの違いがわかれば、売上を増やすためのヒントが見えてくる。つまり、「商品」、「客」、「スタッフ」、「店舗」、「期間」といった「解析単位」を決めて、どの要因がアウトカムにつながっていけくのかを分析すればいい。今回の例では、解析単位をスタッフに設定し、よく商品を売るスタッフと普通のスタッフの違いを明らかにしてみる。

まず、売上履歴データをスタッフ単位に集計し直す。こうすることで、各スタッフの売上金額、どんな時刻帯に仕事をしているか、どんなジャンルの商品をよく売っているかといった、スタッフごとの特徴、つまり「説明変数」が並んだ表ができあがる。売上履歴以外にも、採用時テストの結果など、スタッフごとの特徴を表すデータがほかにもあれば、この表に結合させる。

Excelのピボットテーブルを使って、スタッフ単位に集計し直した表データの例の写真
[写真] Excelのピボットテーブルを使って、スタッフ単位に集計し直した表データの例。各行には、スタッフのID、売上、売上に占める各商品ジャンルの割合、残業の割合、採用時テストの結果などが含まれている。このデータにおいて、売上と、それ以外の項目の間にどんな関係があるのかを分析していく。

Copyright©2011- Tokyo Electron Limited, All Rights Reserved.