No.006 ”データでデザインする社会”
Topics
メディア

ビジネスマンが今日から
データサイエンティストになる方法

 

  • 2014.04.30
  • 文/山路 達也

統計学やITを駆使してデータ分析を行う「データサイエンティスト」という職種が注目を集めている。しかし、データ分析で価値ある発見をするのは、専門家だけの特権ではない。あるシンプルなフレームワークさえ理解していれば、誰でも高度なデータ分析が行えるのだ。

普通のビジネスマンも、データサイエンティストになれるのか?

ビジネス誌や書籍では、将来性が有望な職種として「データサイエンティスト」が大きく紹介されるようになってきた。データサイエンティストに明確な定義であるわけではないが、大まかにいえば、データを分析することでこれまでにない発見をし、それを適切な施策に結びつけられる人材ということになるだろう。

かつてニューヨーク・タイムズに所属していた統計家のネイト・シルバーは、2012年に行われたアメリカ大統領選の勝敗を全50州で的中させ、データサイエンティストが注目されるきっかけを作った。シルバーは膨大な世論調査の結果を独自の数理モデルに当てはめることで、50州それぞれの勝敗だけでなく、大統領選挙人(アメリカ大統領選では、有権者は各州から選出される選挙人団に投票し、勝利した選挙人団が大統領候補者に投票する)が票をどれだけ獲得したかまで正確に予測して見せたのである。シルバーの数理モデルは、世論調査が行われた時期などに応じて、調査結果に重み付けをして足し合わせ、それを過去の結果と比較するというものだ。

いわゆるビッグデータに対して、何らかの分析処理を行うことで、画期的な発見ができると誰もが期待を寄せるきっかけになった。しかし、ビッグデータの分析と一口にいっても、求められるスキルは多岐にわたる。例えば、何を分析すべきなのかを仮説を立て適切な調査手法を検討する、統計学やITの知識を使ってデータ処理を行う、結果を分析して施策を実行に移す、といったフェーズが考えられる。大規模なデータ処理を行うために、最近ではHadoop*1といった分散処理システムが注目され、これらに通じたエンジニアの需要も高まっている。もっとも、1人の人間がすべてのスキルを備えるのは困難なため、それぞれのフェーズに応じた人材を集めて、データ分析のためのチームを作ることが一般的だ。また、最近では、データサイエンティストによるビッグデータ分析をアピールする、コンサルティング会社も急増している。

それでは、データ分析は専門家に任せるしかないのだろうか? 統計学の教科書を買ってきて開いても、複雑な数式に頭がクラクラしてしまうという人も多いはず。普通のビジネスマンが、データ分析のスキルを身につけたいと思ったら、何から始めればよいのだろう?

闇雲なデータ分析では、価値ある情報は見つからない

ビジネスマンに必要とされるのは、利益を上げるための施策に落とし込める洞察だ。自分が制御可能な要因をデータ分析によって探し出し、具体的な施策を提案できることが重要になる。

ベストセラー『統計学は最強の学問である』の著者である、統計家の西内啓氏によれば、ビジネスなどで生産性を向上させる方策を探ったり、在庫コストの最適化を行ったりする上で、高度な統計学の知識や高価なビッグデータの分析基盤は必ずしも必要ないという。

1990年代終わりから2000年代初頭にかけて、「データマイニング」というキーワードが、ビジネスの世界で話題を呼んだ。分析ソフトウェアに大量のデータを入力し、データ項目の関連性を総当たりで調べて、価値がある情報を発見しようと手法だ。これによって、「スーパーマーケットではオムツとビールが同時に買われるケースが多い」といった意外な発見が行われることも多かったが、やがてデータマイニングのブームは収束していく。その理由の1つとしては、データマイニングで得られた発見がビジネス上の利益にあまりつながらなかったから、といわれている。オムツとビールの売り場を近づけたら、両方の商品を買う人にとっては便利だし、そのことで各商品の売上げが伸びるかもしれない。だが、一方で売り場のレイアウトやオペレーションを変更するコスト、さらには分析用の高価なハードウェア、ソフトウェアのコストも必要となってしまう。

Copyright©2011- Tokyo Electron Limited, All Rights Reserved.