データサイエンスの価値

日本のビッグデータ元年はいつなのか?

ここ数年で「ビッグデータ」という単語をよく目にするようになりました。
社内では技術に疎いはずの役員まで、そわそわしたりしています。大量のデータを使って、大きな価値をだせるらしい、アメリカはもっと進んでいるらしい、日本でも早い会社はもう進めているらしいぞ、という落ち着きのなさ。

昔からデータ屋・インフラ屋を地道にやっていた立場から見ると、恥ずかしいくらいです。

確かに、海外 (主にアメリカ) の取り組み事例を見ると、規模の大きさやデータ活用の工夫に関心させられるものもあります。ウォルマートは1時間あたり1.5ペタバイトのデータを集めて、顧客ごとのプロモーションや仕入れ、配送方法を最適化していますし、VISAカードは何千万件のカードトランザクションから、不正使用のシグナル検知の仕組みを実装しています。

Amazonも全顧客の購買傾向を分析し、自分に興味がありそうな商品をおすすめしてくれます。Amazonの売上の実に35%はこのおすすめによるものです(2011年)。GoogleのGmailは400万人以上に使われていますが(2014年現在)、これも同社の技術がインフラを維持する以上の収益をあげているからです。

ビッグデータが活用されるのは、企業領域だけではありません。2012年のアメリカ大統領選挙の結果予想では、政治の専門家が予想を外す中、統計家のネイト・シルバー氏が全米50州における選挙結果を完璧に的中させた事が注目を集めました。また、リオデジャネイロ市では交通・治水・警察官最適配置・電力供給などの管理を行うため、交通カメラや電力消費マップ、果てはマンホールの蓋についたセンサーやTwitterのつぶやきまで分析しています。

確かにこれらの海外の取り組みは先進的であり、効果的にビッグデータを活用している事例といえます。では、日本はどうでしょうか?

総務省の情報通信白書では、ビッグデータをフル活用した場合、現状でも年間7兆7700億円の経済効果が見込めるといいます。
しかし、我々の殆どはそのようなビッグナンバーを実感できないのではないでしょうか。そもそも、何かが劇的に変わったでしょうか? クラウドの活用も増えていますが、既存のシステムの方がまだまだ多いですし、システム部は昔と変わらずサーバーメンテナンスをしたり、ハードウェアを工夫したり、製品のライフサイクルマネジメントをしたり、粛々とやっています。

この延長線上で、ある日出社してみたら、いきなりビッグデータが活用できるようになっていたりする未来があり得るのでしょうか?

いいえ、あり得ません。 ビッグデータの有効活用は、「気付いたらできていた」というレベルのものではありません。
ビッグデータは会社全体に変革を迫るような大きなイノベーションです。企業上層部から現場まで巻き込み、ITだけの議論ではなくてマーケティング部・営業部も、オペレーション部も、サプライチェーン部も、法務部も人事部も全部関わって、何とかする大きなチャレンジなのです。

誤解だらけのビッグデータ

ビッグデータを、まるで魔法の杖か何かと勘違いしているケースが多いように思います。
特に、理系は現場・文系は管理、という役割分担になっている会社は要注意です。

「うちの社員は全然先見性がない。データなんて世の中にいっぱいあるじゃないか。とにかく大量のデータを使えばいいのに」、などとトップが言うと、IT担当者はたいてい暗い顔をしています。

実はIT担当にも問題がない訳ではありません。
IT担当の気持ちとしては、

  • 「具体的な課題を教えてくれれば勿論ソリューションは頑張って考えるし、チャレンジしたい気持ちもある。」
  • 「だけど出てくる話はアメリカのすごい例や、自社のデータアーキテクチャや既存のデータセットから極端に離れたものが多い。」
  • 「とにかく、様々な制約条件を無視した思いつきベースのアイデアを出されても、我々は現実性できない。」

といった所でしょうか。

もやもやしながらも、社内のステークホルダーを納得させるのは難しいし、そもそも何て話したらいいのかも分からないでしょう。
他にも、「ビッグデータ = Hadoop・MapReduce環境」 という、担当者自ら論点を矮小化している例も心当たりがあるのではないでしょうか。

逆に、「単にベンダーが新しい宣伝文句でブーム煽ってるだけ」という斜に構えた業界ツウも。
これだけでも、いかにビッグデータに関連する誤解がバラエティに富んでいるか、イメージが湧くかと思います。

先述の通り、ビッグデータは組織をあげた総力戦で取り組むものです。必ずしもデータに関するリテラシーや専門教育を受けていていない様々な部署のステークホルダーに、誰かがリーダーシップをもって分かりやすくビッグデータとは何で、どう取り組んだら良いのか、説明せねばなりません。
今このサイトを読んでいる方は、自分がそのリードをしている様子がありありと想像できるでしょうか?

ビッグデータの活用をリードするには

ここからは、具体的にビッグデータを活用した取り組みをけん引する立場にあるリーダーに焦点をあてます。
どうすればそれが実現できるのか?