ビックデータとスモールデータのはざまで

1月 4th, 2014 | Posted by admin in 長橋のつぶやき - (ビックデータとスモールデータのはざまで はコメントを受け付けていません)

最近、スモールデータという言葉を聞くようになった。

いうまでもなく、ビックデータに対するアンチテーゼだ。

ビックデータとスモールデータ、何が違うのだろうか?

結局のところ、自分の理解では、誰が意思決定するか、という話だと思う。

ビックデータの場合の意思決定は、コンピュータ、膨大なデータの中から、人間によってプログラムされたアルゴリズムを基に、パターン(例:ワインの熟成度、ユーザの嗜好(この商品をかったユーザは、この別の商品も買う)、などなど)を発見する。この場合は、データが多ければ多いほど良いので、必然的に人間の出番は少なくなる。

一方、スモールデータの場合、 “小さい”データであるので、判断するのは人間だ。結局のところ、情報理論で重要なのは、S/N(Signal/Noise)比、ノイズばっかりで信号(Signal)が少なければ意味がない。だから、ノイズを減らして、S/N比を上げる、そうすれば、必然的にデータは少なくなり、”スモールデータ”となる。

では、この”ビックデータ”と”スモールデータ”、どちらがよいか?

単純に比較はできないけど、結局のところ、どうパターンを見つけるかという話だと思う。




ビックデータにしろ、スモールデータにしろ、重要なのは、データの中からあるパターンを(この購買履歴のあるユーザに、別の商品を提案すれば売れるなど)見つけることだと思う。そして、ビックデータはコンピュータによるアプローチ、スモールデータはどちらかといえば人間によるアプローチ、どちらが優れているとは一概に言えない。

たしかに、コンピュータの処理能力は上がってきているけど、回帰分析をする場合であれば、どれを説明変数にすればいいなど、結局のところ、やはり、人間の知見が必要だと思う。

コンピュータ頼みもダメだし、かといって、人間頼み一遍でもダメ、コンピュータと人間とのはざまでのバランス、これが大事なんだと思ったのでした。

ちなみに、パターンを見つけるという話は、拙著「ビックデータ戦略」で触れていますので、こちらもご参照ください。

データサイエンス超入門 ビジネスで役立つ「統計学」の本当の活かし方

12月 15th, 2013 | Posted by admin in イノベーション | テクノロジー | プログラミングを考える | 経営 - (データサイエンス超入門 ビジネスで役立つ「統計学」の本当の活かし方 はコメントを受け付けていません)

日経BP田島様よりご献本いただきました、ありがとうございました。

最近、いたるところで耳にする「データサイエンス」あるいは「データサイエンティスト」について解説した一冊。

もともと、統計自体は、何十年も前からビジネスに活用されてきており、今さら、統計という話ではない。では、なぜ、”今”なのか?

やはり、ソーシャル、M2M、ウェブなど、様々なデジタル情報が爆発的に増加、くわえて、本書では、データ処理基盤の進歩、使えるデータの整備、人材育成の動きにより、「データ活用のチャンスがより多くの企業に訪れる」(p26)だからこそ、確率論に基づいた統計のスキルが更に重要になると。

とはいうものの、単に、学校の授業の統計解析をマスターできれば良いという話ではない。むしろ、筆者が主張するのは、「膨大なデータを見極めて、目的を達成するための意思決定に役立つ気付きをえる「目利き力」」(p38)が重要と指摘する。そして、その目利き力は

1.データを活用したビジネスを活用する力
2.データサイエンスを支える統計知識
3.アナリティクスを実現するITスキル

の3つが必要と説く。

自分も統計を活用(本書でいえば、正規分布くらいまでは使うけど、機械学習まで及びません。。)することがあり、つくづく思うのは会社によってデータを活用しようという姿勢が全然違うこと。「分析力を武器とする企業」(トーマス・H・ダベンポート)では、企業の分析力にはステージに分かれていると説いているように、Excelの四則演算で十分な会社もあれば、SPSS等を利用して、高度な統計手法を駆使している会社もある。

そういう意味で、本書で指摘している「筆者は企業経営層の方々に「データサイエンティストとは何者か」と聞かれたら、まずは「データサイエンスという言葉の定義を合わせましょう」と回答するように心がけている。」(p242)という主張は尤もだと思う。

Excel、SPSS、いずれも共通しているのは、やはり、データ・数字をもとにビジネスを展開すること、そして、他社にまねできないビジネスを展開すること(イノベーション)。そして、イノベーションを生むには、本書では次の3つが必要と説く。(p228)

1.適当な解で満足してはいけない
2.普遍的だと思われている事象であっても漫然と処理してはいけない
3.妥協せずやり抜く

自分が思うに、データはモノごとの状態を客観的に提示してくれるものだと思う。たとえば、甘いだけだとわからないけど、糖度10%といえば、客観的に提示しているといった類だ。そして、 当たり前と思われていることをも漫然と処理せず、データに即して検証することでイノベーションは生まれるのかもしれない。そして、日本からもデータサイエンスを通じてたくさんのイノベーションが生まれたらこれほど素晴らしいことはないと思う。

本書は、データを活用したビジネス、統計の基礎、アナリティクスを実現するITスキルがコンパクトにまとめられており、そして、それを使ってどうイノベーションを誘発するか、を考えさせられるよいヒントになりました。

データサイエンス超入門 ビジネスで役立つ「統計学」の本当の活かし方 データサイエンス超入門 ビジネスで役立つ「統計学」の本当の活かし方
(2013/11/07)
工藤卓哉、保科学世 他

商品詳細を見る

分析力を武器とする企業 分析力を武器とする企業
(2008/07/24)
トーマス・H・ダベンポート、ジェーン・G・ハリス 他

商品詳細を見る

オムニ・マネジメント 2013年10月号 「ビックデータ」活動最前線 に寄稿させていただきました

9月 27th, 2013 | Posted by admin in お知らせ - (オムニ・マネジメント 2013年10月号 「ビックデータ」活動最前線 に寄稿させていただきました はコメントを受け付けていません)

一般社団法人日本経営協会の機関誌であるオムニ・マネジメント 2013年10月号 「ビックデータ」活動最前線に”経営者のデータ分析重視と、失敗を限定しない企業文化が重要”として寄稿させていただきました。

http://www.noma.or.jp/noma/omni-management/index.html

週刊ダイヤモンド7月6日号

7月 2nd, 2013 | Posted by admin in お知らせ - (週刊ダイヤモンド7月6日号 はコメントを受け付けていません)

利益率の改善はわずか1%!?「ビックデータ」の正体(産業レポート)に、コメントさせていただきました。
2012年上梓させえいただいた「ビックデータ戦略」の内容に沿ったものです。