日経BP田島様よりご献本いただきました、ありがとうございました。
最近、いたるところで耳にする「データサイエンス」あるいは「データサイエンティスト」について解説した一冊。
もともと、統計自体は、何十年も前からビジネスに活用されてきており、今さら、統計という話ではない。では、なぜ、”今”なのか?
やはり、ソーシャル、M2M、ウェブなど、様々なデジタル情報が爆発的に増加、くわえて、本書では、データ処理基盤の進歩、使えるデータの整備、人材育成の動きにより、「データ活用のチャンスがより多くの企業に訪れる」(p26)だからこそ、確率論に基づいた統計のスキルが更に重要になると。
とはいうものの、単に、学校の授業の統計解析をマスターできれば良いという話ではない。むしろ、筆者が主張するのは、「膨大なデータを見極めて、目的を達成するための意思決定に役立つ気付きをえる「目利き力」」(p38)が重要と指摘する。そして、その目利き力は
1.データを活用したビジネスを活用する力
2.データサイエンスを支える統計知識
3.アナリティクスを実現するITスキル
の3つが必要と説く。
自分も統計を活用(本書でいえば、正規分布くらいまでは使うけど、機械学習まで及びません。。)することがあり、つくづく思うのは会社によってデータを活用しようという姿勢が全然違うこと。「分析力を武器とする企業」(トーマス・H・ダベンポート)では、企業の分析力にはステージに分かれていると説いているように、Excelの四則演算で十分な会社もあれば、SPSS等を利用して、高度な統計手法を駆使している会社もある。
そういう意味で、本書で指摘している「筆者は企業経営層の方々に「データサイエンティストとは何者か」と聞かれたら、まずは「データサイエンスという言葉の定義を合わせましょう」と回答するように心がけている。」(p242)という主張は尤もだと思う。
Excel、SPSS、いずれも共通しているのは、やはり、データ・数字をもとにビジネスを展開すること、そして、他社にまねできないビジネスを展開すること(イノベーション)。そして、イノベーションを生むには、本書では次の3つが必要と説く。(p228)
1.適当な解で満足してはいけない
2.普遍的だと思われている事象であっても漫然と処理してはいけない
3.妥協せずやり抜く
自分が思うに、データはモノごとの状態を客観的に提示してくれるものだと思う。たとえば、甘いだけだとわからないけど、糖度10%といえば、客観的に提示しているといった類だ。そして、 当たり前と思われていることをも漫然と処理せず、データに即して検証することでイノベーションは生まれるのかもしれない。そして、日本からもデータサイエンスを通じてたくさんのイノベーションが生まれたらこれほど素晴らしいことはないと思う。
本書は、データを活用したビジネス、統計の基礎、アナリティクスを実現するITスキルがコンパクトにまとめられており、そして、それを使ってどうイノベーションを誘発するか、を考えさせられるよいヒントになりました。
データサイエンス超入門 ビジネスで役立つ「統計学」の本当の活かし方 (2013/11/07) 工藤卓哉、保科学世 他 |
分析力を武器とする企業 (2008/07/24) トーマス・H・ダベンポート、ジェーン・G・ハリス 他 |