支持率から許容誤差を考える

1月 18th, 2017 | Posted by admin in 長橋のつぶやき - (支持率から許容誤差を考える はコメントを受け付けていません)

以前、ビックデータ時代だからこそスモールデータの手法の理解も大事というエントリを投稿しました。

で、自分はあまりテレビを見ないのですが、たまたまCNNによる世論調査で1000名を対象に米国時期大統領トランプ氏を支持するかしないかについて、世論調査したところ以前オバマ氏が81%のところ40%で支持率が低いという報道でした。

あらかじめ言うと、自分はこの結果に、とく賛成・反対はありません。むしろ、純粋にデータサイエンス的にこれが有意かどうか純粋に興味があります。

一番、確実なアプローチは、米国民3.189億人に賛成か反対かを問うこと。いわゆる、ビックデータのアプローチ。ただ、これが本当にできるかといえば意外と難しい気がする。11月の大統領選挙でも、多くのメディアがヒラリー氏優先と伝えたものの、蓋を開けたら違う結果になったように、”ビックデータ”で解決できる話でないと思う。

となると、やっぱり、母集団からサンプリングして、そのサンプルから母集団を推定するというアプローチが妥当で、統計の世界では、サンプルの許容誤差という考え方があります。一般的には誤差5%つまり100のうち95が正しくて5が誤ると想定すると、許容誤差のサンプル数は(正規分布の5%信頼水準 1.96)^2 x (支持率 0.5x非支持率 0.5)/(標本誤差 0.05)^2 = 384、つまり、384人にアンケートを取れば、理論上、許容誤差に収まる、なので、1000人は許容誤差の範囲といえるかもしれない。

ただ、この5%の許容誤差を1%にすると、(正規分布の5%信頼水準 2.58)^2 x (支持率 0.5x非支持率 0.5)/(標本誤差 0.01)^2 = 16,641人、384人くらべて43倍のサンプル数が必要になる。

というわけで、ここから何がいえるか?この許容誤差の5%というのは、完全無作為に抽出する前提であれば成立するかもしれない。ただ、ただでさえ、CNNはトランプ氏から”うそのメディア”というレッテルを貼れて、質疑を拒否されたほど対立関係にあるので、もしかしたら、何かしらのバイアスがかかって”完全無作為”とはなっていないかもしれない。

というわけで、この精度をあげるには、1.CNNとは独立な機関によってサンプル抽出する、もしくは、2.許容誤差を5%から下げる、ともう少し尤もらしくなると思うのでした。

開発と営業のスキマを埋める

1月 11th, 2017 | Posted by admin in 長橋のつぶやき - (開発と営業のスキマを埋める はコメントを受け付けていません)

 日経新聞のカルロス・ゴーン氏の私の履歴書を読んでいて、共感するところがありました。

 彼がルノーあるいは日産において、不振の要因が縦割りの組織にあると感じ、「会議では自己主張や実りのない議論が多く、何も決まらない。何か起きれば、言い訳が先行する」状態だったと。そして、これを変えるべくクロスファンクショナルチームをつくる。それによって、部門壁を壊し、風通しを良くして一緒に問題の解決にあたる状況をつくると。

 自分は製造業の経験はないけど、IT企業においても、これがズバリ当てはまる。IT企業の場合の多くは開発と営業の厚い壁があるケースが多い。開発は、”営業がムリな案件とってきた、仕様がムチャクチャ”と営業の詰る。一方で、営業は、”開発が遅い、バグが多い”と開発のせいにしがち。自分の経験上、開発と営業の溝が深いほど、企業の業績は落ちる、逆に、開発と営業との距離が近いほど、業績は総じて手堅い。

 で、この溝を解決するには、一つしかない。それは、マネジメントによるハンズオン・介入。開発はいつも営業が悪いというけど、たまには営業が正しいこともある、逆もしかり。だからこそ、マネジメントが場を作って、しっかりと受け止めて、フェアに判断する、そして、仕組みを作る。ま、一言でいえば、リーダーシップですね。

 「一方聞いて沙汰するな」、もうだいぶ時間がたってしまいましたが、大河ドラマ篤姫の主人公が常に心がけたことです。やっぱり、開発の話を聞いて沙汰するのではなく、開発と営業、両方の言い分をきちんと聞いて沙汰する。翻って、ゴーン氏はこうした判断能力が卓越していると思う、で、自分もまだまだだけど少しで近づければなあと思ったのでした。