プログラマ行進曲第二章

主にソフトウェア関連の技術をネタにした記事を執筆するためのブログ

【〜『不透明な時代を見抜く「統計思考力」』刊行記念〜 神永正博氏・小飼弾氏トークセミナー】参加レポート その1

以前書いた記事を使って、『不透明な時代を見抜く「統計思考力」』のトークセミナーに応募してみたところ、限定10名の抽選に当たったので、「楽しいことありそうだし、行ってみるか〜」という、当たったくせに何とも生意気な心持ちでトークセミナーに参加してきました。以下はその参加したときのレポートです。*1

この記事は「主観を交えたレポート」という位置づけですので、公式のもの or 手軽に内容を知りたい方はこちらのDiscover21の干場社長のブログの記事を見ていただいた方がいいかと。

他の参加者の方もレポートを書いていらっしゃるようなので、以下にリンクを貼っておきます*2から、そちらも是非見てもらえると当日の雰囲気&より正確な内容がよくわかるのではないかと思いますよ。

どの方のレポートもそれぞれの視点で書かれていたり、情報を上手くまとめてリンクを丁寧に貼っていたり、個別に対談者と会話した様子が書かれていたりと、トークセミナーに参加できなかった人はもちろん、参加した人も新たな発見があるので読む価値ありです!

ちゃんと本で勉強したように、データを駆使してみると意外なことが……

抽選に当たった当初は「良く当たったな〜」とビックリしたのですが、会場に行ってみると、当選した理由がよくわかりました。

どういうことかというと、会場に行ったら出席率が約5割だったんですよ。

『不透明な時代を見抜く「統計思考力」』では「データは議論のための共通言語」だと習ったので、会場に行って早速習ったことを活かそうとしたら判明した事実*3でした。ここから察するに、応募数が定員割れか、それに近い状態だったんでしょうね*4。だから駆け込みの5月7日にかいたエントリで応募しても余裕だったんだろうなと予想します。あれですね、こういった「ブログで記事を書いたら抽選で招待!」というのはかなり狙い所ですよ。おそらく長い感想エントリを書く人は早々いないでしょうし。*5

なにげなしにやったことですが、実際にやってみると面白いことがわかったりしたので、本を読んだ成果があったかなと一人勝手に思いながら、セミナー開始の時間がやってきました。

トークセミナー開始! 神永氏、小飼氏、干場社長が登場!

丸善かDiscover21社の社員らしき人がトークセミナー開始を告げると、後ろから神永氏、小飼氏、干場社長が現れ、神永氏は壇上向かって右側の席、小飼氏は左側の席、干場社長は司会進行席みたいなところにそれぞれ移動し、干場社長がトークセミナーの導入に、『不透明な時代を見抜く「統計思考力」』を出版するに至った経緯を話し始めました。

  • 干場社長
    • (会場の参加者に向けて)「統計に詳しい方はいらっしゃいますか?」「理系の方は?」という質問 → 前者は(私が見る限り)0、後者はちらほら手を上げていました。
    • 「小飼さんのエントリで神永さんのことを初めて知ったのですが、本を読んだ後にブログに神永さんがコメントを残してくださり、それをきっかけにして出版のお誘いをしたのが今回の本の出版に繋がりました」

とのこと。

統計リテラシーが必要な3つの理由

理由その1 【データは議論のための共通言語】

これは『不透明な時代を見抜く「統計思考力」』でも述べられていますね。以下両氏が述べたことをまとめておきます。*6

  • 神永氏
    • 「まず『そもそも何が問題なのさ?』というところが重要という意味です。例えば食料自給率という指標を例に挙げますと、『食料自給率40%』と言うときの"40%"というのはカロリーベースの値なんですね。プライスベースだった場合には食料自給率は70%になるので、こういった"40%"とか"70%"というデータや値がそもそも何を指しているのか、何を意味しているのかということを見て押さえないと議論の土台が築けないんじゃないかなと思います」
  • 小飼氏
    • 「詐欺師っていうのは『見せたいデータだけを見せる』んですよ。ですから、データを出されたときには疑ってかかるくらいでちょうどいいんじゃないでしょうか」
理由その2 【データがないと嗜好が深まらない】
  • 神永氏
    • 「これはそのままの意味なんですけど、例を挙げますと、ビョルン=ロンボルグという人が書いて2003年に邦訳が出た『環境危機をあおってはいけない 地球環境のホントの実態』*7という環境問題を扱った本があって、これが凄い本なんです。かなりの情報の統計データが併記されていて、相当データを集めるのに苦労したんじゃないかと思います。こんな風にデータと統計を積み上げると、次のステージの議論が出来るんです。」
  • 小飼氏*8
    • 私のブログ『単純な脳、複雑な「私」』という本の書評をしたんですが、そこでも書いたように、私たちには「何かを選びとら『ない』」という自由しか無いんです。ですから、何か選べるメニューがたくさんあって、その中から選び取らない自由を確保するなら、選択肢はたくさんあった方が良いと。統計はそのメニューに当たるんです」

(参考資料)


単純な脳、複雑な「私」

単純な脳、複雑な「私」

理由その3 【「誰が正しいか」ではなく、「何が正しいか」がわかる】
  • 神永氏
    • 「これは特に議論するときの話しなんですが、議論が盛り上がってくるとお互いヒートアップしてくるので個人攻撃に向かいやすいんですね。私としては、こういった個人攻撃のやり取りは『無駄なんじゃないかなぁ』と感じます」
  • 小飼氏
    • (セミナー参加者に向かって)「この中で『誰が正しいことを言っているか?』ということを考えの基準にしてしまう人がいたら手を上げてください」 → 挙手する人多し。
    • 「『言っていることが正しいか?』ということと『誰が正しいか?』ということは本来関係ないはずなんですよ。でもこんな風に『誰が正しいか?』ということを基準にしてしまっている人が多いですね。ここで問題なのが、『誰が正しいか?』という方に重きを置いてしまうと、年寄りの方が有利になってしまうんです。だから年上の人と議論するにはデータを用いるしかないですね」

統計を見る人に知っておきたい3つのポイント

ここの部分はこちらのDiscover21の干場社長のブログの記事の方が簡潔且つ情報もまとまっていると思いますので、補足的に書いていこうと思います。

調査の規模はどれくらい? 誰(何)を調査したのか?
  • 神永氏
    • 「同じ3割の賛成と言っても、10人中3人の賛成と10000万人中3000人の賛成は統計的に意味が違うんです。」
    • 「政府による統計は基本的に規模等の点で信用できると思います。独自調査の場合、ちゃんとしているものもあるんですけど、規模の適正さとか調査の点で信用できないものもあるんじゃないでしょうか*9
  • 小飼氏
    • 「独自調査でも信頼できるものが一つあります。それは選挙のときの出口調査。これはほとんど外しませんね。*10
偶然と考えられないか?
  • 神永氏
    • ("Introduction to Probability Theory"*11という論文の中にある「ロンドン市に落ちた爆弾の数」に関する箇所*12を引き合いに出して)「まずポアソン分布のことを思い出したらいいと思う。(規則性があるように見えても)実は全くの偶然であるかもしれないですから」
    • 「雑誌の特集でガン治療の病院ランキングというものがあったのですが、『ガンになって入院してから5年後の生存率を基にして作られたランキング』でした。こういう基準でランキングにすると、例えば(末期に近い)重症のガン患者を積極的に受け入れて奮戦したという病院が下のランキングになってしまうし、そういったガン患者を拒否した病院が上位に来ると言うことになってしまいます。ですので、こういった基準でレベルがわかるのか?というのが疑問です」
  • 小飼氏
    • 「ここで一つ補足すると、ある統計が操作されているか否かを知るのも統計的手法なんです。それを知ってほしいですね」

(参考資料)

An Introduction to Probability Theory and Its Applications Vol. 1, Edition 3

An Introduction to Probability Theory and Its Applications Vol. 1, Edition 3


An Introduction to Probability Theory and Its Applications -Volume 2,  2nd Edition

An Introduction to Probability Theory and Its Applications -Volume 2, 2nd Edition

疑いすぎない
  • 神永氏
    • 「私が以前数値解析というものをやっていたとき、何度やっても『上手くいかない!』という状態でした」
    • 「疑いだすとキリが無いので、疑い過ぎないということも重要です。特に生データを疑いだすとキリが無くなるので、バランスが重要でしょうね」
  • 小飼氏
    • 「でもそのさじ加減っていうのは本当に難しいですよ。そのバランスが分かるのはプロだからなんじゃないか、と私は思いますね。」
    • 「そして重要なのは、疑うことそれ自体はコストがかかるってことで、データを利用するのにそのデータ自体を疑っていたら本末転倒になりがちだということがあります。だからデータに毒を混ぜるのは一番の罪です」

自分の頭で考える人にとっての三大美徳*13

しつこい
  • 神永氏
    • 「しつこいというのはきわめて重要な資質だと思います。(Arther Cayleyという人を例に挙げて)この人、信じられない人で、弁護士なのに数学に関する論文をたくさん出していて*14、最後には詩人になったという、信じられないくらい凄い人なんですよ。しかも、その数学の論文はどれもその分野にとって重要になるくらいのレベルの論文なんです。」
  • 小飼氏
    • 「しつこいといったら、オイラーもそうですよね。オイラーなんてまだ全集が完成してないんですから!」*15
欲深い
  • 神永氏
    • 「(例としてCarlo Rubiaという人を挙げて)彼は新発見をするためにはかなり欲深い人でした。」
ものわかりが悪い
  • 神永氏
    • 「ガン研究をしていた昔の人に山極勝三郎という人と市川厚一という人がいたんですが、この人たちは当時のガン発生の仮説のうち、「刺激説」をとっていた研究者でした。ですが、当時他の仮説の「寄生虫説」をとっていた人がノーベル賞を取ったんですね。普通だったらそこでやり方を変えると思うんですけど、山極というひとはそうしなくて刺激説の研究*16を続けたんです。そして止めずにズ〜っと研究をやっていたら、ガンが発生したんです。こんな風に、なかなか納得しなくて、続けるという姿勢も必要なんじゃないかと思います*17
  • 小飼氏
    • 「ものわかりが悪い有名な人物はアインシュタイン。彼が証明したことを示す材料や証拠は前から色々あったけど、アインシュタインくらいしかしつこく考える人がいなかったんじゃないかと思います。」
  • 神永氏
    • 「頭がいい人はそう言う意味では研究者に向いていないのかもしれませんね」
  • 小飼氏
    • 「(「ものわかりが悪い」例でなく)「欲深い」例で、フォン=ノイマンを思い出しました。しかし彼でもできなかったことをやってのけた人がいますね。ゲーデルのことですけど、彼が証明した不完全性定理ノイマンからしたら『やられた!』という類いのものな気がします。この差がどこから出てくるかというと、物わかりの悪さ*18だったんでしょうね。頭のいい人はすぐに見切りをつけてしまいますから」

今日中(2009/05/16中)に全部書こうと思ったんですけど、あまりに時間がかかったので、今回の記事を「その1」としてまた後日、別記事の形で続きを書きます。残りは質疑応答の内容だけですし、明日中に出来たら良いなというところです。

(2009/05/21 追記)
レポートの続きを書きました!

PS.
今回のセミナーとは全く関係ないんですけど、小飼(id:dankogai)さん、発注を受けたとおっしゃっていたJavaScriptの本、出版予定っていつ頃でしょうか? オライリーのHead Firstもいいんですけど、オライリーの本って詳しくていい反面、分厚くて小回り効かないので、小飼さんのJavaScript本が早く出るのを期待していますよ!

*1:一応セミナー中に書いたメモを基にレポートを書きますが、メモも完全ではないので、正確性は保証できないことをあらかじめお断りしておきます。

*2:現時点で把握しているものに限ります

*3:詳しい内訳を書きますと、座席数が107席(セミナー終了後に2度確認したのでおそらく正確)で、出席者数が57名(会場2,3分前に数えた。確認してないので不正確かも)でした。割合に直すと約53.3%ですね。この出席率をいいと見るか悪いと見るか…他のセミナーの出席率を知らないので何とも言えません。考え方でも違うでしょうし。

*4:傍証として、5月7日付けでDiscover社から来たメールがあります。[http://www.d21.co.jp/contents/campaign/statistics/present.html:title=キャンペーンページ]ではキャンペーンの期間が2009/05/01〜05/07となっていたのに、メールでは期間が2009/05/7〜05/10となっていました。期間を延長したとすると、定員割れしてたのかなということです。

*5:建前は本文通りですが、実際は「まぁ、絶対当たるでしょ、[http://d.hatena.ne.jp/kutakutatriangle/20090507/1241679198:title=力入れて記事を書いた]し。今までのプレゼント当選経験から言って、手間をかけて文章を書いて応募したときは当選確率がかなり上がるからなぁ」と超生意気に思っていました(笑)。このプレゼント当選経験の話しは汎用性が無いでしょうが、いずれまとめて記事にしようかなと思っています。

*6:間違いがあったら指摘をお願いします。これはこれ以降の章でも同様です。文脈も踏まえた上でなるべく再現したつもりですが、筆力不足な部分が多いため、発言者の意図と異なったように読めてしまうかもしれないので

*7:これは邦訳です。原題というか英語名はThe Skeptical Environmentalist: Measuring the Real State of the Worldらしいです。

*8:この部分の話しの内容はメモの不足のため、不正確だと思いますので、雰囲気だけつかんでもらえれば幸いです

*9:ここら辺、話しの流れが実際のセミナーのときと全然違うかもしれません。

*10:神永氏曰く、出口調査は割当法という統計的手法(よくわからないが、『全体の縮図を作って調べる』方法だそうで)を使っているだろうから、訪ねた割合が数%でも当確が出せるとのこと。専門的な話しに立ち入ってしまうからこれ以上は詳しく説明されなかったです。

*11:Fellerという人が書いた確率論の有名なものらしいです。

*12:パワーポイントの図には"Flying-bomb hits on London"と出ていたので、気になった人は該当書籍からその部分を探してくださいね

*13:神永さん曰く、「小飼さんがおっしゃってたLarry Wallプログラマーの三大美徳を真似ました」「3つがうまく独立していなくて、依存関係があるんですけど…」とのこと。

*14:正確な数字はメモれませんでしたが、100単位レベルの論文執筆数ということは覚えています。

*15:文脈とは関係ないけど、『オイラーの贈物』(ちくま学芸文庫)が絶版(でしたよね?)なのは人類の損失だと思います。(私は文庫版で持っていますが)これを絶版にしたままなのは絶対によろしくないので、筑摩書房さんの復刊という英断を期待したいです。

*16:ウサギの耳にタールを塗ってガンが発生するか否かという研究だったようです

*17:他の例として、青色発光ダイオードの話しもされていました。

*18:ゲーデルが物わかりが悪かったということ。