2013年9月13日金曜日

統計学は最強の学問ではない


統計学は最強の学問ではない


http://snowymoon.hateblo.jp/entry/2013/04/16/215336

この間、「統計学が最強の学問である」という本を読了しました。

統計学が最強の学問である

統計の話は私も興味がちょうどあったところ。ちらほらと話題にも上がっていてけっこう売れているようだったので、私も読んでみました。
そしたら、これがなかなかの当たりでして!


おおまかには、統計学の社会における有用性と重要性を統計学に馴染みのない一般人にも分かるように平易に解説している本ということになるのですが、非常に話が面白いんです。あまりにも楽しいので、あっという間に読み終えてしまいました。
あくまで学識ばらない一般向けの本ということで、よくも悪くも煽り文句が目立つのも本書の特徴です。
売り文句の冒頭からして、

あえて断言しよう。あらゆる学問のなかで統計学が最強の学問であると。

と、タイトル通りの、一見傲慢な主張さえ声高に述べる鼻息の荒さです。

そんなわけで、せっかく興味深い本に巡り合いましたので、今回は本書のレビューをしつつ、私なりの意見もはさんでいきたいと思います(レビューはちきりんさんの本で書いて以来、久々ですね・・・)。


さて、レビュー開始にあたり、私もあえて断言させていただくと、

統計学は最強の学問ではありません!

わー、身も蓋もない。(笑)

はい、というわけで、今日も一緒にボーッと考えていきましょう。



統計リテラシーは超大事

のっけからタイトルを否定するような主張を掲げておいてなんなのですが、冒頭から褒めちぎっていることからお分かりの通り、私も筆者の統計学の重要性を訴えたいという思いには、とってもとっても共感するものです。基本的に本書の内容は同意・賛成なんです!

ではまず、統計学がなぜ重要かといえば、本書でも再三言われている通り、この社会には統計学の素養(統計リテラシーなどと言われます)が無いと、色々な判断を誤ってしまって、利益のチャンスを失ったり、不利益を被ったりすることが、少なくないからです。


「ゲーム脳」の恐怖
統計リテラシーを欠いた誤判断として有名なのが、本書内にも挙げられていた「ゲーム脳」の恐怖のお話です。

犯罪行為をはたらいた少年たちは暴力的なゲームを好んでいることが多い。
⇨だから、少年犯罪を防ぐために暴力的なゲームを禁止しよう!

こんな言説、きっとみなさんも聞いたことありますよね。
一見、もっともらしいようにも思ってしまうかもしれませんが、この主張にはとっても論理の飛躍があるのです。少なくとも「犯罪行為をはたらいた少年たちは暴力的なゲームを好んでいることが多い」という前提だけでは、とても暴力的なゲームを禁止する根拠にはつながりません。


問題点①:対抗馬の不在
ツッコミどころは多々あるのですが、大きなポイントを挙げておきますと、まず「犯罪行為をはたらかなかった少年たちが暴力的なゲームを好んでないかどうか」が確認されていないという点があります。
もし「犯罪行為をはたらかなかった少年たち」の方がより暴力的なゲームが好きだったとしたら、まずその時点で、「暴力的なゲームを禁止する」主張は無理が出てきますよね。だから、その結論を強く主張するためには、少なくとも「犯罪行為をはたらかなかった少年たち」はどうなのかという対抗馬の情報も挙げる必要があります。
対抗馬の情報を挙げなくてもいいのなら、

犯罪行為をはたらいた少年たちは毎日パンを食べていることが多い。
⇨だから、少年犯罪を防ぐためにパンを禁止しよう!

なんて、トンデモビックリな結論だって導き出すことができるからです。
パンなんて犯罪をしてない少年たちだって、そしてもちろん私たちだって、かなりの頻度で食べてますよね(笑)
ええ、当たり前の話のように聞こえるかもしれませんが、案外、この「対抗馬はどうなのか」という点を抜きにした議論というのは実は少なくないのです。


問題点②:因果関係は不明
あともう一つの大きなツッコミどころは、ちゃんと対抗馬のデータも持ってきて、ちゃんと「犯罪行為をはたらいた少年たちの方が犯罪をしてない少年たちより暴力的なゲームを好んでいた」としても、「暴力的なゲームが少年犯罪の原因」とは言えない点です。
これも一見するとひっかかりそうなポイントなのですが、例えばこんな主張を考えてみて下さい。

普段日本語を話す人たちは正月に初詣に行くことが多い。
⇨だから、正月の初詣を禁止すれば、日本語を話さなくなる!

だって、調査の結果、普段日本語を話す人たちは、普段英語を話す人たちより、確かに正月に初詣に行くことが多いんです!だから、理屈から言えば、やっぱり正月の初詣を禁止すれば日本語の会話を防ぐことができるんですよ!!

・・・なんて言われたら、いやいや、ちょっと待ってよ、と思いますよね(笑)
そうなんです、こんなの、ただ日本の文化だからですよね。確かに日本語を話す人のほうが初詣に行く傾向はあるでしょうけれど、初詣に行くから日本語を話すわけじゃないですよね。
そう、たとえ相関関係があっても因果関係があるとは限らないんです。

でも、暴力的なゲームの廃止を叫ぶ人は、実は同じ理屈を言っています。
例えば、少年犯罪の原因は暴力を推奨するような家庭環境にあるのかもしれません。その家庭環境が原因で暴力的なゲームを好んだり、犯罪をしでかしたりしているだけかもしれません。なら、元の家庭環境を改善しないでゲームだけ禁止しても、犯罪は減らないのは明らかですよね。
こう考えると、当たり前の話なのですが、案外、この「因果関係はどうなのか」という点を抜きにした議論というのはこれまた少なくないのです。


人は都合よく考える
結局、こういった誤判断(少なくとも早計な判断)が何故起こるかと言えば、人はついつい、いわゆる「結論ありきの理屈」を述べたくなるものだからです。
意識的にせよ無意識的にせよ、私たちは、ついつい自分の好む結論に持って行きたいがために、都合の良い解釈をしたり、論理の飛躍をしたりしてしまうものなのです。

統計学というのは、実はこういった「主観的な判断」「恣意的な判断」「都合のいい判断」を防止するための学問と言ってもいいぐらい、「主観」「故意」「恣意」を嫌います。だからこそ、凄まじく「客観的」な学問です。
このように統計学は「客観的」な立場であるからこそ、先ほどのような詭弁を防ぐことができます。誤判断を避け、正しい道を照らす道標と言ってもいいでしょう。
玉石混交の様々な情報や主張があふれている現代で、情報を客観的に吟味できる統計リテラシーが非常に強力かつ重要な能力だという筆者の主張は、非常に共感できるところと思います。
私も一緒に声を大にして「統計学大事だよ!」って叫んであげたいぐらいです。


統計学の弱点

さて、一般に学問というのはかなりシビアに「客観的」であることを求められる領域です。
どんな素晴らしい主張であっても、「客観的な根拠は全くないのですが、私はそう信じています」と最後に付け加えるだけで、誰も聞いてくれなくなります(笑)
だから、非常に「客観的」である統計学というのが「最強の学問」なんだという筆者の主張ももっともかもしれません。
にも関わらず、私が「統計学は最強の学問じゃない」と言うのはなぜかといえば、やっぱり統計学にも弱点があるからです。

おそらく実は筆者もその弱点が分かった上で本書を書かれていると思うんですよね。
例えば冒頭に挙げた売り文句も、

あえて断言しよう。あらゆる学問のなかで統計学が最強の学問であると。

分かります?「あえて」なんですよ。
本当は弱点もあると思ってるけれど、とにかく今は統計リテラシーの重要性を周知させたいという想いから筆者は「あえて」最強の称号を掲げたんだと思うんです。


統計の目指すゴール
さて、そんな統計学の弱点の切れ端は実は本書の中にもちらりと登場しています。
ちょっと長めの引用をしますと。

統計学をある程度マスターすれば「どのようにデータを解析するか」ということはわかる。だが、実際に研究や調査をしようとすれば、「どのようなデータを収集し解析するか」という点のほうが重要になる。
(中略)
では、私たちはいったいどのようなデータを比較し、その違いを生み出しうる要因を探し当てればよいのだろうか?
その答えを一言で言えば、ごく簡単だ。「目指すゴールを達成したもの」と「そうでないもの」の違いを比較しさえすればいい。あるいはゴールを達成するという表現は「自分にとってより理想的」とか「より好都合」と言い換えてもいい。
こういう風に説明すると、「それでは目指すゴールとは何なのか?」という質問をいただくこともあるが、その質問に対して私が返せる最も正確な答えは「知らんがな」である。あるいはもう少し紳士的に言うと、「それは人それぞれですね」ということになる。

つまり、統計学では「ゴール設定」が課題となってくるんですね。
この点については本書の中でも面白いエピソードが紹介されていて

「我が社(もしくはクライアント企業)には何テラバイトにも及ぶ膨大なデータが溜まっている。Exadataほどではないがサーバも導入した。で、ここから何かわからないだろうか?」
こうした相談を持ちかけてくる企業のことが、私はいつも不思議でならない。
「何がわかるかもわからずに、なんでそんな投資したんですか?」と正直聞きたい。

「ゴール」についてのイメージが定まらないまま、多分何かできるはずと思って統計用の高い買い物をしてしまった企業の話。
例えて言うなら、この話は高級なゴルフクラブを買っておいて、「で、これは何に使う棒なのかな」と言っているようなものですよね(笑)
何事もそうですけれど、ちゃんとゴールも決めないまま、せっせと高級な道具だけ揃えるなんて、そりゃおかしい話なわけです。


ゴールを決めるという主観的な作業
しかし、先ほどのゴール設定についての引用文章をよく見てみてください。

「自分にとってより理想的」「より好都合」ですよ?

えっと・・・めっちゃ「主観的」ですよね。

そう、他でもない、この「統計のゴール設定は主観的に行われる」という点こそが、私の考える統計学の最大の弱点なのです。

考えてもみて下さい。
本書の中でも統計学の歴史の節で触れられている通り、IT技術が発展して、昔に比べたら統計は簡単に大規模に行えるようになったとはいえ、それなりにお金や労力がかかる行為です。
だから、みんなどうしても「役に立つであろうテーマ」や「利益のでそうなテーマ」について統計を取ろうとします。大規模な統計であればあるほど、大規模な予算や人員が必要になりますから、よりその傾向は強くなります。

例えば、博打かなんかで使うサイコロを振った時の出目についての統計や分析は行われても、サイコロの飛距離や回転数を調査する人はまあ稀でしょう。あるいは、競馬の勝ち馬の特徴を分析する人はいても、投げ捨てられた外れ馬券の滞空時間を調査する人はいませんよね。
だって、サイコロの飛距離や外れ馬券の滞空時間なんて調査したところで、特に役に立ちそうもありませんからね。

そうするとどうなるでしょう。
あえて根拠レスなことを言いますが、そう、統計のゴールの分布の統計をもし取ったとすれば、きっとめちゃくちゃ偏るんですよ。

先ほどのゴルフの例で言えば、ゴルフクラブを使って打ったボールの目指す先って、あたりまえですけどホールだったり、せいぜい途中のフェアウェイですよね。バンカーやOBや池ポチャを狙う人なんて、まあ、いないわけです。

つまり、「主観」「故意」「恣意」を嫌う「客観的」な統計学も、それが仕えるべき「統計のゴール」という主人は、まさしく「主観」「故意」「恣意」でできているという弱点があるのです。
その「ゴール」という自分勝手な主人は統計学の手の届かないところに居るために、統計学ではどうにもできない「目の上のたんこぶ」なのです。


学問が客観的であるために

最強の「客観的」な刺客だったはずの統計学が手出しできない「ゴール設定」という弱点に対して、学問がその理想とする「客観性」を実現するためにできることは一つしかありません。
それは「ゴールをとにかく各自で自由に考えること」です。
つまり「出来る限り何でも別け隔てなく調べること」です。
なるべく、一見「どうでもいいようなこと」さえ調べるべきです。「役にたちそうにないこと」だって気をつけるべきです。
多くの人がやっていることから、あえて離れたテーマを研究してみる人も必要なんです。

そうしてなるべくテーマが分散してランダムになるようにしないと、統計学が私たちに教えてくれた、学問の肝である「客観性」が発揮できないのです。
本書の中でもページを大きく割いて触れられていたように「ランダム性」という要素が統計学の「客観性」を担保する最大の特徴です。
しかし、「ゴール設定」についてはその「統計学」が闘えない領域である以上、私たちが私たち自身で出来る限りランダムになるようにするしかないのです。
つまり、各研究者の多様性こそが学問が客観的になるために最も必要な要素なのです。


実用的なのが学問ではない
以前、私が「ニセ科学」の記事でも主張した通り、学問に対する社会からの「実用的であれ」という圧力は凄まじいものがあります(代表的なセリフが「二位じゃだめなんですか?」でしたね)。
しかし、改めて主張しますけれど、学問というのは「探求する」のが本質であって、「役に立つかどうか」は二の次なのです。
そして「探求する」ことを第一にしているからこそ、「役に立つ」とも言えるのです。

例えば「役に立つ」という一つのゴールに全ての学問が追従した時点で、学問は多様性を失い「客観性」を失ってしまいます。
「客観性」を失えばどうなるかといえば、結局統計のゴールが「主観的」になってしまい、それこそ最初の「ゲーム脳の恐怖」の例で挙げたような危険な誤判断や早計な判断につながりかねません。
つまり、ややこしいのですが、統計学が私たちに教えてくれたことを踏まえれば、「役に立つ」ことを追求し「客観性」を失った結果、「主観的」になり、かえって「役に立つ」ことが阻害されるパラドックスさえ生じうるのです。


統計原理主義者の矛盾
「統計学が最強の学問である」と私が言いたくない理由はココにあります。
統計リテラシーが無いことも問題ですが、統計学などの「客観性」が強い学問を最強と信じるあまり、客観的でない意見をすぐに排除する、いわば統計原理主義者というような人も見受けられるからです。統計リテラシーが強すぎる人と言ってもいいでしょう。

例えば、「◯◯が△△だから、□□なんじゃないかなー」という主張を誰かがした途端、「その根拠は?」「◯◯の定義は?」「どこにそんなデータがあるの?」と問い詰め始め、ちょっと言いよどむと、「ほーら、客観性を欠いた、主観的な意見だね、デタラメ言うな」などと彼らは断じます。

しかし、先ほどから述べています通り、私たちが神ならぬ人である以上、「統計のゴール」は主観的なものにしかなりません。そしてそのゴールを目指すためには、まず「◯◯が△△だから、□□なんじゃないかなー」という主観的な仮説を立てないと話は進みません。

ですが、統計原理主義者は客観性を重んじるあまり、この仮説の段階で「根拠となるデータ」を求め、客観的でないとして、それを否定することがしばしばあります。
それが論文や学会発表などの「客観性の祭典」ならいいでしょう。そこでは「客観的であること」が至上のルールだからです。ただ、その客観性のリング外でさえ、暴力的に「客観性」の物差しを振るう人はやはり居るのです。

そう、逆説的ですが、客観的でないとして主観的な意見を排除すればするほど、テーマの多様性が失われて、学問全体としては主観的になってしまうのです。
これこそが統計原理主義者の矛盾です。

ゴルフの例えで言えば、すごく上質のゴルフクラブを持っていてそれを振っていい球を飛ばすけれど、ホールの位置を全然違う場所と思い込んいる可能性があるという感じです。
なぜって、世界は本当はゴルフのように「ホールの位置」は事前に決まっていないので、下手をするとグリーンの中にホールが無くて、バンカーの中にあってもおかしくないからです。グリーンの方にだけ打ち込んでも実は全然ホールに入っていないということも起こりえます。
だからこそ、バンカーでもOBでも池でも色んなところに打ち込むしかないのです。
でも、一人一人はどうしても主観的、つまり一打ずつぐらいしか打てないのですから、みんなでなるべく色んな所にボールが飛ぶように色んな向きに打ってみるしか無いのです。


統計学は最強の・・・

本書の筆者も「ミシンを2台買ったら一割引きで、売上が上がるのか?」という節で、一見馬鹿げたような仮説をすぐに「誤り」と決めつけてしまうことの愚かさを説いています。

ですから、きっと、筆者も、優れた統計家ほど「根拠は?」「データは?」などと問い詰めるばかりのような統計原理主義にならず「ゴールの設定は人それぞれ」と「多様な主観的な見地」も大事にする、と潜在的に主張したいのではないかなぁと、私は本書を読んで感じました。

その上でまず統計リテラシーの普及のため、「あえて」「統計学が最強の学問である」と掲げた筆者。

だからこそ、私はその「あえて」の気持ちを組んで、「あえて」「統計学は最強の学問ではない」と主張したいのです。

もちろん、統計学は非常に重要で有用な学問です。
客観性を担保したい時には、非常に大切な存在です。
学問にとってはとてもとても欠かせない全ての学問に共通した基盤であり、武器なんです。

ですから、統計学は「最強の学問」ではなくて、言うならば、

「統計学は最共の学問である」

そして

「統計は学問にとって最強の武器である」

のです。





P.S.
相変わらずのぶっとんだ主張を、相変わらずの長文でお送りいたしました(/ω\)
ちなみに、どんな仮説も誤りと即断してはいけないからこそ、実は「ゲーム脳の恐怖」仮説も、本当は上の理屈では否定されたわけではありません。便宜上、「誤判断」扱いさせていただきましたが、本当は本文中カッコの中にも示したとおり、「まだ結論を断定するには早い早計な仮説」でしかありません。
だから、「ゲーム脳の恐怖」を主張してはいけないとは言えないのです。
しかし、あまりにも真実であったり、証明されたものであるかのように強く主張しすぎれば、やはりそれは客観性を損ないますから、そこまでいくと、批判されても仕方がないというのはあるのですけれど。
なので、もし読まれた方の中に「ゲーム脳」関係者の方がいらっしゃっても、怒らないでくださいね(;・∀・)

統計リテラシーの解説については、ブログである都合上、ちょっと理屈を端折っているとこもありますが、そこはご容赦下さい。「結局統計学ってどんなんなの?」と興味がわいた方は是非本書を手にお取りいただければ!

0 件のコメント:

コメントを投稿