<検出力は悪魔を倒せるか?>

 前回、前々回と相関関係の中から因果関係をいかに見つけていくかについてお話ししてきました。その中では、我々が世界をデータとして捉え、数学を使って解析する時、相関関係しか分からないので、データの取得方法や解析の条件をコントロールし、因果関係を見極める必要があるということをお話ししました。

 

 具体的に話しますと、データが相関関係にある場合は、パターン①から⑤の理由が考えられ(前回、前々回参照)、その中から、上手く因果関係を見つけていく作業のお話しをしました。それには先ず、原因は結果の必ず前に来ることから時間の経過を考慮する必要があり、この事を考慮している前向き試験の方が、後ろ向き試験に比べてエビデンスレベルとしては高いと見做せるという説明をしました。

 

 また、パターン①から④を見分けるには、データの相関以外の知見を活用する必要があることを説明しました。

 

 今回は、パターン⑤(本をよく読む(原因?)→糖尿病(結果))のような、意味があるのか無いのか分からない、過去の知見も存在しない相関が紛れ混んでいる可能性をどの様に制御していくか?というお話しから始めていきます。

 

 ”本をよく読む”と”糖尿病”の間には、一見、因果関係がなさそうですが、”本をよく読む”⇨“運動不足”⇨”糖尿病”という関連性も考えられます。この相関関係が意味がある真の相関なのか、本当は関連が無いのに偶然に検出されてしまったのかを区別する方法です。結論から言ってしまいますが、サンプル数を多くし、偶然に相関関係が見つかる可能性を低くするという方法を取ります。

 

 検証試験を例に考えてみましょう。『本をよく読むことは糖尿病の原因となる』という仮説を検証するとします。交絡などを調整できるよう上手く検証できる試験を組めることを前提として、本をよく読む人をA群、本を読まない人をB群として比較検証していきます。

 

 最初にA群、B群の人数をそれぞれ10人ずつを追跡し、糖尿病になった人の割合を比較してみます。その結果、糖尿病になった人がA群で4人、B群で3人だったとしたら、A群の方が多かった、故に本を良く読むことが糖尿病の原因になっていることが検証された、と自信を持って言えるでしょうか?多くの人は私がこんなことを言っても確証を持てないのではないでしょうか?理由はこの4人と3人の差が偶然に起こったかもしれないという疑惑が晴れないからです。

 

 この偶然によるかどうかの疑惑を晴らすにはどうしたら良いでしょうか?

 

 話を進めてしまいますが、A群、B群それぞれ100人ずつを比較し、40人と30人だったらどうでしょうか?10人ずつを比較した時よりも、仮説を支持する人が多くなると思います。更に、1000人ずつを比較し、400人と300人となったら、本をよく読むことは糖尿病に何らかの関係があるのでは無いか?というこの仮説はかなりの信憑性を持って受け入れられるのでは無いでしょうか?

 

 つまり、サンプル数を10人ずつよりも100人ずつ、更に1,000人、10,000人と増やせば増やすほど、偶然による間違いを除くことができそうです。ではサンプル数は多ければ多いほど良いのでしょうか?

 

 もう一度、今の検証試験に戻ってみます。A群、B群それぞれ10人ずつ比較し、糖尿病になった人が10人と3人だったとします。明らかに違いそうですよね?更にサンプル数を100人ずつにし、100人と30人ならもうこれは偶然では片付けられないと考える人が殆どだと思います。つまり、本を読むことが糖尿病の原因として効果が強ければ強いほど少ないサンプル数でも上手に見つけられそうです。

 

 こららの事実から言えることは、結果に対する効果が強い場合はサンプル数が少なくても信頼のおける検証ができますよ、逆に、効果が弱い場合はサンプル数を多くしなければ偶然による相関も拾ってきてしまう可能性もありますよ、ということです。この様に、サンプル数と効果から決められる数値を検出力と言い、検出力が高ければそれだけ僅かな効果も捉える事ができます。但し、・・・

 

 ここに悪魔の生まれる隙があるのです。

 

 私が『本をよく読むことは糖尿病の原因となる』という仮説を立てました。A群、B群、1,000人ずつで比較し、それぞれ302人、299人という結果を得たとします。これだと差が偶然かどうかは分かりませんよね?そこで新たに1万人ずつ比較します。3,001人、3,000人ならばどうでしょうか?更に固執する私は100万人に増やし、30万人、30万人という結果が出てきました。それでも、私は自分の仮説に自信がある、1億人ずつを比較すべき、と言い出したらどうでしょうか?

 

 もうどこまで調べれば気が済むんだ?と思うでしょうか?それとも皆の為を思う熱心な研究者に映るでしょうか?

 

 皆さん、お気づきかと思いますが、『本をよく読むことは糖尿病の原因となる筈だ』と言い張られると、周囲は、絶対無いとは“証明できない”のです。

 

 よしんば、1万人ずつ比較し、3,010人、と3,000人という結果(リスク比で、3010/3000 = 1.003  (0.3%)  )で因果関係がありそうだ、という結果が出たとします。これで、私が「本を読むのは危険だ!」と本を読むことのメリットを無視して言うことが正義でしょうか?

 

(そもそもこれ(”本をよく読む”⇨“運動不足”⇨”糖尿病”)を考えたら、運動不足を解消した方が良いんじゃないか?ってツッコミどころ満載ではありますが。。。)

 

 悪魔に取り憑かれた人たちは自分の妄執に取り憑かれているのです。現実を見ていないと言っても良いでしょう。現実的に不可能な検証をしろ、そうでなければ俺様の仮説が正しいと認めろ、と。。。これに打ち克つには、妄執に執われず、キチンと理性に従って考える事、言い換えればここで説明した検出力の意味をしっかりと理解する事が大切です。

 

 交絡は実在する怪物、悪魔は心に住む幻なのです。悪魔を退治するのはあなた自身の心です。但し、ここでは簡単そうに説明しましたが、日常生活での実践は難しいですよ。我を捨てること、自分の思ったことを捨てることですから。

 

 例えば、過去記事の例で言うと『自分が居たからチームが勝った』と思い込んでいたのが検証の結果、自分の思い込みに過ぎなかった場合、或いは、いつも仲良くしてくれて自分に好意があると思っていた異性にパートナーが居た場合、などです。検証の結果を認めること、そこから更に一歩前進することは、その人の成長に欠かせないものですが、とても勇気の要ることなのです。

 

『よう言うた又八。弱い者は己を弱いとは言わん…おぬしはもう弱い者じゃない。強くあろうとする者。もう一歩めを踏みだしたよ。』byお杉おばば(バガボンドより)

 

 私はオカルトやUFOなどの話が夢があって好きです。ただ、その論法に辟易してしまう事があります。例えば、『UFOは存在すると確信する、その証拠を政府は隠してる、それを公表しろ』のような話を聞いたことはありませんか?よくよく考えたら『あなたが、UFOは存在すると言う根拠は何ですか?』、それを提示すれば終わってしまう話ではないでしょうか?政府が証拠を出せないから“益々疑惑が深まった”って論理的におかしくありませんかね?ということです。

 

 そのような扇動に乗せられない為には、自分がそう考える根拠は何か?を常に考えておく必要があります。それは科学をする上で不可欠のものであるだけでなく、自分自身を向上させるのに欠かせないものでもあるのですから。

 

ご興味があれば過去の記事<ヨーダの言葉>を読んでみるのもヒントになるでしょう。