<交絡因子という実在の怪物>

    統計を学んでいると“悪魔の証明”に出てくる“悪魔”の正体が理解できるようになります。この“悪魔”については、一たびそのの正体が分かると対処法は比較的簡単です。何故なら、それは我々の心が産み出した思い込みだからです。しかし、今回紹介する“交絡因子”という怪物は実在する“怪物”です。そして、その対処法は限られていますし、現実にはその対処法が使えないことが殆どです。<科学の目的>の回で紹介した“The Lady Tasting Tea”という本には、R.A.フィッシャーが喫煙と肺癌との因果関係に最後まで疑念を呈していたくだりがあるのですが、その原因のひとつは、この交絡因子という怪物への対処法が不完全にならざるを得ないことに起因すると言っても過言ではないでしょう。また、私がR.A.フィッシャーを科学者として崇拝するのも、この交絡因子へのこだわりというか、センス故です。それはさておき、この交絡因子について理解することは、対処法を考える上でも重要ですし、この怪物がどこで悪さをしているかを見極めることも重要です。

    前回お話しした、反実仮想モデルを使った因果関係の検証方法は、全く同じ現実を2つ用意して、一方に原因と考えられる因子を加え、もう一方には何も加えない、そしてそれらの結果を比較して、2つの結果に差があれば、その因子は結果に何らかの影響を及ぼした、つまり原因と結果という因果関係が存在する、反対に2つの結果が同じで差が無ければ、その因子と結果の間には因果関係が存在しない、というものでした。この方法を使えば、寝坊が遅刻の原因になっているか?風邪薬に効果があったのか?自分のお陰で試合に勝てたか?というのが、誰の目にも、文句のつけようがなく、明らかにできるということです。

    しかし、ここで我々は壁にぶつかります。反実仮想モデルで言う、全く同じ現実を2つ用意できるのか?と。その様なことは奇跡でも起きない限りあり得ませんが、人類は意図的に作り出すことを思い付きました。それが実験室で行なっている実験です。実験室の中では、検証したい因子以外の条件を同じに揃え、原因として検証したい因子を加えた場合と、加えなかった場合の結果を比較することにより、検証した因子と結果の間に因果関係が成立したかどうかを検証することができます。

    では、実験室の中で検証された因果関係を蓄積していけば、我々は世界の全ての因果関係を知ることができ、ひいては我々の生活に役立ち、これぞ科学の進歩のおかげだ!となるのでしょうか?残念ながら現実はそう甘くはありません。例えば、薬が人間の病気に対して効果があるかないかの検証は、実験動物で検証されていても、やはり人間で検証しなければ分かりません。実験動物で効果が検証されている物質でも、人間で効果が無かった、なんて言う物質は世の中にゴマンとあり、そういった事例の方が圧倒的に多いのです。ですから、なんとしてでも実験室以外の因果関係の検証方法を考えていかなければなりません。

    そこで考える出発点として、同じ病気のAさんとBさんのどちらか一人に薬を飲んでもらい、もう一人は薬を飲まずに、症状が改善したかどうか、つまり薬が病気に効くかどうかを検証する場面を考えてみたいと思います。この場合、体質により、薬が早く代謝されてしまったり、病気の進行度合いが違っていたりと、なかなか上手く比較できません。薬を飲んだ人が重い症状だったりしたら、薬に効果があっても症状が改善しなかったり、逆に、薬を飲まない人の症状が軽かったら、薬を飲んでいないのに症状が改善したりしたら、薬を飲んだ方が症状が悪化するなんていう誤った結論を導いてしまうかもしれません。そもそも、反実仮想モデルから言うと、Aさん、Bさんは全く同じでなくてはならない筈です。そうです、体質や病気の状態によって症状の改善は影響を受ける(可能性がある)ので、これらの影響を除かないとキチンと検証ができないのです。

    今、さりげなく話してしまいましたが、薬の代謝だったり、病気の症状の軽重だったり、は検証したい結果に影響を及ぼす可能性がある因子で、これらを交絡因子と言います。つまり、交絡因子が存在しているので、それらを除かなければ、反実仮想モデルを使うことができず、因果関係も検証できない、ということです。だから、この交絡因子という、実在の怪物の正体を見極め、対処法を考えなければ、現実世界で因果関係を検証することは不可能ということになります。交絡因子が結果に影響するパターンはいくつかあり、追ってお話ししますが、ここではこのまま交絡因子の対処法について考えていきたいと思います。

    Aさん、Bさんの話に戻しますと、薬の効果を検証するのに、個々人の薬の代謝や症状の軽重といった交絡因子が結果に影響を及ぼすならば、それらを揃えておけば良いのでは?という発想は自然です。つまり、薬の代謝を揃えたいなら、薬の代謝を担う肝臓の疾患が無い人同士(あるいは疾患を持った人同士)で比較する、症状を揃えたいなら症状が同程度の人同士で比較する、という方法です。実際には、代謝の良し悪しや症状の軽重は単純に線引きされるものではありませんが、それでも、何も考えずに一括りにして検証するよりも、こういった人ごとの背景を揃えて検証した方が信用のおける検証になりそうです。実際、この様な手法は層別化と呼ばれ、結構多用されています。

    さて、今、層別化をしていくと、交絡に対処でき、上手く因果関係を検証できそうな話をしたのですが、本当にそうでしょうか?Aさん、Bさんの例では、予め代謝や症状の軽重が結果に影響を及ぼすだろうと、予測または過去の知見を前提にして話を進めました。では、年齢を揃える必要はないでしょうか?直前に食事をしたかどうか、何を食べたか、飲酒をしたか、喫煙者か、体重は?睡眠時間は?などなど、結果に影響する可能性のある因子はドンドン増えていきます。そして、層別化を無限に進めていくと、反実仮想モデルでいう、全く同じ人を2人用意しなくてはならないという結論に戻ってしまいます。病気や薬の効果と交絡する因子について、神のごとく完全に理解しているなら話は別ですが、人類は無知なので何も知らないことを前提に検証できる方法があれば、未知の薬にも使えて便利ということになります。

    と言う訳で次回は、交絡という怪物を断ち切る究極の武器の話をする予定です。交絡因子ってチョロそうですか?イヤイヤとんでもない!!その判断は次回を読んでからの方が良いでしょう。交絡因子は、英語だと“confounding“です。結果に影響を及ぼす、あるいは、結果と常に一緒なのでconfoundingです。我々が因果関係を検証する際にはこの交絡の影響を無くさなければならないと検証できないということを覚えておいてください。反実仮想モデルという理論上のモデルに対して、現実にそれを邪魔しているのが交絡因子ということができます。
    
    蛇足ですが、今まで話してきた反実仮想モデルを使う方法では、2つの事柄の間の因果関係を検証できるのですが、何処まで本質に迫っているかは分かりません。つまり、“風が吹けば桶屋が儲かる”のように現象を順に追って因果関係を確認する方法ではなく、“風が吹いた(原因らしきもの)”と“桶屋が儲かった(結果)”の間の因果関係が検証できれば良いのであり、2つの事柄の間に何が起ころうと知ったこっちゃないのです。このことは一見、いい加減に見えますが、よくよく考えてみると、原因と結果を決めてしまえば、それらの間に未知の事象があっても検証できるという便利さもあります。