<世界をモデル化する。抽象化された世界で考えるということ。>

 今回は、<はじめに言葉ありき>でお話しした抽象化についてもっと科学的な面から掘り下げていきたいと思います。

 

 さっそくですが、皆さまが高校物理で習った次の式“v=gt”は現実か?というところから始めさせていただきます。この式の意味するのは、“物体の自由落下速度は時間に比例する”、という関係です。重さに関係しないとか、色々、読み取ることができますが、そういう関係を表しています。

 

 では、この式は現実にそうなるでしょうか?例えば、鳥の羽根、雨の水滴、雪、みな同じ速度で落ちてくるでしょうか?現実にはそうはならない筈です。つまり、この関係式には前提条件があります。すなわち、ここでいう物体には形や体積が無く、風の影響や空気抵抗を無視した場合の理論上の関係式だということです。こうした力学の関係式を現実世界で使う際には、そうした前提条件を考慮しなくてはならない、もしくはそれがどこまでそれが使えるかを念頭に置き、使える範囲を明確にしなければ上手に使いこなすことができません。

 

 念を押しますが、理論上の関係式が成り立つのはそれが現実のデータに支えられているからですが、実際的な場面では落下速度に影響を与えるそれ以外の要素もあるので、それらを考慮して、使える、使えないを判断する必要がある、ということです。

 

 さて、話を更に進めて、この物体の落下の例を使って10メートル下の落下点を想像してみましょう。理論的には、質点の場合は形や風の抵抗もなく、物体はまっすぐ下に落ちる筈です。ここに平べったい板の様なものを落とすことを想像してみましょう。現実世界の話なので、形や向き、風速なども考慮します。板は落ち始めの向きによって空気の抵抗を受け、前後左右に揺らぎながら落ちる筈ですし、途中で風の影響を受けたりして、その落下点は質点の時の様に真下に落ちるとは限りません。これを正確に予測しようとすると、板の向き、風の速度や方向などを変数(パラメータ)とし、モデル(関係式)に組み込む必要がありそうです。現在では、計算科学が発達していますので、そうした変数と落下点から適切な関係式を組み立て、精度よく落下点を予測することが可能かもしれません。

 

 今、行った一連の作業は、物体の落下点の位置をそれに影響しそうな因子を変数とし、データに基づいて関係式として表すという作業でした。これが現実をモデル化する、或いは、関係式などに抽象化して考えるということです。なんとなくイメージを持っていただけたでしょうか?そして、私が強調しておきたいのは、科学は現実を抽象化して表しているのであって、実在との間にギャップがあるということ、そして科学はそのギャップを埋めるように理論を修正していく、という作業になるということです。

 

 こうした抽象化、モデル化はなにも物理だけではありません。疫学の例を考えてみましょう。今回もいつものように、何でも揃っている都合の良い架空のデータベースを想像しましょう。今、ある薬を服用した患者さんに副作用が起こっている疑いがあり、それを調べる為に、薬を飲んだ人と飲まない人で比較し、副作用があるかどうかを確かめることにします。

 

 さて、ここで薬を飲んだ人を定義(=決めること)してみましょう。単純にはその薬を1回でも飲んだ人を”薬を飲んだ人”、その薬を全く薬を飲まなかった人を”薬を飲まない人”と決めて比較するかもしれません。しかし、ちょっと考えてみてください。この定義だと、1回飲んで止めてしまった人と1年間継続して飲んだ人を同じ”薬を飲んだ人”として扱って良いか?少ない量を飲み続けている人と多い量を1回飲んだ人を同じに扱って良いか?過去に飲んでいたけど、一旦止めて再開した人、或いは止めてから別の薬を飲んだ人、或いは止めて10年後に副作用らしきものを発症した人、こうした様々な”薬を飲んだ人”を同じに扱っても良いのでしょうか?

 

 答えは、ケースバイケースです。つまり、検証しようとする副作用に依ります。例えば、ショック性の副作用の場合なら、薬を一回でも飲んだ人は”薬を飲んだ人”グループに入りますが、過去にその薬を飲んでいたけど、違う薬に変えた後に副作用を起こした人は”薬を飲んだ人”から除外したりします。つまり、生物学的にどのような反応が起こっているかのモデルを考えつつ”薬を飲んだ人”の定義を決めているのです。

 

 このような事象を抽象化する能力は、人類に固有の能力と思われます。人類の歴史を振り返れば、遠いエジプト文明では土地やピラミッドの測量の必要性から幾何学が生まれました。また、デカルトは世界を座標の中に抽象化することを提案しました。ポアンカレアインシュタインは、思考の中でモデルを考えた訳です。数や足し算、引き算、掛け算、割り算も皆、抽象化の産物なのです。

 

 最後に、統計の役割についても確認しておきましょう。先ほど述べた物体の落下位置を推定する場合を考えてみましょう。この例では、落下位置に変化を及ぼす変数を色々考え、データを元に精度の高いモデルを組み立てていく方法を説明しました。ここで変数を考えずにデータを蓄積していったら、どうなるでしょうか?つまり、10メートルの高さから同じ板を何回も落としてみて、経験的にどこにどのくらいの割合で落ちてくるという統計を取れば、次に落ちる位置は統計的に推定ができてしまうのです。

 

 ちょっといい加減な感じがするかもしれませんが、ここで紹介した統計的な方法では、関係しそうな変数の選択やモデル化をしなくても、落下地点を推定できるという利点があります。変数が分からなくても対応できるという利点があ流のです。特に、生体反応や社会学などといった様々な因子が複雑に絡み合っている事象に関しては、未知の変数が多く、またそれらがどれくらい影響するかも、全くと言っていいほど分かっていません。その様な場合に統計が力を発揮するのです。いわば科学に於いて、理論と統計は両輪なのです。

<検出力は悪魔を倒せるか?>

 前回、前々回と相関関係の中から因果関係をいかに見つけていくかについてお話ししてきました。その中では、我々が世界をデータとして捉え、数学を使って解析する時、相関関係しか分からないので、データの取得方法や解析の条件をコントロールし、因果関係を見極める必要があるということをお話ししました。

 

 具体的に話しますと、データが相関関係にある場合は、パターン①から⑤の理由が考えられ(前回、前々回参照)、その中から、上手く因果関係を見つけていく作業のお話しをしました。それには先ず、原因は結果の必ず前に来ることから時間の経過を考慮する必要があり、この事を考慮している前向き試験の方が、後ろ向き試験に比べてエビデンスレベルとしては高いと見做せるという説明をしました。

 

 また、パターン①から④を見分けるには、データの相関以外の知見を活用する必要があることを説明しました。

 

 今回は、パターン⑤(本をよく読む(原因?)→糖尿病(結果))のような、意味があるのか無いのか分からない、過去の知見も存在しない相関が紛れ混んでいる可能性をどの様に制御していくか?というお話しから始めていきます。

 

 ”本をよく読む”と”糖尿病”の間には、一見、因果関係がなさそうですが、”本をよく読む”⇨“運動不足”⇨”糖尿病”という関連性も考えられます。この相関関係が意味がある真の相関なのか、本当は関連が無いのに偶然に検出されてしまったのかを区別する方法です。結論から言ってしまいますが、サンプル数を多くし、偶然に相関関係が見つかる可能性を低くするという方法を取ります。

 

 検証試験を例に考えてみましょう。『本をよく読むことは糖尿病の原因となる』という仮説を検証するとします。交絡などを調整できるよう上手く検証できる試験を組めることを前提として、本をよく読む人をA群、本を読まない人をB群として比較検証していきます。

 

 最初にA群、B群の人数をそれぞれ10人ずつを追跡し、糖尿病になった人の割合を比較してみます。その結果、糖尿病になった人がA群で4人、B群で3人だったとしたら、A群の方が多かった、故に本を良く読むことが糖尿病の原因になっていることが検証された、と自信を持って言えるでしょうか?多くの人は私がこんなことを言っても確証を持てないのではないでしょうか?理由はこの4人と3人の差が偶然に起こったかもしれないという疑惑が晴れないからです。

 

 この偶然によるかどうかの疑惑を晴らすにはどうしたら良いでしょうか?

 

 話を進めてしまいますが、A群、B群それぞれ100人ずつを比較し、40人と30人だったらどうでしょうか?10人ずつを比較した時よりも、仮説を支持する人が多くなると思います。更に、1000人ずつを比較し、400人と300人となったら、本をよく読むことは糖尿病に何らかの関係があるのでは無いか?というこの仮説はかなりの信憑性を持って受け入れられるのでは無いでしょうか?

 

 つまり、サンプル数を10人ずつよりも100人ずつ、更に1,000人、10,000人と増やせば増やすほど、偶然による間違いを除くことができそうです。ではサンプル数は多ければ多いほど良いのでしょうか?

 

 もう一度、今の検証試験に戻ってみます。A群、B群それぞれ10人ずつ比較し、糖尿病になった人が10人と3人だったとします。明らかに違いそうですよね?更にサンプル数を100人ずつにし、100人と30人ならもうこれは偶然では片付けられないと考える人が殆どだと思います。つまり、本を読むことが糖尿病の原因として効果が強ければ強いほど少ないサンプル数でも上手に見つけられそうです。

 

 こららの事実から言えることは、結果に対する効果が強い場合はサンプル数が少なくても信頼のおける検証ができますよ、逆に、効果が弱い場合はサンプル数を多くしなければ偶然による相関も拾ってきてしまう可能性もありますよ、ということです。この様に、サンプル数と効果から決められる数値を検出力と言い、検出力が高ければそれだけ僅かな効果も捉える事ができます。但し、・・・

 

 ここに悪魔の生まれる隙があるのです。

 

 私が『本をよく読むことは糖尿病の原因となる』という仮説を立てました。A群、B群、1,000人ずつで比較し、それぞれ302人、299人という結果を得たとします。これだと差が偶然かどうかは分かりませんよね?そこで新たに1万人ずつ比較します。3,001人、3,000人ならばどうでしょうか?更に固執する私は100万人に増やし、30万人、30万人という結果が出てきました。それでも、私は自分の仮説に自信がある、1億人ずつを比較すべき、と言い出したらどうでしょうか?

 

 もうどこまで調べれば気が済むんだ?と思うでしょうか?それとも皆の為を思う熱心な研究者に映るでしょうか?

 

 皆さん、お気づきかと思いますが、『本をよく読むことは糖尿病の原因となる筈だ』と言い張られると、周囲は、絶対無いとは“証明できない”のです。

 

 よしんば、1万人ずつ比較し、3,010人、と3,000人という結果(リスク比で、3010/3000 = 1.003  (0.3%)  )で因果関係がありそうだ、という結果が出たとします。これで、私が「本を読むのは危険だ!」と本を読むことのメリットを無視して言うことが正義でしょうか?

 

(そもそもこれ(”本をよく読む”⇨“運動不足”⇨”糖尿病”)を考えたら、運動不足を解消した方が良いんじゃないか?ってツッコミどころ満載ではありますが。。。)

 

 悪魔に取り憑かれた人たちは自分の妄執に取り憑かれているのです。現実を見ていないと言っても良いでしょう。現実的に不可能な検証をしろ、そうでなければ俺様の仮説が正しいと認めろ、と。。。これに打ち克つには、妄執に執われず、キチンと理性に従って考える事、言い換えればここで説明した検出力の意味をしっかりと理解する事が大切です。

 

 交絡は実在する怪物、悪魔は心に住む幻なのです。悪魔を退治するのはあなた自身の心です。但し、ここでは簡単そうに説明しましたが、日常生活での実践は難しいですよ。我を捨てること、自分の思ったことを捨てることですから。

 

 例えば、過去記事の例で言うと『自分が居たからチームが勝った』と思い込んでいたのが検証の結果、自分の思い込みに過ぎなかった場合、或いは、いつも仲良くしてくれて自分に好意があると思っていた異性にパートナーが居た場合、などです。検証の結果を認めること、そこから更に一歩前進することは、その人の成長に欠かせないものですが、とても勇気の要ることなのです。

 

『よう言うた又八。弱い者は己を弱いとは言わん…おぬしはもう弱い者じゃない。強くあろうとする者。もう一歩めを踏みだしたよ。』byお杉おばば(バガボンドより)

 

 私はオカルトやUFOなどの話が夢があって好きです。ただ、その論法に辟易してしまう事があります。例えば、『UFOは存在すると確信する、その証拠を政府は隠してる、それを公表しろ』のような話を聞いたことはありませんか?よくよく考えたら『あなたが、UFOは存在すると言う根拠は何ですか?』、それを提示すれば終わってしまう話ではないでしょうか?政府が証拠を出せないから“益々疑惑が深まった”って論理的におかしくありませんかね?ということです。

 

 そのような扇動に乗せられない為には、自分がそう考える根拠は何か?を常に考えておく必要があります。それは科学をする上で不可欠のものであるだけでなく、自分自身を向上させるのに欠かせないものでもあるのですから。

 

ご興味があれば過去の記事<ヨーダの言葉>を読んでみるのもヒントになるでしょう。

<後ろ向き研究と因果関係>

 今回は前回<結果と相関関係にある因子いろいろ>の続きで、後ろ向き研究を相関関係と因果関係の観点から考えていきたいと思います。始めに探索的な解析を説明し、次にケース・コントロール研究を見ていきたいと思います。

 

 前向き研究の説明では、リサーチクエスチョンに基づいてどういったデータを取っていくか?という話をさせていただきました。今回は、予め十分なデータが取得されている状況(データベース化されている状況)を思い浮かべてください。データの内容も前回と同じものを使います。すなわち、糖分を多く摂取する or 摂取しない、運動する or しない、肥満 or 肥満でない、糖尿病である or 糖尿病でない、本をよく読む or 読まない、持ち家がある or ない、といったデータ項目を含む架空のデータセットを使います。糖分を多く摂取する人では、糖尿病の割合が高く、肥満の割合も高く、運動しない人の割合も高く、本をよく読む人の割合も高いという仮定も全く同じです。

 

 はじめに、前向き研究と、後ろ向き研究のリサーチクエスチョンを比較してみましょう。ここでは後ろ向き研究として、一番単純な探索研究を考えます。ここで、前向き研究のリサーチクエスチョンは、”糖分を多く摂取することが糖尿病の原因となるか”であり、これを検証していくのが前向き研究でした。一方、探索研究のリサーチクエスチョンは、”(データベースから)糖尿病の原因となり得る因子を探索する”というようになると思います。

 

 次に探索研究を順を追って見ていきます。今回の例では、前回用いた”糖分を多く摂取する人では、糖尿病の割合が高く、肥満の割合も高く、運動しない人の割合も高く、本をよく読む人の割合も高い”という集団を使います。そこから“糖尿病の原因となる因子”を探索する訳です。探索するには反実仮想モデルを逆に考えて、糖尿病の人とそうでない人を比較して、糖尿病の人に”有り”、そうでない人に”無い”因子が存在すればそれが糖尿病の原因となっている可能性があると考えます。

 

 やり方は簡単で、糖尿病の集団とそうで無い集団を比較して、糖尿病の集団で多く見つかる因子をリストアップすることになります。つまり相関関係にある因子を取ってきている訳です。(厳密に言うと交絡などの関連もあり100%成功するとは限りませんが、それ以外の手法はありません)

 

 その結果、糖尿病の集団では、”糖分を多く摂取する人”、”肥満の人”、”運動しない人”、”本をよく読む人”の割合が高かったとします。(前提では“糖分を多く摂取する人では、糖尿病の割合が高く、肥満の割合も高く、運動しない人の割合も高く、本をよく読む人の割合も高い”でした。糖尿病の有無で分けたらとこうなったと仮定して説明に使っているだけで、決してこのパターンが唯一無二ではありません。)

 

 この場合、”糖分を多く摂取する”、”肥満”、”運動しない”、”本をよく読む”を糖尿病の原因と考えて良いでしょうか?もう一度、以下を確認してみます。

 

パターン①:糖分を多く摂取する(原因)→糖尿病(結果1)→肥満(結果2)

パターン②:糖分を多く摂取する(原因)→肥満(中間因子)→糖尿病(結果)

パターン③:糖分を多く摂取する(原因)→糖尿病(結果1)、糖分を多く摂取する (原因)→  

      肥満(結果2)

パターン④:糖分を多く摂取する(原因1)→糖尿病(結果)、運動しない(原因2)→糖尿病  

     (結果)(、肥満(中間因子)→糖尿病(結果))

パターン⑤:本をよく読む(原因?)→糖尿病(結果)

 

 パターン①の場合、”肥満”は糖尿病の結果(糖尿病は肥満のリスク因子)であり、”肥満”は原因ではありません。また、パターン③では、”糖分を多く摂取する”ことは、糖尿病の原因であると同時に、”肥満”の原因でもあります。このパターンでは、”肥満”は糖尿病の原因とはなっていません。つまり、原因でない因子も取れてきてしまっている可能性があり、我々はデータを解析しただけでは判別できないということです。

 

 一方、この解析結果からは、パターン②における肥満の様な中間の因子、パターン④における糖分を多く摂取すること、パターン⑤における運動をしないことの様な因子も取ってくることが可能です。前向き研究の場合は、特定の原因と結果を検証しましたが、この探索研究では、相関関係を用いて原因となり得る因子を選んできているが、それら全てが糖尿病の結果になっているとは言い切れない、何故ならいくらデータ見てもパターン①から⑤のどれか分からないから、ということになります。

 

 ですから、因果関係としては、エビデンスレベルが検証研究に比べて低いものの、未知の原因候補を探すという特徴は検証研究にない特徴です。こうしたことから、研究者は自分のやるべきことは探索なのか?検証なのか?を目的に応じて使い分ける必要があります。また、探索研究の結果を検証研究の結果の様にミスリードしてはなりません。

 

 以上、2回に分けて、相関関係と因果関係の違いを、前向き研究と後ろ向き研究に絡めて説明させて頂きました。これで、今回の目的を果たした訳ですが、せっかくですのでケース・コントロール研究についても考えてみたいと思います。ただ、疫学の手法なので、関係ない人は読み飛ばしていただいても構いません。

 

 ケース・コントロール研究のリサーチクエスチョンは、前向き研究と同様、”糖分を多く摂取することが糖尿病の原因となるか”であり、これを検証したい、です。今、説明のために、結果から逆に考えてみます。すなわち、探索研究と全く同様に、糖尿病の人、糖尿病でない人をそれぞれ集めます。そして、過去に遡って原因と考える因子が原因となっているのかを検証します。やっていることは探索研究と同様、相関を求めているので、糖尿病の集団の中に、糖分を多く摂取した人の割合が糖尿病でない人の集団におけるそれよりも多ければ、糖尿病の原因と考えることができますよね。なので、研究は糖尿病であるかないか、と過去に糖分を多く取ったかそうでないか、と言うデータがあれば検証可能です。・・・・といきたいのですが、少し考える必要があります。

 

 ケース・コントロール研究では、データは取っていませんが、他のデータがどうなるか、想像しながら話を先に進めましょう。今回の検証にはパターン①の肥満のデータは、糖尿病と糖分摂取の因果関係に直接関係無いので取る必要はありません。パターン③における肥満も別の因果関係の結果なのでデータとして必要ありません。パターン⑤のように、糖尿病と糖分摂取に因果関係が無かったとしても偶然に相関関係が認められてしまうことがありますが、これはサンプル数を多くすることで防ぐことができます。このことについては<検出力は悪魔を倒せるか?>みたいなタイトルで話せればと考えています。

 

 さて、気を付けなければいけないパターン②と④における”肥満”と”運動しない”について考察してみましょう。最初の探索研究で使った前提を使います。この時、糖尿病の集団における”肥満”、”運動しない人”の割合は高いことになっていました。さて、パターン④では、”運動しない”は糖尿病の原因になっています。ということは、運動をしない人が多く含まれていると、それだけで糖尿病になる確率が高くなってしまいますよね?いわばゲタを履いている訳です。ということは、糖分摂取と糖尿病の因果関係を検証するには、”運動する” or ”運動しない”との様な糖尿病の原因となる他の因子を揃えてやる試験をする必要があります。これはパターン②における”肥満”の様に中間であっても同じです。

 

 では、その対策をどうするか?と言うことです。それには前向きの試験でやった様に、予め結果に対して原因となる因子で分かっているものを洗い出し、対処しなければなりません。一番分かり易いのは、この場合、”運動している人(または運動しない人)”の中で試験を組むなど、試験の集団を規定してしまい、結果に対して、検証すべき原因に他から邪魔が入らない様に試験を組むことです。この様にケース・コントロール研究では、患者さんの背景に気を配り、原因と結果のエビデンスを高める工夫が必要です。

<結果と相関関係にある因子イロイロ>

 今回は、前回<因果関係と相関関係>で述べた『データを時間毎に細かく区切り、前後関係を考慮しつつ解析することは因果関係を探る上で役に立ちますが、それも原因と結果の関係が予め予想がついている場合だけで、それが未知の状態ではデータベースの解析から正確に解釈できるかはどうかは分からないということ』について掘り下げてみたいと思います。

 

 また、<交絡因子という実在の怪物>の回で、『交絡因子が結果に影響するパターンはいくつかあり』という記載をしましたが、表題のごとく、交絡因子のパターンではなく、『“結果と相関関係にある因子のパターン”はいくつかあり』という表現が文脈上正しく、交絡因子はそれら相関関係にあるの因子のうちの一つと捉えるのが正確な表現だと思いますので、この場で訂正させていただきます。交絡因子を、結果と相関する因子のうちの一つと捉える利点は、ケース・コントロール研究や探索研究といった後ろ向きの研究を考える際、または、リスク因子の意味を考える際に明らかになると思います。

 

 先ずは、データベース研究を意識しつつ、お話を進めさせていただこうと思います。今、糖分を多く摂取する or 摂取しない、運動する or しない、肥満 or 肥満でない、糖尿病である or 糖尿病でない、というデータ項目を含んだデータセットを想定します。その他の項目については、本をよく読む or 読まない、持ち家がある or ない等何でも構いませんが、かなり多くの項目が網羅されている状況を想像してください。ここで、生物学的厳密さを欠いたまま仮定の話で進めさせていただきますが、糖分を多く摂取する人では、糖尿病の割合が高く、肥満の割合も高く、運動しない人の割合も高く、本をよく読む人の割合も高いというようなデータセットが得られるとします。

 

 この場合、結果と相関関係にある因子は次の5つのパターンに分けられます。すなわち、結果が更に後続の事象の原因となっているパターン①、原因と結果の間に中間因子が存在するパターン②、原因が異なる2つの結果と因果関係があるパターン③、結果に対し他の原因が存在するパターン③(これが交絡因子です)、単なる偶然により相関ができてしまうパターン⑤。これらを具体例で書くと以下になります。

 

パターン①:糖分を多く摂取する(原因)→糖尿病(結果1)→肥満(結果2)

パターン②:糖分を多く摂取する(原因)→肥満(中間因子)→糖尿病(結果)

パターン③:糖分を多く摂取する(原因)→糖尿病(結果1)、糖分を多く摂取する(原因)→  肥満(結果2)

パターン④:糖分を多く摂取する(原因1)→糖尿病(結果)、運動しない(原因2)→糖尿病(結果)(、肥満(中間因子)→糖尿病(結果))

パターン⑤:本をよく読む(原因?)→糖尿病(結果)

 

 さて我々は先述のデータセットを見ただけでは、これらパターン①から⑤のどれが本当の関係か、または①から⑤の様々な関係が混ざっているのか、どれくらい混ざっているのかは区別が付きません。ただ、別の研究で、肥満は糖尿病になりやすい(リスク因子)とか、運動不足は糖尿病になりやすい(リスク因子)とかの情報はあるかもしれません。この様な別の研究から分かる情報量は、糖尿病のようにある程度研究が進んでいる事象と、全く未知の事象では状況が違うことも頭の隅に置いといてください。

 

 準備が整いました。先ずは前向き研究で、糖分を多く摂取することが糖尿病の原因となるかを検証していきましょう。前向き研究の場合は、どうやってデータを得ることから始めますので、どの様なデータをどうやって得ていけばエビデンスレベルの高い研究ができるか?という流れで考えていきたいと思います。

 

 例のごとく、反実仮想モデルを思い出しながら考えます。糖分を多く摂取する人、糖分摂取が少ない人をそれぞれ集めてきて糖尿病になった人の割合を比較し、糖分を多く摂取した人の群で糖尿病の人が多ければ、糖分を多く摂取することは糖尿病の原因となる、と言えるでしょう。。。と、すんなりはいきません。これが成り立つのは、両方の群の人・集団が全く均一(背景因子が均一)になり、比較可能になった状態でしたね(同じ系統の実験動物を使ったり、クローン人間の集団の様な状態を思い浮かべてください)。もしくは、パターン②、④のような経路が全く存在しないことが証明されている状況です(パターン②や④が絶対にありえないことを証明するのは悪魔の証明なのであり得ない状況ですが)。

 

 今仮に、先行する研究に於いて糖分を多く摂取すると肥満になり、その肥満が糖尿病の原因になっている(パターン②もしくは④)、または運動不足が糖尿病の原因になっている(パターン④)、という事実が分かっているとします。この時、糖分を多く摂取する群に、”予め”肥満の人や運動しない人が多く含まれていたらどうでしょうか?この状況で、糖分を多く摂取することが糖尿病の原因となっているかどうかを検証しても、キチンとした評価はできませんよね?何しろ、糖分を多く摂取する群の人たちは、予め、糖尿病になりやすい人が多く入ってしまっているのですから。。。つまり、この場合、糖分を多く摂取する群の人は糖尿病に罹りやすい人が入ってしまっている(リスク因子を持つ人が多くいる)ということになります。つまり、糖分摂取の他に、糖尿病の原因となる因子(交絡因子)が混ざってしまっているために、糖分摂取と糖尿病の因果関係を検証するためには、その影響を補正して評価する必要があるということです。ですから、前向き研究を実施するとしたら、糖分の摂取データ、糖尿病かどうか、の他に、肥満であるかどうか、運動するかどうか、と言ったデータを取得し、解析時に補正を行う必要があります。

 

 以上の理由で、我々がエビデンスレベルの高い前向き研究を実施する際には、先行研究で分かっている交絡因子を調べ、それらのデータを取得し、何らかのやり方で補正をしなければなりません。今の場合ですと、糖分の摂取量と糖尿病になったかどうか、と、肥満かどうか、運動量のデータも取得することが必要ということです。その他のデータの取得についてはどうでしょうか?これは何とも言えません。読書の有無など、十中八九、糖尿病の罹患に影響しないと考えられる因子については、取得は必要でないと考えても良いと思いますが、遺伝的要因など先行研究が無くても因果関係がありそうだと考えられるものがあれば取得し、補正の必要がないかを改めてデータを確認しつつ解析を進めていくべきと考えます。

 

 この様にして、できる限り交絡している因子を補正するほどエビデンスレベルの高い検証ができます。しかしながら、先行研究で全ての因子について調べ尽くされているとは、誰も言い切れません。神のみぞ知る、ということです。また、先の遺伝的要因にしても、機能の分かっていない遺伝子が影響している可能性もあります。つまり、人類がいくら補正し尽くしても、完璧に補正し尽くしたとは言い切れません。こうした理由で、ランダマイズ化によって交絡を断ち切って行う比較研究よりもエビデンスレベルは低いと言わざるを得ません。ここが疫学研究の限界です。ただし、私見ですが、これはあくまで理論上の話です。と言いますのは、現実において、結果に対し強い影響を及ぼす交絡因子(結果と因果関係が強い因子)は大概、経験的に分かっている筈で、精密なデータを大量に取らないと検証できないような交絡因子は見逃しても実生活上、影響は殆どないと割り切れるからです。

 

 余談になりますが、現在、世界中で希少疾患などを除く大部分の薬剤の効果は、ランダマイズ化比較試験により検証され、それを元に薬剤が承認され、日本ですと保険償還の適応となります。効果が検証されたものを承認し、費用が補助されるのは論理的であり、国として当然ですよね。しかし、少し考えてみる必要があると思います。と言うのは、一般に効果を検証するまでに多くの患者さんの協力と時間を必要とするのです。ですから、効果が検証されるべき薬剤をもっと早く市場に導入すればより社会にとって有用ではないか?と考えることは自然の要求です。効果を検証し、市場に出すことは理論的には誰の目にも明らかでスッキリ線引きができるのですが、実践的にベストか?と言うとそうではないと言うことです(但し、安全性をどうするか?という問いも存在します)。

 

 昨今、Real World Evidence(RWE)をいかに薬剤の承認に取り入れていくかと言うことが盛んに議論されていますが、そういった背景があると言うことです。但し、それには論理的に越えられない壁に対して、我々の認識をどうするか?ということが問われていくと思います。詳しくは、Precision Medicineと一緒にいつかお話ができればと思っています。

 

 次に後ろ向きの解析の場合を考えてみたいと思いますが、まだまだ長くなりそうなので、次回に回させて頂きます。次回も説明しますが、交絡因子の扱いが疫学研究にとっていかに重要か、また、その扱いと解析結果の解釈には研究者のセンスが重要かということを感じていただけますと幸いです。

<因果関係と相関関係>

 前回までは、事象間の因果関係を検証する方法について話してきました。今回は、“因果関係”と“相関関係”の違いについて書きます。ぶっちゃけ言うと、原因は結果の前に来るという当たり前に思える話をします。但し、ここを注意深く認識しておく事で、データベースの扱い方やエビデンスレベルの評価、特に仮説と検証の違いに対する理解が深まっていくと思いますので、敢えてここで取り上げます。

 

 今まで『寝坊(原因)をしたから遅刻(結果)した』、『薬(原因)を飲んだから効いた(結果)』、『自分がいた(原因)からチームが勝った(結果)』という様に、全て原因が結果の先に来る、という因果律を前提に話を進めてきました。この前提の部分で何が起こっているかを確認していこうという事です。

 

 話が横道に逸れますが、“メッセージ(原作小説『あなたの人生の物語』)”という映画では、この因果律が成り立っていませんでした。また、ベイズの様に決定論的な世界観に基づくモデルでは、この因果律に対する捉え方も異なります(故に、事前確率と事後確率という観念を理論に取り込んでいる)。また、仏教の様に『結局、そんなものは無いんだよ』という世界観(例えば、般若心経)もあります。因果律が実在するかどうかは私には分かりません。しかしながら、我々が世の中のことを考えるには、この因果律に則って考えると便利なことが多いようですし、データに溢れる現代社会で生き抜く為には覚えておいて損は無いと思います。

 

 さて、本題に戻りますと、今、適度に都合の良いデータがあるとします。何でも良いのですが、30分毎の降水量のデータとカエルが鳴いたかどうかのデータがあったとします。私の子供の頃に信じていたことが正しければ、雨が降るとそれを受けてカエルが鳴きだします。この時、データを見てみます。すると、データは30分毎なので、雨が降ったと同時にカエルが鳴きだした様にデータ上は見えるかと思います。すると我々は『雨が降った(原因)からカエルが鳴いた(結果)』と常識的に考えます。では、このデータから『カエルが鳴いた(原因)から雨が降った(結果)』と判断したら間違いでしょうか?どちらもデータの見方として間違いではありません。この事は、データベース解析からわかるのは相関関係(”カエルが鳴く”と”雨が降る”がほぼ同時に起こっている)であって、因果関係までは分からないと言うことから来ています。

 

 では、前後関係をはっきりとさせるために、30分毎に取っていたデータをもっと細かくしたらどうでしょうか。つまり、1分毎とか、1秒毎とか。。。それならば、雨が先に降り、カエルがそれに続いて鳴きだす。という様に我々の常識と一致するデータが得られるかもしれません。但し、全てがそう上手く解決するかと言うと、そうとも言い切れません。例えば、仮定の話ですが、カエルに湿度や気温を感じ取り、雨が降ることを予測できる能力があり、と同時に鳴きだす習性がある。しかし、それは人類に知られていない。そんな場合はどうなるでしょうか?この場合、データ上の見掛けは、カエルが先に鳴き、続いて雨が降るかもしれません。その場合、カエルが雨を降らせたという解釈もできてしまいます。つまり、データを時間毎に細かく区切り、前後関係を考慮しつつ解析することは因果関係を探る上で役に立ちますが、それも原因と結果の関係が予め予想がついている場合だけで、それが未知の状態ではデータベースの解析から正確に解釈できるかはどうかは分からないということです。

 

 クドくなりますが、原因と結果を”正しく”判断しているのは、人間の感覚的な常識であって、データベース解析の結果そのものでは無いという事です。このことを科学に当て嵌めて考えますと、科学者が事象間の因果性の判断に使っているのは、この感覚的な常識に相当する能力、つまり過去の科学的知見から論理的に導き出された妥当な仮説(リサーチクエスチョンとも言われる)の設定能力ということが分かると思います。科学者としての感性と言っても良いと思います。

 

 キチンととした仮説があり、それを検証するのに適切なデータセットを得、適切な方法で解析し、結果を出し、適切に解釈することが科学者たる所以です。または、データセットが与えられた時、適切な方法で解析し、結果をエビデンスレベルと共に評価し、仮説として適切に解釈することです。データセットの優劣はエビデンスレベルには関係しますが、解釈というのは、あくまで科学者の感性とも言うべき論理的思考の産物なのです。

 

 昨今、多くの企業でビッグデータやAIの活用などされていると思います。私も時々、社内で相談に乗ることがあるのですが、いつも困ってしまいます。と言うのは、データの解析結果を持ってきて、『成績の良い社員は出社が早い』、『残業が多い』といった原因と結果を考えやすいものから、『営業車を使っていない』といった本当に因果関係があるものかどうかも疑わしい解析結果まで持って来られて、このデータは使えるでしょうか?または解析手法は使えるでしょうか?何に使えますか?とか、納得いく結果が出る様に条件を絞るにはどうしたら良いでしょうか?等と質問されるのです。率直に答えると『目的に依る』ですが、そういう人に限り、リサーチクエスチョンは?と訊くと、データや手法が使えるかどうか?どうやったら使えるか?という答えが返ってきて禅問答になってしまいます。

 

 AIを使おうが、ビックデータをどう解析しようが、やっていることは相関を見ているか、何らかの関数もしくは関係性が当て嵌まるか、どうかです。この仕組みを理解していれば、何に使えるか?どうやったら使えるか?は適切な質問ではありません。冷静に考えれば、自分は何をしたいか決めていません。使えるでしょうか?何に使えるでしょうか?どうやった役に立つ様に使えるか教えてください。というのは、質問になっているのでしょうか?

 

 話はだいぶ逸れましたが、相関関係から因果関係を探り当てるには、人間の感性が必要ということをお話ししました。また、情報リテラシーの面から皆様に気を付けて頂きたいのは、エビデンスベース、データに基づいていると言っても、トンデモで我田引水な主張が混じっている事が非常に多いので、主張している人の肩書きなどに騙されず、キチンと物事を判断して欲しいということです。

<ランダマイズ化で交絡を断ち切る>

    前回は交絡因子と言う実在する怪物の話をし、その対処法の一つとして層別化を紹介させていただきました。そして、その層別化にも限界がありそうだ、ということもお話ししました。今回は、もっと根源的な意味で最強の対処法であるランダマイズ化について説明します。もっとも、それについても限界があるのですが。

    例によって、反実仮想モデルから話を始めようと思います。このモデルでは全く同じ現実を2つ用意し、片方に、原因として検証したい因子を加えてみて、結果に差が生じれば、2つの事柄の間に因果関係が成立する、と言っても良いだろうというものでした。そこでAさんとソックリなBさんが居れば、即ち、体質も、生活も、食事のパターンも、その他諸々も限りなくAさんに近いBさんが居れば、交絡因子に邪魔されずに因果関係を検証できる。でもそれって現実にはできないね、という話になったと思います。

    そこでちょっと考え直してみましょう。今まで、AさんとソックリなBさんという、あくまで個人のレベルで話を進めてきましたが、これをある集団Aと集団Bと読み替えてしまったらどうでしょうか?例えば、日本人の集団とか。元々、反実仮想モデルのところで“全く同じ現実を2つ用意し”というところを、Aさんという“個人”を勝手に当てはめて話を進めてしまったのですが、実はAさんという個人でも、集団Aという集団でも構いません。

    ただ、解釈をキチンと知っておく必要があります。Aさんを2人用意して、寝坊した場合としなかった場合で、寝坊と遅刻の因果関係を検証しても、分かるのはAさんのその日における寝坊と遅刻の因果関係だけです。例えば、電車が止まっている日はこの因果関係が成立するかわかりません。この例だと分かりにくいので、薬とその効果の因果関係を検証する場合を例にしてみましょう。

    Aさんの風邪に対して、ある薬の効果が検証されていたと仮定しましょう。この薬は、Aさんとは体質が違い、薬が早く代謝されてしまうBさんにも効果があるのでしょうか?それはBさんで検証しなければ分かりません。こんがらがってしまう人がいると困るので、丁寧に説明しますと、元々、反実仮想モデルを使って、“全く同じ現実を2つ用意し”のところで、Aさんを2人用意して効果を検証しました(これは理想の世界での話で、現実にはほぼ不可能という話をしましたので、検証できたという仮定です)。ところが、Bさんは体質が違い、薬が早く代謝されてしまう訳です。Bさんにこの薬の効果あるかどうかは、分からないですよね?ということです。Bさんで薬に効果があるという因果関係を検証しないとハッキリとは言えない。で、究極的には一人ひとり、効果を検証しなければ分からないことだらけ、ということなのです。前々回で出てきた、“野球の試合で自分のチームが勝ったのは自分のお陰だ”、というのが万が一検証できたとしても、次回、相手が変わったり、相手が同じでも自分のチームが変わったり、自分のチームの他の誰かが大活躍して勝ったりしたら、自分のお陰かどうかもわからないまま試合が終わってしまいますということです。

    では、Aさんを日本人という集団に読み替えた時は、どう解釈すれば良いでしょうか?方法については後で述べますが、日本人で“薬(原因)”と“(ある病気に)効果がある(結果)”の因果関係を検証できたとします。Aさん個人について検証した場合は、Bさん個人については検証した訳では無いのでBさんにも当てはまるかどうかは分からないのですが、“日本人という集団”で薬の効果が検証されたならば、“日本人という集団”について当てはまりそうです。つまり、Aさん、Bさんといった個人的な因果関係ではなく、日本人といった、より広い範囲に因果関係を拡張できそうです。付け加えて言うなら、<科学の目的>で書いた“普遍的な法則を見つける”というのを思い出してください。うまく普遍的な方向、つまり、個人から日本人に当てはめられるという一般化の方向に進んでいませんか?

    実際に、反実仮想モデルを元に、日本人で薬と効果の因果関係を検証していく方法を考えていきましょう。え?日本人を2つ用意できないって?では、日本人を2つのグループ、つまり半分に分け、両方とも日本人の集団としてしまったらどうでしょうか?この2つの集団を同じと見做しても良いでしょうか?結論を言ってしまえばOKです。Aさん、Bさんといった個人では、それぞれ体質の差があったり、年齢、性別や喫煙歴とか飲酒歴とか、結果に影響するかもしれない交絡因子に差があって、比較をしても因果関係があるかどうか分からなくなる可能性がありました。しかし、Aグループ、Bグループとし、その中に色々な人を入れて“十分に”人数が多くなれば、同質なグループとして、因果関係の検証に耐えるぐらいに同質になります。

    ここで“十分”に人数が多い状態とは、A、B両グループで交絡因子の平均や散らばり具合が同じと見なせる状態で、この場合、集団として同じと見なすことができます。例えば、A、B両グループの中には、病気の軽い人、重い人、色々います。薬の効果を見る場合、重い人には効かなくて、軽い人には効くとすると、Aグループの中には薬が効く人もいれば、効かない人もいる訳です。また、年齢によって効いたり、効かなかったりする場合でも、A、B両グループで平均年齢が同じで、その散らばり具合も同じであれば効果の検証が可能です。代謝について個人個人で違っている場合でも沢山集めれば、同様のことが言えます。この事は、たとえ喫煙の有無や飲酒の有無が結果に影響しても、しなくても両方のグループに同じ様に散らばっていれば良い訳です。また、全然、気付きもしない様な未知の交絡因子があっても、人数が沢山いれば、どちらのグループにも同じように散らばっていることが期待されるので、同様のことが言えます。このように集団をある程度大きくしていけば、反実仮想モデルを使って、AグループとBグループの結果を比較することにより、薬とその効果の因果関係を検証することが可能になります。こうやって考えていくと日本人を2つのグループに分ければ、“十分”に人数が多い状態となり、検証が可能になります。

    さて“日本人全体を2つに分けれ”ば、十分に人数が多いと言えそうですが、それは非現実的ですし、理論的に何処から“十分”と言えるか?それが分かれば、必要最小限の人数を使って検証することができそうです。それについてはまた回を改めさせていただくことにして、実際にはどうやっているかを見てみましょう。例えば、病気に対して薬の効果があるかないかは、臨床試験で検証されます。臨床試験では、病気の進行度を揃えたり、試験から子供や高齢者を除外したり、肝臓に障害のある人を除いたりと、交絡因子として病気の進行や薬の効果に影響しそうな因子を予め除きます。この事により、数百から数千人規模でも薬の効果を検証できる状態にして臨床試験を実施しています。

    さて、ここで敢えてダメな例を紹介します。例えば、症状が重いグループと軽いグループに分けます。そして、薬を症状の重いグループに投与し、症状の軽いグループには薬を投与しなかったとします。すると、実際に薬が効いていたとしても症状が重いグループに投与しているのと、一方では、薬の投与をしていないグループでは症状が元々軽いこともあり、効果が見辛くなる可能性があります。投与を逆にすると、症状の軽いグループに投与すると薬の効きがよく見え、尚且つ症状の重いグループは病気がドンドン進行していきますから、実際の効果よりも大きな効果に見える可能性があります。だから矢張り、この様な、結果に影響をする因子は、A、B両方のグループで均等に散らばっている必要があります。両方のグループで各因子が上手く散らばる為には、何も考えずにランダムにグループ分けされる必要があるので、ランダム化と呼ばれます。ランダム化は前述の様に、未知の交絡因子が潜んでいたとしても、グループの人数を増やすことで対処できます。ですから、上手く人数を割当てやれば、ランダム化することにより、交絡因子の影響を断ち切ることができるのであり、人類が知り得る殆ど唯一の交絡を断ち切る方法です。

    しかし、冒頭で述べたように、この人類にとって唯一の交絡因子という怪物に立ち向かう方法にも限界があります。最後にそれに触れておきます。

    医薬品として、国に承認されているものは、特殊な場合を除いて、ランダム化比較試験を経て、薬と効果の間に因果関係がありました、つまり、この薬の効果は検証済みですよ、というお墨付きを貰って承認されています。このことを正確に解釈すると、効果が検証されているのは、試験をされたグループの条件に当てはまる人においてです。つまり、『薬に効果がある事は検証された。それは、試験条件に当てはまる人においてである。』です。条件に当てはまらなかった人に対しては、『薬の効果は検証されているので、効果が見込める。』が正しい解釈です。また、条件に当てはまっている場合でも、効果があった人と無かった人がいる訳です。ある条件で検証された因果関係を、その他の条件に拡張する作業は一般化と呼ばれます。これは、メタアナリシス等と一緒に説明した方が楽しいと思いますのでそれまでお待ちください。

    もしかしたら、『全ての条件で検証しないのはけしからん。キチンと全ての人で効果を検証してから承認しろ。』と言う人がいるかもしれません。でも、そういう人には、敢えて反論させて貰います。それをやっていたら世界から薬が無くなってしまいます。現実に、薬は多くの人を救ってきました。その薬を世界から無くしますか?世の中には論理的に正しいことはゴマンとあります。論理だけで考えることは、所詮、頭の中で考えたことです。科学者にとって、論理は世界を表現する道具であって、従わなくてはならないルールではありません。

<交絡因子という実在の怪物>

    統計を学んでいると“悪魔の証明”に出てくる“悪魔”の正体が理解できるようになります。この“悪魔”については、一たびそのの正体が分かると対処法は比較的簡単です。何故なら、それは我々の心が産み出した思い込みだからです。しかし、今回紹介する“交絡因子”という怪物は実在する“怪物”です。そして、その対処法は限られていますし、現実にはその対処法が使えないことが殆どです。<科学の目的>の回で紹介した“The Lady Tasting Tea”という本には、R.A.フィッシャーが喫煙と肺癌との因果関係に最後まで疑念を呈していたくだりがあるのですが、その原因のひとつは、この交絡因子という怪物への対処法が不完全にならざるを得ないことに起因すると言っても過言ではないでしょう。また、私がR.A.フィッシャーを科学者として崇拝するのも、この交絡因子へのこだわりというか、センス故です。それはさておき、この交絡因子について理解することは、対処法を考える上でも重要ですし、この怪物がどこで悪さをしているかを見極めることも重要です。

    前回お話しした、反実仮想モデルを使った因果関係の検証方法は、全く同じ現実を2つ用意して、一方に原因と考えられる因子を加え、もう一方には何も加えない、そしてそれらの結果を比較して、2つの結果に差があれば、その因子は結果に何らかの影響を及ぼした、つまり原因と結果という因果関係が存在する、反対に2つの結果が同じで差が無ければ、その因子と結果の間には因果関係が存在しない、というものでした。この方法を使えば、寝坊が遅刻の原因になっているか?風邪薬に効果があったのか?自分のお陰で試合に勝てたか?というのが、誰の目にも、文句のつけようがなく、明らかにできるということです。

    しかし、ここで我々は壁にぶつかります。反実仮想モデルで言う、全く同じ現実を2つ用意できるのか?と。その様なことは奇跡でも起きない限りあり得ませんが、人類は意図的に作り出すことを思い付きました。それが実験室で行なっている実験です。実験室の中では、検証したい因子以外の条件を同じに揃え、原因として検証したい因子を加えた場合と、加えなかった場合の結果を比較することにより、検証した因子と結果の間に因果関係が成立したかどうかを検証することができます。

    では、実験室の中で検証された因果関係を蓄積していけば、我々は世界の全ての因果関係を知ることができ、ひいては我々の生活に役立ち、これぞ科学の進歩のおかげだ!となるのでしょうか?残念ながら現実はそう甘くはありません。例えば、薬が人間の病気に対して効果があるかないかの検証は、実験動物で検証されていても、やはり人間で検証しなければ分かりません。実験動物で効果が検証されている物質でも、人間で効果が無かった、なんて言う物質は世の中にゴマンとあり、そういった事例の方が圧倒的に多いのです。ですから、なんとしてでも実験室以外の因果関係の検証方法を考えていかなければなりません。

    そこで考える出発点として、同じ病気のAさんとBさんのどちらか一人に薬を飲んでもらい、もう一人は薬を飲まずに、症状が改善したかどうか、つまり薬が病気に効くかどうかを検証する場面を考えてみたいと思います。この場合、体質により、薬が早く代謝されてしまったり、病気の進行度合いが違っていたりと、なかなか上手く比較できません。薬を飲んだ人が重い症状だったりしたら、薬に効果があっても症状が改善しなかったり、逆に、薬を飲まない人の症状が軽かったら、薬を飲んでいないのに症状が改善したりしたら、薬を飲んだ方が症状が悪化するなんていう誤った結論を導いてしまうかもしれません。そもそも、反実仮想モデルから言うと、Aさん、Bさんは全く同じでなくてはならない筈です。そうです、体質や病気の状態によって症状の改善は影響を受ける(可能性がある)ので、これらの影響を除かないとキチンと検証ができないのです。

    今、さりげなく話してしまいましたが、薬の代謝だったり、病気の症状の軽重だったり、は検証したい結果に影響を及ぼす可能性がある因子で、これらを交絡因子と言います。つまり、交絡因子が存在しているので、それらを除かなければ、反実仮想モデルを使うことができず、因果関係も検証できない、ということです。だから、この交絡因子という、実在の怪物の正体を見極め、対処法を考えなければ、現実世界で因果関係を検証することは不可能ということになります。交絡因子が結果に影響するパターンはいくつかあり、追ってお話ししますが、ここではこのまま交絡因子の対処法について考えていきたいと思います。

    Aさん、Bさんの話に戻しますと、薬の効果を検証するのに、個々人の薬の代謝や症状の軽重といった交絡因子が結果に影響を及ぼすならば、それらを揃えておけば良いのでは?という発想は自然です。つまり、薬の代謝を揃えたいなら、薬の代謝を担う肝臓の疾患が無い人同士(あるいは疾患を持った人同士)で比較する、症状を揃えたいなら症状が同程度の人同士で比較する、という方法です。実際には、代謝の良し悪しや症状の軽重は単純に線引きされるものではありませんが、それでも、何も考えずに一括りにして検証するよりも、こういった人ごとの背景を揃えて検証した方が信用のおける検証になりそうです。実際、この様な手法は層別化と呼ばれ、結構多用されています。

    さて、今、層別化をしていくと、交絡に対処でき、上手く因果関係を検証できそうな話をしたのですが、本当にそうでしょうか?Aさん、Bさんの例では、予め代謝や症状の軽重が結果に影響を及ぼすだろうと、予測または過去の知見を前提にして話を進めました。では、年齢を揃える必要はないでしょうか?直前に食事をしたかどうか、何を食べたか、飲酒をしたか、喫煙者か、体重は?睡眠時間は?などなど、結果に影響する可能性のある因子はドンドン増えていきます。そして、層別化を無限に進めていくと、反実仮想モデルでいう、全く同じ人を2人用意しなくてはならないという結論に戻ってしまいます。病気や薬の効果と交絡する因子について、神のごとく完全に理解しているなら話は別ですが、人類は無知なので何も知らないことを前提に検証できる方法があれば、未知の薬にも使えて便利ということになります。

    と言う訳で次回は、交絡という怪物を断ち切る究極の武器の話をする予定です。交絡因子ってチョロそうですか?イヤイヤとんでもない!!その判断は次回を読んでからの方が良いでしょう。交絡因子は、英語だと“confounding“です。結果に影響を及ぼす、あるいは、結果と常に一緒なのでconfoundingです。我々が因果関係を検証する際にはこの交絡の影響を無くさなければならないと検証できないということを覚えておいてください。反実仮想モデルという理論上のモデルに対して、現実にそれを邪魔しているのが交絡因子ということができます。
    
    蛇足ですが、今まで話してきた反実仮想モデルを使う方法では、2つの事柄の間の因果関係を検証できるのですが、何処まで本質に迫っているかは分かりません。つまり、“風が吹けば桶屋が儲かる”のように現象を順に追って因果関係を確認する方法ではなく、“風が吹いた(原因らしきもの)”と“桶屋が儲かった(結果)”の間の因果関係が検証できれば良いのであり、2つの事柄の間に何が起ころうと知ったこっちゃないのです。このことは一見、いい加減に見えますが、よくよく考えてみると、原因と結果を決めてしまえば、それらの間に未知の事象があっても検証できるという便利さもあります。