2020.01.21

因果推論のすすめ!!

2020年になりました。20年代のスタートです。新たな10年を迎え、元号も令和になり、一新した気持ちで業務に挑みたいと感じています。

果敢に挑戦したいと考えているのが「因果推論」です。インターネット広告は効果検証文化が根付いていますが、もっと広がって「ちゃんと効果を見ましょうよ」という時代が訪れるのではないかと感じています。

ちなみに因果推論とは、施策Aを実施すればX万円の効果が見込める、という確度の高い仮説を生み出すのに、もっとも適した手段の1つです。

相関関係と因果関係は違う

まずは因果推論について話す前に、因果関係とは何かについて考えてみましょう。

以下の、日毎の広告出稿量と売上の散布図を見て下さい。広告出稿量が増えると、売上も増えています。点が右肩上がりに描かれていますね。

この図から、広告出稿量を増やしたから売上が増えたと言えるでしょうか?

因果推論1

答えは「NO」です。散布図から言えるのは「広告出稿量が多い日は、売上が多い」だけです。”増やしたから”という因果は認められません。

そもそも因果関係とは、2つ以上のモノの間に原因と結果の関係があると言い切れる関係を意味しています。

気温が上がったから、エアコンが売れる。気温が下がったから、おでんが売れる。暑いから、喉が渇く。空気が乾燥しているから、肌が荒れる。どれもA、だからBと言える原因と結果の関係です。

因果推論2

 

ちなみに、この原因と結果の関係は絶対に一方通行です。

「エアコンが売れる」という原因で「気温が上がる」という結果はありえません。地球温暖化の遠因の1つに、エアコンを含めたCO2の排出があるかもしれませんが、それは因果関係ではなくバタフライ効果ですね。

ちなみに相関関係とは、一方の値が変化すれば他方の値も変化する、2つの値の関連性を意味しています。

 

因果推論3

 

つまり因果関係と相関関係は似て非なるものです。因果関係は理由が明確な1本のストーリー(AだからB)、相関は2本のストーリー(AとB)の関係性を表しています。

では先ほどの広告出稿量と売上の散布図は、1本のストーリーでしょうか、それとも2本のストーリーの関係性でしょうか?

もし広告出稿量を増やしたおかげで売上も増えたという1本のストーリーを主張するなら、様々な証明が必要になります。

「偶然では無い」と証明する必要があります。広告出稿量が多い日は、土日か、給料日直後か、たまたま売れやすかっただけかもしれません。

「実は他の施策が効いていた可能性」を排除する必要があります。SNSで紹介されてバズっただけかもしれません。

「因果の方向性(時間軸)」も確認しておく必要があります。「今日は売れそう」と感じた店主が、昼から広告出稿量を増やしただけかもしれません。

このように並べると、私たちは相関関係だけで「広告のおかげで売上が増えた」と判断しがちだと分かります。

ベーシックな因果関係の見つけ方

明確な1本のストーリー(AだからB)なら、Aじゃなかったら当然Bにはなりません。もしAじゃないのにBになるなら、AとBは因果関係があるとは言えないからです。

豚まんでお馴染みの551のように、あるとき・無いときで考えましょう。

 

因果推論4

 

551の豚まんがあるとき、みんなの笑顔を観測できます。551の豚まんがないとき、みんなの寂しい顔を観測できます。みんなに笑顔をもたらした原因が551の豚まんです。

Aがあるとき・Aがないときを観測して、その結果の差分を見れば「因果関係の効果」を可視化できます。Aに何らかの原因があるなら、良しにせよ悪しにせよ効果が出るはずです。

因果推論5

 

ただし、この発想は「卓上の空論」であり、実際には実現不可能です。なぜなら、ある人に対して「豚まんがあるとき」と「豚まんがないとき」を同時に観測できないからです。

1日目に「551の豚まんがあるとき」を観測して、2日目に「551の豚まんがないとき」を観測しても、1日目と2日目の差分は本当に「豚まんのある・なし」だけと言えるでしょうか。偶然や他の施策の影響を排除できないので、実験としては良手とは言えません。

そこで生み出されたのが、ノーベル経済学賞も受賞したRCTという手法です。こちらは次回に説明します。

関連記事

551の豚まんで考えるRCT(ランダム化比較実験)を用いた因果関係の求め方

2020.02.04

データにおけるマクロな視点とミクロな視点

2020.02.18

「わたしではないわたし」に潜むインサイト:文化人類学からのインサイト思考

2019.12.11