因果推論のおすすめ本 – 計量経済学、機械学習、疫学からも
なぜ今「因果推論」なのか(相関ではなく“効いたか”を知るために)
データ分析をしていると、まず目に入るのは「AとBが一緒に増える/減る」といった相関関係です。でも実務で本当に知りたいのは、たいてい次の問いです。
- 広告を出したから売上が増えたのか?
- 新しい施策を導入したから離脱が減ったのか?
- 研修を受けたから成果が上がったのか?
- 治療をしたから回復したのか?
この「〜したから、〜になった」をデータで扱うのが 因果推論 です。
相関分析は“起きたことの一緒さ”を捉えるのが得意ですが、因果推論は“介入したら何が変わるか”を扱います。意思決定(施策を続ける/やめる、予算を増やす/減らす)に直結するのは、まさにこちらです。
因果推論が扱う中心の問い:「もし〜しなかったら?」
因果推論の考え方の核は、とてもシンプルに言うと 反実仮想(カウンターファクチュアル) です。
- ある人(ある店舗、あるユーザー)が施策を受けた世界と、受けなかった世界を比べたい
- でも同じ対象でその両方は同時に観測できない
だからこそ因果推論では、「観測できない片方」を、データと仮定を使って できるだけ妥当に推定 します。
この“推定の仕方”にさまざまな流派・道具があり、本がたくさん出ている理由でもあります。
相関でハマりやすい落とし穴(因果の勘違いあるある)
因果推論が必要になる典型パターンは、「相関っぽいが、因果とは限らない」状況です。たとえば:
- 交絡(confounding):
例)熱心な人ほど研修にも参加しやすく、成果も出しやすい
→ 研修の効果に見えて、実は“熱心さ”の影響かもしれない - 逆因果:
例)売上が伸びている店舗ほど広告費が増える
→ 広告が原因ではなく、売上が原因で広告が増えた可能性 - 選択バイアス:
例)クーポンを配った相手が、もともと購入意欲の高い層に偏っている
→ クーポンの効果を過大評価しやすい
因果推論の本は、こうした落とし穴を「どう定式化し、どう回避し、どう説明するか」を体系立てて教えてくれます。
因果推論を学ぶと何ができる?(実務のメリット)
因果推論が強いのは、次のような意思決定シーンです。
- 施策の効果検証(ABテストができない/できなかったときも含む)
- 観測データからの効果推定(ログ・医療データ・行政データなど)
- 「何を変えるべきか」の優先順位付け(介入可能な要因を見極める)
- 説明責任(なぜその結論に至ったかを、仮定とセットで語れる)
特に重要なのは、因果推論は「魔法の推定」ではなく、仮定(前提)を明示して推論する技術だという点です。
本を読むときも、「この方法は何を仮定しているのか?」という視点が、理解を一段深くします。
• 分析者のための因果推論入門 データ分析と意思決定を紐づける手法と考え方を網羅的に詳解する
因果推論では「どんな仮定を置くか」を明示し、その仮定の下で得られた推定値をどう解釈するかに重きを置く本です。潜在反応(潜在結果)モデルと構造的因果モデルという2つの視点を行き来しながら、因果効果推定の考え方と手法を整理して学べます。
• 因果推論: 基礎から機械学習・時系列解析・因果探索を用いた意思決定のアプローチ
「相関と因果の違い」「効果検証の考え方」など実務で起きがちなつまずきを、因果推論を軸に解決することを狙った本です。基礎に加えて、機械学習・時系列解析との組み合わせや因果探索まで扱い、Python実装も通して意思決定に落とし込む流れを学べます。
• 正しいデータ分析でビジネスを加速する 因果推論入門
「施策に本当に効果があったと言えるのか?」に答えるための、ビジネスパーソン向け入門書です。高度な数学を前提にせず、具体例中心で説明し、動画解説つきのExcel演習で現場で使う型を身につけられる構成です。
• 因果推論の科学 「なぜ?」の問いにどう答えるか
従来の統計・データ分析だけでは答えにくい「なぜ?」に向き合うための、因果推論をめぐる一般向け解説書です。「因果のはしご」などの枠組みを通じて、介入や反事実といった発想がなぜ重要かを大きな絵で理解できます。
• 効果検証入門〜正しい比較のための因果推論/計量経済学の基礎
施策対象が意図的に選ばれることで生じる偏り(単純比較の落とし穴)を出発点に、より正しい効果検証の考え方と手法を学ぶ本です。RCTが理想である理由を押さえつつ、RCTが難しい状況で因果推論で「比較」を成立させる道筋を説明しています。
• 医学研究のための 因果推論レクチャー
医学研究で因果推論をどう使うかに焦点を当て、研究の「問い」に応じて手法を選ぶ考え方を学べる本です。リサーチクエスチョンの立て方からデータソース選定、研究への適用プロセスまで、実践手順として整理しています。
• はじめての統計的因果推論(林 岳彦)
因果推論の基本を、図と言葉とシンプルな例で直感的に理解できるようにした入門書です。推定結果の解釈・利用での注意点や、質的研究との関係にも触れつつ、数式が得意でない初学者でも原理をつかめる構成です。
• つくりながら学ぶ! Pythonによる因果分析 ~因果推論・因果探索の実践入門
因果分析の主要領域である「因果推論」と「因果探索」を、Pythonで実装しながら身につける実践書です。施策効果の推定と、変数間の因果関係を明らかにするアプローチを、ビジネスの具体例とともに学べます。
• 因果推論の計量経済学
経済学・実証分析で使われる因果推論を、基礎から応用・実装まで一気通貫で案内する本です。最新動向や実務上の“暗黙知”も踏まえ、無作為化実験から疑似実験的手法までを扱い、Rコードなどで実践につなげる作りです。
• 入門 統計的因果推論
DAG(因果ダイアグラム)などを用いて、統計モデルと因果モデルの違いから介入効果、反事実までをコンパクトに学べる入門書です。因果探索や調整(バックドア等)の考え方も含め、「何が因果として言えるのか」を整理したい人向けです。
・ローゼンバウム 因果推論とは何か
因果推論の第一人者であるローゼンバウムが、因果効果を考えるための基本的な枠組みを、数式をほとんど使わずに解説する入門書です。医学・疫学・経済・公共政策など多様な事例を通して、「因果はどう主張できるのか」「どこにバイアスが入り得るのか」を直感的に学べます。
・Pythonライブラリによる因果推論・因果探索[概念と実践]
因果的概念(関連・介入・反事実、構造的因果モデルなど)とグラフ表現を押さえたうえで、Pythonライブラリで因果推論・因果探索を実装できるようにする実践ガイドです。DoWhyやEconMLによる推定、gCastleなどによる因果探索まで扱い、コード例を通じて手を動かしながら理解を深められます。
・インベンス・ルービン 統計的因果推論 (上/下)
潜在結果(potential outcomes)にもとづく「統計的因果推論」の標準的枠組みを体系的に学べる基本書です。上巻で因果効果の定義や無作為化実験への適用を丁寧に押さえ、下巻で観察研究の一般設定に拡張して、非交絡性・傾向スコア・割り当て非順守など重要テーマを扱います。
・データ分析の力 因果関係に迫る思考法
「広告は売上を伸ばしたのか」「政策は本当に効果があったのか」といった問いに答えるための、因果関係に焦点を当てたデータ分析入門です。ランダム化比較試験、回帰不連続、パネルデータ分析などを数式なしで説明し、データと人間の判断をどう組み合わせるかを具体例で学べます。
・政治学と因果推論 (シリーズソーシャル・サイエンス)
政治学の研究で因果推論を使うために、研究の基本的な流れと主要な識別手法をコンパクトにまとめた方法論書です。無作為化実験・自然実験・不連続回帰・操作変数法・差の差法などを、政治学の研究例とともに解説し、実践へつなげる構成です。
・因果推論入門〜ミックステープ:基礎から現代的アプローチまで
因果推論の代表的トピックを幅広く並べて学べる「研究デザイン入門」の決定版で、理論説明を丁寧にしつつR/Stataでの実装も重視した構成です。DAG、潜在アウトカム、マッチング、RD、IV、パネル、差分の差、合成コントロールなどを体系的に学べます(機械学習の話題は中心ではありません)。
・「原因と結果」の経済学―――データから真実を見抜く思考法
世の中の「もっともらしい通説」が、相関の見誤りで生まれることを具体例で示し、因果推論の考え方を数式なしで解説する一般向け入門書です。正しい比較の作り方や、データから因果を読み解く際の落とし穴を学び、だまされない思考法を身につけることを狙っています。
・統計的因果推論 -モデル・推論・推測
因果ダイアグラムと構造的因果モデルを軸に、介入(do演算)や反事実を含む因果推論の理論体系をまとめた古典的名著の邦訳です。統計モデルだけでは扱いにくい「因果」を、どの仮定の下で同定・推論できるのかを理論的に整理し、幅広い応用への基盤を与えます。
・ローゼンバウム 統計的因果推論入門: 観察研究とランダム化実験
ランダム化実験と観察研究の違いを踏まえ、因果効果を見極めるための考え方と設計(デザイン)を学ぶ入門書です。マッチングや感度分析、自然実験、インスツルメントなど、バイアスを見抜き軽減するための実践的論点を、例を通して理解できるように説明しています。
・統計的因果推論 (統計解析スタンダード)
潜在結果の枠組みに基づく統計的因果推論を、推定の実際まで見通せるように整理した教科書です。群間比較の考え方から始め、傾向スコア、マッチング、層化、重み付け、操作変数法などの代表手法を段階的に学べる構成です。