三大法寶

裔風 2021-08-15 13:10:29 阅读数:558

本文一共[544]字,预计阅读时长:1分钟~
大法

本文要回答的三個問題

一、傾向分值匹配可以解决內生性問題嗎?
二、中介效應模型可以用於機制分析嗎?
三、調節效應模型是什麼?用來做什麼?

因果推斷框架

  • 經濟研究要回答三類問題:
    1)選擇是什麼?
    2)為什麼做出這個選擇?
    3)做了選擇會怎麼樣?
    回答問題1主要靠描述統計,而回答問題2、3就依靠因果推斷識別因果效應

  • 三類因果識別假設(根據處理組和控制組生成方式劃分):

    1. 第一類——隨機實驗(RCT):類似自然科學,自變量完全外生,可以用簡單的組間均值做差算出因果效應。
    2. 第二類——條件獨立性(CIA):在控制了一些變量後,自變量就能外生。即假設沒有不可觀測的因素導致內生性。
    3. 第三類——存在不可觀測的遺漏變量:即使控制了一些變量,擾動項中也會有一些不可觀測因素導致自變量內生。這種假設最貼近真實情况,即下圖。 —簡單線性回歸、DIM(組間均值之差)是基於第一類識別假設。
      —多元線性回歸、匹配是基於第二類識別假設。
      —IV、RD、DID、SCM、Event Study等工具是基於第三類假設。

一、傾向分值匹配可以解决內生性問題嗎?

估計偏誤的原因有三種情形:

例子:研究上大學對工資影響,用大學畢業生收入均值-高中畢業生收入均值,身高是一個導致內生的因素。

  1. 範圍不重疊導致偏誤(weak overlap)
    如高中生都是150-169cm;大學生都是170-190cm
  2. 分布不同(weak balancing)
    如高中生和大學生都是160-190cm,但是高中生集中分布於165cm左右,大學生集中分布於175左右。
  3. 自變量內生
    這個才是我們通常所指的內生性問題。
  • 匹配必須基於沒有第一種偏誤,之後能解决第二種偏誤,無法解决第三種,也就是無法解决內生性問題。

另一個角度:計量方法分類

  • 綜上,匹配總共基於兩個假設:CIA和overlap
  • 匹配方法與解决內生性的那些IV、RDD等方法都不是一類!當然無法解决內生性。

二、中介效應模型可以用於機制分析嗎?

什麼是中介效應模型?

  • 如果(2)中的 和(3)中的 聯合顯著,則M是中介變量。
  • 在以上條件下,如果(3)中的 不顯著,M是完全中介; 顯著,M是部分中介。
  • 是總效應, 是直接效應, 是間接效應。

中介效應模型為什麼不建議用?

1. 中介變量系數無法被准確估計。

  • 以上(4)式是中介效應模型的核心,而它的成立依賴於 都能被准確估計。
    • 可以被准確估計。因為我們能通過因果推斷的工具解决X的內生性。
    • 不能被准確估計。一篇文章只能解决一個變量的內生性,在方程(3)中無法同時處理 的內生性。

2. 核心變量系數變味。
比如大學教育→職業→工資,如果控制了中介變量職業(白領和藍領),就變成研究上了大學的白領和沒上大學的白領的工資差异,此時會產生偏誤。因為沒上大學還能當白領多半是牛X之人,把他們與正常的上了大學去當白領的人比較是不對的,也不是我們想研究的。同理,也比較了上了大學的藍領和沒上大學的藍領的工資。上了大學還去當藍領,多半是能力差的,和正常沒上大學當藍領的人比也不公平。

3. 沒必要也很難區分直接效應和間接效應。
上了大學,從而能得到一個好工作,進而得到高工資,這本來就是我們想研究的“教育帶來回報”這個因果效應的一部分,而在方程(3)中控制了職業,我們的研究目標就變成了:上大學帶來的除了能的得到更好職業之外的回報率。這是什麼?很難說清!

4. 任何一個遺漏變量都會被中介效應模型驗證為機制。
回顧遺漏變量偏誤: 可以發現如果把 換成中介變量,和中介效應模型一模一樣,所以任何一個遺漏變量都會被中介效應模型驗證為機制。

那怎麼做機制分析?

  • 首先要搞清為什麼要做機制分析?
    • 是為了讓別人相信你講的故事!
    • 寫文章就是講道理+擺證據。
      講道理對應文章裏的理論基礎板塊,如果別人直接相信你的道理,連擺證據都不用。但是現在越來越多的人不相信純道理,所以我再跑個OLS看有效果;別人還說不相信,因為認為有內生性,我再用IV等方法解决了內生性的問題,甚至到隨機試驗,完全外生。此時別人承認有效果了,但不相信你的理論。於是擺出機制分析的證據。這每一步的努力都是提供一些弱證據,最終讓人相信你的故事。所以實證研究最重要的是把理論邏輯講清楚,再確保識別的是因果關系,再談機制分析。
  • 怎麼做機制分析?——“做一半、說一半”!
    • X→M跑回歸,M→Y引用文獻/講道理。M→Y的關系最好是顯而易見的。
      • 如收入→健康→健康保險,健康→健康保險就是一個共識,因為逆向選擇是經常存在的,健康差的人更傾向於買健康保險,如果別人不相信,可以引用一些文獻佐證。
    • 事實上機制檢驗形式多種多樣。
      • 如研究艾滋病對生育率的影響機制,想檢驗心理上和生理上兩個機制。於是在艾滋病流行的區域,分了得艾滋病和沒得艾滋病兩組人,沒得艾滋的人只有心理機制,得了艾滋的兩種機制都有。

三、調節效應模型是什麼?怎麼做?

調節效應就是經濟學中的异質性

  • x對y的影響大小受到z的調節。
  • 打破同質性假設:

為什麼要做异質性?

  • 和機制分析一樣是為了講故事。

怎麼做异質性分析?

  • 交互項or分組回歸(可以結合)
    • 交互項好在可以從交互項系數直接看出异質性是否顯著,分組回歸如果兩組都顯著,還得檢驗組間系數差异。
    • 交互項還好在用全樣本分析,樣本量大,比分組回歸更容易顯著。
    • 交互項壞在假設控制變量在兩組間系數相同,但是交互項也可以通過把控制變量和解釋變量交互來規避這個缺點。分組回歸就允許兩組系數不同。
    • 交互項還壞在要求調解變量和自變量相互獨立。
  • 异質性分析一定要建立在理論的基礎上。
    • 不是直接就東、中、西;城市、農村等,如果有理論支持才能這麼分。
    • 理論未必要有一個數理模型。形式可以是文字、圖像、數理模型、引用文獻。

PS.關於數理模型的誤用現象:一般均衡模型+OLS
所有的回歸都建立在STUVA假設上,即認為不存在一般均衡效應,以局部均衡為基礎,每個城市都是獨立的,不存在溢出效應。這與理論部分的一般均衡模型相矛盾。

說明:本文基於張川川老師講座《經濟學研究中的機制分析和异質性分析》總結而成。

- END -
版权声明:本文为[裔風]所创,转载请带上原文链接,感谢。 https://gsmany.com/2021/08/20210815131016230S.html