工具變量回歸時怎樣理解局部平均(LATE)? | 知乎問答精選

 

A-A+

工具變量回歸時怎樣理解局部平均(LATE)?

2017年01月06日 知乎問答精選 暫無評論 閱讀 70 ℃ 次

【慧航的回答(20票)】:

謝邀。其實我沒有很明白題主的意思,我就從工具變量的角度來談一下如何理解LATE吧。

(既然題主的問題比較技術化,在此我假設這篇答案的讀者已經掌握了基本的OLS、2SLS等方法。

首先我們需要從這個題目的背景談起。LATE的大背景是什麼?Treatment effects。所以首先我先引入一些notation。

假設一個個體參與一個項目(treatment),如果參與項目,其outcome為

,如果不參加,其outcome為

,我們關心的是個體參與項目與否其outcome的差別,

,或者說,處理效應(treatment effects)。當然,由於異質性,每個人的處理效應是不一樣的,我們經常關注平均處理效應Average Treatment Effects,ATE):

然而,由於不存在平行世界,我們只能觀察到

其中的一個,而非both。因此我們觀察到的實際上是

,其中

是一個0-1函數,代表個人是否參加了這個項目。以上的方程可以寫為:

其中

是我們關心的處理效應。我們不妨做一個假設,約束一下函數形式,假設

,以上式子變成了:

現在問題來了,如果我們直接ols y on x d是肯定不行的,因為誤差項

是跟d相關的。那麼一個很自然的想法就是找一個工具變量z。然而,著並沒有什麼卵用。為啥呢?因為工具變量要求跟d相關,而跟d相關的變量,都跟誤差項相關。。。。

所以這裡,為了使得以前的工具變量方法可以使用,我們必須做一個更強的假設,把

給去掉,傳統的工具變量才能用。如果假設

,那麼問題解決了,我們可以使用之前的工具變量了。

不過,這裡工具變量該怎麼用是個很有意思的事情。最傳統的,我們可以使用2SLS的方法,也就是先拿d對x和z做回歸,得到

,然後用

替換d進行第二階段回歸(

的下表1代表第1階段回歸)。

不過觀察到d是一個0-1變量,更有效的方法是第一階段不用OLS,而是用諸如probit、logit的方法做,得到一個

然後用

作為d的工具變量。注意這裡是使用

作為工具變量,而並不是使用

替代d,這是有關鍵差別的。有什麼差別呢?忽略常數項和

作為工具變量估計的實際上是:

而如果直接回歸y on d,得到的結果是:

顯然兩者是不相等的,後者低估了處理效應的magnitude。

此外,這裡一個關鍵點是,任何z的函數都可以作為工具變量,但是做出propensity score

,繼而使用

作為工具變量可能又潛在的效率的提升。那麼LATE(local average treatment effects)呢?

在LATE裡,我們有一個比較特殊的工具變量,簡單敘述起見,z也是一個0-1變量。有了工具變量,我們有兩種做法,第一種還是跟上面一樣,計算出z=0/1的propensity score

,工具可能是:

,這是上面的做法。還有一種做法,是直接使用z作為工具變量,也就是:

我們來看分子,

最終,

分子同理,最後得到:

也就是LATE的表達式。

為什麼使用LATE?熟悉LATE的都知道LATE之所以被稱之為「local」,是因為LATE有一個非常簡單的經濟學解釋:LATE度量的是,從z=0到z=1,會從d=0變到d=1的那些人的平均的處理效應。

有點繞,我們來舉個栗子。就像 @閆文收講的那個經典的例子。用離學校的距離做IV,一共有四類人:無論如何都會去上學的;無論如何都不去上學的;距離近就上學,距離遠就不上學的;距離近不上學,距離遠上學的。而LATE在這裡假設第四類人,也就是家和學校距離越遠越願意上學的,這個非常不符合直覺,假設不存在這類人。那麼LATE度量了第三類人,也就是因為家近才去上學的人的平均處理效應。

以上,從IV的角度看LATE,寫完了。其實LATE一般不是這樣講的,如果感興趣可以繼續看Angrist的書《mostly harmless econometrics》,或者Wooldridge的《cross sectional and panel data》也講的很不錯。

【趙曉航的回答(0票)】:

DingPeng: 因果推斷簡介之六:工具變量(instrumental variable)

【閆文收的回答(1票)】:

強烈推薦:mostly harmless econometrics.。 比如用家庭到學校的距離作為教育的IV,這個要起作用,會將樣本分成四個群體。1 離學校遠,上大學機會就小;2 離學校近,上大學機會大 這兩種是compliers; 3 不管遠近,都不上大學,4 不管遠近,都不上大學。 最後IV估計出來的效果是 1和2的受教育影響。 這個就稱為 local average treatment effect. 希望這樣理解是對的。

標籤:-計量經濟學


相關資源:





給我留言