縱橫資料
縱橫資料(英語:Panel data,中國大陸稱作面板數據),是統計學與計量經濟學中截面數據與時間序列數據的結合。[1][2]縱橫資料不同於混合橫截面數據(pooled cross-sectional data)。縱橫資料是對 同一主體的不同時間點的觀測值。混合橫截面數據是在不同時點從同一個大母體內部分別抽樣,將所得到的數據混合起來的一種數據集。如許多關於個人、家庭和企業的調查,每隔一段時間,常常是每隔一年,重複進行一次,如果每個時期都抽取一個隨機樣本,那麼把所得到的隨機樣本合併起來就給出一個混合橫截面。
相關的技術為縱向分析或面板分析。
例子
person | year | income | age | sex |
---|---|---|---|---|
1 | 2016 | 1300 | 27 | 1 |
1 | 2017 | 1600 | 28 | 1 |
1 | 2018 | 2000 | 29 | 1 |
2 | 2016 | 2000 | 38 | 2 |
2 | 2017 | 2300 | 39 | 2 |
2 | 2018 | 2400 | 40 | 2 |
person | year | income | age | sex |
---|---|---|---|---|
1 | 2016 | 1600 | 23 | 1 |
1 | 2017 | 1500 | 24 | 1 |
2 | 2016 | 1900 | 41 | 2 |
2 | 2017 | 2000 | 42 | 2 |
2 | 2018 | 2100 | 43 | 2 |
3 | 2017 | 3300 | 34 | 1 |
上例的多響應置換過程分析(Multiple Response Permutation Procedure, MRPP),兩個數據集分別是
- 平衡面板 (balanced panel):每個面板成員(如person)在每個時間點都被觀測到數據。
- 不平衡面板 (unbalanced panel):每個面板成員至少被觀測到一次。
上例兩個數據集都是長格式(long format),即每行數據是一個成員在一個時間點被觀測到的數據。另一種格式是寬格式(wide format),即每行數據是一個成員在所有時間點的觀測數據。
分析
面板可表示為:
其中 是個體的維度, 是時間維度。一般的縱橫資料迴歸模型可寫作: 不同的假定可用於這個通用模型的精細結構。兩個重要的模型是固定效果模型與隨機效果模型。
考慮一個通用的縱橫資料模型:
是個體相關的,時不變效果(如一個國家的地理、氣候等),而 是一個時變隨機成分。
如果 是不可觀測的,並相關於至少一個獨立變量,這導致了在標準的普通最小平方法迴歸時不可觀測的變異數偏。 但是,縱橫資料方法,如固定效果估計器或其他可選方法,可用[[first-difference estimator|一階差分估計器}}來控制。
不相關於任何獨立變量,普通最小平方線性迴歸方法可產生迴歸參數的不偏的、一致的估計。但是,因為 是時不變的,這將導致迴歸誤差項的序列相關性(serial correlation)。這意味著更為更有效地估計技術可用。隨機效果是這樣一種方法:廣義最小平方法特例可控制 導致的序列相關性結構。
動態縱橫資料
動態縱橫資料描述了迴歸器用到的相依變量的滯後算子(lag)的情形:
滯後相依變量的存在違背了嚴格的外部性(strict exogeneity),即外部性出現了。固定效果估計器與一階差分估計器依賴於嚴格的外部性。因此如果 被相信相關於一個獨立變量,必須採取其他估計技術,如工具變量(instrumental variable) 或高斯混合模型(GMM)技術,如Arellano–Bond estimator。
參考文獻
- ^ Diggle, Peter J.; Heagerty, Patrick; Liang, Kung-Yee; Zeger, Scott L. Analysis of Longitudinal Data 2nd. Oxford University Press. 2002: 2. ISBN 0-19-852484-6.
- ^ Fitzmaurice, Garrett M.; Laird, Nan M.; Ware, James H. Applied Longitudinal Analysis. Hoboken: John Wiley & Sons. 2004: 2. ISBN 0-471-21487-6.
- Baltagi, Badi H. Econometric Analysis of Panel Data Fourth. Chichester: John Wiley & Sons. 2008. ISBN 978-0-470-51886-1.
- Davies, A.; Lahiri, K. A New Framework for Testing Rationality and Measuring Aggregate Shocks Using Panel Data. Journal of Econometrics. 1995, 68 (1): 205–227. doi:10.1016/0304-4076(94)01649-K.
- Davies, A.; Lahiri, K. Re-examining the Rational Expectations Hypothesis Using Panel Data on Multi-Period Forecasts. Analysis of Panels and Limited Dependent Variable Models. Cambridge: Cambridge University Press. 2000: 226–254. ISBN 0-521-63169-6.
- Frees, E. Longitudinal and Panel Data: Analysis and Applications in the Social Sciences. New York: Cambridge University Press. 2004. ISBN 0-521-82828-7.
- Hsiao, Cheng. Analysis of Panel Data Second. New York: Cambridge University Press. 2003. ISBN 0-521-52271-4.