Chương trình giảng dạy kinh tế Fulbright
Niên khóa 2006-2007
Các phương pháp phân tích
Bài giảng
Dữ liệu bảng (Panel Data)
1
Các loại dữ liệu
Time – series
Cross – sections
Panel
2
1
Chương trình giảng dạy kinh tế Fulbright
Niên khóa 2006-2007
Các phương pháp phân tích
Bài giảng
Dữ liệu bảng
và dữ liệu chéo gộp chung
Dữ liệu bảng là các quan sát về một chỉ tiêu
nào đó sẽ bao gồm quan sát chéo và quan
sát theo thời gian
Cần phân biệt dữ liệu bảng và dữ liệu chéo
gộp chung (pooled): i,t??
¾Bỏ qua yếu tố thời gian
¾Chỉ là các quan sát dữ liệu thuần túy
3
Ưu điểm của dữ liệu bảng
Nghiên cứu được sự khác biệt giữa các đơn
vị chéo mà trước đây chúng ta hay sử dụng
dummy
Nâng cao được số quan sát của mẫu và phần
nào khắc phục được hiện tượng đa cộng
tuyến
Chứa đựng nhiều thông tin hơn các dữ liệu
khác
4
2
Chương trình giảng dạy kinh tế Fulbright
Niên khóa 2006-2007
Các phương pháp phân tích
Bài giảng
Ưu điểm của dữ liệu bảng (tt)
Nghiên cứu được động thái thay đổi của các
đơn vị chéo theo thời gian
Một mô tả dạng hàm dữ liệu bảng đơn giản
và các ý tưởng khai thác từ dữ liệu bảng:
mối quan hệ giữa năng suất lúa với lao động
nông nghiệp
5
Tổ chức dữ liệu bảng
Unstacked: Các đơn vị chéo được sắp xếp
theo thời gian một cách riêng biệt theo từng
biến (vd trong tài liệu đọc của Gujarati, đây
là cách thông thường khi mô tả dữ liệu
bảng-ví dụ bằng Eviews)
Stacked: Các đơn vị chéo được sắp xếp theo
thời gian và các đơn vị chéo này được nhóm
lại với nhau theo từng biến
6
3
Chương trình giảng dạy kinh tế Fulbright
Niên khóa 2006-2007
Các phương pháp phân tích
Bài giảng
Ví dụ về dữ liệu bảng stacked
Y 1 ,1
⎡
⎢ Y
1 , 2
⎢
⎢
M
⎢ Y 1 ,T
⎢
⎢ Y 2 ,1
⎢ Y
2 , 2
⎢
M
⎢
⎢ Y 2 ,T
⎢
M
⎢
⎢ Y N,1
⎢
⎢ Y N,2
⎢
M
⎢
⎣⎢ Y N, T
X 1 ,1
⎡
⎢ X
1 , 2
⎢
⎢
M
⎢ X 1 ,T
⎢
2 ,1
⎢ X
⎢ X
2 , 2
⎢
M
⎢
⎢ X
2 , T
⎢
M
⎢
⎢ X
N,1
⎢
N,2
⎢ X
⎢
M
⎢
⎢⎣ X
N,
T
⎤
⎥
⎥
⎥
⎥
⎥
⎥
⎥
⎥
⎥
⎥
⎥
⎥
⎥
⎥
⎥
⎥
⎥
⎦⎥
⎤
⎥
⎥
⎥
⎥
⎥
⎥
⎥
⎥
⎥
⎥
⎥
⎥
⎥
⎥
⎥
⎥
⎥
⎥⎦
⎡
⎢
⎢
⎢
⎢
⎢
⎢
⎢
⎢
⎢
⎢
⎢
⎢
⎢
⎢
⎢
⎢
⎢
⎣⎢
Z
Z
⎤
⎥
⎥
⎥
⎥
⎥
⎥
⎥
⎥
⎥
⎥
⎥
⎥
⎥
⎥
⎥
⎥
⎥
⎦⎥
1 ,1
1 , 2
M
Z
1 , T
Z
Z
2
,1
2
, 2
M
Z
2
, T
M
Z
Z
N,1
N,2
M
Z
N,
T
7
Ví dụ về dữ liệu bảng Unstacked
Quan saùt
I
F–1
C–1
Quan saùt
GE
I
C–1
F–1
US
1935
33,1 1170,6
97,8
1935
209,9
1362,4
53,8
1936
45,0 2015,8
104,4
1936
355,3
1807,1
50,5
1937
77,2 2803,3
118,0
1937
469,9
2673,3
118,1
1938
44,6 2039,7
156,2
1938
262,3
1801,9
260,2
1939
48,1 2256,2
172,6
1939
230,4
1957,3
312,7
1940
74,4 2132,2
186,6
1940
361,6
2202,9
254,2
8
4
Chương trình giảng dạy kinh tế Fulbright
Niên khóa 2006-2007
Các phương pháp phân tích
Bài giảng
Các loại dữ liệu bảng
Dữ liệu bảng cân bằng (balanced): khi các
đơn vị chéo có cùng số quan sát theo thời
gian
Dữ liệu bảng không cân bằng (unbalance):
khi các đơn vị chéo không có cùng số quan
sát theo thời gian
9
Ý tưởng cơ bản về dữ liệu bảng
Dữ liệu bảng không thể thực hiện hồi qui
bằng OLS thông thường
Các trường hợp có thể xảy ra cho các đơn vị
chéo
¾Các đơn vị chéo có điều kiện đặc thù giống
nhau
¾Các đơn vị chéo có điều kiện đặc thù khác
nhau
10
5
Chương trình giảng dạy kinh tế Fulbright
Niên khóa 2006-2007
Các phương pháp phân tích
Bài giảng
Ý tưởng cơ bản về dữ liệu bảng (tt)
¾Các đơn vị chéo có sự khác biệt về tác động
biên của các nhân tố ảnh hưởng
¾Các đơn vị chéo vừa khác biệt về điều kiện
đặc thù và vừa khác biệt về tác động biên
của các nhân tố ảnh hưởng
¾Các đơn vị chéo không có sự khác biệt về
điều kiện đặc thù và tác động biên của các
biến độc lập đang xét
11
Dummy và dữ liệu bảng
Dummy có giải quyết các vấn đề của dữ
liệu bảng?
Câu trả lời là được nhưng rất phức tạp và
không hiệu quả
12
6
Chương trình giảng dạy kinh tế Fulbright
Niên khóa 2006-2007
Các phương pháp phân tích
Bài giảng
Dạng tổng quát mô hình
Yit = β1it + β2itX2it + β3itX3it + uit
Các tiếp cận ước lượng mô hình tổng quát
¾Pure Pooled Î OLS
¾FEMÎ OLS + Dummy (LSDV)
¾ECM/REM Î GLS
13
Tiếp cận tác động cố định
Tất cả các hệ số đều không đổi theo thời
gian và các đơn vị chéo (pure pooled)
Hệ số độ dốc không đổi theo thời gian và
các đơn vị chéo nhưng hệ số trục tung khác
nhau giữa các đơn vị chéo (+dummy)
Hệ số độ dốc không đổi theo thời gian và
các đơn vị chéo nhưng hệ số trục tung biến
đổi giữa các đơn vị chéo và thời gian
14
7
Chương trình giảng dạy kinh tế Fulbright
Niên khóa 2006-2007
Các phương pháp phân tích
Bài giảng
Tiếp cận tác động cố định (tt)
Tất cả các hệ số biến đổi theo các đơn vị
chéo (dummy + interactive)
Tất cả các hệ số biến đổi theo các đơn vị
chéo và theo thời gian (dummy +
interactive)
15
Tất cả các hệ số không đổi
OLS- Pooled (hồi qui kết hợp tất cả các
quan sát)
Yit = β1 + β2X2it + β3X3it + uit
Nhược điểm
¾ Nhận dạng sai thể hiện ở DW
¾Ràng buộc quá chặt về các đơn vị chéo,
điều này khó xảy ra trong thực tế
16
8
Chương trình giảng dạy kinh tế Fulbright
Niên khóa 2006-2007
Các phương pháp phân tích
Bài giảng
Tất cả các hệ số không đổi (tt)
Y^ = –63,3041 +0,1101X2 + 0,3034X3
se
(29,6124) (0,0137)
(0,0493)
t
(–2,1376) (8,0188)
(6,1545)
R2 = 0,7565
DW = 0,2187
n = 80
df = 77
Phương trình 16.3.1 trong bài đọc
17
Hệ số trục tung biến đổi theo chéo
Phương pháp FEM – LSDV
Yit = β1it + β2X2it + β3X3it + uit
FEM: mặc dù có sự khác biệt các đơn vị
chéo về hệ số trục tung nhưng lại không
khác biệt theo thời gian
Giải pháp dummy?
18
9
Chương trình giảng dạy kinh tế Fulbright
Niên khóa 2006-2007
Các phương pháp phân tích
Bài giảng
Intercept biến đổi theo đơn vị chéo (tt)
Yit = α1 + α2D2i + α3D3i + α4D4i +
β2X2it + β3X3it + uit
19
Intercept biến đổi theo đơn vị chéo (tt)
Hãy xem kết quả mô hình ước lượng 16.3.4
Mô hình này tốt hơn mô hình đầu tiên ở các
hệ số xác định, ý nghĩa thống kê t và DW . . .
Sự sai lầm về nhận dạng được cải thiện
Thoả mãn kiểm định Wald
20
10
Chương trình giảng dạy kinh tế Fulbright
Niên khóa 2006-2007
Các phương pháp phân tích
Bài giảng
Intercept biến đổi theo thời gian
Tiếp tục sử dụng biến dummy cho thời gian
Tốn kém thời gian
Không có ý nghĩa thống kê
Time effect: điều này có nghĩa là các yếu tố đặc
thù của ngành không thay đổi theo thời gian
¾ Yit = λ0 + λ1 Dum35 + λ2 Dum36+ . . . + λ19
Dum53 + β2X2it + β3X3it + uit
(16.3.6)
21
Intercept biến đổi theo đơn vị chéo
và theo thời gian
Sử dụng dummy một lần nữa cho cả đơn vị
chéo và thời gian
Kết quả
¾Các hệ số của dummy ít có ý nghĩa thống kê
¾Mô hình tốt là mô hình có các biến giả theo
các đơn vị chéo
22
11
Chương trình giảng dạy kinh tế Fulbright
Niên khóa 2006-2007
Các phương pháp phân tích
Bài giảng
Tất cả các hệ số biến đổi theo đơn vị
chéo
Sử dụng dummy theo các đơn vị chéo cho
intercept và slope
Kết quả hồi qui ở 16.3.8
¾ Các hàm đầu tư của các đơn vị chéo khác
nhau
¾Không thể sử dụng dữ liệu pooled để hồi
qui hàm đầu tư cho tất cả các đơn vị chéo
mà không tính đến đặc thù của chúng
23
Trục trặc khi sử dụng FEM (LSDV)
Giảm bậc tự do của dữ liệu đi rất nhiều
Nguy cơ đa cộng tuyến vì có quá nhiều biến
Giả định cổ điển về uit ~ N (0, σ2) rất khó
thực hiện
¾Cần thiết có một phương pháp khác
24
12
Chương trình giảng dạy kinh tế Fulbright
Niên khóa 2006-2007
Các phương pháp phân tích
Bài giảng
Tiếp cận REM (ECM)
Ý tưởng của tiếp cận này cho rằng sự khác
biệt về các điều kiện đặc thù của các đơn vị
chéo được chứa đựng trong phần sai số
ngẫu nhiên
¾ β1i = β1 + εi
¾Yit = β1 + β2X2it + β3X3it + εi + uit
= β1 + β2X2it + β3X3it + wit
¾ wit = εi + uit
25
Giả định REM
Giả định thông thường
ε i ~ N (0 , σ
(
u it ~ N 0 , σ
2
ε
2
u
)
)
26
13
Chương trình giảng dạy kinh tế Fulbright
Niên khóa 2006-2007
Các phương pháp phân tích
Bài giảng
Sự khác biệt giữa FEM và ECM
FEM có riêng từng Intercept cho từng đơn vị chéo
và chúng ta quan sát được
ECM chỉ có một intercept duy nhất cho tất cả các
đơn vị chéo, giá trị này là giá trị trung bình của tất
cả các đơn vị chéo.
Sự khác biệt của các đơn vị chéo ước lượng bằng
εi phần ngẫu nhiên
ECM nằm trong thành
27
Lựa chọn mô hình cho dữ liệu bảng
Ý tưởng kinh tế lượng
¾FEM khi εi và các biến độc lập được giả
thiết có mối quan hệ chặt chẽ (chọn mẫu
không đại diện)
¾ ECM khi εi và các biến độc lập được giả
thiết không có mối quan hệ chặt chẽ (chọn
mẫu ngẫu nhiên)
Căn cứ vào n và t: Judge
28
14
Chương trình giảng dạy kinh tế Fulbright
Niên khóa 2006-2007
Các phương pháp phân tích
Bài giảng
Lựa chọn mô hình cho dữ liệu bảng
Căn cứ vào N và T: Judge
¾ECM và FEM không phân biệt khi T lớn và N
nhỏ
¾ECM và FEM sẽ khá khác biệt về kết quả khi
N lớn và T nhỏ
9ECM thích hợp khi các đơn vị chéo ngẫu nhiên
9FEM sẽ thích hợp khi các đơn vị chéo không
được lựa chọn ngẫu nhiên
29
15
- Xem thêm -