TRƯỜNG ĐẠI HỌC NGOẠI THƯƠNG
KHOA KINH TẾ QUỐC TẾ
TIỂU LUẬN MÔN KINH TẾ LƯỢNG I
ĐỀ TÀI: CÁC YẾU TỐ ẢNH HƯỞNG ĐẾN THU
NHẬP THEO GIỜ CỦA NGƯỜI LAO ĐỘNG
Nhóm thực hiện : Nhóm 23
Danh sách thành viên : Nguyễn Anh Tú - 1614410184
Lê Anh Tuấn - 1714410236
Giảng viên : TS. Nguyễn Thu Giang
Mã lớp tín chỉ : KTE218(2-1819).2
MỤC LỤC
PHẦN 1
1.1
PHÂN TÍCH VÀ XÂY DỰNG MÔ HÌNH NGHIÊN CỨU ...................... 3
Mô tả tổng quan và xây dựng mô hình ................................................................. 3
1.1.1
Mô tả bộ dữ liệu ............................................................................................... 3
1.1.2
Mô hình toán học ............................................................................................. 4
1.1.3
Mô hình kinh tế lượng ...................................................................................... 4
1.2
Mô tả chi tiết các biến trong mô hình ................................................................... 6
1.2.1
Thu nhập trung bình theo giờ (wage) .............................................................. 6
1.2.2
Kinh nghiệm làm việc (exper) .......................................................................... 8
1.2.3
Trình độ học vấn (educ) ................................................................................... 9
1.2.4
Tình trạng sức khỏe (goodhlth) ...................................................................... 10
1.2.5
Tình trạng hôn nhân (married) ...................................................................... 11
1.2.6
Ngành làm việc (service) ................................................................................ 11
PHẦN 2
ƯỚC LƯỢNG MÔ HÌNH VÀ KIỂM ĐỊNH............................................. 13
2.1
Mô tả tương quan giữa biến phụ thuộc và các biến độc lập .............................. 13
2.1.1
Lập bảng tương quan ..................................................................................... 13
2.1.2
Phân tích mối quan hệ tương quan giữa các biến ......................................... 13
2.2
Chạy mô hình hồi quy và phân tích kết quả ....................................................... 14
2.2.1
Chạy mô hình hồi quy .................................................................................... 14
2.2.2
Phân tích kết quả sau khi chạy mô hình ......................................................... 15
2.3
Kiểm tra khuyết tật của mô hình ......................................................................... 17
2.3.1
Đa cộng tuyến (Multi - collinearity) .............................................................. 17
2.3.2
Phương sai sai số thay đổi (Heteroscedasticity)............................................ 19
2.4
Kiểm định giả thuyết về hệ số hồi quy ................................................................ 21
2.4.1
Kinh nghiệm làm việc (exper) ........................................................................ 21
2.4.2
Trình độ học vấn (educ) ................................................................................. 22
2.4.3
Tình trạng sức khỏe (goodhlth) ...................................................................... 22
2.4.4
Tình trạng hôn nhân (married) ...................................................................... 22
2.4.5
Ngành làm việc (service) ................................................................................ 23
2.5
Kiểm định sự phù hợp của mô hình ................................................................... 23
LỜI MỞ ĐẦU
Kinh tế lượng (Econometrics) là môn khoa học xã hội trong đó các công cụ của lý
thuyết kinh tế, toán học và suy đoán thống kê được áp dụng để phân tích các vấn đề kinh
tế. Kinh tế lượng sử dụng các công cụ phương pháp của thống kê toán để tìm ra bản chất
của các số liệu thống kê, đưa ra kết luận về các số liệu thống kê thu nhập được từ đó có thể
đưa ra các dự báo về các hiện tượng kinh tế.
Từ khi ra đời đến nay, kinh tế lượng đã đem lại cho các nhà kinh tế một công cụ đo
lường đáng tin cậy để đo các quan hệ kinh tế. Là những sinh viên đang theo học khối ngành
kinh tế, nhóm nhận thấy được sự cần thiết của việc học tập và tìm hiểu về kinh tế lượng
trong việc phân tích logic và nghiên cứu vấn đề. Để hiểu sâu hơn về việc đưa kinh tế lượng
vào trong thực tế cuộc sống và áp dụng kinh tế lượng sao cho đúng và hiệu quả, nhóm xin
xây dựng bài báo cáo thực hành kinh tế lượng phân tích sự ảnh hưởng của một số yếu tố
đến mức thu nhập trung bình theo giờ. Trong bài báo cáo nhóm đã sử dụng công cụ phân
tích kinh tế lượng là phần mềm Stata để phân tích, nghiên cứu dựa trên số liệu của file dữ
liệu Dataset.dta.
Nguồn thu nhập của đại đa số công nhân hay người đi làm phần lớn từ việc bán sức
lao động của mình để tạo thu nhập, ổn định đời sống cho mình và gia đình nên thu nhập
bình quân ảnh hưởng rất lớn đến cuộc sống của người lao động nói riêng và xã hội nói
chung. Vì vậy, nhóm hi vọng bài báo cáo có thể giúp những người lao động cũng như doanh
nghiệp, tổ chức phần nào hiểu hơn về một số yếu tố ảnh hưởng đến thu nhập để có những
quyết định đúng đắn trong tương lai.
Do kiến thức còn hạn chế nên đề tài của nhóm không tránh khỏi những thiếu sót không
mong muốn. Nhóm rất mong nhận được sự đóng góp ý kiến và phê bình của cô để đề tài
được hoàn chỉnh hơn.
NỘI DUNG
PHẦN 1
PHÂN TÍCH VÀ
XÂY DỰNG MÔ HÌNH NGHIÊN CỨU
1.1 Mô tả tổng quan và xây dựng mô hình
1.1.1 Mô tả bộ dữ liệu
Mô tả bộ dữ liệu (file Dataset) bằng lệnh des, nhóm thu được kết quả như sau:
. des
storage
variable name
type
display
value
format
label
variable label
--------------------------------------------------------------------------wage
float
%9.0g
hourly wage
lwage
float
%9.0g
log(wage)
belavg
byte
%8.0g
=1 if looks <= 2
abvavg
byte
%8.0g
=1 if looks >=4
exper
byte
%8.0g
years of workforce experience
looks
byte
%8.0g
from 1 to 5
union
byte
%8.0g
=1 if union member
goodhlth
byte
%8.0g
=1 if good health
black
byte
%8.0g
=1 if black
female
byte
%8.0g
=1 if female
married
byte
%8.0g
=1 if married
south
byte
%8.0g
=1 if live in south
bigcity
byte
%8.0g
=1 if live in big city
smllcity
byte
%8.0g
=1 if live in small city
service
byte
%8.0g
=1 if service industry
expersq
int
%8.0g
exper^2
educ
byte
%8.0g
years of schooling
---------------------------------------------------------------------------
1.1.2 Mô hình toán học
Từ phần mô tả bộ trên cho thấy, có nhiều yếu tố tác động đến thu nhập trung bình theo
giờ trong bộ dữ liệu như: giới tính, ngoại hình, vùng miền, nơi làm việc,… Trong phạm vi
bài báo cáo, nhóm tác giả chọn các yếu tố bao gồm: kinh nghiệm làm việc, trình độ học
vấn, tình trạng sức khỏe, tình trạng hôn nhân và ngành làm việc, như sau:
Biến phụ thuộc: Y (wage)
Biến độc lập: Xi (gồm 5 biến: X1: exper, X2: educ, X3: goodhlth, X4: married, X5: service).
Thu nhập = f (kinh nghiệm làm việc, trình độ học vấn, tình trạng sức khỏe, tình trạng hôn
nhân, ngành làm việc)
Dạng mô hình được sử dụng là tuyến tính, nhóm xây dựng mô hình toán học đơn giản sau:
Wage = βo + β1 * exper + β2 * educ + β3 * goodhlth + β4 * married + β5 * service
Trong đó: β0 là hệ số chặn;
β1, β2, β3, β4, β5 là các hệ số góc.
1.1.3 Mô hình kinh tế lượng
Để xây dựng quan hệ đúng giữa thu nhập trung bình theo giờ, kinh nghiệm làm việc,
trình độ học vấn, tình trạng sức khỏe, tình trạng hôn nhân và ngành làm việc, nhóm xét đến
ảnh hưởng của các yếu tố ngẫu nhiên và có được mô hình kinh tế lượng sau:
Hàm hồi quy tổng thể:
PRF:
Wage = βo + β1 * exper + β2 * educ + β3 * goodhlth + β4 * married + β5 * service + ui
Hàm hồi quy mẫu:
SRF:
̂ = 𝛽̂o + 𝛽̂1 * exper + 𝛽̂2 * educ + 𝛽̂3 * goodhlth + 𝛽̂4 * married + 𝛽̂5 * service
𝑊𝑎𝑔𝑒
Trong đó: ui là yếu tố ngẫu nhiên/nhiễu.
-
Mô tả dữ liệu bằng lệnh des, nhóm thu được kết quả như sau:
. des wage exper educ goodhlth married service
storage
variable name
type
display
value
format
label
variable label
------------------------------------------------------------------------wage
float
%9.0g
hourly wage
exper
byte
%8.0g
years of workforce experience
educ
byte
%8.0g
years of schooling
goodhlth
byte
%8.0g
=1 if good health
married
byte
%8.0g
=1 if married
service
byte
%8.0g
=1 if service industry
Bảng 1 Giải thích các biến số sử dụng trong mô hình
STT
1
1.1
2
Tên biến
Ký hiệu
Đơn vị
wage
USD
Biến phụ thuộc
Thu nhập
Kinh nghiệm làm
việc
exper
năm
2.2
Trình độ học vấn
educ
năm
2.4
2.5
-
Thu nhập trung bình theo
giờ
Biến độc lập
2.1
2.3
Giải thích biến
Tình trạng sức khỏe
Tình trạng hôn nhân
Ngành làm việc
goodhlth
married
service
Số năm kinh nghiệm làm
việc
Số năm học vấn
-
= 1 nếu người làm việc có
sức khỏe tốt
= 0 nếu người làm việc
không có sức khỏe tốt
-
= 1 nếu người làm việc đã
kết hôn
= 0 nếu người làm việc
chưa kết hôn
-
= 1 nếu làm việc trong
ngành dịch vụ
= 0 nếu không làm việc
trong ngành dịch vụ
Mô tả dữ liệu bằng lệnh sum, nhóm thu được kết quả như sau:
. sum wage exper educ goodhlth married service
Variable |
Obs
Mean
Std. Dev.
Min
Max
-------------+-------------------------------------------------------wage |
1260
6.30669
4.660639
1.02
77.72
exper |
1260
18.20635
11.96349
0
48
educ |
1260
12.56349
2.624489
5
17
goodhlth |
1260
.9333333
.2495429
0
1
married |
1260
.6912698
.462153
0
1
-------------+-------------------------------------------------------service |
1260
.2738095
.4460895
0
1
Bảng 2 Kết quả mô tả thống kê các biến số sử dụng trong mô hình
Giá trị trung
bình
Độ lệch
chuẩn
Giá trị nhỏ
nhất
Giá trị lớn
nhất
Tên biến
Số quan sát
Wage
1260
6.30669
4.660639
1.02
77.72
Exper
1260
18.20635
11.96349
0
48
Educ
1260
12.56349
2.624489
5
17
Goodhlth
1260
0.9333333
0.2495429
0
1
Married
1260
0.6912698
0.462153
0
1
Service
1260
0.2738095
0.4460895
0
1
1.2 Mô tả chi tiết các biến trong mô hình
Mô tả chi tiết dữ liệu bằng lệnh tab, nhóm thu được kết quả như sau:
1.2.1 Thu nhập trung bình theo giờ (wage)
. tab wage
hourly wage |
Freq.
Percent
Cum.
------------+----------------------------------1.02 |
1
0.08
0.08
1.05 |
1
0.08
0.16
1.09 |
1
0.08
0.24
1.16 |
2
0.16
0.40
1.17 |
1
0.08
0.48
1.2 |
2
0.16
0.63
1.22 |
1
0.08
0.71
1.25 |
1
0.08
0.79
1.26 |
1
0.08
0.87
1.27 |
4
0.32
1.19
1.28 |
3
0.24
1.43
1.32 |
3
0.24
1.67
1.46 |
1
0.08
1.75
1.48 |
1
0.08
1.83
1.56 |
1
0.08
1.90
1.58 |
1
0.08
1.98
1.61 |
1
0.08
2.06
1.63 |
1
0.08
2.14
1.65 |
2
0.16
2.30
1.66 |
1
0.08
2.38
1.68 |
3
0.24
2.62
1.75 |
1
0.08
2.70
1.76 |
1
0.08
2.78
1.79 |
3
0.24
3.02
1.8 |
4
0.32
3.33
1.82 |
1
0.08
3.41
1.83 |
2
0.16
3.57
1.88 |
2
0.16
3.73
1.92 |
13
1.03
4.76
---more---
Như vậy, nhóm nhận thấy:
Thu nhập bình quân được tính theo giờ (hourly wage), dao động từ 1.02 đến 77.72 USD/giờ.
Tần suất xuất hiện (Freq.) khác nhau, trong đó, thu nhập bình quân 3.75 USD/giờ là phổ
biến nhất, xuất hiện 36 lần với tỷ lệ (percent) 2.86%.
Phần trăm tích lũy (Cum.) cho thấy 60.79% trong 1260 người được quan sát có thu nhập
bình quân theo giờ < 6.30669USD/giờ (giá trị trung bình).
1.2.2 Kinh nghiệm làm việc (exper)
. tab exper
years of |
workforce |
experience |
Freq.
Percent
Cum.
------------+----------------------------------0 |
4
0.32
0.32
1 |
19
1.51
1.83
2 |
23
1.83
3.65
3 |
45
3.57
7.22
4 |
42
3.33
10.56
5 |
59
4.68
15.24
6 |
29
2.30
17.54
7 |
52
4.13
21.67
8 |
46
3.65
25.32
9 |
41
3.25
28.57
10 |
68
5.40
33.97
11 |
37
2.94
36.90
12 |
55
4.37
41.27
13 |
37
2.94
44.21
14 |
31
2.46
46.67
15 |
44
3.49
50.16
16 |
30
2.38
52.54
17 |
25
1.98
54.52
18 |
46
3.65
58.17
19 |
25
1.98
60.16
20 |
43
3.41
63.57
21 |
15
1.19
64.76
22 |
19
1.51
66.27
23 |
26
2.06
68.33
24 |
25
1.98
70.32
25 |
27
2.14
72.46
26 |
26
2.06
74.52
27 |
19
1.51
76.03
28 |
24
1.90
77.94
29 |
16
1.27
79.21
30 |
24
1.90
81.11
31 |
17
1.35
82.46
32 |
15
1.19
83.65
33 |
13
1.03
84.68
34 |
19
1.51
86.19
35 |
25
1.98
88.17
36 |
17
1.35
89.52
37 |
18
1.43
90.95
38 |
14
1.11
92.06
39 |
9
0.71
92.78
40 |
28
2.22
95.00
41 |
11
0.87
95.87
42 |
18
1.43
97.30
43 |
7
0.56
97.86
44 |
14
1.11
98.97
45 |
6
0.48
99.44
46 |
2
0.16
99.60
47 |
3
0.24
99.84
48 |
2
0.16
100.00
------------+----------------------------------Total |
1,260
100.00
Như vậy, nhóm nhận thấy:
Số năm kinh nghiệm làm việc (years of workforce experience) dao động từ 0 đến 48 năm.
Tần suất xuất hiện (Freq.) khác nhau, trong đó, 10 năm kinh nghiệm là phổ biến nhất, xuất
hiện 68 lần ở tỷ lệ (percent) 5.40%.
Phần trăm tích lũy (Cum.) cho thấy 58.17% trong 1260 người được quan sát có kinh nghiệm
làm việc < 18.20635 năm (giá trị trung bình).
1.2.3 Trình độ học vấn (educ)
. tab educ
years of |
schooling |
Freq.
Percent
Cum.
------------+----------------------------------5 |
42
3.33
3.33
8 |
44
3.49
6.83
10 |
156
12.38
19.21
12 |
468
37.14
56.35
13 |
246
19.52
75.87
14 |
51
4.05
79.92
16 |
121
9.60
89.52
17 |
132
10.48
100.00
------------+----------------------------------Total |
1,260
100.00
Như vậy, nhóm nhận thấy:
Số năm học vấn (years of schooling) dao động từ 5 đến 17 năm.
Tần suất xuất hiện (Freq.) khác nhau, trong đó, 12 năm học là phổ biến nhất, xuất hiện 468
lần ở tỷ lệ (percent) 37.14%.
Phần trăm tích lũy (Cum.) cho thấy 56.35% trong 1260 người được quan sát có trình độ
học vấn với số năm học < 12.56349 năm (giá trị trung bình).
1.2.4 Tình trạng sức khỏe (goodhlth)
. tab goodhlth
=1 if good |
health |
Freq.
Percent
Cum.
------------+----------------------------------0 |
84
6.67
6.67
1 |
1,176
93.33
100.00
------------+----------------------------------Total |
1,260
100.00
Như vậy, nhóm nhận thấy:
Biến giả goodhlth nhận giá trị = 1 nếu người làm việc có sức khỏe tốt (=1 if good health).
Tần suất xuất hiện (Freq.): 1176 lần trong 1260 quan sát, chiếm phần lớn số quan sát
(percent), lên tới 93.33%.
Biến giả goodhlth nhận giá trị = 0 nếu người làm việc không có sức khỏe tốt. Tần suất xuất
hiện (Freq.): chỉ xuất hiện 84 lần trong 1260 quan sát và chiếm (percent) 6.67%.
1.2.5 Tình trạng hôn nhân (married)
. tab married
=1 if |
married |
Freq.
Percent
Cum.
------------+----------------------------------0 |
389
30.87
30.87
1 |
871
69.13
100.00
------------+----------------------------------Total |
1,260
100.00
Như vậy, nhóm nhận thấy:
Biến giả married nhận giá trị = 1 nếu người làm việc đã kết hôn (=1 if married). Tần suất
xuất hiện (Freq.): 871 lần trong 1260 quan sát, cũng chiếm trên 50% số quan sát (percent),
lên tới 69.13%.
Biến giả married nhận giá trị = 0 nếu người làm việc không có sức khỏe tốt. Tần suất xuất
hiện (Freq.): chỉ xuất hiện 389 lần trong 1260 quan sát và chiếm (percent) 30.87%.
1.2.6 Ngành làm việc (service)
. tab service
=1 if |
service |
industry |
Freq.
Percent
Cum.
------------+----------------------------------0 |
915
72.62
72.62
1 |
345
27.38
100.00
------------+----------------------------------Total |
1,260
Như vậy, nhóm nhận thấy:
100.00
Biến giả service nhận giá trị = 1 nếu làm việc trong ngành dịch vụ (=1 if service industry).
Tần suất xuất hiện (Freq.): chỉ xuất hiện 345 lần trong 1260 quan sát, chiếm dưới 30% số
quan sát (percent): 27.38%.
Biến giả service nhận giá trị = 0 nếu không làm việc trong ngành dịch vụ. Tần suất xuất
hiện (Freq.): tới 915 lần trong 1260 quan sát và chiếm (percent) cao: 72.62%.
PHẦN 2
ƯỚC LƯỢNG MÔ HÌNH VÀ KIỂM ĐỊNH
2.1 Mô tả tương quan giữa biến phụ thuộc và các biến độc lập
2.1.1 Lập bảng tương quan
Trước khi chạy mô hình hồi quy, nhóm xem xét mối quan hệ tương quan giữa các biến
bằng cách sử dụng lệnh corr, thu được kết quả như sau:
. corr wage exper educ goodhlth married service
(obs=1260)
|
wage
exper
educ goodhlth
married
service
-------------+-----------------------------------------------------wage |
1.0000
exper |
0.2346
1.0000
educ |
0.2123
-0.1862
1.0000
goodhlth |
0.0068
-0.1316
0.1071
1.0000
married |
0.1845
0.2556
-0.0477
-0.0133
1.0000
service |
-0.0537
-0.0573
0.3016
0.0499
-0.0751
1.0000
Như vậy, nhóm nhận thấy:
Các biến độc lập có tương quan với biến phụ thuộc nhưng không cao. Hầu hết các
biến độc lập đều có hệ số tương quan dương, cho thấy tác động cùng chiều lên biến phụ
thuộc, riêng biến service có hệ số tương quan âm, cho thấy tác động ngược chiều lên biến
phụ thuộc.
Các biến độc lập có tương quan với nhau và mối quan hệ tương quan giữa các biến
độc lập với nhau cũng không cao, hệ số tương quan cao nhất chỉ là 0,3016 (giữa biến educ
và service).
Không có hệ số tương quan nào có độ lớn vượt quá 0.8, bởi vậy nhóm dự đoán mô
hình không xảy ra hiện tượng đa cộng tuyến.
2.1.2 Phân tích mối quan hệ tương quan giữa các biến
Từ bảng tương quan trên có thể thấy:
- Hệ số tương quan giữa biến wage và exper là: r(wage, exper)= 0.2346 nên kỳ vọng
dấu của 𝛽̂1 dương.
- Hệ số tương quan giữa biến wage và educ là: r(wage, educ)= 0.2123 nên kỳ vọng
dấu của 𝛽̂2 dương.
- Hệ số tương quan giữa biến wage và goodhlth là: r(wage, goodhlth)= 0.0068 nên kỳ
vọng dấu của 𝛽̂3 dương.
- Hệ số tương quan giữa biến wage và married là: r(wage, married)= 0.1845 nên kỳ
vọng dấu của 𝛽̂4 dương.
- Hệ số tương quan giữa biến wage và service là: r(wage, service)= -0.0537 nên kỳ
vọng dấu của 𝛽̂5 âm.
Như vậy, trong các nhân tố được nghiên cứu, biến exper có mối tương quan mạnh
nhất đến wage, hay kinh nghiệm làm việc có ảnh hưởng nhiều đến thu nhập bình quân theo
giờ. Hệ số tương quan giữa 2 biến mang dấu dương thể hiện mối quan hệ cùng chiều giữa
2 biến nên nếu kinh nghiệm làm việc tăng thì thu nhập bình quân theo giờ cũng tăng.
Ngược lại, biến goodhlth ảnh hưởng ít nhất đến wage, hay tình trạng sức khỏe không
ảnh hưởng nhiều đến thu nhập bình quân theo giờ như các yếu tố khác. Hệ số tương quan
giữa 2 biến mang dấu dương thể hiện mối quan hệ cùng chiều giữa 2 biến, nếu tình trạng
sức khỏe tốt thì thu nhập bình quân theo giờ sẽ cao hơn người không có tình trạng sức khỏe
tốt nhưng không cao hơn nhiều. Biến service ảnh hưởng ngược chiều đến biến wage, hệ số
tương quan giữa hai biến mang dấu âm thể hiện nếu làm việc trong ngành dịch vụ thì thu
nhập bình quân theo giờ sẽ thấp hơn không làm việc trong ngành dịch vụ.
Ngoài ra, vì giá trị tuyệt đối của các chỉ số đều nhỏ hơn 0.8 nên nhóm dự đoán được
mô hình không xảy ra hiện tượng đa cộng tuyến.
2.2 Chạy mô hình hồi quy và phân tích kết quả
2.2.1 Chạy mô hình hồi quy
Chạy mô hình hồi quy bằng lệnh reg, nhóm thu được kết quả như sau:
. reg wage exper educ goodhlth married service
Source |
SS
df
MS
-------------+-----------------------------Model |
4184.10271
5
836.820542
Number of obs =
F( 5,
1254) =
Prob > F
=
1260
45.30
0.0000
Residual |
23163.3365
1254
18.4715602
R-squared
-------------+-----------------------------Total |
27347.4392
1259
21.7215561
=
0.1530
Adj R-squared =
0.1496
Root MSE
4.2979
=
-------------------------------------------------------------------------wage |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------exper |
.0988369
.0107208
9.22
0.000
.0778042
.1198696
educ |
.533433
.0493363
10.81
0.000
.4366421
.6302239
goodhlth |
.2928497
.4916339
0.60
0.552
-.6716659
1.257365
married |
1.261672
.2717504
4.64
0.000
.7285364
1.794808
service |
-1.265254
.2854645
-4.43
0.000
-1.825295
-.7052133
_cons |
-2.993594
.8074974
-3.71
0.000
-4.577789
-1.409399
--------------------------------------------------------------------------
Từ đó, có được bảng số liệu sau:
Bảng 3 Kết quả chạy mô hình hồi quy
Tên biến
Hệ số tự do
Exper
Educ
Goodhlth
Married
Service
Hệ số hồi quy
-2.993594
0.0988369
0.533433
0.2928497
1.261672
-1.265254
Thống kê t
-3.71
9.22
10.81
0.60
4.64
-4.43
P-value
0.000
0.000
0.000
0.552
0.000
0.000
Khoảng tin cậy
[-4.577789; -1.409399]
[0.778042; 0.1198696]
[0.4366421; 0.6302239]
[-0.6716659; 1.257365]
[0.7285364; 1.794808]
[-4.577789; -1.409399]
Như vậy, có được hàm hồi quy mẫu:
SRF:
̂ = -2.993594 + 0.0988369 * exper + 0.533433 * educ + 0.2928497 * goodhlth +
𝑊𝑎𝑔𝑒
1.261672 * married – 1.265254 * service
2.2.2 Phân tích kết quả sau khi chạy mô hình
Số quan sát (n): Obs = 1260.
Tổng bình phương sai số được giải thích: SSE = 4184.10271.
Tổng bình phương các phần dư: SSR = 23163.3365.
Tổng bình phương sai số tổng cộng: SST = 27347.4392.
Bậc tự do của phần được giải thích (k): Dfm = 5.
Bậc tự do của phần dư: Dfr =1254.
Hệ số xác định: R2 (đo mức độ phù hợp của hàm hồi quy mẫu, cho biết % sự biến động của
Y được giải thích bởi các biến số Xi trong mô hình) = 0.1530 có nghĩa là các biến Xi trong
mô hình giải thích được 15.30% sự dao động của biến Y hay các biến số kinh nghiệm làm
việc, trình độ học vấn, tình trạng sức khỏe, tình trạng hôn nhân và ngành làm việc giải thích
được 15.30% sự dao động của biến thu nhập trung bình theo giờ.
Hệ số xác định điều chỉnh: 𝑅2 = 0.1496.
Ý nghĩa của các hệ số hồi quy trong mô hình:
β0 = -2.993594 nghĩa là khi giá tri ̣của các biến độc lập đều bằng 0 thì thu nhập trung
bình theo giờ là -2.993594 USD;
β1 = 0.0988369 > 0 nghĩa là mỗi một năm kinh nghiệm làm việc tăng thêm sẽ làm thu
nhập trung bình theo giờ tăng 0.0988369 USD với điều kiện các yếu tố khác không đổi;
β2 = 0.533433 > 0 nghĩa là mỗi một năm học tăng thêm sẽ làm thu nhập trung bình
theo giờ tăng 0.533433 USD với điều kiện các yếu tố khác không đổi;
𝛽3 = 0.2928497 > 0 nghĩa là thu nhập trung bình theo giờ của người có tình trạng sức
khỏe tốt cao hơn của người có tình trạng sức khỏe không tốt là 0.2928497 với điều kiện các
yếu tố khác không đổi;
β4 = 1.261672 > 0 nghĩa là thu nhập trung bình theo giờ của người đã kết hôn cao hơn
của người chưa kết hôn là 1.261672 USD với điều kiện các yếu tố khác không đổi;
β5 = -1.265254 < 0 nghĩa là thu nhập trung bình theo giờ của người làm trong ngành
dịch vụ thấp hơn của người không làm trong ngành dịch vụ là 1.265254 USD với điều kiện
các yếu tố khác không đổi.
2.3 Kiểm tra khuyết tật của mô hình
2.3.1 Đa cộng tuyến (Multi - collinearity)
2.3.1.1 Bản chấ t:
Theo định lý Gauss - Markov, một ước lượng theo phương pháp OLS có các tính chất:
tuyến tính, không chệch, tốt nhất (BLUE). Tuy nhiên, trên thực tế do xây dựng sai mô hình
hoặc do bản chất của dữ liệu dẫn tới mô hình không đạt được đầy đủ các tính chất trên. Một
trong những vấn đề ảnh hưởng đến mô hình mà được coi là vi phạm các giả định, là đa cộng
tuyến. Đa cộng tuyến là một lỗi của mô hình phân tích hồi quy, xảy ra khi các biến độc lập
Xi trong mô hình hồi quy đa biến tương quan mạnh với nhau.
2.3.1.2 Nguyên nhân:
Có 3 nguyên nhân gây ra vấ n đề đa cô ̣ng tuyế n:
Một là, đa cộng tuyến hoàn hảo xảy ra khi đặt mô hình sai, trên thực tế hiện tượng đa
cộng tuyến hoàn hảo ít khi xảy ra.
Hai là, đa cộng tuyến không hoàn hảo xảy ra do bản chất hiện tượng kinh tế xã hội
mà các biến độc lập đã có sẵn mối quan hệ cộng tuyến với nhau.
Ba là, đa cộng tuyến không hoàn hảo xảy ra do số liệu điều tra không đủ lớn hoặc số
liệu điều tra không ngẫu nhiên.
2.3.1.3 Hậu quả:
Thứ nhất, làm cho phương sai của hệ số hồi quy lớn, dẫn đến ước lượng thiếu chính
xác.
Thứ hai, ảnh hưởng đến giá trị se (Std. Err - sai số chuẩn của hồi quy): se(𝛽̂j) lớn thì
thống kê T nhỏ, dẫn đến kiểm định giả thuyết thiếu chính xác.
2.3.1.4 Cách phát hiê ̣n đa cộng tuyế n
Cách 1: Dùng bảng ma trận tương quan để kiểm tra đa cộng tuyến.
Bảng ma trận tương quan (correlation matrix): lệnh corr được sử dụng để tìm hệ số
tương quan r giữa các biến trong mô hình, r € [-1; 1]. Nếu các biến độc lập có tương quan
mạnh với nhau (|r(Xj,Xk)| ≥ 0.8) thì có xảy ra hiện tượng đa cộng tuyến.
Sử dụng lệnh corr, nhóm thu được kết quả như sau:
. corr wage exper educ goodhlth married service
(obs=1260)
|
wage
exper
educ goodhlth
married
service
-------------+-----------------------------------------------------wage |
1.0000
exper |
0.2346
1.0000
educ |
0.2123
-0.1862
1.0000
goodhlth |
0.0068
-0.1316
0.1071
1.0000
married |
0.1845
0.2556
-0.0477
-0.0133
1.0000
service |
-0.0537
-0.0573
0.3016
0.0499
-0.0751
1.0000
Từ kết quả trên, nhóm nhận thấy hệ số tương quan giữa các biến độc lập tương đối
thấp và đều nhỏ hơn 0.8 nên có thể kết luận mô hình không mắc lỗi đa cộng tuyến.
Cách 2: Dùng lệnh vif để kiểm tra đa cộng tuyến.
Lệnh vif (variance inflation factor – nhân tử phóng đại phương sai): nếu Mean VIF >
10 thì xảy ra hiện tượng đa cộng tuyến. Kiểm tra đa cộng tuyến bằng lệnh vif, nhóm thu
được kết quả như sau:
. vif
Variable |
VIF
1/VIF
-------------+---------------------educ |
1.14
0.875093
exper |
1.12
0.891882
service |
1.11
0.904752
married |
1.08
0.930178
goodhlth |
1.03
0.974774
-------------+---------------------Mean VIF |
1.09
Từ kết quả trên cho thấy Mean VIF < 10 nên có thể kết luận mô hình không mắc lỗi
đa cộng tuyến.
Kết luận: Từ 2 cách kiểm định trên cho thấy mô hình không mắc lỗi đa cộng tuyến.
2.3.2 Phương sai sai số thay đổi (Heteroscedasticity)
2.3.2.1 Bản chất
Vấn đề khác mà mô hình cũng có thể gặp phải là phương sai của sai số thay đổi – một
trong những lỗi phổ biến.
Các Ui có phương sai sai số thuần nhất (homoscedasticity), tức là các Ui có phương sai
giống nhau với bất kỳ giá trị nào của Xi:
𝑉𝑎𝑟(𝑈𝑖/𝑋𝑖) = 𝐸[𝑈𝑖– 𝐸 (𝑈𝑖/𝑋𝑖)]2 = 𝐸(𝑈𝑖 2 /𝑋𝑖)= 𝜎2 ; i = 1,2,3…n
Khi giả thiết đó bị vi phạm hay chính là trong trường hợp phương sai của Ui thay đổi
thì mô hình mắc lỗi phương sai sai số thay đổi.
2.3.2.2 Nguyên nhân
Có 5 nguyên nhân gây ra vấn đề phương sai sai số thay đổi:
Một là, do bản chất của các hiện tượng kinh tế: Nếu các hiện tượng kinh tế theo không
gian được điều tra trên những đối tượng có quy mô khác nhau hoặc các hiện tượng kinh tế
theo thời gian được điều tra qua các giai đoạn có mức biến động khác nhau thì phương sai
sai số có thể không đồng đều.
Hai là, do định dạng không đúng dạng hàm của mô hình: Có thể do bỏ sót biến thích
hợp hoặc dạng giải tích của hàm là sai.
Ba là, do số liệu không phản ánh đúng bản chất của hiện tượng kinh tế, chẳng hạn
xuất hiện các quan sát ngoại lai: Việc đưa vào hay loại bỏ các quan sát này ảnh hưởng rất
lớn đến phân tích hồi quy.
Bốn là, do kỹ thuật thu thập, bảo quản và xử lý số liệu được cải tiến dẫn đến sai số có
xu hướng giảm.
Năm là, do con người học được hành vi trong quá khứ.
2.3.2.3 Hậu quả
Hậu quả của phương sai sai số thay đổi là các ước lượng bình phương nhỏ nhất tuy
vẫn là không chệch nhưng không còn hiệu quả nữa và ước lượng của các phương sai sẽ bị
chệch.
Dẫn đến: Làm mất hiệu lực của kiểm định khiến cho mô hình bị kém hiệu quả.
- Xem thêm -