Đăng ký Đăng nhập
Trang chủ Các yếu tố đến mức thu nhập trung bình theo giờ của người lao động...

Tài liệu Các yếu tố đến mức thu nhập trung bình theo giờ của người lao động

.PDF
26
194
56

Mô tả:

TRƯỜNG ĐẠI HỌC NGOẠI THƯƠNG KHOA KINH TẾ QUỐC TẾ  TIỂU LUẬN MÔN KINH TẾ LƯỢNG I ĐỀ TÀI: CÁC YẾU TỐ ẢNH HƯỞNG ĐẾN THU NHẬP THEO GIỜ CỦA NGƯỜI LAO ĐỘNG Nhóm thực hiện : Nhóm 23 Danh sách thành viên : Nguyễn Anh Tú - 1614410184 Lê Anh Tuấn - 1714410236 Giảng viên : TS. Nguyễn Thu Giang Mã lớp tín chỉ : KTE218(2-1819).2 MỤC LỤC PHẦN 1 1.1 PHÂN TÍCH VÀ XÂY DỰNG MÔ HÌNH NGHIÊN CỨU ...................... 3 Mô tả tổng quan và xây dựng mô hình ................................................................. 3 1.1.1 Mô tả bộ dữ liệu ............................................................................................... 3 1.1.2 Mô hình toán học ............................................................................................. 4 1.1.3 Mô hình kinh tế lượng ...................................................................................... 4 1.2 Mô tả chi tiết các biến trong mô hình ................................................................... 6 1.2.1 Thu nhập trung bình theo giờ (wage) .............................................................. 6 1.2.2 Kinh nghiệm làm việc (exper) .......................................................................... 8 1.2.3 Trình độ học vấn (educ) ................................................................................... 9 1.2.4 Tình trạng sức khỏe (goodhlth) ...................................................................... 10 1.2.5 Tình trạng hôn nhân (married) ...................................................................... 11 1.2.6 Ngành làm việc (service) ................................................................................ 11 PHẦN 2 ƯỚC LƯỢNG MÔ HÌNH VÀ KIỂM ĐỊNH............................................. 13 2.1 Mô tả tương quan giữa biến phụ thuộc và các biến độc lập .............................. 13 2.1.1 Lập bảng tương quan ..................................................................................... 13 2.1.2 Phân tích mối quan hệ tương quan giữa các biến ......................................... 13 2.2 Chạy mô hình hồi quy và phân tích kết quả ....................................................... 14 2.2.1 Chạy mô hình hồi quy .................................................................................... 14 2.2.2 Phân tích kết quả sau khi chạy mô hình ......................................................... 15 2.3 Kiểm tra khuyết tật của mô hình ......................................................................... 17 2.3.1 Đa cộng tuyến (Multi - collinearity) .............................................................. 17 2.3.2 Phương sai sai số thay đổi (Heteroscedasticity)............................................ 19 2.4 Kiểm định giả thuyết về hệ số hồi quy ................................................................ 21 2.4.1 Kinh nghiệm làm việc (exper) ........................................................................ 21 2.4.2 Trình độ học vấn (educ) ................................................................................. 22 2.4.3 Tình trạng sức khỏe (goodhlth) ...................................................................... 22 2.4.4 Tình trạng hôn nhân (married) ...................................................................... 22 2.4.5 Ngành làm việc (service) ................................................................................ 23 2.5 Kiểm định sự phù hợp của mô hình ................................................................... 23 LỜI MỞ ĐẦU Kinh tế lượng (Econometrics) là môn khoa học xã hội trong đó các công cụ của lý thuyết kinh tế, toán học và suy đoán thống kê được áp dụng để phân tích các vấn đề kinh tế. Kinh tế lượng sử dụng các công cụ phương pháp của thống kê toán để tìm ra bản chất của các số liệu thống kê, đưa ra kết luận về các số liệu thống kê thu nhập được từ đó có thể đưa ra các dự báo về các hiện tượng kinh tế. Từ khi ra đời đến nay, kinh tế lượng đã đem lại cho các nhà kinh tế một công cụ đo lường đáng tin cậy để đo các quan hệ kinh tế. Là những sinh viên đang theo học khối ngành kinh tế, nhóm nhận thấy được sự cần thiết của việc học tập và tìm hiểu về kinh tế lượng trong việc phân tích logic và nghiên cứu vấn đề. Để hiểu sâu hơn về việc đưa kinh tế lượng vào trong thực tế cuộc sống và áp dụng kinh tế lượng sao cho đúng và hiệu quả, nhóm xin xây dựng bài báo cáo thực hành kinh tế lượng phân tích sự ảnh hưởng của một số yếu tố đến mức thu nhập trung bình theo giờ. Trong bài báo cáo nhóm đã sử dụng công cụ phân tích kinh tế lượng là phần mềm Stata để phân tích, nghiên cứu dựa trên số liệu của file dữ liệu Dataset.dta. Nguồn thu nhập của đại đa số công nhân hay người đi làm phần lớn từ việc bán sức lao động của mình để tạo thu nhập, ổn định đời sống cho mình và gia đình nên thu nhập bình quân ảnh hưởng rất lớn đến cuộc sống của người lao động nói riêng và xã hội nói chung. Vì vậy, nhóm hi vọng bài báo cáo có thể giúp những người lao động cũng như doanh nghiệp, tổ chức phần nào hiểu hơn về một số yếu tố ảnh hưởng đến thu nhập để có những quyết định đúng đắn trong tương lai. Do kiến thức còn hạn chế nên đề tài của nhóm không tránh khỏi những thiếu sót không mong muốn. Nhóm rất mong nhận được sự đóng góp ý kiến và phê bình của cô để đề tài được hoàn chỉnh hơn. NỘI DUNG PHẦN 1 PHÂN TÍCH VÀ XÂY DỰNG MÔ HÌNH NGHIÊN CỨU 1.1 Mô tả tổng quan và xây dựng mô hình 1.1.1 Mô tả bộ dữ liệu Mô tả bộ dữ liệu (file Dataset) bằng lệnh des, nhóm thu được kết quả như sau: . des storage variable name type display value format label variable label --------------------------------------------------------------------------wage float %9.0g hourly wage lwage float %9.0g log(wage) belavg byte %8.0g =1 if looks <= 2 abvavg byte %8.0g =1 if looks >=4 exper byte %8.0g years of workforce experience looks byte %8.0g from 1 to 5 union byte %8.0g =1 if union member goodhlth byte %8.0g =1 if good health black byte %8.0g =1 if black female byte %8.0g =1 if female married byte %8.0g =1 if married south byte %8.0g =1 if live in south bigcity byte %8.0g =1 if live in big city smllcity byte %8.0g =1 if live in small city service byte %8.0g =1 if service industry expersq int %8.0g exper^2 educ byte %8.0g years of schooling --------------------------------------------------------------------------- 1.1.2 Mô hình toán học Từ phần mô tả bộ trên cho thấy, có nhiều yếu tố tác động đến thu nhập trung bình theo giờ trong bộ dữ liệu như: giới tính, ngoại hình, vùng miền, nơi làm việc,… Trong phạm vi bài báo cáo, nhóm tác giả chọn các yếu tố bao gồm: kinh nghiệm làm việc, trình độ học vấn, tình trạng sức khỏe, tình trạng hôn nhân và ngành làm việc, như sau: Biến phụ thuộc: Y (wage) Biến độc lập: Xi (gồm 5 biến: X1: exper, X2: educ, X3: goodhlth, X4: married, X5: service). Thu nhập = f (kinh nghiệm làm việc, trình độ học vấn, tình trạng sức khỏe, tình trạng hôn nhân, ngành làm việc) Dạng mô hình được sử dụng là tuyến tính, nhóm xây dựng mô hình toán học đơn giản sau: Wage = βo + β1 * exper + β2 * educ + β3 * goodhlth + β4 * married + β5 * service Trong đó: β0 là hệ số chặn; β1, β2, β3, β4, β5 là các hệ số góc. 1.1.3 Mô hình kinh tế lượng Để xây dựng quan hệ đúng giữa thu nhập trung bình theo giờ, kinh nghiệm làm việc, trình độ học vấn, tình trạng sức khỏe, tình trạng hôn nhân và ngành làm việc, nhóm xét đến ảnh hưởng của các yếu tố ngẫu nhiên và có được mô hình kinh tế lượng sau: Hàm hồi quy tổng thể: PRF: Wage = βo + β1 * exper + β2 * educ + β3 * goodhlth + β4 * married + β5 * service + ui Hàm hồi quy mẫu: SRF: ̂ = 𝛽̂o + 𝛽̂1 * exper + 𝛽̂2 * educ + 𝛽̂3 * goodhlth + 𝛽̂4 * married + 𝛽̂5 * service 𝑊𝑎𝑔𝑒 Trong đó: ui là yếu tố ngẫu nhiên/nhiễu. - Mô tả dữ liệu bằng lệnh des, nhóm thu được kết quả như sau: . des wage exper educ goodhlth married service storage variable name type display value format label variable label ------------------------------------------------------------------------wage float %9.0g hourly wage exper byte %8.0g years of workforce experience educ byte %8.0g years of schooling goodhlth byte %8.0g =1 if good health married byte %8.0g =1 if married service byte %8.0g =1 if service industry Bảng 1 Giải thích các biến số sử dụng trong mô hình STT 1 1.1 2 Tên biến Ký hiệu Đơn vị wage USD Biến phụ thuộc Thu nhập Kinh nghiệm làm việc exper năm 2.2 Trình độ học vấn educ năm 2.4 2.5 - Thu nhập trung bình theo giờ Biến độc lập 2.1 2.3 Giải thích biến Tình trạng sức khỏe Tình trạng hôn nhân Ngành làm việc goodhlth married service Số năm kinh nghiệm làm việc Số năm học vấn - = 1 nếu người làm việc có sức khỏe tốt = 0 nếu người làm việc không có sức khỏe tốt - = 1 nếu người làm việc đã kết hôn = 0 nếu người làm việc chưa kết hôn - = 1 nếu làm việc trong ngành dịch vụ = 0 nếu không làm việc trong ngành dịch vụ Mô tả dữ liệu bằng lệnh sum, nhóm thu được kết quả như sau: . sum wage exper educ goodhlth married service Variable | Obs Mean Std. Dev. Min Max -------------+-------------------------------------------------------wage | 1260 6.30669 4.660639 1.02 77.72 exper | 1260 18.20635 11.96349 0 48 educ | 1260 12.56349 2.624489 5 17 goodhlth | 1260 .9333333 .2495429 0 1 married | 1260 .6912698 .462153 0 1 -------------+-------------------------------------------------------service | 1260 .2738095 .4460895 0 1 Bảng 2 Kết quả mô tả thống kê các biến số sử dụng trong mô hình Giá trị trung bình Độ lệch chuẩn Giá trị nhỏ nhất Giá trị lớn nhất Tên biến Số quan sát Wage 1260 6.30669 4.660639 1.02 77.72 Exper 1260 18.20635 11.96349 0 48 Educ 1260 12.56349 2.624489 5 17 Goodhlth 1260 0.9333333 0.2495429 0 1 Married 1260 0.6912698 0.462153 0 1 Service 1260 0.2738095 0.4460895 0 1 1.2 Mô tả chi tiết các biến trong mô hình Mô tả chi tiết dữ liệu bằng lệnh tab, nhóm thu được kết quả như sau: 1.2.1 Thu nhập trung bình theo giờ (wage) . tab wage hourly wage | Freq. Percent Cum. ------------+----------------------------------1.02 | 1 0.08 0.08 1.05 | 1 0.08 0.16 1.09 | 1 0.08 0.24 1.16 | 2 0.16 0.40 1.17 | 1 0.08 0.48 1.2 | 2 0.16 0.63 1.22 | 1 0.08 0.71 1.25 | 1 0.08 0.79 1.26 | 1 0.08 0.87 1.27 | 4 0.32 1.19 1.28 | 3 0.24 1.43 1.32 | 3 0.24 1.67 1.46 | 1 0.08 1.75 1.48 | 1 0.08 1.83 1.56 | 1 0.08 1.90 1.58 | 1 0.08 1.98 1.61 | 1 0.08 2.06 1.63 | 1 0.08 2.14 1.65 | 2 0.16 2.30 1.66 | 1 0.08 2.38 1.68 | 3 0.24 2.62 1.75 | 1 0.08 2.70 1.76 | 1 0.08 2.78 1.79 | 3 0.24 3.02 1.8 | 4 0.32 3.33 1.82 | 1 0.08 3.41 1.83 | 2 0.16 3.57 1.88 | 2 0.16 3.73 1.92 | 13 1.03 4.76 ---more--- Như vậy, nhóm nhận thấy: Thu nhập bình quân được tính theo giờ (hourly wage), dao động từ 1.02 đến 77.72 USD/giờ. Tần suất xuất hiện (Freq.) khác nhau, trong đó, thu nhập bình quân 3.75 USD/giờ là phổ biến nhất, xuất hiện 36 lần với tỷ lệ (percent) 2.86%. Phần trăm tích lũy (Cum.) cho thấy 60.79% trong 1260 người được quan sát có thu nhập bình quân theo giờ < 6.30669USD/giờ (giá trị trung bình). 1.2.2 Kinh nghiệm làm việc (exper) . tab exper years of | workforce | experience | Freq. Percent Cum. ------------+----------------------------------0 | 4 0.32 0.32 1 | 19 1.51 1.83 2 | 23 1.83 3.65 3 | 45 3.57 7.22 4 | 42 3.33 10.56 5 | 59 4.68 15.24 6 | 29 2.30 17.54 7 | 52 4.13 21.67 8 | 46 3.65 25.32 9 | 41 3.25 28.57 10 | 68 5.40 33.97 11 | 37 2.94 36.90 12 | 55 4.37 41.27 13 | 37 2.94 44.21 14 | 31 2.46 46.67 15 | 44 3.49 50.16 16 | 30 2.38 52.54 17 | 25 1.98 54.52 18 | 46 3.65 58.17 19 | 25 1.98 60.16 20 | 43 3.41 63.57 21 | 15 1.19 64.76 22 | 19 1.51 66.27 23 | 26 2.06 68.33 24 | 25 1.98 70.32 25 | 27 2.14 72.46 26 | 26 2.06 74.52 27 | 19 1.51 76.03 28 | 24 1.90 77.94 29 | 16 1.27 79.21 30 | 24 1.90 81.11 31 | 17 1.35 82.46 32 | 15 1.19 83.65 33 | 13 1.03 84.68 34 | 19 1.51 86.19 35 | 25 1.98 88.17 36 | 17 1.35 89.52 37 | 18 1.43 90.95 38 | 14 1.11 92.06 39 | 9 0.71 92.78 40 | 28 2.22 95.00 41 | 11 0.87 95.87 42 | 18 1.43 97.30 43 | 7 0.56 97.86 44 | 14 1.11 98.97 45 | 6 0.48 99.44 46 | 2 0.16 99.60 47 | 3 0.24 99.84 48 | 2 0.16 100.00 ------------+----------------------------------Total | 1,260 100.00 Như vậy, nhóm nhận thấy: Số năm kinh nghiệm làm việc (years of workforce experience) dao động từ 0 đến 48 năm. Tần suất xuất hiện (Freq.) khác nhau, trong đó, 10 năm kinh nghiệm là phổ biến nhất, xuất hiện 68 lần ở tỷ lệ (percent) 5.40%. Phần trăm tích lũy (Cum.) cho thấy 58.17% trong 1260 người được quan sát có kinh nghiệm làm việc < 18.20635 năm (giá trị trung bình). 1.2.3 Trình độ học vấn (educ) . tab educ years of | schooling | Freq. Percent Cum. ------------+----------------------------------5 | 42 3.33 3.33 8 | 44 3.49 6.83 10 | 156 12.38 19.21 12 | 468 37.14 56.35 13 | 246 19.52 75.87 14 | 51 4.05 79.92 16 | 121 9.60 89.52 17 | 132 10.48 100.00 ------------+----------------------------------Total | 1,260 100.00 Như vậy, nhóm nhận thấy: Số năm học vấn (years of schooling) dao động từ 5 đến 17 năm. Tần suất xuất hiện (Freq.) khác nhau, trong đó, 12 năm học là phổ biến nhất, xuất hiện 468 lần ở tỷ lệ (percent) 37.14%. Phần trăm tích lũy (Cum.) cho thấy 56.35% trong 1260 người được quan sát có trình độ học vấn với số năm học < 12.56349 năm (giá trị trung bình). 1.2.4 Tình trạng sức khỏe (goodhlth) . tab goodhlth =1 if good | health | Freq. Percent Cum. ------------+----------------------------------0 | 84 6.67 6.67 1 | 1,176 93.33 100.00 ------------+----------------------------------Total | 1,260 100.00 Như vậy, nhóm nhận thấy: Biến giả goodhlth nhận giá trị = 1 nếu người làm việc có sức khỏe tốt (=1 if good health). Tần suất xuất hiện (Freq.): 1176 lần trong 1260 quan sát, chiếm phần lớn số quan sát (percent), lên tới 93.33%. Biến giả goodhlth nhận giá trị = 0 nếu người làm việc không có sức khỏe tốt. Tần suất xuất hiện (Freq.): chỉ xuất hiện 84 lần trong 1260 quan sát và chiếm (percent) 6.67%. 1.2.5 Tình trạng hôn nhân (married) . tab married =1 if | married | Freq. Percent Cum. ------------+----------------------------------0 | 389 30.87 30.87 1 | 871 69.13 100.00 ------------+----------------------------------Total | 1,260 100.00 Như vậy, nhóm nhận thấy: Biến giả married nhận giá trị = 1 nếu người làm việc đã kết hôn (=1 if married). Tần suất xuất hiện (Freq.): 871 lần trong 1260 quan sát, cũng chiếm trên 50% số quan sát (percent), lên tới 69.13%. Biến giả married nhận giá trị = 0 nếu người làm việc không có sức khỏe tốt. Tần suất xuất hiện (Freq.): chỉ xuất hiện 389 lần trong 1260 quan sát và chiếm (percent) 30.87%. 1.2.6 Ngành làm việc (service) . tab service =1 if | service | industry | Freq. Percent Cum. ------------+----------------------------------0 | 915 72.62 72.62 1 | 345 27.38 100.00 ------------+----------------------------------Total | 1,260 Như vậy, nhóm nhận thấy: 100.00 Biến giả service nhận giá trị = 1 nếu làm việc trong ngành dịch vụ (=1 if service industry). Tần suất xuất hiện (Freq.): chỉ xuất hiện 345 lần trong 1260 quan sát, chiếm dưới 30% số quan sát (percent): 27.38%. Biến giả service nhận giá trị = 0 nếu không làm việc trong ngành dịch vụ. Tần suất xuất hiện (Freq.): tới 915 lần trong 1260 quan sát và chiếm (percent) cao: 72.62%. PHẦN 2 ƯỚC LƯỢNG MÔ HÌNH VÀ KIỂM ĐỊNH 2.1 Mô tả tương quan giữa biến phụ thuộc và các biến độc lập 2.1.1 Lập bảng tương quan Trước khi chạy mô hình hồi quy, nhóm xem xét mối quan hệ tương quan giữa các biến bằng cách sử dụng lệnh corr, thu được kết quả như sau: . corr wage exper educ goodhlth married service (obs=1260) | wage exper educ goodhlth married service -------------+-----------------------------------------------------wage | 1.0000 exper | 0.2346 1.0000 educ | 0.2123 -0.1862 1.0000 goodhlth | 0.0068 -0.1316 0.1071 1.0000 married | 0.1845 0.2556 -0.0477 -0.0133 1.0000 service | -0.0537 -0.0573 0.3016 0.0499 -0.0751 1.0000 Như vậy, nhóm nhận thấy: Các biến độc lập có tương quan với biến phụ thuộc nhưng không cao. Hầu hết các biến độc lập đều có hệ số tương quan dương, cho thấy tác động cùng chiều lên biến phụ thuộc, riêng biến service có hệ số tương quan âm, cho thấy tác động ngược chiều lên biến phụ thuộc. Các biến độc lập có tương quan với nhau và mối quan hệ tương quan giữa các biến độc lập với nhau cũng không cao, hệ số tương quan cao nhất chỉ là 0,3016 (giữa biến educ và service). Không có hệ số tương quan nào có độ lớn vượt quá 0.8, bởi vậy nhóm dự đoán mô hình không xảy ra hiện tượng đa cộng tuyến. 2.1.2 Phân tích mối quan hệ tương quan giữa các biến Từ bảng tương quan trên có thể thấy: - Hệ số tương quan giữa biến wage và exper là: r(wage, exper)= 0.2346 nên kỳ vọng dấu của 𝛽̂1 dương. - Hệ số tương quan giữa biến wage và educ là: r(wage, educ)= 0.2123 nên kỳ vọng dấu của 𝛽̂2 dương. - Hệ số tương quan giữa biến wage và goodhlth là: r(wage, goodhlth)= 0.0068 nên kỳ vọng dấu của 𝛽̂3 dương. - Hệ số tương quan giữa biến wage và married là: r(wage, married)= 0.1845 nên kỳ vọng dấu của 𝛽̂4 dương. - Hệ số tương quan giữa biến wage và service là: r(wage, service)= -0.0537 nên kỳ vọng dấu của 𝛽̂5 âm. Như vậy, trong các nhân tố được nghiên cứu, biến exper có mối tương quan mạnh nhất đến wage, hay kinh nghiệm làm việc có ảnh hưởng nhiều đến thu nhập bình quân theo giờ. Hệ số tương quan giữa 2 biến mang dấu dương thể hiện mối quan hệ cùng chiều giữa 2 biến nên nếu kinh nghiệm làm việc tăng thì thu nhập bình quân theo giờ cũng tăng. Ngược lại, biến goodhlth ảnh hưởng ít nhất đến wage, hay tình trạng sức khỏe không ảnh hưởng nhiều đến thu nhập bình quân theo giờ như các yếu tố khác. Hệ số tương quan giữa 2 biến mang dấu dương thể hiện mối quan hệ cùng chiều giữa 2 biến, nếu tình trạng sức khỏe tốt thì thu nhập bình quân theo giờ sẽ cao hơn người không có tình trạng sức khỏe tốt nhưng không cao hơn nhiều. Biến service ảnh hưởng ngược chiều đến biến wage, hệ số tương quan giữa hai biến mang dấu âm thể hiện nếu làm việc trong ngành dịch vụ thì thu nhập bình quân theo giờ sẽ thấp hơn không làm việc trong ngành dịch vụ. Ngoài ra, vì giá trị tuyệt đối của các chỉ số đều nhỏ hơn 0.8 nên nhóm dự đoán được mô hình không xảy ra hiện tượng đa cộng tuyến. 2.2 Chạy mô hình hồi quy và phân tích kết quả 2.2.1 Chạy mô hình hồi quy Chạy mô hình hồi quy bằng lệnh reg, nhóm thu được kết quả như sau: . reg wage exper educ goodhlth married service Source | SS df MS -------------+-----------------------------Model | 4184.10271 5 836.820542 Number of obs = F( 5, 1254) = Prob > F = 1260 45.30 0.0000 Residual | 23163.3365 1254 18.4715602 R-squared -------------+-----------------------------Total | 27347.4392 1259 21.7215561 = 0.1530 Adj R-squared = 0.1496 Root MSE 4.2979 = -------------------------------------------------------------------------wage | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------exper | .0988369 .0107208 9.22 0.000 .0778042 .1198696 educ | .533433 .0493363 10.81 0.000 .4366421 .6302239 goodhlth | .2928497 .4916339 0.60 0.552 -.6716659 1.257365 married | 1.261672 .2717504 4.64 0.000 .7285364 1.794808 service | -1.265254 .2854645 -4.43 0.000 -1.825295 -.7052133 _cons | -2.993594 .8074974 -3.71 0.000 -4.577789 -1.409399 -------------------------------------------------------------------------- Từ đó, có được bảng số liệu sau: Bảng 3 Kết quả chạy mô hình hồi quy Tên biến Hệ số tự do Exper Educ Goodhlth Married Service Hệ số hồi quy -2.993594 0.0988369 0.533433 0.2928497 1.261672 -1.265254 Thống kê t -3.71 9.22 10.81 0.60 4.64 -4.43 P-value 0.000 0.000 0.000 0.552 0.000 0.000 Khoảng tin cậy [-4.577789; -1.409399] [0.778042; 0.1198696] [0.4366421; 0.6302239] [-0.6716659; 1.257365] [0.7285364; 1.794808] [-4.577789; -1.409399] Như vậy, có được hàm hồi quy mẫu: SRF: ̂ = -2.993594 + 0.0988369 * exper + 0.533433 * educ + 0.2928497 * goodhlth + 𝑊𝑎𝑔𝑒 1.261672 * married – 1.265254 * service 2.2.2 Phân tích kết quả sau khi chạy mô hình Số quan sát (n): Obs = 1260. Tổng bình phương sai số được giải thích: SSE = 4184.10271. Tổng bình phương các phần dư: SSR = 23163.3365. Tổng bình phương sai số tổng cộng: SST = 27347.4392. Bậc tự do của phần được giải thích (k): Dfm = 5. Bậc tự do của phần dư: Dfr =1254. Hệ số xác định: R2 (đo mức độ phù hợp của hàm hồi quy mẫu, cho biết % sự biến động của Y được giải thích bởi các biến số Xi trong mô hình) = 0.1530 có nghĩa là các biến Xi trong mô hình giải thích được 15.30% sự dao động của biến Y hay các biến số kinh nghiệm làm việc, trình độ học vấn, tình trạng sức khỏe, tình trạng hôn nhân và ngành làm việc giải thích được 15.30% sự dao động của biến thu nhập trung bình theo giờ. Hệ số xác định điều chỉnh: 𝑅2 = 0.1496. Ý nghĩa của các hệ số hồi quy trong mô hình: β0 = -2.993594 nghĩa là khi giá tri ̣của các biến độc lập đều bằng 0 thì thu nhập trung bình theo giờ là -2.993594 USD; β1 = 0.0988369 > 0 nghĩa là mỗi một năm kinh nghiệm làm việc tăng thêm sẽ làm thu nhập trung bình theo giờ tăng 0.0988369 USD với điều kiện các yếu tố khác không đổi; β2 = 0.533433 > 0 nghĩa là mỗi một năm học tăng thêm sẽ làm thu nhập trung bình theo giờ tăng 0.533433 USD với điều kiện các yếu tố khác không đổi; 𝛽3 = 0.2928497 > 0 nghĩa là thu nhập trung bình theo giờ của người có tình trạng sức khỏe tốt cao hơn của người có tình trạng sức khỏe không tốt là 0.2928497 với điều kiện các yếu tố khác không đổi; β4 = 1.261672 > 0 nghĩa là thu nhập trung bình theo giờ của người đã kết hôn cao hơn của người chưa kết hôn là 1.261672 USD với điều kiện các yếu tố khác không đổi; β5 = -1.265254 < 0 nghĩa là thu nhập trung bình theo giờ của người làm trong ngành dịch vụ thấp hơn của người không làm trong ngành dịch vụ là 1.265254 USD với điều kiện các yếu tố khác không đổi. 2.3 Kiểm tra khuyết tật của mô hình 2.3.1 Đa cộng tuyến (Multi - collinearity) 2.3.1.1 Bản chấ t: Theo định lý Gauss - Markov, một ước lượng theo phương pháp OLS có các tính chất: tuyến tính, không chệch, tốt nhất (BLUE). Tuy nhiên, trên thực tế do xây dựng sai mô hình hoặc do bản chất của dữ liệu dẫn tới mô hình không đạt được đầy đủ các tính chất trên. Một trong những vấn đề ảnh hưởng đến mô hình mà được coi là vi phạm các giả định, là đa cộng tuyến. Đa cộng tuyến là một lỗi của mô hình phân tích hồi quy, xảy ra khi các biến độc lập Xi trong mô hình hồi quy đa biến tương quan mạnh với nhau. 2.3.1.2 Nguyên nhân: Có 3 nguyên nhân gây ra vấ n đề đa cô ̣ng tuyế n: Một là, đa cộng tuyến hoàn hảo xảy ra khi đặt mô hình sai, trên thực tế hiện tượng đa cộng tuyến hoàn hảo ít khi xảy ra. Hai là, đa cộng tuyến không hoàn hảo xảy ra do bản chất hiện tượng kinh tế xã hội mà các biến độc lập đã có sẵn mối quan hệ cộng tuyến với nhau. Ba là, đa cộng tuyến không hoàn hảo xảy ra do số liệu điều tra không đủ lớn hoặc số liệu điều tra không ngẫu nhiên. 2.3.1.3 Hậu quả: Thứ nhất, làm cho phương sai của hệ số hồi quy lớn, dẫn đến ước lượng thiếu chính xác. Thứ hai, ảnh hưởng đến giá trị se (Std. Err - sai số chuẩn của hồi quy): se(𝛽̂j) lớn thì thống kê T nhỏ, dẫn đến kiểm định giả thuyết thiếu chính xác. 2.3.1.4 Cách phát hiê ̣n đa cộng tuyế n Cách 1: Dùng bảng ma trận tương quan để kiểm tra đa cộng tuyến. Bảng ma trận tương quan (correlation matrix): lệnh corr được sử dụng để tìm hệ số tương quan r giữa các biến trong mô hình, r € [-1; 1]. Nếu các biến độc lập có tương quan mạnh với nhau (|r(Xj,Xk)| ≥ 0.8) thì có xảy ra hiện tượng đa cộng tuyến. Sử dụng lệnh corr, nhóm thu được kết quả như sau: . corr wage exper educ goodhlth married service (obs=1260) | wage exper educ goodhlth married service -------------+-----------------------------------------------------wage | 1.0000 exper | 0.2346 1.0000 educ | 0.2123 -0.1862 1.0000 goodhlth | 0.0068 -0.1316 0.1071 1.0000 married | 0.1845 0.2556 -0.0477 -0.0133 1.0000 service | -0.0537 -0.0573 0.3016 0.0499 -0.0751 1.0000 Từ kết quả trên, nhóm nhận thấy hệ số tương quan giữa các biến độc lập tương đối thấp và đều nhỏ hơn 0.8 nên có thể kết luận mô hình không mắc lỗi đa cộng tuyến. Cách 2: Dùng lệnh vif để kiểm tra đa cộng tuyến. Lệnh vif (variance inflation factor – nhân tử phóng đại phương sai): nếu Mean VIF > 10 thì xảy ra hiện tượng đa cộng tuyến. Kiểm tra đa cộng tuyến bằng lệnh vif, nhóm thu được kết quả như sau: . vif Variable | VIF 1/VIF -------------+---------------------educ | 1.14 0.875093 exper | 1.12 0.891882 service | 1.11 0.904752 married | 1.08 0.930178 goodhlth | 1.03 0.974774 -------------+---------------------Mean VIF | 1.09 Từ kết quả trên cho thấy Mean VIF < 10 nên có thể kết luận mô hình không mắc lỗi đa cộng tuyến. Kết luận: Từ 2 cách kiểm định trên cho thấy mô hình không mắc lỗi đa cộng tuyến. 2.3.2 Phương sai sai số thay đổi (Heteroscedasticity) 2.3.2.1 Bản chất Vấn đề khác mà mô hình cũng có thể gặp phải là phương sai của sai số thay đổi – một trong những lỗi phổ biến. Các Ui có phương sai sai số thuần nhất (homoscedasticity), tức là các Ui có phương sai giống nhau với bất kỳ giá trị nào của Xi: 𝑉𝑎𝑟(𝑈𝑖/𝑋𝑖) = 𝐸[𝑈𝑖– 𝐸 (𝑈𝑖/𝑋𝑖)]2 = 𝐸(𝑈𝑖 2 /𝑋𝑖)= 𝜎2 ; i = 1,2,3…n Khi giả thiết đó bị vi phạm hay chính là trong trường hợp phương sai của Ui thay đổi thì mô hình mắc lỗi phương sai sai số thay đổi. 2.3.2.2 Nguyên nhân Có 5 nguyên nhân gây ra vấn đề phương sai sai số thay đổi: Một là, do bản chất của các hiện tượng kinh tế: Nếu các hiện tượng kinh tế theo không gian được điều tra trên những đối tượng có quy mô khác nhau hoặc các hiện tượng kinh tế theo thời gian được điều tra qua các giai đoạn có mức biến động khác nhau thì phương sai sai số có thể không đồng đều. Hai là, do định dạng không đúng dạng hàm của mô hình: Có thể do bỏ sót biến thích hợp hoặc dạng giải tích của hàm là sai. Ba là, do số liệu không phản ánh đúng bản chất của hiện tượng kinh tế, chẳng hạn xuất hiện các quan sát ngoại lai: Việc đưa vào hay loại bỏ các quan sát này ảnh hưởng rất lớn đến phân tích hồi quy. Bốn là, do kỹ thuật thu thập, bảo quản và xử lý số liệu được cải tiến dẫn đến sai số có xu hướng giảm. Năm là, do con người học được hành vi trong quá khứ. 2.3.2.3 Hậu quả Hậu quả của phương sai sai số thay đổi là các ước lượng bình phương nhỏ nhất tuy vẫn là không chệch nhưng không còn hiệu quả nữa và ước lượng của các phương sai sẽ bị chệch. Dẫn đến: Làm mất hiệu lực của kiểm định khiến cho mô hình bị kém hiệu quả.
- Xem thêm -

Tài liệu liên quan

thumb
Năng lượng gió...
130
78479
145