Đăng ký Đăng nhập
Trang chủ Báo cáo thực hành kinh tế lượng...

Tài liệu Báo cáo thực hành kinh tế lượng

.DOCX
27
350
83

Mô tả:

TRƯỜNG ĐẠI HỌC NGOẠI THƯƠNG KHOA KINH TẾ QUỐC TẾ =====000===== BÁO CÁO KINH TẾ LƯỢNG NHÓM 13: THỰC HIỆN NGHIÊN CỨU BỘ SỐ LIỆU 13_CRIME2 Giảng viên hướng dẫn: TS. Đinh Thị Thanh Bình Nhóm sinh viên thực hiện: 1. Đỗ Trung Hiếu 2. Nguyễn Thị Thanh Hoa 3. Nguyễn Việt Hoa (Nhóm trưởng) 4. Bùi Ngọc Hoa - 1311160050 - 1311110252 - 1311110253 - 1311110258 - 25% - 25% - 30% - 20% HÀ NỘI – THÁNG 12 NĂM 2014 1 MỤC LỤC LỜI MỞ ĐẦU.............................................................................................................................3 NỘI DUNG.................................................................................................................................4 I. MÔ TẢ SỐ LIỆU................................................................................................................4 1. Mô tả tổng quan...............................................................................................................4 2. Mô tả chi tiết các biến trong mô hình.............................................................................6 II. PHÂN TÍCH HỒI QUY....................................................................................................12 1. Phương trình hồi quy tuyến tính...................................................................................12 2. Lập bảng tương quan và phân tích mối quan hệ tương quan giữa các biến...............12 3. 2.1. Lập bảng tương quan..................................................................................................12 2.2. Phân tích mối quan hệ tương quan giữa các biến....................................................13 Chạy mô hình hồi quy và phân tích kết quả.................................................................13 3.1. Chạy mô hình hồi quy.................................................................................................13 3.2. Phân tích kết quả sau khi chạy mô hình....................................................................14 4. Kiểm định giả thuyết về hệ số hồi quy..........................................................................15 5. Một số kiểm định F........................................................................................................18 6. 7. 5.1. Kiểm định sự phù hợp của mô hình...........................................................................18 5.2. Kiểm định đa ràng buộc tuyến tính............................................................................18 Kiểm tra khuyết tật của mô hình..................................................................................19 6.1. Đa cộng tuyến..............................................................................................................19 6.2. Phương sai sai số thay đổi..........................................................................................21 Sửa lỗi mô hình..............................................................................................................23 KẾT LUẬN...............................................................................................................................25 2 LỜI MỞ ĐẦU Kinh tế lượng (Econometrics) là môn khoa học xã hô ôi trong đó các công cụ của ly thuyết kinh tế, toán học và suy đoán thống kê được áp dụng để phân tích các vấn đề kinh tế. Kinh tế lượng sử dụng các công cụ phương pháp của thống kê toán để tìm ra bản chất của các số liê uô thống kê, đưa ra kết luâ nô về các số liê ôu thống kê thu thâ ôp được từ đó có thể đưa ra các dự báo về các hiê nô tượng kinh tế. Từ khi ra đời đến nay, kinh tế lượng đã đem lại cho các nhà kinh tế mô ôt công cụ đo lường sắc bén để đo các quan hê ô kinh tế. Là những sinh viên đang theo học khối ngành kinh tế, chúng em nhâ nô thấy được sự cần thiết của viê ôc học tâ ôp và tìm hiểu về Kinh tế lượng trong viê ôc phân tích logic và nghiên cứu vấn đề. Để hiểu sâu hơn về viê ôc đưa Kinh tế lượng vào trong thực tế cuô ôc sống và áp dụng Kinh tế lượng sao cho đúng và hiê uô quả, nhóm em xin xây dựng bài BÁO CÁO THỰC HÀNH KINH TẾ LƯỢNG dưới sự hướng dẫn của TS. Đinh Thị Thanh Bình. Trong bài báo cáo, nhóm đã em sử dụng công cụ phân tích kinh tế lượng là phần mềm stata để phân tích, nghiên cứu dựa trên số liệu của file dữ liệu: 13_CRIME2.DTA: "Phân tích sự ảnh hưởng của một số yếu tố đến tổng số vụ phạm tội.” Chúng em xin chân thành cảm ơn giảng viên hướng dẫn – TS. Đinh Thị Thanh Bình đã giúp đỡ chúng em thực hiện bài báo cáo này. Trong quá trình làm bài báo cáo, dù đã rất cố gắng nhưng chắc chắn chúng em không thể tránh khỏi những sai sót, kính mong được cô góp y để nhóm chúng em có thể hoàn thiện hơn bản báo cáo này. 3 NỘI DUNG I. MÔ TẢ SỐ LIỆU 1. Mô tả tổng quan Trong bối cảnh xã hội ngày càng phát triển với tốc độ đô thị hóa cao cũng như việc đất nước mạnh dạn mở cửa để tiếp thu với các nền văn hóa khác nhau thì tình trạng vi phạm pháp luật ngày càng trở thành một vấn đề đáng lo ngại. Có rất nhiều yếu tố tác động đến tổng số vụ phạm tội. Sau khi xem xét y nghĩa của từng biến trong file số liệu 13_CRIME2.DTA, nhóm em đã quyết định chọn mô hình hồi quy gồm các biến sau:  Biến phụ thuộc: Y: crimes  Biến độc lập: gồm 5 biến:  X1: south  X2: area  X3: popden  X4: lawexpc  X5: polpc Mô tả dữ liệu bẳng lệnh des, ta thu được kết quả như sau: . des crimes south area popden lawexpc polpc storage variable name type display format crimes south area popden lawexpc polpc %9.0g %9.0g %9.0g %9.0g %9.0g %9.0g float byte float float float float Ta có bảng sau: Tên biến Đơn vị tính crimes Vụ án south - area popden lawexpc dặm vuông người/dặm vuông $ value label variable label total number index crimes =1 if city in south land area, square miles people per sq mile law enforce. expend. pc, $ police per 1000 people Ý nghĩa biến Tổng số vụ phạm tội = 1 nếu người phạm tội sống ở phía nam = 0 nếu người phạm tội sống ở những vùng khác Diện tích vùng đất khảo sát Mật độ dân số trên 1 dặm vuông Chi phí thực thi pháp luật bình quân đầu người 4 polpc Cảnh sát Số lượng cảnh sát trên 1000 người dân Tiếp tục sử dụng lệnh sum để mô tả dữ liệu. Lệnh sum cho biết số lượng quan sát (Obs), giá trị trung bình (mean), độ lệch chuẩn (std. dev.) cũng như giá trị lớn nhất (max) và nhỏ nhất (min) của các biến. . sum crimes south area popden lawexpc polpc Variable Obs Mean crimes south area popden lawexpc 92 92 92 92 92 39663.53 .326087 122.7304 4984.489 958.643 polpc 92 2.251738 Std. Dev. Min Max 29692.1 .4713482 125.5295 3172.98 313.88 4124 0 13 703.7964 377.54 164452 1 604 16550.28 2262.44 .6315045 1.283939 4.619234 Dựa theo kết quả trên, ta có bảng tổng hợp sau: Tên biến Số quan sát Giá trị trung bình Độ lệch chuẩn Giá trị nhỏ nhất Giá trị lớn nhất crimes 92 39663.53 29692.1 4124 164452 south 92 0.326087 0.4713482 0 1 area 92 122.7304 125.5295 13 604 popden 92 4984.489 3172.98 703.7964 16550.28 lawexpc 92 958.643 313.88 377.54 2262.44 polp 92 2.251738 0.6315045 1.283939 4.619234 Có thể nhận thấy biến tổng số vụ phạm tội có sự chênh lệch khá lớn giữa mức cao nhất và mức thấp nhất, lên tới xấp xỉ 40 lần, cao hơn hẳn so với các biến còn lại. 2. Mô tả chi tiết các biến trong mô hình Để mô tả chi tiết các biến đã chọn, ta dùng lệnh tab. 5 Sử dụng lệnh tab cho phép miêu tả các biến với các thông tin tần suất (Freq.), phần trăm (Percent), phần trăm tích lũy cộng phần trăm từ trên xuống (Cum.) a) Crimes (tổng số tội phạm) . tab crimes total number index crimes Freq. Percent Cum. 4124 5276 5596 5708 6533 7207 8511 11648 13122 13188 14537 15233 15698 15931 16806 16953 17136 17306 18703 18915 19082 19438 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1.09 1.09 1.09 1.09 1.09 1.09 1.09 1.09 1.09 1.09 1.09 1.09 1.09 1.09 1.09 1.09 1.09 1.09 1.09 1.09 1.09 1.09 1.09 2.17 3.26 4.35 5.43 6.52 7.61 8.70 9.78 10.87 11.96 13.04 14.13 15.22 16.30 17.39 18.48 19.57 20.65 21.74 22.83 23.91 more − Tổng số vụ phạm tội dao động từ 4124 vụ án đến 164452 vụ án. Tất cả các giá trị số vụ phạm tội đều chiếm tỉ trọng như nhau là 1.09%. − Có 23.91% trong tổng số 92 số quan sát mà tổng số vụ phạm tội ≤ 19438 vụ án. 6 b) Vùng miền (south) . tab south =1 if city in south Freq. Percent Cum. 0 1 62 30 67.39 32.61 67.39 100.00 Total 92 100.00  Biến giả south nhận giá trị = 1 nếu người phạm tội sống ở phía nam, xuất hiện 30 lần chiếm 32.61%  Biến giả south nhận giá trị = 0 nếu người phạm tội không sống ở phía nam, xuất hiện 62 lần chiếm 67.39%  Nhìn chung, số lượng người phạm tội sống ở phía nam chiếm tỉ lệ thấp hơn so với số lượng người phạm tội sống ở những vùng khác trong mối quan hệ với tổng số vụ phạm tội. c) Diện tích đất (area) 7 . tab area land area, square miles Freq. Percent Cum. 13 17.8 18.9 20.8 21.9 24.1 24.2 25.3 27.4 34.2 34.3 41.8 44.6 46.4 49.8 52.9 53 54.4 55.1 55.3 55.4 55.9 61.1 74 78 79 95.8 97.3 100.5 104.2 106.8 113.9 131.2 135.6 169.2 186.8 199.4 255.9 258.5 264.1 316.4 329 331.4 352 375 604 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2.17 2.17 2.17 2.17 2.17 2.17 2.17 2.17 2.17 2.17 2.17 2.17 2.17 2.17 2.17 2.17 2.17 2.17 2.17 2.17 2.17 2.17 2.17 2.17 2.17 2.17 2.17 2.17 2.17 2.17 2.17 2.17 2.17 2.17 2.17 2.17 2.17 2.17 2.17 2.17 2.17 2.17 2.17 2.17 2.17 2.17 2.17 4.35 6.52 8.70 10.87 13.04 15.22 17.39 19.57 21.74 23.91 26.09 28.26 30.43 32.61 34.78 36.96 39.13 41.30 43.48 45.65 47.83 50.00 52.17 54.35 56.52 58.70 60.87 63.04 65.22 67.39 69.57 71.74 73.91 76.09 78.26 80.43 82.61 84.78 86.96 89.13 91.30 93.48 95.65 97.83 100.00 Total 92 100.00 8 − Diện tích vùng đất khảo sát dao động từ 13 dặm vuông đến 604 dặm vuông. Mỗi giá trị đều xuất hiện 2 lần với tỉ lệ như nhau là 2.17%. − Có 63.04% trong tổng số 92 số quan sát mà diện tích đất ≤ 100.5 dặm vuông. d) Mật độ dân số trên 1 dặm vuông (popden) . tab popden people per sq mile 703.7964 730.8079 1050.75 1314.366 1329.261 1359.923 1404.494 1426.666 1590.438 1596.368 1672.36 1727.662 2170.811 2220.036 2385.081 2488.472 2497.993 2498.724 2570.054 2700.385 2725.987 2743.34 2755.948 2793.656 more Freq. Percent Cum. 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1.09 1.09 1.09 1.09 1.09 1.09 1.09 1.09 1.09 1.09 1.09 1.09 1.09 1.09 1.09 1.09 1.09 1.09 1.09 1.09 1.09 1.09 1.09 1.09 1.09 2.17 3.26 4.35 5.43 6.52 7.61 8.70 9.78 10.87 11.96 13.04 14.13 15.22 16.30 17.39 18.48 19.57 20.65 21.74 22.83 23.91 25.00 26.09 − Mật độ dân số trên 1 dặm vuông dao động và trải đều từ 703.7964 đến 16550.28 người/dặm vuông. Mỗi giá trị chỉ xuất hiện 1 lần với tỉ lệ như nhau là 1.09%. − Có 26.09% trong tổng số 92 số quan sát mà mật độ dân số ≤ 2793.656 người/dặm vuông. 9 e) Chi phí thực thi pháp luật bình quân đầu người (lawexpc) . tab lawexpc law enforce. expend. pc, $ 377.54 554.7 556.8 570 570.63 582.56 586.72 608.44 635.7 641.55 655.1799 660.15 660.3 661.5 668.1 671.56 672.75 702.96 710.52 714 726.45 731.64 more Freq. Percent Cum. 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1.09 1.09 1.09 1.09 1.09 1.09 1.09 1.09 1.09 1.09 1.09 1.09 1.09 1.09 1.09 1.09 1.09 1.09 1.09 1.09 1.09 1.09 1.09 2.17 3.26 4.35 5.43 6.52 7.61 8.70 9.78 10.87 11.96 13.04 14.13 15.22 16.30 17.39 18.48 19.57 20.65 21.74 22.83 23.91 − Chi phí thực thi pháp luật bình quân đầu người dao động và trải đều từ 377.54$ đến 2262.44$. Mỗi giá trị chỉ xuất hiện một lần với tỉ lệ như nhau là 1.09%. − Có 23.91% trong tổng số 92 số quan sát mà chi phí thực thi pháp luật bình quân đầu người ≤ 731.64$. 10 f) Số lượng cảnh sát trên 1000 người (popden) . tab polpc police per 1000 people 1.283939 1.300569 1.350198 1.351552 1.366975 1.388133 1.420306 1.434222 1.478796 1.481664 1.487614 1.515053 1.517768 1.568048 1.577169 1.608299 1.632377 1.685959 1.688117 1.697174 1.737621 1.74235 1.747294 1.764359 more Freq. Percent Cum. 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1.09 1.09 1.09 1.09 1.09 1.09 1.09 1.09 1.09 1.09 1.09 1.09 1.09 1.09 1.09 1.09 1.09 1.09 1.09 1.09 1.09 1.09 1.09 1.09 1.09 2.17 3.26 4.35 5.43 6.52 7.61 8.70 9.78 10.87 11.96 13.04 14.13 15.22 16.30 17.39 18.48 19.57 20.65 21.74 22.83 23.91 25.00 26.09 − Số cảnh sát trên 1000 người dân dao động trong khoảng 1.283939% đến 4.619234%. Mỗi giá trị chỉ xuất hiện một lần với tỉ lệ như nhau là 1.09%. − Có 26.09% trong tổng số 92 số quan sát mà số cảnh sát trên 1000 người dân ≤ 1.764359%. 11 II. PHÂN TÍCH HỒI QUY 1. Phương trình hồi quy tuyến tính Chọn biến phụ thuộc Y là crimes, các biến độc lập X1, X2, X3, X4, X5, X6 lần lượt là unem, pcinc, area, popden, lawexpc, polpc. Ta có:  Hàm hồi quy tổng thể: (PRF): crimes = β0 + β1south + β2area + β3popden + β4lawexpc + β5polpc + ui  Hàm hồi quy mẫu:  (SRF): crimes =      β 0 + β 1 south + β 2 area + β 3 popden + β 4 lawexpc +  β 5 polpc Trong đó: ui là yếu tố ngẫu nhiên (nhiễu). 2. Lập bảng tương quan và phân tích mối quan hệ tương quan giữa các biến 2.1. Lập bảng tương quan Trước khi chạy mô hình hồi quy, chúng ta xem xét mức độ tương quan giữa các biến bằng cách sử dụng lệnh corr crimes south area popden lawexpc polpc. Ta thu được bảng tương quan giữa các biến như sau: . corr crimes south area popden lawexpc polpc (obs=92) crimes south area popden lawexpc polpc crimes south area popden lawexpc polpc 1.0000 0.0600 0.4801 0.0477 0.2322 0.3304 1.0000 0.2163 -0.2847 -0.2294 -0.0586 1.0000 -0.5490 -0.2358 -0.2109 1.0000 0.3654 0.4798 1.0000 0.3965 1.0000 Kết luận: 12 Nhìn chung các biến độc lập có tương quan với biến phụ thuộc không cao. Tất cả các biến độc lập đều có hệ số tương quan dương, cho thấy tác động cùng chiều lên biến phụ thuộc. Mối quan hệ tương quan giữa các biến độc lập với nhau cũng không cao, hệ số tương quan cao nhất cũng chỉ là 0.4798 giữa biến popden và polpc. Do không có hệ số tương quan nào có độ lớn vượt quá 0.8 nên có thể dự đoán mô hình không xảy ra hiện tượng đa cộng tuyến khi hồi quy. 2.2. Phân tích mối quan hệ tương quan giữa các biến Từ bảng tương quan trên ta thấy: - Hệ số tương quan giữa biến crimes và south là 0.0600 - Hệ số tương quan giữa biến crimes và area là 0.4801 - Hệ số tương quan giữa biến crimes và popden là 0.0477 - Hệ số tương quan giữa biến crimes và lawexpc 0.2322 - Hệ số tương quan giữa biến crimes và polpc là 0.3304 Như vậy, trong các nhân tố được nghiên cứu, biến area có mối tương quan mạnh nhất đến crimes, hay diện tích đất có ảnh hưởng khá lớn đến tổng số vụ phạm tội. Hệ số tương quan giữa 2 biến mang dấu dương thể hiện mối quan hệ cùng chiều giữa 2 biến, như nếu diện tích đất tăng thì tổng số vụ phạm tội cũng tăng. Ngược lại, biến popden ít ảnh hưởng nhất đến crimes, hay mối tương quan giữa mật độ dân số trên 1 dặm vuông và tổng số vụ phạm tội không mạnh như các nhân tố khác. Hệ số tương quan giữa 2 biến mang dấu dương thể hiện mối quan hệ cùng chiều giữa 2 biến, nếu mật độ dân số trên 1 dặm vuông tăng thì tổng số vụ phạm tội cũng tăng nhưng tăng không đáng kể. Ngoài ra, vì giá trị tuyệt đối của các chỉ số đều nhỏ hơn 0.8 nên dự đoán rằng mô hình không xảy ra hiện tượng đa cộng tuyến. 3. Chạy mô hình hồi quy và phân tích kết quả 3.1. Chạy mô hình hồi quy Để chạy mô hình hồi quy, ta thực hiện lệnh reg như sau: 13 . reg crimes south area popden lawexpc polpc Source SS df MS Model Residual 3.9943e+10 4.0284e+10 5 86 7.9887e+09 468419090 Total 8.0227e+10 91 881620871 crimes Coef. south area popden lawexpc polpc _cons 2380.125 168.0235 2.192713 19.75433 13507.01 -42015.36 Std. Err. 5128.681 21.76537 .9861742 8.203154 4307.702 10856.3 t 0.46 7.72 2.22 2.41 3.14 -3.87 Number of obs F( 5, 86) Prob > F R-squared Adj R-squared Root MSE P>|t| 0.644 0.000 0.029 0.018 0.002 0.000 = = = = = = 92 17.05 0.0000 0.4979 0.4687 21643 [95% Conf. Interval] -7815.356 124.7554 .232264 3.447003 4943.584 -63596.97 12575.61 211.2916 4.153163 36.06166 22070.44 -20433.75 Từ đó ta có bảng số liệu sau: Tên biến Hệ số tự do south area popden lawexpc polpc Hệ số hồi quy -42015.36 2380.125 168.0235 2.192713 19.75433 13507.01 Thống kê t -3.87 0.46 7.72 2.22 2.41 3.14 P-value 0.000 0.644 0.000 0.029 0.018 0.002 Khoảng tin cậy [-63596.97 ; -20433.75] [-7815.356 ; 12575.61] [124.7554 ; 211.2916] [0.232264 ; 4.153163] [3.447003 ; 36.06166] [4943.584; 22070.44] Từ bảng trên ta có phương trình hàm hồi quy mẫu SRF:  crime = -42015.36 + 2380.125south + 168.0235area + 2.192popden + 19.754lawexpc + 13507.01polpc 3.2. Phân tích kết quả sau khi chạy mô hình − − − − − − Số quan sát Obs = 92. Tổng bình phương sai số được giải thích SSE = 3.9943e+10 Tổng bình phương các phần dư SSR = 4.0284e+10 Tổng bình phương sai số tổng cộng SST = 8.0227e+10 Bậc tự do của phần được giải thích Dfm = 5 Bậc tự do của phần dư Dfr =86 14 − Hệ số xác định R2 = 0.4979 có nghĩa là các biến X trong mô hình giải thích được 53.31% sự dao động của biến Y. Hay các biến vùng miền, diện tích đất, mật độ dân số trên 1 dặm vuông, chi phí thực thi pháp luật bình quân đầu người và số cảnh sát trên 1000 người giải thích được 49.79% sự dao động của biến tổng số tội phạm. − Hệ số xác định điều chỉnh  R2 = 0.4687 − Ý nghĩa của các hệ số hồi quy trong mô hình:  β1 = 2380.125>0 nghĩa là tổng số vụ phạm tội xảy ra ở phía nam cao hơn tổng số vụ phạm tội xảy ra không ở phía nam là 2380.125 vụ án trong điều kiện các yếu tố khác không đổi.  β2 = 168.0235>0 nghĩa là diện tích đất tăng 1 dặm vuông thì tổng số vụ phạm tội tăng 168.0235 vụ án trong điều kiện các yếu tố khác không đổi.  β 3 = 2.192713>0 nghĩa là mật độ dân số tăng 1 người/dặm vuông thì tổng số vụ phạm tội tăng 2.192713 vụ án trong điều kiện các yếu tố khác không đổi.  β4 = 19.75433>0 nghĩa là chi phí thực thi pháp luật tăng 1$ thì tổng số vụ phạm tội tăng 19.75433 vụ án trong điều kiện các yếu tố khác không đổi.  β5 = 13507.01>0 nghĩa là cứ tăng thêm 1 cảnh sát trên 1000 người dân thì tổng số vụ phạm tội tăng 13507.01 vụ án trong điều kiện các yếu tố khác không đổi (điều này có thể hiểu là: khi tăng số lượng cảnh sát điều tra thì chứng tỏ có nhiều vụ án xảy ra hơn nên biến đô ôc lâ pô số lượng cảnh sát trên 1000 người tỷ lê ô thuâ ôn với biến phụ thuô ôc tổng số vụ phạm tội là phù hợp với thực tế).  β0 = -42015.36<0 nghĩa là khi giá trị của các biến đô ôc lâ ôp bằng 0 thì tổng số vụ phạm tội là -42015.36vụ án trong điều kiê nô các yếu tố khác không đổi 4. Kiểm định giả thuyết về hệ số hồi quy Cặp giả thuyết thống kê: Sử dụng giá trị tới hạn:  H 0 : βj 0 H 1 : βj ≠ 0  βj − β  T  se  βj  15 n− k−1 85 Ta có: c ∝ c 0,051.990 Do mô hình mắc lỗi phương sai sai số thay đổi (sẽ chứng minh ở phần cuối) nên phải sửa lỗi mô hình bằng lệnh reg, robust trước khi kiểm định giả thuyết thống kê. . reg crimes south area popden lawexpc polpc, robust Linear regression Number of obs = F( 5, 86) = Prob > F = R-squared = Root MSE = crimes Coef. south area popden lawexpc polpc _cons 2380.125 168.0235 2.192713 19.75433 13507.01 -42015.36 Robust Std. Err. 4999.456 37.32388 .814641 8.280635 4638.13 14229.47 t 0.48 4.50 2.69 2.39 2.91 -2.95 P>|t| 0.635 0.000 0.009 0.019 0.005 0.004 92 6.67 0.0000 0.4979 21643 [95% Conf. Interval] -7558.464 93.82607 .5732607 3.292975 4286.716 -70302.62 12318.71 242.2209 3.812166 36.21569 22727.31 -13728.11 Từ bảng trên ta thấy biến south có p-value = 0.635 > 0.05 còn các biến độc lập khác đều có p-value > 0.05 nên chỉ có biến south không có ảnh hưởng mang y nghĩa thống kê đến biến crimes. a) south:  t  0.48 1.990 Có:  chưa có cơ sở để bác bỏ H0 với mức y nghĩa 5%. Biến south không có ảnh hưởng mang y nghĩa thống kê đến biến crimes. ð Kết luận: Vùng miền không có ảnh hưởng mang y nghĩa thống kê đến tổng số tội phạm. b) area: Có  t  4.51.990  Bác bỏ H0, chấp nhận H1 với mức y nghĩa 5%. Biến area có ảnh hưởng mang y nghĩa thống kê đến biến crimes. ð Kết luận:  Diện tích đất có ảnh hưởng mang y nghĩa thống kê đến tổng số vụ phạm tội.  Diện tích đất càng tăng thì tổng số vụ phạm tội cũng tăng. 16  Kết quả chạy mô hình hồi quy dựa trên 1 mẫu cụ thể cho thấy diện tích đất tăng 1 dặm vuông thì tổng số vụ phạm tội tăng 168.0235 vụ án với điều kiện các yếu tố khác không đổi. 17 c) popden: Có:  t  2.691.990  Bác bỏ H0, chấp nhận H1 với mức y nghĩa 5%. Biến popden có ảnh hưởng mang y nghĩa thống kê đến biến crimes. ð Kết luận:  Mật độ dân số trên 1 dặm vuông có ảnh hưởng mang y nghĩa thống kê đến tổng số tội phạm.  Mật độ dân số trên 1 dặm vuông tăng thì tổng số tội phạm cũng tăng.  Kết quả chạy mô hình hồi quy dựa trên 1 mẫu cụ thể cho thấy cứ tăng thêm 1 người/dặm vuông thì tổng số vụ phạm tội tăng 2.192713 vụ án với điều kiện các yếu tố khác không đổi. d) lawexpc Có: t 2.391.990  Bác bỏ H0, chấp nhận H1 với mức y nghĩa 5%. ð biến lawexpc có ảnh hưởng mang y nghĩa thống kê đến biến crimes.  Kết luận:  Chi phí thực thi pháp luật bình quân đầu người có ảnh hưởng mang y nghĩa thống kê đến tổng số vụ phạm tội.  Chi phí thực thi pháp luật bình quân đầu người tăng thì tổng số vụ phạm tội cũng tăng.  Kết quả chạy mô hình hồi quy dựa trên 1 mẫu cụ thể cho thấy chi phí thực thi pháp luật bình quân đầu người tăng 1$ thì tổng số vụ phạm tội tăng 19.75433 vụ án với điều kiện các yếu tố khác không đổi. e) polpc Có: t 2.911.990  Bác bỏ H0, chấp nhận H1 với mức y nghĩa 5%. ð Biến polpc có ảnh hưởng mang y nghĩa thống kê đến biến crimes.  Kết luận:  Số cảnh sát trên 1000 người dân có ảnh hưởng mang y nghĩa thống kê đến tổng số tội phạm.  Số cảnh sát trên 1000 người dân tăng thì tổng số tội phạm cũng tăng.  Kết quả chạy mô hình hồi quy dựa trên 1 mẫu cụ thể cho thấy cứ tăng thêm 1 cảnh sát trên 1000 người dân thì tổng số vụ phạm tội tăng 13507.01 vụ án với điều kiện các yếu tố khác không đổi. Vậy trong các biến độc lập, với mức ý nghĩa 5%, chỉ có biến south không có ảnh hưởng mang ý nghĩa thống kê đến biến crimes. 18 5. Một số kiểm định F 5.1. Kiểm định sự phù hợp của mô hình Kiểm định này nhằm xem xét trường hợp các tham số của biến độc lập βi đồng thời bằng 0 có thể xảy ra hay không. Cặp giả thuyết thống kê:  H 0 : β 1  β 2 β 3  β 4  β 5  0 H 1 :Tồn tại ít nhất 1 β i ≠ 0 hoặc: Cách 1: Phương pháp giá trị tới hạn F qs   k−1 c n− α R2 k 0.4979  5   2 1−0.4979   92−5−1 1− R   n−k −1       Ho: R2 0 H 1 : R2 ≠ 0 17.05 86 = c 0.05 =1.987 Ta có: F=17.056 > 1.987 => Bác bỏ H0, chấp nhận H1. Cách 2: Phương pháp p-value Nếu giá trị Prob > F nhỏ hơn mức y nghĩa α = 0.05 thì bác bỏ H 0, chấp nhận H1 tức là mô hình hồi quy phù hợp. Ta có: Prob > F = 0.0000 < 0.05 => Bác bỏ H0, chấp nhận H1. Kết luận: Mô hình phù hợp tại mức ý nghĩa 5%. 5.2. Kiểm định đa ràng buộc tuyến tính Giả sử 3 yếu tố south, lawexpc và polpc cùng không ảnh hưởng đến crimes. Cặp giả thuyết thống kê:  H 0 : β 1 β 4  β 5 0 H 1 :Cóít nhất 1 β i ≠ 0 Ta tiến hành chạy mô hình bị ràng buộc với q= 3 biến độc lập south, lawexpc và polpc bị loại khỏi mô hình trên, tức là chỉ chạy lênh hồi quy với 2 biến độc lập area và popden. 19 . reg crimes area popden Source SS df MS Model Residual 2.9615e+10 5.0613e+10 2 89 1.4807e+10 568683453 Total 8.0227e+10 91 881620871 crimes Coef. area popden _cons 171.406 4.169318 -2155.116 Std. Err. 23.82601 .9426052 7203.629 Number of obs F( 2, 89) Prob > F R-squared Adj R-squared Root MSE t P>|t| 7.19 4.42 -0.30 0.000 0.000 0.766 kê F dùng để 0.4979−0.3691 3 1−0.4979  92−5−1 bỏ biến là: F = 92 26.04 0.0000 0.3691 0.3550 23847 [95% Conf. Interval] 124.0642 2.296382 -16468.57 Phương trình không bị ràng buộc: (UR): Phương trình bị ràng buộc (R): Thống = = = = = = R  1− R 2 ủr 2 ủr  2 218.7477 6.042255 12158.34  − Rr  q  n− k −1 = = 7.355 F0 = Fq; n-k-1 = F3; 86 = 2.71 ð ð F = 7.355 > F0 = 2.71 => Bác bỏ H0, chấp nhận H1. Không thể bỏ 3 biến south, lawexpc và polpc ra khỏi mô hình. 6. Kiểm tra khuyết tật của mô hình 6.1. Đa cộng tuyến a) Bản chất: Mô hình tốt là mô hình phải đạt được các tính chất BLUE (tuyến tính, không chệch, hiệu quả nhất). Tuy nhiên trên thực tế do xây dựng sai mô hình hoặc do bản chất của dữ liệu, dẫn tới mô hình không đạt được đầy đủ các tính chất trên. Một trong những vấn đề ảnh hưởng đến mô hình mà ta gọi là vi phạm các giả định, đó là đa cộng tuyến. Đa cộng tuyến là một lỗi của mô hình phân tích hồi quy, xảy ra khi giữa các biến độc lập Xi trong mô hình hồi quy đa biến có tương quan tuyến tính với nhau. b) Nguyên nhân: Có 3 nguyên nhân gây ra vấn đề đa cô ông tuyến: 20
- Xem thêm -

Tài liệu liên quan