TRƯỜNG ĐẠI HỌC NGOẠI THƯƠNG
KHOA KINH TẾ QUỐC TẾ
=====000=====
BÁO CÁO
KINH TẾ LƯỢNG
NHÓM 13: THỰC HIỆN NGHIÊN CỨU BỘ SỐ LIỆU 13_CRIME2
Giảng viên hướng dẫn: TS. Đinh Thị Thanh Bình
Nhóm sinh viên thực hiện:
1. Đỗ Trung Hiếu
2. Nguyễn Thị Thanh Hoa
3. Nguyễn Việt Hoa (Nhóm trưởng)
4. Bùi Ngọc Hoa
- 1311160050
- 1311110252
- 1311110253
- 1311110258
- 25%
- 25%
- 30%
- 20%
HÀ NỘI – THÁNG 12 NĂM 2014
1
MỤC LỤC
LỜI MỞ ĐẦU.............................................................................................................................3
NỘI DUNG.................................................................................................................................4
I.
MÔ TẢ SỐ LIỆU................................................................................................................4
1.
Mô tả tổng quan...............................................................................................................4
2.
Mô tả chi tiết các biến trong mô hình.............................................................................6
II. PHÂN TÍCH HỒI QUY....................................................................................................12
1.
Phương trình hồi quy tuyến tính...................................................................................12
2.
Lập bảng tương quan và phân tích mối quan hệ tương quan giữa các biến...............12
3.
2.1.
Lập bảng tương quan..................................................................................................12
2.2.
Phân tích mối quan hệ tương quan giữa các biến....................................................13
Chạy mô hình hồi quy và phân tích kết quả.................................................................13
3.1.
Chạy mô hình hồi quy.................................................................................................13
3.2.
Phân tích kết quả sau khi chạy mô hình....................................................................14
4.
Kiểm định giả thuyết về hệ số hồi quy..........................................................................15
5.
Một số kiểm định F........................................................................................................18
6.
7.
5.1.
Kiểm định sự phù hợp của mô hình...........................................................................18
5.2.
Kiểm định đa ràng buộc tuyến tính............................................................................18
Kiểm tra khuyết tật của mô hình..................................................................................19
6.1.
Đa cộng tuyến..............................................................................................................19
6.2.
Phương sai sai số thay đổi..........................................................................................21
Sửa lỗi mô hình..............................................................................................................23
KẾT LUẬN...............................................................................................................................25
2
LỜI MỞ ĐẦU
Kinh tế lượng (Econometrics) là môn khoa học xã hô ôi trong đó các công cụ của ly
thuyết kinh tế, toán học và suy đoán thống kê được áp dụng để phân tích các vấn đề kinh
tế. Kinh tế lượng sử dụng các công cụ phương pháp của thống kê toán để tìm ra bản chất
của các số liê uô thống kê, đưa ra kết luâ nô về các số liê ôu thống kê thu thâ ôp được từ đó có
thể đưa ra các dự báo về các hiê nô tượng kinh tế.
Từ khi ra đời đến nay, kinh tế lượng đã đem lại cho các nhà kinh tế mô ôt công cụ đo
lường sắc bén để đo các quan hê ô kinh tế. Là những sinh viên đang theo học khối ngành
kinh tế, chúng em nhâ nô thấy được sự cần thiết của viê ôc học tâ ôp và tìm hiểu về Kinh tế
lượng trong viê ôc phân tích logic và nghiên cứu vấn đề. Để hiểu sâu hơn về viê ôc đưa Kinh
tế lượng vào trong thực tế cuô ôc sống và áp dụng Kinh tế lượng sao cho đúng và hiê uô quả,
nhóm em xin xây dựng bài BÁO CÁO THỰC HÀNH KINH TẾ LƯỢNG dưới sự
hướng dẫn của TS. Đinh Thị Thanh Bình. Trong bài báo cáo, nhóm đã em sử dụng công
cụ phân tích kinh tế lượng là phần mềm stata để phân tích, nghiên cứu dựa trên số liệu của
file dữ liệu: 13_CRIME2.DTA: "Phân tích sự ảnh hưởng của một số yếu tố đến tổng
số vụ phạm tội.”
Chúng em xin chân thành cảm ơn giảng viên hướng dẫn – TS. Đinh Thị Thanh
Bình đã giúp đỡ chúng em thực hiện bài báo cáo này. Trong quá trình làm bài báo cáo, dù
đã rất cố gắng nhưng chắc chắn chúng em không thể tránh khỏi những sai sót, kính mong
được cô góp y để nhóm chúng em có thể hoàn thiện hơn bản báo cáo này.
3
NỘI DUNG
I. MÔ TẢ SỐ LIỆU
1. Mô tả tổng quan
Trong bối cảnh xã hội ngày càng phát triển với tốc độ đô thị hóa cao cũng như việc
đất nước mạnh dạn mở cửa để tiếp thu với các nền văn hóa khác nhau thì tình trạng vi
phạm pháp luật ngày càng trở thành một vấn đề đáng lo ngại. Có rất nhiều yếu tố tác động
đến tổng số vụ phạm tội. Sau khi xem xét y nghĩa của từng biến trong file số liệu
13_CRIME2.DTA, nhóm em đã quyết định chọn mô hình hồi quy gồm các biến sau:
Biến phụ thuộc: Y: crimes
Biến độc lập: gồm 5 biến:
X1: south
X2: area
X3: popden
X4: lawexpc
X5: polpc
Mô tả dữ liệu bẳng lệnh des, ta thu được kết quả như sau:
. des crimes south area popden lawexpc polpc
storage
variable name
type
display
format
crimes
south
area
popden
lawexpc
polpc
%9.0g
%9.0g
%9.0g
%9.0g
%9.0g
%9.0g
float
byte
float
float
float
float
Ta có bảng sau:
Tên biến
Đơn vị tính
crimes
Vụ án
south
-
area
popden
lawexpc
dặm vuông
người/dặm vuông
$
value
label
variable label
total number index crimes
=1 if city in south
land area, square miles
people per sq mile
law enforce. expend. pc, $
police per 1000 people
Ý nghĩa biến
Tổng số vụ phạm tội
= 1 nếu người phạm tội sống ở phía nam
= 0 nếu người phạm tội sống ở những vùng khác
Diện tích vùng đất khảo sát
Mật độ dân số trên 1 dặm vuông
Chi phí thực thi pháp luật bình quân đầu người
4
polpc
Cảnh sát
Số lượng cảnh sát trên 1000 người dân
Tiếp tục sử dụng lệnh sum để mô tả dữ liệu. Lệnh sum cho biết số lượng quan sát
(Obs), giá trị trung bình (mean), độ lệch chuẩn (std. dev.) cũng như giá trị lớn nhất (max)
và nhỏ nhất (min) của các biến.
. sum crimes south area popden lawexpc polpc
Variable
Obs
Mean
crimes
south
area
popden
lawexpc
92
92
92
92
92
39663.53
.326087
122.7304
4984.489
958.643
polpc
92
2.251738
Std. Dev.
Min
Max
29692.1
.4713482
125.5295
3172.98
313.88
4124
0
13
703.7964
377.54
164452
1
604
16550.28
2262.44
.6315045
1.283939
4.619234
Dựa theo kết quả trên, ta có bảng tổng hợp sau:
Tên biến
Số quan
sát
Giá trị
trung bình
Độ lệch
chuẩn
Giá trị nhỏ
nhất
Giá trị lớn
nhất
crimes
92
39663.53
29692.1
4124
164452
south
92
0.326087
0.4713482
0
1
area
92
122.7304
125.5295
13
604
popden
92
4984.489
3172.98
703.7964
16550.28
lawexpc
92
958.643
313.88
377.54
2262.44
polp
92
2.251738
0.6315045
1.283939
4.619234
Có thể nhận thấy biến tổng số vụ phạm tội có sự chênh lệch khá lớn giữa mức cao
nhất và mức thấp nhất, lên tới xấp xỉ 40 lần, cao hơn hẳn so với các biến còn lại.
2. Mô tả chi tiết các biến trong mô hình
Để mô tả chi tiết các biến đã chọn, ta dùng lệnh tab.
5
Sử dụng lệnh tab cho phép miêu tả các biến với các thông tin tần suất (Freq.), phần
trăm (Percent), phần trăm tích lũy cộng phần trăm từ trên xuống (Cum.)
a) Crimes (tổng số tội phạm)
. tab crimes
total
number
index
crimes
Freq.
Percent
Cum.
4124
5276
5596
5708
6533
7207
8511
11648
13122
13188
14537
15233
15698
15931
16806
16953
17136
17306
18703
18915
19082
19438
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
2.17
3.26
4.35
5.43
6.52
7.61
8.70
9.78
10.87
11.96
13.04
14.13
15.22
16.30
17.39
18.48
19.57
20.65
21.74
22.83
23.91
more
− Tổng số vụ phạm tội dao động từ 4124 vụ án đến 164452 vụ án. Tất cả các giá trị
số vụ phạm tội đều chiếm tỉ trọng như nhau là 1.09%.
− Có 23.91% trong tổng số 92 số quan sát mà tổng số vụ phạm tội ≤ 19438 vụ án.
6
b) Vùng miền (south)
. tab south
=1 if city
in south
Freq.
Percent
Cum.
0
1
62
30
67.39
32.61
67.39
100.00
Total
92
100.00
Biến giả south nhận giá trị = 1 nếu người phạm tội sống ở phía nam, xuất hiện 30
lần chiếm 32.61%
Biến giả south nhận giá trị = 0 nếu người phạm tội không sống ở phía nam, xuất
hiện 62 lần chiếm 67.39%
Nhìn chung, số lượng người phạm tội sống ở phía nam chiếm tỉ lệ thấp hơn so với
số lượng người phạm tội sống ở những vùng khác trong mối quan hệ với tổng số
vụ phạm tội.
c) Diện tích đất (area)
7
. tab area
land area,
square
miles
Freq.
Percent
Cum.
13
17.8
18.9
20.8
21.9
24.1
24.2
25.3
27.4
34.2
34.3
41.8
44.6
46.4
49.8
52.9
53
54.4
55.1
55.3
55.4
55.9
61.1
74
78
79
95.8
97.3
100.5
104.2
106.8
113.9
131.2
135.6
169.2
186.8
199.4
255.9
258.5
264.1
316.4
329
331.4
352
375
604
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2.17
2.17
2.17
2.17
2.17
2.17
2.17
2.17
2.17
2.17
2.17
2.17
2.17
2.17
2.17
2.17
2.17
2.17
2.17
2.17
2.17
2.17
2.17
2.17
2.17
2.17
2.17
2.17
2.17
2.17
2.17
2.17
2.17
2.17
2.17
2.17
2.17
2.17
2.17
2.17
2.17
2.17
2.17
2.17
2.17
2.17
2.17
4.35
6.52
8.70
10.87
13.04
15.22
17.39
19.57
21.74
23.91
26.09
28.26
30.43
32.61
34.78
36.96
39.13
41.30
43.48
45.65
47.83
50.00
52.17
54.35
56.52
58.70
60.87
63.04
65.22
67.39
69.57
71.74
73.91
76.09
78.26
80.43
82.61
84.78
86.96
89.13
91.30
93.48
95.65
97.83
100.00
Total
92
100.00
8
− Diện tích vùng đất khảo sát dao động từ 13 dặm vuông đến 604 dặm vuông. Mỗi
giá trị đều xuất hiện 2 lần với tỉ lệ như nhau là 2.17%.
− Có 63.04% trong tổng số 92 số quan sát mà diện tích đất ≤ 100.5 dặm vuông.
d) Mật độ dân số trên 1 dặm vuông (popden)
.
tab popden
people per
sq mile
703.7964
730.8079
1050.75
1314.366
1329.261
1359.923
1404.494
1426.666
1590.438
1596.368
1672.36
1727.662
2170.811
2220.036
2385.081
2488.472
2497.993
2498.724
2570.054
2700.385
2725.987
2743.34
2755.948
2793.656
more
Freq.
Percent
Cum.
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
2.17
3.26
4.35
5.43
6.52
7.61
8.70
9.78
10.87
11.96
13.04
14.13
15.22
16.30
17.39
18.48
19.57
20.65
21.74
22.83
23.91
25.00
26.09
− Mật độ dân số trên 1 dặm vuông dao động và trải đều từ 703.7964 đến 16550.28
người/dặm vuông. Mỗi giá trị chỉ xuất hiện 1 lần với tỉ lệ như nhau là 1.09%.
− Có 26.09% trong tổng số 92 số quan sát mà mật độ dân số ≤ 2793.656 người/dặm
vuông.
9
e) Chi phí thực thi pháp luật bình quân đầu người (lawexpc)
. tab lawexpc
law
enforce.
expend. pc,
$
377.54
554.7
556.8
570
570.63
582.56
586.72
608.44
635.7
641.55
655.1799
660.15
660.3
661.5
668.1
671.56
672.75
702.96
710.52
714
726.45
731.64
more
Freq.
Percent
Cum.
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
2.17
3.26
4.35
5.43
6.52
7.61
8.70
9.78
10.87
11.96
13.04
14.13
15.22
16.30
17.39
18.48
19.57
20.65
21.74
22.83
23.91
− Chi phí thực thi pháp luật bình quân đầu người dao động và trải đều từ 377.54$
đến 2262.44$. Mỗi giá trị chỉ xuất hiện một lần với tỉ lệ như nhau là 1.09%.
− Có 23.91% trong tổng số 92 số quan sát mà chi phí thực thi pháp luật bình quân
đầu người ≤ 731.64$.
10
f) Số lượng cảnh sát trên 1000 người (popden)
. tab polpc
police per
1000 people
1.283939
1.300569
1.350198
1.351552
1.366975
1.388133
1.420306
1.434222
1.478796
1.481664
1.487614
1.515053
1.517768
1.568048
1.577169
1.608299
1.632377
1.685959
1.688117
1.697174
1.737621
1.74235
1.747294
1.764359
more
Freq.
Percent
Cum.
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
1.09
2.17
3.26
4.35
5.43
6.52
7.61
8.70
9.78
10.87
11.96
13.04
14.13
15.22
16.30
17.39
18.48
19.57
20.65
21.74
22.83
23.91
25.00
26.09
− Số cảnh sát trên 1000 người dân dao động trong khoảng 1.283939% đến
4.619234%. Mỗi giá trị chỉ xuất hiện một lần với tỉ lệ như nhau là 1.09%.
− Có 26.09% trong tổng số 92 số quan sát mà số cảnh sát trên 1000 người dân ≤
1.764359%.
11
II.
PHÂN TÍCH HỒI QUY
1. Phương trình hồi quy tuyến tính
Chọn biến phụ thuộc Y là crimes, các biến độc lập X1, X2, X3, X4, X5, X6 lần lượt là
unem, pcinc, area, popden, lawexpc, polpc.
Ta có:
Hàm hồi quy tổng thể:
(PRF): crimes = β0 + β1south + β2area + β3popden + β4lawexpc + β5polpc + ui
Hàm hồi quy mẫu:
(SRF): crimes =
β 0 + β 1 south + β 2 area + β 3 popden + β 4 lawexpc +
β 5 polpc
Trong đó: ui là yếu tố ngẫu nhiên (nhiễu).
2. Lập bảng tương quan và phân tích mối quan hệ tương quan giữa các biến
2.1. Lập bảng tương quan
Trước khi chạy mô hình hồi quy, chúng ta xem xét mức độ tương quan giữa các biến
bằng cách sử dụng lệnh corr crimes south area popden lawexpc polpc. Ta thu được
bảng tương quan giữa các biến như sau:
. corr crimes south area popden lawexpc polpc
(obs=92)
crimes
south
area
popden
lawexpc
polpc
crimes
south
area
popden
lawexpc
polpc
1.0000
0.0600
0.4801
0.0477
0.2322
0.3304
1.0000
0.2163
-0.2847
-0.2294
-0.0586
1.0000
-0.5490
-0.2358
-0.2109
1.0000
0.3654
0.4798
1.0000
0.3965
1.0000
Kết luận:
12
Nhìn chung các biến độc lập có tương quan với biến phụ thuộc không cao. Tất cả
các biến độc lập đều có hệ số tương quan dương, cho thấy tác động cùng chiều lên biến
phụ thuộc.
Mối quan hệ tương quan giữa các biến độc lập với nhau cũng không cao, hệ số
tương quan cao nhất cũng chỉ là 0.4798 giữa biến popden và polpc. Do không có hệ số
tương quan nào có độ lớn vượt quá 0.8 nên có thể dự đoán mô hình không xảy ra hiện
tượng đa cộng tuyến khi hồi quy.
2.2. Phân tích mối quan hệ tương quan giữa các biến
Từ bảng tương quan trên ta thấy:
-
Hệ số tương quan giữa biến crimes và south là 0.0600
-
Hệ số tương quan giữa biến crimes và area là 0.4801
-
Hệ số tương quan giữa biến crimes và popden là 0.0477
-
Hệ số tương quan giữa biến crimes và lawexpc 0.2322
-
Hệ số tương quan giữa biến crimes và polpc là 0.3304
Như vậy, trong các nhân tố được nghiên cứu, biến area có mối tương quan mạnh
nhất đến crimes, hay diện tích đất có ảnh hưởng khá lớn đến tổng số vụ phạm tội. Hệ số
tương quan giữa 2 biến mang dấu dương thể hiện mối quan hệ cùng chiều giữa 2 biến,
như nếu diện tích đất tăng thì tổng số vụ phạm tội cũng tăng.
Ngược lại, biến popden ít ảnh hưởng nhất đến crimes, hay mối tương quan giữa mật
độ dân số trên 1 dặm vuông và tổng số vụ phạm tội không mạnh như các nhân tố khác. Hệ
số tương quan giữa 2 biến mang dấu dương thể hiện mối quan hệ cùng chiều giữa 2 biến,
nếu mật độ dân số trên 1 dặm vuông tăng thì tổng số vụ phạm tội cũng tăng nhưng tăng
không đáng kể.
Ngoài ra, vì giá trị tuyệt đối của các chỉ số đều nhỏ hơn 0.8 nên dự đoán rằng mô
hình không xảy ra hiện tượng đa cộng tuyến.
3. Chạy mô hình hồi quy và phân tích kết quả
3.1. Chạy mô hình hồi quy
Để chạy mô hình hồi quy, ta thực hiện lệnh reg như sau:
13
. reg crimes south area popden lawexpc polpc
Source
SS
df
MS
Model
Residual
3.9943e+10
4.0284e+10
5
86
7.9887e+09
468419090
Total
8.0227e+10
91
881620871
crimes
Coef.
south
area
popden
lawexpc
polpc
_cons
2380.125
168.0235
2.192713
19.75433
13507.01
-42015.36
Std. Err.
5128.681
21.76537
.9861742
8.203154
4307.702
10856.3
t
0.46
7.72
2.22
2.41
3.14
-3.87
Number of obs
F( 5,
86)
Prob > F
R-squared
Adj R-squared
Root MSE
P>|t|
0.644
0.000
0.029
0.018
0.002
0.000
=
=
=
=
=
=
92
17.05
0.0000
0.4979
0.4687
21643
[95% Conf. Interval]
-7815.356
124.7554
.232264
3.447003
4943.584
-63596.97
12575.61
211.2916
4.153163
36.06166
22070.44
-20433.75
Từ đó ta có bảng số liệu sau:
Tên biến
Hệ số tự do
south
area
popden
lawexpc
polpc
Hệ số hồi quy
-42015.36
2380.125
168.0235
2.192713
19.75433
13507.01
Thống kê t
-3.87
0.46
7.72
2.22
2.41
3.14
P-value
0.000
0.644
0.000
0.029
0.018
0.002
Khoảng tin cậy
[-63596.97 ; -20433.75]
[-7815.356 ; 12575.61]
[124.7554 ; 211.2916]
[0.232264 ; 4.153163]
[3.447003 ; 36.06166]
[4943.584; 22070.44]
Từ bảng trên ta có phương trình hàm hồi quy mẫu SRF:
crime = -42015.36 + 2380.125south + 168.0235area + 2.192popden + 19.754lawexpc +
13507.01polpc
3.2. Phân tích kết quả sau khi chạy mô hình
−
−
−
−
−
−
Số quan sát Obs = 92.
Tổng bình phương sai số được giải thích SSE = 3.9943e+10
Tổng bình phương các phần dư SSR = 4.0284e+10
Tổng bình phương sai số tổng cộng SST = 8.0227e+10
Bậc tự do của phần được giải thích Dfm = 5
Bậc tự do của phần dư Dfr =86
14
− Hệ số xác định R2 = 0.4979 có nghĩa là các biến X trong mô hình giải thích được
53.31% sự dao động của biến Y. Hay các biến vùng miền, diện tích đất, mật độ dân số
trên 1 dặm vuông, chi phí thực thi pháp luật bình quân đầu người và số cảnh sát trên
1000 người giải thích được 49.79% sự dao động của biến tổng số tội phạm.
− Hệ số xác định điều chỉnh
R2
= 0.4687
− Ý nghĩa của các hệ số hồi quy trong mô hình:
β1 = 2380.125>0 nghĩa là tổng số vụ phạm tội xảy ra ở phía nam cao hơn tổng số
vụ phạm tội xảy ra không ở phía nam là 2380.125 vụ án trong điều kiện các yếu tố
khác không đổi.
β2 = 168.0235>0 nghĩa là diện tích đất tăng 1 dặm vuông thì tổng số vụ phạm tội
tăng 168.0235 vụ án trong điều kiện các yếu tố khác không đổi.
β 3 = 2.192713>0 nghĩa là mật độ dân số tăng 1 người/dặm vuông thì tổng số vụ
phạm tội tăng 2.192713 vụ án trong điều kiện các yếu tố khác không đổi.
β4 = 19.75433>0 nghĩa là chi phí thực thi pháp luật tăng 1$ thì tổng số vụ phạm tội
tăng 19.75433 vụ án trong điều kiện các yếu tố khác không đổi.
β5 = 13507.01>0 nghĩa là cứ tăng thêm 1 cảnh sát trên 1000 người dân thì tổng số
vụ phạm tội tăng 13507.01 vụ án trong điều kiện các yếu tố khác không đổi (điều
này có thể hiểu là: khi tăng số lượng cảnh sát điều tra thì chứng tỏ có nhiều vụ án
xảy ra hơn nên biến đô ôc lâ pô số lượng cảnh sát trên 1000 người tỷ lê ô thuâ ôn với
biến phụ thuô ôc tổng số vụ phạm tội là phù hợp với thực tế).
β0 = -42015.36<0 nghĩa là khi giá trị của các biến đô ôc lâ ôp bằng 0 thì tổng số vụ
phạm tội là -42015.36vụ án trong điều kiê nô các yếu tố khác không đổi
4. Kiểm định giả thuyết về hệ số hồi quy
Cặp giả thuyết thống kê:
Sử dụng giá trị tới hạn:
H 0 : βj 0
H 1 : βj ≠ 0
βj − β
T
se βj
15
n− k−1
85
Ta có: c ∝ c 0,051.990
Do mô hình mắc lỗi phương sai sai số thay đổi (sẽ chứng minh ở phần cuối) nên phải
sửa lỗi mô hình bằng lệnh reg, robust trước khi kiểm định giả thuyết thống kê.
. reg crimes south area popden lawexpc polpc, robust
Linear regression
Number of obs =
F( 5,
86) =
Prob > F
=
R-squared
=
Root MSE
=
crimes
Coef.
south
area
popden
lawexpc
polpc
_cons
2380.125
168.0235
2.192713
19.75433
13507.01
-42015.36
Robust
Std. Err.
4999.456
37.32388
.814641
8.280635
4638.13
14229.47
t
0.48
4.50
2.69
2.39
2.91
-2.95
P>|t|
0.635
0.000
0.009
0.019
0.005
0.004
92
6.67
0.0000
0.4979
21643
[95% Conf. Interval]
-7558.464
93.82607
.5732607
3.292975
4286.716
-70302.62
12318.71
242.2209
3.812166
36.21569
22727.31
-13728.11
Từ bảng trên ta thấy biến south có p-value = 0.635 > 0.05 còn các biến độc lập
khác đều có p-value > 0.05 nên chỉ có biến south không có ảnh hưởng mang y nghĩa
thống kê đến biến crimes.
a) south:
t 0.48 1.990
Có:
chưa có cơ sở để bác bỏ H0 với mức y nghĩa 5%.
Biến south không có ảnh hưởng mang y nghĩa thống kê đến biến crimes.
ð
Kết luận:
Vùng miền không có ảnh hưởng mang y nghĩa thống kê đến tổng số tội phạm.
b) area:
Có
t 4.51.990
Bác bỏ H0, chấp nhận H1 với mức y nghĩa 5%.
Biến area có ảnh hưởng mang y nghĩa thống kê đến biến crimes.
ð
Kết luận:
Diện tích đất có ảnh hưởng mang y nghĩa thống kê đến tổng số vụ phạm tội.
Diện tích đất càng tăng thì tổng số vụ phạm tội cũng tăng.
16
Kết quả chạy mô hình hồi quy dựa trên 1 mẫu cụ thể cho thấy diện tích đất tăng 1
dặm vuông thì tổng số vụ phạm tội tăng 168.0235 vụ án với điều kiện các yếu tố
khác không đổi.
17
c) popden:
Có:
t 2.691.990
Bác bỏ H0, chấp nhận H1 với mức y nghĩa 5%.
Biến popden có ảnh hưởng mang y nghĩa thống kê đến biến crimes.
ð
Kết luận:
Mật độ dân số trên 1 dặm vuông có ảnh hưởng mang y nghĩa thống kê đến tổng số
tội phạm.
Mật độ dân số trên 1 dặm vuông tăng thì tổng số tội phạm cũng tăng.
Kết quả chạy mô hình hồi quy dựa trên 1 mẫu cụ thể cho thấy cứ tăng thêm 1
người/dặm vuông thì tổng số vụ phạm tội tăng 2.192713 vụ án với điều kiện các
yếu tố khác không đổi.
d) lawexpc
Có: t 2.391.990 Bác bỏ H0, chấp nhận H1 với mức y nghĩa 5%.
ð biến lawexpc có ảnh hưởng mang y nghĩa thống kê đến biến crimes.
Kết luận:
Chi phí thực thi pháp luật bình quân đầu người có ảnh hưởng mang y nghĩa thống
kê đến tổng số vụ phạm tội.
Chi phí thực thi pháp luật bình quân đầu người tăng thì tổng số vụ phạm tội cũng
tăng.
Kết quả chạy mô hình hồi quy dựa trên 1 mẫu cụ thể cho thấy chi phí thực thi pháp
luật bình quân đầu người tăng 1$ thì tổng số vụ phạm tội tăng 19.75433 vụ án với
điều kiện các yếu tố khác không đổi.
e) polpc
Có: t 2.911.990 Bác bỏ H0, chấp nhận H1 với mức y nghĩa 5%.
ð Biến polpc có ảnh hưởng mang y nghĩa thống kê đến biến crimes.
Kết luận:
Số cảnh sát trên 1000 người dân có ảnh hưởng mang y nghĩa thống kê đến tổng số
tội phạm.
Số cảnh sát trên 1000 người dân tăng thì tổng số tội phạm cũng tăng.
Kết quả chạy mô hình hồi quy dựa trên 1 mẫu cụ thể cho thấy cứ tăng thêm 1 cảnh
sát trên 1000 người dân thì tổng số vụ phạm tội tăng 13507.01 vụ án với điều kiện
các yếu tố khác không đổi.
Vậy trong các biến độc lập, với mức ý nghĩa 5%, chỉ có biến south không có ảnh
hưởng mang ý nghĩa thống kê đến biến crimes.
18
5. Một số kiểm định F
5.1. Kiểm định sự phù hợp của mô hình
Kiểm định này nhằm xem xét trường hợp các tham số của biến độc lập
βi
đồng
thời bằng 0 có thể xảy ra hay không.
Cặp giả thuyết thống kê:
H 0 : β 1 β 2 β 3 β 4 β 5 0
H 1 :Tồn tại ít nhất 1 β i ≠ 0
hoặc:
Cách 1: Phương pháp giá trị tới hạn
F qs
k−1
c n−
α
R2 k
0.4979 5
2
1−0.4979
92−5−1
1− R n−k −1
Ho: R2 0
H 1 : R2 ≠ 0
17.05
86
= c 0.05 =1.987
Ta có: F=17.056 > 1.987 => Bác bỏ H0, chấp nhận H1.
Cách 2: Phương pháp p-value
Nếu giá trị Prob > F nhỏ hơn mức y nghĩa α = 0.05 thì bác bỏ H 0, chấp nhận H1 tức
là mô hình hồi quy phù hợp.
Ta có: Prob > F = 0.0000 < 0.05 => Bác bỏ H0, chấp nhận H1.
Kết luận: Mô hình phù hợp tại mức ý nghĩa 5%.
5.2. Kiểm định đa ràng buộc tuyến tính
Giả sử 3 yếu tố south, lawexpc và polpc cùng không ảnh hưởng đến crimes.
Cặp giả thuyết thống kê:
H 0 : β 1 β 4 β 5 0
H 1 :Cóít nhất 1 β i ≠ 0
Ta tiến hành chạy mô hình bị ràng buộc với q= 3 biến độc lập south, lawexpc và polpc bị
loại khỏi mô hình trên, tức là chỉ chạy lênh hồi quy với 2 biến độc lập area và popden.
19
. reg crimes area popden
Source
SS
df
MS
Model
Residual
2.9615e+10
5.0613e+10
2
89
1.4807e+10
568683453
Total
8.0227e+10
91
881620871
crimes
Coef.
area
popden
_cons
171.406
4.169318
-2155.116
Std. Err.
23.82601
.9426052
7203.629
Number of obs
F( 2,
89)
Prob > F
R-squared
Adj R-squared
Root MSE
t
P>|t|
7.19
4.42
-0.30
0.000
0.000
0.766
kê
F
dùng
để
0.4979−0.3691 3
1−0.4979 92−5−1
bỏ
biến
là:
F =
92
26.04
0.0000
0.3691
0.3550
23847
[95% Conf. Interval]
124.0642
2.296382
-16468.57
Phương trình không bị ràng buộc:
(UR):
Phương trình bị ràng buộc
(R):
Thống
=
=
=
=
=
=
R
1− R
2
ủr
2
ủr
2
218.7477
6.042255
12158.34
− Rr q
n− k −1
=
= 7.355
F0 = Fq; n-k-1 = F3; 86 = 2.71
ð
ð
F = 7.355 > F0 = 2.71 => Bác bỏ H0, chấp nhận H1.
Không thể bỏ 3 biến south, lawexpc và polpc ra khỏi mô hình.
6. Kiểm tra khuyết tật của mô hình
6.1. Đa cộng tuyến
a) Bản chất:
Mô hình tốt là mô hình phải đạt được các tính chất BLUE (tuyến tính, không chệch,
hiệu quả nhất). Tuy nhiên trên thực tế do xây dựng sai mô hình hoặc do bản chất của dữ
liệu, dẫn tới mô hình không đạt được đầy đủ các tính chất trên. Một trong những vấn đề
ảnh hưởng đến mô hình mà ta gọi là vi phạm các giả định, đó là đa cộng tuyến.
Đa cộng tuyến là một lỗi của mô hình phân tích hồi quy, xảy ra khi giữa các biến
độc lập Xi trong mô hình hồi quy đa biến có tương quan tuyến tính với nhau.
b) Nguyên nhân:
Có 3 nguyên nhân gây ra vấn đề đa cô ông tuyến:
20
- Xem thêm -