Header Page 1 of 161.
BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI 2
KHOA TOÁN
Mai Thị Tuyết
SUY DIỄN THỐNG KÊ VÀ DỰ BÁO
TỪ MÔ HÌNH HỒI QUY TUYẾN TÍNH
KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC
Hà Nội – Năm 2016
Footer Page 1 of 161.
Header Page 2 of 161.
BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI 2
KHOA TOÁN
Mai Thị Tuyết
SUY DIỄN THỐNG KÊ VÀ DỰ BÁO
TỪ MÔ HÌNH HỒI QUY TUYẾN TÍNH
Chuyên ngành: Toán ứng dụng
KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC
NGƯỜI HƯỚNG DẪN KHOA HỌC:
PGS.TS Trần Trọng Nguyên
Hà Nội – Năm 2016
Footer Page 2 of 161.
Header Page 3 of 161.
Mục lục
Danh sách bảng
vi
Danh sách hình vẽ
vii
Lời mở đầu
1
1 MÔ HÌNH HỒI QUY TUYẾN TÍNH BỘI
3
1.1
1.2
1.3
Khái niệm và các giả thiết cơ bản . . . . . . . . . . . .
3
1.1.1
Khái niệm . . . . . . . . . . . . . . . . . . . . .
3
1.1.2
Các giả thiết cơ bản . . . . . . . . . . . . . . .
4
Ước lượng các tham số bằng OLS cho mô hình
hồi quy bội . . . . . . . . . . . . . . . . . . . . . . .
6
1.2.1
Phương pháp OLS . . . . . . . . . . . . . . . .
6
1.2.2
Định lý Gauss- Markov . . . . . . . . . . . . . .
7
1.2.3
Các tính chất của ước lượng OLS . . . . . . . .
10
1.2.4
Tính vững của ước lượng OLS . . . . . . . . . .
11
Hệ số xác định bội R2 và hệ số xác định hiệu chỉnh R̄2
13
2 SUY DIỄN THỐNG KÊ VÀ DỰ BÁO TỪ MÔ HÌNH
HỒI QUY
18
i
Footer Page 3 of 161.
Header Page 4 of 161.
Khóa luận tốt nghiệp Đại học
2.1
Mai Thị Tuyết
QUY LUẬT PHÂN PHỐI XÁC SUẤT CỦA MỘT SỐ
THỐNG KÊ MẪU . . . . . . . . . . . . . . . . . . . .
2.2
18
BÀI TOÁN XÂY DỰNG KHOẢNG TIN CẬY CHO
CÁC HỆ SỐ HỒI QUY . . . . . . . . . . . . . . . . .
2.2.1
Khoảng tin cậy cho một hệ số hồi quy: đánh giá
tác động khi một biến độc lập thay đổi . . . . .
2.2.2
20
20
Khoảng tin cậy cho biểu thức của hai hệ số hồi
quy; đánh giá tác động khi hai biến độc lập cùng
2.3
2.4
thay đổi . . . . . . . . . . . . . . . . . . . . . .
22
2.2.3
Ý nghĩa của khoảng tin cậy . . . . . . . . . . .
24
2.2.4
Các yếu tố ảnh hưởng đến độ đài khoảng tin cậy 25
BÀI TOÁN KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ
VỀ HỆ SỐ HỒI QUY . . . . . . . . . . . . . . . . . .
26
2.3.1
Kiểm định giả thuyết về một hệ số hồi quy . . .
26
2.3.2
Kiểm định giả thuyết về một ràng buộc giữa các
hệ số hồi quy - kiểm định T . . . . . . . . . . .
30
2.3.3
Giá trị xác suất P của các thống kê kiểm định .
31
2.3.4
Kiểm định giả thuyết về nhiều ràng buộc của
các hệ số hồi quy-kiểm định F . . . . . . . . . .
33
2.3.5
Kiểm định về sự phù hợp của hàm hồi quy . . .
37
2.3.6
So sánh kiểm định T và kiểm định F . . . . . .
39
DỰ BÁO GIÁ TRỊ CỦA BIẾN PHỤ THUỘC VÀ SAI
SỐ DỰ BÁO . . . . . . . . . . . . . . . . . . . . . . .
41
2.4.1
Dự báo giá trị của biến phụ thuộc . . . . . . . .
41
2.4.2
Đánh giá sai số dự báo . . . . . . . . . . . . . .
42
ii
Footer Page 4 of 161.
Header Page 5 of 161.
Khóa luận tốt nghiệp Đại học
Mai Thị Tuyết
Kết luận chung
Footer Page 5 of 161.
45
iii
Header Page 6 of 161.
LỜI CẢM ƠN
Trong quá trình nghiên cứu khóa luận “Suy diễn thống kê và dự báo
từ mô hình hồi quy tuyến tính” với sự cố gắng của bản thân và sự giúp
đỡ nhiệt tình của các thầy cô trong tổ Toán ứng dụng, các bạn sinh viên
khoa Toán em đã hoàn thành khóa luận này.
Em xin chân thành cảm ơn sự giúp đỡ quý báu của các thầy cô trong
tổ Toán ứng dụng, trường đại học sư phạm Hà Nội 2 và các bạn sinh
viên đã tạo điều kiện cho em trong suốt thời gian làm khóa luận.
Đặc biệt, em xin bày tỏ lòng biết ơn sâu sắc tới thầy hướng dẫn
PGS.TS Trần Trọng Nguyên, người đã tận tình và đóng góp ý kiến quý
báu cho em trong quá trình thực hiện và hoàn thành khóa luận này.
Hà Nội, tháng 05 năm 2016
Sinh viên
Mai Thị Tuyết
Footer Page 6 of 161.
Header Page 7 of 161.
LỜI CAM ĐOAN
Em xin cam đoan đề tài này là do em thực hiện. Trong quá trình
nghiên cứu em đã kế thừa những thành quả nghiên cứu của các nhà
khoa học, nhà nghiên cứu với sự trân trọng biết ơn. Đề tài này không
trùng với các kết quả của tác giả khác.
Hà Nội, tháng 05 năm 2016
Sinh viên
Mai Thị Tuyết
Footer Page 7 of 161.
Header Page 8 of 161.
Danh sách bảng
1.1
Bảng số liệu . . . . . . . . . . . . . . . . . . . . . . . .
14
2.1
Các cặp giả thuyết và điều kiện để bác bỏ H0 tương ứng
28
2.2
Các cặp giả thuyết và điều kiện để bác bỏ H0 tương ứng
30
Footer Page 8 of 161.
vi
Header Page 9 of 161.
Danh sách hình vẽ
1.1
Kết quả EVIEWS cho ví dụ 1.3.1
. . . . . . . . . . . .
15
1.2
Kết quả hồi quy cho ví dụ 1.3.1 . . . . . . . . . . . . .
16
2.1
Khoảng tin cậy với độ tin cậy 95% từ các mẫu khác nhau 25
2.2
Giá trị tqs và xác suất P tương ứng . . . . . . . . . . .
32
2.3
Kết quả ước lượng . . . . . . . . . . . . . . . . . . . . .
43
2.4
Kết quả sai số dự báo . . . . . . . . . . . . . . . . . . .
44
Footer Page 9 of 161.
vii
Header Page 10 of 161.
Khóa luận tốt nghiệp Đại học
Mai Thị Tuyết
Lời mở đầu
1. Lý do chọn đề tài
Suy diễn thống kê là việc nghiên cứu mối quan hệ giữa một tổng thể
và một mẫu được lấy ra từ tổng thể đó. Suy diễn thống kê và dự báo từ
mô hình hồi quy tuyến tính là một phần quan trọng trong phân tích hồi
quy. Nó giúp cho người nghiên cứu kiểm chứng nhiều giả thuyết quan
trọng và đưa ra các dự báo trên cở sở phân tích khoa học về các dữ liệu
đã thu thập được để có thêm thông tin chắc chắn cho việc ra quyết định
về chính sách hay giải pháp nào đó.
Với mong muốn tìm hiểu sâu vấn đề này, cùng sự giúp đỡ tận tình của
PGS.TS Trần Trọng Nguyên, tôi đã chọn nghiên cứu đề tài khóa
luận tốt nghiệp: “Suy diễn thống kê và dự báo từ mô hình hồi
quy tuyến tính”.
2. Mục đích nghiên cứu
Nghiên cứu mô hình hồi quy tuyến tính (bội), phương pháp ước lượng
OLS, bài toán suy diễn thống kê về giá trị của các hệ số hồi quy tổng
thể và bài toán dự báo cho giá trị của biến phụ thuộc tại các giá trị cụ
thể của biến độc lập với sự hỗ trợ của phần mềm Eviews.
3. Đối tượng và phạm vi nghiên cứu
- Đối tượng nghiên cứu: suy diễn thống kê và dự báo từ mô hình hồi
quy tuyến tính.
- Phạm vi nghiên cứu: mô hình hồi quy tuyến tính (bội), các phương
pháp ước lượng và kiểm định giả thuyết về các hệ số của mô hình hồi
quy ứng dụng trong việc trình bày bài toán suy diễn thống kê và bài
toán dự báo trong phân tích hồi quy.
4. Phương pháp và công cụ nghiên cứu
- Phương pháp nghiên cứu tổng hợp tài liệu.
Footer Page 10 of 161.
1
Header Page 11 of 161.
Khóa luận tốt nghiệp Đại học
Mai Thị Tuyết
- Phương pháp nghiên cứu thực nghiệm với dữ liệu thực tế.
- Sử dụng phần mềm Eviews 4.0
5. Cấu trúc khóa luận
Nội dung khóa luận gồm hai chương:
Chương 1. Mô hình hồi quy tuyến tính bội: chương này trình bày một
số khái niệm và kiến thức cơ bản sẽ được sử dụng trong chương sau.
Chương 2. Suy diễn thống kê và dự báo từ mô hình hồi quy tuyến
tính: chương này trình bày bài toán suy diễn thống kê và trình bày bài
toán dự báo sử dụng mô hình hồi quy.
Footer Page 11 of 161.
2
Header Page 12 of 161.
Chương 1
MÔ HÌNH HỒI QUY TUYẾN
TÍNH BỘI
Mục đích của chương này là trình bày mô hình hồi quy tuyến tính dưới
dạng tổng quát- còn được gọi là mô hình hồi quy bội. Trong mô hình hồi
quy bội, biến phụ thuộc có thể được giải thích bởi nhiều biến độc lập,
điều này cho phép đánh giá tác động riêng phần của một biến độc lập
lên biến phụ thuộc- là một vấn đề cốt lõi khi đánh giá tác động trong
kinh tế- xã hội, khi mà các biến số thường có tác động chồng chéo nhau.
1.1
1.1.1
Khái niệm và các giả thiết cơ bản
Khái niệm
Mô hình hồi quy tuyến tính k biến có thể viết dưới dạng sau:
Y = β1 + β2 X2 + ... + βk Xk + u.
(1.1)
Trong đó Y là biến phụ thuộc và các Xj (j = 2, 3, ..., k) là các biến
độc lập.Ta biết rằng dù có đưa bao nhiêu biến độc lập vào mô hình thì
vẫn tồn tại những yếu tố có tác động đến biến phụ thuộc mà chúng
Footer Page 12 of 161.
3
Header Page 13 of 161.
Khóa luận tốt nghiệp Đại học
Mai Thị Tuyết
ta hoặc không có quan sát của chúng, hoặc không thể và cũng không
muốn đưa vào mô hình như là các biến s, do đó với mô hình k biến
vẫn tồn tại sai số ngẫu nhiên u, đại diện cho các yếu tố ngoài các biến
Xj (j = 2 − k),có tác động đến Y nhưng không đưa vào mô hình như là
biến số.
Sai số ngẫu nhiên u trong mô hình hồi quy bội là yếu tố đại diện cho
các yếu tố có tác động đến Y nhưng không đưa vào mô hình như các
biến số.
1.1.2
Các giả thiết cơ bản
Với mô hình (1.1), xét ra các giả thiết sau:
Giả thiết 1 : Việc ước lượng được dựa trên cơ sở mẫu ngẫu nhiên.
Giả thiết này tương tự như trong mô hình hồi quy hai biến: các cá
thể được chọn một cách ngẫu nhiên, rồi từ đó thu thập các chỉ tiêu của
các cá thể này. Chẳng hạn khi xem xét vấn đề năng suất lao động thì
người lao động được lựa chọn một cách ngẫu nhiên từ tổng thể, sau đó
thu thập các số liệu từ những người được chọn trong mẫu về năng suất,
trình độ học vấn, tuổi ...
Giả thiết 2 : Kỳ vọng của sai số ngẫu nhiên tại mỗi giá trị (X2i , ..., Xki )
bằng 0:
E(ui |X2i ,...,Xki ) = 0 .
Giả thiết 3 : Phương sai của sai số ngẫu nhiên tại các giá trị (X2i , ..., Xki )
đều bằng nhau:
V ar(u X2i ,...,Xki ) = σ 2 .
Footer Page 13 of 161.
4
Header Page 14 of 161.
Khóa luận tốt nghiệp Đại học
Mai Thị Tuyết
Giả thiết 4 : Giữa các biến độc lập Xj (j = 2, ..., k) không có mối
quan hệ đa cộng tuyến hoàn hảo, nghĩa là không tồn tại các hằng số
λ2 , ..., λk không đồng thời bằng 0 sao cho: λ2 X2 + ... + λk Xk = 0.
Ý nghĩa của các hệ số hồi quy
Các hệ số hồi quy trong mô hình hồi quy bội còn được gọi là hệ số
hồi quy bội.
Với giả thiết 2 ta có:
E(Y |X2 ,...,Xk ) = β1 + β2 X2 + ... + βk Xk .
Để tìm hiểu ý nghĩa các hệ số góc βj (j ≥ 2), ta lấy đạo hàm riêng
hai vế biểu thức trên theo Xj (giả định Xj là biến liên tục):
∂E(Y X2 ,..., Xk )
∂Xj
= βj , (j = 2, ..., k).
Hệ số góc βj (j = 2 − k) thể hiện tác động riêng phần của biến Xj
lên giá trị trung bình của biến phụ thuộc, là tác động của biến Xj lên
giá trị trung bình của biến phụ thuộc khi các yếu tố Xs (s 6= j) là không
đổi. Do đó trong mô hình hồi quy bội, các hệ số góc còn được gọi là hệ
số hồi quy riêng (partial coefficient).
Mô hình hồi quy bội cho phép đánh giá tác động của một biến độc
lập lên biến phụ thuộc khi các biến số khác trong mô hình hồi là không
đổi. Điều này cho thấy sự ưu việt quan trọng của mô hình hồi quy bội
trong phân tích kinh tế xã hội: mặc dù trong thực tế, chúng ta không
cần (và không thể) “giữ nguyên các yếu tố khác không đổi”, nhưng vẫn
có thể ước lượng được tác động riêng phần của một biến số như trong
điều kiện “giữ nguyên một số các yếu tố khác không đổi”.
Footer Page 14 of 161.
5
Header Page 15 of 161.
Khóa luận tốt nghiệp Đại học
1.2
Mai Thị Tuyết
Ước lượng các tham số bằng OLS cho mô hình
hồi quy bội
1.2.1
Phương pháp OLS
Xét mô hình k biến:
Y = β1 + β2 X2 + ... + βk Xk + u.
Giả sử có một mẫu quan sát với các giá trị thực tế là (Yi , X2i , ..., Xki
(i = 1, 2, ..., n) và ta sẽ sử dụng thông tin từ mẫu này để xây dựng các
ước lượng cho các hệ số βj (j = 1, 2, ..., k) ký hiệu bởi β̂j (j = 1, 2, ..., k)
tương ứng. Từ các giá trị ước lượng này có thể viết hàm hồi quy mẫu
như sau: Ŷ = β̂1 + β̂2 X2 + ... + β̂k Xk .
Tại mỗi quan sát i, hàm hồi quy mẫu này được viết thành:
Ŷi = β̂1 + β̂2 X2i + ... + β̂k Xki .
Trong đó Ŷi là giá trị ước lượng cho Yi và sai lệch giữa hai giá trị này
được gọi là phần dư: ei = Yi − Ŷi .
Phương pháp OLS nhằm xác định các giá trị β̂j (j = 1, 2, ..., k) sao
cho tổng bình phương các phần dư là bé nhất:
n
X
e2i =
X
(Yi − β1 − β2 X2 − ... − βk Xk )2
(1.2)
i=1
= M inβ̃1 ,...,β̃k
Footer Page 15 of 161.
nX
2
(Yi − β̃1 − β̃2 X2 − ... − β̃k Xk )
6
o
.
Header Page 16 of 161.
Khóa luận tốt nghiệp Đại học
Mai Thị Tuyết
Khi đó dễ thấy rằng các giá trị là nghiệm của hệ k phương trình sau:
P
n
(Yi − β̂1 − β̂2 X2i − ... − β̂k Xki ) = 0
i=1
n
P X2i (Yi − β̂1 − β̂2 X2i − ... − β̂k Xki ) = 0
i=1
......
n
P
Xki (Yi − β̂1 − β̂2 X2i − ... − β̂k Xki ) = 0
i=1
1.2.2
Định lý Gauss- Markov
Định lý 1.1. Khi các giả thiết 1- giả thiết 4 thỏa mãn thì các ước lượng
thu được từ phương pháp OLS là các ước lượng tuyến tính, không chệch
và có phương sai nhỏ nhất trong lớp các ước lượng tuyến tính không
chệch.
Khi các giả thiết 1- giả thiết 4 được thỏa mãn thì ước lượng OLS là
ước lượng tốt nhất trong lớp các ước lượng tuyến tính không chệch và
thường viết tắt là BLUE (best linear unbiased estimator).
Ước lượng tuyến tính: β̃j được gọi là ước lượng tuyến tính cho hệ số
hồi quy nếu nó được biểu diễn dưới dạng là tổ hợp tuyến tính của các
giá trị của biến phụ thuộc: β̃j = w1 Y1 + ... + wn Yn .
Trong đó wi là các hằng số nào đó và Yi là các giá trị trong mẫu của
biến phụ thuộc. Như vậy định lý Gauss- Markov khẳng định rằng các
ước lượng OLS là ước lượng tuyến tính.
Ước lượng không chệch: Ước lượng β̃j được gọi là ước lượng không
chệch của nếu βj E(β̃j ) = βj . Như vậy định lý Gauss- Markov khẳng
định rằng: E(β̂j ) = βj , j = 2, 3, ..., k.
Phương sai nhỏ nhất: Như đã chỉ ra phần trên, khi β̂j là ước lượng
không chệch của βj , thì var(β̂j ) thể hiện độ chính xác của ước lượng,
Footer Page 16 of 161.
7
Header Page 17 of 161.
Khóa luận tốt nghiệp Đại học
Mai Thị Tuyết
var(β̂j ) càng nhỏ có nghĩa là độ chính xác càng lớn. Vì vậy trong các
ước lượng không chệch, ước lượng có phương sai nhỏ hơn sẽ được ưa
thích hơn.
Định lý Gauss- Markov khẳng định rằng khi các giả thiết 1 − 4 thỏa
mãn thì ước lượng thu được từ phương pháp OLS là có phương sai bé
nhất trong số các ước lượng tuyến tính không chệch:
var(β̂j OLS ≤ var(β̃j )
với β̃j là ước lượng tuyến tính không chệch bất kỳ.
Như vậy nếu các giả thiết 1 − 4 được thỏa mãn thì ước lượng OLS
là ước lượng tốt nhất trong số các ước lượng có dạng tuyến tính và ta
không cần tìm đến bất kỳ ước lượng tuyến tính nào khác. Điều này cũng
có nghĩa là khi một trong các giả thiết này không được thỏa mãn thì
các ước lượng OLS sẽ không còn là ước lượng tôt nhất nữa.
Độ chính xác của các ước lượng
Khi các giả thiết 1 − 4 thỏa mãn thì β̂j là các ước lượng không chệch
của βj và var(β̂j ) chính là thước đo độ chính xác của các ước lượng này.
Bây giờ xem xét công thức để ước lượng var(β̂j ). Phương sai của các hệ
số ước lượng được tính theo công thức:
σ2
P .
var(β̂j ) =
(1 − Rj2 ) x2ji
(1.3)
Trong đó Rj2 là hệ số xác định của mô hình hồi quy Xj theo hệ số
chặn và các biến độc lập còn lại trong mô hình và xji = Xji − X̄j .
Chẳng hạn Rj2 là hệ số xác định của mô hình hồi quy sau đây: X2 =
α1 + α2 X3 + ... + αk Xk + v.
Trong đó v là sai số ngẫu nhiên trong mô hình hồi quy phụ này.
Footer Page 17 of 161.
8
Header Page 18 of 161.
Khóa luận tốt nghiệp Đại học
Mai Thị Tuyết
Trong công thức R2 = r2 (Y, Ŷ ), do σ 2 là tham số chưa biết nên khi
tính toán được thay bởi ước lượng (không chệch) của nó là σ̂ 2 , trong đó:
n
P
σ̂ 2 =
j=1
e2i
n−k
.
(1.4)
Với các giả thiết 1 − 4 thì được tính theo công thức (1.4) chính là
ước lượng không chệch của tham số tổng thể σ 2 .
Sai số chuẩn của se(β̂j ) được ký hiệu bởi se(β̂j ) và được tính bởi
công thức:
s
se(β̂j ) =
σ̂ 2
P
=
(1 − Rj2 ) x2ji
s
RSS/(n − k)
P , j = (2, 3, ..., k). (1.5)
(1 − Rj2 ) x2ji
Các yếu tố xác định độ chính xác của ước lượng
Từ công thức (1.3) ta thấy độ chính xác của các β̂j phụ thuộc vào
ba thành phần sau đây:
Thứ nhất, nó phụ thuộc vào phương sai của yếu tố ngẫu nhiên σ 2 ,
phương sai này càng bé thì độ chính xác của các ước ượng càng lớn. Ta
biết rằng u thể hiện cho các yếu tố có tác động đến biến phụ thuộc Y
nhưng không được đưa vào mô hình như là các biến số, vậy ta kỳ vọng
rằng việc giảm bớt các thành phần trong u sẽ giúp giảm phương sai của
nó. Điều này có nghĩa là việc đưa thêm các biến số thích hợp vào mô
hình sẽ có khả năng giúp làm giảm σ 2 và do đó giúp làm tăng độ chính
xác của các β̂j .
Thành phần thứ hai trong (1.3) là
1
:
(1−Rj2 )
khi Rj2 càng lớn thì giá trị
này càng lớn và khi xấp Rj2 xỉ 1 thì giá trị này sẽ lớn rất nhanh, làm cho
phương sai rất lớn và tiến dần đến +∞ một cách nhanh chóng, do đó
thành phần này còn được gọi là nhân tử phóng đại phương sai ( VIF:
Footer Page 18 of 161.
9
Header Page 19 of 161.
Khóa luận tốt nghiệp Đại học
Mai Thị Tuyết
variance inflation factor) .
V IFj =
1
.
(1 − Rj2 )
(1.6)
Nhớ lại rằng Rj2 là hệ số xác định trong mô hình hồi quy phụ của
biến độc lập Xj theo hệ số chặn và theo các biến độc lập còn lại trong
mô hình, nó thể hiện mối quan hệ tuyến tính giữa biến Xj và các biến
độc lập còn lại. Do đó nếu quan hệ tuyến tính này càng chặt thì Rj2 càng
lớn và độ chính xác của các ước lượng càng giảm.
n
P
Thành phần còn lại trong công thức (1.3) là
x2ji , giá trị này càng
i=1
lớn thì độ chính xác của ước lượng càng lớn. Do đó nếu giá trị của biến
Xj trong mẫu càng khác biệt thì phương sai của hệ số ước lượng càng
nhỏ.
Như vậy việc đưa thêm một biến độc lập bất kỳ vào mô hình thì
thông thường sẽ làm thay đổi không chỉ vào giá trị ước lượng của các hệ
số hồi quy mà còn vào phương sai của các ước lượng, thông qua cả ba
thành phần trong công thức (1.3). Tuy nhiên cũng sẽ có một số trường
hợp khi mà việc đưa thêm biến số vào không làm thay đổi kết quả ước
lượng.
1.2.3
Các tính chất của ước lượng OLS
Xét mô hình hồi quy bội: Y = β1 + β2 X2i + β3 X3i + ... + βk Xki + ui .
Mô hình hồi quy bội có các tính chất sau:
• Đường hồi quy bội đi qua điểm (Ȳ , X̄2 , X̄3 , ..., X̄k ).
• ¯ˆY = Ȳ .
•
n
P
ui = 0.
i=1
Footer Page 19 of 161.
10
Header Page 20 of 161.
Khóa luận tốt nghiệp Đại học
Mai Thị Tuyết
• ui không tương quan với Xpi , (p = 2, 3, ..., k),
n
P
ui Xpi = 0.
i=1
• Các ui không tương quan với Ŷi :
n
P
ui Ŷi = 0.
i=1
• Các β̂j là các ước lượng tuyến tính không chệch và có phương sai
nhỏ nhất cho các βi (i = 1, k).
1.2.4
Tính vững của ước lượng OLS
Định lý 1.2. Định lý Gauss – Markov cho ta biết rằng khi các giả thiết
1 − 4 thỏa mãn thì ước lượng OLS là các ước lượng tốt nhất trong lớp các
ước lượng tuyến tính không chệch. Tính chất vững của ước lượng phản
ánh chất lượng của ước lượng khi mẫu lớn, vì vậy tính chất này còn gọi
là tính chất với mẫu lớn của ước lượng.
Để làm rõ ý nghĩa ứng dụng của khái niệm này, hãy xem xét trường
hợp khi mà θ̂ không phải là ước lượng vững của θ. Khi đó dù kích thước
mẫu có lớn đến đâu thì chúng ta cũng không kỳ vọng rằng ước lượng θ̂
thu được từ mẫu đó là xấp xỉ với giá trị chưa biết θ.
Về mặt lý thuyết, trong trường hợp ước lượng là không chệch thì vẫn
có thể thu được giá trị gần đúng cho θ kể cả khi ước lượng là không vững,
bằng cách lấy ngẫu nhiên nhiều mẫu cùng kích thước và lấy giá trị trung
bình của các ước lượng θ thu được từ mẫu này: θ̂∗ =
θ̂(1) +θ̂(2) +...+θ̂(m)
.
m
Trong đó θ̂(j) là ước lượng không chệch cho thu được từ mẫu thứ j
(j = 1, 2, ..., m). Khi m khá lớn thì theo định lý giới hạn trung tâm, θ̂∗
sẽ là một ước lượng tốt của θ. Tuy nhiên trong thực hành, các nhà kinh
tế lượng thường chỉ có một mẫu, do đó tính vững của ước lượng vẫn là
một yêu cầu cơ bản.
Trong trường hợp ước lượng là chệch mà lại không vững thì θ̂∗ nói
trên sẽ cũng không phải là ước lượng tốt, do đó yêu cầu về tính vững lại
Footer Page 20 of 161.
11
- Xem thêm -