Bài giảng
KINH TẾ LƯỢNG
Trần Minh Nguyệt
Tháng 8 năm 2011
Chương 1
Giới thiệu về Kinh tế lượng
1 Tổng quan về kinh tế lượng
1.1 Kinh tế lượng là gì?
• Kinh tế lượng có nghĩa là đo lường kinh tế. Trong tiếng Anh, thuật ngữ được sử dụng là
"Econometrics" (economy= kinh tế, mmetrics= đo lường).
• Kinh tế lượng là một phương pháp phân tích thực nghiệm để định lượng các vấn đề kinh
tế, dựa trên cơ sở số liệu thực tế, các lý thuyết kinh tế và thống kê toán.
1.2 Mục đích của kinh tế lượng
1. Định lượng các mối quan hệ kinh tế, các cơ chế tác động dẫn đến các kết cục về hành vi
của các tác nhân kinh tế trong kinh tế vi mô và tăng trưởng, ổn định trong kinh tế vĩ mô.
2. Dự báo các khả năng phát triển kinh tế hay diễn biến của các hiện tượng kinh tế có thể
xảy ra trong tương lai dựa vào các mô hình đã được ước lượng.
3. Phân tích chính sách kinh tế dựa vào kết quả chạy các mô hình kinh tế lượng.
Ba mục đích này thường gắn bó nhau trong quá trình xây dựng và sử dụng các mô hình kinh tế
lượng. Có thể nói, ngày nay hầu hết các lĩnh vực quản lí kinh tế như kế hoạch, tài chính, ngân
hàng, kinh doanh, tiếp thị, ngoại thương, ... đều sử dụng kinh tế lượng như một công cụ phổ
biến.
2 Phương pháp luận của kinh tế lượng
Phân tích kinh tế lượng được thực hiện theo các bước sau đây:
1. Nêu các giả thuyết hay giả thiết về các mối quan hệ giữa các biến kinh tế.
Chẳng hạn kinh tế vĩ mô khẳng định rằng nhu cầu về một loại hàng hóa phụ thuộc theo
quan hệ ngược chiều với giá của hàng hóa đó.
2. Thiết lập các mô hình toán học để mô tả mối quan hệ giữa các biến số này.
Chẳng hạn lý thuyết kinh tế cho biết mối quan hệ ngược chiều giữa lượng cầu về một loại
2
2. Phương pháp luận của kinh tế lượng
3
hàng hóa và giá của hàng hóa đó, nhưng không nêu rõ cụ thể dạng hàm. Hàm cầu có thể
có dạng phi tuyến, cũng có thể có dạng tuyến tính.
Giả sử ta chọn đường cầu dạng tuyến tính thì dạng hàm sẽ là:
Q = B1 + B2 P
(1.1)
với Q là lượng cầu, P là giá, B1 , B2 là các tham số.
3. Thiết lập mô hình kinh tế lượng.
Phương trình (1.1) xác định một quan hệ chính xác giữa nhu cầu hàng hóa với giá của nó.
Với mỗi giá trị của giá P xác định duy nhất một lượng cầu Q. Do các mối quan hệ kinh
tế nói chung là không hoàn toàn chính xác, vì vậy:
Q = B1 + B2 P + u
(1.2)
với u là sai số ngẫu nhiên. Sai số ngẫu nhiên u phân biệt mô hình kinh tế lượng (1.2) với
mô hình toán học (1.1).
4. Thu thập số liệu.
5. Ước lượng các tham số của mô hình.
Khi đã thiết lập được mô hình và thu thập dữ liệu phù hợp thì thì nhiệm vụ quan trọng là
phải ước lượng cho những tham số chưa biết của mô hình.
Ví dụ ta đã có mô hình về lượng cầu và giá của một loại hàng hóa là:
Q = B1 + B2 P + u
Với một bộ dữ liệu về lượng cầu Q và giá P , ta cần ước lượng các hệ số B1 , B2 , để từ
đó xác định được sự phụ thuộc của lượng cầu Q vào giá P .
6. Phân tích kết quả: Phân tích xem các kết quả nhận được có phù hợp với lý thuyết kinh tế
không, kiểm định giả thuyết.
Vì dữ liệu thường được thu thập trên một mẫu rút ra từ tổng thể nghiên cứu nên thông tin
do dữ liệu cung cấp không phản ánh đầy đủ toàn bộ thông tin của tổng thể, vì vậy việc ước
lượng các tham số dựa trên dữ liệu chỉ cho các đánh giá gần đúng. Mặt khác mô hình kinh
tế lượng mà ta thiết lập chịu ảnh hưởng của lý thuyết kinh tế được xác lập từ trước và ảnh
hưởng của các kết quả nghiên cứu trong quá khứ, do đó kết quả có được khi ước lượng
tham số có thể chưa phù hợp với thực tế hoặc chưa giải thích được hết sự ảnh hưởng của
các biến kinh tế. Vì vậy ta cần kiểm định giả thuyết về các tham số và về sự phù hợp của
mô hình.
Ví dụ, đối với mô hình về lượng cầu và giá của một loại hàng hóa:
Q = B1 + B2 P + u
Nếu ước lượng của B2 là số âm thì ước lượng này hợp lý về mặt kinh tế, nếu dương thì
không phù hợp về mặt kinh tế, ...
7. Dự báo.
Khi mô hình đã phù hợp với lý thuyết kinh tế thì có thể sử dụng mô hình để dự báo (dự
báo giá trị thật hoặc dự báo giá trị trung bình).
8. Ra quyết định và các chính sách.
Dựa vào các kết quả dự báo để đưa ra các quyết định và đề xuất các chính sách thích hợp.
Trần Minh Nguyệt
Chương 1. Giới thiệu về Kinh tế lượng
4
Ta có thể tóm tắt các bước trên bằng sơ đồ sau:
3 Phân tích hồi quy
Hồi quy là một công cụ cơ bản của kinh tế lượng. Thuật ngữ "Hồi quy" đã được Francis Galton
sử dụng vào năm 1986. Trong một bài báo nổi tiếng của mình, ông đã cho rằng có một xu hướng
chung về chiều cao của những đứa trẻ được sinh do cha mẹ cao không bình thường hoặc thấp
không bình thường. Người ta gọi xu hướng này là luật Galton. Trong bài báo của mình Galton
dùng cụm từ "regression to mediocrity" - quy về trung bình. Từ đó vấn đề hồi quy được nhiều
người quan tâm, hoàn thiện và được ứng dụng rộng rãi.
3.1
Khái niệm và ví dụ
Phân tích hồi quy nghiên cứu mối liên hệ phụ thuộc của một biến (gọi là biến phụ thuộc hay
biến được giải thích) theo một hay nhiều biến khác (được gọi là các biến độc lập hay biến giải
thích).
Ta kí hiệu biến phụ thuộc (biến được giải thích) là Y , các biến độc lập (biến giải thích) là
X1 , X2 , ..., Xk . Trong đó biến phụ thuộc Y là đại lượng ngẫu nhiên, có quy luật phân phối
xác suất, các biến độc lập không phải là biến ngẫu nhiên, giá trị của chúng đã được cho trước.
Phân tích hồi quy giải quyết các vấn đề sau đây:
1. Ước lượng giá trị trung bình của biến phụ thuộc với các giá trị đã cho của biến độc lập.
2. Kiểm định giả thuyết về bản chất của sự phụ thuộc.
3. Dự đoán giá trị trung bình của biến phụ thuộc khi biết giá trị của các biến độc lập.
Bài giảng Kinh tế lượng
3. Phân tích hồi quy
5
4. Kết hợp các vấn đề trên.
Ví dụ 1.1. Luật Galton Karl Pearson nghiên cứu sự phụ thuộc chiều cao của các con trai vào
chiều cao của bố. Trong ví dụ này thì chiều cao của con trai là biến phụ thuộc, chiều cao của
bố là biến độc lập.
Ví dụ 1.2. Một người nghiên cứu sự phụ thuộc của lượng cầu về một loại hàng hóa vào giá
hàng hóa đó và thu nhập của người tiêu dùng.
Trong trường hợp này, lượng cầu là biến phụ thuộc, giá của hàng hóa và thu nhập của người
tiêu dùng là các biến độc lập.
3.2
Số liệu cho phân tích hồi quy
Các loại số liệu
Có ba loại số liệu: Các số liệu theo thời gian (chuỗi thời gian), các số liệu chéo và các số liệu
hỗn hợp.
• Các số liệu theo thời gian là các số liệu được thu thập trong một thời kì nhất định. Số liệu
có thể được thu thập hàng tuần, hàng tháng, hàng quý, hàng năm ...
Ví dụ 1.3. Số liệu về giá vàng SJC bán ra (ngàn đồng/chỉ) trong tuần từ 18-12-2005 đến
24-12-2005 như sau:
Ngày
Giá
18-12
972
19-12
982
20-12
980
21-12
959
22-12
955
23-12
966
24-12
963
• Các số liệu chéo là các số liệu về một hoặc nhiều biến được thu thập tại một thời điểm ở
nhiều địa điểm khác nhau.
Ví dụ 1.4. Số liệu về giá vàng SJC bán ra (ngàn đồng/chỉ) ngày 18-12-2005 tại 4 địa
điểm: Thành phố Hồ Chí Minh, Hà Nội, Đà Nẵng, Cần Thơ như sau:
Địa điểm
Giá
TP Hồ Chí Minh
972
Hà Nội
973
Đà Nẵng
966
Cần Thơ
969
• Các số liệu hỗn hợp theo thời gian và không gian: số liệu được thu thập ở nhiều địa điểm
khác nhau tại nhiều thời điểm khác nhau.
Ví dụ 1.5. Số liệu về giá vàng SJC bán ra (ngàn đồng/chỉ) trong tuần tại bốn địa điểm
như sau:
Ngày
Nơi
TP Hồ Chí Minh
Hà Nội
Đà Nẵng
Cần Thơ
18-12
19-12
20-12
21-12
22-12
23-12
24-12
972
973
966
968
982
983
982
982
980
982
980
980
959
966
959
960
955
960
955
955
966
968
966
966
963
968
967
963
Trần Minh Nguyệt
Chương 1. Giới thiệu về Kinh tế lượng
6
Nguồn gốc các số liệu
Số liệu sử dụng trong phân tích hồi quy có thể được thu thập từ hai nguồn: số liệu điều tra thực
tế và số liệu thực nghiệm.
• Số liệu thực nghiệm có được nhờ vào việc tiến hành thử nghiệm theo những điều kiện
nhất định nào đó, thí dụ như để phân tích ảnh hưởng của việc bón phân đối với năng suất
của một loại cây trồng, người ta có thể tiến hành bón phân với số lượng khác nhau trên
các mảnh đất cùng loại. Sản lượng thu hoạch của các mảnh đất khác nhau phản ánh tác
động của việc bón phân lên cây trồng.
• Số liệu điều tra thực tế không bị kiểm soát bởi nhà nghiên cứu, thí dụ như số liệu về giá
vàng, giá bất động sản, tỷ lệ thất nghiệp ... không nằm trong tầm kiểm soát của người điều
tra. Điều này thường gây khó khăn trong việc tìm ra nguyên nhân chính xác ảnh hưởng
đến một tình huống riêng biệt. Thí dụ, có phải lượng cung về tiền ảnh hưởng đến GDP
hay còn có nguyên nhân nào khác?
Phân tích hồi quy trong kinh tế lượng chủ yếu khai thác nguồn số liệu điều tra thực tế.
Mặc dù số liệu phục vụ cho nghiên cứu kinh tế trong thực tế rất phong phú nhưng chất lượng
của số liệu thường không đủ tốt. Điều đó do các nguyên nhân sau đây:
• Hầu hết các số liệu trong khoa học xã hội đều là các số liệu phi thực nghiệm, do vậy có
thể có sai số quan sát hoặc bỏ sót quan sát hoặc cả hai.
• Ngay cả các số liệu thu thập bằng thực nghiệm cũng có sai số của phép đo.
• Trong các cuộc điều tra bằng câu hỏi, gặp vấn đề không nhận được câu trả lời hoặc có trả
lời nhưng không trả lời hết các câu hỏi.
• Các số liệu kinh tế thường có sẵn ở mức tổng hợp cao, không cho phép đi sâu vào các đơn
vị nhỏ.
• Ngoài ra còn có những số liệu thuộc bí mật quốc gia mà không phải ai cũng có thể sử dụng
được.
3.3
Mô hình hồi quy tổng thể
Xét ví dụ phân tích hồi quy chỉ gồm một biến phụ thuộc Y và một biến độc lập X. Trung bình
có điều kiện của Y sẽ là một hàm của X:
E(Y |X) = f (X)
(1.3)
trong đó: E(Y |X) là kì vọng điều kiện của biến ngẫu nhiên Y với giá trị đã cho của biến X,
f (X) là một hàm nào đó của biến X.
Hàm (1.3) được gọi là mô hình hồi quy tổng thể hay hàm hồi quy tổng thể (PRF).
Hàm f (X) có dạng như thế nào chúng ta không biết, bởi vì trong thực tế chúng ta thường không
có tổng thể để có thể tính toán ra được. Nếu f (X) là hàm tuyến tính, tức là f (X) = B1 +B2 X
thì thì mô hình (1.3) trở thành:
E(Y |X) = B1 + B2 X.
Mô hình này được gọi là mô hình hồi quy tuyến tính hai biến.
Bài giảng Kinh tế lượng
3. Phân tích hồi quy
7
3.4 Hàm hồi quy mẫu
Trong thực tế không thể nghiên cứu toàn bộ tổng thể, do đó chỉ có thể đưa ra dạng của hàm hồi
quy tổng thể chứ không thể xác định hàm này một cách chính xác. Để ước lượng hàm hồi quy
tổng thể phải dựa vào một mẫu được rút ra ngẫu nhiên từ tổng thể. Hàm hồi quy được xây dựng
dựa trên mẫu được gọi là hàm hồi quy mẫu (SRF). Chắc chắn rằng ta không thể ước lượng một
cách chính xác PRF dựa trên mẫu ngẫu nhiên, và đối với các mẫu ngẫu nhiên khác nhau sẽ cho
những hàm hồi quy mẫu SRF khác nhau.
Giả sử hàm hồi quy tổng thể PRF có dạng:
E(Y |X) = B1 + B2 X
và (X1 , Y1 ), (X2 , Y2 ), ..., (Xn , Yn ) là n quan sát về X, Y .
Kí hiệu E(Y |Xi ) hoặc E(Y |X = Xi ) là kì vọng điều kiện của Y khi X nhận giá trị Xi . Ta
có:
E(Y |Xi ) = B1 + B2 Xi
(1.4)
Khi X nhận giá trị Xi thì E(Y |Xi ) là một giá trị cụ thể, nhưng ta không biết giá trị đó bằng
bao nhiêu vì ta không nghiên cứu được tổng thể. Dựa vào mẫu ngẫu nhiên ta có phương trình
ước lượng cho (1.4) là:
ˆ
Yi = b1 + b2 Xi
(1.5)
ˆ
trong đó: Yi là ước lượng cho E(Y |Xi ).
b1 là ước lượng cho B1 .
b2 là ước lượng cho B2 .
Phương trình (1.5) được gọi là phương trình hồi quy mẫu hoặc hàm hồi quy mẫu (SRF).
3.5 Sai số ngẫu nhiên
Giả sử ta đã có hàm hồi quy tổng thể:
E(Y |X) = f (X)
Với mỗi giá trị của X thì E(Y |X) là giá trị trung bình của Y khi X nhận giá trị cụ thể ấy, khi
đó giá trị của biến ngẫu nhiên Y sẽ dao động quanh giá trị trung bình E(Y |X). Đặt:
u = Y − E(Y |X)
Từ đó ta có:
Y = E(Y |X) + u
Khi X nhận giá trị Xi thì Y = Yi , vì vậy ta có:
Yi = E(Y |Xi ) + ui
(1.6)
ui được gọi là sai số ngẫu nhiên (hay nhiễu ngẫu nhiên). Nếu mô hình hồi quy tổng thể là tuyến
tính, tức là E(Y |Xi ) = B1 + B2 Xi thì (1.6) trở thành:
Yi = B1 + B2 Xi + ui
(1.7)
Từ (1.6) lấy kì vọng điều kiện hai vế ta có:
E(Yi |Xi ) = E(Y |Xi ) + E(ui |Xi )
Trần Minh Nguyệt
Chương 1. Giới thiệu về Kinh tế lượng
8
Từ đó ta có E(ui |Xi ) = 0. Như vậy, những cách viết sau là đồng nhất và cùng được gọi là
mô hình hồi quy tuyến tính tổng thể PRF (đối với biến phụ thuộc Y và biến độc lập X):
E(Y |X) = B1 + B2 X
E(Y |Xi ) = B1 + B2 Xi
Y = B1 + B2 X + u
Yi = B1 + B2 Xi + ui
Phương trình (1.6) cho ta thấy rằng ngoài các biến giải thích trong mô hình vẫn còn những yếu
tố khác ảnh hưởng đến biến phụ thuộc. Vì vậy ta gộp chúng lại và gọi đó là các sai số ngẫu
nhiên khi biểu diễn Y qua các biến giải thích X. Nhưng về mặt trung bình thì sự ảnh hưởng
của các nhiễu ngẫu nhiên này đến biến phụ thuộc là bằng 0. Vậy liệu có thể đưa ra được hết các
yếu tố ảnh hưởng đến biến phụ thuộc hay không và khi ấy có thể loại bỏ được sự có mặt của
nhiễu ngẫu nhiên ui hay không. Câu trả lời là sai số ngẫu nhiên vẫn luôn tồn tại vì một số lý do
như sau:
• Việc xác định được hết các yếu tố ảnh hưởng đến biến phụ thuộc Y là rất khó.
• Do điều kiện kĩ thuật và kinh tế nên ta muốn có một mô hình đơn giản nhât, tức là một
mô hình mà với một lượng vừa đủ biến độc lập ta cũng có thể giải thích được cho hành
vi của biến phụ thuộc. Vì thế cần gộp vào ui thay thế cho các biến giải thích khác mà có
ảnh hưởng nhỏ đến hành vi của biến phụ thuộc.
Giả sử phương trình hồi quy mẫu có dạng:
ˆ
Yi = b1 + b2 Xi
ˆ
Đặt ei = Yi − Yi ta có:
Yi = b1 + b2 Xi + ei
Phương trình này cũng được gọi là phương trình hồi quy mẫu.
ei được gọi là phần dư và ei chính là một ước lượng điểm của ui .
Bài giảng Kinh tế lượng
3. Phân tích hồi quy
9
Y
.
Y
. i
e
.i
ˆ
S
. RF : Yi = b1 + b2 Xi
Y
.ˆi
u
. i
E
. (Y |Xi )
P
. RF : E(Y |Xi ) = B1 + B2 Xi
.
X
. i
X
.
Trần Minh Nguyệt
Chương 2
Các mô hình hồi quy tuyến tính
1 Mô hình hồi qui tuyến tính hai biến
Xét mô hình hồi quy tuyến tính hai biến gồm một biến phụ thuộc Y và một biến độc lập X:
E(Y |X) = B1 + B2 X
(2.1)
B1 được gọi là hệ số chặn (hoặc hệ số tung độ gốc) của đường hồi quy tổng thể.
B2 được gọi là hệ số độ dốc của đường hồi quy tổng thể. Từ phương trình (2.1) ta thấy:
• E(Y |X = 0) = B1 , như vậy B1 cho biết giá trị trung bình của Y khi X = 0.
• Khi X thay đổi 1 đơn vị thì E(Y |X) thay đổi B2 đơn vị. Như vậy B2 cho biết giá trị
trung bình của Y thay đổi như thế nào khi X thay đổi 1 đơn vị. Sự thay đổi này có thể
cùng chiều hay ngược chiều phụ thuộc vào dấu của B2 là dương hay âm.
1.1 Phương pháp bình phương nhỏ nhất thông thường
Trong phân tích hồi quy chúng ta phải ước lượng giá trị trung bình của biến phụ thuộc Y . Trong
phương trình (2.1), các giá trị của X đã biết, do vậy việc ước lượng đó trở thành việc ước
lượng các tham số chưa biết B1 , B2 . Có nhiều phương pháp để ước lượng cho B1 , B2 . Một
trong những phương pháp phổ biến nhất là phương pháp bình phương nhỏ nhất thông thường
(Ordinary Least Squares - OLS).
Giả sử ta có PRF là:
E(Y |Xi ) = B1 + B2 Xi
và có mẫu gồm n quan sát về X, Y là (X1 , Y1 ), (X2 , Y2 ), ..., (Xn , Yn ).
Dựa vào mẫu ta ước lượng cho mô hình trên, tức là tìm đường hồi quy mẫu:
ˆ
Yi = b1 + b2 Xi
trong đó:
b1 là ước lượng cần tìm cho B1 (b1 được gọi là hệ số chặn hoặc hệ số tung độ gốc của đường
hồi quy mẫu).
b2 là ước lượng cần tìm cho B2 (b2 được gọi là hệ số độ dốc của đường hồi quy mẫu).
ˆ
Ta tìm b1 , b2 sao cho các Yi càng gần với Yi càng tốt, tức là các phần dư
ˆ
ei = Yi − Yi = Yi − b1 − b2 Xi
10
1. Mô hình hồi qui tuyến tính hai biến
11
càng nhỏ càng tốt. Do các ei , i = 1, n có thể âm, có thể dương, vì vậy ta tìm b1 , b2 sao cho
tổng bình phương các phần dư là nhỏ nhất.
Vậy, ý tưởng của phương pháp bình phương nhỏ nhất thông thường là tìm b1 , b2 sao cho tổng
bình phương:
n
n
∑
∑
2
ei =
(Yi − b1 − b2 Xi )2
i−1
i=1
đạt giá trị nhỏ nhất.
Y
. 3
e
.3
ˆ
S
. RF : Yi = b1 + b2 Xi
∑ 2
. ei → M in
b1 ,b2
Y
. 1
e
.1
e
.2
Y
. 2
.
X
. 1
X
. 2
X
. 3
Đây là bài toán tìm giá trị nhỏ nhất của hàm hai biến (các biến là b1 , b2 ). Giải ra ta được:
n
b2 =
n
∑
Yi X i −
i=1
n
n
∑
i=1
n
∑
Xi
i=1
(
2
Xi
b1 = Y − b2 X
−
n
∑
n
∑
i=1
Yi
)2
Xi
=
XY − X.Y
X 2 − (X)2
(2.2)
i=1
b1 , b2 là các ước lượng của B1 , B2 tính được bằng phương pháp bình phương nhỏ nhất - được
gọi là các ước lượng bình phương nhỏ nhất.
1.2 Các tính chất của các ước lượng bình phương nhỏ nhất
1. b1 , b2 được xác định một cách duy nhất ứng với n cặp quan sát (Xi , Yi ).
2. b1 , b2 là các ước lượng điểm của B1 , B2 và là các đại lượng ngẫu nhiên, với các mẫu
khác nhau chúng có giá trị khác nhau.
Trần Minh Nguyệt
Chương 2. Các mô hình hồi quy tuyến tính
12
ˆ
3. Hàm hồi quy mẫu SRF: Yi = b1 + b2 Xi có các tính chất sau đây:
i. SRF đi qua trung bình mẫu (X, Y ), nghĩa là:
Y = b1 + b2 X.
ˆ
ii. Giá trị trung bình của các Yi bằng giá trị trung bình của các quan sát:
ˆ
Y =Y.
iii. Giá trị trung bình của các phần dư bằng 0:
n
∑
ei = 0.
i=1
ˆ
iv. Các phần dư ei không tương quan với Yi , tức là
n
∑
ˆ
Yi ei = 0.
i=1
v. Các phần dư ei không tương quan với Xi , tức là
n
∑
Xi ei = 0.
i=1
1.3 Các giả thiết cơ bản của mô hình hồi quy tuyến tính cổ điển
Giả thiết 1: Các biến giải thích là phi ngẫu nhiên, tức là các giá trị của chúng là các số đã được
xác định.
Giả thiết 2: Kỳ vọng của các nhiễu ngẫu nhiên bằng 0, tức là:
E(ui |Xi ) = 0.
Giả thiết này có nghĩa là các yếu tố không có trong mô hình (mà ui đại diện cho chúng)
không có ảnh hưởng hệ thống đến giá trị trung bình của Y . Về mặt hình học giả thiết này
được mô tả bằng đồ thị sau:
Bài giảng Kinh tế lượng
1. Mô hình hồi qui tuyến tính hai biến
13
Y
.
P
. RF
+
. ui
−
. ui
.
X
.
X
. 1
X
. 2
X
. 3
Giả thiết 3: Phương sai của các ui bằng nhau (còn gọi là giả thiết phương sai thuần nhất). Tức
là:
V ar(ui |Xi ) = V ar(uj |Xj ) = σ 2
∀i ̸= j.
M
. ật độ xác suất của ui
f
. (u)
Y
.
.
X
. 1
X
. 2
P
. RF
X
. i
X
.
Phương sai thuần nhất
Trần Minh Nguyệt
Chương 2. Các mô hình hồi quy tuyến tính
14
M
. ật độ xác suất của ui
f
. (u)
Y
.
.
X
. 1
X
. 2
P
. RF
X
. i
X
.
Phương sai không thuần nhất
Giả thiết 4: Không có tương quan giữa các ui :
Cov(ui , uj ) = 0 ∀i ̸= j.
1.4 Tính chất BLUE của các ước lượng bình phương nhỏ nhất
Tính chất BLUE (Best Linear Unbiased Estimator) của các ước lượng bình phương nhỏ nhất
được thể hiện qua định lý sau đây:
Định lý 2.1 (Gauss-Markov). Với các giả thiết 1-4 đã nêu trên, các ước lượng bình phương nhỏ
nhất là các ước lượng tuyến tính, không chệch và có phương sai nhỏ nhất trong lớp các ước
lượng tuyến tính không chệch.
Tuyến tính tức là các ước lượng bình phương nhỏ nhất (2.2) là các hàm tuyến tính của Yi .
Không chệch tức là:
E(b1 ) = B1 , E(b2 ) = B2 .
Phương sai nhỏ nhất trong lớp các ước lượng tuyến tính không chệch tức là: Nếu ˜1 , ˜2 là các
b b
hàm ước lượng tuyến tính không chệch bất kì lần lượt cho hai tham số B1 , B2 thì:
V ar(˜1 ) ≥ V ar(b1 ),
b
V ar(˜2 ) ≥ V ar(b2 ).
b
1.5 Hệ số xác định
Đặt
T SS =
ESS =
n
∑
(Yi − Y )2 ,
i=1
n
∑
ˆ
ˆ
(Yi − Y )2 =
i=1
RSS =
n
∑
i=1
Bài giảng Kinh tế lượng
e2 =
i
n
∑
i=1
n
∑
ˆ
(Yi − Y )2 ,
i=1
ˆ
(Yi − Yi )2 .
1. Mô hình hồi qui tuyến tính hai biến
15
TSS(Total Sum of Squares - Tổng bình phương độ lệch) là tổng bình phương của tất cả các
sai lệch giữa các giá trị quan sát Yi với giá trị trung bình của chúng.
ESS(Explained Sum of Squares - Tổng bình phương độ lệch được giải thích) là tổng bình
phương của tất cả các sai lệch giữa các giá trị của biến phụ thuộc Y nhận được từ hàm hồi quy
ˆ
mẫu với giá trị trung bình của chúng (Y = Y ). Phần này đo độ chính xác của hàm hồi quy.
RSS(Residual Sum of Squares - Tổng bình phương phần dư) là tổng bình phương của tất cả
các sai lệch giữa các giá trị quan sát Yi và các giá trị nhận được từ hàm hồi quy. Về mặt hình
học có thể minh họa trên hình sau:
Y
.
S
. RF
Y
. i
Y
. i−Y
Y
.ˆi
e
.i
Y
.ˆi − Y
Y
.
.
X
. i
X
.
Ta chứng minh được:
T SS = ESS + RSS.
Như vậy, tổng bình phương độ lệch (TSS) được chia thành hai phần: một phần được giải thích
(ESS) do đường hồi quy mẫu gây ra và một phần không được giải thích (RSS) do các yếu tố
ngẫu nhiên gây ra.
Từ biểu thức trên ta được:
ESS
RSS
1=
+
T SS
T SS
ESS
RSS
Đặt R2 =
=1−
.
T SS
T SS
R2 được gọi là hệ số xác định, được sử dụng để đo độ thích hợp của đường hồi quy mẫu với các
số liệu quan sát. Hệ số R2 cho biết tỷ lệ (tỷ lệ phần trăm) của phần biến thiên được giải thích
trong toàn bộ biến thiên của Y .
Về hệ số xác định R2 có một số lưu ý sau đây:
1. 0 ≤ R2 ≤ 1.
2. Khi R2 = 1 thì đường hồi quy thích hợp hoàn toàn. Khi đó
RSS =
n
∑
ˆ
(Yi − Yi )2 = 0
i=1
Trần Minh Nguyệt
Chương 2. Các mô hình hồi quy tuyến tính
16
ˆ
nên Yi ≡ Yi . Nếu biểu diễn trên đồ thị thì tất cả các điểm dữ liệu quan sát đều nằm trên
đường thẳng hồi quy mẫu SRF. Khi R2 = 1 thì ESS = T SS nên ta còn nói: Y được
giải thích hoàn toàn qua X.
3. Khi R2 = 0 thì đường hồi quy hoàn toàn không thích hợp. Khi đó ESS = 0 nên ta còn
nói: Y hoàn toàn không được giải thích qua X.
4. Trong thực tế, rất hiếm khi R2 = 0 hoặc R2 = 1 mà chỉ có R2 gần 0 hay gần 1. Nếu
R2 càng gần 1 thì mức độ phù hợp của đường hồi quy càng cao.
5. Không có tiêu chuẩn chung để xác định R2 bao nhiêu là cao hay thấp và không nên chỉ
căn cứ vào R2 để đánh giá mô hình tốt hay không tốt. Để xem xét một mô hình tốt hay
không ta phải căn cứ vào nhiều yếu tố: R2 , dấu của hệ số hồi quy, kinh nghiệm thực tế,
khả năng dự báo chính xác ...
Theo kinh nghiệm, với số liệu chuỗi thời gian thì R2 > 0.9 được xem là tốt, với số liệu
chéo thì R2 > 0.7 được xem là tốt.
1.6 Mối quan hệ giữa hệ số tương quan tuyến tính mẫu và hệ số xác định
R2
Gọi r là hệ số tương quan tuyến tính mẫu giữa X và Y , được xác định bởi công thức:
∑
(Xi − X)(Yi − Y )
r = √∑
∑
(Xi − X)2 (Yi − Y )2
Ta chứng minh được:
√∑
(Xi − X)2
r = b2 √ ∑
(Yi − Y )2
và
2
R =
b2
2
∑
(Xi − X)2
∑
(Yi − Y )2
Như vậy, r 2 = R2 , tuy nhiên r có thể nhận dấu âm hoặc dương và r cùng dấu với hệ số b2 của
hàm hồi quy mẫu.
1.7 Phân phối xác suất của các tham số mẫu
Để nhận được phân phối xác suất của các tham số mẫu, ngoài 4 giả thiết đã nêu của mô hình hồi
quy tuyến tính cổ điển, ta đưa thêm giả thiết thứ 5 sau:
5. ui tuân theo phân phối chuẩn N (0, σ 2 ) với mọi i.
Ta quan tâm đến các tham số mẫu sau:
n
b2 =
n
∑
Yi X i −
i=1
n
n
∑
i=1
Bài giảng Kinh tế lượng
n
∑
Xi
i=1
(
2
Xi
−
n
∑
i=1
n
∑
i=1
Yi
)2
Xi
=
XY − X.Y
X 2 − (X)2
1. Mô hình hồi qui tuyến tính hai biến
17
b1 = Y − b2 X
n
∑
σ2 =
ˆ
e2
i
i=1
n−2
=
RSS
n−2
b1 là hàm ước lượng cho B1 , b2 là hàm ước lượng cho B2 , σ 2 là hàm ước lượng cho σ 2 .
ˆ
n
∑
√
e2
i
RSS
i=1
σ =
ˆ
=
được gọi là sai số chuẩn của đường hồi quy (Standard error of
n−2
n−2
regression) hoặc sai số chuẩn của ước lượng (Standard error of estimate).
Nếu 5 giả thuyết đã nêu trên được thỏa mãn thì ta có:
• b1 tuân theo phân phối chuẩn với trung bình và độ lệch chuẩn như sau:
n
∑
E(b1 ) = B1 ,
2
Xi
i=1
se(b1 ) = σ
n
n
∑
(Xi − X)2
i=1
• b2 tuân theo phân phối chuẩn với trung bình và độ lệch chuẩn như sau:
E(b2 ) = B2 ,
se(b2 ) =
σ
n
∑
(Xi − X)2
i=1
• σ 2 là một ước lượng không chệch của phương sai nhiễu σ 2 và
ˆ
(n − 2)ˆ 2
σ
phối khi bình phương với (n − 2) bậc tự do.
(se: standard error - độ lệch chuẩn.)
σ2
tuân theo phân
Chú ý 2.2. Trong các công thức tính se(b1 ), se(b2 ) thì σ 2 là phương sai của nhiễu ui và
b2 − B 2
b1 − B 1
và
cùng tuân theo
không được biết nên σ 2 được ước lượng bằng σ 2 , vì vậy
ˆ
se(b1 )
se(b2 )
phân phối student với (n − 2) bậc tự do. Điều này là cơ sở để thực hiện bài toán ước lượng
khoảng và kiểm định sau đây.
1.8 Ước lượng và kiểm định giả thiết về hệ số hồi quy
Trong phần này ta chú ý các kí hiệu:
tn−2,α/2 là giá trị thỏa mãn: P (tn−2 > tn−2,α/2 ) = α/2.
tn−2,α là giá trị thỏa mãn: P (tn−2 > tn−2,α ) = α.
trong đó: tn−2 là biến ngẫu nhiên tuân theo phân phối student với (n − 2) bậc tự do.
Trần Minh Nguyệt
Chương 2. Các mô hình hồi quy tuyến tính
18
Khoảng tin cậy
• Khoảng ước lượng với độ tin cậy 100(1 − α)% cho B1 là:
b1 − tn−2,α/2 se(b1 ) ≤ B1 ≤ b1 + tn−2,α/2 se(b1 )
• Khoảng ước lượng với độ tin cậy 100(1 − α)% cho B2 là:
b2 − tn−2,α/2 se(b2 ) ≤ B2 ≤ b2 + tn−2,α/2 se(b2 )
Kiểm định về các hệ số hồi quy
Các bài toán kiểm định trình bày sau đây đều dựa trên cơ sở:
theo phân phối student với (n − 2) bậc tự do.
Các bước thực hiện kiểm định như sau:
b1 − B1
se(b1 )
và
b2 − B2
se(b1 )
cùng tuân
1. Chọn cặp giả thuyết H0 , H1 .
2. Tính giá trị kiểm định t.
3. Kết luận (Bác bỏ H0 hay chấp nhận H0 - Có thể so sánh giá trị kiểm định t với giá trị tới
hạn hoặc tính p-value để kết luận).
Ta có thể tóm tắt bằng các bảng 2.1, 2.2.
Bảng 2.1: Kiểm định giả thuyết về hệ số B1
Giả thuyết
H0
Giả thuyết đối
H1
∗
B1 = B1
∗
B1 ̸= B1
∗
B1 = B1
∗
B1 < B 1
∗
(B1 ≥ B1 )
B1 =
∗
B1
B1 >
∗
(B1 ≤ B1 )
∗
B1
Giá trị
kiểm định t
∗
b1 − B1
t=
se(b1 )
∗
b1 − B1
t=
se(b1 )
t=
∗
b1 − B1
se(b1 )
Miền bác bỏ
p-value
|t| > tn−2,α/2
2P (tn−2 > |t|)
t < −tn−2,α
P (tn−2 < t)
t > tn−2,α
P (tn−2 > t)
1.9 Dự báo
Có hai loại dự báo:
• Dự báo giá trị trung bình có điều kiện của Y khi X = X0 (Dự báo cho E(Y |X0 )).
• Dự báo giá trị cá biệt của Y khi X = X0 (Dự báo cho Y0 ).
Bài giảng Kinh tế lượng
1. Mô hình hồi qui tuyến tính hai biến
19
Bảng 2.2: Kiểm định giả thuyết về hệ số B2
Giả thuyết
H0
Giả thuyết đối
H1
∗
B2 = B2
∗
B2 ̸= B2
∗
B2 = B2
∗
B2 < B 2
∗
(B2 ≥ B2 )
B2 =
∗
B2
B2 >
∗
B2
Giá trị
kiểm định t
∗
b2 − B2
t=
se(b2 )
∗
b2 − B2
t=
se(b2 )
t=
∗
b2 − B2
∗
(B2 ≤ B2 )
se(b2 )
Miền bác bỏ
p-value
|t| > tn−2,α/2
2P (tn−2 > |t|)
t < −tn−2,α
P (tn−2 < t)
t > tn−2,α
P (tn−2 > t)
ˆ
Giả sử X = X0 . Khi đó, ước lượng điểm cho E(Y |X0 ) và Y đều là Y0 = b1 + b2 X0 .
Khoảng tin cậy 100(1 − α)% cho E(Y |X0 ) là:
ˆ
Y0 −tn−2,α/2 σ
ˆ
1
n
+
(X0 − X)2
ˆ
≤ E(Y |X0 ) ≤ Y0 +tn−2,α/2 σ
ˆ
n
∑
(Xi − X)2
1
n
+
i=1
(X0 − X)2
n
∑
(Xi − X)2
i=1
Khoảng tin cậy 100(1 − α)% cho Y0 là:
ˆ
Y0 −tn−2,α/2 σ
ˆ
1+
1
n
+
(X0 − X)2
ˆ
≤ Y0 ≤ Y0 +tn−2,α/2 σ
ˆ
n
∑
(Xi − X)2
1+
1
n
+
i=1
(X0 − X)2
n
∑
(Xi − X)2
i=1
Ví dụ 2.3. File số liệu GiaNhaDienTich.txt chứa giá bán và diện tích của 14 căn nhà dành cho
một gia đình, trong đó Y : giá bán (nghìn USD), X: diện tích (feet vuông).
1. Xác định hàm SRF của Y theo X. Nêu ý nghĩa của các hệ số của SRF.
2. Vẽ biểu đồ tán xạ cho X và Y . Vẽ thêm đường thẳng SRF vào biểu đồ tán xạ.
3. Tính T SS, ESS, RSS, σ , se(b1 ), se(b2 ).
ˆ
4. Tìm hệ số xác định R2 , nêu ý nghĩa.
5. Xác định khoảng tin cậy 99% cho hệ số độ dốc của PRF.
6. Ở mức ý nghĩa 5% hãy kết luận diện tích có ảnh hưởng đến giá bán nhà hay không?
7. Có nhận định cho rằng: Khi diện tích tăng lên 1 (feet vuông) thì giá nhà tăng lên ít nhất
0.5 (nghìn USD). Ở mức ý nghĩa 5% hãy kết luận về nhận định trên.
8. Tìm ước lượng khoảng với độ tin cậy 99% cho giá bán của một căn nhà có diện tích 2500
feet vuông.
9. Tìm ước lượng khoảng với độ tin cậy 99% cho giá bán trung bình khi diện tích là 2500
feet vuông.
Trần Minh Nguyệt
Chương 2. Các mô hình hồi quy tuyến tính
20
2 Mô hình hồi quy ba biến
2.1
Mô hình hồi quy tổng thể PRF
Xét mô hình hồi quy tuyến tính ba biến gồm một biến phụ thuộc Y và hai biến độc lập X2 , X3 :
E(Y |X2 , X3 ) = B1 + B2 X2 + B3 X3
(2.3)
B1 được gọi là hệ số chặn (hoặc hệ số tung độ gốc) của đường hồi quy tổng thể.
B2 , B3 được gọi là các hệ số hồi quy riêng của đường hồi quy tổng thể. Từ phương trình (2.3)
ta thấy:
• E(Y |X2 = 0, X3 = 0) = B1 , như vậy B1 cho biết giá trị trung bình của Y khi
X2 = 0, X3 = 0.
• Khi X2 thay đổi 1 đơn vị, X3 không thay đổi thì E(Y |X2 , X3 ) thay đổi B2 đơn vị.
Như vậy B2 cho biết giá trị trung bình của Y thay đổi như thế nào khi X2 thay đổi 1 đơn
vị còn X3 không đổi. Sự thay đổi này có thể cùng chiều hay ngược chiều phụ thuộc vào
dấu của B2 là dương hay âm.
• Khi X3 thay đổi 1 đơn vị, X2 không thay đổi thì E(Y |X2 , X3 ) thay đổi B3 đơn vị.
Như vậy B3 cho biết giá trị trung bình của Y thay đổi như thế nào khi X3 thay đổi 1 đơn
vị còn X2 không đổi. Sự thay đổi này có thể cùng chiều hay ngược chiều phụ thuộc vào
dấu của B3 là dương hay âm.
2.2
Hàm hồi quy mẫu
Giả sử (Y, X2i , X3i ), i = 1, n là n quan sát về Y, X2 , X3 .
Ta có PRF như sau:
Yi = B1 + B2 X2i + B3 X3i + ui
Tương tự như mô hình hồi quy hai biến, sử dụng phương pháp bình phương nhỏ nhất thông
thường ta thu được SRF như sau:
Yi = b1 + b2 X2i + b3 X3i + ei
b1 , b2 , b3 được gọi là các ước lượng bình phương nhỏ nhất, được xác định như sau:
b1 = Y − b2 X 2 − b3 X 3
n
n
n
n
∑
∑
∑
∑
2
yi x3i )(
x2i x3i )
(
yi x2i )(
x3i ) − (
b2 =
i=1
i=1
i=1
i=1
n
n
n
∑
∑
∑
2
2
x2i x3i )2
x3i ) − (
(
x2i )(
i=1
i=1
i=1
n
n
n
n
∑
∑
∑
∑
2
yi x2i )(
x2i x3i )
(
yi x3i )(
x2i ) − (
b3 =
i=1
i=1
i=1
i=1
n
n
n
∑
∑
∑
2
2
x2i x3i )2
x3i ) − (
(
x2i )(
i=1
i=1
i=1
trong đó: x2i = X2i − X 2 , x3i = X3i − X 3 , yi = Yi − Y .
Bài giảng Kinh tế lượng
(2.4)
- Xem thêm -