1
2
BỘ GIÁO DỤC VÀ ĐÀO TẠO
ĐẠI HỌC ĐÀ NẴNG
Công trình ñược hoàn thành tại
ĐẠI HỌC ĐÀ NẴNG
HUỲNH NGỌC TUẤN
MỞ RỘNG MÔ HÌNH HỒI QUY
Người hướng dẫn khoa học: TS. CAO VĂN NUÔI
Phản biện 1: TS. NGUYỄN DUY THÁI SƠN
TUYẾN TÍNH HAI BIẾN
Phản biện 2: GS.TS. LÊ VĂN THUYẾT
Chuyên ngành : PHƯƠNG PHÁP TOÁN SƠ CẤP
Mã số:
60.46.40
Luận văn ñược bảo vệ tại Hội ñồng chấm luận văn tốt nghiệp
Thạc sĩ khoa học họp tại Đại học Đà Nẵng vào ngày 02
tháng 02 năm 2012.
TÓM TẮT LUẬN VĂN THẠC SĨ KHOA HỌC
* Có thể tìm hiểu luận văn tại:
- Trung tâm Thông tin - Học liệu, Đại học Đà Nẵng
- Thư viện trường Đại học Sư phạm, Đại học Đà Nẵng
Đà Nẵng - Năm 2012
3
4
cách có hệ thống với các ví dụ minh họa ñầy ñủ cho phần lý thuyết
MỞ ĐẦU
1. LÝ DO CHỌN ĐỀ TÀI
Việc xác ñịnh một cách ñịnh lượng trong kinh tế ñược khảo sát khá
kỹ trong bộ môn kinh tế lượng. Bộ môn này, ra ñời vào những năm
1930 của thế kỷ XX, cho ñến nay môn khoa học này ñã ñem lại cho
các nhà kinh tế một công cụ sắc bén, nhất là trong ước lượng, kiểm
ñịnh các quan hệ kinh tế, dự báo các thay ñổi kinh tế vĩ mô quan
trọng như lãi suất, tỉ lệ lạm phát, GDP…các mô hình kinh tế như:
Hồi quy tuyến tính, mô hình log tuyến tính, mô hình nửa log
(semilog),....
Hiện nay giáo trình và tài liệu trình bày một cách có hệ thống kiến
thức về mở rộng mô hình hồi quy tuyến tính tổng quát trong kinh tế
lượng bằng ngôn ngữ toán học vẫn còn hạn chế. Vì vậy, tôi chọn ñề
tài “MỞ RỘNG MÔ HÌNH HỒI QUY TUYẾN TÍNH HAI
BIẾN” ñể làm luận văn tốt nghiệp của mình.
2. MỤC ĐÍCH NGHIÊN CỨU
Tác giả rất hi vọng ñây sẽ là tài liệu tham khảo bổ ích về mở rộng
mô hình hồi quy tuyến tính hai biến và áp dụng của nó trong thực tế.
3. ĐỐI TƯỢNG VÀ PHẠM VI NGHIÊN CỨU
3.1. Đối tượng: Áp dụng mô hình hồi quy trong kinh tế lượng.
3.2. Phạm vi nghiên cứu: Mô hình hồi quy tuyến tính hai biến và
mở rộng mô hình hồi quy tuyến tính hai biến.
4. PHƯƠNG PHÁP NGHIÊN CỨU
Tham khảo, phân tích, tổng hợp, hệ thống các tài liệu chuyên khảo
và các bài báo trên internet khác nhau có liên quan ñến hồi quy tuyến
tính và ứng dụng trong một số vấn ñề kinh tế. Từ ñó trình bày một
ñã trình bày.
5. Ý NGHĨA KHOA HỌC VÀ THỰC TIỄN CỦA ĐỀ TÀI
5.1. Ý nghĩa khoa học: Hệ thống kiến thức về “mở rộng mô hình hồi
quy tuyến tính hai biến” và ứng dụng vào giải một số bài toán kinh tế
lượng dựa trên số liệu thực tế.
5.2. Ý nghĩa thực tiễn: Đề tài hoàn thành trở thành tài liệu tham
khảo cho giáo viên, sinh viên ở các trường ñại học và cao ñẳng, các
bạn yêu toán và các ứng dụng của toán trong kinh tế, ñặc biệt là kinh
tế lượng.
6. CẤU TRÚC LUẬN VĂN
Luận văn gồm 3 chương:
CHƯƠNG 1. MÔ HÌNH HỒI QUY TUYẾN TÍNH CỔ ĐIỂN
Định nghĩa mô hình hồi quy tuyến tính cơ bản và các tích chất liên
quan.
CHƯƠNG 2. CÁC MỞ RỘNG CỦA HỒI QUY TUYẾN TÍNH
HAI BIẾN
Trình bày sự mở rộng về hồi quy tuyến tính hai biến.
CHƯƠNG 3. MỘT SỐ ÁP DỤNG CỦA CÁC MÔ HÌNH MỞ
RỘNG TỪ MÔ HÌNH HỒI QUY TUYẾN TÍNH HAI BIẾN
Trình bày một số áp dụng của mô hình hồi quy tuyến tính hai biến
mở rộng.
5
6
CHƯƠNG 1. MÔ HÌNH HỒI QUY TUYẾN TÍNH
CỔ ĐIỂN
1.1. KHÁI NIỆM HÀM HỒI QUY ĐÁM ĐÔNG
Từ bảng trên ta tính ñược:
Bảng 1.2. Các thông số về xác suất và trung bình
X→
Giả thiết rằng một cụm dân cư có 60 hộ dân. Giả sử rằng chúng ta
chỉ quan tâm ñến việc nghiên cứu mối quan hệ giữa ñại lượng Y tiêu
p (Y | X i ) ↓
dùng hàng tuần và ñại lượng X khả năng thu nhập khả dụng của mỗi
gia ñình.
Xác suất có
Giả sử chúng ta chia 60 gia ñình này thành 10 nhóm có thu nhập xấp
xỉ nhau và ñánh giá thu chi của các gia ñình này trong từng nhóm thu
nhập. Số liệu ñược cho bởi bảng sau:
ñiều
kiện
p (Y | X i )
Bảng 1.1. Số liệu thu nhập của 60 gia ñình
X→
80
100
120
140
160
180
200
220
240
260
1/5
1/6
1/5
1/7
1/6
1/6
1/5
1/7
1/6
1/7
1/5
1/6
1/5
1/7
1/6
1/6
1/5
1/7
1/6
1/7
1/5
1/6
1/5
1/7
1/6
1/6
1/5
1/7
1/6
1/7
1/5
1/6
1/5
1/7
1/6
1/6
1/5
1/7
1/6
1/7
-
1/6
-
1/7
1/6
1/6
-
1/7
1/6
1/7
-
-
-
1/7
-
-
-
1/7
-
1/7
77
89
101
113
125
137
149
161
173
Trung bình
Y↓
80
100
120
140
160
180
200
220
240
260
Chi tiêu
55
65
79
102
102
110
120
135
137
150
của Y
tiêu
60
70
84
93
107
115
136
137
145
152
Bảng 1.2 ñược thể hiện qua các hình sau:
dùng
65
74
90
95
110
120
140
140
155
175
gia ñình
70
80
94
103
116
135
145
157
175
180
hàng
-
88
--
113
125
140
-
160
189
185
-
-
-
115
-
-
-
162
-
191
325
462
445
707
678
750
685
1043
966
1211
có ñiều kiện 65
tuần Y,
$
Tổng
cộng
Bảng 1.1, các giá trị trung bình của Y tăng khi X tăng. Nếu chúng
ta tập trung vào các ñiểm có kích thước lớn ñể thể hiện các giá trị
trung bình của Y thì các trung bình có ñiều kiện này nằm trên một
Hình 1.1. Phân phối có ñiều kiện của chi tiêu ñối với
ñường thẳng với một ñộ dốc dương. Đường thẳng này ñược gọi là
mức ñộ thu nhập khác nhau của Bảng 1.1
ñường hồi quy tổng thể.
7
8
1.2.2. Sự tuyến tính theo các tham số
Đó là kỳ vọng có ñiều kiện của Y, E (Y | X i ) là một hàm tuyến
tính theo các tham số β của nó. Theo các hiểu này thì nó có thể
tuyến tính hoặc không tuyến tính theo biến X.
1.3. SAI SỐ NGẪU NHIÊN
Từ hình 1.1, nhận thấy rằng với một mức thu nhập X i , mức chi
tiêu của một hộ gia ñình có thể nằm xung quanh giá trị trung bình của
các hộ gia ñình có thu nhập X i . Điều này ta có thể diễn tả ñộ lệch của
Yi xung quanh giá trị kỳ vọng của nó:
Yi = E (T | X i ) + ui
Hình 1.2. Đường hồi quy tổng thể của Bảng 1.2
Từ hình 1.1 và 1.2, ta nhận thấy rằng mỗi trung bình có ñiều kiện
trong ñó, ñộ lệch ui là biến số ngẫu nhiên không thể quan sát.
Về thuật ngữ chuyên môn, ta gọi ui là số hạng nhiễu ngẫu nhiên hay
E(Y|Xi) là một hàm của X i . Kí hiệu:
E (Y | X i ) = f ( X i ) , i = 1, n
(1.3)
(1.1)
trong ñó, f ( X i ) là hàm của biến giải thích X i , phương trình (1.1)
số hạng sai số ngẫu nhiên. Công thức (1.3) có thể cho chúng ta biết
rằng chi tiêu của một gia ñình khi biết mức thu nhập của họ:
ñược gọi là hàm hồi quy tổng thể hai biến (Population Regression
(1) E (T | X i ) chi tiêu trung bình của tất cả các gia ñình có cùng thu
Function - PRF) hay ngắn gọn hơn là hồi quy tổng thể (Population
nhập (yếu tố này tất yếu).
Regression - PR). Theo Keynes, hàm tiêu dùng Y theo thu nhập X
(2) ui yếu tố ngẫu nhiên hay không hệ thống.
như sau:
1.4. HÀM HỒI QUY MẪU
E (Y | X i ) = β1 + β 2 X i
(1.2)
Chúng ta cần phải tính PRF trên cơ sở thông tin mẫu. Giả thiết
trong ñó, β1 , β 2 gọi là hệ số hồi quy.
rằng ta không có thông tin gì về Bảng 1.1 và ta chỉ có thông tin ngẫu
Phương trình (1.2) ñược gọi là hàm hồi quy tổng thể tuyến tính.
nhiên tương ứng các giá trị Y với X (ñược cho ở bảng sau).
1.2. Ý NGHĨA CỦA THUẬT NGỮ “TUYẾN TÍNH”
Bảng 1.3. Mẫu ngẫu nhiên từ tổng thể bảng 1.1 (1)
Y
X
Y
X
Đó là kỳ vọng có ñiều kiện của Y là một hàm tuyến tính của X i .
70
80
115
180
Về mặt hình học, ñường cong tuyến tính trong trường hợp này là
65
100
120
200
ñường thẳng.
90
120
140
220
95
140
155
140
110
160
150
260
1.2.1. Sự tuyến tính theo các biến số
9
10
Từ Bảng 1.3 ta có thể dự ñoán ñược chi tiêu trung bình hàng tuần Y
Tóm lại, mục tiêu chính của ta trong phân tích hồi quy là tính PRF
trong tổng thể tương ứng X ñược chọn không? Hay ta có thể tính
Yi = β1 + β 2 X i + ui
(1.4)
ñược PRF từ bảng dữ liệu mẫu hay không? Việc tính này cũng ñặt ra
Trên cơ sở của SRF
Yˆi = βˆ1 + βˆ2 X i + uˆi
(1.9)
nghi vấn không tính chính xác ñược PRF bởi vì có sự dao ñộng trong
việc lấy mẫu. Giả sử ta lấy ngẫu nhiên một mẫu ngẫu nhiên khác từ
bảng 1.1.
Bảng 1.4. Mẫu ngẫu nhiên từ tổng thể bảng 1.1 (2)
Y
X
Y
X
55
80
120
180
88
100
145
200
90
120
125
220
80
140
145
240
118
160
175
260
1.5. MÔ HÌNH HỒI QUY TUYẾN TÍNH CỔ ĐIỂN
1.5.1. Ước lượng các hệ số của mô hình hồi quy bằng phương
pháp bình phương tối thiểu thông thường OLS (Ordinary Least
Square)
1.5.1.1. Các giả ñịnh của mô hình hồi quy tuyến tính cổ ñiển
1.5.1.2. Phương pháp bình phương tối thiểu thông thường
Từ hàm hồi quy (1.9): ui = Yi − βˆ1 − βˆ2 X i
n
vậy
∑
ui2
i =1
Từ bảng 1.3 và 1.4, chúng ta ñược ñồ thị phân tán như sau:
=
∑(
n
Yi − βˆ1 − βˆ2 X i
i =1
)
2
(1.10)
Điều kiện ñể (1.10) ñạt cực trị là:
βˆ 1 = Y − βˆ 2 X
(1.15)
n
βˆ2 =
∑y x
i i
i =1
n
∑
(1.17)
xi2
i =1
với x i = X i − X và y i = Yi − Y .
1.5.1.3. Tính chất của hàm hồi quy mẫu theo OLS
Tính chất của ước lượng tham số:
(1) β̂1 và β̂ 2 là duy nhất ứng với một mẫu xác ñịnh gồm n quan sát
(Xi,Yi).
(2) β̂1 và β̂ 2 là các ước lượng ñiểm của β1 và β2. Giá trị của β̂1 và
Hình 1.3. Đường hồi quy mẫu của 2 mẫu bảng 1.3 và 1.4
Biểu thức tương ứng với (1.2) có thể ñược viết lại:
Yˆ = βˆ + βˆ X
i
1
2
i
β̂ 2 thay ñổi theo mẫu dùng ñể ước lượng.
(1.8)
11
12
Tính chất của hàm hồi quy mẫu:
(1) Hàm hồi quy mẫu ñi qua giá trị trung bình của dữ liệu.
(2) Giá trị trung bình của ước lượng bằng giá trị trung bình của quan
^
sát ñối với biến phụ thuộc E Y = Y .
(3) Giá trị trung bình của phần dư bằng 0: E ( ui ) = 0 .
βˆ 1 − t ( n −2,1−α / 2) se(βˆ 1 ) ≤ β1 ≤ βˆ 1 + t ( n −2,1−α / 2) se(βˆ 1 )
βˆ 2 − t ( n −2,1−α / 2) se(βˆ 2 ) ≤ β 2 ≤ βˆ 2 + t ( n − 2,1−α / 2 ) se(βˆ 2 )
1.5.2.2. Kiểm ñịnh giả thiết về hệ số hồi quy
H 0 : β 2 = β*2
Giả thiết:
∑u Y = 0 .
i i
i =1
n
(5) Các phần dư ui và X i không tương quan với nhau:
∑u X
i
i
=0.
i =1
1.5.1.4. Phân phối của β̂1 và β̂ 2
β̂1
E βˆ = β
Kỳ vọng
( )
1
( )
E βˆ 2 = β 2
1
n
Phương
sai
( )
var βˆ 1 =
∑X
i =1
n
2
i
n∑ x
i =1
σ
2
2
i
( )
chuẩn
σ βˆ =
1
∑X
i =1
n
phối
βˆ 2 − β*2
βˆ − β*2
< t ( n −2,α / 2) hoặc 2
> t ( n −2,1−α / 2) thì bác bỏ H 0 .
se(βˆ 2 )
se(βˆ 2 )
βˆ 2 − β*2
≤ t ( n −2,1−α / 2) thì ta không thể bác bỏ H 0
se(βˆ )
2
1.5.3. Độ thích hợp của hàm hồi quy - R 2
1.5.3.1 Hệ số xác ñịnh R 2
i =1
2
2
i
n ∑ x i2
σ
i =1
Phân
βˆ 2 − β 2
≤ t ( n − 2,1−α / 2) = 1 − α
se(βˆ 2 )
ñiều kiện quyết ñịnh:
(1) Nếu t ( n − 2,α / 2 ) ≤
σ2
var βˆ 2 = n
∑ x i2
n
Sai số
mệnh ñề xác suất: P t ( n − 2 ,α / 2 ) ≤
(1)Nếu
β̂ 2
(1.25)
H1 : β 2 ≠ β*2
n
(4) Các phần dư ui và Yi không tương quan với nhau:
(1.24)
n
X i2
∑
2
ˆβ ~ N β , i =1
σ
1
1 n 2
n∑ x i
i =1
σ βˆ =
2
n
∑ x i yi
R 2 = ni =1 n = rX2 ,Y
∑ x i2 ∑ y i2
σ
n
∑ x i2
i =1
2
ˆβ ~ N β , σ
2
2 n 2
xi
∑
i =1
i =1
1.5.2. Khoản tin cậy và kiểm ñịnh giả thiết các hệ số hồi quy
(1.35)
i =1
1.5.3.2 Ý nghĩa của hệ số xác ñịnh R 2
(1) Đo tỷ lệ hay số phần trăm của toàn bộ sai lệch của Y với giá trị
trung bình của chúng ñược giải thích bằng mô hình.
(2) Hệ số R 2 ñược sử dụng ñể ño mức ñộ phù hợp của hàm hồi quy.
1.5.3.3 Tính chất của hệ số xác ñịnh R 2
1.5.2.1. Khoản tin cậy của các hệ số hồi quy
(1) 0 ≤ R 2 ≤ 1 . Với R 2 = 0 thể hiện X và Y ñộc lập thống kê. R 2 = 1
Ước lượng khoảng cho hệ số hồi quy với mức ý nghĩa α như sau:
thể hiện X và Y phụ thuộc tuyến tính hoàn hảo.
13
14
Nếu R 2 → 1 thì mô hình hồi quy càng thích hợp.
n
Nếu R 2 → 0 thì mô hình hồi quy ít thích hợp.
βˆ2 =
(2) R 2 không xét ñến quan hệ nhân quả.
∑X Y
i i
i =1
n
∑
(2.6)
X i2
i =1
1.5.4. Dự báo bằng mô hình hồi quy hai biến
Khoảng tin cậy cho dự báo: Ŷo ± t ( n − 2,1−α / 2 ) se(Ŷo )
σ2
var βˆ2 = n
X i2
( )
Nhận xét: X 0 càng lệch ra khỏi giá trị trung bình thì sai số dự báo
càng lớn.
(2.7)
∑
i =1
1.6. ĐỊNH LÝ GAUSS – MARKOV
So sánh các công thức với các công thức khi có tung ñộ gốc trong mô
Nội dung của ñịnh lý này ñược phát biểu: “Cho trước các giả
hình:
thuyết của mô hình hồi quy tuyến tính cổ ñiển, các hàm ước lượng
n
n
bình phương tối thiểu, trong nhóm các hàm ước lượng tuyến tính
βˆ2 =
không chệch, có phương sai nhỏ nhất, chúng là các hàm ước lượng
∑x y
i i
i =1
n
∑x
σ
; var βˆ2 = n
2
i
không chệch tuyến tính tốt nhất”.
( )
2
∑x
2
i
; σˆ 2 =
∑ uˆ
2
i
i =1
n−2
i =1
i =1
Sự khác biệt giữa các công thức rất rõ ràng:
CHƯƠNG 2. CÁC MỞ RỘNG CỦA HỒI QUY
TUYẾN TÍNH HAI BIẾN
2.1. HỒI QUY QUA GỐC
phương và tích chéo thô nhưng trong mô hình có tung ñộ gốc, ta sử
dụng tổng bình phương và tích chéo hiệu chỉnh.
(2) Số bậc tự do ñể tính σˆ 2 trong hai trường hợp lần lượt là ( n − 1) và
Xét hàm hồi quy tổng thể (PRF) hai biến có dạng sau:
Yi = β 2 X + ui
(1) Trong mô hình không có tung ñộ gốc, ta sử dụng tổng bình
(2.1)
( n − 2)
Trong mô hình này, tung ñộ gốc không có hay bằng 0 và ñược gọi là
Mặc dù trong mô hình không có tung ñộ gốc hay tung ñộ gốc bằng
mô hình hồi quy qua gốc.
không có thể thích hợp trong một số trường hợp, tuy nhiên khi sử
Làm sao chúng ta ước lượng các mô hình như (2.1) và mô hình này
dụng mô hình này ta cần chú ý:
ñưa ra các vấn ñề ñặc biệt như thế nào? Để trả lời câu hỏi này, ta viết
mô hình hồi quy mẫu (SRF) của (2.1) là:
Yi = βˆ2 X i + uˆi
n
(a)
∑ uˆ , luôn bằng 0 trong mô hình có tung ñộ gốc (mô hình quy
i
i =1
(2.5)
ước) nhưng không cần phải bằng 0 trong trường hợp không có tung
n
ñộ gốc. Nói một cách ngắn gọn,
∑ uˆ
i
i =1
mô hình hồi quy qua gốc.
không nhất thiết bằng 0 với
15
16
(b) r 2 , hệ số xác ñịnh luôn không âm với mô hình quy ước
lượng bằng hồi quy OLS. Do tính chất tuyến tính này, các mô hình
Do các ñặc ñiểm của mô hình, ta cần rất cẩn thận khi sử dụng mô
như thế ñược gọi là mô hình log-log, log kép, hay tuyến tính log.
hình hồi quy qua gốc tọa ñộ bằng 0. Trừ khi chúng ta có một tiên
Trong mô hình hai biến, cách ñơn giản nhất ñể quyết ñịnh xem mô
nghiệm rất mạnh, ta cần phải sử dụng mô hình quy ước có tung ñộ
hình tuyến tính lôgarit có thích hợp với số liệu hay không là vẽ lên ñồ
gốc.
thị phân tán biểu diễn lnYi theo lnXi và xem xem nếu các ñiểm phân
Điều này có lợi thế kép:
tán nằm gần ñúng theo một ñường thẳng.
(1) Thứ nhất: Nếu số hạng tung ñộ gốc ñưa vào mô hình nhưng nó trở
2.4. MÔ HÌNH NỬA LOG
nên không có ý nghĩa về mặt thống kê, ta có một mô hình hồi quy
2.4.1. Mô hình log – lin
(3)
qua gốc tọa ñộ .
Ta có bảng số liệu sau:
(2) Thứ hai: nếu thật sự có tung ñộ gốc nhưng ta khẳng ñịnh rằng ñó
Bảng 2.2.(6) Tổng sản phẩm nội ñịa tính theo giá năm 1987
là hồi quy qua gốc tọa ñộ thì ta sẽ phạm sai số ñặc trưng, và như vậy
của Hoa Kỳ, 1972 – 1991
ta sẽ vi phạm giả thuyết của mô hình hồi quy tuyến tính cổ ñiển.
Năm
GDP
Năm
GDP
Năm
GDP
2.2. TỶ LỆ VÀ ĐƠN VỊ ĐO
1972
3107.1
1979
3796.8
1986
4404.5
Việc chuyển ñổi tỉ lệ không tác ñộng tới những tính chất của ước
1973
3268.6
1980
3776.3
1987
4539.9
lượng OLS.
1974
3248.1
1981
3843.1
1988
4718.6
2.3. MÔ HÌNH LOG TUYẾN TÍNH
1975
3221.7
1982
3760.3
1989
4838
1976
3380.8
1983
3906.6
1990
4877.5
1977
3533.3
1984
4148.5
1991
4821
1978
3703.5
1985
4279.8
--
--
Xem xét mô hình sau với tên gọi là mô hình hồi quy mũ:
Yi = β1 X iβ2 eui
(2.34)
Phương trình có thể ñược biểu diễn dưới dạng sau:
ln Yi = ln β1 + β 2 ln X i + ui
(2.35)
với ln là logarit tự nhiên nghĩa là logarit với cơ số e ( e = 2,718 )
Nếu ta viết (2.34) dưới dạng:
ln Yi = α + β 2 ln X i + ui
(2.36)
với α = ln β1 , mô hình này tuyến tính theo các thông số α và β 2 ,
tuyến tính theo lôgarit của các biến Y và X. Mô hình có thể ñược ước
(3)
Henri Theil chỉ ra rằng nếu tung ñộ gốc thật sự không có, hệ số ñộ dốc có thể
ñược ước lượng với ñộ chính xác lớn hơn rất nhiều so với trường hợp có tung ñộ
gốc. Xem Introduction to Economertrics của Henri Theil, Prentice – Hall,
Englewood Cliffs, N.J., 1978, trang 76.
Giả sử ta muốn tìm tốc ñộ tăng trưởng GDP thực trong giai ñoạn
này. Đặt Yt = GDP thực (RGDP) vào thời ñiểm t và Y0 = giá trị ban
ñầu (năm 1972) của GDP thực. Bây giờ nhớ lại công thức tính lãi
suất gộp nổi tiếng về tiền tệ, tài chính và ngân hàng.
Yt = Y0 (1 + r )t
(6)
(2.38)
Nguồn: Báo cáo của Tổng thống, tháng 1 năm 1993, bảng B-1 và B-2 trang 348 349
17
18
với r là tốc ñộ tăng trưởng gộp (theo thời gian) của Y. Lấy lôgarit tự
nhiên (ln) của (2.38), ta có:
ln Yt = ln Y0 + t ln(1 + r )
(2.39)
bây giờ ñặt:
β1 = lnY0
β 2 = ln(1 + r )
(2.40)
(2.41)
ta có thể viết (2.39) dưới dạng:
ln Yt = β1 + β 2t
(2.42)
cộng thêm yếu tố nhiễu vào (2.42), ta có:(7)
ln Yt = β1 + β 2t + ut
(2.43)
Mô hình này giống mọi mô hình tuyến tính khác ở chỗ các thông
số β1 và β 2 là tuyến tính. Sự khác nhau duy nhất là biến hồi quy phụ
thuộc vào lôgarit của Y và biến hồi quy ñộc lập là “thời gian”, lấy giá
trị 1,2,3,...
Các mô hình như (2.43) ñược gọi là mô hình bán lôgarit (semilog)
do chỉ có một biến (trong trường hợp này là biến hồi quy phụ thuộc)
xuất hiện dưới dạng lôgarit. Đối với các mục ñích mô tả, một mô
hình trong ñó biến hồi quy phụ thuộc ñược lôgarit hóa sẽ ñược gọi là
mô hình log-lin.
2.4.2. Mô hình Lin – log
Ta có bảng số liệu sau:
Bảng 2.3.(9) GNP và lượng cung tiền Hoa Kỳ năm 1973 – 1987
GNP
GNP
Năm
M2
Năm
M2
( tỷ USD)
( tỷ USD)
1973 1359.3
861.0
1981 3052.6
1795.5
1974 1472.8
908.5
1982 3166.0
1954.0
1975 1598.4
1023.2 1983 3405.7
2185.2
(7)
Ta ñưa thêm sai số vào vì công thức lãi suất gộp sẽ không thảo mãn chính xác.
Nguồn báo cáo kinh tế của Tổng thống, 1989, số liệu GNP lấy từ bảng B-1 trang
308 và M2 từ bảng B-67 trang 385
(9)
1976
1977
1978
1979
1980
1782.8
1990.5
2249.7
2508.2
2723.0
1163.7
1286.7
1389.0
1500.2
1633.1
1984
1985
1986
1987
--
3772.2
4014.9
4240.3
4526.7
--
2363.6
2562.6
2807.7
2901.0
--
Lưu ý: Các số liệu GNP là số liệu hàng quý trên cơ sở tốc ñộ hàng
năm ñã hiệu chỉnh theo mùa.
M2 =
tiền mặt + tiền gửi không kỳ hạn + séc du lịch + các loại tiền
gửi ñược rút séc khác + hợp ñồng mua lại chứng khoán (RP) 1 ngày
ñêm và Eurodollar + số dư MMMF (quỹ hỗ tương trên thị trường tiền
tệ) + MMDAs (các tài khoản tiền gửi trên thị trường tiền tệ) + tiết
kiệm và tiền gửi nhỏ.
Giả sử ta có số liệu như trong bảng 2.3, với Y là GNP và X là lượng
cung tiền. Tiếp theo, giả sử ta quan tâm ñến việc tìm xem GNP tăng
lên bao nhiêu (về giá trị tuyệt ñối) nếu lượng cung tiền tăng lên 1%.
Không giống mô hình tăng trưởng vừa thảo luận trong ñó ta quan
tâm ñến việc tìm xem gia tăng phần trăm của Y khi X tăng lên 1 ñơn
vị, bây giờ ta quan tâm ñến việc tìm sự thay ñổi tuyệt ñối của Y khi X
thay ñổi ñi 1%. Một mô hình phục vụ mục tiêu này có thể ñược viết
như sau:
Yi = β1 + β 2 ln X i + ui
(2.45)
Với các mục ñích mô tả, mô hình như vậy là mô hình lin – log.
2.5. MÔ HÌNH NGHỊCH ĐẢO
Các mô hình có dạng sau ñược gọi là mô hình nghịch ñảo.
1
Yi = β1 + β 2
(2.48)
+ ui
Xi
19
20
Mặc dù mô hình này là phi tuyến theo biến X bởi vì biến X có dạng
CHƯƠNG 3. MỘT SỐ ÁP DỤNG CỦA CÁC
MÔ HÌNH MỞ RỘNG TỪ MÔ HÌNH HỒI QUY
TUYẾN TÍNH
nghịch ñảo, mô hình có dạng tuyến tính theo β1 và β 2 và do vậy mô
hình là mô hình hồi quy tuyến tính.(11)
Mô hình này có các ñặc ñiểm: khi X tiến dần tới vô cùng, số hạng
3.1. MỘT ÁP DỤNG CỦA MÔ HÌNH HỒI QUY TUYẾN TÍNH
β 2 (1 / X ) dần tới không (lưu ý: β 2 không ñổi) và Y tiến tới giá trị giới
CỔ ĐIỂN: ĐƯỜNG ĐẶC TÍNH CỦA LÝ THUYẾT CƠ CẤU
hạn hay tiệm cận β1 . Do vậy, các mô hình như (2.48) tạo nên một giá
ĐẦU TƯ CHỨNG KHOÁN
trị tiệm cận hay giới hạn mà biến phụ thuộc sẽ nhận khi giá trị của
Ta có bảng số liệu về suất sinh lợi hàng năm (%) của Afuture Fund:
biến X dần tới vô cùng.
Bảng 3.1. Suất sinh lợi trung bình của Afuture Fund
Bảng tóm tắt các ñặc trưng nổi bật các mô hình vừa trình bày ở trên:
Bảng 2.4. Tóm tắt các hệ số co giãn cho các mô hình
Mô hình
Phương trình
Độ dốc
Độ co giãn
X
Y = β1 + β 2 X
β2
β2 *
Tuyến tính
Y
Tuyến tính
log
hay
LnY = β1 + β 2 ln X
Y
X
β2
β2
log-log
Log-lin
lnY = β1 + β 2 X
Lin-log
Y = β1 + β 2 ln X
1
Y = β1 + β 2
X
Nghịch
ñảo
β 2 (Y )
β2 ( X ) *
1
X
1
β2
1
−β2 2
X
β2 *
Y
1
−β2
*
XY
và của chỉ số Fisher (cơ cấu chứng khoán thị trường), 1971 – 1980(14)
Suất sinh lợi dựa trên
Năm
Suất sinh lợi của
Afuture Fund (%)
chỉ số Fisher (%)
Y
X
1971
37.5
19.5
1972
19.2
8.5
1973
-35.2
-29.3
1974
-42.0
-26.5
1975
63.7
62.9
1976
19.3
45.5
1977
3.6
9.5
1978
20.0
14.0
1979
40.3
35.3
1980
37.5
31.0
Đường ñặc tính của phân tích ñầu tư có thể biểu diễn như sau:
Yi = α i + βi X i + ui
(3.1)
Trong một số kết quả thực nghiệm ñã cho thấy α i dương và có ý
nghĩa thống kê và một số khác lại cho thấy nó không khác 0 và
trường hợp sau có thể viết lại mô hình dưới dạng:
Yi = βi X i + ui
(14)
(11)
Nếu ta gọi
tính.
X i*
= (1 / X i ) (2.48) có các thông số và các biến Yi và
X i*
tuyến
(3.2)
Nguồn: Haim Levy & Marshall Sarnat, Portfolio and Investment Selection:
Theory and Practive, Prentice – Hall, Engwood Cliffs, N.J., 1984, trang 730 & 738.
Số liệu này ñược thu thập bởi các tác giả từ Weisenberg Investment Sevice,
Investment Companies, lần xuất bản 1981.
21
22
1975
1976
1977
1978
1979
1980
Nếu quyết ñịnh sử dụng mô hình (2.1), ta có kết quả hồi quy sau(15):
Yˆ i = 1.0899 X i
r 2 thô = 0.7825
t = ( 5.6884 )
(3.3)
2.20
2.11
1.94
1.97
2.06
2.02
0.75
1.08
1.81
1.39
1.20
1.17
Chạy mô hình hồi quy (3.1) và sử dụng bảng số liệu 2.1, ta có kết quả
Sau ñó ta dùng mô hình tuyến tính hai biến ñể làm thích hợp với dữ
sau:
liệu ñã cho trong bảng 3.2, ta thu ñược các kết quả như sau(17):
Yˆt = 2.6911 − 0.4795 X t
Yˆi = 1.2797
+ 1.0691X 1
t = ( 0.1664 ) +
( 4.4860 )
r 2 = 0.7155
(3.4)
Từ những kết quả này ta không thể bác bỏ giả thuyết cho rằng giá trị
ñúng của tung ñộ gốc bằng 0, do vậy ta xác nhận việc sử dụng (3.2),
tức là hồi quy qua gốc tọa ñộ.
( )
( )
var ( βˆ ) = 0.0129; se ( βˆ ) = 0.01140;σˆ
var βˆ1 = 0.0148; se βˆ1 = 0.1216
2
2
(3.5)
2
= 0.01656
r 2 = 0.6628
3.2. MỘT ÁP DỤNG CỦA MÔ HÌNH LOG TUYẾN TÍNH: SỰ
Thực hiện tính toán, ta thu ñược các kết quả sau:
TIÊU THỤ CAFÉ (CÀ PHÊ) Ở HOA KỲ NĂM 1970 – 1980
lnY =
Xét dữ liệu ñã cho trong bảng 3.2
Bảng 3.2. Tiêu thụ Coffee ở Hoa Kỳ (Y) trong tương quan
với giá bán lẻ thực tế trung bình (X), 1970 – 1980(16).
Y
X
Năm
(Số ly 01 người
(Giá bán lẽ trung
uống mỗi ngày)
bình mỗi ly)
1970
2.57
0.77
1971
2.50
0.74
1972
2.35
0.72
1973
2.30
0.73
1974
2.25
0.76
0,7774
– 0,2530 lnXt
2
r = 0,7448
(3.6)
F1,9 = 26,27
Với Yt = tiêu dùng cà phê, ly/người/ngày, và Xt = giá thực của cà phê,
USD/pao.
Từ các kết quả này, ta thấy hệ số co giãn giá cả là -0,25, có nghĩa là
với 1% gia tăng mức giá thực của 1 pao cà phê, mức cầu cà phê (tính
bằng số ly cà phê tiêu dùng một ngày) bình quân giảm ñi 0,25%. Do
giá trị hệ số co giãn giá cả là 0,25 nhỏ hơn 1 về giá trị tuyệt ñối, ta có
thể nói rằng cầu cà phê không có tính co giãn về giá cả.
Bây giờ, một cách ñể ta có thể so sánh hai mô hình là tính một ñại
(15)
Kết quả in ra của SAS trong phụ lục 3A, mục 3A.1
Lưu ý: giá danh nghĩa ñược lấy từ chỉ số tiêu dùng (CPI) cho thực phẩm và ñồ
uống, 1967 = 100
Nguồn: Dữ liệu Y lấy từ tóm lược của công trình nghiên cứu Quốc gia về uống Café,
Nhóm dữ liệu Elkins Park, Peen., 1981 và dữ liệu về X danh nghĩa (nghĩa là X tính
theo giá hiện tại) lấy từ Niealsen Food Index A.C.Nielsen, New York, 1981.
(16)
lượng gần ñúng của hệ số co giãn giá cả cho mô hình (3.5). Điều ñó
có thể ñược thực hiện như sau:
(17)
Kết quả in ra của SAS trong phụ lục 3A, mục 3A.2
23
24
Hệ số co giãn E của biến Y (ví dụ lượng cầu) ñối với một biến khác X
Yˆt
= −16329.0 + 2584.8 X t
ñược ñịnh nghĩa là:
t
= ( −23.494 )
Giá tri p =
( 27.549 )
*
( 0.0000 ) ( 0.0000 )*
r 2 = 0.9832
% Thay ñổi của Y
E=
* là giá trị rất nhỏ.
% Thay ñổi của X
=
=
(∆Y / Y ) ⋅ 100
(∆X / X ) ⋅ 100
Giải thích theo cách vừa trình bày, hệ số ñộ dốc khoảng 2585 có
(3.7)
∆Y X
⋅
∆X Y
= (hệ số ñộ dốc)(X/Y)
Với ∆ biểu thị thay ñổi (nhỏ). Nếu ∆ ñủ nhỏ, ta có thể thay thế
∆Y / ∆X bởi dạng ñạo hàm, dY/dX. Bây giờ ñối với mô hình tuyến
tính (3.6), ước lượng của hệ số ñộ dốc ñược tính bởi hệ số ước lượng
β 2 , trong hàm cầu cà phê là -0,4795. Như (3.7) biểu thị, ñể tính ñộ
co giãn, ta phải nhân hệ số ñộ dốc này với tỷ lệ (X/Y), tức là giá cả
chia cho số lượng. Nhưng ta chọn giá trị nào của X và Y? Như Bảng
nghĩa là trong khoảng thời gian của mẫu, lượng cung tiền tăng lên
1%, bình quân, kéo theo sự gia tăng GNP khoảng 25,85 tỷ USD.
Trước khi tiếp tục, lưu ý rằng nếu muốn tính hệ số co giãn cho các
mô hình log-lin hay lin-log, ta có thể thực hiện từ ñịnh nghĩa hệ số co
giãn ở trên, cụ thể, (dY/dX)(X/Y). Trên thực tế, khi biết dạng hàm số
của mô hình, ta có thể tính các hệ số co giãn bằng cách áp dụng ñịnh
nghĩa ở trên.
3.4. MỘT ÁP DỤNG CỦA MÔ HÌNH NGHỊCH ĐẢO: ĐƯỜNG
CONG PHILLIPS CỦA ANH QUỐC, 1950-1966
Ta có bảng số liệu sau:
Bảng 3.3. Tỷ lệ tăng lương hàng năm và tỷ lệ thất nghiệp,
1950
Anh Quốc, 1950-1966
Tăng lương hàng
năm, %
Y
1,8
1951
1952
1953
1954
1955
1956
1957
1958
1959
8,5
8,4
4,5
4,3
6,9
8,0
5,0
3,6
2,6
3.2 biểu thị, có 11 cặp giá trị giá cả (X) và số lượng (Y). Nếu ta sử
dụng tất cả các giá trị này, ta sẽ có 11 ước lượng của ñộ co giãn giá
cả.
Tuy nhiên trên thực tế, hệ số co giãn ñược tính bằng giá trị trung bình
hay bình quân của Y và X. Tức là, ta có một ước lượng về hệ số co
giãn trung bình.
3.3. MỘT ÁP DỤNG CỦA MÔ HÌNH NỬA LOG
Quay lại với số liệu trong Bảng 2.3, ta có các kết quả hồi quy như
sau:
Năm
Thất nghiệp, %
X
1,4
1,1
1,5
1,5
1,2
1,0
1,1
1,3
1,8
1,9
25
1960
1961
1962
1963
1964
1965
1966
26
2,6
4,2
3,6
3,7
4,8
4,3
4,6
1,5
1,4
1,8
2,1
1,5
1,3
1,4
KẾT LUẬN VÀ KIẾN NGHỊ
Sau gần một năm nghiên cứu ñề tài “Mở rộng mô hình hồi quy
tuyến tính hai biến”, tác giả nhân thấy ñây là ñề tài rất hay, rất bổ ích.
Hiện chưa có giáo trình, tài liệu chính thức nào bằng tiếng việt ñể
mọi người tham khảo. Điểm hạn chế của ñề tài này là tác giả mới tiếp
Việc xây dựng một mô hình nghịch ñảo (2.48) thích hợp với chuỗi số
liệu cho ta các kết quả sau:
cận với các mô hình thông qua hai biến việc này dẫn ñến các mô hình
nhiều hơn hai biến chưa ñược nghiên cứu hết. Nếu có ñiều kiện tác
(19)
Yt = −1, 4282 + 8,2743 (1 / X t ) r = 0,3849
2
(3.8)
giả sẽ tiếp tục nghiên cứu và bổ sung ñể luận văn ñược hoàn chỉnh
hơn.
Hình 3.1. Đường cong Philips của Anh Quốc, 1950 – 1966
Đường hồi quy ước lượng ñược biểu diễn trong Hình 3.1. Từ hình
này ta thấy rõ rằng giới hạn bên dưới của tốc ñộ thay ñổi mức lương
là -1,43, tức là khi X tăng lên vô hạn, tỷ lệ phần trăm giảm sút của
mức lương sẽ không lớn hơn 1,43%/năm.
(19)
Kết quả in ra của SAS trong phụ lục 3A, mục 3A.3
- Xem thêm -