Mở rộng mô hình hồi quy tuyến tính hai biến

  • Số trang: 13 |
  • Loại file: PDF |
  • Lượt xem: 29 |
  • Lượt tải: 0
thuvientrithuc1102

Đã đăng 15337 tài liệu

Mô tả:

1 2 BỘ GIÁO DỤC VÀ ĐÀO TẠO ĐẠI HỌC ĐÀ NẴNG Công trình ñược hoàn thành tại ĐẠI HỌC ĐÀ NẴNG HUỲNH NGỌC TUẤN MỞ RỘNG MÔ HÌNH HỒI QUY Người hướng dẫn khoa học: TS. CAO VĂN NUÔI Phản biện 1: TS. NGUYỄN DUY THÁI SƠN TUYẾN TÍNH HAI BIẾN Phản biện 2: GS.TS. LÊ VĂN THUYẾT Chuyên ngành : PHƯƠNG PHÁP TOÁN SƠ CẤP Mã số: 60.46.40 Luận văn ñược bảo vệ tại Hội ñồng chấm luận văn tốt nghiệp Thạc sĩ khoa học họp tại Đại học Đà Nẵng vào ngày 02 tháng 02 năm 2012. TÓM TẮT LUẬN VĂN THẠC SĨ KHOA HỌC * Có thể tìm hiểu luận văn tại: - Trung tâm Thông tin - Học liệu, Đại học Đà Nẵng - Thư viện trường Đại học Sư phạm, Đại học Đà Nẵng Đà Nẵng - Năm 2012 3 4 cách có hệ thống với các ví dụ minh họa ñầy ñủ cho phần lý thuyết MỞ ĐẦU 1. LÝ DO CHỌN ĐỀ TÀI Việc xác ñịnh một cách ñịnh lượng trong kinh tế ñược khảo sát khá kỹ trong bộ môn kinh tế lượng. Bộ môn này, ra ñời vào những năm 1930 của thế kỷ XX, cho ñến nay môn khoa học này ñã ñem lại cho các nhà kinh tế một công cụ sắc bén, nhất là trong ước lượng, kiểm ñịnh các quan hệ kinh tế, dự báo các thay ñổi kinh tế vĩ mô quan trọng như lãi suất, tỉ lệ lạm phát, GDP…các mô hình kinh tế như: Hồi quy tuyến tính, mô hình log tuyến tính, mô hình nửa log (semilog),.... Hiện nay giáo trình và tài liệu trình bày một cách có hệ thống kiến thức về mở rộng mô hình hồi quy tuyến tính tổng quát trong kinh tế lượng bằng ngôn ngữ toán học vẫn còn hạn chế. Vì vậy, tôi chọn ñề tài “MỞ RỘNG MÔ HÌNH HỒI QUY TUYẾN TÍNH HAI BIẾN” ñể làm luận văn tốt nghiệp của mình. 2. MỤC ĐÍCH NGHIÊN CỨU Tác giả rất hi vọng ñây sẽ là tài liệu tham khảo bổ ích về mở rộng mô hình hồi quy tuyến tính hai biến và áp dụng của nó trong thực tế. 3. ĐỐI TƯỢNG VÀ PHẠM VI NGHIÊN CỨU 3.1. Đối tượng: Áp dụng mô hình hồi quy trong kinh tế lượng. 3.2. Phạm vi nghiên cứu: Mô hình hồi quy tuyến tính hai biến và mở rộng mô hình hồi quy tuyến tính hai biến. 4. PHƯƠNG PHÁP NGHIÊN CỨU Tham khảo, phân tích, tổng hợp, hệ thống các tài liệu chuyên khảo và các bài báo trên internet khác nhau có liên quan ñến hồi quy tuyến tính và ứng dụng trong một số vấn ñề kinh tế. Từ ñó trình bày một ñã trình bày. 5. Ý NGHĨA KHOA HỌC VÀ THỰC TIỄN CỦA ĐỀ TÀI 5.1. Ý nghĩa khoa học: Hệ thống kiến thức về “mở rộng mô hình hồi quy tuyến tính hai biến” và ứng dụng vào giải một số bài toán kinh tế lượng dựa trên số liệu thực tế. 5.2. Ý nghĩa thực tiễn: Đề tài hoàn thành trở thành tài liệu tham khảo cho giáo viên, sinh viên ở các trường ñại học và cao ñẳng, các bạn yêu toán và các ứng dụng của toán trong kinh tế, ñặc biệt là kinh tế lượng. 6. CẤU TRÚC LUẬN VĂN Luận văn gồm 3 chương: CHƯƠNG 1. MÔ HÌNH HỒI QUY TUYẾN TÍNH CỔ ĐIỂN Định nghĩa mô hình hồi quy tuyến tính cơ bản và các tích chất liên quan. CHƯƠNG 2. CÁC MỞ RỘNG CỦA HỒI QUY TUYẾN TÍNH HAI BIẾN Trình bày sự mở rộng về hồi quy tuyến tính hai biến. CHƯƠNG 3. MỘT SỐ ÁP DỤNG CỦA CÁC MÔ HÌNH MỞ RỘNG TỪ MÔ HÌNH HỒI QUY TUYẾN TÍNH HAI BIẾN Trình bày một số áp dụng của mô hình hồi quy tuyến tính hai biến mở rộng. 5 6 CHƯƠNG 1. MÔ HÌNH HỒI QUY TUYẾN TÍNH CỔ ĐIỂN 1.1. KHÁI NIỆM HÀM HỒI QUY ĐÁM ĐÔNG Từ bảng trên ta tính ñược: Bảng 1.2. Các thông số về xác suất và trung bình X→ Giả thiết rằng một cụm dân cư có 60 hộ dân. Giả sử rằng chúng ta chỉ quan tâm ñến việc nghiên cứu mối quan hệ giữa ñại lượng Y tiêu p (Y | X i ) ↓ dùng hàng tuần và ñại lượng X khả năng thu nhập khả dụng của mỗi gia ñình. Xác suất có Giả sử chúng ta chia 60 gia ñình này thành 10 nhóm có thu nhập xấp xỉ nhau và ñánh giá thu chi của các gia ñình này trong từng nhóm thu nhập. Số liệu ñược cho bởi bảng sau: ñiều kiện p (Y | X i ) Bảng 1.1. Số liệu thu nhập của 60 gia ñình X→ 80 100 120 140 160 180 200 220 240 260 1/5 1/6 1/5 1/7 1/6 1/6 1/5 1/7 1/6 1/7 1/5 1/6 1/5 1/7 1/6 1/6 1/5 1/7 1/6 1/7 1/5 1/6 1/5 1/7 1/6 1/6 1/5 1/7 1/6 1/7 1/5 1/6 1/5 1/7 1/6 1/6 1/5 1/7 1/6 1/7 - 1/6 - 1/7 1/6 1/6 - 1/7 1/6 1/7 - - - 1/7 - - - 1/7 - 1/7 77 89 101 113 125 137 149 161 173 Trung bình Y↓ 80 100 120 140 160 180 200 220 240 260 Chi tiêu 55 65 79 102 102 110 120 135 137 150 của Y tiêu 60 70 84 93 107 115 136 137 145 152 Bảng 1.2 ñược thể hiện qua các hình sau: dùng 65 74 90 95 110 120 140 140 155 175 gia ñình 70 80 94 103 116 135 145 157 175 180 hàng - 88 -- 113 125 140 - 160 189 185 - - - 115 - - - 162 - 191 325 462 445 707 678 750 685 1043 966 1211 có ñiều kiện 65 tuần Y, $ Tổng cộng Bảng 1.1, các giá trị trung bình của Y tăng khi X tăng. Nếu chúng ta tập trung vào các ñiểm có kích thước lớn ñể thể hiện các giá trị trung bình của Y thì các trung bình có ñiều kiện này nằm trên một Hình 1.1. Phân phối có ñiều kiện của chi tiêu ñối với ñường thẳng với một ñộ dốc dương. Đường thẳng này ñược gọi là mức ñộ thu nhập khác nhau của Bảng 1.1 ñường hồi quy tổng thể. 7 8 1.2.2. Sự tuyến tính theo các tham số Đó là kỳ vọng có ñiều kiện của Y, E (Y | X i ) là một hàm tuyến tính theo các tham số β của nó. Theo các hiểu này thì nó có thể tuyến tính hoặc không tuyến tính theo biến X. 1.3. SAI SỐ NGẪU NHIÊN Từ hình 1.1, nhận thấy rằng với một mức thu nhập X i , mức chi tiêu của một hộ gia ñình có thể nằm xung quanh giá trị trung bình của các hộ gia ñình có thu nhập X i . Điều này ta có thể diễn tả ñộ lệch của Yi xung quanh giá trị kỳ vọng của nó: Yi = E (T | X i ) + ui Hình 1.2. Đường hồi quy tổng thể của Bảng 1.2 Từ hình 1.1 và 1.2, ta nhận thấy rằng mỗi trung bình có ñiều kiện trong ñó, ñộ lệch ui là biến số ngẫu nhiên không thể quan sát. Về thuật ngữ chuyên môn, ta gọi ui là số hạng nhiễu ngẫu nhiên hay E(Y|Xi) là một hàm của X i . Kí hiệu: E (Y | X i ) = f ( X i ) , i = 1, n (1.3) (1.1) trong ñó, f ( X i ) là hàm của biến giải thích X i , phương trình (1.1) số hạng sai số ngẫu nhiên. Công thức (1.3) có thể cho chúng ta biết rằng chi tiêu của một gia ñình khi biết mức thu nhập của họ: ñược gọi là hàm hồi quy tổng thể hai biến (Population Regression (1) E (T | X i ) chi tiêu trung bình của tất cả các gia ñình có cùng thu Function - PRF) hay ngắn gọn hơn là hồi quy tổng thể (Population nhập (yếu tố này tất yếu). Regression - PR). Theo Keynes, hàm tiêu dùng Y theo thu nhập X (2) ui yếu tố ngẫu nhiên hay không hệ thống. như sau: 1.4. HÀM HỒI QUY MẪU E (Y | X i ) = β1 + β 2 X i (1.2) Chúng ta cần phải tính PRF trên cơ sở thông tin mẫu. Giả thiết trong ñó, β1 , β 2 gọi là hệ số hồi quy. rằng ta không có thông tin gì về Bảng 1.1 và ta chỉ có thông tin ngẫu Phương trình (1.2) ñược gọi là hàm hồi quy tổng thể tuyến tính. nhiên tương ứng các giá trị Y với X (ñược cho ở bảng sau). 1.2. Ý NGHĨA CỦA THUẬT NGỮ “TUYẾN TÍNH” Bảng 1.3. Mẫu ngẫu nhiên từ tổng thể bảng 1.1 (1) Y X Y X Đó là kỳ vọng có ñiều kiện của Y là một hàm tuyến tính của X i . 70 80 115 180 Về mặt hình học, ñường cong tuyến tính trong trường hợp này là 65 100 120 200 ñường thẳng. 90 120 140 220 95 140 155 140 110 160 150 260 1.2.1. Sự tuyến tính theo các biến số 9 10 Từ Bảng 1.3 ta có thể dự ñoán ñược chi tiêu trung bình hàng tuần Y Tóm lại, mục tiêu chính của ta trong phân tích hồi quy là tính PRF trong tổng thể tương ứng X ñược chọn không? Hay ta có thể tính Yi = β1 + β 2 X i + ui (1.4) ñược PRF từ bảng dữ liệu mẫu hay không? Việc tính này cũng ñặt ra Trên cơ sở của SRF Yˆi = βˆ1 + βˆ2 X i + uˆi (1.9) nghi vấn không tính chính xác ñược PRF bởi vì có sự dao ñộng trong việc lấy mẫu. Giả sử ta lấy ngẫu nhiên một mẫu ngẫu nhiên khác từ bảng 1.1. Bảng 1.4. Mẫu ngẫu nhiên từ tổng thể bảng 1.1 (2) Y X Y X 55 80 120 180 88 100 145 200 90 120 125 220 80 140 145 240 118 160 175 260 1.5. MÔ HÌNH HỒI QUY TUYẾN TÍNH CỔ ĐIỂN 1.5.1. Ước lượng các hệ số của mô hình hồi quy bằng phương pháp bình phương tối thiểu thông thường OLS (Ordinary Least Square) 1.5.1.1. Các giả ñịnh của mô hình hồi quy tuyến tính cổ ñiển 1.5.1.2. Phương pháp bình phương tối thiểu thông thường Từ hàm hồi quy (1.9): ui = Yi − βˆ1 − βˆ2 X i n vậy ∑ ui2 i =1 Từ bảng 1.3 và 1.4, chúng ta ñược ñồ thị phân tán như sau: = ∑( n Yi − βˆ1 − βˆ2 X i i =1 ) 2 (1.10) Điều kiện ñể (1.10) ñạt cực trị là: βˆ 1 = Y − βˆ 2 X (1.15) n βˆ2 = ∑y x i i i =1 n ∑ (1.17) xi2 i =1 với x i = X i − X và y i = Yi − Y . 1.5.1.3. Tính chất của hàm hồi quy mẫu theo OLS Tính chất của ước lượng tham số: (1) β̂1 và β̂ 2 là duy nhất ứng với một mẫu xác ñịnh gồm n quan sát (Xi,Yi). (2) β̂1 và β̂ 2 là các ước lượng ñiểm của β1 và β2. Giá trị của β̂1 và Hình 1.3. Đường hồi quy mẫu của 2 mẫu bảng 1.3 và 1.4 Biểu thức tương ứng với (1.2) có thể ñược viết lại: Yˆ = βˆ + βˆ X i 1 2 i β̂ 2 thay ñổi theo mẫu dùng ñể ước lượng. (1.8) 11 12 Tính chất của hàm hồi quy mẫu: (1) Hàm hồi quy mẫu ñi qua giá trị trung bình của dữ liệu. (2) Giá trị trung bình của ước lượng bằng giá trị trung bình của quan ^ sát ñối với biến phụ thuộc E  Y  = Y .   (3) Giá trị trung bình của phần dư bằng 0: E ( ui ) = 0 . βˆ 1 − t ( n −2,1−α / 2) se(βˆ 1 ) ≤ β1 ≤ βˆ 1 + t ( n −2,1−α / 2) se(βˆ 1 ) βˆ 2 − t ( n −2,1−α / 2) se(βˆ 2 ) ≤ β 2 ≤ βˆ 2 + t ( n − 2,1−α / 2 ) se(βˆ 2 ) 1.5.2.2. Kiểm ñịnh giả thiết về hệ số hồi quy H 0 : β 2 = β*2 Giả thiết: ∑u Y = 0 . i i i =1 n (5) Các phần dư ui và X i không tương quan với nhau: ∑u X i i =0. i =1 1.5.1.4. Phân phối của β̂1 và β̂ 2 β̂1 E βˆ = β Kỳ vọng ( ) 1 ( ) E βˆ 2 = β 2 1 n Phương sai ( ) var βˆ 1 = ∑X i =1 n 2 i n∑ x i =1 σ 2 2 i ( ) chuẩn σ βˆ = 1 ∑X i =1 n phối βˆ 2 − β*2 βˆ − β*2 < t ( n −2,α / 2) hoặc 2 > t ( n −2,1−α / 2) thì bác bỏ H 0 . se(βˆ 2 ) se(βˆ 2 ) βˆ 2 − β*2 ≤ t ( n −2,1−α / 2) thì ta không thể bác bỏ H 0 se(βˆ ) 2 1.5.3. Độ thích hợp của hàm hồi quy - R 2 1.5.3.1 Hệ số xác ñịnh R 2 i =1 2 2 i n ∑ x i2 σ i =1 Phân  βˆ 2 − β 2 ≤ t ( n − 2,1−α / 2)  = 1 − α  se(βˆ 2 )  ñiều kiện quyết ñịnh: (1) Nếu t ( n − 2,α / 2 ) ≤ σ2 var βˆ 2 = n ∑ x i2 n Sai số    mệnh ñề xác suất: P t ( n − 2 ,α / 2 ) ≤ (1)Nếu β̂ 2 (1.25) H1 : β 2 ≠ β*2 n (4) Các phần dư ui và Yi không tương quan với nhau: (1.24) n   X i2   ∑ 2 ˆβ ~ N β , i =1 σ 1  1 n 2   n∑ x i  i =1   σ βˆ = 2  n   ∑ x i yi  R 2 = ni =1 n  = rX2 ,Y ∑ x i2 ∑ y i2 σ n ∑ x i2 i =1   2 ˆβ ~ N β , σ 2  2 n 2 xi  ∑ i =1  i =1       1.5.2. Khoản tin cậy và kiểm ñịnh giả thiết các hệ số hồi quy (1.35) i =1 1.5.3.2 Ý nghĩa của hệ số xác ñịnh R 2 (1) Đo tỷ lệ hay số phần trăm của toàn bộ sai lệch của Y với giá trị trung bình của chúng ñược giải thích bằng mô hình. (2) Hệ số R 2 ñược sử dụng ñể ño mức ñộ phù hợp của hàm hồi quy. 1.5.3.3 Tính chất của hệ số xác ñịnh R 2 1.5.2.1. Khoản tin cậy của các hệ số hồi quy (1) 0 ≤ R 2 ≤ 1 . Với R 2 = 0 thể hiện X và Y ñộc lập thống kê. R 2 = 1 Ước lượng khoảng cho hệ số hồi quy với mức ý nghĩa α như sau: thể hiện X và Y phụ thuộc tuyến tính hoàn hảo. 13 14 Nếu R 2 → 1 thì mô hình hồi quy càng thích hợp. n Nếu R 2 → 0 thì mô hình hồi quy ít thích hợp. βˆ2 = (2) R 2 không xét ñến quan hệ nhân quả. ∑X Y i i i =1 n ∑ (2.6) X i2 i =1 1.5.4. Dự báo bằng mô hình hồi quy hai biến Khoảng tin cậy cho dự báo: Ŷo ± t ( n − 2,1−α / 2 ) se(Ŷo ) σ2 var βˆ2 = n X i2 ( ) Nhận xét: X 0 càng lệch ra khỏi giá trị trung bình thì sai số dự báo càng lớn. (2.7) ∑ i =1 1.6. ĐỊNH LÝ GAUSS – MARKOV So sánh các công thức với các công thức khi có tung ñộ gốc trong mô Nội dung của ñịnh lý này ñược phát biểu: “Cho trước các giả hình: thuyết của mô hình hồi quy tuyến tính cổ ñiển, các hàm ước lượng n n bình phương tối thiểu, trong nhóm các hàm ước lượng tuyến tính βˆ2 = không chệch, có phương sai nhỏ nhất, chúng là các hàm ước lượng ∑x y i i i =1 n ∑x σ ; var βˆ2 = n 2 i không chệch tuyến tính tốt nhất”. ( ) 2 ∑x 2 i ; σˆ 2 = ∑ uˆ 2 i i =1 n−2 i =1 i =1 Sự khác biệt giữa các công thức rất rõ ràng: CHƯƠNG 2. CÁC MỞ RỘNG CỦA HỒI QUY TUYẾN TÍNH HAI BIẾN 2.1. HỒI QUY QUA GỐC phương và tích chéo thô nhưng trong mô hình có tung ñộ gốc, ta sử dụng tổng bình phương và tích chéo hiệu chỉnh. (2) Số bậc tự do ñể tính σˆ 2 trong hai trường hợp lần lượt là ( n − 1) và Xét hàm hồi quy tổng thể (PRF) hai biến có dạng sau: Yi = β 2 X + ui (1) Trong mô hình không có tung ñộ gốc, ta sử dụng tổng bình (2.1) ( n − 2) Trong mô hình này, tung ñộ gốc không có hay bằng 0 và ñược gọi là Mặc dù trong mô hình không có tung ñộ gốc hay tung ñộ gốc bằng mô hình hồi quy qua gốc. không có thể thích hợp trong một số trường hợp, tuy nhiên khi sử Làm sao chúng ta ước lượng các mô hình như (2.1) và mô hình này dụng mô hình này ta cần chú ý: ñưa ra các vấn ñề ñặc biệt như thế nào? Để trả lời câu hỏi này, ta viết mô hình hồi quy mẫu (SRF) của (2.1) là: Yi = βˆ2 X i + uˆi n (a) ∑ uˆ , luôn bằng 0 trong mô hình có tung ñộ gốc (mô hình quy i i =1 (2.5) ước) nhưng không cần phải bằng 0 trong trường hợp không có tung n ñộ gốc. Nói một cách ngắn gọn, ∑ uˆ i i =1 mô hình hồi quy qua gốc. không nhất thiết bằng 0 với 15 16 (b) r 2 , hệ số xác ñịnh luôn không âm với mô hình quy ước lượng bằng hồi quy OLS. Do tính chất tuyến tính này, các mô hình Do các ñặc ñiểm của mô hình, ta cần rất cẩn thận khi sử dụng mô như thế ñược gọi là mô hình log-log, log kép, hay tuyến tính log. hình hồi quy qua gốc tọa ñộ bằng 0. Trừ khi chúng ta có một tiên Trong mô hình hai biến, cách ñơn giản nhất ñể quyết ñịnh xem mô nghiệm rất mạnh, ta cần phải sử dụng mô hình quy ước có tung ñộ hình tuyến tính lôgarit có thích hợp với số liệu hay không là vẽ lên ñồ gốc. thị phân tán biểu diễn lnYi theo lnXi và xem xem nếu các ñiểm phân Điều này có lợi thế kép: tán nằm gần ñúng theo một ñường thẳng. (1) Thứ nhất: Nếu số hạng tung ñộ gốc ñưa vào mô hình nhưng nó trở 2.4. MÔ HÌNH NỬA LOG nên không có ý nghĩa về mặt thống kê, ta có một mô hình hồi quy 2.4.1. Mô hình log – lin (3) qua gốc tọa ñộ . Ta có bảng số liệu sau: (2) Thứ hai: nếu thật sự có tung ñộ gốc nhưng ta khẳng ñịnh rằng ñó Bảng 2.2.(6) Tổng sản phẩm nội ñịa tính theo giá năm 1987 là hồi quy qua gốc tọa ñộ thì ta sẽ phạm sai số ñặc trưng, và như vậy của Hoa Kỳ, 1972 – 1991 ta sẽ vi phạm giả thuyết của mô hình hồi quy tuyến tính cổ ñiển. Năm GDP Năm GDP Năm GDP 2.2. TỶ LỆ VÀ ĐƠN VỊ ĐO 1972 3107.1 1979 3796.8 1986 4404.5 Việc chuyển ñổi tỉ lệ không tác ñộng tới những tính chất của ước 1973 3268.6 1980 3776.3 1987 4539.9 lượng OLS. 1974 3248.1 1981 3843.1 1988 4718.6 2.3. MÔ HÌNH LOG TUYẾN TÍNH 1975 3221.7 1982 3760.3 1989 4838 1976 3380.8 1983 3906.6 1990 4877.5 1977 3533.3 1984 4148.5 1991 4821 1978 3703.5 1985 4279.8 -- -- Xem xét mô hình sau với tên gọi là mô hình hồi quy mũ: Yi = β1 X iβ2 eui (2.34) Phương trình có thể ñược biểu diễn dưới dạng sau: ln Yi = ln β1 + β 2 ln X i + ui (2.35) với ln là logarit tự nhiên nghĩa là logarit với cơ số e ( e = 2,718 ) Nếu ta viết (2.34) dưới dạng: ln Yi = α + β 2 ln X i + ui (2.36) với α = ln β1 , mô hình này tuyến tính theo các thông số α và β 2 , tuyến tính theo lôgarit của các biến Y và X. Mô hình có thể ñược ước (3) Henri Theil chỉ ra rằng nếu tung ñộ gốc thật sự không có, hệ số ñộ dốc có thể ñược ước lượng với ñộ chính xác lớn hơn rất nhiều so với trường hợp có tung ñộ gốc. Xem Introduction to Economertrics của Henri Theil, Prentice – Hall, Englewood Cliffs, N.J., 1978, trang 76. Giả sử ta muốn tìm tốc ñộ tăng trưởng GDP thực trong giai ñoạn này. Đặt Yt = GDP thực (RGDP) vào thời ñiểm t và Y0 = giá trị ban ñầu (năm 1972) của GDP thực. Bây giờ nhớ lại công thức tính lãi suất gộp nổi tiếng về tiền tệ, tài chính và ngân hàng. Yt = Y0 (1 + r )t (6) (2.38) Nguồn: Báo cáo của Tổng thống, tháng 1 năm 1993, bảng B-1 và B-2 trang 348 349 17 18 với r là tốc ñộ tăng trưởng gộp (theo thời gian) của Y. Lấy lôgarit tự nhiên (ln) của (2.38), ta có: ln Yt = ln Y0 + t ln(1 + r ) (2.39) bây giờ ñặt: β1 = lnY0 β 2 = ln(1 + r ) (2.40) (2.41) ta có thể viết (2.39) dưới dạng: ln Yt = β1 + β 2t (2.42) cộng thêm yếu tố nhiễu vào (2.42), ta có:(7) ln Yt = β1 + β 2t + ut (2.43) Mô hình này giống mọi mô hình tuyến tính khác ở chỗ các thông số β1 và β 2 là tuyến tính. Sự khác nhau duy nhất là biến hồi quy phụ thuộc vào lôgarit của Y và biến hồi quy ñộc lập là “thời gian”, lấy giá trị 1,2,3,... Các mô hình như (2.43) ñược gọi là mô hình bán lôgarit (semilog) do chỉ có một biến (trong trường hợp này là biến hồi quy phụ thuộc) xuất hiện dưới dạng lôgarit. Đối với các mục ñích mô tả, một mô hình trong ñó biến hồi quy phụ thuộc ñược lôgarit hóa sẽ ñược gọi là mô hình log-lin. 2.4.2. Mô hình Lin – log Ta có bảng số liệu sau: Bảng 2.3.(9) GNP và lượng cung tiền Hoa Kỳ năm 1973 – 1987 GNP GNP Năm M2 Năm M2 ( tỷ USD) ( tỷ USD) 1973 1359.3 861.0 1981 3052.6 1795.5 1974 1472.8 908.5 1982 3166.0 1954.0 1975 1598.4 1023.2 1983 3405.7 2185.2 (7) Ta ñưa thêm sai số vào vì công thức lãi suất gộp sẽ không thảo mãn chính xác. Nguồn báo cáo kinh tế của Tổng thống, 1989, số liệu GNP lấy từ bảng B-1 trang 308 và M2 từ bảng B-67 trang 385 (9) 1976 1977 1978 1979 1980 1782.8 1990.5 2249.7 2508.2 2723.0 1163.7 1286.7 1389.0 1500.2 1633.1 1984 1985 1986 1987 -- 3772.2 4014.9 4240.3 4526.7 -- 2363.6 2562.6 2807.7 2901.0 -- Lưu ý: Các số liệu GNP là số liệu hàng quý trên cơ sở tốc ñộ hàng năm ñã hiệu chỉnh theo mùa. M2 = tiền mặt + tiền gửi không kỳ hạn + séc du lịch + các loại tiền gửi ñược rút séc khác + hợp ñồng mua lại chứng khoán (RP) 1 ngày ñêm và Eurodollar + số dư MMMF (quỹ hỗ tương trên thị trường tiền tệ) + MMDAs (các tài khoản tiền gửi trên thị trường tiền tệ) + tiết kiệm và tiền gửi nhỏ. Giả sử ta có số liệu như trong bảng 2.3, với Y là GNP và X là lượng cung tiền. Tiếp theo, giả sử ta quan tâm ñến việc tìm xem GNP tăng lên bao nhiêu (về giá trị tuyệt ñối) nếu lượng cung tiền tăng lên 1%. Không giống mô hình tăng trưởng vừa thảo luận trong ñó ta quan tâm ñến việc tìm xem gia tăng phần trăm của Y khi X tăng lên 1 ñơn vị, bây giờ ta quan tâm ñến việc tìm sự thay ñổi tuyệt ñối của Y khi X thay ñổi ñi 1%. Một mô hình phục vụ mục tiêu này có thể ñược viết như sau: Yi = β1 + β 2 ln X i + ui (2.45) Với các mục ñích mô tả, mô hình như vậy là mô hình lin – log. 2.5. MÔ HÌNH NGHỊCH ĐẢO Các mô hình có dạng sau ñược gọi là mô hình nghịch ñảo.  1  Yi = β1 + β 2  (2.48)  + ui  Xi  19 20 Mặc dù mô hình này là phi tuyến theo biến X bởi vì biến X có dạng CHƯƠNG 3. MỘT SỐ ÁP DỤNG CỦA CÁC MÔ HÌNH MỞ RỘNG TỪ MÔ HÌNH HỒI QUY TUYẾN TÍNH nghịch ñảo, mô hình có dạng tuyến tính theo β1 và β 2 và do vậy mô hình là mô hình hồi quy tuyến tính.(11) Mô hình này có các ñặc ñiểm: khi X tiến dần tới vô cùng, số hạng 3.1. MỘT ÁP DỤNG CỦA MÔ HÌNH HỒI QUY TUYẾN TÍNH β 2 (1 / X ) dần tới không (lưu ý: β 2 không ñổi) và Y tiến tới giá trị giới CỔ ĐIỂN: ĐƯỜNG ĐẶC TÍNH CỦA LÝ THUYẾT CƠ CẤU hạn hay tiệm cận β1 . Do vậy, các mô hình như (2.48) tạo nên một giá ĐẦU TƯ CHỨNG KHOÁN trị tiệm cận hay giới hạn mà biến phụ thuộc sẽ nhận khi giá trị của Ta có bảng số liệu về suất sinh lợi hàng năm (%) của Afuture Fund: biến X dần tới vô cùng. Bảng 3.1. Suất sinh lợi trung bình của Afuture Fund Bảng tóm tắt các ñặc trưng nổi bật các mô hình vừa trình bày ở trên: Bảng 2.4. Tóm tắt các hệ số co giãn cho các mô hình Mô hình Phương trình Độ dốc Độ co giãn X Y = β1 + β 2 X β2 β2   * Tuyến tính Y  Tuyến tính log hay LnY = β1 + β 2 ln X Y   X β2  β2 log-log Log-lin lnY = β1 + β 2 X Lin-log Y = β1 + β 2 ln X 1 Y = β1 + β 2   X Nghịch ñảo β 2 (Y ) β2 ( X ) * 1  X 1   β2   1  −β2  2  X  β2   * Y  1  −β2  *  XY  và của chỉ số Fisher (cơ cấu chứng khoán thị trường), 1971 – 1980(14) Suất sinh lợi dựa trên Năm Suất sinh lợi của Afuture Fund (%) chỉ số Fisher (%) Y X 1971 37.5 19.5 1972 19.2 8.5 1973 -35.2 -29.3 1974 -42.0 -26.5 1975 63.7 62.9 1976 19.3 45.5 1977 3.6 9.5 1978 20.0 14.0 1979 40.3 35.3 1980 37.5 31.0 Đường ñặc tính của phân tích ñầu tư có thể biểu diễn như sau: Yi = α i + βi X i + ui (3.1) Trong một số kết quả thực nghiệm ñã cho thấy α i dương và có ý nghĩa thống kê và một số khác lại cho thấy nó không khác 0 và trường hợp sau có thể viết lại mô hình dưới dạng: Yi = βi X i + ui (14) (11) Nếu ta gọi tính. X i* = (1 / X i ) (2.48) có các thông số và các biến Yi và X i* tuyến (3.2) Nguồn: Haim Levy & Marshall Sarnat, Portfolio and Investment Selection: Theory and Practive, Prentice – Hall, Engwood Cliffs, N.J., 1984, trang 730 & 738. Số liệu này ñược thu thập bởi các tác giả từ Weisenberg Investment Sevice, Investment Companies, lần xuất bản 1981. 21 22 1975 1976 1977 1978 1979 1980 Nếu quyết ñịnh sử dụng mô hình (2.1), ta có kết quả hồi quy sau(15): Yˆ i = 1.0899 X i r 2 thô = 0.7825 t = ( 5.6884 ) (3.3) 2.20 2.11 1.94 1.97 2.06 2.02 0.75 1.08 1.81 1.39 1.20 1.17 Chạy mô hình hồi quy (3.1) và sử dụng bảng số liệu 2.1, ta có kết quả Sau ñó ta dùng mô hình tuyến tính hai biến ñể làm thích hợp với dữ sau: liệu ñã cho trong bảng 3.2, ta thu ñược các kết quả như sau(17): Yˆt = 2.6911 − 0.4795 X t Yˆi = 1.2797 + 1.0691X 1 t = ( 0.1664 ) + ( 4.4860 ) r 2 = 0.7155 (3.4) Từ những kết quả này ta không thể bác bỏ giả thuyết cho rằng giá trị ñúng của tung ñộ gốc bằng 0, do vậy ta xác nhận việc sử dụng (3.2), tức là hồi quy qua gốc tọa ñộ. ( ) ( ) var ( βˆ ) = 0.0129; se ( βˆ ) = 0.01140;σˆ var βˆ1 = 0.0148; se βˆ1 = 0.1216 2 2 (3.5) 2 = 0.01656 r 2 = 0.6628 3.2. MỘT ÁP DỤNG CỦA MÔ HÌNH LOG TUYẾN TÍNH: SỰ Thực hiện tính toán, ta thu ñược các kết quả sau: TIÊU THỤ CAFÉ (CÀ PHÊ) Ở HOA KỲ NĂM 1970 – 1980 lnY = Xét dữ liệu ñã cho trong bảng 3.2 Bảng 3.2. Tiêu thụ Coffee ở Hoa Kỳ (Y) trong tương quan với giá bán lẻ thực tế trung bình (X), 1970 – 1980(16). Y X Năm (Số ly 01 người (Giá bán lẽ trung uống mỗi ngày) bình mỗi ly) 1970 2.57 0.77 1971 2.50 0.74 1972 2.35 0.72 1973 2.30 0.73 1974 2.25 0.76 0,7774 – 0,2530 lnXt 2 r = 0,7448 (3.6) F1,9 = 26,27 Với Yt = tiêu dùng cà phê, ly/người/ngày, và Xt = giá thực của cà phê, USD/pao. Từ các kết quả này, ta thấy hệ số co giãn giá cả là -0,25, có nghĩa là với 1% gia tăng mức giá thực của 1 pao cà phê, mức cầu cà phê (tính bằng số ly cà phê tiêu dùng một ngày) bình quân giảm ñi 0,25%. Do giá trị hệ số co giãn giá cả là 0,25 nhỏ hơn 1 về giá trị tuyệt ñối, ta có thể nói rằng cầu cà phê không có tính co giãn về giá cả. Bây giờ, một cách ñể ta có thể so sánh hai mô hình là tính một ñại (15) Kết quả in ra của SAS trong phụ lục 3A, mục 3A.1 Lưu ý: giá danh nghĩa ñược lấy từ chỉ số tiêu dùng (CPI) cho thực phẩm và ñồ uống, 1967 = 100 Nguồn: Dữ liệu Y lấy từ tóm lược của công trình nghiên cứu Quốc gia về uống Café, Nhóm dữ liệu Elkins Park, Peen., 1981 và dữ liệu về X danh nghĩa (nghĩa là X tính theo giá hiện tại) lấy từ Niealsen Food Index A.C.Nielsen, New York, 1981. (16) lượng gần ñúng của hệ số co giãn giá cả cho mô hình (3.5). Điều ñó có thể ñược thực hiện như sau: (17) Kết quả in ra của SAS trong phụ lục 3A, mục 3A.2 23 24 Hệ số co giãn E của biến Y (ví dụ lượng cầu) ñối với một biến khác X Yˆt = −16329.0 + 2584.8 X t ñược ñịnh nghĩa là: t = ( −23.494 ) Giá tri p = ( 27.549 ) * ( 0.0000 ) ( 0.0000 )* r 2 = 0.9832 % Thay ñổi của Y E= * là giá trị rất nhỏ. % Thay ñổi của X = = (∆Y / Y ) ⋅ 100 (∆X / X ) ⋅ 100 Giải thích theo cách vừa trình bày, hệ số ñộ dốc khoảng 2585 có (3.7) ∆Y X ⋅ ∆X Y = (hệ số ñộ dốc)(X/Y) Với ∆ biểu thị thay ñổi (nhỏ). Nếu ∆ ñủ nhỏ, ta có thể thay thế ∆Y / ∆X bởi dạng ñạo hàm, dY/dX. Bây giờ ñối với mô hình tuyến tính (3.6), ước lượng của hệ số ñộ dốc ñược tính bởi hệ số ước lượng β 2 , trong hàm cầu cà phê là -0,4795. Như (3.7) biểu thị, ñể tính ñộ co giãn, ta phải nhân hệ số ñộ dốc này với tỷ lệ (X/Y), tức là giá cả chia cho số lượng. Nhưng ta chọn giá trị nào của X và Y? Như Bảng nghĩa là trong khoảng thời gian của mẫu, lượng cung tiền tăng lên 1%, bình quân, kéo theo sự gia tăng GNP khoảng 25,85 tỷ USD. Trước khi tiếp tục, lưu ý rằng nếu muốn tính hệ số co giãn cho các mô hình log-lin hay lin-log, ta có thể thực hiện từ ñịnh nghĩa hệ số co giãn ở trên, cụ thể, (dY/dX)(X/Y). Trên thực tế, khi biết dạng hàm số của mô hình, ta có thể tính các hệ số co giãn bằng cách áp dụng ñịnh nghĩa ở trên. 3.4. MỘT ÁP DỤNG CỦA MÔ HÌNH NGHỊCH ĐẢO: ĐƯỜNG CONG PHILLIPS CỦA ANH QUỐC, 1950-1966 Ta có bảng số liệu sau: Bảng 3.3. Tỷ lệ tăng lương hàng năm và tỷ lệ thất nghiệp, 1950 Anh Quốc, 1950-1966 Tăng lương hàng năm, % Y 1,8 1951 1952 1953 1954 1955 1956 1957 1958 1959 8,5 8,4 4,5 4,3 6,9 8,0 5,0 3,6 2,6 3.2 biểu thị, có 11 cặp giá trị giá cả (X) và số lượng (Y). Nếu ta sử dụng tất cả các giá trị này, ta sẽ có 11 ước lượng của ñộ co giãn giá cả. Tuy nhiên trên thực tế, hệ số co giãn ñược tính bằng giá trị trung bình hay bình quân của Y và X. Tức là, ta có một ước lượng về hệ số co giãn trung bình. 3.3. MỘT ÁP DỤNG CỦA MÔ HÌNH NỬA LOG Quay lại với số liệu trong Bảng 2.3, ta có các kết quả hồi quy như sau: Năm Thất nghiệp, % X 1,4 1,1 1,5 1,5 1,2 1,0 1,1 1,3 1,8 1,9 25 1960 1961 1962 1963 1964 1965 1966 26 2,6 4,2 3,6 3,7 4,8 4,3 4,6 1,5 1,4 1,8 2,1 1,5 1,3 1,4 KẾT LUẬN VÀ KIẾN NGHỊ Sau gần một năm nghiên cứu ñề tài “Mở rộng mô hình hồi quy tuyến tính hai biến”, tác giả nhân thấy ñây là ñề tài rất hay, rất bổ ích. Hiện chưa có giáo trình, tài liệu chính thức nào bằng tiếng việt ñể mọi người tham khảo. Điểm hạn chế của ñề tài này là tác giả mới tiếp Việc xây dựng một mô hình nghịch ñảo (2.48) thích hợp với chuỗi số liệu cho ta các kết quả sau: cận với các mô hình thông qua hai biến việc này dẫn ñến các mô hình nhiều hơn hai biến chưa ñược nghiên cứu hết. Nếu có ñiều kiện tác (19) Yt = −1, 4282 + 8,2743 (1 / X t ) r = 0,3849 2 (3.8) giả sẽ tiếp tục nghiên cứu và bổ sung ñể luận văn ñược hoàn chỉnh hơn. Hình 3.1. Đường cong Philips của Anh Quốc, 1950 – 1966 Đường hồi quy ước lượng ñược biểu diễn trong Hình 3.1. Từ hình này ta thấy rõ rằng giới hạn bên dưới của tốc ñộ thay ñổi mức lương là -1,43, tức là khi X tăng lên vô hạn, tỷ lệ phần trăm giảm sút của mức lương sẽ không lớn hơn 1,43%/năm. (19) Kết quả in ra của SAS trong phụ lục 3A, mục 3A.3
- Xem thêm -