Tài liệu Bài giảng kinh tế lượng

.PDF

105

hoang Báo vi phạm

Tải xuống 105

Mô tả:

Bài giảng KINH TẾ LƯỢNG Trần Minh Nguyệt Tháng 8 năm 2011 Chương 1 Giới thiệu về Kinh tế lượng 1 Tổng quan về kinh tế lượng 1.1 Kinh tế lượng là gì? • Kinh tế lượng có nghĩa là đo lường kinh tế. Trong tiếng Anh, thuật ngữ được sử dụng là "Econometrics" (economy= kinh tế, mmetrics= đo lường). • Kinh tế lượng là một phương pháp phân tích thực nghiệm để định lượng các vấn đề kinh tế, dựa trên cơ sở số liệu thực tế, các lý thuyết kinh tế và thống kê toán. 1.2 Mục đích của kinh tế lượng 1. Định lượng các mối quan hệ kinh tế, các cơ chế tác động dẫn đến các kết cục về hành vi của các tác nhân kinh tế trong kinh tế vi mô và tăng trưởng, ổn định trong kinh tế vĩ mô. 2. Dự báo các khả năng phát triển kinh tế hay diễn biến của các hiện tượng kinh tế có thể xảy ra trong tương lai dựa vào các mô hình đã được ước lượng. 3. Phân tích chính sách kinh tế dựa vào kết quả chạy các mô hình kinh tế lượng. Ba mục đích này thường gắn bó nhau trong quá trình xây dựng và sử dụng các mô hình kinh tế lượng. Có thể nói, ngày nay hầu hết các lĩnh vực quản lí kinh tế như kế hoạch, tài chính, ngân hàng, kinh doanh, tiếp thị, ngoại thương, ... đều sử dụng kinh tế lượng như một công cụ phổ biến. 2 Phương pháp luận của kinh tế lượng Phân tích kinh tế lượng được thực hiện theo các bước sau đây: 1. Nêu các giả thuyết hay giả thiết về các mối quan hệ giữa các biến kinh tế. Chẳng hạn kinh tế vĩ mô khẳng định rằng nhu cầu về một loại hàng hóa phụ thuộc theo quan hệ ngược chiều với giá của hàng hóa đó. 2. Thiết lập các mô hình toán học để mô tả mối quan hệ giữa các biến số này. Chẳng hạn lý thuyết kinh tế cho biết mối quan hệ ngược chiều giữa lượng cầu về một loại 2 2. Phương pháp luận của kinh tế lượng 3 hàng hóa và giá của hàng hóa đó, nhưng không nêu rõ cụ thể dạng hàm. Hàm cầu có thể có dạng phi tuyến, cũng có thể có dạng tuyến tính. Giả sử ta chọn đường cầu dạng tuyến tính thì dạng hàm sẽ là: Q = B1 + B2 P (1.1) với Q là lượng cầu, P là giá, B1 , B2 là các tham số. 3. Thiết lập mô hình kinh tế lượng. Phương trình (1.1) xác định một quan hệ chính xác giữa nhu cầu hàng hóa với giá của nó. Với mỗi giá trị của giá P xác định duy nhất một lượng cầu Q. Do các mối quan hệ kinh tế nói chung là không hoàn toàn chính xác, vì vậy: Q = B1 + B2 P + u (1.2) với u là sai số ngẫu nhiên. Sai số ngẫu nhiên u phân biệt mô hình kinh tế lượng (1.2) với mô hình toán học (1.1). 4. Thu thập số liệu. 5. Ước lượng các tham số của mô hình. Khi đã thiết lập được mô hình và thu thập dữ liệu phù hợp thì thì nhiệm vụ quan trọng là phải ước lượng cho những tham số chưa biết của mô hình. Ví dụ ta đã có mô hình về lượng cầu và giá của một loại hàng hóa là: Q = B1 + B2 P + u Với một bộ dữ liệu về lượng cầu Q và giá P , ta cần ước lượng các hệ số B1 , B2 , để từ đó xác định được sự phụ thuộc của lượng cầu Q vào giá P . 6. Phân tích kết quả: Phân tích xem các kết quả nhận được có phù hợp với lý thuyết kinh tế không, kiểm định giả thuyết. Vì dữ liệu thường được thu thập trên một mẫu rút ra từ tổng thể nghiên cứu nên thông tin do dữ liệu cung cấp không phản ánh đầy đủ toàn bộ thông tin của tổng thể, vì vậy việc ước lượng các tham số dựa trên dữ liệu chỉ cho các đánh giá gần đúng. Mặt khác mô hình kinh tế lượng mà ta thiết lập chịu ảnh hưởng của lý thuyết kinh tế được xác lập từ trước và ảnh hưởng của các kết quả nghiên cứu trong quá khứ, do đó kết quả có được khi ước lượng tham số có thể chưa phù hợp với thực tế hoặc chưa giải thích được hết sự ảnh hưởng của các biến kinh tế. Vì vậy ta cần kiểm định giả thuyết về các tham số và về sự phù hợp của mô hình. Ví dụ, đối với mô hình về lượng cầu và giá của một loại hàng hóa: Q = B1 + B2 P + u Nếu ước lượng của B2 là số âm thì ước lượng này hợp lý về mặt kinh tế, nếu dương thì không phù hợp về mặt kinh tế, ... 7. Dự báo. Khi mô hình đã phù hợp với lý thuyết kinh tế thì có thể sử dụng mô hình để dự báo (dự báo giá trị thật hoặc dự báo giá trị trung bình). 8. Ra quyết định và các chính sách. Dựa vào các kết quả dự báo để đưa ra các quyết định và đề xuất các chính sách thích hợp. Trần Minh Nguyệt Chương 1. Giới thiệu về Kinh tế lượng 4 Ta có thể tóm tắt các bước trên bằng sơ đồ sau: 3 Phân tích hồi quy Hồi quy là một công cụ cơ bản của kinh tế lượng. Thuật ngữ "Hồi quy" đã được Francis Galton sử dụng vào năm 1986. Trong một bài báo nổi tiếng của mình, ông đã cho rằng có một xu hướng chung về chiều cao của những đứa trẻ được sinh do cha mẹ cao không bình thường hoặc thấp không bình thường. Người ta gọi xu hướng này là luật Galton. Trong bài báo của mình Galton dùng cụm từ "regression to mediocrity" - quy về trung bình. Từ đó vấn đề hồi quy được nhiều người quan tâm, hoàn thiện và được ứng dụng rộng rãi. 3.1 Khái niệm và ví dụ Phân tích hồi quy nghiên cứu mối liên hệ phụ thuộc của một biến (gọi là biến phụ thuộc hay biến được giải thích) theo một hay nhiều biến khác (được gọi là các biến độc lập hay biến giải thích). Ta kí hiệu biến phụ thuộc (biến được giải thích) là Y , các biến độc lập (biến giải thích) là X1 , X2 , ..., Xk . Trong đó biến phụ thuộc Y là đại lượng ngẫu nhiên, có quy luật phân phối xác suất, các biến độc lập không phải là biến ngẫu nhiên, giá trị của chúng đã được cho trước. Phân tích hồi quy giải quyết các vấn đề sau đây: 1. Ước lượng giá trị trung bình của biến phụ thuộc với các giá trị đã cho của biến độc lập. 2. Kiểm định giả thuyết về bản chất của sự phụ thuộc. 3. Dự đoán giá trị trung bình của biến phụ thuộc khi biết giá trị của các biến độc lập. Bài giảng Kinh tế lượng 3. Phân tích hồi quy 5 4. Kết hợp các vấn đề trên. Ví dụ 1.1. Luật Galton Karl Pearson nghiên cứu sự phụ thuộc chiều cao của các con trai vào chiều cao của bố. Trong ví dụ này thì chiều cao của con trai là biến phụ thuộc, chiều cao của bố là biến độc lập. Ví dụ 1.2. Một người nghiên cứu sự phụ thuộc của lượng cầu về một loại hàng hóa vào giá hàng hóa đó và thu nhập của người tiêu dùng. Trong trường hợp này, lượng cầu là biến phụ thuộc, giá của hàng hóa và thu nhập của người tiêu dùng là các biến độc lập. 3.2 Số liệu cho phân tích hồi quy Các loại số liệu Có ba loại số liệu: Các số liệu theo thời gian (chuỗi thời gian), các số liệu chéo và các số liệu hỗn hợp. • Các số liệu theo thời gian là các số liệu được thu thập trong một thời kì nhất định. Số liệu có thể được thu thập hàng tuần, hàng tháng, hàng quý, hàng năm ... Ví dụ 1.3. Số liệu về giá vàng SJC bán ra (ngàn đồng/chỉ) trong tuần từ 18-12-2005 đến 24-12-2005 như sau: Ngày Giá 18-12 972 19-12 982 20-12 980 21-12 959 22-12 955 23-12 966 24-12 963 • Các số liệu chéo là các số liệu về một hoặc nhiều biến được thu thập tại một thời điểm ở nhiều địa điểm khác nhau. Ví dụ 1.4. Số liệu về giá vàng SJC bán ra (ngàn đồng/chỉ) ngày 18-12-2005 tại 4 địa điểm: Thành phố Hồ Chí Minh, Hà Nội, Đà Nẵng, Cần Thơ như sau: Địa điểm Giá TP Hồ Chí Minh 972 Hà Nội 973 Đà Nẵng 966 Cần Thơ 969 • Các số liệu hỗn hợp theo thời gian và không gian: số liệu được thu thập ở nhiều địa điểm khác nhau tại nhiều thời điểm khác nhau. Ví dụ 1.5. Số liệu về giá vàng SJC bán ra (ngàn đồng/chỉ) trong tuần tại bốn địa điểm như sau: Ngày Nơi TP Hồ Chí Minh Hà Nội Đà Nẵng Cần Thơ 18-12 19-12 20-12 21-12 22-12 23-12 24-12 972 973 966 968 982 983 982 982 980 982 980 980 959 966 959 960 955 960 955 955 966 968 966 966 963 968 967 963 Trần Minh Nguyệt Chương 1. Giới thiệu về Kinh tế lượng 6 Nguồn gốc các số liệu Số liệu sử dụng trong phân tích hồi quy có thể được thu thập từ hai nguồn: số liệu điều tra thực tế và số liệu thực nghiệm. • Số liệu thực nghiệm có được nhờ vào việc tiến hành thử nghiệm theo những điều kiện nhất định nào đó, thí dụ như để phân tích ảnh hưởng của việc bón phân đối với năng suất của một loại cây trồng, người ta có thể tiến hành bón phân với số lượng khác nhau trên các mảnh đất cùng loại. Sản lượng thu hoạch của các mảnh đất khác nhau phản ánh tác động của việc bón phân lên cây trồng. • Số liệu điều tra thực tế không bị kiểm soát bởi nhà nghiên cứu, thí dụ như số liệu về giá vàng, giá bất động sản, tỷ lệ thất nghiệp ... không nằm trong tầm kiểm soát của người điều tra. Điều này thường gây khó khăn trong việc tìm ra nguyên nhân chính xác ảnh hưởng đến một tình huống riêng biệt. Thí dụ, có phải lượng cung về tiền ảnh hưởng đến GDP hay còn có nguyên nhân nào khác? Phân tích hồi quy trong kinh tế lượng chủ yếu khai thác nguồn số liệu điều tra thực tế. Mặc dù số liệu phục vụ cho nghiên cứu kinh tế trong thực tế rất phong phú nhưng chất lượng của số liệu thường không đủ tốt. Điều đó do các nguyên nhân sau đây: • Hầu hết các số liệu trong khoa học xã hội đều là các số liệu phi thực nghiệm, do vậy có thể có sai số quan sát hoặc bỏ sót quan sát hoặc cả hai. • Ngay cả các số liệu thu thập bằng thực nghiệm cũng có sai số của phép đo. • Trong các cuộc điều tra bằng câu hỏi, gặp vấn đề không nhận được câu trả lời hoặc có trả lời nhưng không trả lời hết các câu hỏi. • Các số liệu kinh tế thường có sẵn ở mức tổng hợp cao, không cho phép đi sâu vào các đơn vị nhỏ. • Ngoài ra còn có những số liệu thuộc bí mật quốc gia mà không phải ai cũng có thể sử dụng được. 3.3 Mô hình hồi quy tổng thể Xét ví dụ phân tích hồi quy chỉ gồm một biến phụ thuộc Y và một biến độc lập X. Trung bình có điều kiện của Y sẽ là một hàm của X: E(Y |X) = f (X) (1.3) trong đó: E(Y |X) là kì vọng điều kiện của biến ngẫu nhiên Y với giá trị đã cho của biến X, f (X) là một hàm nào đó của biến X. Hàm (1.3) được gọi là mô hình hồi quy tổng thể hay hàm hồi quy tổng thể (PRF). Hàm f (X) có dạng như thế nào chúng ta không biết, bởi vì trong thực tế chúng ta thường không có tổng thể để có thể tính toán ra được. Nếu f (X) là hàm tuyến tính, tức là f (X) = B1 +B2 X thì thì mô hình (1.3) trở thành: E(Y |X) = B1 + B2 X. Mô hình này được gọi là mô hình hồi quy tuyến tính hai biến. Bài giảng Kinh tế lượng 3. Phân tích hồi quy 7 3.4 Hàm hồi quy mẫu Trong thực tế không thể nghiên cứu toàn bộ tổng thể, do đó chỉ có thể đưa ra dạng của hàm hồi quy tổng thể chứ không thể xác định hàm này một cách chính xác. Để ước lượng hàm hồi quy tổng thể phải dựa vào một mẫu được rút ra ngẫu nhiên từ tổng thể. Hàm hồi quy được xây dựng dựa trên mẫu được gọi là hàm hồi quy mẫu (SRF). Chắc chắn rằng ta không thể ước lượng một cách chính xác PRF dựa trên mẫu ngẫu nhiên, và đối với các mẫu ngẫu nhiên khác nhau sẽ cho những hàm hồi quy mẫu SRF khác nhau. Giả sử hàm hồi quy tổng thể PRF có dạng: E(Y |X) = B1 + B2 X và (X1 , Y1 ), (X2 , Y2 ), ..., (Xn , Yn ) là n quan sát về X, Y . Kí hiệu E(Y |Xi ) hoặc E(Y |X = Xi ) là kì vọng điều kiện của Y khi X nhận giá trị Xi . Ta có: E(Y |Xi ) = B1 + B2 Xi (1.4) Khi X nhận giá trị Xi thì E(Y |Xi ) là một giá trị cụ thể, nhưng ta không biết giá trị đó bằng bao nhiêu vì ta không nghiên cứu được tổng thể. Dựa vào mẫu ngẫu nhiên ta có phương trình ước lượng cho (1.4) là: ˆ Yi = b1 + b2 Xi (1.5) ˆ trong đó: Yi là ước lượng cho E(Y |Xi ). b1 là ước lượng cho B1 . b2 là ước lượng cho B2 . Phương trình (1.5) được gọi là phương trình hồi quy mẫu hoặc hàm hồi quy mẫu (SRF). 3.5 Sai số ngẫu nhiên Giả sử ta đã có hàm hồi quy tổng thể: E(Y |X) = f (X) Với mỗi giá trị của X thì E(Y |X) là giá trị trung bình của Y khi X nhận giá trị cụ thể ấy, khi đó giá trị của biến ngẫu nhiên Y sẽ dao động quanh giá trị trung bình E(Y |X). Đặt: u = Y − E(Y |X) Từ đó ta có: Y = E(Y |X) + u Khi X nhận giá trị Xi thì Y = Yi , vì vậy ta có: Yi = E(Y |Xi ) + ui (1.6) ui được gọi là sai số ngẫu nhiên (hay nhiễu ngẫu nhiên). Nếu mô hình hồi quy tổng thể là tuyến tính, tức là E(Y |Xi ) = B1 + B2 Xi thì (1.6) trở thành: Yi = B1 + B2 Xi + ui (1.7) Từ (1.6) lấy kì vọng điều kiện hai vế ta có: E(Yi |Xi ) = E(Y |Xi ) + E(ui |Xi ) Trần Minh Nguyệt Chương 1. Giới thiệu về Kinh tế lượng 8 Từ đó ta có E(ui |Xi ) = 0. Như vậy, những cách viết sau là đồng nhất và cùng được gọi là mô hình hồi quy tuyến tính tổng thể PRF (đối với biến phụ thuộc Y và biến độc lập X): E(Y |X) = B1 + B2 X E(Y |Xi ) = B1 + B2 Xi Y = B1 + B2 X + u Yi = B1 + B2 Xi + ui Phương trình (1.6) cho ta thấy rằng ngoài các biến giải thích trong mô hình vẫn còn những yếu tố khác ảnh hưởng đến biến phụ thuộc. Vì vậy ta gộp chúng lại và gọi đó là các sai số ngẫu nhiên khi biểu diễn Y qua các biến giải thích X. Nhưng về mặt trung bình thì sự ảnh hưởng của các nhiễu ngẫu nhiên này đến biến phụ thuộc là bằng 0. Vậy liệu có thể đưa ra được hết các yếu tố ảnh hưởng đến biến phụ thuộc hay không và khi ấy có thể loại bỏ được sự có mặt của nhiễu ngẫu nhiên ui hay không. Câu trả lời là sai số ngẫu nhiên vẫn luôn tồn tại vì một số lý do như sau: • Việc xác định được hết các yếu tố ảnh hưởng đến biến phụ thuộc Y là rất khó. • Do điều kiện kĩ thuật và kinh tế nên ta muốn có một mô hình đơn giản nhât, tức là một mô hình mà với một lượng vừa đủ biến độc lập ta cũng có thể giải thích được cho hành vi của biến phụ thuộc. Vì thế cần gộp vào ui thay thế cho các biến giải thích khác mà có ảnh hưởng nhỏ đến hành vi của biến phụ thuộc. Giả sử phương trình hồi quy mẫu có dạng: ˆ Yi = b1 + b2 Xi ˆ Đặt ei = Yi − Yi ta có: Yi = b1 + b2 Xi + ei Phương trình này cũng được gọi là phương trình hồi quy mẫu. ei được gọi là phần dư và ei chính là một ước lượng điểm của ui . Bài giảng Kinh tế lượng 3. Phân tích hồi quy 9 Y . Y . i e .i ˆ S . RF : Yi = b1 + b2 Xi Y .ˆi u . i E . (Y |Xi ) P . RF : E(Y |Xi ) = B1 + B2 Xi . X . i X . Trần Minh Nguyệt Chương 2 Các mô hình hồi quy tuyến tính 1 Mô hình hồi qui tuyến tính hai biến Xét mô hình hồi quy tuyến tính hai biến gồm một biến phụ thuộc Y và một biến độc lập X: E(Y |X) = B1 + B2 X (2.1) B1 được gọi là hệ số chặn (hoặc hệ số tung độ gốc) của đường hồi quy tổng thể. B2 được gọi là hệ số độ dốc của đường hồi quy tổng thể. Từ phương trình (2.1) ta thấy: • E(Y |X = 0) = B1 , như vậy B1 cho biết giá trị trung bình của Y khi X = 0. • Khi X thay đổi 1 đơn vị thì E(Y |X) thay đổi B2 đơn vị. Như vậy B2 cho biết giá trị trung bình của Y thay đổi như thế nào khi X thay đổi 1 đơn vị. Sự thay đổi này có thể cùng chiều hay ngược chiều phụ thuộc vào dấu của B2 là dương hay âm. 1.1 Phương pháp bình phương nhỏ nhất thông thường Trong phân tích hồi quy chúng ta phải ước lượng giá trị trung bình của biến phụ thuộc Y . Trong phương trình (2.1), các giá trị của X đã biết, do vậy việc ước lượng đó trở thành việc ước lượng các tham số chưa biết B1 , B2 . Có nhiều phương pháp để ước lượng cho B1 , B2 . Một trong những phương pháp phổ biến nhất là phương pháp bình phương nhỏ nhất thông thường (Ordinary Least Squares - OLS). Giả sử ta có PRF là: E(Y |Xi ) = B1 + B2 Xi và có mẫu gồm n quan sát về X, Y là (X1 , Y1 ), (X2 , Y2 ), ..., (Xn , Yn ). Dựa vào mẫu ta ước lượng cho mô hình trên, tức là tìm đường hồi quy mẫu: ˆ Yi = b1 + b2 Xi trong đó: b1 là ước lượng cần tìm cho B1 (b1 được gọi là hệ số chặn hoặc hệ số tung độ gốc của đường hồi quy mẫu). b2 là ước lượng cần tìm cho B2 (b2 được gọi là hệ số độ dốc của đường hồi quy mẫu). ˆ Ta tìm b1 , b2 sao cho các Yi càng gần với Yi càng tốt, tức là các phần dư ˆ ei = Yi − Yi = Yi − b1 − b2 Xi 10 1. Mô hình hồi qui tuyến tính hai biến 11 càng nhỏ càng tốt. Do các ei , i = 1, n có thể âm, có thể dương, vì vậy ta tìm b1 , b2 sao cho tổng bình phương các phần dư là nhỏ nhất. Vậy, ý tưởng của phương pháp bình phương nhỏ nhất thông thường là tìm b1 , b2 sao cho tổng bình phương: n n ∑ ∑ 2 ei = (Yi − b1 − b2 Xi )2 i−1 i=1 đạt giá trị nhỏ nhất. Y . 3 e .3 ˆ S . RF : Yi = b1 + b2 Xi ∑ 2 . ei → M in b1 ,b2 Y . 1 e .1 e .2 Y . 2 . X . 1 X . 2 X . 3 Đây là bài toán tìm giá trị nhỏ nhất của hàm hai biến (các biến là b1 , b2 ). Giải ra ta được: n b2 = n ∑ Yi X i − i=1 n n ∑ i=1 n ∑ Xi i=1 ( 2 Xi b1 = Y − b2 X − n ∑ n ∑ i=1 Yi )2 Xi = XY − X.Y X 2 − (X)2 (2.2) i=1 b1 , b2 là các ước lượng của B1 , B2 tính được bằng phương pháp bình phương nhỏ nhất - được gọi là các ước lượng bình phương nhỏ nhất. 1.2 Các tính chất của các ước lượng bình phương nhỏ nhất 1. b1 , b2 được xác định một cách duy nhất ứng với n cặp quan sát (Xi , Yi ). 2. b1 , b2 là các ước lượng điểm của B1 , B2 và là các đại lượng ngẫu nhiên, với các mẫu khác nhau chúng có giá trị khác nhau. Trần Minh Nguyệt Chương 2. Các mô hình hồi quy tuyến tính 12 ˆ 3. Hàm hồi quy mẫu SRF: Yi = b1 + b2 Xi có các tính chất sau đây: i. SRF đi qua trung bình mẫu (X, Y ), nghĩa là: Y = b1 + b2 X. ˆ ii. Giá trị trung bình của các Yi bằng giá trị trung bình của các quan sát: ˆ Y =Y. iii. Giá trị trung bình của các phần dư bằng 0: n ∑ ei = 0. i=1 ˆ iv. Các phần dư ei không tương quan với Yi , tức là n ∑ ˆ Yi ei = 0. i=1 v. Các phần dư ei không tương quan với Xi , tức là n ∑ Xi ei = 0. i=1 1.3 Các giả thiết cơ bản của mô hình hồi quy tuyến tính cổ điển Giả thiết 1: Các biến giải thích là phi ngẫu nhiên, tức là các giá trị của chúng là các số đã được xác định. Giả thiết 2: Kỳ vọng của các nhiễu ngẫu nhiên bằng 0, tức là: E(ui |Xi ) = 0. Giả thiết này có nghĩa là các yếu tố không có trong mô hình (mà ui đại diện cho chúng) không có ảnh hưởng hệ thống đến giá trị trung bình của Y . Về mặt hình học giả thiết này được mô tả bằng đồ thị sau: Bài giảng Kinh tế lượng 1. Mô hình hồi qui tuyến tính hai biến 13 Y . P . RF + . ui − . ui . X . X . 1 X . 2 X . 3 Giả thiết 3: Phương sai của các ui bằng nhau (còn gọi là giả thiết phương sai thuần nhất). Tức là: V ar(ui |Xi ) = V ar(uj |Xj ) = σ 2 ∀i ̸= j. M . ật độ xác suất của ui f . (u) Y . . X . 1 X . 2 P . RF X . i X . Phương sai thuần nhất Trần Minh Nguyệt Chương 2. Các mô hình hồi quy tuyến tính 14 M . ật độ xác suất của ui f . (u) Y . . X . 1 X . 2 P . RF X . i X . Phương sai không thuần nhất Giả thiết 4: Không có tương quan giữa các ui : Cov(ui , uj ) = 0 ∀i ̸= j. 1.4 Tính chất BLUE của các ước lượng bình phương nhỏ nhất Tính chất BLUE (Best Linear Unbiased Estimator) của các ước lượng bình phương nhỏ nhất được thể hiện qua định lý sau đây: Định lý 2.1 (Gauss-Markov). Với các giả thiết 1-4 đã nêu trên, các ước lượng bình phương nhỏ nhất là các ước lượng tuyến tính, không chệch và có phương sai nhỏ nhất trong lớp các ước lượng tuyến tính không chệch. Tuyến tính tức là các ước lượng bình phương nhỏ nhất (2.2) là các hàm tuyến tính của Yi . Không chệch tức là: E(b1 ) = B1 , E(b2 ) = B2 . Phương sai nhỏ nhất trong lớp các ước lượng tuyến tính không chệch tức là: Nếu ˜1 , ˜2 là các b b hàm ước lượng tuyến tính không chệch bất kì lần lượt cho hai tham số B1 , B2 thì: V ar(˜1 ) ≥ V ar(b1 ), b V ar(˜2 ) ≥ V ar(b2 ). b 1.5 Hệ số xác định Đặt T SS = ESS = n ∑ (Yi − Y )2 , i=1 n ∑ ˆ ˆ (Yi − Y )2 = i=1 RSS = n ∑ i=1 Bài giảng Kinh tế lượng e2 = i n ∑ i=1 n ∑ ˆ (Yi − Y )2 , i=1 ˆ (Yi − Yi )2 . 1. Mô hình hồi qui tuyến tính hai biến 15 TSS(Total Sum of Squares - Tổng bình phương độ lệch) là tổng bình phương của tất cả các sai lệch giữa các giá trị quan sát Yi với giá trị trung bình của chúng. ESS(Explained Sum of Squares - Tổng bình phương độ lệch được giải thích) là tổng bình phương của tất cả các sai lệch giữa các giá trị của biến phụ thuộc Y nhận được từ hàm hồi quy ˆ mẫu với giá trị trung bình của chúng (Y = Y ). Phần này đo độ chính xác của hàm hồi quy. RSS(Residual Sum of Squares - Tổng bình phương phần dư) là tổng bình phương của tất cả các sai lệch giữa các giá trị quan sát Yi và các giá trị nhận được từ hàm hồi quy. Về mặt hình học có thể minh họa trên hình sau: Y . S . RF Y . i Y . i−Y Y .ˆi e .i Y .ˆi − Y Y . . X . i X . Ta chứng minh được: T SS = ESS + RSS. Như vậy, tổng bình phương độ lệch (TSS) được chia thành hai phần: một phần được giải thích (ESS) do đường hồi quy mẫu gây ra và một phần không được giải thích (RSS) do các yếu tố ngẫu nhiên gây ra. Từ biểu thức trên ta được: ESS RSS 1= + T SS T SS ESS RSS Đặt R2 = =1− . T SS T SS R2 được gọi là hệ số xác định, được sử dụng để đo độ thích hợp của đường hồi quy mẫu với các số liệu quan sát. Hệ số R2 cho biết tỷ lệ (tỷ lệ phần trăm) của phần biến thiên được giải thích trong toàn bộ biến thiên của Y . Về hệ số xác định R2 có một số lưu ý sau đây: 1. 0 ≤ R2 ≤ 1. 2. Khi R2 = 1 thì đường hồi quy thích hợp hoàn toàn. Khi đó RSS = n ∑ ˆ (Yi − Yi )2 = 0 i=1 Trần Minh Nguyệt Chương 2. Các mô hình hồi quy tuyến tính 16 ˆ nên Yi ≡ Yi . Nếu biểu diễn trên đồ thị thì tất cả các điểm dữ liệu quan sát đều nằm trên đường thẳng hồi quy mẫu SRF. Khi R2 = 1 thì ESS = T SS nên ta còn nói: Y được giải thích hoàn toàn qua X. 3. Khi R2 = 0 thì đường hồi quy hoàn toàn không thích hợp. Khi đó ESS = 0 nên ta còn nói: Y hoàn toàn không được giải thích qua X. 4. Trong thực tế, rất hiếm khi R2 = 0 hoặc R2 = 1 mà chỉ có R2 gần 0 hay gần 1. Nếu R2 càng gần 1 thì mức độ phù hợp của đường hồi quy càng cao. 5. Không có tiêu chuẩn chung để xác định R2 bao nhiêu là cao hay thấp và không nên chỉ căn cứ vào R2 để đánh giá mô hình tốt hay không tốt. Để xem xét một mô hình tốt hay không ta phải căn cứ vào nhiều yếu tố: R2 , dấu của hệ số hồi quy, kinh nghiệm thực tế, khả năng dự báo chính xác ... Theo kinh nghiệm, với số liệu chuỗi thời gian thì R2 > 0.9 được xem là tốt, với số liệu chéo thì R2 > 0.7 được xem là tốt. 1.6 Mối quan hệ giữa hệ số tương quan tuyến tính mẫu và hệ số xác định R2 Gọi r là hệ số tương quan tuyến tính mẫu giữa X và Y , được xác định bởi công thức: ∑ (Xi − X)(Yi − Y ) r = √∑ ∑ (Xi − X)2 (Yi − Y )2 Ta chứng minh được: √∑ (Xi − X)2 r = b2 √ ∑ (Yi − Y )2 và 2 R = b2 2 ∑ (Xi − X)2 ∑ (Yi − Y )2 Như vậy, r 2 = R2 , tuy nhiên r có thể nhận dấu âm hoặc dương và r cùng dấu với hệ số b2 của hàm hồi quy mẫu. 1.7 Phân phối xác suất của các tham số mẫu Để nhận được phân phối xác suất của các tham số mẫu, ngoài 4 giả thiết đã nêu của mô hình hồi quy tuyến tính cổ điển, ta đưa thêm giả thiết thứ 5 sau: 5. ui tuân theo phân phối chuẩn N (0, σ 2 ) với mọi i. Ta quan tâm đến các tham số mẫu sau: n b2 = n ∑ Yi X i − i=1 n n ∑ i=1 Bài giảng Kinh tế lượng n ∑ Xi i=1 ( 2 Xi − n ∑ i=1 n ∑ i=1 Yi )2 Xi = XY − X.Y X 2 − (X)2 1. Mô hình hồi qui tuyến tính hai biến 17 b1 = Y − b2 X n ∑ σ2 = ˆ e2 i i=1 n−2 = RSS n−2 b1 là hàm ước lượng cho B1 , b2 là hàm ước lượng cho B2 , σ 2 là hàm ước lượng cho σ 2 . ˆ n ∑ √ e2 i RSS i=1 σ = ˆ = được gọi là sai số chuẩn của đường hồi quy (Standard error of n−2 n−2 regression) hoặc sai số chuẩn của ước lượng (Standard error of estimate). Nếu 5 giả thuyết đã nêu trên được thỏa mãn thì ta có: • b1 tuân theo phân phối chuẩn với trung bình và độ lệch chuẩn như sau: n ∑ E(b1 ) = B1 , 2 Xi i=1 se(b1 ) = σ n n ∑ (Xi − X)2 i=1 • b2 tuân theo phân phối chuẩn với trung bình và độ lệch chuẩn như sau: E(b2 ) = B2 , se(b2 ) = σ n ∑ (Xi − X)2 i=1 • σ 2 là một ước lượng không chệch của phương sai nhiễu σ 2 và ˆ (n − 2)ˆ 2 σ phối khi bình phương với (n − 2) bậc tự do. (se: standard error - độ lệch chuẩn.) σ2 tuân theo phân Chú ý 2.2. Trong các công thức tính se(b1 ), se(b2 ) thì σ 2 là phương sai của nhiễu ui và b2 − B 2 b1 − B 1 và cùng tuân theo không được biết nên σ 2 được ước lượng bằng σ 2 , vì vậy ˆ se(b1 ) se(b2 ) phân phối student với (n − 2) bậc tự do. Điều này là cơ sở để thực hiện bài toán ước lượng khoảng và kiểm định sau đây. 1.8 Ước lượng và kiểm định giả thiết về hệ số hồi quy Trong phần này ta chú ý các kí hiệu: tn−2,α/2 là giá trị thỏa mãn: P (tn−2 > tn−2,α/2 ) = α/2. tn−2,α là giá trị thỏa mãn: P (tn−2 > tn−2,α ) = α. trong đó: tn−2 là biến ngẫu nhiên tuân theo phân phối student với (n − 2) bậc tự do. Trần Minh Nguyệt Chương 2. Các mô hình hồi quy tuyến tính 18 Khoảng tin cậy • Khoảng ước lượng với độ tin cậy 100(1 − α)% cho B1 là: b1 − tn−2,α/2 se(b1 ) ≤ B1 ≤ b1 + tn−2,α/2 se(b1 ) • Khoảng ước lượng với độ tin cậy 100(1 − α)% cho B2 là: b2 − tn−2,α/2 se(b2 ) ≤ B2 ≤ b2 + tn−2,α/2 se(b2 ) Kiểm định về các hệ số hồi quy Các bài toán kiểm định trình bày sau đây đều dựa trên cơ sở: theo phân phối student với (n − 2) bậc tự do. Các bước thực hiện kiểm định như sau: b1 − B1 se(b1 ) và b2 − B2 se(b1 ) cùng tuân 1. Chọn cặp giả thuyết H0 , H1 . 2. Tính giá trị kiểm định t. 3. Kết luận (Bác bỏ H0 hay chấp nhận H0 - Có thể so sánh giá trị kiểm định t với giá trị tới hạn hoặc tính p-value để kết luận). Ta có thể tóm tắt bằng các bảng 2.1, 2.2. Bảng 2.1: Kiểm định giả thuyết về hệ số B1 Giả thuyết H0 Giả thuyết đối H1 ∗ B1 = B1 ∗ B1 ̸= B1 ∗ B1 = B1 ∗ B1 < B 1 ∗ (B1 ≥ B1 ) B1 = ∗ B1 B1 > ∗ (B1 ≤ B1 ) ∗ B1 Giá trị kiểm định t ∗ b1 − B1 t= se(b1 ) ∗ b1 − B1 t= se(b1 ) t= ∗ b1 − B1 se(b1 ) Miền bác bỏ p-value |t| > tn−2,α/2 2P (tn−2 > |t|) t < −tn−2,α P (tn−2 < t) t > tn−2,α P (tn−2 > t) 1.9 Dự báo Có hai loại dự báo: • Dự báo giá trị trung bình có điều kiện của Y khi X = X0 (Dự báo cho E(Y |X0 )). • Dự báo giá trị cá biệt của Y khi X = X0 (Dự báo cho Y0 ). Bài giảng Kinh tế lượng 1. Mô hình hồi qui tuyến tính hai biến 19 Bảng 2.2: Kiểm định giả thuyết về hệ số B2 Giả thuyết H0 Giả thuyết đối H1 ∗ B2 = B2 ∗ B2 ̸= B2 ∗ B2 = B2 ∗ B2 < B 2 ∗ (B2 ≥ B2 ) B2 = ∗ B2 B2 > ∗ B2 Giá trị kiểm định t ∗ b2 − B2 t= se(b2 ) ∗ b2 − B2 t= se(b2 ) t= ∗ b2 − B2 ∗ (B2 ≤ B2 ) se(b2 ) Miền bác bỏ p-value |t| > tn−2,α/2 2P (tn−2 > |t|) t < −tn−2,α P (tn−2 < t) t > tn−2,α P (tn−2 > t) ˆ Giả sử X = X0 . Khi đó, ước lượng điểm cho E(Y |X0 ) và Y đều là Y0 = b1 + b2 X0 . Khoảng tin cậy 100(1 − α)% cho E(Y |X0 ) là: ˆ Y0 −tn−2,α/2 σ ˆ 1 n + (X0 − X)2 ˆ ≤ E(Y |X0 ) ≤ Y0 +tn−2,α/2 σ ˆ n ∑ (Xi − X)2 1 n + i=1 (X0 − X)2 n ∑ (Xi − X)2 i=1 Khoảng tin cậy 100(1 − α)% cho Y0 là: ˆ Y0 −tn−2,α/2 σ ˆ 1+ 1 n + (X0 − X)2 ˆ ≤ Y0 ≤ Y0 +tn−2,α/2 σ ˆ n ∑ (Xi − X)2 1+ 1 n + i=1 (X0 − X)2 n ∑ (Xi − X)2 i=1 Ví dụ 2.3. File số liệu GiaNhaDienTich.txt chứa giá bán và diện tích của 14 căn nhà dành cho một gia đình, trong đó Y : giá bán (nghìn USD), X: diện tích (feet vuông). 1. Xác định hàm SRF của Y theo X. Nêu ý nghĩa của các hệ số của SRF. 2. Vẽ biểu đồ tán xạ cho X và Y . Vẽ thêm đường thẳng SRF vào biểu đồ tán xạ. 3. Tính T SS, ESS, RSS, σ , se(b1 ), se(b2 ). ˆ 4. Tìm hệ số xác định R2 , nêu ý nghĩa. 5. Xác định khoảng tin cậy 99% cho hệ số độ dốc của PRF. 6. Ở mức ý nghĩa 5% hãy kết luận diện tích có ảnh hưởng đến giá bán nhà hay không? 7. Có nhận định cho rằng: Khi diện tích tăng lên 1 (feet vuông) thì giá nhà tăng lên ít nhất 0.5 (nghìn USD). Ở mức ý nghĩa 5% hãy kết luận về nhận định trên. 8. Tìm ước lượng khoảng với độ tin cậy 99% cho giá bán của một căn nhà có diện tích 2500 feet vuông. 9. Tìm ước lượng khoảng với độ tin cậy 99% cho giá bán trung bình khi diện tích là 2500 feet vuông. Trần Minh Nguyệt Chương 2. Các mô hình hồi quy tuyến tính 20 2 Mô hình hồi quy ba biến 2.1 Mô hình hồi quy tổng thể PRF Xét mô hình hồi quy tuyến tính ba biến gồm một biến phụ thuộc Y và hai biến độc lập X2 , X3 : E(Y |X2 , X3 ) = B1 + B2 X2 + B3 X3 (2.3) B1 được gọi là hệ số chặn (hoặc hệ số tung độ gốc) của đường hồi quy tổng thể. B2 , B3 được gọi là các hệ số hồi quy riêng của đường hồi quy tổng thể. Từ phương trình (2.3) ta thấy: • E(Y |X2 = 0, X3 = 0) = B1 , như vậy B1 cho biết giá trị trung bình của Y khi X2 = 0, X3 = 0. • Khi X2 thay đổi 1 đơn vị, X3 không thay đổi thì E(Y |X2 , X3 ) thay đổi B2 đơn vị. Như vậy B2 cho biết giá trị trung bình của Y thay đổi như thế nào khi X2 thay đổi 1 đơn vị còn X3 không đổi. Sự thay đổi này có thể cùng chiều hay ngược chiều phụ thuộc vào dấu của B2 là dương hay âm. • Khi X3 thay đổi 1 đơn vị, X2 không thay đổi thì E(Y |X2 , X3 ) thay đổi B3 đơn vị. Như vậy B3 cho biết giá trị trung bình của Y thay đổi như thế nào khi X3 thay đổi 1 đơn vị còn X2 không đổi. Sự thay đổi này có thể cùng chiều hay ngược chiều phụ thuộc vào dấu của B3 là dương hay âm. 2.2 Hàm hồi quy mẫu Giả sử (Y, X2i , X3i ), i = 1, n là n quan sát về Y, X2 , X3 . Ta có PRF như sau: Yi = B1 + B2 X2i + B3 X3i + ui Tương tự như mô hình hồi quy hai biến, sử dụng phương pháp bình phương nhỏ nhất thông thường ta thu được SRF như sau: Yi = b1 + b2 X2i + b3 X3i + ei b1 , b2 , b3 được gọi là các ước lượng bình phương nhỏ nhất, được xác định như sau: b1 = Y − b2 X 2 − b3 X 3 n n n n ∑ ∑ ∑ ∑ 2 yi x3i )( x2i x3i ) ( yi x2i )( x3i ) − ( b2 = i=1 i=1 i=1 i=1 n n n ∑ ∑ ∑ 2 2 x2i x3i )2 x3i ) − ( ( x2i )( i=1 i=1 i=1 n n n n ∑ ∑ ∑ ∑ 2 yi x2i )( x2i x3i ) ( yi x3i )( x2i ) − ( b3 = i=1 i=1 i=1 i=1 n n n ∑ ∑ ∑ 2 2 x2i x3i )2 x3i ) − ( ( x2i )( i=1 i=1 i=1 trong đó: x2i = X2i − X 2 , x3i = X3i − X 3 , yi = Yi − Y . Bài giảng Kinh tế lượng (2.4)

- Xem thêm -

Tài liệu Bài giảng kinh tế lượng

Tài liệu liên quan

Tài liệu vừa đăng

Tài liệu xem nhiều nhất