Đăng ký Đăng nhập

Tài liệu Hồi quy

.PDF
30
540
104

Mô tả:

hồi quy
05-Apr-11 Nguyễn Duy Tâm - http://sites.google.com/site/tam0505/ Nguyen Duy Tam - http://sites.google.com/site/tam0505/ 1 Con người – Tầm nhìn mới Nguyen Duy Tam - http://sites.google.com/site/tam0505/ 2 1 05-Apr-11 GiỚI THIỆU TƢƠNG QUAN – HỒI QUY 1. 2. 3. 4. 5. 6. 7. Tương quan Hồi quy Quy trình xây dựng mô hình trên SPSS Các loại kiểm định trong mô hình Ý nghĩa hệ số hồi quy Dự báo với mô hình hồi quy Xử lí các lỗi của hồi quy Nguyen Duy Tam - http://sites.google.com/site/tam0505/ 3  Là mối quan hệ tuyến tính giữa hai biến (X và Y) (rXY) Nguyen Duy Tam - http://sites.google.com/site/tam0505/ 4 2 05-Apr-11 Hệ số tƣơng quan  “r” Hệ số tương quan…  Độ mạnh của mối quan hệ (mạnh, yếu, hoặc không có quan hệ)  Các loại quan hệ ▪ Đồng biến – X và Y biến thiên cùng chiều ▪ Nghịch biến – X và Y biến thiên ngược chiều  Khoảng biến thiên của r từ –1 đến 1 -1.0 Strong Negative 0.0 No Rel. +1.0 Strong Positive •Go to website! –playing with scatterplots 5 Nguyen Duy Tam - http://sites.google.com/site/tam0505/ Thực hành với đồ thị phân tán r = .__ __ r = .__ __ r = .__ __ Nguyen Duy Tam - http://sites.google.com/site/tam0505/ r = .__ __ 6 3 05-Apr-11 Thực hành trên SPSS Click here Nguyen Duy Tam - http://sites.google.com/site/tam0505/ 7 Thực hành trên SPSS Nhận xét mối quan hệ Nguyen Duy Tam - http://sites.google.com/site/tam0505/ 8 4 05-Apr-11 XÁC ĐỊNH HỆ SỐ TƢƠNG QUAN Nguyen Duy Tam - http://sites.google.com/site/tam0505/ 9 XÁC ĐỊNH HỆ SỐ TƢƠNG QUAN Nguyen Duy Tam - http://sites.google.com/site/tam0505/ 10 5 05-Apr-11 KiỂM ĐỊNH MỐI QUAN HỆ TUYẾN TÍNH Kiểm định mối quan hệ tuyến tính giữa các biến. 1. H0: rxy =0: hai biến không có mối quan hệ tuyến tính phụ thuộc nhau 2. H1: rxy <>0: hai biến có mối quan hệ tuyến tính phụ thuộc nhau  11 Nguyen Duy Tam - http://sites.google.com/site/tam0505/ HỒI QUY trực tiếp Path Diagram of A Linear Regression Analysis X1 YY error X2 Yi  k  b1 x1  b2 x2  b3 x3  ei x3 Nguyen Duy Tam - http://sites.google.com/site/tam0505/ 12 6 05-Apr-11 HỒI QUY tổng hợp A Path Analysis Decomposition of Effects into Direct, Indirect, Spurious, and Total Effects Error Error X2 C Y3 A X1 Các loại quan hệ hồi quy F E B Y2 Trực tiếp Y3: C,E, F D Error Gián tiếp Y3: BE, BDF Y1 Tổng tác động = Trực tiếp + gián tiếp Error Indirect Effects: Paths AC, BE, DF Direct Effects: Paths C, E, F Total Effects: Sum of Direct and Indirect Effects Spurious effects are due to common (antecedent) causes 13 Nguyen Duy Tam - http://sites.google.com/site/tam0505/ HỒI QUY TƢƠNG TÁC Interaction Analysis X1 A Y C B Hệ số tác động tương tác: C X2 X1 và X2 tương tác lẫn nhau cùng tác động lên Y. Y= K + aX1 + BX2 + CX1*X2 Nguyen Duy Tam - http://sites.google.com/site/tam0505/ 14 7 05-Apr-11 Các loại quan hệ giữa biến phụ thuộc và biến độc lập 1. 2. 3. 4. 5. 6. 7. 8. 9. Quan hệ tuyến tính (linear) Hồi quy chỉ xét đối Quan hệ logarithmic với hồi quy tuyến Quan hệ hàm nghịch đảo (inverse) tinh (đối với tham Quan hệ parapol (quadratic) số). Những mối Quan hệ hàm bậc 3 (cubic) quan hệ phi tuyến Quan hệ hàm mũ (Power) đều phải chuyển về Quan hệ logistic quan hệ tuyến tính) Quan hệ hàm tăng trưởng (growth) Quan hệ san bằng hàm mũ (exponential) Nguyen Duy Tam - http://sites.google.com/site/tam0505/ 15 Mối quan hệ tuyến tính (linear) Nguyen Duy Tam - http://sites.google.com/site/tam0505/ 16 8 05-Apr-11 Quan hệ logarithmic Nguyen Duy Tam - http://sites.google.com/site/tam0505/ 17 Quan heä nghòch ñaûo (inverse – hypecpol) Nguyen Duy Tam - http://sites.google.com/site/tam0505/ 18 9 05-Apr-11 Quan heä haøm baäc hai (Quadratic) Nguyen Duy Tam - http://sites.google.com/site/tam0505/ 19 Quan heä haøm baäc 3 (cubic) Nguyen Duy Tam - http://sites.google.com/site/tam0505/ 20 10 05-Apr-11 NGHIÊN CỨU CÁC NHÂN TỐ TÁC ĐỘNG ĐẾN MƢC LƢƠNG HiỆN TẠI      BÀI TẬP: EMPLOYEE DATA.SAV. Yêu cầu: Hãy xây dựng mô hình hồi quy mô tả những nhân tố (mối quan hệ) tác động đến mức lương hiện tại của người lao động trong công ty theo 2 mô hình sau. MH1: Lifeexpf = a + b1*calories + b2*gdp_gap MH2: Lifeexpf = a + b1*calories + b2*Ln(gdp_gap) MH3: Xây dựng mô hình hồi quy với Lifeexpf là biến phụ thuộc và tất cả các biến còn lại là biến độc lập Nguyen Duy Tam - http://sites.google.com/site/tam0505/ 21 Nguyen Duy Tam - http://sites.google.com/site/tam0505/ 22 MÔ HÌNH 1 11 05-Apr-11 BẢNG KẾT QuẢ KIỂM ĐỊNH TỔNG THỂ  1. 2. KIỂM ĐỊNH TỔNG THỂ Gỉa thiết H0: Mô hình không có khả năng giải thích giá trị thực tế Giả thiết H1: Mô hình có thể sử dụng để giải thích giá trị thực tế của mức lương Nguyen Duy Tam - http://sites.google.com/site/tam0505/ 23 BẢNG KẾT QuẢ KIỂM ĐỊNH HỆ SỐ HỒI QUY  1. 2. KIỂM ĐỊNH HỆ SỐ HỒI QUY Giả thiết đối với hệ số hồi quy thứ I H0: bi = 0 (biến Xi không tác động vào Y) H1: bi <> 0 (biến Xi tác động vào Y) Nguyen Duy Tam - http://sites.google.com/site/tam0505/ 24 12 05-Apr-11 Ý NGHĨA HỆ SỐ HỒI QUY  Phương trình hồi quy mô hình 1 được viết như sau:  Lifeexpf = 32,77 + 0,012*calories + 0*gdp_gap 1. 2. B1: Trong điều kiện các nhân tố khác không đổi (2 nước giống nhau trừ lượng calories) thì nếu nước này có lượng calories nạp vào hàng ngày hơn hơn nước kia 1 calories thì tuổi thọ của người dân nước này cao hơn nước kia là 0,012 tuổi. B2: Nếu chọn α=5%, Ta đề xuất loại biến gdp_gap ra khỏi mô hình Nguyen Duy Tam - http://sites.google.com/site/tam0505/ 25 BẢNG KẾT QuẢ HỆ SỐ GIẢI THÍCH R2   Hệ số R2 và R2 hiệu chỉnh R2 là khả năng giải thích của mô hình. Nếu R2 = 0,706  80,4%) thì mô hình có khả năng giải thích được 70,6% giá trị thực tế. Chú ý: mô hình hồi quy đa biến độc lập (hồi quy bội) ta dùng R2 hiệu chỉnh để nêu khả năng giải thích của mô hình. (69,8%) Nguyen Duy Tam - http://sites.google.com/site/tam0505/ 26 13 05-Apr-11 DỰ BÁO BẰNG MÔ HÌNH HỒI QUY DỰ BÁO CHO 3 NGƢỜI CÓ ĐIỀU KIỆN SAU Việt Nam Gdp_gap Calories PA1 1000 2400 PA2 1200 2500 PA3 1500 2700 TẠI HỘP THOẠI LINEAR REGRESSION - SAVE Nhập dữ liệu của 3 phương án trên vào quan sát thứ 110-111-112 Nguyen Duy Tam - http://sites.google.com/site/tam0505/ 27 KẾT QuẢ DỰ BÁO Nguyen Duy Tam - http://sites.google.com/site/tam0505/ 28 14 05-Apr-11 Xây dựng mô hình 3 và dự báo tuổi thọ BQ của phụ nữ cho 3 phương án của Việt nam và năm 2008 Nguyen Duy Tam - http://sites.google.com/site/tam0505/ 29 GiẢ THIẾT CỦA MÔ HÌNH HỒI QUY BỘI 1. 2. 3. Các biến độc lập (giải thích) được biết trước Các biến độc lập không tương quan với nhau [cov(xi,xj) =0] Các sai số giữa giá trị thực tế và giá trị dự báo (phần dư, resid, ui) không tự tương quan với nhau [cov(ui,uj) =0] 4. 5. Phần dư (resid) có phương sai không đổi. Var(resid) = constant Phần dư (resid) giữa giá trị dự báo và giá trị thực tế tuân theo phân phối chuẩn. Nguyen Duy Tam - http://sites.google.com/site/tam0505/ 30 15 05-Apr-11 KiỂM ĐỊNH CÁC LỖI CỦA MÔ HÌNH 1. 2. 3. 4. 5. Giả định về sự liên hệ tuyến tính giữa hai biến (đồ thị scatter) Khả năng tuân theo phân phối chuẩn của phần dư (residual) Hiện tượng tự tương quan Hiện tượng đa cộng tuyến Hiện tượng phương sai thay đổi Nguyen Duy Tam - http://sites.google.com/site/tam0505/ 31 Giả định về sự liên hệ tuyến tính (đồ thị scatter)  Biến độc lập X có thể giải thích cho biến phụ thuộc Y khi X có mối liên hệ tuyến tính với X. 1. Đồ thị Scatter giữa X và Y có mối liên hệ nào đó với nhau 2. Đồ thị phần dư (resid) giữa phần dư và giá trị dự báo biến thiên ngẫu nhiên Nguyen Duy Tam - http://sites.google.com/site/tam0505/ 32 16 05-Apr-11 Giả định về sự liên hệ tuyến tính (đồ thị scatter)  Mối liên hệ tuyến tính Nguyen Duy Tam - http://sites.google.com/site/tam0505/ 33 Kieåm tra ñoà thò phaân taùn phaàn dö (scatter)   B1: Tính giá trị phần dư và giá trị dự báo chuẩn hoá. B2: Vẽ đồ thị phân tán với trục hoành là Zpr và trục tung là ZRE. (Có thể thêm vào đường xu hướng để kiểm tra mối liên hệ tuyến tính) Nguyen Duy Tam - http://sites.google.com/site/tam0505/ 34 17 05-Apr-11 Kieåm ñònh phaàn dö coù phaân phoái chuaån (quy trình) KHÔNG CÓ MỐI LIÊN HỆ CÓ MỐI LIÊN HỆ (CUBIC) Nguyen Duy Tam - http://sites.google.com/site/tam0505/ 35 Kiểm định phần dƣ có phân phối chuẩn  Ta có thể kiểm tra khả năng tuân theo phân phối chuẩn của resid thông qua hai đồ thị 1. Đồ thị tần số Histogram 2. Đồ thị Q-Q plot Nguyen Duy Tam - http://sites.google.com/site/tam0505/ 36 18 05-Apr-11 Kiểm định phần dƣ có phân phối chuẩn ĐỒ THỊ HISTOGRAM ĐỒ THỊ HISTOGRAM Nguyen Duy Tam - http://sites.google.com/site/tam0505/ 37 Kiểm định phần dƣ có phân phối chuẩn ĐỒ THỊ Q-Q PLOT ĐỒ THỊ Q-Q PLOT Nguyen Duy Tam - http://sites.google.com/site/tam0505/ 38 19 05-Apr-11 Kieåm ñònh hieän töôïng phöông sai khoâng ñoåi  Là hiện tượng các sai số (resid) có mối tương quan với giá trị dự báo (Y^). Nguyen Duy Tam - http://sites.google.com/site/tam0505/ 39 Kieåm ñònh hieän töôïng phöông sai thay ñoåi KIỂM ĐỊNH HỆ SỐ TƢƠNG QUAN QUY TRÌNH B1: Chạy hồi quy, lấy phần dư (resid) B2: Tạo biến trị tuyệt đối của resid (ABS_resid). B3. Kiểm định hệ số tương quan giữa biến ABS_resid với từng biến độc lập H0: Không có hiện tượng phương sai thay đổi H1: Ngược lại Nguyen Duy Tam - http://sites.google.com/site/tam0505/ 40 20
- Xem thêm -

Tài liệu liên quan