Tài liệu Ứng dụng mô hình chuỗi thời gian mờ bậc cao trong dự báo

  • Số trang: 82 |
  • Loại file: PDF |
  • Lượt xem: 36 |
  • Lượt tải: 0
nhattuvisu

Đã đăng 27125 tài liệu

Mô tả:

ĐẠI HỌC THÁI NGUYÊN KHOA CÔNG NGHỆ THÔNG TIN TRẦN THANH THƢƠNG ỨNG DỤNG MÔ HÌNH CHUỖI THỜI GIAN MỜ BẬC CAO TRONG DỰ BÁO CHUYÊN NGÀNH: KHOA HỌC MÁY TÍNH MÃ SỐ: 60 48 01 LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH NGƢỜI HƢỚNG DẪN KHOA HỌC: TS. NGUYỄN CÔNG ĐIỀU THÁI NGUYÊN - 2010 Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn i MỤC LỤC Trang Trang phụ bìa Lời cam đoan MỤC LỤC ...................................................................................................... i DANH MỤC BẢNG BIỂU, HÌNH VẼ ......................................................... iii MỞ ĐẦU ....................................................................................................... 1 CHƢƠNG 1 CÁC KIẾN THỨC CƠ BẢN VỀ CHUỖI THỜI GIAN ............ 3 1.1. Chuỗi thời gian và quá trình ngẫu nhiên .................................................. 3 1.1.1. Khái niệm chuỗi thời gian và quá trình ngẫu nhiên .............................. 3 1.1.2. Quá trình ngẫu nhiên dừng ................................................................... 4 1.1.3. Hàm tự tương quan............................................................................... 5 1.1.4. Toán tử tiến, toán tử lùi ........................................................................ 5 1.2. Quá trình ARMA ..................................................................................... 6 1.2.1. Quá trình tự hồi quy ............................................................................. 6 1.2.2. Quá trình trung bình trượt .................................................................... 8 1.2.3. Quá trình tự hồi quy trung bình trượt ................................................... 9 1.3. Ƣớc lƣợng tham số mô hình ARMA...................................................... 11 1.4. Những hạn chế của mô hình ARMA trong chuỗi thời gian tài chính...... 12 CHƢƠNG 2 LÝ THUYẾT TẬP MỜ ........................................................... 17 2.1. Lý thuyết tập mờ ................................................................................... 17 2.1.1. Tập mờ ............................................................................................... 17 2.1.2. Các phép toán trên tập mờ.................................................................. 19 2.2. Các quan hệ và suy luận xấp xỉ, suy diễn mờ ......................................... 22 Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn ii 2.2.1. Quan hệ mờ ........................................................................................ 22 2.2.2. Suy luận xấp xỉ và suy diễn mờ ........................................................... 23 2.3. Hệ mờ.................................................................................................... 25 2.3.1. Bộ mờ hoá .......................................................................................... 25 2.3.2. Hệ luật mờ .......................................................................................... 26 2.3.3. Động cơ suy diễn ................................................................................ 26 2.3.4. Bộ giải mờ .......................................................................................... 27 2.3.5. Ví dụ minh họa ................................................................................... 28 CHƢƠNG 3.................................................................................................. 30 MÔ HÌNH CHUỖI THỜI GIAN MỜ BẬC CAO VÀ ỨNG DỤNG .............. 30 3.1. Chuỗi thời gian mờ ................................................................................ 30 3.1.1. Khái niệm ........................................................................................... 30 3.1.2. Một số định nghĩa liên quan đến chuỗi thời gian mờ .......................... 30 3.2. Một số thuật toán trong mô hình chuỗi thời gian mờ ............................. 31 3.2.1. Một số thuật toán bậc một (thuật toán cơ sở) ..................................... 31 3.2.2. Một số thuật toán bậc cao .................................................................. 33 3.3. Ứng dụng trong dự báo .......................................................................... 40 3.3.1. Ứng dụng thuật toán bậc cao mới ....................................................... 40 3.3.2. Ứng dụng thuật toán bậc cao của Singh ............................................. 55 3.3.3. Ứng dụng cải biên thuật toán bậc cao của Singh ................................ 62 KẾT LUẬN .................................................................................................. 72 TÀI LIỆU THAM KHẢO ............................................................................ 73 PHỤ LỤC .................................................................................................... 75 Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn iii DANH MỤC BẢNG BIỂU, HÌNH VẼ Hình 1.1 Chuỗi giá ................................................................................................ 12 Hình 1.2 Chuỗi tăng trƣởng ................................................................................... 12 Hình 1.3 Tự tƣơng quan của chuỗi tăng trƣởng...................................................... 13 Hình 1.4 Tự tƣơng quan riêng của chuỗi tăng trƣởng ............................................. 13 Hình 1.5 Bình phƣơng chuỗi tăng trƣởng............................................................... 14 Hình 1.6 Tự tƣơng quan của bình phƣơng chuỗi tăng trƣởng ................................. 14 Hình 1.7 Tự tƣơng quan riêng của bình phƣơng chuỗi tăng trƣởng ........................ 14 Hình 1.8 Nhiễu ...................................................................................................... 15 Hình 1.9 Tự tƣơng quan của nhiễu......................................................................... 15 Hình 1.10. Tự tƣơng quan riêng của nhiễu ............................................................. 15 Hình 1.11. Bình phƣơng nhiễu............................................................................... 16 Hình 1.12 Tự tƣơng quan bình phƣơng nhiễu ........................................................ 16 Hình 1.13 Tự tƣơng quan riêng bình phƣơng nhiễu ............................................... 16 Hình 2.1. Hàm liên thuộc của tập mờ “x gần 1” .................................................... 18 Hình 2.2. Một số dạng hàm liên thuộc của tập mờ ................................................. 18 Bảng 2.1: Các cặp T - chuẩn và T - đối chuẩn ....................................................... 21 Bảng 2.2. Một số phép kéo theo mờ thông dụng .................................................... 22 Hình 2.3. Minh hoạ các phƣơng pháp giải mờ ....................................................... 29 Bảng 3.1. Giá trị chỉ số chứng khoán Đài Loan ..................................................... 40 Bảng 3.2. Phân bố giá trị trong từng khoảng .......................................................... 41 Bảng 3.3. Phân khoảng .......................................................................................... 41 Bảng 3.4. Nhóm mối quan hệ mờ .......................................................................... 42 Bảng 3.5. Mối quan hệ mờ và nhóm quan hệ mờ bậc cao ...................................... 44 Bảng 3.6. Kết quả dự báo của các phƣơng pháp khác nhau .................................... 45 Bảng 3.7. Chuỗi thời gian mờ và kết quả dự báo dự báo ........................................ 45 Bảng 3.8. Giá trị nhiệt độ Hà Nội .......................................................................... 46 Bảng 3.9. Phân bố giá trị trong từng khoảng .......................................................... 47 Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn iv Bảng 3.10. Phân khoảng ........................................................................................ 47 Bảng 3.11. Nhóm mối quan hệ mờ ........................................................................ 48 Bảng 3.12. Mối quan hệ mờ và nhóm quan hệ mờ bậc cao – kết quả dự báo .......... 54 Hình 3.1. Đồ thị so sánh kết quả dự báo và giá trị thực .......................................... 55 Bảng 3.13. Phân khoảng ........................................................................................ 56 Bảng 3.14. Các giá trị mờ hóa .............................................................................. 57 Bảng 3.15. Kết quả dự báo .................................................................................... 58 Hình 3.2. Đồ thị so sánh kết quả dự báo và giá trị thực .......................................... 58 Bảng 3.16. Phân khoảng ........................................................................................ 59 Bảng 3.17. Các quan hệ mờ ................................................................................... 60 Bảng 3.18. Kết quả dự báo .................................................................................... 61 Bảng 3.19. Phân bố giá trị trong từng khoảng ........................................................ 63 Bảng 3.20. Phân khoảng ........................................................................................ 63 Bảng 3.21. Các giá trị mờ hóa ............................................................................... 64 Bảng 3.22. Kết quả dự báo .................................................................................... 65 Bảng 3.23. Phân bố giá trị trong từng khoảng ........................................................ 67 Bảng 3.24. Phân khoảng ........................................................................................ 68 Bảng 3.25. Các giá trị mờ hóa ............................................................................... 69 Bảng 3.26. Kết quả dự báo .................................................................................... 70 Hình PL.1. Giao diện chƣơng trình ........................................................................ 75 Hình PL.2. Test chƣơng trình ................................................................................ 75 Hình PL.3. Dự báo chỉ số chứng khoán theo thuật toán nguyên thủy của Singh ..... 76 Hình PL.4. Dự báo nhiệt độ theo thuật toán nguyên thủy của Singh ...................... 76 Hình PL.5. Dự báo chỉ số chứng khoán theo thuật toán Singh cải biên .................. 77 Hình PL.6. Dự báo nhiệt độ theo thuật toán Singh cải biên .................................... 77 Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 1 MỞ ĐẦU Chuỗi thời gian đang đƣợc sử dụng nhƣ một công cụ hữu hiệu để phân tích số liệu trong kinh tế, xã hội cũng nhƣ trong nghiên cứu khoa học. Chính do tầm quan trọng của phân tích chuỗi thời gian, rất nhiều tác giả đã đề xuất các công cụ phân tích chuỗi thời gian để trích xuất ra những thông tin quan trọng từ trong các dãy số liệu. Trƣớc đây, phƣơng pháp chủ yếu để phân tích chuỗi thời gian là sử dụng các công cụ của thống kê nhƣ hồi qui, phân tích Fourie và một vài công cụ khác. Nhƣng hiệu quả nhất và đƣợc sử dụng chủ yếu để dự báo chỗi thời gian là phƣơng pháp đƣợc Box và Jenkins xây dựng từ những năm 70 của thế kỷ trƣớc. Đó là mô hình ARMA. Tuy nhiên mô hình ARMA chỉ thích ứng hầu hết cho chuỗi thời gian dừng và tuyến tính, chính vì vậy những chuỗi thời gian biến thiên nhanh hoặc chuỗi số liệu lịch sử ngắn cho kết quả chƣa chính xác. Chuỗi thời gian trong kinh tế do đặc điểm phát triển kinh tế phụ thuộc rất nhiều vào các yếu tố khác nhau nên có nhiều biến thiên và mang tính phi tuyến. Chính vì vậy mô hình ARMA không thể xử lý tốt trong lĩnh vực kinh tế. Để vƣợt qua đƣợc những khó khăn trên, gần đây nhiều tác giả đã sử dụng mô hình chuỗi thời gian mờ. Khái niệm tập mờ đƣợc Zadeh đƣa ra từ năm 1965 và ngày càng tìm đƣợc ứng dụng trong nhiều lĩnh vực khác nhau nhất là trong điều khiển và trí tuệ nhân tạo. Chuỗi thời gian mờ và mô hình chuỗi thời gian mờ bậc nhất đƣợc Song và Chissom phát triển từ năm 1993, Song và Chissom đã đƣa ra khái niệm chuỗi thời gian mờ không phụ thuộc vào thời gian (chuỗi thời gian dừng) và phụ thuộc vào thời gian (không dừng) để dự báo. Chen đã cải tiến và đƣa ra phƣơng pháp mới đơn giản và hữu hiệu hơn so với phƣơng pháp của Song và Chissom. Trong phƣơng pháp của mình, thay vì sử dụng các phép tính tổ hợp Max-Min phức tạp, Chen đã tính toán bằng các phép tính số học đơn giản để thiết lập các mối quan hệ mờ. Phƣơng pháp của Chen cho hiệu quả cao hơn về mặt sai số dự báo và giảm độ phức tạp của thuật toán. Từ các công trình ban đầu về chuỗi thời gian mờ đƣợc xuất hiện năm 1993, hiện nay mô hình này đang đƣợc sử dụng để dự báo trong rất nhiều lĩnh vực của kinh tế hay xã hội nhƣ giáo dục để dự báo số sinh viên nhập trƣờng hay trong lĩnh vực dự báo thất nghiệp, dân số, chứng khoán và trong đời sống nhƣ dự báo mức tiêu thụ điện, hay dự báo nhiệt độ của thời tiết… Tuy nhiên xét về độ chính xác của dự báo, các thuật toán trên cho kết quả chƣa cao. Trong những năm gần đây, một số tác giả đã sử dụng nhiều kỹ thuật khác nhau để tìm mô hình hữu hiệu cho chuỗi thời gian mờ. Những kỹ thuật trong lý thuyết tính toán mềm, khai phá dữ liệu, mạng nơ ron và các giải thuật tiến hoá Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 2 đều đƣợc đƣa vào sử dụng. Một số tác giả sử dụng phƣơng pháp phân cụm nhƣ công trình của Chen et al trong tập thô hay sử dụng khái niệm tối ƣu đám đông nhƣ trong các công trình để xây dựng các thuật toán trong mô hình chuỗi thời gian mờ. Ngoài ra, một số tác giả khác đã sử dụng thêm thông tin khác trong chứng khoán để dự báo chính xác hơn các chỉ số chứng khoán. Một trong các hƣớng đƣợc phát triển là sử dụng mối quan hệ mờ bậc cao trong mô hình chuỗi thời gian mờ. Chen tiếp tục là ngƣời đi đầu khi xây dựng đƣợc thuật toán để xử lý mối quan hệ mờ bậc cao. Sau đó hƣớng này đƣợc một số tác giả khác tiếp cận và ứng dụng trong các công trình của mình. Riêng Singh đã xây dựng mô hình chuỗi thời gian mờ bậc cao bằng cách mở rộng thuật toán đơn giản của mình xây dựng trong các công trình trƣớc đây. Nhƣ đã trình bầy ở trên, mô hình chuỗi thời gian mờ đang có nhiều ứng dụng trong công tác dự báo. Tuy nhiên kết quả dự báo của các phƣơng pháp đề xuất còn chƣa cao. Do đó việc tìm tòi các mô hình có độ chính xác cao hơn và thuật toán đơn giản hơn đang là một ƣu tiên. Với mục tiêu tìm hiểu về việc sử dụng mô hình chuỗi thời gian trong dự báo, đặc biệt là việc sử dụng mô hình chuỗi thời gian mờ bậc cao, em đã lựa chọn đề tài “Ứng dụng mô hình chuỗi thời gian mờ bậc cao trong dự báo” làm đề tài cho luận văn tốt nghiệp của mình. Nội dung chính của luận văn là tìm hiểu, nghiên cứu những khái niệm, tính chất và một số thuật toán trong mô hình chuỗi thời gian mờ bậc cao để ứng dụng dự báo chỉ số chứng khoán Đài Loan và dự báo nhiệt độ tại Hà Nội đƣợc trình bày trong 3 chƣơng nhƣ sau: Chƣơng 1: Các kiến thức cơ bản về chuỗi thời gian. Chƣơng 2: Lý thuyết tập mờ. Chƣơng 3: Mô hình chuỗi thời gian mờ bậc cao và ứng dụng. Luận văn này đƣợc hoàn thành dƣới sự hƣớng dẫn tận tình của TS Nguyễn Công Điều, tác giả xin bày tỏ lòng biết ơn chân thành của mình đối với thầy. Tác giả xin chân thành cảm ơn các thầy, cô giáo Viện Công nghệ thông tin, Khoa Công nghệ thông tin - Đại học Thái Nguyên đã tham gia giảng dạy, giúp đỡ em trong suốt qúa trình học tập nâng cao trình độ kiến thức. Tuy nhiên vì điều kiện thời gian và khả năng có hạn nên luận văn không thể tránh khỏi những thiếu sót. Tác giả kính mong các thầy cô giáo và bạn đóng góp ý kiến để đề tài đƣợc hoàn thiện hơn. Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 3 CHƢƠNG 1 CÁC KIẾN THỨC CƠ BẢN VỀ CHUỖI THỜI GIAN Chƣơng 1 giới thiệu các kiến thức cơ bản về chuỗi thời gian và trọng tâm là trình bầy về một lớp mô hình chuỗi thời gian hết sức thông dụng trong thực tế. Đó là mô hình quy trình trƣợt ARMA (Autoregressive Moving Average). Bao gồm các nội dung: đặc trƣng của quá trình ARMA, phƣơng pháp ƣớc lƣợng tham số của lớp mô hình này và hạn chế của nó khi áp dụng với chuỗi thời gian tài chính. 1.1. Chuỗi thời gian và quá trình ngẫu nhiên 1.1.1. Khái niệm chuỗi thời gian và quá trình ngẫu nhiên Một chuỗi thời gian là một dãy các giá trị quan sát X:={x1, x2,…… xn} đƣợc xếp thứ tự diễn biến thời gian với x1 là các giá trị quan sát tại thời điểm đầu tiên, x2 là quan sát tại thời điểm thứ 2 và xn là quan sát tại thời điểm thứ n. Ví dụ: Các báo cáo tài chính mà ta thấy hằng ngày trên báo chí, tivi hay Internet về các chỉ số chứng khoán, tỷ giá tiền tệ, chỉ số tiêu dùng đều là những thể hiện rất thực tế của chuỗi thời gian. Bƣớc đầu tiên của việc phân tích chuỗi thời gian là chọn một mô hình toán học phù hợp với tập dữ liệu cho trƣớc X:={x1, x2,……… xn} nào đó. Để có thể nói về bản chất của những quan sát chƣa diễn ra, ta giả thiết mỗi quan sát xt là một giá trị thể hiện của biến ngẫu nhiên Xt với tT. Ở đây T đƣợc gọi là tập chỉ số. Khi đó ta có thể coi tập dữ liệu X:={x1, x2,……… xn} là thể hiện của quá trình ngẫu nhiên Xt, tT. Và vì vậy, ta có thể định nghĩa một quá trình ngẫu nhiên nhƣ sau: Định nghĩa 1.1(Quá trình ngẫu nhiên) Một quá trình ngẫu nhiên là một họ các biến ngẫu nhiên  Xt, tT được định nghĩa trên một không gian xác suất(, ,). Chú ý: Trong việc phân tích chuỗi thời gian, tập chỉ số T là một tập các thời điểm, ví dụ nhƣ là tập {1,2..} hay tập (-,+). Cũng có những quá trình ngẫu nhiên có T không phải là một tập con của R nhƣng trong giới hạn của luận văn nàychỉ xét cho trƣờng hợp TR. Và thƣờng thì ta xem T là các tập các số nguyên, khi đó ta sẽ sử dụng ký hiệu tập chỉ số là Z Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 4 thay vì T ở trên. Một điểm chú ý nữa là trong luận văn này sẽ dùng thuật ngữ chuỗi thời gian để đồng thời chỉ dữ liệu cũng nhƣ quá trình có dữ liệu đó là một thể hiện. 1.1.2. Quá trình ngẫu nhiên dừng Định nghĩa 1.2 (Hàm tự hiệp phƣơng sai) Giả sử  Xt, t Z là một quá trình ngẫu nhiên có var(Xt)< với mỗi t Z. Khi đó hàm tự hiệp phương sai của Xt được định nghĩa theo công thức sau:  x (r , s) : cov( X r , X s )  E[( X r  EX r )( X s  EX s )], với r, s  Z. Định nghĩa 1.3 (Quá trình dừng) Chuỗi thời gian Xt, t Z được gọi là dừng nếu nó thoả mãn 3 điều kiện sau: - E X t  , t  Z 2 - EX t  m, t  Z -  x (r , s )   x (r  t , s  t ), t , r , s  Z Định lý 1.1 Nếu  Xt, t Z là một quá trình dừng, và nếu như at  R, i Z thoả mãn điều  kiện  ai   thì hệ thức Yt : i    a X i   i t -i , t  Z sẽ định nghĩa một quá dừng. Chú ý: Cũng có tài liệu gọi “dừng” theo nghĩa trên là dừng yếu, dừng theo nghĩa rộng hay dừng bậc hai. Tuy nhiên trong giới hạn luận văn chỉ xem xét tính dừng theo định nghĩa ở trên. Khi chuỗi thời gian Xt, t Z là dừng thì y x  (r , s)   x (r  s,0), r , s  Z , Và vì vậy, với một quá trình dừng thì có thể định nghĩa lại hàm tự hiệp phƣơng sai bằng cách chỉ thông qua hàm một biến. Khi đó, với quá trình dừng Xt, t Z ta có: y x (h)   x (h,0)  Cov( X t h , X t ), t, h  Z Hàm số y x (.)  đƣợc gọi là hàm tự hiệp phƣơng sai của Xt, còn x(h)là giá trị của nó tại “trễ” h. Đối với một quá trình dừng thì ta thƣờng ký hiệu hàm tự hiệp phƣơng sai bởi (.) thay vì x(.). Với một quá trình dừng thì hàm hiệp phƣơng sai có các tính chất (0)  0, (h)(0), hZ Và nó còn là một hàm chẵn nghĩa là: (h) = (-h),hZ. Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 5 1.1.3. Hàm tự tương quan Định nghĩa 1.4 Hàm tự tương quan của quá trình ngẫu nhiên  Xt, t Z được định nghĩa tại trễ h như sau: (h): = (h)/(0):=corr(Xt+h,Xt), t, hZ Chú ý: Trong thực tế, ta chỉ quan sát đƣợc một thể hiện hữu hạn X:={xt, t = 1,2,…n} của một chuỗi thời gian dừng nên về nguyên tắc ta không thể biết chính xác đƣợc các hàm tự hiệp phƣơng sai của chuỗi thời gian đó, muốn ƣớc lƣợng nó ta đƣa vào khái niệm hàm tự hiệp phƣơng sai mẫu của thể hiện X. Hàm tự hiệp phƣơng sai mẫu của một thể hiện X đƣợc định nghĩa bởi công thức: n h c(h) : n 1n 1  ( x j  x)( x  x),0  h  n j h j 1 n Và c(h) : c(h), n  h  0, trong đó x  n 1  x j là trung bình mẫu. j 1 Khi đó thì hàm tƣơng tự tƣơng quan mẫu cũng định nghĩa thông qua hàm tự hiệp phƣơng sai mẫu nhƣ sau: r (h) : c(h) / c(0), h  n. 1.1.4. Toán tử tiến, toán tử lùi Toán tử lùi B kết hợp với một quá trình ngẫu nhiên  Xt, t Z là quá trình ngẫu nhiên  Yt, t Z sao cho Yt : BX t : X t 1 Toán tử lùi B là toán tử tuyến tính và khả nghịch. Nghịch đảo của nó B-1:=F đƣợc gọi là toán tử tiến, định nghĩa bởi công thức: FXt :=Xt+1 Các toán tử B, F thoả mãn hệ thức BnXt = Xt-n, FnXt :=Xt+n Và n  n    a B i X   a X t i0 i t-i i  i0  Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 6 Chú ý: Một cách tổng quát, ngƣời ta có thể định nghĩa các chuỗi theo toán tử tiến F hay toán tử lùi B và muốn thế cần hạn chế trong trƣờng hợp các quá trình là dừng. Khi đó, giả sử ta có quá trình dừng  Xt, t Z và một dãy {ai ,iZ tuyệt đối khả tổng, tức là    ai   , thì theo định lý 1.1, quá trình Yt :  ai X t i , t  Z cũng là quá trình i   i  dừng. Ta ký hiệu a B i   i i là ánh xạ đặt tƣơng ứng quá trình dừng  Xt, t Z với quá trình dừng  Yt, t Z. Các chuỗi theo B khi đó sẽ có những tính chất cho phép ta xử lý nó tƣơng tự nhƣ đối với chuỗi nguyên thông thƣờng. Đặc biệt ta có thể thực hiện phép cộng, phép nhân hay phép lấy nghịch đảo. Điều này có vai trò quan trọng trong các phép biến đổi của đa thức tự hồi quy, đa thức trung bình trƣợt và các phép biến đổi xử lý chuỗi thời gian khác. 1.2. Quá trình ARMA 1.2.1. Quá trình tự hồi quy Định nghĩa 1.5 (Quá trình ồn trắng) Quá trình ngẫu nhiên t, tZ được gọi là một ồn trắng, ký hiệu WN(0,2), khi nó thoả mãn các điều kiện sau: Ets = 0 (t s) E t2   2 Et  0, t Định nghĩa 1.6 (Quá trình tự hồi quy) Người ta gọi quá trình ngẫu nhiên  Xt, t Z là một quá trình tự hồi quy cấp P, viết là Xt  AR(p), là một quá trình dừng {Xt, tZ} thoả mãn Xt a X a X  ...  a X   | a  0 . 1 t 1 2 t 2 p t-p t p với {} là một ồn trắng. Ta có thể viết biểu thức của quá trình tự hồi quy ở trên bởi công thức Xt  a1X t 1  a2 X t 2  ....  a p X t-p   t | a p  0, Hay ở dạng toán tử z  a  z 2  ...  a z 1 2 p a ( z ) : 1  a p ở đây a(z) đƣợc gọi là đa thức hồi quy. Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 7 Chú ý: Nếu đa thức a(z) ở trên có nghiệm nằm ngoài đĩa tròn đơn vị ( z  1) thì Xt đƣợc gọi là quá trình nhân quả tự hồi qui cấp p và nói chung ta chỉ xét các quá trình nhân quả. Các đặc trƣng của quá trình tự hồi quy cấp p: - E(Xt) = 0 -  (0)   ai  (i ) |  2 p t 1 p -  (h)   ai  (h  i)  0, h  0 i1 Lần lƣợt cho h = 1,2,….p ta đƣợc 1 (1) …. (p-2) (p-1) (1) 1 …. (p-3) (p-1) …. …. …. …... ….. (p-2)…. (p-3) 1 (1) (p-1) (p-2) (1) 1  a1    (1)  a    ( 2)    2     =   ......  a  p 1   ( p  1)     a  p     ( p )  Hệ phƣơng trình gọi là hệ phƣơng trình Jule – Walker, song tuyến đối với a và . Nghĩa là nếu cho  ta sẽ tính đƣợc a và ngƣợc lại cho a ta cũng sẽ tính đƣợc . Trong hệ phƣơng trình Jule – Walker, nếu ta đặt pi = ai, i =1,…p thì hệ phƣơng trình Jule – Walker tƣơng đƣơng với  ( j )   p1  ( j  p), j  1,..., p Đại lƣợng pp ở trên đƣợc gọi là tự tƣơng quan riêng cấp p của quá trình {Xt, nó đóng vai trò rất quan trọng trong việc xác định bậc của quá trình tự hồi quy cũng nhƣ việc ƣớc lƣợng tham số mô hình tự hồi quy sau này. Trong việc thực tế, khi cho chuỗi quan sát X:=x1, t = 1,2…,n thì ta dùng công thức của tƣơng quan mẫu để tính các r(i), là các giá trị xấp xỉ của (i). Khi đã có các tự tƣơng quan mẫu ta thay vào hệ phƣơng trình Jule – Walker và giải nó để tìm các tham số a1. Từ đây ta cũng xác định đƣợc tƣơng quan riêng p1….,pp. Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 8 1.2.2. Quá trình trung bình trượt Định nghĩa1.7 (Quá trình trung bình trƣợt) Một quá trình trung bình trượt cấp q, ký hiệu Xt MA(q), là một quá trình  Xt, t Z thoả mãn biểu thức Xt    b   ....  bq t q , b b ,...,bq  R, bq  0 1 1 t 1 1 2 với t là một ồn trắng. Ta cũng có thể viết biểu thức trung bình trƣợt ở trên dƣới dạng toán tử lùi tƣơng tự nhƣ đối với quá trình tự hồi quy nhƣ sau : Xt = b(B)t, Trong đó hàm b(.) định nghĩa bởi b(z) : = 1+b1z+…+bqzq. Ở đây b(z) đƣợc gọi là đa thức trung bình trƣợt. Chú ý: Khác với quá trình AR, biểu thức trên luôn xác định duy nhất một quá trình MA mà không đòi hỏi thêm điều kiện gì đối với các hệ số b1. Và với giả thiết t là ồn trắng thì theo định lý 1.1 ta có b(z)(z) = 1. Và khi đó 1 có thể biểu diễn dƣới dạng     t    j X t  j ; ( z)    j z j ;   j   j  j  j  Một chú ý nữa, cũng giống nhƣ trƣờng hợp AR, nếu đa thức trung bình trƣợt b(z) không có nghiệm có môđun bằng 1 thì ta có thể biểu diễn Xt dƣới dạng sau:   j 1 j   X t   j X t  j   t ;   j   Và có thể xác định  i bằng cách chia 1 (theo luỹ thừa tăng) cho b(z), ( 0  1) . Khi quá trình X t có thể biểu diễn ở dạng trên, tức là khi b(z) chỉ có nghiệm có môđun lớn hơn 1 thì ta nói X t là một quá trình khả nghịch. Và từ nay về sau, nếu không nói gì thêm thì khi nói về các quá trình AR và MA thì sẽ đƣợc hiểu đó là các quá trình nhân quả và khả nghịch. Các đặc trƣng của quá trình trung bình trƣợt: Trƣớc hết, dễ dàng thấy rằng EX t  0 , Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 9 Và  2 , s  t   E ( X t  t )   2b1, s  t  i;1  i  q  0, s    Mặt khác  (h): E ( X t X t  h )  E ( X t (t  h  b11  h  1  bq1  h  q )) có: Từ đó suy ra  (h)  2 (b  b b ... b b ),b :1;1 h  q  h 1 h 1 q h q 0   (h)  0, h  q  Đặc biệt có γ(0):=varX =σ2 (1+b2 +...+b2 ) t 1 q Từ công thức hiệp sai của quá trình trung bình trƣợt suy ra công thức của tự tƣơng quan nhƣ sau:  bh  b1  bh1  ....  bq hbq  , h  1, 2....q 2  1  b 2  ....  bq  ( h)   1  0, h.  q   1.2.3. Quá trình tự hồi quy trung bình trượt Định nghĩa 1.8 (quá trình tự hồi quy trung bình trƣợt) Một quá trình  Xt, t Z được gọi là quá trình tự hồi quy trung bình trượt cấp p,q, kí hiệu X t  ARMA(p,q) là một quá trình Xt, t Z thỏa mãn X t  a1X t 1  ....  a p X t  p   t  b1 t 1  ...  bq t q , a1, a2 ,...a p , b1, b2 ,..., bq  R, a p  0, bq  0 Trong đó  t là ồn trắng, a(.) và b(.) lần lƣợt là đa thức tự hồi quy và đa thức trung bình trƣợt có bậc tƣơng ứng là p và q: p a( z ) : 1  a z  ...  a p z 1 q b( z ) : 1  b1z  ...  bq z Khi đó ta có thể viết quá trình ARMA ở dạng toán tử nhƣ sau: a( B) X t  b( B)t Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 10 Định nghĩa 1.9 (Quá trình nhân khả nghịch) Một quá trình ARMA(p,q) đƣợc gọi là một quá trình nhân quả và khả nghịch nếu có là một quá trình ARMA(p,q) có a(z) và b(z) thỏa mãn hai điều kiện: i) a(z) và b(z) không có nghiệm chung ii) a(z) và b(z) không có nghiệm có môđun không vƣợt quá 1 Chú ý: Do tính nhân quả và khả nghịch cộng với tính chất khả đảo của đa thức toán tử, ta có thể biểu diễn một quá trình   X t   i t i ,   1;  i  . 0 i 0 i 1 Và có thể tính các hệ số  t bằng cách chia theo lũy thừa tăng a(z) cho b(z). Các đặc trƣng của quá trình ARMA: Trƣớc hết ta có  (h)  E( X t X p q )   a  (h  i)    . X (h)   bi  . X (h  i) t h t 1 1 i1 Với   . X (k ) : E(t X t k Mặt khác ta có thể biểu diễn X    i t k i 0 t k i Và ta có 0, k  0  e.X (k )   2  k  , k 0 Lần lƣợt cho h = 0,1,...p trong các chƣơng trình trên và chú ý đến tính chẵn của hàm (h) ta có hệ phƣơng trình tuyến tính đối với (0),..., (p) hay với  (1),... ( p). p  (h)   ai  (h  i ), h  q i 1 Và vì thế p  (h)   ai  (h  i), h  q. i1 Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 11 1.3. Ƣớc lƣợng tham số mô hình ARMA Giả sử ta cần ƣớc lƣợng các tham số của mô hình ARMA(p,q) X t  a1X t 1  ...  a p X t  p   t  b1 t 1  ...  bq t q | a1, a2 ,..., a p , b1, b2 ,..., bq  R, a p  0, bq  0,  t đóng vai trò là sai số. trong đó Đối với mô hình ARMA cũng có nhiều phƣơng pháp ƣớc lƣợng tham số hiệu quả và đƣợc nêu ra chi tiết trong P.Brockwell, R. David, 2001. Một trong số đó là phƣơng pháp bình phƣơng cực tiểu theo kiểu thuật toán Hannan – Rissanen. Ý tƣởng của thuật toán này là sử dụng hồi quy tuyến tính để ƣớc lƣợng các tham số. Nếu q>0 ta còn phải ƣớc lƣợng các giá trị chƣa biết t . Thuật toán Hannan – Rissanen Bƣớc 1: Dùng ƣớc lƣợng Yule Walker để ƣớc lƣợng các tham số mô hình AR(m), với m > max(p,q). X t  a1X t 1  ...  am X t m  t , t  m  1,..., n. Bƣớc 2: Ƣớc lƣợng vecto tham số   (a1,..., a p , b1...., bq )t trên cơ sở cực tiểu hóa hàm S (  )  n ( xt  a x  a x  ...  a p xt  p  b   ...  bq t q )2 theo  .  1 t  1 2 t  2 1 t  2 t mq1 Giải hệ Gauss-Markov, kết quả thu đƣợc ở dạng sau:    ( Z t Z )1 Z t X n , Ta cũng có thể dùng phƣơng pháp trực giao hóa Househoder để tìm. Ở đây, X n  ( X m1q ,..., X n ) Và ... X mq1 p  mq  mq1 ... m1   X mq X mq1   X  X ... X   ...  m q mq2 p mq1 mq m 2  Z   mq1    ....    ...    X X n 2 .... X n p  n2  n2 ...  nq  n1  Ƣớc lƣợng phƣơng sai  t theo công thức  2 S ( )  HR  . nmq Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 12 1.4. Những hạn chế của mô hình ARMA trong chuỗi thời gian tài chính Mô hình ARMA thu đƣợc thành công lớn khi áp dụng cho các chuỗi thời gian xuất phát từ các lĩnh vực khoa học tự nhiên và kỹ thuật nhƣng thất bại khi áp dụng cho các chuỗi thời gian kinh tế tài chính. Nguyên nhân chính là giả thiết về mặt toán học phƣơng sai của các chuỗi thời gian tài chính không thay đổi theo thời gian là không phù hợp. Và vì vậy mô hình ARMA có thể dự báo đƣợc kỳ vọng nhƣng thất bại khi dự báo phƣơng sai của chuỗi thời gian tài chính. Sau đây ta sẽ xem xét một ví dụ cụ thể để thấy rõ sự không phù hợp của mô hình ARMA đối với chuỗi thời gian tài chính. Xét chuỗi số chuỗi số liệu NYSE chứa giá trị của chỉ số chứng khoán giao dịch hằng ngày trên thị trƣờng NewYork từ tháng ngày 02/01/1990 đến ngày 31/12/2001. Chuỗi gồm 3028 số liệu đƣợc lƣu dƣới tên file là NYSE.txt. Tuy nhiên thay vì trực tiếp làm việc với chuỗi số liệu gốc, ta lấy logarit tự nhiên của chuỗi gốc rồi lấy lại sai phân của nó để đƣợc một chuỗi mới mà trong lĩnh vực kinh tế tài chính ta gọi là chuỗi tăng trƣởng. Từ số liệu ở trên, chuỗi giá và chuỗi tăng trƣởng đƣợc minh họa nhƣ sau: Hình 1.1 Chuỗi giá Hình 1.2 Chuỗi tăng trưởng Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 13 Nhìn vào đồ thị của chuỗi giá, rõ ràng ta thấy nó không có tính dừng. Ngƣợc lại, chuỗi tăng trƣởng có đồ thị rất giống với một quá trình dừng. Khi nhìn vào đồ thị của chuỗi tăng trƣởng ta cũng thấy có xuất hiện những cụm biến động, có vùng biến đổi về phƣơng sai của chuỗi thời gian. Tiếp theo ta sẽ khai thác đặc trƣng tƣơng quan riêng mẫu của chuỗi tăng trƣởng ở trên. Kết quả đƣợc minh họa bằng đồ thị sau: Hình 1.3 Tự tương quan của chuỗi tăng trưởng Hình 1.4 Tự tương quan riêng của chuỗi tăng trưởng Ta thấy rằng tƣơng quan riêng của chuỗi tăng trƣởng biến đổi trong một khoảng tƣơng đối hẹp khá giống với tự tƣơng quan riêng của một quá trình dừng. Tuy nhiên ta lại không thấy đƣợc dấu hiệu triệt tiêu của tự tƣơng quan riêng mặc dù ta đã lấy đến trễ 100. Điều này cho thấy cho chuỗi tăng trƣởng chắc chắn không thể là một quá trình tự hồi quy. Ta cũng biết rằng, về mặt lý thuyết có thể xấp xỉ mô hình AR nhiều tham số bằng mô hình ARMA với ít tham số hơn. Điều này cũng cho thấy mô hình ARMA nhiều khả năng không phù hợp với chuỗi tăng trƣởng của chúng ta. Bây giờ ta lấy bình phƣơng chuỗi tăng trƣởng, kết quả cho bởi đồ thị dƣới đây Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 14 Hình 1.5 Bình phương chuỗi tăng trưởng Nhìn vào đồ thị ta có thể ta có thể thấy đƣợc việc tạo thành các cụm biến động trong đó các thời kỳ và biến động mạnh xen kẽ nhau. Ta tính tiếp các đặc trƣng mẫu của bình phƣơng chuỗi tăng trƣởng. Kết quả đƣợc thể hiện bằng các đồ thị sau Hình 1.6 Tự tương quan của bình phương chuỗi tăng trưởng Hình 1.7 Tự tương quan riêng của bình phương chuỗi tăng trưởng Mặc dù chuỗi tăng trƣởng ít tƣơng quan nhƣng bình phƣơng của nó lại thể hiện sự tƣơng quan mạnh. Những dấu hiệu đó cho ta thấy rằng mô hình ARMA không thực sự phù hợp với chuỗi thời gian qua sát này. Bây giờ giả sử bằng cách nào đó ta tìm đƣợc mô hình ARMA gần nhất với chuỗi quan sát và đó là mô hình ARMA(1,1). Mục đích ở đây là chúng ta sẽ thấy rõ ràng sau khi ƣớc lƣợng, nhiễu thu đƣợc sẽ không phải là một ồn trắng nhƣ ta mong muốn nữa. Thật vậy, kết quả ƣớc lƣợng theo mô hình ARMA(1,1) là yt  0.00049332  t Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 15 Nhiễu khi đó đƣợc tính toán và biểu diễn bởi đồ thị sau Hình 1.8 Nhiễu Khi đó tự tƣơng quan và tự tƣơng quan riêng của nhiễu cho bởi đồ thị dƣới đây Hình 1.9 Tự tương quan của nhiễu Hình 1.10. Tự tương quan riêng của nhiễu Ban đầu, do tính ít tƣơng quan của nhiễu ƣớc lƣợng đƣợc nên ta thấy nó giống với một quá trình ồn trắng. Tuy nhiên khi lấy bình phƣơng nhiễu ta lại thấy khác. Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
- Xem thêm -