ĐẠI HỌC THÁI NGUYÊN
KHOA CÔNG NGHỆ THÔNG TIN
TRẦN THANH THƢƠNG
ỨNG DỤNG MÔ HÌNH CHUỖI THỜI GIAN MỜ BẬC CAO
TRONG DỰ BÁO
CHUYÊN NGÀNH: KHOA HỌC MÁY TÍNH
MÃ SỐ: 60 48 01
LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH
NGƢỜI HƢỚNG DẪN KHOA HỌC: TS. NGUYỄN CÔNG ĐIỀU
THÁI NGUYÊN - 2010
Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên
http://www.lrc-tnu.edu.vn
i
MỤC LỤC
Trang
Trang phụ bìa
Lời cam đoan
MỤC LỤC ...................................................................................................... i
DANH MỤC BẢNG BIỂU, HÌNH VẼ ......................................................... iii
MỞ ĐẦU ....................................................................................................... 1
CHƢƠNG 1 CÁC KIẾN THỨC CƠ BẢN VỀ CHUỖI THỜI GIAN ............ 3
1.1. Chuỗi thời gian và quá trình ngẫu nhiên .................................................. 3
1.1.1. Khái niệm chuỗi thời gian và quá trình ngẫu nhiên .............................. 3
1.1.2. Quá trình ngẫu nhiên dừng ................................................................... 4
1.1.3. Hàm tự tương quan............................................................................... 5
1.1.4. Toán tử tiến, toán tử lùi ........................................................................ 5
1.2. Quá trình ARMA ..................................................................................... 6
1.2.1. Quá trình tự hồi quy ............................................................................. 6
1.2.2. Quá trình trung bình trượt .................................................................... 8
1.2.3. Quá trình tự hồi quy trung bình trượt ................................................... 9
1.3. Ƣớc lƣợng tham số mô hình ARMA...................................................... 11
1.4. Những hạn chế của mô hình ARMA trong chuỗi thời gian tài chính...... 12
CHƢƠNG 2 LÝ THUYẾT TẬP MỜ ........................................................... 17
2.1. Lý thuyết tập mờ ................................................................................... 17
2.1.1. Tập mờ ............................................................................................... 17
2.1.2. Các phép toán trên tập mờ.................................................................. 19
2.2. Các quan hệ và suy luận xấp xỉ, suy diễn mờ ......................................... 22
Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên
http://www.lrc-tnu.edu.vn
ii
2.2.1. Quan hệ mờ ........................................................................................ 22
2.2.2. Suy luận xấp xỉ và suy diễn mờ ........................................................... 23
2.3. Hệ mờ.................................................................................................... 25
2.3.1. Bộ mờ hoá .......................................................................................... 25
2.3.2. Hệ luật mờ .......................................................................................... 26
2.3.3. Động cơ suy diễn ................................................................................ 26
2.3.4. Bộ giải mờ .......................................................................................... 27
2.3.5. Ví dụ minh họa ................................................................................... 28
CHƢƠNG 3.................................................................................................. 30
MÔ HÌNH CHUỖI THỜI GIAN MỜ BẬC CAO VÀ ỨNG DỤNG .............. 30
3.1. Chuỗi thời gian mờ ................................................................................ 30
3.1.1. Khái niệm ........................................................................................... 30
3.1.2. Một số định nghĩa liên quan đến chuỗi thời gian mờ .......................... 30
3.2. Một số thuật toán trong mô hình chuỗi thời gian mờ ............................. 31
3.2.1. Một số thuật toán bậc một (thuật toán cơ sở) ..................................... 31
3.2.2. Một số thuật toán bậc cao .................................................................. 33
3.3. Ứng dụng trong dự báo .......................................................................... 40
3.3.1. Ứng dụng thuật toán bậc cao mới ....................................................... 40
3.3.2. Ứng dụng thuật toán bậc cao của Singh ............................................. 55
3.3.3. Ứng dụng cải biên thuật toán bậc cao của Singh ................................ 62
KẾT LUẬN .................................................................................................. 72
TÀI LIỆU THAM KHẢO ............................................................................ 73
PHỤ LỤC .................................................................................................... 75
Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên
http://www.lrc-tnu.edu.vn
iii
DANH MỤC BẢNG BIỂU, HÌNH VẼ
Hình 1.1 Chuỗi giá ................................................................................................ 12
Hình 1.2 Chuỗi tăng trƣởng ................................................................................... 12
Hình 1.3 Tự tƣơng quan của chuỗi tăng trƣởng...................................................... 13
Hình 1.4 Tự tƣơng quan riêng của chuỗi tăng trƣởng ............................................. 13
Hình 1.5 Bình phƣơng chuỗi tăng trƣởng............................................................... 14
Hình 1.6 Tự tƣơng quan của bình phƣơng chuỗi tăng trƣởng ................................. 14
Hình 1.7 Tự tƣơng quan riêng của bình phƣơng chuỗi tăng trƣởng ........................ 14
Hình 1.8 Nhiễu ...................................................................................................... 15
Hình 1.9 Tự tƣơng quan của nhiễu......................................................................... 15
Hình 1.10. Tự tƣơng quan riêng của nhiễu ............................................................. 15
Hình 1.11. Bình phƣơng nhiễu............................................................................... 16
Hình 1.12 Tự tƣơng quan bình phƣơng nhiễu ........................................................ 16
Hình 1.13 Tự tƣơng quan riêng bình phƣơng nhiễu ............................................... 16
Hình 2.1. Hàm liên thuộc của tập mờ “x gần 1” .................................................... 18
Hình 2.2. Một số dạng hàm liên thuộc của tập mờ ................................................. 18
Bảng 2.1: Các cặp T - chuẩn và T - đối chuẩn ....................................................... 21
Bảng 2.2. Một số phép kéo theo mờ thông dụng .................................................... 22
Hình 2.3. Minh hoạ các phƣơng pháp giải mờ ....................................................... 29
Bảng 3.1. Giá trị chỉ số chứng khoán Đài Loan ..................................................... 40
Bảng 3.2. Phân bố giá trị trong từng khoảng .......................................................... 41
Bảng 3.3. Phân khoảng .......................................................................................... 41
Bảng 3.4. Nhóm mối quan hệ mờ .......................................................................... 42
Bảng 3.5. Mối quan hệ mờ và nhóm quan hệ mờ bậc cao ...................................... 44
Bảng 3.6. Kết quả dự báo của các phƣơng pháp khác nhau .................................... 45
Bảng 3.7. Chuỗi thời gian mờ và kết quả dự báo dự báo ........................................ 45
Bảng 3.8. Giá trị nhiệt độ Hà Nội .......................................................................... 46
Bảng 3.9. Phân bố giá trị trong từng khoảng .......................................................... 47
Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên
http://www.lrc-tnu.edu.vn
iv
Bảng 3.10. Phân khoảng ........................................................................................ 47
Bảng 3.11. Nhóm mối quan hệ mờ ........................................................................ 48
Bảng 3.12. Mối quan hệ mờ và nhóm quan hệ mờ bậc cao – kết quả dự báo .......... 54
Hình 3.1. Đồ thị so sánh kết quả dự báo và giá trị thực .......................................... 55
Bảng 3.13. Phân khoảng ........................................................................................ 56
Bảng 3.14. Các giá trị mờ hóa .............................................................................. 57
Bảng 3.15. Kết quả dự báo .................................................................................... 58
Hình 3.2. Đồ thị so sánh kết quả dự báo và giá trị thực .......................................... 58
Bảng 3.16. Phân khoảng ........................................................................................ 59
Bảng 3.17. Các quan hệ mờ ................................................................................... 60
Bảng 3.18. Kết quả dự báo .................................................................................... 61
Bảng 3.19. Phân bố giá trị trong từng khoảng ........................................................ 63
Bảng 3.20. Phân khoảng ........................................................................................ 63
Bảng 3.21. Các giá trị mờ hóa ............................................................................... 64
Bảng 3.22. Kết quả dự báo .................................................................................... 65
Bảng 3.23. Phân bố giá trị trong từng khoảng ........................................................ 67
Bảng 3.24. Phân khoảng ........................................................................................ 68
Bảng 3.25. Các giá trị mờ hóa ............................................................................... 69
Bảng 3.26. Kết quả dự báo .................................................................................... 70
Hình PL.1. Giao diện chƣơng trình ........................................................................ 75
Hình PL.2. Test chƣơng trình ................................................................................ 75
Hình PL.3. Dự báo chỉ số chứng khoán theo thuật toán nguyên thủy của Singh ..... 76
Hình PL.4. Dự báo nhiệt độ theo thuật toán nguyên thủy của Singh ...................... 76
Hình PL.5. Dự báo chỉ số chứng khoán theo thuật toán Singh cải biên .................. 77
Hình PL.6. Dự báo nhiệt độ theo thuật toán Singh cải biên .................................... 77
Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên
http://www.lrc-tnu.edu.vn
1
MỞ ĐẦU
Chuỗi thời gian đang đƣợc sử dụng nhƣ một công cụ hữu hiệu để phân tích số liệu
trong kinh tế, xã hội cũng nhƣ trong nghiên cứu khoa học. Chính do tầm quan trọng
của phân tích chuỗi thời gian, rất nhiều tác giả đã đề xuất các công cụ phân tích chuỗi
thời gian để trích xuất ra những thông tin quan trọng từ trong các dãy số liệu.
Trƣớc đây, phƣơng pháp chủ yếu để phân tích chuỗi thời gian là sử dụng các công
cụ của thống kê nhƣ hồi qui, phân tích Fourie và một vài công cụ khác. Nhƣng hiệu
quả nhất và đƣợc sử dụng chủ yếu để dự báo chỗi thời gian là phƣơng pháp đƣợc Box
và Jenkins xây dựng từ những năm 70 của thế kỷ trƣớc. Đó là mô hình ARMA. Tuy
nhiên mô hình ARMA chỉ thích ứng hầu hết cho chuỗi thời gian dừng và tuyến tính,
chính vì vậy những chuỗi thời gian biến thiên nhanh hoặc chuỗi số liệu lịch sử ngắn
cho kết quả chƣa chính xác. Chuỗi thời gian trong kinh tế do đặc điểm phát triển kinh
tế phụ thuộc rất nhiều vào các yếu tố khác nhau nên có nhiều biến thiên và mang tính
phi tuyến. Chính vì vậy mô hình ARMA không thể xử lý tốt trong lĩnh vực kinh tế.
Để vƣợt qua đƣợc những khó khăn trên, gần đây nhiều tác giả đã sử dụng mô hình
chuỗi thời gian mờ. Khái niệm tập mờ đƣợc Zadeh đƣa ra từ năm 1965 và ngày càng
tìm đƣợc ứng dụng trong nhiều lĩnh vực khác nhau nhất là trong điều khiển và trí tuệ
nhân tạo. Chuỗi thời gian mờ và mô hình chuỗi thời gian mờ bậc nhất đƣợc Song và
Chissom phát triển từ năm 1993, Song và Chissom đã đƣa ra khái niệm chuỗi thời gian
mờ không phụ thuộc vào thời gian (chuỗi thời gian dừng) và phụ thuộc vào thời gian
(không dừng) để dự báo. Chen đã cải tiến và đƣa ra phƣơng pháp mới đơn giản và hữu
hiệu hơn so với phƣơng pháp của Song và Chissom. Trong phƣơng pháp của mình,
thay vì sử dụng các phép tính tổ hợp Max-Min phức tạp, Chen đã tính toán bằng các
phép tính số học đơn giản để thiết lập các mối quan hệ mờ. Phƣơng pháp của Chen cho
hiệu quả cao hơn về mặt sai số dự báo và giảm độ phức tạp của thuật toán.
Từ các công trình ban đầu về chuỗi thời gian mờ đƣợc xuất hiện năm 1993, hiện
nay mô hình này đang đƣợc sử dụng để dự báo trong rất nhiều lĩnh vực của kinh tế hay
xã hội nhƣ giáo dục để dự báo số sinh viên nhập trƣờng hay trong lĩnh vực dự báo thất
nghiệp, dân số, chứng khoán và trong đời sống nhƣ dự báo mức tiêu thụ điện, hay dự
báo nhiệt độ của thời tiết… Tuy nhiên xét về độ chính xác của dự báo, các thuật toán
trên cho kết quả chƣa cao. Trong những năm gần đây, một số tác giả đã sử dụng nhiều
kỹ thuật khác nhau để tìm mô hình hữu hiệu cho chuỗi thời gian mờ. Những kỹ thuật
trong lý thuyết tính toán mềm, khai phá dữ liệu, mạng nơ ron và các giải thuật tiến hoá
Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên
http://www.lrc-tnu.edu.vn
2
đều đƣợc đƣa vào sử dụng. Một số tác giả sử dụng phƣơng pháp phân cụm nhƣ công
trình của Chen et al trong tập thô hay sử dụng khái niệm tối ƣu đám đông nhƣ trong
các công trình để xây dựng các thuật toán trong mô hình chuỗi thời gian mờ. Ngoài ra,
một số tác giả khác đã sử dụng thêm thông tin khác trong chứng khoán để dự báo
chính xác hơn các chỉ số chứng khoán. Một trong các hƣớng đƣợc phát triển là sử
dụng mối quan hệ mờ bậc cao trong mô hình chuỗi thời gian mờ. Chen tiếp tục là
ngƣời đi đầu khi xây dựng đƣợc thuật toán để xử lý mối quan hệ mờ bậc cao. Sau đó
hƣớng này đƣợc một số tác giả khác tiếp cận và ứng dụng trong các công trình của
mình. Riêng Singh đã xây dựng mô hình chuỗi thời gian mờ bậc cao bằng cách mở
rộng thuật toán đơn giản của mình xây dựng trong các công trình trƣớc đây.
Nhƣ đã trình bầy ở trên, mô hình chuỗi thời gian mờ đang có nhiều ứng dụng trong
công tác dự báo. Tuy nhiên kết quả dự báo của các phƣơng pháp đề xuất còn chƣa cao.
Do đó việc tìm tòi các mô hình có độ chính xác cao hơn và thuật toán đơn giản hơn
đang là một ƣu tiên. Với mục tiêu tìm hiểu về việc sử dụng mô hình chuỗi thời gian
trong dự báo, đặc biệt là việc sử dụng mô hình chuỗi thời gian mờ bậc cao, em đã lựa
chọn đề tài “Ứng dụng mô hình chuỗi thời gian mờ bậc cao trong dự báo” làm đề tài
cho luận văn tốt nghiệp của mình.
Nội dung chính của luận văn là tìm hiểu, nghiên cứu những khái niệm, tính chất
và một số thuật toán trong mô hình chuỗi thời gian mờ bậc cao để ứng dụng dự báo chỉ
số chứng khoán Đài Loan và dự báo nhiệt độ tại Hà Nội đƣợc trình bày trong 3 chƣơng
nhƣ sau:
Chƣơng 1: Các kiến thức cơ bản về chuỗi thời gian.
Chƣơng 2: Lý thuyết tập mờ.
Chƣơng 3: Mô hình chuỗi thời gian mờ bậc cao và ứng dụng.
Luận văn này đƣợc hoàn thành dƣới sự hƣớng dẫn tận tình của TS Nguyễn
Công Điều, tác giả xin bày tỏ lòng biết ơn chân thành của mình đối với thầy. Tác giả
xin chân thành cảm ơn các thầy, cô giáo Viện Công nghệ thông tin, Khoa Công nghệ
thông tin - Đại học Thái Nguyên đã tham gia giảng dạy, giúp đỡ em trong suốt qúa
trình học tập nâng cao trình độ kiến thức. Tuy nhiên vì điều kiện thời gian và khả năng
có hạn nên luận văn không thể tránh khỏi những thiếu sót. Tác giả kính mong các thầy
cô giáo và bạn đóng góp ý kiến để đề tài đƣợc hoàn thiện hơn.
Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên
http://www.lrc-tnu.edu.vn
3
CHƢƠNG 1 CÁC KIẾN THỨC CƠ BẢN VỀ CHUỖI THỜI GIAN
Chƣơng 1 giới thiệu các kiến thức cơ bản về chuỗi thời gian và trọng tâm là
trình bầy về một lớp mô hình chuỗi thời gian hết sức thông dụng trong thực tế. Đó là
mô hình quy trình trƣợt ARMA (Autoregressive Moving Average). Bao gồm các nội
dung: đặc trƣng của quá trình ARMA, phƣơng pháp ƣớc lƣợng tham số của lớp mô
hình này và hạn chế của nó khi áp dụng với chuỗi thời gian tài chính.
1.1. Chuỗi thời gian và quá trình ngẫu nhiên
1.1.1. Khái niệm chuỗi thời gian và quá trình ngẫu nhiên
Một chuỗi thời gian là một dãy các giá trị quan sát X:={x1, x2,…… xn} đƣợc xếp
thứ tự diễn biến thời gian với x1 là các giá trị quan sát tại thời điểm đầu tiên, x2 là quan
sát tại thời điểm thứ 2 và xn là quan sát tại thời điểm thứ n.
Ví dụ: Các báo cáo tài chính mà ta thấy hằng ngày trên báo chí, tivi hay Internet
về các chỉ số chứng khoán, tỷ giá tiền tệ, chỉ số tiêu dùng đều là những thể hiện rất
thực tế của chuỗi thời gian.
Bƣớc đầu tiên của việc phân tích chuỗi thời gian là chọn một mô hình toán học
phù hợp với tập dữ liệu cho trƣớc X:={x1, x2,……… xn} nào đó. Để có thể nói về bản
chất của những quan sát chƣa diễn ra, ta giả thiết mỗi quan sát xt là một giá trị thể hiện
của biến ngẫu nhiên Xt với tT. Ở đây T đƣợc gọi là tập chỉ số. Khi đó ta có thể coi tập
dữ liệu X:={x1, x2,……… xn} là thể hiện của quá trình ngẫu nhiên Xt, tT. Và vì vậy,
ta có thể định nghĩa một quá trình ngẫu nhiên nhƣ sau:
Định nghĩa 1.1(Quá trình ngẫu nhiên)
Một quá trình ngẫu nhiên là một họ các biến ngẫu nhiên Xt, tT được định
nghĩa trên một không gian xác suất(, ,).
Chú ý:
Trong việc phân tích chuỗi thời gian, tập chỉ số T là một tập các thời điểm, ví dụ nhƣ
là tập {1,2..} hay tập (-,+). Cũng có những quá trình ngẫu nhiên có T không phải là một
tập con của R nhƣng trong giới hạn của luận văn nàychỉ xét cho trƣờng hợp TR. Và
thƣờng thì ta xem T là các tập các số nguyên, khi đó ta sẽ sử dụng ký hiệu tập chỉ số là Z
Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên
http://www.lrc-tnu.edu.vn
4
thay vì T ở trên. Một điểm chú ý nữa là trong luận văn này sẽ dùng thuật ngữ chuỗi thời
gian để đồng thời chỉ dữ liệu cũng nhƣ quá trình có dữ liệu đó là một thể hiện.
1.1.2. Quá trình ngẫu nhiên dừng
Định nghĩa 1.2 (Hàm tự hiệp phƣơng sai)
Giả sử Xt, t Z là một quá trình ngẫu nhiên có var(Xt)< với mỗi t Z. Khi
đó hàm tự hiệp phương sai của Xt được định nghĩa theo công thức sau:
x (r , s) : cov( X r , X s ) E[( X r EX r )( X s EX s )], với r, s Z.
Định nghĩa 1.3 (Quá trình dừng)
Chuỗi thời gian Xt, t Z được gọi là dừng nếu nó thoả mãn 3 điều kiện sau:
- E X t , t Z
2
- EX t m, t Z
- x (r , s ) x (r t , s t ), t , r , s Z
Định lý 1.1
Nếu Xt, t Z là một quá trình dừng, và nếu như at R, i Z thoả mãn điều
kiện
ai thì hệ thức Yt :
i
a X
i
i
t -i
, t Z sẽ định nghĩa một quá dừng.
Chú ý: Cũng có tài liệu gọi “dừng” theo nghĩa trên là dừng yếu, dừng theo
nghĩa rộng hay dừng bậc hai. Tuy nhiên trong giới hạn luận văn chỉ xem xét tính dừng
theo định nghĩa ở trên.
Khi chuỗi thời gian Xt, t Z là dừng thì
y x (r , s) x (r s,0), r , s Z ,
Và vì vậy, với một quá trình dừng thì có thể định nghĩa lại hàm tự hiệp phƣơng
sai bằng cách chỉ thông qua hàm một biến. Khi đó, với quá trình dừng
Xt, t Z ta có:
y x (h) x (h,0) Cov( X
t h
, X t ), t, h Z
Hàm số y x (.) đƣợc gọi là hàm tự hiệp phƣơng sai của Xt, còn x(h)là giá trị
của nó tại “trễ” h. Đối với một quá trình dừng thì ta thƣờng ký hiệu hàm tự hiệp
phƣơng sai bởi (.) thay vì x(.).
Với một quá trình dừng thì hàm hiệp phƣơng sai có các tính chất
(0) 0, (h)(0), hZ
Và nó còn là một hàm chẵn nghĩa là:
(h) = (-h),hZ.
Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên
http://www.lrc-tnu.edu.vn
5
1.1.3. Hàm tự tương quan
Định nghĩa 1.4
Hàm tự tương quan của quá trình ngẫu nhiên Xt, t Z được định nghĩa tại
trễ h như sau:
(h): = (h)/(0):=corr(Xt+h,Xt), t, hZ
Chú ý:
Trong thực tế, ta chỉ quan sát đƣợc một thể hiện hữu hạn X:={xt, t = 1,2,…n}
của một chuỗi thời gian dừng nên về nguyên tắc ta không thể biết chính xác đƣợc các
hàm tự hiệp phƣơng sai của chuỗi thời gian đó, muốn ƣớc lƣợng nó ta đƣa vào khái
niệm hàm tự hiệp phƣơng sai mẫu của thể hiện X.
Hàm tự hiệp phƣơng sai mẫu của một thể hiện X đƣợc định nghĩa bởi công
thức:
n h
c(h) : n 1n 1 ( x j x)( x
x),0 h n
j h
j 1
n
Và c(h) : c(h), n h 0, trong đó x n 1 x j là trung bình mẫu.
j 1
Khi đó thì hàm tƣơng tự tƣơng quan mẫu cũng định nghĩa thông qua hàm tự
hiệp phƣơng sai mẫu nhƣ sau:
r (h) : c(h) / c(0), h n.
1.1.4. Toán tử tiến, toán tử lùi
Toán tử lùi B kết hợp với một quá trình ngẫu nhiên Xt, t Z là quá trình
ngẫu nhiên Yt, t Z sao cho
Yt : BX t : X t 1
Toán tử lùi B là toán tử tuyến tính và khả nghịch. Nghịch đảo của nó
B-1:=F đƣợc gọi là toán tử tiến, định nghĩa bởi công thức:
FXt :=Xt+1
Các toán tử B, F thoả mãn hệ thức
BnXt = Xt-n, FnXt :=Xt+n
Và
n
n
a B i X a X
t i0 i t-i
i
i0
Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên
http://www.lrc-tnu.edu.vn
6
Chú ý:
Một cách tổng quát, ngƣời ta có thể định nghĩa các chuỗi theo toán tử tiến F hay
toán tử lùi B và muốn thế cần hạn chế trong trƣờng hợp các quá trình là dừng. Khi đó,
giả sử ta có quá trình dừng Xt, t Z và một dãy {ai ,iZ tuyệt đối khả tổng, tức là
ai , thì theo định lý 1.1, quá trình Yt : ai X t i , t Z cũng là quá trình
i
i
dừng. Ta ký hiệu
a B
i
i
i
là ánh xạ đặt tƣơng ứng quá trình dừng Xt, t Z với quá
trình dừng Yt, t Z. Các chuỗi theo B khi đó sẽ có những tính chất cho phép ta xử lý
nó tƣơng tự nhƣ đối với chuỗi nguyên thông thƣờng. Đặc biệt ta có thể thực hiện phép
cộng, phép nhân hay phép lấy nghịch đảo. Điều này có vai trò quan trọng trong các
phép biến đổi của đa thức tự hồi quy, đa thức trung bình trƣợt và các phép biến đổi xử
lý chuỗi thời gian khác.
1.2. Quá trình ARMA
1.2.1. Quá trình tự hồi quy
Định nghĩa 1.5 (Quá trình ồn trắng)
Quá trình ngẫu nhiên t, tZ được gọi là một ồn trắng, ký hiệu WN(0,2),
khi nó thoả mãn các điều kiện sau:
Ets = 0 (t s)
E t2 2
Et 0, t
Định nghĩa 1.6 (Quá trình tự hồi quy)
Người ta gọi quá trình ngẫu nhiên Xt, t Z là một quá trình tự hồi quy cấp P,
viết là Xt AR(p), là một quá trình dừng {Xt, tZ} thoả mãn
Xt
a X
a X
... a X | a 0 .
1 t 1
2 t 2
p t-p
t
p
với {} là một ồn trắng.
Ta có thể viết biểu thức của quá trình tự hồi quy ở trên bởi công thức
Xt a1X t 1 a2 X t 2 .... a p X t-p t | a p 0,
Hay ở dạng toán tử
z a z 2 ... a z
1
2
p
a ( z ) : 1 a
p
ở đây a(z) đƣợc gọi là đa thức hồi quy.
Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên
http://www.lrc-tnu.edu.vn
7
Chú ý:
Nếu đa thức a(z) ở trên có nghiệm nằm ngoài đĩa tròn đơn vị ( z 1) thì
Xt đƣợc gọi là quá trình nhân quả tự hồi qui cấp p và nói chung ta chỉ xét các quá trình
nhân quả.
Các đặc trƣng của quá trình tự hồi quy cấp p:
-
E(Xt) = 0
-
(0) ai (i ) | 2
p
t 1
p
-
(h) ai (h i) 0, h 0
i1
Lần lƣợt cho h = 1,2,….p ta đƣợc
1
(1)
….
(p-2)
(p-1)
(1)
1
….
(p-3)
(p-1)
….
….
….
…...
…..
(p-2)….
(p-3)
1
(1)
(p-1)
(p-2)
(1)
1
a1 (1)
a ( 2)
2
=
......
a
p 1 ( p 1)
a
p
( p )
Hệ phƣơng trình gọi là hệ phƣơng trình Jule – Walker, song tuyến đối với a và .
Nghĩa là nếu cho ta sẽ tính đƣợc a và ngƣợc lại cho a ta cũng sẽ tính đƣợc .
Trong hệ phƣơng trình Jule – Walker, nếu ta đặt pi = ai, i =1,…p thì hệ phƣơng trình
Jule – Walker tƣơng đƣơng với
( j ) p1 ( j p), j 1,..., p
Đại lƣợng pp ở trên đƣợc gọi là tự tƣơng quan riêng cấp p của quá trình {Xt, nó
đóng vai trò rất quan trọng trong việc xác định bậc của quá trình tự hồi quy cũng nhƣ
việc ƣớc lƣợng tham số mô hình tự hồi quy sau này.
Trong việc thực tế, khi cho chuỗi quan sát X:=x1, t = 1,2…,n thì ta dùng công
thức của tƣơng quan mẫu để tính các r(i), là các giá trị xấp xỉ của (i). Khi đã có các tự
tƣơng quan mẫu ta thay vào hệ phƣơng trình Jule – Walker và giải nó để tìm các tham
số a1. Từ đây ta cũng xác định đƣợc tƣơng quan riêng p1….,pp.
Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên
http://www.lrc-tnu.edu.vn
8
1.2.2. Quá trình trung bình trượt
Định nghĩa1.7 (Quá trình trung bình trƣợt)
Một quá trình trung bình trượt cấp q, ký hiệu Xt MA(q), là một quá trình Xt,
t Z thoả mãn biểu thức
Xt b
.... bq t q , b b ,...,bq R, bq 0
1 1 t 1
1 2
với t là một ồn trắng.
Ta cũng có thể viết biểu thức trung bình trƣợt ở trên dƣới dạng toán tử lùi
tƣơng tự nhƣ đối với quá trình tự hồi quy nhƣ sau :
Xt = b(B)t,
Trong đó hàm b(.) định nghĩa bởi
b(z) : = 1+b1z+…+bqzq.
Ở đây b(z) đƣợc gọi là đa thức trung bình trƣợt.
Chú ý:
Khác với quá trình AR, biểu thức trên luôn xác định duy nhất một quá trình MA
mà không đòi hỏi thêm điều kiện gì đối với các hệ số b1. Và với giả thiết t là ồn trắng
thì theo định lý 1.1 ta có
b(z)(z) = 1.
Và khi đó 1 có thể biểu diễn dƣới dạng
t j X t j ; ( z) j z j ; j
j
j
j
Một chú ý nữa, cũng giống nhƣ trƣờng hợp AR, nếu đa thức trung bình trƣợt
b(z) không có nghiệm có môđun bằng 1 thì ta có thể biểu diễn Xt dƣới dạng sau:
j 1
j
X t j X t j t ; j
Và có thể xác định i bằng cách chia 1 (theo luỹ thừa tăng) cho b(z), ( 0 1) .
Khi quá trình X t có thể biểu diễn ở dạng trên, tức là khi b(z) chỉ có nghiệm có
môđun lớn hơn 1 thì ta nói X t là một quá trình khả nghịch. Và từ nay về sau, nếu
không nói gì thêm thì khi nói về các quá trình AR và MA thì sẽ đƣợc hiểu đó là các
quá trình nhân quả và khả nghịch.
Các đặc trƣng của quá trình trung bình trƣợt:
Trƣớc hết, dễ dàng thấy rằng
EX t 0 ,
Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên
http://www.lrc-tnu.edu.vn
9
Và
2 , s t
E ( X t t ) 2b1, s t i;1 i q
0, s
Mặt khác
(h): E ( X t X t h ) E ( X t (t h b11 h 1 bq1 h q ))
có:
Từ đó suy ra
(h) 2 (b b b ... b b ),b :1;1 h q
h 1 h 1
q h q 0
(h) 0, h q
Đặc biệt có
γ(0):=varX =σ2 (1+b2 +...+b2 )
t
1
q
Từ công thức hiệp sai của quá trình trung bình trƣợt suy ra công thức của tự tƣơng
quan nhƣ sau:
bh b1 bh1 .... bq hbq
, h 1, 2....q
2
1 b 2 .... bq
( h)
1
0,
h. q
1.2.3. Quá trình tự hồi quy trung bình trượt
Định nghĩa 1.8 (quá trình tự hồi quy trung bình trƣợt)
Một quá trình Xt, t Z được gọi là quá trình tự hồi quy trung bình trượt cấp
p,q, kí hiệu X t ARMA(p,q) là một quá trình Xt, t Z thỏa mãn
X t a1X t 1 .... a p X t p t b1 t 1 ...
bq t q , a1, a2 ,...a p , b1, b2 ,..., bq R, a p 0, bq 0
Trong đó t là ồn trắng, a(.) và b(.) lần lƣợt là đa thức tự hồi quy và đa thức
trung bình trƣợt có bậc tƣơng ứng là p và q:
p
a( z ) : 1 a z ... a p z
1
q
b( z ) : 1 b1z ... bq z
Khi đó ta có thể viết quá trình ARMA ở dạng toán tử nhƣ sau: a( B) X t b( B)t
Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên
http://www.lrc-tnu.edu.vn
10
Định nghĩa 1.9 (Quá trình nhân khả nghịch)
Một quá trình ARMA(p,q) đƣợc gọi là một quá trình nhân quả và khả nghịch
nếu có là một quá trình ARMA(p,q) có a(z) và b(z) thỏa mãn hai điều kiện:
i) a(z) và b(z) không có nghiệm chung
ii) a(z) và b(z) không có nghiệm có môđun không vƣợt quá 1
Chú ý:
Do tính nhân quả và khả nghịch cộng với tính chất khả đảo của đa thức
toán tử, ta có thể biểu diễn một quá trình
X t i t i , 1; i .
0
i 0
i 1
Và có thể tính các hệ số t bằng cách chia theo lũy thừa tăng a(z) cho b(z).
Các đặc trƣng của quá trình ARMA:
Trƣớc hết ta có
(h) E( X t X
p
q
) a (h i) . X (h) bi . X (h i)
t h t 1 1
i1
Với
. X (k ) : E(t X t k
Mặt khác ta có thể biểu diễn
X
i
t k i 0 t k i
Và ta có
0, k 0
e.X (k )
2
k , k
0
Lần lƣợt cho h = 0,1,...p trong các chƣơng trình trên và chú ý đến tính chẵn của hàm
(h) ta có hệ phƣơng trình tuyến tính đối với (0),..., (p) hay với (1),... ( p).
p
(h) ai (h i ), h q
i 1
Và vì thế
p
(h) ai (h i), h q.
i1
Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên
http://www.lrc-tnu.edu.vn
11
1.3. Ƣớc lƣợng tham số mô hình ARMA
Giả sử ta cần ƣớc lƣợng các tham số của mô hình ARMA(p,q)
X t a1X t 1 ... a p X t p t b1 t 1 ... bq t q | a1, a2 ,..., a p , b1, b2 ,..., bq R, a p 0, bq 0,
t đóng vai trò là sai số.
trong đó
Đối với mô hình ARMA cũng có nhiều phƣơng pháp ƣớc lƣợng tham số hiệu
quả và đƣợc nêu ra chi tiết trong P.Brockwell, R. David, 2001. Một trong số đó là
phƣơng pháp bình phƣơng cực tiểu theo kiểu thuật toán Hannan – Rissanen. Ý tƣởng
của thuật toán này là sử dụng hồi quy tuyến tính để ƣớc lƣợng các tham số. Nếu q>0 ta
còn phải ƣớc lƣợng các giá trị chƣa biết t .
Thuật toán Hannan – Rissanen
Bƣớc 1:
Dùng ƣớc lƣợng Yule Walker để ƣớc lƣợng các tham số mô hình AR(m), với
m >
max(p,q).
X t a1X t 1 ... am X t m t , t m 1,..., n.
Bƣớc 2:
Ƣớc lƣợng vecto tham số (a1,..., a p , b1...., bq )t trên cơ sở cực tiểu hóa hàm
S ( )
n
( xt a x a x
... a p xt p b
... bq t q )2 theo .
1
t
1
2
t
2
1
t
2
t mq1
Giải hệ Gauss-Markov, kết quả thu đƣợc ở dạng sau:
( Z t Z )1 Z t X n ,
Ta cũng có thể dùng phƣơng pháp trực giao hóa Househoder để tìm.
Ở đây,
X n ( X m1q ,..., X n )
Và
... X mq1 p
mq mq1 ... m1
X mq X mq1
X
X
...
X
...
m q
mq2 p
mq1 mq
m 2
Z mq1
....
...
X
X n 2
....
X n p
n2 n2 ... nq
n1
Ƣớc lƣợng phƣơng sai t theo công thức
2
S ( )
HR
.
nmq
Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên
http://www.lrc-tnu.edu.vn
12
1.4. Những hạn chế của mô hình ARMA trong chuỗi thời gian tài chính
Mô hình ARMA thu đƣợc thành công lớn khi áp dụng cho các chuỗi thời gian
xuất phát từ các lĩnh vực khoa học tự nhiên và kỹ thuật nhƣng thất bại khi áp dụng cho
các chuỗi thời gian kinh tế tài chính. Nguyên nhân chính là giả thiết về mặt toán học
phƣơng sai của các chuỗi thời gian tài chính không thay đổi theo thời gian là không
phù hợp. Và vì vậy mô hình ARMA có thể dự báo đƣợc kỳ vọng nhƣng thất bại khi dự
báo phƣơng sai của chuỗi thời gian tài chính. Sau đây ta sẽ xem xét một ví dụ cụ thể
để thấy rõ sự không phù hợp của mô hình ARMA đối với chuỗi thời gian tài chính.
Xét chuỗi số chuỗi số liệu NYSE chứa giá trị của chỉ số chứng khoán giao dịch
hằng ngày trên thị trƣờng NewYork từ tháng ngày 02/01/1990 đến ngày 31/12/2001.
Chuỗi gồm 3028 số liệu đƣợc lƣu dƣới tên file là NYSE.txt. Tuy nhiên thay vì trực
tiếp làm việc với chuỗi số liệu gốc, ta lấy logarit tự nhiên của chuỗi gốc rồi lấy lại sai
phân của nó để đƣợc một chuỗi mới mà trong lĩnh vực kinh tế tài chính ta gọi là chuỗi
tăng trƣởng. Từ số liệu ở trên, chuỗi giá và chuỗi tăng trƣởng đƣợc minh họa nhƣ sau:
Hình 1.1 Chuỗi giá
Hình 1.2 Chuỗi tăng trưởng
Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên
http://www.lrc-tnu.edu.vn
13
Nhìn vào đồ thị của chuỗi giá, rõ ràng ta thấy nó không có tính dừng. Ngƣợc
lại, chuỗi tăng trƣởng có đồ thị rất giống với một quá trình dừng. Khi nhìn vào đồ thị
của chuỗi tăng trƣởng ta cũng thấy có xuất hiện những cụm biến động, có vùng biến
đổi về phƣơng sai của chuỗi thời gian. Tiếp theo ta sẽ khai thác đặc trƣng tƣơng quan
riêng mẫu của chuỗi tăng trƣởng ở trên.
Kết quả đƣợc minh họa bằng đồ thị sau:
Hình 1.3 Tự tương quan của chuỗi tăng trưởng
Hình 1.4 Tự tương quan riêng của chuỗi tăng trưởng
Ta thấy rằng tƣơng quan riêng của chuỗi tăng trƣởng biến đổi trong một khoảng
tƣơng đối hẹp khá giống với tự tƣơng quan riêng của một quá trình dừng. Tuy nhiên ta
lại không thấy đƣợc dấu hiệu triệt tiêu của tự tƣơng quan riêng mặc dù ta đã lấy đến trễ
100. Điều này cho thấy cho chuỗi tăng trƣởng chắc chắn không thể là một quá trình tự
hồi quy. Ta cũng biết rằng, về mặt lý thuyết có thể xấp xỉ mô hình AR nhiều tham số
bằng mô hình ARMA với ít tham số hơn. Điều này cũng cho thấy mô hình ARMA
nhiều khả năng không phù hợp với chuỗi tăng trƣởng của chúng ta.
Bây giờ ta lấy bình phƣơng chuỗi tăng trƣởng, kết quả cho bởi đồ thị dƣới đây
Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên
http://www.lrc-tnu.edu.vn
14
Hình 1.5 Bình phương chuỗi tăng trưởng
Nhìn vào đồ thị ta có thể ta có thể thấy đƣợc việc tạo thành các cụm biến động
trong đó các thời kỳ và biến động mạnh xen kẽ nhau. Ta tính tiếp các đặc trƣng mẫu
của bình phƣơng chuỗi tăng trƣởng. Kết quả đƣợc thể hiện bằng các đồ thị sau
Hình 1.6 Tự tương quan của bình phương chuỗi tăng trưởng
Hình 1.7 Tự tương quan riêng của bình phương chuỗi tăng trưởng
Mặc dù chuỗi tăng trƣởng ít tƣơng quan nhƣng bình phƣơng của nó lại thể hiện
sự tƣơng quan mạnh. Những dấu hiệu đó cho ta thấy rằng mô hình ARMA không thực
sự phù hợp với chuỗi thời gian qua sát này.
Bây giờ giả sử bằng cách nào đó ta tìm đƣợc mô hình ARMA gần nhất với
chuỗi quan sát và đó là mô hình ARMA(1,1). Mục đích ở đây là chúng ta sẽ thấy rõ
ràng sau khi ƣớc lƣợng, nhiễu thu đƣợc sẽ không phải là một ồn trắng nhƣ ta mong
muốn nữa. Thật vậy, kết quả ƣớc lƣợng theo mô hình ARMA(1,1) là
yt 0.00049332 t
Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên
http://www.lrc-tnu.edu.vn
15
Nhiễu khi đó đƣợc tính toán và biểu diễn bởi đồ thị sau
Hình 1.8 Nhiễu
Khi đó tự tƣơng quan và tự tƣơng quan riêng của nhiễu cho bởi đồ thị dƣới đây
Hình 1.9 Tự tương quan của nhiễu
Hình 1.10. Tự tương quan riêng của nhiễu
Ban đầu, do tính ít tƣơng quan của nhiễu ƣớc lƣợng đƣợc nên ta thấy nó giống
với một quá trình ồn trắng. Tuy nhiên khi lấy bình phƣơng nhiễu ta lại thấy khác.
Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên
http://www.lrc-tnu.edu.vn
- Xem thêm -