Tài liệu Nghiên cứu cải tiến phương pháp phân tích chuỗi thời gian mở và ứng dụng dự báo sinh viên nhập học

.PDF

264

106

thanhphoquetoi Báo vi phạm

Tải xuống 106

Mô tả:

LỜI CẢM ƠN Chúng tôi xin gửi lời cảm ơn tới nhóm seminar Đại số gia tử tại Viện Công nghệ thông tin, Viện Hàn lâm Khoa học và Công nghệ Việt Nam đã có những góp ý quý báu, cung cấp nhiều kiến thức để chúng tôi hoàn thiện hiểu biết của mình trong quá trình nghiên cứu. Chúng tôi cũng xin gửi lời cảm ơn chân thành tới tập thể Bộ môn Kỹ thuật máy tính - Mạng, Khoa Toán - Lý - Tin, Trường Đại học Tây Bắc đã đóng góp nhiều ý kiến thiết thực, tạo điều kiện để chúng tôi hoàn thành đề tài này. NHÓM TÁC GIẢ MỤC LỤC PHẦN MỞ ĐẦU ............................................................................................................. 1 1. Lý do chọn đề tài ..................................................................................................... 1 2. Mục đích, nhiệm vụ nghiên cứu.............................................................................. 1 3. Đối tượng nghiên cứu ............................................................................................. 1 4. Phạm vi nghiên cứu................................................................................................. 2 5. Phương pháp nghiên cứu......................................................................................... 2 6. Cấu trúc đề tài ......................................................................................................... 2 CHƯƠNG 1: TỔNG QUAN VỀ BÀI TOÁN DỰ BÁO VÀ DỮ LIỆU CHUỖI THỜI GIAN ............................................................................................................................... 3 1.1 Khái quát về dự báo .............................................................................................. 3 1.1.1 Khái niệm về dự báo ...................................................................................... 3 1.1.2 Tính chất của dự báo ...................................................................................... 3 1.1.3 Các phương pháp dự báo ............................................................................... 4 1.1.4 Chức năng và vai trò của dự báo .................................................................... 4 1.2 Chuỗi thời gian ...................................................................................................... 5 1.2.1 Khái niệm chuỗi thời gian .............................................................................. 5 1.2.2 Phân tích chuỗi thời gian và dự báo ............................................................... 7 1.2.3 Mô hình ARMA ............................................................................................. 8 Chương 2: CÁC PHƯƠNG PHÁP DỰ BÁO CHUỖI THỜI GIAN MỜ ....................................................................................................................................... 12 2.1 Lý thuyết tập mờ ................................................................................................. 12 2.1.1 Tập mờ ......................................................................................................... 12 2.1.2 Biến ngôn ngữ .............................................................................................. 12 2.1.3 Số mờ ........................................................................................................... 13 2.1.3 Các phép toán trên tập mờ ........................................................................... 16 2.1.5 Giải mờ......................................................................................................... 20 2.2 Suy diễn mờ ........................................................................................................ 23 2.2.1 Kiến trúc cơ bản của hệ suy diễn mờ ........................................................... 23 2.2.2 Các bước suy diễn mờ .................................................................................. 25 2.2.3 Một số phương pháp suy diễn trong hệ mờ ................................................. 25 2.3 Chuỗi thời gian mờ ............................................................................................. 26 2.3.1 Một số khái niệm về chuỗi thời gian mờ ..................................................... 26 2.3.2 Mô hình dự báo Song và Chissom ............................................................... 27 2.3.3 Mô hình dự báo Chen.................................................................................. 28 2.3.4 Luật dự báo chuỗi thời gian mờ ................................................................... 28 Chương 3: CẢI TIẾN PHƯƠNG PHÁP DỰ BÁO CHUỖI THỜI GIAN MỜ VÀ ỨNG DỤNG DỰ BÁO SINH VIÊN NHẬP HỌC TẠI TRƯỜNG ĐẠI HỌC TÂY BẮC .............................................................................................................................. 30 3.1 Một số khái niệm về đại số gia tử và ứng dụng tron bài toán dự báo ................. 30 3.2 Ứng dụng phương pháp dự báo chuỗi thời gian mờ sử dụng đại số gia tử vào bài toán dự báo số lượng sinh viên nhập học tại Trường Đại học Tây Bắc .................... 34 3.3 Tối ưu tham số mô hình dự báo chuỗi thời gian sử dụng đại số gia tử ............... 39 KẾT LUẬN VÀ KIẾN NGHỊ ...................................................................................... 41 TÀI LIỆU THAM KHẢO............................................................................................. 42 DANH MỤC HÌNH ẢNH Hình 1.1: Biến động tỷ giá USD/VND trên thị trường ................................................... 7 Hình 1.2: Biểu đồ giá vàng qua các tháng ...................................................................... 7 Hình 2.1: Số mờ Singleton ............................................................................................ 14 Hình 2.2: Số mờ tam giác ............................................................................................. 14 Hình 2.3: Bài toán độ tuổi theo số mờ tam giác............................................................ 15 Hình 2.4: Số mờ hình thang .......................................................................................... 15 Hình 2.5: Bài toán nhiệt độ theo số mờ hình thang ...................................................... 16 Hình 2.6: Số mờ hình Gaussian .................................................................................... 16 Hình 2.7: Hàm thuộc về của tập mờ A.......................................................................... 17 Hình 2.8: Hàm thuộc về của tập mờ ¬ A(x) ................................................................. 17 Hình 2.9: Tuyển của hai tập mờ theo S(x,y) = max(x,y) .............................................. 17 Hình 2.10: Tuyển của hai tập mờ theo S(x,y) = min (1,x+y)........................................ 18 Hình 2.11: Tuyển của hai tập mờ theo S(x,y) = x+y+x.y ............................................. 18 Hình 2.12: Hàm thuộc về của hai tập mờ A,B .............................................................. 18 Hình 2.13: Hội của hai tập mờ theo T(x,y) = min(x,y) ................................................. 19 Hình 2.14: Hội của hai tập mờ theo T(x,y) = x.y .......................................................... 19 Hình 2.15: Giải mờ bằng phương pháp......................................................................... 21 Hình 2.16: Giải mờ bằng phương pháp trung bình ....................................................... 21 Hình 2.17: Giải mờ theo phương pháp trung bình tâm. ................................................ 22 Hình 2.18: Hàm thuộc hợp thành dạng đối xứng. ......................................................... 22 Hình 2.19: Cấu trúc cơ bản của hệ suy diễn mờ ........................................................... 24 Hình 3.1: Biểu đồ so sánh kết quả dự báo .................................................................... 38 Hình 3.2: Biểu đồ so sánh kết quả dự báo sau khi tối ưu .............................................. 40 PHẦN MỞ ĐẦU 1. Lý do chọn đề tài Bài toán dự báo chuỗi thời gian đã và đang được nhiều tác giả trong nước cũng như ngoài nước quan tâm nghiên cứu [5,6,7,8,9,10,11,14,15]. Việc dự báo được dữ liệu trong tương lai luôn là tham vọng của con người nhằm đoán biết trước kết quả từ đó có những giải pháp đi trước để hoạch định tốt hơn trong công việc. Chuỗi thời gian mờ được Q. Song và B.S. Chissom lần đầu tiên đề cập tới trong nghiên cứu của mình năm 1993 [1,2]. Chuỗi thời gian mờ là công cụ hữu hiệu để có thể dự đoán các dữ liệu thu thập được bằng ngôn ngữ tự nhiên, không những thế nó còn cho thấy những ưu điểm vượt trội khi sử dụng cho những dữ liệu có sự biến động lớn như giá cổ phiếu trên thị trường chứng khoán [7,8]. Kể từ khi được giới thiệu cho tới nay, nhiều công trình nghiên cứu đã được đề xuất nhằm nâng cao tính chính xác của kết quả dự báo và giảm bớt độ phức tạp tính toán của bài toán [7,8,9,10,11]. Đại số gia tử (ĐSGT) được N. Cat Ho và W. Wechler giới thiệu năm 1990 [12] nhằm đưa ra một mô hình toán học phù hợp với dữ liệu không chắc chắn, theo đó các giá trị ngữ nghĩa của ngôn ngữ nằm trong một trật tự nhất định và chính thứ tự đó tạo nên giá trị ngữ nghĩa của từ ngôn ngữ. Đại số gia tử đã được ứng dụng trong các bài toán điều khiển, hồi quy, trích rút tri thức, tính toán trên từ… và cho nhiều kết quả tốt [16,17,18,19,20]. Trong nghiên cứu này chúng tôi sẽ tìm kiếm giải pháp cải tiến mô hình dự báo chuỗi thời gian mờ, cụ thể là việc áp dụng lý thuyết đại số gia tử vào mô hình này. Các kết quả dự báo khi thực nghiệm áp dụng dự báo số lượng sinh viên nhập học tại Trường Đại học Tây Bắc cũng sẽ được đưa ra thảo luận nhằm cho thấy tính hiệu quả của mô hình đề xuất. 2. Mục đích, nhiệm vụ nghiên cứu - Nghiên cứu về bài toán dự báo và dữ liệu chuỗi thời gian. - Nghiên cứu về lý thuyết tập mờ và khả năng ứng dụng. - Nghiên cứu các phương pháp dự báo chuỗi thời gian mờ. - Thử nghiệm dự báo với dữ liệu sinh viên nhập học tại Trường Đại học Tây Bắc. 3. Đối tượng nghiên cứu - Bài toán dự báo chuỗi thời gian mờ. 1 4. Phạm vi nghiên cứu - Nghiên cứu ứng dụng bài toán dự báo chuỗi thời gian mờ vào dự báo dữ liệu sinh viên nhập học tại Trường Đại học Tây Bắc. 5. Phương pháp nghiên cứu - Phương pháp phân tích, tổng hợp tài liệu. - Phương pháp thực nghiệm. 6. Cấu trúc đề tài Đề tài gồm ba phần: - Phần 1: Phần mở đầu. - Phần 2: Phần nội dung của đề tài gồm 3 chương: Chương 1: Tổng quan về bài toán dự báo và dữ liệu chuỗi thời gian. Chương 2: Các phương pháp dự báo chuỗi thời gian mờ. Chương 3: Cải tiến phương pháp dự báo chuỗi thời gian mờ và ứng dụng dự báo sinh viên nhập học tại Trường Đại học Tây Bắc. - Phần 3: Kết luận và kiến nghị. 2 CHƯƠNG 1: TỔNG QUAN VỀ BÀI TOÁN DỰ BÁO VÀ DỮ LIỆU CHUỖI THỜI GIAN 1.1 Khái quát về dự báo 1.1.1 Khái niệm về dự báo Dự báo là sự tiên đoán có căn cứ khoa học, mang tính chất xác suất về mức độ, nội dung, các mối quan hệ, trạng thái, xu hướng phát triển của đối tượng nghiên cứu hoặc về cách thức và thời hạn đạt được các mục tiêu nhất định đã đề ra trong tương lai. Dự báo là kết quả của sự kết hợp giữa những phân tích định tính và những phân tích định lượng các quá trình cần dự báo. Chỉ có dự báo khoa học mới đảm bảo độ tin cậy cao và là cơ sở vững chắc cho việc thông qua các quyết định quản lý khoa học. Ngày nay vai trò của dự báo trong mọi lĩnh vực đời sống, xã hội ngày càng quan trọng và được nâng lên đáng kể. 1.1.2 Tính chất của dự báo - Dự báo mang tính xác suất: Mỗi đối tượng dự báo đều vận động theo một quy luật, một quỹ đạo nhất định nào đó. Đồng thời trong quá trình phát triển nó luôn chịu tác động từ môi trường hay các yếu tố bên ngoài mà chính các yếu tố tác động này cũng không phải là đứng im mà luôn vận động và phát triển không ngừng. Chính vì vậy dù trình độ dự báo có hoàn thiện đến đâu cũng không thể chắc chắn rằng kết quả của dự báo là hoàn toàn chính xác, luôn tồn tại những trường hợp không lường trước được trong tương lai. - Dự báo là đáng tin cậy: Mặc dù dự báo mang tính xác suất nhưng nó đáng tin cậy. Vì nó dựa trên những cơ sở lý luận và phương pháp luận khoa học. Ngày nay, phương pháp và công cụ xử lý thông tin ngày càng hiện đại giúp cho việc tính toán, phân tích đơn giản, chính xác và độ tin cậy của dự báo không ngừng được nâng cao. - Dự báo mang tính đa phương án: Dự báo được thực hiện trên những giả thiết dự báo có điều kiện. Tập hợp các giả thiết để dự báo được gọi là phông dự báo. Mỗi dự báo có thể được tiến hành trên các phông dự báo khác nhau do những nguyên nhân chủ quan và khách quan khác nhau. Tính đa phương án một mặt là thuộc tính khách quan của dự báo nhưng mặt khác lại là phù hợp với yêu cầu của công tác quản lý, nó làm cho việc ra quyết định cũng như chỉ đạo thực hiện quyết định quản lý trở nên linh hoạt hơn, dễ thích nghi với sự biến đổi vô cùng phức tạp của tình hình thực tế. 3 1.1.3 Các phương pháp dự báo Theo học giả Gordon, trong hai thập kỷ gần đây, có tám phương án dự báo được áp dụng rộng rãi trên thế giới như sau: 1. Tiên đoán (Genius forecasitng). 2. Ngoại suy xu hướng (Trend extrapolation). 3. Phương pháp chuyên gia (Consensus methods). 4. Phương pháp mô phỏng (Stimulation). 5. Phương pháp kịch bản (Scenarion). 6. Phương pháp cây quyết định (Decision trees). 7. Phương pháp ma trận tác động qua lại (Cross-impact matrix method). 8. Phương pháp dự báo tổng hợp (Combining methods). Tuy nhiên theo các phân loại của Việt Nam các phương pháp dự báo thường được chia thành hai nhóm chính là: Phương pháp định tính và phương pháp định lượng 1.1.3.1 Phương pháp định tính Phương pháp này dựa trên cơ sở nhận xét của những yếu tố liên quan, dựa trên những ý kiến về các khả năng có liên hệ của những yếu tố liên quan này trong tương lai. Từ việc khảo sát ý kiến được tiến hành một cách khoa học để nhận biết các sự kiện tương lai hay từ ý kiến phản hồi của một nhóm đối tượng hưởng lợi (chịu tác động) nào đó mà phương pháp định tinh có liên quan đến mức độ phức tạp khác nhau. 1.1.3.2 Phương pháp định lượng Mô hình dự báo định lượng dựa trên số liệu quá khứ, những số liệu này được giả sử có liên quan đến tương lai và có thể tìm thấy được. Tất cả các mô hình dự báo theo định lượng có thể sử dụng thông qua chuỗi thời gian và các giá trị này được quan sát đo lường các giai đoạn theo từng chuỗi . Hiện nay, để nâng cao mức độ chính xác của dự báo người ta thường kết hợp cả hai phương pháp định tính và định lượng. Bên cạnh đó, vấn đề cần dự báo đôi khi không thể thực hiện được thông qua một phương pháp dự báo đơn lẻ mà đòi hỏi kết hợp nhiều hơn một phương pháp nhằm mô tả đúng bản chất sự việc cần dự báo. 1.1.4 Chức năng và vai trò của dự báo 1.1.4.1 Chức năng của dự báo Theo quan điểm của triết học, dự báo là một hình thức nhận thức thế giới, nhận thức xã hội. Nó có hai chức năng cơ bản: 4 - Chức năng tham mưu: trên cơ sở đánh giá thực trạng, phân tích xu hướng vận động và phát triển trong quá khứ, hiện tại và tương lai, dự báo sẽ cung cấp thông tin cần thiết, khách quan làm căn cứ cho việc ra quyết định quản lý và xây dựng chiến lược, kế hoạch hóa các chương trình, dự án,…người quản lý và hoạch định chiến lược, người lập kế hoạch có nhiệm vụ lựa chọn trong số các phương án có thể có, tìm ra các phương án có tính khả thi cao nhất, có hiệu quả nhất. Để thực hiện tốt chức năng này dự báo phải thật sự đảm bảo được tính khách quan, khoa học và tính độc lập tương đối với các cơ quan quản lý và hoạch định chính sách. - Chức năng khuyến nghị hay điều chỉnh: Với chức năng này dự báo tiên đoán các hậu quả có thể nảy sinh trong quá trình thực hiện các chính sách kinh tế -xã hội nhằm giúp các cơ quan chức năng kịp thời điều chỉnh mục tiêu cũng như các cơ chế tác động quản lý để đạt được hiệu quả kinh tế - xã hội cao nhất. 1.1.4.2 Vai trò của dự báo Trong nền kinh tế thị trường, công tác dự báo là vô cùng quan trọng bởi lẽ nó cung cấp các thông tin cần thiết nhằm phát hiện và bố trí sử dụng các nguồn lực trong tương lai một cách có căn cứ thực tế. Với những thông tin mà dự báo đưa ra cho phép các nhà hoạch định chính sách có những quyết định về đầu tư, các quyết định về sản xuất, về tiết kiệm và tiêu dùng, các chính sách tài chính, chính sách kinh tế vĩ mô. Dự báo không chỉ tạo cơ sở khoa học cho việc hoạch định chính sách, cho việc xây dựng chiến lược phát triển, cho các quy hoạch tổng thể mà còn cho phép xem xét khả năng thực hiện kế hoạch và hiệu chỉnh kế hoạch. Sử dụng mô hình dự báo trong hoạt động quản lý là rất quan trọng, nó tạo điều kiện không những cung cấp thông tin tương lai mà còn có khả năng làm chủ công tác quản lý. Nhờ có mô hình dự báo mà có thể tăng cường khả năng quản lý một cách khoa học. Giúp nhận thức sâu sắc hơn các quy luật khách quan, tránh được tính chủ quan. 1.2 Chuỗi thời gian 1.2.1 Khái niệm chuỗi thời gian Một chuỗi thời gian là một dãy các giá trị quan sát X:={x1, x2,……… xn} được xếp thứ tự diễn biến thời gian với x1 là các giá trị quan sát tại thời điểm đầu tiên, x2 là quan sát tại thời điểm thứ 2 và xn là quan sát tại thời điểm thứ n. Ví dụ: 5 Thống kê số lượng sinh viên hệ đại học chính quy nhập học tại Trường Đại học Tây Bắc qua các năm, ở đây ta có x1 = 672 là giá trị quan sát tại thời điểm thứ nhất tức là năm 2004, x2 = 1007 là giá trị quan sát tại thời điểm thứ 2 tức là năm 2005... và x = 680 là giá trị quan sát tại thời điểm thứ 14 tức là năm 2017. 10 STT Khóa Năm Tổng số SV 1 K45 2004 672 2 K46 2005 1007 3 K47 2006 1271 4 K48 2007 1588 5 K49 2008 1481 6 K50 2009 1692 7 K51 2010 1814 8 K52 2011 1995 9 K53 2012 1653 10 K54 2013 1640 11 K55 2014 1129 12 K56 2015 1246 13 K57 2016 902 14 K58 2017 680 Bảng 1: Thống kê số lượng sinh viên hệ Đại học chính quy nhập học tại Trường Đại học Tây Bắc Các báo cáo tài chính mà ta thấy hằng ngày trên các phương tiên truyền thông như: báo, tivi, internet… về các chỉ số chứng khoán, tỷ giá tiền tệ, chỉ số tiêu dùng… Đó là những thể hiện rất thực tế của chuỗi thời gian. Trong các thí dụ trên, thứ tự thời gian quan sát thực sự đóng vai trò quan trọng, vì thế hầu hết các kỹ thuật thống kê cổ điển ít có tác dụng và do đó cần phải đề xuất những kỹ thuật tính toán mới để bộc lộ được các nét đặc thù của chuỗi thời gian. 6 Hình 1.1: Biến động tỷ giá USD/VND trên thị trường Hình 1.2: Biểu đồ giá vàng qua các tháng 1.2.2 Phân tích chuỗi thời gian và dự báo Bước đầu tiên của việc phân tích chuỗi thời gian là chọn một mô hình toán học phù hợp với tập dữ liệu cho trước X={x1, x2,……… xn} nào đó. Để có thể nói về bản chất của những quan sát chưa diễn ra, ta giả thiết mỗi quan sát xt là một giá trị thể hiện của biến ngẫu nhiên Xt với t ∈ T. Ở đây T được gọi là tập chỉ số. Khi đó ta có thể coi tập dữ liệu X={x1, x2,……… xn} là thể hiện của quá trình ngẫu nhiên{Xt, t ∈ T}. Và vì vậy, ta có thể định nghĩa một quá trình ngẫu nhiên như sau: Định nghĩa 1.1 (Quá trình ngẫu nhiên) Một quá trình ngẫu nhiên là một họ các biến ngẫu nhiên {Xt, t∈T} được định nghĩa trên một không gian xác suất(Ω, A, P). Chú ý: 7 Trong việc phân tích chuỗi thời gian, tập chỉ số T là một tập các thời điểm, ví dụ như là tập {1,2..} hay tập (-∞,+∞). Tất nhiên cũng có những quá trình ngẫu nhiên có T không phải là một tập con của R nhưng ở đây ta chỉ xét cho trường hợp T∈R. Và thường thì ta xem T là các tập các số nguyên, khi đó ta sẽ sử dụng ký hiệu tập chỉ số là Z thay vì T ở trên. Một điểm chú ý nữa là trong luận văn này chúng ta sẽ dùng thuật ngữ chuỗi thời gian để đồng thời chỉ dữ liệu cũng như quá trình có dữ liệu đó là một thể hiện. Việc phân tích chuỗi thời gian là đi tới xây dựng một mô hình có khả năng: Cung cấp một đặc tả ngắn gọn của dữ liệu đang quan sát; có thể dùng để suy ra các đặc điểm của hệ thống; có thể được dùng để suy diễn để tìm ra cơ chế hoạt động của hệ thống; có thể dùng để dự báo giá trị trong tương lai. 1.2.3 Mô hình ARMA Trong thống kê học, mô hình autoregressive moving average (ARMA), đôi khi còn được gọi là mô hình Box-Jenkins. Sau khi phương pháp Box-Jenkins được đưa ra sử dụng để chạy mô hình, thường được áp dụng cho dữ liệu chuỗi thời gian (time series) tự tương quan (autocorrelated). Mô hình ARMA gồm hai phần: Phần tự hồi quy (AR) và phần bình quân dịch chuyển (MA). 1.2.3.1 Quá trình tự hồi quy - Định nghĩa 1.2 (Quá trình ồn trắng) Quá trình ngẫu nhiên {εt, t∈Z} được gọi là một ồn trắng, ký hiệu ε~WN(0,σ2), khi nó thỏa mãn điều kiện sau: - Eεtεs = 0 (t ≠ s) - E ε t2 = σ2 - Eεt = 0, ∀t - Định nghĩa 1.3 (Quá trình tự hồi quy) Người ta gọi quá trình ngẫu nhiên {Xt, t ∈ Z} là một quá trình tự hồi quy cấp p, viết là Xt ~ AR(p), là một quá trình dừng {Xt, t ∈ Z} thỏa mãn: Xt = a1Xt-1 + a2Xt-2 + …+ apXt-p + εt, ap ≠ 0 Với {ε} là một ồn trắng. Ta có thể viết biểu thức của quá trình tự hồi quy ở trên bởi công thức 8 Xt - a1Xt-1 – a2Xt-2 – … – apXt-p = εt, ap ≠ 0 Hay ở dạng toán tử: a(z):= 1 – a1z – a2 – z2 – … – apzp ở đây a(z) được gọi là đa thức hồi quy. Chú ý: Nếu đa thức a(z) ở trên có nghiệm nằm ngoài đĩa tròn đơn vị (|z| > 1) thì Xt được gọi là quá trình nhân quả tự hồi qui cấp p và nói chung ta chỉ xét các quá trình nhân quả. Các đặc trưng của quá trình tự hồi quy cấp p: - E(Xt) = 0 - γ(0) = - ρ (h) - p ∑ a γ (i)+ σ t=1 2 i p ∑ a ρ(h− i) =0, ∀h > 0 t=1 i Lần lượt cho h = 1,2,… p ta được: X t = a1 X t −1 + ... + a p X t − p + ε t + b1ε t −1 + ... + bqε t −q , a1 , a2 ,..., a p , b1 , b2 ,..., bq ∈ R, a p ≠ 0, bq ≠ 0 Hệ phương trình gọi là hệ phương trình Jule–Walker, song tuyến đối với a và ρ. 1.2.3.2 Quá trình trung bình trượt - Định nghĩa 1.4 (Quá trình trung bình trượt) Một quá trình trung bình trượt cấp q, ký hiệu Xt ~ MA(q), là một quá trình {Xt, t∈Z} thỏa mãn biểu thức Xt = ε1+b1 εt-1+…+bq εt-q, b1 b2,…, bq ϵ R, bq≠0 Với {εt} là một ồn trắng. Ta cũng có thể viết biểu thức trung bình trượt ở trên dưói dạng toán tử là tương tự như đối với quá trình tự hồi quy như sau: Xt = b(B) εt Trong đó hàm b(.) định nghĩa bởi b(z) = 1+ b1z+…+bqzq Ở đây b(z) được gọi là đa thức trung bình trượt. Các đặc trưng của quá trình trung bình trượt: Trước hết, ta dễ dàng thấy rằng: 9 EXt = 0 và ⎧ σ 2 ,s = t ⎪⎪ E(Xt ε t ) = ⎨ σ 2b1 ,s = t − i;1 ≤ i ≤ q ⎪ 0,s ≠ ⎪⎩ ⎫ ⎪⎪ ⎬ ⎪ ⎪⎭ Mặt khác ta có: γ (h):= E(Xt Xt−h ) = E(Xt (ε t+h + b1ε 1+h−1 + bqε 1+h−q )) Từ đó suy ra: ⎧ γ (h) = σ 2(b + b b + ... + b b ),b := 1;1 ≤ h ≤ q ⎪ h 1 h+1 q−h q 0 ⎨ γ (h) = 0,h > q ⎪ ⎩ ⎫ ⎪ ⎬ ⎪⎭ Đặc biệt ta có: γ (0) = var Xt = σ 2(1+ b12 + ... + bq2 ) Từ công thức hiệp sai của quá trình trung bình trượt ta suy ra công thức của tự tương quan như sau: ⎧ b + b + b + ... + b b q−h q ⎪⎪ h 1 h+1 ,h = 1,2...q 2 2 ρ(h) = ⎨ 1+ b1 + ... + bq ⎪ 0,h > q ⎪⎩ ⎫ ⎪⎪ ⎬ ⎪ ⎪⎭ 1.2.3.3 Quá trình tự hồi quy trung bình trượt - Định nghĩa 1.5 (quá trình tự hồi quy trung bình trượt) Một quá trình {Xt, t∈Z} được gọi là quá trình tự hồi quy trung bình trượt cấp p, q kí hiệu Xt ~ ARMA(p,q) là một quá trình {Xt, t ∈ Z) thỏa mãn: X = a X + ...+ ap Xt−p + ε t + b1ε t−1 + ...+ bqε t−q ,a1 ,a2 ,...,ap ,b1 ,b2 ,...,bq ∈R,ap ≠ 0,bq ≠ 0 t 1 t−1 Trong đó t là ồn trắng, a(.) và b(.) lần lượt là đa thức tự hồi quy và đa thức trung bình trượt có bậc tương ứng là p và q: a(z)=1–a1z–…–apzp b(z)=1+b1z+…+bqzq Khi đó ta có thể viết quá trình ARMA ở dạng toán tử như sau: a(B)Xt=b(B)εt - Định nghĩa 1.6 (Quá trình nhân khả nghịch) 10 Một quá trình ARMA(p,q) được gọi là một quá trình nhân quả và khả nghịch nếu có một quá trình ARMA(p,q) có a(z) và b(z) thỏa mãn hai điều kiện: i) a(z) và b(z) không có nghiệm chung ii) a(z) và b(z) không có nghiệm có modun không vượt quá 1 Nhưng kỹ thuật mô hình ARMA cung cấp là một cơ sở rất quan trọng và mang lại nhiều gợi ý cho các công trình nghiên cứu về chuỗi thời gian sau BoxJenkins. 11 Chương 2: CÁC PHƯƠNG PHÁP DỰ BÁO CHUỖI THỜI GIAN MỜ 2.1 Lý thuyết tập mờ 2.1.1 Tập mờ Tập mờ là một tập hợp mà mỗi phần tử cơ bản của nó được gán thêm một giá trị thực µ A (x)∈[0,1] để chỉ độ thuộc của nó vào tập đã cho. Độ phụ thuộc càng lớn thì phần tử thuộc về tập càng lớn. Khi độ phụ thuộc bằng 0 thì phần tử đó sẽ không thuộc về tập đã cho. Ngược lại nếu mức độ phụ thuộc bằng 1 phần tử cơ bản sẽ thuộc về tập hợp với xác suất 100%. Định nghĩa 2.1: Cho là U một tập vũ trụ với các phần tử kí hiệu bởi x, U = {x}. Một tập mờ A trên U là tập được đặc trưng bởi một hàm µA(x) mà nó liên kết mỗi phần tử x ∈U với một số thực trong đoạn [0,1]. Giá trị của hàm µA(x) biểu diễn mức độ thuộc của x trong A. Kí hiệu A = {(x , µ A (x))| x ∈U} Trong đó µA(x) là một ánh xạ từ U vào [0,1] và được gọi là hàm thuộc của tập mờ A và µA(x) có giá trị bất kỳ trong đoạn [0,1] là điều khác biệt cơ bản giữa tập rõ và tập mờ. Giá trị của µA(x) càng gần tới 1 thì mức độ thuộc của x trong A càng cao. Tập mờ là sự mở rộng của tập kinh điển. Thật vậy, khi A là một tập kinh điển, hàm thuộc của nó µA(x) chỉ nhận 2 giá trị 0 hoặc 1 tương ứng với x có nằm trong A hay không. Thực tế các khái niệm mờ trong các bài toán ứng dụng rất đa dạng và khó để xác định được các hàm thuộc của chúng một cách chính xác, thông thường dựa trên ngữ cảnh mà khái niệm mờ đó đang được sử dụng. Một lớp rộng các khái niệm mờ có thể mô hình qua các tập mờ mà L.A.Zadeh [1] đã đưa ra gọi là biến ngôn ngữ. 2.1.2 Biến ngôn ngữ Theo Zadeh [1], biến ngôn ngữ là các biến mà giá trị của chúng không phải là số mà là các từ hoặc các câu trong ngôn ngữ tự nhiên hoặc nhân tạo. Các giá trị của biến ngôn ngữ được sử dụng “khi có sự thiếu hụt tính chính xác bề ngoài của những vấn đề phức tạp cố hữu”. Về hình thức biến ngôn ngữ được định nghĩa như sau: Định nghĩa 2.2: Biến ngôn ngữ là một bộ năm (X, T(X), U, R, M) trong đó X là tên biến, T(X) là tập các giá trị ngôn ngữ của biến X, U là không gian tham chiếu hay 12 còn gọi là miền cơ sở của biến X, R là một quy tắc cú pháp sinh các giá trị ngôn ngữ trong T(X), M là quy tắc gán ngữ nghĩa biểu thị bằng tập mờ trên U cho các từ ngôn ngữ trong T(X). Từ những nghiên cứu về biến ngôn ngữ, tác giả đưa ra những đặc trưng cơ bản của biến ngôn ngữ: - Tính phổ quát: các biến ngôn ngữ khác nhau về các giá trị nguyên thủy nhưng ý nghĩa về mặt cấu trúc miền giá trị của chúng vẫn được giữ. Nói cách khác, cấu trúc miền giá trị của hai biến ngôn ngữ cho trước tồn tại một “đẳng cấu” sai khác nhau bởi giá trị sinh nguyên thủy. - Tính độc lập ngữ cảnh của gia tử và liên từ như AND, OR,...: ngữ nghĩa của các gia tử và liên từ như AND, OR,... hoàn toàn độc lập với với ngữ cảnh, khác với giá trị nguyên thủy của các biến ngôn ngữ lại phụ thuộc vào ngữ cảnh. Do đó khi tìm kiếm mô hình cho các gia tử và liên từ như AND, OR,... chúng ta không phải quan tâm đến giá trị nguyên thủy của biến ngôn ngữ đang xét. Các đặc trưng này cho phép chúng ta sử dụng cùng một tập gia tử và xây dựng một cấu trúc toán học duy nhất cho miền giá trị của các biến ngôn ngữ khác nhau. 2.1.3 Số mờ 2.1.3.1 Mờ hóa Định nghĩa 2.3: Mờ hóa được định nghĩa như là sự ánh xạ (sự làm tương ứng) từ tập các giá trị thực x* ∈U ⊂ R thành tập các giá trị mờ A ở trong U. Nguyên tắc chung việc thực hiện mờ hóa là: - Từ tập giá trị thực x đầu vào sẽ tạo ra tập mờ A với hàm thuộc có giá trị đủ rộng tại các điểm rõ x * . - Nếu có nhiễu ở đầu vào thì việc mờ hóa sẽ góp phần khử nhiễu. - Việc mờ hóa phải tạo điều kiện đơn giản cho tính toán sau này. Thông thường dùng ba phương pháp mờ hóa sau đây: - Mờ hóa đơn trị (Singleton fuzzifier). Mờ hóa đơn trị là từ các điểm giá trị thực x* ∈U lấy các giá trị đơn của tập mờ A, nghĩa là hàm thuộc có dạng: - Mờ hóa Gauss (Gaussian fuzzifier). Mờ hóa Gauss là từ các điểm giá trị thực x* ∈U lấy các giá trị trong tập mờ A với hàm thuộc Gauss. 13 - Mờ hóa hình tam giác (Triangular fuzzifier). Mờ hóa hình tam giác là từ các điểm giá trị thực x* ∈U lấy các giá trị trong tập mờ A với hàm thuộc dạng hình tam giác (hoặc hình thang). Ta thấy mờ hóa đơn trị cho phép tính toán về sau rất đơn giản nhưng không khử được nhiễu đầu vào, mờ hóa Gaus hoặc mờ hóa hình tam giác không những cho phép tính toán về sau tương đối đơn giản mà còn đồng thời có thể khử nhiễu đầu vào. 2.1.3.2 Các loại số mờ Tập mờ trên tập số thực Rl là một số thực mờ nếu: - Mờ chuẩn hóa tức có điểm x’ sao cho µM(x’) = 1. - Ứng với mỗi α ∈ Rl tập mức {x: µM(x) ≥ α} là đoạn đóng trên Rl. Có 4 dạng số mờ cơ bản: - Số mờ hình Singleton: Hình 2.1: Số mờ Singleton - Số mờ hình tam giác: M(a,b,c) Hình 2.2: Số mờ tam giác Ví dụ: Nếu coi 25 tuổi là lớp trẻ, 45 tuổi là trung niên và 60 tuổi là già. Xác định độ thuộc của người đàn ông 30 tuổi vào các lớp trẻ, trung niên, già. Dựa vào số mờ tam giác ta có đồ thị biểu diễn bài toán như sau: 14 Hình 2.3: Bài toán độ tuổi theo số mờ tam giác Áp dụng công thức tính số mờ tam giác. Ta có thể tính độ thuộc của người đàn ông 30 tuổi như sau: + Độ thuộc vào lớp trẻ: ⎛ ⎛ ⎛ 30− 0 45− 30 ⎞ ⎞ ⎛ 6 3⎞ ⎞ 3 M30 Tre = max ⎜ min ⎜ , ,0 = max min ⎟ ⎜ ⎜⎝ 5 , 4 ⎟⎠ ,0⎟ = 4 = 0.75 ⎝ 25− 0 45− 25 ⎟⎠ ⎠ ⎝ ⎝ ⎠ ( ) + Độ thuộc vào lớp trung niên: ⎛ ⎛ ⎛ 30− 25 60− 30 ⎞ ⎞ ⎛1 ⎞ ⎞ 1 M30 TN = max ⎜ min ⎜ , ,0 = max min ⎟ ⎜ ⎜⎝ 4 ,2⎟⎠ ,0⎟ = 4 = 0.25 ⎝ 45− 25 60− 45 ⎟⎠ ⎠ ⎝ ⎝ ⎠ ( ) + Độ thuộc vào lớp già: ⎛ ⎛ 30− 45 90− 30 ⎞ ⎞ M30 Gia = max ⎜ min ⎜ , ,0⎟ = 0 ⎝ 60− 45 90− 60 ⎟⎠ ⎠ ⎝ ( ) Kết luận: Vậy độ thuộc của người đàn ông 30 tuổi vào các lớp là: trẻ - 0.75; trung niên - 0.25; già - 0. - Số mờ hình thang: M(a,b,c,d) Hình 2.4: Số mờ hình thang Ví dụ: 15 Nhiệt độ môi trường được chia theo các mức như hình dưới. Xác định độ thuộc của 16oC vào các lớp lạnh, trung bình, nóng. Hình 2.5: Bài toán nhiệt độ theo số mờ hình thang Áp dụng công thức tính số mờ hình thang ta tính được như sau: + Độ thuộc vào lớp lạnh: ⎛ ⎛ ⎛ 20−16 ⎞ ⎞ ⎛4 ⎞ ⎞ 4 M16 (Lanh) = max ⎜ min ⎜ ,1⎟ ,0⎟ = max ⎜ min ⎜ ,1⎟ ,0⎟ = = 0.8 ⎝ 20−15 ⎠ ⎠ ⎝5 ⎠ ⎠ 5 ⎝ ⎝ + Độ thuộc vào lớp trung bình: ⎛ ⎛ ⎛ 16 −15 35−16 ⎞ ⎞ ⎛ 1 19 ⎞ ⎞ 1 M16 (TB) = max ⎜ min ⎜ , ,1⎟ ,0⎟ = max ⎜ min ⎜ , ,1⎟ ,0⎟ = = 0.2 ⎝ 20−15 35− 30 ⎠ ⎠ ⎝5 5 ⎠ ⎠ 5 ⎝ ⎝ + Nhiệt độ 16oC không thuộc vào lớp nóng, tức M16(Nong)=0. - Số mờ hình Gaussian (Bell): Hình 2.6: Số mờ hình Gaussian 2.1.3 Các phép toán trên tập mờ 2.1.3.1 Phép bù Định nghĩa 2.4: Cho tập không gian nền (tập vũ trụ) U có hàm thuộc µA(x). Phần bù (ký hiệu ¬ A) của tập mờ A là một tập mờ với hàm thuộc về được xác định bởi : µ ¬ A (x) = 1- µA(x) , với mỗi x ∈ U. 16

- Xem thêm -

Tài liệu Nghiên cứu cải tiến phương pháp phân tích chuỗi thời gian mở và ứng dụng dự báo sinh viên nhập học

Tài liệu liên quan

Tài liệu vừa đăng

Tài liệu xem nhiều nhất