Mô hình hàm chuyển và ứng dụng xây dựng mô hình dự báo với việc sử dụng chỉ số dẫn báo

  • Số trang: 72 |
  • Loại file: PDF |
  • Lượt xem: 23 |
  • Lượt tải: 0
tailieuonline

Đã đăng 27372 tài liệu

Mô tả:

ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ PHẠM TRUNG THÀNH MÔ HÌNH HÀM CHUYỂN VÀ ỨNG DỤNG XÂY DỰNG MÔ HÌNH DỰ BÁO VỚI VIỆC SỬ DỤNG CHỈ SỐ DẪN BÁO LUẬN VĂN THẠC SĨ HÀ NỘI - 2011 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ PHẠM TRUNG THÀNH MÔ HÌNH HÀM CHUYỂN VÀ ỨNG DỤNG XÂY DỰNG MÔ DỰ BÁO VỚI VIỆC SỬ DỤNG CHỈ SỐ DẪN BÁO Ngành : Công nghệ thông tin Chuyên ngành: Hệ thống thông tin Mã số: 60 48 05 LUẬN VĂN THẠC SĨ Người hướng dẫn khoa học PGS. TS. ĐỖ VĂN THÀNH HÀ NỘI – 2011 Luận văn cao học - Chuyên ngành: Hệ thống thông tin MỤC LỤC Danh sách hình ................................................................................................ 3 Danh sách bảng ............................................................................................... 4 Chƣơng 1 TỔNG QUAN VỀ CHUỖI THỜI GIAN VÀ CÁC MÔ HÌNH DỰ BÁO CHUỖI THỜI GIAN ............................................................................. 8 1. 1 CHUỖI THỜI GIAN VÀ PHÂN TÍCH, DỰ BÁO CHUỖI THỜI GIAN .................. 8 1.1.1 Chuỗi thời gian .................................................................................................... 8 1.1.2 Các đại lƣợng đặc trƣng của chuỗi thời gian ........................................................ 9 1.1.3 Toán tử trễ và toán tử sai phân ........................................................................... 13 1.1.4 Chuỗi thời gian dừng ......................................................................................... 13 1.1.5 Phân tích, dự báo chuỗi thời gian ....................................................................... 16 1.2 MÔ HÌNH DỰ BÁO CHUỖI THỜI GIAN ĐƠN BIẾN ........................................... 19 1.2.1 Mô hình tích hợp trung bình trƣợt tự hồi quy ARMA(p,q). ................................ 20 1.2.2 Mô hình làm trơn hàm mũ chuỗi thời gian ......................................................... 20 1.2.3 Mô hình phƣơng sai thay đổi điều kiện tự hồi quy.............................................. 21 1.3 MÔ HÌNH DỰ BÁO CHUỖI THỜI GIAN ĐA BIẾN .............................................. 22 1.3.1 Mô hình hàm chuyển .......................................................................................... 22 1.3.2 Mô hình tự hồi quy véc tơ VAR ......................................................................... 22 1.3.3 Mô hình điều chỉnh sai số dạng véc tơ VARX.................................................... 24 1.4 MÔ HÌNH DỰ BÁO CHUỖI THỜI GIAN PHI TUYẾN ......................................... 24 KẾT LUẬN CHƢƠNG ................................................................................................... 25 Chƣơng 2 CÁC MÔ HÌNH HÀM CHUYỂN ...............................................26 2.1 CÁC MÔ HÌNH HÀM CHUYỂN TUYẾN TÍNH RỜI RẠC .................................... 27 2.1.1 Những mô hình hàm chuyển tuyến tính rời rạc.................................................... 27 2.1.2 Mô hình hàm chuyển rời rạc đƣợc biểu diễn bằng sai phân ................................ 29 2.1.3 Những mô hình hàm chuyển rời rạc có nhiễu ...................................................... 31 2.2 XÁC ĐỊNH MÔ HÌNH: NHẬN DẠNG, ƢỚC LƢỢNG VÀ KIỂM TRA MÔ HÌNH HÀM CHUYỂN.............................................................................................................. 31 2.2.1 Hàm tự tƣơng quan chéo ..................................................................................... 32 2.2.2 Xác định mô hình hàm chuyển ........................................................................... 34 2.2.3 Hiệu chỉnh và kiểm tra mô hình hàm chuyển ..................................................... 43 KẾT LUẬN CHƢƠNG ................................................................................................... 45 Chƣơng 3 ỨNG DỤNG MÔ HÌNH HÀM CHUYỂN TRONG DỰ BÁO CHỈ SỐ KINH TẾ VĨ MÔ VIỆT NAM BẰNG CHỈ SỐ DẪN BÁO ...................46 3.1 CHỈ SỐ DẪN BÁO .................................................................................................. 46 3.2 DỰ BÁO VỚI MÔ HÌNH HÀM CHUYỂN BẰNG CÁC CHỈ SỐ DẪN BÁO ......... 47 3.2.1 Dự báo sai số bình phƣơng trung bình tối thiểu .................................................. 47 Tính toán dự báo Giờ, ta viết (3.1) dƣới dạng: ........................................................... 48 Học viên: Phạm Trung Thành 1 Lớp Hệ thống thông tin K16 Luận văn cao học - Chuyên ngành: Hệ thống thông tin 3.3 DỰ BÁO CHỈ TIÊU KINH TẾ VĨ MÔ Ở VIỆT NAM BẰNG VIỆC ỨNG DỤNG MÔ HÌNH HÀM CHUYỂN ............................................................................................ 49 3.3.1 Các chỉ tiêu kinh tế vĩ mô ................................................................................... 49 3.3.2 Xây dựng và sử dụng mô hình hàm chuyển để dự báo cho chỉ tiêu kinh tế vĩ mô 50 KẾT LUẬN CHƢƠNG ................................................................................................... 62 KẾT LUẬN ĐỀ TÀI ......................................................................................69 TÀI LIỆU THAM KHẢO .............................................................................70 Học viên: Phạm Trung Thành 2 Lớp Hệ thống thông tin K16 Luận văn cao học - Chuyên ngành: Hệ thống thông tin Danh sách hình Hình 1 Các dạng hàm chuyển với r <= 2, s <= 2, b = 3 ............................................. 39 Hình 2: Biểu đồ hai chuỗi GDP và CNXD ................................................................. 52 Hình 3: Biểu đồ và hàm tự tƣơng quan và tự tƣơng quan từng phần của xt ................. 53 Hình 4: Biểu đồ và hàm tự tƣơng quan và tự tƣơng quan từng phần của yt ................. 53 Hình 5: Biễu diễn chuỗi xt theo mô hình ARIMA ...................................................... 54 Hình 6: Hàm ACF, PACF của phần dƣ có dạng nhiễu trắng của chuỗi xt ................... 54 Hình 7: Hàm tự tƣơng quan chéo r (k ) và giá trị ƣớc lƣợng các phản ứng xung vj... 55 Hình 8: Biểu đồ và hàm tự tƣơng quan và tự tƣơng quan từng phần của chuỗi PDU .. 56 Hình 9: Xác định mô hình nhiễu ................................................................................ 57 Hình 10: Kiểm tra tƣơng quan phần dƣ của nhiễu ...................................................... 57 Hình 11 Kết quả bởi phƣơng pháp bình phƣơng tối thiểu ........................................... 60 Học viên: Phạm Trung Thành 3 Lớp Hệ thống thông tin K16 Luận văn cao học - Chuyên ngành: Hệ thống thông tin Danh sách bảng Bảng 1: Bộ dữ liệu thử nghiệm của hai chuỗi GDP và Công nghiệp xây dựng ........... 52 Bảng 2 : Kết quả dự báo của mô hình hàm chuyển ..................................................... 62 Bảng 3: Kết quả dự báo của mô hình ARIMA cho chuỗi Công nghiệp xây dựng Yt ... 65 Bảng 4: Bộ dự liệu cho GDP, Bản lẻ tiêu dùng, nhập khẩu, xuất khẩu ....................... 66 Dƣới đây là một số mô hình tìm đƣợc: ....................................................................... 67 Học viên: Phạm Trung Thành 4 Lớp Hệ thống thông tin K16 Luận văn cao học - Chuyên ngành: Hệ thống thông tin GIỚI THIỆU ĐỀ TÀI Dự báo có vai trò quan trọng trong việc lập kế hoạch phát triển kinh tế-xã hội. Tuy nhiên, dự báo là công việc khó và ở nƣớc ta còn là công việc khá mới mẻ so với nhiều quốc gia phát triển, thậm chí so với ngay cả các nƣớc trong khu vực. Vì vậy đề tài là một nỗ lực nhằm hƣởng ứng và góp phần vào việc thúc đẩy và triển khai các hoạt động nghiên cứu và ứng dụng về dự báo. Có nhiều hƣớng tiếp cận cũng nhƣ phƣơng pháp xây dựng các mô hình dự báo khác nhau tùy thuộc vào chủ thể nghiên cứu, đối tƣợng nghiên cứu, yêu cầu của việc nghiên cứu…Trong khuôn khổ đề tài, đối tƣợng nghiên cứu là chuỗi thời gian thể hiện một giá trị định lƣợng nào đó ở những thời điểm khác nhau, theo trật tự thời gian về một sự vật, hiện tƣợng hoặc quá trình nhất định. Mục đích, yêu cầu và cũng là nhu cầu của việc dự báo là trên cơ sở các giá trị hiện tại và quá khứ của các chuỗi thời gian, ta có thể dự báo đƣợc giá trị tƣơng lai của một chuỗi nào đó với độ chính xác chấp nhận đƣợc. Do đối tƣợng nghiên cứu là chuỗi thời gian, mà về mặt toán học là một quá trình ngẫu nhiên, nên việc xây dựng, kiểm định mô hình và tiến hành dự báo chủ yếu dựa trên nền tảng toán học xác xuất thống kê. Nói cách khác khi ta nghiên cứu về chuỗi thời gian, về các tính chất, thuộc tính, qui luật của nó để xây dựng nên các mô hình dự báo thì về cơ bản là ta làm việc với các giá trị, các đặc trƣng thống kê của chuỗi. Từ đó, có thể thấy ngay rằng việc xây dựng, kiểm định mô hình hay dự báo từ mô hình luôn gắn liền với sai số, với sự điều chỉnh không ngừng để có đƣợc một kết quả ngày càng hợp lý theo thời gian. Rõ ràng, ngay cả khi xác định đối tƣợng nghiên cứu là chuỗi thời gian, thì việc tiếp cận và xác định mô hình dự báo cũng vô cùng đa dạng. Chúng ta có thể phân chia các mô hình dự báo chuỗi thời gian thành mô hình dự báo tuyến tính và phi tuyến, mô hình dự báo đơn biến và đa biến, hoặc theo tiêu chí thời hạn dự báo thì có mô hình dự báo ngắn hạn, trung hạn và dài hạn. Mỗi mô hình có các ƣu, nhƣợc điểm khác nhau và đƣợc áp dụng cho các đối tƣợng có đặc thù và các bài toán khác nhau. Do đó, không có mô hình nào là tuyệt đối vƣợt trội hoặc là chìa khóa vạn năng áp dụng cho mọi dạng chuỗi thời gian. Mô hình mà đề tài nghiên cứu là mô hình hàm chuyển, một mô hình dự báo đa biến và áp dụng chủ yếu cho việc dự báo ngắn hạn hoặc trung hạn. Mô hình áp dụng tốt nhất cho các chuỗi, các quá trình có “tính dừng”. Tính đa biến cho Học viên: Phạm Trung Thành 5 Lớp Hệ thống thông tin K16 Luận văn cao học - Chuyên ngành: Hệ thống thông tin phép mô hình có khả năng dự báo giá trị tƣơng lai của một chuỗi thông qua giá trị hiện tại và quá khứ của chính nó và của các chuỗi thời gian khác. Điều đó rất có giá trị bởi mô hình hàm chuyển biểu diễn đƣợc mối quan hệ tƣơng quan giữa các chuỗi thời gian khác nhau, và do đó cũng chính là mối quan hệ giữa các sự vật, hiện tƣợng và quá trình khác nhau. Đây là ƣu điểm vƣợt trội của mô hình hàm chuyển so với các mô hình dự báo đơn biến - các mô hình chỉ thể hiện đƣợc sự tƣơng quan giữa các giá trị của cùng một chuỗi, tức mối quan hệ nội tại theo thời gian của cùng một đối tƣợng, mà không chỉ ra đƣợc sự phụ thuộc của các đối tƣợng khác nhau - một việc rất cần thiết trong phân tích tình hình kinh tế, xã hội. Chính vì vậy, mô hình hàm chuyển hiện đang đƣợc coi là trung tâm của các ứng dụng dự báo về kinh tế, xã hội và cả tự nhiên. Về bố cục nội dung, luận văn bao gồm phần giới thiệu đề tài, ba chƣơng chính và phần kết luận đề tài, trong đó: Chƣơng 1: Trình bày một cách tổng quan về chuỗi thời gian và việc phân tích, dự báo cho chuỗi thời gian. Qua đó chúng ta có thể hình dung đƣợc một cách khái quát về chuỗi thời gian - đối tƣợng dữ liệu của dự báo, với các nội dung cơ bản nhất; đồng thời cũng hiểu sơ bộ về vai trò của công tác dự báo, một số loại dự báo, một số phƣơng pháp dự báo thƣờng đƣợc sử dụng trong lập kế hoạch phát triển kinh tế - xã hội. Chƣơng 2: Là nội dung quan trọng, trình bày nền tảng lý thuyết về mô hình cũng nhƣ qui trình xây dựng mô hình hàm chuyển. Cụ thể, trong chƣơng này luận văn sẽ trình bày chi tiết về khái niệm, các bƣớc trong quá trình xác định và kiểm tra mô hình hàm chuyển; và trong từng bƣớc sẽ chỉ ra các phƣơng pháp, các thủ tục đƣợc sử dụng để giải quyết các mục tiêu của bƣớc đó. Kết thúc Chƣơng 2 ta có thể nhận dạng và xây dựng đƣợc các mô hình hàm chuyển rời rạc cho các chuỗi thời gian và các mô hình này là cơ sở cho việc dự báo đƣợc trình bày trong Chƣơng 3. Chƣơng 3: Tập trung trình bày về việc dự báo sử dụng mô hình hàm chuyển đã đƣợc xây dựng theo qui trình và thủ tục ở Chƣơng 2. Đồng thời cũng trong chƣơng Ba luận văn sẽ trình bày việc xây dƣng một mô hình hàm chuyển thử nghiệm cho các chỉ tiêu kinh tế Việt Nam. Đây là một nội dung có tính thực tiễn, qua đó chúng ta có thể hiểu một cách rõ ràng hơn toàn bộ các vấn đề lý thuyết đƣợc trình bày ở các chƣơng trƣớc. Với các nội dung trên, luận văn đã bám sát giải quyết các mục tiêu và các yêu cầu đề ra. Tuy nhiên mô hình hàm chuyển là một nội dung tƣơng đối mới, Học viên: Phạm Trung Thành 6 Lớp Hệ thống thông tin K16 Luận văn cao học - Chuyên ngành: Hệ thống thông tin còn ít đƣợc nghiên cứu tại Việt Nam, do dó việc nghiên cứu phát triển mô hình, khai thác mô hình trong thực tiễn và kết hợp với các mô hình dự báo khác để có một mô hình dự báo kết hợp hiệu quả là một vấn đề, cũng là một nhu cầu thực sự cần thiết tƣơng lai. . Đây cũng chính là hƣớng phát triển Equation Chapter 1 Section 1 Học viên: Phạm Trung Thành 7 Lớp Hệ thống thông tin K16 Luận văn cao học - Chuyên ngành: Hệ thống thông tin Chƣơng 1 TỔNG QUAN VỀ CHUỖI THỜI GIAN VÀ CÁC MÔ HÌNH DỰ BÁO CHUỖI THỜI GIAN Chuỗi thời gian là một khái niệm chỉ một tập quan sát đƣợc đo đạc theo trình tự thời gian về một thuộc tính, một tính chất hoặc một khía cạnh nào đó của một (hoặc một vài) sự vật, hiện tƣợng hay quá trình nhất định. Chuỗi thời gian là đối tƣợng dữ liệu để xây dựng mô hình dự báo chuỗi thời gian. Nó có những thành phần, những tính chất cơ bản và đặc biệt là các đặc trưng thống kê làm cơ sở để chúng ta phân tích và dự báo về chuỗi. Trong đó, cần lƣu ý ngay từ đầu rằng tính dừng của chuỗi là một tiền đề rất quan trọng để xây dựng mô hình dự báo hiệu quả và chính xác. Do đó một điều kiện cần thiết là biến đổi đƣợc một chuỗi không dừng thành chuỗi có tính dừng trƣớc khi thực hiện xây dựng mô hình. Có nhiều mô hình phân tích và dự báo khác nhau cho chuỗi thời gian, tùy theo từng tiêu chí phân loại. Có thể kể đến các mô hình đơn biến hay đa biến, các mô hình tuyến tính hoặc phi tuyến, mô hình dự báo ngắn hạn, dài hạn hay trung hạn. Mỗi mô hình có các ƣu và nhƣợc điểm khác nhau, phù hợp với từng mục tiêu dự báo, tính chất và yêu cầu dự báo khác nhau. Mô hình mà đề tài nghiên cứu là mô hình hàm chuyển, một mô hình đƣợc coi là hữu hiệu và cho kết quả dự báo tƣơng đối chính xác. Tất cả những vấn đề trên sẽ đƣợc trình bày một cách khái quát trong các nội dung dƣới đây. 1. 1 CHUỖI THỜI GIAN VÀ PHÂN TÍCH, DỰ BÁO CHUỖI THỜI GIAN 1.1.1 Chuỗi thời gian Chuỗi thời gian là một tập các quan sát đƣợc đo tuần tự theo thời gian. Nếu tập là liên tục, chuỗi thời gian đƣợc gọi là chuỗi liên tục, ngƣợc lại đƣợc gọi là chuỗi rời rạc. Có thể nói phần lớn dữ liệu phụ thuộc thời gian phản ánh các hoạt động của đời sống kinh tế - xã hội thƣờng đƣợc đo tại các mốc thời gian cách đều nhau, nên trong khuôn khổ đề tài chúng ta chỉ quan tâm đến các chuỗi thời gian rời rạc, mà ở đó các quan sát đƣợc đƣợc đo tại các thời điểm cách đều nhau, với hoạt động và phƣơng pháp đo cố định. Các quan sát của một chuỗi thời gian rời rạc thực hiện tại các thời điểm cách đều nhau t1 , t2 ,..., t N ta kí hiệu là z1 , z2 ,..., z N . Về mặt toán học, chuỗi thời gian rời rạc là một tập giá trị các quan Học viên: Phạm Trung Thành 8 Lớp Hệ thống thông tin K16 Luận văn cao học - Chuyên ngành: Hệ thống thông tin sát của biến ngẫu nhiên {zt} đo đƣợc trong các khoảng thời gian t nhƣ nhau và đƣợc xếp theo thứ tự thời gian. Các tính chất của chuỗi thời gian: Tính thời đoạn: Tập quan sát của chuỗi thời gian đƣợc đo ở các các điểm thời gian khác nhau, do đó đơn vị phân tích là thời đoạn: hàng ngày, hàng tuần, hàng tháng, hàng năm… . Tính mùa vụ: Chuỗi thể hiện tính mùa vụ thông thƣờng có xu hƣớng đƣợc nhắc lại ở những khoảng thời gian theo mùa đều đặn. Tính dừng: Chuỗi mà các quan sát của nó đƣợc biến thiên quanh giá trị trung bình hay ở một mức không đổi nào đó. Tính xu thế: Tính xu thế thể hiện sự dịch chuyển dữ liệu hoặc chiều tăng hoặc giảm của dữ liệu trong dài hạn. Tính chu kỳ: Chuỗi quan sát của chuỗi thời gian thể hiện dƣới dạng đồ thị hàm tuần hoàn (chẳng hạn các hàm lƣợng giác: sin, cosin, ...) 1.1.2 Các đại lƣợng đặc trƣng của chuỗi thời gian Khi nghiên cứu chuỗi thời gian, ta không xem xét từng phần tử của chuỗi một cách độc lập, mà xem xét các phần tử của chuỗi trong mối quan hệ tƣơng quan với nhau, nhằm tìm ra qui luật biểu diễn mối liên hệ của chúng theo thời gian. Vì vậy, đƣơng nhiên cách tiếp cận của chúng ta là thông qua các đặc trƣng thống kê của chuỗi, các giá trị định lƣợng có tính ổn định, đại diện cho chuỗi. Dƣới đây là một số đại lƣợng đặc trƣng của chuỗi thời gian mà ta cần xem xét, với chú ý rằng các đặc trƣng này, xét tới cùng khi đƣợc tính toán trong thực tế, chính là các đại lƣợng đƣợc triết xuất từ các mẫu của chuỗi mà thôi. Giả sử có chuỗi thời gian với n các quan sát {zt}, t = 1,2,…n. Kỳ vọng Đại diện cho giá trị trung bình của chuỗi. Ký hiệu là: E(z t )   (1.1) Trong thực tế không thể nghiên cứu đƣợc toàn bộ tổng thể của hiện tƣợng mà chỉ nghiên cứu đƣợc tập con các phần tử của tổng thể gọi là mẫu. Lý do là, thu thập thông tin về toàn bộ tổng thể sẽ đòi hỏi cần nhiều thời gian và chi phí. Vì thế ta chỉ nghiên cứu một số phần tử nào đó của tổng thể tức là chỉ nghiên cứu các mẫu, từ đó suy đoán về tổng thể. Các phần tử đƣợc chọn để nghiên cứu tổng thể đƣợc gọi là mẫu ngẫu nhiên. Nên kỳ vọng tổng thể đƣợc tính dựa trên mẫu các quan sát gọi là kỳ vọng mẫu, và đƣợc tính nhƣ sau: Học viên: Phạm Trung Thành 9 Lớp Hệ thống thông tin K16 Luận văn cao học - Chuyên ngành: Hệ thống thông tin z 1 n  zt n t 1 (1.2) Phƣơng sai Đại diện cho mức độ phân tán các giá trị của chuỗi xung quanh kỳ vọng: var(z t )   2z  E[(z t  ) 2 ] (1.3) Tƣơng tự, phƣơng sai mẫu đƣợc tính: ˆ z2  1 n ( zt  z ) 2  n t 1 (1.4) Độ lệch chuẩn Là căn bậc hai của phƣơng sai mẫu: ˆ z  ˆ 2 (1.5) Dƣới đây là một số đại lƣợng mô tả mối quan hệ (ta gọi là sự tƣơng quan) giữa các phần tử trong chuỗi: Hiệp phƣơng sai Sử dụng để đo mức độ tƣơng quan tuyến tính của hai biến ngẫu nhiên trong cùng một chuỗi thời gian. Nó phản ánh sự phụ thuộc hay độc lập của các biến ngẫu nhiên trong chuỗi. Hiệp phƣơng sai giữa hai biến ngẫu nhiên trên chuỗi thời gian nhƣ nhau tại thời điểm t, ký hiệu là zt và tại thời điểm t + k, ký hiệu là zt + k , và giữa chúng có k - 1 quan sát gọi là độ trễ k, đƣợc xác định nhƣ sau:  z (k )  cov  zt , zt  k   E ( zt   )( zt  k   )  (1.6) trong đó,  là kỳ vọng của zt và zt + k. Hiệp phƣơng sai khi độ trễ k = 0 chính là phƣơng sai của zt:  z (0)  cov  zt, zt    z2 . Tƣơng tự, hiệp phƣơng sai mẫu đƣợc tính nhƣ sau: ˆz (k )  1 nk  ( zt  z )( zt  k  z ) n t 1 k = 1, 2...n-1 (1.7) trong đó, z là kỳ vọng mẫu của zt và zt + k. Hàm tự tƣơng quan (ACF) Đại lƣợng mô tả tƣơng quan tại trễ k giữa các giá trị trong chuỗi thời gian, đƣợc xác định: k  cov(z t , z t  k )  (k )  z   zt  zt k  zt  ztk Học viên: Phạm Trung Thành 10 E(z t  )(z t  k  )   E (z t  ) 2 E (z t  k  ) 2  (1.8) Lớp Hệ thống thông tin K16 Luận văn cao học - Chuyên ngành: Hệ thống thông tin trong đó,  z (k ) là tự hiệp phƣơng sai,  zt ,  zt  k lần lƣợt là độ lệch chuẩn của zt và zt + k. Khi chuỗi thời gian là dừng (định nghĩa ở dƣới) thì zt và zt+k đều có phƣơng sai nhƣ nhau là  z2   z (0) , nên tự tƣơng quan tại trễ k đƣợc tính: k   z (k )  z (0) Tự tƣơng quan đƣợc xem là một hàm với tham số biến thiên theo trễ k (k=1,2…) và đƣợc gọi là hàm tự tƣơng quan. Tự tƣơng quan mẫu đƣợc tính theo công thức: ˆ k  ˆz (k ) ˆz (0) (1.9) Một vài tính chất của tự tƣơng quan mẫu: - Tính chất 1:  1  ˆk  1 - Tính chất 2: k  0  ˆ0  1 - Tính chất 3: ˆk  ˆk Nếu nhƣ zt và zt + k không tƣơng quan với nhau thì tự tƣơng quan ˆk  0 , do khi đó cov(zt, zt + k) = 0, nhƣng điều ngƣợc lại chƣa chắc đã đúng. Dựa trên mối quan hệ tự tƣơng quan giữa các phần tử trong chuỗi, ngƣời ta có thể xây dựng đƣợc mô hình dự báo chuỗi thời gian. Hàm tự tƣơng quan từng phần (PACF) Tự tƣơng quan mẫu ˆk phản ánh mức độ tƣơng quan giữa hai biến ngẫu nhiên zt và zt + k trong chuỗi thời gian. Tuy nhiên, sự tƣơng quan giữa chúng có thể chịu sự tác động của các biến khác, trong trƣờng hợp này là k - 1 biến trung gian zt + 1, zt + 2… zt + k - 1 ảnh hƣởng đến sự tƣơng quan giữa biến zt và zt+k. Do đó hàm tự tƣơng quan từng phần đƣợc đƣa vào nhằm mục đích mô tả mức độ tƣơng quan trực tiếp giữa hai biến zt và zt + k (không bị ảnh hƣởng ràng buộc bởi mối quan hệ với các biến trung gian), đƣợc tính theo công thức: kj  k 1, j  kkk 1,k  j j  1, 2,..., k  1 (1.10) k 1  kk   k    k 1, j  k  j j 1 k 1 1    k 1, j  j , độ trễ k = 1,2,3... (1.11) j 1 Tự tƣơng quan từng phần đƣợc khảo sát nhƣ là một hàm với tham số biến thiên theo độ trễ k và đƣợc gọi là hàm tự tƣơng quan từng phần. Tự tƣơng quan từng Học viên: Phạm Trung Thành 11 Lớp Hệ thống thông tin K16 Luận văn cao học - Chuyên ngành: Hệ thống thông tin phần cũng đƣợc hiểu theo quan điểm của bài toán dự báo đó là giả định muốn dự báo giá trị của zt+h từ các giá trị zt+h-1,.. zt, dựa trên hàm tuyến tính để kết hợp các giá trị quá khứ này. Khi đó ngƣời ta sử dụng phƣơng pháp tối thiểu sai số bình phƣơng trung bình (Mean Square Error- MSE) h MSE  E[( zt  h   ak zt  hk ) 2 ] k 1 trên các giá trị có thể của trọng số a1,...,ah. Nếu xem xét kết quả này tại một trễ cụ thể h thì khi đó tự tƣơng quan từng phần PACF đƣợc định nghĩa nhƣ là giá trị của hệ số ah:  hh  a h Hệ số R2 Đƣợc sử dụng để đo mức độ phù hợp của hàm hồi qui. Giả sử cho mô hình hồi qui chuỗi thời gian yt     zt  at , với yt gọi là 1 2 biến phụ thuộc (biến đƣợc giải thích), zt là biến độc lập,  1 là hệ số chặn,  2 là hệ số góc, at là nhiễu (phần không giải thích đƣợc). Hệ số R2 đƣợc tính: n R2  ( ( zi  z )( yi  y )) 2 i 1 n  (z  z ) ( y  y) i 1 (1.12) n 2 i i 1 2 i trong đó, n là số các quan sát, z là kỳ vọng mẫu của biến độc lập zt, y là kỳ vọng mẫu của biến phụ thuộc yt. Dễ dàng thấy 0  R2  1 nếu R2 tiến đến 1 thì mô hình hồi qui đƣợc lựa chọn là hợp lý tức là sự thay đổi giá trị của biến phụ thuộc đƣợc giải thích bằng mô hình, ngƣợc lại nếu R2 tiến về 0 thì mô hình đƣợc lựa chọn là không hợp lý hay mô hình không thể giải thích đƣợc sự biến đổi của biến phụ thuộc. Hệ số điều chỉnh R 2 Đôi khi hệ số R2 không phản ánh trung thực mức độ phù hợp của mô hình, chẳng hạn khi thêm các tham biến đƣợc cho là không hợp lý vào mô hình thì R2 không những không giảm mà ngƣợc lại còn tăng lên. Vì thế hệ số điều chỉnh R 2 đƣợc đƣa ra để thẩm định rõ sự phù hợp của mô hình. R 2  1  (1  R 2 ) n 1 nk (1.13) trong đó, n là số các quan sát của chuỗi thời gian, k là số các tham biến trong mô hình. R 2 luôn nhỏ hơn R2, và giảm nếu bổ sung thêm biến hồi qui không hợp lý vào mô hình. R 2 càng gần 1 thì mức độ phù hợp của mô hình càng cao. Học viên: Phạm Trung Thành 12 Lớp Hệ thống thông tin K16 Luận văn cao học - Chuyên ngành: Hệ thống thông tin 1.1.3 Toán tử trễ và toán tử sai phân Toán tử trễ và toán tử sai phân là hai toán tử thƣờng đƣợc dùng để biểu diễn trong các mô hình dự báo chuỗi thời gian. Ta có thể hiểu sơ bộ hai toán tử này nhƣ sau: Toán tử trễ Giả sử có chuỗi các quan sát {zt}, t = 1, 2, ...n. Toán tử trễ, ký hiệu B, là một toán tử thao tác trên chuỗi thời gian với tính chất là làm dịch chuyển quan sát tại thời gian t sang quan sát tại thời gian (t – 1): Bzt  zt 1 (1.14) Toán tử trễ có các tính chất điển hình sau: - Bkzt = zt-k - B0zt = zt (1.15) Toán tử sai phân Toán tử sai phân thƣờng đƣợc sử dụng để biến đổi chuỗi thời gian không có tính mùa vụ không dừng thành chuỗi dừng và đƣợc định nghĩa nhƣ sau: - Sai phân bậc 1:   zt  zt 1  (1  B) zt - Sai phân bậc 2:  2 zt  ( zt )  zt  2zt 1  zt 2 = (1-B)2zt - Sai phân bậc d:  d zt  ( d 1 zt ) = (1-B)dzt (1.16) Toán tử sai phân theo mùa vụ đƣợc sử dụng để khử tính không dừng theo mùa vụ trong quá trình biến đổi chuỗi thời gian có tính mùa vụ không dừng thành thành chuỗi không có tính mùa vụ và dừng, nó đƣợc định nghĩa nhƣ sau: - Sai phân theo trễ mùa vụ bậc 1: s zt  zt  zt s  (1  B s ) zt - Sai phân theo trễ mùa vụ bậc D: SD zt  (1  B s ) D zt (1.17) Ở đây s là khoảng thời gian của một chu kỳ mùa vụ (sẽ đƣợc giải thích rõ hơn ở phần dƣới). 1.1.4 Chuỗi thời gian dừng Trƣớc khi phân tích, mô hình hóa chuỗi thời gian cũng nhƣ đƣa ra dự báo, đối với nhiều mô hình một điều kiện cần đƣợc thỏa mãn là chuỗi thời gian phải là chuỗi dừng. Bởi vì với chuỗi dừng thì các đại lƣợng đặc trƣng chẳng hạn phƣơng sai, kỳ vọng của nó mới có nghĩa đồng thời chỉ khi xây dựng mô hình với chuỗi thời gian dừng thì dự báo đƣa ra mới đáng tin cậy. Do đó ta cần sử dụng các phƣơng pháp để nhận biết đƣợc một chuỗi có dừng hay không, và nếu Học viên: Phạm Trung Thành 13 Lớp Hệ thống thông tin K16 Luận văn cao học - Chuyên ngành: Hệ thống thông tin chuỗi không dừng thì phải có cách thức nào để biến đổi chuỗi không dừng thành dừng. Chuỗi thời gian dừng zt (t = 1, 2...n) đƣợc gọi là chuỗi dừng nếu kỳ vọng, phƣơng sai không đổi theo thời gian và hiệp phƣơng sai giữa hai quan sát bất kỳ chỉ phụ thuộc vào khoảng cách (độ trễ về thời gian) giữa t và t-k, không phụ thuộc vào thời điểm hiệp phƣơng sai đƣợc tính, tức là về mặt toán học chuỗi thời gian zt đƣợc gọi là dừng nếu : - - Kỳ vọng: E ( zt )    const - - Phƣơng sai: var( zt )   z2 t t (1.18) - Tự hiệp phƣơng sai:  z (k )  cov( zt , zt k )  cov( zq , zqk ) t,q|t  q Chuỗi nhiễu trắng Một chuỗi đƣợc gọi là nhiễu trắng nếu nó hầu nhƣ không thể hiện một cấu trúc, hình mẫu rõ rệt nào cũng nhƣ không có bất kỳ sự tự tƣơng quan nào trong chuỗi. Về mặt toán học dãy các biến ngẫu nhiên {at} đƣợc gọi là chuỗi nhiễu trắng nếu các at có phân phối giống nhau, độc lập và có các đại lƣợng đặc trƣng nhƣ sau:  E (at )  0, t  var(at )   , 2 a t  a2 , k  0   k  cov(at , at  k )    0, k  0 1, k  0  k   0, k  0 Nhiễu trắng at đƣợc ký hiệu at ~ WN (0,  a2 ) . Trong thực tế, rất hiếm chuỗi thời gian là nhiễu trắng, nhƣng quá trình nhiễu trắng lại là công cụ cơ bản để tạo ra mô hình phức tạp. Các phƣơng pháp kiểm định chuỗi thời gian dừng Có một số phƣơng pháp hay đƣợc dùng để kiểm định một chuỗi thời gian có dừng hay không, trong đó phƣơng pháp kiểm định dựa trên tƣơng quan đồ của hàm tự tƣơng quan ACF là phƣơng pháp đƣợc ƣu tiên sử dụng trong đề tài. Bên cạnh đó, ta có thể kiểm tra tính dừng bằng phƣơng pháp kiểm định nghiệm đơn vị DF: nếu có tồn tại nghiệm đơn vị trong chuỗi thì kết luận đây là chuỗi không dừng. Đây là phƣơng pháp tƣơng đối hữu hiệu. Một phƣơng pháp khác, nhƣng đề tài chỉ dùng để bổ trợ cho hai phƣơng pháp trên là dùng kiểm định Q để kiểm định tính dừng của chuỗi. Học viên: Phạm Trung Thành 14 Lớp Hệ thống thông tin K16 Luận văn cao học - Chuyên ngành: Hệ thống thông tin Phƣơng pháp kiểm định dựa trên tƣơng quan đồ của hàm ACF đƣợc ƣu tiên sử dụng vì nó trực quan và khá hiệu quả. Tƣơng quan đồ là đồ thị thể hiện hàm tự tƣơng quan (ACF) và tự tƣơng quan riêng (PACF) của một chuỗi thời gian (sẽ trình bày cụ thể ở phần sau). Nếu chuỗi thời gian là ngẫu nhiên, tự tƣơng quan sẽ gần về 0 ở tất cả khoảng phân chia thời gian. Nếu không ngẫu nhiên thì một hoặc một số tự tƣơng quan sẽ khác 0. Khoảng tin cậy khoảng trên 95% của tự tƣơng quan là ± 1.96/N 1/2. Nếu chuỗi là ngẫu nhiên và dừng thì hàm tự tƣơng quan sẽ có phân bố xấp xỉ với phân bố chuẩn N(0,1/n) (n là số các quan sát). Do vậy, nếu chuỗi là dừng thì 95% tự tƣơng quan mẫu sẽ nằm trong khoảng giới hạn 1.96 / n (thể hiện bằng hai đƣờng viền nét đứt trong tƣơng quan đồ của ACF). Còn ngƣợc lại thì chuỗi không phải là dừng khi có nhiều tự tƣơng quan mẫu nằm ngoài khoảng giới hạn này. Tính chất đặc trƣng hàm ACF, với tham số trễ k, của chuỗi không dừng là nó giảm rất chậm khi k tăng, và PACF thì có xu thế đạt điểm cực đại tại độ trễ 1. Các phƣơng pháp biến đổi chuỗi thời gian dừng Nhƣ đã trình bày ở trên, để xây dựng đƣợc mô hình dự báo chính xác thì các chuỗi thời gian không dừng cần đƣợc biến đổi thành các chuỗi thời gian dừng, bằng một số cách nhƣ sau: Phương pháp khử xu thế: Tính xu thế trong chuỗi thời gian là một trong những nguyên nhân chủ yếu làm cho chuỗi không dừng. Giả sử mô hình ƣớc lƣợng biểu diễn chuỗi thời gian không dừng zt chứa xu thế tuyến tính đƣợc biểu diễn nhƣ sau: zˆt  ˆ1  ˆ2t trong đó, ˆ1 , ˆ2 lần lƣợt là ƣớc lƣợng của hệ số chặn và hệ số góc. Để biến đổi chuỗi không dừng zt thành chuỗi dừng, xem xét chuỗi phần dƣ, eˆ  z  ˆ  ˆ t có dừng không.Ngoài ra xu thế cũng đƣợc biểu diễn mô tả bằng t t 1 2 hàm đa thức, đƣờng cong tuyến tính, hàm mũ…Và phƣơng pháp loại trừ xu thế trong chuỗi để biến đổi thành chuỗi dừng cũng đƣợc thực hiện bằng phƣơng pháp tƣơng tự. Phương pháp sai phân: Loại bỏ thành phần xu thế trong chuỗi bằng ứng dụng toán tử sai phân bậc d (d ≥ 1):  d zt  ( d 1 zt ) (1.19) Loại bỏ thành phần mùa vụ trong chuỗi bằng cách sử dụng toán tử sai phân theo trễ mùa vụ bậc D (D ≥ 1): sD zt  (1  B s ) D zt Học viên: Phạm Trung Thành 15 (1.20) Lớp Hệ thống thông tin K16 Luận văn cao học - Chuyên ngành: Hệ thống thông tin Loại trừ thành phần mùa vụ và xu thế trong chuỗi: ứng dụng kết hợp toán tử sai phân theo mùa vụ bậc D và sai phân thƣờng bậc d:  d sD zt  ( zt  zt 1 )d ( zt  zt s ) D  (1  B) d (1  B s ) D zt (1.21) Phương pháp hàm biến đổi: Chuỗi không dừng có thể có nguyên nhân bởi các dao động trong chuỗi không ổn định. Do đó hàm biến đổi đƣợc sử dụng để tác động khiến dao động trong chuỗi trở nên ổn định hơn. Một tập hợp các hàm biến đổi đƣợc Box-Cox đƣa ra, trong đó chẳng hạn là các hàm zt  log( zt ) hoặc zt  zt . 1.1.5 Phân tích, dự báo chuỗi thời gian Giả định cơ bản Phƣơng pháp phân tích, dự báo chuỗi thời gian dựa trên giả định cơ bản là sự biến động của các hiện tƣợng trong tƣơng lai sẽ đƣợc giải thích đƣợc sự biến động của các hiện tƣợng trong quá khứ và hiện tại. Vì vậy mục tiêu chính của phân tích, dự báo chuỗi thời gian là chỉ ra và tách biệt các yếu tố ảnh hƣởng đến nó. Quá trình phân tích, dự báo chuỗi thời gian {zt} là để tìm ra các mô hình, luật ẩn trong nó, đƣợc thực hiện trên mẫu các quan sát, đƣợc tiến hành nhƣ sau: Xây dựng mô hình Bắt đầu bằng việc xác định mô hình. Trƣớc tiên ta cần tiến hành bƣớc chuẩn bị dữ liệu nhằm nhận dạng các thành phần ẩn tồn tại trong chuỗi thời gian, làm trơn số liệu. Sau đó ta tiến tới bƣớc nhận dạng mô hình, ƣớc lƣợng các tham số mô hình. Kết quả đƣợc mô hình ở dạng thô. Kết quả ở dạng thô này cần đƣợc tiếp tục xử lý ở bƣớc hiệu chỉnh và kiểm tra mô hình để đƣợc mô hình cuối cùng thích hợp nhất; kiểm định để kiểm tra xem thực sự mô hình cuối cùng này có đảm bảo những yêu cầu mang tính nguyên tắc hay không. Nếu không đảm bảo, quay lại bƣớc một. Chọn lựa mô hình trong lớp các mô hình phân tích, dự báo chuỗi thời gian cần đƣợc tiến hành sao cho mô hình đƣợc lựa chọn là “tốt nhất”, phải thỏa mãn các tiêu chí kiểm định, đánh giá. Mô hình đƣợc chọn lựa cũng phải đơn giản và có thể hiểu đƣợc dễ dàng, nó sinh ra chuỗi “gần giống” với chuỗi quan sát thực. Chú ý: Bƣớc chuẩn bị dữ liệu cần thực hiện các công việc sau: - Nhận dạng các thành phần ẩn tồn tại trong chuỗi thời gian: Thành phần xu thế thể hiện chiều hƣớng biến động tăng hoặc giảm của các hiện tƣợng nghiên cứu trong thời gian dài. Thành phần chu kỳ thể hiện biến động của hiện tƣợng đƣợc lặp lại với chu kỳ nhất định, thƣờng kéo dài từ 2 đến 10 năm. Thành phần Học viên: Phạm Trung Thành 16 Lớp Hệ thống thông tin K16 Luận văn cao học - Chuyên ngành: Hệ thống thông tin mùa vụ biểu hiện sự tăng hoặc giảm mức độ của hiện tƣợng ở một số thời điểm (tháng, quý) nào đó đƣợc lặp đi lặp lại qua nhiều năm. Thành phần ngẫu nhiên thể hiện những biến động không có qui luật và hầu nhƣ không dự báo, quan sát đƣợc lên giá trị của hiện tƣợng đang nghiên cứu. Nhiệm vụ ở bƣớc này là xác định đƣợc các thành phần của chuỗi để tiến hành khử các chúng ở bƣớc hai. - Làm trơn số liệu: Sau khi xác định đƣợc các thành phần trên trong chuỗi thời gian, tiếp theo phải tiến hành làm trơn dữ liệu. Cụ thể hơn là loại trừ đƣợc thành phần xu thế và mùa vụ trong chuỗi thời gian. Chuỗi thu đƣợc sau cùng không còn chứa các thành phần đó (chuỗi đƣợc làm trơn), khiến cho việc phân tích, dự báo dễ dàng hơn. Việc khử các thành phần sẽ biến chuỗi ban đầu thành một chuỗi mới ổn định hơn mà ta gọi là chuỗi dừng, giúp cho việc dự báo đƣợc chính xác. Tất nhiên, sau khi dự báo cho chuỗi mới ta sẽ “bù” lại các thành phần đã đƣợc khử để đƣợc kết quả cuối cùng phù hợp với chuỗi ban đầu. Một số kiểm định thống kê: Để biết một mô hình có phù hợp với thực tế hay không, mức độ phù hợp nhƣ thế nào, đã tối ƣu hay chƣa, ta cần cần dùng các phƣơng pháp kiểm định. Dƣới đây là một số phƣơng pháp kiểm định đƣợc dùng trong luận văn: Kiểm định T: Để kiểm định xem mỗi hệ số trong mô hình  i (i = 1, …, n) = 0 hay không. Nếu Pr(T-Statistic) < 0,1 thì giả thuyết  i (i = 1, …, n) = 0 ở mức dƣới 10% (hay giả thuyết này bị bác bỏ ở mức trên 90%); nếu Pr(T-Statistic) < 0,05 thì giả thuyết  i (i = 1, …, n) = 0 ở mức dƣới 5% (hay giả thuyết bị bác bỏ ở mức trên 95%) và giả thuyết này bị bác bỏ ở mức trên 99% nếu nếu Pr(TStatistic) < 0,01, ... Mức mỗi hệ số  i = 0 bị bác bỏ là do ngƣời sử dụng tự lựa chọn và khi giả thuyết  i = 0 bị bác bỏ có nghĩa là  i khác 0 và biến Xi vẫn có mặt trong phƣơng trình hồi qui. Kiểm định d (Durbin - Watson): Dùng để phát hiện xem chuỗi phần dƣ hay sai số của mô hình có tự tƣơng quan hay không. Nếu có tự tƣơng quan thì dự báo sẽ không chính xác. Nếu d nằm trong khoảng gần 2 là tốt (khoảng từ 1,8 đến 2,2), chuỗi phần dƣ không có tự tƣơng quan. Tiêu chuẩn thông tin Akaike (AIC), Schwarz (SIC): Làm thế nào chọn đƣợc mô hình đƣợc cho là tối ƣu nhất trong nhiều mô hình ứng cử, hai tiêu chuẩn AIC hoặc SIC là những tiêu chuẩn cho phép chọn lựa đƣợc một mô hình đƣợc cho là tối ƣu nhất. Học viên: Phạm Trung Thành 17 Lớp Hệ thống thông tin K16 Luận văn cao học - Chuyên ngành: Hệ thống thông tin - Tiêu chuẩn: AIC (k )  log ˆ 2  - Tiêu chuẩn: SIC (k )  logˆ 2  2k n k log n n trong đó k là số lƣợng các tham số trong mô hình, n là số các quan sát của chuỗi, ˆ 2 là ƣớc lƣợng phƣơng sai (độ lệch) của mô hình. Tiêu chí để chọn lựa mô hình hợp lý trong nhiều mô hình ứng cử là chọn giá trị k (số các tham số) của mô hình ứng cử dẫn đến giá trị AIC(k), SIC(k) là nhỏ nhất. Nó thể hiện nguyên tắc tằn tiện trong việc lựa chọn mô hình. Dự báo Dựa trên mô hình đƣa ra các dự báo về giá trị phần tử của chuỗi trong tƣơng lai. Từ mô hình thực hiện dự báo giá trị tƣơng lai cho chuỗi, phân tích sự phù hợp của giá trị dự báo cả về mặt thực nghiệm và lý thuyết. Xác định độ chệch giữa giá trị dự báo với giá trị quan sát thực và khoảng tin cậy của dự báo tức là giới hạn mà giá trị quan sát thực sẽ nằm trong đó. Dự báo chuỗi thời gian là ƣớc lƣợng các giá trị của biến ngẫu nhiên chuỗi thời gian zt+h ( h  1 ) tại thời điểm t, ký hiệu là zˆt (h) , dựa trên cơ sở các giá trị của biến ngẫu nhiên {zt} đƣợc quan sát trong quá khứ và tại thời điểm này. Trên cơ sở mô hình đã đƣợc xây dựng, ta sẽ tiến hành dự báo các giá trị tƣơng lai của hiện tƣợng nghiên cứu, trên cơ sở đó để lập kế hoạch, đề ra các quyết định trong sản xuất, kinh doanh hoặc đề ra chính sách. Đồng thời cung cấp thêm các giá trị quan sát mới vào dữ liệu chuỗi quan sát nhằm mục đích hiệu chỉnh lại mô hình để đƣa ra dự báo tốt hơn. Dự báo trước một bước ngoài mẫu: Giả sử số liệu các biến có đến năm thứ N. Sử dụng mô hình đƣợc xây dựng để dự báo giá trị các biến Y năm N + 1, thì giá trị dự báo này đƣợc gọi là đƣợc dự báo trƣớc một bƣớc ngoài mẫu. Dự báo trước nhiều bước ngoài mẫu: Sử dụng mô hình đƣợc xây dựng để dự báo giá trị các biến ở năm N + h, thì giá trị dự báo ở thời điểm N + h đƣợc gọi là đƣợc dự báo trƣớc nhiều bƣớc (ở đây là h bƣớc) ngoài mẫu. Để dự báo trƣớc nhiều bƣớc ngoài mẫu, ta nên dự báo trƣớc một bƣớc ngoài mẫu, lấy giá trị này bổ sung vào tập dữ liệu để ƣớc lƣợng lại các tham số mô hình và thực hiện dự báo trƣớc một bƣớc ngoài mẫu, ..., cứ nhƣ vậy cho đến khi nhận đƣợc giá trị dự báo trƣớc nhiều bƣớc ngoài mẫu. Học viên: Phạm Trung Thành 18 Lớp Hệ thống thông tin K16
- Xem thêm -