Đăng ký Đăng nhập
Trang chủ Dự báo chuỗi dữ liệu phụ thuộc thời gian theo mùa vụ bằng mô hình holt - winters...

Tài liệu Dự báo chuỗi dữ liệu phụ thuộc thời gian theo mùa vụ bằng mô hình holt - winters

.PDF
69
1038
146

Mô tả:

ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ -----***----- Tạ Mạnh Cường DỰ BÁO CHUỖI DỮ LIỆU PHỤ THUỘC THỜI GIAN THEO MÙA VỤ BẰNG MÔ HÌNH HOLT-WINTERS LUẬN VĂN THẠC SĨ Hà nội - 2006 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ -----***----- Tạ Mạnh Cường DỰ BÁO CHUỖI DỮ LIỆU PHỤ THUỘC THỜI GIAN THEO MÙA VỤ BẰNG MÔ HÌNH HOLT-WINTERS Ngành: Công nghệ thông tin Mã số: 1.01.10 LUẬN VĂN THẠC SĨ Người hướng dẫn khoa học: TS Đỗ Văn Thành Hà nội - 2006 -i- Mục lục Lời cảm ơn ......................................................................................... 1 Mở đầu ............................................................................................... 2 Chương 1: Chuỗi thời gian và phân tích dự báo chuỗi thời gian ..... 5 1. Chuỗi thời gian và dự báo chuỗi thời gian .................................... 5 1.1. Định nghĩa chuỗi thời gian ................................................................ 5 1.2. Dự báo chuỗi thời gian....................................................................... 6 2. Đại lượng đặc trưng chuỗi thời gian ............................................. 7 2.1. Các đại lượng thống kê đặc trưng cho chuỗi thời gian...................... 7 2.2. Các đại lượng mô tả mối quan hệ giữa các phần tử trong chuỗi ....... 8 3. Phân tích, dự báo chuỗi thời gian ................................................ 10 4. Các mô hình chuỗi thời gian đơn giản ........................................ 12 4.1. Nhiễu trắng ...................................................................................... 12 4.2. Mô hình bước ngẫu nhiên ............................................................... 12 4.3. Bước ngẫu nhiên có bụi ................................................................... 12 5. Một số phép toán và kiểm định thống kê .................................... 13 5.1. Kiểm định T ..................................................................................... 13 5.2. Toán tử trễ ....................................................................................... 13 6. Kết luận chương 1 ....................................................................... 14 Chương 2: Mô hình làm trơn hàm mũ Holt-Winters ..................... 15 1. Một số khái niệm cơ bản ............................................................. 15 1.1. Mô hình mùa vụ cộng và mô hình mùa vụ nhân ............................. 15 1.2. Xu thế tuyến tính, hàm mũ hoặc kết hợp cả hai .............................. 18 1.3. Chỉ số mùa vụ SI (Seasonal Index).................................................. 18 - ii - 2. Làm trơn hàm mũ (Exponential smoothing) ............................... 18 2.1. Làm trơn hàm mũ dạng đơn giản (single exponential smoothing) . 18 2.2. Làm trơn hàm mũ bậc hai (double exponential smoothing)............ 20 2.3. Làm trơn hàm mũ bậc ba (triple exponential smoothing) ............... 21 3. Mô hình mùa vụ nhân .................................................................. 21 3.1. Khái quát .......................................................................................... 21 3.2. Ứng dụng mô hình ........................................................................... 22 3.3. Chi tiết .............................................................................................. 22 3.3.1. Các ký hiệu sử dụng .............................................................. 22 3.3.2. Thủ tục cho việc cập nhật các ước lượng tham số mô hình .. 22 3.3.3. Giá trị dự báo ......................................................................... 23 3.3.4. Khởi tạo giá trị của các tham số trong mô hình .................... 24 4. Mô hình mùa vụ cộng .................................................................. 25 4.1. Khái quát .......................................................................................... 25 4.2. Ứng dụng mô hình ........................................................................... 26 4.3. Chi tiết .............................................................................................. 26 4.3.1. Các ký hiệu sử dụng .............................................................. 26 4.3.2. Thủ tục cho việc cập nhật các ước lượng tham số mô hình .. 26 4.3.3. Giá trị dự báo ......................................................................... 27 5. Xây dựng mô hình làm trơn hàm mũ HW .................................. 28 5.1. Các bước xây dựng và lựa chọn các tham số .................................. 28 5.2. Đánh giá dự báo và sai số của dự báo.............................................. 29 5.3. So sánh các bước xây dựng mô hình Holt-Winters và ARIMA:..... 30 5.4. Chuyển đổi mô hình HW sang mô hình ARIMA ............................ 31 5.5. Lựa chọn đặc tính chuỗi phù hợp với mô hình Holt-Winters.......... 32 - iii - 6. Kết luận chương 2 ....................................................................... 33 Chương 3: Ứng dụng mô hình Holt-Winters cho mùa vụ ............. 34 1. Bài toán 1 - Dự báo chỉ số giá tiêu dùng ..................................... 34 1.1. Bước 1: Nhận dạng chuỗi ................................................................ 36 1.1.1. Nhận dạng thành phần xu thế ................................................ 36 1.1.2. Nhận dạng thành phần mùa vụ .............................................. 37 1.2. Lựa chọn mô hình Holt-Winters theo mùa vụ ................................. 38 1.3. Kiểm định các tham số ước lượng mô hình ..................................... 40 1.4. Dự báo .............................................................................................. 41 2. Bài toán 2 - Dự báo giá trị hàng hoá xuất khẩu của Việt nam .... 43 2.1. Bước 1: Nhận dạng chuỗi ................................................................ 44 2.1.1. Nhận dạng thành phần xu thế ................................................ 44 2.1.2. Nhận dạng thành phần mùa vụ .............................................. 45 2.2. Lựa chọn mô hình Holt-Winters theo mùa vụ ................................. 47 2.3. Kiểm định các tham số ước lượng mô hình ..................................... 48 2.4. Dự báo .............................................................................................. 49 3. So sánh, nhận xét giữa mô hình Holt-Winters và SARIMA....... 51 4. Kết luận chương 3 ....................................................................... 54 Kết Luận .......................................................................................... 55 Tài Liệu Tham Khảo ....................................................................... 58 - iv - Danh mục hình vẽ Hình 1 - Chuỗi nhiễu trắng.............................................................................. 12 Hình 2 - Đồ thị của chuỗi thời gian theo mô hình mùa vụ cộng..................... 17 Hình 3 - Đồ thị của chuỗi thời gian theo mô hình mùa vụ nhân..................... 17 Hình 4 - Các bước xây dựng mô hình Holt-Winters ....................................... 28 -v- Danh mục bảng biểu Bảng 1 - So sánh các bước xây dựng mô hình HW và ARIMA ..................... 31 Bảng 2 - Chuyển đổi một số mô hình làm trơn hàm mũ sang ARIMA .......... 31 Bảng 3 - Lựa chọn mô hình HW theo đặc tính chuỗi ..................................... 33 Bảng 4 - Số liệu chỉ số giá tiêu dùng (nguồn dữ liệu: Tổng cục thống kê; đơn vị tính 1/10.000) .............................................................................................. 35 Bảng 5 – Giá trị xuất khẩu của Việt nam (nguồn: tổng cục thống kê; đơn vị: triệu USD) ....................................................................................................... 44 Bảng 6 - Một số kết quả so sánh dự báo giữa mô hình HW & ARIMA ........ 53 Bảng 7 - Một số đánh giá, nhận xét giữa mô hình HW & ARIMA ................ 54 - vi - Bảng từ ngữ, thuật ngữ viết tắt Từ hoặc cụm từ Từ viết Từ tiếng Anh tắt Hàm tự tương quan ACF AutoCorrelation Function Kiểm định DF ADF Argumented Dickey-Fuller Tiêu chuẩn thông tin AIC/SIC AIC/SIC Akaike Information Criteria, Schwarz Information Criteria Sai số phần trăm tuyệt đối APE Absolute Percent Error Tự hồi qui AR AutoRegression Tích hợp trung bình trượt tự ARIMA AutoRegressive hồi qui Moving Average Trung bình trượt tự hồi qui ARMA AutoRegressive Integrated Moving Average Kiểm định DW DW Durbin-Watson Mô hình làm trơn hàm mũ HW Exponential Smoothing (Holt- Holt-Winters Winters) Phân phối đồng nhất độc lập I.I.D Independent Distribution Trung bình trượt MA Moving Average Sai số tuyệt đối trung bình MAE Mean Absolute Error Sai số bình phương trung MSE bình Mean Square Error Identical - vii - Ước lượng bình phương nhỏ OLS Ordinary Least Square nhất Hàm tự tương quan từng PACF Partial phần Function Tự hồi qui theo mùa vụ SAR AutoCorrelation Seasonal AutoRegressive Tích hợp trung bình trượt tự SARIMA Seasonal hồi qui theo mùa vụ Integrated Moving Average Trung bình trượt theo mùa SMA Seasonal Moving Average AutoRegressive vụ Tổng bình phương sai số SSE Sum of Square Error Nhiễu trắng WN White Noise -1- Lời cảm ơn Luận văn thạc sĩ chuyên ngành CNTT: “Dự báo chuỗi dữ liệu phụ thuộc thời gian theo mùa vụ bằng mô hình Holt-Winters” được TS. Đỗ Văn Thành công tác tại Trung tâm thông tin và dự báo Kinh tế - Xã hội Quốc gia Bộ kế hoạch và đầu tư, người đã tận tình hướng dẫn và giúp đỡ tác giả rất nhiều trong quá trình thực hiện luận văn này, người đã mở ra cho tác giả những cách tiếp cận mới của công nghệ thông tin vào trong đời sống thực tế. Qua đây, tác giả xin gửi tới TS. Đỗ Văn Thành lời cảm ơn chân thành và sâu sắc nhất. Tác giả cũng xin bày tỏ lời cảm ơn tới các thầy TS. Hà Quang Thụy, GS.TSKH. Phan Đình Diệu, PGS.TS. Trịnh Nhật Tiến, PGS.TS. Đoàn Văn Ban, TS. Nguyễn Việt Hà, TS. Hoàng Xuân Huấn, PGS.TS. Nguyễn Ngọc Bình, PGS TS. Đinh Mạnh Tường ... những người đã truyền cho tác giả nhiều kiến thức và kinh nghiệm quý báu trong thời gian tác giả theo học cao học tại Trường Đại học Công nghệ - Đại học Quốc gia Hà nội. Tác giả cũng xin gửi lời cảm ơn chân thành đến một số cán bộ thuộc Tổng cục Thống kê Việt nam, những người đã giúp đỡ nhiệt tình trong việc cung cấp số liệu đầy đủ, trung thực phục vụ cho luận văn này. Cuối cùng, tác giả xin gửi lời cảm ơn đến bạn Trần Văn Thái, người đã giúp đỡ tác giả hoàn thành luận văn này đồng thời cũng xin gửi lời cám ơn tới tất cả người thân trong gia đình, bạn bè trong quá trình học tập và công tác. Tác giả Tạ Mạnh Cường -2- Mở đầu Vấn đề dự báo phát triển kinh tế - xã hội luôn là vấn đề quan tâm của mọi quốc gia, nhất là đối với nước ta đang trong quá trình xây dựng nền kinh tế thị trường trong bối cảnh toàn cầu hoá kinh tế phát triển ngày càng sâu, rộng và cạnh tranh gay gắt. Trong nền kinh tế thị trường chức năng quản lý nhà nước về kinh tế chủ yếu được thực hiện thông qua công cụ chính sách phát triển kinh tế - xã hội. Kinh nghiệm của các nước có nền kinh tế thị trường cho thấy để công cụ chính sách phát huy được hiệu quả điều rất quan trong là phải thực hiện tốt công tác phân tích và dự báo phát triển kinh tế - xã hội. Với sự bùng nổ về thông tin và dữ liệu về kinh tế - xã hội, để dự báo chính xác và kịp thời tình hình biến động của kinh tế - xã hội Việt Nam và thế giới phục vụ công tác chỉ đạo, điều hành về kinh tế của Chính phủ thì việc ứng dụng các phương tiện kỹ thuật và công nghệ của CNTT nhằm phát hiện tri thức mới từ dữ liệu kinh tế - xã hội hiện tại và quá khứ là cách tiếp cận đang được các nhà nghiên cứu và ứng dụng Việt Nam hết sức quan tâm. Luận văn này nằm trong hướng nghiên cứu ứng dụng đó. Như đã biết các dữ liệu phát triển kinh tế - xã hội là phụ thuộc thời gian, được thu thập định kỳ theo tháng, quý, năm và có tính mùa vụ rất rõ. Hiện đã có nhiều phương pháp dự báo kinh tế - xã hội khác nhau, mỗi phương pháp thường phù hợp với một số vấn đề dự báo kinh tế - xã hội nhất định trong một nền kinh tế cụ thể, bởi vậy việc nghiên cứu xác định phương pháp dự báo hiệu quả, phù hợp với thực tiễn phát triển kinh tế - xã hội Việt nam là vấn đề đòi hỏi phải được quan tâm nghiên cứu ứng dụng. Trong phân tích và dự báo dữ liệu chuỗi thời gian về kinh tế - xã hội, hiện có bốn mô hình đang được đặc biệt quan tâm, đó là mô hình hồi quy -3- chuỗi thời gian, mô hình tích hợp trung bình trượt tự hồi quy ARIMA, mô hình tự hồi quy véc tơ VAR và mô hình làm trơn hàm mũ Holt-Winters. Cùng với mô hình ARIMA, mô hình Holt-Winters cũng đang được xem là rất thích hợp cho dự báo ngắn hạn một số vấn đề về kinh tế - xã hội từ dữ liệu chuỗi thời gian có tính mùa vụ. Luận văn ”Dự báo chuỗi dữ liệu phụ thuộc thời gian theo mùa vụ bằng mô hình Holt-Winters” sẽ tập trung khảo cứu và ứng dụng mô hình làm trơn hàm mũ Holt-Winters để dự báo biến động về chỉ số giá tiêu dùng và giá cả một số mặt hàng theo tháng, tổng giá trị xuất khẩu của Việt nam theo tháng trên những số liệu chính thống do Tổng cục Thống kê thu thập. Việc dự báo những nội dung trên đã được thực hiện bằng việc ứng dụng mô hình ARIMA đã được trình bầy trong một luận văn cao học, khoa CNTT - Đại học Công nghệ thực hiện, trong luận văn này sẽ tập trung nghiên cứu làm rõ sự giống và khác nhau của hai mô hình này, so sánh kết quả dự báo bằng việc ứng dụng cả hai mô hình trên cùng tập dữ liệu thử nghiệm. Luận văn gồm 3 chương nội dung, không kể phần mở đầu, phần kết luận, phần phụ lục và tài liệu tham khảo. Chương 1: Chuỗi thời gian và Phân tích chuỗi thời gian, sẽ giới thiệu một cách tóm tắt những khái niệm chủ yếu liên quan đến chuỗi thời gian và các bước tiến hành phân tích và dự báo chuỗi thời gian, giới thiệu một số mô hình chuỗi thời gian đơn giản và một số kiểm định thống kê sử dụng cho phân tích, dự báo dữ liệu chuỗi thời gian. Chi tiết của những khái niệm này có thể được tham khảo trong phần phụ lục. Chương 2: Mô hình làm trơn hàm mũ Holt-Winters. Nội dung chính của chương là trình bày một cách có hệ thống mô hình làm trơn hàm mũ đơn, mô hình làm trơn hàm mũ bậc hai và mô hình làm trơn hàm mũ bậc ba (HoltWinters) để dự báo dữ liệu chuỗi thời gian có tính chất xu thế và tính chất -4- mùa vụ. Việc lựa chọn mô hình làm trơn hàm mũ nào phụ thuộc vào tính chất dữ liệu chuỗi thời gian cụ thể. Chương 3: Ứng dụng mô hình Holt-Winters. Chương này tập trung trình bày qui trình ứng dụng mô hình Holt-Winters theo mùa vụ để dự báo một số chỉ số kinh tế vĩ mô quan trọng phản ánh mức độ tăng trưởng kinh tế Việt nam như dự báo chỉ số giá tiêu dùng theo tháng (CPI), tổng giá trị hàng hóa xuất khẩu của Việt nam theo tháng. Dữ liệu được sử dụng để dự báo là số liệu thực tế của nền kinh tế do Tổng cục Thống kê công bố. Các kết quả dự báo theo mô hình Holt-Winters sẽ được so sánh với các kết quả dự báo theo mô hình ARIMA. Phần kết luận: Tổng kết những công việc đã thực hiện và kết quả đạt được trong luận văn này, đồng thời đề xuất một số hướng nghiên cứu tiếp theo. Phụ lục: Gồm hai phần, Phần 1 của phụ lục sẽ giới thiệu chi tiết hơn một số khái niệm quan trọng liên quan đến chuỗi thời gian và phân tích, dự báo dữ liệu chuỗi thời gian, Phần 2 của phụ lục sẽ giới thiệu mô hình ARIMA cho mùa vụ. -5- Chương 1: Chuỗi thời gian và phân tích dự báo chuỗi thời gian Phân tích, dự báo chuỗi thời gian có thể được chia làm hai loại: Phân tích, dự báo theo mức thời gian và phân tích mối liên hệ nguyên nhân - kết quả. Phương pháp dự báo theo mức thời gian liên quan đến việc dự báo các giá trị tương lai của yếu tố được nghiên cứu dựa trên sự tương quan với các quan sát trong quá khứ và hiện tại. Trong khi đó phân tích mối liên hệ nhân quả liên quan đến việc xác định các nhân tố khác ảnh hưởng đến yếu tố muốn dự báo, như dùng phương pháp phân tích hồi qui bội xem xét GDP phụ thuộc vào lượng đầu tư trong nước, lượng đầu tư nước ngoài, dân số… Luận văn này chỉ tập trung vào phân tích, dự báo theo mức thời gian dựa trên giả định cơ bản là các yếu tố ảnh hưởng đến biến động của hiện tượng trong quá khứ và hiện tại sẽ còn tiếp tục tồn tại trong tương lai. Chương này sẽ trình bày sơ lược một số vấn đề chủ yếu liên quan đến chuỗi thời gian bao gồm khái niệm, dự báo cho chuỗi thời gian và các đại lượng đặc trưng của nó, tiếp đó trình bày về các mô hình chuỗi thời gian đơn giản, đưa ra một số phương pháp kiểm định thống kê cho mô hình chuỗi thời gian. Chi tiết xin tham khảo ở phần Phụ lục. 1. Chuỗi thời gian và dự báo chuỗi thời gian 1.1. Định nghĩa chuỗi thời gian Chuỗi dữ liệu phụ thuộc thời gian được chia làm hai loại: - Chuỗi dữ liệu phụ thuộc thời gian được quan sát, đo đạc trong khoảng thời gian rời rạc: Các quan sát được thực hiện tại các thời điểm tách -6- biệt, chúng thường là các quan sát được đo tại các mốc thời gian cách đều nhau, ví dụ chuỗi thời gian được đo theo tuần, quý, tháng, năm, …. - Chuỗi dữ liệu liên tục theo thời gian: Các quan sát được đo trong khoảng thời gian liên tục, ví dụ chuỗi dữ liệu đo nhiệt độ trong ngày (nhiệt kế). Luận văn này tập trung vào chuỗi dữ liệu phụ thuộc thời gian được đo trong khoảng thời gian rời rạc và cách đều nhau, gọi là chuỗi thời gian (series time data) Như vậy: Chuỗi thời gian là một tập giá trị các quan sát của biến ngẫu nhiên, ký hiệu là {zt } , t  1,...,n là số các quan sát, đo được trong các khoảng thời gian t như nhau (hàng năm, quý, tháng, tuần, ngày …) và được xếp theo thứ tự thời gian. Ví dụ: - Chuỗi giá trị tổng sản phẩm quốc nội (GDP) được đo theo từng quý. - Chuỗi giá trị đo lượng mưa trung bình hàng năm. - Chuỗi giá trị chỉ số thị trường chứng khoán đo theo ngày. - Chuỗi giá trị đo sản lượng điện năng tiêu thụ của Việt Nam đo theo từng tháng, từng quí trong nhiều năm. - Chuỗi giá trị về chỉ số giá tiêu dùng của Việt Nam theo từng tháng, quý trong năm. 1.2. Dự báo chuỗi thời gian Dự báo chuỗi thời gian là ước lượng các giá trị của biến ngẫu nhiên chuỗi thời gian zt  h (h  1) , ký hiệu là zˆt ( h) , dựa trên sự tương quan với các giá trị của biến ngẫu nhiên {zt } đã được quan sát trong quá khứ. Chất lượng của dự báo phụ thuộc vào nhiều yếu tố chẳng hạn sự phức tạp của chuỗi thời gian khi thực hiện phân tích, tác động của nhiều yếu tố bất -7- thường không thể lường trước được khi tiến hành dự báo, ngoài ra độ chính xác cũng còn phụ thuộc phần lớn vào khoảng cách xa gần của dự báo (dự báo gần thì cho độ chính xác của dự báo tốt hơn so với dự báo xa). 2. Đại lượng đặc trưng chuỗi thời gian Giả sử có chuỗi thời gian {zt } gồm n các quan sát, t  1,...,n . 2.1. Các đại lượng thống kê đặc trưng cho chuỗi thời gian Kỳ vọng: Đại diện cho giá trị trung tâm trong chuỗi: E ( zt )   (1.1) Kỳ vọng của tổng thể được tính dựa trên mẫu các quan sát gọi là kỳ vọng mẫu, như sau: 1 n z   zt n t 1 (1.2) Phương sai: Đại diện cho mức độ phân tán các giá trị trong chuỗi xung quanh kỳ vọng của nó: var (zt )  σ z2  E[(zt  μ)2 ] (1.3) Tương tự, phương sai mẫu được tính: ˆ z2  1 n ( zt  z ) 2  n t 1 (1.4) Độ lệch chuẩn: là căn bậc hai của phương sai mẫu: ˆ z  ˆ z2 (1.5) -8- 2.2. Các đại lượng mô tả mối quan hệ giữa các phần tử trong chuỗi Tự hiệp phương sai: Tự hiệp phương sai giữa hai z t và z t  k , giữa chúng có k  1 quan sát gọi là k độ trễ, được xác định như sau:  z (k )  cov zt , zt  k   E ( zt   )( zt  k   ) (1.6) Trong đó,  là kỳ vọng chung của z t và z t  k . Tự hiệp phương sai khi độ trễ k  0 chính là phương sai của z t :  z (0)  covzt , zt    z2 . Tương tự, tự hiệp phương sai mẫu được tính: 1 nk ˆ z (k )   ( zt  z )( zt  k  z ) , k  1,...,n  1 n t 1 (1.7) Trong đó, z là kỳ vọng mẫu của z t và z t  k . Hàm tự tương quan (ACF): Mô tả tương quan tại trễ k giữa các giá trị trong chuỗi thời gian, được xác định: k  cov( zt , zt k )  zt  zt k  E( zt   )( zt k   )  z (k )   zt  zt k E ( zt   ) 2 E ( zt  k   ) 2    (1.8) Trong đó,  z (k ) là tự hiệp phương sai,  zt ,  zt  k lần lượt là độ lệch chuẩn của z t và z t  k . Tự tương quan mẫu được tính theo công thức: ˆ k  ˆ z (k ) ˆ z (0) (1.9) Nếu như z t và z t  k không tương quan với nhau thì tự tương quan ˆ k  0 , do khi đó cov( zt , zt  k )  0 . Nhưng điều ngược lại chưa hẳn đã đúng. Hàm tự tương quan từng phần (PACF): Tự tương quan giữa hai biến z t và z t  k gồm k  1 biến trung gian z t 1 , z t  2 , … , zt  k 1 : -9- k 1 kk   k   k 1, j  k  j j 1 k 1 1   k 1, j  j , độ trễ k  2,3,... (1.10) j 1 kj  k 1, j  kk k 1,k  j , j  1,2,...,k  1 (1.11) Giá trị ban đầu, 11  1 Bằng tính toán tương tự trên các quan sát mẫu có được tự tương quan từng phần mẫu ˆkk . Khảo sát tự tương quan từng phần như một hàm với tham số biến thiên theo độ trễ k được gọi là hàm tự tương quan từng phần. Hệ số R2: Được sử dụng để đo độ thích hợp của mô hình ước lượng. Giả sử cho mô hình hồi qui chuỗi thời gian y t  1   2 z t  at . Hệ số R 2 được tính: n R2  ( ( z i  z )( y i  y )) 2 i 1 n n  ( zi  z )  ( yi  y ) i 1 2 (1.12) 2 i 1 Trong đó, n là số các quan sát, z là kỳ vọng mẫu của biến độc lập z t , y là kỳ vọng mẫu của biến phụ thuộc y t . Dễ dàng thấy 0  R 2  1 nếu R 2 tiến đến 1 thì mô hình hồi qui được lựa chọn là hợp lý, ngược lại nếu R 2 tiến về 0 thì mô hình được lựa chọn là chưa hợp lý. Hệ số điều chỉnh R 2 : Đôi khi hệ số R 2 không phản ánh trung thực mức độ hợp lý của mô hình, chẳng hạn khi thêm các tham biến được cho là không hợp lý vào mô hình thì R 2 không những không giảm mà ngược lại còn tăng lên. Vì thế hệ số điều chỉnh R 2 được xem xét để thẩm định rõ sự phù hợp của mô hình: - 10 - R 2  1  (1  R 2 ) n 1 nk (1.13) ở đây n là số các quan sát của chuỗi thời gian, k là số các tham biến trong mô hình. R 2 luôn nhỏ hơn R 2 , và giảm nếu bổ sung thêm biến hồi qui không hợp lý vào mô hình. 3. Phân tích, dự báo chuỗi thời gian Quá trình phân tích, dự báo chuỗi thời gian {zt } là để tìm ra các mô hình, luật ẩn trong nó, việc này được thực hiện trên các quan sát mẫu, gồm có những bước sau: Bước 1: Nhận dạng các thành phần ẩn tồn tại trong chuỗi thời gian [4] - Thành phần xu thế (Trend - T): Thể hiện chiều hướng biến động tăng hoặc giảm của các hiện tượng nghiên cứu trong thời gian dài. - Thành phần chu kỳ (Period - P): Thể hiện biến động của hiện tượng được lặp lại với chu kỳ nhất định, thường kéo dài từ 2 đến 10 năm. - Thành phần mùa vụ (Seasonal - S): Biểu hiện sự tăng hoặc giảm mức độ của hiện tượng ở một số thời điểm (tháng, quý, năm) nào đó được lặp đi lặp lại qua nhiều năm. - Thành phần ngẫu nhiên (Irregular - I): Thể hiện những biến động không có qui luật và hầu như không dự báo hoặc quan sát được trong của hiện tượng đang nghiên cứu. Những thành phần này kết hợp với nhau trong chuỗi thời gian bằng nhiều cách thức khác nhau, chẳng hạn chuỗi thời gian z t được mô tả là tích các thành phần, zt  T  P  S  I gọi là mô hình tích, hoặc zt  T  P  S  I gọi là mô hình tổng, hoặc kết hợp cả hai zt  T  P  S  I . Do vậy, để phân tích và nghiên cứu hành vi cũng như dự báo biến động của chuỗi thời gian thì - 11 - cần thiết phải ước lượng được các thành phần nói trên trong chuỗi thời gian và cách thức kết hợp chúng với nhau trong chuỗi. Bước 2: Làm trơn số liệu Tuỳ theo mô hình dự báo áp dụng mà cần thiết tiến hành bước làm trơn số liệu hay không ?. Trong trường hợp mô hình dự báo áp dụng cần quá trình làm trơn số liệu ta tiến hành loại trừ được thành phần xu thế và mùa vụ trong chuỗi thời gian. Chuỗi thu được sau cùng không còn chứa các thành phần đó (chuỗi được làm trơn) sẽ khiến cho việc phân tích dễ dàng hơn. Bước 3: Chọn lựa, ước lượng và đánh giá mô hình Chọn lựa mô hình trong lớp các mô hình, sao cho mô hình được lựa chọn là “tốt nhất” trong số các mô hình ứng cử và nó cũng phải đơn giản và có thể hiểu được dễ dàng. Sau đó thực hiện ước lượng các tham số, phần dư cho mô hình vừa chọn lựa và chúng phải thỏa mãn các tiêu chí kiểm định, đánh giá. Mô hình ước lượng được đánh giá là hợp lý khi đó sẽ sinh ra chuỗi “gần giống” với chuỗi dữ liệu quan sát thực. Bước 4: Dự báo Dựa trên mô hình thực hiện dự báo giá trị tương lai cho chuỗi thời gian, phân tích sự phù hợp của giá trị dự báo cả về mặt thực nghiệm và lý thuyết. Xác định độ chệch giữa giá trị dự báo với giá trị quan sát thực và khoảng tin cậy của dự báo tức là giới hạn mà giá trị quan sát thực sẽ nằm trong. Ứng dụng kết quả dự báo vào thực tế Trên cơ sở các dự báo về các giá trị tương lai của hiện tượng nghiên cứu đề ra các quyết định kinh doanh hoặc chính sách. Đồng thời gộp thêm các giá trị quan sát mới vào chuỗi dữ liệu quan sát nhằm mục đích hiệu chỉnh lại mô hình để đưa ra dự báo tốt hơn.
- Xem thêm -

Tài liệu liên quan