ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
-----***-----
Tạ Mạnh Cường
DỰ BÁO CHUỖI DỮ LIỆU PHỤ
THUỘC THỜI GIAN THEO MÙA VỤ
BẰNG MÔ HÌNH HOLT-WINTERS
LUẬN VĂN THẠC SĨ
Hà nội - 2006
ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
-----***-----
Tạ Mạnh Cường
DỰ BÁO CHUỖI DỮ LIỆU PHỤ
THUỘC THỜI GIAN THEO MÙA VỤ
BẰNG MÔ HÌNH HOLT-WINTERS
Ngành: Công nghệ thông tin
Mã số: 1.01.10
LUẬN VĂN THẠC SĨ
Người hướng dẫn khoa học: TS Đỗ Văn Thành
Hà nội - 2006
-i-
Mục lục
Lời cảm ơn ......................................................................................... 1
Mở đầu ............................................................................................... 2
Chương 1: Chuỗi thời gian và phân tích dự báo chuỗi thời gian ..... 5
1. Chuỗi thời gian và dự báo chuỗi thời gian .................................... 5
1.1. Định nghĩa chuỗi thời gian ................................................................ 5
1.2. Dự báo chuỗi thời gian....................................................................... 6
2. Đại lượng đặc trưng chuỗi thời gian ............................................. 7
2.1. Các đại lượng thống kê đặc trưng cho chuỗi thời gian...................... 7
2.2. Các đại lượng mô tả mối quan hệ giữa các phần tử trong chuỗi ....... 8
3. Phân tích, dự báo chuỗi thời gian ................................................ 10
4. Các mô hình chuỗi thời gian đơn giản ........................................ 12
4.1. Nhiễu trắng ...................................................................................... 12
4.2. Mô hình bước ngẫu nhiên ............................................................... 12
4.3. Bước ngẫu nhiên có bụi ................................................................... 12
5. Một số phép toán và kiểm định thống kê .................................... 13
5.1. Kiểm định T ..................................................................................... 13
5.2. Toán tử trễ ....................................................................................... 13
6. Kết luận chương 1 ....................................................................... 14
Chương 2: Mô hình làm trơn hàm mũ Holt-Winters ..................... 15
1. Một số khái niệm cơ bản ............................................................. 15
1.1. Mô hình mùa vụ cộng và mô hình mùa vụ nhân ............................. 15
1.2. Xu thế tuyến tính, hàm mũ hoặc kết hợp cả hai .............................. 18
1.3. Chỉ số mùa vụ SI (Seasonal Index).................................................. 18
- ii -
2. Làm trơn hàm mũ (Exponential smoothing) ............................... 18
2.1. Làm trơn hàm mũ dạng đơn giản (single exponential smoothing) . 18
2.2. Làm trơn hàm mũ bậc hai (double exponential smoothing)............ 20
2.3. Làm trơn hàm mũ bậc ba (triple exponential smoothing) ............... 21
3. Mô hình mùa vụ nhân .................................................................. 21
3.1. Khái quát .......................................................................................... 21
3.2. Ứng dụng mô hình ........................................................................... 22
3.3. Chi tiết .............................................................................................. 22
3.3.1. Các ký hiệu sử dụng .............................................................. 22
3.3.2. Thủ tục cho việc cập nhật các ước lượng tham số mô hình .. 22
3.3.3. Giá trị dự báo ......................................................................... 23
3.3.4. Khởi tạo giá trị của các tham số trong mô hình .................... 24
4. Mô hình mùa vụ cộng .................................................................. 25
4.1. Khái quát .......................................................................................... 25
4.2. Ứng dụng mô hình ........................................................................... 26
4.3. Chi tiết .............................................................................................. 26
4.3.1. Các ký hiệu sử dụng .............................................................. 26
4.3.2. Thủ tục cho việc cập nhật các ước lượng tham số mô hình .. 26
4.3.3. Giá trị dự báo ......................................................................... 27
5. Xây dựng mô hình làm trơn hàm mũ HW .................................. 28
5.1. Các bước xây dựng và lựa chọn các tham số .................................. 28
5.2. Đánh giá dự báo và sai số của dự báo.............................................. 29
5.3. So sánh các bước xây dựng mô hình Holt-Winters và ARIMA:..... 30
5.4. Chuyển đổi mô hình HW sang mô hình ARIMA ............................ 31
5.5. Lựa chọn đặc tính chuỗi phù hợp với mô hình Holt-Winters.......... 32
- iii -
6. Kết luận chương 2 ....................................................................... 33
Chương 3: Ứng dụng mô hình Holt-Winters cho mùa vụ ............. 34
1. Bài toán 1 - Dự báo chỉ số giá tiêu dùng ..................................... 34
1.1. Bước 1: Nhận dạng chuỗi ................................................................ 36
1.1.1. Nhận dạng thành phần xu thế ................................................ 36
1.1.2. Nhận dạng thành phần mùa vụ .............................................. 37
1.2. Lựa chọn mô hình Holt-Winters theo mùa vụ ................................. 38
1.3. Kiểm định các tham số ước lượng mô hình ..................................... 40
1.4. Dự báo .............................................................................................. 41
2. Bài toán 2 - Dự báo giá trị hàng hoá xuất khẩu của Việt nam .... 43
2.1. Bước 1: Nhận dạng chuỗi ................................................................ 44
2.1.1. Nhận dạng thành phần xu thế ................................................ 44
2.1.2. Nhận dạng thành phần mùa vụ .............................................. 45
2.2. Lựa chọn mô hình Holt-Winters theo mùa vụ ................................. 47
2.3. Kiểm định các tham số ước lượng mô hình ..................................... 48
2.4. Dự báo .............................................................................................. 49
3. So sánh, nhận xét giữa mô hình Holt-Winters và SARIMA....... 51
4. Kết luận chương 3 ....................................................................... 54
Kết Luận .......................................................................................... 55
Tài Liệu Tham Khảo ....................................................................... 58
- iv -
Danh mục hình vẽ
Hình 1 - Chuỗi nhiễu trắng.............................................................................. 12
Hình 2 - Đồ thị của chuỗi thời gian theo mô hình mùa vụ cộng..................... 17
Hình 3 - Đồ thị của chuỗi thời gian theo mô hình mùa vụ nhân..................... 17
Hình 4 - Các bước xây dựng mô hình Holt-Winters ....................................... 28
-v-
Danh mục bảng biểu
Bảng 1 - So sánh các bước xây dựng mô hình HW và ARIMA ..................... 31
Bảng 2 - Chuyển đổi một số mô hình làm trơn hàm mũ sang ARIMA .......... 31
Bảng 3 - Lựa chọn mô hình HW theo đặc tính chuỗi ..................................... 33
Bảng 4 - Số liệu chỉ số giá tiêu dùng (nguồn dữ liệu: Tổng cục thống kê; đơn
vị tính 1/10.000) .............................................................................................. 35
Bảng 5 – Giá trị xuất khẩu của Việt nam (nguồn: tổng cục thống kê; đơn vị:
triệu USD) ....................................................................................................... 44
Bảng 6 - Một số kết quả so sánh dự báo giữa mô hình HW & ARIMA ........ 53
Bảng 7 - Một số đánh giá, nhận xét giữa mô hình HW & ARIMA ................ 54
- vi -
Bảng từ ngữ, thuật ngữ viết tắt
Từ hoặc cụm từ
Từ viết
Từ tiếng Anh
tắt
Hàm tự tương quan
ACF
AutoCorrelation Function
Kiểm định DF
ADF
Argumented Dickey-Fuller
Tiêu
chuẩn
thông
tin AIC/SIC
AIC/SIC
Akaike
Information
Criteria,
Schwarz Information Criteria
Sai số phần trăm tuyệt đối
APE
Absolute Percent Error
Tự hồi qui
AR
AutoRegression
Tích hợp trung bình trượt tự ARIMA
AutoRegressive
hồi qui
Moving Average
Trung bình trượt tự hồi qui
ARMA
AutoRegressive
Integrated
Moving
Average
Kiểm định DW
DW
Durbin-Watson
Mô hình làm trơn hàm mũ HW
Exponential Smoothing (Holt-
Holt-Winters
Winters)
Phân phối đồng nhất độc lập
I.I.D
Independent
Distribution
Trung bình trượt
MA
Moving Average
Sai số tuyệt đối trung bình
MAE
Mean Absolute Error
Sai số bình phương trung MSE
bình
Mean Square Error
Identical
- vii -
Ước lượng bình phương nhỏ OLS
Ordinary Least Square
nhất
Hàm tự tương quan từng PACF
Partial
phần
Function
Tự hồi qui theo mùa vụ
SAR
AutoCorrelation
Seasonal AutoRegressive
Tích hợp trung bình trượt tự SARIMA
Seasonal
hồi qui theo mùa vụ
Integrated Moving Average
Trung bình trượt theo mùa SMA
Seasonal Moving Average
AutoRegressive
vụ
Tổng bình phương sai số
SSE
Sum of Square Error
Nhiễu trắng
WN
White Noise
-1-
Lời cảm ơn
Luận văn thạc sĩ chuyên ngành CNTT: “Dự báo chuỗi dữ liệu phụ
thuộc thời gian theo mùa vụ bằng mô hình Holt-Winters” được TS. Đỗ Văn
Thành công tác tại Trung tâm thông tin và dự báo Kinh tế - Xã hội Quốc gia Bộ kế hoạch và đầu tư, người đã tận tình hướng dẫn và giúp đỡ tác giả rất
nhiều trong quá trình thực hiện luận văn này, người đã mở ra cho tác giả
những cách tiếp cận mới của công nghệ thông tin vào trong đời sống thực tế.
Qua đây, tác giả xin gửi tới TS. Đỗ Văn Thành lời cảm ơn chân thành và sâu
sắc nhất.
Tác giả cũng xin bày tỏ lời cảm ơn tới các thầy TS. Hà Quang Thụy,
GS.TSKH. Phan Đình Diệu, PGS.TS. Trịnh Nhật Tiến, PGS.TS. Đoàn Văn
Ban, TS. Nguyễn Việt Hà, TS. Hoàng Xuân Huấn, PGS.TS. Nguyễn Ngọc
Bình, PGS TS. Đinh Mạnh Tường ... những người đã truyền cho tác giả nhiều
kiến thức và kinh nghiệm quý báu trong thời gian tác giả theo học cao học tại
Trường Đại học Công nghệ - Đại học Quốc gia Hà nội.
Tác giả cũng xin gửi lời cảm ơn chân thành đến một số cán bộ thuộc
Tổng cục Thống kê Việt nam, những người đã giúp đỡ nhiệt tình trong việc
cung cấp số liệu đầy đủ, trung thực phục vụ cho luận văn này.
Cuối cùng, tác giả xin gửi lời cảm ơn đến bạn Trần Văn Thái, người đã
giúp đỡ tác giả hoàn thành luận văn này đồng thời cũng xin gửi lời cám ơn tới
tất cả người thân trong gia đình, bạn bè trong quá trình học tập và công tác.
Tác giả
Tạ Mạnh Cường
-2-
Mở đầu
Vấn đề dự báo phát triển kinh tế - xã hội luôn là vấn đề quan tâm của
mọi quốc gia, nhất là đối với nước ta đang trong quá trình xây dựng nền kinh
tế thị trường trong bối cảnh toàn cầu hoá kinh tế phát triển ngày càng sâu,
rộng và cạnh tranh gay gắt. Trong nền kinh tế thị trường chức năng quản lý
nhà nước về kinh tế chủ yếu được thực hiện thông qua công cụ chính sách
phát triển kinh tế - xã hội. Kinh nghiệm của các nước có nền kinh tế thị
trường cho thấy để công cụ chính sách phát huy được hiệu quả điều rất quan
trong là phải thực hiện tốt công tác phân tích và dự báo phát triển kinh tế - xã
hội.
Với sự bùng nổ về thông tin và dữ liệu về kinh tế - xã hội, để dự báo
chính xác và kịp thời tình hình biến động của kinh tế - xã hội Việt Nam và thế
giới phục vụ công tác chỉ đạo, điều hành về kinh tế của Chính phủ thì việc
ứng dụng các phương tiện kỹ thuật và công nghệ của CNTT nhằm phát hiện
tri thức mới từ dữ liệu kinh tế - xã hội hiện tại và quá khứ là cách tiếp cận
đang được các nhà nghiên cứu và ứng dụng Việt Nam hết sức quan tâm. Luận
văn này nằm trong hướng nghiên cứu ứng dụng đó.
Như đã biết các dữ liệu phát triển kinh tế - xã hội là phụ thuộc thời
gian, được thu thập định kỳ theo tháng, quý, năm và có tính mùa vụ rất rõ.
Hiện đã có nhiều phương pháp dự báo kinh tế - xã hội khác nhau, mỗi phương
pháp thường phù hợp với một số vấn đề dự báo kinh tế - xã hội nhất định
trong một nền kinh tế cụ thể, bởi vậy việc nghiên cứu xác định phương pháp
dự báo hiệu quả, phù hợp với thực tiễn phát triển kinh tế - xã hội Việt nam là
vấn đề đòi hỏi phải được quan tâm nghiên cứu ứng dụng.
Trong phân tích và dự báo dữ liệu chuỗi thời gian về kinh tế - xã hội,
hiện có bốn mô hình đang được đặc biệt quan tâm, đó là mô hình hồi quy
-3-
chuỗi thời gian, mô hình tích hợp trung bình trượt tự hồi quy ARIMA, mô
hình tự hồi quy véc tơ VAR và mô hình làm trơn hàm mũ Holt-Winters. Cùng
với mô hình ARIMA, mô hình Holt-Winters cũng đang được xem là rất thích
hợp cho dự báo ngắn hạn một số vấn đề về kinh tế - xã hội từ dữ liệu chuỗi
thời gian có tính mùa vụ.
Luận văn ”Dự báo chuỗi dữ liệu phụ thuộc thời gian theo mùa vụ bằng
mô hình Holt-Winters” sẽ tập trung khảo cứu và ứng dụng mô hình làm trơn
hàm mũ Holt-Winters để dự báo biến động về chỉ số giá tiêu dùng và giá cả
một số mặt hàng theo tháng, tổng giá trị xuất khẩu của Việt nam theo tháng
trên những số liệu chính thống do Tổng cục Thống kê thu thập. Việc dự báo
những nội dung trên đã được thực hiện bằng việc ứng dụng mô hình ARIMA
đã được trình bầy trong một luận văn cao học, khoa CNTT - Đại học Công
nghệ thực hiện, trong luận văn này sẽ tập trung nghiên cứu làm rõ sự giống và
khác nhau của hai mô hình này, so sánh kết quả dự báo bằng việc ứng dụng cả
hai mô hình trên cùng tập dữ liệu thử nghiệm.
Luận văn gồm 3 chương nội dung, không kể phần mở đầu, phần kết
luận, phần phụ lục và tài liệu tham khảo.
Chương 1: Chuỗi thời gian và Phân tích chuỗi thời gian, sẽ giới thiệu
một cách tóm tắt những khái niệm chủ yếu liên quan đến chuỗi thời gian và
các bước tiến hành phân tích và dự báo chuỗi thời gian, giới thiệu một số mô
hình chuỗi thời gian đơn giản và một số kiểm định thống kê sử dụng cho phân
tích, dự báo dữ liệu chuỗi thời gian. Chi tiết của những khái niệm này có thể
được tham khảo trong phần phụ lục.
Chương 2: Mô hình làm trơn hàm mũ Holt-Winters. Nội dung chính
của chương là trình bày một cách có hệ thống mô hình làm trơn hàm mũ đơn,
mô hình làm trơn hàm mũ bậc hai và mô hình làm trơn hàm mũ bậc ba (HoltWinters) để dự báo dữ liệu chuỗi thời gian có tính chất xu thế và tính chất
-4-
mùa vụ. Việc lựa chọn mô hình làm trơn hàm mũ nào phụ thuộc vào tính chất
dữ liệu chuỗi thời gian cụ thể.
Chương 3: Ứng dụng mô hình Holt-Winters. Chương này tập trung
trình bày qui trình ứng dụng mô hình Holt-Winters theo mùa vụ để dự báo
một số chỉ số kinh tế vĩ mô quan trọng phản ánh mức độ tăng trưởng kinh tế
Việt nam như dự báo chỉ số giá tiêu dùng theo tháng (CPI), tổng giá trị hàng
hóa xuất khẩu của Việt nam theo tháng. Dữ liệu được sử dụng để dự báo là số
liệu thực tế của nền kinh tế do Tổng cục Thống kê công bố. Các kết quả dự
báo theo mô hình Holt-Winters sẽ được so sánh với các kết quả dự báo theo
mô hình ARIMA.
Phần kết luận: Tổng kết những công việc đã thực hiện và kết quả đạt
được trong luận văn này, đồng thời đề xuất một số hướng nghiên cứu tiếp
theo.
Phụ lục: Gồm hai phần, Phần 1 của phụ lục sẽ giới thiệu chi tiết hơn
một số khái niệm quan trọng liên quan đến chuỗi thời gian và phân tích, dự
báo dữ liệu chuỗi thời gian, Phần 2 của phụ lục sẽ giới thiệu mô hình ARIMA
cho mùa vụ.
-5-
Chương 1:
Chuỗi thời gian và phân tích dự báo chuỗi thời
gian
Phân tích, dự báo chuỗi thời gian có thể được chia làm hai loại: Phân
tích, dự báo theo mức thời gian và phân tích mối liên hệ nguyên nhân - kết
quả. Phương pháp dự báo theo mức thời gian liên quan đến việc dự báo các
giá trị tương lai của yếu tố được nghiên cứu dựa trên sự tương quan với các
quan sát trong quá khứ và hiện tại. Trong khi đó phân tích mối liên hệ nhân
quả liên quan đến việc xác định các nhân tố khác ảnh hưởng đến yếu tố muốn
dự báo, như dùng phương pháp phân tích hồi qui bội xem xét GDP phụ thuộc
vào lượng đầu tư trong nước, lượng đầu tư nước ngoài, dân số…
Luận văn này chỉ tập trung vào phân tích, dự báo theo mức thời gian
dựa trên giả định cơ bản là các yếu tố ảnh hưởng đến biến động của hiện
tượng trong quá khứ và hiện tại sẽ còn tiếp tục tồn tại trong tương lai.
Chương này sẽ trình bày sơ lược một số vấn đề chủ yếu liên quan đến
chuỗi thời gian bao gồm khái niệm, dự báo cho chuỗi thời gian và các đại
lượng đặc trưng của nó, tiếp đó trình bày về các mô hình chuỗi thời gian đơn
giản, đưa ra một số phương pháp kiểm định thống kê cho mô hình chuỗi thời
gian. Chi tiết xin tham khảo ở phần Phụ lục.
1. Chuỗi thời gian và dự báo chuỗi thời gian
1.1. Định nghĩa chuỗi thời gian
Chuỗi dữ liệu phụ thuộc thời gian được chia làm hai loại:
- Chuỗi dữ liệu phụ thuộc thời gian được quan sát, đo đạc trong khoảng
thời gian rời rạc: Các quan sát được thực hiện tại các thời điểm tách
-6-
biệt, chúng thường là các quan sát được đo tại các mốc thời gian cách
đều nhau, ví dụ chuỗi thời gian được đo theo tuần, quý, tháng, năm, ….
- Chuỗi dữ liệu liên tục theo thời gian: Các quan sát được đo trong
khoảng thời gian liên tục, ví dụ chuỗi dữ liệu đo nhiệt độ trong ngày
(nhiệt kế).
Luận văn này tập trung vào chuỗi dữ liệu phụ thuộc thời gian được đo
trong khoảng thời gian rời rạc và cách đều nhau, gọi là chuỗi thời gian (series
time data)
Như vậy: Chuỗi thời gian là một tập giá trị các quan sát của biến ngẫu
nhiên, ký hiệu là {zt } , t 1,...,n là số các quan sát, đo được trong các khoảng
thời gian t như nhau (hàng năm, quý, tháng, tuần, ngày …) và được xếp theo
thứ tự thời gian.
Ví dụ:
- Chuỗi giá trị tổng sản phẩm quốc nội (GDP) được đo theo từng quý.
- Chuỗi giá trị đo lượng mưa trung bình hàng năm.
- Chuỗi giá trị chỉ số thị trường chứng khoán đo theo ngày.
- Chuỗi giá trị đo sản lượng điện năng tiêu thụ của Việt Nam đo theo
từng tháng, từng quí trong nhiều năm.
- Chuỗi giá trị về chỉ số giá tiêu dùng của Việt Nam theo từng tháng, quý
trong năm.
1.2. Dự báo chuỗi thời gian
Dự báo chuỗi thời gian là ước lượng các giá trị của biến ngẫu nhiên
chuỗi thời gian zt h (h 1) , ký hiệu là zˆt ( h) , dựa trên sự tương quan với các
giá trị của biến ngẫu nhiên {zt } đã được quan sát trong quá khứ.
Chất lượng của dự báo phụ thuộc vào nhiều yếu tố chẳng hạn sự phức
tạp của chuỗi thời gian khi thực hiện phân tích, tác động của nhiều yếu tố bất
-7-
thường không thể lường trước được khi tiến hành dự báo, ngoài ra độ chính
xác cũng còn phụ thuộc phần lớn vào khoảng cách xa gần của dự báo (dự báo
gần thì cho độ chính xác của dự báo tốt hơn so với dự báo xa).
2. Đại lượng đặc trưng chuỗi thời gian
Giả sử có chuỗi thời gian {zt } gồm n các quan sát, t 1,...,n .
2.1. Các đại lượng thống kê đặc trưng cho chuỗi thời
gian
Kỳ vọng: Đại diện cho giá trị trung tâm trong chuỗi:
E ( zt )
(1.1)
Kỳ vọng của tổng thể được tính dựa trên mẫu các quan sát gọi là kỳ vọng
mẫu, như sau:
1 n
z zt
n t 1
(1.2)
Phương sai: Đại diện cho mức độ phân tán các giá trị trong chuỗi xung
quanh kỳ vọng của nó:
var (zt ) σ z2 E[(zt μ)2 ]
(1.3)
Tương tự, phương sai mẫu được tính:
ˆ z2
1 n
( zt z ) 2
n t 1
(1.4)
Độ lệch chuẩn: là căn bậc hai của phương sai mẫu:
ˆ z ˆ z2
(1.5)
-8-
2.2. Các đại lượng mô tả mối quan hệ giữa các phần tử
trong chuỗi
Tự hiệp phương sai: Tự hiệp phương sai giữa hai z t và z t k , giữa
chúng có k 1 quan sát gọi là k độ trễ, được xác định như sau:
z (k ) cov zt , zt k E ( zt )( zt k )
(1.6)
Trong đó, là kỳ vọng chung của z t và z t k . Tự hiệp phương sai khi
độ trễ k 0 chính là phương sai của z t : z (0) covzt , zt z2 .
Tương tự, tự hiệp phương sai mẫu được tính:
1 nk
ˆ z (k ) ( zt z )( zt k z ) , k 1,...,n 1
n t 1
(1.7)
Trong đó, z là kỳ vọng mẫu của z t và z t k .
Hàm tự tương quan (ACF): Mô tả tương quan tại trễ k giữa các giá
trị trong chuỗi thời gian, được xác định:
k
cov( zt , zt k )
zt zt k
E( zt )( zt k )
z (k )
zt zt k
E ( zt ) 2 E ( zt k ) 2
(1.8)
Trong đó, z (k ) là tự hiệp phương sai, zt , zt k lần lượt là độ lệch
chuẩn của z t và z t k .
Tự tương quan mẫu được tính theo công thức:
ˆ k
ˆ z (k )
ˆ z (0)
(1.9)
Nếu như z t và z t k không tương quan với nhau thì tự tương quan
ˆ k 0 , do khi đó cov( zt , zt k ) 0 . Nhưng điều ngược lại chưa hẳn đã đúng.
Hàm tự tương quan từng phần (PACF): Tự tương quan giữa hai biến
z t và z t k gồm k 1 biến trung gian z t 1 , z t 2 , … , zt k 1 :
-9-
k 1
kk
k k 1, j k j
j 1
k 1
1 k 1, j j
, độ trễ k 2,3,...
(1.10)
j 1
kj k 1, j kk k 1,k j , j 1,2,...,k 1
(1.11)
Giá trị ban đầu, 11 1
Bằng tính toán tương tự trên các quan sát mẫu có được tự tương quan
từng phần mẫu ˆkk . Khảo sát tự tương quan từng phần như một hàm với tham
số biến thiên theo độ trễ k được gọi là hàm tự tương quan từng phần.
Hệ số R2: Được sử dụng để đo độ thích hợp của mô hình ước lượng.
Giả sử cho mô hình hồi qui chuỗi thời gian y t 1 2 z t at . Hệ số R 2
được tính:
n
R2
( ( z i z )( y i y )) 2
i 1
n
n
( zi z ) ( yi y )
i 1
2
(1.12)
2
i 1
Trong đó, n là số các quan sát, z là kỳ vọng mẫu của biến độc lập z t , y là
kỳ vọng mẫu của biến phụ thuộc y t . Dễ dàng thấy 0 R 2 1 nếu R 2 tiến
đến 1 thì mô hình hồi qui được lựa chọn là hợp lý, ngược lại nếu R 2 tiến về 0
thì mô hình được lựa chọn là chưa hợp lý.
Hệ số điều chỉnh R 2 : Đôi khi hệ số R 2 không phản ánh trung thực
mức độ hợp lý của mô hình, chẳng hạn khi thêm các tham biến được cho là
không hợp lý vào mô hình thì R 2 không những không giảm mà ngược lại còn
tăng lên. Vì thế hệ số điều chỉnh R 2 được xem xét để thẩm định rõ sự phù
hợp của mô hình:
- 10 -
R 2 1 (1 R 2 )
n 1
nk
(1.13)
ở đây n là số các quan sát của chuỗi thời gian, k là số các tham biến trong
mô hình. R 2 luôn nhỏ hơn R 2 , và giảm nếu bổ sung thêm biến hồi qui không
hợp lý vào mô hình.
3. Phân tích, dự báo chuỗi thời gian
Quá trình phân tích, dự báo chuỗi thời gian {zt } là để tìm ra các mô
hình, luật ẩn trong nó, việc này được thực hiện trên các quan sát mẫu, gồm có
những bước sau:
Bước 1: Nhận dạng các thành phần ẩn tồn tại trong chuỗi thời gian [4]
- Thành phần xu thế (Trend - T): Thể hiện chiều hướng biến động tăng
hoặc giảm của các hiện tượng nghiên cứu trong thời gian dài.
- Thành phần chu kỳ (Period - P): Thể hiện biến động của hiện tượng
được lặp lại với chu kỳ nhất định, thường kéo dài từ 2 đến 10 năm.
- Thành phần mùa vụ (Seasonal - S): Biểu hiện sự tăng hoặc giảm mức
độ của hiện tượng ở một số thời điểm (tháng, quý, năm) nào đó được
lặp đi lặp lại qua nhiều năm.
- Thành phần ngẫu nhiên (Irregular - I): Thể hiện những biến động không
có qui luật và hầu như không dự báo hoặc quan sát được trong của hiện
tượng đang nghiên cứu.
Những thành phần này kết hợp với nhau trong chuỗi thời gian bằng
nhiều cách thức khác nhau, chẳng hạn chuỗi thời gian z t được mô tả là tích
các thành phần, zt T P S I gọi là mô hình tích, hoặc zt T P S I
gọi là mô hình tổng, hoặc kết hợp cả hai zt T P S I . Do vậy, để phân
tích và nghiên cứu hành vi cũng như dự báo biến động của chuỗi thời gian thì
- 11 -
cần thiết phải ước lượng được các thành phần nói trên trong chuỗi thời gian
và cách thức kết hợp chúng với nhau trong chuỗi.
Bước 2: Làm trơn số liệu
Tuỳ theo mô hình dự báo áp dụng mà cần thiết tiến hành bước làm trơn
số liệu hay không ?. Trong trường hợp mô hình dự báo áp dụng cần quá trình
làm trơn số liệu ta tiến hành loại trừ được thành phần xu thế và mùa vụ trong
chuỗi thời gian. Chuỗi thu được sau cùng không còn chứa các thành phần đó
(chuỗi được làm trơn) sẽ khiến cho việc phân tích dễ dàng hơn.
Bước 3: Chọn lựa, ước lượng và đánh giá mô hình
Chọn lựa mô hình trong lớp các mô hình, sao cho mô hình được lựa
chọn là “tốt nhất” trong số các mô hình ứng cử và nó cũng phải đơn giản và
có thể hiểu được dễ dàng. Sau đó thực hiện ước lượng các tham số, phần dư
cho mô hình vừa chọn lựa và chúng phải thỏa mãn các tiêu chí kiểm định,
đánh giá. Mô hình ước lượng được đánh giá là hợp lý khi đó sẽ sinh ra chuỗi
“gần giống” với chuỗi dữ liệu quan sát thực.
Bước 4: Dự báo
Dựa trên mô hình thực hiện dự báo giá trị tương lai cho chuỗi thời gian,
phân tích sự phù hợp của giá trị dự báo cả về mặt thực nghiệm và lý thuyết.
Xác định độ chệch giữa giá trị dự báo với giá trị quan sát thực và khoảng tin
cậy của dự báo tức là giới hạn mà giá trị quan sát thực sẽ nằm trong.
Ứng dụng kết quả dự báo vào thực tế
Trên cơ sở các dự báo về các giá trị tương lai của hiện tượng nghiên
cứu đề ra các quyết định kinh doanh hoặc chính sách. Đồng thời gộp thêm các
giá trị quan sát mới vào chuỗi dữ liệu quan sát nhằm mục đích hiệu chỉnh lại
mô hình để đưa ra dự báo tốt hơn.
- Xem thêm -