i
BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI 2
BÙI VĂN BẰNG
CHUỖI THỜI GIAN KHÔNG DỪNG VÀ ỨNG DỤNG
TRONG PHÂN TÍCH DỰ VÀ BÁO KINH TẾ
Chuyên ngành: Toán ứng dụng
Mã số: 60 46 01 12
LUẬN VĂN THẠC SĨ TOÁN HỌC
Người hướng dẫn khoa học: PGS. TS Trần Trọng Nguyên
HÀ NỘI, 2016
ii
LỜI CẢM ƠN
Luận văn được hoàn thành dưới sự hướng dẫn của PGS.TS Trần Trọng
Nguyên.
Tác giả xin bày tỏ lòng biết ơn sâu sắc nhất tới PGS.TS Trần Trọng
Nguyên người đã định hướng chọn đề tài và tận tình hướng dẫn để tác giả hoàn
thành luận văn này.
Tác giả cũng xin bày tỏ lòng biết ơn chân thành tới Phòng Sau đại học,
các thầy cô giáo dạy cao học trường Đại học Sư phạm Hà Nội 2 đã giúp đỡ tác
giả trong suốt quá trình học tập và hoàn thành luận văn tốt nghiệp.
Tác giả xin được gửi lời cảm ơn đến gia đình, bạn bè đã luôn ủng hộ,
quan tâm để tác giả có thể hoàn thành luận văn.
Hà Nội, tháng 6 năm 2016
TÁC GIẢ
Bùi Văn Bằng
iii
LỜI CAM ĐOAN
Được sự hướng dẫn của PGS.TS Trần Trọng Nguyên, luận văn Thạc sĩ
chuyên ngành Toán ứng dụng với đề tài “Chuỗi thời gian không dừng và ứng
dụng trong phân tích và dự báo kinh tế” được hoàn thành bởi sự nhận thức của
bản thân, số liệu và kết quả nghiên cứu trong luận văn này là trung thực không
trùng với bất kỳ luận văn nào khác.
Tôi cũng xin cam đoan rằng mọi sự giúp đỡ cho việc thực hiện luận văn
này đã được cảm ơn và các thông tin trích dẫn trong luận văn đã được chỉ rõ
nguồn gốc.
TÁC GIẢ
Bùi Văn Bằng
iv
MỤC LỤC
MỞ ĐẦU .............................................................................................................. 1
1. Lý do chọn đề tài ............................................................................................... 1
2. Mục đích nghiên cứu ......................................................................................... 2
3. Nhiệm vụ nghiên cứu ........................................................................................ 2
4. Đối tượng và phạm vi nghiên cứu ..................................................................... 2
5. Phương pháp và công cụ nghiên cứu ................................................................ 2
6. Kết cấu của luận văn ......................................................................................... 3
7. Đóng góp mới của luận văn .............................................................................. 3
CHƯƠNG I: KIẾN THỨC CHUẨN BỊ............................................................ 4
1.1. Quá trình ngẫu nhiên ...................................................................................... 4
1.2. Chuỗi thời gian ............................................................................................... 5
1.3. Kỳ vọng của biến ngẫu nhiên ......................................................................... 5
1.4. Sai phân của chuỗi thời gian .......................................................................... 6
1.5. Toán tử dịch chuyển lùi.................................................................................. 7
1.6. Hiệp phương sai ............................................................................................. 8
1.7. Hàm tự tương quan....................................................................................... 10
CHƯƠNG 2: CHUỖI THỜI GIAN KHÔNG DỪNG VÀ MÔ HÌNH
TRUNG BÌNH TRƯỢT TÍCH HỢP TỰ HỒI QUY ..................................... 18
2.1. Chuỗi thời gian không dừng......................................................................... 18
2.2. Một số quá trình ngẫu nhiên giản đơn ......................................................... 19
2.2.1. Nhiễu trắng ............................................................................................ 19
2.2.2. Bước ngẫu nhiên ................................................................................... 20
2.2.3. Quá trình trung bình trượt (MA) ........................................................... 22
2.2.3.1. Quá trình trung bình trượt bậc nhất – MA(1) ................................ 22
2.2.3.2. Quá trình trung bình trượt bậc q – MA(q) ..................................... 23
2.2.3.3. Quá trình trung bình trượt vô hạn– MA() ................................... 23
2.2.4. Quá trình tự hồi quy (AR) ..................................................................... 24
2.2.4.1. Quá trình tự hồi quy bậc 1 - AR(1) không có hệ số chặn .............. 24
v
2.2.4.2. Quá trình AR(1) có hệ số chặn....................................................... 26
2.2.4.3. Quá trình tự hồi quy bậc p.............................................................. 28
2.3. Nhận biết tính dừng của chuỗi thời gian. ..................................................... 30
2.3.1. Nhận biết qua đồ thị .............................................................................. 30
2.3.2. Nhận biết qua biểu đồ tự tương quan .................................................... 32
2.3.3. Kiểm định nghiệm đơn vị...................................................................... 35
2.3.3.1. Kiểm định Dickey- Fuller .............................................................. 35
2.3.3.2. Kiểm định Philips và Perron .......................................................... 41
2.4. Một số vấn đề về chuỗi thời gian không dừng ............................................. 43
2.4.1. Hậu quả khi ước lượng mô hình chuỗi thời gian không dừng .............. 43
2.4.2. Hồi quy giả mạo .................................................................................... 44
2.4.3. Chuỗi dừng xu thế và dừng sai phân..................................................... 49
2.4.4. Đồng tích hợp ........................................................................................ 49
2.4.4.1. Khái niệm đồng tích hợp ................................................................ 49
2.4.4.2. Kiểm định hồi quy đồng tích hợp .................................................. 50
2.5. Loại bỏ tính không dừng trong chuỗi thời gian. .......................................... 52
2.6. Mô hình trung bình trượt tích hợp tự hồi quy ARIMA ................................ 54
2.6.1. Cách xây dựng mô hình ARIMA cho dữ liệu chuỗi thời gian.............. 54
2.6.1.1. Mô hình tự hồi quy bậc 1 ............................................................... 54
2.6.1.2. Mô hình trung bình trượt bậc 1 ...................................................... 55
2.6.1.3. Các mô hình tự hồi quy bậc cao ..................................................... 55
2.6.1.4. Mô hình trung bình trượt bậc cao .................................................. 56
2.6.1.5. Mô hình trung bình trượt và tự hồi quy ARMA ............................ 57
2.6.1.6. Mô hình trung bình trượt, tích hợp, tự hồi quy ARIMA................ 58
2.6.1.7. Mô hình ARIMA có yếu tố mùa vụ ............................................... 59
2.6.2. Phương pháp Box-Jenkins .................................................................... 60
2.6.2.1. Định dạng mô hình - xác định các tham số d, p, q......................... 60
2.6.2.2. Ước lượng mô hình ........................................................................ 63
2.6.2.3. Kiểm định tính thích hợp của mô hình........................................... 65
2.6.2.4. Dự báo và sai số dự báo ................................................................. 65
vi
CHƯƠNG 3: ỨNG DỤNG CHUỖI THỜI GIAN KHÔNG DỪNG TRONG
PHÂN TÍCH VÀ DỰ BÁO KINH TẾ............................................................. 67
3.1. Phân tích và dự báo kinh tế dựa vào dữ liệu chuỗi thời gian ....................... 67
3.2. Ứng dụng mô hình ARIMA trong phân tích và dự báo ............................... 71
3.2.1. Xác định vấn đề, thu thập dữ liệu. ........................................................ 71
3.2.2. Phân tích sơ bộ ...................................................................................... 71
3.2.3. Lựa chọn và ước lượng mô hình ........................................................... 72
3.2.4. Đánh giá mô hình .................................................................................. 79
3.2.5. Thực hiện phân tích và dự báo .............................................................. 81
3.2.6. Trình bày kết quả phân tích và dự báo .................................................. 84
3.2.7. Theo dõi kết quả dự báo, cập nhật và đánh giá lại mô hình ................. 84
3.3. Ưu nhược điểm của phương pháp dự báo bằng mô hình ARIMA .............. 84
3.3.1. Ưu điểm ................................................................................................. 84
3.3.2. Nhược điểm ........................................................................................... 85
KẾT LUẬN ........................................................................................................ 86
TÀI LIỆU KHAM KHẢO ................................................................................ 87
PHỤ LỤC ........................................................................................................... 88
vii
DANH MỤC BẢNG, BIỂU
Bảng 1.1: CPI của Việt Nam và các chuỗi sai phân ............................................. 7
Bảng 2.1: Kiểm định ADF cho chuỗi GDP ước lượng theo mô hình 1.............. 39
Bảng 2.2: Kiểm định ADF cho chuỗi GDP ước lượng theo mô hình 2.............. 39
Bảng 2.3: Kiểm định ADF cho chuỗi GDP ước lượng theo mô hình 3.............. 40
Bảng 2.4: Kiểm định ADF cho sai phân bậc nhất của chuỗi GDP. .................... 41
Bảng 2.5: Kiểm định Phillips và Perron cho chuỗi GDP. ................................... 42
Bảng 2.6: Kết quả hồi quy LC theo LY .............................................................. 45
Bảng 2.7: Kiểm định nghiệm đơn vị với chuỗi LC............................................. 47
Bảng 2.8: Kiểm định nghiệm đơn vị với chuỗi LY. ........................................... 47
Bảng 2.9: Kiểm định nghiệm đơn vị với chuỗi LY khi thêm biến xu thế. ......... 48
Bảng 2.10: Kiểm định nghiệm đơn vị với phần dư sau khi hồi quy. .................. 50
Bảng 2.11: Kết quả hồi quy LC, LY theo phương trình. .................................... 51
Bảng 2.12: Kiểm định nghiệm đơn vị với chuỗi D(S_LOGGDP)...................... 53
Bảng 2.13: Đặc tính đồ thị của các mô hình AR, MA. ....................................... 57
Bảng 2.14: Bậc p, q của ARIMA ........................................................................ 61
Bảng 2.15: Ước lượng các tham số. .................................................................... 65
Bảng 3.1: Kiểm định nghiệm đơn vị về tính dừng của chuỗi S_LOGGDP........ 73
Bảng 3.2: Kiểm định nghiệm đơn vị về tính dừng của chuỗi sai phân bậc 1. .... 76
Bảng 3.3: Kiểm định nghiệm đơn vị về tính dừng của chuỗi sai phân bậc 2. .... 77
Bảng 3.4: Kết quả ước lượng mô hình theo ARIMA theo EQ01. ...................... 78
Bảng 3.5: Kết quả ước lượng mô hình theo ARIMA theo EQ02. ...................... 80
Bảng 3.6: Kết quả ước lượng mô hình theo ARIMA theo EQ03. ...................... 80
Bảng 3.7: So sánh các mô hình. .......................................................................... 81
Bảng 3.8: Kết quả dự báo GDP quý I năm 2013. ............................................... 84
viii
DANH MỤC HÌNH
Hình 1.1: Lược đồ SACF và SPACF của chuỗi CPI. ......................................... 14
Hình 1.2: Biểu đồ hệ số tự tương quan và tự tương quan riêng.......................... 14
Hình 1.3: Biểu đồ hàm tự tương quan của chuỗi kim ngạch xuất khẩu.............. 15
Hình 1.4: Biểu đồ hàm tự tương quan của chuỗi CPI theo quý. ......................... 16
Hình 2.1: Đồ thị của chuỗi thời gian dừng, không dừng .................................... 19
Hình 2.2: Đồ thị sai phân bậc 2 của chuỗi CPI theo quý. ................................... 30
Hình 2.3: Đồ thị sai phân bậc 2 của chuỗi CPI theo tháng. ................................ 31
Hình 2.4: Đồ thị kim ngạch xuất khẩu hàng hóa của Việt Nam. ........................ 32
Hình 2.5: Biểu đồ hàm tự tương quan của một chuỗi không dừng..................... 33
Hình 2.6: Biểu đồ hàm tự tương quan của chuỗi kim ngạch xuất khẩu VN ....... 33
Hình 2.7: Biểu đồ hàm tự tương quan của chuỗi GDP theo quý Việt Nam ....... 34
Hình 2.8: Biểu đồ hàm tự tương quan chuỗi KNXK sau khi lấy sai phân ......... 35
Hình 2.9: Biểu đồ GDP của Mỹ từ quý I năm 1970 đến quý IV năm 1980 ....... 38
Hình 2.10: Đồ thị biến LC, LY ........................................................................... 46
Hình 3.1: Đồ thị chuỗi GDP của Việt Nam theo quý từ năm 1990 đến 2012. ... 71
Hình 3.2: Đồ thị chuỗi LOGGDP. ...................................................................... 72
Hình 3.3: Đồ thị chuỗi S_LOGGDP ................................................................... 73
Hình 3.4: Biểu đồ hàm tự tương quan của chuỗi S_LOGGDP........................... 74
Hình 3.5: Biểu đồ hàm tự tương quan sai phân bậc 1 chuỗi S_LOGGDP. ........ 75
Hình 3.6: Biểu đồ hàm tự tương quan sai phân bậc 2 chuỗi S_LOGGDP. ........ 77
Hình 3.7: Biểu đồ hàm tự tương quan của phần dư. ........................................... 79
Hình 3.8: Giá trị thực và dải biến động của giá trị dự báo.................................. 81
Hình 3.9: Đồ thị sai số dự báo của chuỗi LOGGDP. .......................................... 82
Hình 3.10: Đồ thị sai số dự báo của chuỗi GDP. ................................................ 83
Hình 3.11: Giá trị thực tế và giá trị dự báo của chuỗi GDP................................ 83
ix
DANH MỤC CHỮ VIẾT TẮT
TT
Từ viết tắt
1
AIC
2
3
ACF
ADF
4
ARIMA
5
BIC
6
7
8
9
CPI
GDP
PACF
SACF
Tiếng Anh
Tiếng Việt
Tiêu chuẩn thông tin
Akaike
Autocorrelation function
Hàm tự tương quan
Augumented Dickey- Fuller
Dickey- Fuller mở rộng
Autoregressive interrated
Trung bình trượt tích hợp
moving average
tự hồi quy
Tiêu chuẩn thông tin
Bayesian information criterion
Bayesian
Consumer price index
Chỉ số giá tiêu dùng
Gross domestic product
Tổng sản phẩm quốc nội
Partial autocorrelation function Hàm tự tương quan riêng
Sample autocorrelation function Hàm tự tương quan mẫu
Akaike information criterion
1
MỞ ĐẦU
1. Lý do chọn đề tài
Việt Nam đã và đang thiết lập nền kinh tế thị trường định hướng XHCN.
Cơ chế quản lý kinh tế, tài chính đã và đang đổi mới sâu sắc, toàn diện với mục
tiêu tăng trưởng với tốc độ cao, bền vững, xây dựng đất nước giàu mạnh. Chính
sách kinh tế phải được hoạch định phù hợp với điều kiện cụ thể của Việt Nam.
Để có được những chính sách kinh tế năng động, hợp lý, có hiệu quả, dự báo
kinh tế là một trong những công cụ hữu ích làm cơ sở khoa học có căn cứ để đưa
ra các quyết định và xây dựng các chính sách phù hợp.
Ngày nay cùng với sự phát triển của khoa học công nghệ, có nhiều
phương pháp dự báo định lượng, trong đó có phương pháp sử dụng các quá trình
ngẫu nhiên đặc biệt là các mô hình chuỗi thời gian. Các dữ liệu về chuỗi thời
gian đã và đang được sử dụng một cách thường xuyên, hiệu quả và đáng tin cậy
như một công cụ hữu hiệu để phân tích kinh tế, xã hội cũng như trong nghiên
cứu khoa học.
Có nhiều phương pháp dự báo kinh tế dựa vào dữ liệu chuỗi thời gian
như: Mô hình hồi quy đơn phương trình; mô hình hồi quy phương trình đồng
thời; mô hình tự hồi quy véc tơ (VAR); mô hình trung bình trượt tích hợp tự hồi
quy ARIMA.
Phân tích hồi quy dựa trên các dữ liệu chuỗi thời gian thường ngầm giả
định rằng chuỗi thời gian đối tượng phải là dừng, nếu không các phương pháp
kiểm định trở nên không đáng tin cậy. Nhưng trong thực tế các mô hình kinh tế
vĩ mô thì chuỗi thời gian thường lại không dừng.
Việc phát triển ứng dụng chuỗi dừng, chuỗi không dừng trong nghiên
cứu, phân tích và dự báo kinh tế là một trong các phát triển đột phá của kinh tế
học hiện đại vào cuối thế kỷ 20. Nhiều nghiên cứu, nhiều tác giả đều khởi nguồn
khi nghiên cứu các chuỗi không dừng trong kinh tế.
2
Được sự gợi ý của thầy hướng dẫn và nhận thấy tính thiết thực của vấn đề,
em đã chọn đề tài “Chuỗi thời gian không dừng và ứng dụng trong phân tích
và dự báo kinh tế” để làm nội dung cho luận văn.
2. Mục đích nghiên cứu
Tìm hiểu về lý thuyết chuỗi thời gian dừng, không dừng.
Tìm hiểu phương pháp dự báo dựa vào dữ liệu chuỗi thời gian.
Ứng dụng phân tích và dự báo một số chuỗi thời gian không dừng trong
kinh tế.
3. Nhiệm vụ nghiên cứu
Nghiên cứu về tính dừng, không dừng của chuỗi thời gian.
Nghiên cứu các phương pháp kiểm định tính dừng của chuỗi thời gian.
Nghiên cứu cách loại bỏ tính không dừng của dữ liệu chuỗi thời gian.
Nghiên cứu các phương pháp dự báo dựa vào dữ liệu chuỗi thời gian
trong đó tập trung vào mô hình trung bình trượt tích hợp tự hồi quy.
Ứng dụng phân tích và dự báo một số chuỗi thời gian không dừng trong
kinh tế.
4. Đối tượng và phạm vi nghiên cứu
Các chuỗi thời gian dừng và không dừng.
Tập trung vào các chuỗi thời gian trong kinh tế.
5. Phương pháp và công cụ nghiên cứu
* Phương pháp nghiên cứu:
Phương pháp tiếp cận hệ thống: Phương pháp thống kê toán.
Phương pháp thực nghiệm: Nghiên cứu các dữ liệu thực nghiệm theo thời
gian, phân tích nhận diện vấn đề, sử dụng dữ liệu lịch sử để kiểm định các
mô hình.
3
Phương pháp phân tích tổng hợp: Nghiên cứu dữ liệu, phân tích tổng hợp
các quan điểm, qua đó chỉ ra sự vượt trội, giới hạn của từng phương pháp.
Phương pháp mô hình hóa: Xác định, ước lượng và kiểm định các mô
hình.
* Công cụ nghiên cứu: Luận văn sử dụng các phần mềm Eviews, Excel để
nhận dạng, ước lượng và kiểm định các tham số trong các mô hình cũng như độ
phù hợp của mô hình.
6. Kết cấu của luận văn
Ngoài phần mở đầu và kết luận, danh mục tài liệu tham khảo,..., nội dung
của luận văn được chia thành 3 chương sau:
Chương 1. Kiến thức chuẩn bị.
Chương 2. Chuỗi thời gian không dừng và mô hình trung bình trượt tích
hợp tự hồi quy.
Chương 3. Ứng dụng chuỗi thời gian không dừng trong phân tích và dự
báo kinh tế.
7. Đóng góp mới của luận văn
Đưa ra mô hình dự báo tối ưu và có ý nghĩa thực tiễn.
4
CHƯƠNG I: KIẾN THỨC CHUẨN BỊ
Trong chương này giới thiệu một số kiến thức về kỳ vọng; phương sai và
hiệp phương sai; sai phân của chuỗi thời gian; toán tử dịch chuyển lùi; hàm tự
tương quan. Đây là kiến thức cơ bản để nghiên cứu chuỗi thời gian không dừng.
1.1. Quá trình ngẫu nhiên
Giả sử ta nghiên cứu sự tiến triển của một hệ vật chất nào đó theo thời
gian. Gọi Yt là vị trí (tình trạng) của hệ tại thời điểm t, Yt chính là một biến ngẫu
nhiên mô tả vị trí (tình trạng) của hệ thống. Quá trình Yt t 0 được gọi là một
quá trình ngẫu nhiên.
Tập hợp các vị trí (tình trạng) có thể của hệ là không gian trạng thái.
Định nghĩa 1.1: Họ Yt , t T các biến ngẫu nhiên nhận giá trị trên I được gọi là
một quá trình ngẫu nhiên với tập chỉ số T và không gian trạng thái I.
Giả sử T là một tập vô hạn nào đó. Nếu với mỗi t T , Yt là biến ngẫu
nhiên thì ta ký hiệu Y Yt , t T và gọi Y là hàm ngẫu nhiên (với tham biến
t T ).
Nếu T là tập đếm được thì ta gọi Y Yt , t T là quá trình ngẫu nhiên
với tham số rời rạc.
Nếu T là một khoảng của đường thẳng thực, tức là T thuộc một trong các
tập
sau:
, ;a, ; , b;a, b ; a, b; a, b; a, b
thì
ta
gọi
Y Yt , t T là quá trình ngẫu nhiên với tham số liên tục. Tham số t
đóng vai trò thời gian.
Như vậy họ các biến ngẫu nhiên Y1, Y2,... trong đó các chỉ số là các thời
điểm kế tiếp nhau. Nói chung mỗi biến có một quy luật phân phối xác suất riêng.
Y1, Y2, …, được gọi là một quá trình ngẫu nhiên.
5
1.2. Chuỗi thời gian
Khái niệm 1.1: Chuỗi thời gian là một chuỗi số liệu được thu thập trong
một thời kì hoặc một khoảng thời gian lặp lại như nhau trên cùng một đối tượng,
một không gian một địa điểm.
Với số liệu chuỗi thời gian ta thường sử dụng chỉ số t để chỉ thứ tự của
các quan sát, chẳng hạn Xt, Yt,…, trong đó t = 1, 2, …, n. Chuỗi thời gian có thể
được thu thập theo đơn vị thời gian là năm, tháng, ngày hay chi tiết hơn như giờ,
phút, ….
Mặc dù chuỗi thời gian chỉ là một phép thử của một quá trình ngẫu nhiên,
nhưng chúng cũng được gọi là quá trình ngẫu nhiên, ký hiệu là:
Yt với t = 1,2,....
Đặc trưng của chuỗi thời gian là: tính xu hướng, tính mùa vụ, tính ngẫu
nhiên và tính tương quan.
1.3. Kỳ vọng của biến ngẫu nhiên
* Kỳ vọng của biến ngẫu nhiên
Kỳ vọng của biến ngẫu nhiên rời rạc Yt thường được kí hiệu là E(Yt ) .
n
E(Yt ) yi pi .
(1.3.1)
i 1
Khi Yt là biến ngẫu nhiên liên tục với hàm mật độ f y (y t ) thì:
t
E(Yt )
yf
t yt
(y t )dy t .
(1.3.2)
E(Yt ) có thể tính được bằng giới hạn theo xác suất của trung bình chung:
1 I
E(Yt ) p lim i 1 y (i)
.
t
I I
Kỳ vọng là trung bình theo nghĩa xác suất của biến ngẫu nhiên.
(1.3.3)
6
Kỳ vọng toán phản ánh giá trị trung tâm của phân phối xác suất theo biến
ngẫu nhiên.
Một số tính chất:
E ; const .
(1.3.4)
E X .E X ; const .
(1.3.5)
Với X, Y là 2 biến ngẫu nhiên thì: E X Y E X E Y .
(1.3.6)
Với X, Y là 2 biến ngẫu nhiên độc lập thì: E X.Y E X .E Y . (1.3.7)
Ví dụ 1.1: Ta xét một số quá trình sau đây.
Nếu Yt Yt 1 u t , với E u t 0 thì E Yt E Yt 1 E u t E Yt 1 .
Nếu Yt u t , với E u t 0 thì E Yt E u t E E u t .
Nếu Yt t u t , E u t 0 thì E Yt E t u t E t E u t t .
* Kỳ vọng có điều kiện:
Kỳ vọng điều kiện của X cho bởi Y, với X, Y là các biến ngẫu nhiên bất
kỳ:
E X Y y E X Y y x.P X x Y y .
(1.3.8)
x
1.4. Sai phân của chuỗi thời gian
Sai phân bậc nhất của chuỗi Yt trễ 1 thời kỳ, kí hiệu là D(Yt) hay ∆Yt
được tính như sau: ∆Yt = Yt – Yt-1.
(1.4.1)
Sai phân bậc 2 của chuỗi Yt trễ 1 thời kỳ, kí hiệu là D2(Yt) hoặc ∆2Yt :
∆2Yt = ∆Yt – ∆Yt-1.
Sai phân bậc d của chuỗi Yt, kí hiệu là Dd(Yt) hoặc ∆dYt:
∆dYt = ∆d-1Yt – ∆d-1Yt-1.
(1.4.2)
7
Khi nói sai phân bậc d của một chuỗi ta hiểu là d lần lấy sai phân trễ 1
thời kỳ cho một chuỗi dữ liệu nào đó.
Sai phân bậc 1 của chuỗi Yt trễ k thời kỳ:
∆Yt = ∆Yt – ∆Yt-k .
(1.4.3)
Ví dụ 1.2: Chuỗi sai phân được lập từ một chuỗi số liệu gốc.
Bảng 1.1: CPI của Việt Nam và các chuỗi sai phân
Sai phân bậc Sai phân bậc Sai phân bậc 2
Tháng
CPI
01/1995
103.8000
NA
NA
NA
02/1995
103.4000
-0.400000
NA
NA
03/1995
100.2000
-3.200000
-3.600000
-2.800000
04/1995
101.0000
0.800000
-2.400000
4.000000
05/1995
101.8000
0.800000
1.600000
0.000000
06/1995
100.8000
-1.000000
-0.200000
-1.800000
07/1995
100.0000
-0.800000
-1.800000
0.200000
08/1995
100.3000
0.300000
-0.500000
1.100000
09/1995
100.5000
0.200000
0.500000
-0.100000
10/1995
100.1000
-0.400000
-0.200000
-0.600000
11/1995
100.1000
0.000000
-0.400000
0.400000
12/1995
100.3000
0.200000
0.200000
0.200000
1 trễ 1 thời kỳ 1 trễ 2 thời kỳ trễ 1 thời kỳ
1.5. Toán tử dịch chuyển lùi
Một cách ký hiệu rất hữu ích khi xem xét sự dịch chuyển lùi (trễ) của
chuỗi thời gian là toán tử L tác động lên chuỗi Yt, viết là: LYt = Yt-1.
Công thức đó được hiểu là toán tử L làm dữ liệu Yt dịch chuyển lùi về
phía quá khứ một thời kỳ. Hai lần L sẽ dịch chuyển Yt lùi về quá khứ hai thời
kỳ: L(LYt) = L2Yt = Yt-2 .
Tổng quát: Lk Yt Yt k , k là một số nguyên bất kỳ.
(1.5.1)
8
Đối với chuỗi dữ liệu theo tháng, nếu chúng ta muốn xem xét sự thay đổi
của quan sát so với giá trị của cùng kỳ năm trước, chúng ta sử dụng ký hiệu L12,
và ký hiệu là L12Yt = Yt-12 .
Ký hiệu dịch chuyển lùi rất tiện dụng khi mô tả một quá trình lấy sai
phân. Sai phân bậc nhất trễ một thời kỳ có thể được viết thành.
Yt’ = Yt – Yt-1 = Yt – LYt = (1 – L)Yt.
Chú ý rằng sai phân bậc nhất trễ một thời kỳ ký hiệu là (1 – L). Tương tự,
nếu ta lấy sai phân bậc hai (trễ một thời kỳ):
Yt” = (Yt’ – Y’t-1) = (Yt – Yt-1) – (Yt-1 – Yt-2)
= Yt – 2Yt-1 + Yt-2 = (1 – 2L + L2)Yt.
Như vậy: Yt” = (1 – L)2Yt.
Chú ý rằng sai phân bậc hai được ký hiệu là (1 – L)2. Điều quan trọng là
sai phân bậc hai khác với sai phân trễ hai thời kỳ (được ký hiệu là 1 – L2).
Tương tự, sai phân trễ 12 thời kỳ phải được ký hiệu là 1 – L12, còn sai phân bậc
12 (tức là 12 lần lấy sai phân) sẽ được ký hiệu là (1 – L)12.
Sai phân bậc d của chuỗi Yt có thể ký hiệu ngắn gọn là: (1 – L)dYt.
Nếu lấy sai phân trễ một thời kỳ của chuỗi Yt sau khi đã lấy sai phân theo
mùa vụ thì có thể ký hiệu là (1 – L)(1 – Ls)Yt.
Ký hiệu dịch chuyển lùi rất tiện dụng bởi vì ký hiệu này có thể nhân với
nhau theo cách tính toán học để thấy được ảnh hưởng kết hợp. Chẳng hạn,
(1 – L)(1 – Ls)Yt = (1 – L – Ls + Ls+1)Yt = Yt – Yt-1 – Yt-s + Yt-s+1.
1
Chú ý: 1 L Yt 1 L 2 L2 3L3 ... Yt L Yt với 1 .
1.6. Hiệp phương sai
* Phương sai: Thước đo lường sự tập trung của các giá trị có thể có của một
biến ngẫu nhiên xung quanh giá trị trung bình của nó.
Phương sai của biến ngẫu nhiên Yt , là kỳ vọng của bình phương sai lệch
của biến ngẫu nhiên so với kỳ vọng toán của nó, kí hiệu var(Yt ) :
9
2
var(Yt ) E Yt E Yt .
(1.6.1)
Với Yt là biến ngẫu nhiên rời rạc với các giá trị y1 , y 2 ,..., y n với xác suất
n
2
xảy ra tương ứng là p1 , p 2 ,..., p n thì: var(Yt ) yi2 pi E Yt .
(1.6.2)
i 1
Với Yt là biến ngẫu nhiên liên tục:
var(Yt )
2
y 2t f y t dy t E X .
(1.6.3)
Phương sai là trung bình số học của bình phương sai lệch giữa các giá trị
quan sát của biến ngẫu nhiên so với giá trị trung bình của các giá trị đó.
Phương sai phản ánh mức độ phân tán của các giá trị của biến ngẫu nhiên
so với giá trị trung tâm của kỳ vọng toán. Phương sai càng nhỏ thì các giá trị
càng tập trung ở giá trị gần trung tâm.
Tính chất:
var( ) 0; const .
(1.6.4)
var( X) 2 var X ; const .
(1.6.5)
Với X, Y là 2 biến ngẫu nhiên độc lập thì:
var X Y var X var Y .
(1.6.6)
Khi tính phương sai để thuận tiện ta hay dùng công thức:
2
var X E X 2 E X .
(1.6.7)
var aX bY a 2 var X b 2 var Y 2abcov X,Y .
(1.6.8)
* Độ lệch chuẩn: Độ lệch chuẩn của biến ngẫu nhiên Yt , ký hiệu là sd(Yt ) hay
Y được định nghĩa như sau: Y var(Yt ) .
t
t
* Hiệp phương sai: Đo lường mối quan hệ tuyến tính giữa hai biến số.
(1.6.9)
10
Khi xét đồng thời hai biến ngẫu nhiên X và Y, cần quan tâm đến hiệp
phương sai, ký hiệu là cov(X,Y), được định nghĩa bởi công thức sau:
cov X, Y E X X Y Y với X E X ; Y E Y .
Công thức (1.6.10) có thể viết thành: cov X, Y E X.Y x .Y .
(1.6.10)
(1.6.11)
Khi X và Y là hai biến ngẫu nhiên độc lập thì theo (1.3.7) ta có:
cov(X, Y) E X.Y X . Y E X .E Y X . Y X .Y X . Y 0 .
Tính chất:
cov X, X var X .
(1.6.12)
cov aX, bY ab cov X, Y .
(1.6.13)
Hàm hiệp phương sai đối với chuỗi Yt là chuỗi vô hạn các hiệp phương sai:
cov(Yt , Y
k
t k
) E Yt Yt k với k = 0, 1, 2,...
(1.6.14)
khi k = 0 thì 0 cov(Yt , Yt ) var Yt .
Hiệp phương sai dương ngụ ý hai biến có mối quan hệ tuyến tính thuận
chiều tức là giá trị của hai biến số nói chung sẽ thay đổi theo cùng chiều nhau;
hiệp phương sai âm ngụ ý hai biến số có mối quan hệ tuyến tính ngược chiều.
1.7. Hàm tự tương quan
* Hệ số tự tương quan giữa Yt và Yt-k là: k
k
0
(1.7.1)
* Hàm tự tương quan (ACF): Khi khảo sát các k theo độ dài của trễ
ACF k corr Yt , Yt k k
cov(Yt ,Y )
t k với k = 0, 1, 2,… (1.7.2)
var(Yt )
* Hàm tự tương quan riêng (PACF) là hệ số tương quan có điều kiện giữa Yt
và Yt-k , kí hiệu kk .
11
kk corr Yt ,Yt k Yt 1 ,Yt 2 ,...,Yt k 1 với k = 1, 2,…
(1.7.3)
Sử dụng công thức Yule - Walker để tính truy hồi kk .
* Hàm tự tương quan mẫu (SACF), kí hiệu k .
Giả sử rằng có một mẫu kích thước n, ( Y1 , Y2 ,...Yn ) , từ đây sẽ tính được
n
y
t
t 1
trung bình mẫu: Y
.
n
Các hiệp phương sai mẫu:
n
cov(Yt ,Yt k ) k
n
(Y Y)(Y
t
Với n khá lớn: k
(Y Y)(Y
t
t k
t
nk
t k
.
t k
t k 1
n
var(Yt ) 0
yy
Y)
n
.
n
(Y Y)
y
t
t 1
n
SACF(k)
k
(1.7.4)
n
2
t 1
n
2
t
.
(1.7.5)
n
n
(Y Y)(Y
t
t k
t k 1
n
t
t 1
k 1
yy
Y)
t
(Y Y)
t k 1
n
t k 1
SE
k
t
nk
n
yy
Y)
t k
t k 1
2
t k 1
n
y
t k
.
(1.7.6)
2
t
t 1
1 2
i
2
i 1
.
n
(1.7.7)
Với mẫu có kích thước nhỏ thì:
n
k
yy
t
t k 1
n 1
t k
.
(1.7.8)
- Xem thêm -