1
NGHIÊN CỨU ỨNG DỤNG CHUỖI THỜI GIAN TRONG
VIỆC DỰ BÁO KINH DOANH XĂNG DẦU
Trần Văn Tâm Em
Tổng Công ty Tín Nghĩa
Email:
[email protected]
Tóm tắt
Mục tiêu của nghiên cứu này nhằm giới thiệu việc xây dựng mô hình tự hồi qui
(AutoRegressive – AR) với các dữ liệu chuỗi thời gian, và ứng dụng mô hình này trong
việc dự báo. Mô hình giải thích sự biến động của chuỗi thời gian bằng cách quan hệ với
các giá trị quá khứ có độ trễ. Cụ thể mô hình được ứng dụng tại Công ty Xăng dầu Tín
Nghĩa nhằm hỗ trợ việc lập kế hoạch kinh doanh.
1.
Đặt vấn đề
Ngày nay, có rất nhiều cách, nhiều
nghĩa đối với các công ty nhập khẩu xăng
phương pháp và mô hình để dự báo nhằm
dầu đầu mối để có kế hoạch nhập khẩu và
để biết trước những điều có thể xảy ra
dự trữ nhằm đảm bảo hiệu quả sản xuất
trong tương lai. Mô hình AR là một trong
kinh doanh và ổn định kinh tế chính trị.
những mô hình về dự báo dự đoán giá trị
Các nghiên cứu liên quan đến dữ liệu
của biến số (hoặc một dãy biến số) tại
chuỗi thời gian và dự báo có rất nhiều, rất
một số điểm trong tương lai căn cứ vào
đa dạng, ở nhiều lĩnh vực khác nhau.
những dữ liệu trong quá khứ. Trong bất
Trong phạm vi này có thể tóm tắt một số
kì nền kinh tế phát triển ở mức độ nào
nghiên cứu liên quan tiêu biểu dựa vào
xăng dầu luôn được coi là mặt hàng chiến
mô hình tự hồi quy AR (AutoRegressive).
lược, là một mặt hàng thiết yếu. Việc
Trên thế giới, việc nghiên cứu chuỗi thời
đảm bảo cung cấp đầy đủ nhu cầu của sản
gian để dự báo dựa vào mô hình hồi quy
xuất cũng như sinh họat không chỉ có ý
áp dụng rất nhiều trong lĩnh vực kinh tế
nghĩa về kinh tế mà có cả yếu tố đảm bảo
như: Dự báo tỷ giá giữa đồng Guarani
sự ổn định về mặt chính trị. Vì vậy dự
của Paraguay và đồng đô la Mỹ; Dự báo
báo nhu cầu xăng dầu xăng dầu rất cần
giá trà trên thế giới dựa trên giá xuất
thiết đối với các đơn vị kinh doanh có ý
khẩu trà của các nước xuất khẩu trà như
2
Trung Quốc, Đức, Anh, Ấn độ, Indonesia,
áp dụng cho bài toán dự báo sản lượng
Kenya, Banladesh, Sri Lanka… đây là
tiêu thụ xăng dầu. Trong bài này tập
ứng dụng áp dụng trong khoảng thời gian
trung sử dụng chuỗi thời gian trong quá
dài từ 1970 đến 1998. Dự báo lạm phát ở
khứ, dùng mô hình tự hồi qui AR
Ireland từ đầu năm 1999, Governing
(AutoRegressive) để nhận dạng dữ liệu,
Council of the European Central Bank
ước lượng tham số, kiểm tra giá trị và dự
ECB quyết định về chính sách tiền tệ
báo. Áp dụng vào việc giải quyết bài toán
chung cho các nước Châu Âu trong đó có
dự báo sản lương tiêu thụ xăng dầu trong
Ireland, dữ liệu được quan sát được thực
tương lai. Để giải quyết bài toán ta sử
hiện từ năm 1976 đến 1999. Trong nước,
dụng mô hình tự hồi
qui:
p
việc nghiên cứu chuỗi thời gian cho bài
yt 0 i yt i t
i 1
toán dự báo cũng được áp dụng khá nhiều
Từ mô hình, chúng ta giải quyết bài toán
trong lĩnh vực kinh tế, giáo dục, kỹ
theo từng tự sau:
thuật…. Nhóm nghiên cứu SAM của TS.
o Nhận dạng cấu trúc mô hình.
Nguyễn Văn Minh Mẫn và TS. Trần Nam
o Ước lượng các tham số.
Dũng áp dụng các mô hình dự báo khác
o Kiểm tra sự tồn tại của mô hình và
nhau, đưa lý thuyết toán vào bài toán ứng
các tham số độ dốc.
dụng
o Xác định mô hình và dự báo.
Qua tìm hiểu trên với việc chọn hướng
2.1 Nhận dạng mô hình
nghiên cứu dự báo nhu cầu tiêu thụ xăng
Mô hình dữ liệu chuỗi thời gian [4]:
dầu, nhằm áp dụng thực tế cho bài toán
Từ mô hình Chúng ta khảo sát những dấu
tại doanh nghiệp để đánh giá được nhu
hiệu nhận dạng mô hình tự hồi qui phù
cầu tiêu thụ thực tế và đưa ra được chiến
hợp là dựa vào thể hiện của hàm tự tương
lược kinh doanh hợp lý, tăng hiệu quả
quan [1,2](Autocorrelation Function –
kinh doanh…Phần nghiên cứu này cụ thể
ACF) và tự tương quan từng phần [1,2]
(1) đặt vấn đề, (2) giải quyết vấn đề, (3)
(Part Autocorrelation Function – PACF)
ứng dụng kết quả trên tập dữ liệu thực (4)
như sau:
kết quả đạt được, (5) kết luận.
2. Giải quyết vấn đề
Dựa vào dữ liệu theo chuổi thời gian Time Series [5] và xây dựng mô hình ước
lượng dữ liệu, dự báo giá trị tương lai và
yt f ( yt 1 , yt 2 ,..., yt p , t ) (2.1)
3
ACF: Cho chuỗi n quan sát, giá trị
Sử dụng phương pháp bình phương cực
rk của hàm tương tự quan tại độ
tiểu (Ordinary Least Squares - OLS) [4]
trễ k được tính như sau:
để ước lượng tham số cho mô hình hồi
N k
rk
1
N
qui
( yt y)( yt k y)
t 1
y
1 n
( yt )
n t 1
Trong đó:
yt: dữ liệu chuỗi thời gian dừng tại
t 1
Từ phương trình hồi qui theo chuỗi
thời gian tổng quát:
yt 0 i yt i t
(2.4)
i 1
Xây dựng ma trận với các vector như
yt+k : dữ liệu chuỗi thời gian dừng
sau:
: giá trị trung bình của chuỗi thời
rk : giá trị tương quan mẫu giữa yt
và yt+k tại độ trễ k.
y t ) 2 Min
thời điểm t.
gian dừng.
t 1
^
t
p
tại thời điểm t +k.
y
n
2
t
(2.2)
s2
Với
1 n
s 2 ( yt y ) 2
n t 1
n
( y
rk=0 thì không có hiện tượng tự
quan (-1<= rk<=1).
PACF: Tương tự như ACF, PACF
được tính như sau
Khi k=1
r1
k 1
r
rk 1, j .rk j
k
rkk
j 1
Khi k=2,3….
k 1
1
(2.3)
rk 1, j .rk j
j 1
Trong đó, rkj = rk-1,j - rkk .rk-1,k-j với j=1, 2,
…, k-1
2.2 Ước lượng tham số
y p1
y p2
y ..
.
.
.
yn
1 y p y p 1 ... y1
1 y p 1 y p y2
X .. .. .. ..
. . . .
. . .
1 y y
n1 n2 yn p
0
1
e ..
..
p
0
1
b ..
..
p
- Tìm hệ số ước lượng
b ( X T X )1 X T y
(2.5)
4
2.3 Kiểm định
Kiểm định này được mô tả tổng quát
* Kiểm định ý nghĩa tổng quát của mô
trong bảng phân tích phương sai [1], [6]
hình
như sau:
Để kiểm định, chúng ta hình thành giả
Nguồn
thuyết như sau:
H0 : j = 0 (1 = 2 =...= j =0)
H1 : j 0 (có ít nhất một hệ số j
0)
Thủ tục kiểm định cho H0: β1 = β2 = · · ·
Tổng bình Bậc tự Trung bình
biến động
phương
do
bình phương
Hồi qui
Sai số /
phần dư
Tổng
SSR
SSE
SST
k
n-k-1
n-1
MSR
MSE
F0
MSR/
MSE
= βk = 0 là đúng, tính F0 với công thức:
* Kiểm định tham số độ dốc
Nếu |F0| > F,k,n-k−1[4]. Từ chối giả thuyết
H0, tức là tạm chấp nhận H1 (mô hình có
Phương pháp kiểm tra sự đóng góp của
ý nghĩa về mặt thống kê)
từng biến số độc lập [1],[4] sẽ mô tả
Để tính toán các giá trị SSR, SSE, SST
thông qua giả thuyết như sau:
theo công thức sau:
H0 : j = 0 (1 = 2 =... =j =0)
n
^
SSE y T y bT X T y SSE ( yt y ) 2
H1 : j 0 (có ít nhất một hệ số j 0)
t 1
n
SST y T y
( y ) 2
t 1
n
n
Nếu tạm chấp nhận H0 : βj = 0, thì chỉ ra
_
SST ( yt y ) 2
rằng Xj (yt-1, yt-2….) có thể bị loại bỏ ra
t 1
n
SSR b X y
T
T
( y ) 2
t 1
n
n
^
_
SST ( y t y )
t 1
khỏi mô hình. Kiểm định thống kê cho
2
giả thuyết này là
SST SSR SSE
SSE(Sum of Square Error) : Tổng
bình phương của sai số
SSR(Sum of Square Regression):
Tổng bình phương của các phần
dư.
SST(Sum of Square Total ): Tổng
của các bình phương.
t0
Trong đó:
bj
^
2
(2.7)
C jj
- bj : là hệ số ước lượng của tham
số đám đông
- Cjj là phần tử đường chéo chính
của ma trận (XTX)−1 tương ứng
với βj,
5
Giả thuyết H0 : βj = 0 bị bác bỏ nếu |t0| >
t/2, n−k−1. [4] Tức là loại giả thiết H0
chấp nhận giả thuyết H1.
2.4. Mô hình tìm được
Mô hình tự hồi qui bậc một AR(1):
yt 0 1 yt 1 t .
Mô hình tự hồi qui bậc 2 AR(2) xem xét
ảnh hưởng của quan hệ giữa giá trị 2 kỳ
- Nhận dạng cấu trúc mô hình
Mã R để hiện thực nhận dạng
setwd("c:/works/")
gas_data<- read.csv ("gas.csv",
header=TRUE)
summary(gas_data)
qui <- gas_data[, c(8)]
par(mfrow=c(2,1))
acf(qui, 16)
pacf(qui, 16)
Kết quả hiện thị hàm ACF và
PACF nhận dạng mô hình
trước đó,
yt 0 1 yt 1 2 yt 2 t .
Công thức hồi qui tuyến tính trên chuỗi
thời gian tổng quát xét trên quan hệ của
nhiều kỳ trước đó được trình bày như
5
yt 0 i yt i t
sau:
i 1
p
yt 0
y
i t i
t.
i 1
3. Ứng dụng kết quả thử nghiệm trên
tập dữ liệu thực.
Bài toán sử dụng tập dữ liệu đã
được thu thập từ những giá trị thực tế
trong quá trình kinh doanh với sản lượng
bán ra,tại Công ty xăng dầu Tín Nghĩa từ
năm 2006 đến năm 2010. Trong đó, sử
dụng mã lệnh R để đề cập đến việc hiện
thực các tính toán bằng ngôn ngữ này.
Sau đó sử dụng Java để xuất quả.
- Ước lượng tham số với phương pháp
OLS :
Mã R để hiện thực ước lượng
X <- gas_data[, c(1,2,3,4,5,6)]
X <- as.matrix(X)
XtX <- t(X) %*% X
solve(XtX)
y <- gas_data[,c(7)]
Xty <- t(X) %*% y
solve(XtX)
b <-(XtX)%*%Xty
b <- solve(XtX)%*%Xty
6
Kết quả hiện thị ước lượng
- Kiểm định :
Mã R để hiện thực kiểm định
n=length(y)
k=5
SSE<- t(y)%*%y t(b)%*%t(X)%*%y
MSE<-SSE/(n-k-1)
SSR<- t(b)%*%t(X)%*%y (sum(y)^2)/n
MSR<-SSR/k
SST<- t(y)%*%y - (sum(y))^2/n
MST<-SST/(n-1)
R_square <- (1- SSE/SST)
R_adj_square <- (1- (MSE/MST))
F0<- MSR/MSE
F0 # Compare to F0.05,5,7 = 4.88
if (F0 >= 4.88 {print("Ton tai it
nhat mot he so beta_i khac 0")} else
{print("Tat ca he so beta_i = 0")}
Cij<-solve(XtX) # inverse (XtX)
Cov<-SSE/(n-k) # covariance
#Test b1:
H01<-b[2]/sqrt(Cov*Cij[2,2])#
Compare to t0.025,7= 2.365
if (H01>=2.365) {print( "Beta 1 co
y nghia thong ke")} else
{print( "Beta 1 khong co y nghia
thong ke")}
#Test b2:
H02<-b[3]/sqrt(Cov*Cij[3,3])#
Compare to t0.025,9= 2.365
if (H02>=2.365) {print( "Beta 2 co
y nghia thong ke")} else
{print( "Beta 2 khong co y nghia
thong ke")}
#Test b3:
H03<-b[4]/sqrt(Cov*Cij[4,4])#
Compare to t0.025,9= 2.365
if (H03>=2.365) {print( "Beta 3 co
y nghia thong ke")} else
{print( "Beta 3 khong co y nghia
thong ke")}
#Test b4:
H04<-b[5]/sqrt(Cov*Cij[5,5])#
Compare to t0.025,9= 2.365
if (H04>=2.365) {print( "Beta 4 co
y nghia thong ke")} else
{print( "Beta 4 khong co y nghia
thong ke")}
#Test b5:
H05<-b[6]/sqrt(Cov*Cij[6,6])#
Compare to t0.025,9= 2.365
if (H05>=2.365) {print( "Beta 5 co
y nghia thong ke")} else
{print( "Beta 5 khong co y nghia
thong ke")}
Kết qủa hiện thực kiểm định
7
- Mô hình tìm được và dự báo :
Mã R để hiện thực kiểm định
X <- gas_data[, c(1,5)]
X <- as.matrix(X)
XtX <- t(X) %*% X
y <- gas_data[,c(7)]
Xty <- t(X) %*% y
b <-(XtX)%*%Xty
b <- solve(XtX)%*%Xty
Kết quả hiện thị dự báo
Tuy nhiên, bên cạnh các kết quả đạt được
như mong muốn cũng còn một vài hạn chế
như:
Chuỗi dữ liệu dạng thời gian phải quan
sát liên tục có tính chu kỳ theo tháng,
quí, năm… Theo cách tập hợp dữ liệu
này sẽ làm tăng tính chính xác của dự
báo nhưng hạn chế trong việc chọn lựa
dữ liệu quan sát trước khi tiến hành dự
báo.
Vấn đề nghiên cứu chỉ tập trung vào
một mô hình tự hồi qui để giải quyết bài
toán với một loại dữ liệu quan sát là sản
lượng tiêu thụ nên bỏ qua một biến cố
4. Kết quả đạt được
ảnh hưởng khác.
5. Kết luận
Sử dụng mô hình tự hồi qui
(AutoRegressive) với phương pháp OLS
dùng để ước lượng các tham số và tiến tới
dự báo giá trị tương lai. Trong cách tiếp
cận này, kiểm định được độ chính xác và
xác lập các tham số tối ưu cho kết quả dự
báo sau cùng giúp doanh nghiệp giải quyết
được bài toán bằng phương pháp thống kê
toán học, với nhưng lập luận có tính logic
cao. Ngoài ra, giải quyết được vấn đề then
chốt là dữ liệu chuỗi thời gian có yếu tố
mùa vụ mà bài toán thực tế đạt được trong
mô hình dự báo. Cụ thể, nó ứng dụng rất
tốt cho việc hỗ trợ lập kế hoạch kinh doanh.
Dự báo là một bài toán khá thú vị và có
ảnh hưởng rất lớn đến việc xác lập kế
hoạch hành động. Nó đóng vai trò đặc biệt
quan trọng đối với các đơn vị làm kinh tế
mà đòi hỏi tính cạnh tranh cao. Đơn vị nào
nhận định đúng về tương lai sẽ mang đến
thành công. Bất kỳ một nhận định nào
cũng đều có cơ sở suy luận của nó, trên cơ
sở suy luận đó là việc tổng kết các kinh
nghiệm đã diễn ra trong quá khứ, có thể là
các quy luật đã được xác lập hoặc các suy
luận logic nhưng nhìn chung mọi cơ sở
đều xuất phát từ dữ liệu lịch sử.
8
Với việc nghiên cứu ứng dụng dữ liệu
chuỗi thời gian và sử dụng mô hình tự hồi
qui AR cho nghiên cứu này mang tính ứng
dụng cao. Áp dụng vào thực tế mang đến
[3]
Nguyễn Trọng Hoài, Phùng Thanh
Bình, Nguyễn Khánh Duy (2009),
Dự báo và phân tích dữ liệu trong
kinh tế và tài chính, Nhà xuất bản
thống kê.
TÀI LIỆU THAM KHẢO
[4] Douglas C.Montgomery. (2001),
Design and Analysis of Experiments,
5th edition, Jonh Wiley& Sons Inc.
[1] Hoàng Trọng, Chu Nguyễn Mộng
Ngọc (2008), Thống kê ứng dụng
trong kinh tế - xã hội, nhà xuất bản
thống kê.
[5] THOMAS
B.FOMBY
(2002),
Econometric Analysis of Financial
and Economic Time Series Part A,
Volume 20.
[2] Nguyễn Trọng Hoài (2005), Mô hình
hoá và dự báo chuỗi thời gian trong
kinh doanh và kinh tế, nhà xuất bản
Đại học Quốc gia TPHCM.
[6] RUEY S. TSAY (2002), Analysis of
Financial
Time
Series,
The
University of Chicago Booth School
of Business Chicago, IL.
kết quả như mong đợi của Doanh nghiệp.
Time Series For Petrol & Oil Management Forecast
ABSTRACT
The objective of this reseach is to introduce the construction of the model of stochastic
processes – AR ((AutoRegressive)
model, and their use in forecasting. This model
explains the movement of the time series by relating it to the own past values and to the
weighted sum of current and lagged random disturbances. The model is also illustratively
applied to forecast Petrol & Oil at Tin Nghia Corporation.