BTNMT
TTKTTVQG
BỘ TÀI NGUYÊN VÀ MÔI TRƯỜNG
TRUNG TÂM KHÍ TƯỢNG THỦY VĂN QUỐC GIA
Số 4 Đặng Thái Thân – Quận Hoàn Kiếm – Hà Nội
-----------------********--------------------
BÁO CÁO
TỔNG KẾT ĐỀ TÀI NGHIÊN CỨU
KHOA HỌC VÀ CÔNG NGHỆ CẤP BỘ
ĐỀ TÀI:
NGHIÊN CỨU XÂY DỰNG HỆ THỐNG DỰ BÁO CÁC
YẾU TỐ KHÍ TƯỢNG BẰNG PHƯƠNG PHÁP THỐNG KÊ
TRÊN SẢN PHẨM MÔ HÌNH HRM
Chủ nhiệm: ThS. Đỗ Lệ Thủy
7583
28/12/2009
HÀ NỘI, 12-2009
BỘ TÀI NGUYÊN VÀ MÔI TRƯỜNG
TRUNG TÂM KHÍ TƯỢNG THỦY VĂN QUỐC GIA
Số 4 Đặng Thái Thân – Quận Hoàn Kiếm – Hà Nội
-----------------********--------------------
BÁO CÁO
TỔNG KẾT ĐỀ TÀI NGHIÊN CỨU
KHOA HỌC VÀ CÔNG NGHỆ CẤP BỘ
ĐỀ TÀI:
NGHIÊN CỨU XÂY DỰNG HỆ THỐNG DỰ BÁO CÁC
YẾU TỐ KHÍ TƯỢNG BẰNG PHƯƠNG PHÁP THỐNG KÊ
TRÊN SẢN PHẨM MÔ HÌNH HRM
Chỉ số đăng ký:
Chỉ số phân loại:
Chỉ số lưu trữ:
Cộng tác viên chính:
TS Lê Đức
ThS Võ Văn Hòa
ThS Nguyễn Đăng Quang
CN Vũ Duy Tiến
TSKH Phạm Kỳ Anh
TS Phạm Thị Thanh Ngà
CN Nguyễn Thu Hằng
CN Nguyễn Mạnh Linh
Hà Nội, ngày tháng 12 năm 2009
Hà Nội, ngày tháng 12 năm 2009
CƠ QUAN CHỦ TRÌ
CƠ QUAN THỰC HIỆN
CHỦ NHIỆM ĐỀ TÀI
Đỗ Lệ Thủy
Bùi Minh Tăng
Trần Văn Sáp
Hà Nội, ngày tháng 12 năm 2009
HỘI ĐỒNG ĐÁNH GIÁ CHÍNH THỨC
CHỦ TỊCH HỘI ĐỒNG
Hà Nội, ngày tháng 12 năm 2009
CƠ QUAN QUẢN LÝ ĐỀ TÀI
TL. BỘ TRƯỞNG
KT. VỤ TRƯỞNG
VỤ KHOA HỌC VÀ CÔNG NGHỆ
PHÓ VỤ TRƯỞNG
TS. Nguyễn Lê Tâm
Nguyễn Lê Tâm
Trung Tâm Dự báo KTTV Trung ương
Trung tâm KTTV Quốc Gia
DANH SÁCH CÁC CHỮ VIẾT TẮT
BCDG
Phương pháp phân tích BCDG
(Bergthorssen-Doss-Cressman method for Grid)
BIAS
Sai số hệ thống
BRK
Loại mây (nhiều mây)
BRoKen
BS
Chỉ số Brier
(Brier Score)
BSS
Chỉ số kỹ năng Brier
(Brier Skill Score)
BoM
Cơ quan khí tượng Ôxtrâylia
(Bureau of Meteorology, Australia)
CLR
Quang mây
(CleaR)
CRF
Chỉ số đánh giá
Cumulative Relative Frequency
CSI
Chỉ số đánh giá CSI
(Critical Success Index)
DMO
Dự báo trực tiếp từ mô hình
(Direct Model Output)
DWD
Tổng cục thời tiết Cộng hoà Liên bang Đức
(Deutscher WetterDienst)
EMOS
Thống kê sau mô hình tổ hợp
(Ensemble Model Ouput Statistics)
ETS
Chỉ số đánh giá ETS
(Equitable Threat Score)
FB
Chỉ số đánh giá FB
(Frequency Bias)
FAR
Tỷ lệ cảnh báo khống
(False Alarm Ratio)
GME
Mô hình toàn cầu của CHLB Đức
(Global Model for Europe)
Nghiên cứu xây dựng hệ thống dự báo các yếu tố khí tượng bằng phương pháp thống kê
trên sản phẩm mô hình HRM - Hà Nội 2009
i
Trung Tâm Dự báo KTTV Trung ương
Trung tâm KTTV Quốc Gia
GMOS
Thống kê sau mô hình trên lưới
(Gridded Model Ouput Statistics)
GSM
Mô hình phổ toàn cầu của JMA
(Global Spectral Model)
JMA
Cơ quan khí tượng Nhật bản
(Japan Meteorological Agency)
HSS
Chỉ số kỹ năng Heidke
(Heidke Skill Score)
KF
Phương pháp lọc Kalman
Kalman Filter
MAE
Sai số tuyệt đối trung bình
(Mean Absolute Error)
ME
Sai số trung bình
(Mean Error)
MLR
Hồi quy tuyến tính đa biến
(Multiple Linear Regression)
MOS
Thống kê sau mô hình
(Model Ouput Statistics)
NCEP
Trung tâm dự báo môi trường quốc gia Mỹ
(National Centers for Environmental Prediction)
NWS
Cơ quan khí tượng quốc gia Mỹ
(US National Meteorological Service)
NWP
Dự báo thời tiết số trị
(Numerical Weather Prediction)
OVC
Loại mây (đầy mây)
(OVeRcast)
PC
Chỉ số đánh giá
(Percentage Correct)
POD
Chỉ số xác suất phát hiện mưa
(Probability Of Detection)
PoP
Xác suất xảy ra mưa
(Probability Of Precipitation)
Nghiên cứu xây dựng hệ thống dự báo các yếu tố khí tượng bằng phương pháp thống kê
trên sản phẩm mô hình HRM - Hà Nội 2009
ii
Trung Tâm Dự báo KTTV Trung ương
Trung tâm KTTV Quốc Gia
PP
Phương pháp dự báo hoàn hảo
(Perfect Prognosis)
RMSE
Sai số quân phương
(Root Mean Square Error)
RV
Chỉ số RV
(Reduction of Variance)
SCT
Loại mây (ít mây)
SCaTtered
SSCP
Ma trận phương sai hiệp biến
Sum of Squares and Cross Products
TS
Chỉ số đánh giá TS
(Threat Score)
TTDBTƯ
Trung tâm Dự báo Khí tượng Thủy văn Trung ương
UMOS
Thống kê sau mô hình có cập nhật hệ số
(Updatable Model Ouput Statistics)
VCE
Sự thay đổi theo độ cao
(Vertical Change Elevation)
Nghiên cứu xây dựng hệ thống dự báo các yếu tố khí tượng bằng phương pháp thống kê
trên sản phẩm mô hình HRM - Hà Nội 2009
iii
Trung Tâm Dự báo KTTV Trung ương
Trung tâm KTTV Quốc Gia
DANH SÁCH CÁC BẢNG
TT
Số thứ
tự bảng
1
2.4.1
2
2.4.2
3
3.1.1
4
5
3.1.2
3.1.3
6
3.1.4
7
8
3.1.5
3.1.6
9
3.1.7
10
3.1.8
11
3.1.9
12
13
3.1.10
3.1.11
14
15
3.1.12
3.1.13
16
3.1.14
17
3.1.15
18
19
20
21
3.1.16
3.1.17
3.1.18
3.1.19
Nội dung
Trang
Số liệu (quan trắc) và mô hình (HRM, GSM) được thử nghiệm trong
phát triển hệ thống diễn giải
Số lượng các trạm quan trắc khí tượng bề mặt của 9 Đài KTTV khu
vực được thử nghiệm trong phát triển hệ thống diễn giải
Biến đổi của phương trình dự báo tmax và RV, hạn 54 giờ tại trạm
Láng theo dung lượng tập dữ liệu mới với mô hình GSM vào mùa
hè
Như bảng 3.1.1, nhưng cho trạm Tân Sơn Hòa
Tần xuất tuyển chọn và tần xuất tuyển chọn đầu tiên các nhân tố của
phương trình dự báo tmax, hạn 54 giờ theo dung lượng tập dữ liệu
mới với mô hình GSM vào mùa hè
Biến đổi của phương trình dự báo tmin và RV, hạn 66 giờ tại trạm
Láng theo dung lượng tập dữ liệu mới với mô hình HRM vào mùa
đông
Như bảng 3.1.4, nhưng cho trạm Tân Sơn Hòa
Tần xuất tuyển chọn và tần xuất tuyển chọn đầu tiên các nhân tố của
phương trình dự báo tmin, hạn 66 giờ theo dung lượng tập dữ liệu
mới với mô hình HRM vào mùa đông
Biến đổi của phương trình dự báo t, td và RV, hạn 48 giờ tại trạm
Trường Sa theo dung lượng tập dữ liệu mới với mô hình GSM vào
mùa hè
Tần xuất tuyển chọn và tần xuất tuyển chọn đầu tiên các nhân tố của
phương trình dự báo t và td, hạn 48 giờ theo dung lượng tập dữ liệu
mới với mô hình GSM vào mùa hè
Biến đổi của phương trình dự báo gió và RV, hạn 24 giờ tại trạm
Côn Đảo theo dung lượng tập dữ liệu mới với mô hình HRM vào
mùa đông
Như bảng 3.1.9, nhưng với mô hình GSM
Tần xuất tuyển chọn và tần xuất tuyển chọn đầu tiên các nhân tố của
phương trình dự báo gió hạn 24 giờ theo dung lượng tập dữ liệu mới
với mô hình HRM vào mùa đông
Như bảng 3.1.11, nhưng với mô hình GSM
Biến đổi của phương trình dự báo mây và RV, hạn 06 giờ tại trạm
Sìn Hồ theo dung lượng tập dữ liệu mới với mô hình GSM vào mùa
hè
Tần xuất tuyển chọn và tần xuất tuyển chọn đầu tiên các nhân tố của
phương trình dự báo mây, hạn 06 giờ theo dung lượng tập dữ liệu
mới với mô hình GSM vào mùa hè
Các nhân tố có tần xuất tuyển chọn lớn hơn 20% trong các phương
trình MLR cho tmax với bộ nhân tố đầu vào từ mô hình HRM và
GSM
Tương tự bảng 3.1.15 nhưng cho yếu tố dự báo tmin
Tương tự bảng 3.1.15 nhưng cho yếu tố dự báo t
Tương tự bảng 3.1.15 nhưng cho yếu tố dự báo td
Tương tự bảng 3.1.15 nhưng cho yếu tố dự báo u và có tần xuất >
31
Nghiên cứu xây dựng hệ thống dự báo các yếu tố khí tượng bằng phương pháp thống kê
trên sản phẩm mô hình HRM - Hà Nội 2009
32
54
55
56
57
58
60
60
62
64
65
66
67
67
69
70
71
71
72
73
iv
Trung Tâm Dự báo KTTV Trung ương
22
3.1.20
23
3.1.21
24
3.1.22
25
3.1.23
Trung tâm KTTV Quốc Gia
10%
Tương tự bảng 3.1.15 nhưng cho yếu tố dự báo v và có tần xuất >
10%
Tương tự bảng 3.1.15 nhưng cho yếu tố dự báo ff và có tần xuất >
10%
Tương tự bảng 3.1.15 nhưng cho yếu tố dự báo clr và có tần xuất >
10%
Tương tự bảng 3.1.15 nhưng cho yếu tố dự báo ovc và có tần xuất >
10%
Nghiên cứu xây dựng hệ thống dự báo các yếu tố khí tượng bằng phương pháp thống kê
trên sản phẩm mô hình HRM - Hà Nội 2009
73
74
75
75
v
Trung Tâm Dự báo KTTV Trung ương
Trung tâm KTTV Quốc Gia
DANH SÁCH CÁC HÌNH VẼ VÀ BIỂU ĐỒ
TT
Số thứ tự
hình
1
1.2.1
2
3
1.2.2
2.3.1
4
2.4.1
5
2.4.2
6
7
8
2.5.1
2.7.1
2.7.2
9
2.7.3
10
2.7.4
11
2.7.5
12
3.1.1
13
14
3.1.2
3.1.3
15
3.1.4
16
3.1.5
17
3.1.6
18
3.1.7
19
3.1.8
20
3.1.9
Nội dung
Trang
Đồ thị hai chiều và ba chiều của hàm trọng số cho ma trận SSCP
mới và SSCP cũ theo dung lượng mẫu (theo Wilson và Vallee,
2002)
Sơ đồ mô tả bước dự báo và hiệu chỉnh của lọc Kalman
Chỉ số RV trung bình trên khu vực Việt Nam theo phương pháp hồi
quy từng bước từ mô hình HRM dự báo cho tmax (trái) và tmin
(phải), hạn dự báo 72 giờ
Sự biến thiên trung bình (%) của sai số quân phương (RMSE) dự
báo từ lọc Kalman theo các giá trị dung lượng mẫu khác nhau cho
tmax hạn 6h (bên trái) và tmin hạn 18h (bên phải)
Tương tự hình 2.4.1 nhưng cho t hạn 24h (bên trái) và wind hạn
24h (bên phải)
Thuật toán dự báo hiện tượng từ dự báo xác suất
Meteogram dự báo cho Cam Ranh
Bản đồ dự báo nhiệt độ 2m (t2m, trái), nhiệt độ tối thấp 2m (tmin2m,
giữa) và nhiệt độ tối cao 2m (tmax2m, phải) theo GMOS
Bản đồ dự báo nhiệt độ 2m (t2m,trái), nhiệt độ điểm sương 2m
(td2m,giữa) và độ ẩm tương đối 2m (rh2m, phải) theo GMOS
Bản đồ dự báo độ ẩm tương đối 2m (rh2m, trái), lượng mây (giữa)
và gió 10m (w10m, phải) theo GMOS
Bản đồ dự báo xác suất mưa 24 giờ ngưỡng 01mm (trái), 05mm
(giữa) và 20mm (phải) theo GMOS
Biến đổi của RV theo dung lượng mẫu tập số liệu mới sau khi mô
hình GSM (trên) và HRM (dưới) thay đổi vào mùa đông (trái) và
mùa hè (phải) cho tmax
Như hình 3.1.1, nhưng cho yếu tố tmin
Biến đổi của RV theo dung lượng mẫu tập số liệu mới sau khi mô
hình GSM (trên) và HRM (dưới) thay đổi vào mùa đông (trái) và
mùa hè (phải) cho t và td với hạn dự báo 12, …, 72 giờ
Toán đồ tụ điểm dự báo t (trên) và td (dưới) hạn 72 giờ, mùa hè từ
mô hình GSM so sánh với quan trắc trong năm 2007 (trái), 2008
(giữa) và 2009 (phải)
Toán đồ tụ điểm dự báo t (trên) và td (dưới) hạn 72 giờ, mùa đông
từ mô hình GSM so sánh với quan trắc trong năm 2006 (trái), 2007
(giữa) và 2008 (phải)
Biến đổi của RV theo dung lượng mẫu tập số liệu mới sau khi mô
hình GSM (trên) và HRM (dưới) thay đổi vào mùa đông (trái) và
mùa hè (phải) cho u, v và ff
Như hình 3.1.16, nhưng cho bốn loại mây CLR, SCT, BRK và
OVC
Hình 3.1.8. Sự biến thiên của các hệ số hồi quy trong phương trình
dự báo tmax hạn 30h và sai số hệ thống (BIAS) của DMO và KF
tại trạm Láng đối với chu kỳ dự báo 21/11/2007-21/01/2008 với số
liệu đầu vào từ mô hình GSM
Tương tự như hình 3.1.8 nhưng cho phương trình dự báo t hạn 24h
10
Nghiên cứu xây dựng hệ thống dự báo các yếu tố khí tượng bằng phương pháp thống kê
trên sản phẩm mô hình HRM - Hà Nội 2009
14
30
35
36
41
46
47
47
48
48
50
51
51
52
53
63
64
77
78
vi
Trung Tâm Dự báo KTTV Trung ương
21
3.1.10
22
23
3.1.11
3.2.1
24
3.2.2
25
26
27
3.2.3
3.2.4
3.2.5
28
3.2.6
29
30
31
3.2.7
3.2.8
3.2.9
32
3.2.10
33
34
35
3.2.11
3.2.12
3.2.13
36
3.2.14
37
38
39
3.2.15
3.2.16
3.2.17
40
41
3.2.18
3.2.19
42
43
44
45
3.2.20
3.2.21
3.2.22
3.2.23
46
3.2.24
Trung tâm KTTV Quốc Gia
Tương tự như hình 3.1.8 nhưng cho chu kỳ dự báo 25/10/200725/12/2007 với số liệu đầu vào từ mô hình HRM
Tương tự như hình 3.1.10 nhưng cho phương trình dự báo t hạn 24h
Bias dự báo của tmax vào mùa hè 2007 (trái), 2008 (giữa) và 2009
(phải) theo hai mô hình GSM (trên) và HRM (dưới) với ba phương
pháp DMO, KF và UMOS
Bias dự báo của tmax vào mùa đông 2006 (trái), 2007 (giữa) và
2008 (phải) theo hai mô hình GSM (trên) và HRM (dưới) với ba
phương pháp DMO, KF và UMOS
Như hình 3.2.1, nhưng với chỉ số RMSE
Như hình 3.2.2, nhưng với chỉ số RMSE
Bias dự báo của tmin vào mùa hè 2007 (trái), 2008 (giữa) và 2009
(phải) theo hai mô hình GSM (trên) và HRM (dưới) với ba phương
pháp DMO, KF và UMOS
Bias dự báo của tmin vào mùa đông 2006 (trái), 2007 (giữa) và
2008 (phải) theo hai mô hình GSM (trên) và HRM (dưới) với ba
phương pháp DMO, KF và UMOS
Như hình 3.2.5, nhưng với chỉ số RMSE
Như hình 3.2.6, nhưng với chỉ số RMSE
Bias dự báo của t vào mùa hè 2007 (trái), 2008 (giữa) và 2009
(phải) theo hai mô hình GSM (trên) và HRM (dưới) với ba phương
pháp DMO, KF và UMOS
Bias dự báo của t vào mùa đông 2006 (trái), 2007 (giữa) và 2008
(phải) theo hai mô hình GSM (trên) và HRM (dưới) với ba phương
pháp DMO, KF và UMOS
Như hình 3.2.9, nhưng với chỉ số RMSE
Như hình 3.2.10, nhưng với chỉ số RMSE
Bias dự báo của td vào mùa hè 2007 (trái), 2008 (giữa) và 2009
(phải) theo hai mô hình GSM (trên) và HRM (dưới) với ba phương
pháp DMO, KF và UMOS
Bias dự báo của td vào mùa đông 2006 (trái), 2007 (giữa) và 2008
(phải) theo hai mô hình GSM (trên) và HRM (dưới) với ba phương
pháp DMO, KF và UMOS
Như hình 3.2.13, nhưng với chỉ số RMSE
Như hình 3.2.14, nhưng với chỉ số RMSE
Bias dự báo của t theo mô hình GSM vào mùa hè 2007, 2008, 2009
(trên) và mùa đông 2006, 2007, 2008 (dưới) với ba phương pháp
DMO, UMOSreg và UMOS
Hình 3.2.18: Như hình 3.2.17, nhưng với chỉ số RMSE
Dự báo tmax ngày thứ hai (hạn dự báo 48 giờ) theo GMOS với các
mô hình GSM, HRM theo hai phương pháp UMOS và KF. Quan
trắc cũng được hiển thị với mục đích so sánh.
Như hình 3.2.19, nhưng cho tmin
Như hình 3.2.19, nhưng cho t
Như hình 3.2.19, nhưng cho td
Dự báo rh hạn 54 giờ theo GMOS với các mô hình GSM, HRM
theo hai phương pháp UMOS và KF. Quan trắc cũng được hiển thị
với mục đích so sánh.
Bias dự báo của dd vào mùa hè 2007 (trái), 2008 (giữa) và 2009
(phải) theo hai mô hình GSM (trên) và HRM (dưới) với ba phương
pháp DMO, KF và UMOS
Nghiên cứu xây dựng hệ thống dự báo các yếu tố khí tượng bằng phương pháp thống kê
trên sản phẩm mô hình HRM - Hà Nội 2009
78
78
81
82
83
84
85
86
87
88
90
91
92
93
94
95
96
97
99
100
101
102
103
104
105
107
vii
Trung Tâm Dự báo KTTV Trung ương
47
3.2.25
48
49
50
51
52
3.2.26
3.2.27
3.2.28
3.2.29
3.2.30
53
3.2.31
54
55
56
57
58
59
60
3.2.32
3.2.33
3.2.34
3.2.35
3.2.36
3.2.37
3.2.38
61
62
3.2.39
3.2.40
63
3.2.41
64
3.2.42
65
3.2.43
66
3.2.44
67
3.2.45
Trung tâm KTTV Quốc Gia
Bias dự báo của dd vào mùa đông 2006 (trái), 2007 (giữa) và 2008
(phải) theo hai mô hình GSM (trên) và HRM (dưới) với ba phương
pháp DMO, KF và UMOS
Như hình 3.2.24, nhưng với chỉ số RMSE
Như hình 3.2.25, nhưng với chỉ số RMSE
Như hình 3.2.24, nhưng với chỉ số CRF
Như hình 3.2.25, nhưng với chỉ số CRF
Bias dự báo của ff vào mùa hè 2007 (trái), 2008 (giữa) và 2009
(phải) theo hai mô hình GSM (trên) và HRM (dưới) với ba phương
pháp DMO, KF và UMOS
Bias dự báo của ff vào mùa đông 2006 (trái), 2007 (giữa) và 2008
(phải) theo hai mô hình GSM (trên) và HRM (dưới) với ba phương
pháp DMO, KF và UMOS
Như hình 3.2.30, nhưng với chỉ số RMSE
Như hình 3.2.31, nhưng với chỉ số RMSE
Như hình 3.2.30, nhưng với chỉ số HSS
Như hình 3.2.31, nhưng với chỉ số HSS
Như hình 3.2.30, nhưng với chỉ số TS
Như hình 3.2.31, nhưng với chỉ số TS
Chỉ số CRF dự báo của dd theo mô hình GSM vào mùa hè 2007,
2008, 2009 (trên) và mùa đông 2006, 2007, 2008 (dưới) với ba
phương pháp DMO, UMOSreg và UMOS
Như hình 3.2.38, nhưng với chỉ số HSS cho ff
Dự báo gió hạn 30 giờ theo GMOS với các mô hình GSM, HRM
theo hai phương pháp UMOS và KF. Quan trắc cũng được hiển thị
với mục đích so sánh.
HSS dự báo của n vào mùa hè 2007 (trái), 2008 (giữa) và 2009
(phải) theo hai mô hình GSM (trên) và HRM (dưới) với ba phương
pháp DMO, KF và UMOS
HSS dự báo của n vào mùa đông 2006 (trái), 2007 (giữa) và 2008
(phải) theo hai mô hình GSM (trên) và HRM (dưới) với ba phương
pháp DMO, KF và UMOS
HSS dự báo của n theo mô hình GSM vào mùa hè 2007, 2008,
2009 (trên) và mùa đông 2006, 2007, 2008 (dưới) với ba phương
pháp DMO, UMOSreg và UMOS
Dự báo lượng mây hạn 12 giờ theo GMOS với các mô hình GSM,
HRM theo hai phương pháp UMOS và KF. Quan trắc cũng được
hiển thị với mục đích so sánh.
Dự báo lượng mây hạn 12 giờ theo GMOS với các mô hình GSM,
HRM theo hai phương pháp UMOS và UMOSreg. Quan trắc cũng
được hiển thị với mục đích so sánh.
Nghiên cứu xây dựng hệ thống dự báo các yếu tố khí tượng bằng phương pháp thống kê
trên sản phẩm mô hình HRM - Hà Nội 2009
108
109
110
111
112
113
114
115
116
117
118
119
120
122
123
124
126
127
129
130
131
viii
Trung Tâm Dự báo KTTV Trung ương
Trung tâm KTTV Quốc Gia
MỤC LỤC
Trang
1
MỞ ĐẦU
1.1
CHƯƠNG I. KHÁI QUÁT VỀ CÁC PHƯƠNG PHÁP UMOS,
LỌC KALMAN VÀ GMOS
3
Lược sử phát triển các phương pháp thống kê sau mô hình
3
1.1.1 Trên thế giới
3
1.1.2 Tại Việt Nam
6
1.2
Cơ sở lý thuyết các phương pháp UMOS, KF và GMOS
1.2.1 UMOS
7
7
1.2.2 Lọc Kalman
12
1.2.3 GMOS (Gridded MOS)
15
CHƯƠNG II. THIẾT KẾ CÁC HỆ THỐNG DỰ BÁO
UMOS, KF VÀ GMOS
19
2.1
Đặt vấn đề
19
2.2
Yếu tố dự báo
20
2.2.1 Các yếu tố dự báo
20
2.2.2 Kiểm tra chất lượng thám sát
22
2.3
Nhân tố dự báo
27
2.4
Phương pháp
31
2.4.1 Xây dựng các phương trình dự báo cho UMOS và KF
31
2.4.2 Thiết kế và xây dựng GMOS
36
2.5
Hậu xử lý
39
2.6
Phương pháp đánh giá
42
2.7
Sản phẩm
44
Nghiên cứu xây dựng hệ thống dự báo các yếu tố khí tượng bằng phương pháp thống kê
trên sản phẩm mô hình HRM - Hà Nội 2009
ix
Trung Tâm Dự báo KTTV Trung ương
Trung tâm KTTV Quốc Gia
CHƯƠNG III. KẾT QUẢ VÀ ĐÁNH GIÁ
3.1
Khảo sát kết quả thực hiện
3.1.1 Khảo sát các phương trình dự báo theo UMOS
49
49
49
3.1.1.1 Phương trình dự báo các yếu tố nhiệt độ: tmax, tmin, t và td
49
3.1.1.2 Phương trình dự báo gió và lượng mây
62
3.1.2 Khảo sát các phương trình dự báo theo lọc Kalman
69
3.2
Đánh giá
3.2.1 Đánh giá dự báo nhiệt độ
79
80
3.2.2 Đánh giá dự báo gió
105
3.2.3 Đánh giá dự báo lượng mây
124
KẾT LUẬN VÀ KIẾN NGHỊ
133
TÀI LIỆU THAM KHẢO
135
PHỤ LỤC
Phụ
lục
Thông tin về các trạm quan trắc khu vực và tập nhân tố dự
báo từ mô hình HRM và GSM
139
Bảng Danh sách 132 trạm quan trắc synốp thuộc 9 khu vực được sử
I.1 dụng trong nghiên cứu dự báo các yếu tố nhiệt độ, gió và lượng
mây
139
Bảng Danh sách các nhân tố dự báo cơ bản từ mô hình HRM và GSM
I.2 được sử dụng để đưa vào các sơ đồ tuyển chọn nhân tố cho các
phương pháp UMOS và KF
141
Nghiên cứu xây dựng hệ thống dự báo các yếu tố khí tượng bằng phương pháp thống kê
trên sản phẩm mô hình HRM - Hà Nội 2009
x
Trung Tâm Dự báo KTTV Trung ương
Trung tâm KTTV Quốc Gia
MỞ ĐẦU
Kể từ năm 2000, khi mô hình số dự báo thời tiết đầu tiên HRM bắt đầu được
đưa vào chạy dự báo tại Việt Nam, cho đến nay có nhiều mô hình khác nhau đang
được chạy nghiên cứu hay dự báo thử nghiệm tại một số Trung tâm tính toán của
Việt Nam như HRM, Eta tại Trung Tâm Dự báo Khí tượng Thủy văn Trung ương,
RAMS, HRM tại Khoa Khí tượng Thủy văn Hải dương học, Đại học Khoa học Tự
nhiên, MM5, WRF tại Viện Khoa học Khí tượng Thủy văn và Môi trường. Trước
đó, kết quả dự báo dưới dạng số từ Cơ quan khí tượng Nhật Bản (JMA) và Cơ quan
khí tượng Úc (BoM) cũng đã nhận được tại Trung Tâm Khí tượng Thủy văn Quốc
gia vào các năm 1997 và 2001. Tuy nhiên, một hệ thống diễn giải dự báo cho các
sản phẩm dự báo từ mô hình vẫn chưa được triển khai tại Việt Nam. Tại những
trung tâm có sử dụng mô hình dự báo, sản phẩm dự báo cuối cùng vẫn là sản phẩm
dự báo trực tiếp từ mô hình, chưa có bất kỳ hiệu chỉnh nào.
Cho đến nay, tập số liệu bề mặt (địa hình, thảm phủ thực vật, sử dụng đất) sử
dụng trong tất cả các mô hình hiện có tại Việt Nam đều được lấy từ tập số liệu toàn
cầu của Mỹ. Tập số liệu này được xác định từ vệ tinh trong những năm 90. Tới thời
điểm hiện nay, với tốc độ phát triển kinh tế xã hội của Việt Nam, tập số liệu này đã
không còn mô tả tốt một số khu vực trên lãnh thổ Việt Nam khi có những biến động
lớn trong khu dân cư tại các đô thị, hay vấn đề sử dụng đất. Ngoài ra, các mô hình
sử dụng đều có nguồn gốc từ các nước ngoại nhiệt đới nên khả năng mô phỏng
chính xác các quá trình nhiệt đới trên khu vực Việt Nam cũng cần được đặt ra. Do
đó, sai số hệ thống tồn tại trong sản phẩm dự báo của mô hình là không thể tránh
khỏi. Bởi vậy một dự báo thống kê như MOS trở nên rất cần thiết nhằm tăng cường
chất lượng dự báo, loại bỏ các sai số hệ thống từ mô hình cũng như điều kiện ban
đầu. Bên cạnh đó, đòi hỏi ngày càng cao của xã hội trong chất lượng dự báo hạn
ngắn cũng thúc đẩy xây dựng dự báo sau mô hình.
Trong nỗ lực tăng cường chất lượng dự báo, đã có một nghiên cứu đầu tiên
trong nước thử nghiệm lọc Kalman vào hiệu chỉnh dự báo từ mô hình (Võ Văn Hòa
và nnk, 2007). Mặc dù phương trình thống kê mà nhóm tác giả này sử dụng còn đơn
giản, kết quả hiệu chỉnh đã cho thấy những cải tiến đáng kể và chỉ ra khả năng phát
triển dự báo thống kê sau mô hình ở Việt Nam. Tiếp tục theo hướng nghiên cứu của
nhóm tác giả trên cũng như hướng nghiên cứu của đề tài cấp Bộ dự báo mưa bằng
MOS và ANN vừa hoàn thành (Bùi Minh Tăng và nnk, 2009), đề tài này tiếp cận
bài toán thống kê sau mô hình theo hai hướng: UMOS và lọc Kalman. Kết quả dự
báo theo hai phương pháp này sau đó sẽ được chuyển lên lưới nhờ một phương
Nghiên cứu xây dựng hệ thống dự báo các yếu tố khí tượng bằng phương pháp thống kê
trên sản phẩm mô hình HRM - Hà Nội 2009
1
Trung Tâm Dự báo KTTV Trung ương
Trung tâm KTTV Quốc Gia
pháp phân tích thích hợp, tạo khả năng dự báo cho một điểm bất kỳ ngoài điểm trạm
(GMOS).
Theo đăng ký trong thuyết minh đề cương, đề tài chỉ sử dụng dự báo từ mô
hình HRM chạy nghiệp vụ tại TTDBTƯ làm nhân tố dự báo. Tuy nhiên, chúng tôi
nhận thấy trong hệ thống MOS dự báo mưa định lượng hiện có tại TTDBTƯ (Bùi
Minh Tăng và nnk, 2009), mọi dự báo MOS từ mô hình HRM luôn có sai số lớn
hơn dự báo tương ứng từ mô hình GSM. Để hướng tới một dự báo tốt hơn, đề tài đã
sử dụng thêm mô hình GSM bên cạnh mô hình HRM. Hệ thống đã được xây
dựng độc lập với mô hình dự báo để có thể sử dụng cho bất kỳ mô hình dự báo
nào, không phụ thuộc riêng cho từng mô hình.
Dựa trên mục tiêu và nội dung công việc đã đăng ký trong bản thuyết minh đề
tài, nội dung của báo cáo tổng kết đề tài được bố cục thành các phần như sau:
Mở đầu
Chương I. Tổng quan về các phương pháp UMOS, lọc Kalman và GMOS
Chương II. Thiết kế các hệ thống dự báo UMOS, lọc Kalman và GMOS
Chương III. Kết quả và đánh giá
Kết luận
Kiến nghị
Tài liệu tham khảo
Phụ lục
Đề tài do các nghiên cứu viên Phòng Nghiên cứu ứng dụng, Trung tâm Dự báo
KTTV Trung ương thực hiện với sự cộng tác chặt chẽ của các đồng nghiệp Đại học
Khoa học tự nhiên, Đại học Quốc gia Hà Nội và sự theo dõi, chỉ đạo kịp thời của
Ban Giám đốc Trung tâm. Nhóm thực hiện đề tài hy vọng những kết quả nghiên
cứu mà đề tài đạt được sẽ có những đóng góp cho công tác dự báo nghiệp vụ cũng
như nghiên cứu phát triển sau này tại Trung tâm Dự báo KTTV Trung ương nói
riêng và Trung tâm KTTV Quốc gia nói chung. Nhân dip này, chủ nhiệm đề tài và
các cộng tác viên xin gửi lời cảm ơn chân thành đến Lãnh đạo Bộ Tài nguyên và
Môi trường, Lãnh đạo Trung tâm KTTV Quốc gia và đặc biệt là Ban Giám đốc
Trung tâm Dự báo KTTV Trung ương đã tạo mọi điều kiện cho chúng tôi hoàn
thành đề tài. Một lần nữa, xin trân trọng cảm ơn.
Nghiên cứu xây dựng hệ thống dự báo các yếu tố khí tượng bằng phương pháp thống kê
trên sản phẩm mô hình HRM - Hà Nội 2009
2
Trung Tâm Dự báo KTTV Trung ương
Trung tâm KTTV Quốc Gia
CHƯƠNG I
TỔNG QUAN VỀ CÁC PHƯƠNG PHÁP UMOS, LỌC KALMAN
VÀ GMOS
1.1. LƯỢC SỬ PHÁT TRIỂN CÁC PHƯƠNG PHÁP THỐNG KÊ SAU MÔ
HÌNH
1.1.1. Trên thế giới
Ngay sau khi có sự xuất hiện của dự báo số, các phương pháp thống kê sau
mô hình đã bắt đầu được áp dụng với phương pháp dự báo hoàn hảo PP (Perfect
Prog) do Klein và nnk (1959) đề xuất. Sau đó một thập niên, Glahn và Lowry
(1972) đề xuất phương pháp thứ hai MOS (Model Output Statistics) chủ yếu dựa
vào kỹ thuật hồi quy tuyến tính đa biến. Ngày nay, MOS được hiểu theo nghĩa rộng
hơn với bất kỳ kỹ thuật thống kê nào có thể áp dụng từ hồi quy logistic, phân tích
riêng biệt cho đến mạng tế bào thần kinh nhân tạo, giải thuật di truyền. MOS theo
như Glahn và Lowry (1972) đề xuất được xem là dự báo MOS truyền thống.
Hai phương pháp này đều có mục đích làm chính xác hơn các kết quả dự báo
từ mô hình và cùng dựa trên phương pháp hồi quy tuyến tính đa biến. Lựa chọn
nhân tố dự báo là khác biệt duy nhất giữa hai phương pháp này. Trong khi PP sử
dụng quan trắc làm nhân tố dự báo thì MOS sử dụng dự báo từ mô hình làm nhân tố
dự báo trong pha traning. Khi áp dụng dự báo, PP xem dự báo từ mô hình như quan
trắc và đưa vào phương trình dự báo. Cho tiết về hai phương pháp này có thể xem
trong Wilks (2006) hoặc Bùi Minh Tăng và nnk (2009).
Khi dự báo số bắt đầu cung cấp những trường dự báo có chất lượng hơn
trong thập kỷ 80, một số các trung tâm dự báo lớn trên thế giới đã xây dựng hệ
thống diễn giải dự báo dựa trên phương pháp MOS, cung cấp dự báo tại các điểm
trạm quan trắc khí tượng như Mỹ (Carter và nnk, 1989), Canada (Brunet và nnk,
1988), Hà Lan (Lemcke và Kruizinga, 1988), Úc (Woodcock, 1984), Anh (Francis
và nnk, 1982). Tuy nhiên, vào những năm 90, người ta bắt đầu nhận thấy những hạn
chế của MOS, dẫn đến giảm dần sử dụng MOS trong diễn giải dự báo. Vấn đề nằm
ở chỗ: khi xây dựng các phương trình hồi quy, tập số liệu mô hình dùng làm nhân tố
dự báo phải đồng nhất. Theo đánh giá của Jacks và nnk (1990) để có được một quan
hệ thống kê ổn định, cần ít nhất hai năm số liệu dự báo từ mô hình và thám sát. Sau
đó khi sử dụng MOS, các đặc trưng của mô hình dự báo như các sơ đồ tham số hóa,
độ phân giải,... cần được giữ nguyên như khi sử dụng mô hình để thiết lập quan hệ
thống kê. Điều này rõ ràng là một hạn chế lớn của MOS, bởi ta biết rằng từ thập kỷ
90 với sự phát triển nhanh của tốc độ tính toán cũng như các hệ thống quan trắc, các
Nghiên cứu xây dựng hệ thống dự báo các yếu tố khí tượng bằng phương pháp thống kê
trên sản phẩm mô hình HRM - Hà Nội 2009
3
Trung Tâm Dự báo KTTV Trung ương
Trung tâm KTTV Quốc Gia
mô hình thường xuyên được cập nhật với độ phân giải ngày càng cao hơn, các sơ đồ
tham số hóa tinh tế hơn, trường phân tích chính xác hơn. Erikson và nnk (2002) cho
ta thấy sai số hệ thống sẽ xuất hiện khi sử dụng MOS với mô hình được cải tiến. Do
đó, khi mô hình có sự thay đổi ta phải đợi ít nhất hai năm mới có thể bắt đầu sử
dụng MOS trong dự báo hoặc dự báo lại với mô hình đã thay đổi cho hai năm trước
đó nhằm xác định lại các hệ số hồi quy. Với số phương trình hồi quy rất lớn (tại mỗi
trạm, cho mỗi biến và mỗi hạn dự báo có một phương trình hồi quy riêng biệt), chi
phí cho tái xây dựng hệ thống MOS khi mô hình thay đổi là khá lớn.
Có thể lấy thí dụ thông qua hệ thống MOS của Mỹ: Hệ thống MOS đầu tiên
được xây dựng cho mô hình LFM vào năm 1976. Đến năm 1990, hệ thống này được
thay thế bởi hệ thống MOS cho mô hình NGM (Jacks và nnk, 1990). Từ năm 1993,
mô hình Eta bắt đầu được đưa vào chạy nghiệp vụ tại NCEP thay thế cho mô hình
LFM. Do mô hình Eta thường xuyên được cải tiến, không có hệ thống MOS nào
được xây dựng cho mô hình này trong suốt những năm 90 (Mao và nnk, 1999). Phải
đến năm 2002, khi hệ thống dự báo với mô hình Eta đã trở nên ổn định, hệ thống
MOS cho Eta mới bắt đầu được thực hiện (Dallavalle và nnk, 2004). Với hệ thống
mới này, các tác giả đã tính đến khả năng mô hình thay đổi trong quá trình sử dụng
MOS bằng cách lựa chọn một lưới tính cố định cho MOS thường có độ phân giải
thô hơn so với độ phân giải mô hình hay làm trơn các nhân tố dự báo (Erikson và
nnk, 2002).
Để giải quyết hạn chế này của phương pháp MOS truyền thống khi mô hình
liên tục có sự thay đổi, người ta sử dụng các phương pháp thống kê có khả năng tự
cập nhật. Thông tin sẽ được truyền vào phương trình dự báo ngay khi có những thay
đổi trong mô hình dự báo. Hiện tại có hai phương pháp cho phép hệ phương trình
dự báo tự cập nhật:
•
Phương pháp thứ nhất: Sử dụng lọc Kalman, thay vì cố định các hệ số
hồi quy trong phương trình hồi quy, các hệ số này sẽ được cập nhật hàng
ngày theo thời gian (Simonsen 1991, Homleid 1995). Cần chú ý rằng tên
gọi lọc Kalman có thể gây hiểu lầm về một phương pháp lọc nhiễu. Thực
tế, lọc Kalman là một phương pháp đánh giá tối ưu trạng thái của một hệ
thống thể hiện qua các biến trạng thái từ các quan trắc gián tiếp (Grewal
và Andrews, 2001).
•
Phương pháp thứ hai: Về cơ bản vẫn sử dụng phương pháp MOS
truyền thống nhưng đưa thêm khả năng tự cập nhật cho MOS thông qua
một phương pháp lấy trọng số giữa hai tập dữ liệu cũ và mới khi có thay
đổi trong mô hình (Wilson và Vallée, 2002) với tên gọi UMOS. Nếu mô
Nghiên cứu xây dựng hệ thống dự báo các yếu tố khí tượng bằng phương pháp thống kê
trên sản phẩm mô hình HRM - Hà Nội 2009
4
Trung Tâm Dự báo KTTV Trung ương
Trung tâm KTTV Quốc Gia
hình không có cải tiến nào đáng kể, UMOS sẽ trở thành phương pháp
MOS thông thường.
Ngoài ra, có một số tác giả đề xuất một số phương pháp mới thay thế cho
MOS với tập số liệu mẫu ngắn hơn (Mao và CS, 1999) hoặc phương pháp phi tuyến
thông qua mạng tế bào thần kinh có khả năng tự cập nhật (Yuval và Hsieh, 2003).
Cần chú ý rằng khi sử dụng các phương pháp phi tuyến thay thế cho phương pháp
hồi quy tuyến tính, vấn đề thay đổi của mô hình khi sử dụng MOS vẫn không được
giải quyết.
Cả hai phương pháp này cùng xuất hiện những năm đầu thập kỷ 90 và
nhanh chóng được các trung tâm dự báo trên thế giới triển khai ứng dụng, đặc biệt
là lọc Kalman. Được đề xuất bởi các tác giả Bắc Âu, lọc Kalman nhanh chóng được
triển khai thực hiện trước tiên tại các nước này như Đan Mạch (Simonsen, 1991),
Nauy (Homleid, 2004) hay Iceland (Crochet, 2004). Sau đó phương pháp này dần
được các nước khác tại châu Âu sử dụng như Pháp (Météo France, 2002), Đức
(Haalman, 2003), Rumani (Diaconu, 2002), Hy Lạp (Golanis và Anadranistokis,
2002), ... Tại các nước Đông Á, lọc Kalman được ứng dụng rất nhiều trong hệ thống
diễn giải dự báo hạn ngắn tại Cơ quan khí tượng Nhật Bản (JMA) và Cơ quan khí
tượng Hàn quốc (KMA). Từ năm 1996, JMA chủ yếu sử dụng lọc Kalman trong
diễn giải kết quả dự báo từ mô hình cho mọi yếu tố khí tượng cơ bản: mưa, gió,
nhiệt độ (JMA, 2006). Tại Hàn Quốc, KMA dự báo cho nhiệt độ cho 40 điểm trạm
tại Hàn Quốc cùng 32 điểm khác tại CHDC ND Triều Tiên, Trung Quốc và Nhật
Bản theo phương pháp lọc Kalman và một biến thể của nó là DLM (Joo, 2006).
Riêng với phương pháp UMOS, dù được phát triển tại Mỹ nhưng lại được ứng dụng
tại Canada (Wilson và Vallée, 2002, 2003). Hiện tại, Mỹ vẫn chủ yếu sử dụng
phương pháp MOS truyền thống nhưng đã bắt đầu triển khai theo hai hướng GMOS
và EMOS.
Hiện tại, MOS đang được tiếp tục phát triển theo hai hướng mới là GMOS
(dự báo thống kê sau mô hình trên lưới) và EMOS (dự báo thống kê sau mô hình tổ
hợp). Nếu như theo phương pháp MOS, thông thường ta chỉ xây dựng phương trình
dự báo tại trạm, sau đó cũng đưa ra dự báo tại điểm trạm thì GMOS hướng đến sử
dụng MOS dự báo trên lưới (Dallavalle và Glahn, 2005). Nếu như thám sát được
cho trên lưới thì GMOS chính là phương pháp MOS thông thường. Nếu các thám
sát phân bố không đều, sau khi có dự báo MOS tại trạm, sử dụng các kỹ thuật phân
tích hai chiều như Cressman hay Barnes người ta sẽ chuyển các dự báo này về lưới.
Như vậy, GMOS có thể cho ta dự báo từ MOS tại bất kỳ điểm nào, không cố định
tại các điểm trạm như MOS, đây chính là lợi thế của phương pháp này. Với
Nghiên cứu xây dựng hệ thống dự báo các yếu tố khí tượng bằng phương pháp thống kê
trên sản phẩm mô hình HRM - Hà Nội 2009
5
Trung Tâm Dự báo KTTV Trung ương
Trung tâm KTTV Quốc Gia
EMOS, thay vì sử dụng MOS cho một mô hình, người ta sử dụng các phương pháp
thống kê dựa trên dự báo từ nhiều mô hình (Wilks và Hamill, 2007). So với MOS,
EMOS không cần sử dụng một tập số liệu mẫu dài lại có khả năng đưa ra được
phân bố xác suất của biến dự báo. Hơn nữa, phương trình dự báo sử dụng chỉ cần
lấy trung bình đơn giản đã có thể đem lại kết quả dự báo tốt tương đương với MOS.
Có thể nói EMOS sẽ là hướng phát triển mạnh trong tương lai.
1.1.2. Tại Việt Nam
Việt Nam hiện mới chỉ có khả năng áp dụng các phương pháp thống kê sau
mô hình đã được nghiên cứu trên thế giới vào bài toán cụ thể của mình, chưa có khả
năng đóng góp nghiên cứu về mặt phương pháp luận. Trước năm 1997, trong
nghiệp vụ dự báo hàng ngày, chủ yếu sử dụng phương pháp synop để dự báo hình
thế thời tiết. Một số các công cụ trên cơ sở phương pháp thống kê truyền thống
cũng được xây dựng, nhưng phần lớn là những phương trình hồi qui đơn giản áp
dụng cho một vài điểm, chỉ để dự báo một số nhân tố truyền thống như mưa, nhiệt
độ, vận tốc gió, và phần lớn là áp dụng cho những dự báo hạn vừa và dài (Nguyễn
Văn Tuyên, 1988, 1999).
Từ năm 1997 trở lại đây, trên cơ sở hợp tác song phương, Trung Tâm dự báo
KTTV Trung ương đã thu được một số sản phẩm dự báo của các mô hình số từ
JMA, cơ quan khí tượng Úc (BoM) và một vài Trung tâm khí tượng khác chủ yếu
dưới dạng bản đồ. Đến năm 2002, tại TTDDBTƯ bắt đầu chạy nghiệp vụ mô hình
số phân giải cao HRM. Trong các năm từ 2001 đến 2002 tại TTDBTƯ đã tiến hành
thực hiện đề tài “Nghiên cứu ứng dụng phương pháp dự báo lượng mưa dựa trên
sản phẩm mô hình dự báo số trị của Nhật”. Tuy nhiên, đây không phải là phương
pháp thống kê mà chỉ đơn thuần là một mô hình tính toán lượng mưa dẫn xuất dựa
trên các biến dự báo từ mô hình thông qua một vài phương trình vật lý (Đỗ Lệ Thủy
và nnk, 2002).
Sau những năm đặt trọng tâm phát triển mô hình dự báo từ năm 2000,
những năm gần đây, các nghiên cứu về dự báo thống kê sau mô hình mới bắt đầu
được triển khai với công trình đầu tiên của Bùi Minh Tăng và nnk (2009). Các tác
giả này đã áp dụng một số kỹ thuật thống kê theo nghĩa MOS mở rộng (không đơn
thuần là hồi quy tuyến tính) vào dự báo yếu tố lượng mưa 24 giờ đầu từ mô hình số
trị. Các kết quả thu được là rất đáng khích lệ dù nghiên cứu có nhược điểm xem như
mô hình dự báo không thay đổi theo thời gian. Nhược điểm này có thể không
nghiêm trọng với các trung tâm dự báo lớn khi có thể chạy lại mô hình sau khi thay
đổi nhưng với Việt Nam sẽ là một vấn đề lớn do Việt Nam phụ thuộc vào dự báo từ
mô hình toàn cầu của các trung tâm khác. Các phương pháp dự báo sau mô hình có
Nghiên cứu xây dựng hệ thống dự báo các yếu tố khí tượng bằng phương pháp thống kê
trên sản phẩm mô hình HRM - Hà Nội 2009
6
Trung Tâm Dự báo KTTV Trung ương
Trung tâm KTTV Quốc Gia
khả năng tự cập nhật như UMOS, lọc Kalman hay tổ hợp như EMOS hứa hẹn sẽ
đem lại những giải pháp cho vấn đề này và Việt Nam nên đi theo các hướng nghiên
cứu này nếu muốn xây dựng hệ thống diễn giải dự báo. Trên thực tế trước đó, Võ
Văn Hòa và nnk (2007) đã có một nghiên cứu nhỏ thử nghiệm lọc Kalman hiệu
chỉnh dự báo nhiệt từ mô hình.
1.2. CƠ SỞ LÝ THUYẾT CÁC PHƯƠNG PHÁP UMOS, KF VÀ GMOS
1.2.1. UMOS
Theo như cách tiếp cận truyền thống của MOS (hồi quy tuyến tính đa biến)
không dễ để có thể đưa ý tưởng cập nhật vào phương pháp, nếu chỉ nhìn MOS ở
khía cạnh toán học quen thuộc của nó. Bài toán hồi quy tuyến tính đa biến MOS sử
dụng có dạng như sau: xác định tập p+1 các hệ số tự do ai của phương trình dự báo
yếu tố Y theo tập p các nhân tố dự báo Xi:
Y= a0 + a1X1+ … + apXp
(1.2.1)
từ tập số liệu quá khứ và áp dụng dự báo tương lai. Các hệ số ai sẽ được xác định
theo phương pháp bình phương tối thiểu dựa trên tập số liệu training dung lượng
mẫu n. Viết dưới dạng ma trận, công thức tính vector hệ số ai có dạng sau:
a = (XTX)-1XTy
(1.2.2)
trong đó y là vector yếu tố dự báo kích thước n, X là ma trận nhân tố dự báo kích
thước (p+1)×n, với mỗi vector cột, tương ứng vector nhân tố dự báo kích thước n.
MOS không cố định trước tập p các nhân tố mà thực hiện hồi quy từng bước với p
tăng dần từ 1 cho đến một giá trị nào đó thỏa mãn tiêu chuẩn dừng. Tại mỗi bước,
bài toán hồi quy mà MOS thực hiện hoàn toàn đồng nhất với mô tả toán học ở trên.
Nếu thực hiện như đã mô tả ở trên, khi muốn cập nhật phương trình dự báo
1.2.1 với tập số liệu training đã được mở rộng thêm từ n lên n+m (m là số ngày mới
tích lũy thêm dữ liệu), toàn bộ quá trình phải được thực hiện lại từ đầu với hồi quy
từng bước và tại mỗi bước phải giải các hệ phương trình tuyến tính 1.2.2. Với tập
các nhân tố có thể vào khoảng 200, tại mỗi bước ta phải giải 200 hệ phương trình
tuyến tính 1.2.1. Thông thường, mỗi phương trình dự báo sau khi thỏa mãn điều
kiện dừng có khoảng 10 nhân tố, số lần giải phương trình sẽ là 2000 lần. Nhân lên
với số trạm cần cập nhật, chi phí tính toán cho mỗi lần cập nhật sẽ rất lớn. Với tốc
độ máy tính hiện nay, khối lượng tính toán như trên có thể giảm thiểu nếu thực hiện
tính toán song song cho nhiều trạm tại cùng một thời điểm. Khó khăn thực sự nằm ở
phương thức thiết kế, lưu trữ và sử dụng số liệu cho bài toán cập nhật.
Với những vấn đề cố hữu như trên, các trung tâm thường không thực hiện
cập nhật phương trình dự báo theo ngày hay theo tháng mà thực hiện một lần duy
nhất rồi áp dụng cho các năm kế tiếp hoặc cập nhật theo từng năm. Với dung lượng
Nghiên cứu xây dựng hệ thống dự báo các yếu tố khí tượng bằng phương pháp thống kê
trên sản phẩm mô hình HRM - Hà Nội 2009
7
Trung Tâm Dự báo KTTV Trung ương
Trung tâm KTTV Quốc Gia
tập training đủ dài, cách thực hiện như vậy vẫn đảm bảo một kết quả tốt do phương
trình dự báo sẽ ổn định trên một tập dữ liệu đủ dài. Tất nhiên, nếu tận dụng được tập
số liệu mới để tăng dung lượng tập training, phương trình dự báo thu được sẽ có
chất lượng tốt hơn.
Với các nghiên cứu của mình, Ross (1987, 1989, 1992) và sau đó là Wilson
và Vallee (2002) đã chỉ ra rằng vẫn có thể thực hiện cập nhật cho MOS mà chi phí
tính toán không lớn nếu thực hiện theo cách thông thường. Ý tưởng cập nhật được
hình thành dựa trên biểu diễn lại dạng toán học của phương pháp hồi quy tuyến tính
đa biến. Từ công thức (1.2.2) dễ thấy vector a được xác định thông qua ma trận
XTX kích thước (p+1)×(p+1) và vector XTy kích thước p+1. Mỗi phần tử Mij của
ma trận XTX chỉ đơn giản là tích vô hướng giữa hai vector nhân tố dự báo kích
thước n thứ i và j, trong khi mỗi phần tử Vi của vector XTy là tích vô hướng giữa
vector nhân tố dự báo kích thước n thứ i với vector yếu tố dự báo kích thước n.
n
Mij= ∑ X ik X kj
(1.2.3)
k =1
n
Vi= ∑ X ik Yk
(1.2.4)
k =1
Các phần tử này có đặc tính cộng, nghĩa là khi dung lượng mẫu tăng lên n+1,
các phần tử Mij hay Vi có thể xác định rất đơn giản bằng cách cộng thêm số hạng
X(i,n+1)X(j,n+1) và X(i,n+1)Y(n+1) vào giá trị trước đó mà không cần phải tính lại
toàn bộ cho n+1 số hạng. Khả năng cập nhật rõ ràng đã thể hiện ngay trong phân
tích trên. Nếu muốn cập nhật, thay vì phải lưu chuỗi dữ liệu Xi hay Y với kích
thước n tăng lên từng ngày, bài toán sẽ đơn giản hơn, nếu ta chỉ cần lưu các phần tử
Mij và Vi và thay đổi giá trị của chúng từng ngày bằng cách cộng thêm một số hạng
mới vào như trên. Cách thực hiện này sẽ tiết kiệm dung lượng lưu trữ với một ma
trận và một vector kích thước không thay đổi (p+1)×(p+1) và p+1 so với ma trận
nhân tố dự báo và vector yếu tố dự báo có dung lượng n tăng dần. Các hệ số ai cuối
cùng vẫn hoàn toàn được xác định theo công thức (1.2.2) của bài toán hồi quy tuyến
tính đa biến.
Tuy nhiên, bằng cách thay đổi điểm nhìn như vậy, phương pháp mới đòi hỏi
tập các nhân tố p phải được xác định trước. Đây là chi phí phải trả cho việc đưa ý
tưởng cập nhật vào MOS. Điều này cũng đồng nghĩa quá trình hồi quy từng bước sẽ
không được thực hiện và các nhân tố dự báo phải cố định giống như trong phương
pháp lọc Kalman. Một quá trình sơ tuyển cần được thực hiện tuyển chọn trước các
nhân tố này. Thông thường p vào khoảng 10 và dung lượng lưu trữ được sử dụng
cập nhật phương trình dự báo cho một trạm sẽ rất nhỏ với 132 số thực (11×11+11).
Nghiên cứu xây dựng hệ thống dự báo các yếu tố khí tượng bằng phương pháp thống kê
trên sản phẩm mô hình HRM - Hà Nội 2009
8
- Xem thêm -