PHÂN TÍCH VÀ DỰ BÁO
THỐNG KÊ
(Dành cho Cao học Khí tượng)
Phan Văn Tân
Thời lượng và phương pháp tiếp cận
•
•
•
•
3 Tín chỉ = 45 tiết TC
Giới thiệu qua bài giảng
Đọc tài liệu
Làm bài tập tiểu luận
Nội dung
1. Một số kiến thức cơ bản về lý thuyết hàm ngẫu
nhiên
2. Các mô hình thống kê ứng dụng trong khí tượng
3. Các phương pháp PP (Perfect Prognosis), MOS
(Model Output Statistics) và ứng dụng trong dự
báo thời tiết, khí hậu
4. Dự báo khí hậu bằng phương pháp thống kê
5. Phương pháp thống kê trong nghiên cứu dao
động và biến đổi khí hậu – Phân tích chuỗi thời
gian
Tài liệu tham khảo
• Phan Văn Tân: Các phương pháp thống kê trong khí hậu.
NXB ĐHQGHN, 2003
• Trần Tân Tiến, Nguyễn Đăng Quế: Xử lý số liệu khí tượng
và dự báo thời tiết bằng phương pháp thống kê vật lý. NXB
ĐHQGHN, 2002
• Daniel S. Wilks: Statistical methods in the Atmospheric
Sciences - An Introduction. Academic Press, 1995, 465 pp
• Harry R. Glahn, Allan H. Murphy, Laurence J. Wilson,
John S. Jensenius: Lectures presented at the WMO
training workshop on the interpretation of NWP products in
terms of local weather phenomena and their verification
(Wageningen, the Netherlands, 29 July-9 August 1991).
PSPM No 34, WMO/TD No 421, 1991
• Hans von Storch and Francis W. Zwiers: Statistical
Analysis in Climate Research. Cambridge University Press
(Virtual Publishing) 2003, 484 pp
• Phan Văn Tân: Ngôn ngữ lập trình Fortran 90. NXB
ĐHQGHN, 2006
Tài liệu tham khảo
• Kazakevits: Cơ sở lý thuyết hàm ngẫu nhiên và
ứng dụng trong khí tượng thủy văn. NXB ĐHQG,
2005, (Bản dịch của Phan Văn Tân, Phạm Văn
Huấn và Nguyễn Thanh Sơn)
• Peter Dunn: Statistics for Climate Research.
Faculty of Sciences. The University of Southern
Queensland
• Ben Kroese, Patrick van der Smagt: An
introduction to Neural Networks. Eighth edition,
The University of Amsterdam, 1996
• Welch & Bishop: An Introduction to the Kalman
Filter. http://www.cs.unc.edu/~welch
Nội dung
1. Một số kiến thức cơ bản về lý thuyết hàm ngẫu
nhiên
2. Các mô hình thống kê ứng dụng trong khí tượng
3. Các phương pháp PP (Perfect Prognosis), MOS
(Model Output Statistics) và ứng dụng trong dự
báo thời tiết, khí hậu
4. Dự báo khí hậu bằng phương pháp thống kê
5. Phương pháp thống kê trong nghiên cứu dao
động và biến đổi khí hậu
HÀM NGẪU NHIÊN
1 Khái lược về quá trình ngẫu nhiên
Định nghĩa hàm ngẫu nhiên
• Một hàm mà kết quả của mỗi lần thí nghiệm được tiến hành trong
những điều kiện như nhau, có thể có các dạng khác nhau, không
biết trước được cụ thể, được gọi là hàm ngẫu nhiên
♦ Hàm không ngẫu nhiên thu được do kết quả của mỗi thí
nghiệm được gọi là thể hiện của hàm ngẫu nhiên
♦ Mỗi lần lặp lại thí nghiệm ta lại nhận được một thể hiện mới
♦ Ký hiệu hàm ngẫu nhiên bằng các chữ cái lớn kèm theo đối số:
X(t), Y(t), còn các thể hiện của nó là các chữ cái nhỏ: x1(t),
x2(t),…, xn(t) với các chỉ số nêu rõ lần thí nghiệm mà thể hiện
trên nhận được.
♦ Lát cắt của hàm ngẫu nhiên tại giá trị đối số to được ký hiệu là
X(t0)
• Trong khí tượng: Phân biệt Trường ngẫu nhiên và Quá trình ngẫu
nhiên
HÀM NGẪU NHIÊN
1 Khái lược về quá trình ngẫu nhiên
Định nghĩa hàm ngẫu nhiên
• Tập hợp các giá trị
của X(t) tại t=t0 lập
thành tập các giá trị
có thể của một đại
lượng ngẫu nhiên,
ký hiệu là X(t0)
• Lát cắt X(t0) là một
đại lượng ngẫu
nhiên
• Thành phần vĩ hướng của vectơ gió tại các trạm theo thời gian như
là hàm ngẫu nhiên của đối số thời gian
• Mỗi đường cong như là một thể hiện
• Với t0=48h ta có X(t0) là một lát cắt
HÀM NGẪU NHIÊN
1 Khái lược về quá trình ngẫu nhiên
Các qui luật phân bố quá trình nhẫu nhiên
• Xét quá trình ngẫu nhiên X(t) với n lát cắt t1, t2,…, tn.
X1 = X (t1 ), X 2 = X (t2 ),..., X n = X (tn )
• Khi đó, một cách gần đúng, X(t) có thể được đặc trưng bởi hàm
phân bố của hệ X1,…, Xn:
Fn (x1 , x2 ,..., xn ) = P( X 1 < x1 , X 2 < x2 ,..., X n < xn )
= P( X (t1 ) < x1 ,..., X (tn ) < xn ) = Fn (x1 , x2 ,..., xn ; t1 , t2 ,..., tn )
• Các giá trị của đối số ti càng phân bố gần nhau, số lát cắt n càng
lớn thì hàm phân bố đặc trưng cho quá trình ngẫu nhiên càng đầy
đủ hơn
HÀM NGẪU NHIÊN
1 Khái lược về quá trình ngẫu nhiên
Các qui luật phân bố quá trình nhẫu nhiên
• Hàm phân bố một chiều: n=1
F1 (x, t ) = P( X (t ) < x)
• Hàm phân bố hai chiều: n=2
F2 (x1, x2 ; t1, t2 ) = P( X (t1 ) < x1, X (t2 ) < x2 )
• Hàm phân bố n chiều:
Fn (x1, x2 ,..., xn ; t1, t2 ,..., tn ) = P( X (t1 ) < x1,..., X (tn ) < xn )
HÀM NGẪU NHIÊN
1 Khái lược về quá trình ngẫu nhiên
Các qui luật phân bố quá trình nhẫu nhiên
• Hàm mật độ một chiều: n=1
∂F1 (x, t )
f1 (x, t ) =
∂x
• Hàm mật độ hai chiều: n=2
∂F2 (x1 , x2 ; t1 , t2 )
f 2 (x1 , x2 ; t1 , t2 ) =
∂x1∂x2
• Hàm mật độ n chiều:
∂Fn (x1 , x2 ,..., xn ; t1 , t2 ,..., tn )
f n (x1 , x2 ,..., xn ; t1 , t2 ,..., tn ) =
∂x1∂x2 ...∂xn
HÀM NGẪU NHIÊN
1 Khái lược về quá trình ngẫu nhiên
Các đặc trưng của quá trình nhẫu nhiên
Mômen gốc:
• Mômen gốc bậc i1 + i2 + ... + in của quá trình ngẫu nhiên là kỳ
vọng toán học của tích các luỹ thừa tương ứng của các lát cắt khác
nhau của quá trình ngẫu nhiên
i1 , i2 ,..., in ∈ N
mi i ...i (t1, t2 ,..., tn ) = M [X (t1 )] i1[X (t2 )] i2...[X (tn )] in
12
n
Khi i1 + i2 + ... + in = 1 :
{
}
m10..0 (t1 ) ≡ m1 (t ) = M [X (t )] ≡ mx (t )
mx (t ) = M [X (t )] gọi là kỳ vọng của quá trình ngẫu nhiên X(t)
• Kỳ vọng của quá trình ngẫu nhiên X(t) là một hàm không ngẫu
nhiên của đối số t
+∞
mx ( t ) =
∫ xf ( x, t )dx
1
−∞
HÀM NGẪU NHIÊN
1 Khái lược về quá trình ngẫu nhiên
Các đặc trưng của quá trình nhẫu nhiên
mx(t1)
mx(t2)
mx(t)
t1
t2
• Có thể hình dung kỳ vọng như là đường trung bình đi qua tập các
thể hiện
• Ứng với mỗi giá trị đối số t cố định, mx(t) là kỳ vọng của lát cắt
X(t)
HÀM NGẪU NHIÊN
1 Khái lược về quá trình ngẫu nhiên
Các đặc trưng của quá trình nhẫu nhiên
Mômen gốc:
[
m2,0 (t1 ) ≡ m2,0 (t ) = M X 2 (t )
Khi i1 + i2 + ... + in = 2 :
]
m1,1 ( t1, t2 ) = M [X (t1 ) X (t2 )]
+∞
m2,0 (t ) =
2
x
∫ f1 ( x, t )dx
−∞
+∞
m1,1 (t1, t2 ) =
∫xx
f ( x1, x2 ; t1, t2 )dx1dx2
1 2 2
−∞
• Các mômen gốc bậc cao thường được sử dụng trong tính toán
trung gian
HÀM NGẪU NHIÊN
1 Khái lược về quá trình ngẫu nhiên
Các đặc trưng của quá trình nhẫu nhiên
Quá trình ngẫu nhiên qui tâm:
• Hiệu giữa quá trình ngẫu nhiên và kỳ vọng của nó gọi là quá trình
ngẫu nhiên qui tâm 0
X (t ) = X (t ) − mx (t )
0
⎡
M ⎢ X (t )⎤⎥ = M [ X (t ) − mx (t )] = M [ X (t )] − M [mx (t )] = mx (t ) − mx (t ) = 0
⎣
⎦
HÀM NGẪU NHIÊN
1 Khái lược về quá trình ngẫu nhiên
Các đặc trưng của quá trình nhẫu nhiên
Mômen trung tâm:
• Mômen trung tâm bậc i1 + i2 + ... + in của quá trình ngẫu nhiên là
kỳ vọng toán học của tích các luỹ thừa tương ứng của các lát cắt
khác nhau của quá trình ngẫu nhiên qui tâm
i1 0
i2
in
0
⎧ ⎡ 0
⎫
⎤
⎡
⎤
⎡
⎤
µi1i2 ...in (t1, t2 ,..., tn ) = M ⎨ ⎢ X (t1 )⎥ ⎢ X (t2 )⎥ ...⎢ X (tn )⎥ ⎬
⎦ ⎣
⎦ ⎣
⎦ ⎭
⎩ ⎣
(i1 , i2 ,..., in ∈ N )
Khi i1 + i2 + ... + in = 1 :
0
⎡
µ10..0 (t1 ) ≡ µ1 (t ) = M ⎢ X (t )⎤⎥ = 0
⎣
⎦
HÀM NGẪU NHIÊN
1 Khái lược về quá trình ngẫu nhiên
Các đặc trưng của quá trình nhẫu nhiên
Mômen trung tâm:
Khi i1 + i2 + ... + in = 2 :
⎡⎛ 0 ⎞2 ⎤
µ20 (t ) = M ⎢⎜ X (t ) ⎟ ⎥ = M (X (t ) − mx (t ) )2 ≡ Dx (t )
⎠ ⎦
⎣⎝
Dx(t) gọi là phương sai của quá trình ngẫu nhiên X(t)
[
]
σ x (t ) = Dx (t ) gọi là độ lệch chuẩn của quá trình ngẫu nhiên X(t)
0
0
⎡
µ11 (t1 , t2 ) = M ⎢ X (t1 ) X (t2 )⎤⎥ = M [( X (t1 ) − mx (t1 ) )( X (t2 ) − mx (t2 ) )] ≡ Rx (t1 , t2 )
⎣
⎦
Rx(t1,t2) gọi là hàm tương quan của quá trình ngẫu nhiên X(t)
• Phương sai Dx(t) và hàm tương quan Rx(t1,t2) là những hàm
không ngẫu nhiên
HÀM NGẪU NHIÊN
1 Khái lược về quá trình ngẫu nhiên
Các đặc trưng của quá trình nhẫu nhiên
Mômen trung tâm:
• Ta có:
+∞
Dx (t ) = M [( X (t ) − mx (t ))2 ] = ∫ ( x − mx (t ))2 f1 ( x, t )dx
−∞
Rx (t1 , t2 ) = M [( X (t1 ) − mx (t1 ) )( X (t2 ) − mx (t2 ) )]
+ ∞+ ∞
=
∫ ∫ (x
1
− mx (t1 ))( x2 − mx (t2 )) f 2 ( x1 , x2 ; t1 , t2 )dx1dx2
−∞− ∞
• Để tính hàm tương quan cần biết mật độ phân bố hai chiều
HÀM NGẪU NHIÊN
1 Khái lược về quá trình ngẫu nhiên
Các đặc trưng của quá trình nhẫu nhiên
Mômen trung tâm:
• Phương sai Dx(t) (hoặc độ lệch chuẩn σx(t)) đặc trưng cho mức
độ tản mạn của quá trình ngẫu nhiên X(t) xung quanh kỳ vọng
mx(t)
• Hàm tương quan Rx(t1,t2) đặc trưng cho mức độ quan hệ tương
quan tuyến tính giữa hai lát cắt t1 và t2 của quá trình ngẫu nhiên
X(t)
• Vì thứ nguyên của hàm tương quan Rx(t1,t2) bằng bình phương
thứ nguyên của X(t), nên thay cho Rx(t1,t2) người ta thường sử
dụng hàm tương quan chuẩn hóa:
Rx (t1, t2 )
Rx (t1, t2 )
rx (t1, t2 ) =
=
Dx (t1 ) Dx (t2 ) σ x (t1 )σ x (t2 )
HÀM NGẪU NHIÊN
1 Khái lược về quá trình ngẫu nhiên
Các đặc trưng của quá trình nhẫu nhiên
Mômen trung tâm:
• Ta có
2
0
⎡
⎤
⎡
⎤
⎛
⎞
Khi t1 = t2 ≡ t : Rx (t1, t2 ) = Rx (t, t ) = M ⎢ X (t ) X (t )⎥ = M ⎢⎜ X (t ) ⎟ ⎥ = Dx (t )
⎣
⎦
⎠ ⎦
⎣⎝
Rx (t, t )
Dx (t )
Dx (t )
rx (t1, t2 ) = rx (t, t ) =
=
=
=1
Dx (t ) Dx (t ) σ x (t )σ x (t ) Dx (t )
0
0
0
0
0
0
⎡
⎤
⎡
Rx (t1 , t2 ) = M ⎢ X (t1 ) X (t 2 )⎥ = M ⎢ X (t2 ) X (t1)⎤⎥ = Rx (t2 , t1 )
⎣
⎦
⎣
⎦
⇒ rx (t1 , t2 ) = rx (t2 , t1 )
Hàm tương quan và hàm tương quan chuẩn hóa là những
hàm đối xứng đối với các đối số
- Xem thêm -