1
MỞ ĐẦU
Về lịch sử, các bài toán điều khiển tối ưu (ĐKTƯ) tất định ra đời sớm nhất-gắn với
tên tuổi của Pontriagin (1959), Bellman (1957). Do tầm quan trọng của bài toán này
trong các lãnh vực điều khiển học, khoa học-kỹ thuật, quản lý kinh tế-tài chính...nên
việc nghiên cứu các mô hình ĐKTƯ mới cùng với phương pháp giải trong từng lĩnh
vực đã và đang được nhiều tác giả trong hoặc ngoài nước quan tâm. Theo truyền
thống, các phương pháp tất định của quy hoạch lồi được sử dụng trước tiên để giải
các bài toán ĐKTƯ lồi kinh điển (hệ động lực tuyến tính theo biến trạng thái và
điều khiển, hàm mục tiêu và tập hợp các điều khiển chấp nhận được (CNĐ) là lồi).
Đương nhiên, nếu bài toán ĐKTƯ không có tính lồi thì các công cụ trên không còn
hiệu lực và trở thành lý do mà cho đến những năm gần đây, G. Zhao, M. Davison
(2009), Y. Kyung, J. Kim, S. Jung, K. Eom (2010)... vẫn phải dùng đến các phương
pháp heuristic để giải bài toán này. Các phương pháp của quy hoạch phi tuyến cũng
đã được T.D. Quốc, C. Savorgman (2009), T.D. Quoc, M. Diehl (2010)... sử dụng,
nhưng chỉ để giải bài toán ĐKTƯ rời rạc và cũng chỉ tìm được nghiệm tối ưu (TƯ) địa
phương. Khi mở rộng khái niệm hội tụ từ tất định sang ngẫu nhiên (hội tụ hầu chắc
chắn (hcc)) của lời giải xấp xỷ khi giải số bài toán ĐKTƯ không lồi, các phương pháp
Monte Carlo (PPMC) đã được T. Cảnh, M.V. Được, T. Đ. Quỳ (2008), W. Jiekang,
Z. Jianquan, C. Groutong, Z. Hongliang (2008), N.Q. Hỷ, M.V. Được (2009), M.V.
Được, N.Q. Hỷ (2010) sử dụng để giải 1 số dạng riêng biệt của loại bài toán trên.
Bản luận án này nhằm mục đích góp phần sử dụng PPMC để giải 2 lớp mới trong
số các bài toán ĐKTƯ không lồi. Đây là 2 lớp tổng quát hóa của bài toán Mayer
không lồi có (hoặc không) ràng buộc trạng thái và chúng không những là các lớp đủ
rộng trong các bài toán ĐKTƯ không lồi (vì các bài toán Lagrange, Bolza không lồi
đều có thể chuyển về các dạng này), mà còn là những dạng tổng quát hóa của mô
hình hợp lý cực đại (HLCĐ) kinh điển (được chúng tôi gọi là Mô hình HLCĐ liên tục
hóa), khi nghiên cứu 2 bài toán ngẫu nhiên mới về dự báo động đất.
Gắn với mục tiêu nghiên cứu trên, các kết quả chính của Luận án bao gồm:
- Thiết lập mới 2 lớp Bài toán Mayer suy rộng (hoặc mở rộng) không (hoặc có) ràng
2
buộc trạng thái, với mục tiêu và tập các điều khiển CNĐ không lồi, hệ động lực phi
tuyến gồm phương trình vi phân (PTVP) và đạo hàm riêng thường (hoặc suy rộng).
- Sử dụng PPMC để xây dựng các dãy nghiệm ngẫu nhiên hội tụ hcc theo mục tiêu về
nghiệm TƯ của các bài toán Mayer không lồi nói trên và đánh giá sai số tương ứng.
- Xây dựng khái niệm về "mô hình HLCĐ liên tục hóa" dưới dạng các bài toán Mayer
không lồi này và dùng các kết quả trên để xác định các tham biến của quá trình động
đất liên quan đến việc Giảm thiểu độ rủi ro động đất (RRĐĐ) cho CTTĐ Sơn La.
Các nội dung này đã được công bố trong các bài báo [1] (Tạp chí KH & CN, ĐH
Thái nguyên), [2], [3], [4] (Tạp chí Ứng dụng Toán học) và các báo cáo khoa học tại
Hội nghị Quốc gia và hội nghị Quốc tế; Đồng thời đươc trình bày trong 3 chương cuối
của luận án, theo bố cục sau:
CHƯƠNG 1
Một số công cụ giải tích và ngẫu nhiên có liên quan
Giới thiệu một số công cụ liên quan đến việc trình bày luận án trong các chương sau,
trong đó: Phương trình vi phân thường (và suy rộng), mô hình HLCĐ dùng để đặt
bài toán ĐKTƯ từ 1 thực tế ứng dụng; Các phương pháp số trong ĐKTƯ và mô hình
dò tìm ngẫu nhiên (DTNN) dùng để giải bài toán
CHƯƠNG 2
Thuật toán Monte Carlo giải bài toán Mayer suy rộng không lồi
Trong chương này, 1 dạng mở rộng của bài toán Mayer không lồi và không ràng buộc
(trạng thái) thông thường là Bài toán Mayer suy rộng không lồi được thiết lập (trong
Mục 2.1), với hệ động lực phi tuyến là PTVP và đạo hàm riêng suy rộng, hàm mục
tiêu không lồi. Việc sử dụng phương pháp sai phân để rời rạc hóa bài toán này được
xét trong Mục 2.2, gắn với sự hội tụ theo mục tiêu của nghiệm bài toán rời rạc về
nghiệm TƯ của bài toán Mayer suy rộng nói trên. Khi đó, ta có thể sử dụng PPMC
để lập (trong Mục 2.3) các dãy nghiệm ngẫu nhiên hội tụ hcc theo mục tiêu về nghiệm
TƯ của bài toán ban đầu, gắn với công thức đánh giá sai số tương ứng.
Nội dung của chương này đã công bố trong các công trình [2] của tác giả.
3
2.1. Đặt bài toán
Xét điều khiển u : [so, T2 ] → Rm liên tục từng khúc trong Bài toán Mayer suy rộng:
(2.1.1)
J (u) := f o y(T1), z(T1 , T2 ) → inf,
ẏ(t) = g1 y(t), z(t, T2), t (to < t ≤ T1 ), y(to) = yo ,
∂z(t, s)
∂s
(2.1.2)
= g2 z(t, s), u(s), t, s (so < s ≤ T2 ), z(t, so) = zo(t) (to ≤ t ≤ T1 ),
u ∈ U := {u : [so, T2 ] → Ω | liên tục từng khúc}.
(2.1.3)
(2.1.4)
trong đó đã cho: yo ∈ Rn1 , Ω ⊂ Rm , các hàm zo, gi (i = 1 ÷ 2) và các đạo hàm được hiểu
theo nghĩa suy rộng. Gắn với các miền Ωz , Ωy chứa tất cả các giá trị có thể của lần
lượt các nghiệm z(t, s), y(t) = y(t; u) (∀u ∈ U, t ∈ [to, T1], s ∈ [so, T2 ) là các giả thiết:
(A1 )- Hàm g1 : Rn1 × Rn2 × [to, T1] → Rn1 thỏa mãn điều kiện Lipschitz :
(1) 0
(1) 0
0
kg1 (y 0 , z 0 , t0 ) − g1 (y”, z”, t”)k ≤ L(1)
y ky − y”k + Lz kz − z”k + Lt |t − t”|
(∀y 0 , y”
∈ Ωy ⊂
Rn1
;
z 0 , z”
∈ Ωz ⊂
Rn2
;
t0 , t”
(2.1.5)
∈ [to, T1]).
(B1 )- Hàm g2 : Rn2 × Rm × [to, T1 ] × [so, T2] → Rn2 thỏa mãn điều kiện Lipschitz :
(2)
(2)
(2)
kg2 (z 0 , u0 , t, s0 ) − g2 (z”, u”, t, s”)k ≤ Lz kz 0 − z”k + Lu ku0 − u”k + Ls |s0 − s”|
(∀z 0 , z” ∈ Ωz ; u0 , u” ∈ Ω; t ∈ [to, T1]); s0 , s” ∈ [so, T2 ])
(2.1.6)
với các hàm g2 (z, u, t, s), zo(t) ∈ Rn2 liên tục theo t ∈ [to, T1 ].
(C1 )- Hàm f o : Rn1 × Rn2 → R1 thỏa mãn điều kiện Lipschitz :
(o)
(o)
|f o (y 0 , z 0 ) − f o(y”, z”)| ≤ Ly ky 0 − y”k + Lz kz 0 − z”k (∀y 0 , y” ∈ Ωy ; z 0 , z” ∈ Ωz ). (2.1.7)
(D1 )- Các hệ (2.1.2)-(2.1.3) luôn có nghiệm duy nhất y(t) ∈ Rn1 , z(t, s; u) ∈ Rn1 (∀u ∈
U) liên tục theo t ∈ [to, T1 ], s ∈ [so, T2 ]. Đồng thời, bài toán (2.1.1)-(2.1.4) có ĐKTƯ
u∗ ∈ U với hữu hạn các điểm gián đoạn (loại 1) là s(k) (k = 1 ÷ ko < ∞).
2.2. Nghiệm tựa tối ưu và sự hội tụ của nó
N1 N2
, sk k=0 của lưới (đều) trên [to, T1 ] và [so, T2 ] sao cho:
i=0
Gắn với các điểm ti
ti = to + ih1 (0 ≤ i ≤ N1 ); sk = so + kh2 (0 ≤ k ≤ N2 ); h1 =
T1 − to
T 2 − so
, h2 =
,
N1
N2
ta lập bài toán ĐKTƯ rời rạc ứng với bài toán (2.1.1)-(2.1.4), dưới dạng:
N2
F o(U) := f o (YN1 , ZN
) → inf,
1
(2.2.1)
4
Yi+1 = Yi + h1 g1 (Yi , ZiN2 , ti ) (0 ≤ i < N1 ) , Yo = yo,
(2.2.2)
Zik+1 = Zik + h2 g2 (Zik , Uk , ti , sk ), Zio = zo(ti ) (0 ≤ i ≤ N1 , 0 ≤ k < N2 )
(2.2.3)
U := (U0 , U1 , ..., UN2−1 )T ∈ RmN2 , Uk ∈ Ω (0 ≤ k < N2 ).
(2.2.4)
Từ các hệ rời rạc (2.2.2)-(2.2.3) ta có thể xấp xỉ hệ (2.1.2)-(2.1.3) bởi hệ:
dY (t)
dt
∂Z(t,s)
∂s
= g1 Yi , Z(ti , T2 ), ti (ti < t ≤ ti+1 , 0 ≤ i < N1 ), Y (to ) = yo ,
= g2 (Zik , Uk , ti , sk )(sk < s ≤ sk+1 , ti < t ≤ ti+1 ), Z(t, so) = zo(t)
(2.2.4*)
(to ≤ t ≤ T1 ) ; 0 ≤ i < N1 , 0 ≤ k < N2 ,
Định nghĩa 2.2.1 Ứng với mỗi điều khiển u ∈ U (trong (2.1.4)):
- Nếu biến điều khiển trong hệ động lực (2.2.4*) xác định dưới dạng: Uk := u(sk ) (0 ≤
k < N2 ), thì quỹ đạo Y (t) := Y (t; u), Z(t, s) := Z(t, s; u) của hệ (2.2.4*) gọi là quỹ đạo
xấp xỉ tuyến tính (XXTT) (với y(t) := y(t; u), z(t, s) := z(t, s; u)) của hệ (2.1.2)-(2.1.3).
- Nếu biến điều khiển trong hệ động lực (2.1.2)-(2.1.3) xác định dưới dạng: u(s) ≡
u(sk ) (sk ≤ s < sk+1 , 0 ≤ k < N2 ), thì nó được gọi là xấp xỉ bậc thang (hay hằng từng
khúc) với biến điều khiển u ∈ U.
- Nghiệm liên tục hóa u(s), Y (t; u), Z(t, s; u) trong bài toán ĐKTƯ rời rạc (2.2.1)
(2.2.4) gọi là nghiệm XXTT (với nghiệm u(s), y(t; u), z(t, s; u) ) của (2.1.1)-(2.1.4).
Để đánh giá sai số của các quỹ đạo XXTT trong hệ (2.1.3), ta đưa ra các ký hiệu:
(2)
Ik (u)
:=
Zsk
ku(s) − u(sk−1 )kds (1 ≤ k ≤ N2 ) (∀u ∈ U),
sk−1
∆u Zi := max ∆uk Zi , ∆ukZi :=
1≤k≤N2
max
sk−1 ≤s≤sk
kz(ti , s; u) − Z(ti , s; u)k (1 ≤ i ≤ N1 )
và đánh giá sai số ∆u Zi của quỹ đạo XXTT bằng mệnh đề sau:
Bổ đề 2.2.1 Nếu Ωz còn chứa các giá trị có thể của nghiệm phương trình (2.2.3) và
có các điều kiện (B1 ), (D1 ) thì tồn tại các hằng số C2 , K2 ∈ (0, +∞) để cho:
(2)
(2)
C2 := max(u,t)∈Ω×[to,T1 ] kg2 z(t, s), u, t, s k ≤ K2 Lz (T2 − so)eLz (T2 −so ) + 1
s∈[so ,T2 ]
K := maxkg (z (t), u, t, s)k : (u, t, s) ∈ Ω × [t , T ] × [s , T ] .
2
2 o
o 1
o 2
Khi đó :
5
P N2
(2)
N2 −k I (2)(u) (1 ≤ i ≤ N )
∆u Zi ≤ C 2 h2 + L(2)
u
1
k=1 (1 + Lz h2 )
k
(2)
(2)
(2)
với: C := 2−1 C + L(2) eL(2)
z (T2 −so )
− 1 , Ls/z := Ls /Lz .
2
2
s/z
Tương tự, để đánh giá sai số của các quỹ đạo XXTT trong hệ (2.1.2), ta các ký hiệu:
(1)
Ii (z)
=
(1)
Ii
Zti
z(u) :=
kz(t, T2 ; u) − Z(ti−1 , T2 ; u)kdt (∀u ∈ U, i = 1 ÷ N1 )
ti−1
∆u Y := max ∆ui Y, ∆ui Y :=
1≤i≤N1
max ky(t; u) − Y (t; u)k
ti−1 ≤t≤ti
và đánh giá sai số ∆u Y của quỹ đạo XXTT bằng mệnh đề sau:
Bổ đề 2.2.2 Với điều kiện của Bổ đề 2.2.1, nếu Ωy còn chứa các giá trị có thể của
nghiệm phương trình (2.2.2) và có điều kiện (A1 ) thì tồn tại các hằng số C1 , K1 :
0 < C1 := sup
z∈Z kg1
t∈[to,T1 ]
(1)
(1)
y(t), z, t)k ≤ K1 Ly (T1 − to)eLy
(T1 −to )
+ 1 < +∞,
0 < K1 := sup kg1 (yo, z, t)k : to ≤ t ≤ T1 , z ∈ Z , Z := z ∈ Rn2 : kzk ≤ r < +∞,
(1)
(1)
với r := supto ≤t≤T1 kzo(t)k + (T2 − so)C2 . Nếu đặt L(1)
:= Lt /Ly thì ∀u ∈ U ta còn có:
t/y
u
∆ Y ≤
(1)
C 1 h1 + Lz
N1
X
i=1
(1)
(1)
Ii (z) 1 + Ly h1
N1 −i
(1)
(1)
, C 1 := 2−1 (C1 + Lt/y ) eLy
(T1 −to )
−1 .
Từ các giả thiết (A1 )-(C1 ) ta suy ra tính liên tục của các hàm hợp ZiN2 = ZiN2 (U), YN1 =
YN1 (U) cho từ hệ (2.2.3)-(2.2.2). Khi đó bài toán (2.2.1)-(2.2.4) trở thành bài toán quy
hoạch liên tục với tập hợp các lời giải CNĐ là tập compact ΩN2 ⊂ RmN2 , dưới dạng:
N2
F o(U) := f o YN1 (U), ZN
(U) → inf, U := (U0 , ..., UN2−1 ) ∈ ΩN2 .
1
(2.2.5)
Bởi vậy, sẽ tồn tại lời giải Û := (Û0 , ..., ÛN2−1 ) của bài toán trên.
Định nghĩa 2.2.2 Lời giải Û ∈ ΩN2 của bài toán quy hoạch (2.2.5) (cũng là ĐKTƯ
của bài toán ĐKRR (2.2.1)-(2.2.4)) và các quỹ đạo Ŷi = Yi (Û ), Ẑik = Zik (Û) (0 ≤
i ≤ N1 , 0 ≤ k ≤ N2 ) của hệ (2.2.2)-(2.2.3) tương ứng gọi là nghiệm tối ưu (TƯ) rời
rạc ứng với bài toán ĐKTƯ liên tục (2.1.1)-(2.1.4). Hàm hằng từng khúc û ∈ U:
û(s) := Ûk (sk ≤ s < sk+1 , 0 ≤ k < N2 ) gọi là điều khiển tựa TƯ và quỹ đạo ẑ(t, s) =
z(t, s; û), ŷ(t) = y(t; û) tương ứng của hệ (2.1.3), (2.1.2) gọi là quỹ đạo tựa TƯ của
bài toán (2.1.1)-(2.1.4). Điều khiển tựa TƯ và quỹ đạo tựa TƯ û(s), ẑ(t, s), ŷ(t) gọi
6
là nghiệm tựa TƯ và û(s), Ẑ(t, s) = Z(t, s; û), Ŷ (t) = Y (t; û) gọi là nghiệm XXTT tựa
TƯ của bài toán này.
Liên quan đến việc sử dụng các nghiệm (và nghiệm XXTT) tựa TƯ để xấp xỉ nghiệm
TƯ u∗ (s), y ∗(t) = y(t; u∗ ), z ∗ (t, s) = z(t, s; u∗ ) của bài toán (2.1.1)-(2.1.4), ta đặt:
(1)
Ji
∆f o := f o y(T1; û), z(T1, T2 ; û) −f o y(T1; u∗ ), z(T1 , T2; u∗ ) ,
∆f
ˆ o := f o Ŷ (T1 ), Ẑ(T1 , T2) −f o y(T1; u∗ ), z(T1 , T2; u∗ ) ,
ˆ o ≥ 0)
ˆ o ≥ 0)
I (1) z(u∗ ) (Khi : ∆f
I (2) (u∗ ) (Khi : ∆f
i
k
(2)
:=
Jk :=
I (1) z(û) (Khi : ∆f
0
ˆ o < 0)
ˆ o < 0)
(Khi : ∆f
i
(với 1 ≤ i ≤ N1 , 1 ≤ k ≤ N2 ). Khi đó từ các Bổ đề 2.2.1 và 2.2.2 ta lần lượt thu được:
Bổ đề 2.2.3 Nếu có các điều kiện của Bổ đề 2.2.2 và điều kiện (C1 ) thì:
(o)
(o) (1) PN1
(1)
(1) N1 −i
ˆ o | ≤ (L(o)
1 + Ly h1
+
|∆f
y C 1 )h1 + (Lz C 2 )h2 + Ly Lz
i=1 Ji
+L(o) L(2) PN2 J (2) 1 + L(2) h N2 −k , 0 ≤ ∆f o ≤ L(o)∆û Z + L(o)∆û Y + |∆f
ˆ o |.
z
y
z
2
y
z
N1
k=1 k
Định lí 2.2.1 Nếu có các điều kiện của Bổ đề 2.2.3 và nếu h1 , h2 → 0 thì điều khiển
tựa TƯ û(s) sẽ hội tụ theo mục tiêu về ĐKTƯ u∗ của bài toán (2.1.1)-(2.1.4):
lim f o y(T1 ; û), z(T1 , T2; û) = f o y(T1 ; u∗ ), z(T1, T2 ; u∗ ) .
h1 ,h2 →0
Khi ký hiệu Uh2 := u ∈ U : u(s) ≡ Uk (sk ≤ s < sk+1 , 0 ≤ k < N2 ) , ta còn có:
lim f o Ŷ (T1 ), Ẑ(T1, T2 ) = f o y(T1; u∗ ), z(T1, T2 ; u∗ ) ,
h1 ,h2 →0
lim ∆u Y = lim ∆u Zi = 0 (∀i = 1 ÷ N1 , u ∈ Uh2 ).
h1 ,h2 →0
h2 →0
2.3 Thuật toán Monte Carlo giải bài toán
Từ Định lý 2.2.1 ta thấy rằng: Việc tìm ĐKTƯ u∗ (s) của bài toán (2.1.1)-(2.1.4) đưa
về việc tìm điều khiển tựa TƯ û(s) tương ứng, mà thực chất là việc giải bài toán quy
hoạch (2.2.5). Liên quan đến những ứng dụng ở Chương 4, ta còn xét bài toán này
ứng với dạng đặc biệt của vế phải trong hệ động lực (2.1.2)-(2.1.3) như dưới đây:
g1 (y, z, t) = A1 (t)y + b1 (z, t) , g2 (z, u, t, s) = A2 (t, s)z + b2 (u, t, s), A1 : [to, T1 ] → Rn1 ×n1 ,
b : Rn2 × [t , T ] → Rn1 , A : [t , T ] × [s , T ] → Rn2 ×n2 , b : Rm × [t , T ] × [s , T ] → Rn2
1
o 1
2
o 1
o 2
2
o 1
o 2
(2.3.1)
7
Chú ý 2.3.1 Nếu hệ (2.1.2)-(2.1.3) có dạng (2.3.1) (tuyến tính theo trạng thái),
thì từ các Bổ đề 2.3.1 và 2.3.2 (trong Luận án) ta thu được dạng hiển của các hàm
hợp YN1 (U), ZNN12 (U) trong (2.2.5). Khi: yo = 0 ∈ Rn1 , zo(t) ≡ 0 ∈ Rn2 , A1 (t) ≡ 0 ∈
Rn1 ×n1 , A2 (t, s) ≡ 0 ∈ Rn2 ×n2 , ta còn có thể biểu diễn F o(U) trong (2.2.5) dưới dạng:
o
o
F (U) = f h1
N
1 −1
X
b1 (ZiN2 , ti ), h2
i=0
NX
2 −1
k=0
NX
2 −1
N2
b2 (Uk , T1 , sk ) , Zi = h2
b2 (Uk , ti , sk )(i = 0÷N1 )
k=0
Do bài toán quy hoạch (2.2.5) không có tính lồi, nên 1 loại thuật toán Monte Carlo
(Mô hình DTNN đơn giản) sẽ được sử dụng để giải bài toán trên. Liên quan đến điều
này, mệnh đề dưới đây đã được chứng minh.
Bổ đề 2.3.3 Trong các điều kiện của Định lý 2.2.1, bài toán (2.2.5) tồn tại điểm
cực tiểu Û ∈
ΩN2
N
o
o
2
không cô lập, theo nghĩa: mes U ∈ Ω : F (U) < F (Û) + ε > 0
(∀ε > 0), với mes(B) là độ đo Lebesgue của tập hợp Borel B ⊂ ΩN2 ⊂ RmN2 .
Trên cơ sở này, ta có thể lập dãy DTNN đơn giản {U (r) }r≥1 theo công thức lặp:
U (r+1) =
U (r)
wr
(Khi F o(U (r) ) ≤ F o(wr ))
(Khi
F o(U (r) )
>
(∀ r ≥ 1) , U (1) := wo , với :
(2.3.2)
F o(wr ))
{wr }r≥0 là dãy các thể hiện độc lập của vtnn w ∼ U(ΩN2 ) và đưa ra các khái niệm sau:
Định nghĩa 2.3.1 Một hàm nhận giá trị ngẫu nhiên được gọi là:
(r)
- Mô phỏng điều khiển tựa TƯ, nếu có dạng: u(r) (s) := Uk (sk ≤ s < sk+1 , 0 ≤ k < N2 ).
- Mô phỏng quỹ đạo tựa TƯ, nếu nó là nghiệm y (r) (t), z (r) (t, s) của hệ (2.1.2)-(2.1.3)
ứng với điều khiển u(r) (s) (so ≤ s ≤ T2 ) :
y (r) (t) := y(t; u(r)), z (r) (t, s) := z(t, s; u(r) ) (∀t ∈ [to, T1 ] , s ∈ [so , T2]).
- Mô phỏng nghiệm tựa TƯ, nếu nó là mô phỏng điều khiển và quỹ đạo tựa TƯ
u(r) (s), y (r) (t), z (r)(t, s) .
- Mô phỏng quỹ đạo XXTT tựa TƯ, nếu nó là quỹ đạo XXTT Y (r) (t), Z (r) (t, s) của
hệ (2.1.2)-(2.1.3) ứng với điều khiển u(r) ∈ U :
Y (r) (t) := Y (t; u(r)), Z (r) (t, s) := Z(t, s; u(r)) (∀t ∈ [to, T1], s ∈ [so , T2]).
- Mô phỏng nghiệm XXTT tựa TƯ, nếu nó là mô phỏng điều khiển tựa TƯ và quỹ
đạo XXTT tựa TƯ u(r) (s), Y (r) (t), Z (r)(t, s) .
8
Sự hội tụ của dãy mô phỏng nghiệm XXTT tựa TƯ cho bởi mệnh đề sau:
Định lý 2.3.1 Với các điều kiện của Định lý 2.2.1, nếu h1 , h2 → 0, r → +∞ thì dãy mô
phỏng nghiệm XXTT tựa TƯ hội tụ (hcc) theo mục tiêu về nghiệm TƯ u∗ (s), y ∗ (t) :=
y(t; u∗), z ∗ (t, s) := z(t, s; u∗) của bài toán (2.1.1)-(2.1.4):
P
n
o
lim f o Y (r) (T1), Z (r) (T1, T2 ) = f o y ∗(T1 ), z ∗ (T1 , T2 ) = 1.
h1 ,h2 →0
r→+∞
Sự hội tụ của dãy mô phỏng nghiệm tựa TƯ cho bởi mệnh đề sau:
Hệ quả 2.3.1 Với các điều kiện của Định lý 2.2.1, nếu h1 , h2 → 0, r → +∞ thì dãy mô
phỏng nghiệm tựa TƯ hội tụ (hcc) theo mục tiêu về nghiệm TƯ u∗ (s), y ∗ (t), z ∗ (t, s))
của bài toán (2.1.1)-(2.1.4):
P
n
o
lim f o y (r) (T1 ), z (r) (T1 , T2) = f o y ∗ (T1), z ∗ (T1 , T2 ) = 1.
h1 ,h2 →0
r→+∞
Để đánh giá "sai số" theo số phép lặp của các nghiệm mô phỏng trong các mệnh đề
trên, chúng tôi đưa ra các khái niệm sau:
Định nghĩa 2.3.2 Với mỗi vtnn w := (wo , · · · , wN2 −1 ) ∼ U(ΩN2 ) và vec tơ tất định
U = (Uo , · · · , UN2 −1 ) ∈ ΩN2 ta lập các hàm bậc thang uw , uU ∈ Uh2 có dạng:
uw (s) ≡ wk , uU (s) ≡ Uk (∀s ∈ [s,sk+1 ), k = 0 ÷ N2 − 1).
Khi đó các tập Ar (δ), Ar (δ) (0 ≤ δ 1) được gọi là tập các lời giải δ -tốt bị bỏ qua của
lần lượt xấp xỉ U (r) (cho Û ) và mô phỏng u(r) (cho u∗ ), nếu chúng có dạng:
Ar (δ) := U ∈ ΩN2 : F o(U) < F o(U (r) ) − δ , Ar (δ) := U ∈ ΩN2 : J (uU ) < J (u(r) ) − δ ,
và gọi Λr (δ), λr (δ) là δ -sai số tương đối tương ứng, nếu chúng là các xác suất:
Λr (δ) := P F o(w) < F o(U (r) ) − δ , λr (δ) := P J (uw ) < J (u(r)) − δ .
Bổ đề 2.3.4 Với các tập Ar (δ), Ar (δ) và các δ -sai số tương đối nói trên, ta có:
λr (δ) = Λr (δ) ,
Λr (δ) =
λ (δ) =
r
mes A r (δ)
mes(ΩN2 )
mes Ar (δ)
mes(ΩN2 )
=
=
mes U ∈ΩN2 :F o (U ) 0) ứng với bài toán (3.1.1)-(3.1.5), dưới dạng:
N2
Fo(U) := fo(YN1 , ZN
) → inf,
1
(3.2.1)
Yi+1 = Yi + h1 g1 (Yi , ZiN2 , ti ), Yo = yo (0 ≤ i ≤ N1 ),
(3.2.2)
Zik+1 = Zik + h2 g2 (Zik , Uk , ti, sk ), Zio = zo (ti) (0 ≤ i ≤ N1 , 0 ≤ k < N2 ),
(3.2.3)
U := (U0 , U1 , ..., UN2−1 )T ∈ RmN2 , Uk ∈ Ω (0 ≤ k < N2 ),
(3.2.4)
N2
Fj (U) := fj (YN1 , ZN
) ≤ −δ (1 ≤ j ≤ n).
1
Chú ý 3.2.1
(3.2.5)
Do hệ động lực (3.1.2)-(3.1.3) trùng với (2.1.2)-(2.1.3) và hệ rời
rạc tương ứng (3.2.2)-(3.2.3) trùng với (2.2.2)-(2.2.3), nên trong trường hợp này ta
cũng có thể đưa ra (trong Định nghĩa 3.2.1 của Luận án) các khái niệm tương tự
như trong Định nghĩa 2.2.1 về: xấp xỉ bậc thang u ∈ Uh2 của điều khiển u ∈ U (trong
(3.1.4)), quỹ đạo XXTT Y (t; u), Z(t, s; u) của quỹ đạo y(t; u), z(t, s; u) và nghiệm XXTT
u(s), Y (t; u), Z(t, s; u) của nghiệm u(s), y(t; u), z(t, s; u) .
Ngoài ra, từ các giả thiết (A2 )-(D2 ) ta suy ra tính liên tục (theo U ) của các hàm hợp
N2
N2
YN1 = YN1 (U), ZN
= ZN
(U) (xác định từ hệ phương trình truy hồi (3.2.2)-(3.2.3)) và
1
1
do đó là tính liên tục của các hàm hợp fj YN1 (U), ZNN12 (U) (0 ≤ j ≤ n). Khi đó bài
toán điều khiển rời rạc (ĐKRR) (3.2.1)-(3.2.5) trở thành bài toán quy hoạch liên tục:
Fo (U) := fo YN1 (U), Z N2 (U) → inf, U ∈ ΩN2 ,
N1
F (U) := f Y (U), Z N2 (U)≤ −δ (1 ≤ j ≤ n).
j
j N1
N1
(3.2.6)
Do ΩN2 là tập compac trong RmN2 nên bài toán này luôn có lời giải U = Û . Đây cũng
là ĐKRR tối ưu của bài toán (3.2.1)-(3.2.5). Khi đó ta có thể mở rộng Định nghĩa
2.2.2 trong trường hợp này, dưới dạng:
Định nghĩa 3.2.2 ĐKRR tối ưu Û ∈ ΩN2 của bài toán (3.2.1)-(3.2.5) và các quỹ
đạo Ŷi = Yi (Û), Ẑik = Zik (Û) (0 ≤ i ≤ N1 , 0 ≤ k ≤ N2 ) tương ứng của hệ (3.2.2)-(3.2.3)
gọi là nghiệm TƯ của bài toán ĐKRR (3.2.1)-(3.2.5). Hàm bậc thang û ∈ Uh2 gọi là
12
điều khiển tựa TƯ, nếu nó có dạng: û(s) := Ûk (sk ≤ s < sk+1 , 0 ≤ k < N2 ); Quỹ đạo
ẑ(t, s) = z(t, s; û), ŷ(t) = y(t; û) tương ứng gọi là quỹ đạo tựa TƯ và û(s), ŷ(t), ẑ(t, s)
gọi là nghiệm tựa TƯ và û(s), Ŷ (t), Ẑ(t, s) (với Ŷ (t) = Y (t; û), Ẑ(t, s) = Z(t, s; û)) gọi
là nghiệm XXTT tựa TƯ của bài toán (3.1.1)-(3.1.5)
Để chỉ ra sự hội tụ của các nghiệm nói trên về nghiệm TƯ của bài toán (3.1.1)(3.1.5), các mệnh đề dưới đây lần lượt được chứng minh gắn với các ký hiệu:
∆u Zi := max1≤k≤N2 ∆uk Zi , ∆uk Zi := maxsk−1 ≤s≤sk kz(ti , s; u) − Z(ti , s; u)k (∀u ∈ U),
Z s
(2)
Iik (u) := sup(z,v,s)∈Ωuk
g2 (z, v, ti, ξ) − g2 (z, u(sk ), ti , ξ) dξ
(i = 1 ÷ N1 ),
sk
Ωuk := Ωz × Vku × [sk , sk+1 ], Vku := u(ξ) ∈ Ω : sk ≤ ξ ≤ s ≤ sk+1 (k = 0 ÷ N2 − 1).
Bổ đề 3.2.1 Với các điều kiện (B2 ) − (C2), nếu Ωz chứa mọi giá trị có thể của nghiệm
phương trình (3.2.3) thì với mọi u ∈ U ta có:
(2)
P
∆uZi ≤ eLz (T2 −so ) − 1 ε(2) (h2 ) + N2 (1 + γ2 )N2 −k I (2) (u) (∀i = 1 ÷ N1 ),
k=1
i,k−1
P N2
(2)
(2)
với : lim
(2)
N2 −k γ < eLz (T2 −so ) − 1.
2
h2 →0 ε (h2 ) = 0, γ2 := Lz h2 ,
k=1 (1 + γ2 )
Tương tự, ta có các mệnh đề sau, gắn với mọi u ∈ U, i = 1 ÷ N1 và các ký hiệu:
∆u Y := max1≤i≤N1 ∆uiY , ∆ui Y := maxti−1 ≤t≤ti ky(t; u) − Y (t; u)k,
Z t
(1)
Ii (u) := max(y,z,t)∈Ωui
g1 (y, z, τ ) − g1 (y, Z(ti, T2 ; u), τ ) dτ
,
ti
u
Ωi := Ωy × Ziu × [ti , ti+1], Ziu := z(t, T2; u) ∈ Ωz : ti ≤ t ≤ ti+1 .
Bổ đề 3.2.2 Với các điều kiện (A2 ) và (D2 ), nếu Ωy chứa mọi giá trị có thể của
nghiệm phương trình (3.2.2), thì với mọi u ∈ U ta có:
(1)
P
∆u Y ≤ eLy (T1 −to ) − 1 ε(1) (h1 ) + N1 (1 + γ1 )N1 −i I (1) (u),
i=1
i−1
lim
h1 →0 ε
(1) (h )
1
(1)
= 0 , γ1 := Ly h1 ,
P N1
i=1 (1 + γ1 )
N1 −i γ
1
(1)
< eLy
với :
(T1 −to )
− 1.
Bổ đề 3.2.3 Với các điều kiện trong các Bổ đề 3.2.1 và 3.2.2, ta có :
lim ∆u Zi = lim ∆u Zi = 0 (1 ≤ i ≤ N1 ),
∗
h2 →0
h2 →0
lim ∆u Y =
∗
h1 ,h2 →0
lim ∆u Y = 0 (∀u ∈ Uo(h2 )).
h1 ,h2 →0
Định lý 3.2.1 Giả sử các điều kiện (A2)-(D2 ) cùng với các điều kiện nêu trong các
Bổ đề 3.2.1 và 3.2.2 về các tập Ωz , Ωy được thỏa mãn. Khi đó:
13
1- Nếu h1 , h2 và tham số δ trong điều kiện (3.2.5) chọn đủ bé thì điều khiển tựa TƯ û(s)
(trong (3.2.9)) tương ứng sẽ là CNĐ, theo nghĩa: fj ŷ(T1 ), ẑ(T1 , T2 ) < 0 (∀j = 1 ÷ n).
2- Nếu h1 , h2 → 0 thì nghiệm tựa TƯ û(s), ŷ(t), ẑ(t, s) và nghiệm XXTT tựa TƯ
û(s), Ŷ (t), Ẑ(t, s) sẽ hội tụ theo mục tiêu về nghiệm TƯ u∗ (s), y ∗ (t), z ∗ (t, s) của bài
toán (3.1.1)-(3.1.5):
lim fo Ŷ (T1 ), Ẑ(T1 , T2 ) = fo y ∗ (T1), z ∗ (T1 , T2 )
h1 ,h2 →0
lim fo ŷ(T1 ), ẑ(T1 , T2 ) = fo y ∗ (T1 ), z ∗ (T1 , T2) .
h1 ,h2 →0
Để đơn giản hóa việc kiểm tra sự thỏa mãn điều kiện Lipschitz của các giả thiết (A2 ),
(B2 ) trong định lý nêu trên, ta đưa ra giả thiết :
(E)- Tồn tại các số tự nhiên mi và các hằng số ai , bi ≥ 0, Ri > 0 (i = 1 ÷ 2), sao cho :
m1
m2
R1 > kyo k + K 1 e(a1 R1 +b1 )(T1 −to ) := R1 , R2 > k|zo|k + K 2 e(a2 R2 +b2 )(T2 −so ) := R2 ,
với : |kzo|k := supt∈[to ,T1 ] kzo(t)k, BRi (0) := x ∈ Rni : kxk ≤ Ri (i = 1 ÷ 2),
Z T1
Z T2
kg1 (yo , z, t)kdt, K 2 := supt∈[to,T1 ]
kg2 (zo(t), u, t, s)kds.
K 1 := supz∈BR2 (0)
to
(1)
m
u∈Ω
(2)
m
so
Khi đặt: Ly := a1 R1 1 +b1, Lz := a2 R2 2 +b2 , BRi (0) := x ∈ Rni : kxk ≤ Ri (i = 1÷2),
ta có thể phát biểu Định lý 3.2.1 dưới dạng các hệ quả dưới đây:
Hệ quả 3.2.1 Các kết luận của Định lý 3.2.1 không thay đổi, nếu có giả thiết (E)
(1)
(1)
(2)
(2)
và nếu các hằng số Lipschitz trong (A2 ), (B2) được chọn là Ly := Ly , Lz := Lz .
Khi đó tập chứa các giá trị có thể của nghiệm các PTVP (3.1.2)-(3.1.3) được chọn
là Ωy = BR1 (0), Ωz = BR2 (0). Đây cũng là các tập chứa các giá trị có thể của nghiệm
các PTSP (3.2.2)-(3.2.3), khi h1 , h2 1.
Liên quan đến các hằng số ai , bi , Ri (i = 1 ÷ 2) trong giả thiết (E), ta còn đưa ra các
giả thiết sau:
(A∗2 )- Hàm g1 (y, z, t) ∈ Rn1 khả vi theo y ∈ BR1 (0), với ma trận các đạo hàm riêng
∂g1 (y,z,t)
∂g1 (y,z,t)
thỏa
mãn
điều
kiện:
0
≤
sup
≤ a1 kykm1 + b1 (∀y ∈ BR1 (0)).
t∈[to ,T1 ]
∂y
∂y
(B2∗ )- Hàm g2 (z, u, t, s)
∂g2 (z,u,t,s)
thỏa mãn điều
∂z
∈
Rn2
z∈BR2 (0)
khả vi theo z ∈ BR2 (0), với ma trận đạo hàm riêng
kiện: 0 ≤ supu∈Ω,
∂g2 (z,u,t,s)
≤ a2kzkm2 +b2 (∀z ∈ BR2 (0)).
t∈[to,T1 ]
∂z
s∈[so ,T2 ]
Hệ quả 3.2.2 Các kết luận của Hệ quả 3.2.1 không thay đổi, nếu có giả thiết (E)
14
và các giả thiết về điều kiện Lipschitz trong (A2 ), (B2 ) thay bởi lần lượt các giả thiết
(1)
(1)
(2)
(2)
(A∗2 ), (B2∗ ) với Ly := Ly , Lz := Lz , Ωy := BR1 (0), Ωz := BR2 (0).
Bây giờ ta xét 1 trường hợp riêng của bài toán quy hoạch (3.2.6) gắn với dạng đặc
biệt của bài toán (3.1.1)-(3.1.5), trong đó:
g1 (y, z, t) ≡ b1 (z, t) ∈ Rn1 , zo (t) ≡ 0 ∈ Rm , g2 (z, u, t, s) ≡ b2 (u, s) := u
T2 −so , n2 := m,
∀z ∈ Ω, t ∈ [t , T ], s ∈ [s , T ], u ∈ U := u : [s , T ] → Ω | u(s) ≡ u(const), ∀s ∈ [s , T ] .
o 1
o 2
o 2
o 2
Khi đó do z(t, T2) ≡ u (∀t ∈ [to, T1 ]) nên bài toán (3.1.1)-(3.1.5) trở thành bài toán
ĐKTƯ theo tham số u ∈ Rm :
J (u) := fo y(T1), u → inf, u := (u1 , . . . , um) ∈ Ω,
ẏ(t) = b (u, t) (t < t ≤ T ), y(t ) = y ∈ Rn1 , f y(T ), u≤ 0 (1 ≤ j ≤ n).
1
o
1
o
o
j
1
(3.2.7)
Gắn với bài toán này, ta đưa vào giả thiết:
(Ao)- Hàm b1 (u, t) liên tục theo u ∈ Ω và L-khả tích theo t ∈ [to, T1 ],
và phát biểu Định lý 3.2.1 trong ngôn ngữ dưới đây:
Hệ quả 3.2.3 Nếu có các giả thiết (Ao), (D2 ) thì các kết luận của Định lý 3.2.1 còn
đúng cho bài toán (3.2.7). Khi đó bài toán quy hoạch (3.2.6) tương ứng có dạng:
P
Fo(u) := fo h1 N1 −1 b1 (u, ti) + yo , u → inf, u := (u1 , ..., um) ∈ Ω,
i=0
F (δ)(u) := f h PN1 −1 b (u, t ) + y , u +δ ≤ 0 (1 ≤ j ≤ n).
j
1
1
i
o
i=0
j
Chú ý 3.2.1
(3.2.7*)
Qua Thí du 3.2.2 (Luận án) minh họa sự kiểm tra các giả thiết
(A2 ) − (D2 ), chúng tôi thấy rằng: Điều kiện về tính liên tục trên Ωy × Ωz của các
hàm fj (y, z) (1 ≤ j ≤ n) trong giả thiết (D2 ) đã nới lỏng khá nhiều các giả thiết truyền
thống, ngay cả đối với bài toán Mayer thông thường có ràng buộc trạng thái.
3.3 Quy trình Monte Carlo giải bài toán
Từ Định lý 3.2.1 ta thấy rằng: Việc giải gần đúng bài toán (3.1.1)-(3.1.5) đưa về việc
xác định nghiệm tựa TƯ (hoặc nghiệm XXTT tựa TƯ) của bài toán này, nghĩa là
(xem Định nghĩa 3.2.2) đưa về việc giải bài toán quy hoạch (3.2.6), dưới dạng:
Fo (U) → min , U ∈ Dδ − với không gian độ đo Dδ , B(Dδ ), λ
trong đó : D := U ∈ ΩN2 : F (U) + δ ≤ 0 (1 ≤ j ≤ n) .
j
δ
(3.3.1)
15
B(Dδ ) là σ -đại số các tập Borel trong Dδ , λ là độ đo Lebesgue trong RmN2 . Tương tự
như trong Bổ đề 2.3.2, ta có thể dựa vào tính liên tục của các hàm Fj (U) (0 ≤ j ≤ n)
trên tập compac ΩN2 để chỉ ra rằng bài toán trên có điểm cực tiểu không cô lập. Bởi
vậy có thể thiết lập dãy DTNN U (r) = (Uo(r) , · · · , UN(r)2 −1 )
U
với w(r)
(r+1)
=
U (r)
wr
(Khi Fo(U (r) ) ≤ Fo(wr ))
(Khi Fo
(U (r) )
> Fo
r≥1
theo công thức lặp:
(r ≥ 1) ; U (1) := wo,
(3.3.2)
(wr ))
là dãy thể hiện độc lập của vtnn w ∼ U(Dδ ). Từ dãy DTNN đơn giản
r≥1
(r)
(r)
(r)
U = (Uo , · · · , UN2 −1 ) r≥1 nói trên, ta lập các hàm ngẫu nhiên:
Y (r) (t) := Y (t; u(r)), Z (r) (t, s) := Z(t, s; u(r)), y (r) (t) := y(t; u(r)), z (r) (t, s) := z(t, s; u(r)),
u(r) (s) := U (r) (s ≤ s < s
k
k+1 , 0 ≤ k < N2 ), (∀t ∈ [to , T1], s ∈ [so , T2 ], r ≥ 1).
k
(3.3.3)
Khi đó có thể mở rộng Định nghĩa 2.3.1 trong trường hợp này dưới dạng:
Định nghĩa 3.3.1. Đối với các hàm ngẫu nhiên xác định theo (3.3.3), ta gọi :
u(r) (s)- là mô phỏng điều khiển tựa TƯ;
y (r) (t), z (r) (t, s) - là mô phỏng quỹ đạo tựa TƯ;
u(r) (s), y (r) (t), z (r)(t, s) - là mô phỏng nghiệm tựa TƯ;
Y (r) (t), Z (r)(t, s) - là mô phỏng quỹ đạo XXTT tựa TƯ;
u(r) (s), Y (r) (t), Z (r) (t, s) - là mô phỏng nghiệm XXTT tựa TƯ.
Bổ đề 3.3.1 Với những điều kiện của Định lý (3.2.1), nếu δ, h1 , h2 1 thì các
mô phỏng nghiệm tựa TƯ u(r) (s), y (r) (t), z (r)(t, s) và nghiệm XXTT tựa TƯ u(r) (s),
Y (r) (t), Z (r)(t, s) (∀r ≥ 1) đều là CNĐ, theo nghĩa:
fj Y (r) (T1 ), Z (r) (T1 , T2) ≤ −δ < 0 (1 ≤ j ≤ n),
fj y (r) (T1 ), z (r) (T1 , T2) ≤ 0 (1 ≤ j ≤ n).
Định lí 3.3.1: Nếu các điều kiện của Định lý (3.2.1) được thỏa mãn thì dãy mô phỏng
nghiệm XXTT tựa TƯ và dãy mô phỏng nghiệm tựa TƯ đều CNĐ và cùng hội tụ (hcc)
theo mục tiêu về nghiệm TƯ của bài toán (3.1.1)-(3.1.5) (khi r → +∞, h1 , h2 → 0):
P
lim fo Y (r) (T1 ), Z (r) (T1 , T2 ) = fo y ∗ (T1 ), z ∗ (T1 , T2) = 1
lim fo y (r) (T1 ), z (r) (T1 , T2) = fo y ∗ (T1 ), z ∗ (T1 , T2 ) = 1.
P
h1 ,h2 →0
r→+∞
h1 ,h2 →0
r→+∞
16
Chú ý 3.3.1 Trong trường hợp (2.3.1) ta cũng có thể sử dụng phương pháp nêu trong
Chú ý 2.3.1, để thu được các hàm hợp Fj (U) (0 ≤ j ≤ n) trong (3.3.1), dưới dạng:
Fj (U) = fj h1
NX
1 −1
b1 (ZiN2 , ti ), h2
i=0
N
2 −1
X
b2 (Uk , T1 , sk )
k=0
, ZiN2
= h2
N
2 −1
X
b2 (Uk , ti , sk )(i = 0÷N1 )
k=0
Hệ quả 3.3.1: Đối với bài toán ĐKTƯ theo tham số (3.2.7), nếu có các giả thiết
(Ao), (D2 ) thì Bổ đề 3.3.1 và Định lý 3.3.1 còn đúng. Khi đó, bài toán quy hoạch
(3.3.1) có dạng (3.2.7*)
Cuối cùng, nhằm xây dựng "công thức đánh giá sai số" ứng với các dãy nghiệm mô
phỏng trong Định lý 3.3.1, ta dựa vào Định nghĩa 2.3.2 để lập tập A(i)
r (δi ) (i = 1 ÷ 2)
các nghiệm δi -tốt bị bỏ qua của mô phỏng nghiệm tựa TƯ (u(r) , y (r) , z (r) ) (khi i=1) và
của mô phỏng nghiệm XXTT tựa TƯ (u(r) , Y (r) , Z (r) ) (khi=2), dưới dạng:
(1)
Ar (δ1) := u ∈ Uh2 : fo y(T1 ; u), z(T1, T2 ; u) < fo y (r) (T1 ), z (r) (T1 , T2 ) −δ1 ,
(2)
Ar (δ2 ) := u ∈ Uh2 : fo Y (T1 ; u), Z(T1, T2 ; u) < fo Y (r) (T1 ), Z (r) (T1 , T2) −δ2 ,
0 ≤ δ1 ≤ ∆fo ,
∆fo := fo y(T1; û), z(T1 , T2; û) −fo y(T1; u∗ ), z(T1 , T2; u∗ ) ,
với :
0 ≤ δ ≤ |∆f
∆f
ˆ o| ,
ˆ o := fo Ŷ (T1), Ẑ(T1 , T2 ) −fo y(T1; u∗ ), z(T1 , T2; u∗ ) .
2
Tương tự như đối với Định lý 2.3.2, dựa vào Bổ đề 2.3.4 ta thu được:
Định lý 3.3.2 Nếu có các điều kiện của Định lý 3.3.1, thì:
1- Tập các nghiệm δ1 -tốt bị bỏ qua của mô phỏng (u(r) , y (r) , z (r) ) nghiệm tựa TƯ là
(1)
Ar (δ1 ); Tập các nghiệm δ2 -tốt bị bỏ qua của mô phỏng (u(r) , Y (r) , Z (r) ) nghiệm XXTT
(2)
(i)
(i)
(i)
ˆ o |.
tựa TƯ là Ar (δ2 ), trong đó Ar (δ i ) ⊂ Ar (δi ) ⊂ Ar (0) (i = 1÷2), δ 1 := ∆f o , δ2 := |∆f
(i)
mes(Ar (δi))
2- Tỷ số
:=
N2 là δi -sai số tương đối của mô phỏng nghiệm tựa TƯ
mes(Ω)
(u(r) , y (r) , z (r) ) (khi i=1) và mô phỏng nghiệm XXTT tựa TƯ (u(r) , Y (r) , Z (r) ) (khi i=2).
(i)
λr (δi)
Các sai số này được đánh giá theo công thức sau:
(i)
P λr (δi ) ≤ εi ≥ 1 − (1 − εi )r−1 (∀εi ∈ (0, 1), i = 1 ÷ 2).
CHƯƠNG 4:
Áp dụng vào mô hình hợp lý cực đại
Trong chương này, các khái niệm mới về "Mô hình HLCĐ liên tục hóa ước lượng
(ƯL) tham hàm và tham số" được xây dựng trong Mục 4.1, nhằm mở rộng các mô
17
hình HLCĐ kinh điển về ƯL tham số và ứng dụng để dự báo động đất. Những kết quả
của Chương 2 được sử dụng để giải bài toán HLCĐ liên tục hóa ƯL tham hàm trong
Mục 4.2. Những kết quả của Chương 3 được sử dụng để giải bài toán HLCĐ liên tục
hóa ƯL tham số trong Mục 4.3. Bài toán được giải ở Mục 4.2 gắn với một dạng mới
của mô hình Jackson-Kagan (được tham hàm hóa) về hàm mật độ xác suất có điều
kiện của chấn tâm động đất. Bài toán được giải ở Mục 4.3 gắn với hàm mật độ xác
suất Richter-Gutenberg của chấn cấp động đất và một phương pháp mới trong việc
kết hợp các số liệu địa chấn với các số liệu địa chất-địa vật lý để dự báo động đất.
Nội dung của chương này đã được công bố rải rác trong các công trình khoa học [1]-[4]
của tác giả.
4.1. Mô hình hợp lý cực đại liên tục hóa:
Xét vtnn (ξ, µ) = (ξ1 , · · · , ξn , µ) ∈ Rn × R1 có hàm mật độ xác suất đồng thời p(x, s)
được biểu diễn dưới dạng: p(x, s) = pξ (x|s) pµ (s) (∀(x, s) ∈ Rn × R1 ), trong đó:
pµ (s) - là hàm mật độ biên duyên (không điều kiện) của đlnn µ,
pξ (x|s) - là hàm mật độ có điều kiện của vtnn ξ ∈ Rn , khi µ = s, với giả thiết rằng :
- Hàm pµ (s) là L-khả tích theo s ∈ R1 và phụ thuộc tham số θ, dưới dạng:
pµ (s) := g(s, θ) > 0 (∀s ∈ [so, T2 ] ⊂ R1 ) , θ ∈ Θ ⊂ Ωo ⊂ Rmo .
(4.1.1)
- Hàm pξ (x|s) là L-khả tích theo x ∈ Rn và phụ thuộc tham hàm u(s), dưới dạng:
pξ (x|s) = f x, u(s) > 0 (∀(x, s) ∈ X × [so , T2] ⊂ Rn × R1 ),
u ∈ U := {u : [so, T2 ] → Ω ⊂
Rm |
(4.1.2)
liên tục từng khúc}.
Khi đó hàm mật độ p(x, s) của vtnn (ξ, µ) được tham số và tham hàm hóa dưới dạng:
p(x, s) ≡ p x, s; θ, u(.) = f x, u(s) g(s, θ) (∀(x, s) ∈ Rn × R1 ).
Giả sử đã cho dãy quan sát (x(i) , m(i))
N1
i=1
(4.1.3)
(N1 1) của vtnn (ξ, µ), trong đó :
so < min1≤i≤N1 {m(i) } < max1≤i≤N1 {m(i) } < T2 . Khi đó mô hình HLCĐ truyền thống ƯL
P 1
(i)
tham số θ trong hàm mật độ (4.1.1) có dạng: L1 (θ) := N
i=1 ln g(m , θ) → max, θ ∈ Θ.
Trong ngôn ngữ của Bài toán Mayer rời rạc, mô hình này có thể biểu diễn dưới dạng:
JN1 (θ) := −YN1 ≡ −h1 L1 (θ) → inf , θ ∈ Θ ⊂ Rmo , h1 :=
T1
N1
Yi+1 = Yi + h1 ln g(m(i+1) , θ) (0 ≤ i < N1 ) , Yo = 0.
> 0,
18
Dạng liên tục hóa của bài toán trên là bài toán ĐKTƯ theo tham số (3.2.7), có dạng:
Định nghĩa 4.1.1 Bài toán Mayer thông thường được gọi là bài toán HLCĐ liên
tục hóa ƯL tham số trong hàm mật độ (4.1.1) , nếu nó có dạng:
(4.1.4)
J (θ) := −y(T1 ; θ) → inf , θ ∈ Θ ⊂ Ωo ⊂ Rmo ,
ẏ(t) = ln g m(t), θ (0 < t ≤ T1 ) , y(0) = 0,
(4.1.5)
trong đó θ là tham số điều khiển, đạo hàm ẏ(t) hiểu theo nghĩa thông thường và:
m(t) = m(i−1) +
t−ti−1
h1
(m(i) − m(i−1) ) (ti−1 ≤ t ≤ ti , i = 2 ÷ N1 ),
m(t) ≡ m(1) (0 ≤ t ≤ t1 ); ti = ih1 (0 ≤ i ≤ N1 ), h1 =
T1
N1 .
Để ƯL tham hàm u ∈ U trong (4.1.2) ta xấp xỉ nó bởi hàm u ∈ Uh2 , dưới dạng:
u(s) ≡ Uk := u(sk ) ∈ Ω ⊂ Rm (sk ≤ s < sk+1 ), sk = so + kh2 (k = 0 ÷ N2 ), h2 :=
T 2 − so
N2
(với N2 1). Khi đó bài toán ƯL tham hàm u ∈ U được xấp xỉ bởi bài toán ƯL tham
số U = (U0 , · · · , UN2 −1 ) ∈ ΩN2 ⊂ RmN2 quen thuộc, dưới dạng cực đại hóa hàm hợp lý:
N1
2 −1
NX
X
L2 (U) :=
ln
1Mk (m(i))f(x(i) , Uk ) → max , U ∈ ΩN2 ,
i=1
với :
k=0
Mk := (sk , sk+1 ]
(0 ≤ k ≤ N − 1),
2
1M (s) =
1 (Khi : s ∈ M),
0 (Khi : s ∈
/ M).
Bài toán trên lại có dạng bài toán (2.2.1)-(2.2.4), với F o(U) = − ln(T2 − so) + h1 L2 (U) ,
yo = zo (t) = 0, f o (y, z) = −y , g1 (y, z, t) = ln z , g2 (z, u, t, s) =
x(t) = x(i−1) +
PN2 −1
j=0
1Mj m(t) f x(t), u ,
t − ti−1 (i)
(x − x(i−1) ) (ti−1 ≤ t ≤ ti , i = 2 ÷ N1 ), x(t) ≡ x(1) (0 ≤ t ≤ t1 ).
h1
Bởi vậy dạng liên tục hóa (2.1.1)-(2.1.4) tương ứng của bài toán ĐKRR này có dạng:
Định nghĩa 4.1.2 Bài toán Mayer suy rộng (gắn với đạo hàm suy rộng) được gọi là
bài toán HLCĐ liên tục hóa ƯL tham hàm trong hàm mật độ (4.1.2), nếu nó có dạng:
J (u) := −y(T1; u) → inf , u ∈ U,
(4.1.6)
ẏ(t) = ln z(t, T2; u) (0 < t ≤ T1 ) , y(0) = 0,
(4.1.7)
NX
2 −1
∂z(t, s)
=
1Mj m(t) f x(t), u(s) (so < s ≤ T2 ), z(t, so) ≡ 0 (0 ≤ t ≤ T1 ).
∂s
(4.1.8)
j=0
U := u : [so, T2 ] → Ω ⊂ Rm liên tục từng khúc .
(4.1.9)
19
Chú ý 4.1.1 Việc giải bài toán ƯL tham số θ và tham hàm u(s) trong hàm mật độ
đồng thời (4.1.3) của vtnn (ξ, µ) ∈ Rn+1 được phân rã thành việc giải 2 bài toán:
- Bài toán HLCĐ liên tục hóa (4.1.4)-(4.1.5) UL tham số θ.
- Bài toán HLCĐ liên tục hóa (4.1.6)-(4.1.9) ƯL tham hàm u(s).
Với ý nghĩa này, dưới đây ta sẽ giải riêng rẽ từng bài toán nói trên.
4.2. Mô hình hợp lý cực đại ước lượng tham hàm
Trước hết ta xét việc xác định tham hàm HLCĐ u(s) = u∗ (s) (so ≤ s ≤ T2 ) trong hàm
mật độ có điều kiện (4.1.2), nghĩa là xét việc tìm ĐKTƯ u = u∗ ∈ U của bài toán
(4.1.6)-(4.1.9). Không làm mất tính tổng quát, ta có thể xét trường hợp T1 = 1 và nhận
thấy rằng bài toán này có dạng Bài toán Mayer suy rộng (2.1.1)-(2.1.4) với vế phải
của hệ động lực có dạng (2.3.1), trong đó: to = 0, T1 = 1, n1 = n2 = 1, yo = zo (t) ≡ 0,
f o (y, z) := −y, A1(t) = A2 (t, s) ≡ 0 (∀t ∈ [0, 1], s ∈ [so, T2 ]), b1(z, t) ≡ b1 (z) := ln z,
b (u, t, s) ≡ b (u, t) := PN2 −1 1
m(t)
f
x(t),
u
(∀t ∈ [0, 1], s ∈ [so, T2 ], u ∈ Ω). (4.2.1)
2
2
M
k
k=0
Do đó từ Chú ý 2.3.1 ta có thể biểu diễn F o(U) trong (2.2.5) dưới dạng:
F o(U) = −h1
N1
2 −1
NX
X
ln h2
f(x(i) , Uk ) (∀U = (U0 , · · · , UN2 −1 ) ∈ ΩN2 ).
i=1
(4.2.2)
k=0
Trên cơ sở này ta lập được dãy u(r)
r≥1
⊂ Uh2 tham hàm HLCĐ xấp xỉ như là dãy
mô phỏng điều khiển tựa TƯ trong Định nghĩa 2.3.1, gắn với công thức lặp (2.3.2) và
hàm F o(U) trong (4.2.2). Sự hội tụ của dãy tham hàm HLCĐ xấp xỉ nói trên về tham
hàm HLCĐ u∗ ∈ U và đánh giá sai số tương ứng được chỉ ra trong mệnh đề sau:
Mệnh đề 4.2.1 Giả sử các miền Ω ⊂ Rm , X ⊂ Rn là lồi và compac, hàm f(x, u)
(trong (4.1.2)) là liên tục theo x ∈ X và khả vi liên tục theo u ∈ Ω. Khi đó, nếu tồn
tại tham hàm HLCĐ u = u∗ ∈ U thì các điều kiện (A1 )-(D1 ) đều thỏa mãn và các dãy
(r)
u (s) r≥1 , U (r) r≥1 tham hàm và tham số HLCĐ xấp xỉ hội tụ (hcc) theo mục tiêu
về tham hàm HLCĐ u∗ :
P
n
lim
N1 ,N2→+∞
r→+∞
o
n
F o(U (r) ) = J (u∗) = P
lim
N1 ,N2 →+∞
r→+∞
o
J (u(r) ) = J (u∗ ) = 1,
trong đó các công thức đánh giá δ -sai số tương đối tương ứng cho bởi Định lý 2.3.2.
Khi xét các phương trình (4.1.7)-(4.1.8) (có vế phải là các hàm b1 (z, t), b2(u, t) trong
(4.2.1)) ta lưu ý rằng: Do ln z(t, s) (s ∈ [so, T2 ]) không Rieman-khả tích theo t ∈ [0, 1]
20
và b2 u(s), t nói chung không Rieman-khả tích theo s ∈ [so , T2] nên ta chưa thể sử
dụng giải tích cơ sở để khôi phục hàm số từ nguyên hàm và do đó chưa khẳng
định được sự tồn tại cácZ đạo hàm (theo nghĩa thông thường) của các hàm: z(t, s) =
Z
s
so
b2 u(s0 ), t ds0 , y(t) =
t
to
ln z(t0 , T2 ) dt0 . Bởi vậy, chúng tôi có nhận xét sau:
Chú ý 4.2.1 Đạo hàm trong phương trình vi phân (4.1.7) và đạo hàm riêng (4.1.8)
cần được hiểu là các đạo hàm yếu (suy rộng), như đã nêu trong Định nghĩa 4.1.2.
Nhằm ứng dụng mô hình trên vào dự báo động đất (bằng Số liệu địa chấn) trên
vùng X := x = (x1 , x2 ) : xi ≤ xi ≤ xi (i = 1 ÷ 2) , ta xét vtnn (ξ, µ) ∈ R3 với
ξ = (ξ1 , ξ2 ) ∈ X là tọa độ chấn tâm và µ ∈ (so , +∞) là biên độ chấn cấp tương ứng của
các trận động đất trong tương lai trên vùng X. Khi mở rộng mô hình Jackson-Kagan
(tham số hóa) đã biết, ta giả thiết rằng: Hàm mật độ có điều kiện pξ (x|s) của ξ tuân
theo phân phối Jackson-Kagan tham hàm hóa, dưới dạng (4.1.2) với:
N1
X
m(j) − so
Z
N1
X
m(j) − so
f(x, u(s)) :=
ϕj x, u(s) , Ku (s) :=
ϕj x, u(s) dx(∀s ∈ [so, T2 )
πKu (s)
π
j=1
j=1
X
cos2 ψj (x)
u(s) := a(s), d(s) ∈ Ω,
ϕj x; u(s) := 1+a(s)
,
d2 (s)+ri2 (x)
(so ≤ s ≤ T2 ),
Ω := [a, a] × [d, d],
r (x) = kx − x(j) kr , r = 110(Km),
j
o
o
2
(j)
(j)
2 −x2 ) sin αj
(x1 −x1) cos αj +(x
(x 6= x(j) ),
kx−x(j) k
cos2 ψj (x) =
(1 ≤ j ≤ N1 ),
(4.2.3)
(j)
1
(x = x ),
với (x(i), m(i) )
N1
i=1
⊂ X × (so, T2 ) là dãy N1 ( 1) quan sát về vtnn (ξ, µ) trong catalog
động đất trên vùng X và αj = 2πγj , γj ∼ U(0, 1) (1 ≤ j ≤ N1 ) là các đlnn độc lập.
Chú ý 4.2.2 Từ (4.2.3) ta dễ dàng kiểm tra sự thỏa mãn các giả thiết của Mệnh đề
4.2.1 về hàm f(x, u). Khi đó, do X, Ω đều là các hình chữ nhật (lồi, compac) nên ta có
thể sử dụng mệnh đề trên vào việc xác định tham hàm HLCĐ xấp xỉ u(r) (s) cho tham
hàm HLCĐ u∗ ∈ U trong hàm mật độ Jackson-Kagan tham hàm hóa.
Chúng tôi đã ứng dụng (trong Luận án) mô hình trên cho X là vùng Tây Bắc Bộ
nước ta, gắn với các số liệu địa chấn (x(i) , m(i) )
N1
i=1
(N1 = 193) trong catalog của
vùng này để xác định tham hàm HLCĐ của hàm mật độ Jackson-Kagan tham hàm
hóa tương ứng. Từ đó có thể cải tiến việc dự báo (bằng PPMC) sự xuất hiện chấn
tâm động đất trên những dải biên độ chấn cấp khác nhau của vùng Tây Bắc Bộ.
- Xem thêm -