Tài liệu Dùng phương pháp monte carlo để giải một lớp bài toán điều khiển ngẫu nhiên tổng hợp liên quan đến quá trình điểm gắn mã và áp dụng

.PDF

65368

139

thuvientrithuc1102 Báo vi phạm

Tải xuống 139

Mô tả:

1 MỞ ĐẦU Về lịch sử, các bài toán điều khiển tối ưu (ĐKTƯ) tất định ra đời sớm nhất-gắn với tên tuổi của Pontriagin (1959), Bellman (1957). Do tầm quan trọng của bài toán này trong các lãnh vực điều khiển học, khoa học-kỹ thuật, quản lý kinh tế-tài chính...nên việc nghiên cứu các mô hình ĐKTƯ mới cùng với phương pháp giải trong từng lĩnh vực đã và đang được nhiều tác giả trong hoặc ngoài nước quan tâm. Theo truyền thống, các phương pháp tất định của quy hoạch lồi được sử dụng trước tiên để giải các bài toán ĐKTƯ lồi kinh điển (hệ động lực tuyến tính theo biến trạng thái và điều khiển, hàm mục tiêu và tập hợp các điều khiển chấp nhận được (CNĐ) là lồi). Đương nhiên, nếu bài toán ĐKTƯ không có tính lồi thì các công cụ trên không còn hiệu lực và trở thành lý do mà cho đến những năm gần đây, G. Zhao, M. Davison (2009), Y. Kyung, J. Kim, S. Jung, K. Eom (2010)... vẫn phải dùng đến các phương pháp heuristic để giải bài toán này. Các phương pháp của quy hoạch phi tuyến cũng đã được T.D. Quốc, C. Savorgman (2009), T.D. Quoc, M. Diehl (2010)... sử dụng, nhưng chỉ để giải bài toán ĐKTƯ rời rạc và cũng chỉ tìm được nghiệm tối ưu (TƯ) địa phương. Khi mở rộng khái niệm hội tụ từ tất định sang ngẫu nhiên (hội tụ hầu chắc chắn (hcc)) của lời giải xấp xỷ khi giải số bài toán ĐKTƯ không lồi, các phương pháp Monte Carlo (PPMC) đã được T. Cảnh, M.V. Được, T. Đ. Quỳ (2008), W. Jiekang, Z. Jianquan, C. Groutong, Z. Hongliang (2008), N.Q. Hỷ, M.V. Được (2009), M.V. Được, N.Q. Hỷ (2010) sử dụng để giải 1 số dạng riêng biệt của loại bài toán trên. Bản luận án này nhằm mục đích góp phần sử dụng PPMC để giải 2 lớp mới trong số các bài toán ĐKTƯ không lồi. Đây là 2 lớp tổng quát hóa của bài toán Mayer không lồi có (hoặc không) ràng buộc trạng thái và chúng không những là các lớp đủ rộng trong các bài toán ĐKTƯ không lồi (vì các bài toán Lagrange, Bolza không lồi đều có thể chuyển về các dạng này), mà còn là những dạng tổng quát hóa của mô hình hợp lý cực đại (HLCĐ) kinh điển (được chúng tôi gọi là Mô hình HLCĐ liên tục hóa), khi nghiên cứu 2 bài toán ngẫu nhiên mới về dự báo động đất. Gắn với mục tiêu nghiên cứu trên, các kết quả chính của Luận án bao gồm: - Thiết lập mới 2 lớp Bài toán Mayer suy rộng (hoặc mở rộng) không (hoặc có) ràng 2 buộc trạng thái, với mục tiêu và tập các điều khiển CNĐ không lồi, hệ động lực phi tuyến gồm phương trình vi phân (PTVP) và đạo hàm riêng thường (hoặc suy rộng). - Sử dụng PPMC để xây dựng các dãy nghiệm ngẫu nhiên hội tụ hcc theo mục tiêu về nghiệm TƯ của các bài toán Mayer không lồi nói trên và đánh giá sai số tương ứng. - Xây dựng khái niệm về "mô hình HLCĐ liên tục hóa" dưới dạng các bài toán Mayer không lồi này và dùng các kết quả trên để xác định các tham biến của quá trình động đất liên quan đến việc Giảm thiểu độ rủi ro động đất (RRĐĐ) cho CTTĐ Sơn La. Các nội dung này đã được công bố trong các bài báo [1] (Tạp chí KH & CN, ĐH Thái nguyên), [2], [3], [4] (Tạp chí Ứng dụng Toán học) và các báo cáo khoa học tại Hội nghị Quốc gia và hội nghị Quốc tế; Đồng thời đươc trình bày trong 3 chương cuối của luận án, theo bố cục sau: CHƯƠNG 1 Một số công cụ giải tích và ngẫu nhiên có liên quan Giới thiệu một số công cụ liên quan đến việc trình bày luận án trong các chương sau, trong đó: Phương trình vi phân thường (và suy rộng), mô hình HLCĐ dùng để đặt bài toán ĐKTƯ từ 1 thực tế ứng dụng; Các phương pháp số trong ĐKTƯ và mô hình dò tìm ngẫu nhiên (DTNN) dùng để giải bài toán CHƯƠNG 2 Thuật toán Monte Carlo giải bài toán Mayer suy rộng không lồi Trong chương này, 1 dạng mở rộng của bài toán Mayer không lồi và không ràng buộc (trạng thái) thông thường là Bài toán Mayer suy rộng không lồi được thiết lập (trong Mục 2.1), với hệ động lực phi tuyến là PTVP và đạo hàm riêng suy rộng, hàm mục tiêu không lồi. Việc sử dụng phương pháp sai phân để rời rạc hóa bài toán này được xét trong Mục 2.2, gắn với sự hội tụ theo mục tiêu của nghiệm bài toán rời rạc về nghiệm TƯ của bài toán Mayer suy rộng nói trên. Khi đó, ta có thể sử dụng PPMC để lập (trong Mục 2.3) các dãy nghiệm ngẫu nhiên hội tụ hcc theo mục tiêu về nghiệm TƯ của bài toán ban đầu, gắn với công thức đánh giá sai số tương ứng. Nội dung của chương này đã công bố trong các công trình [2] của tác giả. 3 2.1. Đặt bài toán Xét điều khiển u : [so, T2 ] → Rm liên tục từng khúc trong Bài toán Mayer suy rộng: (2.1.1) J (u) := f o y(T1), z(T1 , T2 ) → inf, ẏ(t) = g1 y(t), z(t, T2), t (to < t ≤ T1 ), y(to) = yo , ∂z(t, s) ∂s (2.1.2) = g2 z(t, s), u(s), t, s (so < s ≤ T2 ), z(t, so) = zo(t) (to ≤ t ≤ T1 ), u ∈ U := {u : [so, T2 ] → Ω | liên tục từng khúc}. (2.1.3) (2.1.4) trong đó đã cho: yo ∈ Rn1 , Ω ⊂ Rm , các hàm zo, gi (i = 1 ÷ 2) và các đạo hàm được hiểu theo nghĩa suy rộng. Gắn với các miền Ωz , Ωy chứa tất cả các giá trị có thể của lần lượt các nghiệm z(t, s), y(t) = y(t; u) (∀u ∈ U, t ∈ [to, T1], s ∈ [so, T2 ) là các giả thiết: (A1 )- Hàm g1 : Rn1 × Rn2 × [to, T1] → Rn1 thỏa mãn điều kiện Lipschitz :  (1) 0 (1) 0  0 kg1 (y 0 , z 0 , t0 ) − g1 (y”, z”, t”)k ≤ L(1) y ky − y”k + Lz kz − z”k + Lt |t − t”|   (∀y 0 , y” ∈ Ωy ⊂ Rn1 ; z 0 , z” ∈ Ωz ⊂ Rn2 ; t0 , t” (2.1.5) ∈ [to, T1]). (B1 )- Hàm g2 : Rn2 × Rm × [to, T1 ] × [so, T2] → Rn2 thỏa mãn điều kiện Lipschitz : (2) (2) (2) kg2 (z 0 , u0 , t, s0 ) − g2 (z”, u”, t, s”)k ≤ Lz kz 0 − z”k + Lu ku0 − u”k + Ls |s0 − s”| (∀z 0 , z” ∈ Ωz ; u0 , u” ∈ Ω; t ∈ [to, T1]); s0 , s” ∈ [so, T2 ]) (2.1.6) với các hàm g2 (z, u, t, s), zo(t) ∈ Rn2 liên tục theo t ∈ [to, T1 ]. (C1 )- Hàm f o : Rn1 × Rn2 → R1 thỏa mãn điều kiện Lipschitz : (o) (o) |f o (y 0 , z 0 ) − f o(y”, z”)| ≤ Ly ky 0 − y”k + Lz kz 0 − z”k (∀y 0 , y” ∈ Ωy ; z 0 , z” ∈ Ωz ). (2.1.7) (D1 )- Các hệ (2.1.2)-(2.1.3) luôn có nghiệm duy nhất y(t) ∈ Rn1 , z(t, s; u) ∈ Rn1 (∀u ∈ U) liên tục theo t ∈ [to, T1 ], s ∈ [so, T2 ]. Đồng thời, bài toán (2.1.1)-(2.1.4) có ĐKTƯ u∗ ∈ U với hữu hạn các điểm gián đoạn (loại 1) là s(k) (k = 1 ÷ ko < ∞). 2.2. Nghiệm tựa tối ưu và sự hội tụ của nó N1 N2 , sk k=0 của lưới (đều) trên [to, T1 ] và [so, T2 ] sao cho: i=0 Gắn với các điểm ti ti = to + ih1 (0 ≤ i ≤ N1 ); sk = so + kh2 (0 ≤ k ≤ N2 ); h1 = T1 − to T 2 − so , h2 = , N1 N2 ta lập bài toán ĐKTƯ rời rạc ứng với bài toán (2.1.1)-(2.1.4), dưới dạng: N2 F o(U) := f o (YN1 , ZN ) → inf, 1 (2.2.1) 4 Yi+1 = Yi + h1 g1 (Yi , ZiN2 , ti ) (0 ≤ i < N1 ) , Yo = yo, (2.2.2) Zik+1 = Zik + h2 g2 (Zik , Uk , ti , sk ), Zio = zo(ti ) (0 ≤ i ≤ N1 , 0 ≤ k < N2 ) (2.2.3) U := (U0 , U1 , ..., UN2−1 )T ∈ RmN2 , Uk ∈ Ω (0 ≤ k < N2 ). (2.2.4) Từ các hệ rời rạc (2.2.2)-(2.2.3) ta có thể xấp xỉ hệ (2.1.2)-(2.1.3) bởi hệ:              dY (t) dt ∂Z(t,s) ∂s = g1 Yi , Z(ti , T2 ), ti (ti < t ≤ ti+1 , 0 ≤ i < N1 ), Y (to ) = yo , = g2 (Zik , Uk , ti , sk )(sk < s ≤ sk+1 , ti < t ≤ ti+1 ), Z(t, so) = zo(t) (2.2.4*) (to ≤ t ≤ T1 ) ; 0 ≤ i < N1 , 0 ≤ k < N2 , Định nghĩa 2.2.1 Ứng với mỗi điều khiển u ∈ U (trong (2.1.4)): - Nếu biến điều khiển trong hệ động lực (2.2.4*) xác định dưới dạng: Uk := u(sk ) (0 ≤ k < N2 ), thì quỹ đạo Y (t) := Y (t; u), Z(t, s) := Z(t, s; u) của hệ (2.2.4*) gọi là quỹ đạo xấp xỉ tuyến tính (XXTT) (với y(t) := y(t; u), z(t, s) := z(t, s; u)) của hệ (2.1.2)-(2.1.3). - Nếu biến điều khiển trong hệ động lực (2.1.2)-(2.1.3) xác định dưới dạng: u(s) ≡ u(sk ) (sk ≤ s < sk+1 , 0 ≤ k < N2 ), thì nó được gọi là xấp xỉ bậc thang (hay hằng từng khúc) với biến điều khiển u ∈ U. - Nghiệm liên tục hóa u(s), Y (t; u), Z(t, s; u) trong bài toán ĐKTƯ rời rạc (2.2.1) (2.2.4) gọi là nghiệm XXTT (với nghiệm u(s), y(t; u), z(t, s; u) ) của (2.1.1)-(2.1.4). Để đánh giá sai số của các quỹ đạo XXTT trong hệ (2.1.3), ta đưa ra các ký hiệu: (2) Ik (u) := Zsk ku(s) − u(sk−1 )kds (1 ≤ k ≤ N2 ) (∀u ∈ U), sk−1 ∆u Zi := max ∆uk Zi , ∆ukZi := 1≤k≤N2 max sk−1 ≤s≤sk kz(ti , s; u) − Z(ti , s; u)k (1 ≤ i ≤ N1 ) và đánh giá sai số ∆u Zi của quỹ đạo XXTT bằng mệnh đề sau: Bổ đề 2.2.1 Nếu Ωz còn chứa các giá trị có thể của nghiệm phương trình (2.2.3) và có các điều kiện (B1 ), (D1 ) thì tồn tại các hằng số C2 , K2 ∈ (0, +∞) để cho:  (2)  (2)  C2 := max(u,t)∈Ω×[to,T1 ] kg2 z(t, s), u, t, s k ≤ K2 Lz (T2 − so)eLz (T2 −so ) + 1 s∈[so ,T2 ]   K := maxkg (z (t), u, t, s)k : (u, t, s) ∈ Ω × [t , T ] × [s , T ] . 2 2 o o 1 o 2 Khi đó : 5  P N2 (2)  N2 −k I (2)(u) (1 ≤ i ≤ N ) ∆u Zi ≤ C 2 h2 + L(2) u 1 k=1 (1 + Lz h2 ) k  (2) (2) (2) với: C := 2−1 C + L(2) eL(2) z (T2 −so ) − 1 , Ls/z := Ls /Lz . 2 2 s/z Tương tự, để đánh giá sai số của các quỹ đạo XXTT trong hệ (2.1.2), ta các ký hiệu: (1) Ii (z) = (1) Ii Zti z(u) := kz(t, T2 ; u) − Z(ti−1 , T2 ; u)kdt (∀u ∈ U, i = 1 ÷ N1 ) ti−1 ∆u Y := max ∆ui Y, ∆ui Y := 1≤i≤N1 max ky(t; u) − Y (t; u)k ti−1 ≤t≤ti và đánh giá sai số ∆u Y của quỹ đạo XXTT bằng mệnh đề sau: Bổ đề 2.2.2 Với điều kiện của Bổ đề 2.2.1, nếu Ωy còn chứa các giá trị có thể của nghiệm phương trình (2.2.2) và có điều kiện (A1 ) thì tồn tại các hằng số C1 , K1 :     0 < C1 := sup z∈Z kg1 t∈[to,T1 ] (1) (1) y(t), z, t)k ≤ K1 Ly (T1 − to)eLy (T1 −to ) + 1 < +∞,   0 < K1 := sup kg1 (yo, z, t)k : to ≤ t ≤ T1 , z ∈ Z , Z := z ∈ Rn2 : kzk ≤ r < +∞, (1) (1) với r := supto ≤t≤T1 kzo(t)k + (T2 − so)C2 . Nếu đặt L(1) := Lt /Ly thì ∀u ∈ U ta còn có: t/y u ∆ Y ≤ (1) C 1 h1 + Lz N1 X i=1 (1) (1) Ii (z) 1 + Ly h1 N1 −i (1) (1) , C 1 := 2−1 (C1 + Lt/y ) eLy (T1 −to ) −1 . Từ các giả thiết (A1 )-(C1 ) ta suy ra tính liên tục của các hàm hợp ZiN2 = ZiN2 (U), YN1 = YN1 (U) cho từ hệ (2.2.3)-(2.2.2). Khi đó bài toán (2.2.1)-(2.2.4) trở thành bài toán quy hoạch liên tục với tập hợp các lời giải CNĐ là tập compact ΩN2 ⊂ RmN2 , dưới dạng: N2 F o(U) := f o YN1 (U), ZN (U) → inf, U := (U0 , ..., UN2−1 ) ∈ ΩN2 . 1 (2.2.5) Bởi vậy, sẽ tồn tại lời giải Û := (Û0 , ..., ÛN2−1 ) của bài toán trên. Định nghĩa 2.2.2 Lời giải Û ∈ ΩN2 của bài toán quy hoạch (2.2.5) (cũng là ĐKTƯ của bài toán ĐKRR (2.2.1)-(2.2.4)) và các quỹ đạo Ŷi = Yi (Û ), Ẑik = Zik (Û) (0 ≤ i ≤ N1 , 0 ≤ k ≤ N2 ) của hệ (2.2.2)-(2.2.3) tương ứng gọi là nghiệm tối ưu (TƯ) rời rạc ứng với bài toán ĐKTƯ liên tục (2.1.1)-(2.1.4). Hàm hằng từng khúc û ∈ U: û(s) := Ûk (sk ≤ s < sk+1 , 0 ≤ k < N2 ) gọi là điều khiển tựa TƯ và quỹ đạo ẑ(t, s) = z(t, s; û), ŷ(t) = y(t; û) tương ứng của hệ (2.1.3), (2.1.2) gọi là quỹ đạo tựa TƯ của bài toán (2.1.1)-(2.1.4). Điều khiển tựa TƯ và quỹ đạo tựa TƯ û(s), ẑ(t, s), ŷ(t) gọi 6 là nghiệm tựa TƯ và û(s), Ẑ(t, s) = Z(t, s; û), Ŷ (t) = Y (t; û) gọi là nghiệm XXTT tựa TƯ của bài toán này. Liên quan đến việc sử dụng các nghiệm (và nghiệm XXTT) tựa TƯ để xấp xỉ nghiệm TƯ u∗ (s), y ∗(t) = y(t; u∗ ), z ∗ (t, s) = z(t, s; u∗ ) của bài toán (2.1.1)-(2.1.4), ta đặt: (1) Ji   ∆f o := f o y(T1; û), z(T1, T2 ; û) −f o y(T1; u∗ ), z(T1 , T2; u∗ ) ,   ∆f ˆ o := f o Ŷ (T1 ), Ẑ(T1 , T2) −f o y(T1; u∗ ), z(T1 , T2; u∗ ) ,     ˆ o ≥ 0) ˆ o ≥ 0) I (1) z(u∗ ) (Khi : ∆f I (2) (u∗ ) (Khi : ∆f i k (2) := Jk :=   I (1) z(û) (Khi : ∆f  0 ˆ o < 0) ˆ o < 0) (Khi : ∆f i (với 1 ≤ i ≤ N1 , 1 ≤ k ≤ N2 ). Khi đó từ các Bổ đề 2.2.1 và 2.2.2 ta lần lượt thu được: Bổ đề 2.2.3 Nếu có các điều kiện của Bổ đề 2.2.2 và điều kiện (C1 ) thì:    (o) (o) (1) PN1 (1) (1) N1 −i ˆ o | ≤ (L(o) 1 + Ly h1 + |∆f y C 1 )h1 + (Lz C 2 )h2 + Ly Lz i=1 Ji  +L(o) L(2) PN2 J (2) 1 + L(2) h N2 −k , 0 ≤ ∆f o ≤ L(o)∆û Z + L(o)∆û Y + |∆f ˆ o |. z y z 2 y z N1 k=1 k Định lí 2.2.1 Nếu có các điều kiện của Bổ đề 2.2.3 và nếu h1 , h2 → 0 thì điều khiển tựa TƯ û(s) sẽ hội tụ theo mục tiêu về ĐKTƯ u∗ của bài toán (2.1.1)-(2.1.4): lim f o y(T1 ; û), z(T1 , T2; û) = f o y(T1 ; u∗ ), z(T1, T2 ; u∗ ) . h1 ,h2 →0 Khi ký hiệu Uh2 := u ∈ U : u(s) ≡ Uk (sk ≤ s < sk+1 , 0 ≤ k < N2 ) , ta còn có: lim f o Ŷ (T1 ), Ẑ(T1, T2 ) = f o y(T1; u∗ ), z(T1, T2 ; u∗ ) , h1 ,h2 →0 lim ∆u Y = lim ∆u Zi = 0 (∀i = 1 ÷ N1 , u ∈ Uh2 ). h1 ,h2 →0 h2 →0 2.3 Thuật toán Monte Carlo giải bài toán Từ Định lý 2.2.1 ta thấy rằng: Việc tìm ĐKTƯ u∗ (s) của bài toán (2.1.1)-(2.1.4) đưa về việc tìm điều khiển tựa TƯ û(s) tương ứng, mà thực chất là việc giải bài toán quy hoạch (2.2.5). Liên quan đến những ứng dụng ở Chương 4, ta còn xét bài toán này ứng với dạng đặc biệt của vế phải trong hệ động lực (2.1.2)-(2.1.3) như dưới đây:   g1 (y, z, t) = A1 (t)y + b1 (z, t) , g2 (z, u, t, s) = A2 (t, s)z + b2 (u, t, s), A1 : [to, T1 ] → Rn1 ×n1 ,  b : Rn2 × [t , T ] → Rn1 , A : [t , T ] × [s , T ] → Rn2 ×n2 , b : Rm × [t , T ] × [s , T ] → Rn2 1 o 1 2 o 1 o 2 2 o 1 o 2 (2.3.1) 7 Chú ý 2.3.1 Nếu hệ (2.1.2)-(2.1.3) có dạng (2.3.1) (tuyến tính theo trạng thái), thì từ các Bổ đề 2.3.1 và 2.3.2 (trong Luận án) ta thu được dạng hiển của các hàm hợp YN1 (U), ZNN12 (U) trong (2.2.5). Khi: yo = 0 ∈ Rn1 , zo(t) ≡ 0 ∈ Rn2 , A1 (t) ≡ 0 ∈ Rn1 ×n1 , A2 (t, s) ≡ 0 ∈ Rn2 ×n2 , ta còn có thể biểu diễn F o(U) trong (2.2.5) dưới dạng: o o F (U) = f h1 N 1 −1 X b1 (ZiN2 , ti ), h2 i=0 NX 2 −1 k=0 NX 2 −1 N2 b2 (Uk , T1 , sk ) , Zi = h2 b2 (Uk , ti , sk )(i = 0÷N1 ) k=0 Do bài toán quy hoạch (2.2.5) không có tính lồi, nên 1 loại thuật toán Monte Carlo (Mô hình DTNN đơn giản) sẽ được sử dụng để giải bài toán trên. Liên quan đến điều này, mệnh đề dưới đây đã được chứng minh. Bổ đề 2.3.3 Trong các điều kiện của Định lý 2.2.1, bài toán (2.2.5) tồn tại điểm cực tiểu Û ∈ ΩN2 N o o 2 không cô lập, theo nghĩa: mes U ∈ Ω : F (U) < F (Û) + ε > 0 (∀ε > 0), với mes(B) là độ đo Lebesgue của tập hợp Borel B ⊂ ΩN2 ⊂ RmN2 . Trên cơ sở này, ta có thể lập dãy DTNN đơn giản {U (r) }r≥1 theo công thức lặp: U (r+1) =   U (r)  wr (Khi F o(U (r) ) ≤ F o(wr )) (Khi F o(U (r) ) > (∀ r ≥ 1) , U (1) := wo , với : (2.3.2) F o(wr )) {wr }r≥0 là dãy các thể hiện độc lập của vtnn w ∼ U(ΩN2 ) và đưa ra các khái niệm sau: Định nghĩa 2.3.1 Một hàm nhận giá trị ngẫu nhiên được gọi là: (r) - Mô phỏng điều khiển tựa TƯ, nếu có dạng: u(r) (s) := Uk (sk ≤ s < sk+1 , 0 ≤ k < N2 ). - Mô phỏng quỹ đạo tựa TƯ, nếu nó là nghiệm y (r) (t), z (r) (t, s) của hệ (2.1.2)-(2.1.3) ứng với điều khiển u(r) (s) (so ≤ s ≤ T2 ) : y (r) (t) := y(t; u(r)), z (r) (t, s) := z(t, s; u(r) ) (∀t ∈ [to, T1 ] , s ∈ [so , T2]). - Mô phỏng nghiệm tựa TƯ, nếu nó là mô phỏng điều khiển và quỹ đạo tựa TƯ u(r) (s), y (r) (t), z (r)(t, s) . - Mô phỏng quỹ đạo XXTT tựa TƯ, nếu nó là quỹ đạo XXTT Y (r) (t), Z (r) (t, s) của hệ (2.1.2)-(2.1.3) ứng với điều khiển u(r) ∈ U : Y (r) (t) := Y (t; u(r)), Z (r) (t, s) := Z(t, s; u(r)) (∀t ∈ [to, T1], s ∈ [so , T2]). - Mô phỏng nghiệm XXTT tựa TƯ, nếu nó là mô phỏng điều khiển tựa TƯ và quỹ đạo XXTT tựa TƯ u(r) (s), Y (r) (t), Z (r)(t, s) . 8 Sự hội tụ của dãy mô phỏng nghiệm XXTT tựa TƯ cho bởi mệnh đề sau: Định lý 2.3.1 Với các điều kiện của Định lý 2.2.1, nếu h1 , h2 → 0, r → +∞ thì dãy mô phỏng nghiệm XXTT tựa TƯ hội tụ (hcc) theo mục tiêu về nghiệm TƯ u∗ (s), y ∗ (t) := y(t; u∗), z ∗ (t, s) := z(t, s; u∗) của bài toán (2.1.1)-(2.1.4): P n o lim f o Y (r) (T1), Z (r) (T1, T2 ) = f o y ∗(T1 ), z ∗ (T1 , T2 ) = 1. h1 ,h2 →0 r→+∞ Sự hội tụ của dãy mô phỏng nghiệm tựa TƯ cho bởi mệnh đề sau: Hệ quả 2.3.1 Với các điều kiện của Định lý 2.2.1, nếu h1 , h2 → 0, r → +∞ thì dãy mô phỏng nghiệm tựa TƯ hội tụ (hcc) theo mục tiêu về nghiệm TƯ u∗ (s), y ∗ (t), z ∗ (t, s)) của bài toán (2.1.1)-(2.1.4): P n o lim f o y (r) (T1 ), z (r) (T1 , T2) = f o y ∗ (T1), z ∗ (T1 , T2 ) = 1. h1 ,h2 →0 r→+∞ Để đánh giá "sai số" theo số phép lặp của các nghiệm mô phỏng trong các mệnh đề trên, chúng tôi đưa ra các khái niệm sau: Định nghĩa 2.3.2 Với mỗi vtnn w := (wo , · · · , wN2 −1 ) ∼ U(ΩN2 ) và vec tơ tất định U = (Uo , · · · , UN2 −1 ) ∈ ΩN2 ta lập các hàm bậc thang uw , uU ∈ Uh2 có dạng: uw (s) ≡ wk , uU (s) ≡ Uk (∀s ∈ [s,sk+1 ), k = 0 ÷ N2 − 1). Khi đó các tập Ar (δ), Ar (δ) (0 ≤ δ 1) được gọi là tập các lời giải δ -tốt bị bỏ qua của lần lượt xấp xỉ U (r) (cho Û ) và mô phỏng u(r) (cho u∗ ), nếu chúng có dạng: Ar (δ) := U ∈ ΩN2 : F o(U) < F o(U (r) ) − δ , Ar (δ) := U ∈ ΩN2 : J (uU ) < J (u(r) ) − δ , và gọi Λr (δ), λr (δ) là δ -sai số tương đối tương ứng, nếu chúng là các xác suất: Λr (δ) := P F o(w) < F o(U (r) ) − δ , λr (δ) := P J (uw ) < J (u(r)) − δ . Bổ đề 2.3.4 Với các tập Ar (δ), Ar (δ) và các δ -sai số tương đối nói trên, ta có: λr (δ) = Λr (δ) ,   Λr (δ) =  λ (δ) = r mes A r (δ) mes(ΩN2 ) mes Ar (δ) mes(ΩN2 ) = = mes U ∈ΩN2 :F o (U ) 0) ứng với bài toán (3.1.1)-(3.1.5), dưới dạng: N2 Fo(U) := fo(YN1 , ZN ) → inf, 1 (3.2.1) Yi+1 = Yi + h1 g1 (Yi , ZiN2 , ti ), Yo = yo (0 ≤ i ≤ N1 ), (3.2.2) Zik+1 = Zik + h2 g2 (Zik , Uk , ti, sk ), Zio = zo (ti) (0 ≤ i ≤ N1 , 0 ≤ k < N2 ), (3.2.3) U := (U0 , U1 , ..., UN2−1 )T ∈ RmN2 , Uk ∈ Ω (0 ≤ k < N2 ), (3.2.4) N2 Fj (U) := fj (YN1 , ZN ) ≤ −δ (1 ≤ j ≤ n). 1 Chú ý 3.2.1 (3.2.5) Do hệ động lực (3.1.2)-(3.1.3) trùng với (2.1.2)-(2.1.3) và hệ rời rạc tương ứng (3.2.2)-(3.2.3) trùng với (2.2.2)-(2.2.3), nên trong trường hợp này ta cũng có thể đưa ra (trong Định nghĩa 3.2.1 của Luận án) các khái niệm tương tự như trong Định nghĩa 2.2.1 về: xấp xỉ bậc thang u ∈ Uh2 của điều khiển u ∈ U (trong (3.1.4)), quỹ đạo XXTT Y (t; u), Z(t, s; u) của quỹ đạo y(t; u), z(t, s; u) và nghiệm XXTT u(s), Y (t; u), Z(t, s; u) của nghiệm u(s), y(t; u), z(t, s; u) . Ngoài ra, từ các giả thiết (A2 )-(D2 ) ta suy ra tính liên tục (theo U ) của các hàm hợp N2 N2 YN1 = YN1 (U), ZN = ZN (U) (xác định từ hệ phương trình truy hồi (3.2.2)-(3.2.3)) và 1 1 do đó là tính liên tục của các hàm hợp fj YN1 (U), ZNN12 (U) (0 ≤ j ≤ n). Khi đó bài toán điều khiển rời rạc (ĐKRR) (3.2.1)-(3.2.5) trở thành bài toán quy hoạch liên tục:    Fo (U) := fo YN1 (U), Z N2 (U) → inf, U ∈ ΩN2 , N1  F (U) := f Y (U), Z N2 (U)≤ −δ (1 ≤ j ≤ n). j j N1 N1 (3.2.6) Do ΩN2 là tập compac trong RmN2 nên bài toán này luôn có lời giải U = Û . Đây cũng là ĐKRR tối ưu của bài toán (3.2.1)-(3.2.5). Khi đó ta có thể mở rộng Định nghĩa 2.2.2 trong trường hợp này, dưới dạng: Định nghĩa 3.2.2 ĐKRR tối ưu Û ∈ ΩN2 của bài toán (3.2.1)-(3.2.5) và các quỹ đạo Ŷi = Yi (Û), Ẑik = Zik (Û) (0 ≤ i ≤ N1 , 0 ≤ k ≤ N2 ) tương ứng của hệ (3.2.2)-(3.2.3) gọi là nghiệm TƯ của bài toán ĐKRR (3.2.1)-(3.2.5). Hàm bậc thang û ∈ Uh2 gọi là 12 điều khiển tựa TƯ, nếu nó có dạng: û(s) := Ûk (sk ≤ s < sk+1 , 0 ≤ k < N2 ); Quỹ đạo ẑ(t, s) = z(t, s; û), ŷ(t) = y(t; û) tương ứng gọi là quỹ đạo tựa TƯ và û(s), ŷ(t), ẑ(t, s) gọi là nghiệm tựa TƯ và û(s), Ŷ (t), Ẑ(t, s) (với Ŷ (t) = Y (t; û), Ẑ(t, s) = Z(t, s; û)) gọi là nghiệm XXTT tựa TƯ của bài toán (3.1.1)-(3.1.5) Để chỉ ra sự hội tụ của các nghiệm nói trên về nghiệm TƯ của bài toán (3.1.1)(3.1.5), các mệnh đề dưới đây lần lượt được chứng minh gắn với các ký hiệu:     ∆u Zi := max1≤k≤N2 ∆uk Zi , ∆uk Zi := maxsk−1 ≤s≤sk kz(ti , s; u) − Z(ti , s; u)k (∀u ∈ U),     Z s (2) Iik (u) := sup(z,v,s)∈Ωuk g2 (z, v, ti, ξ) − g2 (z, u(sk ), ti , ξ) dξ (i = 1 ÷ N1 ),  sk      Ωuk := Ωz × Vku × [sk , sk+1 ], Vku := u(ξ) ∈ Ω : sk ≤ ξ ≤ s ≤ sk+1 (k = 0 ÷ N2 − 1). Bổ đề 3.2.1 Với các điều kiện (B2 ) − (C2), nếu Ωz chứa mọi giá trị có thể của nghiệm phương trình (3.2.3) thì với mọi u ∈ U ta có:  (2) P  ∆uZi ≤ eLz (T2 −so ) − 1 ε(2) (h2 ) + N2 (1 + γ2 )N2 −k I (2) (u) (∀i = 1 ÷ N1 ), k=1 i,k−1 P N2 (2)  (2) với : lim (2) N2 −k γ < eLz (T2 −so ) − 1. 2 h2 →0 ε (h2 ) = 0, γ2 := Lz h2 , k=1 (1 + γ2 ) Tương tự, ta có các mệnh đề sau, gắn với mọi u ∈ U, i = 1 ÷ N1 và các ký hiệu:     ∆u Y := max1≤i≤N1 ∆uiY , ∆ui Y := maxti−1 ≤t≤ti ky(t; u) − Y (t; u)k,     Z t (1) Ii (u) := max(y,z,t)∈Ωui g1 (y, z, τ ) − g1 (y, Z(ti, T2 ; u), τ ) dτ ,   ti    u  Ωi := Ωy × Ziu × [ti , ti+1], Ziu := z(t, T2; u) ∈ Ωz : ti ≤ t ≤ ti+1 . Bổ đề 3.2.2 Với các điều kiện (A2 ) và (D2 ), nếu Ωy chứa mọi giá trị có thể của nghiệm phương trình (3.2.2), thì với mọi u ∈ U ta có:  (1) P   ∆u Y ≤ eLy (T1 −to ) − 1 ε(1) (h1 ) + N1 (1 + γ1 )N1 −i I (1) (u), i=1 i−1  lim h1 →0 ε (1) (h ) 1 (1) = 0 , γ1 := Ly h1 , P N1 i=1 (1 + γ1 ) N1 −i γ 1 (1) < eLy với : (T1 −to ) − 1. Bổ đề 3.2.3 Với các điều kiện trong các Bổ đề 3.2.1 và 3.2.2, ta có : lim ∆u Zi = lim ∆u Zi = 0 (1 ≤ i ≤ N1 ), ∗ h2 →0 h2 →0 lim ∆u Y = ∗ h1 ,h2 →0 lim ∆u Y = 0 (∀u ∈ Uo(h2 )). h1 ,h2 →0 Định lý 3.2.1 Giả sử các điều kiện (A2)-(D2 ) cùng với các điều kiện nêu trong các Bổ đề 3.2.1 và 3.2.2 về các tập Ωz , Ωy được thỏa mãn. Khi đó: 13 1- Nếu h1 , h2 và tham số δ trong điều kiện (3.2.5) chọn đủ bé thì điều khiển tựa TƯ û(s) (trong (3.2.9)) tương ứng sẽ là CNĐ, theo nghĩa: fj ŷ(T1 ), ẑ(T1 , T2 ) < 0 (∀j = 1 ÷ n). 2- Nếu h1 , h2 → 0 thì nghiệm tựa TƯ û(s), ŷ(t), ẑ(t, s) và nghiệm XXTT tựa TƯ û(s), Ŷ (t), Ẑ(t, s) sẽ hội tụ theo mục tiêu về nghiệm TƯ u∗ (s), y ∗ (t), z ∗ (t, s) của bài toán (3.1.1)-(3.1.5): lim fo Ŷ (T1 ), Ẑ(T1 , T2 ) = fo y ∗ (T1), z ∗ (T1 , T2 ) h1 ,h2 →0 lim fo ŷ(T1 ), ẑ(T1 , T2 ) = fo y ∗ (T1 ), z ∗ (T1 , T2) . h1 ,h2 →0 Để đơn giản hóa việc kiểm tra sự thỏa mãn điều kiện Lipschitz của các giả thiết (A2 ), (B2 ) trong định lý nêu trên, ta đưa ra giả thiết : (E)- Tồn tại các số tự nhiên mi và các hằng số ai , bi ≥ 0, Ri > 0 (i = 1 ÷ 2), sao cho : m1 m2 R1 > kyo k + K 1 e(a1 R1 +b1 )(T1 −to ) := R1 , R2 > k|zo|k + K 2 e(a2 R2 +b2 )(T2 −so ) := R2 ,     với : |kzo|k := supt∈[to ,T1 ] kzo(t)k, BRi (0) := x ∈ Rni : kxk ≤ Ri (i = 1 ÷ 2), Z T1 Z T2   kg1 (yo , z, t)kdt, K 2 := supt∈[to,T1 ] kg2 (zo(t), u, t, s)kds. K 1 := supz∈BR2 (0) to (1) m u∈Ω (2) m so Khi đặt: Ly := a1 R1 1 +b1, Lz := a2 R2 2 +b2 , BRi (0) := x ∈ Rni : kxk ≤ Ri (i = 1÷2), ta có thể phát biểu Định lý 3.2.1 dưới dạng các hệ quả dưới đây: Hệ quả 3.2.1 Các kết luận của Định lý 3.2.1 không thay đổi, nếu có giả thiết (E) (1) (1) (2) (2) và nếu các hằng số Lipschitz trong (A2 ), (B2) được chọn là Ly := Ly , Lz := Lz . Khi đó tập chứa các giá trị có thể của nghiệm các PTVP (3.1.2)-(3.1.3) được chọn là Ωy = BR1 (0), Ωz = BR2 (0). Đây cũng là các tập chứa các giá trị có thể của nghiệm các PTSP (3.2.2)-(3.2.3), khi h1 , h2 1. Liên quan đến các hằng số ai , bi , Ri (i = 1 ÷ 2) trong giả thiết (E), ta còn đưa ra các giả thiết sau: (A∗2 )- Hàm g1 (y, z, t) ∈ Rn1 khả vi theo y ∈ BR1 (0), với ma trận các đạo hàm riêng ∂g1 (y,z,t) ∂g1 (y,z,t) thỏa mãn điều kiện: 0 ≤ sup ≤ a1 kykm1 + b1 (∀y ∈ BR1 (0)). t∈[to ,T1 ] ∂y ∂y (B2∗ )- Hàm g2 (z, u, t, s) ∂g2 (z,u,t,s) thỏa mãn điều ∂z ∈ Rn2 z∈BR2 (0) khả vi theo z ∈ BR2 (0), với ma trận đạo hàm riêng kiện: 0 ≤ supu∈Ω, ∂g2 (z,u,t,s) ≤ a2kzkm2 +b2 (∀z ∈ BR2 (0)). t∈[to,T1 ] ∂z s∈[so ,T2 ] Hệ quả 3.2.2 Các kết luận của Hệ quả 3.2.1 không thay đổi, nếu có giả thiết (E) 14 và các giả thiết về điều kiện Lipschitz trong (A2 ), (B2 ) thay bởi lần lượt các giả thiết (1) (1) (2) (2) (A∗2 ), (B2∗ ) với Ly := Ly , Lz := Lz , Ωy := BR1 (0), Ωz := BR2 (0). Bây giờ ta xét 1 trường hợp riêng của bài toán quy hoạch (3.2.6) gắn với dạng đặc biệt của bài toán (3.1.1)-(3.1.5), trong đó:   g1 (y, z, t) ≡ b1 (z, t) ∈ Rn1 , zo (t) ≡ 0 ∈ Rm , g2 (z, u, t, s) ≡ b2 (u, s) := u T2 −so , n2 := m,  ∀z ∈ Ω, t ∈ [t , T ], s ∈ [s , T ], u ∈ U := u : [s , T ] → Ω | u(s) ≡ u(const), ∀s ∈ [s , T ] . o 1 o 2 o 2 o 2 Khi đó do z(t, T2) ≡ u (∀t ∈ [to, T1 ]) nên bài toán (3.1.1)-(3.1.5) trở thành bài toán ĐKTƯ theo tham số u ∈ Rm :    J (u) := fo y(T1), u → inf, u := (u1 , . . . , um) ∈ Ω,  ẏ(t) = b (u, t) (t < t ≤ T ), y(t ) = y ∈ Rn1 , f y(T ), u≤ 0 (1 ≤ j ≤ n). 1 o 1 o o j 1 (3.2.7) Gắn với bài toán này, ta đưa vào giả thiết: (Ao)- Hàm b1 (u, t) liên tục theo u ∈ Ω và L-khả tích theo t ∈ [to, T1 ], và phát biểu Định lý 3.2.1 trong ngôn ngữ dưới đây: Hệ quả 3.2.3 Nếu có các giả thiết (Ao), (D2 ) thì các kết luận của Định lý 3.2.1 còn đúng cho bài toán (3.2.7). Khi đó bài toán quy hoạch (3.2.6) tương ứng có dạng:  P  Fo(u) := fo h1 N1 −1 b1 (u, ti) + yo , u → inf, u := (u1 , ..., um) ∈ Ω, i=0   F (δ)(u) := f h PN1 −1 b (u, t ) + y , u +δ ≤ 0 (1 ≤ j ≤ n). j 1 1 i o i=0 j Chú ý 3.2.1 (3.2.7*) Qua Thí du 3.2.2 (Luận án) minh họa sự kiểm tra các giả thiết (A2 ) − (D2 ), chúng tôi thấy rằng: Điều kiện về tính liên tục trên Ωy × Ωz của các hàm fj (y, z) (1 ≤ j ≤ n) trong giả thiết (D2 ) đã nới lỏng khá nhiều các giả thiết truyền thống, ngay cả đối với bài toán Mayer thông thường có ràng buộc trạng thái. 3.3 Quy trình Monte Carlo giải bài toán Từ Định lý 3.2.1 ta thấy rằng: Việc giải gần đúng bài toán (3.1.1)-(3.1.5) đưa về việc xác định nghiệm tựa TƯ (hoặc nghiệm XXTT tựa TƯ) của bài toán này, nghĩa là (xem Định nghĩa 3.2.2) đưa về việc giải bài toán quy hoạch (3.2.6), dưới dạng:   Fo (U) → min , U ∈ Dδ − với không gian độ đo Dδ , B(Dδ ), λ   trong đó : D := U ∈ ΩN2 : F (U) + δ ≤ 0 (1 ≤ j ≤ n) . j δ (3.3.1) 15 B(Dδ ) là σ -đại số các tập Borel trong Dδ , λ là độ đo Lebesgue trong RmN2 . Tương tự như trong Bổ đề 2.3.2, ta có thể dựa vào tính liên tục của các hàm Fj (U) (0 ≤ j ≤ n) trên tập compac ΩN2 để chỉ ra rằng bài toán trên có điểm cực tiểu không cô lập. Bởi vậy có thể thiết lập dãy DTNN U (r) = (Uo(r) , · · · , UN(r)2 −1 ) U với w(r) (r+1) =   U (r)  wr (Khi Fo(U (r) ) ≤ Fo(wr )) (Khi Fo (U (r) ) > Fo r≥1 theo công thức lặp: (r ≥ 1) ; U (1) := wo, (3.3.2) (wr )) là dãy thể hiện độc lập của vtnn w ∼ U(Dδ ). Từ dãy DTNN đơn giản r≥1 (r) (r) (r) U = (Uo , · · · , UN2 −1 ) r≥1 nói trên, ta lập các hàm ngẫu nhiên:   Y (r) (t) := Y (t; u(r)), Z (r) (t, s) := Z(t, s; u(r)), y (r) (t) := y(t; u(r)), z (r) (t, s) := z(t, s; u(r)),  u(r) (s) := U (r) (s ≤ s < s k k+1 , 0 ≤ k < N2 ), (∀t ∈ [to , T1], s ∈ [so , T2 ], r ≥ 1). k (3.3.3) Khi đó có thể mở rộng Định nghĩa 2.3.1 trong trường hợp này dưới dạng: Định nghĩa 3.3.1. Đối với các hàm ngẫu nhiên xác định theo (3.3.3), ta gọi : u(r) (s)- là mô phỏng điều khiển tựa TƯ; y (r) (t), z (r) (t, s) - là mô phỏng quỹ đạo tựa TƯ; u(r) (s), y (r) (t), z (r)(t, s) - là mô phỏng nghiệm tựa TƯ; Y (r) (t), Z (r)(t, s) - là mô phỏng quỹ đạo XXTT tựa TƯ; u(r) (s), Y (r) (t), Z (r) (t, s) - là mô phỏng nghiệm XXTT tựa TƯ. Bổ đề 3.3.1 Với những điều kiện của Định lý (3.2.1), nếu δ, h1 , h2 1 thì các mô phỏng nghiệm tựa TƯ u(r) (s), y (r) (t), z (r)(t, s) và nghiệm XXTT tựa TƯ u(r) (s), Y (r) (t), Z (r)(t, s) (∀r ≥ 1) đều là CNĐ, theo nghĩa: fj Y (r) (T1 ), Z (r) (T1 , T2) ≤ −δ < 0 (1 ≤ j ≤ n), fj y (r) (T1 ), z (r) (T1 , T2) ≤ 0 (1 ≤ j ≤ n). Định lí 3.3.1: Nếu các điều kiện của Định lý (3.2.1) được thỏa mãn thì dãy mô phỏng nghiệm XXTT tựa TƯ và dãy mô phỏng nghiệm tựa TƯ đều CNĐ và cùng hội tụ (hcc) theo mục tiêu về nghiệm TƯ của bài toán (3.1.1)-(3.1.5) (khi r → +∞, h1 , h2 → 0): P lim fo Y (r) (T1 ), Z (r) (T1 , T2 ) = fo y ∗ (T1 ), z ∗ (T1 , T2) = 1 lim fo y (r) (T1 ), z (r) (T1 , T2) = fo y ∗ (T1 ), z ∗ (T1 , T2 ) = 1. P h1 ,h2 →0 r→+∞ h1 ,h2 →0 r→+∞ 16 Chú ý 3.3.1 Trong trường hợp (2.3.1) ta cũng có thể sử dụng phương pháp nêu trong Chú ý 2.3.1, để thu được các hàm hợp Fj (U) (0 ≤ j ≤ n) trong (3.3.1), dưới dạng: Fj (U) = fj h1 NX 1 −1 b1 (ZiN2 , ti ), h2 i=0 N 2 −1 X b2 (Uk , T1 , sk ) k=0 , ZiN2 = h2 N 2 −1 X b2 (Uk , ti , sk )(i = 0÷N1 ) k=0 Hệ quả 3.3.1: Đối với bài toán ĐKTƯ theo tham số (3.2.7), nếu có các giả thiết (Ao), (D2 ) thì Bổ đề 3.3.1 và Định lý 3.3.1 còn đúng. Khi đó, bài toán quy hoạch (3.3.1) có dạng (3.2.7*) Cuối cùng, nhằm xây dựng "công thức đánh giá sai số" ứng với các dãy nghiệm mô phỏng trong Định lý 3.3.1, ta dựa vào Định nghĩa 2.3.2 để lập tập A(i) r (δi ) (i = 1 ÷ 2) các nghiệm δi -tốt bị bỏ qua của mô phỏng nghiệm tựa TƯ (u(r) , y (r) , z (r) ) (khi i=1) và của mô phỏng nghiệm XXTT tựa TƯ (u(r) , Y (r) , Z (r) ) (khi=2), dưới dạng: (1) Ar (δ1) := u ∈ Uh2 : fo y(T1 ; u), z(T1, T2 ; u) < fo y (r) (T1 ), z (r) (T1 , T2 ) −δ1 , (2) Ar (δ2 ) := u ∈ Uh2 : fo Y (T1 ; u), Z(T1, T2 ; u) < fo Y (r) (T1 ), Z (r) (T1 , T2) −δ2 ,     0 ≤ δ1 ≤ ∆fo , ∆fo := fo y(T1; û), z(T1 , T2; û) −fo y(T1; u∗ ), z(T1 , T2; u∗ ) , với :  0 ≤ δ ≤ |∆f  ∆f ˆ o| ,  ˆ o := fo Ŷ (T1), Ẑ(T1 , T2 ) −fo y(T1; u∗ ), z(T1 , T2; u∗ ) . 2 Tương tự như đối với Định lý 2.3.2, dựa vào Bổ đề 2.3.4 ta thu được: Định lý 3.3.2 Nếu có các điều kiện của Định lý 3.3.1, thì: 1- Tập các nghiệm δ1 -tốt bị bỏ qua của mô phỏng (u(r) , y (r) , z (r) ) nghiệm tựa TƯ là (1) Ar (δ1 ); Tập các nghiệm δ2 -tốt bị bỏ qua của mô phỏng (u(r) , Y (r) , Z (r) ) nghiệm XXTT (2) (i) (i) (i) ˆ o |. tựa TƯ là Ar (δ2 ), trong đó Ar (δ i ) ⊂ Ar (δi ) ⊂ Ar (0) (i = 1÷2), δ 1 := ∆f o , δ2 := |∆f (i) mes(Ar (δi)) 2- Tỷ số := N2 là δi -sai số tương đối của mô phỏng nghiệm tựa TƯ mes(Ω) (u(r) , y (r) , z (r) ) (khi i=1) và mô phỏng nghiệm XXTT tựa TƯ (u(r) , Y (r) , Z (r) ) (khi i=2). (i) λr (δi) Các sai số này được đánh giá theo công thức sau: (i) P λr (δi ) ≤ εi ≥ 1 − (1 − εi )r−1 (∀εi ∈ (0, 1), i = 1 ÷ 2). CHƯƠNG 4: Áp dụng vào mô hình hợp lý cực đại Trong chương này, các khái niệm mới về "Mô hình HLCĐ liên tục hóa ước lượng (ƯL) tham hàm và tham số" được xây dựng trong Mục 4.1, nhằm mở rộng các mô 17 hình HLCĐ kinh điển về ƯL tham số và ứng dụng để dự báo động đất. Những kết quả của Chương 2 được sử dụng để giải bài toán HLCĐ liên tục hóa ƯL tham hàm trong Mục 4.2. Những kết quả của Chương 3 được sử dụng để giải bài toán HLCĐ liên tục hóa ƯL tham số trong Mục 4.3. Bài toán được giải ở Mục 4.2 gắn với một dạng mới của mô hình Jackson-Kagan (được tham hàm hóa) về hàm mật độ xác suất có điều kiện của chấn tâm động đất. Bài toán được giải ở Mục 4.3 gắn với hàm mật độ xác suất Richter-Gutenberg của chấn cấp động đất và một phương pháp mới trong việc kết hợp các số liệu địa chấn với các số liệu địa chất-địa vật lý để dự báo động đất. Nội dung của chương này đã được công bố rải rác trong các công trình khoa học [1]-[4] của tác giả. 4.1. Mô hình hợp lý cực đại liên tục hóa: Xét vtnn (ξ, µ) = (ξ1 , · · · , ξn , µ) ∈ Rn × R1 có hàm mật độ xác suất đồng thời p(x, s) được biểu diễn dưới dạng: p(x, s) = pξ (x|s) pµ (s) (∀(x, s) ∈ Rn × R1 ), trong đó: pµ (s) - là hàm mật độ biên duyên (không điều kiện) của đlnn µ, pξ (x|s) - là hàm mật độ có điều kiện của vtnn ξ ∈ Rn , khi µ = s, với giả thiết rằng : - Hàm pµ (s) là L-khả tích theo s ∈ R1 và phụ thuộc tham số θ, dưới dạng: pµ (s) := g(s, θ) > 0 (∀s ∈ [so, T2 ] ⊂ R1 ) , θ ∈ Θ ⊂ Ωo ⊂ Rmo . (4.1.1) - Hàm pξ (x|s) là L-khả tích theo x ∈ Rn và phụ thuộc tham hàm u(s), dưới dạng:   pξ (x|s) = f x, u(s) > 0 (∀(x, s) ∈ X × [so , T2] ⊂ Rn × R1 ),   u ∈ U := {u : [so, T2 ] → Ω ⊂ Rm | (4.1.2) liên tục từng khúc}. Khi đó hàm mật độ p(x, s) của vtnn (ξ, µ) được tham số và tham hàm hóa dưới dạng: p(x, s) ≡ p x, s; θ, u(.) = f x, u(s) g(s, θ) (∀(x, s) ∈ Rn × R1 ). Giả sử đã cho dãy quan sát (x(i) , m(i)) N1 i=1 (4.1.3) (N1 1) của vtnn (ξ, µ), trong đó : so < min1≤i≤N1 {m(i) } < max1≤i≤N1 {m(i) } < T2 . Khi đó mô hình HLCĐ truyền thống ƯL P 1 (i) tham số θ trong hàm mật độ (4.1.1) có dạng: L1 (θ) := N i=1 ln g(m , θ) → max, θ ∈ Θ. Trong ngôn ngữ của Bài toán Mayer rời rạc, mô hình này có thể biểu diễn dưới dạng:   JN1 (θ) := −YN1 ≡ −h1 L1 (θ) → inf , θ ∈ Θ ⊂ Rmo , h1 :=   T1 N1 Yi+1 = Yi + h1 ln g(m(i+1) , θ) (0 ≤ i < N1 ) , Yo = 0. > 0, 18 Dạng liên tục hóa của bài toán trên là bài toán ĐKTƯ theo tham số (3.2.7), có dạng: Định nghĩa 4.1.1 Bài toán Mayer thông thường được gọi là bài toán HLCĐ liên tục hóa ƯL tham số trong hàm mật độ (4.1.1) , nếu nó có dạng: (4.1.4) J (θ) := −y(T1 ; θ) → inf , θ ∈ Θ ⊂ Ωo ⊂ Rmo , ẏ(t) = ln g m(t), θ (0 < t ≤ T1 ) , y(0) = 0, (4.1.5) trong đó θ là tham số điều khiển, đạo hàm ẏ(t) hiểu theo nghĩa thông thường và:   m(t) = m(i−1) + t−ti−1 h1 (m(i) − m(i−1) ) (ti−1 ≤ t ≤ ti , i = 2 ÷ N1 ), m(t) ≡ m(1) (0 ≤ t ≤ t1 ); ti = ih1 (0 ≤ i ≤ N1 ), h1 =   T1 N1 . Để ƯL tham hàm u ∈ U trong (4.1.2) ta xấp xỉ nó bởi hàm u ∈ Uh2 , dưới dạng: u(s) ≡ Uk := u(sk ) ∈ Ω ⊂ Rm (sk ≤ s < sk+1 ), sk = so + kh2 (k = 0 ÷ N2 ), h2 := T 2 − so N2 (với N2 1). Khi đó bài toán ƯL tham hàm u ∈ U được xấp xỉ bởi bài toán ƯL tham số U = (U0 , · · · , UN2 −1 ) ∈ ΩN2 ⊂ RmN2 quen thuộc, dưới dạng cực đại hóa hàm hợp lý: N1 2 −1 NX X L2 (U) := ln 1Mk (m(i))f(x(i) , Uk ) → max , U ∈ ΩN2 , i=1 với : k=0    Mk := (sk , sk+1 ]  (0 ≤ k ≤ N − 1), 2 1M (s) =   1 (Khi : s ∈ M),  0 (Khi : s ∈ / M). Bài toán trên lại có dạng bài toán (2.2.1)-(2.2.4), với F o(U) = − ln(T2 − so) + h1 L2 (U) , yo = zo (t) = 0, f o (y, z) = −y , g1 (y, z, t) = ln z , g2 (z, u, t, s) = x(t) = x(i−1) + PN2 −1 j=0 1Mj m(t) f x(t), u , t − ti−1 (i) (x − x(i−1) ) (ti−1 ≤ t ≤ ti , i = 2 ÷ N1 ), x(t) ≡ x(1) (0 ≤ t ≤ t1 ). h1 Bởi vậy dạng liên tục hóa (2.1.1)-(2.1.4) tương ứng của bài toán ĐKRR này có dạng: Định nghĩa 4.1.2 Bài toán Mayer suy rộng (gắn với đạo hàm suy rộng) được gọi là bài toán HLCĐ liên tục hóa ƯL tham hàm trong hàm mật độ (4.1.2), nếu nó có dạng: J (u) := −y(T1; u) → inf , u ∈ U, (4.1.6) ẏ(t) = ln z(t, T2; u) (0 < t ≤ T1 ) , y(0) = 0, (4.1.7) NX 2 −1 ∂z(t, s) = 1Mj m(t) f x(t), u(s) (so < s ≤ T2 ), z(t, so) ≡ 0 (0 ≤ t ≤ T1 ). ∂s (4.1.8) j=0 U := u : [so, T2 ] → Ω ⊂ Rm liên tục từng khúc . (4.1.9) 19 Chú ý 4.1.1 Việc giải bài toán ƯL tham số θ và tham hàm u(s) trong hàm mật độ đồng thời (4.1.3) của vtnn (ξ, µ) ∈ Rn+1 được phân rã thành việc giải 2 bài toán: - Bài toán HLCĐ liên tục hóa (4.1.4)-(4.1.5) UL tham số θ. - Bài toán HLCĐ liên tục hóa (4.1.6)-(4.1.9) ƯL tham hàm u(s). Với ý nghĩa này, dưới đây ta sẽ giải riêng rẽ từng bài toán nói trên. 4.2. Mô hình hợp lý cực đại ước lượng tham hàm Trước hết ta xét việc xác định tham hàm HLCĐ u(s) = u∗ (s) (so ≤ s ≤ T2 ) trong hàm mật độ có điều kiện (4.1.2), nghĩa là xét việc tìm ĐKTƯ u = u∗ ∈ U của bài toán (4.1.6)-(4.1.9). Không làm mất tính tổng quát, ta có thể xét trường hợp T1 = 1 và nhận thấy rằng bài toán này có dạng Bài toán Mayer suy rộng (2.1.1)-(2.1.4) với vế phải của hệ động lực có dạng (2.3.1), trong đó: to = 0, T1 = 1, n1 = n2 = 1, yo = zo (t) ≡ 0,    f o (y, z) := −y, A1(t) = A2 (t, s) ≡ 0 (∀t ∈ [0, 1], s ∈ [so, T2 ]), b1(z, t) ≡ b1 (z) := ln z,  b (u, t, s) ≡ b (u, t) := PN2 −1 1 m(t) f x(t), u (∀t ∈ [0, 1], s ∈ [so, T2 ], u ∈ Ω). (4.2.1) 2 2 M k k=0 Do đó từ Chú ý 2.3.1 ta có thể biểu diễn F o(U) trong (2.2.5) dưới dạng: F o(U) = −h1 N1 2 −1 NX X ln h2 f(x(i) , Uk ) (∀U = (U0 , · · · , UN2 −1 ) ∈ ΩN2 ). i=1 (4.2.2) k=0 Trên cơ sở này ta lập được dãy u(r) r≥1 ⊂ Uh2 tham hàm HLCĐ xấp xỉ như là dãy mô phỏng điều khiển tựa TƯ trong Định nghĩa 2.3.1, gắn với công thức lặp (2.3.2) và hàm F o(U) trong (4.2.2). Sự hội tụ của dãy tham hàm HLCĐ xấp xỉ nói trên về tham hàm HLCĐ u∗ ∈ U và đánh giá sai số tương ứng được chỉ ra trong mệnh đề sau: Mệnh đề 4.2.1 Giả sử các miền Ω ⊂ Rm , X ⊂ Rn là lồi và compac, hàm f(x, u) (trong (4.1.2)) là liên tục theo x ∈ X và khả vi liên tục theo u ∈ Ω. Khi đó, nếu tồn tại tham hàm HLCĐ u = u∗ ∈ U thì các điều kiện (A1 )-(D1 ) đều thỏa mãn và các dãy (r) u (s) r≥1 , U (r) r≥1 tham hàm và tham số HLCĐ xấp xỉ hội tụ (hcc) theo mục tiêu về tham hàm HLCĐ u∗ : P n lim N1 ,N2→+∞ r→+∞ o n F o(U (r) ) = J (u∗) = P lim N1 ,N2 →+∞ r→+∞ o J (u(r) ) = J (u∗ ) = 1, trong đó các công thức đánh giá δ -sai số tương đối tương ứng cho bởi Định lý 2.3.2. Khi xét các phương trình (4.1.7)-(4.1.8) (có vế phải là các hàm b1 (z, t), b2(u, t) trong (4.2.1)) ta lưu ý rằng: Do ln z(t, s) (s ∈ [so, T2 ]) không Rieman-khả tích theo t ∈ [0, 1] 20 và b2 u(s), t nói chung không Rieman-khả tích theo s ∈ [so , T2] nên ta chưa thể sử dụng giải tích cơ sở để khôi phục hàm số từ nguyên hàm và do đó chưa khẳng định được sự tồn tại cácZ đạo hàm (theo nghĩa thông thường) của các hàm: z(t, s) = Z s so b2 u(s0 ), t ds0 , y(t) = t to ln z(t0 , T2 ) dt0 . Bởi vậy, chúng tôi có nhận xét sau: Chú ý 4.2.1 Đạo hàm trong phương trình vi phân (4.1.7) và đạo hàm riêng (4.1.8) cần được hiểu là các đạo hàm yếu (suy rộng), như đã nêu trong Định nghĩa 4.1.2. Nhằm ứng dụng mô hình trên vào dự báo động đất (bằng Số liệu địa chấn) trên vùng X := x = (x1 , x2 ) : xi ≤ xi ≤ xi (i = 1 ÷ 2) , ta xét vtnn (ξ, µ) ∈ R3 với ξ = (ξ1 , ξ2 ) ∈ X là tọa độ chấn tâm và µ ∈ (so , +∞) là biên độ chấn cấp tương ứng của các trận động đất trong tương lai trên vùng X. Khi mở rộng mô hình Jackson-Kagan (tham số hóa) đã biết, ta giả thiết rằng: Hàm mật độ có điều kiện pξ (x|s) của ξ tuân theo phân phối Jackson-Kagan tham hàm hóa, dưới dạng (4.1.2) với: N1 X m(j) − so Z N1 X m(j) − so f(x, u(s)) := ϕj x, u(s) , Ku (s) := ϕj x, u(s) dx(∀s ∈ [so, T2 ) πKu (s) π j=1 j=1 X    cos2 ψj (x) u(s) := a(s), d(s) ∈ Ω,   ϕj x; u(s) := 1+a(s) , d2 (s)+ri2 (x) (so ≤ s ≤ T2 ),    Ω := [a, a] × [d, d], r (x) = kx − x(j) kr , r = 110(Km), j o o  2 (j) (j)  2 −x2 ) sin αj  (x1 −x1) cos αj +(x (x 6= x(j) ), kx−x(j) k cos2 ψj (x) = (1 ≤ j ≤ N1 ), (4.2.3)   (j) 1 (x = x ), với (x(i), m(i) ) N1 i=1 ⊂ X × (so, T2 ) là dãy N1 ( 1) quan sát về vtnn (ξ, µ) trong catalog động đất trên vùng X và αj = 2πγj , γj ∼ U(0, 1) (1 ≤ j ≤ N1 ) là các đlnn độc lập. Chú ý 4.2.2 Từ (4.2.3) ta dễ dàng kiểm tra sự thỏa mãn các giả thiết của Mệnh đề 4.2.1 về hàm f(x, u). Khi đó, do X, Ω đều là các hình chữ nhật (lồi, compac) nên ta có thể sử dụng mệnh đề trên vào việc xác định tham hàm HLCĐ xấp xỉ u(r) (s) cho tham hàm HLCĐ u∗ ∈ U trong hàm mật độ Jackson-Kagan tham hàm hóa. Chúng tôi đã ứng dụng (trong Luận án) mô hình trên cho X là vùng Tây Bắc Bộ nước ta, gắn với các số liệu địa chấn (x(i) , m(i) ) N1 i=1 (N1 = 193) trong catalog của vùng này để xác định tham hàm HLCĐ của hàm mật độ Jackson-Kagan tham hàm hóa tương ứng. Từ đó có thể cải tiến việc dự báo (bằng PPMC) sự xuất hiện chấn tâm động đất trên những dải biên độ chấn cấp khác nhau của vùng Tây Bắc Bộ.

- Xem thêm -

Tài liệu Dùng phương pháp monte carlo để giải một lớp bài toán điều khiển ngẫu nhiên tổng hợp liên quan đến quá trình điểm gắn mã và áp dụng

Tài liệu liên quan

Tài liệu vừa đăng

Tài liệu xem nhiều nhất