Tóm tắt luận văn thạc sĩ kỹ thuật phân tích hệ thống trong miền không gian trạng thái

  • Số trang: 25 |
  • Loại file: PDF |
  • Lượt xem: 20 |
  • Lượt tải: 0
hoangtuavartar

Đã đăng 24838 tài liệu

Mô tả:

Lời nói đầu Một trong những mục tiêu hàng đầu trong tổng hợp hệ thống điều khiển là tính hiệu quả cao. Hệ thống càng phức tạp, quy mô càng lớn, thì việc đưa ra các quyết định điều khiển để hệ thống cho hiệu quả càng khó khăn, ngay cả đối với những chuyên gia nhiều kinh nghiệm. Bởi vậy cần phải có những phương pháp tổng quát, chặt chẽ về mặt lý thuyết, làm nền tảng trợ giúp cho công việc trên và đó chính là mục đích của điều khiển tối ưu. Điều khiển tối ưu là một chuyên ngành trong điều khiển tự động có vai trò xác lập và tạo lập những luật điều khiển cho hệ thống để hệ thống đạt được chỉ tiêu về tính hiệu quả đã được định trước dưới dạng (phiếm) hàm mục tiêu Q. Miền nghiên cứu của điều khiển tối ưu không chỉ riêng ở các hệ thống kỹ thuật mà có thể tìm thấy ở hầu hết các hệ thống không phải là kỹ thuật khác như hệ sinh học, hệ kinh tế Bài toán điều khiển có ba cấu trúc cơ bản đó là: * Điều khiển hở Về bản chất, hình thức điều khiển này cũng giống như bài toán tìm tín hiệu điều khiển thích hợp đặt ở đầu vào của đối tượng, nhưng được bổ sung thêm bộ điều khiển để tạo ra được tín hiệu điều khiển đó.  (t ) Bộ điều khiển Đối tượng điều khiển u(t) y(t) Hình 1. Cấu trúc điều khiển hở Ví dụ để điều khiển tàu thuỷ đi được theo một quỹ đạo y(t) mong muốn (tín hiêu đầu ra), người ta phải tác động bằng lực  (t ) vào tay lái để tạo ra được vị trí u(t) của bánh lái một cách thích hợp. Trong ví dụ này hệ thống tay lái – bánh lái có vai trò của một bộ điều khiển. Hình thức điều khiển hở này là điều khiển một chiều và chất lượng điều khiển phụ thuộc vào độ chính xác của mô hình toán học mô tả đối tượng cũng như phải có giả thiết rằng không có tác động nhiễu không mong muốn vào hệ thống trong suốt quá trình điều khiển. 1 * Điều khiển phản hồi trạng thái Ở đối tượng điều khiển, các tín hiệu trạng thái x1 (t ), x2 (t ),...,xn (t ) , được viết chung dạng vector x(t )  ( x1 (t ), x2 (t ),...,xn (t ) )T, là thành phần chứa đựng đầy đủ nhất các thông tin chất lượng động học hệ thống, kể cả những tác động nhiễu không mong muốn. Bởi vậy, để có thể tạo ra được cho đối tượng một chất lượng mong muốn, ổn định với tác động nhiễu, cần phải có một tín hiệu áp đặt ở đầu vào là u(t) phản ứng kịp theo những thay đổi trạng thái của đối tượng  e  Bộ điều khiển u Đối tượng điều khiển y  Đối tượng điều khiển u  x y x Bộ điều khiển Hình 2. Điều khiển phản hồi trạng thái Hình 2. biểu diễn nguyên tắc điều khiển phản hồi trạng thái. Bộ điều khiển sử dụng tín hiệu trạng thái x(t ) của đối tượng để tạo ra được tín hiệu đầu vào u(t) cho đối tượng. Vị trí của bộ điều khiển có thể là ở mạch truyền thẳng hoặc ở mạch hồi tiếp. Hệ thống điều khiển phản hồi trạng thái có khả năng giữ được ổn định chất lượng mong muốn cho đối tượng, mặc dù trong quá trình điều khiển luôn có những tác động nhiễu. Như vậy hệ thống điều khiển phản hồi trạng thái tối ưu đã giải quyết triệt để mục tiêu của bài toán điều khiển đó là chất lượng điều khiển đạt tốt nhất. Tuy vậy hệ thống điều khiển phản hồi trạng thái có nhược điểm, trong nhiều trường hợp trạng thái của đối tượng điều khiển không đo được trực tiếp gây khó khăn cho việc nhận dạng đối tượng điều khiển vì vậy người ta phải thay bộ điều khiển phản hồi trạng thái bằng bộ điều khiển phản hồi tín hiệu ra.  e  Bộ điều khiển u Đối tượng điều khiển y  u  Đối tượng điều khiển Bộ điều khiển Hình 3. Điều khiển phản hồi đầu ra 2 y Bộ điều khiển sử dụng tín hiệu đầu ra y(t) của đối tượng để tạo ngược ra được tín hiệu đầu vào u(t) cho nó. Tuy nhiên, cho tới nay bài toán điều khiển phản hồi tín hiệu ra vẫn còn là một bài toán mở và chưa có lời giải tổng quát cuối cùng, vì tín hiệu ra y(t) thường không mang được đầy đủ thông tin động học của đối tượng. Với những ưu nhược điểm của bài toán phản hồi trạng thái và điều khiển phản hồi tín hiệu ra, từ những lý thuyết đã nghiên cứu luận văn trình bày thuật toán thiết kế bộ điều khiển tối ưu phản hồi tín hiệu ra dựa trên sự kết hợp của hai bộ điều khiển: Bộ điều khiển phản hồi trạng thái và bộ điều khiển phản hồi đầu ra áp dụng cho đối tượng điều khiển là đối tượng tuyến tính để chất lượng điều khiển là tối ưu. Sau một thời gian học tập và nghiên cứu đến nay bản luận văn của tôi đã được hoàn thành. Nhân dịp này tôi xin chân thành cảm ơn PGS.TS Nguyễn Doãn Phước - Thầy giáo hướng dẫn trực tiếp, người đã đưa ra hướng nghiên cứu tận tình giúp đỡ, chỉ bảo và tạo mọi điều kiện thuận lợi để tôi hoàn thành luận văn này. Tôi xin cảm ơn tất cả các thầy cô giáo đã tham gia giảng dạy, giúp đỡ tôi trong suốt quá trình học tập, nâng cao trình độ kiến thức. Tôi xin gửi lời cảm ơn đến tất cả bạn bè, đồng nghiệp và người thân đã giúp đỡ tôi trong suốt quá trình vừa qua. Vì điều kiện về thời và khả năng của bản thân có hạn nên bản luận văn này không tránh khỏi những thiếu sót. Tôi rất mong các thầy cô cùng các bạn đồng nghiệp góp ý sửa đổi, bổ xung thêm để bản luận văn thêm hoàn thiện. 3 Chương 1 PHÂN TÍCH HỆ THỐNG TRONG MIỀN KHÔNG GIAN TRẠNG THÁI 1.1. Những nhiệm vụ cơ bản của công việc phân tích Các nhiệm vụ cơ bản của công việc phân tích chất lượng động học của một hệ thống bao gồm: - Tính ổn định - Sai lệch tĩnh, độ quá điều chỉnh, thời gian quá độ. - Chất lượng bền vững. Tuy nhiên, do đặc thù là được mô tả trong không gian trạng thái với mô hình: d x  A x  Bu   dt  y  C x  Du  (1.1) Mà ở đó rất có thể có những biến trạng thái thừa, nên công việc phân tích hệ thống trong không gian trạng thái còn cần phải làm rõ thêm: 1) Hiểu biết về sự phân bố các điểm cân bằng của hệ thống. Một điểm trạng thái xe được gọi là điểm cân bằng nếu như khi hệ đang ở điểm trạng thái xe và không có một tác động nào từ bên ngoài thì hệ sẽ nằm nguyên tại đó. Theo định nghĩa như vậy thì điểm cân bằng xe của hệ thống phải là nghiệm của: dx  Ax  0 dt (1.2) Điều này cũng dễ hiểu, vì theo định nghĩa, điểm cân bằng là điểm mà hệ thống sẽ nằm im tại đó, tức là trạng thái của nó không bị thay đổi dx   0   dt  khi không có sự tác động từ bên ngoài (u=0). Ta có thể thấy ngay được từ (1.2) là hệ tuyến tính cân bằng tại mọi điểm trạng thái thuộc không gian Ker (A) và nếu ma trận A của mô hình trạng thái (1.1) không suy biến thì hệ (1.1) chỉ có một điểm cân bằng duy nhất là gốc toạ độ 0. 2) Hiểu biết về tính ổn định Lyapunow của hệ thống. Một hệ thống được gọi là ổn định Lyapunow tại điểm cân bằng xe nếu sau khi có một tác 4 động tức thời (chẳng hạn như nhiễu tức thời) đánh bật hệ ra khỏi điểm cân bằng xe thì sau đó hệ có khả năng tự quay về được lân cận điểm cân bằng xe ban đầu (không cần có tín hiệu điều khiển u). Nếu hệ không những tự quay về được lân cận của xe mà còn tiến tới xe thì nó được gọi là ổn định tiệm cận Lyapunow tại xe. 3) Hiểu biết về tính điều khiển được của hệ thống tại một điểm trạng thái cho trước. Nhiệm vụ chính của điều khiển là tìm được tín hiệu điều khiển mang lại cho hệ thống một chất lượng mong muốn, tức là phải tìm ra được một tín hiệu thoả mãn chất lượng đề ra trong số các tín hiệu có khả năng đưa hệ thống từ điểm trạng thái x0 ban đầu tới được điểm trạng thái đích xT. Nếu như không tồn tại bất cứ một tín hiệu điều khiển nào đưa được hệ từ x0 tới xT thì sự cố gắng tổng hợp hay đi tìm tín hiệu điều khiển như trên sẽ trở nên vô nghĩa (bài toán không có lời giải). Bởi vậy, để công việc điều khiển có thể có kết quả ta phải biết được rằng có tồn tại hay không ít nhất một tín hiệu điều khiển đưa được hệ thống từ x0 về xT trong khoảng thời gian T hữu hạn. Nếu như tồn tại một tín hiệu điều khiển làm được việc đó thì ta nói hệ thống là điều khiển được tại điểm trạng thái x0. 4) Hiểu biết về tính quan sát được của hệ thống tại một điểm trạng thái cho trước. Hay quay lại vấn đề chính xác là xây dựng bộ điều khiển cho hệ thống để minh hoạ. Nếu sau khi đã biết là công việc xây dựng bộ điều khiển có thể có kết quả (hệ điều khiển được tại x0) thì công việc tiếp theo là phải xác định được x0 để từ đó bộ điều khiển có thể tạo ra được tín hiệu điều khiển thích hợp đưa hệ từ x0 về xT. Công việc xác định điểm trạng thái x0 có thể được tiến hành bằng cách đo trực tiếp (nhờ các bộ cảm biến, sensor) nhưng có khi phải tính toán, phải quan sát khi không thể đo được trực tiếp x0, chẳng hạn như gia tốc không thể đo được trực tiếp mà phải được suy ra từ việc đo tốc độ trong một khoảng thời gian cho phép. Trong trường hợp phải quan sát, người ta nói điểm trạng thái x0 của một hệ là quan sát được nếu ta có thể xác định được nó thông qua việc đo các tín hiệu vào/ra trong một khoảng thời gian hữu hạn. 1.2 Phân tích tính ổn định 1.2.1. Định lý Gerchgorin. 5 Định lý 1.1. (Gerschgorin): Với mỗi giá trị riêng sk của ma trận phức (các phần tử là những số phức): a  11   a21  A      an1  a12 a22  an 2 a1n    a2 n          ann   j  aii . Ri  Hình 1.1. Minh họa định lý 1.1 luôn tồn tại một chỉ số i=1,2,…,n sao cho sk nằm trong đường tròn tâm aii bán kính Ri=aii+…..+aii-1+aii+1+….ain (hình 1.1)tức là: n s k aii  Ri   aij j 1 j 1 Định lý 1.2 (Hệ quả Gerschgorin): Ký hiệu n Ri   aij . Vậy thì hệ j 1 j 1 (1.1) với aijR sẽ ổn định nếu aii+Ri<0 với mọi i = 1, 2,…,n. Định lý 1.3. Hệ (1.1) ổn định BIBO khi và chỉ khi nó ổn định tiệm cận Lyapunov, tức là khi và chỉ khi các qũy đạo trạng thái tự do có hướng tiến về gốc toạ độ và kết thúc tại đó. Định lý 1.4 (Lyapunov): Nếu tồn tại hàm V(x), thoả mãn các điều kiện: a) Khả vi, xác định dương, tức là V(x)>0 với x≠0 và V(x)=0 x = 0 b) dV dV  0, với dt dt là đạo hàm của V(x) dọc theo qũy đạo trạng thái tự do. thì hệ sẽ ổn định tiệm cận Lyapunov tại 0 (ổn định BIBO). Hàm V(x) khi đó được gọi là hàm Lyapunov. Nói cách khác, hệ ổn định tiệm cận tại 0 nếu nó có hàm Lyapunov. Định lý 1.5 (Hệ quả Lyapunov): Cho một hệ tuyến tính mô tả bởi mô hình trạng thái (1.1). Hệ sẽ ổn định nếu một trong hai điều sau được thoả mãn: a) Tồn tại ma trận vuông P Rn xn xác định dương sao cho ma trận PA  AT P xác định âm, tức là  PA  AT P xác định dương. b) Tồn tại một ma trận đối xứng, xác định dương Q sao cho phương trình 6 PA  A P  Q (1.4) T có nghiệm P cũng đối xứng, xác định dương. Phương trình (1.4) có tên gọi là phương trình Lyapunov. Cuối cùng, và cũng để việc sử dụng định lý 1.5 được thuận tiện, thì định lý của Sylvester cho sau đây như một công cụ xác định tính xác định dương của một ma trận đối xứng cho trước. Định lý 1.6 (Sylvester): Cần và đủ để ma trận vuông, đối xứng: q  11   q21  Q      qn1  q1n    q2 n   ,       qnn    q12 q22  qn 2 qik  qki xác định dương là các ma trận đường chéo của nó có định thức dương: q11  0, q  11 det   q21  q12    0, q22   q  11  det  q21    q31  q12 q22 q32 q13   q23   0,....   q33   Tất nhiên rằng định lý Sylvester nêu trên cũng được sử dụng để xác định tính xác định âm của một ma trận Q bằng cách kiểm tra xem ma trận Q có xác định dương hay không. Nếu -Q xá định dương thì Q xác định âm. 1.3. Phân tích tính điều khiển được 1.3.1. Khái niệm điều khiển được và điều khiển được hoàn toàn Định nghĩa 1.1. Một hệ thống tuyến tính, liên tục được gọi là điều khiển được nếu tồn tại ít nhất một tín hiệu điều khiển đưa được nó từ một điểm trạng thái ban đầu x0 (tuỳ ý) để được gốc tọa độ 0 trong khoảng thời gian hữu hạn. 1.3.2. Các tiêu chuẩn xét tính điều khiển được cho hệ tham số hằng Xét hệ tuyến tính tham số hằng mô tả bởi: dx  A x  Bu dt với A  R nxn ; B  R nxm (1.5) 7 1. Tiêu chuẩn Hautus Định lý 1.7. (Hautus): Cần và đủ để hệ tuyến tính (1.5) điều khiển được là: Rank(sI - A,B) = n với mọi s C 2. Tiêu chuẩn Kalman Định lý 1.8. (Kalman): Cần và đủ để hệ tuyến tính (1.5) điều khiển được là: Rank (B, AB,…..An-1B)=n 1.4. Phân tích tính quan sát được 1.4.1. Khái niệm quan sát được và quan sát được hoàn toàn Định nghĩa 1.2. Một hệ thống có tín hiệu vào u(t) và tín hiệu ra y(t) được gọi là: a) Quan sát được tại thời điểm t0, nếu tồn tại ít nhất một giá trị hữu hạn T>t0 để điểm trạng thái x(t) = x0 xác định được một cách chính xác thông qua vector các tín hiệu vào ra u(t), y(t) trong khoảng thời gian [t0, T]. b) Quan sát được hoàn toàn tại thời điểm t0, nếu với mọi T>t0, điểm trạng thái x0 = x(t0) luôn xác định được một cách chính xác từ vector các tín hiệu vào ra u(t), y(t) trong khoảng thời gian [t0, T]. Chú ý: Yêu cầu phải đo trong khoảng thời gian hữu hạn là rất quan trọng. Khoảng thời gian quan sát càng ngắn sẽ càng tốt cho công việc điều khiển sau này. Nếu thời gian quan sát quá lớn, điểm trạng thái x0 vừa xác định được sẽ mất ý nghĩa ứng dụng cho bài toán điều khiển, ví dụ khi có được x0 thì có thể hệ đã chuyển đến một điểm trạng thái mới cách rất xa điểm trạng thái x0. 1.4.2. Một số kết luận chung về tính quan sát được của hệ tuyến tính Một cách tổng quát, sau đây ta sẽ xét hệ tuyến tính có thể không dừng với: d x  A(t ) x  B(t )u   dt  y  C t x  Dt u  (1.10) 8 trong đó A(t )  R nn , B(t )  R nm , C (t )  R rn , phần tử có thể là hàm số phụ thuộc t. D(t )  R r m là những ma trận có Định lý 1.9. Hệ không dừng (1.10) sẽ a) Quan sát được tại t0 khi và chỉ khi tồn tại ít nhất một giá trị T>t0 hữu hạn sao cho các vector cột của ma trận C(t)(t-t0) độc lập tuyến tính trong khoảng thời gian t0 tt0, các vector cột của ma trận C(t)(t-t0) độc lập tuyến tính trong khoảng thời gian t0 tt0 hữu hạn sao cho các vector cột của C (t  t0 ) không phụ thuộc tuyến tính trên tòn khoảng [t0, T1]. Vì C là ma trận hằng nên (t  t0 ) là thành phần duy nhất phụ thuộc t trong tích C(t  t0 ) . Do (t  t0 ) không suy biến với mọi t (định lý 3.12 – Lý thuyết điều khiển nâng cao, Nguyễn Doãn Phước tr263) nên điều này cũng đúng với mọi khoảng [t0, T1], trong đó T là số tuỳ ý lớn hơn t0. Định lý 1.11: Nếu hệ không dừng (1.10) quan sát được tại thời điểm t0 thì nó cũng quan sát được mọi thời điểm t0 1.4.3. Tính đối ngẫu và các tiêu chuẩn xét tính quan sát được của hệ tham số hằng Cho hệ tuyến tính, tham số hằng mô tả bởi: d x  A x  Bu   dt  y  C x  Du  với A  R n n , B  R n m , C  R r  n , D  R r  m (1.12) Một hệ tuyến tính khác được suy ra từ hệ trên với mô hình: d x  AT x  C T u   dt  y  BT x  DT u  (1.13) được gọi là hệ đối ngẫu với hệ (1.12) đã cho. Có thể thấy ngay được là từ là ma trận truyền đạt của hệ (1.12): G(s)  C (sI  A) B  D 9 ta cũng có ma trận truyền đạt GT(s)cho hệ đối ngẫu (1.13) với nó. Định lý 1.12: Hệ tham số hằng (1.12) quan sát được khi và chỉ khi hệ (1.13) đối ngẫu với nó điều khiển được. Định lý 1.13: Cho hệ tham số hằng (1.12). Các phát biểu sau là tương đương: a) Hệ quan sát được. b) c)  sI  A  n Rank  C    với mọi s, và I là ma trận đơn vị (Hautus, 1969).  C     CA  Rank  n     n 1   CA  (Kalman, 1969). 10 Chương 2. THIẾT KẾ BỘ ĐIỀU KHIỂN PHẢN HỒI TRẠNG THÁI TỐI ƯU 2.1. Phương pháp biến phân 2.1.1. Nội dung phương pháp Biến phân là một phương pháp được xây dựng từ điều kiện cần phải có của nghiệm tối ưu u(t) của bài toán tối ưu động, liên tục, có khoảng thời gian T xác định, cho trước và không bị ràng buộc bởi điều kiện U, hoặc nếu có bị ràng buộc thì tập U của các (vector) tín hiệu điều khiển thích hợp phải là một tập hở. Ý tưởng chính của biến phân có thể được tóm tắt như sau: - Từ giả thiết u(t) là tín hiệu điều khiển tối ưu, x(t) là quỹ đạo trạng thái tối ưu, người ta xây dựng một tín hiệu điều khiển khác có một sai lệch nhỏ so với nó là: (2.1) u~(t )  u(t )   u (t ) , trong đó:  u (t ) là rất nhỏ. Và xem u~(t ) chưa phải là tín hiệu tối ưu. - Tiếp theo, người ta giả thiết quỹ đạo trạng thái ~x (t ) do u~(t ) tạo ra cho hệ thống cũng chỉ có một sai lệch rất nhỏ so với quỹ đạo trạng thái tối ưu x(t ) , tức là: ~x (t )  x(t )   x (t ) cũng có  x (t ) rất nhỏ. (2.2) - Cuối cùng, từ điều kiện phải có của tín hiệu điều khiển tối ưu: Q(x, u)  Q( ~x , u~) (2.3) Người ta xác định tính chất của điều khiển tối ưu u(t), gọi là tính chất biến phân. Cho hệ có mô hình: dx  A x  Bu , dt A Rnxn, B Rnxm (2.4) Xét bài toán tìm bộ điều khiển R tĩnh, phản hồi trạng thái để điều khiển đối tượng (2.4). Mục đích của phương pháp thiết kế bộ điều khiển R sao cho sau khi bị nhiễu đánh bật ra khỏi điểm cân bằng (hoặc điểm làm việc ) đến một điểm trạng thái x0 nào đó, bộ điều khiển R sẽ kéo được hệ từ x0về toạ độ 0 (hay điểm làm việc cũ) và trong quá trình trở lại này sự tổn hao năng lượng, đánh giá bởi phiếm hàm mục tiêu: Q x, u    1 T T ( x E x  u F u )dt  min  20 (2.5) 11 Giả sử u(t) là tín hiệu điều khiển được tạo ra bởi R đã thoả mãn điều kiện tối ưu (2.5), tức là trong số tất cả các tín hiệu u~(t ) đưa hệ từ x0 về gốc toạ độ 0 thì u(t) sẽ là vector tín hiệu mà: Qu     1 1 T T T T ( x E x  u F u )dt Qu~    ( x E ~ x  u~ F u~)dt  20 20 (2.6) Bây giờ ta xét đáp ứng của đối tượng với một tín hiệu khác có sai lệch nhỏ  u so với u(t), tức là ứng với u~(t )  u(t )   u (t ) . Gọi ~x (t )  x(t )   x (t ) là quỹ đạo trạng thái tương ứng của đối tượng cũng đi từ x0 về gốc toạ độ 0 khi được kích thích bởi u~(t ) . Vậy thì: dx  Ax  B x dt và d x   x   A( x   x )  B(u   u ) dt Suy ra: d x  A x  B u dt  Ngoài ra, do quỹ đạo giống như x(t) nên d x  A x  B u  0 dt ~ x (t )  x(t )   x (t ) cũng (2.7) đi từ x0 về gốc toạ độ 0  x (0)   x ()  0 (2.8) Tiếp theo, ta xét ảnh hưởng của sự biến phân u(t) thành với giá trị của phiếm hàm mục tiêu:   u(t )   u (t ) đối  1 T Q   Q  Qu   u    ( x   x )T E  x   x   u   u  F u   u  dt 20 Trừ vế với vế của (2.8) và (2.6) được: 0   Q  Qu   u   Qu      1 T T T T T T x E x   x E x   x E x  u F  u   u F u   u F  u dt 2 0      x E x  u F  u dt T T (2.9) 0 vì E, F là hai ma trận đối xứng và do  u ,  x <<0 nên (  Tx E x  uT F u )  0. 12 Để kết hợp được điều kiện biên (2.7) với (2.9) ta tạo ra tích vô hướng của vector 0 trong (2.7) bằng cách nhân hai vế của nó với một vector pT bất kỳ: T d x p (  A x  B u )  0 (2.10) dt rồi cộng với (2.9) sẽ được:  d    Q    xT E x  u T E u  pT ( x  A x  B u ) dt dt  0 (tích phân toàn phần) T   dp T T T T  p  x   ( p B  u F ) u  (  p A  x E ) x   dt dt 0  0   T   T   dp T T T T   ( p B  u F ) u  (  p A  x E ) x   dt dt  0    Nếu như trong vô số các vector pT thoả mãn (2.10) ta chọn: dp dt   ( p A  x E )T   AT p  E x T T  và sử dụng ký hiệu hàm Hamilton: 1 T T T H  p ( Ax  Bu )  ( x E x  u F u ) 2 (2.11)  H  u dt u 0  Q   thì trong đó H u (2.12) là ký hiệu chỉ ra ma trận Jacobi của H, tức là: H H H ( ,......, ) u u1 ur Chú ý: Ký hiệu đạo hàm được sử dụng là đạo hàm Jacobi: T d ( L x) d ( x L) T  L, L dx dx Từ (2.10) và (2.12) ta có các tính chất của tín hiệu điều khiển tối ưu như sau: Định lý 2.1: Nếu u(t) là tín hiệu điều khiển tối ưu thì tín hiệu đó phải thoả mãn: H T 0 u 13 trong đó H là hàm Hamilton định nghĩa theo (2.11). Ngoài ra, cùng với ký hiệu của hàm Hamilton thì: T d x  H   dt   p  T  H     dt  x  dp , và chúng được gọi là phương trình Euler - Lagrange. Định lý 2.2: Nếu u(t) là tín hiệu điều khiển tối ưu thì tín hiệu đó phải thoả mãn: u(t) = F-1BTp(t) 2.1.2. Ứng dụng phương pháp biến phân để thiết kế bộ điều khiển phản hồi trạng thái tối ưu 1. Thiết kế bộ điều khiển LQR phản hồi dương. Thuật toán tìm bộ điều khiển R, tối ưu theo nghĩa (2.14), phản hồi dương trạng thái, gồm hai bước như sau: 1) Xác định ma trận K đối xứng, xác định âm là nghiệm của phương trình Riccati (2.13). Ma trận K xác định âm khi và chỉ khi ma trận -K xác định dương. 2) Xác định R từ K theo (2.14). 2. Thiết kế bộ điều khiển LQR phản hồi âm Thuật toán tìm bộ điều khiển R tối ưu được sửa đổi lại cho nguyên lý phản hồi âm gồm hai bước như sau: 1) Xác định ma trận L đối xứng, xác định dương là nghiệm của phương trình Riccati (2.16) 2) Xác định R từ L theo (2.15)  3 3   3 , 5 R  F 1BT L  0 , 1  3 5       3. Các phương pháp tìm nghiệm của phương trình Riccati trực tiếp a. Phương pháp MacFarlane – Potter 14 b. Phương pháp Kleinman. 2.2. Nguyên lý cực đại 2.2.1. Điều kiện cần 2.2.2. Điều kiện hoành (Điều kiện trực giao) 2.3. Phương pháp quy hoạch động 2.3.1. Nội dung phương pháp Nguyên lý tối ưu của Bellman 2.3.2 Mở rộng cho hệ liên tục và phương trình Hamilton - Jacobi - Bellman 15 Chương 3 THIẾT KẾ BỘ ĐIỀU KHIỂN TỐI ƯU NGẪU NHIÊN ĐỘNG 3.1. Bộ lọc Wiener 3.1.1.Mục đích của bộ lọc n(t) u0(t) u(t) G(s) y(t) Hình 3.1. Bộ lọc Winner y(t) = u0(t) Do tín hiệu nhiễu n(t) không có cùng nguồn phát như u0(t) nên ở đây ta có thể xem chúng là không tương quan với nhau. Nếu có thêm giả thiết nhiễu n(t) có giá trị trung bình (kỳ vọng) bằng 0, thì khi đó sẽ có: S  j   Su ( j )  S n ( j ) =>  u ru n    0 0  Su0 ( j )  Suu0 ( j ) 0 Nhiệm vụ của bộ lọc là tạo ra tín hiệu y(t) ở đầu ra giống như tín hiệu không bị lẫn nhiễu u0(t) ở đầu vào. Đánh giá cho sự sai khác giữa y(t) và u0(t) là hàm sai lệch:  e(t )  y(t )  u0 (t )   g ( )u (t   )d u 0 (t ) 0 Trong đó g(t) là hàm trọng lượng của bộ lọc, tức là hàm có ảnh Laplace là G(s) Nếu ta đơn thuần chỉ lập hàm đo chất lượng của bộ lọc theo  ~ Q   e2 (t )dt (3.1) 0 thì rõ ràng Q~ không những phụ thuộc vào g(t) cần phải xác định mà còn phụ thuộc cả vào tín hiệu nhiễu n(t) có lẫn trong u(t), tức là Q~ = Q~( g , n) . Vì vậy không thể hy vọng rằng thông qua việc xác định: ~ Q( g , n)  min lại có thể nhận được một hàm g(t) bất biến với nhiễu n(t). 16 Để có thể tránh được sự xuất hiện n(t) trong hàm đo chất lượng bộ lọc, người ta đã không sử dụng (3.46) mà thay vào đó là kỳ vọng của nó:   1 Q  M e (t )  lim T   2T 2 T  e (t )dt (3.2) 2 T và như vậy bài toán thiết kế bộ lọc Wiener trở thành một bài toán tối ưu ngẫu nhiên. Do n(t) không tương quan với u0(t) nên Q được lập theo (3.47) cũng sẽ không phụ thuộc vào n(t), tức là: Q = Q(g) và ta đi đến dạng chuẩn của bài toán tối ưu tìm hàm trọng lượng g(t) mô tả bài toán thiết kế bộ lộc Wiener như sau: 1 T   2T Q( g )  lim T  min  e (t )dt  (3.3) 2 g P T trong đó P là tập hàm trọng lượng của các khâu tuyến tính và ổn định. Nghiệm tối ưu g(t) của bài toán (3.3) được phát biểu như sau: 3.1.2. Thuật toán xác định nghiệm tối ưu của bài toán (3.3). 1) Tính mật độ phổ Su(s) của u(t), tức là tính ảnh Laplace của hàm tự tương quan ru() của tín hiệu u(t). Trong nhiều trường hợp, khi mà chỉ biết trước mật độ phổ Su (s) của u0(t) và Sn(s) của nhiễm n(t), thì do u0(t), n(t) không tương quan, ta cũng có được. 0 2) Viết lại Su(s) thành: Su(s) = A-(s) A+(s) => Suu  H  GA A  Suu0  A  GA  0 A     Trong đó A-(s) là hàm thực hữu tỷ có các điểm không và điểm cực đều nằm bên trái trục ảo (pha cực tiểu) và A+(s) là hàm thực - hữu tỷ có các điểm không và điểm cực nằm bên phải trục ảo. 3) Tính tỷ số: R s   Suu0 ( s) A ( s) 17 Trong đó Suu (s) là ảnh Laplace của hàm hỗ tương quan  uu ( ) giữa u(t) và u0(t). Nếu thay vì Suu (s) ta chỉ có Su (s) của u0(t) thì do tính không tương quan giữa u0(t), n(t) ta cũng sẽ có Suu (s) = Su (s) . 0 0 0 0 0 0 4) Tách R(s) thành: R(s) = B-(s) + B+(s) => H = A+ (GA--B--B+) Trong đó B-(s) là hàm bền (giải tích trong nửa mặt phẳng phức bên phải) và B+(s) là hàm giải tích trong nửa mặt phẳng phức bên trái, tức là có các điểm cực nằm bên phải trục ảo (hàm phản bền). 5) Chọn: B  ( s) G s    A ( s) tức là chọn G(s) sao cho GA--B--B+=-B+, để được H(s) = -A+(s)B+(s) là hàm phản bền. 3.2. Bộ quan sát trạng thái Kalman (lọc Kalman) 3.2.1. Mục đích của bộ quan sát 3.2.2. Thuật toán xác định bộ quan sát trạng thái Kalman. 1) Giải bài toán tối ưu (3.16) để có được ma trận R = LT là bộ điều khiển tối ưu phản hồi âm trạng thái (bộ điều khiển LQR cho đối tượng đối ngẫu). Các ma trận Nx, Ny được xác định từ nhiễu nx(t), ny(t) theo công thức (3.9), (3.11) trong đó Nx phải là ma trận xác định bán dương và Ny phải xác định dương. Ở nhiều bài toán ứng dụng thực tế, khi mà thông tin ban đầu về nhiễu nx(t), ny(t) quá ít để có thể xác định được cụ thể Nx, Ny người ta thường hay chọn chúng là những ma trận đơn vị có số chiều phù hợp với số chiều của x và u . 2) Gán L tìm được vào công thức (3.11) để có hoàn chỉnh mô hình bộ quan sát trạng thái cho đối tượng (3.8). 18 Chương 4 XÂY DỰNG THUẬT TOÁN THIẾT KẾ BỘ ĐIỀU KHIỂN PHẢN HỒI TÍN HIỆU RA 4.1. Nội dung bộ điều khiển Cho đối tượng tuyến tính tham số hằng bị tác động bởi nhiễu ồn trắng nx(t) vào hệ thống và ny(t) ở đầu ra, mô tả bởi mô hình trạng thái: d x  A x  Bu  n x   dt  y  C x  Du  n y  Hãy thiết kế bộ điều khiển phản hồi tín hiệu ra sao cho hệ được ổn định tối ưu theo nghĩa khi bị một tác động không mong muốn đánh bật ra khỏi điểm cân bằng (điểm làm việc), bộ điều khiển đó sẽ đưa được hệ quay trở về điểm cân bằng cũ (điểm làm việc cũ) và chi phí cho quá trình quay về đó tính theo:  1 T T Q   ( x E x  u F u ) dt 20 đạt giá trị nhỏ nhất. Bài toán trên được gọi là bài toán thiết kế bộ điều khiển LQG (Hay là điều khiển đối tượng bền vững với nhiễu). Giữa bài toán thiết kế bộ điều khiển LQG và bộ điều khiển LQR có hai điểm khác rất cơ bản. Đó là: - Bộ điều khiển là phản hồi tín hiệu ra, chứ không phải phản hồi trạng thái - Đối tượng có nhiễu tác động cả vào hệ thống lẫn đầu ra. Vì tín hiệu ra không mang đầy đủ thông tin động học của đối tượng, nên để bộ điều khiển LQG đem lại chất lượng điều khiển mong muốn thì hệ tuyến tính phải thõa mãn nguyên lý tách được để bộ điều khiển là sự kết hợp của hai bộ điều khiển: Bộ điều khiển phản hồi trạng thái và bộ điều khiển phản hồi đầu ra. 4.2. Nguyên lý tách được 4.3. Thuật toán thiết kế bộ điều khiển phản hồi tín hiệu ra. Khi hệ tuyến tính thoả mãn nguyên lý tách được thì bài toán thiết kế bộ điều khiển phản hồi tín hiệu ra LQG sẽ chuyển được về bài toán thiết kế bộ điều khiển phản hồi trạng thái LQR. Nói cách khác, bộ điều khiển LQG 19 sẽ được thiết kế gồm một bộ điều khiển tối ưu phản hồi trạng thái LQR và một bộ quan sát trạng thái Kalman mắc nối tiếp nhau như mô tả ở hình 4.1. Ta đi đến thuật toán thiết kế bộ điều khiển LQG với các bước sau: 1) Thiết kế bộ điều khiển tối ưu RLQR phản hồi (âm) trạng thái x(t), tức là bộ điều khiển LQR, cho bài toán: d x  dt  A x  Bu    Q  1 ( xT E x  uT F u )   min u  2 0 (4.1) bằng thuật toán đã trình bày tại chương II. Nói cách khác là phải tính: R:LQR  F 1BT L trong đó L là nghiệm xác định bán dương của phương trình đại số Riccati L BF 1BT L  AT L  L A  E Điều kiện để bài toán này có nghiệm là E xác định bán dương và F xác định dương. Chú ý rằng bộ điều khiển phản hồi trạng thái LQR tìm được như trên chưa đảm bảo chắc chắc làm ổn định đối tượng (4.1) vì nó đã được thiết kế theo phương pháp biến phân cho bài toán tối ưu (4.1) có điểm trạng thái cuối xT tuỳ ý. Nhưng vì ở đây có khoảng thời gian xảy ra quá trình tối ưu T =  nên theo định lý Barbalas ta cũng phải có:   lim x E x  u F u  0 t T T T  lim x E x  lim u F u  0  lim x E x  0 T t T T t T T t T và lim u F u  0 T t T Vì F là ma trận xác định dương. Vậy điểm cuối xT phải là điểm cân bằng của hệ kín. Điểm cân bằng này sẽ là gốc toạ độ (và khi đó hệ kín sẽ ổn định) nếu E cũng là ma trận xác định dương hoặc hệ kín chỉ cân bằng duy nhất tại gốc toạ độ. Để kiểm tra xem hệ kín có cân bằng duy nhất tại gốc 0 hay không, ta chỉ cần kiểm tra xem ma trận hệ thống A-BRLQR có khả nghịch hay không là đủ, tức là: det A  BR:LQR   0  xT=0 2) Thiết kế bộ quan sát trạng thái Kalman để có được trạng thái xấp xỉ gần đúng từ các tín hiệu đo được u(t), y(t) làm tín hiệu đầu vào cho bộ 20
- Xem thêm -