Lời nói đầu
Một trong những mục tiêu hàng đầu trong tổng hợp hệ thống điều
khiển là tính hiệu quả cao. Hệ thống càng phức tạp, quy mô càng lớn, thì
việc đưa ra các quyết định điều khiển để hệ thống cho hiệu quả càng khó
khăn, ngay cả đối với những chuyên gia nhiều kinh nghiệm. Bởi vậy cần
phải có những phương pháp tổng quát, chặt chẽ về mặt lý thuyết, làm nền
tảng trợ giúp cho công việc trên và đó chính là mục đích của điều khiển tối
ưu.
Điều khiển tối ưu là một chuyên ngành trong điều khiển tự động có
vai trò xác lập và tạo lập những luật điều khiển cho hệ thống để hệ thống
đạt được chỉ tiêu về tính hiệu quả đã được định trước dưới dạng (phiếm)
hàm mục tiêu Q. Miền nghiên cứu của điều khiển tối ưu không chỉ riêng ở
các hệ thống kỹ thuật mà có thể tìm thấy ở hầu hết các hệ thống không
phải là kỹ thuật khác như hệ sinh học, hệ kinh tế
Bài toán điều khiển có ba cấu trúc cơ bản đó là:
* Điều khiển hở
Về bản chất, hình thức điều khiển này cũng giống như bài toán tìm
tín hiệu điều khiển thích hợp đặt ở đầu vào của đối tượng, nhưng được bổ
sung thêm bộ điều khiển để tạo ra được tín hiệu điều khiển đó.
(t )
Bộ điều
khiển
Đối tượng điều
khiển
u(t)
y(t)
Hình 1. Cấu trúc điều khiển hở
Ví dụ để điều khiển tàu thuỷ đi được theo một quỹ đạo y(t) mong
muốn (tín hiêu đầu ra), người ta phải tác động bằng lực (t ) vào tay lái để
tạo ra được vị trí u(t) của bánh lái một cách thích hợp. Trong ví dụ này hệ
thống tay lái – bánh lái có vai trò của một bộ điều khiển.
Hình thức điều khiển hở này là điều khiển một chiều và chất lượng
điều khiển phụ thuộc vào độ chính xác của mô hình toán học mô tả đối
tượng cũng như phải có giả thiết rằng không có tác động nhiễu không
mong muốn vào hệ thống trong suốt quá trình điều khiển.
1
* Điều khiển phản hồi trạng thái
Ở đối tượng điều khiển, các tín hiệu trạng thái x1 (t ), x2 (t ),...,xn (t ) ,
được viết chung dạng vector x(t ) ( x1 (t ), x2 (t ),...,xn (t ) )T, là thành phần chứa
đựng đầy đủ nhất các thông tin chất lượng động học hệ thống, kể cả những
tác động nhiễu không mong muốn. Bởi vậy, để có thể tạo ra được cho đối
tượng một chất lượng mong muốn, ổn định với tác động nhiễu, cần phải có
một tín hiệu áp đặt ở đầu vào là u(t) phản ứng kịp theo những thay đổi
trạng thái của đối tượng
e
Bộ điều
khiển
u
Đối tượng
điều khiển
y
Đối tượng
điều khiển
u
x
y
x
Bộ điều
khiển
Hình 2. Điều khiển phản hồi trạng thái
Hình 2. biểu diễn nguyên tắc điều khiển phản hồi trạng thái. Bộ điều khiển
sử dụng tín hiệu trạng thái x(t ) của đối tượng để tạo ra được tín hiệu đầu
vào u(t) cho đối tượng. Vị trí của bộ điều khiển có thể là ở mạch truyền
thẳng hoặc ở mạch hồi tiếp.
Hệ thống điều khiển phản hồi trạng thái có khả năng giữ được ổn
định chất lượng mong muốn cho đối tượng, mặc dù trong quá trình điều
khiển luôn có những tác động nhiễu. Như vậy hệ thống điều khiển phản
hồi trạng thái tối ưu đã giải quyết triệt để mục tiêu của bài toán điều khiển
đó là chất lượng điều khiển đạt tốt nhất.
Tuy vậy hệ thống điều khiển phản hồi trạng thái có nhược điểm, trong
nhiều trường hợp trạng thái của đối tượng điều khiển không đo được trực
tiếp gây khó khăn cho việc nhận dạng đối tượng điều khiển vì vậy người ta
phải thay bộ điều khiển phản hồi trạng thái bằng bộ điều khiển phản hồi tín
hiệu ra.
e
Bộ điều
khiển
u
Đối tượng
điều khiển
y
u
Đối tượng
điều khiển
Bộ điều
khiển
Hình 3. Điều khiển phản hồi đầu ra
2
y
Bộ điều khiển sử dụng tín hiệu đầu ra y(t) của đối tượng để tạo
ngược ra được tín hiệu đầu vào u(t) cho nó. Tuy nhiên, cho tới nay bài toán
điều khiển phản hồi tín hiệu ra vẫn còn là một bài toán mở và chưa có lời
giải tổng quát cuối cùng, vì tín hiệu ra y(t) thường không mang được đầy
đủ thông tin động học của đối tượng.
Với những ưu nhược điểm của bài toán phản hồi trạng thái và điều khiển
phản hồi tín hiệu ra, từ những lý thuyết đã nghiên cứu luận văn trình bày
thuật toán thiết kế bộ điều khiển tối ưu phản hồi tín hiệu ra dựa trên sự kết
hợp của hai bộ điều khiển: Bộ điều khiển phản hồi trạng thái và bộ điều
khiển phản hồi đầu ra áp dụng cho đối tượng điều khiển là đối tượng tuyến
tính để chất lượng điều khiển là tối ưu.
Sau một thời gian học tập và nghiên cứu đến nay bản luận văn của tôi
đã được hoàn thành. Nhân dịp này tôi xin chân thành cảm ơn PGS.TS
Nguyễn Doãn Phước - Thầy giáo hướng dẫn trực tiếp, người đã đưa ra
hướng nghiên cứu tận tình giúp đỡ, chỉ bảo và tạo mọi điều kiện thuận lợi
để tôi hoàn thành luận văn này.
Tôi xin cảm ơn tất cả các thầy cô giáo đã tham gia giảng dạy, giúp
đỡ tôi trong suốt quá trình học tập, nâng cao trình độ kiến thức.
Tôi xin gửi lời cảm ơn đến tất cả bạn bè, đồng nghiệp và người thân
đã giúp đỡ tôi trong suốt quá trình vừa qua.
Vì điều kiện về thời và khả năng của bản thân có hạn nên bản luận văn
này không tránh khỏi những thiếu sót. Tôi rất mong các thầy cô cùng các
bạn đồng nghiệp góp ý sửa đổi, bổ xung thêm để bản luận văn thêm hoàn
thiện.
3
Chương 1
PHÂN TÍCH HỆ THỐNG TRONG MIỀN KHÔNG GIAN TRẠNG THÁI
1.1. Những nhiệm vụ cơ bản của công việc phân tích
Các nhiệm vụ cơ bản của công việc phân tích chất lượng động học
của một hệ thống bao gồm:
- Tính ổn định
- Sai lệch tĩnh, độ quá điều chỉnh, thời gian quá độ.
- Chất lượng bền vững.
Tuy nhiên, do đặc thù là được mô tả trong không gian trạng thái với mô
hình:
d x
A x Bu
dt
y C x Du
(1.1)
Mà ở đó rất có thể có những biến trạng thái thừa, nên công việc phân
tích hệ thống trong không gian trạng thái còn cần phải làm rõ thêm:
1) Hiểu biết về sự phân bố các điểm cân bằng của hệ thống. Một điểm
trạng thái xe được gọi là điểm cân bằng nếu như khi hệ đang ở điểm trạng
thái xe và không có một tác động nào từ bên ngoài thì hệ sẽ nằm nguyên tại
đó. Theo định nghĩa như vậy thì điểm cân bằng xe của hệ thống phải là
nghiệm của:
dx
Ax 0
dt
(1.2)
Điều này cũng dễ hiểu, vì theo định nghĩa, điểm cân bằng là điểm mà
hệ thống sẽ nằm im tại đó, tức là trạng thái của nó không bị thay đổi
dx
0
dt
khi không có sự tác động từ bên ngoài (u=0).
Ta có thể thấy ngay được từ (1.2) là hệ tuyến tính cân bằng tại mọi
điểm trạng thái thuộc không gian Ker (A) và nếu ma trận A của mô hình
trạng thái (1.1) không suy biến thì hệ (1.1) chỉ có một điểm cân bằng duy
nhất là gốc toạ độ 0.
2) Hiểu biết về tính ổn định Lyapunow của hệ thống. Một hệ thống
được gọi là ổn định Lyapunow tại điểm cân bằng xe nếu sau khi có một tác
4
động tức thời (chẳng hạn như nhiễu tức thời) đánh bật hệ ra khỏi điểm cân
bằng xe thì sau đó hệ có khả năng tự quay về được lân cận điểm cân bằng
xe ban đầu (không cần có tín hiệu điều khiển u). Nếu hệ không những tự
quay về được lân cận của xe mà còn tiến tới xe thì nó được gọi là ổn định
tiệm cận Lyapunow tại xe.
3) Hiểu biết về tính điều khiển được của hệ thống tại một điểm trạng
thái cho trước.
Nhiệm vụ chính của điều khiển là tìm được tín hiệu điều khiển mang
lại cho hệ thống một chất lượng mong muốn, tức là phải tìm ra được một
tín hiệu thoả mãn chất lượng đề ra trong số các tín hiệu có khả năng đưa hệ
thống từ điểm trạng thái x0 ban đầu tới được điểm trạng thái đích xT. Nếu
như không tồn tại bất cứ một tín hiệu điều khiển nào đưa được hệ từ x0 tới
xT thì sự cố gắng tổng hợp hay đi tìm tín hiệu điều khiển như trên sẽ trở
nên vô nghĩa (bài toán không có lời giải). Bởi vậy, để công việc điều khiển
có thể có kết quả ta phải biết được rằng có tồn tại hay không ít nhất một tín
hiệu điều khiển đưa được hệ thống từ x0 về xT trong khoảng thời gian T
hữu hạn. Nếu như tồn tại một tín hiệu điều khiển làm được việc đó thì ta
nói hệ thống là điều khiển được tại điểm trạng thái x0.
4) Hiểu biết về tính quan sát được của hệ thống tại một điểm trạng
thái cho trước.
Hay quay lại vấn đề chính xác là xây dựng bộ điều khiển cho hệ
thống để minh hoạ. Nếu sau khi đã biết là công việc xây dựng bộ điều
khiển có thể có kết quả (hệ điều khiển được tại x0) thì công việc tiếp theo
là phải xác định được x0 để từ đó bộ điều khiển có thể tạo ra được tín hiệu
điều khiển thích hợp đưa hệ từ x0 về xT. Công việc xác định điểm trạng thái
x0 có thể được tiến hành bằng cách đo trực tiếp (nhờ các bộ cảm biến,
sensor) nhưng có khi phải tính toán, phải quan sát khi không thể đo được
trực tiếp x0, chẳng hạn như gia tốc không thể đo được trực tiếp mà phải
được suy ra từ việc đo tốc độ trong một khoảng thời gian cho phép. Trong
trường hợp phải quan sát, người ta nói điểm trạng thái x0 của một hệ là
quan sát được nếu ta có thể xác định được nó thông qua việc đo các tín
hiệu vào/ra trong một khoảng thời gian hữu hạn.
1.2 Phân tích tính ổn định
1.2.1. Định lý Gerchgorin.
5
Định lý 1.1. (Gerschgorin): Với mỗi giá trị riêng sk của ma trận phức
(các phần tử là những số phức):
a
11
a21
A
an1
a12
a22
an 2
a1n
a2 n
ann
j
aii
.
Ri
Hình 1.1. Minh họa định lý 1.1
luôn tồn tại một chỉ số i=1,2,…,n sao cho sk nằm trong đường tròn
tâm aii bán kính Ri=aii+…..+aii-1+aii+1+….ain (hình 1.1)tức là:
n
s k aii Ri aij
j 1
j 1
Định lý 1.2 (Hệ quả Gerschgorin): Ký hiệu
n
Ri aij
. Vậy thì hệ
j 1
j 1
(1.1) với aijR sẽ ổn định nếu aii+Ri<0 với mọi i = 1, 2,…,n.
Định lý 1.3. Hệ (1.1) ổn định BIBO khi và chỉ khi nó ổn định tiệm cận
Lyapunov, tức là khi và chỉ khi các qũy đạo trạng thái tự do có hướng tiến
về gốc toạ độ và kết thúc tại đó.
Định lý 1.4 (Lyapunov): Nếu tồn tại hàm V(x), thoả mãn các điều kiện:
a) Khả vi, xác định dương, tức là V(x)>0 với x≠0 và V(x)=0 x = 0
b)
dV
dV
0, với
dt
dt
là đạo hàm của V(x) dọc theo qũy đạo trạng thái tự do.
thì hệ sẽ ổn định tiệm cận Lyapunov tại 0 (ổn định BIBO). Hàm V(x)
khi đó được gọi là hàm Lyapunov. Nói cách khác, hệ ổn định tiệm cận tại 0
nếu nó có hàm Lyapunov.
Định lý 1.5 (Hệ quả Lyapunov): Cho một hệ tuyến tính mô tả bởi mô
hình trạng thái (1.1). Hệ sẽ ổn định nếu một trong hai điều sau được thoả mãn:
a) Tồn tại ma trận vuông P Rn xn xác định dương sao cho ma trận
PA AT P xác định âm, tức là PA AT P xác định dương.
b) Tồn tại một ma trận đối xứng, xác định dương Q sao cho phương
trình
6
PA A P Q
(1.4)
T
có nghiệm P cũng đối xứng, xác định dương. Phương trình (1.4) có
tên gọi là phương trình Lyapunov.
Cuối cùng, và cũng để việc sử dụng định lý 1.5 được thuận tiện, thì
định lý của Sylvester cho sau đây như một công cụ xác định tính xác định
dương của một ma trận đối xứng cho trước.
Định lý 1.6 (Sylvester): Cần và đủ để ma trận vuông, đối xứng:
q
11
q21
Q
qn1
q1n
q2 n
,
qnn
q12
q22
qn 2
qik qki
xác định dương là các ma trận đường chéo của nó có định thức
dương:
q11 0,
q
11
det
q21
q12
0,
q22
q
11
det q21
q31
q12
q22
q32
q13
q23 0,....
q33
Tất nhiên rằng định lý Sylvester nêu trên cũng được sử dụng để xác
định tính xác định âm của một ma trận Q bằng cách kiểm tra xem ma trận Q có xác định dương hay không. Nếu -Q xá định dương thì Q xác định âm.
1.3. Phân tích tính điều khiển được
1.3.1. Khái niệm điều khiển được và điều khiển được hoàn toàn
Định nghĩa 1.1. Một hệ thống tuyến tính, liên tục được gọi là điều
khiển được nếu tồn tại ít nhất một tín hiệu điều khiển đưa được nó từ một
điểm trạng thái ban đầu x0 (tuỳ ý) để được gốc tọa độ 0 trong khoảng thời
gian hữu hạn.
1.3.2. Các tiêu chuẩn xét tính điều khiển được cho hệ tham số hằng
Xét hệ tuyến tính tham số hằng mô tả bởi:
dx
A x Bu
dt
với
A R nxn ; B R nxm
(1.5)
7
1. Tiêu chuẩn Hautus
Định lý 1.7. (Hautus): Cần và đủ để hệ tuyến tính (1.5) điều khiển được
là:
Rank(sI - A,B) = n với mọi
s C
2. Tiêu chuẩn Kalman
Định lý 1.8. (Kalman): Cần và đủ để hệ tuyến tính (1.5) điều khiển
được là:
Rank (B, AB,…..An-1B)=n
1.4. Phân tích tính quan sát được
1.4.1. Khái niệm quan sát được và quan sát được hoàn toàn
Định nghĩa 1.2. Một hệ thống có tín hiệu vào u(t) và tín hiệu ra y(t)
được gọi là:
a) Quan sát được tại thời điểm t0, nếu tồn tại ít nhất một giá trị hữu
hạn T>t0 để điểm trạng thái x(t) = x0 xác định được một cách chính xác
thông qua vector các tín hiệu vào ra u(t), y(t) trong khoảng thời gian [t0, T].
b) Quan sát được hoàn toàn tại thời điểm t0, nếu với mọi T>t0, điểm
trạng thái x0 = x(t0) luôn xác định được một cách chính xác từ vector các
tín hiệu vào ra u(t), y(t) trong khoảng thời gian [t0, T].
Chú ý: Yêu cầu phải đo trong khoảng thời gian hữu hạn là rất quan
trọng. Khoảng thời gian quan sát càng ngắn sẽ càng tốt cho công việc điều
khiển sau này. Nếu thời gian quan sát quá lớn, điểm trạng thái x0 vừa xác
định được sẽ mất ý nghĩa ứng dụng cho bài toán điều khiển, ví dụ khi có
được x0 thì có thể hệ đã chuyển đến một điểm trạng thái mới cách rất xa
điểm trạng thái x0.
1.4.2. Một số kết luận chung về tính quan sát được của hệ tuyến tính
Một cách tổng quát, sau đây ta sẽ xét hệ tuyến tính có thể không
dừng với:
d x
A(t ) x B(t )u
dt
y C t x Dt u
(1.10)
8
trong đó A(t ) R nn , B(t ) R nm , C (t ) R rn ,
phần tử có thể là hàm số phụ thuộc t.
D(t ) R r m
là những ma trận có
Định lý 1.9. Hệ không dừng (1.10) sẽ
a) Quan sát được tại t0 khi và chỉ khi tồn tại ít nhất một giá trị T>t0
hữu hạn sao cho các vector cột của ma trận C(t)(t-t0) độc lập tuyến tính
trong khoảng thời gian t0 tt0, các
vector cột của ma trận C(t)(t-t0) độc lập tuyến tính trong khoảng thời gian t0
tt0 hữu hạn sao cho các vector cột của C (t t0 ) không phụ
thuộc tuyến tính trên tòn khoảng [t0, T1]. Vì C là ma trận hằng nên
(t t0 ) là thành phần duy nhất phụ thuộc t trong tích C(t t0 ) . Do (t t0 )
không suy biến với mọi t (định lý 3.12 – Lý thuyết điều khiển nâng cao,
Nguyễn Doãn Phước tr263) nên điều này cũng đúng với mọi khoảng [t0,
T1], trong đó T là số tuỳ ý lớn hơn t0.
Định lý 1.11: Nếu hệ không dừng (1.10) quan sát được tại thời điểm
t0 thì nó cũng quan sát được mọi thời điểm t0
1.4.3. Tính đối ngẫu và các tiêu chuẩn xét tính quan sát được của hệ
tham số hằng
Cho hệ tuyến tính, tham số hằng mô tả bởi:
d x
A x Bu
dt
y C x Du
với
A R n n , B R n m , C R r n , D R r m
(1.12)
Một hệ tuyến tính khác được suy ra từ hệ trên với mô hình:
d x
AT x C T u
dt
y BT x DT u
(1.13)
được gọi là hệ đối ngẫu với hệ (1.12) đã cho.
Có thể thấy ngay được là từ là ma trận truyền đạt của hệ (1.12):
G(s) C (sI A) B D
9
ta cũng có ma trận truyền đạt GT(s)cho hệ đối ngẫu (1.13) với nó.
Định lý 1.12: Hệ tham số hằng (1.12) quan sát được khi và chỉ khi
hệ (1.13) đối ngẫu với nó điều khiển được.
Định lý 1.13: Cho hệ tham số hằng (1.12). Các phát biểu sau là
tương đương:
a) Hệ quan sát được.
b)
c)
sI A
n
Rank
C
với mọi s, và I là ma trận đơn vị (Hautus, 1969).
C
CA
Rank
n
n 1
CA
(Kalman, 1969).
10
Chương 2.
THIẾT KẾ BỘ ĐIỀU KHIỂN PHẢN HỒI TRẠNG THÁI TỐI ƯU
2.1. Phương pháp biến phân
2.1.1. Nội dung phương pháp
Biến phân là một phương pháp được xây dựng từ điều kiện cần
phải có của nghiệm tối ưu u(t) của bài toán tối ưu động, liên tục, có
khoảng thời gian T xác định, cho trước và không bị ràng buộc bởi điều
kiện U, hoặc nếu có bị ràng buộc thì tập U của các (vector) tín hiệu điều
khiển thích hợp phải là một tập hở.
Ý tưởng chính của biến phân có thể được tóm tắt như sau:
- Từ giả thiết u(t) là tín hiệu điều khiển tối ưu, x(t) là quỹ đạo trạng
thái tối ưu, người ta xây dựng một tín hiệu điều khiển khác có một sai lệch
nhỏ so với nó là:
(2.1)
u~(t ) u(t ) u (t ) , trong đó: u (t ) là rất nhỏ.
Và xem u~(t ) chưa phải là tín hiệu tối ưu.
- Tiếp theo, người ta giả thiết quỹ đạo trạng thái ~x (t ) do u~(t ) tạo ra
cho hệ thống cũng chỉ có một sai lệch rất nhỏ so với quỹ đạo trạng thái tối
ưu x(t ) , tức là: ~x (t ) x(t ) x (t ) cũng có x (t ) rất nhỏ.
(2.2)
- Cuối cùng, từ điều kiện phải có của tín hiệu điều khiển tối ưu:
Q(x, u) Q( ~x , u~)
(2.3)
Người ta xác định tính chất của điều khiển tối ưu u(t), gọi là tính
chất biến phân.
Cho hệ có mô hình:
dx
A x Bu ,
dt
A Rnxn, B Rnxm
(2.4)
Xét bài toán tìm bộ điều khiển R tĩnh, phản hồi trạng thái để điều
khiển đối tượng (2.4). Mục đích của phương pháp thiết kế bộ điều khiển R
sao cho sau khi bị nhiễu đánh bật ra khỏi điểm cân bằng (hoặc điểm làm
việc ) đến một điểm trạng thái x0 nào đó, bộ điều khiển R sẽ kéo được hệ
từ x0về toạ độ 0 (hay điểm làm việc cũ) và trong quá trình trở lại này sự
tổn hao năng lượng, đánh giá bởi phiếm hàm mục tiêu:
Q x, u
1
T
T
( x E x u F u )dt min
20
(2.5)
11
Giả sử u(t) là tín hiệu điều khiển được tạo ra bởi R đã thoả mãn điều
kiện tối ưu (2.5), tức là trong số tất cả các tín hiệu u~(t ) đưa hệ từ x0 về gốc
toạ độ 0 thì u(t) sẽ là vector tín hiệu mà:
Qu
1
1
T
T
T
T
( x E x u F u )dt Qu~ ( x E ~
x u~ F u~)dt
20
20
(2.6)
Bây giờ ta xét đáp ứng của đối tượng với một tín hiệu khác có sai
lệch nhỏ u so với u(t), tức là ứng với u~(t ) u(t ) u (t ) . Gọi ~x (t ) x(t ) x (t ) là
quỹ đạo trạng thái tương ứng của đối tượng cũng đi từ x0 về gốc toạ độ 0
khi được kích thích bởi u~(t ) . Vậy thì:
dx
Ax B x
dt
và
d x x
A( x x ) B(u u )
dt
Suy ra:
d x
A x B u
dt
Ngoài ra, do quỹ đạo
giống như x(t) nên
d x
A x B u 0
dt
~
x (t ) x(t ) x (t ) cũng
(2.7)
đi từ x0 về gốc toạ độ 0
x (0) x () 0
(2.8)
Tiếp theo, ta xét ảnh hưởng của sự biến phân u(t) thành
với giá trị của phiếm hàm mục tiêu:
u(t ) u (t ) đối
1
T
Q Q Qu u ( x x )T E x x u u F u u dt
20
Trừ vế với vế của (2.8) và (2.6) được:
0 Q Qu u Qu
1
T
T
T
T
T
T
x E x x E x x E x u F u u F u u F u dt
2 0
x E x u F u dt
T
T
(2.9)
0
vì E, F là hai ma trận đối xứng và do u , x <<0 nên ( Tx E x uT F u ) 0.
12
Để kết hợp được điều kiện biên (2.7) với (2.9) ta tạo ra tích vô hướng
của vector 0 trong (2.7) bằng cách nhân hai vế của nó với một vector pT bất
kỳ:
T d x
p (
A x B u ) 0
(2.10)
dt
rồi cộng với (2.9) sẽ được:
d
Q xT E x u T E u pT ( x A x B u ) dt
dt
0
(tích phân toàn phần)
T
dp
T
T
T
T
p x ( p B u F ) u (
p A x E ) x dt
dt
0
0
T
T
dp
T
T
T
T
( p B u F ) u (
p A x E ) x dt
dt
0
Nếu như trong vô số các vector pT thoả mãn (2.10) ta chọn:
dp
dt
( p A x E )T AT p E x
T
T
và sử dụng ký hiệu hàm Hamilton:
1 T
T
T
H p ( Ax Bu ) ( x E x u F u )
2
(2.11)
H
u dt
u
0
Q
thì
trong đó
H
u
(2.12)
là ký hiệu chỉ ra ma trận Jacobi của H, tức là:
H
H
H
(
,......,
)
u
u1
ur
Chú ý: Ký hiệu đạo hàm được sử dụng là đạo hàm Jacobi:
T
d ( L x)
d ( x L) T
L,
L
dx
dx
Từ (2.10) và (2.12) ta có các tính chất của tín hiệu điều khiển tối ưu
như sau:
Định lý 2.1: Nếu u(t) là tín hiệu điều khiển tối ưu thì tín hiệu đó phải
thoả mãn:
H
T
0
u
13
trong đó H là hàm Hamilton định nghĩa theo (2.11). Ngoài ra, cùng
với ký hiệu của hàm Hamilton thì:
T
d x H
dt p
T
H
dt
x
dp
,
và chúng được gọi là phương trình Euler - Lagrange.
Định lý 2.2: Nếu u(t) là tín hiệu điều khiển tối ưu thì tín hiệu đó phải
thoả mãn:
u(t) = F-1BTp(t)
2.1.2. Ứng dụng phương pháp biến phân để thiết kế bộ điều khiển
phản hồi trạng thái tối ưu
1. Thiết kế bộ điều khiển LQR phản hồi dương.
Thuật toán tìm bộ điều khiển R, tối ưu theo nghĩa (2.14), phản hồi
dương trạng thái, gồm hai bước như sau:
1) Xác định ma trận K đối xứng, xác định âm là nghiệm của phương
trình Riccati (2.13). Ma trận K xác định âm khi và chỉ khi ma trận -K
xác định dương.
2) Xác định R từ K theo (2.14).
2. Thiết kế bộ điều khiển LQR phản hồi âm
Thuật toán tìm bộ điều khiển R tối ưu được sửa đổi lại cho nguyên lý
phản hồi âm gồm hai bước như sau:
1) Xác định ma trận L đối xứng, xác định dương là nghiệm của phương
trình Riccati (2.16)
2) Xác định R từ L theo (2.15)
3 3
3 , 5
R F 1BT L 0 , 1
3
5
3. Các phương pháp tìm nghiệm của phương trình Riccati trực tiếp
a. Phương pháp MacFarlane – Potter
14
b. Phương pháp Kleinman.
2.2. Nguyên lý cực đại
2.2.1. Điều kiện cần
2.2.2. Điều kiện hoành (Điều kiện trực giao)
2.3. Phương pháp quy hoạch động
2.3.1. Nội dung phương pháp
Nguyên lý tối ưu của Bellman
2.3.2 Mở rộng cho hệ liên tục và phương trình Hamilton - Jacobi - Bellman
15
Chương 3
THIẾT KẾ BỘ ĐIỀU KHIỂN TỐI ƯU NGẪU NHIÊN ĐỘNG
3.1. Bộ lọc Wiener
3.1.1.Mục đích của bộ lọc
n(t)
u0(t)
u(t)
G(s)
y(t)
Hình 3.1. Bộ lọc Winner
y(t) = u0(t)
Do tín hiệu nhiễu n(t) không có cùng nguồn phát như u0(t) nên ở đây
ta có thể xem chúng là không tương quan với nhau. Nếu có thêm giả thiết
nhiễu n(t) có giá trị trung bình (kỳ vọng) bằng 0, thì khi đó sẽ có:
S j Su ( j ) S n ( j )
=> u
ru n 0
0
Su0 ( j ) Suu0 ( j )
0
Nhiệm vụ của bộ lọc là tạo ra tín hiệu y(t) ở đầu ra giống như tín hiệu
không bị lẫn nhiễu u0(t) ở đầu vào. Đánh giá cho sự sai khác giữa y(t) và
u0(t) là hàm sai lệch:
e(t ) y(t ) u0 (t ) g ( )u (t )d u 0 (t )
0
Trong đó g(t) là hàm trọng lượng của bộ lọc, tức là hàm có ảnh Laplace là
G(s)
Nếu ta đơn thuần chỉ lập hàm đo chất lượng của bộ lọc theo
~
Q e2 (t )dt
(3.1)
0
thì rõ ràng Q~ không những phụ thuộc vào g(t) cần phải xác định mà còn
phụ thuộc cả vào tín hiệu nhiễu n(t) có lẫn trong u(t), tức là Q~ = Q~( g , n) . Vì
vậy không thể hy vọng rằng thông qua việc xác định:
~
Q( g , n) min
lại có thể nhận được một hàm g(t) bất biến với nhiễu n(t).
16
Để có thể tránh được sự xuất hiện n(t) trong hàm đo chất lượng bộ
lọc, người ta đã không sử dụng (3.46) mà thay vào đó là kỳ vọng của nó:
1
Q M e (t ) lim
T 2T
2
T
e (t )dt
(3.2)
2
T
và như vậy bài toán thiết kế bộ lọc Wiener trở thành một bài toán tối ưu ngẫu
nhiên.
Do n(t) không tương quan với u0(t) nên Q được lập theo (3.47) cũng
sẽ không phụ thuộc vào n(t), tức là:
Q = Q(g)
và ta đi đến dạng chuẩn của bài toán tối ưu tìm hàm trọng lượng g(t) mô tả
bài toán thiết kế bộ lộc Wiener như sau:
1
T 2T
Q( g ) lim
T
min
e (t )dt
(3.3)
2
g P
T
trong đó P là tập hàm trọng lượng của các khâu tuyến tính và ổn định.
Nghiệm tối ưu g(t) của bài toán (3.3) được phát biểu như sau:
3.1.2. Thuật toán xác định nghiệm tối ưu của bài toán (3.3).
1) Tính mật độ phổ Su(s) của u(t), tức là tính ảnh Laplace của hàm tự
tương quan ru() của tín hiệu u(t). Trong nhiều trường hợp, khi mà chỉ biết
trước mật độ phổ Su (s) của u0(t) và Sn(s) của nhiễm n(t), thì do u0(t), n(t)
không tương quan, ta cũng có được.
0
2) Viết lại Su(s) thành:
Su(s) = A-(s) A+(s)
=>
Suu
H GA A Suu0 A GA 0
A
Trong đó A-(s) là hàm thực hữu tỷ có các điểm không và điểm cực
đều nằm bên trái trục ảo (pha cực tiểu) và A+(s) là hàm thực - hữu tỷ có
các điểm không và điểm cực nằm bên phải trục ảo.
3) Tính tỷ số:
R s
Suu0 ( s)
A ( s)
17
Trong đó Suu (s) là ảnh Laplace của hàm hỗ tương quan uu ( ) giữa
u(t) và u0(t). Nếu thay vì Suu (s) ta chỉ có Su (s) của u0(t) thì do tính không
tương quan giữa u0(t), n(t) ta cũng sẽ có Suu (s) = Su (s) .
0
0
0
0
0
0
4) Tách R(s) thành:
R(s) = B-(s) + B+(s) => H = A+ (GA--B--B+)
Trong đó B-(s) là hàm bền (giải tích trong nửa mặt phẳng phức bên
phải) và B+(s) là hàm giải tích trong nửa mặt phẳng phức bên trái, tức là có
các điểm cực nằm bên phải trục ảo (hàm phản bền).
5) Chọn:
B ( s)
G s
A ( s)
tức là chọn G(s) sao cho GA--B--B+=-B+, để được H(s) = -A+(s)B+(s) là
hàm phản bền.
3.2. Bộ quan sát trạng thái Kalman (lọc Kalman)
3.2.1. Mục đích của bộ quan sát
3.2.2. Thuật toán xác định bộ quan sát trạng thái Kalman.
1) Giải bài toán tối ưu (3.16) để có được ma trận R = LT là bộ điều
khiển tối ưu phản hồi âm trạng thái (bộ điều khiển LQR cho đối tượng đối
ngẫu). Các ma trận Nx, Ny được xác định từ nhiễu nx(t), ny(t) theo công
thức (3.9), (3.11) trong đó Nx phải là ma trận xác định bán dương và Ny
phải xác định dương. Ở nhiều bài toán ứng dụng thực tế, khi mà thông tin
ban đầu về nhiễu nx(t), ny(t) quá ít để có thể xác định được cụ thể Nx, Ny
người ta thường hay chọn chúng là những ma trận đơn vị có số chiều phù
hợp với số chiều của x và u .
2) Gán L tìm được vào công thức (3.11) để có hoàn chỉnh mô hình bộ
quan sát trạng thái cho đối tượng (3.8).
18
Chương 4
XÂY DỰNG THUẬT TOÁN THIẾT KẾ BỘ ĐIỀU KHIỂN
PHẢN HỒI TÍN HIỆU RA
4.1. Nội dung bộ điều khiển
Cho đối tượng tuyến tính tham số hằng bị tác động bởi nhiễu ồn
trắng nx(t) vào hệ thống và ny(t) ở đầu ra, mô tả bởi mô hình trạng thái:
d x
A x Bu n x
dt
y C x Du n y
Hãy thiết kế bộ điều khiển phản hồi tín hiệu ra sao cho hệ được ổn
định tối ưu theo nghĩa khi bị một tác động không mong muốn đánh bật ra
khỏi điểm cân bằng (điểm làm việc), bộ điều khiển đó sẽ đưa được hệ quay trở
về điểm cân bằng cũ (điểm làm việc cũ) và chi phí cho quá trình quay về đó
tính theo:
1
T
T
Q ( x E x u F u ) dt
20
đạt giá trị nhỏ nhất.
Bài toán trên được gọi là bài toán thiết kế bộ điều khiển LQG (Hay là
điều khiển đối tượng bền vững với nhiễu).
Giữa bài toán thiết kế bộ điều khiển LQG và bộ điều khiển LQR có
hai điểm khác rất cơ bản. Đó là:
- Bộ điều khiển là phản hồi tín hiệu ra, chứ không phải phản hồi trạng
thái
- Đối tượng có nhiễu tác động cả vào hệ thống lẫn đầu ra.
Vì tín hiệu ra không mang đầy đủ thông tin động học của đối tượng, nên
để bộ điều khiển LQG đem lại chất lượng điều khiển mong muốn thì hệ
tuyến tính phải thõa mãn nguyên lý tách được để bộ điều khiển là sự kết
hợp của hai bộ điều khiển: Bộ điều khiển phản hồi trạng thái và bộ điều
khiển phản hồi đầu ra.
4.2. Nguyên lý tách được
4.3. Thuật toán thiết kế bộ điều khiển phản hồi tín hiệu ra.
Khi hệ tuyến tính thoả mãn nguyên lý tách được thì bài toán thiết kế
bộ điều khiển phản hồi tín hiệu ra LQG sẽ chuyển được về bài toán thiết kế
bộ điều khiển phản hồi trạng thái LQR. Nói cách khác, bộ điều khiển LQG
19
sẽ được thiết kế gồm một bộ điều khiển tối ưu phản hồi trạng thái LQR và
một bộ quan sát trạng thái Kalman mắc nối tiếp nhau như mô tả ở hình 4.1.
Ta đi đến thuật toán thiết kế bộ điều khiển LQG với các bước sau:
1) Thiết kế bộ điều khiển tối ưu RLQR phản hồi (âm) trạng thái x(t),
tức là bộ điều khiển LQR, cho bài toán:
d x
dt A x Bu
Q 1 ( xT E x uT F u )
min
u
2 0
(4.1)
bằng thuật toán đã trình bày tại chương II. Nói cách khác là phải tính:
R:LQR F 1BT L
trong đó L là nghiệm xác định bán dương của phương trình đại số Riccati
L BF 1BT L AT L L A E
Điều kiện để bài toán này có nghiệm là E xác định bán dương và F
xác định dương. Chú ý rằng bộ điều khiển phản hồi trạng thái LQR tìm
được như trên chưa đảm bảo chắc chắc làm ổn định đối tượng (4.1) vì nó
đã được thiết kế theo phương pháp biến phân cho bài toán tối ưu (4.1) có
điểm trạng thái cuối xT tuỳ ý. Nhưng vì ở đây có khoảng thời gian xảy ra
quá trình tối ưu T = nên theo định lý Barbalas ta cũng phải có:
lim x E x u F u 0
t T
T
T
lim x E x lim u F u 0
lim x E x 0
T
t T
T
t T
T
t T
và
lim u F u 0
T
t T
Vì F là ma trận xác định dương. Vậy điểm cuối xT phải là điểm cân
bằng của hệ kín. Điểm cân bằng này sẽ là gốc toạ độ (và khi đó hệ kín sẽ
ổn định) nếu E cũng là ma trận xác định dương hoặc hệ kín chỉ cân bằng
duy nhất tại gốc toạ độ. Để kiểm tra xem hệ kín có cân bằng duy nhất tại
gốc 0 hay không, ta chỉ cần kiểm tra xem ma trận hệ thống A-BRLQR có khả
nghịch hay không là đủ, tức là:
det A BR:LQR 0
xT=0
2) Thiết kế bộ quan sát trạng thái Kalman để có được trạng thái xấp
xỉ gần đúng từ các tín hiệu đo được u(t), y(t) làm tín hiệu đầu vào cho bộ
20
- Xem thêm -