ĐẠI HỌC QUỐC GIA TP. HCM
TRƯỜNG ĐẠI HỌC BÁCH KHOA
FOG
BÁO CÁO TỔNG KẾT KẾT QUẢ
ĐỀ TÀI KHCN CẤP TRƯỜNG
Tên đề tài:
NGHIÊN CỨU ĐIỀU KHIỂN NHÓM ROBOT NHỎ
DI CHUYỂN THEO ĐỘI HÌNH TRONG MÔI TRƯỜNG PHỨC TẠP
Mã số đề tài: T-CK-2012-01
Thời gian thực hiện: 2/2012 – 2/2013
Chủ nhiệm đề tài: Trần Việt Hồng
Cán bộ tham gia đề tài:
- TS. Lê Thanh Hải
- TS. Nguyễn Quốc Chí
- KS. Trương Quốc Toàn
Thành phố Hồ Chí Minh – Tháng 2/2013
Danh sách các cán bộ tham gia thực hiện đề tài
(Ghi rõ học hàm, học vị, đơn vị công tác gồm bộ môn, Khoa/Trung tâm)
TT SHCC
Họ tên
Học hàm,
học vị
Tiến sĩ
Bộ môn Cơ điện tử, Khoa Cơ khí
Cơ quan đang công tác
1.
0.2338
Nguyễn Quốc Chí
2.
1.3341
Lê Thanh Hải
Tiến sĩ
Bộ môn Cơ điện tử, Khoa Cơ khí
3.
1.3160
Trương Quốc Toàn
Kỹ sư
Bộ môn Cơ điện tử, Khoa Cơ khí
1
MỤC LỤC
Danh sách các cán bộ tham gia thực hiện đề tài ............................................................. 1
Mục lục............................................................................................................................ 2
I. Giới thiệu .................................................................................................................... 3
II. Các kết quả đã đạt được ............................................................................................ 3
III. Các kết quả mới, nổi bật ......................................................................................... 14
IV. Kết luận và kiến nghị ............................................................................................. 15
V. Tài liệu tham khảo.................................................................................................... 16
VI. Báo cáo kinh phí đã chi .......................................................................................... 17
2
I. Giới thiệu
Trong những năm gần đây, điều khiển các hệ thống đa tác tử, hệ thống nhiều robot là
một chủ đề rất thú vị thu hút được sự quan tâm của nhiều nhà nghiên cứu, một phần là
do nó có tầm ứng dụng rất rộng. Nhiều hệ thống bầy đàn như vịt trời bay di trú, người
lính chiến đấu trên chiến trường, cầu thủ đá bóng, hay các robot khi thực hiện một
nhiệm vụ sẽ tập hợp thành một đội hình và cùng nhau xử lý (Xu, 2008). Trong thực tế,
hoạt động theo đội hình giúp ích rất nhiều cho các hệ thống hoạt động trong môi
trường không biết trước và thực hiện một nhiệm vụ bằng nhiều robot đơn giản sẽ giảm
thiểu nguồn lực và linh hoạt hơn so với thực hiện bằng chỉ một robot duy nhất. Hình 1
thể hiện một ứng dụng của điều khiển đội hình robot trong việc di chuyển trong môi
trường phức tạp, trong đó ba nhiệm vụ cơ bản cần điều khiển là thành lập đội hình, giữ
nguyên đội hình khi di chuyển và tránh vật cản.
Hình 1. Các nhiệm vụ cơ bản trong quá trình di chuyển của đội hình robot.
Các hướng nghiên cứu điều khiển đội hình bao gồm các phương pháp tiếp cận sau: dựa
vào cách ứng xử tình huống, dựa vào biểu đồ, dẫn đường- theo đuôi, trường thế, mô
phỏng sinh học, cấu trúc ảo và trí thông minh bầy đàn ((Reynolds, 1987), (Wang,
1991), (Barnes, 2009), (Warburton, 1991), (Lewis, 1997), (Desai, 2002), (Gerasimos,
2008)). Trong đó, dẫn đường-theo đuôi là cách tiếp cận thường được sử dụng nhất do
dễ hiểu và dễ thực hiện, nên nó có phạm vi ứng dụng rất lớn.
II. Các kết quả đã đạt được
Bài toán cần giải quyết được phát biểu như sau: điều khiển một nhóm n robot vừa di
chuyển theo một robot dẫn đầu nhóm R0 (robot này di chuyển theo một quĩ đạo định
trước) vừa giữ hình dạng của một đội hình nhất định.
3
Hình 2. Đội hình 4 robot: (a) Hình thoi theo cấu hình SLR, (b) Hình zigzag theo cấu
hình SLR, và (c) Hình thoi theo cấu hình TLR.
Hình 2 mô tả một ví dụ về đội hình hình thoi và đội hình hình zigzag với 4 robot và
mối quan hệ của các robot trong đội hình theo cấu hình SLR và TLR. Trong cấu hình
SLR, ngoại trừ R0, mỗi robot Ri (gọi là robot theo đuôi) sẽ đi theo một robot Rj (i≠j, gọi
là robot dẫn đường) và cố gắng giữ một khoảng cách và một góc nhất định với Rj. Ví
dụ R1 đi theo R0 phải luôn đảm bảo khoảng cách từ nó tới R0 là d1 và góc lệch giữa
hướng di chuyển của nó và phương nối giữa nó và R0 là ϕ1. Trong cấu hình TLR, ngoại
trừ R0 và R1, mỗi robot theo đuôi Ri sẽ đi theo hai robot Rj và Rk (i≠j≠k). Ví dụ như ở
Hình 2c, R2 phải luôn đảm bảo khoảng cách tới R0 là d20, khoảng cách tới R1 là d21 và
góc lệch giữa hướng di chuyển của nó và phương nối giữa nó và R0 là ϕ2. Như vậy,
định nghĩa đội hình rất linh hoạt, vì một robot có nhiều cách chọn robot dẫn đường của
nó, và việc thay đổi đội hình cũng rất đơn giản và nhanh chóng. Ưu điểm này sẽ được
áp dụng trong phần tránh vật cản ở dưới.
II.1 Mô hình robot
Đề tài giải quyết bài toán điều khiển theo đội hình cho các robot có hai bánh dẫn động
và một bánh tự lựa di chuyển trong môi trường 2D. Mô hình cho robot là mô hình
nonholonomic:
⎡ x& i ⎤ ⎡cos θi
⎢ y& ⎥ = ⎢ sin θ
i
⎢ i⎥ ⎢
⎢⎣ θ& i ⎥⎦ ⎢⎣ 0
0⎤
⎡v ⎤
0 ⎥⎥ ⎢ i ⎥
ω
1 ⎥⎦ ⎣ i ⎦
(1)
Trong đó vi là vận tốc dài, ωi là vận tốc góc của robot, θi là phương di chuyển của robot
(nghĩa là góc giữa hướng di chuyển và trục x), và (xi,yi) là tọa độ trọng tâm của robot.
4
II.2 Nguyên tắc điều khiển trong cấu hình SLR
Hình 3. Nguyên tắc điều khiển trong cấu hình SLR
Trên hình 3, Ri là robot dẫn đường và Rk là robot theo đuôi. dki là khoảng cách thực tế
(hiện tại) giữa Ri và Rk, ϕki là góc thực tế (hiện tại) giữa hướng di chuyển của Rk và trục
dki (trục nối giữa Ri và Rk). dk 0 và ϕk 0 lần lượt là khoảng cách giữa Ri và Rk và góc giữa
hướng di chuyển của Rk và trục dki mà ta mong muốn đạt tới (để lập được đội hình).
Mục tiêu điều khiển 1: Cho vi(t) và ωi(t), hãy tìm vk(t) và ωk(t) cho cấu hình SLR sao
cho:
dki → dk 0 , ϕki → ϕk 0 , ∆θk → 0 khi t → ∞, i = 0, n − 1, k = 1, n , ϕk 0 ≤
π
2
(2)
với ∆θk = θk − θi là độ lệch hướng giữa hai robot
Dựa trên cấu hình và các định nghĩa trên, ta có các phương trình động học của hệ thống
là:
∆θ& k = ωk − ωi
(3)
d&ki = − vk cos ϕki + vi cos ( ϕki + ∆θk )
(4)
ϕ& ki = −ωk + vk
sin ( ϕki + ∆θk )
sin ϕki
− vi
dki
dki
(5)
Để giải bài toán này ta dùng “robot theo đuôi ảo”, tức là đặt một robot ảo tại điểm
M(xkm,ykm) (xem hình 3) có khoảng cách đến robot dẫn đường thật ( AM ) là dk0 và góc
giữa hướng của robot theo đuôi ảo với trục nối hai robot (đường AM) là ϕk0. Tọa độ
của điểm M:
⎡ x km ⎤ ⎡ x i ⎤ ⎡− cos ( θk + ϕk 0 ) ⎤
⎢ y ⎥ = ⎢ y ⎥ + ⎢ − sin θ + ϕ ⎥ dk 0
( k k0 ) ⎦
⎣ km ⎦ ⎣ i ⎦ ⎣
(6)
Mục tiêu điều khiển bây giờ trở thành điều khiển robot theo đuôi Rk tại vị trí (xk,yk)
bám theo để đạt đến vị trí của robot theo đuôi ảo (xkm,ykm) trong khi robot Ri di chuyển.
5
II.3 Giải pháp đề xuất
II.3.1 Nguyên tắc điều khiển trong cấu hình TLR
Hệ thống n robot vẫn giống như trong cấu hình SLR, tuy nhiên, robot Rk bây giờ sẽ
phải đồng thời đi theo hai robot dẫn đường để đảm bảo rằng hai khoảng cách giữa Rk
với Ri và Rk với Rj lần lượt là dk0 và lk0, và một góc giữa hướng của Rk với trục dki là
ϕk0. Robot Ri được gọi là robot dẫn đường chính và Rj là robot dẫn đường phụ cho
robot theo đuôi Rk.
Tương tự như trên, ta cũng dùng “robot theo đuôi ảo”. Như trên hình 4, ba robot hiện
tại đang ở tại các vị trí A, B, và C. Theo như định nghĩa của đội hình robot thì ba robot
phải ở các vị trí là A, E, và D (dj0 = AE, dk0 = AD, lk0 = DE). Ta định nghĩa một tam
giác ∆AMN, tìm được bằng cách xoay tam giác ∆ADE một góc ψ để cạnh AE của
∆ADE luôn luôn nằm trùng với trục dji. Bây giờ robot theo đuôi ảo của Rj sẽ nằm tại E
và robot theo đuôi ảo của Rk sẽ nằm tại M.
Hình 4. Nguyên tắc điều khiển trong cấu hình TLR
Mục tiêu điều khiển sẽ được định nghĩa lại như sau: robot Rj được điều khiển tiến tới E
(điểm N sẽ tiến tới trùng với E) và robot Rk được điều khiển tiến tới M (khi N ≡ E thì
M ≡ D).
Mục tiêu điều khiển 2: Cho vi(t) và ωi(t), hãy tìm vk(t) và ωk(t) cho cấu hình TLR sao
cho:
dki → dk 0 , ϕki → ϕkm ,
∆θk → 0 khi t → ∞, i = 0, n − 1,
k = 2,n.
(7)
Điểm đáng lưu ý là so với mục tiêu của cấu hình SLR, sự khác biệt duy nhất là mục
tiêu của ϕki trong SLR là một hằng số ϕk0, trong khi ở cấu hình TLR thì mục tiêu của
ϕki là một giá trị động ϕkm. Như vậy luật điều khiển trong cấu hình TLR sẽ mang tính
tổng quát hơn, bao gồm cả luật điều khiển cho cấu hình SLR (chỉ việc thay ϕkm bằng
ϕk0).
6
II.3.2 Luật điều khiển đề xuất
Hình 5. Các thông số chi tiết trong cấu hình TLR
Mục tiêu điều khiển sẽ là làm cho điểm C tiệm cận điểm M trong khi M di chuyển theo
A. Sự di chuyển C→M chiếu vuông góc lên trục (dk0) tương ứng là sự di chuyển F→M
và thành phần vận tốc tương đối giữa vk và vi trên trục (dk0) sẽ tạo nên điều đó. Vì thế ta
có:
vk cos ( ϕkm ) − vi cos ( ϕkm + ∆θk ) = k1 ⎡⎣ dki cos ( ϕki − ϕkm ) − dk 0 ⎤⎦
(8)
trong đó k1 là một hằng số dương.
Tiếp theo xét trên trục (ak) là trục vuông góc với vk, tương tự như trên, vận tốc góc ωk
và vận tốc dài vi sẽ gây ra sự thay đổi vận tốc trên trục này tương ứng với sự di chuyển
C→G.
( ωk + ωi ) dki cos ( ϕkm ) = k1 ⎡⎣dki cos ( ϕki ) − dk 0 sin ( ϕkm )⎤⎦ − vi sin ( ∆θk )
(9)
Các phương trình trên và cả các công bố khoa học khác đều có điểm giống nhau là cần
phải đo được vận tốc tuyệt đối của robot dẫn đường vi. Điều này khá khó khăn vì hai
robot đang di chuyển tương đối với nhau. Ngoài ra, cũng rất khó đo ωi.
Ý tưởng trong đề tài này là xây dựng giải thuật điều khiển không cần biết giá trị chính
xác của vi và ωi mà chỉ cần bù lại những sai lệch do sự thay đổi của vi và ωi gây ra, dựa
trên phân tích động học (Hình 5). Khi xét Rk trong hệ qui chiếu Ri sẽ có một vận tốc –vi
tác động lên Rk. Giả sử vi tại thời điểm t thay đổi thành vi +∆vi tại thời điểm t+∆t, ta sẽ
đưa vào trong luật điều khiển của Rk một thành phần ∆v bù lại sự thay đổi đó của vi.
Đây là sự thay đổi của vận tốc trong một đơn vị thời gian nên ý nghĩa của nó là ta sẽ
xấp xỉ gia tốc tịnh tiến tức thời như sau:
( )
(
)
(
)
v& a = k2 sgn ⎡⎢cos 2θ ⎤⎥ ⎡⎢dki cos ϕki + ∆θ − dk 0 cos ϕkm + ∆θ ⎤⎥
i ⎦⎣
k
k ⎦
⎣
trong đó k2 là một hệ số điều chỉnh dương khác, và va = vi + ∆v.
7
(10)
Tương tự như trên, lượng thay đổi ∆ωkm của ωkm giữa hai thời điểm t và t+∆t sẽ được
bù bằng ∆ω (thực chất là gia tốc góc của điểm tham chiếu) tính theo công thức xấp xỉ
sau:
& a = kx
ω
ex ( sin ( ∆θk ) sin ϕkm − cos ( ∆θk ) )
dk 0 cos ϕkm
− ky
ey ( cos ( ∆θk + ϕkm ) sin ϕkm + sin ( ∆θk ) )
dk 0 cos ϕkm
(11)
với kx và ky là các hệ số điều chỉnh. ex = −dk 0 sin ( ∆θk + ϕkm ) + dki sin ( ∆θk + ϕki ) ,
ey = dk 0 cos ( ∆θk + ϕkm ) − dki cos ( ∆θk + ϕki ) , và ωa = ωkm + ∆ω
Tóm lại, luật điều khiển dẫn đường – theo đuôi theo cấu hình TLR như sau:
( )
(
)
(
)
⎧ v& = k sgn ⎡cos 2θ ⎤ ⎡ d cos ϕ + ∆θ − d cos ϕ + ∆θ ⎤
2
ki
k0
km
i ⎦⎥ ⎣⎢ ki
⎪ a
k
k ⎦⎥
⎣⎢
⎪
ex ( sin ( ∆θk ) sin ϕkm − cos ( ∆θk ) )
ey ( cos ( ∆θk + ϕkm ) sin ϕkm + sin ( ∆θk ) )
⎪&
ω
=
−
k
k
a
x
y
⎪
dk 0 cos ϕkm
dk 0 cos ϕkm
⎪
⎨
cos ( ϕkm + ∆θk )
d cos ( ϕki − ϕkm ) − dk 0
⎪ vk = k1 ki
+ va
cos ( ϕkm )
cos ( ϕkm )
⎪
⎪
sin ( ∆θk )
dki cos ( ϕki ) − dk 0 sin ( ϕkm )
⎪
− va
− ωa
⎪ωk = k1
dki cos ( ϕkm )
dki cos ( ϕkm )
⎩
(12)
Công thức tuy trông phức tạp nhưng các phép toán lại rất đơn giản và các giá trị cần đo
chỉ gồm dki, ϕki, ∆θk (có thể đo dễ dàng và nhanh chóng bằng các cảm biến trên robot).
Luật điều khiển này cũng dùng cho cả cấu hình SLR, chỉ cần thay ϕkm = ϕk0 = const. và
ωa = 0.
Bổ đề 1: Giả thiết rằng sự di chuyển của robot dẫn đường Ri thỏa các điều kiện sau:
& a (t ) ∈ L2[0,∞).
vi(t)≥v0>0, v& a (t ) ∈ L2[0,∞), ωi(t) ∈ L2[0,∞),
ω
Trong luật điều khiển (12), nếu ta chọn:
⎧⎪0 < kx < k12
⎨
2
⎪⎩ −k2 s < ky < k1 − k2 s
(13)
( )
với s = sgn ⎡⎢cos 2θi ⎤⎥ thì ta sẽ có ổn định toàn cục, nghĩa là (xk,yk) → (xkm,ykm) khi
⎣
⎦
t → ∞, hay nói cách khác dki → dk0 và ϕki → ϕkm.
Chứng minh: Định nghĩa
⎡ ex ⎤ ⎡ sin θi
⎢ ⎥=⎢
⎣ ey ⎦ ⎣ cos θi
− cos θi ⎤ ⎡ xe ⎤ ⎡ sin θi
=
sin θi ⎦⎥ ⎣⎢ ye ⎦⎥ ⎣⎢ cos θi
− cos θi ⎤ ⎪⎧ ⎡ x k ⎤ ⎡ x km ⎤ ⎪⎫
−
⎨
⎬
sin θi ⎦⎥ ⎩⎪ ⎣⎢ yk ⎦⎥ ⎣⎢ ykm ⎦⎥ ⎭⎪
8
(14)
Viết lại các phương trình (3), (4) và (5) thành
⎡ cos ( ∆θk + ϕkm ) ⎤
⎡ e& x ⎤
⎡ ex ⎤
⎡0 ⎤
⎥
⎢ e& ⎥ = −k1 ⎢ e ⎥ + ∆v ⎢ ⎥ − ∆ωdk 0 ⎢
⎣1 ⎦
⎣ y⎦
⎣ y⎦
⎣ sin ( ∆θk + ϕkm ) ⎦
(15)
Chọn hàm Lyapunov như sau:
2
2
⎛
ω ⎞ ⎛
∆v ωs ⎞
1
2
+
V = ⎜ e x + c ⎟ + ⎜ ey −
⎟ + 2 ( ωs − ∆v )
k1 ⎠ ⎝
k1 k1 ⎠ k1
⎝
(16)
với ωc = ∆ωdk 0 cos ( ∆θk + ϕkm ) , and ωs = ∆ωdk 0 sin ( ∆θk + ϕkm ) .
Tính đạo hàm của V ta có:
2
⎛
ωc ⎞
kx ⎞⎛
V&
= − ⎜ k1 − ⎟⎜ ex +
⎟
2
k1 ⎠⎝
k1 ⎠
⎝
k
1 ⎛ k ky
− x3 ωc2 − 2 ⎜ s 2 +
k1
k1 ⎝ k1 k1
⎛
k ky ⎞ ⎛
∆v ωs ⎞
− ⎜ k1 − s 2 − ⎟ ⎜ ey −
+
⎟
k1 k1 ⎠ ⎝
k1 k1 ⎠
⎝
⎞
2
⎟ ( ωs − ∆v )
⎠
2
(17)
Dễ dàng nhận thấy rằng nếu các điều kiện (13) được thỏa mãn thì V& ≤ 0 , nghĩa là ex và
ey sẽ hội tụ về 0 theo hàm mũ. Do đó, luật điều khiển (12) ổn định tiệm cận theo
Lyapunov.
II.4 Giải thuật tránh vật cản
Do luật điều khiển (12) là luật chung cho cả cấu hình SLR và TLR nên đội hình robot
rất linh hoạt thay đổi để phù hợp với môi trường. Khi bất ngờ gặp vật cản thì đội hình
robot có thể chuyển qua lại giữa các loại cấu hình hoặc tạm thời thay đổi cấu trúc đội
hình để tránh được vật cản chỉ bằng một giải thuật đơn giản. Trong nghiên cứu này, ta
chỉ xét vật cản tĩnh.
Hình 6 trình bày một ví dụ đội hình robot di chuyển gặp vật cản. Cấu hình ban đầu của
đội hình là R1 → (R0), R2 → (R0, R1), R3 → (R1, R2). Khi xuất hiện vật cản trước R2, R2
bị mất kết nối với robot dẫn đường phụ R1. Khi đó R2 sẽ chọn R3 làm robot dẫn đường
thay thế cho R1. Tuy nhiên, do bản thân R2 cũng hiện đang là robot dẫn đường của R3
nên đội hình robot có thể cấu hình lại như sau: R1 → (R0), R2 → (R1, R3), R3 → (R0, R1).
Khi R2 đi vòng qua vật cản thì kết nối của nó với R3 cũng không còn nên nó phải
chuyển qua cấu hình SLR: R1 → (R0), R2 → (R0), R3 → (R0, R1), và khi đã tránh xong
vật cản nó có thể khôi phục lại cấu hình TLR như sau: R1 → (R0), R2 → (R0, R1), R3 →
(R0, R1).
9
(a)
(b)
(c)
(d)
Hình 6. Một ví dụ đội hình robot di chuyển tránh vật cản.
II.4.1 Lưu đồ giải thuật
Hình 7 thể hiện lưu đồ giải thuật điều khiển theo mô hình TLR có kèm giải thuật tránh
vật cản. Nếu điểm a và b được nối với nhau thì sẽ là lưu đồ cho mô hình TLR. Khi cần
tránh vật cản thì chỉ cần thêm khối giải thuật tránh vật cản vào giữa điểm a và b như
trên hình 7. Giải thuật tránh vật cản cũng đơn giản, chỉ gồm hai nhiệm vụ: định nghĩa
lại các mối quan hệ dẫn đường-theo đuôi (cho những cặp robot bị mất liên lạc với nhau
do vật cản) cho phù hợp với môi trường mới và tính toán vị trí tới mới cho các robot
theo đuôi để không va chạm với vật cản. Khi không phát hiện có vật cản thì không cần
sử dụng đến giải thuật tránh vật cản.
II.4.2 Tính ổn định của giải thuật tránh vật cản
Bởi vì mọi robot đều có thể giữ một mối liên hệ với ít nhất một robot khác trong nhóm
nên việc định nghĩa đội hình vẫn được đảm bảo (định nghĩa theo cả cấu hình SLR lẫn
TLR). Vì giải thuật điều khiển cho cả SLR và TLR đều đã được chứng minh là ổn
định, nên giải thuật khi có vật cản hay không có vật cản cũng đều ổn định, nghĩa là đội
hình sẽ bị lệch tạm thời khi tránh vật cản nhưng đội hình robot sẽ nhanh chóng trở lại
như mong muốn ngay khi hết vật cản.
10
Giải thuật tránh vật cản
Bắt đầu
(A)
Mất dấu robot
dẫn đường chính?
Định nghĩa đội hình và
robot dẫn đường
N
Mất dấu robot
dẫn đường phụ?
Y
Time step = 0
Y
Chọn robot
dẫn đường chính khác
Đo khoảng cách và góc
với robot dẫn đường
Tính toán vị trí
robot theo đuôi ảo
N
Có robot theo đuôi?
Chọn robot
dẫn đường phụ khác
N
Y
a
Chọn robot dẫn đường
khác cho robot đó
b
Ước lượng gia tốc tịnh tiến
và gia tốc góc
của robot dẫn đường
Vị trí sắp tới
có đủ an toàn?
N
Y
Tính toán vận tốc tịnh tiến
và vận tốc góc của robot
theo đuôi
Dừng?
(B)
Chọn vị trí tới mới đủ an
toàn không vướng vật cản
Y
N
Time step + 1
Kết thúc
Hình 7. Điều khiển theo mô hình TLR với giải thuật tránh vật cản.
II.5 Ảnh hưởng của nhiễu
Luật điều khiển đề xuất ở phần II.3 chỉ xét trong môi trường tổng quát không có nhiễu.
Trong luật điều khiển này, những thông tin cần thiết chỉ bao gồm dữ liệu đo đạc về
khoảng cách và góc thu được từ các cảm biến trên robot, do mục tiêu của luật điều
khiển là cần đơn giản, tính toán nhanh và hiệu quả. Do đó, việc đo khoảng cách và góc
cần phải thực hiện nhanh và chính xác. Trong đó, việc đo góc thường có sai số lớn và
ảnh hưởng nhiều hơn so với đo khoảng cách. Vì thế, tốt nhất là robot dẫn đường sẽ tự
đo hướng vận tốc hiện tại của mình và thông báo cho các robot theo đuôi biết, để tránh
sai số. Việc còn lại là cần xử lý tốt khi có nhiễu trong việc đo khoảng cách. Muốn xử lý
thì trước hết ta cần đánh giá mức độ ảnh hưởng của sai số khi đo khoảng cách đến chất
lượng điều khiển đội hình robot. Đó là mục tiêu của phần nghiên cứu này.
Từ một kết quả nghiên cứu đã công bố của chủ nhiệm đề tài về đánh giá sai số của việc
đo khoảng cách dùng cảm biến siêu âm trong môi trường nhiễu (Tran, 2009), mức độ
lỗi của các phương pháp đo được thể hiện trong bảng 1.
Phương pháp đo
CC
Mức độ lỗi (%)
36 – 42
WP-GCC IWP-GCC
64 – 65
30 – 34
WDIP
28 – 31
IWDIP
28 –
31
Bảng 1. Mức độ lỗi của các phương pháp đo khoảng cách dùng siêu âm trong môi
11
trường nhiễu lớn (SNR < -40dB)
Từ các dữ liệu ở bảng 1, ta chọn 4 mức độ sai số tiêu biểu để đánh giá độ ảnh hưởng
đến đội hình robot gồm: 30%, 36%, 42%, and 64%. Các kết quả mô phỏng thể hiện
trong phần II.6.
II.6 Kết quả và phân tích
Một số kết quả mô phỏng sử dụng Matlab sẽ được trình bày ở đây để thể hiện tính
đúng đắn, chất lượng và khả năng tùy biến của luật điều khiển theo cấu hình TLR đề
xuất ở trên. Để mang tính khách quan, các kết quả mô phỏng sẽ so sánh việc sử dụng
luật điều khiển cho cấu hình SLR từ nghiên cứu (Gustavi, 2008) và luật điều khiển (12)
cho cấu hình TLR.
Trong tất cả các mô phỏng, time step được chọn là 0,2 giây, trong đó 0,1 giây được giả
sử dành cho quá trình đo đạc và trao đổi dữ liệu và 0,1 giây dành cho việc điều khiển
động cơ và di chuyển. Để có thể so sánh với luật điều khiển của (Gustavi, 2008), robot
dẫn đường của cả nhóm (R0) sẽ di chuyển theo một quỹ đạo hình sin với gia tốc nhỏ.
Các tham số khác sẽ được nêu cụ thể trong mỗi kết quả mô phỏng.
II.6.1 So sánh giữa luật điều khiển theo cấu hình TLR và SLR
Để so sánh ưu điểm của cấu hình TLR so với SLR, một nhóm 5 robot được mô phỏng
xuất phát từ vị trí ngẫu nhiên và nhiệm vụ là tạo thành đội hình đường thẳng với
khoảng cách giữa hai robot liền kề là 3m, và góc giữa chúng là π/6. Kết quả mô phỏng
quỹ đạo được thể hiện trên Hình 8. Để thấy rõ sự khác biệt, các thông số về độ sai lệch
về vị trí (khoảng cách và góc) của các robot trong đội hình trong quá trình di chuyển
được cho trong Bảng 2. Để mang tính tổng quát, sai số khoảng cách sẽ là sai số tương
đối và sai lệch về góc sẽ tính bằng sai số tuyệt đối. Do so sánh phân bố của sai số trong
suốt quá trình di chuyển nên để so sánh ta sẽ dùng các giá trị trung bình (mean) và độ
lệch chuẩn (std). Ta nhận thấy rằng, ngoại trừ robot thứ hai (R1) có thông số sai số
tương đương nhau do cùng là cấu hình SLR, kể từ robot thứ ba trở đi, sai số theo cấu
hình SLR (robot sau đi theo robot trước) sẽ ngày càng tăng dần do sai số cộng dồn.
Trong khi đó, sai số của cấu hình TLR có xu hướng giữ nguyên và thậm chí có thể
giảm, tùy theo cách chọn robot dẫn đường chính và robot dẫn đường phụ. Lý do là vì
sự ràng buộc giữa hai robot dẫn đường, tương đương với một khâu giảm chấn bậc 2, sẽ
giúp cho robot theo đuôi không bị sai số cộng dồn, do đó cấu hình TLR sẽ giảm dao
động cho các robot sau và hội tụ nhanh.
12
Hình 8. Quỹ đạo di chuyển của đội hình 5 robot sử dụng luật điều khiển
(a) SLR và (b) TLR
Bảng 2. So sánh sai số vị trí giữa luật điều khiển cấu hình TLR và SLR
(Gustavi, 2008)
(12)
mean
mean
∆d mean
∆d mean
Robot
std
std
std
std
∆d
∆d
dk 0
dk 0
R1
R2
R3
R4
0.6539
0.6595
0.6790
0.7543
2.2384
2.3966
2.5985
2.8104
∆φkm
∆φkm
0.0429
0.1909
0.2514
0.2653
0.5103
0.9620
dk 0
0.6536
0.3229
0.3203
0.3212
∆φkm
∆φkm
-
0.2514
0.2139
0.2318
0.2216
dk 0
2.2384
1.1045
1.1910
1.1895
II.6.2 Khả năng tránh vật cản tĩnh
Mô phỏng này trình diễn khả năng tránh vật cản tĩnh trong hai trường hợp: một vật cản
và nhiều vật cản, đồng thời so sánh việc tránh vật cản khi không thay đổi định nghĩa
đội hình và khi có thay đổi định nghĩa về đội hình. Các thông số mô phỏng được cho
trong Bảng 3. Hình 9 thể hiện quỹ đạo của nhóm 4 robot di chuyển giữ nguyên đội
hình đường thẳng ΩA. Khi R3 gặp vật cản, nó tìm cách tránh trong khi vẫn giữ được
mối liên lạc với hai robot dẫn đường của nó. Do cấu hình TLR cho tốc độ hội tụ cao
nên robot R3 sẽ nhanh chóng kết thúc sự dao động khi tránh vật cản để tạo thành đội
hình như mong muốn sau khi vượt qua được vật cản. Trong hình 10, đội hình vẫn là ΩA
và khi gặp nhiều vật cản, các robot vẫn không thay đổi các robot dẫn đường của nó.
Hình 11 thể hiện ứng biến của robot, khi gặp vật cản đầu tiên, đội hình liền chuyển từ
ΩA sang ΩB. Hình 11 cho thấy kết quả sau khi tránh vật cản không tốt bằng trường hợp
ở Hình 10. Điều đó cho thấy cách định nghĩa đội hình ảnh hưởng rất nhiều tới chất
lượng. Do các robot đi đầu, đặc biệt là R0, thường di chuyển tốt với ít sai số nên việc
định nghĩa đội hình có liên quan càng nhiều tới các robot này thì càng cho kết quả tốt.
Bảng 3. Thông số mô phỏng giải thuật tránh vật cản
Giá trị đầu
Biến số
Giá trị
Đội hình
13
Biến số
Giá trị
Tọa độ ban (x0, y0, θ0)
(0m, 0m, 0)
đầu của R0 (t=0)
ΩA: R1 → (R0)
(d10, φ10)
(3m, π/6)
Tọa độ ban (x1, y1, θ1)
(-1.5m, -2.6m, 0) ΩA: R2 → (R0, R1) (d20, d21, φ20) (6m, 3m, π/6)
đầu của R1 (t=0)
Tọa độ ban (x2, y2, θ2)
(-3m, -5.2m, 0)
đầu của R2 (t=0)
ΩA: R3 → (R0, R1) (d30, d31, φ30) (9m, 6m, π/6)
Tọa độ ban (x3, y3, θ3)
(-4.5m, -7.8m, 0) ΩB: R1 → (R0)
đầu của R3 (t=0)
Vận tốc ban
v0 (t=0)
đầu của R0
5 m/s
(d10, φ10)
(3m, π/6)
ΩB: R2 → (R0, R1) (d20, d21, φ20) (6m, 3m, π/6)
ΩB: R3 → (R1, R2) (d31, d32, φ30) (6m, 3m, π/6)
Lưu ý rằng, đội hình ΩA và ΩB là giống nhau, chỉ khác nhau cách định nghĩa các robot
dẫn đường chính và robot dẫn đường phụ của R3.
Hình 9. Nhóm bốn robot tránh một vật cản trong khi giữ đội hình ΩA.
14
y (t)
Hình 10. Nhóm bốn robot tránh ba vật cản trong khi giữ đội hình ΩA.
Hình 11. Nhóm bốn robot tránh ba vật cản, có chuyển từ đội hình ΩA sang đội hình ΩB
II.6.3 Ảnh hưởng của nhiễu
Mô phỏng trong phần II.6.1 được thực hiện lại với sự xuất hiện của nhiễu đo khoảng
cách. Hình 12 thể hiện kết quả điều khiển đội hình robot ứng với mức sai số ed = 42%.
15
Hình 12. Quỹ đạo di chuyển của đội hình 5 robot ứng với mức sai số ed = 42%.
Thông số sai số cụ thể cho tất cả 4 mức độ sai số thể hiện trong bảng 4.
Bảng 4. Sai lệch đội hình của luật điều khiển (12) tại các mức sai số khác nhau
Robot
R1
R2
R3
R4
ed (%)
0
30
36
42
64
0
30
36
42
64
0
30
36
42
64
0
30
36
42
64
mean
∆d
dk 0
0.6536
0.6537
0.6532
0.6531
0.6533
0.3229
0.3225
0.3217
0.3218
0.3217
0.3203
0.3202
0.3193
0.3191
0.3196
0.3212
0.3212
0.3196
0.3195
0.3203
std
∆d
dk 0
2.2384
2.2896
2.3230
2.3417
2.4921
1.1045
1.1451
1.1707
1.1856
1.2947
1.1910
1.2302
1.2561
1.2681
1.3886
1.1895
1.2284
1.2577
1.2685
1.3922
16
mean ∆φkm
std ∆φkm
-0.0982
-0.0990
-0.0977
-0.0985
-0.0986
-0.0798
-0.0815
-0.0816
-0.0821
-0.0824
-0.0804
-0.0827
-0.0816
-0.0829
-0.0822
-0.0786
-0.0812
-0.0807
-0.0818
-0.0813
0.2514
0.2513
0.2511
0.2510
0.2503
0.2139
0.2158
0.2182
0.2181
0.2196
0.2318
0.2338
0.2362
0.2363
0.2381
0.2216
0.2236
0.2290
0.2295
0.2330
Có thể thấy từ bảng 4 rằng giá trị sai số tương đối trung bình về khoảng cách (mean
∆d
) không bị ảnh hưởng nhiều bởi nhiễu vì mô hình nhiễu trong mô phỏng là mô hình
dk 0
phân bố chuẩn. Các giá trị sai số tương đối trung bình về góc và phương sai của sai số
góc (mean ∆φkm and std ∆φkm ) cũng ít bị ảnh hưởng vì ta đang giả sử sai số chỉ xảy ra
với sự đo khoảng cách. Tuy nhiên, phương sai của sai số tương đối trung bình (std
∆d
)
dk 0
là thông số thể hiện mức độ ảnh hưởng của sai số đo khoảng cách thì thay đổi rất lớn.
Bảng 5 thể hiện mức độ tăng của std
Robot
R1
R2
R3
R4
∆d
theo sự tăng của sai số đo khoảng cách.
dk 0
std
ed (%)
0
30
36
42
64
0
30
36
42
64
0
30
36
42
64
0
30
36
42
64
∆d
increment (%)
dk 0
0
2.29
3.78
4.61
11.33
0
3.68
5.99
7.34
17.22
0
3.29
5.47
6.47
16.59
0
3.27
5.73
6.64
17.04
Bảng 5. Quan hệ giữa độ tăng của std
∆d
và độ tăng của sai số đo khoảng cách ed
dk 0
Ta nhận thấy rằng, khi sai số đo dưới 30% thì mức độ sai số của đội hình tăng chậm.
Tuy nhiên, khi sai số đo chỉ tăng 6% (từ 30% lên 36%) thì sai số đội hình đã tăng gấp
1,6 lần. Và với 6% tăng thêm tiếp theo của sai số đo (tại mức 42%) thì sai số đội hình
đã tăng gần như gấp đôi. Nhìn chung mức độ sai số của đội hình luôn tăng chậm hơn
độ tăng của sai số đo vì mô hình điều khiển (12) là dạng điều khiển vòng kín, có phản
hồi nên bản thân luật điều khiển (12) đã có thể giảm lỗi. Ở đây chỉ xét đến sai số đo
khoảng cách, trong khi các thông tin khác như định nghĩa đội hình, các vận tốc, các
góc, .... đều đang được giả thiết là đúng nên những thông tin đúng này đã giúp ích
17
nhiều trong việc kiểm soát lỗi. Tuy nhiên, có thể nói rằng mỗi phần trăm sai số đo được
giảm đều có giá trị lớn làm giảm sai số đội hình.
III. Các kết quả mới, nổi bật
Sau khi (Das, 2002) đề xuất chiến lược điều khiển đội hình dựa trên mô hình unicycle
dynamics, đã có khá nhiều nghiên cứu khác dựa trên mô hình đó và còn có các phương
pháp khác như luật điều khiển dựa trên robot kế cạnh (Olfati-Saber, 2002), mô hình
bậc hai và sử dụng các phương pháp điều khiển hồi tiếp, bền vững và thích nghi (Liu,
2007) hay (Sun, 2009; Wang, 2008) có ý tưởng khá hay về việc chuyển đổi vấn đề điều
khiển đội hình thành một vấn đề điều khiển đồng bộ hóa.
Mỗi nghiên cứu trên đều có những ưu điểm riêng nhưng chưa có nghiên cứu nào giải
quyết được tất cả những vấn đề của điều khiển đội hình:
• Phức tạp và tiêu thụ nhiều tài nguyên, nhất là trong các nghiên cứu sử dụng
mạng neural, điều khiển thích nghi.
• Độ trễ: mỗi robot vừa phải quan sát, đo đạc môi trường xung quanh, vừa phải
tương tác với các robot khác trong hệ thống. Đối với lượng dữ liệu lớn đó thì cần
nhiều thời gian để thông tin được truyền tải thông suốt trong mạng.
• Thông tin gián tiếp: có khá nhiều thông tin mà robot không thể hoặc khó đo đạc
trực tiếp bằng các cảm biến tại chỗ. Ví dụ như vận tốc tức thời của robot bên
cạnh hay robot dẫn đường là thông tin rất cần thiết nhưng lại khó có thể đo trực
tiếp mà phải tính toán gián tiếp, gây nên sai số đo đạc.
• Nhiễu: một nguồn gây sai số khác là nhiễu ở trong môi trường. Do cấu trúc hệ
thống phức tạp, nhiều cảm biến và nhiểu dữ liệu đo đạc, mỗi sự đo đạc sai đều
dẫn tới tác động dây chuyền. Chưa có nhiều nghiên cứu về ảnh hưởng của nhiễu
tới hoạt động của toàn hệ thống.
• Cấu trúc một robot dẫn đường (SLR): đây là cấu trúc thường được sử dụng nhất,
đơn giản và vẫn dễ dàng áp dụng khi số lượng robot trong hệ thống có thay đổi.
Tuy nhiên, cấu trúc nối tiếp này sẽ gây sai số cộng dồn. Theo lý thuyết thì cấu
trúc này đảm bảo tính hội tụ của giải thuật với mọi qui mô của hệ thống, tuy
nhiên trên thực tế thì rất khó áp dụng cho những hệ thống từ 4 robot trở lên.
Đề tài này trình bày một phương pháp điều khiển ổn định mới cho hệ thống đa robot di
chuyển theo đội hình khắc phục hầu hết được các vấn đề nêu trên.
IV. Kết luận và kiến nghị
Đề tài đề xuất một luật điều khiển (bậc hai) chung cho cả cấu hình SLR và TLR sẽ đảm
bảo độ hội tụ, giảm dao động và tăng tốc độ hội tụ của giải thuật điều khiển, đồng thời
rất linh hoạt khi vượt chướng ngại vật. Luật điều khiển này sẽ dựa trên sự ước đoán gia
tốc tịnh tiến và gia tốc góc để loại bỏ việc tính toán thông số gián tiếp là vận tốc của
robot dẫn đầu. Tuy là luật điều khiển bậc hai nhưng chỉ gồm các phép tính đại số và sử
18
dụng các thông tin đo đạc cơ bản từ cảm biến là khoảng cách và góc nên thời gian tính
toán rất ngắn, không gây ra trễ. Các thông tin đo đạc này có thể dễ dàng có được bằng
các loại cảm biến cơ bản trên robot (onboard sensors) nên hệ thống đơn giản, không
tốn nhiều tài nguyên khi hoạt động. Do dùng các cảm biến onboard, nên các robot cũng
bị giới hạn về khả năng giao tiếp với nhau, giúp cho lượng thông tin trao đổi ít, giảm
độ trễ.
Đề tài cũng là bước đầu nghiên cứu nhóm robot nhỏ nên khuyến nghị chỉ nên dùng các
kết quả nghiên cứu áp dụng vào các nhóm robot nhỏ (từ 5 robot trở xuống).
V. Tài liệu tham khảo
Barnes, L.E., Fields, M.A., and Valavanis, K.P. (2009). Swarm formation control
utilizing elliptical surfaces and limiting functions. IEEE Trans. on Systems, Man, and
Cybernetics, Part B: Cybernetics, 39, pp. 1434-1445.
Das, A.K., Fierro R., Kumar V., Ostrowski, J.P., Spletzer, J., and Taylor, C.J.
(2002). A vision-based formation control framework. IEEE Trans. Robot. Autom., 18,
pp. 813-825.
Desai, J. P. (2002). A graph theoretic approach for modeling mobile robot team
formation. J. Robotic Syst., 19, pp. 511-525.
Gerasimos G. Rigatos (2008). Multi-robot motion planning using swarm
intelligence. International Journal of Advanced Robotic Systems, 5(2), pp. 139-144.
Gustavi, T., and Hu, X. (2008). Observer-based leader-following formation control
using onboard sensor information. IEEE Trans. on Robotics, 24, pp. 1457-1462.
Lewis, M.A. and Tan, K.H. (1997). High precision formation control of mobile
robots using virtual structures autonomous. Autonomous Robots, 4, pp. 387-403.
Liu, S.C., Tan, D.L., and Liu, G.J. (2007). Robust leader-follower formation
control of mobile robots based on a second order kinematics model. Automatica Sinica,
33, pp. 947-955.
Olfati-Saber, R., and Murray, R.M. (2002). Graph rigidity and distributed
formation stabilization of multivehicle systems. Proceedings of 41st IEEE Conf. on
Decision and Control, Las Vegas, NV, 10-13 December, pp. 2965-2971.
Reynolds, C.W. (1987). Flocks, herds, and schools: a distributed behavioral model.
Computer Graphics, 21, pp. 25-34.
Sun, D., Wang C., Shang W., and Feng G. (2009). A synchronization approach to
trajectory tracking of multiple mobile robots while maintaining time-varying
formations. IEEE Trans. on Robotics, 25, pp. 1074-1086.
19
- Xem thêm -