Đăng ký Đăng nhập
Trang chủ Nghiên cứu thiết kế thay thế bộ điều khiển mô hình cánh tay robot tại phòng thí ...

Tài liệu Nghiên cứu thiết kế thay thế bộ điều khiển mô hình cánh tay robot tại phòng thí nghiệm của trường đại học kỹ thuật công nghiệp thái nguyên

.PDF
73
2
139

Mô tả:

.. ĐẠI HỌC THÁI NGUYÊN TRƢỜNG ĐẠI HỌC KỸ THUẬT CÔNG NGHIỆP TRẦN QUẾ SƠN NGHIÊN CỨU, THIẾT KẾ THAY THẾ BỘ ĐIỀU KHIỂN MÔ HÌNH CÁNH TAY ROBOT TẠI PHÕNG THÍ NGHIỆM CỦA TRƢỜNG ĐẠI HỌC KỸ THUẬT CÔNG NGHIỆP THÁI NGUYÊN LUẬN VĂN THẠC SĨ KỸ THUẬT CHUYÊN NGÀNH KỸ THUẬT ĐIỆN TỬ Thái Nguyên - 2015 Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ LỜI CAM ĐOAN Tên tôi là: Trần Quế Sơn Sinh ngày07 tháng05 năm 1986 Học viên lớp cao học khoá 14–Kỹ thuật điện tử - Trường đại học kỹ thuật Công nghiệp Thái Nguyên. Hiện đang công tác tại Trường đại học kỹ thuật Công nghiệp Thái Nguyên. Xin cam đoan luận văn “Nghiên cứu, thiết kế thay thế bộ điều khiển mô hình cánh tay robot tại phòng thí nghiệm của trường ĐH KTCN ” do thầy giáo PGS.TS. Nguyễn Thanh Hà hướng dẫn là công trình nghiên cứu của riêng tôi. Tất cả các tài liệu tham khảo đều có nguồn gốc, xuất xứ rõ ràng. Tác giả xin cam đoan tất cả những nội dung trong luận văn đúng như nội dung trong đề cương và yêu cầu của thầy giáo hướng dẫn. Nếu có vấn đề gì trong nội dung của luận văn tác giả xin hoàn toàn chịu trách nhiệm với lời cam đoan của mình. Thái Nguyên, ngày tháng năm 2015 Học viên Trần Quế Sơn Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ LỜI CẢM ƠN Sau thời gian nghiên cứu, làm việc khẩn trương và được sự hướng dẫn tận tình giúp đỡ của thầy giáo PGS.TS Nguyễn Thanh Hà, luận văn với đề tài “Nghiên cứu, thiết kế thay thế bộ điều khiển mô hình cánh tay robot tại phòng thí nghiệm của trường ĐH KTCN” đã được hoàn thành. Tác giả xin bày tỏ lòng biết ơn sâu sắc tới: Thầy giáo hướng dẫn PGS.TS Nguyễn Thanh Hà đã tận tình chỉ dẫn, giúp đỡ tác giả hoàn thành luận văn. Thầy giáoPGS.TS.Nguyễn Duy Cương – Bộ môn Kỹ thuật điện tử - Khoa Điện tử, cùng các giáo viên Trường Đại học kỹ thuật công nghiệp Thái Nguyên và một số đồng nghiệp, đã quan tâm động viên, giúp đỡ tác giả trong suốt quá trình học tập để hoàn thành luận văn này. Mặc dù đã cố gắng hết sức, song do hạn chế về điều kiện thời gian và kinh nghiệm thực tế của bản thân còn ít nên đề tài không thể tránh khỏi thiếu sót. Vì vậy, tác giả mong nhận được sự đóng góp ý kiến của các thầy giáo, cô giáo và các bạn bè đồng nghiệp. Tôi xin chân thành cảm ơn! Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ MỤC LỤC LỜI CAM ĐOAN ................................................................................................................... i LỜI CẢM ƠN .......................................................................................................................iii DANH MỤC CÁC KÝ HIỆU VIẾT TẮT ........................................................................... vi DANH MỤC HÌNH VẼ ......................................................................................................vii LỜI NÓI ĐẦU ...................................................................................................................... ix CHƢƠNG 1 ........................................................................................................................ 10 TỔNG QUAN VỀ PID, LEARNING FEED FORWARD CONTROL (LFFC) VÀ MODEL REFERENCE ADAPTIVE SYSTEMS (MRAS), BỘ ĐIỀU KHIỂN PID CHO MÔ HÌNH CÁNH TAY ROBOT RD5NT ............................................................. 10 1.1. Tổng quan về PID ...........................................................................................10 1.2. Tổng quan về Learning Feed-forward Control (LFFC) .................................12 1.2.1. Điều khiển học (Learning Control - LC) .....................................................12 1.2.2. Bộ điều khiển học sử dụng sai lệch phản hồi (Feedback Error Learning FEL) .......................................................................................................................16 1.2.3. Learning Feed forward Control (LFFC) ......................................................21 1.3. Lý thuyết điều khiển thích nghi theo mô hình mẫu (MRAS).........................21 1.3.1 Lịch sử phát triển của hệ điều khiển thích nghi .................................................. 21 1.3.2. Khái quát về hệ điều khiển thích nghi ............................................................... 23 1.3.3 Cơ chế thích nghi – thiết kế bộ điều khiển thích nghi dựa vào luật MIT ........... 28 1.3.4. Phương pháp độ nhạy ........................................................................................ 30 1.3.5. Phương pháp ổn định của Liapunov .................................................................. 32 1.4. Bộ điều khiển LFFC trên cơ sở MRAS ..........................................................35 1.4.1. Khái niệm chung ................................................................................................ 36 1.4.2. MRAS dựa trên điều khiển feed - forward ........................................................ 37 1.4.3. Luật điều khiển thích nghi ................................................................................. 39 CHƢƠNG 2 ..................................................................................................................... 46 CÁC KHÁI NIỆM CƠ BẢN, CƠ SỞ MÔ HÌNH TOÁN, PHƢƠNG TRÌNH ĐỘNG LỰC HỌC CỦA CÁNH TAY ROBOT HAI BẬC TỰ DO, THIẾT KẾ VÀ MÔ PHỎNG HỆ THỐNG ........................................................................................................ 46 2.1. Cấu tạo của Robot công nghiệp ............................................................................ 46 2.2. Tay máy ................................................................................................................ 47 2.3. Bậc tự do của tay máy........................................................................................... 48 2.4. Phương trình động học của robot hai bậc tự do .............................................50 2.5. Thiết kế hệ thống điều khiển ..........................................................................53 2.5.1. Chọn mô hình mẫu ............................................................................................. 53 2.5.2. Xác định đầu vào của phần feed – forward ....................................................... 54 2.5.3 Xác định cấu trúc của phần feed – forward ........................................................ 55 2.5.4 Giải phương trình Lyapunov .............................................................................. 56 2.5.5. Chọn hệ số thích nghi ........................................................................................ 57 2.5.6. Huấn luyện LFFC .............................................................................................. 57 2.6. Mô phỏng hệ thống .........................................................................................58 CHƢƠNG 3 ........................................................................................................................ 60 Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ KẾT QUẢ THỰC NGHIỆM VÀ KẾT LUẬN................................................................ 60 3.1. Sơ đồ khối hệ thống: .......................................................................................60 3.2. Sơ đồ kết nối phần cứng .................................................................................61 3.2.1. Giới thiệu tổng quan các khối trong hệ thống thực nghiệm............................... 62 3.3. Kết quả thực nghiệm ......................................................................................67 Kết quả thực nghiệm được tiến hành trên robot RD5NT tại Phòng thí nghiệm Điện – Điện tử của Khoa điện tử - Trường ĐH Kỹ thuật công nghiệp Thái Nguyên. ............................. 67 3.4. Kết luận và hướng phát triển của đề tài ..........................................................70 TÀI LIỆU THAM KHẢO ................................................................................................. 71 Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ DANH MỤC CÁC KÝ HIỆU VIẾT TẮT LFFC: Learning FeedForward Control MRAS: Model Reference Adaptive System am: Tham số của bộ điều khiển thích nghi bm: Tham số của bộ điều khiển thích nghi cm: Tham số của bộ điều khiển thích nghi dm: Tham số của bộ điều khiển thích nghi : Vecto góc của khớp nối M(): ma trận mô men quán tính C():mô hình lực coriolis và quán tính ly tâm D:hệ số ma trận đường chéo ma sát nhớt S: hệ số ma trận đường chéo ma sát Coulomb G(): Trọng lực u: mô men xoắn của khớp i1,2: Độ dài cánh tay 1,2 r1,2: Tỷ số truyền của động cơ 1,2 d1,2: Ma sát nhớt của 2 khớp 1, 2 s1,2: Là ma sát coulomb của khớp 1,2 p21: Thành phần của ma trận P p22: Thành phần của ma trận P Ap1: Mô hình phụ thuộc vào mô hình của khớp 1 Ap2: Mô hình phụ thuộc vào mô hình của khớp 2 αa: Tham số của bộ điều khiển thích nghi αb: Tham số của bộ điều khiển thích nghi αc: Tham số của bộ điều khiển thích nghi αd: Tham số của bộ điều khiển thích nghi J1,2: Mô men quán tính của 2 khớp 1, 2 Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ DANH MỤC HÌNH VẼ Hình 1.1: Sơ đồ khối của bộ điều khiển PID với bộ lọc bậc nhất Hình 1.2: Cực tiểu cục bộ trong kỹ thuật học Hình 1.3: Cấu trúc bộ điều khiển phản hồi sai lệch Hình 1.4: Học theo sai số phản hồi Hình 1.5a: Hệ thích nghi tham số Hình 1.5b: Hệ thích nghi tín hiệu Hình 1.6. Điều khiển ở cấp 1 và cấp 2 Hình 1.7: Mô hình đối tượng và mô hình mẫu Hình 1.8: Hệ thống điều khiển thích nghi dựa trên mô hình độ nhậy. Hình 1.9a: MRAS cho sự thích nghi của các tham số bộ điều khiển Hình 1.9b: MRAS với mô hình có thể hiệu chỉnh cho nhận dạng tham số Hình 1.9c: Cấu trúc MRAS với khâu khởi tạo tín hiệu đặt Hình 1.10: Nhận dạng mô hình ngược của đối tượng Hình 1.11: Bộ điều khiển LFFC Hình 2.1. Các thành phần chính của một robot công nghiệp Hình 2.2 : Mô hình robot 2 bậc tự do Hình 2.3: Cấu trúc bộ điều khiển phần feed forward Hình 2.4: Sơ đồ mô phỏng hệ thống điều khiển Hình 2.5a: Đáp ứng của khớp 1 Hình 2.5b: Đáp ứng của khớp 2 Hình 3.1: Sơ đồ khối hệ thống điều khiển 1 khớp của mô hình Hình 3.2: Sơ đồ kết nối tổng thể hệ thống thực nghiệm Hình 3.3: Mô hình robot RD5NT Hình 3.4: Bộ điều khiển Dspace 1103 Hình 3.5: Giao diện của phần mềm giám sát điều khiển Control Desk Hình 3.6: Sơ đồ nguyên lý của mạch cầu H sử dụng IC L298 Hình 3.7: Mạch in mạch cầu H điều khiển động cơ Hình 3.8: Bản vẽ nguyên lý mạch nguồn Hình 3.9: Sơ đồ mạch in mạch nguồn Hình 3.10: Hệ thống thực nghiệm được lắp đặt tại Phòng thí nghiệm Điện – Điện tử Hình 3.11a: Đáp ứng thực nghiệm của khớp 1 Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ Hình 3.11b: Đáp ứng thực nghiệm của khớp 2 Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ LỜI NÓI ĐẦU Ngày nay, trong các dây chuyền sản xuất với mức độ tự động hóa cao, robot công nghiệp đóng vai trò quan trọng trong việc giảm cường độ lao động cho người lao động, tăng năng suất và độ chính xác gia công, giảm giá thành sản phẩm. Mục tiêu ứng dụng của kỹ thuật Robot trong công nghiệp nhằm nâng cao năng suất các dây chuyền công nghệ, nâng cao chất lượng và khả năng cạnh tranh của sản phẩm, đồng thời cải thiện điều kiện lao động. Sự cạnh tranh hàng hóa đặt ra một vấn đề thời sự là làm sao để hệ thống tự động hóa sản xuất phải có tính linh hoạt nhằm đáp ứng với sự biến động thường xuyên của thị trường hàng hóa. Robot công nghiệp là bộ phận cấu thành không thể thiếu trong hệ thống sản xuất tự động linh hoạt đó. Gần nửa thế kỷ có mặt trong sản xuất. Robot công nghiệp đã có một lịch sử phát triển hấp dẫn. Ngày nay, Robot công nghiệp được ứng dụng rộng rãi ở nhiều lĩnh vực sản xuất. Điều đó xuất phát từ những ưu điểm cơ bản của các loại Robot đã được lựa chọn và đúc kết qua bao nhiêu năm ứng dụng ở nhiều nước.Ở nước ta trước những năm 1990 hầu như chưa du nhập về kỹ thuật Robot. Từ năm 1990 nhiều cơ sở công nghiệp đã bắt đầu nhập ngoại nhiều loại Robot thực hiện các nhiệm vụ riêng như tháo lắp dụng cụ cho các trung tâm CNC, lắp ráp các linh kiện điện tử, hàn vỏ xe ô tô, xe máy và phun phủ bề mặt … Có những nơi đã bắt đầu thiết kế, chế tạo và lắp ráp Robot. Có thể nói, Robot đang đóng một vai trò hết sức quan trọng trong công cuộc tự động hóa sản xuất. Trong lĩnh vực Robot hiện nay, phần cơ khí (Robot Mechanics), hệ thống Điều khiển (Robot Control) và hệ thống lập trình (Programming system) được coi là các thành phần độc lập và được các nhà sản xuất chào bán độc lập. Trên thế giới nói chung và ở nước ta nói riêng, trong những năm gần đây, các hoạt động nghiên cứu, phát triển về Robot vẫn không ngừng phát triển và có rất nhiều công trình nghiên đưa các phương pháp để điều khiển cánh tay robot. Có thể kể đến ở đây như: - Nguyễn Văn Minh Trí, Lê Văn Mạnh, “Thiết kế bộ điều khiển PID bền vững cho hệ thống phi tuyến bậc hai nhiều đầu vào – Nhiều đầu ra và ứng dụng trong điều khiển tay máy công nghiệp”, Tạp chí Khoa học và Công nghệ, Đại học Đà Nẵng , số 4(39).2010. Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ - Nguyễn Manh Hùng, Ngô Thanh Quyền, “Thiết kế bộ điều khiển mờ một đầu vào cho cánh tay robot”, Tạp Chí Đại Học Công Nghiệp, số 9(06).2011. - Nguyễn Manh Hùng, Ngô Thanh Quyền, “Điều khiển bám đuổi mạng neural thích nghi cho cánh tay robot bao gồm động lực học cơ cấu truyền động” Tạp Chí Đại Học Công Nghiệp, số 9(06).2011. - Asgari, Pouya, Zarafshan, Payam ; Moosavian, S.Ali A.“Dynamics modelling and stable motion control of a Ballbot equipped with a manipulator”, IEEE Conference Publications - Publication Year: 2013 , Page(s): 259 – 264. - YaoNan Wang, ThanhQuyen Ngo, ThangLong Mai, ChengZhong Wu “Adaptive Recurrent Wavelet Fuzzy CMAC Tracking Control for De-icing Robot Manipulator”, Proceedings of World Congress on Engineering and Computer Science 2012 Vol I WCECS 2012, October 24-26, 2012, San Francisco, USA. Các phương pháp này ít nhiều cũng đã giải quyết được những khó khăn khi điều khiển robot như hệ có cấu trúc phi tuyến, tham số bất định, thay đổi, ảnh hưởng bởi nhiễu…Với luận văn này tác giả dự định sẽ áp dụng thuật toán LFFC (Leaning Feedforward Control) dựa trên MRAS (Model Reference Adaptive System) để điều khiển tay máy robto RD5NT với mong muốn bộ điều khiển LFFC có khả năng tự học sẽ giải quyết được sự ảnh hưởng của tham số bất định và nhiễu đến chất lượng bám quỹ đạo của tay máy robot, cho phép cải thiện hơn nữa chất lượng điều khiển bám quỹ đạo. Vì vậy học viên đã chọn đề tài “Nghiên cứu, thiết kế thay thế bộ điều khiển mô hình cánh tay robot tại phòng thí nghiệm của trường ĐH KTCN” là đề tài nghiên cứu cho luận văn thạc sỹ của mình, trước hết với mục đích thiết kế được bộ điều khiển cho 2 trong 5 bậc cánh tay Robot 5 bậc tự do RD5NT. Mô hình thí nghiệm Cánh tay Robot 5 bậc tự do, nhãn hiệu RD5NT nói riêng là một mô hình thí nghiệm trường học, mô hình hóa một cánh tay Robot 5 bậc tự do khá phổ biến trong các dây chuyền sản xuất hiện nay. Mô hình Cánh tay Robot 5 bậc tự do RD5NT có 5 khớp, mỗi khớp được hoạt động bởi một động cơ điện một chiều.Sự thành công của phương pháp điều khiển thích nghi bám quỹ đạo cho robot RD5NT sử dụng thuật toán LFFC dựa trên MRAS kỳ vọng mang lại khả năng chống nhiễu tốt, chất lượng bám quỹ đạo được nâng cao. Đối tượng của đề tài là robot RD5NT tại phòng thí nghiệm của trường ĐH KTCN với mục tiêu thiết kế bộ điều khiển cho 2 trong 5 bậc của mô hình cánh tay robot từ đó thay thế cho bộ điều khiển cũ, phục vụ cho công tác thí nghiệm của nhà trường. Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ Luận văn bao gồm nội dung chính sau: Chương 1: Tổng quan về PID,Learning feed forward control (LFFC) và Hệ thống điều khiển thích nghi mô hình mẫu (MRAS), bộ điều khiển PID cho mô hình cánh tay Robot RD5NT. Chương 2: Các khái niệm cơ bản, cơ sở mô hình toán, động lực học của cánh tay robot 2 bậc tự do, thiết kế và mô phỏng hệ thống. Chương 3: Kết quả thực nghiệm và kết luận. Do điều kiện thời gian không cho phép, tác giả chỉ dừng lại ở việc thiết kế bộ điều khiển phối hợp 2 trong 5 khớp của mô hình. Tuy nhiên, đề tài này sẽ là cơ sở cho các nghiên cứu về sau có thể xây dựng một bộ điều khiển mà có thể điều khiển phối hợp toàn bộ 5 khớp của mô hình. Thái Nguyên, ngày tháng năm 2015 Học viên Trần Quế Sơn Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ 10 CHƢƠNG 1 TỔNG QUAN VỀPID, LEARNING FEED FORWARD CONTROL(LFFC)VÀ MODEL REFERENCE ADAPTIVE SYSTEMS (MRAS), BỘ ĐIỀU KHIỂN PID CHO MÔ HÌNH CÁNH TAY ROBOT RD5NT Như chúng ta đã biết, robot là đối tượng có tính phi tuyến mạnh vì vậy cần có phương pháp để nâng cao độ chính xác về vị trí khi điều khiển cánh tay robot.Trong nội dung chương này, tác giảđề cậpvà phân tích hiệu suất của bộ điều khiển sử dụng thuật toán PID cho mô hình cánh tay robot, đồngthời đề xuất một phương pháp điều khiển mới nhằm cải thiện khả năng bám quỹ đạo của cánh tay robot. 1.1. Tổng quan về PID Thuật toán PID đưa ra tín hiệu điều khiển dựa trên sự tổng hơp của cả ba thành phần: tỉ lệ (P), tích phân (I) và vi phân (D). Chúng có cấu trúc và nguyên lý làm việc đơn giản, có nhiệm vụ đưa sai lệch e(t) của hệ thống về 0 sao cho quá trình quá độ thỏa mãn các yêu cầu cơ bản về chất lượng. Do đó bộ điều khiển PID được sử dụng rộng rãi trong các nghành công nghiệp hiện nay. Bộ điều khiển PID được mô tả dưới phương trình sau: Trong đó: : Hệ số khuếch đại bộ điều khiển : Hằng số tích phân : Hằng số vi phân Từ mô hình vào ra ta có hàm truyền đạt của bộ điều khiển: Tương ứng với hàm truyền đạt: Trong đó: : Hệ số khuếch đại tỷ lệ Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ 11 : Hệ số khuếch đại tích phân : Hệ số khuếch đại vi phân Thuật toán PID là sự mở rộng từ thuật toán PI với việc thêm thành phần vi phân nhằm cải thiện đặc tính động học của hệ thống. Bản chất của tác động vi phân là đoán được trước chiều hướng và tốc độ thay đổi của biến được điều khiển và đưa ra phản ứng thích hợp, do đó có tác dụng làm tăng tốc độ đáp ứng của hệ kín với thay đổi của giá trị đặt hoặc tác động của nhiễu. Bên cạnh đó, quan trọng hơn nữa là sự có mặt của thành phần vi phân giúp cho bộ điều khiển có thể ổn định được một số quá trình mà bình thường không ổn định được với các bộ điều khiển P hoặc PI. Hàm truyền đạt của bộ điều khiển PID cùng với bộ lọc bậc nhất được biểu diễn như sau: Trong đó: E: Sai lệch (vị trí hoặc tốc độc) V: Điện áp : Hằng số thời gian bộ lọc Hình 1.1: Sơ đồ khối của bộ điều khiển PID với bộ lọc bậc nhất Từ sơ đồ khối trên, ta rút ra được các phương trình sau: Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ 12 Từ các phương trình trên ta có không gian trạng thái của bộ điều khiển PID: Hệ phương trình này được viết gọn lại như sau: Trong đó: ; ; ; ; Giả thiết rằng sai lệch của các góc biến khớp là: Trong đó: : Vị trí mong muốn của khớp : Vị trí phản hồi của khớp Do đó, không gian trạng thái của bộ điều khiển PID vị trí được biểu diễn như sau: Với: ; ; ; 1.2. Tổng quan về Learning Feed-forward Control (LFFC) Trong phần này của luận văn, giới thiệu về LFFC, nhưng trước tiên, đề cập một số khái niệm mới. 1.2.1. Điều khiển học (Learning Control - LC) Các bộ điều khiển học LC thường được hình dung giống như là một hệ thống điều khiển của con người và do đó nó có các thuộc tính giống với con người. Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ 13 Trong luận văn này không nghiên cứu bộ LC theo quan điểm sinh học nhưng dựa trên một số định nghĩa sau: Định nghĩa 1.1: Một bộ LC là một hệ thống điều khiển bao gồm trong đó một hàm xấp xỉ các ánh xạ đầu vào – đầu ra tương ứng trong suốt quá trình điều khiển sao cho hoạt động mong muốn của hệ thống điều khiển đạt được. Định nghĩa 1.2 (Hàm xấp xỉ): Một hàm xấp xỉ là một ánh xạ vào/ra được xác định bởi một hàm được lựa chọn F .,   , với các véc tơ thông số  được lựa chọn để hàm F . được xấp xỉ tốt nhất. Lưu ý: (Điều khiển tự học và điều khiển thích nghi): Theo hướng này, điều khiển thích nghi có thể được xem xét giống như là một dạng của LC trong đó một bộ xấp xỉ hàm được sử dụng có thể chỉ xấp xỉ một lớp giới hạn của hàm mục tiêu. Thông thường, một bộ LC sẽ bao gồm một bộ xấp xỉ hàm cho một đối tượng có nhiều hàm mục tiêu hơn. Ta có thể sử dụng nhiều kiểu xấp xỉ hàm như mạng neural, mạng neuro – fuzzy v..v.. Nói chung một cách sơ bộ, các bộ xấp xỉ hàm có thể được sử dụng theo 2 cách: Trước hết, bộ xấp xỉ hàm có thể được sử dụng để tạo (một phần) tín hiệu điều khiển. Việc học được tổ chức bằng cách thích nghi véc tơ thông số của bộ xấp xỉ hàm theo cách cực tiểu một số hàm chi phí. Bộ điều khiển này được gọi là LC trực tiếp. Thứ hai, bộ xấp xỉ hàm có thể được sử dụng để học một mô hình đối tượng. Dựa trên cơ sở của mô hình đã được học, bộ điều khiển được xây dựng, bộ điều khiển này được gọi là LC gián tiếp. Từ khi bộ LC đầu tiên được phát triển vào năm 1963 cho tới nay, lĩnh vực LC đã và đang phát triển rất rộng rãi. Rất nhiều các cấu trúc của bộ điều khiển khác nhau đã được đề xuất và các thuộc tính của chúng (như tính ổn định và tốc độ hội tụ đã được phân tích cả trong thực tế và lý thuyết). Tuy nhiên, mặc dù tất cả chúng đều được nghiên cứu nhưng chỉ có một số bộ LC được ứng dụng trong sản phẩm mang tính thương mại. Có thể vì những lý do sau đây: Việc chứng minh sự ổn định được đánh giá cao. Phần lớn các nghiên cứu lý thuyết của bộ LC được tập trung vào tính ổn định. Tuy nhiên, một bộ LC ổn định cũng không cần thiết mang lại một đáp ứng ngắn hạn học tốt….Hoạt động của bộ LC đối với một con robot đã được quan sát bằng mô phỏng. Sau khi thực hiện với chuyển động 6 bậc tự do, sai số hiệu chỉnh giảm xuống hệ số 2.8. Khi tiếp tục tự Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ 14 học, sai số hiệu chỉnh lên đến hệ số 1051 tại bước lặp thứ 62.000 và cuối cùng giảm xuống hệ số 10-18 tại bước lặp thứ 250.000. Như vậy, mặc dù thực tế cuối cùng sai số hiệu chỉnh nhỏ đã đạt được nhưng bộ LC không có giá trị thực nghiệm vì nó có dải sai số hiệu chỉnh rất rộng ở giữa. Không nên quá quan tâm tới sai số hiệu chỉnh điểm 0. Một số LC cố gắng đạt được sai số hiệu chỉnh điểm 0. Tuy nhiên, điều này yêu cầu có những tín hiệu điều khiển lớn ở những tần số trên băng thông hệ thống, các tần số này có thể gây nguy hiểm cho các cơ cấu chấp hành và nói chung là không đạt được như mong muốn. Loại sai số của hàm xấp xỉ. Trong đại đa số các bộ LC, hàm xấp xỉ được thực hiện với vai trò như một mạng nơ ron (Multi Layer Perceptron – MLP). Như chúng tôi sẽ bàn tới ở dưới đây, loại mạng nơ ron này không tương thích một cách đặc biệt cho việc điều khiển. Trên cơ sở những suy xét này, chúng ta có thể đưa ra một số các thuộc tính sau mà một bộ LC nên để trở thành một mặt hàng ưa chuộng về mặt thương mại: Dễ dàng sử dụng trong một hệ thống điều khiển có sẵn. Điều này có nghĩa là khi một đáp ứng ngắn hạn học tốt thì hiệu suất cực tiểu được bảo đảm. Ví dụ như là trong một bộ điều khiển hiện nay. Thậm chí trong suốt quá trình huấn luyện đối tượng vẫn có thể được duy trì trong quá trình vận hành mà không gây ra những tổn thất của quá trình sản xuất. Có khả năng sử dụng những kiến thức dự đoán của đối tượng. Nói chung các nhà thiết kế và/hoặc người vận hành có một số kiến thức về đối tượng, ví dụ như trong cấu trúc của mô hình toán học( đơn giản) dưới dạng các hàm, một giản đồ Bode của đối tượng hoặc một mô tả dưới dạng biến ngôn ngữ của hành vi đối tượng. Bộ LC nên cho phép loại kiến thức này được kết hợp vào trong thiết kế bộ điều khiển, để chọn các thông số của bộ điều khiển hợp lý và để tốc độ lệ học. Bộ xấp xỉ hàm nên phù hợp cho việc điều khiển. Điều này có nghĩa rằng: Cần sử dụng dung lượng nhớ nhỏ. Trong thực tế, bộ điều khiển được thực hiện bằng phần mềm được gắn vào máy tính. Dung lượng bộ nhớ là có hạn, do đó số lượng các thông số của bộ xấp xỉ hàm mà yêu cầu phải xấp xỉ tín hiệu điều khiển không thể quá rộng. Việc tính toán đầu ra của hàm xấp xỉ và sự tương thích của quan hệ vào/ra phải được thực hiện một cách nhanh chóng. Trong môi trường thời gian thực, trong một khoảng thời gian lấy mẫu, các thông số của hàm xấp xỉ phải tương ứng Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ 15 và đầu ra tính được. Rất nhiều hệ thống chuyển động cơ điện tử yêu cầu thời gian mẫu nhỏ và cho phép thời gian tính toán là rất ít. Các hàm xấp xỉ mà bao gồm một lượng lớn các tính toán phức tạp do đó chúng không phù hợp cho việc điều khiển. Cơ chế học cần hội tụ nhanh. Để giữ được lượng thời gian trong đó quá trình vận hành của hệ thống được điều khiển tối ưu từng phần, tiến tới mức cực tiểu, cơ chế học cần hội tụ nhanh. Cơ chế học không nên bị cực tiểu cục bộ, khi bị lưu giữ trong mức cực tiểu cục bộ, thì cơ chế học cho rằng các giá trị đạt được của các thông số của hàm xấp xỉ, được biểu thị bởi loc , sinh ra sai số xấp xỉ cực tiểu, được biểu thị bởi E ( loc ) . Mặc dù  glob  loc tồn tại, làm cho E ( glob )  E (loc ) . E  Cực tiểu cục bộ Cực tiểu toàn bộ loc glob loc Hình 1.2. Cực tiểu cục bộ trong kỹ thuật học Trong hình dưới đây một ví dụ theo một chiều của hiện tượng như vậy được giới thiệu. Ở mức cực tiểu cục bộ độ    loc , gradient của sai số xấp xỉ bằng 0. Cơ cấu học mà sử chỉ sử dụng gradient của sai số xấp xỉ thì không thể thoát khỏi mức cực tiểu cục bộ. Khi cơ chế học dễ dàng lưu lại ở mức tối thiểu cục bộ, rất khó để huấn luyện LC để thu được hiệu quả cao. Quan hệ vào/ ra phải tương thích một cách cục bộ. Trong một số hàm xấp xỉ, quan hệ vào/ ra này là tương thích toàn cục. Điều này có nghĩa là nếu giá trị của một trong các thông số của hàm xấp xỉ được tương thích, thì quan hệ vào /ra trên toàn bộ phạm vi đầu vào bị thay đổi. Xét một bộ LC được huấn luyện để thực hiện một số chuyển động. Khi bộ LC được huấn luyện để thực hiện một chuyển động mới, điều này liên quan tới việc tương ứng các thông số của hàm xấp xỉ. Bởi vì mối quan hệ vào ra được tương thích toàn cục nên các tín hiệu điều khiển học trước đó bị thay đổi có thể gây ra nhưng tổn thất trong quá trình làm Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ 16 việc. Do đó điều mong đợi ở đây là mối quan hệ vào ra của hàm xấp xỉ được tương thích một cách cục bộ. Trong trường hợp này, việc học một chuyển động mới sẽ không làm thay đổi các tín hiệu đã được học trước đó. Hàm xấp xỉ có khả năng tự khái quát hoá tốt. Khả năng tự khái quát hoá là khả năng tạo ra một đầu ra nhạy cho một đầu vào không được thể hiện trong quá trình huấn luyện nhưng nó tương tự như các huấn luyện mẫu. Khi hàm xấp xỉ có khả năng khái quát hoá tốt, bộ LC cũng sẽ thu được một hiệu quả bám cao cho các chuyển động tương tự các chuyển động được huấn luyện. Vì vậy nó đủ để huấn luyện LC với một lượng nhỏ các đặc tính chuyển động huấn luyện. Khi bộ xấp xỉ không có khả năng tự khái quát hoá tốt, bộ LC phải được huấn luyện cho mỗi chuyển động quan trọng, nó tạo ra một quá trình huấn luyện mở rộng . Sự mềm mại của giá trị xấp xỉ cần điều khiển được. Như nói ở phần trước đây, bộ LC không chỉ thu được sai số bằng không đối với một vài tần số, khi tín hiệu điều khiển có tần số cao sẽ không thỏa mãn theo mong muốn. Người sử dụng phải có khả năng quyết định tần số lớn nhất của đầu ra của hàm xấp xỉ. Đáp ứng ngắn hạn là học tốt. Đáp ứng ngắn hạn của bộ LC nên là loại đáp ứng mà có sai số bám dần hội tụ về giá trị mong muốn. Việc tăng sai số bám trong pha trung gian của quá trình học có thể làm hỏng đối tượng, hơn thế nữa, đây là trường hợp quá trình làm việc tối thiểu có thể không còn được bảo đảm khi bộ điều khiển được sử dụng như một thiết bị ghép thêm cho một bộ điều khiển đã có sẵn. Sự ổn định lâu dài cần phải được bảo đảm. Việc tự học có thể được thực hiện một cách liên tục hoặc được thực hiện trước khi vận hành. Việc học liên tục được yêu cầu khi các thông số của đối tượng thay đổi trong suốt quá trình vận hành. Ví dụ, do hao mòn hay chịu ảnh hưởng của môi trường. Trong trường hợp này, một bộ điều khiển phải có khả năng đảm bảo việc học ổn định bất chấp các điều kiện vận hành thay đổi như thế nào. 1.2.2. Bộ điều khiển học sử dụng sai lệch phản hồi (Feedback Error Learning FEL) Cấu trúc bộ điều khiển này được trình bày ở hình 1.3 Hệ thống LC bao gồm 2 phần: - Bộ điều khiển Feef-forward: Được biểu thị bằng F, nghĩa là 1 hàm/ánh xạ u F  F r  . Một bộ điều khiển Feed - forward thông thường có thể được sử dụng để bù thêm cho các hệ thống động học và theo cách này sẽ thu được độ bám chính xác Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ 17 Hàm xấp xỉ Hình 1.3: Cấu trúc bộ điều khiển phản hồi sai lệch cao. Khi bộ điều khiển feed-forward bằng với đối tượng nghịch đảo F  P 1 , thì đầu ra của đối tượng y sẽ bằng tín hiệu đặt r Đối tượng P , luôn chịu sự tác động của nhiễu. Các loại nhiễu ở bao gồm cả nhiễu ngẫu nhiên và nhiễu có bản chất chu kỳ. Những nhiễu chu kỳ tái diễn giống nhau khi một chuyển động cụ thể được lặp lại. Điều này có nghĩa rằng chúng có thể được xem xét như một hàm trạng thái của đối tượng x và có thể lường trước. - Bộ điều khiển phản phản hồi : Như đã được nói tới, bộ điều khiển phản hồi,C,cung cấp các tín hiệu học cho bộ điều khiển feed-forward. Hơn thế, nó xác định quá trình bám cực tiểu tại thời điểm bắt đầu học. Cuối cùng, bộ điều khiển phản hồi bù các nhiễu ngẫu nhiên. Bộ điều khiển FEL đã được thực hiện trong nhiều ứng dụng ví dụ như như: Hệ thống phanh tự động ô tô Điều khiển hệ thống camera Điều khiển cánh tay robot. Máy hàn. Các ứng dụng chỉ ra rằng bộ điều khiển FEL đã cải thiện một cách rõ ràng dựa trên quá trình vận hành của bộ điều khiển phản hồi và các ứng dụng này cũng chỉ ra có thể thu được chất lượng bám cao mà không cần mô hình mở rộng. Cách hoạt động của một bộ FEL được so sánh với cách hoạt động của hệ thống điều khiển thích nghi. Kết luận rằng, trong trường hợp mô hình đối tượng chính xác được sử dụng trong các hệ thống điều khiển thích nghi, quá trình bám của bộ điều khiển thích nghi và của bộ điều khiển FEL là tương tự như nhau. Khi FEL hội tụ chậm hơn bộ điều khiển thích nghi, trong tình huống này bộ điều khiển thích nghi được ưa chuộng hơn. Tuy nhiên khi chưa có một mô hình Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ 18 đối tượng chính xác, thì bộ điều khiển thích nghi sẽ không thể thu được hiệu suất bám như mong muốn. Bộ điều khiển FEL không phải trải qua điều này và nó vẫn đem lại hệ số bám chính xác. Khả năng này nâng cao giả thiết rằng bộ FEL có phù hợp cho hang loạt các ứng dụng mở rộng khi trong thực tế các đối tượng thường khó có một mô hình chính xác. Câu hỏi đặt ra là nếu xét về mặt thương mại thì nên sử dụng bộ điều khiển nào? Để trả lời cho câu hỏi này chúng ra sẽ đi đánh giá xem bộ điều khiển FEL có đáp ứng được đầy đủ các chỉ tiêu chất lượng mà ta đã đưa ra trong mục Learning Control hay không - Dễ dàng sử dụng trên hệ thống điều khiển có sẵn: Sự mở rộng duy nhất đối với hệ thống điều khiển có sẵn là hàm xấp xỉ. Khi hệ thống điều khiển được thực hiện bằng phần mềm điều này yêu cầu ít có sự thay đổi và có thể dễ dàng được thực hiện. - Sự hợp nhất các kiến thức quan trọng trong thiết kế: Khi cấu trúc của đối tượng động học được xác định, thì mạng MLP trong bộ điều khiển feedforward có thể tách ra thành một vài mạng MLP nhỏ hơn. Mỗi một mạng con này sẽ bù cho một phần riêng biệt của đối tượng động học. Những thí nghiệm đã chỉ ra rằng mạng này đã nâng tốc độ học lên đáng kể - Sự ổn định được xác lập: Điều này đã được chứng minh bằng lý thuyết rằng bộ điều khiển FEL sử dụng cho điều khiển cánh tay robot cho kết quả là hội tụ. Với các hệ thống khác, sự ổn định chưa được xét đến trên phương diện lý thuyết. - Đáp ứng quá độ tốt: Trong quá trình học, sai lệch bám sẽ dần hội tụ đến giá trị cực tiểu của nó. Giống như sự ổn định, đáp ứng ngắn hạn cũng chưa được xét tới trên phương diện lý thuyết - Hàm xấp xỉ phù hợp cho việc điều khiển: Rất nhiều các giá trị thực của bộ một LC phụ thuộc vào loại hàm xấp xỉ được sử dụng. Mặc dù thực tế là bộ điều khiển FEL cũng đạt được chất lượng bám cao nhưng cách học không phải là tối ưu cho mạng MLP. - Yêu cầu bộ nhớ nhỏ: Một trong số những thuộc tính tốt của MLP là nó có thể xấp xỉ các hàm mục tiêu đa chiều với một số ít các thông số. Do đó tổng dung lượng bộ nhớ của máy tính yêu cầu cho việc thực hiện là rất nhỏ. Tốn kém cho việc tính toán giá trị. Việc tính toán đầu ra của mạng MLP và trọng số của bộ thích nghi bao gồm một số lượng lớn các tính toán phức tạp. Do đó, với một số ứng dụng điều khiển thời gian thực thì loại mạng mạng nơ ron này có thể không phù hợp. Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/
- Xem thêm -

Tài liệu liên quan