Đăng ký Đăng nhập
Trang chủ điều khiển dự báo dùng mạng rbf ...

Tài liệu điều khiển dự báo dùng mạng rbf

.PDF
119
3
84

Mô tả:

Đại Học Quốc Gia Tp. Hồ Chí Minh TRƯỜNG ĐẠI HỌC BÁCH KHOA -------------------- NGUYỄN PHI DIỆU ĐIỀU KHIỂN DỰ BÁO DÙNG MẠNG RBF Chuyên ngành: Tự động hóa LUẬN VĂN THẠC SĨ TP. HỒ CHÍ MINH, tháng 06 năm 2009. CÔNG TRÌNH ĐƯỢC HOÀN THÀNH TẠI TRƯỜNG ĐẠI HỌC BÁCH KHOA ĐẠI HỌC QUỐC GIA TP. HỒ CHÍ MINH Cán bộ hướng dẫn khoa học: Ts. Nguyễn Thiện Thành .................................... (Ghi rõ họ, tên, học hàm, học vị và chữ ký) Cán bộ chấm nhận xét 1: P.Gs.Ts. Nguyễn Thị Phương Hà .............................. (Ghi rõ họ, tên, học hàm, học vị và chữ ký) Cán bộ chấm nhận xét 2: Ts. Huỳnh Thái Hoàng .............................................. (Ghi rõ họ, tên, học hàm, học vị và chữ ký) Luận văn thạc sĩ được bảo vệ tại HỘI ĐỒNG CHẤM BẢO VỆ LUẬN VĂN THẠC SĨ TRƯỜNG ĐẠI HỌC BÁCH KHOA, ngày 31 tháng 07 năm 2009 TRƯỜNG ĐẠI HỌC BÁCH KHOA PHÒNG ĐÀO TẠO SĐH CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM ĐỘC LẬP – TỰ DO – HẠNH PHÚC Tp. HCM, ngày . . . . tháng . . . . năm ... . NHIỆM VỤ LUẬN VĂN THẠC SĨ Họ tên học viên: Nguyễn Phi Diệu ................................... Phái: Nam Ngày, tháng, năm sinh: 09-04-1983 .................................. Nơi sinh: Quảng Ngãi Chuyên ngành: Tự động hóa ...................................................... MSHV: 01506346 I- TÊN ĐỀ TÀI: ĐIỀU KHIỂN DỰ BÁO DÙNG MẠNG RBF II- NHIỆM VỤ VÀ NỘI DUNG: - Khảo sát mô hình toán học và mô hình hóa máy bay trực thăng hai trục tự do ......... - Nghiên cứu phương pháp điều khiển dự báo cho hệ phi tuyến .................................. - Thiết kế bộ điều khiển dự báo cho hệ phi tuyến dựa vào mạng RBF......................... - Áp dụng bộ điều khiển dự báo dùng mạng RBF cho mô hình máy bay trực thăng hai trục tự do ................................................................................................................. ....................................................................................................................................... ....................................................................................................................................... III- NGÀY GIAO NHIỆM VỤ (Ngày bắt đầu thực hiện LV ghi trong Quyết định giao đề tài): ................................................................................................................... IV- NGÀY HOÀN THÀNH NHIỆM VỤ:................................................................. V- CÁN BỘ HƯỚNG DẪN (Ghi rõ học hàm, học vị, họ, tên): T.s. Nguyễn Thiện Thành (Học hàm, học vị, họ tên và chữ ký) CÁN BỘ HƯỚNG DẪN CN BỘ MÔN QL CHUYÊN NGÀNH Ts. Nguyễn Thiện Thành Ts. Nguyễn Đức Thành Nội dung và đề cương luận văn thạc sĩ đã được Hội đồng chuyên ngành thông qua. TRƯỞNG PHÒNG ĐT – SĐH Ngày tháng năm TRƯỞNG KHOA QL NGÀNH (Ghi chú: Học viên phải đóng tờ nhiệm vụ này vào trang đầu tiên của tập thuyết minh LV) LỜI CẢM ƠN Tôi xin chân thành cảm ơn giáo viên hướng dẫn, Ts. Nguyễn Thiện Thành, đã tận tình hướng dẫn, góp ý và giúp đỡ để tôi hoàn thành đề tài luận văn này. Đồng thời tôi cũng cảm ơn các thầy cô ở Bộ môn Điều khiển Tự động, Khoa Điện-Điện tử, Trường Đại học Bách Khoa Tp. Hồ Chí Minh đã nhiệt tình dạy dỗ, truyền thụ cho tôi nhiều kiến thức và giúp đỡ nghiên cứu trong suốt quá trình học tập ở trường. Xin cảm ơn bố mẹ, người thân và bạn bè đã luôn ở bên tôi, động viên và giúp đỡ để cho tôi có được ngày hôm nay. Tp. Hồ Chí Minh, ngày 29 tháng 06 năm 2009 Học viên Nguyễn Phi Diệu ABSTRACT MODEL PREDICTIVE CONTROL BASED ON RADIAL BASIS FUNCTION NETWORKS Nguyen Phi Dieu Ho Chi Minh University of Technology Nowadays, model predictive control (MPC) is an effective control strategy used in variety of process industries. The predictive controller uses a model to predict the future response of the system at the discrete times in a prediction horizon, and a algorithm optimization to calculate the sequence of signal control over a control horizon for a minimum error between the prediction response and reference signal. This work primarily is concerned with developing a nonlinear predictive control methodology based on radial basis function (RBF) networks for nonlinear dynamical systems. The RBF neural network is employed to predict future model output . The approximate model predictive control technique based on the RBF model or the optimization technique based on Levenberg-Marquardt algorithm is employed to calculate the optimal actuation sequence for nonlinear system. The proposed control methodology is tested using a helicopter model. The proposed control strategy proved to be successful. The controller is capable of tracking various set-point changes. Keywords Radial Basis Function (RBF) Networks, Model Predictive Control. TÓM TẮT ĐIỀU KHIỂN DỰ BÁO DÙNG MẠNG RBF Nguyễn Phi Diệu Đại học Bách Khoa T.p Hồ Chí Minh Hiện nay, điều khiển dự báo dựa vào mô hình là chiến lược điều khiển hiệu quả được sử dụng phổ biến trong điều khiển quá trình. Bộ điều khiển dự báo dùng một mô hình để dự báo đáp ứng tương lai của hệ thống tại các thời điểm rời rạc trong một phạm vi dự báo nhất định, và một thuật toán tối ưu hoá để tính toán chuỗi tín hiệu điều khiển tương lai trong phạm vi điều khiển sao cho sai lệch giữa đáp ứng dự báo bởi mô hình và tín hiệu chuẩn cho trước là tối thiểu. Đề tài nghiên cứu phương pháp điều khiển dự báo cho hệ phi tuyến dựa trên mạng thần kinh nhân tạo hàm cơ sở xuyên tâm. Trong đó mạng hàm cơ sở xuyên tâm được dùng để dự báo đáp ứng ngõ ra của hệ thống. Dựa vào đáp ứng dự báo này, giải thuật điều khiển dự báo xấp xỉ hay giải thuật tối ưu dựa trên thuật toán Levenberg-Marquardt được dùng để tính toán chuỗi tín hiệu điều khiển dự báo cho hệ thống. Áp dụng giải thuật điều khiển dự báo cho đối tượng phi tuyến máy bay trực thăng hai trục tự do cho kết quả tốt. Bộ điều khiển dự báo có khả năng điều khiển ngõ ra của máy bay trực thăng bám theo tín hiệu đặt thay đổi. i MỤC LỤC Chương I: TỔNG QUAN VỀ ĐỀ TÀI ..................................................................... - 1 - 1.1 GIỚI THIỆU ĐỀ TÀI ............................................................................................ - 1 1.2 MỤC TIÊU ĐỀ TÀI............................................................................................... - 2 1.3 HƯỚNG GIẢI QUYẾT.......................................................................................... - 3 Chương II: MẠNG THẦN KINH NHÂN TẠO ..................................................... - 5 - 2.1 GIỚI THIỆU .......................................................................................................... - 5 2.2 TẾ BÀO THẦN KINH VÀ MẠNG THẦN KINH NHÂN TẠO........................... - 6 2.2.1 Tế bào thần kinh .............................................................................................. - 6 2.2.2 Mạng thần kinh nhân tạo ................................................................................. - 8 2.3 CÁC PHƯƠNG PHÁP HUẤN LUYỆN MẠNG THẦN KINH NHÂN TẠO ...... - 9 2.3.1 Học có giám sát (Supervised Learning) ........................................................ - 10 2.3.2 Học củng cố (Reinforcement Learning)......................................................... - 10 2.3.3 Học không có giám sát (Unsupervied Learning) ........................................... - 11 2.4 MẠNG TRUYỀN THẲNG NHIỀU LỚP............................................................ - 12 2.4.1 Cấu trúc mạng ............................................................................................... - 12 2.4.2 Thuật toán lan truyền ngược (Back Propagation – BP) ................................ - 13 2.4.3 Các yếu tố ảnh hưởng đến quá trình huấn luyện mạng ................................. - 17 2.5 MẠNG HÀM CƠ SỞ XUYÊN TÂM ................................................................... - 19 2.5.1 Cấu trúc mạng hàm cơ sở xuyên tâm (Radial Basis Function -RBF) ........... - 19 2.5.2 Thuật toán huấn luyện mạng hàm cơ sở xuyên tâm ....................................... - 21 2.5.3 Các phương trình toán học của mạng RBF ................................................... - 23 Chương III: LÝ THUYẾT ĐIỀU KHIỂN DỰ BÁO ............................................. - 25 - 3.1 NGUYÊN TẮC ĐIỀU KHIỂN DỰ BÁO ............................................................ - 25 3.2 PHƯƠNG TRÌNH ĐIỀU KHIỂN DỰ BÁO TIÊU BIỂU ................................. - 27 3.3 ĐIỀU KHIỂN DỰ BÁO MÔ HÌNH PHI TUYẾN ............................................. - 29 3.3.1 Nguyên tắc điều khiển dự báo mô hình phi tuyến .......................................... - 30 3.3.2 Công thức toán học của điều khiển dự báo mô hình phi tuyến..................... - 31 3.3.3 Tính chất của điều khiển dự báo mô hình phi tuyến ...................................... - 33 3.3.4 Một vài kết luận về điều khiển dự báo mô hình phi tuyến ............................. - 35 Chương IV: NHẬN DẠNG HỆ THỐNG PHI TUYẾN ........................................ - 36 - 4.1 GIỚI THIỆU NHẬN DẠNG HỆ THỐNG ......................................................... - 36 - ii 4.2 NHẬN DẠNG HỆ PHI TUYẾN ......................................................................... - 39 4.2.1 Bài toán nhận dạng ........................................................................................ - 39 4.2.2 Các phần tử hồi quy ....................................................................................... - 39 4.2.3 Ánh xạ phi tuyến ............................................................................................ - 40 4.2.4 Chọn cấu trúc mô hình................................................................................... - 44 4.2.5 Ước lượng thông số ....................................................................................... - 45 4.2.6 Đánh giá mô hình .......................................................................................... - 47 4.3 NHẬN DẠNG HỆ PHI TUYẾN DÙNG MÔ HÌNH MẠNG THẦN KINH ..... - 48 4.3.1 Nhận dạng dùng mạng truyền thẳng nhiều lớp ............................................. - 49 4.3.2 Nhận dạng dùng mạng hàm cơ sở xuyên tâm ................................................ - 50 Chương V: ĐIỀU KHIỂN DỰ BÁO DÙNG MẠNG RBF .................................... - 55 - 5.1 HÀM MỤC TIÊU VÀ QUỸ ĐẠO CHUẨN ........................................................ - 55 5.2 CẬP NHẬT THÔNG SỐ ĐIỀU KHIỂN ............................................................ - 56 5.3 ĐIỀU KHIỂN DỰ BÁO VỚI GIẢI THUẬT TỐI ƯU DÙNG THUẬT TOÁN LEVENBERG-MARQUART .................................................................................... - 57 5.3.1 Tối ưu hóa dùng thuật toán Levenberg-Marquardt ....................................... - 57 5.3.2 Giải thuật điều khiển dự báo sử dụng thuật toán Levenberg Marquardt. ..... - 58 5.4 ĐIỀU KHIỂN DỰ BÁO XẤP XỈ ........................................................................ - 60 5.4.1 Điều khiển dự báo xấp xỉ ............................................................................... - 60 5.4.2 Giải thuật điều khiển dự báo xấp xỉ dùng mạng RBF ................................... - 64 Chương VI: KHẢO SÁT ĐỐI TƯỢNG ................................................................. - 66 - VÀ PHẦN MỀM LIÊN QUAN.................................................................................... - 66 6.1 KHẢO SÁT ĐỐI TƯỢNG ................................................................................... - 66 6.1.1 Giới thiệu ....................................................................................................... - 66 6.1.2 Mô hình máy bay trực thăng hai trục tự do ................................................... - 66 6.1.3 Mô hình hóa máy bay trực thăng hai trục tự do bằng Simulink .................... - 86 6.2 KHẢO SÁT CÁC PHẦN MỀM LIÊN QUAN .................................................... - 89 6.2.1 Phần mềm Matlab .......................................................................................... - 90 6.2.2 Phần mềm WinconTM ................................................................................... - 90 6.2.3 S-Function ...................................................................................................... - 91 Chương VII: KẾT QUẢ NHẬN DẠNG VÀ ĐIỀU KHIỂN TRÊN MÔ HÌNH MÔ PHỎNG VÀ MÔ HÌNH THỰC ........................................... - 94 7.1 KHẢO SÁT MÔ HÌNH VỚI BỘ ĐIỀU KHIỂN LQR ....................................... - 94 - iii 7.1.1 Sơ đồ điều khiển LQR .................................................................................... - 94 7.1.2 Kết quả điều khiển LQR ................................................................................. - 94 7.1.3 Nhận xét ......................................................................................................... - 95 7.2 NHẬN DẠNG MÔ HÌNH MÔ PHỎNG ............................................................. - 95 7.2.1 Kết quả nhận dạng ......................................................................................... - 95 7.2.2 Kết quả nhận dạng trục Pitch ........................................................................ - 96 7.2.3 Kết quả nhận dạng trục Yaw.......................................................................... - 98 7.3 ĐIỀU KHIỂN DỰ BÁO MÔ HÌNH MÔ PHỎNG........................................... - 101 7.3.1 Sơ đồ điều khiển ........................................................................................... - 101 7.3.2 Kết quả điều khiển trục Pitch ...................................................................... - 101 7.3.3 Kết quả điều khiển trục Yaw ........................................................................ - 102 7.4 NHẬN DẠNG VÀ ĐIỀU KHIỂN MÔ HÌNH THỰC ...................................... - 104 7.4.1 Sơ đồ thu thập dữ liệu .................................................................................. - 104 7.4.2 Sơ đồ điều khiển ........................................................................................... - 105 7.4.3 Kết quả điều khiển ....................................................................................... - 105 Chương VIII: KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN ĐỀ TÀI............................................................................... - 106 -  Luận văn tốt nghiệp Chương I: -1- TỔNG QUAN VỀ ĐỀ TÀI 1.1 GIỚI THIỆU ĐỀ TÀI Ngày nay, cùng với sự phát triển của máy tính, các kỹ thuật điều khiển hiện đại dựa trên khả năng tính toán của máy tính ngày càng được áp dụng một cách phổ biến, hiệu quả và chính xác. Trong đó, các phương pháp điều khiển sử dụng mô hình của đối tượng để tính toán tín hiệu điều khiển ngày càng được nghiên cứu và đưa vào ứng dụng rất rộng rãi. Điều khiển dự báo là một trong những phương pháp điều khiển dựa vào mô hình (Model Predictive Control-MPC). Ý tưởng sơ khai của điều khiển dự báo được đưa ra vào đầu thập niên 60 và trở nên phổ biến vào thập niên 70. Tuy nhiên, trong giai đoạn đầu điều khiển dự báo chỉ tập trung giải quyết những vấn đề của bài toán mô hình tuyến tính. Cho đến thập niên 90 ta mới có thể chứng kiến sự phát triển mạnh mẽ trong lý thuyết điều khiển cũng như trong ứng dụng thực tế của điều khiển dự báo áp dụng cho các mô hình phi tuyến (Nonlinear Model Predictive Control -NMPC). Hiện nay, điều khiển dự báo là chiến lược điều khiển được sử dụng phổ biến nhất trong điều khiển quá trình. Bộ điều khiển dự báo dùng một mô hình để dự báo đáp ứng tương lai của đối tượng điều khiển tại các thời điểm rời rạc trong một phạm vi dự báo nhất định. Dựa vào đáp ứng dự báo này, một thuật toán tối ưu hoá được sử dụng để tính toán chuỗi tín hiệu điều khiển tương lai trong phạm vi điều khiển sao cho sai lệch giữa đáp ứng dự báo bởi mô hình và tín hiệu chuẩn cho trước là tối thiểu. Phương pháp điều khiển dự báo là phương pháp tổng quát thiết kế bộ điều khiển trong miền thời gian có thể áp dụng cho hệ tuyến tính cũng như phi tuyến, tuy nhiên trong thực tế việc áp dụng chiến lược điều khiển dự báo cho hệ phi tuyến gặp khó khăn. Thứ nhất là phải xây dựng được mô hình toán để dự báo chính xác trạng thái của quá trình cần điều khiển trong phạm vi dự báo. Đối với hệ phi tuyến xây dựng được mô hình toán chính xác là một bài toán khó vì đặc tính phi tuyến rất đa dạng. Thứ hai là phải giải bài toán tối ưu phi tuyến để tính toán chuỗi tín hiệu điều khiển trong phạm vi điều khiển. Tất cả các thuật toán tối ưu hóa phi tuyến đều là CBHD: Ts. Nguyễn Thiện Thành HVTH: Nguyễn Phi Diệu Luận văn tốt nghiệp -2- thuật toán lặp đòi hỏi số lượng phép tính rất lớn, do đó hạn chế khả năng áp dụng chiến lược điều khiển dự báo cho các hệ thống đòi hỏi tốc độ cao. Trong những năm gần đây, lý thuyết mạng thần kinh nhân tạo (Artificial Neural Networks-ANN) đã phát triển rất mạnh và áp dụng thành công vào các bài toán điều khiển cũng như nhận dạng hệ phi tuyến. Đã có nhiều nghiên cứu sử dụng mô hình mạng thần kinh nhân tạo trong hệ thống điều khiển dự báo nhờ vào tính linh hoạt cao trong nhận dạng và điều khiển, có thể xấp xỉ hàm phi tuyến trơn với sai số nhỏ nếu số tế bào lớp ẩn đủ lớn. Trong điều khiển dự báo, mô hình mạng thần kinh được sử dụng để nhận dạng đặc tính động học của hệ thống và dự báo các ngõ ra. Dựa trên các ngõ ra dự báo và hàm mục tiêu, giá trị ngõ vào được tính toán trên cơ sở tối ưu hàm mục tiêu. Kết quả tính toán được đưa vào bộ điều khiển hệ thống. Có nhiều cấu trúc mạng thần kinh nhân tạo như: mạng một lớp, mạng nhiều lớp, mạng truyền thẳng, mạng hồi quy,…Trong đó mạng hàm cơ sở xuyên tâm (Radial Basis Function Networks-RBF) là một trường hợp đặc biệt của mạng truyền thẳng hai lớp, với khả năng xấp xỉ hàm tốt, có thể huấn luyện dễ dàng, nhanh chóng và không gặp vấn đề liên quan đến cực trị cục bộ. Một trong những ưu điểm của mạng RBF là các trọng số tuyến tính ở lớp ra có thể xem như độc lập với các tế bào thần kinh ở lớp ẩn. Sau khi trọng số lớp ẩn đã được huấn luyện dùng thuật toán tối ưu hóa phi tuyến thì trọng số của lớp ra được huấn luyện dùng thuật toán tối ưu hóa tuyến tính. Trong đề tài này, học viên thực hiện sẽ tìm hiểu về lý thuyết nhận dạng và điều khiển dự báo dựa vào mạng thần kinh nhân tạo, sử dụng mạng RBF, áp dụng cho mô hình phi tuyến. Tiếp theo ứng dụng để điều khiển đối tượng phi tuyến cụ thể trong thực tế. Học viên thực hiện thực hiện đề tài này với tên: “Điều khiển dự báo dùng mạng RBF”. 1.2 MỤC TIÊU ĐỀ TÀI Dựa trên việc định hướng nghiên cứu đề tài, học viên đưa ra mục tiêu của đề tài như sau: 1. Tìm hiểu cơ sở lý thuyết mạng thần kinh nhân tạo. CBHD: Ts. Nguyễn Thiện Thành HVTH: Nguyễn Phi Diệu Luận văn tốt nghiệp -3- 2. Tìm hiểu cơ sở lý thuyết điều khiển dự báo. 3. Tìm hiểu cơ sở lý thuyết nhận dạng hệ thống. 4. Sử dụng mô hình mạng hàm cơ sở xuyên tâm để nhận dạng và điều khiển dự báo hệ phi tuyến. 5. Áp dụng vào nhận dạng và điều khiển mô phỏng hệ phi tuyến. 6. Áp dụng điều khiển đối tượng thực. 1.3 HƯỚNG GIẢI QUYẾT Điều khiển dự báo dựa vào mô hình (Model Predictive Control-MPC) có nhiều dạng khác nhau, mỗi dạng có một đặc điểm riêng, tuy nhiên tất cả các hệ thống MPC đều dựa trên ý tưởng chủ đạo, đó là tính toán các giá trị ngõ vào cho đối tượng bằng cách giải quyết vấn đề tối ưu online (realtime). Vấn đề đó được xây dựng trên nền tảng của việc mô hình hóa quá trình và đo lường quá trình. Đo lường quá trình cung cấp các tín hiệu hồi tiếp cho cấu trúc của MPC. Sơ đồ Hình 1.1 mô tả cấu trúc tiêu biểu của hệ thống MPC. Để điều khiển dự báo ta phải có tất cả các thông số sau: - Ngõ vào và ngõ ra của mô hình. - Dự báo nhiễu. - Hàm mục tiêu. - Đo lường. - Giới hạn vào-ra. - Thời gian lấy mẫu (thời gian để giải quyết vấn đề tối ưu online). Hình 1.1 Cấu trúc tiêu biểu của điều khiển dự báo CBHD: Ts. Nguyễn Thiện Thành HVTH: Nguyễn Phi Diệu Luận văn tốt nghiệp -4- Dựa trên ý tưởng cơ bản của điều khiển dự báo ta thấy các vấn đề quan trọng cần phải được quan tâm là: Thứ nhất: Điều khiển dự báo trước tiên phải có mô hình đối tượng. Để thành lập mô hình của đối tượng ta có dựa vào việc mô hình hóa hay nhận dạng đối tượng. Đối với những đối tượng đơn giản, ta có thể lập mô hình đối tượng dựa vào mô hình hoá đối tượng trên cơ sở của các phương trình động học của đối tượng. Đối với những đối tượng phức tạp, ta không biết được đặc tính động học của đối tượng, mô hình của đối tượng được xây dựng trên nhận dạng hệ thống dựa vào ngõ vào và ngõ ra của đối tượng. Chất lượng điều khiển dự báo phụ thuộc rất nhiều vào chất lượng của mô hình nhận dạng. Thứ hai: Xây dựng hàm mục tiêu cho đối tượng đảm bảo chất lượng điều khiển trong điều kiện làm việc cũng như hiệu quả điều khiển (tối ưu về thời gian, công suất, năng lượng,…). Thứ ba: Xây dựng thuật toán để giải quyết bài toán tối ưu hàm mục tiêu. Vấn đề giải quyết bài toán tối ưu là vấn đề rất quan trọng, vì bài toán điều khiển dự báo đòi hỏi phải giải quyết bài toán tối ưu online, do đó việc tính toán tìm lời giải phải được thực hiện trong thời gian ngắn, trong khoảng thời gian thu thập dữ liệu – chu kì lấy mẫu. Trước đây, do những hạn chế trong tính toán, điều khiển dự báo chỉ được áp dụng trong những hệ thống có đáp ứng chậm, có thời gian lấy mẫu lớn như hệ thống trao đổi nhiệt, cột chưng cất…. Ngày nay, với sự phát triển của máy tính với tốc độ tính toán cao, cùng với sự phát triển của các thuật toán tối ưu, điều khiển dự báo có thể được áp dụng vào các đối tượng yêu cầu thời gian lấy mẫu bé hơn. Trong đề tài này, học viên sẽ viết chương trình thực hiện các thuật toán nhận dạng và điều khiển dự báo, áp dụng các thuật toán này vào nhận dạng và điều khiển mô hình được xây dựng trên Simulink của Matlab, sau đó áp dụng vào nhận dạng và điều khiển mô hình thực trong phòng thí nghiệm. Với các mô hình này, quá trình điều khiển được thực hiện trên Simulink của Matlab, sau đó sử dụng phần mềm Wincon của hãng Quanser để biên dịch và điều khiển đối tượng. Các thuật toán nhận dạng và điều khiển đối tượng được viết trên M-file và xây dựng trên Sfunction. CBHD: Ts. Nguyễn Thiện Thành HVTH: Nguyễn Phi Diệu Luận văn tốt nghiệp Chương II: -5- MẠNG THẦN KINH NHÂN TẠO 2.1 GIỚI THIỆU Bộ não con người (Hình 2.1) là hệ thống xử lý thông tin phức hợp, phi tuyến và song song có khả năng học, ghi nhớ, tổng quát hóa và xử lý lỗi. Bộ não con người gồm khoảng 1011 tế bào thần kinh liên kết với nhau thành mạng. Mỗi tế bào thần kinh sinh học (Hình 2.2) gồm 3 thành phần chính là thân tế bào (soma), một hệ thống hình cây các đầu dây thần kinh vào (dendrite) và một trục (axon) dẫn đến đầu dây thần kinh ra. Tại đầu của các dây thần kinh có các khớp thần kinh (synapse) để kết nối với các tế bào thần kinh khác. Mỗi tế bào thần kinh trong bộ não con người có khoảng 104 khớp thần kinh. Có hai loại khớp nối: khớp nối kích thích (excitatory) hoặc khớp nối ức chế (inhibitory). Tín hiệu truyền trong các dây thần kinh vào và dây thần kinh ra của các tế bào thần kinh là tín hiệu điện phát sinh thông qua các quá trình phản ứng và giải phóng các chất hữu cơ. Các chất này được phát ra từ các khớp nối dẫn tới các dây thần kinh vào sẽ làm tăng hay giảm điện thế của nhân tế bào. Khi điện thế này đạt đến một ngưỡng nào đó, sẽ tạo ra một xung điện dẫn đến trục dây thần kinh ra. Xung này được truyền theo trục, tới các nhánh rẽ khi chạm tới các khớp nối với các tế bào thần kinh khác sẽ giải phóng các chất truyền điện. Quá trình lan truyền tín hiệu cứ tiếp tục như vậy cho đến khi đến đầu ra cuối cùng. Hình 2.1 Bộ não con người Hình 2.2 Tế bào thần kinh sinh học CBHD: Ts. Nguyễn Thiện Thành HVTH: Nguyễn Phi Diệu Luận văn tốt nghiệp -6- Mạng thần kinh nhân tạo là mô hình toán học đơn giản của bộ não con người, bản chất mạng thần kinh nhân tạo là mạng tính toán phân bố song song. Hầu hết các mạng thần kinh nhân tạo phải được huấn luyện trước khi sử dụng. Đã có rất nhiều nghiên cứu về mạng thần kinh nhân tạo và đến nay rất nhiều cấu hình mạng và thuật toán huấn luyện tương ứng được công bố để giải quyết các bài toán khác nhau. Chương này trình bày cơ bản về tế bào thần kinh, cấu trúc và thuật toán huấn luyện các loại mạng thần kinh phổ biến trong lĩnh vực điều khiển thông minh. 2.2 TẾ BÀO THẦN KINH VÀ MẠNG THẦN KINH NHÂN TẠO 2.2.1 Tế bào thần kinh Mạng thần kinh nhân tạo (gọi ngắn gọn là mạng thần kinh) có thể xem như là mô hình toán học đơn giản của bộ não con người. Mạng thần kinh gồm các tế bào thần kinh (đơn vị xử lý) kết nối với nhau bởi các liên kết. Mỗi liên kết kèm theo một trọng số, đặc trưng cho đặc tính kích thích hay ức chế giữa các tế bào thần kinh. Hình 2.3 Tế bào thần kinh nhân tạo Mỗi tế bào thần kinh được nối với các tế bào thần kinh khác và nhận các tính hiệu xj từ chúng với các trọng số wj. Đặt x = [ x1 w = [ w1 x2 ... xm ] : vector tín hiệu vào các tế bào thần kinh (2.1) T w2 ... wm ] : vector trọng số của tế bào thần kinh T (2.2) Quá trình xử lý thông tin của tế bào thần kinh có thể chia thành hai phần: xử lý ở ngõ vào và xử lý ở ngõ ra. Hàm xử lý ở ngõ vào là hàm tổng có dạng như sau. Hàm tuyến tính (linear function): CBHD: Ts. Nguyễn Thiện Thành HVTH: Nguyễn Phi Diệu Luận văn tốt nghiệp -7- ⎛ m ⎞ f = net = ⎜ ∑ w j x j ⎟ − θ = wT x − θ ⎝ j =1 ⎠ (2.3) Hàm toàn phương (quadratic function): ⎛ m ⎞ f = net = ⎜ ∑ w j x 2j ⎟ − θ ⎝ j =1 ⎠ (2.4) Hàm cầu (spherical function): m ⎛ 2⎞ T f = net = ⎜ ρ −2 ∑ ( x j − w j ) ⎟ − θ = ρ −2 ( x − w ) ( x − w ) − θ j =1 ⎝ ⎠ (2.5) Trong các biểu thức trên θ là mức ngưỡng của tế bào thần kinh. Thường hàm tổng ở ngõ vào đươc sử dụng nhiều nhất là hàm tuyến tính (2.3). Ngõ ra của mỗi tế bào thần kinh được cho bởi biểu thức: y = a(f) (2.6) Hàm a(.)gọi là hàm tác động (activation function) hay hàm truyền (transfer function). Các dạng hàm tác động thường dùng là: ⎧ 1 if f ≥ 0 Hàm nấc: a( f ) = ⎨ ⎩0 if f < 0 (2.7) ⎧1 if f ≥ 0 Hàm dấu: a ( f ) = ⎨ ⎩-1 if f < 0 (2.8) Hàm tuyến tính: a(f) = f (2.9) ⎧1 if f > 1 ⎪ Hàm dốc bão hòa: a ( f ) = ⎨ f if 0 ≤ f ≤ 1 ⎪0 if f < 0 ⎩ (2.10) ⎧1 if f > 1 ⎪ Hàm tuyến tính bão hòa: a ( f ) = ⎨ f if 0 ≤ f ≤ 1 ⎪ −1 if f < −1 ⎩ (2.11) Hàm dạng S đơn cực: a ( f ) = 1 1 + e− λ f Hàm dạng S lưỡng cực: a ( f ) = CBHD: Ts. Nguyễn Thiện Thành 2 −1 1 + e− λ f (2.12) (2.13) HVTH: Nguyễn Phi Diệu Luận văn tốt nghiệp -8- Hình 2.4 Các dạng hàm tác động thường dùng a. Hàm nấc b. Hàm dấu c. Hàm dốcbão hòa d. Hàm tuyến tính bão hòa e. Hàm dạng S đơn cực f. Hàm dạng S lưỡng cực Chú ý rằng, tế bào thần kinh có m tính hiệu vào với mức ngưỡng θ có thể biến đổi tương đương thành tế bào thần kinh có m+1 tín hiệu vào với mức ngưỡng θ = 0 như sau: Hình 2.5 Biến đổi tương đương tế bào thần kinh về dạng có mức ngưỡng bằng 0 Tổng có trọng số của các tín hiệu vào của tế bào thần kinh Hình 2.5 là: m ⎛ m ⎞ f = net = ⎜ ∑ w j x j ⎟ − 0 = ∑ w j x j − θ j =1 ⎝ j =0 ⎠ (2.14) Rõ ràng biểu thức (2.3) và (2.14) là tương đương nhau. Vì vậy, để cho đơn giản (và cũng không mất tính tổng quát), từ đây về sau chúng ta chỉ xét các tế bào thần kinh có mức ngưỡng θ = 0 . 2.2.2 Mạng thần kinh nhân tạo Mạng thần kinh nhân tạo gồm nhiều tế bào thần kinh liên kết chặt chẽ với nhau. Tùy theo cấu trúc mạng, người ta chia ra các loại mạng sau (Hình 2.6) CBHD: Ts. Nguyễn Thiện Thành HVTH: Nguyễn Phi Diệu Luận văn tốt nghiệp -9- - Mạng một lớp là mạng chỉ gồm một lớp tế bào thần kinh xử lý. - Mạng nhiều lớp là mạng gồm nhiều lớp tế bào thần kinh xử lý. - Mạng truyền thẳng là mạng mà trong đó tín hiệu chỉ truyền theo một chiều từ ngõ vào đến ngõ ra. - Mạng hồi quy mà mạng mà trong đó có tín hiệu hồi tiếp từ ngõ ra trở về ngõ vào. Hình 2.6 Các loại mạng thần kinh nhân tạo thường gặp a. Mạng thần kinh truyền thẳng một lớp b. Mạng thần kinh truyền thẳng nhiều lớp c. Mạng thần kinh hồi quy một lớp d. Mạng thần kinh hồi quy nhiều lớp 2.3 CÁC PHƯƠNG PHÁP HUẤN LUYỆN MẠNG THẦN KINH NHÂN TẠO Mạng thần kinh nhân tạo phải được huấn luyện trước khi sử dụng. Có hai kiểu huấn luyện: - Học thông số (Parameter learning): để cập nhật các trọng số liên kết giữa các tế bào thần kinh trong mạng. - Học cấu trúc (Structure learning): để thay đổi cấu trúc mạng, bao gồm số tế bào thần kinh và cách liên kết giữa chúng. Hai kiểu học trên có thể sử dụng đồng thời hay riêng lẽ. Có 3 phương pháp học thông số. CBHD: Ts. Nguyễn Thiện Thành HVTH: Nguyễn Phi Diệu Luận văn tốt nghiệp - 10 - 2.3.1 Học có giám sát (Supervised Learning) Trong phương pháp học có giám sát, dữ liệu huấn luyện mạng thần kinh là tập các mẫu (dữ liệu vào – dữ liệu ra) mong muốn. Giả sử có K mẫu dữ liệu huấn luyện mạng: {( x (1) , d (1) ) ; ( x ( 2 ) , d ( 2 ) ) ;...; ( x ( K ) , d ( K ) )} Ban đầu các trọng số của mạng được khởi động giá trị bất kì. Lần lượt từng dữ liệu vào x(k) được đưa vào các ngõ vào của mạng, mạng thần kinh tính được dữ liệu ở ngõ ra là y(k). Dữ liệu ra y(k) được so sánh với dữ liệu ra mong muốn d(k). Sai số e(k)= d(k)- y(k) được sử dụng để cập nhật trọng số của mạng (Hình 2.7). Hình 2.7 Học có giám sát 2.3.2 Học củng cố (Reinforcement Learning) Trong phương pháp học có giám sát, chúng ta đã biết dữ liệu ở ngõ ra của mạng tương ứng với mỗi mẫu tín hiệu vào. Tuy nhiên trong thực tế, không phải lúc nào chúng ta cũng có được thông tin đầy đủ như vậy. Ví dụ, trong một số trường hợp chúng ta chỉ biết ngõ ra thực của mạng là “đúng” hay “ sai” so với ngõ ra mong muốn. Phương pháp học dựa trên thông tin đánh giá như trên gọi là học củng cố. Thông tin đánh giá chỉ cho biết mức độ “ đúng” hay “sai” của ma trận mà không chỉ dẫn được phải thay đổi ma trận trọng số như thế nào để đi đến kết quả đúng (Hình 2.8). Hình 2.8 Học củng cố CBHD: Ts. Nguyễn Thiện Thành HVTH: Nguyễn Phi Diệu Luận văn tốt nghiệp - 11 - 2.3.3 Học không có giám sát (Unsupervied Learning) Trong phương pháp học không có giám sát, không có thông tin phản hồi cho biết ngõ ra của mạng là đúng hay sai. Mạng thần kinh phải tự phát hiện các đặc điểm, các mối tương quan, hay các nhóm của tập mẫu dữ liệu vào và mã hóa chúng thành dữ liệu ra của mạng.Trong khi phát hiện ra các đặc điểm này, mạng thần kinh thay đổi thông số của nó, quá trình này gọi là tự tổ chức (Hình 2.9). Hình 2.9 Học không có giám sát Chúng ta vừa xét ba phương pháp huấn luyện mạng thần kinh nhân tạo. Dù huấn luyện mạng thần kinh nhân tạo theo phương pháp nào thì sơ đồ tổng quát để huấn luyện một tế bào thần kinh cũng có dạng như sau: Trong Hình 2.10, tín hiệu vào xj (j=1,2,…,m) có thể là tín hiệu ra từ một tế bào thần kinh khác hoặc có thể là tín hiệu vào từ bên ngoài. Chú ý rằng mức ngưỡng θ của tế bào thần kinh cũng bao gồm trong quá trình học như là một trọng số của ngõ vào x0 có giá trị cố định bằng -1. Tín hiệu ra mong muốn di chỉ tồn tại trong phương pháp học có giám sát, hoặc trong phương pháp học củng cố, di là tín hiệu đánh giá.Tổng quát vector trọng số của tế bào thần kinh hay đổi theo quy luật sau: wi (k + 1) = wi (k ) ++wi (k ) (2.15) Trong đó +wi (k ) là biến thiên của vector trọng số tại bước lặp thứ k. +wi (k ) = η rx(k ) (2.16) η là một số dương quyết định tốc độ học, gọi là hằng số học; r là tín hiệu học, tổng quát là hàm của wi, x và tín hiệu mong muốn di (nếu tồn tại). r = f r ( wi (k ), x(k ), di ) CBHD: Ts. Nguyễn Thiện Thành (2.17) HVTH: Nguyễn Phi Diệu
- Xem thêm -

Tài liệu liên quan