Đại Học Quốc Gia Tp. Hồ Chí Minh
TRƯỜNG ĐẠI HỌC BÁCH KHOA
--------------------
NGUYỄN PHI DIỆU
ĐIỀU KHIỂN DỰ BÁO DÙNG MẠNG RBF
Chuyên ngành: Tự động hóa
LUẬN VĂN THẠC SĨ
TP. HỒ CHÍ MINH, tháng 06 năm 2009.
CÔNG TRÌNH ĐƯỢC HOÀN THÀNH TẠI
TRƯỜNG ĐẠI HỌC BÁCH KHOA
ĐẠI HỌC QUỐC GIA TP. HỒ CHÍ MINH
Cán bộ hướng dẫn khoa học: Ts. Nguyễn Thiện Thành ....................................
(Ghi rõ họ, tên, học hàm, học vị và chữ ký)
Cán bộ chấm nhận xét 1: P.Gs.Ts. Nguyễn Thị Phương Hà ..............................
(Ghi rõ họ, tên, học hàm, học vị và chữ ký)
Cán bộ chấm nhận xét 2: Ts. Huỳnh Thái Hoàng ..............................................
(Ghi rõ họ, tên, học hàm, học vị và chữ ký)
Luận văn thạc sĩ được bảo vệ tại HỘI ĐỒNG CHẤM BẢO VỆ LUẬN VĂN
THẠC SĨ
TRƯỜNG ĐẠI HỌC BÁCH KHOA, ngày 31 tháng 07 năm 2009
TRƯỜNG ĐẠI HỌC BÁCH KHOA
PHÒNG ĐÀO TẠO SĐH
CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM
ĐỘC LẬP – TỰ DO – HẠNH PHÚC
Tp. HCM, ngày . . . . tháng . . . . năm ... .
NHIỆM VỤ LUẬN VĂN THẠC SĨ
Họ tên học viên: Nguyễn Phi Diệu ................................... Phái: Nam
Ngày, tháng, năm sinh: 09-04-1983 .................................. Nơi sinh: Quảng Ngãi
Chuyên ngành: Tự động hóa ...................................................... MSHV: 01506346
I- TÊN ĐỀ TÀI: ĐIỀU KHIỂN DỰ BÁO DÙNG MẠNG RBF
II- NHIỆM VỤ VÀ NỘI DUNG:
- Khảo sát mô hình toán học và mô hình hóa máy bay trực thăng hai trục tự do .........
- Nghiên cứu phương pháp điều khiển dự báo cho hệ phi tuyến ..................................
- Thiết kế bộ điều khiển dự báo cho hệ phi tuyến dựa vào mạng RBF.........................
- Áp dụng bộ điều khiển dự báo dùng mạng RBF cho mô hình máy bay trực thăng
hai trục tự do .................................................................................................................
.......................................................................................................................................
.......................................................................................................................................
III- NGÀY GIAO NHIỆM VỤ (Ngày bắt đầu thực hiện LV ghi trong Quyết định
giao đề tài): ...................................................................................................................
IV- NGÀY HOÀN THÀNH NHIỆM VỤ:.................................................................
V- CÁN BỘ HƯỚNG DẪN (Ghi rõ học hàm, học vị, họ, tên): T.s. Nguyễn Thiện
Thành
(Học hàm, học vị, họ tên và chữ ký)
CÁN BỘ HƯỚNG DẪN
CN BỘ MÔN
QL CHUYÊN NGÀNH
Ts. Nguyễn Thiện Thành
Ts. Nguyễn Đức Thành
Nội dung và đề cương luận văn thạc sĩ đã được Hội đồng chuyên ngành thông qua.
TRƯỞNG PHÒNG ĐT – SĐH
Ngày
tháng
năm
TRƯỞNG KHOA QL NGÀNH
(Ghi chú: Học viên phải đóng tờ nhiệm vụ này vào trang đầu tiên của tập thuyết minh LV)
LỜI CẢM ƠN
Tôi xin chân thành cảm ơn giáo viên hướng dẫn, Ts. Nguyễn Thiện
Thành, đã tận tình hướng dẫn, góp ý và giúp đỡ để tôi hoàn thành đề tài luận
văn này.
Đồng thời tôi cũng cảm ơn các thầy cô ở Bộ môn Điều khiển Tự động,
Khoa Điện-Điện tử, Trường Đại học Bách Khoa Tp. Hồ Chí Minh đã nhiệt
tình dạy dỗ, truyền thụ cho tôi nhiều kiến thức và giúp đỡ nghiên cứu trong
suốt quá trình học tập ở trường.
Xin cảm ơn bố mẹ, người thân và bạn bè đã luôn ở bên tôi, động viên
và giúp đỡ để cho tôi có được ngày hôm nay.
Tp. Hồ Chí Minh, ngày 29 tháng 06 năm 2009
Học viên
Nguyễn Phi Diệu
ABSTRACT
MODEL PREDICTIVE CONTROL
BASED ON RADIAL BASIS FUNCTION NETWORKS
Nguyen Phi Dieu
Ho Chi Minh University of Technology
Nowadays, model predictive control (MPC) is an effective control strategy
used in variety of process industries. The predictive controller uses a model to
predict the future response of the system at the discrete times in a prediction
horizon, and a algorithm optimization to calculate the sequence of signal control
over a control horizon for a minimum error between the prediction response and
reference signal.
This work primarily is concerned with developing a nonlinear predictive
control methodology based on radial basis function (RBF) networks for nonlinear
dynamical systems.
The RBF neural network is employed to predict future model output . The
approximate model predictive control technique based on the RBF model or the
optimization technique based on Levenberg-Marquardt algorithm is employed to
calculate the optimal actuation sequence for nonlinear system. The proposed control
methodology is tested using a helicopter model. The proposed control strategy
proved to be successful. The controller is capable of tracking various set-point
changes.
Keywords
Radial Basis Function (RBF) Networks, Model Predictive Control.
TÓM TẮT
ĐIỀU KHIỂN DỰ BÁO DÙNG MẠNG RBF
Nguyễn Phi Diệu
Đại học Bách Khoa T.p Hồ Chí Minh
Hiện nay, điều khiển dự báo dựa vào mô hình là chiến lược điều khiển hiệu
quả được sử dụng phổ biến trong điều khiển quá trình. Bộ điều khiển dự báo dùng
một mô hình để dự báo đáp ứng tương lai của hệ thống tại các thời điểm rời rạc
trong một phạm vi dự báo nhất định, và một thuật toán tối ưu hoá để tính toán chuỗi
tín hiệu điều khiển tương lai trong phạm vi điều khiển sao cho sai lệch giữa đáp ứng
dự báo bởi mô hình và tín hiệu chuẩn cho trước là tối thiểu.
Đề tài nghiên cứu phương pháp điều khiển dự báo cho hệ phi tuyến dựa trên
mạng thần kinh nhân tạo hàm cơ sở xuyên tâm. Trong đó mạng hàm cơ sở xuyên
tâm được dùng để dự báo đáp ứng ngõ ra của hệ thống. Dựa vào đáp ứng dự báo
này, giải thuật điều khiển dự báo xấp xỉ hay giải thuật tối ưu dựa trên thuật toán
Levenberg-Marquardt được dùng để tính toán chuỗi tín hiệu điều khiển dự báo cho
hệ thống. Áp dụng giải thuật điều khiển dự báo cho đối tượng phi tuyến máy bay
trực thăng hai trục tự do cho kết quả tốt. Bộ điều khiển dự báo có khả năng điều
khiển ngõ ra của máy bay trực thăng bám theo tín hiệu đặt thay đổi.
i
MỤC LỤC
Chương I:
TỔNG QUAN VỀ ĐỀ TÀI ..................................................................... - 1 -
1.1 GIỚI THIỆU ĐỀ TÀI ............................................................................................ - 1 1.2 MỤC TIÊU ĐỀ TÀI............................................................................................... - 2 1.3 HƯỚNG GIẢI QUYẾT.......................................................................................... - 3 Chương II:
MẠNG THẦN KINH NHÂN TẠO ..................................................... - 5 -
2.1 GIỚI THIỆU .......................................................................................................... - 5 2.2 TẾ BÀO THẦN KINH VÀ MẠNG THẦN KINH NHÂN TẠO........................... - 6 2.2.1 Tế bào thần kinh .............................................................................................. - 6 2.2.2 Mạng thần kinh nhân tạo ................................................................................. - 8 2.3 CÁC PHƯƠNG PHÁP HUẤN LUYỆN MẠNG THẦN KINH NHÂN TẠO ...... - 9 2.3.1 Học có giám sát (Supervised Learning) ........................................................ - 10 2.3.2 Học củng cố (Reinforcement Learning)......................................................... - 10 2.3.3 Học không có giám sát (Unsupervied Learning) ........................................... - 11 2.4 MẠNG TRUYỀN THẲNG NHIỀU LỚP............................................................ - 12 2.4.1 Cấu trúc mạng ............................................................................................... - 12 2.4.2 Thuật toán lan truyền ngược (Back Propagation – BP) ................................ - 13 2.4.3 Các yếu tố ảnh hưởng đến quá trình huấn luyện mạng ................................. - 17 2.5 MẠNG HÀM CƠ SỞ XUYÊN TÂM ................................................................... - 19 2.5.1 Cấu trúc mạng hàm cơ sở xuyên tâm (Radial Basis Function -RBF) ........... - 19 2.5.2 Thuật toán huấn luyện mạng hàm cơ sở xuyên tâm ....................................... - 21 2.5.3 Các phương trình toán học của mạng RBF ................................................... - 23 Chương III:
LÝ THUYẾT ĐIỀU KHIỂN DỰ BÁO ............................................. - 25 -
3.1 NGUYÊN TẮC ĐIỀU KHIỂN DỰ BÁO ............................................................ - 25 3.2 PHƯƠNG TRÌNH ĐIỀU KHIỂN DỰ BÁO TIÊU BIỂU ................................. - 27 3.3 ĐIỀU KHIỂN DỰ BÁO MÔ HÌNH PHI TUYẾN ............................................. - 29 3.3.1 Nguyên tắc điều khiển dự báo mô hình phi tuyến .......................................... - 30 3.3.2 Công thức toán học của điều khiển dự báo mô hình phi tuyến..................... - 31 3.3.3 Tính chất của điều khiển dự báo mô hình phi tuyến ...................................... - 33 3.3.4 Một vài kết luận về điều khiển dự báo mô hình phi tuyến ............................. - 35 Chương IV:
NHẬN DẠNG HỆ THỐNG PHI TUYẾN ........................................ - 36 -
4.1 GIỚI THIỆU NHẬN DẠNG HỆ THỐNG ......................................................... - 36 -
ii
4.2 NHẬN DẠNG HỆ PHI TUYẾN ......................................................................... - 39 4.2.1 Bài toán nhận dạng ........................................................................................ - 39 4.2.2 Các phần tử hồi quy ....................................................................................... - 39 4.2.3 Ánh xạ phi tuyến ............................................................................................ - 40 4.2.4 Chọn cấu trúc mô hình................................................................................... - 44 4.2.5 Ước lượng thông số ....................................................................................... - 45 4.2.6 Đánh giá mô hình .......................................................................................... - 47 4.3 NHẬN DẠNG HỆ PHI TUYẾN DÙNG MÔ HÌNH MẠNG THẦN KINH ..... - 48 4.3.1 Nhận dạng dùng mạng truyền thẳng nhiều lớp ............................................. - 49 4.3.2 Nhận dạng dùng mạng hàm cơ sở xuyên tâm ................................................ - 50 Chương V:
ĐIỀU KHIỂN DỰ BÁO DÙNG MẠNG RBF .................................... - 55 -
5.1 HÀM MỤC TIÊU VÀ QUỸ ĐẠO CHUẨN ........................................................ - 55 5.2 CẬP NHẬT THÔNG SỐ ĐIỀU KHIỂN ............................................................ - 56 5.3 ĐIỀU KHIỂN DỰ BÁO VỚI GIẢI THUẬT TỐI ƯU DÙNG THUẬT TOÁN
LEVENBERG-MARQUART .................................................................................... - 57 5.3.1 Tối ưu hóa dùng thuật toán Levenberg-Marquardt ....................................... - 57 5.3.2 Giải thuật điều khiển dự báo sử dụng thuật toán Levenberg Marquardt. ..... - 58 5.4 ĐIỀU KHIỂN DỰ BÁO XẤP XỈ ........................................................................ - 60 5.4.1 Điều khiển dự báo xấp xỉ ............................................................................... - 60 5.4.2 Giải thuật điều khiển dự báo xấp xỉ dùng mạng RBF ................................... - 64 Chương VI:
KHẢO SÁT ĐỐI TƯỢNG ................................................................. - 66 -
VÀ PHẦN MỀM LIÊN QUAN.................................................................................... - 66 6.1 KHẢO SÁT ĐỐI TƯỢNG ................................................................................... - 66 6.1.1 Giới thiệu ....................................................................................................... - 66 6.1.2 Mô hình máy bay trực thăng hai trục tự do ................................................... - 66 6.1.3 Mô hình hóa máy bay trực thăng hai trục tự do bằng Simulink .................... - 86 6.2 KHẢO SÁT CÁC PHẦN MỀM LIÊN QUAN .................................................... - 89 6.2.1 Phần mềm Matlab .......................................................................................... - 90 6.2.2 Phần mềm WinconTM ................................................................................... - 90 6.2.3 S-Function ...................................................................................................... - 91 Chương VII:
KẾT QUẢ NHẬN DẠNG VÀ ĐIỀU KHIỂN
TRÊN MÔ HÌNH MÔ PHỎNG VÀ MÔ HÌNH THỰC ........................................... - 94 7.1 KHẢO SÁT MÔ HÌNH VỚI BỘ ĐIỀU KHIỂN LQR ....................................... - 94 -
iii
7.1.1 Sơ đồ điều khiển LQR .................................................................................... - 94 7.1.2 Kết quả điều khiển LQR ................................................................................. - 94 7.1.3 Nhận xét ......................................................................................................... - 95 7.2 NHẬN DẠNG MÔ HÌNH MÔ PHỎNG ............................................................. - 95 7.2.1 Kết quả nhận dạng ......................................................................................... - 95 7.2.2 Kết quả nhận dạng trục Pitch ........................................................................ - 96 7.2.3 Kết quả nhận dạng trục Yaw.......................................................................... - 98 7.3 ĐIỀU KHIỂN DỰ BÁO MÔ HÌNH MÔ PHỎNG........................................... - 101 7.3.1 Sơ đồ điều khiển ........................................................................................... - 101 7.3.2 Kết quả điều khiển trục Pitch ...................................................................... - 101 7.3.3 Kết quả điều khiển trục Yaw ........................................................................ - 102 7.4 NHẬN DẠNG VÀ ĐIỀU KHIỂN MÔ HÌNH THỰC ...................................... - 104 7.4.1 Sơ đồ thu thập dữ liệu .................................................................................. - 104 7.4.2 Sơ đồ điều khiển ........................................................................................... - 105 7.4.3 Kết quả điều khiển ....................................................................................... - 105 Chương VIII:
KẾT LUẬN VÀ
HƯỚNG PHÁT TRIỂN ĐỀ TÀI............................................................................... - 106 -
Luận văn tốt nghiệp
Chương I:
-1-
TỔNG QUAN VỀ ĐỀ TÀI
1.1 GIỚI THIỆU ĐỀ TÀI
Ngày nay, cùng với sự phát triển của máy tính, các kỹ thuật điều khiển hiện
đại dựa trên khả năng tính toán của máy tính ngày càng được áp dụng một cách phổ
biến, hiệu quả và chính xác. Trong đó, các phương pháp điều khiển sử dụng mô
hình của đối tượng để tính toán tín hiệu điều khiển ngày càng được nghiên cứu và
đưa vào ứng dụng rất rộng rãi. Điều khiển dự báo là một trong những phương pháp
điều khiển dựa vào mô hình (Model Predictive Control-MPC).
Ý tưởng sơ khai của điều khiển dự báo được đưa ra vào đầu thập niên 60 và
trở nên phổ biến vào thập niên 70. Tuy nhiên, trong giai đoạn đầu điều khiển dự báo
chỉ tập trung giải quyết những vấn đề của bài toán mô hình tuyến tính. Cho đến thập
niên 90 ta mới có thể chứng kiến sự phát triển mạnh mẽ trong lý thuyết điều khiển
cũng như trong ứng dụng thực tế của điều khiển dự báo áp dụng cho các mô hình
phi tuyến (Nonlinear Model Predictive Control -NMPC).
Hiện nay, điều khiển dự báo là chiến lược điều khiển được sử dụng phổ biến
nhất trong điều khiển quá trình. Bộ điều khiển dự báo dùng một mô hình để dự báo
đáp ứng tương lai của đối tượng điều khiển tại các thời điểm rời rạc trong một phạm
vi dự báo nhất định. Dựa vào đáp ứng dự báo này, một thuật toán tối ưu hoá được
sử dụng để tính toán chuỗi tín hiệu điều khiển tương lai trong phạm vi điều khiển
sao cho sai lệch giữa đáp ứng dự báo bởi mô hình và tín hiệu chuẩn cho trước là tối
thiểu. Phương pháp điều khiển dự báo là phương pháp tổng quát thiết kế bộ điều
khiển trong miền thời gian có thể áp dụng cho hệ tuyến tính cũng như phi tuyến, tuy
nhiên trong thực tế việc áp dụng chiến lược điều khiển dự báo cho hệ phi tuyến gặp
khó khăn. Thứ nhất là phải xây dựng được mô hình toán để dự báo chính xác trạng
thái của quá trình cần điều khiển trong phạm vi dự báo. Đối với hệ phi tuyến xây
dựng được mô hình toán chính xác là một bài toán khó vì đặc tính phi tuyến rất đa
dạng. Thứ hai là phải giải bài toán tối ưu phi tuyến để tính toán chuỗi tín hiệu điều
khiển trong phạm vi điều khiển. Tất cả các thuật toán tối ưu hóa phi tuyến đều là
CBHD: Ts. Nguyễn Thiện Thành
HVTH: Nguyễn Phi Diệu
Luận văn tốt nghiệp
-2-
thuật toán lặp đòi hỏi số lượng phép tính rất lớn, do đó hạn chế khả năng áp dụng
chiến lược điều khiển dự báo cho các hệ thống đòi hỏi tốc độ cao.
Trong những năm gần đây, lý thuyết mạng thần kinh nhân tạo (Artificial
Neural Networks-ANN) đã phát triển rất mạnh và áp dụng thành công vào các bài
toán điều khiển cũng như nhận dạng hệ phi tuyến. Đã có nhiều nghiên cứu sử dụng
mô hình mạng thần kinh nhân tạo trong hệ thống điều khiển dự báo nhờ vào tính
linh hoạt cao trong nhận dạng và điều khiển, có thể xấp xỉ hàm phi tuyến trơn với
sai số nhỏ nếu số tế bào lớp ẩn đủ lớn. Trong điều khiển dự báo, mô hình mạng thần
kinh được sử dụng để nhận dạng đặc tính động học của hệ thống và dự báo các ngõ
ra. Dựa trên các ngõ ra dự báo và hàm mục tiêu, giá trị ngõ vào được tính toán trên
cơ sở tối ưu hàm mục tiêu. Kết quả tính toán được đưa vào bộ điều khiển hệ thống.
Có nhiều cấu trúc mạng thần kinh nhân tạo như: mạng một lớp, mạng nhiều
lớp, mạng truyền thẳng, mạng hồi quy,…Trong đó mạng hàm cơ sở xuyên tâm
(Radial Basis Function Networks-RBF) là một trường hợp đặc biệt của mạng
truyền thẳng hai lớp, với khả năng xấp xỉ hàm tốt, có thể huấn luyện dễ dàng, nhanh
chóng và không gặp vấn đề liên quan đến cực trị cục bộ. Một trong những ưu điểm
của mạng RBF là các trọng số tuyến tính ở lớp ra có thể xem như độc lập với các tế
bào thần kinh ở lớp ẩn. Sau khi trọng số lớp ẩn đã được huấn luyện dùng thuật toán
tối ưu hóa phi tuyến thì trọng số của lớp ra được huấn luyện dùng thuật toán tối ưu
hóa tuyến tính.
Trong đề tài này, học viên thực hiện sẽ tìm hiểu về lý thuyết nhận dạng và
điều khiển dự báo dựa vào mạng thần kinh nhân tạo, sử dụng mạng RBF, áp dụng
cho mô hình phi tuyến. Tiếp theo ứng dụng để điều khiển đối tượng phi tuyến cụ thể
trong thực tế. Học viên thực hiện thực hiện đề tài này với tên:
“Điều khiển dự báo dùng mạng RBF”.
1.2 MỤC TIÊU ĐỀ TÀI
Dựa trên việc định hướng nghiên cứu đề tài, học viên đưa ra mục tiêu của đề
tài như sau:
1. Tìm hiểu cơ sở lý thuyết mạng thần kinh nhân tạo.
CBHD: Ts. Nguyễn Thiện Thành
HVTH: Nguyễn Phi Diệu
Luận văn tốt nghiệp
-3-
2. Tìm hiểu cơ sở lý thuyết điều khiển dự báo.
3. Tìm hiểu cơ sở lý thuyết nhận dạng hệ thống.
4. Sử dụng mô hình mạng hàm cơ sở xuyên tâm để nhận dạng và điều khiển
dự báo hệ phi tuyến.
5. Áp dụng vào nhận dạng và điều khiển mô phỏng hệ phi tuyến.
6. Áp dụng điều khiển đối tượng thực.
1.3 HƯỚNG GIẢI QUYẾT
Điều khiển dự báo dựa vào mô hình (Model Predictive Control-MPC) có
nhiều dạng khác nhau, mỗi dạng có một đặc điểm riêng, tuy nhiên tất cả các hệ
thống MPC đều dựa trên ý tưởng chủ đạo, đó là tính toán các giá trị ngõ vào cho đối
tượng bằng cách giải quyết vấn đề tối ưu online (realtime). Vấn đề đó được xây
dựng trên nền tảng của việc mô hình hóa quá trình và đo lường quá trình. Đo lường
quá trình cung cấp các tín hiệu hồi tiếp cho cấu trúc của MPC. Sơ đồ Hình 1.1 mô
tả cấu trúc tiêu biểu của hệ thống MPC. Để điều khiển dự báo ta phải có tất cả các
thông số sau:
- Ngõ vào và ngõ ra của mô hình.
- Dự báo nhiễu.
- Hàm mục tiêu.
- Đo lường.
- Giới hạn vào-ra.
- Thời gian lấy mẫu (thời gian để giải quyết vấn đề tối ưu online).
Hình 1.1 Cấu trúc tiêu biểu của điều khiển dự báo
CBHD: Ts. Nguyễn Thiện Thành
HVTH: Nguyễn Phi Diệu
Luận văn tốt nghiệp
-4-
Dựa trên ý tưởng cơ bản của điều khiển dự báo ta thấy các vấn đề quan trọng
cần phải được quan tâm là:
Thứ nhất: Điều khiển dự báo trước tiên phải có mô hình đối tượng. Để thành
lập mô hình của đối tượng ta có dựa vào việc mô hình hóa hay nhận dạng đối tượng.
Đối với những đối tượng đơn giản, ta có thể lập mô hình đối tượng dựa vào mô hình
hoá đối tượng trên cơ sở của các phương trình động học của đối tượng. Đối với
những đối tượng phức tạp, ta không biết được đặc tính động học của đối tượng, mô
hình của đối tượng được xây dựng trên nhận dạng hệ thống dựa vào ngõ vào và ngõ
ra của đối tượng. Chất lượng điều khiển dự báo phụ thuộc rất nhiều vào chất lượng
của mô hình nhận dạng.
Thứ hai: Xây dựng hàm mục tiêu cho đối tượng đảm bảo chất lượng điều
khiển trong điều kiện làm việc cũng như hiệu quả điều khiển (tối ưu về thời gian,
công suất, năng lượng,…).
Thứ ba: Xây dựng thuật toán để giải quyết bài toán tối ưu hàm mục tiêu.
Vấn đề giải quyết bài toán tối ưu là vấn đề rất quan trọng, vì bài toán điều khiển dự
báo đòi hỏi phải giải quyết bài toán tối ưu online, do đó việc tính toán tìm lời giải
phải được thực hiện trong thời gian ngắn, trong khoảng thời gian thu thập dữ liệu –
chu kì lấy mẫu. Trước đây, do những hạn chế trong tính toán, điều khiển dự báo chỉ
được áp dụng trong những hệ thống có đáp ứng chậm, có thời gian lấy mẫu lớn như
hệ thống trao đổi nhiệt, cột chưng cất…. Ngày nay, với sự phát triển của máy tính
với tốc độ tính toán cao, cùng với sự phát triển của các thuật toán tối ưu, điều khiển
dự báo có thể được áp dụng vào các đối tượng yêu cầu thời gian lấy mẫu bé hơn.
Trong đề tài này, học viên sẽ viết chương trình thực hiện các thuật toán nhận
dạng và điều khiển dự báo, áp dụng các thuật toán này vào nhận dạng và điều khiển
mô hình được xây dựng trên Simulink của Matlab, sau đó áp dụng vào nhận dạng và
điều khiển mô hình thực trong phòng thí nghiệm. Với các mô hình này, quá trình
điều khiển được thực hiện trên Simulink của Matlab, sau đó sử dụng phần mềm
Wincon của hãng Quanser để biên dịch và điều khiển đối tượng. Các thuật toán
nhận dạng và điều khiển đối tượng được viết trên M-file và xây dựng trên Sfunction.
CBHD: Ts. Nguyễn Thiện Thành
HVTH: Nguyễn Phi Diệu
Luận văn tốt nghiệp
Chương II:
-5-
MẠNG THẦN KINH NHÂN TẠO
2.1 GIỚI THIỆU
Bộ não con người (Hình 2.1) là hệ thống xử lý thông tin phức hợp, phi tuyến
và song song có khả năng học, ghi nhớ, tổng quát hóa và xử lý lỗi. Bộ não con
người gồm khoảng 1011 tế bào thần kinh liên kết với nhau thành mạng. Mỗi tế bào
thần kinh sinh học (Hình 2.2) gồm 3 thành phần chính là thân tế bào (soma), một hệ
thống hình cây các đầu dây thần kinh vào (dendrite) và một trục (axon) dẫn đến đầu
dây thần kinh ra. Tại đầu của các dây thần kinh có các khớp thần kinh (synapse) để
kết nối với các tế bào thần kinh khác. Mỗi tế bào thần kinh trong bộ não con người
có khoảng 104 khớp thần kinh. Có hai loại khớp nối: khớp nối kích thích
(excitatory) hoặc khớp nối ức chế (inhibitory).
Tín hiệu truyền trong các dây thần kinh vào và dây thần kinh ra của các tế
bào thần kinh là tín hiệu điện phát sinh thông qua các quá trình phản ứng và giải
phóng các chất hữu cơ. Các chất này được phát ra từ các khớp nối dẫn tới các dây
thần kinh vào sẽ làm tăng hay giảm điện thế của nhân tế bào. Khi điện thế này đạt
đến một ngưỡng nào đó, sẽ tạo ra một xung điện dẫn đến trục dây thần kinh ra.
Xung này được truyền theo trục, tới các nhánh rẽ khi chạm tới các khớp nối với các
tế bào thần kinh khác sẽ giải phóng các chất truyền điện. Quá trình lan truyền tín
hiệu cứ tiếp tục như vậy cho đến khi đến đầu ra cuối cùng.
Hình 2.1 Bộ não con người
Hình 2.2 Tế bào thần kinh sinh học
CBHD: Ts. Nguyễn Thiện Thành
HVTH: Nguyễn Phi Diệu
Luận văn tốt nghiệp
-6-
Mạng thần kinh nhân tạo là mô hình toán học đơn giản của bộ não con
người, bản chất mạng thần kinh nhân tạo là mạng tính toán phân bố song song. Hầu
hết các mạng thần kinh nhân tạo phải được huấn luyện trước khi sử dụng. Đã có rất
nhiều nghiên cứu về mạng thần kinh nhân tạo và đến nay rất nhiều cấu hình mạng
và thuật toán huấn luyện tương ứng được công bố để giải quyết các bài toán khác
nhau.
Chương này trình bày cơ bản về tế bào thần kinh, cấu trúc và thuật toán huấn
luyện các loại mạng thần kinh phổ biến trong lĩnh vực điều khiển thông minh.
2.2 TẾ BÀO THẦN KINH VÀ MẠNG THẦN KINH NHÂN TẠO
2.2.1 Tế bào thần kinh
Mạng thần kinh nhân tạo (gọi ngắn gọn là mạng thần kinh) có thể xem như là
mô hình toán học đơn giản của bộ não con người. Mạng thần kinh gồm các tế bào
thần kinh (đơn vị xử lý) kết nối với nhau bởi các liên kết. Mỗi liên kết kèm theo một
trọng số, đặc trưng cho đặc tính kích thích hay ức chế giữa các tế bào thần kinh.
Hình 2.3 Tế bào thần kinh nhân tạo
Mỗi tế bào thần kinh được nối với các tế bào thần kinh khác và nhận các tính
hiệu xj từ chúng với các trọng số wj.
Đặt x = [ x1
w = [ w1
x2 ... xm ] : vector tín hiệu vào các tế bào thần kinh (2.1)
T
w2 ... wm ] : vector trọng số của tế bào thần kinh
T
(2.2)
Quá trình xử lý thông tin của tế bào thần kinh có thể chia thành hai phần: xử
lý ở ngõ vào và xử lý ở ngõ ra. Hàm xử lý ở ngõ vào là hàm tổng có dạng như sau.
Hàm tuyến tính (linear function):
CBHD: Ts. Nguyễn Thiện Thành
HVTH: Nguyễn Phi Diệu
Luận văn tốt nghiệp
-7-
⎛ m
⎞
f = net = ⎜ ∑ w j x j ⎟ − θ = wT x − θ
⎝ j =1
⎠
(2.3)
Hàm toàn phương (quadratic function):
⎛ m
⎞
f = net = ⎜ ∑ w j x 2j ⎟ − θ
⎝ j =1
⎠
(2.4)
Hàm cầu (spherical function):
m
⎛
2⎞
T
f = net = ⎜ ρ −2 ∑ ( x j − w j ) ⎟ − θ = ρ −2 ( x − w ) ( x − w ) − θ
j =1
⎝
⎠
(2.5)
Trong các biểu thức trên θ là mức ngưỡng của tế bào thần kinh. Thường hàm
tổng ở ngõ vào đươc sử dụng nhiều nhất là hàm tuyến tính (2.3).
Ngõ ra của mỗi tế bào thần kinh được cho bởi biểu thức: y = a(f)
(2.6)
Hàm a(.)gọi là hàm tác động (activation function) hay hàm truyền (transfer
function). Các dạng hàm tác động thường dùng là:
⎧ 1 if f ≥ 0
Hàm nấc: a( f ) = ⎨
⎩0 if f < 0
(2.7)
⎧1 if f ≥ 0
Hàm dấu: a ( f ) = ⎨
⎩-1 if f < 0
(2.8)
Hàm tuyến tính: a(f) = f
(2.9)
⎧1 if f > 1
⎪
Hàm dốc bão hòa: a ( f ) = ⎨ f if 0 ≤ f ≤ 1
⎪0 if f < 0
⎩
(2.10)
⎧1 if f > 1
⎪
Hàm tuyến tính bão hòa: a ( f ) = ⎨ f if 0 ≤ f ≤ 1
⎪ −1 if f < −1
⎩
(2.11)
Hàm dạng S đơn cực: a ( f ) =
1
1 + e− λ f
Hàm dạng S lưỡng cực: a ( f ) =
CBHD: Ts. Nguyễn Thiện Thành
2
−1
1 + e− λ f
(2.12)
(2.13)
HVTH: Nguyễn Phi Diệu
Luận văn tốt nghiệp
-8-
Hình 2.4 Các dạng hàm tác động thường dùng
a. Hàm nấc b. Hàm dấu c. Hàm dốcbão hòa
d. Hàm tuyến tính bão hòa e. Hàm dạng S đơn cực f. Hàm dạng S lưỡng cực
Chú ý rằng, tế bào thần kinh có m tính hiệu vào với mức ngưỡng θ có thể
biến đổi tương đương thành tế bào thần kinh có m+1 tín hiệu vào với mức
ngưỡng θ = 0 như sau:
Hình 2.5 Biến đổi tương đương tế bào thần kinh về dạng có mức ngưỡng bằng 0
Tổng có trọng số của các tín hiệu vào của tế bào thần kinh Hình 2.5 là:
m
⎛ m
⎞
f = net = ⎜ ∑ w j x j ⎟ − 0 = ∑ w j x j − θ
j =1
⎝ j =0
⎠
(2.14)
Rõ ràng biểu thức (2.3) và (2.14) là tương đương nhau. Vì vậy, để cho đơn
giản (và cũng không mất tính tổng quát), từ đây về sau chúng ta chỉ xét các tế bào
thần kinh có mức ngưỡng θ = 0 .
2.2.2 Mạng thần kinh nhân tạo
Mạng thần kinh nhân tạo gồm nhiều tế bào thần kinh liên kết chặt chẽ với
nhau. Tùy theo cấu trúc mạng, người ta chia ra các loại mạng sau (Hình 2.6)
CBHD: Ts. Nguyễn Thiện Thành
HVTH: Nguyễn Phi Diệu
Luận văn tốt nghiệp
-9-
- Mạng một lớp là mạng chỉ gồm một lớp tế bào thần kinh xử lý.
- Mạng nhiều lớp là mạng gồm nhiều lớp tế bào thần kinh xử lý.
- Mạng truyền thẳng là mạng mà trong đó tín hiệu chỉ truyền theo một chiều
từ ngõ vào đến ngõ ra.
- Mạng hồi quy mà mạng mà trong đó có tín hiệu hồi tiếp từ ngõ ra trở về
ngõ vào.
Hình 2.6 Các loại mạng thần kinh nhân tạo thường gặp
a. Mạng thần kinh truyền thẳng một lớp b. Mạng thần kinh truyền thẳng nhiều lớp
c. Mạng thần kinh hồi quy một lớp d. Mạng thần kinh hồi quy nhiều lớp
2.3 CÁC PHƯƠNG PHÁP HUẤN LUYỆN MẠNG THẦN KINH NHÂN TẠO
Mạng thần kinh nhân tạo phải được huấn luyện trước khi sử dụng. Có hai
kiểu huấn luyện:
- Học thông số (Parameter learning): để cập nhật các trọng số liên kết giữa
các tế bào thần kinh trong mạng.
- Học cấu trúc (Structure learning): để thay đổi cấu trúc mạng, bao gồm số tế
bào thần kinh và cách liên kết giữa chúng.
Hai kiểu học trên có thể sử dụng đồng thời hay riêng lẽ. Có 3 phương pháp
học thông số.
CBHD: Ts. Nguyễn Thiện Thành
HVTH: Nguyễn Phi Diệu
Luận văn tốt nghiệp
- 10 -
2.3.1 Học có giám sát (Supervised Learning)
Trong phương pháp học có giám sát, dữ liệu huấn luyện mạng thần kinh là
tập các mẫu (dữ liệu vào – dữ liệu ra) mong muốn. Giả sử có K mẫu dữ liệu huấn
luyện mạng:
{( x (1) , d (1) ) ; ( x ( 2 ) , d ( 2 ) ) ;...; ( x ( K ) , d ( K ) )}
Ban đầu các trọng số của mạng được khởi động giá trị bất kì. Lần lượt từng
dữ liệu vào x(k) được đưa vào các ngõ vào của mạng, mạng thần kinh tính được dữ
liệu ở ngõ ra là y(k). Dữ liệu ra y(k) được so sánh với dữ liệu ra mong muốn d(k).
Sai số e(k)= d(k)- y(k) được sử dụng để cập nhật trọng số của mạng (Hình 2.7).
Hình 2.7 Học có giám sát
2.3.2 Học củng cố (Reinforcement Learning)
Trong phương pháp học có giám sát, chúng ta đã biết dữ liệu ở ngõ ra của
mạng tương ứng với mỗi mẫu tín hiệu vào. Tuy nhiên trong thực tế, không phải lúc
nào chúng ta cũng có được thông tin đầy đủ như vậy. Ví dụ, trong một số trường
hợp chúng ta chỉ biết ngõ ra thực của mạng là “đúng” hay “ sai” so với ngõ ra mong
muốn. Phương pháp học dựa trên thông tin đánh giá như trên gọi là học củng cố.
Thông tin đánh giá chỉ cho biết mức độ “ đúng” hay “sai” của ma trận mà không chỉ
dẫn được phải thay đổi ma trận trọng số như thế nào để đi đến kết quả đúng (Hình
2.8).
Hình 2.8 Học củng cố
CBHD: Ts. Nguyễn Thiện Thành
HVTH: Nguyễn Phi Diệu
Luận văn tốt nghiệp
- 11 -
2.3.3 Học không có giám sát (Unsupervied Learning)
Trong phương pháp học không có giám sát, không có thông tin phản hồi cho
biết ngõ ra của mạng là đúng hay sai. Mạng thần kinh phải tự phát hiện các đặc
điểm, các mối tương quan, hay các nhóm của tập mẫu dữ liệu vào và mã hóa chúng
thành dữ liệu ra của mạng.Trong khi phát hiện ra các đặc điểm này, mạng thần kinh
thay đổi thông số của nó, quá trình này gọi là tự tổ chức (Hình 2.9).
Hình 2.9 Học không có giám sát
Chúng ta vừa xét ba phương pháp huấn luyện mạng thần kinh nhân tạo. Dù
huấn luyện mạng thần kinh nhân tạo theo phương pháp nào thì sơ đồ tổng quát để
huấn luyện một tế bào thần kinh cũng có dạng như sau:
Trong Hình 2.10, tín hiệu vào xj (j=1,2,…,m) có thể là tín hiệu ra từ một tế
bào thần kinh khác hoặc có thể là tín hiệu vào từ bên ngoài. Chú ý rằng mức
ngưỡng θ của tế bào thần kinh cũng bao gồm trong quá trình học như là một trọng
số của ngõ vào x0 có giá trị cố định bằng -1. Tín hiệu ra mong muốn di chỉ tồn tại
trong phương pháp học có giám sát, hoặc trong phương pháp học củng cố, di là tín
hiệu đánh giá.Tổng quát vector trọng số của tế bào thần kinh hay đổi theo quy luật
sau:
wi (k + 1) = wi (k ) ++wi (k )
(2.15)
Trong đó +wi (k ) là biến thiên của vector trọng số tại bước lặp thứ k.
+wi (k ) = η rx(k )
(2.16)
η là một số dương quyết định tốc độ học, gọi là hằng số học; r là tín hiệu
học, tổng quát là hàm của wi, x và tín hiệu mong muốn di (nếu tồn tại).
r = f r ( wi (k ), x(k ), di )
CBHD: Ts. Nguyễn Thiện Thành
(2.17)
HVTH: Nguyễn Phi Diệu
- Xem thêm -