BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƢỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
---------------------------------------
NGÔ NGỌC HOÀNG
ỨNG DỤNG MẠNG NƠRON TRONG ĐIỀU KHIỂN THÍCH NGHI
Chuyên ngành: ĐIỀU KHIỂN VÀ TỰ ĐỘNG HÓA
LUẬN VĂN THẠC SĨ KỸ THUẬT
ĐIỀU KHIỂN VÀ TỰ ĐỘNG HÓA
NGƢỜI HƢỚNG DẪN KHOA HỌC
TS. ĐÀO PHƢƠNG NAM
HÀ NỘI – 2017
Luận văn Thạc Sĩ
Chuyên ngành: Điều khiển & Tự Động Hóa
MỤC LỤC
LỜI CAM ĐOAN ...................................................................................................... 4
PHẦN MỞ ĐẦU ........................................................................................................ 5
CHƢƠNG 1: TỔNG QUAN VỀ MẠNG NƠRON NHÂN TẠO .......................... 8
1.1.
Lịch sử phát triển của mạng nơron nhân tạo ................................................. 8
1.2.
Các tính chất của mạng nơron nhân tạo ........................................................ 9
1.3.
Cấu trúc và mô hình mạng nơ-ron ................................................................. 9
1.4.
Những mô hình nơ-ron thƣờng sử dụng ...................................................... 12
1.5.
Cấu tạo mạng nơ-ron ................................................................................... 12
1.6.
Phƣơng thức làm việc của mạng nơ-ron ...................................................... 15
1.7.
Các luật học ................................................................................................. 17
1.8.
Mạng nơron truyền thẳng và mạng nơron hồi quy ...................................... 21
1.8.1.
Mạng nơron truyền thẳng...................................................................... 21
1.8.2.
Mạng nơron hồi quy.............................................................................. 22
1.9.
Ứng dụng mạng nơron trong điều khiển tự động ........................................ 27
1.10. Công nghệ phần cứng sử dụng mạng nơron ................................................ 28
1.11. So sánh khả năng của mạng nơron với mạch lôgíc ..................................... 29
1.12. Kết luận chƣơng 1 ....................................................................................... 30
CHƢƠNG 2: ĐIỀU KHIỂN THÍCH NGHI, ROBOT, MẠNG NƠRON VÀ
BỘ ĐIỀU KHIỂN PHẢN HỒI RISE ................................................................... 31
2.1.
Điều khiển thích nghi .................................................................................. 31
2.2.
Robot công nghiệp ....................................................................................... 32
2.2.1.
Tổng quan về Robot công nghiệp ......................................................... 32
2.2.2.
Động lực học Robot .............................................................................. 33
Ngô Ngọc Hoàng
1
ĐK-TĐH2015B
Luận văn Thạc Sĩ
Chuyên ngành: Điều khiển & Tự Động Hóa
2.3.
Xấp xỉ hàm số bằng mạng nơron nhân tạo .................................................. 35
2.4.
Phƣơng pháp điều khiển phản hồi Rise. ...................................................... 38
2.5.
Kết luận chƣơng 2 ....................................................................................... 39
CHƢƠNG 3 : ỨNG DỤNG MẠNG NƠRON TRUYỀN THẲNG VÀ BỘ ĐIỀU
KHIỂN RISE TRONG ĐIỀU KHIỂN THÍCH NGHI ROBOT ........................ 40
3.1.
Mở đầu ......................................................................................................... 40
3.2.
Mục tiêu điều khiển ..................................................................................... 40
3.3.
Thiết kế điều khiển ...................................................................................... 41
3.4.
Bộ điều khiển phản hồi RISE ...................................................................... 44
3.5.
Sai lệch hệ thống vòng kín .......................................................................... 50
3.6.
Phân tích tính ổn định và tối ƣu ................................................................... 53
3.7.
Mô phỏng ..................................................................................................... 55
3.7.1.
Mô hình hệ thống robot 2 khâu RT ...................................................... 55
3.7.2.
Kết quả mô phỏng ................................................................................. 59
3.7.3.
Kết luận ................................................................................................. 61
KẾT QUẢ VÀ BÀN LUẬN .................................................................................... 62
TÀI LIỆU THAM KHẢO ...................................................................................... 63
Phụ lục1: Lập trình Matlab ................................................................................... 65
Phụ lục 2: Mô hình robot 2 khâu RT trên Matlab ............................................... 67
Ngô Ngọc Hoàng
2
ĐK-TĐH2015B
Luận văn Thạc Sĩ
Chuyên ngành: Điều khiển & Tự Động Hóa
DANH MỤC HÌNH VẼ VÀ SƠ ĐỒ
Hình 1. 1. Một mạng nơ-ron cơ bản gồm hai thành phần ....................................... 10
Hình 1. 2. Nơ-ron là khâu MISO ............................................................................... 10
Hình 1. 3. Mạng nơ-ron ba lớp ................................................................................. 13
Hình 1. 4. Mạng MLP ............................................................................................... 14
Hình 1. 5. Cấu trúc mạng nơ-ron .............................................................................. 14
Hình 1. 6. Mô hình học có giám sát và học củng cố ................................................. 18
Hình 1. 7. Mô hình học không có giám sát ............................................................... 18
Hình 1. 8. Sơ đồ cấu trúc chung của quá trình học .................................................. 20
Hình 1. 9. Mạng nơ-ron truyền thẳng một lớp .......................................................... 21
Hình 1. 10. Mạng nơ-ron truyền thẳng nhiều lớp ..................................................... 22
Hình 1. 11. Sơ đồ cấu trúc của mạng Jordan ........................................................... 24
Hình 1. 12. Sơ đồ cấu trúc mạng nơ-ron hồi quy đơn .............................................. 25
Hình 2. 1. Mạng nơ-ron truyền thẳng ba lớp……………………………….……...36
Hình 3.7.1. 1. Mô hình robot 2 khâu RT……………………………………….......56
Hình 3.7.1. 2. Tọa độ của các khâu trên robot ....................................................... ..57
Hình 3.7.2. 1. Sai lệch teta…………………………………………………………….....60
Hình 3.7.2. 2. Sai lệch d2……………………………………………………………….…60
Ngô Ngọc Hoàng
3
ĐK-TĐH2015B
Luận văn Thạc Sĩ
Chuyên ngành: Điều khiển & Tự Động Hóa
LỜI CAM ĐOAN
Tên tôi là: Ngô Ngọc Hoàng
Học viên lớp cao học Điều khiển và tự động hóa 2015B – Trƣờng đại học
Bách khoa Hà Nội.
Xin cam đoan: đề tài “Ứng dụng mạng Nơron trong điều khiển thích nghi.”
do thầy giáo TS. Đào Phƣơng Nam hƣớng dẫn là của riêng tôi.
“Tôi cam đoan rằng, ngoại trừ các kết quả tham khảo từ các công trình khác
nhƣ đã ghi rõ trong luận văn, các công việc trình bày trong luận văn này là do chính
tôi thực hiện và chƣa có phần nội dung nào của luận văn này đƣợc nộp để lấy một
bằng cấp ở trƣờng này hoặc trƣờng khác”.
Ngô Ngọc Hoàng
4
ĐK-TĐH2015B
Luận văn Thạc sĩ
Chuyên ngành: Điều khiển & Tự Động Hóa
PHẦN MỞ ĐẦU
1. Lý do chọn đề tài:
Để điều khiển chính xác đối tƣợng khi chƣa biết rõ đƣợc thông số, trƣớc tiên
ta phải hiểu rõ đối tƣợng đó. Đối với đối tƣợng có thông số thay đổi, ta cần thực
hiện nhận dạng đặc tính vào ra, mô tả bằng mạng nơron các hàm động lực học liên
tục của nó để đảm bảo tạo ra tín hiệu điều khiển thích nghi đƣợc lựa chọn chính xác
hơn. Hiện nay thƣờng dùng lôgíc mờ (Fuzzy Logic), mạng nơron (Neural
Networks), và mạng nơron mờ (Fuzzy Neural Networks) để nhận dạng và điều
khiển thích nghi hệ thống có thông số thay đổi. Trong khuôn khổ của khóa học Cao
học, chuyên ngành Điều khiển và Tự động hóa tại trƣờng Đại học Bách khoa Hà
Nội, đƣợc sự tạo điều kiện giúp đỡ của nhà trƣờng và Tiến sĩ Đào Phƣơng Nam, em
đã lựa chọn đề tài tốt nghiệp của mình là “Ứng dụng mạng nơron trong điều khiển
thích nghi”.
2. Cơ sở khoa học và thực tiễn của đề tài
Ngày nay do tiến bộ của khoa học kỹ thuật trong điện tử và tin học các hệ
thống điều khiển tự động đƣợc phát triển và có sự thay đổi lớn. Công nghệ vi mạch
phát triển khiến cho việc sản xuất các thiết bị điện tử ngày càng hoàn thiện. Các bộ
biến đổi điện tử trong các hệ thống không những đáp ứng đƣợc khả năng tác động
nhanh, độ chính xác cao mà còn góp phần giảm kích thƣớc và hạ giá thành của hệ
thống. Đặc biệt trong những thập kỷ gần đây trƣớc sự phát triển mạnh mẽ và ngày
càng hoàn thiện của lý thuyết mạng nơron truyền thẳng nhiều lớp, hàng loạt các ứng
dụng của lý thuyết mạng nơron truyền thẳng nhiều lớp đã và đang mở ra một kỷ
nguyên mới ngành điều khiển. Tuy là ngành kỹ thuật điều khiển non trẻ nhƣng
những ứng dụng trong công nghiệp của điều khiển mạng nơron thật rộng rãi nhƣ
trong nhận dạng, phân loại sản phẩm, xử lý tiếng nói, chữ viết và điều khiển hệ
thống, điều khiển robot. Tới nay đã có rất nhiều sản phẩm công nghiệp đƣợc tạo ra
và nhờ kỹ thuật điều khiển mạng nơron, rất nhiều nƣớc trên thế giới đã thành công.
Chính vì thế mà việc đi sâu nghiên cứu và áp dụng lý thuyết điều khiển nơron
truyền thẳng nhiều lớp trong điều khiển thích nghi có ý nghĩa khoa học.
5
Ngô Ngọc Hoàng
ĐK-TĐH2015B
Luận văn Thạc sĩ
Chuyên ngành: Điều khiển & Tự Động Hóa
Khác hẳn với kỹ thuật điều khiển kinh điển là hoàn toàn dựa vào sự chính
xác tuyệt đối của thông tin mà trong nhiều ứng dụng không cần thiết hoặc không thể
có đƣợc, điều khiển nơron truyền thẳng nhiều lớp chỉ cần xử lý những thông tin
không chính xác hay không đầy đủ, những thông tin mà sự chính xác của nó chỉ
nhận thấy đƣợc giữa các quan hệ của chúng với nhau và chỉ có thể mô tả đƣợc bằng
ngôn ngữ, đã có thể cho ra những quyết định chính xác. Chính khả năng này đã làm
cho điều khiển nơron truyền thẳng sao chụp đƣợc phƣơng thức xử lý thông tin và
điều khiển của con ngƣời. Do đó việc áp dụng điều khiển nơron truyền thẳng nhiều
lớp vào hệ thống điều khiển thích nghi là việc cần phải làm.
3. Mục đích của đề tài
Đối với đối tƣợng có thông số thay đổi, ta cần nhận dạng đặc tính vào-ra, mô
tả bằng mạng nơron các hàm động lực học liên tục của nó, bảo đảm tạo ra tín hiệu
điều khiển thích nghi đƣợc chính xác hơn. Hiện nay thƣờng sử dụng logic mờ
(Fuzzy Logic), mạng nơron mờ (Fuzzy Neural Networks), mạng nơron (Neural
Networks) để nhận dạng và điều khiển thích nghi hệ thống Robot.
Đề tài này nghiên cứu ứng dụng mạng nơron truyền thẳng trong điều khiển
thích nghi, kết hợp giữa thuật toán mạng nơron truyền thẳng với nguyên lý phản hồi
Rise xây dựng bộ điều khiển tối ƣu xấp xỉ vào điều khiển thích nghi robot.
4. Đối tƣợng và phạm vi nghiên cứu của đề tài:
Phần mở đầu
Chương 1. Tổng quan về mạng nơron nhân tạo
Phân tích tổng quan về mạng nơron bao gồm: phần lịch sử phát triển, kết cấu
của mạng các nơron, ứng dụng của chúng, …
Chương 2. Điều khiển thích nghi, robot, mạng nơron và bộ điều khiển
phản hồi Rise
Tóm tắt một số lý thuyết về điều khiển thích nghi, động lực học robot, đề
xuất chuyển đổi xấp xỉ mô hình động lực học robot bằng mạng nơron, …
6
Ngô Ngọc Hoàng
ĐK-TĐH2015B
Luận văn Thạc sĩ
Chuyên ngành: Điều khiển & Tự Động Hóa
Chương 3. Ứng dụng mạng nơron truyền thẳng và bộ điều khiển rise
trong điều khiển thích nghi robot
Mô phỏng, kết hợp mạng nơron và bộ điều khiển phản hồi rise vào điều
khiển thích nghi robot
Chương 4. Kết luận chung và kiến nghị.
5. Ý nghĩa khoa học và thực tiễn của đề tài
Với ứng dụng của mạng nơron truyền thẳng nhiều lớp điều khiển hệ Robot,
sau khi đã xấp xỉ đƣợc mô hình động lực học Robot bằng mạng nơron, ta có thể
thay thế gần đúng mô hình Robot bằng mạng nơron, từ đó căn cứ trên các thông số
mô phỏng của mạng nơron, tính toán đƣợc tín hiệu điều khiển nhằm điều khiển
thích nghi Robot phù hợp với yêu cầu cần thiết của điều khiển thích nghi hệ Robot.
Để hoàn thành đƣợc luận văn này, em xin đƣợc gửi lời cảm ơn tới Giảng viên
- TS. ĐÀO PHƢƠNG NAM và tập thể các thầy cô trong bộ môn Điều khiển tự
động, Viện Điện, Trƣờng Đại học Bách Khoa Hà Nội đã tận tình giảng dạy và
hƣớng dẫn em trong những tháng năm qua, cũng nhƣ tạo mọi điều kiện tốt nhất cho
em. Và đặc biệt là tới gia đình, đã cổ vũ động viên em trong quá trình thực hiện
luận văn này.
Cuối cùng, với kiến thức và thời gian hạn chế, em còn để lại nhiều thiếu sót
trong luận văn này. Vì vậy, em rất mong nhận đƣợc sự góp ý từ phía các thầy, các
cô cũng nhƣ bạn đọc để bản luận văn này đƣợc hoàn thiện hơn.
Em xin chân thành cảm ơn!
Hà Nội, ngày … tháng … năm 2017
Học viên thực hiên
Ngô Ngọc Hoàng
7
Ngô Ngọc Hoàng
ĐK-TĐH2015B
Luận văn Thạc sĩ
Chuyên ngành: Điều khiển & Tự Động Hóa
CHƢƠNG 1: TỔNG QUAN VỀ MẠNG NƠRON NHÂN TẠO
Nghiên cứu và mô phỏng não ngƣời, cụ thể là mô phỏng nơron thần kinh là
một ƣớc muốn từ lâu của nhân loại. Từ mơ ƣớc đó, nhiều nhà khoa học đã không
ngừng nghiên cứu tìm hiểu về mạng nơron. Trong đó mạng nơron nhân tạo đã đƣợc
nói đến ở cuốn sách “Điều khiển học, hay điều chỉnh và sự truyền sinh trong cơ thể
sống, trong máy móc” của tác giả Nobert Wieners xuất bản năm 1948. Điều khiển
học đã đặt ra mục đích nghiên cứu áp dụng nguyên lý làm việc của hệ thống thần
kinh động vật vào điều khiển. Công cụ giúp điều khiển học thực hiện đƣợc mục
đích này là trí tuệ nhân tạo và mạng nơron. Trí tuệ nhân tạo đƣợc xây dựng dựa trên
mạng nơron. Mạng nơron nhân tạo (Artificial Neural Networks) là hệ thống đƣợc
xây dựng dựa trên nguyên tắc cấu tạo của bộ não con ngƣời. Mạng nơron nhân tạo
có một số lƣợng lớn mối liên kết của các phần tử biến đổi (Processing Elements) có
liên kết song song. Nó có hành vi tƣơng tự nhƣ bộ não con ngƣời với các khả năng
học (Learning), gọi lại (Recall) và tổng hợp thông tin từ sự luyện tập của các mẫu
và dữ liệu. Các phần tử biến đổi của mạng nơron nhân tạo đƣợc gọi là các nơron
nhân tạo (Artificial Neural) hoặc gọi tắt là nơron (Neural). Trong thiết kế hệ thống
tự động hóa sử dụng mạng nơron là một khuynh hƣớng hoàn toàn mới, phƣơng
hƣớng thiết kế hệ thống điều khiển thông minh, một hệ thống mà bộ điều khiển có
khả năng tƣ duy nhƣ bộ não con ngƣời.
1.1. Lịch sử phát triển của mạng nơron nhân tạo
Mạng nơron nhân tạo đã có một lịch sử lâu dài. Năm 1943, McCulloch và
Pitts đã đƣa ra khả năng liên kết và một số liên kết cơ bản của mạng nơron. Năm
1949, Hebb đã đƣa ra các luật thích nghi trong mạng nơron. Năm 1958, Rosenblatt
đƣa ra cấu trúc Perception. Năm 1969, Minsky và Papert phân tích sự đúng đắn của
Perception, họ đã chứng minh các tính chất và chỉ rõ các giới hạn của một số mô
hình. Năm 1976, Grossberg dựa vào tích chất sinh học đã đƣa ra một số cấu trúc của
hệ động học phi tuyến với các tính chất mới. Năm 1982, Hoppfield đã đƣa ra mạng
học phi tuyến với các tính chất mới. Năm 1982, Rumelhart đƣa ra mô hình song
song (Parallel Distributer Processing-PDS) và một số kết quả và thuật toán. Thuật
8
Ngô Ngọc Hoàng
ĐK-TĐH2015B
Luận văn Thạc sĩ
Chuyên ngành: Điều khiển & Tự Động Hóa
toán học lan truyền ngƣợc (Back Propagation learning rule) đƣợc Rumelhart,
Hinton, Williams (1986) đề xuất luyện mạng nơron nhiều lớp. Những năm gần đây,
nhiều tác giả đã đề xuất nhiều loại cấu trúc mạng nơron mới. Mang nơron đƣợc ứng
dụng trong nhiều lĩnh vực kinh tế, kỹ thuật, khoa học vũ trụ (Hecht - Nielsen, 1988).
1.2. Các tính chất của mạng nơron nhân tạo
Là hệ phi tuyến: Mạng nơron có khả năng to lớn trong lĩnh vực nhận dạng
và điều khiển các đối tƣợng phi tuyến.
Là hệ xử lý song song: Mạng nơron có cấu trúc song song, do đó có tốc độ
tính toán rất cao, rất phù hợp với lĩnh vực nhận dạng và điều khiển.
Là hệ học và thích nghi: Mạng đƣợc luyện từ các số liệu quá khứ, có khả
năng tự chỉnh khi số liệu đầu vào bị mất, có thể điều khiển on-line.
Là hệ nhiều biến, là hệ nhiều đầu vào, nhiều đầu ra (Many Input Many
Output - MIMO), rất tiện dụng khi điều khiển đối tƣợng có nhiều biến số.
1.3. Cấu trúc và mô hình mạng nơ-ron
Theo mục 7.1.1 – Tr.208 tài liệu tham khảo [1]
Mạng nơron là sự tái tạo bằng kỹ thuật những chức năng của hệ thần kinh
con ngƣời. Trong quá trình tái tạo không phải tất cả các chức năng của bộ não con
ngƣời có đều đƣợc tái tạo, mà chỉ có những chức năng cần thiết. Bên cạnh đó còn
có những chức năng mới đƣợc tạo ra nhằm giải quyết một bài toán điều khiển đã
định hƣớng trƣớc.
Mạng nơron bao gồm vô số các nơron đƣợc liên kết truyền thông với nhau
trong mạng. Hình 1.1 là một phần của mạng nơron bao gồm hai nơron.
9
Ngô Ngọc Hoàng
ĐK-TĐH2015B
Luận văn Thạc sĩ
Chuyên ngành: Điều khiển & Tự Động Hóa
Hình 1. 1. Một mạng nơ-ron cơ bản gồm hai thành phần
Một nơ-ron chứa đựng các thành phần cơ bản:
-Thân nơ-ron đƣợc giới hạn trong một màng membran và trong cùng là nhân.
Từ thân nơ-ron còn có rất nhiều đƣờng rẽ nhánh tạm gọi là rễ.
-“Bus” liên kết nơ-ron này với các nơ-ron khác đƣợc gọi là axon, trên axon
có các đƣờng rẽ nhánh. Nơ-ron còn có thể liên kết với các nơ-ron khác qua các rễ.
Chính vì cách liên kết đa dạng nhƣ vậy nên mạng nơ-ron có độ liên kết rất cao.
Các rễ của nơ-ron đƣợc chia thành hai loại: loại nhận thông tin từ nơ-ron
khác qua axon, mà ta sẽ gọi là rễ đầu vào và loại đƣa thông tin qua axon tới các nơron khác, gọi là rễ đầu ra. Một nơ-ron có thể có nhiều rễ đầu vào, nhƣng chỉ có một
rễ đầu ra. Bởi vậy nếu xem nơ-ron nhƣ một khâu điều khiển thì nó chính là khâu có
nhiều đầu vào, một đầu ra (khâu MISO)
Hình 1. 2. Nơ-ron là khâu MISO
Một tính chất rất cơ bản của mạng nơ-ron sinh học là các đáp ứng theo kích
thích có khả năng thay đổi theo thời gian. Các đáp ứng có thể tăng lên, giảm đi hoặc
hoàn toàn biến mất. Qua các nhánh axon liên kết tế bào nơ-ron này với các nơ-ron
khác, sự thay đổi trạng thái của một nơ-ron cũng sẽ kéo theo sự thay đổi trạng thái
của những nơ-ron khác và do đó là sự thay đổi của toàn bộ mạng nơ-ron. Việc thay
10
Ngô Ngọc Hoàng
ĐK-TĐH2015B
Luận văn Thạc sĩ
Chuyên ngành: Điều khiển & Tự Động Hóa
đổi trạng thái của mạng nơ-ron có thể thực hiện qua một quá trình “dạy” hoặc do
khả năng “học” tự nhiên. Sự thay thế những tính chất này bằng một mô hình toán
học tƣơng đƣơng đƣợc gọi là mạng nơ-ron nhân tạo. Mạng nơ-ron nhân tạo có thể
đƣợc chế tạo bằng nhiều cách khác nhau vì vậy trong thực tế tồn tại rất nhiều kiểu
mạng nơ-ron nhân tạo.
Khâu cộng Σ: Khâu cộng tín hiệu vào có chức năng thực hiện phƣơng trình
sau:
m
wi xi
i 1
w1
x1
tức là thực hiện phép nhân vô hƣớng hai vector w và x
w
x
m
m
wT x
(2.37)
Khâu tiền đáp ứng c: Những khả năng hoạt động của nơ-ron hoàn toàn phụ
thuộc vào khâu tạo chức năng đáp ứng c. Thế năng của một màng membran càng
cao nếu nhƣ giá trị
càng lớn. Khâu tạo chức năng đáp ứng tạo giá trị đáp ứng
tăng giảm phụ thuộc vào giátrị đầu vào, một cách đơn giản nhất có thể tạo đáp ứng
theo phƣơng trình
c
(2.38)
Quan hệ giữa tín hiệu vào và ra đƣợc biểu diễn theo phƣơng trình trên là một
quan hệ tĩnh và tuyến tính. Đây cũng là cách thiết kế nơ-ron nhân tạo một cách đơn
giản nhất. Để tăng độ chính xác ngƣời ta tìm cách xây dựng mô hình động cho nơron. Thực tế, khi có kích thích đầu vào, thế năng của màng membran tăng dần lên
cho dù ngay tại thời điểm đƣợc kích thích vẫn chƣa có đáp ứng đầu ra. Hoàn toàn
tƣơng tự, khi kích thích mất đi thì nơ-ron cũng không thể trở về ngay trạng thái cân
bằng cũ mà sự trở về diễn ra cũng dần dần nhƣ một quá trình liên tục theo thời gian.
Quá trình đó có thể mô tả qua phƣơng trình vi phân bậc nhất :
Tc t c t c0 t
(2.39)
11
Ngô Ngọc Hoàng
ĐK-TĐH2015B
Luận văn Thạc sĩ
Chuyên ngành: Điều khiển & Tự Động Hóa
trong đó c0 là thế năng của mạng membran ở trạng thái không bị kích thích. Đó là
phƣơng trình động học của một khâu quán tính bậc nhất với hằng số thời gian quán
tính T . Khâu tạo chức năng đáp ứng kiểu này còn có tên là BSB.
Khâu đáp ứng
: Giá
trị ra y của một nơ-ron biểu diễn trạng thái kích
thích đến các nơ-ron tiếp theo trong mạng. Tín hiệu ra y phụ thuộc vào độ kích
thích của nơ-ron, thông thƣờng đƣợc so sánh theo kiểu cắt ngƣỡng. Quan hệ này
của mô hình nơ-ron. Thông thƣờng giá trị ra
y phải thay đổi liên tục theo sự thay đổi của tiền đáp ứng c hoặc không thay đổi
nếu c nhỏ hơn giá trị ngƣỡng.
đƣợc mô tả qua khâu tạo đáp ứng
1.4. Những mô hình nơ-ron thƣờng sử dụng
Theo mục 7.1.2 – Tr.214 tài liệu tham khảo [1] :
Mỗi một kết nối từ vector tín hiệu vào x tới tín hiệu ra y , qua đặc tính của
khâu cộng Σ với hàm mô tả (2.37), khâu tiền đáp ứng c , và khâu tạo đáp ứng
sẽ
cho ra một mô hình nơ-ron. Nhƣ vậy tổng cộng sẽ có tất cả là 15 mô hình nơ-ron.
Giá trị đầu ra y của nơ-ron là:
y c c c wT x
Tuy nhiên, phổ biến nhất trong số 15 mô hình nơ-ron là sáu loại sau:
STT
Tên gọi
STT
Tên gọi
1
McCulloch-Pitts
1
Adeline
2
Fermi
2
Boltzmann
3
BSB
3
Hopfield
1.5. Cấu tạo mạng nơ-ron
Theo mục 7.1.3 – Tr.208 tài liệu tham khảo [1]:
Dựa trên những phƣơng pháp xây dựng nơ-ron ở phần trên, ta có thể coi nơron nhƣ một hệ MISO truyền đạt và xử lý tín hiệu. Đặc tính truyền đạt của nơ-ron
12
Ngô Ngọc Hoàng
ĐK-TĐH2015B
Luận văn Thạc sĩ
Chuyên ngành: Điều khiển & Tự Động Hóa
phần lớn là đặc tính truyền đạt tĩnh, chỉ khi chọn khâu chức năng đáp ứng kiểu BSB
thì lúc đó nơ-ron có đặc tính động. Trong mọi trƣờng hợp do đặc tính phi tuyến của
khâu tạo chức năng ra kết hợp và/hoặc với đặc tuyến phi tuyến của khâu tạo chức
năng đáp ứng mà nơ-ron là một hệ có tính phi tuyến mạnh.
Liên kết các đầu vào và ra của nhiều nơ-ron với nhau ta đƣợc một mạng nơron. Việc ghép nối các nơ-ron trong mạng với nhau có thể theo một nguyên tắc bất
kỳ nào đó, vì về nguyên tắc một nơ-ron là một hệ MISO. Từ đó có thể phân biệt các
loại nơ-ron khác nhau nhƣ các loại nơ-ron mà các đầu vào nhận thông tin từ môi
trƣờng bên ngoài với các loại nơ-ron mà các đầu vào đƣợc nối với các nơ-ron khác
trong mạng. Các nơ-ron mà đầu vào giữ chức năng nhận thông tin từ môi trƣờng
bên ngoài đóng chức năng “đầu vào” của mạng. Cũng tƣơng tự nhƣ vậy, một nơ-ron
có một đầu ra, đầu ra của nơ-ron này có thể là đầu vào của nhiều nơ-ron khác hoặc
có thể đƣa ra môi môi trƣờng bên ngoài. Những nơ-ron có đầu ra đƣa tín hiệu vào
môi trƣờng bên ngoài đƣợc gọi là “đầu ra” của mạng. Nhƣ vậy một mạng nơ-ron
cũng có chức năng của một hệ truyền đạt và xử lý tín hiệu từ đầu vào đến đầu ra của
mạng. Các nơ-ron trong một mạng thƣờng đƣợc chọn cùng một loại, chúng đƣợc
phân biệt với nhau qua vector hàm trọng lƣợng ở đầu vào w .
Hình 1. 3. Mạng nơ-ron ba lớp
Nguyên lý cấu tạo của một mạng nơ-ron bao gồm nhiều lớp, mỗi lớp bao
gồm nhiều nơ-ron có cùng một chức năng trong mạng. Trong hình 2.2.3 là mô hình
của một mạng nơ-ron ba lớp với 9 nơ-ron. Mạng có ba đầu vào x1 , x2 , x3 và hai đầu
ra y1 , y2 . Các tín hiệu đầu vào đƣợc đƣa đến ba nơ-ron đầu vào, ba nơ-ron này làm
13
Ngô Ngọc Hoàng
ĐK-TĐH2015B
Luận văn Thạc sĩ
Chuyên ngành: Điều khiển & Tự Động Hóa
thành lớp đầu vào của mạng (input layer). Các nơ-ron trong lớp này đƣợc gọi là nơron đầu vào. Đầu ra của các nơ-ron này đƣợc đƣa đến đầu vào của bốn nơ-ron tiếp
theo, bốn nơ-ron này không trực tiếp tiếp xúc với môi trƣờng xung quanh và làm
thành lớp trung gian trong mạng (hidden layer). Các nơ-ron trong lớp này có tên là
nơ-ron nội hay nơ-ron bị che. Đầu ra của các nơ-ron này đƣợc đƣa đến hai nơ-ron
đƣa tín hiệu ra môi trƣờng bên ngoài. Các nơ-ron trong lớp đầu ra này có tên là nơron đầu ra (output layer).
Hình 1. 4. Mạng MLP
Hình 1. 5. Cấu trúc mạng nơ-ron
a)
Mạng truyền thẳng một lớp
b)
Mạng hồi tiếp một lớp
c)
Mạng MLP truyền thẳng
d)
Mạng MLP hồi tiếp
Mạng nơ-ron đƣợc xây dựng nhƣ trên là mạng gồm ba lớp mắc nối tiếp nhau
đi từ đầu vào đến đầu ra. Trong mạng không tồn tại bất kỳ một mạch hồi tiếp nào kể
14
Ngô Ngọc Hoàng
ĐK-TĐH2015B
Luận văn Thạc sĩ
Chuyên ngành: Điều khiển & Tự Động Hóa
cả hồi tiếp nội lẫn hồi tiếp từ đầu ra trở về đầu vào. Một mạng nơ-ron có cấu tạo
nhƣ vậy đƣợc gọi là mạng truyền thẳng (feedforward network). Mạng nơ-ron có
đƣờng phản hồi từ đầu ra của một nơ-ron tới đầu vào của nơ-ron cùng lớp hoặc
thuộc lớp phía trƣớc có tên gọi là mạng hồi tiếp (feedback network). Mạng nơ-ron
bao gồm một hay nhiều lớp trung gian đƣợc gọi là mạng MLP (multilayer
perceptrons Network). Còn mạng chỉ có một lớp, vừa là lớp vào vừa là lớp trung
gian và cũng là lớp ra thì mạng đó có tên là một lớp. Mạng nơ-ron có cấu trúc mạng
ghép nối hoàn toàn, tức là bất cứ một nơ-ron nào trong mạng cũng đƣợc nối với một
hoặc vài nơ-ron khác. Trong trƣờng hợp các nơ-ron trong mạng có khâu tạo chức
năng đáp ứng là khâu tuyến tính, tính phi tuyến chỉ nằm ở khâu tạo chức năng ra thì
việc mắc nối tiếp các nơ-ron trong mạng không còn ý nghĩa nữa và lúc đó ta hoàn
toàn có thể thay thế mạng nơ-ron nhiều lớp thành mạng nơ-ron một lớp.
1.6. Phƣơng thức làm việc của mạng nơ-ron
Theo mục 7.1.4 – Tr.217 tài liệu tham khảo [1]:
Phƣơng thức làm việc của một mạng nơ-ron nhân tạo có thể phân chia làm
hai giai đoạn:
-Tự tái tạo lại (reproduction)
-Và giai đoạn học (learning phase).
Ở một mạng nơ-ron có cấu trúc bền vững có nghĩa là vector hàm trọng lƣợng
đầu vào, khâu tạo đáp ứng và khâu tạo tín hiệu đầu ra đều cố định không bị thay đổi
về mặt cấu trúc cũng nhƣ tham số thì mạng có một quá trình truyền đạt xác định
chắc chắn, tĩnh hoặc động phụ thuộc vào cấu tạo của các nơ-ron trong mạng. Ở đầu
vào của mạng xuất hiện thông tin thì tại đầu ra cũng xuất hiện một đáp ứng tƣơng
ứng.
Đối với mạng nơ-ron có quá trình truyền đạt tĩnh, đáp ứng đầu ra xuất hiện
ngay sau khi đầu vào nhận đƣợc thông tin, còn đối với mạng nơ-ron có quá trình
truyền đạt động thì phải sau một thời gian quá độ ở đầu ra của mạng nơ-ron mới
xuất hiện đáp ứng. Xuất phát từ quan điểm mọi đáp ứng của nơ-ron đều tiền định tự
nhiên, có nghĩa là khi xuất hiện các kích thích ở đầu vào của mạng ở các thời điểm
15
Ngô Ngọc Hoàng
ĐK-TĐH2015B
Luận văn Thạc sĩ
Chuyên ngành: Điều khiển & Tự Động Hóa
khác nhau các giá trị nhƣ nhau thì đáp ứng ở đầu ra ở các thời điểm tƣơng ứng cũng
hoàn toàn giống nhau. Quá trình làm việc nhƣ vậy của một mạng nơ-ron đƣợc gọi là
quá trình tái diễn lại (reproduction phase). Khi có thông tin ở đầu vào mạng lƣu giữ
thông tin đó và dựa trên các tri thức của mình đƣa ra đáp ứng ở đầu ra phù hợp với
lƣợng thông tin thu đƣợc từ đầu vào. Mạng nơ-ron khi mới hình thành còn chƣa có
tri thức, tri thức của mạng hình thành dần sau một quá trình học. Mạng nơ-ron đƣợc
dạy bằng cách đƣa vào đầu vào những kích thích và mạng hình thành những đáp
ứng tƣơng ứng, những đáp ứng phù hợp với từng loại kích thích sẽ đƣợc lƣu giữ,
giai đoạn này đƣợc gọi là giai đoạn học của mạng. Khi đã hình tri thức mạng có thể
giải quyết các vấn đề cụ thể một cách đúng đắn. Đó có thể là những vấn đề ứng
dụng rất khác nhau, đƣợc giải quyết chủ yếu dựa trên sự tổ chức hợp nhất giữa các
thông tin đầu vào của mạng và các đáp ứng đầu ra:
1)
Nhiệm vụ của một mạng liên kết là hoàn chỉnh hoặc hiệu chỉnh các
thông tin thu thập đƣợc không đầy đủ hoặc bị tác động của nhiễu. Mạng nơ-ron kiểu
này đƣợc ứng dụng trong lĩnh vực hoàn thiện mẫu, mà một trong những lĩnh vực cụ
thể đó là nhận dạng chữ viết.
2)
Nhiệm vụ tổng quát của một mạng nơ-ron là lƣu giữ động các thông
tin. Dạng thông tin lƣu giữ đó chính là quan hệ giữa các thông tin đầu vào của mạng
và các đáp ứng đầu ra tƣơng ứng, để khi có một kích thích bất kỳ tác động vào
mạng, mạng có khả năng suy diễn và đƣa ra một đáp ứng phù hợp. Đó chính là chức
năng nhận dạng theo mẫu của mạng nơ-ron. Để thực hiện chức năng này, mạng nơron đóng vai trò nhƣ một bộ phận tổ chức các nhóm thông tin đầu vào và tƣơng ứng
với mỗi nhóm là một đáp ứng đầu ra phù hợp. Nhƣ vậy một nhóm bao gồm một loại
thông tin đầu vào và một đáp ứng ra. Các nhóm có thể đƣợc hình thành trong quá
trình học và cũng có thể hình thành không trong quá trình học.
Trong lĩnh vực ứng dụng, mạng nơ-ron có khả năng tạo ra các đáp ứng đầu
ra dựa trên thông tin thu thập vào mạng, điều đó có nghĩa là ứng với một thông tin
xác định ở đầu vào mạng cung cấp một đáp ứng tƣơng ứng xác định ở đầu ra. Nhìn
trên quan điểm lý thuyết hệ thống, mạng nơ-ron đƣợc coi nhƣ một bộ xấp xỉ thông
16
Ngô Ngọc Hoàng
ĐK-TĐH2015B
Luận văn Thạc sĩ
Chuyên ngành: Điều khiển & Tự Động Hóa
tin, thiết bị này có khả năng cung cấp một quá trình xử lý mong muốn một cách
chính xác. Mục đích của quá trình học là tạo ra một tri thức cho mạng thông qua rèn
luyện. Nguyên tắc học đƣợc thực hiện cho một mạng mà cấu trúc của mạng cũng
nhƣ các phần tử nơ-ron cố định, chính là thay đổi giá trị của các phần tử trong
vector hàm trọng lƣợng, vector ghép nối giữa các phần tử nơ-ron trong mạng. Các
phần tử này đƣợc chọn sao cho quá trình truyền đạt mong muốn đƣợc xấp xỉ một
cách đủ chính xác nhƣ bài toán yêu cầu. Để đạt đƣợc mục đích đó, ngƣời ta cho tác
k
động vào đầu vào của mạng hàng loạt các tác động x , k 1,2
có khả năng lặp
lại trong quá trình mạng làm việc. Những tác động này đƣợc gọi là tác động mẫu.
Các đáp ứng y
k
của tác động mẫu đƣợc so sánh với đáp ứng mẫu y
k
chọn trƣớc
và các phần tử của vector hàm trọng lƣợng w đƣợc hiệu chỉnh sao cho sai lệch so
với mẫu mong muốn là nhỏ nhất. Quá trình chỉnh định này sẽ đƣợc thực hiện cho
đến khi đạt đƣợc sai số mong muốn nào đó. Mạng lúc này đã có đƣợc một đáp ứng
đầu ra hoàn toàn phù hợp với tác động mẫu đầu vào và kết quả này sẽ đƣợc cất giữ.
1.7. Các luật học
Nhƣ phần trên đã trình bày, học là vấn đề quan trọng trong mạng nơ-ron. Có
hai kiểu học:
-Học thông số (Paramater Learning): Tìm ra biểu thức cập nhật các thông số
về trọng số cập nhật kết nối giữa các nơron.
-Học cấu trúc (Structure Learning): Trọng tâm là sự biến đổi cấu trúc của
mạng nơ-ron gồm số lƣợng nút (node) và các mẫu liên kết.
Có hai loại học: Thực hiện đồng thời và không đồng thời.
Chúng ta tập trung vào phần học thông số.
Giả sử ma trận trọng số bao gồm tất cả các phần tử thích ứng của mạng
nơron. Nhiệm vụ của việc học thông số là bằng cách nào đó, tìm đƣợc ma trận chính
xác mong muốn từ ma trận giả thuyết ban đầu với cấu trúc của mạng nơron có sẵn.
Để làm đƣợc việc đó, mạng nơron sử dụng các trọng số điều chỉnh, với nhiều
17
Ngô Ngọc Hoàng
ĐK-TĐH2015B
Luận văn Thạc sĩ
Chuyên ngành: Điều khiển & Tự Động Hóa
phƣơng pháp học khác nhau có thể tính toán gần đúng ma trận W cần tìm đặc trƣng
cho mạng. Có ba phƣơng pháp học:
* Học có giám sát (Supervised Learning)
Là quá trình học có giám sát (Hình 1.6), ở mỗi thời điểm thứ i khi đƣa tín
hiệu vào xi mạng nơron, tƣơng ứng sẽ có các đáp ứng mong muốn di của đầu ra cho
trƣớc ở thời điểm đó. Hay nói cách khác, trong quá trình học có giám sát, mạng
nơron đƣợc cung cấp liên tục các cặp số liệu mong muốn vào - ra ở từng thời điểm
(x1, d1), (x2, d2), …, (xk, dk), … khi cho đầu vào thực của mạng là xk tƣơng ứng sẽ
có tín hiệu đầu ra cũng đƣợc lặp lại là dk giống nhƣ mong muốn. Kết quả của quá
trình học có giám sát là tạo đƣợc một hộp đen có đầu vào là véc tơ tín hiệu vào x sẽ
đƣa ra đƣợc câu trả lời đúng d.
Hình 1. 7. Mô hình học không
có giám sát
Hình 1. 6. Mô hình học có giám
sát và học củng cố
Để đạt đƣợc kết quả mong muốn trên, khi đƣa vào tín hiệu xk, thông thƣờng
sẽ có sai lệch ek giữa tín hiệu đầu ra thực yk và tín hiệu đầu ra mong muốn dk. Sai
lệch đó sẽ đƣợc truyền ngƣợc tới đầu vào để điều chỉnh thông số mạng nơron là ma
trận trọng sô W… Quá trình cứ thế tiếp diễn sao cho sai lệch giữa tín hiện ra mong
muốn và tín hiệu ra thực tế trong phạm vi cho phép, kết quả ta nhận đƣợc ma trận
trọng số W với các phần tử wij đã đƣợc điều chỉnh phù hợp với đặc điểm của đối
tƣợng hay hàm số mạng nơron cần học.
* Học củng cố (Reinforcement Learning)
18
Ngô Ngọc Hoàng
ĐK-TĐH2015B
Luận văn Thạc sĩ
Chuyên ngành: Điều khiển & Tự Động Hóa
Tín hiệu có thể đƣợc đƣa tín hiệu d từ bên ngoài môi trƣờng (Hình 1.6),
nhƣng tín hiệu này có thể không đƣợc đƣa đầy đủ, mà có thể chỉ đƣa đại diện 1 bít
để có tính chất kiểm tra quá trình đúng hay sai. Tín hiệu đó đƣơc gọi là tín hiệu
củng cố (Reinforcement Signal). Phƣơng pháp học củng cố chỉ là một trƣờng hợp
của phƣơng pháp học có giám sát, bởi vì nó cũng có nhận tín hiệu chỉ đạo (giáo
viên) phản hồi từ môi trƣờng. Chỉ khác là tín hiệu củng cố chỉ có tính ƣớc lƣợng
hơn là để dạy. Có nghĩa là chỉ có thể nói là tốt hay xấu cho một số tín hiệu đầu ra cá
biệt. Tín hiệu giám sát bên ngoài d thƣờng đƣợc tiến hành bởi các tín hiệu ƣớc
lƣợng để tạo thông tin tín hiệu ƣớc lƣợng cho mạng nơron điều chỉnh trọng số với
hy vọng sự ƣớc lƣợng đó mạng lại sự tốt đẹp cho quá trình tính toán. Học củng cố
còn đƣợc gọi là học với sự ƣớc lƣợng (Learning With a Critic).
* Học không có giám sát (Unsupervised Learning)
Trong trƣờng hợp này, hoàn toàn không có tín hiệu ở bên ngoài (Hình 1.7).
Giá trị mục tiêu điều khiển không đƣợc cung cấp và không đƣợc tăng cƣờng. Mạng
phải khám phá các mẫu, các nét đặc trƣng, tính cân đối, tính tƣơng quan, … Trong
khi khám phá các đặc trƣơng khác, mạng nơron đã trải qua việc tự thay đổi thông
số, vấn đề đó còn gọi là tự tổ chức (Self – Organizing).
Hình 1.8 mô tả cấu trúc chung của quá trình học của ba phƣơng pháp học đã
đƣợc nêu trên. Trong đó tín hiệu vào xj, j = 1, 2, 3, …, m, có thể đƣợc lấy từ đầu ra
của các nơron khác hoặc có thể đƣợc lấy từ bên ngoài. Chú ý rằng thông số ngƣỡng
θi có thể đƣợc bao trong việc học nhƣ là một trọng số thứ m: wi,m của tín hiệu vào
có giá trị xm = -1. Tín hiệu mong muốn di có sẵn chỉ trong phƣơng pháp học có giám
sát hoặc củng cố (với di là tín hiệu học củng cố). Từ hai phƣơng pháp học trên.
Trọng số của nơron thứ i đƣợc thay đổi tùy theo tín hiệu ở đầu vào mà nó thu nhận,
giá trị đầu ra của nó. Trong phƣơng pháp học không giám sát sự thay đổi trọng số
chỉ dựa trên cơ sở các giá trị đầu vào và đầu ra. Dạng tổng quát của luật học trọng
số của mạng nơron cho biết là gia số của véc tơ wi là Δwi tỷ lệ với tín hiệu học r và
tín hiệu đầu vào x(t):
19
Ngô Ngọc Hoàng
ĐK-TĐH2015B
- Xem thêm -