Tài liệu ứng dụng mạng nơron trong điều khiển thích nghi

.PDF

134

thanhphoquetoi Báo vi phạm

Tải xuống 134

Mô tả:

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƢỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI --------------------------------------- NGÔ NGỌC HOÀNG ỨNG DỤNG MẠNG NƠRON TRONG ĐIỀU KHIỂN THÍCH NGHI Chuyên ngành: ĐIỀU KHIỂN VÀ TỰ ĐỘNG HÓA LUẬN VĂN THẠC SĨ KỸ THUẬT ĐIỀU KHIỂN VÀ TỰ ĐỘNG HÓA NGƢỜI HƢỚNG DẪN KHOA HỌC TS. ĐÀO PHƢƠNG NAM HÀ NỘI – 2017 Luận văn Thạc Sĩ Chuyên ngành: Điều khiển & Tự Động Hóa MỤC LỤC LỜI CAM ĐOAN ...................................................................................................... 4 PHẦN MỞ ĐẦU ........................................................................................................ 5 CHƢƠNG 1: TỔNG QUAN VỀ MẠNG NƠRON NHÂN TẠO .......................... 8 1.1. Lịch sử phát triển của mạng nơron nhân tạo ................................................. 8 1.2. Các tính chất của mạng nơron nhân tạo ........................................................ 9 1.3. Cấu trúc và mô hình mạng nơ-ron ................................................................. 9 1.4. Những mô hình nơ-ron thƣờng sử dụng ...................................................... 12 1.5. Cấu tạo mạng nơ-ron ................................................................................... 12 1.6. Phƣơng thức làm việc của mạng nơ-ron ...................................................... 15 1.7. Các luật học ................................................................................................. 17 1.8. Mạng nơron truyền thẳng và mạng nơron hồi quy ...................................... 21 1.8.1. Mạng nơron truyền thẳng...................................................................... 21 1.8.2. Mạng nơron hồi quy.............................................................................. 22 1.9. Ứng dụng mạng nơron trong điều khiển tự động ........................................ 27 1.10. Công nghệ phần cứng sử dụng mạng nơron ................................................ 28 1.11. So sánh khả năng của mạng nơron với mạch lôgíc ..................................... 29 1.12. Kết luận chƣơng 1 ....................................................................................... 30 CHƢƠNG 2: ĐIỀU KHIỂN THÍCH NGHI, ROBOT, MẠNG NƠRON VÀ BỘ ĐIỀU KHIỂN PHẢN HỒI RISE ................................................................... 31 2.1. Điều khiển thích nghi .................................................................................. 31 2.2. Robot công nghiệp ....................................................................................... 32 2.2.1. Tổng quan về Robot công nghiệp ......................................................... 32 2.2.2. Động lực học Robot .............................................................................. 33 Ngô Ngọc Hoàng 1 ĐK-TĐH2015B Luận văn Thạc Sĩ Chuyên ngành: Điều khiển & Tự Động Hóa 2.3. Xấp xỉ hàm số bằng mạng nơron nhân tạo .................................................. 35 2.4. Phƣơng pháp điều khiển phản hồi Rise. ...................................................... 38 2.5. Kết luận chƣơng 2 ....................................................................................... 39 CHƢƠNG 3 : ỨNG DỤNG MẠNG NƠRON TRUYỀN THẲNG VÀ BỘ ĐIỀU KHIỂN RISE TRONG ĐIỀU KHIỂN THÍCH NGHI ROBOT ........................ 40 3.1. Mở đầu ......................................................................................................... 40 3.2. Mục tiêu điều khiển ..................................................................................... 40 3.3. Thiết kế điều khiển ...................................................................................... 41 3.4. Bộ điều khiển phản hồi RISE ...................................................................... 44 3.5. Sai lệch hệ thống vòng kín .......................................................................... 50 3.6. Phân tích tính ổn định và tối ƣu ................................................................... 53 3.7. Mô phỏng ..................................................................................................... 55 3.7.1. Mô hình hệ thống robot 2 khâu RT ...................................................... 55 3.7.2. Kết quả mô phỏng ................................................................................. 59 3.7.3. Kết luận ................................................................................................. 61 KẾT QUẢ VÀ BÀN LUẬN .................................................................................... 62 TÀI LIỆU THAM KHẢO ...................................................................................... 63 Phụ lục1: Lập trình Matlab ................................................................................... 65 Phụ lục 2: Mô hình robot 2 khâu RT trên Matlab ............................................... 67 Ngô Ngọc Hoàng 2 ĐK-TĐH2015B Luận văn Thạc Sĩ Chuyên ngành: Điều khiển & Tự Động Hóa DANH MỤC HÌNH VẼ VÀ SƠ ĐỒ Hình 1. 1. Một mạng nơ-ron cơ bản gồm hai thành phần ....................................... 10 Hình 1. 2. Nơ-ron là khâu MISO ............................................................................... 10 Hình 1. 3. Mạng nơ-ron ba lớp ................................................................................. 13 Hình 1. 4. Mạng MLP ............................................................................................... 14 Hình 1. 5. Cấu trúc mạng nơ-ron .............................................................................. 14 Hình 1. 6. Mô hình học có giám sát và học củng cố ................................................. 18 Hình 1. 7. Mô hình học không có giám sát ............................................................... 18 Hình 1. 8. Sơ đồ cấu trúc chung của quá trình học .................................................. 20 Hình 1. 9. Mạng nơ-ron truyền thẳng một lớp .......................................................... 21 Hình 1. 10. Mạng nơ-ron truyền thẳng nhiều lớp ..................................................... 22 Hình 1. 11. Sơ đồ cấu trúc của mạng Jordan ........................................................... 24 Hình 1. 12. Sơ đồ cấu trúc mạng nơ-ron hồi quy đơn .............................................. 25 Hình 2. 1. Mạng nơ-ron truyền thẳng ba lớp……………………………….……...36 Hình 3.7.1. 1. Mô hình robot 2 khâu RT……………………………………….......56 Hình 3.7.1. 2. Tọa độ của các khâu trên robot ....................................................... ..57 Hình 3.7.2. 1. Sai lệch teta…………………………………………………………….....60 Hình 3.7.2. 2. Sai lệch d2……………………………………………………………….…60 Ngô Ngọc Hoàng 3 ĐK-TĐH2015B Luận văn Thạc Sĩ Chuyên ngành: Điều khiển & Tự Động Hóa LỜI CAM ĐOAN Tên tôi là: Ngô Ngọc Hoàng Học viên lớp cao học Điều khiển và tự động hóa 2015B – Trƣờng đại học Bách khoa Hà Nội. Xin cam đoan: đề tài “Ứng dụng mạng Nơron trong điều khiển thích nghi.” do thầy giáo TS. Đào Phƣơng Nam hƣớng dẫn là của riêng tôi. “Tôi cam đoan rằng, ngoại trừ các kết quả tham khảo từ các công trình khác nhƣ đã ghi rõ trong luận văn, các công việc trình bày trong luận văn này là do chính tôi thực hiện và chƣa có phần nội dung nào của luận văn này đƣợc nộp để lấy một bằng cấp ở trƣờng này hoặc trƣờng khác”. Ngô Ngọc Hoàng 4 ĐK-TĐH2015B Luận văn Thạc sĩ Chuyên ngành: Điều khiển & Tự Động Hóa PHẦN MỞ ĐẦU 1. Lý do chọn đề tài: Để điều khiển chính xác đối tƣợng khi chƣa biết rõ đƣợc thông số, trƣớc tiên ta phải hiểu rõ đối tƣợng đó. Đối với đối tƣợng có thông số thay đổi, ta cần thực hiện nhận dạng đặc tính vào ra, mô tả bằng mạng nơron các hàm động lực học liên tục của nó để đảm bảo tạo ra tín hiệu điều khiển thích nghi đƣợc lựa chọn chính xác hơn. Hiện nay thƣờng dùng lôgíc mờ (Fuzzy Logic), mạng nơron (Neural Networks), và mạng nơron mờ (Fuzzy Neural Networks) để nhận dạng và điều khiển thích nghi hệ thống có thông số thay đổi. Trong khuôn khổ của khóa học Cao học, chuyên ngành Điều khiển và Tự động hóa tại trƣờng Đại học Bách khoa Hà Nội, đƣợc sự tạo điều kiện giúp đỡ của nhà trƣờng và Tiến sĩ Đào Phƣơng Nam, em đã lựa chọn đề tài tốt nghiệp của mình là “Ứng dụng mạng nơron trong điều khiển thích nghi”. 2. Cơ sở khoa học và thực tiễn của đề tài Ngày nay do tiến bộ của khoa học kỹ thuật trong điện tử và tin học các hệ thống điều khiển tự động đƣợc phát triển và có sự thay đổi lớn. Công nghệ vi mạch phát triển khiến cho việc sản xuất các thiết bị điện tử ngày càng hoàn thiện. Các bộ biến đổi điện tử trong các hệ thống không những đáp ứng đƣợc khả năng tác động nhanh, độ chính xác cao mà còn góp phần giảm kích thƣớc và hạ giá thành của hệ thống. Đặc biệt trong những thập kỷ gần đây trƣớc sự phát triển mạnh mẽ và ngày càng hoàn thiện của lý thuyết mạng nơron truyền thẳng nhiều lớp, hàng loạt các ứng dụng của lý thuyết mạng nơron truyền thẳng nhiều lớp đã và đang mở ra một kỷ nguyên mới ngành điều khiển. Tuy là ngành kỹ thuật điều khiển non trẻ nhƣng những ứng dụng trong công nghiệp của điều khiển mạng nơron thật rộng rãi nhƣ trong nhận dạng, phân loại sản phẩm, xử lý tiếng nói, chữ viết và điều khiển hệ thống, điều khiển robot. Tới nay đã có rất nhiều sản phẩm công nghiệp đƣợc tạo ra và nhờ kỹ thuật điều khiển mạng nơron, rất nhiều nƣớc trên thế giới đã thành công. Chính vì thế mà việc đi sâu nghiên cứu và áp dụng lý thuyết điều khiển nơron truyền thẳng nhiều lớp trong điều khiển thích nghi có ý nghĩa khoa học. 5 Ngô Ngọc Hoàng ĐK-TĐH2015B Luận văn Thạc sĩ Chuyên ngành: Điều khiển & Tự Động Hóa Khác hẳn với kỹ thuật điều khiển kinh điển là hoàn toàn dựa vào sự chính xác tuyệt đối của thông tin mà trong nhiều ứng dụng không cần thiết hoặc không thể có đƣợc, điều khiển nơron truyền thẳng nhiều lớp chỉ cần xử lý những thông tin không chính xác hay không đầy đủ, những thông tin mà sự chính xác của nó chỉ nhận thấy đƣợc giữa các quan hệ của chúng với nhau và chỉ có thể mô tả đƣợc bằng ngôn ngữ, đã có thể cho ra những quyết định chính xác. Chính khả năng này đã làm cho điều khiển nơron truyền thẳng sao chụp đƣợc phƣơng thức xử lý thông tin và điều khiển của con ngƣời. Do đó việc áp dụng điều khiển nơron truyền thẳng nhiều lớp vào hệ thống điều khiển thích nghi là việc cần phải làm. 3. Mục đích của đề tài Đối với đối tƣợng có thông số thay đổi, ta cần nhận dạng đặc tính vào-ra, mô tả bằng mạng nơron các hàm động lực học liên tục của nó, bảo đảm tạo ra tín hiệu điều khiển thích nghi đƣợc chính xác hơn. Hiện nay thƣờng sử dụng logic mờ (Fuzzy Logic), mạng nơron mờ (Fuzzy Neural Networks), mạng nơron (Neural Networks) để nhận dạng và điều khiển thích nghi hệ thống Robot. Đề tài này nghiên cứu ứng dụng mạng nơron truyền thẳng trong điều khiển thích nghi, kết hợp giữa thuật toán mạng nơron truyền thẳng với nguyên lý phản hồi Rise xây dựng bộ điều khiển tối ƣu xấp xỉ vào điều khiển thích nghi robot. 4. Đối tƣợng và phạm vi nghiên cứu của đề tài: Phần mở đầu Chương 1. Tổng quan về mạng nơron nhân tạo Phân tích tổng quan về mạng nơron bao gồm: phần lịch sử phát triển, kết cấu của mạng các nơron, ứng dụng của chúng, … Chương 2. Điều khiển thích nghi, robot, mạng nơron và bộ điều khiển phản hồi Rise Tóm tắt một số lý thuyết về điều khiển thích nghi, động lực học robot, đề xuất chuyển đổi xấp xỉ mô hình động lực học robot bằng mạng nơron, … 6 Ngô Ngọc Hoàng ĐK-TĐH2015B Luận văn Thạc sĩ Chuyên ngành: Điều khiển & Tự Động Hóa Chương 3. Ứng dụng mạng nơron truyền thẳng và bộ điều khiển rise trong điều khiển thích nghi robot Mô phỏng, kết hợp mạng nơron và bộ điều khiển phản hồi rise vào điều khiển thích nghi robot Chương 4. Kết luận chung và kiến nghị. 5. Ý nghĩa khoa học và thực tiễn của đề tài Với ứng dụng của mạng nơron truyền thẳng nhiều lớp điều khiển hệ Robot, sau khi đã xấp xỉ đƣợc mô hình động lực học Robot bằng mạng nơron, ta có thể thay thế gần đúng mô hình Robot bằng mạng nơron, từ đó căn cứ trên các thông số mô phỏng của mạng nơron, tính toán đƣợc tín hiệu điều khiển nhằm điều khiển thích nghi Robot phù hợp với yêu cầu cần thiết của điều khiển thích nghi hệ Robot. Để hoàn thành đƣợc luận văn này, em xin đƣợc gửi lời cảm ơn tới Giảng viên - TS. ĐÀO PHƢƠNG NAM và tập thể các thầy cô trong bộ môn Điều khiển tự động, Viện Điện, Trƣờng Đại học Bách Khoa Hà Nội đã tận tình giảng dạy và hƣớng dẫn em trong những tháng năm qua, cũng nhƣ tạo mọi điều kiện tốt nhất cho em. Và đặc biệt là tới gia đình, đã cổ vũ động viên em trong quá trình thực hiện luận văn này. Cuối cùng, với kiến thức và thời gian hạn chế, em còn để lại nhiều thiếu sót trong luận văn này. Vì vậy, em rất mong nhận đƣợc sự góp ý từ phía các thầy, các cô cũng nhƣ bạn đọc để bản luận văn này đƣợc hoàn thiện hơn. Em xin chân thành cảm ơn! Hà Nội, ngày … tháng … năm 2017 Học viên thực hiên Ngô Ngọc Hoàng 7 Ngô Ngọc Hoàng ĐK-TĐH2015B Luận văn Thạc sĩ Chuyên ngành: Điều khiển & Tự Động Hóa CHƢƠNG 1: TỔNG QUAN VỀ MẠNG NƠRON NHÂN TẠO Nghiên cứu và mô phỏng não ngƣời, cụ thể là mô phỏng nơron thần kinh là một ƣớc muốn từ lâu của nhân loại. Từ mơ ƣớc đó, nhiều nhà khoa học đã không ngừng nghiên cứu tìm hiểu về mạng nơron. Trong đó mạng nơron nhân tạo đã đƣợc nói đến ở cuốn sách “Điều khiển học, hay điều chỉnh và sự truyền sinh trong cơ thể sống, trong máy móc” của tác giả Nobert Wieners xuất bản năm 1948. Điều khiển học đã đặt ra mục đích nghiên cứu áp dụng nguyên lý làm việc của hệ thống thần kinh động vật vào điều khiển. Công cụ giúp điều khiển học thực hiện đƣợc mục đích này là trí tuệ nhân tạo và mạng nơron. Trí tuệ nhân tạo đƣợc xây dựng dựa trên mạng nơron. Mạng nơron nhân tạo (Artificial Neural Networks) là hệ thống đƣợc xây dựng dựa trên nguyên tắc cấu tạo của bộ não con ngƣời. Mạng nơron nhân tạo có một số lƣợng lớn mối liên kết của các phần tử biến đổi (Processing Elements) có liên kết song song. Nó có hành vi tƣơng tự nhƣ bộ não con ngƣời với các khả năng học (Learning), gọi lại (Recall) và tổng hợp thông tin từ sự luyện tập của các mẫu và dữ liệu. Các phần tử biến đổi của mạng nơron nhân tạo đƣợc gọi là các nơron nhân tạo (Artificial Neural) hoặc gọi tắt là nơron (Neural). Trong thiết kế hệ thống tự động hóa sử dụng mạng nơron là một khuynh hƣớng hoàn toàn mới, phƣơng hƣớng thiết kế hệ thống điều khiển thông minh, một hệ thống mà bộ điều khiển có khả năng tƣ duy nhƣ bộ não con ngƣời. 1.1. Lịch sử phát triển của mạng nơron nhân tạo Mạng nơron nhân tạo đã có một lịch sử lâu dài. Năm 1943, McCulloch và Pitts đã đƣa ra khả năng liên kết và một số liên kết cơ bản của mạng nơron. Năm 1949, Hebb đã đƣa ra các luật thích nghi trong mạng nơron. Năm 1958, Rosenblatt đƣa ra cấu trúc Perception. Năm 1969, Minsky và Papert phân tích sự đúng đắn của Perception, họ đã chứng minh các tính chất và chỉ rõ các giới hạn của một số mô hình. Năm 1976, Grossberg dựa vào tích chất sinh học đã đƣa ra một số cấu trúc của hệ động học phi tuyến với các tính chất mới. Năm 1982, Hoppfield đã đƣa ra mạng học phi tuyến với các tính chất mới. Năm 1982, Rumelhart đƣa ra mô hình song song (Parallel Distributer Processing-PDS) và một số kết quả và thuật toán. Thuật 8 Ngô Ngọc Hoàng ĐK-TĐH2015B Luận văn Thạc sĩ Chuyên ngành: Điều khiển & Tự Động Hóa toán học lan truyền ngƣợc (Back Propagation learning rule) đƣợc Rumelhart, Hinton, Williams (1986) đề xuất luyện mạng nơron nhiều lớp. Những năm gần đây, nhiều tác giả đã đề xuất nhiều loại cấu trúc mạng nơron mới. Mang nơron đƣợc ứng dụng trong nhiều lĩnh vực kinh tế, kỹ thuật, khoa học vũ trụ (Hecht - Nielsen, 1988). 1.2. Các tính chất của mạng nơron nhân tạo Là hệ phi tuyến: Mạng nơron có khả năng to lớn trong lĩnh vực nhận dạng và điều khiển các đối tƣợng phi tuyến. Là hệ xử lý song song: Mạng nơron có cấu trúc song song, do đó có tốc độ tính toán rất cao, rất phù hợp với lĩnh vực nhận dạng và điều khiển. Là hệ học và thích nghi: Mạng đƣợc luyện từ các số liệu quá khứ, có khả năng tự chỉnh khi số liệu đầu vào bị mất, có thể điều khiển on-line. Là hệ nhiều biến, là hệ nhiều đầu vào, nhiều đầu ra (Many Input Many Output - MIMO), rất tiện dụng khi điều khiển đối tƣợng có nhiều biến số. 1.3. Cấu trúc và mô hình mạng nơ-ron Theo mục 7.1.1 – Tr.208 tài liệu tham khảo [1] Mạng nơron là sự tái tạo bằng kỹ thuật những chức năng của hệ thần kinh con ngƣời. Trong quá trình tái tạo không phải tất cả các chức năng của bộ não con ngƣời có đều đƣợc tái tạo, mà chỉ có những chức năng cần thiết. Bên cạnh đó còn có những chức năng mới đƣợc tạo ra nhằm giải quyết một bài toán điều khiển đã định hƣớng trƣớc. Mạng nơron bao gồm vô số các nơron đƣợc liên kết truyền thông với nhau trong mạng. Hình 1.1 là một phần của mạng nơron bao gồm hai nơron. 9 Ngô Ngọc Hoàng ĐK-TĐH2015B Luận văn Thạc sĩ Chuyên ngành: Điều khiển & Tự Động Hóa Hình 1. 1. Một mạng nơ-ron cơ bản gồm hai thành phần Một nơ-ron chứa đựng các thành phần cơ bản: -Thân nơ-ron đƣợc giới hạn trong một màng membran và trong cùng là nhân. Từ thân nơ-ron còn có rất nhiều đƣờng rẽ nhánh tạm gọi là rễ. -“Bus” liên kết nơ-ron này với các nơ-ron khác đƣợc gọi là axon, trên axon có các đƣờng rẽ nhánh. Nơ-ron còn có thể liên kết với các nơ-ron khác qua các rễ. Chính vì cách liên kết đa dạng nhƣ vậy nên mạng nơ-ron có độ liên kết rất cao. Các rễ của nơ-ron đƣợc chia thành hai loại: loại nhận thông tin từ nơ-ron khác qua axon, mà ta sẽ gọi là rễ đầu vào và loại đƣa thông tin qua axon tới các nơron khác, gọi là rễ đầu ra. Một nơ-ron có thể có nhiều rễ đầu vào, nhƣng chỉ có một rễ đầu ra. Bởi vậy nếu xem nơ-ron nhƣ một khâu điều khiển thì nó chính là khâu có nhiều đầu vào, một đầu ra (khâu MISO) Hình 1. 2. Nơ-ron là khâu MISO Một tính chất rất cơ bản của mạng nơ-ron sinh học là các đáp ứng theo kích thích có khả năng thay đổi theo thời gian. Các đáp ứng có thể tăng lên, giảm đi hoặc hoàn toàn biến mất. Qua các nhánh axon liên kết tế bào nơ-ron này với các nơ-ron khác, sự thay đổi trạng thái của một nơ-ron cũng sẽ kéo theo sự thay đổi trạng thái của những nơ-ron khác và do đó là sự thay đổi của toàn bộ mạng nơ-ron. Việc thay 10 Ngô Ngọc Hoàng ĐK-TĐH2015B Luận văn Thạc sĩ Chuyên ngành: Điều khiển & Tự Động Hóa đổi trạng thái của mạng nơ-ron có thể thực hiện qua một quá trình “dạy” hoặc do khả năng “học” tự nhiên. Sự thay thế những tính chất này bằng một mô hình toán học tƣơng đƣơng đƣợc gọi là mạng nơ-ron nhân tạo. Mạng nơ-ron nhân tạo có thể đƣợc chế tạo bằng nhiều cách khác nhau vì vậy trong thực tế tồn tại rất nhiều kiểu mạng nơ-ron nhân tạo. Khâu cộng Σ: Khâu cộng tín hiệu vào có chức năng thực hiện phƣơng trình sau: m    wi xi i 1  w1   x1      tức là thực hiện phép nhân vô hƣớng hai vector w    và x    w  x   m  m   wT x (2.37) Khâu tiền đáp ứng c: Những khả năng hoạt động của nơ-ron hoàn toàn phụ thuộc vào khâu tạo chức năng đáp ứng c. Thế năng của một màng membran càng cao nếu nhƣ giá trị  càng lớn. Khâu tạo chức năng đáp ứng tạo giá trị đáp ứng tăng giảm phụ thuộc vào giátrị đầu vào, một cách đơn giản nhất có thể tạo đáp ứng theo phƣơng trình c  (2.38) Quan hệ giữa tín hiệu vào và ra đƣợc biểu diễn theo phƣơng trình trên là một quan hệ tĩnh và tuyến tính. Đây cũng là cách thiết kế nơ-ron nhân tạo một cách đơn giản nhất. Để tăng độ chính xác ngƣời ta tìm cách xây dựng mô hình động cho nơron. Thực tế, khi có kích thích đầu vào, thế năng của màng membran tăng dần lên cho dù ngay tại thời điểm đƣợc kích thích vẫn chƣa có đáp ứng đầu ra. Hoàn toàn tƣơng tự, khi kích thích mất đi thì nơ-ron cũng không thể trở về ngay trạng thái cân bằng cũ mà sự trở về diễn ra cũng dần dần nhƣ một quá trình liên tục theo thời gian. Quá trình đó có thể mô tả qua phƣơng trình vi phân bậc nhất : Tc  t   c  t   c0   t  (2.39) 11 Ngô Ngọc Hoàng ĐK-TĐH2015B Luận văn Thạc sĩ Chuyên ngành: Điều khiển & Tự Động Hóa trong đó c0 là thế năng của mạng membran ở trạng thái không bị kích thích. Đó là phƣơng trình động học của một khâu quán tính bậc nhất với hằng số thời gian quán tính T . Khâu tạo chức năng đáp ứng kiểu này còn có tên là BSB. Khâu đáp ứng  : Giá trị ra y của một nơ-ron biểu diễn trạng thái kích thích đến các nơ-ron tiếp theo trong mạng. Tín hiệu ra y phụ thuộc vào độ kích thích của nơ-ron, thông thƣờng đƣợc so sánh theo kiểu cắt ngƣỡng. Quan hệ này  của mô hình nơ-ron. Thông thƣờng giá trị ra y phải thay đổi liên tục theo sự thay đổi của tiền đáp ứng c hoặc không thay đổi nếu c nhỏ hơn giá trị ngƣỡng. đƣợc mô tả qua khâu tạo đáp ứng 1.4. Những mô hình nơ-ron thƣờng sử dụng Theo mục 7.1.2 – Tr.214 tài liệu tham khảo [1] : Mỗi một kết nối từ vector tín hiệu vào x tới tín hiệu ra y , qua đặc tính của khâu cộng Σ với hàm mô tả (2.37), khâu tiền đáp ứng c , và khâu tạo đáp ứng  sẽ cho ra một mô hình nơ-ron. Nhƣ vậy tổng cộng sẽ có tất cả là 15 mô hình nơ-ron. Giá trị đầu ra y của nơ-ron là:  y    c     c      c  wT x   Tuy nhiên, phổ biến nhất trong số 15 mô hình nơ-ron là sáu loại sau: STT Tên gọi STT Tên gọi 1 McCulloch-Pitts 1 Adeline 2 Fermi 2 Boltzmann 3 BSB 3 Hopfield 1.5. Cấu tạo mạng nơ-ron Theo mục 7.1.3 – Tr.208 tài liệu tham khảo [1]: Dựa trên những phƣơng pháp xây dựng nơ-ron ở phần trên, ta có thể coi nơron nhƣ một hệ MISO truyền đạt và xử lý tín hiệu. Đặc tính truyền đạt của nơ-ron 12 Ngô Ngọc Hoàng ĐK-TĐH2015B Luận văn Thạc sĩ Chuyên ngành: Điều khiển & Tự Động Hóa phần lớn là đặc tính truyền đạt tĩnh, chỉ khi chọn khâu chức năng đáp ứng kiểu BSB thì lúc đó nơ-ron có đặc tính động. Trong mọi trƣờng hợp do đặc tính phi tuyến của khâu tạo chức năng ra kết hợp và/hoặc với đặc tuyến phi tuyến của khâu tạo chức năng đáp ứng mà nơ-ron là một hệ có tính phi tuyến mạnh. Liên kết các đầu vào và ra của nhiều nơ-ron với nhau ta đƣợc một mạng nơron. Việc ghép nối các nơ-ron trong mạng với nhau có thể theo một nguyên tắc bất kỳ nào đó, vì về nguyên tắc một nơ-ron là một hệ MISO. Từ đó có thể phân biệt các loại nơ-ron khác nhau nhƣ các loại nơ-ron mà các đầu vào nhận thông tin từ môi trƣờng bên ngoài với các loại nơ-ron mà các đầu vào đƣợc nối với các nơ-ron khác trong mạng. Các nơ-ron mà đầu vào giữ chức năng nhận thông tin từ môi trƣờng bên ngoài đóng chức năng “đầu vào” của mạng. Cũng tƣơng tự nhƣ vậy, một nơ-ron có một đầu ra, đầu ra của nơ-ron này có thể là đầu vào của nhiều nơ-ron khác hoặc có thể đƣa ra môi môi trƣờng bên ngoài. Những nơ-ron có đầu ra đƣa tín hiệu vào môi trƣờng bên ngoài đƣợc gọi là “đầu ra” của mạng. Nhƣ vậy một mạng nơ-ron cũng có chức năng của một hệ truyền đạt và xử lý tín hiệu từ đầu vào đến đầu ra của mạng. Các nơ-ron trong một mạng thƣờng đƣợc chọn cùng một loại, chúng đƣợc phân biệt với nhau qua vector hàm trọng lƣợng ở đầu vào w . Hình 1. 3. Mạng nơ-ron ba lớp Nguyên lý cấu tạo của một mạng nơ-ron bao gồm nhiều lớp, mỗi lớp bao gồm nhiều nơ-ron có cùng một chức năng trong mạng. Trong hình 2.2.3 là mô hình của một mạng nơ-ron ba lớp với 9 nơ-ron. Mạng có ba đầu vào x1 , x2 , x3 và hai đầu ra y1 , y2 . Các tín hiệu đầu vào đƣợc đƣa đến ba nơ-ron đầu vào, ba nơ-ron này làm 13 Ngô Ngọc Hoàng ĐK-TĐH2015B Luận văn Thạc sĩ Chuyên ngành: Điều khiển & Tự Động Hóa thành lớp đầu vào của mạng (input layer). Các nơ-ron trong lớp này đƣợc gọi là nơron đầu vào. Đầu ra của các nơ-ron này đƣợc đƣa đến đầu vào của bốn nơ-ron tiếp theo, bốn nơ-ron này không trực tiếp tiếp xúc với môi trƣờng xung quanh và làm thành lớp trung gian trong mạng (hidden layer). Các nơ-ron trong lớp này có tên là nơ-ron nội hay nơ-ron bị che. Đầu ra của các nơ-ron này đƣợc đƣa đến hai nơ-ron đƣa tín hiệu ra môi trƣờng bên ngoài. Các nơ-ron trong lớp đầu ra này có tên là nơron đầu ra (output layer). Hình 1. 4. Mạng MLP Hình 1. 5. Cấu trúc mạng nơ-ron a) Mạng truyền thẳng một lớp b) Mạng hồi tiếp một lớp c) Mạng MLP truyền thẳng d) Mạng MLP hồi tiếp Mạng nơ-ron đƣợc xây dựng nhƣ trên là mạng gồm ba lớp mắc nối tiếp nhau đi từ đầu vào đến đầu ra. Trong mạng không tồn tại bất kỳ một mạch hồi tiếp nào kể 14 Ngô Ngọc Hoàng ĐK-TĐH2015B Luận văn Thạc sĩ Chuyên ngành: Điều khiển & Tự Động Hóa cả hồi tiếp nội lẫn hồi tiếp từ đầu ra trở về đầu vào. Một mạng nơ-ron có cấu tạo nhƣ vậy đƣợc gọi là mạng truyền thẳng (feedforward network). Mạng nơ-ron có đƣờng phản hồi từ đầu ra của một nơ-ron tới đầu vào của nơ-ron cùng lớp hoặc thuộc lớp phía trƣớc có tên gọi là mạng hồi tiếp (feedback network). Mạng nơ-ron bao gồm một hay nhiều lớp trung gian đƣợc gọi là mạng MLP (multilayer perceptrons Network). Còn mạng chỉ có một lớp, vừa là lớp vào vừa là lớp trung gian và cũng là lớp ra thì mạng đó có tên là một lớp. Mạng nơ-ron có cấu trúc mạng ghép nối hoàn toàn, tức là bất cứ một nơ-ron nào trong mạng cũng đƣợc nối với một hoặc vài nơ-ron khác. Trong trƣờng hợp các nơ-ron trong mạng có khâu tạo chức năng đáp ứng là khâu tuyến tính, tính phi tuyến chỉ nằm ở khâu tạo chức năng ra thì việc mắc nối tiếp các nơ-ron trong mạng không còn ý nghĩa nữa và lúc đó ta hoàn toàn có thể thay thế mạng nơ-ron nhiều lớp thành mạng nơ-ron một lớp. 1.6. Phƣơng thức làm việc của mạng nơ-ron Theo mục 7.1.4 – Tr.217 tài liệu tham khảo [1]: Phƣơng thức làm việc của một mạng nơ-ron nhân tạo có thể phân chia làm hai giai đoạn: -Tự tái tạo lại (reproduction) -Và giai đoạn học (learning phase). Ở một mạng nơ-ron có cấu trúc bền vững có nghĩa là vector hàm trọng lƣợng đầu vào, khâu tạo đáp ứng và khâu tạo tín hiệu đầu ra đều cố định không bị thay đổi về mặt cấu trúc cũng nhƣ tham số thì mạng có một quá trình truyền đạt xác định chắc chắn, tĩnh hoặc động phụ thuộc vào cấu tạo của các nơ-ron trong mạng. Ở đầu vào của mạng xuất hiện thông tin thì tại đầu ra cũng xuất hiện một đáp ứng tƣơng ứng. Đối với mạng nơ-ron có quá trình truyền đạt tĩnh, đáp ứng đầu ra xuất hiện ngay sau khi đầu vào nhận đƣợc thông tin, còn đối với mạng nơ-ron có quá trình truyền đạt động thì phải sau một thời gian quá độ ở đầu ra của mạng nơ-ron mới xuất hiện đáp ứng. Xuất phát từ quan điểm mọi đáp ứng của nơ-ron đều tiền định tự nhiên, có nghĩa là khi xuất hiện các kích thích ở đầu vào của mạng ở các thời điểm 15 Ngô Ngọc Hoàng ĐK-TĐH2015B Luận văn Thạc sĩ Chuyên ngành: Điều khiển & Tự Động Hóa khác nhau các giá trị nhƣ nhau thì đáp ứng ở đầu ra ở các thời điểm tƣơng ứng cũng hoàn toàn giống nhau. Quá trình làm việc nhƣ vậy của một mạng nơ-ron đƣợc gọi là quá trình tái diễn lại (reproduction phase). Khi có thông tin ở đầu vào mạng lƣu giữ thông tin đó và dựa trên các tri thức của mình đƣa ra đáp ứng ở đầu ra phù hợp với lƣợng thông tin thu đƣợc từ đầu vào. Mạng nơ-ron khi mới hình thành còn chƣa có tri thức, tri thức của mạng hình thành dần sau một quá trình học. Mạng nơ-ron đƣợc dạy bằng cách đƣa vào đầu vào những kích thích và mạng hình thành những đáp ứng tƣơng ứng, những đáp ứng phù hợp với từng loại kích thích sẽ đƣợc lƣu giữ, giai đoạn này đƣợc gọi là giai đoạn học của mạng. Khi đã hình tri thức mạng có thể giải quyết các vấn đề cụ thể một cách đúng đắn. Đó có thể là những vấn đề ứng dụng rất khác nhau, đƣợc giải quyết chủ yếu dựa trên sự tổ chức hợp nhất giữa các thông tin đầu vào của mạng và các đáp ứng đầu ra: 1) Nhiệm vụ của một mạng liên kết là hoàn chỉnh hoặc hiệu chỉnh các thông tin thu thập đƣợc không đầy đủ hoặc bị tác động của nhiễu. Mạng nơ-ron kiểu này đƣợc ứng dụng trong lĩnh vực hoàn thiện mẫu, mà một trong những lĩnh vực cụ thể đó là nhận dạng chữ viết. 2) Nhiệm vụ tổng quát của một mạng nơ-ron là lƣu giữ động các thông tin. Dạng thông tin lƣu giữ đó chính là quan hệ giữa các thông tin đầu vào của mạng và các đáp ứng đầu ra tƣơng ứng, để khi có một kích thích bất kỳ tác động vào mạng, mạng có khả năng suy diễn và đƣa ra một đáp ứng phù hợp. Đó chính là chức năng nhận dạng theo mẫu của mạng nơ-ron. Để thực hiện chức năng này, mạng nơron đóng vai trò nhƣ một bộ phận tổ chức các nhóm thông tin đầu vào và tƣơng ứng với mỗi nhóm là một đáp ứng đầu ra phù hợp. Nhƣ vậy một nhóm bao gồm một loại thông tin đầu vào và một đáp ứng ra. Các nhóm có thể đƣợc hình thành trong quá trình học và cũng có thể hình thành không trong quá trình học. Trong lĩnh vực ứng dụng, mạng nơ-ron có khả năng tạo ra các đáp ứng đầu ra dựa trên thông tin thu thập vào mạng, điều đó có nghĩa là ứng với một thông tin xác định ở đầu vào mạng cung cấp một đáp ứng tƣơng ứng xác định ở đầu ra. Nhìn trên quan điểm lý thuyết hệ thống, mạng nơ-ron đƣợc coi nhƣ một bộ xấp xỉ thông 16 Ngô Ngọc Hoàng ĐK-TĐH2015B Luận văn Thạc sĩ Chuyên ngành: Điều khiển & Tự Động Hóa tin, thiết bị này có khả năng cung cấp một quá trình xử lý mong muốn một cách chính xác. Mục đích của quá trình học là tạo ra một tri thức cho mạng thông qua rèn luyện. Nguyên tắc học đƣợc thực hiện cho một mạng mà cấu trúc của mạng cũng nhƣ các phần tử nơ-ron cố định, chính là thay đổi giá trị của các phần tử trong vector hàm trọng lƣợng, vector ghép nối giữa các phần tử nơ-ron trong mạng. Các phần tử này đƣợc chọn sao cho quá trình truyền đạt mong muốn đƣợc xấp xỉ một cách đủ chính xác nhƣ bài toán yêu cầu. Để đạt đƣợc mục đích đó, ngƣời ta cho tác k  động vào đầu vào của mạng hàng loạt các tác động x , k  1,2 có khả năng lặp lại trong quá trình mạng làm việc. Những tác động này đƣợc gọi là tác động mẫu.  Các đáp ứng y k  của tác động mẫu đƣợc so sánh với đáp ứng mẫu y k chọn trƣớc và các phần tử của vector hàm trọng lƣợng w đƣợc hiệu chỉnh sao cho sai lệch so với mẫu mong muốn là nhỏ nhất. Quá trình chỉnh định này sẽ đƣợc thực hiện cho đến khi đạt đƣợc sai số mong muốn nào đó. Mạng lúc này đã có đƣợc một đáp ứng đầu ra hoàn toàn phù hợp với tác động mẫu đầu vào và kết quả này sẽ đƣợc cất giữ. 1.7. Các luật học Nhƣ phần trên đã trình bày, học là vấn đề quan trọng trong mạng nơ-ron. Có hai kiểu học: -Học thông số (Paramater Learning): Tìm ra biểu thức cập nhật các thông số về trọng số cập nhật kết nối giữa các nơron. -Học cấu trúc (Structure Learning): Trọng tâm là sự biến đổi cấu trúc của mạng nơ-ron gồm số lƣợng nút (node) và các mẫu liên kết. Có hai loại học: Thực hiện đồng thời và không đồng thời. Chúng ta tập trung vào phần học thông số. Giả sử ma trận trọng số bao gồm tất cả các phần tử thích ứng của mạng nơron. Nhiệm vụ của việc học thông số là bằng cách nào đó, tìm đƣợc ma trận chính xác mong muốn từ ma trận giả thuyết ban đầu với cấu trúc của mạng nơron có sẵn. Để làm đƣợc việc đó, mạng nơron sử dụng các trọng số điều chỉnh, với nhiều 17 Ngô Ngọc Hoàng ĐK-TĐH2015B Luận văn Thạc sĩ Chuyên ngành: Điều khiển & Tự Động Hóa phƣơng pháp học khác nhau có thể tính toán gần đúng ma trận W cần tìm đặc trƣng cho mạng. Có ba phƣơng pháp học: * Học có giám sát (Supervised Learning) Là quá trình học có giám sát (Hình 1.6), ở mỗi thời điểm thứ i khi đƣa tín hiệu vào xi mạng nơron, tƣơng ứng sẽ có các đáp ứng mong muốn di của đầu ra cho trƣớc ở thời điểm đó. Hay nói cách khác, trong quá trình học có giám sát, mạng nơron đƣợc cung cấp liên tục các cặp số liệu mong muốn vào - ra ở từng thời điểm (x1, d1), (x2, d2), …, (xk, dk), … khi cho đầu vào thực của mạng là xk tƣơng ứng sẽ có tín hiệu đầu ra cũng đƣợc lặp lại là dk giống nhƣ mong muốn. Kết quả của quá trình học có giám sát là tạo đƣợc một hộp đen có đầu vào là véc tơ tín hiệu vào x sẽ đƣa ra đƣợc câu trả lời đúng d. Hình 1. 7. Mô hình học không có giám sát Hình 1. 6. Mô hình học có giám sát và học củng cố Để đạt đƣợc kết quả mong muốn trên, khi đƣa vào tín hiệu xk, thông thƣờng sẽ có sai lệch ek giữa tín hiệu đầu ra thực yk và tín hiệu đầu ra mong muốn dk. Sai lệch đó sẽ đƣợc truyền ngƣợc tới đầu vào để điều chỉnh thông số mạng nơron là ma trận trọng sô W… Quá trình cứ thế tiếp diễn sao cho sai lệch giữa tín hiện ra mong muốn và tín hiệu ra thực tế trong phạm vi cho phép, kết quả ta nhận đƣợc ma trận trọng số W với các phần tử wij đã đƣợc điều chỉnh phù hợp với đặc điểm của đối tƣợng hay hàm số mạng nơron cần học. * Học củng cố (Reinforcement Learning) 18 Ngô Ngọc Hoàng ĐK-TĐH2015B Luận văn Thạc sĩ Chuyên ngành: Điều khiển & Tự Động Hóa Tín hiệu có thể đƣợc đƣa tín hiệu d từ bên ngoài môi trƣờng (Hình 1.6), nhƣng tín hiệu này có thể không đƣợc đƣa đầy đủ, mà có thể chỉ đƣa đại diện 1 bít để có tính chất kiểm tra quá trình đúng hay sai. Tín hiệu đó đƣơc gọi là tín hiệu củng cố (Reinforcement Signal). Phƣơng pháp học củng cố chỉ là một trƣờng hợp của phƣơng pháp học có giám sát, bởi vì nó cũng có nhận tín hiệu chỉ đạo (giáo viên) phản hồi từ môi trƣờng. Chỉ khác là tín hiệu củng cố chỉ có tính ƣớc lƣợng hơn là để dạy. Có nghĩa là chỉ có thể nói là tốt hay xấu cho một số tín hiệu đầu ra cá biệt. Tín hiệu giám sát bên ngoài d thƣờng đƣợc tiến hành bởi các tín hiệu ƣớc lƣợng để tạo thông tin tín hiệu ƣớc lƣợng cho mạng nơron điều chỉnh trọng số với hy vọng sự ƣớc lƣợng đó mạng lại sự tốt đẹp cho quá trình tính toán. Học củng cố còn đƣợc gọi là học với sự ƣớc lƣợng (Learning With a Critic). * Học không có giám sát (Unsupervised Learning) Trong trƣờng hợp này, hoàn toàn không có tín hiệu ở bên ngoài (Hình 1.7). Giá trị mục tiêu điều khiển không đƣợc cung cấp và không đƣợc tăng cƣờng. Mạng phải khám phá các mẫu, các nét đặc trƣng, tính cân đối, tính tƣơng quan, … Trong khi khám phá các đặc trƣơng khác, mạng nơron đã trải qua việc tự thay đổi thông số, vấn đề đó còn gọi là tự tổ chức (Self – Organizing). Hình 1.8 mô tả cấu trúc chung của quá trình học của ba phƣơng pháp học đã đƣợc nêu trên. Trong đó tín hiệu vào xj, j = 1, 2, 3, …, m, có thể đƣợc lấy từ đầu ra của các nơron khác hoặc có thể đƣợc lấy từ bên ngoài. Chú ý rằng thông số ngƣỡng θi có thể đƣợc bao trong việc học nhƣ là một trọng số thứ m: wi,m của tín hiệu vào có giá trị xm = -1. Tín hiệu mong muốn di có sẵn chỉ trong phƣơng pháp học có giám sát hoặc củng cố (với di là tín hiệu học củng cố). Từ hai phƣơng pháp học trên. Trọng số của nơron thứ i đƣợc thay đổi tùy theo tín hiệu ở đầu vào mà nó thu nhận, giá trị đầu ra của nó. Trong phƣơng pháp học không giám sát sự thay đổi trọng số chỉ dựa trên cơ sở các giá trị đầu vào và đầu ra. Dạng tổng quát của luật học trọng số của mạng nơron cho biết là gia số của véc tơ wi là Δwi tỷ lệ với tín hiệu học r và tín hiệu đầu vào x(t): 19 Ngô Ngọc Hoàng ĐK-TĐH2015B

- Xem thêm -

Tài liệu ứng dụng mạng nơron trong điều khiển thích nghi

Tài liệu liên quan

Tài liệu vừa đăng

Tài liệu xem nhiều nhất