Tài liệu Sử dụng mạng noron cho nhận dạng ký tự tiếng việt

  • Số trang: 58 |
  • Loại file: PDF |
  • Lượt xem: 309 |
  • Lượt tải: 0
nguyetha

Đã đăng 8489 tài liệu

Mô tả:

1 LỜI CẢM ƠN Xin chân thành cảm ơn Thầy giáo, PGS.TS. Lê Bá Dũng đã tận tình chỉ dạy, hướng dẫn tôi trong suốt thời gian nghiên cứu và thực hiện luận văn. Tôi cũng xin chân thành cảm ơn các Thầy giáo Viện Công nghệ Thông tin và các Thầy giáo Trường Đại học sư phạm Hà Nội 2 đã giảng dạy, giúp đỡ trong suốt thời gian học tập. Xin cảm ơn tất cả các anh chị học viên Cao học khóa 15 – Khoa học máy tính, cảm ơn các cán bộ công chức, giảng viên Trường Đại học sư phạm Hà Nội 2 đã tạo điều kiện tốt cho tôi trong suốt trong hai năm học qua. Xin cảm ơn các bạn bè, đồng nghiệp, gia đình đã tạo mọi điều kiện thuận lợi cũng như đã chỉ bảo tôi rất nhiều trong thời gian thực hiện luận văn này để tôi có được kết quả như ngày hôm nay. Hà Nội, tháng 11/2013 Người viết luận văn Nguyễn Đức Thịnh 2 LỜI CAM ĐOAN Tôi xin cam đoan đề tài luận văn “Sử dụng mạng noron cho nhận dạng ký tự tiếng Việt” là công trình nghiên cứu của bản thân tôi. Các số liệu, kết quả nghiên cứu nêu trong luận văn này là trung thực và không sao chép y nguyên từ một công trình nào khác. Tôi xin chịu trách nhiệm về luận văn của mình. Hà Nội, tháng 11/2013 Người viết luận văn Nguyễn Đức Thịnh 3 MỤC LỤC Trang LỜI CẢM ƠN .................................................................................................. 1 LỜI CAM ĐOAN ............................................................................................ 2 MỤC LỤC ........................................................................................................ 3 DANH MỤC CÁC TỪ TIẾNG ANH VIẾT TẮT ........................................ 6 DANH MỤC CÁC HÌNH .............................................................................. 7 LỜI NÓI ĐẦU ................................................................................................. 8 CHƢƠNG 1. MỘT SỐ VẤN ĐỀ VỀ MẠNG NƠRON ............................. 10 1.1. Mạng Nơron sinh học............................................................................. 10 1.2. Mạng Nơ-ron nhân tạo .......................................................................... 11 1.2.1. Nơ-ron nhân tạo ............................................................................. 11 1.2.2. Mạng nơ-ron nhân tạo................................................................... 17 1.2.2.1. Mạng truyền thẳng. ............................................................. 18 1.2.2.2. Mạng hồi quy (Recurrent Neutral Network) ...................... 20 1.3. Đặc trƣng của mạng nơron. .................................................................. 21 1.4. Mạng KOHONEN. ................................................................................ 24 1.4.1. Giới thiệu về mạng Nơron Kohonen. ............................................ 24 1.4.2. Cấu trúc của mạng nơron Kohonen ............................................. 25 1.4.3. Thực hiện mạng nơron Kohonen. ................................................. 27 1.4.3.1. Chuẩn hóa đầu vào. ................................................................ 27 1.4.3.2. Tính toán đầu ra cho mỗi nơron. ............................................ 28 1.4.3.3. Chọn nơron chiến thắng. ........................................................ 28 1.4.3.4. Quá trình học của mạng nơron Kohonen. .............................. 29 1.4.4. Kết luận. ............................................................................................... 33 CHƢƠNG 2. MỘT SỐ VẤN ĐỀ NHẬN DẠNG KÝ TỰ SỬ DỤNG MẠNG NƠRON ............................................................................................ 35 4 2.1. Nhận dạng ký tự ..................................................................................... 35 2.1.1. Giới thiệu về nhận dạng ký tự ....................................................... 35 2.1.2. Mô hình tổng quát của một hệ nhận dạng ký tự. ......................... 38 2.2. Một số phƣơng pháp nhận dạng ký tự. ................................................ 38 2.2.1. Đối sánh mẫu. ................................................................................ 38 2.2.2. Phương pháp tiếp cận cấu trúc. .................................................... 39 2.2.3. Mô hình Markov ẩn (HMM - Hidden Markov Model) ................ 40 2.2.4 Máy véc tơ tựa (SVM) ..................................................................... 40 2.2.5. Mạng nơron .................................................................................... 41 2.2.5.1. Những bài toán thích hợp. ..................................................... 41 2.2.5.2. Các lĩnh vực ứng dụng mạng nơron. .................................... 41 CHƢƠNG 3. ỨNG DỤNG MẠNG KOHONEN CHO NHẬN DẠNG KÝ TỰ ............................................................................................... 43 3.1. Bài toán.................................................................................................... 43 3.1.1. Phát biểu bài toán .......................................................................... 43 3.1.2. Ý tưởng bài toán ............................................................................. 43 3.2. Xác định các tham số của mạng cho nhận dạng ký tự. ...................... 43 3.2.1. Các bước giải quyết bài toán sử dụng mạng nơron Kohonen.................................................................................................... 43 3.2.1.1. Xây dựng giao diện vẽ. .......................................................... 44 3.2.1.2. Xây dựng mạng nơron Kohonen............................................ 44 3.2.1.3. Xử lý dữ liệu (phân tích ảnh). ................................................ 45 3.2.1.4. Huấn luyện mạng nơron Kohonen. ........................................ 46 3.2.1.5. Nhận dạng mạng nơron Kohonen. ......................................... 48 3.2.1.6. Kết luận. ................................................................................. 48 3.2.2. Giao diện chương trình. ................................................................ 49 3.2.3. Quá trình nhận dạng ..................................................................... 50 5 3.3. Tính toán và huấn luyện mạng Nơron. ................................................ 50 3.3.1. Tính toán đầu ra của mạng KOHONEN. ..................................... 50 3.3.2. Huấn luyện mạng nơron Kohonen .............................................. 52 3.4. Kết quả chƣơng trình............................................................................. 54 3.5. Kết quả đạt đƣợc, hƣớng phát triển. .................................................... 56 3.5.1. Kết quả. ........................................................................................... 56 3.5.2. Hướng phát triển tiếp theo ............................................................ 56 KẾT LUẬN .................................................................................................... 57 TÀI LIỆU THAM KHẢO ............................................................................ 58 6 DANH MỤC CÁC TỪ TIẾNG ANH VIẾT TẮT STT Từ viết tắt Từ viết tƣờng minh 1 HMM Hiden Markov Model 2 LVQ Learning Vector Quantization 3 MLP Multi Layer Perception 4 OCR Optical Character Recognation 5 PDA Personal Digital Assistant 6 RFID Radio Frequency Identification 7 SOM Self Organizing Maps 8 SVM Support Vector Machine 7 DANH MỤC CÁC HÌNH Hình 1.1. Mô hình nơron sinh học Hình 1.2. Mô hình một nơron Hình 1.3. Mạng truyền thẳng một lớp Hình 1.4. Mạng truyền thẳng nhiều lớp Hình 1.5. Mạng một lớp có nối ngược Hình 1.6. Mạng nhiều lớp có nối ngược Hình 1.7. Cấu trúc của mạng Kohonen Hình 1.8. Mạng Kohonen điển hình Hình 1.9. Huấn luyện mạng Kohonen Hình 2.1. Mô hình tổng quát của một hệ nhận dạng ký tự Hình 3.1. Quá trình tìm giới hạn ký tự Hình 3.2. Quá trình lấy mẫu xuống Hình 3.3. Quá trình ánh xạ từ ma trận điểm sang ma trận giá trị Hình 3.4. Quá trình huấn luyện mạng nơron kohonen Hình 3.5. Giao diện chương trình mô phỏng Hình 3.6. Nhận dạng ký tự N Hình 3.7. Nhận dạng ký tự Ô Hình 3.8. Nhận dạng ký tự Á 8 PHẦN MỞ ĐẦU Công nghệ thông tin ngày nay càng ngày càng trở lên quan trọng trong cuộc sống hàng ngày của chúng ta. Trong công nghệ thông tin, trí tuệ nhân tạo hiện nay đang được quan tâm rất nhiều của xã hội. Nó như là một giải pháp mang đến hy vọng mới mô phỏng được bộ não con người. Nghiên cứu và mô phỏng trí não, cụ thể là tế bào thần kinh (Neural) là một ước muốn từ lâu của nhân loại. Với khoảng 15 tỷ Neural ở não người, mỗi Neural có thể nhận hàng vạn tín hiệu từ khớp thần kinh và được coi là một cơ chế sinh vật phức tạp nhất. Bộ não con người có khả năng giải quyết rất nhiều vấn đề như: nghe, nhìn, nói, hồi ức thông tin, phân biệt, phân tích các mẫu dựa trên một số thông tin đã có. Neural thần kinh chính là yếu tố chính giúp chúng ta có thể làm những công việc như vậy. Bộ não phân công công việc xủ lí cho hàng tỉ Neural có liên quan, điều khiển các mối liên hệ giữa các Neural đó. Neural không ngừng nhận và truyền thông tin lẫn nhau. Cơ chế hoạt động của Neural [1] bao gồm: liên kết (association), tổng quát hóa (generation), và tự tổ chức (Self Orgazation). Các Nơron tự liên kết với nhau thành mạng trong xử lý. Mỗi mạng gồm hàng vạn các phần tử Nơron khác nhau. Mỗi phần tử Nơron có khả năng liên kết với hàng nghìn các Nơron khác. Hiện nay, mạng Nơron được đưa vào ứng dụng rộng rãi trong rất nhiều lĩnh vực. Và bài toán nhận dạng là bài toán sử dụng các tính năng của mạng Nơron nhiều nhất. Bài toán nhận dạng với sự trợ giúp của mạng Nơron ngày nay đã không còn dừng ở mức độ nghiên cứu nữa mà nó trở thành một lĩnh vực để áp dụng vào thực tế. Các bài toán nhận dạng được nghiên cứu nhiều nhất hiện nay tập trung vào nhận dạng mẫu hình học (vân tay, mặt người, hình khối …), nhận dạng tiếng nói và nhận dạng chữ viết. Chúng được ứng dụng trong rất nhiều lĩnh vực như y học, dự báo thời tiết, dự báo cháy rừng, …, các 9 lĩnh vực tự động hóa như điều khiển rô-bốt, điều khiển các thiết bị bằng giọng nói,…. Trong số các bài toán nhận dạng này, nhận dạng chữ viết đang được ứng dụng rất phổ biến. Nhận dạng chữ viết được ứng dụng trong quá trình tự động hóa các công việc văn phòng như nhập liệu, lưu trữ văn bản, sách báo, phân loại thư tín,…, những công việc rất nhàm chán và đòi hỏi nhiều thời gian của con người. Nhận dạng bằng mạng Nơron đang được ứng dụng trong hàng loạt lĩnh vực quan trọng của cuộc sống, phục vụ lợi ích trực tiếp và thiết thực cho công việc của con người. Mục đích của luận văn là: Trình bày các kết quả nghiên cứu lý thuyết phục vụ cho chủ đề: “Nhận dạng chữ viết tay Tiếng Việt sử dụng mạng Nơron”. Tuy nhiên, do hạn chế về mặt thời gian cũng như độ phức tạp của bài toán mà trong khuôn khổ, thời lượng của luận văn, tôi chỉ đi sâu nghiên cứu và đưa ra một chương trình mô phỏng nhận dạng ký tự viết tay Tiếng Việt rời rạc trực tuyến sử dụng mạng Nơron Kohonen. 10 CHƢƠNG 1 MỘT SỐ VẤN ĐỀ VỀ MẠNG NƠRON 1.1. Mạng Nơron sinh học Bộ não con người có khoảng 1010 tế bào thần kinh liên kết chặt chẽ với nhau được gọi là các nơ-ron. Mỗi nơ-ron gồm có ba phần: Thân nơ-ron với nhân ở bên trong (soma), một đầu sợi trục thần kinh ra (axon) và một hệ thống tế bào hình cây (dendrite). Tế bào hình cây có nhiệm vụ mang các tín hiệu điện tới các tế bào thân, tế bào thân sẽ thực hiện gộp (Sum) và phân ngưỡng (Thresholds) các tín hiệu đến. Sợi trục thần kinh làm nhiệm vụ đưa các tín hiệu thân ra ngoài. Trong thực tế có rất nhiều dây thần kinh vào và chúng bao phủ một diện tích rất lớn (0.25 mm2) để nhận các tín hiệu từ các nơ-ron khác. Đầu thần kinh ra được rẽ nhánh nhằm chuyển giao tín hiệu từ thân nơ-ron tới nơ-ron khác. Các nhánh của đầu thần kinh được nối với các khớp thần kinh (synapse). Các khớp thần kinh này được nối với thần kinh vào của các nơ-ron khác. Sự sắp xếp của các nơ-ron và mức độ mạnh yếu của các khớp thần kinh được quyết định bởi quá trình hóa học phức tạp, sẽ thiết lập chức năng của mạng nơ-ron, các nơ-ron có thể sửa đổi tín hiệu tại các khớp, trong các nơ-ron nhân tạo được gọi là trọng số. Có thể nói, mạng nơ-ron sinh học hoạt động chậm hơn rất nhiều so với các linh kiện điện tử (10-3 giây so với 10-9 giây), nhưng bộ não có thể thực hiện nhiều công việc nhanh hơn rất nhiều so với máy tính thông thường. Do cấu trúc song song của mạng nơ-ron sinh học thể hiện toàn bộ các nơ-ron thực hiện đồng thời tại một thời điểm. Mạng nơ-ron nhân tạo cũng có được đặc điểm này. Các mạng nơ-ron nhân tạo chủ yếu thực nghiệm trên các máy tính mạnh có vi mạch tích hợp rất lớn, các thiết bị quang, bộ xử lý song song. Điều 11 này cũng giải thích tại sao những nghiên cứu khoa học về mạng nơ-ron nhân tạo có điều kiện phát triển cùng với sự phát triển về kỹ thuật công nghệ phần cứng máy tính. Có nhiều loại nơ-ron khác nhau về kích thước và khả năng thu phát tín hiệu. Tuy nhiên, chúng có cấu trúc và nguyên lý hoạt động chung. Hình vẽ (1.1) là một hình ảnh đơn giản hoá của một loại nơ-ron như vậy. [3] Hình 1.1. Mô hình nơ-ron sinh học Hoạt động của nơ-ron sinh học có thể mô tả tóm tắt như sau: Mỗi nơ-ron nhận tín hiệu vào từ các tế bào thần kinh khác. Chúng tích hợp các tín hiệu vào, khi tổng tín hiệu vượt quá một ngưỡng nào đó chúng tạo tín hiệu ra và gửi tín hiệu này tới các nơ-ron khác thông qua dây thần kinh. Các nơ-ron liên kết với nhau thành mạng. Mức độ bền vững của các liên kết này xác định một hệ số gọi là trọng số liên kết. 1.2. Mạng Nơ-ron nhân tạo 1.2.1. Nơ-ron nhân tạo Để mô phỏng các tế bào thần kinh và các khớp nối thần kinh của bộ não con người, mạng nơ-ron nhân tạo có các thành phần có vai trò tương tự là 12 các nơ-ron nhân tạo và kết nối giữa chúng (kết nối này gọi là weights). Nơ-ron là một đơn vị tính toán có nhiều đầu vào và một đầu ra, mỗi đầu vào đến từ một khớp nối thần kinh (synapse). Đặc trưng của nơ-ron là một hàm kích hoạt phi tuyến chuyển đổi một tổ hợp tuyến tính của tất cả các tín hiệu đầu vào thành tín hiệu đầu ra. Một nơ-ron nhân tạo là một đơn vị tính toán hay đơn vị xử lý thông tin cơ sở cho hoạt động của một mạng nơ-ron. Các thành phần cơ bản của một mô hình nơ-ron.[1] Trọng số và tổng tín hiệu đầu vào: Mỗi nơ-ron có rất nhiều dây thần kinh vào, nghĩa là mỗi nơ-ron có thể tiếp nhận đồng thời nhiều tín hiệu. Giả sử tại nơ-ron i có N tín hiệu vào, mỗi tín hiệu vào Sj được gán một trọng số Wij tương ứng. Ta ước lượng tổng tín hiệu đi vào nơ-ron neti theo một số dạng sau: (i) Dạng tuyến tính: neti N Wij s j (1.1) j 1 (ii) Dạng toàn phương: neti N Wij s 2j (1.2) j 1 (iii) Dạng mặt cầu: neti Trong đó: 2 N s j j 1 2 wij và w ij j 1, N lần lượt là tâm và bán kính mặt cầu (1.3) 13 Hàm kích hoạt (hàm chuyển): Hầu hết các đơn vị trong mạng nơ-ron chuyển net input bằng cách sử dụng một hàm vô hướng (scalar – to – scalar function) gọi là hàm kích hoạt, kết quả của hàm này là một giá trị gọi là mức độ kích hoạt của đơn vị. Trừ khả năng đơn vị đó thuộc lớp ra, giá trị kích hoạt được đưa vào một hay nhiều đơn vị khác. Các hàm kích hoạt thường bị ép vào một khoảng giá trị xác định, do đó thường được gọi là các hàm nén (squashing). Hàm biến đổi tín hiệu đầu vào net cho tín hiệu đầu ra out được gọi là hàm kích hoạt. Hàm này có đặc điểm là không âm và bị chặn, dùng để giới hạn biên độ đầu ra của nơ-ron. Có nhiều dạng hàm kích hoạt, người ta thường sử dụng một hàm kích hoạt chung cho toàn mạng. Một số hàm kích hoạt thường được sử dụng: 1) Hàm đồng nhất (Linear function, Identity function) g(x) = x (1.4) Nếu coi các đầu vào là một đơn vị thì chúng sẽ sử dụng hàm này. Có khi một hằng số được nhân với net-input tạo thành một hàm đồng nhất. Đồ thị hàm đồng nhất (Identity function) 2) Hàm bước nhị phân (Binary step function, Hard limit function) Hàm này còn gọi là hàm ngưỡng (Threshold function hay Heaviside function). Đầu ra của hàm này giới hạn một trong hai giá trị: 14 g( x) 1, neá ux 0, neá ux (1.5) ở đây là ngưỡng. Đồ thị hàm bƣớc nhị phân (Binary step function) Dạng hàm này thường sử dụng trong mạng một lớp. Trong hình vẽ được chọn bằng 1. 3) Hàm sigmoid (Sigmoid function (logsig)) Hàm sigma là dạng chung nhất của hàm kích hoạt được sử dụng trong cấu trúc mạng nơ-ron nhân tạo. Nó là một hàm tăng và nó thể hiện một sự trung gian giữa tuyến tính và phi tuyến. Một ví dụ của hàm này là hàm logistics, xác định như sau: g( x) Ở đó 1 1 e x (1.6) là tham số độ dốc của hàm sigma. Bằng việc biến đổi tham số , chúng ta thu được các hàm sigma với các độ dốc khác nhau. Thực tế, hệ số góc tại x= 0 là /4. Khi tham số hệ số góc tiến tới không xác định, hàm sigma trở thành một hàm ngưỡng đơn giản. Trong khi một hàm ngưỡng chỉ có giá trị là 0 hoặc 1, thì một hàm sigma nhận các giá trị từ 0 tới 1. Cũng phải ghi nhận rằng hàm sigma là hàm phân biệt, trong khi hàm ngưỡng thì không (Tính phân biệt của hàm là một đặc tính quan trọng trong lý thuyết mạng neuron). Hàm này thường được dùng cho các mạng được huấn luyện (trained) 15 bởi thuật toán lan truyền ngược (back –propagation), bởi nó dễ lấy đạo hàm, làm giảm đáng kể tính toán trong quá trình huấn luyện. Hàm được dùng cho các chương trình ứng dụng mà đầu ra mong muốn rơi vào khoảng [0,1]. Đồ thị hàm sigmoid 4) Hàm sigmoid lưỡng cực (Bipolar sigmoid function (tan(sig)) 1 ex g( x) 1 ex (1.7) Hàm này có đặc tính tương tự hàm sigmoid. Hàm làm việc tốt đối với các ứng dụng có đầu ra yêu cầu trong khoảng [-1,1]. Đồ thị hàm sigmoid lƣỡng cực Các hàm chuyển của các đơn vị ẩn (hidden units) là cần thiết để biểu diễn sự phi tuyến vào trong mạng. Nút bias: Là một nút thêm vào nhằm tăng khả năng thích nghi của mạng nơ-ron trong quá trình học. Trong các mạng nơ-ron có sử dụng bias, mỗi nơ-ron có thể có một trọng số tương ứng với bias. Trọng số này luôn có giá trị là 1. 16 Mô hình của một nút xử lý (nút thứ i): Hình 1.2. Mô hình nơ-ron 17 1.2.2. Mạng nơ-ron nhân tạo Mạng nơ-ron nhân tạo (Artificial Neural Network – ANN) là mô hình toán học hay mô hình tính toán được xây dựng dựa trên các mạng nơ-ron sinh học. Nó gồm có một nhóm các nơ-ron nhân tạo (nút) nối với nhau và xử lý thông tin bằng cách truyền theo các kết nối và tính giá trị mới tại các nút (cách tiếp cận connectionism đối với tính toán). Phần lớn mạng nơ-ron nhân tạo là một hệ thống thích ứng (adaptive system) tự thay đổi cấu trúc của mình dựa trên các thông tin bên ngoài hay bên trong chảy qua mạng trong quá trình học. Với việc giả lập các hệ thống sinh học, các cấu trúc tính toán, mạng nơron có thể giải quyết được các lớp bài toán nhất định, như: Bài toán người du lịch, bài toán tô màu bản đồ, bài toán nhận dạng mẫu... Các bài toán phức tạp cao, không xác định. Tuy nhiên, sự liên kết giữa một bài toán bất kỳ trong thực tế với một giải pháp mạng nơ-ron lại là một việc không dễ dàng. Xét một cách tổng quát, mạng nơ-ron là một cấu trúc xử lý song song thông tin phân tán mang các đặc tính nổi bật sau : Là mô hình toán học dựa trên bản chất của nơ-ron. Bao gồm một số lượng rất lớn các nơ-ron liên kết với nhau. Mạng nơ-ron có khả năng học, khái quát hóa tập dữ liệu học thông qua việc gán và hiệu chỉnh các trọng số liên kết. Tổ chức theo kiểu tập hợp mang lại cho mạng nơ-ron khả năng tính toán rất lớn, trong đó không có nơ-ron nào mang thông tin riêng biệt. Ví dụ: Hình 1.2 là một mô hình mạng thông dụng.  Các hình trạng của mạng Hình trạng mạng được định nghĩa bởi: số lớp (layers), số đơn vị trên mỗi lớp, và sự liên kết giữa các lớp đó. Các mạng thường được chia làm hai loại dựa trên cách thức liên kết các đơn vị: 18 1.2.2.1. Mạng truyền thẳng. - Mạng truyền thẳng một lớp Mạng perceptron một lớp do F.Rosenblatt đề xuất năm 1960 là mạng truyền thẳng chỉ một lớp vào và một lớp ra không có lớp ẩn. Trên mỗi lớp này có thể có một hoặc nhiều nơ-ron. Mô hình mạng nơ-ron của F.Rosenblatt sử dụng hàm ngưỡng đóng vai trò là hàm chuyển. Do đó, tổng của tín hiệu vào lớn hơn giá trị ngưỡng thì giá trị đầu ra của nơ-ron sẽ là 1, còn trái lại sẽ là 0. g( x) 1, neá ux 0, neá ux (1.8) Mô hình mạng nơ-ron truyền thẳng một lớp là mô hình liên kết cơ bản và đơn giản nhất. Các nơ-ron tổ chức lại với nhau tạo thành một lớp, đường truyền tín hiệu được truyền theo một hướng nhất định nào đó. Các đầu vào được nối với các nơ-ron theo các trọng số khác nhau, sau quá trình xử lý cho ra một chuỗi các tín hiệu ra. x1 y1 x2 y2 Xm yn Hình 1.3. Mạng truyền thẳng một lớp Với mỗi giá trị đầu vào: x = éëx1,x 2, ...,x n ù û . Qua quá trình xử lý của T mạng ta sẽ thu được một bộ tương ứng các giá trị đầu ra là: y = éëy1,y 2, ...,y n ù û T được xác định như sau: 19 æm ö y i = f i ççå wij x j - qi ÷ ,i = 1,n ÷ çè j= 1 ÷ ø (1.9) Trong đó: m: Số tín hiệu vào. n: Số tín hiệu ra. T WiT = éëwi1,wi 2 ,...,win ù û : là véc tơ trọng số của nơ-ron thứ i. f i : Là hàm kích hoạt nơ-ron thứ i i : Là ngưỡng của nơ-ron thứ i. Ngay từ khi mạng Perceptron được đề xuất nó được sử dụng để giải quyết bài toán phân lớp. Một đối tượng sẽ được nơ-ron i phân vào lớp A nếu: Tổng thông tin đầu vào wij x j i Trong trường hợp trái lại nơ-ron sẽ được phân vào lớp B. - Mạng truyền thẳng nhiều lớp (Multilayer Perceptron –MLP) Với mạng nơ-ron truyền thẳng một lớp ở trên, khi phân tích một bài toán phức tạp sẽ gặp rất nhiều khó khăn, để khắc phục vấn đề này người ta đưa ra mô hình mạng nơ-ron truyền thẳng nhiều lớp bằng việc kết hợp một số lớp nơ-ron lại với nhau. Lớp nhận tín hiệu vào gọi là lớp vào, lớp đưa tín hiệu ra của mạng được gọi là lớp ra. Các lớp ở giữa lớp vào và lớp ra được gọi là lớp ẩn và các nơ-ron trong các lớp ẩn có hàm chuyển (hàm kích hoạt) dạng phi tuyến. Mạng nơ-ron nhiều lớp có thể giải quyết các bài toán phi tuyến nhờ vào các lớp ẩn. Càng nhiều lớp ẩn thì khả năng mở rộng thông tin càng cao và xử lý tốt mạng có nhiều lớp vào và lớp ra. 20 Hình (1.4) mô tả cấu trúc của mạng nơ-ron truyền thẳng nhiều lớp. x1 Lớp vào Lớp ẩn Lớp ra y1 x2 y2 yn xm Hình 1.4. Mạng truyền thẳng nhiều lớp 1.2.2.2. Mạng hồi quy (Recurrent Neutral Network) Mạng hồi quy một lớp có nối ngược X1 Y1 X2 Y2 ... ... XN ... YM Hình 1.5. Mạng một lớp có nối ngƣợc Mạng hồi quy nhiều lớp có nối ngược. X1 Y1 X2 ... Y2 ... ... XN ... YM Hình 1.6. Mạng nhiều lớp có nối ngƣợc
- Xem thêm -