Đăng ký Đăng nhập
Trang chủ Giáo dục - Đào tạo Cao đẳng - Đại học Kiến trúc xây dựng ứng dụng máy vectơ hỗ trợ trong phân tích mẫu và chẩn đoán bệnh trên cây xoài...

Tài liệu ứng dụng máy vectơ hỗ trợ trong phân tích mẫu và chẩn đoán bệnh trên cây xoài

.PDF
78
8
94

Mô tả:

NGUYỄN THỪA PHÁT TÀI ĐẠI HỌC ĐÀ NẴNG TRƯỜNG ĐẠI HỌC BÁCH KHOA NGUYỄN THỪA PHÁT TÀI * ỨNG DỤNG MÁY VECTƠ HỖ TRỢ TRONG PHÂN TÍCH MẪU VÀ CHẨN ĐOÁN BỆNH TRÊN CÂY XOÀI KHOA HỌC MÁY TÍNH LUẬN VĂN THẠC SĨ KHOA HỌC CHUYÊN NGÀNH KHOA HỌC MÁY TÍNH * KHÓA K32 Đà Nẵng - Năm 2018 ĐẠI HỌC ĐÀ NẴNG TRƢỜNG ĐẠI HỌC BÁCH KHOA ------------------------ NGUYỄN THỪA PHÁT TÀI ỨNG DỤNG MÁY VECTƠ HỖ TRỢ TRONG PHÂN TÍCH MẪU VÀ CHẨN ĐOÁN BỆNH TRÊN CÂY XOÀI Chuyên ngành: KHOA HỌC MÁY TÍNH Mã số: 60.48.01 LUẬN VĂN THẠC SĨ KỸ THUẬT NGƢỜI HƢỚNG DẪN KHOA HỌC 1. TS. Huỳnh Hữu Hƣng Đà Nẵng - Năm 2018 -i- LỜI CAM ĐOAN Tôi xin cam đoan đây là công trình nghiên cứu của riêng tôi. Các số liệu, kết quả nêu trong luận văn là trung thực và chưa từng được ai công bố trong bất kỳ công trình nào khác. Tác giả Nguyễn Thừa Phát Tài -ii- MỤC LỤC MỞ ĐẦU 1. Lý do chọn đề tài ......................................................................................................... 1 2. Mục tiêu và nhiệm vụ nghiên cứu ............................................................................... 1 3. Đối tƣợng và phạm vi nghiên cứu ............................................................................... 1 4. Phƣơng pháp nghiên cứu ............................................................................................. 1 5. Ý nghĩa khoa học và thực tiễn của luận văn ................................................................ 2 6. Bố cục luận văn: .......................................................................................................... 2 CHƢƠNG 1 - TỔNG QUAN VỀ NHẬN DẠNG VÀ XỬ LÝ ẢNH 1.1 Các bƣớc cơ bản trong xử lý ảnh số ......................................................................... 3 1.1.1 Thu nhận ảnh .................................................................................................... 3 1.1.2 Tiền xử lý ......................................................................................................... 3 1.1.3 Phân đoạn hay phân vùng ảnh ......................................................................... 3 1.1.4 Biểu diễn ảnh ................................................................................................... 3 1.1.5 Nhận dạng và nội suy ảnh ................................................................................ 4 1.2 Mốt số vấn đề cơ bản trong xử lý ảnh số .................................................................. 4 1.2.1 Điểm ảnh .......................................................................................................... 4 1.2.2 Mức xám của ảnh ............................................................................................. 4 1.2.3 Ảnh đen trắng ................................................................................................... 4 1.2.4 Ảnh nhị phân .................................................................................................... 5 1.2.5 Ảnh màu ........................................................................................................... 5 1.3 Cải thiện ảnh sử dụng toán tử điểm .......................................................................... 5 1.3.1 Tăng giảm độ sáng ........................................................................................... 5 1.3.2 Tăng độ tƣơng phản ......................................................................................... 6 1.3.3 Tách nhiễu và lấy ngƣỡng ................................................................................ 7 1.3.4 Biến đổi âm bản ............................................................................................... 7 1.3.5 Biến đổi ảnh đen trắng ..................................................................................... 7 1.3.6 Lƣợc đồ xám(Histogram)................................................................................. 8 1.3.7 Kỹ thuật cải thiện ảnh nhị phân ....................................................................... 9 1.4 Trích rút đặt trƣng ảnh ............................................................................................ 11 1.4.1 Đặc trƣng màu sắc.......................................................................................... 11 1.4.2 Đặc trƣng kết cấu ........................................................................................... 12 1.4.3 Đặc trƣng hình dáng ....................................................................................... 14 1.5 Phƣơng pháp nhận dạng. ......................................................................................... 15 1.5.1 Khái niệm nhận dạng ..................................................................................... 15 1.5.2 Support vector machine (SVM) ..................................................................... 15 1.5.3 K-láng giềng gần nhất (k-Nearest Neighbors) ............................................... 16 1.5.4 Mô hình Markov ẩn (Hidden Markov Models) ............................................. 16 1.5.5 Mạng nơ-ron nhân tạo16 1.6 Đánh giá ƣu điểm của thuật toán SVM ................................................................... 16 1.7 KẾT CHƢƠNG ...................................................................................................... 17 -iiiCHƢƠNG 2 – PHƢƠNG PHÁP NHẬN DẠNG VÀ PHÂN LOẠI 2.1 Các công trình nghiên cứu liên quan ...................................................................... 18 2.2 Trích xuất đặc trƣng trong đánh và phân loại trái cây ............................................ 18 2.2.1 Sử dụng đặc trƣng màu sắc ............................................................................ 19 2.2.2 Trích chọn đặc trƣng màu cho bài toán so màu lá lúa ................................... 19 2.2.3 Sử dụng đặc trƣng kết cấu.............................................................................. 21 2.2.4 Sử dụng đặc trƣng Gist và Gist descriptor ..................................................... 22 2.3 Các phƣơng pháp phân loại trái cây........................................................................ 23 2.3.1 Phân biệt phần cuống và khiếm khuyết thực tế trên trái cây ......................... 23 2.3.2 Kết hợp các thống kê màu sắc và đặc trƣng kết cấu để nhận biết bệnh táo... 26 2.3.3 Nghiên cứu xây dựng hệ thống h trợ nông dân so màu lá lúa ..................... 31 2.4 KẾT CHƢƠNG ...................................................................................................... 38 CHƢƠNG 3 – ỨNG DỤNG MÁY VECTƠ HỖ TRỢ TRONG CHẨN ĐOÁN BỆNH TRÊN XOÀI 3.1 Phƣơng pháp phân lớp dữ liệu máy vector h trợ SVM ......................................... 39 3.1.1 Giới thiệu ....................................................................................................... 39 3.1.2 Ý tƣởng của phƣơng pháp .............................................................................. 39 3.1.3 Các bƣớc chính của phƣơng pháp .................................................................. 40 3.1.4 Cơ sở lý thuyết ............................................................................................... 40 3.2 Chẩn đoán bệnh trên xoài với máy vetor h trợ SVM. ........................................... 43 3.2.1 Mô tả bài toán ................................................................................................ 43 3.2.2 Mô hình giải quyết bài toán ........................................................................... 44 3.3 Tiền xử lý ................................................................................................................ 44 3.3.1 Tăng/giảm độ tƣơng phản của ảnh ................................................................. 44 3.3.2 Thực hiện phép co/giãn ảnh ........................................................................... 45 3.3.3 Chuyển và tách ảnh màu RGB sang các kênh H-S-V ................................... 45 3.4 Trích chọn đặc trƣng ............................................................................................... 46 3.4.1 Đặc trƣng màu sắc.......................................................................................... 46 3.4.2 Đặc trƣng kết cấu ........................................................................................... 47 3.5 Thực nghiệm ........................................................................................................... 51 3.5.1 Tập mẫu trái xoài ........................................................................................... 51 3.5.2 Tập mẫu lá xoài .............................................................................................. 51 3.5.3 Xử lý .............................................................................................................. 52 3.5.4 Huấn luyện và chẩn đoán bệnh ứng dụng máy vetor h trợ SVM54 3.6 Kết quả chẩn đoán ................................................................................................... 55 3.6.1 Lá bệnh thán thƣ ............................................................................................ 55 3.6.2 Bệnh ghẻ lồi trên lá xoài .............................................................................. 56 3.6.3 Lá xoài không bệnh ........................................................................................ 56 3.7 KẾT CHƢƠNG ...................................................................................................... 57 KẾT LUẬN VÀ HƢỚNG PHÁT TRIỂN ................................................................. 57 MỤC LỤC .................................................................................................................... 56 -ivỨNG DỤNG MÁY VECTƠ HỖ TRỢ TRONG PHÂN TÍCH MẪU VÀ CHẨN ĐOÁN BỆNH TRÊN CÂY XOÀI Học viên: Nguyễn Thừa Phát Tài; Chuyên ngành: Khoa học máy tính Mã số: 60.48.01; Khóa: 2016-2018 Trƣờng Đại học Bách khoa - ĐHĐN Tóm tắt –Ứng dụng kỹ thuật nhận dạng và xử lý ảnh trong bài toán nhận dạng và phân loại nông sản đã đƣợc ứng dụng khá thành công, các hệ thống đã giúp nâng cao năng suất lao động, mang lại hiệu quả về mặt kinh tế, khẳng định vai trò thực tiễn của công nghệ thông tin, tự động hóa ứng dụng trong cuộc sống, những năm gần đây, phƣơng pháp sử dụng bộ phân loại máy h trợ vector (Support Vector Machine - SVM) đƣợc quan tâm và áp dụng nhiều trong lĩnh vực nhận dạng và phân loại trong nông nghiệp. Từ các công trình khoa học đã công bố cho thấy phƣơng pháp SVM có khả năng nhận dạng tốt đối với các bài toán trong lĩnh vực nhận dạng và phân loại cũng nhƣ trong nhiều ứng dụng khác. Luận văn này nghiên cứu ứng dụng kĩ thuật Support Vector Machine để nhận dạng mẫu và chẩn đoán bệnh trên Xoài thông qua ảnh chụp sử dụng phƣơng pháp phân lớp SVM. Kết quả thực nghiệm với độ chính xác phân loại trên 96% cho thấy sự thành công của việc áp dụng phƣơng pháp SVM vào việc chẩn đoán bệnh trên cây Xoài thông qua ảnh chụp, đồng thời cho thấy khả năng xây dựng những ứng dụng thực tiễn có hiệu quả từ cách tiếp cận này. Từ khóa - chẩn đoán bệnh trên cây Xoài; máy vectơ h trợ; nhận dạng mẫu; nhận dạng loài cây; phân lớp ảnh chụp lá cây. Abstract - The application of image recognition and processing techniques in the identification and classification of agricultural products has been proved relatively successful. The systems have helped improve labor productivity, bring economic efficiency, as well as emphasize the practical role of information technology, applied automation in life. In recent years, the use of Support Vector Machine (SVM) has been taken into serious consideration and extensively applied in the field of identification and classification in agriculture. Published scientific work shows that the SVM method can identify the problems in the field of identification and classification as well as in many other applications. This thesis studies the application of Support Vector Machine technique to identify specimens and diagnose diseases on mango through photos using SVM classification method. Experimental results with the accuracy of over 96% indicate the success of applying the SVM method to the diagnosis of mango disease through photos, and demonstrates the potential for developing effective practical applications from this approach. Key words 1- the diagnosis of mango disease; Support Vector Machine; Specimen identification; image classification; leaf recognition -v- DANH MỤC CÁC CHỮ VIẾT TẮT Từ viết tắt Tiếng Anh ANN Artificial Neural Networks CM Convolution Mask GLCM Gray-Level Co-occurrence Matrices HMM Hidden Markov Models HSV Hue, Saturation, Value KNN MLP PE P-M QP RGB K-Nearest Neighbors algorithm MultiLayer Perceptron Processing Element McCulloch and Pitts Quadratic Programing Red, Green,Blue SDM Size-dependent measurements SIM Size-independent measurements SOM Self – Organizing Map SVM XLA Support Vector Machine Tiếng Việt Mạng nơron Mặc nạ cuộn Ma trận đồng hiện mức xám Mô hình Markov ẩn Vùng màu, Độ bão hòa màu, Độ sáng K -láng giềng gần nhất Mạng Perceptron nhiều tầng Phần tử xử lý McCulloch và Pitts Quy hoạch toàn phƣơng màu đỏ, xanh lục, xanh lơ Đo lƣờng phụ thuộc vào kích thƣớc Đo lƣờng không phụ thuộc vào kích thƣớc Kiểu học không có giám sát trong mạng nơron Máy vectơ h trợ Xử lý ảnh -vi- DANH MỤC HÌNH Hình 1.1 Các bƣớc trong xử lý ảnh ................................................................................. 3 Hình 1.2 Ảnh xám ngƣỡng 255 ....................................................................................... 4 Hình 1.3 Ảnh trắng đen ................................................................................................... 5 Hình 1.4 Ảnh nhị phân .................................................................................................... 5 Hình 1.5 Ảnh màu ........................................................................................................... 5 Hình 1.6 Ảnh tăng/giảm độ sáng .................................................................................... 6 Hình 1.7 Biểu đồ giãn độ tƣơng phản ............................................................................. 6 Hình 1.8 Ảnh khi tăng tƣơng độ phản ............................................................................. 6 Hình 1.9 Ảnh âm bản....................................................................................................... 7 Hình 1.10 Ảnh trắng đen ................................................................................................. 7 Hình 1.11 Lƣợc đồ mức xám của các loại ảnh ................................................................ 8 Hình 1.12 Biểu đồ lƣợc đồ xám (Histogram) của ảnh .................................................... 9 Hình 1.13 Cân bằng mức xám của ảnh............................................................................ 9 Hình 1.14 Minh hoạ của phép giãn ảnh......................................................................... 10 Hình 1.15 Ứng dụng của phép co ảnh ........................................................................... 10 Hình 1.16 Không gian màu RGB .................................................................................. 11 Hình 1.17 Không gian màu HSV .................................................................................. 12 Hình 1.18 H2 là siêu phẳng tốt nhất .............................................................................. 15 Hình 1.19 Mô hình một nơ-ron nhân tạo ....................................................................... 16 Hình 2.1 Minh họa trích đặc trƣng màu với moment thứ nhất ...................................... 20 Hình 2.2 Minh họa trích đặc trƣng màu với 3 moment màu ......................................... 20 Hình 2.3 Minh họa hiệu suất của bộ mô tả dựa trên kết cấu ......................................... 22 Hình 2.4 Mô hình phân biệt phần cuống với các khiếm khuyết trên trái cây ............... 23 Hình 2.5 (a) Trái cây đầu vào với phần cuống và phần khiếm khuyết ......................... 24 Hình 2.6 (a) Hình ảnh đầu vào, (b) Kết quả phân đoạn chuyển dịch trung bình, ......... 25 Hình 2.7 (a) Vòng tròn đƣợc áp thủ công trong các đối tƣợng, .................................... 26 Hình 2.8 Hệ thống nhận dạng bệnh trái táo ................................................................... 27 Hình 2.9 Một số kết quả phân đoạn khiếm khuyết ........................................................ 28 Hình 2.10 Hình ảnh mẫu từ bộ dữ liệu .......................................................................... 29 Hình 2.11 Mô hình hệ thống ......................................................................................... 31 Hình 2.12 Cắt/chọn phần lá lúa cần so màu .................................................................. 31 Hình 2.13 Xử lý nhiễu ................................................................................................... 32 Hình 2.14 Sơ đồ kỹ thuật so khớp ảnh .......................................................................... 34 Hình 2.15 Cấu trúc tập dữ liệu kiểu arff ........................................................................ 34 Hình 2.16 Mô hình phân lớp ảnh với kỹ thuật K láng giềng......................................... 36 Hình 2.17 Biểu đồ so sánh kết quả thực nghiệm kỹ thuật so khớp ảnh với K-NN ....... 37 Hình 3. 1 Siêu phân hoạch tập mẫu từ không gian Rn sang không gian Rd ................. 39 -viiHình 3. 2 Siêu phẳng phân chia dữ liệu với khoảng cách biên lớn nhất ....................... 39 Hình 3. 3 Minh họa cho bài toán phân hai lớp .............................................................. 40 Hình 3. 4 Minh họa bài toán phân hai lớp với SVM ..................................................... 41 Hình 3. 5 Bài toán SVM mẫu trong trƣờng hợp không phân tách tuyến tính ............... 41 Hình 3. 6 Hàm nhận dạng của SVM 2-vs-rest có giá trị bé nhất, nên mẫu cần nhận dạng là lớp thứ 2 ............................................................................................................ 42 Hình 3. 7 SVM loại trừ .................................................................................................. 42 Hình 3. 8 Sơ đồ loại trừ trong các tình huống ............................................................... 43 Hình 3. 9 Mô hình chẩn đoán bệnh trên cây xoài.......................................................... 44 Hình 3. 10 Độ tƣơng phản của ảnh ................................................................................ 45 Hình 3. 11 Co giãn ảnh .................................................................................................. 45 Hình 3. 12 Ảnh màu RGB chuyển đổi sang ảnh màu HSV và ảnh các kênh màu ........ 45 Hình 3. 13 Mô hình trích lọc và đo lƣờng đặc trƣng kết cấu ........................................ 48 Hình 3. 14 Xoài không bệnh ......................................................................................... 51 Hình 3. 15 bệnh thối trái ................................................................................................ 51 Hình 3. 16 bệnh nứt trái ................................................................................................. 51 Hình 3. 17 lá xoài không bệnh ..................................................................................... 51 Hình 3. 18 lá bệnh ghẻ lồi ............................................................................................. 52 Hình 3. 19 lá bệnh thán thƣ ........................................................................................... 52 Hình 3. 20 Giao diện trích xuất đặc trƣng .................................................................... 53 Hình 3. 21 Giao diện huấn luyện và chẩn đoán bệnh ................................................... 54 Hình 3. 22 Bệnh thán thƣ ............................................................................................. 56 Hình 3. 23 Bệnh ghẻ lồi ................................................................................................ 56 Hình 3. 24 Lá xoài không bệnh .................................................................................... 57 -viii- DANH MỤC BẢNG Bảng 2. 1 Tỉ lệ sai số tổng thể của phƣơng pháp ......................................................... 26 Bảng 2. 2 Tính chính xác phân loại bệnh khi MSVM đƣợc huấn luyện với 70 hình ảnh m i loại ......................................................................................................................... 29 Bảng 2. 3 So sánh với các phƣơng pháp hiện tại ......................................................... 30 Bảng 2. 4 Giá trị của các vector đại diện có số chiều là 3 của các mức màu trong không gian màu RGB .............................................................................................................. 32 Bảng 2. 5 Giá trị của các vector đại diện có số chiều là 3 của các mức màu trong không gian màu HSV .............................................................................................................. 32 Bảng 2. 6 Giá trị của các vector đại diện có số chiều là 3 của các mức màu trong không gian màu CIE – LAB .................................................................................................... 33 Bảng 2. 7 Giá trị của các vector đại diện có số chiều là 9 của các mức màu trong không gian màu RGB .............................................................................................................. 33 Bảng 2. 8 Giá trị của các vector đại diện có số chiều là 9 của các mức màu trong không gian màu HSV .............................................................................................................. 33 Bảng 2. 9 Giá trị của các vector đại diện có số chiều là 9 của các mức màu trong không gian màu CIE LAB ....................................................................................................... 33 Bảng 2. 10 So sánh thực nghiệm giữa kỹ thuật so khớp ảnh & K láng giềng ............. 36 Bảng 2. 11 So sánh các kỹ thuật máy học với tập dữ liệu kiểm tra ............................. 37 Bảng 3. 1 So sánh giá trị trung bình nhƣng độ lệch chuẩn khác nhau .......................... 47 Bảng 3. 2 Các tham số của hàm Gabor Wavelet và đặc trƣng kết cấu ảnh V ............... 49 Bảng 3. 3 Các giá trị tham số của GLCM ..................................................................... 50 Bảng 3. 4 Các tham số đặc trƣng đƣợc trích xuất từ tập ảnh huấn luyện...................... 53 Bảng 3. 5 Số lƣợng mẫu dùng trong thực nghiệm ........................................................ 55 Bảng 3. 6 Kết quả thực nghiệm phân lớp bằng máy học SVM ..................................... 55 Bảng 3. 7 Kết quả đạt đƣợc ........................................................................................... 57 -1- MỞ ĐẦU 1. Lý do chọn đề tài Hiện nay nông dân tại các tỉnh đồng bằng sông Cửu Long nói chung và tỉnh Trà Vinh nói riêng chỉ canh tác và trồng trọt chủ yếu chỉ dựa vào kinh nghiệm mà chƣa biết ứng dụng khoa học và công nghệ vào trong sản xuất để nâng cao chất lƣợng sản phẩm, hiệu quả kinh tế nhằm giảm chi phí sản xuất. Chính vì vậy việc triển khai nghiên cứu các ứng dụng nhận dạng và xử lý ảnh để chẩn đoán bệnh trên cây Xoài, một loại cây trồng có giá trị kinh tế cao, nhằm giải phóng sức lao động, tiết kiệm thời gian, nâng cao năng suất là một việc làm hết sức có ý nghĩa trong giai đoạn này. Từ hiện trạng và những lý do trên tôi xin đề xuất đề tài: “Ứng dụng máy vectơ hỗ trợ trong phân tích mẫu và chẩn đoán bệnh trên cây Xoài” 2. Mục tiêu và nhiệm vụ nghiên cứu 2.1 Mục tiêu nghiên cứu Mục tiêu nghiên của đề tài là đƣa ra một giải pháp mới giúp ngƣời nông dân ứng dụng khoa học vào trong sản xuất nông nghiệp và trong việc chẩn đoán bệnh trên cây Xoài thông qua ứng dụng máy vectơ h trợ. 2.2 Nhiệm vụ nghiên cứu Đề tài sẽ thực hiện nghiên cứu các vấn đề sau: - Nghiên cứu tổng quan về xử lý ảnh số, nhận dạng mẫu, thuật toán SVM. - Tìm hiểu và thu thập hình ảnh các loại bệnh trên Xoài ngoài thực địa. - Phƣơng pháp huấn luyện, nhận dạng và xử lý ảnh số. - Ứng dụng thuật toán SVM chẩn đoán bệnh trên cây Xoài. 3. Đối tƣợng và phạm vi nghiên cứu 3.1 Đối tượng nghiên cứu Đề tài nghiên cứu chủ yếu tập trung vào các đối tƣợng: - Hình ảnh, các đặc trƣng của cây Xoài bị bệnh và không bị bệnh ngoài thực địa. - Nghiên cứu và áp dụng thuật toán SVM trong phân lớp và nhận dạng. 3.2 Phạm vi nghiên cứu - Dùng thuật toán SVM trong phân tích mẫu và chẩn đoán bệnh trên cây Xoài. - Nghiên cứu các bƣớc xử lý và xây dựng tập dữ liệu huấn luyện (training set), tập dữ liệu tham chiếu (reference set), tập dữ liệu để nhận dạng (probe set). 4. Phƣơng pháp nghiên cứu 4.1 Phương pháp nghiên cứu lý thuyết Nghiên cứu lý thuyết tập trung vào các vấn đề gồm: - Thu thập, phân tích các tài liệu và thông tin liên quan đến đề tài. - Tham khảo các đề tài, bài báo liên quan đến lĩnh vực nhận dạng trái cây. -2- Các tài liệu về cơ sở lý thuyết: Xử lý ảnh, lọc trích đặc trƣng ảnh, xác định biên, nghiên cứu các kỹ thuật nhận dạng mẫu. 4.2 Phương pháp nghiên cứu thực nghiệm Nghiên cứu thực nghiệm tập trung vào các nội dung sau: - So sánh và phân tích hình ảnh trái, lá cây Xoài có bệnh và không bệnh ngoài thực địa. - Cài đặt chƣơng trình, thực hiện chƣơng trình với một số mẫu dữ liệu và đánh giá kết quả. 5. Ý nghĩa khoa học và thực tiễn của luận văn 5.1 Ý nghĩa khoa học Nghiên cứu nhằm ứng dụng khoa học và công nghệ vào sản xuất nông nghiệp, đƣa ra giải pháp nhằm góp phần ứng dụng kỹ thuật nhận dạng và xử lý ảnh vào sản xuất nông nghiệp tại tỉnh Trà Vinh. 5.2 Ý nghĩa thực tiễn Góp thêm một giải pháp mới để nông dân chẩn đoán bệnh trên cây Xoài tại tỉnh Trà Vinh, góp phần giải phóng sức lao động, tiết kiệm chi phí và nâng cao năng suất cây trồng, tăng thu nhập cho nông dân. 6. Bố cục luận văn: Nội dung của luận văn đƣợc trình bày bao gồm các phần chính nhƣ sau: Chƣơng 1 - Tổng quan về nhận dạng và xử lý ảnh: Tác giả đã trình bày tổng quan về các vấn đề liên quan tới nhận dạng và xử lý ảnh số. Tiếp theo chƣơng 2, tác giả sẽ trình bày chi tiết về nhận dạng và phân tích mẫu, ứng dụng thuật toán SVM để chẩn đoán bệnh trên cây Xoài. Chƣơng 2 - Phƣơng pháp nhận dạng và phân loại: Tác giả tìm hiểu một số bài toán về nhận dạng và phân loại, kết quả thực nghiệm trên các loại trái cây nhƣ táo, cam quýt, bài toán nhận dạng trên lá và so màu lá lúa. Thông qua các công trình nghiên cứu hiện tại tác giả đã hiểu biết đƣợc một số thuật toán và các đặc trƣng cần trích xuất cho một bài toán nhận dạng và phân loại. Chƣơng 3 tác giả sẽ ứng dụng các kiến thức và sự hiểu biết của mình để áp dụng vào bài toán “Ứng dụng máy vector h trợ trong phân tích mẫu và chẩn đoán bệnh trên cây Xoài Chƣơng 3 - Ứng dụng máy vec tơ hỗ trợ trong phân tích mẫu và chẩn đoán bệnh trên cây Xoài: Tác giả nhận thấy SVM đƣợc đánh giá là một hƣớng tiếp cận phân lớp đạt độ chính xác cao. Hạn chế lớn nhất của SVM là tốc độ phân lớp rất chậm, Tuy nhiên, SVM vẫn đƣợc đánh giá là phƣơng pháp học máy tiên tiến đã đóng góp nhiều thành công trong các lĩnh vực khai phá dữ liệu cũng nhƣ trong lĩnh vực nhận dạng. Nét đặc trƣng cơ bản nhất của SVM là việc phân lớp đƣợc thực hiện gián tiếp trong không gian đặc trƣng với số chiều cao hơn thông qua một hàm nhân. -3- CHƢƠNG 1 - TỔNG QUAN VỀ NHẬN DẠNG VÀ XỬ LÝ ẢNH 1.1 Các bƣớc cơ bản trong xử lý ảnh số Hình 1. 1 Các bƣớc trong xử lý ảnh 1.1.1 Thu nhận ảnh Ảnh thƣờng đƣợc thu nhận qua các thiết bị nhƣ camera, scanner. Tuỳ theo yêu cầu thực thế mà m i điểm ảnh đƣợc biểu diễn qua 1 hay nhiều bit. Đây là giai đoạn quan trọng trong toàn bộ quá trình xử lý ảnh, ảnh nhận đƣợc là ảnh ban đầu để đƣa vào xử lý tại các giai đoạn sau, trƣờng hợp ảnh ban đầu có chất lƣợng kém, hiệu quả của các bƣớc xử lý tiếp theo sẽ bị giảm. 1.1.2 Tiền xử lý Sau bộ thu nhận, ảnh có thể nhiễu độ tƣơng phản thấp nên cần đƣa vào bộ tiền xử lý để nâng cao chất lƣợng. Chức năng của bộ tiền xử lý là lọc nhiễu, nâng độ tƣơng phản để làm ảnh rõ hơn, nét hơn. 1.1.3 Phân đoạn hay phân vùng ảnh Phân vùng ảnh là tách một ảnh đầu vào thành các vùng thành phần để biểu diễn phân tích, nhận dạng ảnh. Đây là phần phức tạp khó khăn nhất trong xử lý ảnh và cũng dễ gây l i, làm mất độ chính xác của ảnh. Kết quả nhận dạng ảnh phụ thuộc rất nhiều vào công đoạn này. Phân vùng ảnh theo miền đồng nhất: Gồm phƣơng pháp tách cây tứ phân, phƣơng pháp cục bộ, phƣơng pháp tổng hợp. Phân vùng ảnh theo kết cấu bề mặt: gồm phƣơng pháp thống kê và phƣơng pháp cấu trúc. 1.1.4 Biểu diễn ảnh Đầu ra ảnh sau phân đoạn chứa các điểm ảnh của vùng ảnh, và mã liên kết với các vùng lận cận. Việc biến đổi các số liệu này thành dạng thích hợp là cần thiết cho xử lý tiếp theo bằng máy tính. Việc chọn các tính chất để thể hiện ảnh gọi là trích chọn đặc trƣng (Feature Selection) gắn với việc tách các đặc tính của ảnh dƣới dạng các -4thông tin định lƣợng hoặc làm cơ sở để phân biệt lớp đối tƣợng này với đối tƣợng khác trong phạm vi ảnh nhận đƣợc. 1.1.5 Nhận dạng và nội suy ảnh Nhận dạng ảnh là quá trình xác định ảnh, quá trình này thƣờng thu đƣợc bằng cách so sánh với mẫu chuẩn đã đƣợc học từ trƣớc. Nội suy là phán đoán theo ý nghĩa trên cơ sở nhận dạng, nhận dạng theo tham số và nhận dạng theo cấu trúc. 1.2 Mốt số vấn đề cơ bản trong xử lý ảnh số 1.2.1 Điểm ảnh Điểm ảnh là một phần tử của ảnh số tại toạ độ (x, y) với độ xám hoặc màu nhất định. Kích thƣớc và khoảng cách giữa các điểm ảnh đó đƣợc chọn thích hợp sao cho mắt ngƣời cảm nhận sự liên tục về không gian và mức xám (hoặc màu) của ảnh số gần nhƣ ảnh thật. M i phần tử trong ma trận đƣợc gọi là một phần tử ảnh. 1.2.2 Mức xám của ảnh Mức xám là kết quả của sự mã hóa tƣơng ứng với một cƣờng độ sáng của m i điểm ảnh với một giá trị số, kết quả của quá trình lƣợng tử hóa. Một điểm ảnh (pixel) có hai đặc trƣng cơ bản là vị trí (x, y) của điểm ảnh và độ xám của nó. • Mức xám của điểm ảnh là cƣờng độ sáng của nó đƣợc gán bằng giá trị số tại điểm đó. • Các thang giá trị mức xám thông thƣờng: 16, 32, 64, 128, 256, mức 256 là mức phổ dụng, dùng 8 bit để biểu diễn: 28=256 mức, tức là từ 0 đến 255. Hình 1. 2 Ảnh xám ngƣỡng 255 1.2.3 Ảnh đen trắng Ảnh đen trắng gồm có ảnh nhị phân và ảnh đa cấp xám, nếu chỉ có hai mức 0 và 1 còn gọi là ảnh nhị phân, nếu lớn hơn hai mức ta có ảnh đa cấp xám. Với ảnh nhị phân, m i pixel đƣợc mã hóa trên một bit. Còn với ảnh xám 256 mức đƣợc mã hóa trên 1 byte = 8 bit. -5- Hình 1. 3 Ảnh trắng đen 1.2.4 Ảnh nhị phân Ảnh chỉ có 2 mức đen trắng phân biệt tức dùng 1 bit mô tả, m i điểm ảnh của ảnh nhị phân chỉ có thể là 0 hoặc 1, các phần tử ảnh có thể coi nhƣ phần tử logic. Hình 1. 4 Ảnh nhị phân 1.2.5 Ảnh màu Trong khuôn khổ lý thuyết ba màu (Red, Blue, Green) để tạo nên thế giới màu, ngƣời ta thƣờng dùng 3 byte để mô tả mức màu, khi đó các giá trị màu 2 8*3=224≈ 16,7 triệu màu. Hình 1. 5 Ảnh màu 1.3 Cải thiện ảnh sử dụng toán tử điểm 1.3.1 Tăng giảm độ sáng Độ tƣơng phản biểu diễn sự thay đổi độ sáng của đối tƣợng so với nền. Vì vậy, muốn nhìn thấy rõ đối tƣợng trong ảnh so với nền thì chúng ta có thể thay đổi giá trị cƣờng độ sáng trong ảnh. Giả sử ta có ảnh đầu vào I ~ kích thƣớc (m x n) và số nguyên c Nếu c > 0: ảnh sáng lên Nếu c < 0: ảnh tối đi -6- Hình 1. 6 Ảnh tăng/giảm độ sáng 1.3.2 Tăng độ tương phản Ảnh số là tập hợp các điểm, m i điểm có giá trị độ sáng khác nhau, hai đối tƣợng có cùng độ sáng nhƣng đặt trên hai nền khác nhau sẽ cho cảm nhận sáng khác nhau. Vậy độ tƣơng phản biểu diễn sự thay đổi độ sáng của đối tƣợng so với nền, hay độ tƣơng phản là độ nổi của điểm ảnh hay vùng ảnh so với nền. Nếu ảnh có độ tƣơng phản kém, ta có thể thay đổi theo các hàm. u  ua   f (u )   (u  a)  Va a  u  b   (u  b)  V b  u  L b  Các độ dốc , ,  xác định độ tƣơng phản tƣơng đối. L là số mức xám cực đại Ta có: α = β = γ =1 ảnh kết quả trùng với ảnh gốc α, β, γ > 1 giãn độ tƣơng phản α, β, γ < 1 co độ tƣơng phản Hình 1. 7 Biểu đồ giãn độ tƣơng phản Hình 1. 8 Ảnh khi tăng tƣơng độ phản -71.3.3 Tách nhiễu và lấy ngưỡng • Tách nhiễu: là trƣờng hợp riêng của giãn độ tƣơng phản khi α = γ = 0, ứng dụng để giảm nhiễu khi biết tín hiệu nằm trong khoảng [a,b]. • Lấy ngƣỡng: là trƣờng hợp riêng của tách nhiễu khi a = b = θ (θ là ngƣỡng), ứng dụng trong trƣờng hợp biến đổi từ ảnh đa mức xám về ảnh nhị phân. 1.3.4 Biến đổi âm bản Âm bản nhận đƣợc bằng phép biến đổi âm. Phép biến đổi này có rất nhiều hữu ích cho các phim ảnh dùng trong y học. v= f (u)  L  u Giả sử ta có ảnh I ~ kích thƣớc (m x n) Hình 1. 9 Ảnh âm bản 1.3.5 Biến đổi ảnh đen trắng Để chuyển đổi một ảnh màu sang ảnh đen trắng ta dùng kĩ thuật tách ngƣỡng. Giả sử ta có ảnh I ~ kích thƣớc (m x n), hai số Min, Max và ngƣỡng θ. Hình 1. 10 Ảnh trắng đen -8- 1.3.6 Lược đồ xám(Histogram) 2.3.1.1 Hiển thị lược đồ xám của ảnh Lƣợc đồ mức xám là một hàm cung cấp tần suất xuất hiện của m i mức xám (gray-level) trong ảnh. Biễu diễn toán học của histogram của một ảnh số có L=256 mức xám là một hàm rời rạc. p( f k )  nk n Trong đó: f k là giá trị xám thứ k (k = 0, 1,..., L-1) nk là số pixel có mức xám đó và n là tổng số pixel của ảnh p( f k ) [0,1] Miền giá trị của Một cách biễu diễn toán học khác của histogram của một ảnh là số lần xuất hiện của m i mức xám. p( f k )  nk Khi lƣợc đồ xám đƣợc biễu diễn trong một hệ tọa độ vuông góc x, y (trục hoành x biễu diễn số mức xám từ 0 đến L -1, trục tung y biễu diễn số điểm ảnh có cùng mức xám hay tỷ lệ số điểm ảnh có cùng mức xám trên tổng số điểm ảnh), thì hình dạng của histogram của ảnh sẽ mang đến cho chúng ta thông tin về tính động của ảnh (ảnh rất sáng hay ảnh rất đậm) dùng làm cơ sở cho việc tăng cƣờng độ tƣơng phản. Hình 1. 11 Lƣợc đồ mức xám của các loại ảnh -9Nhìn vào biểu đồ trên ta nhận thấy rằng: nếu ảnh tối thì mức xám sẽ tập trung ở gần gốc tọa độ. Theo định nghĩa của lƣợc đồ xám, thì việc xây dựng nó là khá đơn giản. Hình 1. 12 Biểu đồ lƣợc đồ xám (Histogram) của ảnh Lƣợc đồ xám là một công cụ hữu hiệu dùng trong nhiều công đoạn của tăng cƣờng xử lý ảnh. 2.3.1.2 Cân bằng lược đồ xám Với một ảnh tự nhiên đƣợc lƣợng hóa một cách tuyến tính, phần lớn các điểm ảnh có giá trị thấp hơn độ sáng trung bình. Trong miền tối, ta khó có thể cảm nhận các chi tiết của ảnh. Thực tế cần phải khắc phục nhƣợc điểm này bằng cách biến đổi lƣợc đồ xám. Ngƣời ta biến đổi lƣợc đồ sao cho tiến gần tới lƣợc đồ định trƣớc. Có nhiều phƣơng pháp, trong đó phƣơng pháp phổ dụng nhất là san bằng lƣợc đồ. Nếu ảnh có kích thƣớc (p x p) và ảnh kết quả đƣợc mã hóa trên N F mức xám thì số điểm ảnh cho một mức xám trong lƣợc đồ cân bằng lý tƣởng sẽ là hằng số và bằng P 2 / N F ( N F là số mức xám đầu xa). Trên thực tế, N F thƣờng nhỏ hơn N I (số mức xám ban đầu). Hình 1. 13 Cân bằng mức xám của ảnh 1.3.7 Kỹ thuật cải thiện ảnh nhị phân Với ảnh nhị phân, mức xám chỉ có 2 giá trị là 0 hay 1. Do vậy, ta xét một phần tử ảnh nhƣ một phần tử logic và có thể áp dụng các toán tử hình học dựa trên khái niệm biến đổi hình học của một ảnh bởi một phần tử cấu trúc. -10Phần tử cấu trúc là một mặt nạ dạng bất kỳ mà các phần tử của nó tạo nên một mô-típ, ngƣời ta tiến hành rê mặt nạ đi khắp ảnh và tính giá trị điểm ảnh bởi các điểm lân cận với mô-típ của mặt nạ theo cách lấy hội hay lấy tuyển. Dựa vào nguyên tắc trên, ngƣời ta sử dụng 2 kỹ thuật: dãn ảnh (Dilatation) và co ảnh (Erosion). 1.4.1.1 Dãn ảnh Dãn ảnh nhằm loại bỏ điểm đen bị vây bởi các điểm trắng. Trong kỹ thuật này, một cửa sổ (N+1) x (N+1) đƣợc rê đi khắp ảnh và thực hiện đối sánh một pexel của ảnh với (N+1)2-1 điểm lân cận (không tính điểm ở tâm). Phép đối sánh ở đây thực hiện bởi phép tuyển logic. Hình 1. 14 Minh hoạ của phép giãn ảnh 1.4.1.2 Co ảnh Co ảnh là thao tác đối ngẫu của dãn ảnh nhằm loại bỏ điểm trắng bị vây bởi các điểm đen. Trong kỹ thuật này, một cửa sổ (N+1)2 đƣợc rê đi khắp ảnh và thực hiện so sánh một pixel của ảnh với (N+1)2-1 điểm lân cận. Việc so sánh ở đây thực hiện bởi phép hội logic. Để không ảnh hƣởng đến kích thƣớc của đối tƣợng trong ảnh, ngƣời ta tiến hành n lần dãn và n lần co. Hình 1. 15 Ứng dụng của phép co ảnh
- Xem thêm -

Tài liệu liên quan