NGUYỄN THỪA PHÁT TÀI
ĐẠI HỌC ĐÀ NẴNG
TRƯỜNG ĐẠI HỌC BÁCH KHOA
NGUYỄN THỪA PHÁT TÀI
*
ỨNG DỤNG MÁY VECTƠ HỖ TRỢ TRONG
PHÂN TÍCH MẪU VÀ CHẨN ĐOÁN BỆNH TRÊN CÂY XOÀI
KHOA HỌC MÁY TÍNH
LUẬN VĂN THẠC SĨ KHOA HỌC
CHUYÊN NGÀNH KHOA HỌC MÁY TÍNH
*
KHÓA K32
Đà Nẵng - Năm 2018
ĐẠI HỌC ĐÀ NẴNG
TRƢỜNG ĐẠI HỌC BÁCH KHOA
------------------------
NGUYỄN THỪA PHÁT TÀI
ỨNG DỤNG MÁY VECTƠ HỖ TRỢ TRONG
PHÂN TÍCH MẪU VÀ CHẨN ĐOÁN BỆNH TRÊN CÂY XOÀI
Chuyên ngành: KHOA HỌC MÁY TÍNH
Mã số: 60.48.01
LUẬN VĂN THẠC SĨ
KỸ THUẬT
NGƢỜI HƢỚNG DẪN KHOA HỌC
1. TS. Huỳnh Hữu Hƣng
Đà Nẵng - Năm 2018
-i-
LỜI CAM ĐOAN
Tôi xin cam đoan đây là công trình nghiên cứu của riêng tôi. Các số liệu, kết quả
nêu trong luận văn là trung thực và chưa từng được ai công bố trong bất kỳ công trình
nào khác.
Tác giả
Nguyễn Thừa Phát Tài
-ii-
MỤC LỤC
MỞ ĐẦU
1. Lý do chọn đề tài ......................................................................................................... 1
2. Mục tiêu và nhiệm vụ nghiên cứu ............................................................................... 1
3. Đối tƣợng và phạm vi nghiên cứu ............................................................................... 1
4. Phƣơng pháp nghiên cứu ............................................................................................. 1
5. Ý nghĩa khoa học và thực tiễn của luận văn ................................................................ 2
6. Bố cục luận văn: .......................................................................................................... 2
CHƢƠNG 1 - TỔNG QUAN VỀ NHẬN DẠNG VÀ XỬ LÝ ẢNH
1.1 Các bƣớc cơ bản trong xử lý ảnh số ......................................................................... 3
1.1.1 Thu nhận ảnh .................................................................................................... 3
1.1.2 Tiền xử lý ......................................................................................................... 3
1.1.3 Phân đoạn hay phân vùng ảnh ......................................................................... 3
1.1.4 Biểu diễn ảnh ................................................................................................... 3
1.1.5 Nhận dạng và nội suy ảnh ................................................................................ 4
1.2 Mốt số vấn đề cơ bản trong xử lý ảnh số .................................................................. 4
1.2.1 Điểm ảnh .......................................................................................................... 4
1.2.2 Mức xám của ảnh ............................................................................................. 4
1.2.3 Ảnh đen trắng ................................................................................................... 4
1.2.4 Ảnh nhị phân .................................................................................................... 5
1.2.5 Ảnh màu ........................................................................................................... 5
1.3 Cải thiện ảnh sử dụng toán tử điểm .......................................................................... 5
1.3.1 Tăng giảm độ sáng ........................................................................................... 5
1.3.2 Tăng độ tƣơng phản ......................................................................................... 6
1.3.3 Tách nhiễu và lấy ngƣỡng ................................................................................ 7
1.3.4 Biến đổi âm bản ............................................................................................... 7
1.3.5 Biến đổi ảnh đen trắng ..................................................................................... 7
1.3.6 Lƣợc đồ xám(Histogram)................................................................................. 8
1.3.7 Kỹ thuật cải thiện ảnh nhị phân ....................................................................... 9
1.4 Trích rút đặt trƣng ảnh ............................................................................................ 11
1.4.1 Đặc trƣng màu sắc.......................................................................................... 11
1.4.2 Đặc trƣng kết cấu ........................................................................................... 12
1.4.3 Đặc trƣng hình dáng ....................................................................................... 14
1.5 Phƣơng pháp nhận dạng. ......................................................................................... 15
1.5.1 Khái niệm nhận dạng ..................................................................................... 15
1.5.2 Support vector machine (SVM) ..................................................................... 15
1.5.3 K-láng giềng gần nhất (k-Nearest Neighbors) ............................................... 16
1.5.4 Mô hình Markov ẩn (Hidden Markov Models) ............................................. 16
1.5.5 Mạng nơ-ron nhân tạo16
1.6 Đánh giá ƣu điểm của thuật toán SVM ................................................................... 16
1.7 KẾT CHƢƠNG ...................................................................................................... 17
-iiiCHƢƠNG 2 – PHƢƠNG PHÁP NHẬN DẠNG VÀ PHÂN LOẠI
2.1 Các công trình nghiên cứu liên quan ...................................................................... 18
2.2 Trích xuất đặc trƣng trong đánh và phân loại trái cây ............................................ 18
2.2.1 Sử dụng đặc trƣng màu sắc ............................................................................ 19
2.2.2 Trích chọn đặc trƣng màu cho bài toán so màu lá lúa ................................... 19
2.2.3 Sử dụng đặc trƣng kết cấu.............................................................................. 21
2.2.4 Sử dụng đặc trƣng Gist và Gist descriptor ..................................................... 22
2.3 Các phƣơng pháp phân loại trái cây........................................................................ 23
2.3.1 Phân biệt phần cuống và khiếm khuyết thực tế trên trái cây ......................... 23
2.3.2 Kết hợp các thống kê màu sắc và đặc trƣng kết cấu để nhận biết bệnh táo... 26
2.3.3 Nghiên cứu xây dựng hệ thống h trợ nông dân so màu lá lúa ..................... 31
2.4 KẾT CHƢƠNG ...................................................................................................... 38
CHƢƠNG 3 – ỨNG DỤNG MÁY VECTƠ HỖ TRỢ TRONG CHẨN ĐOÁN
BỆNH TRÊN XOÀI
3.1 Phƣơng pháp phân lớp dữ liệu máy vector h trợ SVM ......................................... 39
3.1.1 Giới thiệu ....................................................................................................... 39
3.1.2 Ý tƣởng của phƣơng pháp .............................................................................. 39
3.1.3 Các bƣớc chính của phƣơng pháp .................................................................. 40
3.1.4 Cơ sở lý thuyết ............................................................................................... 40
3.2 Chẩn đoán bệnh trên xoài với máy vetor h trợ SVM. ........................................... 43
3.2.1 Mô tả bài toán ................................................................................................ 43
3.2.2 Mô hình giải quyết bài toán ........................................................................... 44
3.3 Tiền xử lý ................................................................................................................ 44
3.3.1 Tăng/giảm độ tƣơng phản của ảnh ................................................................. 44
3.3.2 Thực hiện phép co/giãn ảnh ........................................................................... 45
3.3.3 Chuyển và tách ảnh màu RGB sang các kênh H-S-V ................................... 45
3.4 Trích chọn đặc trƣng ............................................................................................... 46
3.4.1 Đặc trƣng màu sắc.......................................................................................... 46
3.4.2 Đặc trƣng kết cấu ........................................................................................... 47
3.5 Thực nghiệm ........................................................................................................... 51
3.5.1 Tập mẫu trái xoài ........................................................................................... 51
3.5.2 Tập mẫu lá xoài .............................................................................................. 51
3.5.3 Xử lý .............................................................................................................. 52
3.5.4 Huấn luyện và chẩn đoán bệnh ứng dụng máy vetor h trợ SVM54
3.6 Kết quả chẩn đoán ................................................................................................... 55
3.6.1 Lá bệnh thán thƣ ............................................................................................ 55
3.6.2 Bệnh ghẻ lồi trên lá xoài .............................................................................. 56
3.6.3 Lá xoài không bệnh ........................................................................................ 56
3.7 KẾT CHƢƠNG ...................................................................................................... 57
KẾT LUẬN VÀ HƢỚNG PHÁT TRIỂN ................................................................. 57
MỤC LỤC .................................................................................................................... 56
-ivỨNG DỤNG MÁY VECTƠ HỖ TRỢ TRONG PHÂN TÍCH MẪU VÀ CHẨN
ĐOÁN BỆNH TRÊN CÂY XOÀI
Học viên: Nguyễn Thừa Phát Tài; Chuyên ngành: Khoa học máy tính
Mã số: 60.48.01; Khóa: 2016-2018 Trƣờng Đại học Bách khoa - ĐHĐN
Tóm tắt –Ứng dụng kỹ thuật nhận dạng và xử lý ảnh trong bài toán nhận dạng và phân
loại nông sản đã đƣợc ứng dụng khá thành công, các hệ thống đã giúp nâng cao năng suất lao
động, mang lại hiệu quả về mặt kinh tế, khẳng định vai trò thực tiễn của công nghệ thông tin,
tự động hóa ứng dụng trong cuộc sống, những năm gần đây, phƣơng pháp sử dụng bộ phân
loại máy h trợ vector (Support Vector Machine - SVM) đƣợc quan tâm và áp dụng nhiều
trong lĩnh vực nhận dạng và phân loại trong nông nghiệp. Từ các công trình khoa học đã công
bố cho thấy phƣơng pháp SVM có khả năng nhận dạng tốt đối với các bài toán trong lĩnh vực
nhận dạng và phân loại cũng nhƣ trong nhiều ứng dụng khác. Luận văn này nghiên cứu ứng
dụng kĩ thuật Support Vector Machine để nhận dạng mẫu và chẩn đoán bệnh trên Xoài thông
qua ảnh chụp sử dụng phƣơng pháp phân lớp SVM. Kết quả thực nghiệm với độ chính xác
phân loại trên 96% cho thấy sự thành công của việc áp dụng phƣơng pháp SVM vào việc chẩn
đoán bệnh trên cây Xoài thông qua ảnh chụp, đồng thời cho thấy khả năng xây dựng những
ứng dụng thực tiễn có hiệu quả từ cách tiếp cận này.
Từ khóa - chẩn đoán bệnh trên cây Xoài; máy vectơ h trợ; nhận dạng mẫu; nhận dạng
loài cây; phân lớp ảnh chụp lá cây.
Abstract - The application of image recognition and processing techniques in the
identification and classification of agricultural products has been proved relatively successful.
The systems have helped improve labor productivity, bring economic efficiency, as well as
emphasize the practical role of information technology, applied automation in life. In recent
years, the use of Support Vector Machine (SVM) has been taken into serious consideration
and extensively applied in the field of identification and classification in agriculture.
Published scientific work shows that the SVM method can identify the problems in the field
of identification and classification as well as in many other applications. This thesis studies
the application of Support Vector Machine technique to identify specimens and diagnose
diseases on mango through photos using SVM classification method. Experimental results
with the accuracy of over 96% indicate the success of applying the SVM method to the
diagnosis of mango disease through photos, and demonstrates the potential for developing
effective practical applications from this approach.
Key words 1- the diagnosis of mango disease; Support Vector Machine; Specimen
identification; image classification; leaf recognition
-v-
DANH MỤC CÁC CHỮ VIẾT TẮT
Từ viết tắt
Tiếng Anh
ANN
Artificial Neural Networks
CM
Convolution Mask
GLCM
Gray-Level Co-occurrence Matrices
HMM
Hidden Markov Models
HSV
Hue, Saturation, Value
KNN
MLP
PE
P-M
QP
RGB
K-Nearest Neighbors algorithm
MultiLayer Perceptron
Processing Element
McCulloch and Pitts
Quadratic Programing
Red, Green,Blue
SDM
Size-dependent measurements
SIM
Size-independent measurements
SOM
Self – Organizing Map
SVM
XLA
Support Vector Machine
Tiếng Việt
Mạng nơron
Mặc nạ cuộn
Ma trận đồng hiện mức xám
Mô hình Markov ẩn
Vùng màu, Độ bão hòa màu,
Độ sáng
K -láng giềng gần nhất
Mạng Perceptron nhiều tầng
Phần tử xử lý
McCulloch và Pitts
Quy hoạch toàn phƣơng
màu đỏ, xanh lục, xanh lơ
Đo lƣờng phụ thuộc vào kích
thƣớc
Đo lƣờng không phụ thuộc vào
kích thƣớc
Kiểu học không có giám sát
trong mạng nơron
Máy vectơ h trợ
Xử lý ảnh
-vi-
DANH MỤC HÌNH
Hình 1.1 Các bƣớc trong xử lý ảnh ................................................................................. 3
Hình 1.2 Ảnh xám ngƣỡng 255 ....................................................................................... 4
Hình 1.3 Ảnh trắng đen ................................................................................................... 5
Hình 1.4 Ảnh nhị phân .................................................................................................... 5
Hình 1.5 Ảnh màu ........................................................................................................... 5
Hình 1.6 Ảnh tăng/giảm độ sáng .................................................................................... 6
Hình 1.7 Biểu đồ giãn độ tƣơng phản ............................................................................. 6
Hình 1.8 Ảnh khi tăng tƣơng độ phản ............................................................................. 6
Hình 1.9 Ảnh âm bản....................................................................................................... 7
Hình 1.10 Ảnh trắng đen ................................................................................................. 7
Hình 1.11 Lƣợc đồ mức xám của các loại ảnh ................................................................ 8
Hình 1.12 Biểu đồ lƣợc đồ xám (Histogram) của ảnh .................................................... 9
Hình 1.13 Cân bằng mức xám của ảnh............................................................................ 9
Hình 1.14 Minh hoạ của phép giãn ảnh......................................................................... 10
Hình 1.15 Ứng dụng của phép co ảnh ........................................................................... 10
Hình 1.16 Không gian màu RGB .................................................................................. 11
Hình 1.17 Không gian màu HSV .................................................................................. 12
Hình 1.18 H2 là siêu phẳng tốt nhất .............................................................................. 15
Hình 1.19 Mô hình một nơ-ron nhân tạo ....................................................................... 16
Hình 2.1 Minh họa trích đặc trƣng màu với moment thứ nhất ...................................... 20
Hình 2.2 Minh họa trích đặc trƣng màu với 3 moment màu ......................................... 20
Hình 2.3 Minh họa hiệu suất của bộ mô tả dựa trên kết cấu ......................................... 22
Hình 2.4 Mô hình phân biệt phần cuống với các khiếm khuyết trên trái cây ............... 23
Hình 2.5 (a) Trái cây đầu vào với phần cuống và phần khiếm khuyết ......................... 24
Hình 2.6 (a) Hình ảnh đầu vào, (b) Kết quả phân đoạn chuyển dịch trung bình, ......... 25
Hình 2.7 (a) Vòng tròn đƣợc áp thủ công trong các đối tƣợng, .................................... 26
Hình 2.8 Hệ thống nhận dạng bệnh trái táo ................................................................... 27
Hình 2.9 Một số kết quả phân đoạn khiếm khuyết ........................................................ 28
Hình 2.10 Hình ảnh mẫu từ bộ dữ liệu .......................................................................... 29
Hình 2.11 Mô hình hệ thống ......................................................................................... 31
Hình 2.12 Cắt/chọn phần lá lúa cần so màu .................................................................. 31
Hình 2.13 Xử lý nhiễu ................................................................................................... 32
Hình 2.14 Sơ đồ kỹ thuật so khớp ảnh .......................................................................... 34
Hình 2.15 Cấu trúc tập dữ liệu kiểu arff ........................................................................ 34
Hình 2.16 Mô hình phân lớp ảnh với kỹ thuật K láng giềng......................................... 36
Hình 2.17 Biểu đồ so sánh kết quả thực nghiệm kỹ thuật so khớp ảnh với K-NN ....... 37
Hình 3. 1 Siêu phân hoạch tập mẫu từ không gian Rn sang không gian Rd ................. 39
-viiHình 3. 2 Siêu phẳng phân chia dữ liệu với khoảng cách biên lớn nhất ....................... 39
Hình 3. 3 Minh họa cho bài toán phân hai lớp .............................................................. 40
Hình 3. 4 Minh họa bài toán phân hai lớp với SVM ..................................................... 41
Hình 3. 5 Bài toán SVM mẫu trong trƣờng hợp không phân tách tuyến tính ............... 41
Hình 3. 6 Hàm nhận dạng của SVM 2-vs-rest có giá trị bé nhất, nên mẫu cần nhận
dạng là lớp thứ 2 ............................................................................................................ 42
Hình 3. 7 SVM loại trừ .................................................................................................. 42
Hình 3. 8 Sơ đồ loại trừ trong các tình huống ............................................................... 43
Hình 3. 9 Mô hình chẩn đoán bệnh trên cây xoài.......................................................... 44
Hình 3. 10 Độ tƣơng phản của ảnh ................................................................................ 45
Hình 3. 11 Co giãn ảnh .................................................................................................. 45
Hình 3. 12 Ảnh màu RGB chuyển đổi sang ảnh màu HSV và ảnh các kênh màu ........ 45
Hình 3. 13 Mô hình trích lọc và đo lƣờng đặc trƣng kết cấu ........................................ 48
Hình 3. 14 Xoài không bệnh ......................................................................................... 51
Hình 3. 15 bệnh thối trái ................................................................................................ 51
Hình 3. 16 bệnh nứt trái ................................................................................................. 51
Hình 3. 17 lá xoài không bệnh ..................................................................................... 51
Hình 3. 18 lá bệnh ghẻ lồi ............................................................................................. 52
Hình 3. 19 lá bệnh thán thƣ ........................................................................................... 52
Hình 3. 20 Giao diện trích xuất đặc trƣng .................................................................... 53
Hình 3. 21 Giao diện huấn luyện và chẩn đoán bệnh ................................................... 54
Hình 3. 22 Bệnh thán thƣ ............................................................................................. 56
Hình 3. 23 Bệnh ghẻ lồi ................................................................................................ 56
Hình 3. 24 Lá xoài không bệnh .................................................................................... 57
-viii-
DANH MỤC BẢNG
Bảng 2. 1 Tỉ lệ sai số tổng thể của phƣơng pháp ......................................................... 26
Bảng 2. 2 Tính chính xác phân loại bệnh khi MSVM đƣợc huấn luyện với 70 hình ảnh
m i loại ......................................................................................................................... 29
Bảng 2. 3 So sánh với các phƣơng pháp hiện tại ......................................................... 30
Bảng 2. 4 Giá trị của các vector đại diện có số chiều là 3 của các mức màu trong không
gian màu RGB .............................................................................................................. 32
Bảng 2. 5 Giá trị của các vector đại diện có số chiều là 3 của các mức màu trong không
gian màu HSV .............................................................................................................. 32
Bảng 2. 6 Giá trị của các vector đại diện có số chiều là 3 của các mức màu trong không
gian màu CIE – LAB .................................................................................................... 33
Bảng 2. 7 Giá trị của các vector đại diện có số chiều là 9 của các mức màu trong không
gian màu RGB .............................................................................................................. 33
Bảng 2. 8 Giá trị của các vector đại diện có số chiều là 9 của các mức màu trong không
gian màu HSV .............................................................................................................. 33
Bảng 2. 9 Giá trị của các vector đại diện có số chiều là 9 của các mức màu trong không
gian màu CIE LAB ....................................................................................................... 33
Bảng 2. 10 So sánh thực nghiệm giữa kỹ thuật so khớp ảnh & K láng giềng ............. 36
Bảng 2. 11 So sánh các kỹ thuật máy học với tập dữ liệu kiểm tra ............................. 37
Bảng 3. 1 So sánh giá trị trung bình nhƣng độ lệch chuẩn khác nhau .......................... 47
Bảng 3. 2 Các tham số của hàm Gabor Wavelet và đặc trƣng kết cấu ảnh V ............... 49
Bảng 3. 3 Các giá trị tham số của GLCM ..................................................................... 50
Bảng 3. 4 Các tham số đặc trƣng đƣợc trích xuất từ tập ảnh huấn luyện...................... 53
Bảng 3. 5 Số lƣợng mẫu dùng trong thực nghiệm ........................................................ 55
Bảng 3. 6 Kết quả thực nghiệm phân lớp bằng máy học SVM ..................................... 55
Bảng 3. 7 Kết quả đạt đƣợc ........................................................................................... 57
-1-
MỞ ĐẦU
1. Lý do chọn đề tài
Hiện nay nông dân tại các tỉnh đồng bằng sông Cửu Long nói chung và tỉnh Trà
Vinh nói riêng chỉ canh tác và trồng trọt chủ yếu chỉ dựa vào kinh nghiệm mà chƣa
biết ứng dụng khoa học và công nghệ vào trong sản xuất để nâng cao chất lƣợng sản
phẩm, hiệu quả kinh tế nhằm giảm chi phí sản xuất.
Chính vì vậy việc triển khai nghiên cứu các ứng dụng nhận dạng và xử lý ảnh để
chẩn đoán bệnh trên cây Xoài, một loại cây trồng có giá trị kinh tế cao, nhằm giải
phóng sức lao động, tiết kiệm thời gian, nâng cao năng suất là một việc làm hết sức có
ý nghĩa trong giai đoạn này.
Từ hiện trạng và những lý do trên tôi xin đề xuất đề tài: “Ứng dụng máy vectơ
hỗ trợ trong phân tích mẫu và chẩn đoán bệnh trên cây Xoài”
2. Mục tiêu và nhiệm vụ nghiên cứu
2.1 Mục tiêu nghiên cứu
Mục tiêu nghiên của đề tài là đƣa ra một giải pháp mới giúp ngƣời nông dân ứng
dụng khoa học vào trong sản xuất nông nghiệp và trong việc chẩn đoán bệnh trên cây
Xoài thông qua ứng dụng máy vectơ h trợ.
2.2 Nhiệm vụ nghiên cứu
Đề tài sẽ thực hiện nghiên cứu các vấn đề sau:
- Nghiên cứu tổng quan về xử lý ảnh số, nhận dạng mẫu, thuật toán SVM.
- Tìm hiểu và thu thập hình ảnh các loại bệnh trên Xoài ngoài thực địa.
- Phƣơng pháp huấn luyện, nhận dạng và xử lý ảnh số.
- Ứng dụng thuật toán SVM chẩn đoán bệnh trên cây Xoài.
3. Đối tƣợng và phạm vi nghiên cứu
3.1 Đối tượng nghiên cứu
Đề tài nghiên cứu chủ yếu tập trung vào các đối tƣợng:
- Hình ảnh, các đặc trƣng của cây Xoài bị bệnh và không bị bệnh ngoài thực địa.
- Nghiên cứu và áp dụng thuật toán SVM trong phân lớp và nhận dạng.
3.2 Phạm vi nghiên cứu
- Dùng thuật toán SVM trong phân tích mẫu và chẩn đoán bệnh trên cây Xoài.
- Nghiên cứu các bƣớc xử lý và xây dựng tập dữ liệu huấn luyện (training set),
tập dữ liệu tham chiếu (reference set), tập dữ liệu để nhận dạng (probe set).
4. Phƣơng pháp nghiên cứu
4.1 Phương pháp nghiên cứu lý thuyết
Nghiên cứu lý thuyết tập trung vào các vấn đề gồm:
- Thu thập, phân tích các tài liệu và thông tin liên quan đến đề tài.
- Tham khảo các đề tài, bài báo liên quan đến lĩnh vực nhận dạng trái cây.
-2- Các tài liệu về cơ sở lý thuyết: Xử lý ảnh, lọc trích đặc trƣng ảnh, xác định biên,
nghiên cứu các kỹ thuật nhận dạng mẫu.
4.2 Phương pháp nghiên cứu thực nghiệm
Nghiên cứu thực nghiệm tập trung vào các nội dung sau:
- So sánh và phân tích hình ảnh trái, lá cây Xoài có bệnh và không bệnh ngoài
thực địa.
- Cài đặt chƣơng trình, thực hiện chƣơng trình với một số mẫu dữ liệu và đánh
giá kết quả.
5. Ý nghĩa khoa học và thực tiễn của luận văn
5.1 Ý nghĩa khoa học
Nghiên cứu nhằm ứng dụng khoa học và công nghệ vào sản xuất nông nghiệp,
đƣa ra giải pháp nhằm góp phần ứng dụng kỹ thuật nhận dạng và xử lý ảnh vào sản
xuất nông nghiệp tại tỉnh Trà Vinh.
5.2 Ý nghĩa thực tiễn
Góp thêm một giải pháp mới để nông dân chẩn đoán bệnh trên cây Xoài tại tỉnh
Trà Vinh, góp phần giải phóng sức lao động, tiết kiệm chi phí và nâng cao năng suất
cây trồng, tăng thu nhập cho nông dân.
6. Bố cục luận văn:
Nội dung của luận văn đƣợc trình bày bao gồm các phần chính nhƣ sau:
Chƣơng 1 - Tổng quan về nhận dạng và xử lý ảnh: Tác giả đã trình bày tổng
quan về các vấn đề liên quan tới nhận dạng và xử lý ảnh số. Tiếp theo chƣơng 2, tác
giả sẽ trình bày chi tiết về nhận dạng và phân tích mẫu, ứng dụng thuật toán SVM để
chẩn đoán bệnh trên cây Xoài.
Chƣơng 2 - Phƣơng pháp nhận dạng và phân loại: Tác giả tìm hiểu một số bài
toán về nhận dạng và phân loại, kết quả thực nghiệm trên các loại trái cây nhƣ táo,
cam quýt, bài toán nhận dạng trên lá và so màu lá lúa. Thông qua các công trình
nghiên cứu hiện tại tác giả đã hiểu biết đƣợc một số thuật toán và các đặc trƣng cần
trích xuất cho một bài toán nhận dạng và phân loại. Chƣơng 3 tác giả sẽ ứng dụng các
kiến thức và sự hiểu biết của mình để áp dụng vào bài toán “Ứng dụng máy vector h
trợ trong phân tích mẫu và chẩn đoán bệnh trên cây Xoài
Chƣơng 3 - Ứng dụng máy vec tơ hỗ trợ trong phân tích mẫu và chẩn đoán
bệnh trên cây Xoài: Tác giả nhận thấy SVM đƣợc đánh giá là một hƣớng tiếp cận
phân lớp đạt độ chính xác cao. Hạn chế lớn nhất của SVM là tốc độ phân lớp rất chậm,
Tuy nhiên, SVM vẫn đƣợc đánh giá là phƣơng pháp học máy tiên tiến đã đóng góp
nhiều thành công trong các lĩnh vực khai phá dữ liệu cũng nhƣ trong lĩnh vực nhận
dạng. Nét đặc trƣng cơ bản nhất của SVM là việc phân lớp đƣợc thực hiện gián tiếp
trong không gian đặc trƣng với số chiều cao hơn thông qua một hàm nhân.
-3-
CHƢƠNG 1 - TỔNG QUAN VỀ NHẬN DẠNG VÀ XỬ LÝ ẢNH
1.1 Các bƣớc cơ bản trong xử lý ảnh số
Hình 1. 1 Các bƣớc trong xử lý ảnh
1.1.1 Thu nhận ảnh
Ảnh thƣờng đƣợc thu nhận qua các thiết bị nhƣ camera, scanner. Tuỳ theo yêu
cầu thực thế mà m i điểm ảnh đƣợc biểu diễn qua 1 hay nhiều bit.
Đây là giai đoạn quan trọng trong toàn bộ quá trình xử lý ảnh, ảnh nhận đƣợc là
ảnh ban đầu để đƣa vào xử lý tại các giai đoạn sau, trƣờng hợp ảnh ban đầu có chất
lƣợng kém, hiệu quả của các bƣớc xử lý tiếp theo sẽ bị giảm.
1.1.2 Tiền xử lý
Sau bộ thu nhận, ảnh có thể nhiễu độ tƣơng phản thấp nên cần đƣa vào bộ tiền xử
lý để nâng cao chất lƣợng. Chức năng của bộ tiền xử lý là lọc nhiễu, nâng độ tƣơng
phản để làm ảnh rõ hơn, nét hơn.
1.1.3 Phân đoạn hay phân vùng ảnh
Phân vùng ảnh là tách một ảnh đầu vào thành các vùng thành phần để biểu diễn
phân tích, nhận dạng ảnh. Đây là phần phức tạp khó khăn nhất trong xử lý ảnh và cũng
dễ gây l i, làm mất độ chính xác của ảnh. Kết quả nhận dạng ảnh phụ thuộc rất nhiều
vào công đoạn này.
Phân vùng ảnh theo miền đồng nhất: Gồm phƣơng pháp tách cây tứ phân,
phƣơng pháp cục bộ, phƣơng pháp tổng hợp.
Phân vùng ảnh theo kết cấu bề mặt: gồm phƣơng pháp thống kê và phƣơng pháp
cấu trúc.
1.1.4 Biểu diễn ảnh
Đầu ra ảnh sau phân đoạn chứa các điểm ảnh của vùng ảnh, và mã liên kết với
các vùng lận cận. Việc biến đổi các số liệu này thành dạng thích hợp là cần thiết cho
xử lý tiếp theo bằng máy tính. Việc chọn các tính chất để thể hiện ảnh gọi là trích chọn
đặc trƣng (Feature Selection) gắn với việc tách các đặc tính của ảnh dƣới dạng các
-4thông tin định lƣợng hoặc làm cơ sở để phân biệt lớp đối tƣợng này với đối tƣợng khác
trong phạm vi ảnh nhận đƣợc.
1.1.5 Nhận dạng và nội suy ảnh
Nhận dạng ảnh là quá trình xác định ảnh, quá trình này thƣờng thu đƣợc bằng
cách so sánh với mẫu chuẩn đã đƣợc học từ trƣớc.
Nội suy là phán đoán theo ý nghĩa trên cơ sở nhận dạng, nhận dạng theo tham số
và nhận dạng theo cấu trúc.
1.2 Mốt số vấn đề cơ bản trong xử lý ảnh số
1.2.1 Điểm ảnh
Điểm ảnh là một phần tử của ảnh số tại toạ độ (x, y) với độ xám hoặc màu nhất
định. Kích thƣớc và khoảng cách giữa các điểm ảnh đó đƣợc chọn thích hợp sao cho
mắt ngƣời cảm nhận sự liên tục về không gian và mức xám (hoặc màu) của ảnh số gần
nhƣ ảnh thật. M i phần tử trong ma trận đƣợc gọi là một phần tử ảnh.
1.2.2 Mức xám của ảnh
Mức xám là kết quả của sự mã hóa tƣơng ứng với một cƣờng độ sáng của m i
điểm ảnh với một giá trị số, kết quả của quá trình lƣợng tử hóa.
Một điểm ảnh (pixel) có hai đặc trƣng cơ bản là vị trí (x, y) của điểm ảnh và độ
xám của nó.
• Mức xám của điểm ảnh là cƣờng độ sáng của nó đƣợc gán bằng giá trị số tại
điểm đó.
• Các thang giá trị mức xám thông thƣờng: 16, 32, 64, 128, 256, mức 256 là mức
phổ dụng, dùng 8 bit để biểu diễn: 28=256 mức, tức là từ 0 đến 255.
Hình 1. 2 Ảnh xám ngƣỡng 255
1.2.3 Ảnh đen trắng
Ảnh đen trắng gồm có ảnh nhị phân và ảnh đa cấp xám, nếu chỉ có hai mức 0 và
1 còn gọi là ảnh nhị phân, nếu lớn hơn hai mức ta có ảnh đa cấp xám. Với ảnh nhị
phân, m i pixel đƣợc mã hóa trên một bit. Còn với ảnh xám 256 mức đƣợc mã hóa
trên 1 byte = 8 bit.
-5-
Hình 1. 3 Ảnh trắng đen
1.2.4 Ảnh nhị phân
Ảnh chỉ có 2 mức đen trắng phân biệt tức dùng 1 bit mô tả, m i điểm ảnh của
ảnh nhị phân chỉ có thể là 0 hoặc 1, các phần tử ảnh có thể coi nhƣ phần tử logic.
Hình 1. 4 Ảnh nhị phân
1.2.5 Ảnh màu
Trong khuôn khổ lý thuyết ba màu (Red, Blue, Green) để tạo nên thế giới màu,
ngƣời ta thƣờng dùng 3 byte để mô tả mức màu, khi đó các giá trị màu 2 8*3=224≈ 16,7
triệu màu.
Hình 1. 5 Ảnh màu
1.3 Cải thiện ảnh sử dụng toán tử điểm
1.3.1 Tăng giảm độ sáng
Độ tƣơng phản biểu diễn sự thay đổi độ sáng của đối tƣợng so với nền. Vì vậy,
muốn nhìn thấy rõ đối tƣợng trong ảnh so với nền thì chúng ta có thể thay đổi giá trị
cƣờng độ sáng trong ảnh.
Giả sử ta có ảnh đầu vào I ~ kích thƣớc (m x n) và số nguyên c
Nếu c > 0: ảnh sáng lên
Nếu c < 0: ảnh tối đi
-6-
Hình 1. 6 Ảnh tăng/giảm độ sáng
1.3.2 Tăng độ tương phản
Ảnh số là tập hợp các điểm, m i điểm có giá trị độ sáng khác nhau, hai đối tƣợng
có cùng độ sáng nhƣng đặt trên hai nền khác nhau sẽ cho cảm nhận sáng khác nhau.
Vậy độ tƣơng phản biểu diễn sự thay đổi độ sáng của đối tƣợng so với nền, hay
độ tƣơng phản là độ nổi của điểm ảnh hay vùng ảnh so với nền. Nếu ảnh có độ tƣơng
phản kém, ta có thể thay đổi theo các hàm.
u
ua
f (u ) (u a) Va a u b
(u b) V b u L
b
Các độ dốc , , xác định độ tƣơng phản tƣơng đối. L là số mức xám cực đại
Ta có:
α = β = γ =1 ảnh kết quả trùng với ảnh gốc
α, β, γ > 1 giãn độ tƣơng phản
α, β, γ < 1 co độ tƣơng phản
Hình 1. 7 Biểu đồ giãn độ tƣơng phản
Hình 1. 8 Ảnh khi tăng tƣơng độ phản
-71.3.3 Tách nhiễu và lấy ngưỡng
• Tách nhiễu: là trƣờng hợp riêng của giãn độ tƣơng phản khi α = γ = 0, ứng dụng
để giảm nhiễu khi biết tín hiệu nằm trong khoảng [a,b].
• Lấy ngƣỡng: là trƣờng hợp riêng của tách nhiễu khi a = b = θ (θ là ngƣỡng),
ứng dụng trong trƣờng hợp biến đổi từ ảnh đa mức xám về ảnh nhị phân.
1.3.4 Biến đổi âm bản
Âm bản nhận đƣợc bằng phép biến đổi âm. Phép biến đổi này có rất nhiều hữu
ích cho các phim ảnh dùng trong y học.
v= f (u) L u
Giả sử ta có ảnh I ~ kích thƣớc (m x n)
Hình 1. 9 Ảnh âm bản
1.3.5 Biến đổi ảnh đen trắng
Để chuyển đổi một ảnh màu sang ảnh đen trắng ta dùng kĩ thuật tách ngƣỡng.
Giả sử ta có ảnh I ~ kích thƣớc (m x n), hai số Min, Max và ngƣỡng θ.
Hình 1. 10 Ảnh trắng đen
-8-
1.3.6 Lược đồ xám(Histogram)
2.3.1.1 Hiển thị lược đồ xám của ảnh
Lƣợc đồ mức xám là một hàm cung cấp tần suất xuất hiện của m i mức xám
(gray-level) trong ảnh. Biễu diễn toán học của histogram của một ảnh số có L=256
mức xám là một hàm rời rạc.
p( f k )
nk
n
Trong đó:
f k là giá trị xám thứ k (k = 0, 1,..., L-1)
nk là số pixel có mức xám đó và
n là tổng số pixel của ảnh
p( f k ) [0,1]
Miền giá trị của
Một cách biễu diễn toán học khác của histogram của một ảnh là số lần xuất hiện
của m i mức xám.
p( f k ) nk
Khi lƣợc đồ xám đƣợc biễu diễn trong một hệ tọa độ vuông góc x, y (trục hoành
x biễu diễn số mức xám từ 0 đến L -1, trục tung y biễu diễn số điểm ảnh có cùng mức
xám hay tỷ lệ số điểm ảnh có cùng mức xám trên tổng số điểm ảnh), thì hình dạng của
histogram của ảnh sẽ mang đến cho chúng ta thông tin về tính động của ảnh (ảnh rất
sáng hay ảnh rất đậm) dùng làm cơ sở cho việc tăng cƣờng độ tƣơng phản.
Hình 1. 11 Lƣợc đồ mức xám của các loại ảnh
-9Nhìn vào biểu đồ trên ta nhận thấy rằng: nếu ảnh tối thì mức xám sẽ tập trung ở
gần gốc tọa độ.
Theo định nghĩa của lƣợc đồ xám, thì việc xây dựng nó là khá đơn giản.
Hình 1. 12 Biểu đồ lƣợc đồ xám (Histogram) của ảnh
Lƣợc đồ xám là một công cụ hữu hiệu dùng trong nhiều công đoạn của tăng
cƣờng xử lý ảnh.
2.3.1.2 Cân bằng lược đồ xám
Với một ảnh tự nhiên đƣợc lƣợng hóa một cách tuyến tính, phần lớn các điểm
ảnh có giá trị thấp hơn độ sáng trung bình. Trong miền tối, ta khó có thể cảm nhận các
chi tiết của ảnh. Thực tế cần phải khắc phục nhƣợc điểm này bằng cách biến đổi lƣợc
đồ xám. Ngƣời ta biến đổi lƣợc đồ sao cho tiến gần tới lƣợc đồ định trƣớc. Có nhiều
phƣơng pháp, trong đó phƣơng pháp phổ dụng nhất là san bằng lƣợc đồ.
Nếu ảnh có kích thƣớc (p x p) và ảnh kết quả đƣợc mã hóa trên N F mức xám thì
số điểm ảnh cho một mức xám trong lƣợc đồ cân bằng lý tƣởng sẽ là hằng số và bằng
P 2 / N F ( N F là số mức xám đầu xa). Trên thực tế, N F thƣờng nhỏ hơn N I (số mức
xám ban đầu).
Hình 1. 13 Cân bằng mức xám của ảnh
1.3.7 Kỹ thuật cải thiện ảnh nhị phân
Với ảnh nhị phân, mức xám chỉ có 2 giá trị là 0 hay 1. Do vậy, ta xét một phần tử
ảnh nhƣ một phần tử logic và có thể áp dụng các toán tử hình học dựa trên khái niệm
biến đổi hình học của một ảnh bởi một phần tử cấu trúc.
-10Phần tử cấu trúc là một mặt nạ dạng bất kỳ mà các phần tử của nó tạo nên một
mô-típ, ngƣời ta tiến hành rê mặt nạ đi khắp ảnh và tính giá trị điểm ảnh bởi các điểm
lân cận với mô-típ của mặt nạ theo cách lấy hội hay lấy tuyển.
Dựa vào nguyên tắc trên, ngƣời ta sử dụng 2 kỹ thuật: dãn ảnh (Dilatation) và co
ảnh (Erosion).
1.4.1.1 Dãn ảnh
Dãn ảnh nhằm loại bỏ điểm đen bị vây bởi các điểm trắng. Trong kỹ thuật này,
một cửa sổ (N+1) x (N+1) đƣợc rê đi khắp ảnh và thực hiện đối sánh một pexel của
ảnh với (N+1)2-1 điểm lân cận (không tính điểm ở tâm). Phép đối sánh ở đây thực hiện
bởi phép tuyển logic.
Hình 1. 14 Minh hoạ của phép giãn ảnh
1.4.1.2 Co ảnh
Co ảnh là thao tác đối ngẫu của dãn ảnh nhằm loại bỏ điểm trắng bị vây bởi các
điểm đen.
Trong kỹ thuật này, một cửa sổ (N+1)2 đƣợc rê đi khắp ảnh và thực hiện so sánh
một pixel của ảnh với (N+1)2-1 điểm lân cận. Việc so sánh ở đây thực hiện bởi phép
hội logic.
Để không ảnh hƣởng đến kích thƣớc của đối tƣợng trong ảnh, ngƣời ta tiến hành
n lần dãn và n lần co.
Hình 1. 15 Ứng dụng của phép co ảnh
- Xem thêm -