BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC LẠC HỒNG
TRẦN THỊ HỒNG
SỬ DỤNG KỸ THUẬT HỌC SÂU
NHẬN DẠNG MỘT SỐ BỆNH NGOÀI DA
LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN
Đồng Nai, Năm 2019
BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC LẠC HỒNG
TRẦN THỊ HỒNG
SỬ DỤNG KỸ THUẬT HỌC SÂU
NHẬN DẠNG MỘT SỐ BỆNH NGOÀI DA
Chuyên ngành: Công Nghệ Thông Tin
Mã ngành: 8480201
LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN
NGƯỜI HƯỚNG DẪN KHOA HỌC
PGS. TS. TRẦN VĂN LĂNG
Đồng Nai, Năm 2019
i
LỜI CẢM ƠN
Qua quá trình học tập và rèn luyện tại Trường Đại Học Lạc Hồng, với sự biết
ơn và kính trọng, xin gửi lời cảm ơn chân thành đến Ban Giám Hiệu nhà trường, các
phòng ban, khoa Công Nghệ Thông Tin và các Thầy đã nhiệt tình hướng dẫn, giảng
dạy, giúp đỡ em trong suốt thời gian học tập, nghiên cứu và hoàn thiện đề tài nghiên
cứu khoa học này.
Đặc biệt, em xin bày tỏ lòng biết ơn sâu sắc tới Thầy PGS.TS Trần Văn Lăng
đã trực tiếp hướng dẫn rất nhiệt tình và luôn đồng hành cùng em trong quá trình thực
hiện đề tài.
Em cũng xin gửi lời cảm ơn đến những người thân trong gia đình cùng anh chị,
các bạn trong lớp đã luôn quan tâm giúp đỡ tôi trong suốt thời gian học tập cũng như
làm luận văn.
Mặc dù đã cố gắng rất nhiều, tuy nhiên điều kiện về năng lực bản thân còn hạn
chế, nên luận văn không tránh khỏi những thiếu sót. Kính mong nhận được sự đóng
góp ý kiến của các Quý thầy cô giáo, bạn bè và đồng nghiệp để bài nghiên cứu được
hoàn thiện hơn.
Tôi xin chân thành cảm ơn!
Đồng Nai, Ngày 20 tháng 11 năm 2019
Học viên
Trần Thị Hồng
ii
LỜI CAM ĐOAN
Tôi cam đoan kết quả đạt được trong luận văn này là sản phẩm của riêng cá
nhân tôi, là kết quả đạt được trong quá trình học tập và nghiên cứu khoa học độc lập.
Các nội dung luận văn tham khảo từ các tài liệu được trích dẫn và chú thích đầy
đủ.
Không có sản phẩm hay nghiên cứu nào của người khác được sử dụng trong
luận văn mà không có trích dẫn theo đúng quy định.
Tôi xin chịu trách nhiệm về luận văn của mình.
Đồng Nai, Ngày 20 tháng 11 năm 2019
Học viên
Trần Thị Hồng
iii
TÓM TẮT ĐỀ TÀI
( Dùng cho học viên và người hướng dẫn)
Đề tài: Sử Dụng Kỹ Thuật Học Sâu Nhận Dạng Một Số Bệnh Ngoài Da
Ngành: Công nghệ thông tin
Mã số: 916000200
Học viên: Trần Thị Hồng
Người hướng dẫn: PGS.TS Trần Văn Lăng
NỘI DUNG TÓM TẮT
Nội dung được giao và kết quả mong đợi của người hướng dẫn
Thu thập các dữ liệu liên quan nằm trong phạm nghiên cứu đề tài:
Bài toán nhận dạng một số bệnh ngoài da trong thời gian gần đây đã có những
kết quả nỗi bật tuy nhiên cũng đang còn gặp vài khó khăn trong việc thu thập và xử
lý dữ liệu, chưa xây dựng được một mô hình chuẩn trong việc nhận dạng bệnh ngoài
da.
Các mô hình học sâu như ANN, CNN, RNN, LSTM,…đang là những mô hình
được áp dụng nhiều trong các bài toán từ bài toán phân loại đến bài toán nhận dạng
và thu được nhiều thành tựu nỗi bật.
Sử dụng mô hình huấn luyện bằng ResNet 101, sử dụng kỹ thuật tinh chỉnh để
cập nhật các trọng số đã được huấn luyện trên tập ảnh IMAGENET. Tập huấn luyện
sử dụng Tensorflow trên Google Colab với GPU.
Hiện nay các kỹ thuật học sâu không chỉ dừng lại ở mức cơ bản mà còn được
nhiều nhà nghiên cứu phát triển, cải tiến để áp dụng nâng cao hiệu quả cho từng bài
toán khác nhau. Việc nghiên cứu kỹ thuật học sâu không thể thiếu trong luận văn.
Đề tài “Sử dụng kỹ thuật học sâu nhận dạng một số bệnh ngoài da”. Sẽ xây dựng
mô hình nhận dạng một số bệnh ngoài da dựa trên bộ dữ liệu thu thập được, đồng
thời đưa ra một quy trình cụ thể để huấn luyện mô hình bắt đầu từ bước xử lý dữ liệu
đến trích xuất đặc trưng và cuối cùng là xây dựng mô hình nhận dạng dựa trên kỹ
thuật học sâu.
Đồng Nai, Ngày 20 tháng 11 năm 2019
Người hướng dẫn
Học viên
PGS.TS. Trần Văn Lăng
Trần Thị Hồng
iv
MỤC LỤC
LỜI CẢM ƠN .............................................................................................................i
LỜI CAM ĐOAN ..................................................................................................... ii
TÓM TẮT ĐỀ TÀI ................................................................................................. iii
MỤC LỤC .................................................................................................................iv
DANH MỤC HÌNH VẼ ...........................................................................................vi
DANH MỤC BẢNG BIỂU .................................................................................... vii
DANH MỤC VIẾT TẮT ....................................................................................... vii
CHƯƠNG 1 GIỚI THIỆU TỔNG QUAN .............................................................. 1
1.1 Về đề tài ............................................................................................................. 1
1.1.1 Đặt vấn đề nghiên cứu ................................................................................ 1
1.1.2 Mục tiêu nghiên cứu ................................................................................... 1
1.2 Về cơ sở lý thuyết .............................................................................................. 4
1.2.1 Giới thiệu về xử lý ảnh ............................................................................... 4
1.2.2 Bài toán nhận dạng ..................................................................................... 5
1.2.3 Bài toán nhận dạng bệnh về da ................................................................... 7
CHƯƠNG 2 TỔNG QUAN VỀ PHƯƠNG PHÁP HỌC MÁY .......................... 13
2.1 Phương pháp học máy truyền thống ................................................................ 13
2.2 Phương pháp học sâu ....................................................................................... 16
2.3 Mạng neural tích chập .................................................................................... 18
2.3.1 Kiến trúc mạng neural tích chập ............................................................... 19
2.3.2 Một số kiến trúc mạng tích chập học sâu ................................................. 21
CHƯƠNG 3 TỔNG QUAN VỀ GOOGLE COLAB ........................................... 28
3.1 Tổng quan về công nghệ ................................................................................. 28
3.2 Một số ứng dụng công nghệ thông minh (AI) trong nghành y tế .................... 29
3.2.1 Phẫu thuật với sự hỗ trợ từ robot .............................................................. 29
3.2.2 Trợ lý y tá ảo ............................................................................................. 29
3.2.3 Giúp gánh bớt khối lượng công việc và nhiệm vụ quản trị ...................... 29
3.2.4 Phân tích hình ảnh .................................................................................... 29
3.2.5 Hỗ trợ chẩn đoán lâm sàng ....................................................................... 30
3.3 Ứng dụng trong học máy ................................................................................. 30
v
CHƯƠNG 4 NHẬN DẠNG BỆNH NGOÀI DA .................................................. 33
4.1 Thiết kế hệ thống ............................................................................................. 33
4.2 Các bước thực nghiệm với kỹ thuật mạng neural tích chập ............................ 33
4.3 Xây dựng cấu trúc mạng neural tích chập ....................................................... 34
4.4 Dữ liệu thực nghiệm nhận dạng bệnh ngoài da ............................................... 34
4.5 Kết quả thực nghiệm ....................................................................................... 35
4.6 Kết luận ........................................................................................................... 40
TÀI LIỆU THAM KHẢO
vi
DANH MỤC HÌNH VẼ
Hình 2.1 Hình ảnh dịch vụ chăm sóc sức khỏe [6] ...................................................13
Hình 2.2 Ứng dụng Strems của công ty DeepMind [28] ..........................................14
Hình 2.3 Sự khác biệt giữa AI, Machine learning và Deep learning [9] ..................17
Hình 2.4 Bài toán phân loại ảnh [5] ..........................................................................18
Hình 2.5 Kiến trúc mạng neural tích chập [11].........................................................19
Hình 2.6 Ví dụ bộ lọc tích chập được sử dụng ma trận điểm ảnh. [7] ......................20
Hình 2.7 Phương thức Avarage Pooling và Max Pooling [8] ...................................20
Hình 2.8 Minh họa hoạt động của lớp pooling [26] ..................................................21
Hình 2.9 Ví dụ nhận dạng khuôn mặt người [5] .......................................................23
Hình 2.10 Kiến trúc mạng LeNet5 [7] ......................................................................23
Hình 2.11 Kiến trúc mạng AlexNet [21]...................................................................24
Hình 2.12 Kiến trúc mạng ZFNet [20] ......................................................................25
Hình 2.13 Một dạng cụ thể của kiến trúc mạng GooLeNet [25] ..............................26
Hình 2.14 Kiến trúc mạng VGGNet [14] ..................................................................27
Hình 3.1 Google ứng dụng trong chăm sóc sức khỏe [31] .......................................28
Hình 3.2 Ung thư tế bào hắc tố [30]..........................................................................31
Hình 3.4 Sử dụng AI chuẩn đoán bệnh nhiễm hắc tố da [30] ...................................32
Hình 4.1 Sơ đồ nhận dạng bệnh ngoài da .................................................................33
Hình 4.2 Một vài hình ảnh của tập dữ liệu ISIC .......................................................34
Hình 4.3 Một vài hình ảnh sử dụng ResNet [34]. .....................................................35
Hình 4.4 Một vài hình ảnh của tập dữ liệu ................................................................35
Hình 4.5 Tải dữ liệu đầu vào .....................................................................................37
Hình 4.6 Lấy một vài mẫu ( hình ảnh) để Train .......................................................37
Hình 4.7 Quá trình Train ...........................................................................................38
Hình 4.8 Thống kê kết quả quá trình huần luyện ......................................................38
Hình 4.9 Test dữ liệu .................................................................................................39
Hình 4.10 Thống kê kết quả. huấn luyện ResNet101 ...............................................40
Hình 4.11 Thống kê kết quả huấn luyện ResNet152 ................................................40
vii
DANH MỤC BẢNG BIỂU
Bảng 4.1 Bộ dữ liệu hình ảnh của bảy loại bệnh khác nhau .....................................36
Bảng 4.2 Thống kê quá trình huấn luyện ..................................................................39
DANH MỤC VIẾT TẮT
Các từ viết tắt
Tiếng Anh
Tiếng Việt
DNN
Deep Neural Network
Mạng ̣nơ-ron sâu
CNN
Convolutional Neural Networks
Mạng nơ-ron tích chập
ANN
Artificial Neural Network
Mạng nơ-ron nhân tạo
SVM
Support vector machine
Máy vector hỗ trợ
LSTM
Long Short Term Memory
Bộ nhớ ngắn hạn
AI
Artificial Intelligence
Trí tuệ nhân tạo
1
CHƯƠNG 1 GIỚI THIỆU TỔNG QUAN
1.1 Về đề tài
1.1.1 Đặt vấn đề nghiên cứu
Ngày nay, với sự phát triển của khoa công nghệ thì việc giao tiếp giữa con người
với máy tính càng trở nên dễ dàng hơn. Với nhiều kiến trúc học máy khác nhau được
áp dụng như mạng neural nhân tạo (ANN), mạng neural học sâu (DNN), đã từng bước
được áp dụng vào các lĩnh vực khác nhau của đời sống như lĩnh vực thị giác máy
tính, lĩnh vực tự động nhận dạng giọng nói, xử lý ngôn ngữ tự nhiên, lĩnh vực y khoa,
... kết quả đã vượt trội so với các phương pháp truyền thống.
Đặc biệt cùng với sự phát triển của phần cứng mạnh mẽ cho phép tính toán hàng
tỷ phép tính trong một giây, tạo tiền đề cho mạng CNN trở nên phổ biến hơn. Một
trong những ứng dụng quan trọng của mạng CNN đó là cho phép các máy tính có khả
năng nhìn và phân tích, mạng CNN được sử dụng để nhận dạng hình ảnh của đối
tượng bằng cách đưa nó qua nhiều lớp với một bộ lọc tích chập để sau đó có thể nhận
dạng được đối tượng đó.
Da là bộ phận quan trọng nhất của cơ thể, da có nhiệm vụ bảo vệ cơ thể che chở
cho cơ thể chúng ta khỏi những tác nhân gây bệnh nguy hiểm. Vì thế, cách tốt nhất
để bảo vệ làn da của chúng ta chính là tìm ra các bệnh ngoài da để có cách chữa trị
kịp thời nhanh chóng. Ngày nay, bệnh ngoài da càng ngày càng phổ biến đặc biệt là
ở nước có điều kiện khí hậu nóng ẩm như ở Việt Nam.
Vì vậy, để nhận dạng một số bệnh ngoài da luận văn áp dụng các kỹ thuật học
sâu để nhận dạng bệnh ngoài da tự động, đặc biệt là các bệnh ngoài da phổ biến hiện
nay là rất cần thiết.
1.1.2 Mục tiêu nghiên cứu
Mục tiêu nghiên cứu của đề tài là xây dựng được mô hình nhận dạng một số
bệnh ngoài da, đánh giá và phân tích độ chính xác của mô hình dựa trên bộ dữ liệu cụ
thể.
Đối tượng nghiên cứu là tập trung nghiên cứu và nhận dạng bảy loại bệnh: Nhọt,
trứng cá, bệnh vẩy nến, ung thư tế bào đáy, ung thư tế bào vảy, ung thư tế bào hắc tố,
bệnh bạch biến.
a) Tổng quan về các nghiên cứu liên quan
Trong bài nghiên cứu của Jang Hyung Lee và Kwang Gi Kim về một số bài toán
y khoa hiện nay đã quan tâm đến việc ứng dụng kỹ thuật học sâu trong việc hỗ trợ
2
phân tích hình ảnh y khoa,thực hiện để ước tính độ tuổi của xương [17]. Từ nhu cầu
ước tính độ tuổi xương tay trong độ tuổi tăng trưởng, Lee và Kim đã áp dụng kỹ thuật
học sâu vào phân tích hình ảnh y khoa làm chỉ số tiên lượng tăng trưởng chiều cao
của đối tượng. Trong [17] các tác giả đã sử dụng mô hình hồi quy cùng platforms
Caffenet (một trong nhiều nền tảng được sử dụng trong kỹ thuật học sâu hiện nay) để
huấn luyện bộ dữ liệu hình ảnh X-Quang xương tay của bệnh nhân mục đích so sánh
tiên lượng tuổi của xương tay.
Liên quan đến việc sử dụng kỹ thuật học sâu trong việc phân tích ảnh, nhóm tác
giả Jae-Hong Lee và đồng sự sử dụng mạng lưới học sâu mạng neural tích chập để
chẩn đoán và dự đoán răng bị tổn thương dựa trên thư viện Keras [4]. Trong công
trình này các tác giả đã sử dụng dữ liệu đầu vào là những hình ảnh X-Quang chất
lượng cao được phân loại bởi những bác sĩ nha khoa có kinh nghiệm kết hợp sử dụng
CNN trên kiến trúc mạng VGG-19 cải tiến (kiến trúc mạng neural tích chập cải tiến
từ kiến trúc VGG) giúp tăng hiệu suất phát hiện đối tượng và phân loại hình ảnh.
Trong bài nghiên cứu Deep CNN and Data Augmentation for Skin Lesion
Classification các tác giả Tri-Cong Pham, Chi-Mai Luong, Muriel Visani, and VanDung Hoang [3], Trong nghiên cứu này họ đề xuất một hệ thống phân loại khối u ác
tính bao gồm ba thành phần chính: tăng thêm mô-đun dữ liệu, trích xuất các mô-đun
tính năng và phân loại. Trong hệ thống phân loại, việc tăng cường dữ liệu được áp
dụng bằng cách sử dụng phép biến đổi truyền thống của TensorFlow của Google,
trình trích xuất tính năng được Deep CNN triển khai, lớp được xây dựng bởi các thuật
toán truyền thống như NN, SVM, RF. Trình tự của quá trình đào tạo là: tăng cường
hình ảnh tổn thương da, trích xuất các tính năng của hình ảnh được tạo ra, đào tạo mô
hình phân loại và lưu mô hình phân loại thành mô hình. Trong quá trình dự đoán các
bước này là: làm tăng hình ảnh tổn thương da, trích xuất vectơ tính năng trung bình
và mô hình của phân loại.
Còn trong bài báo Deep – CLASS at ISIC Machine Learning Challenge 2018
nhóm tác giả Sara Nasiri, Matthias Jung, Julien Helsper, Madjid Fathi [4], báo cáo
phương pháp, kết quả đánh giá của nhóm cho nhiệm vụ thử thách ISIC. Một trong
những mô hình đại diện giữa các mô hình học sâu khác nhau là một mạng neural tính
chập (CNN).
Trong nghiên cứu này họ áp dụng mạng CNN để phát hiện các tổn thương ác
tính bằng cách sử dụng hình ảnh từ tập dữ liệu lưu trữ ISIC. Họ đã áp dụng các loại
3
tối ưu hóa khác nhau và chọn sự kết hợp tốt nhất của các CNN được tinh chỉnh tốt.
[4].
CNN sẽ hữu ích cho việc phân loại các bệnh và đặc biệt là để phát hiện sớm ung
thư da. Phân tích các kết quả thu được bằng cách kiểm tra số liệu ISIC cho thấy rằng
việc sử dụng hệ thống dựa trên trường hợp của họ để biểu diễn các trường hợp thông
qua CNN phù hợp với mục đích hỗ trợ người dùng bằng cách cung cấp thông tin liên
quan đến từng bệnh.
Trong lĩnh vực chăm sóc sức khỏe chủ yếu dựa vào các thuật toán để phân tích
dữ liệu và đề xuất phương pháp điều trị. Cụ thể, máy tính được nạp một lượng lớn dữ
liệu đã biết, sau đó sử dụng các quy tắc hoặc thuật toán do những chuyên gia thiết lập
để trích xuất thông tin và áp dụng nó cho một vấn đề sức khỏe.
Trong các nghiên cứu của các nhà khoa học tại Đại học Tôn Dật Tiên, Trung
Quốc đang dùng một mạng neural nhân tạo mới được gọi là CC-Cruiser, để nhận biết
và chẩn đoán bệnh đục thủy tinh thể bẩm sinh một cách chính xác như các bác sĩ nhãn
khoa. Mạng này đã xác định những trường hợp bị đục thủy tinh thể bẩm sinh với độ
chính xác 98,25%, ước lượng được vị trí đục thủy tinh thể với độ chính xác 100%, đề
xuất phương pháp điều trị thích hợp với độ chính xác 92,86%.
b) Phạm vi nghiên cứu
Phạm vi nghiên cứu của đề tài là dựa vào đặc trưng các loại tổn thương da của
bảy bệnh như: Nhọt, trứng cá, bệnh vẩy nến, ung thư tế bào đáy, ung thư tế bào vảy,
ung thư tế bào hắc tố, bệnh bạch biến từ tập dữ liệu lưu trữ ISIC2018.
c) Ý nghĩa khoa học và ý nghĩa thực tiễn của đề tài
c.1 Ý nghĩa khoa học
Đưa ra mô hình mới cho bài toán nhận dạng một số bệnh ngoài da.
Đánh giá thực nghiệm trên các dữ liệu thực.
4
c.2 Ý nghĩa thực tiễn
Kết quả nghiên cứu của đề tài có thể làm tài liệu tham khảo cho bài toán nhận
dạng bệnh ngoài da trên các thiết bị di động.
d) Phương pháp nghiên cứu
d.1 Phương pháp nghiên cứu lý thuyết
Phương pháp học sâu rất hiệu quả trong những bài toán nhận dạng. Vì vậy, đề
tài sẽ nghiên cứu các mô hình học sâu để áp dụng giải quyết bài toán nhận dạng trên.
d.2 Phương pháp nghiên cứu thực nghiệm
Xây dựng dữ liệu để huấn luyện mô hình cho phương pháp và đánh giá phương
pháp.
Tiến hành thực nghiệm và đánh giá kết quả dựa trên mô hình và dữ liệu.
1.2 Về cơ sở lý thuyết
1.2.1 Giới thiệu về xử lý ảnh
Xử lý ảnh là đối tượng nghiên cứu trong lĩnh vực thị giác máy tính, là quá trình
biến đổi từ một ảnh ban đầu sang một ảnh mới với các đặc tính và tuân theo ý muốn
của người sử dụng. Xử lý ảnh có thể gồm quá trình phân tích, phân lớp các đối tượng,
làm tăng chất lượng, phân đoạn và tách cạnh, gán nhãn cho vùng hay quá trình biên
dịch các thông tin hình ảnh của ảnh. Cũng như xử lý dữ liệu bằng đồ hoạ, xử lý ảnh
số là một lĩnh vực của tin học ứng dụng. Xử lý dữ liệu bằng đồ họa đề cập đến những
ảnh nhân tạo, các ảnh này được xem xét như là một cấu trúc dữ liệu và được tạo bởi
các chương trình. Xử lý ảnh số bao gồm các phương pháp và kỹ thuật biến đổi, để
truyền tải hoặc mã hoá các ảnh tự nhiên. Mục đích của xử lý ảnh gồm: Biến đổi ảnh
làm tăng chất lượng ảnh. Tự động nhận dạng ảnh, đoán nhận ảnh, đánh giá các nội
dung của ảnh. Nhận biết và đánh giá các nội dung của ảnh là sự phân tích một hình
ảnh thành những phần có ý nghĩa để phân biệt đối tượng này với đối tượng khác, dựa
vào đó ta có thể mô tả cấu trúc của hình ảnh ban đầu. Có thể liệt kê một số phương
pháp nhận dạng cơ bản như nhận dạng ảnh của các đối tượng trên ảnh, tách cạnh,
phân đoạn hình ảnh, … Kỹ thuật này được dùng nhiều trong y học (xử lý tế bào,
nhiễm sắc thể), nhận dạng chữ trong văn bản.
Thu nhận ảnh: Đây là công đoạn đầu tiên mang tính quyết định đối với quá
trình xử lý ảnh. Ảnh đầu vào sẽ được thu nhận qua các thiết bị như camera, sensor,
máy scanner, … và sau đó các tín hiệu này sẽ được số hóa. Việc lựa chọn các thiết bị
thu nhận ảnh sẽ phụ thuộc vào đặc tính của các đối tượng cần xử lý. Các thông số
5
quan trọng ở bước này là độ phân giải, chất lượng màu, dung lượng bộ nhớ và tốc độ
thu nhận ảnh của các thiết bị. Tiền xử lý: Ở bước này, ảnh sẽ được cải thiện về độ
tương phản, khử nhiễu, khử bóng, khử độ lệch, … với mục đích làm cho chất lượng
ảnh trở lên tốt hơn nữa, chuẩn bị cho các bước xử lý phức tạp hơn về sau trong quá
trình xử lý ảnh. Quá trình này thường được thực hiện bởi các bộ lọc.
Phân đoạn ảnh: phân đoạn ảnh là bước quan trọng trong xử lý ảnh. Giai đoạn
này phân tích ảnh thành những thành phần có cùng tính chất nào đó dựa theo biên
hay các vùng liên thông. Tiêu chuẩn để xác định các vùng liên thông có thể là cùng
màu, cùng mức xám, … Mục đích của phân đoạn ảnh là để có một miêu tả tổng hợp
về nhiều phần tử khác nhau cấu tạo lên ảnh thô. Vì lượng thông tin chứa trong ảnh
rất lớn, trong khi đa số các ứng dụng chúng ta chỉ cần trích một vài đặc trưng nào đó,
do vậy cần có một quá trình để giảm lượng thông tin khổng lồ đó. Quá trình này bao
gồm phân vùng ảnh và trích chọn đặc tính chủ yếu.
Nhận dạng và giải thích: Đây là bước cuối cùng trong quá trình xử lý ảnh,
nhận dạng ảnh có thể được nhìn nhận một cách đơn giản là việc gán nhãn cho các đối
tượng trong ảnh, giải thích là công đoạn gán nghĩa cho một tập các đối tượng đã được
nhận biết. Xử lý ảnh đã đem lại nhiều ứng dụng trong nhiều lĩnh vực khác nhau: lĩnh
vực chăm sóc sức khỏe, khoa học hình hình sự, khí tượng thuỷ văn, quản lý,…
1.2.2 Bài toán nhận dạng
Nhận dạng đối tượng trong ảnh được coi là bài toán cơ bản nhất trong lĩnh vực
thị giác máy tính, khả năng kết hợp các phương pháp trí tuệ nhân tạo với xử lý đặc
trưng ảnh vào việc phát hiện, nhận dạng và định danh đối tượng. Khó khăn để máy
tính có thể hiểu được các thông tin trong một bức ảnh đó là phải kể đến [3]:
Sự đa dạng trong điểm nhìn( Viewpoint): Cùng một vật thể nhưng có thể có
rất nhiều vị trí và góc nhìn khác nhau, dẫn đến các hình ảnh thu được về đối tượng đó
sẽ không giống nhau. Việc huấn luyện để máy tính có thể hiểu được điều này thực sự
là một thách thức khó khăn.
Sự đa dạng trong kích thước: Các bức ảnh không có cách nào thể hiện trường
thông tin về kích thước của vật thể trong đời thực, và máy tính cũng chỉ có thể tính
toán được tỉ lệ tương đối của vật thể so với bức ảnh bằng cách đếm theo số lượng các
điểm ảnh vật thể đó chiếm trong ảnh.
6
Các điều kiện khác nhau của chiếu sáng: Ánh sáng có ảnh hưởng mạnh mẽ
đến thông tin thể hiện trong một bức ảnh, đặc biệt là ở mức độ thấp như mức độ điểm
ảnh.
Sự ẩn giấu một phần của vật thể sau các đối tượng khác trong ảnh: Trong các
bức ảnh, vật thể không nhất định phải xuất hiện với đầy đủ hình dạng mà có thể bị
che lấp một phần nào đó bởi nền hoặc các vật thể xung quanh. Sự không đầy đủ về
hình dạng của vật thể sẽ dẫn đến việc thiếu thông tin, đặc trưng và càng làm bài toán
nhận dạng khó khăn hơn.
Sự lộn xộn phức tạp của nền: Trong nhiều trường hợp, đối tượng cần nhận dạng
bị lẫn gần như hoàn toàn vào nền của bức ảnh, sự lẫn lộn về màu sắc, họa tiết giữa
vật thể và nền khiến cho việc nhận dạng trở nên vô cùng khó khăn, kể cả với thị giác
con người.
Sự đa dạng về chủng loại đối tượng: Đối tượng cần nhận dạng có thể bao gồm
nhiều chủng loại khác nhau, với hình dạng, màu sắc, biểu hiện không rõ ràng. Đây
chính là một thách thức nữa với bài toán nhận dạng, đó là làm thế nào để các mô hình
nhận dạng của máy tính có thể nhận biết được các biến thể về chủng loại của đối
tượng.
Với sự phát triển của khoa học kỹ thuật thì bài toán nhận dạng ngày càng áp
dụng rộng rãi trên nhiều lĩnh vực khác nhau của đời sống hằng ngày như các ứng
dụng liên quan đến nhận dạng đối tượng có thể kể đến như:
Hệ thống phát hiện tội phạm: Qua hình ảnh từ camera được đặt tại một số điểm
công cộng như ở siêu thị, nhà sách, trạm xe buýt, sân bay.
Hệ thống theo dõi nhân sự trong một đơn vị: giám sát giờ ra vào của từng nhân
viên và chấm công.
Hệ thống giao tiếp người máy: Thay thế việc tương tác giữa người và máy
theo những cách truyền thống như: bàn phím, chuột được thay vào đó là sử dụng các
giao tiếp trực qua biểu cảm khuôn mặt, dấu hiệu, cử chỉ bằng tay.
Các hệ thống bảo mật dựa trên thông tin trắc sinh học: mặt người, vân tay thay
vì xác nhận mật khẩu, khóa...
Như vậy, một hệ thống nhận dạng đối tượng là hệ thống nhận vào một ảnh hoặc
một đoạn video (một chuỗi các ảnh). Qua xử lý tính toán hệ thống xác định được vị
trí đối tượng trong ảnh (nếu có) và xác định là đối tượng nào trong số những đối
7
tượng hệ thống đã được biết (qua quá trình học) hay là đối tượng mới. Yêu cầu đặt ra
đối với hệ thống nhận dạng đối tượng là độ chính xác cao vì vậy hệ thống đòi hỏi
phải có các đặc trưng tốt. Hệ thống phải biết chọn đặc trưng như thế nào để có thể
biểu diễn tốt được thông tin đối tượng cần nhận dạng. Đồng thời, đặc trưng phải được
tính toán nhanh để không làm chậm công việc nhận dạng, thêm vào đó hệ thống phải
có phương pháp học hiệu quả, có khả năng nhận dạng tốt các mẫu mới chứ không chỉ
làm tốt các mẫu đã học.
Xét trường hợp đối tượng là phi tuyến có độ phức tạp cao, nếu sử dụng phương
pháp giải thích thông thường để nhận dạng sẽ rất là khó khăn, thậm chí không thực
hiện được do dữ liệu quá ít về đối tượng.
Nhận dạng mạng neural gồm hai loại: nhận dạng mô hình và nhận dạng tham
số.
Nhận dạng mô hình: là quá trình xác định mô hình của đối tượng và thông số
trên đầu vào và đầu ra của đối tượng. Mô hình thu được sau khi nhận dạng gọi là tốt
nếu nó thể hiện được là đúng đối tượng. Như vậy có thể sử dụng mô hình cho đối
tượng để dự báo, kiểm tra và điều khiển. Mạng neural được huấn luyện để mô hình
hóa quan hệ vào ra của đối tượng. Như vậy quy trình nhận dạng mô hình có bản chất
của thuật toán huấn luyện mạng. Cấu trúc mạng neural giải bài toán nhận dạng mô
hình rất đa dạng, tùy thuộc vào bài toán cụ thể.
Nhận dạng tham số: chính là huấn luyện mạng, được biểu diễn trên tín hiệu sai
số là cơ sở cho quá trình huấn luyện mạng neural ở đây có thể là mạng neural nhiều
lớp hoặc các dạng khác .
1.2.3 Bài toán nhận dạng bệnh về da
a) Khái niệm
Hàng ngày, làn da của chúng ta cũng phải chống chọi với nắng, gió, khói bụi,
vi khuẩn, vì thế nếu không bảo vệ và chăm sóc da thật tốt, làn da sẽ rất dễ bị tổn
thương và có nguy cơ mắc phải những căn bệnh ngoài da nguy hiểm. Bệnh ngoài da
là bệnh gây ảnh hưởng trực tiếp đến bề mặt da của chúng ta. Bệnh có thể không nguy
hiểm đến sức khỏe tính mạng của chúng ta nhưng lại tác động vào bề mặt da gây mất
thẩm mỹ, mất tự tin khi giao tiếp, khó khăn trong sinh hoạt trong cuộc sống, những
cảm giác khó chịu, đau rát do bệnh ngoài da gây nên.
Dấu hiệu các bệnh ngoài da: là hiện tượng da bị dị ứng, nhiễm khuẩn, nổi ngứa,
mẩn đỏ, phát ban bất kỳ vị trí nào trên cơ thể chúng ta, làm cho chúng ta đứng ngồi
không yên, ăn không ngon miệng, ngủ không đủ giấc. Vì vậy, bệnh ngoài da đã trở
8
thành một trong những bệnh phổ biến nhất trên toàn thế giới, bên cạnh những tác
động đau đớn của chúng gây ra cho người bệnh. Để chẩn đoán các bệnh về da đòi hỏi
mức độ hiểu biết cao về chuyên môn, người bệnh phải cần có tư vấn của bác sĩ da
liễu. Một số bệnh ngoài da thường gặp: nhọt, trứng cá, bệnh vẩy nến, ung thư tế bào
đáy, ung thư tế bào vảy, ung thư tế bào hắc tố, bệnh bạch biến.
Bài toán nhận dạng và chuẩn đoán bệnh ngoài da, cũng gặp nhiều khó khăn như
số lượng khổng lồ về chủng loại bệnh ngoài da, bệnh có thể gặp theo mùa, theo vùng
miền, … với vô số loại bệnh ngoài da có những biểu hiện bệnh khác nhau hoặc gần
giống nhau làm cho người bệnh hay chủ quan không thăm hỏi ý kiến bác sĩ dẫn tới
bệnh ngày một nặng hơn.
Ví dụ: Bệnh da do nhiễm khuẩn bao gồm nhiều bệnh như bệnh chốc, bệnh nhọt,
bệnh viêm nang lông, hội chứng bong vảy da do tụ cầu, bệnh trứng cá, bệnh phong,
bệnh lao da. Bên cạnh đó dấu hiệu nặng nhẹ của bệnh ngoài da biểu hiện trên mỗi
người là khác nhau tùy thuộc vào kết cấu, tình trạng da của mỗi người. Đối với bệnh
ngoài da nhẹ có thể dễ dàng chữa khỏi tuy nhiên, đối với bệnh da liễu nặng thì cần
phải có biện pháp điều trị đặc biệt.
b) Mô tả bài toán
Đầu vào của bài toán là tập ảnh về bệnh ngoài da có thể thu nhận qua các thiết
bị như: máy scanner ,camera, sensor, … mỗi ảnh được gắn nhãn tạo thành ảnh đầu
vào. Tập dữ liệu này được đưa vào mạng CNN để huấn luyện phát hiện vùng bệnh
ngoài da và trích xuất đặc trưng bệnh. Sau đó nhận dạng bệnh dựa trên việc trích xuất
đặc trưng của hình ảnh thu được, với dữ liệu đã huấn luyện để phát hiện bệnh ngoài
da và cho ra kết quả đó là bệnh gì.
Đầu ra của bài toán là nhận dạng được bệnh ngoài da là bệnh gì.
Một số bệnh ngoài da hay gặp [27]:
9
b.1 Nhọt
Nhọt (Furuncle) là tình trạng viêm cấp tính gây hoại tử nang lông và tổ chức
xung quanh. Bệnh thường gặp về mùa hè, nam nhiều hơn nữ. Mọi lứa tuổi đều có thể
mắc bệnh, tuy nhiên, bệnh thường gặp hơn ở trẻ em.
Nguyên nhân gây bệnh là tụ cầu vàng (Staphylococcus aereus). Bình thường,vi
khuẩn này sống ký sinh trên da, nhất là các nang lông ở các nếp gấp như rãnh mũi
má, rãnh liên mông…hoặc các hốc tự nhiên như lỗ mũi. Khi nang lông bị tổn thương
kết hợp với những điều kiện thuận lợi như tình trạng miễn dịch kém, suy dinh dưỡng,
mắc bệnh tiểu đường…vi khuẩn sẽ phát triển và gây bệnh.
Thống kê cho thấy, có khoảng 80% số người trong độ tuổi từ 11 – 30 tuổi bị
mụn nhọt. Tình trạng này tiếp tục phát triển trong đời sống của người trưởng thành,
với khoảng 5% phụ nữ và 1% đàn ông trên 25 tuổi tiếp tục mắc bệnh lý về da này.
b.2 Trứng Cá
Trứng cá (acne) là bệnh da thông thường gây nên do tăng tiết chất bã và viêm
của hệ thống nang lông tuyến bã. Bệnh biểu hiện bằng nhiều loại tổn thương khác
nhau như mụn cám, sẩn, viêm, mụn mủ, mụn bọc, nang, ... khu trú ở vị trí tiết nhiều
chất bã như mặt, lưng, ngực. Khoảng 80% trường hợp trứng cá gặp ở tuổi thanh thiếu
niên, đặc biệt giai đoạn dậy thì. Trứng cá không ảnh hưởng nghiêm trọng đến tính
mạng, tuy nhiên, do tồn tại dai dẳng, mụn, sẩn hay sẹo lồi, sẹo lõm ở vùng mặt ảnh
hưởng tới thẩm mỹ và chất lượng cuộc sống người bệnh. Trứng cá là mối quan tâm
của nhiều bạn trẻ hiện nay do nhiều nguyên nhân khác nhau, đặc biệt trong đó rối loạn
nội tiết và trứng cá do dùng thuốc.
Một số loại mụn trứng cá thông dụng như bệnh trứng cá do nghề nghiệp, trứng
cá ở trẻ em, trứng cá thông thường, trứng cá đỏ, trứng cá mạch lươn, trứng cá sẹo lồi,
trứng cá kê hoại tử, trứng cá do thuốc.
b.3 Bệnh vẩy nến
Bệnh vẩy nến chiếm 5% dân số Châu Âu, 2% dân số Châu Á và Châu Phi, xấp
xỉ 10% tổng số các bệnh nhân đến khám ở các phòng khám Da liễu. Bệnh lành tính,
thường không ảnh hưởng đến sức khỏe nhưng ảnh hưởng đến thẩm mỹ, tâm lý và
những hệ lụy của nó, nam gặp nhiều hơn nữ, người lớn nhiều hơn trẻ em. Bệnh phát
thành từng đợt, có khi tăng giảm theo mùa.
Bệnh vẩy nến là một căn bệnh ngoài da mãn tính, có xu hướng ngày càng trầm
trọng thêm. Dạng bệnh vẩy nến thường xuyên xảy ra là gây nên các mảng da có màu
xám hoặc hồng khác nhau với lớp vảy bạc phủ lên. Các mảng này có thể gây nên
10
chứng sắc tố trên da. Các triệu chứng đầu tiên có thể xuất hiện ở bât cứ độ tuổi nào,
tuy nhiên, chúng có xu hướng xuất hiện ở giai đoạn đầu của tuổi trưởng thành, hoặc
lúc lớn tuổi khoảng 50- 60 tuổi.
Nguyên nhân gây ra căn bệnh vẩy nến là không rõ ràng, mặc dù có nguyên nhân
đã được chấp nhận là do một thành phần di truyền cơ bản nào đó, khi được kích hoạt
sẽ làm cho hệ thống miễn dịch sản xuất một số lượng quá nhiều tế bào da. Như vậy
hiện tượng này được gọi là một rối loạn da tự miễn dịch. Hiện nay chưa có cách chữa
khỏi hoàn toàn căn bệnh này mà không tái phát bệnh. Một số loại bệnh vẩy nến
thường gặp:
Bệnh vẩy nến thể mảng bám, bệnh vẩy nến thể tròn, bệnh vẩy nến thể mụn mủ,
bệnh vẩy nến thể đốm, bệnh vẩy nến bàn tay, bàn chân, bệnh vẩy nến móng, viêm
khớp vảy nến, bệnh vẩy nến da tiết bã, bệnh vẩy nến toàn thân.
b.4 Ung thư tế bào đáy
Ung thư tế bào đáy (Basal cell carcinoma - BCC): là loại u ác tính gồm những
tế bào giống với tế bào ở lớp đáy của thượng bì. Nguồn gốc thực sự của ung thư tế
bào đáy còn chưa rõ ràng. Đây là loại ung thư da hay gặp nhất, chiếm khoảng 75% các
loại ung thư da, bệnh thường gặp ở người trên 50 tuổi.
Nhiều nghiên cứu đã xác định tia cực tím là nguyên nhân chủ yếu gây ung thư
da, nhất là ung thư biểu mô tế bào đáy. Những người làm việc ngoài trời có tỉ lệ mắc
ung thư biểu mô tế bào đáy rất cao, khoảng 80% các thương tổn ung thư biểu mô tế
bào đáy ở vùng da hở. Trong phổ của ánh sáng mặt trời thì các tia cực tím (UV: Ultra
Violet) bao gồm các chùm tia UVC, UVB, UVA được coi tác tác nhân chủ yếu gây
ung thư biểu mô tế bào đáy. Tế bào cơ sở ung thư thường phát triển trên các phần tiếp
xúc với ánh nắng của cơ thể, đặc biệt là đầu và cổ, một số lượng nhỏ hơn nhiều xảy
ra trên thân và chân. Tuy nhiên, ung thư tế bào đáy cũng có thể xảy ra trên các bộ
phận của cơ thể mà ít khi tiếp xúc ánh sáng ban ngày.
b.5 Ung thư tế bào vảy
Ung thư tế bào vảy (squamous cell carcinoma-SCC) là ung thư khởi phát từ tế
bào sừng của da và niêm mạc, chiếm khoảng 20% các ung thư da và đứng hàng thứ
hai sau ung thư tế bào đáy. Ung thư tế bào vảy có thể xâm lấn và di căn xa, tại bệnh
viện da liễu Trung ương, số người bị ung thư tế bào vảy đến khám và điều trị ngày
càng tăng. Phần lớn người bệnh đến khám muộn, khi tổn thương lan rộng hoặc đã di
căn. Ung thư biểu mô tế bào vảy thường xuất hiện trên các tổn thương da mãn tính như
dày sừng ánh sáng (actinic keratosis), bạch sản (leucoplasia), các sẹo bỏng, viêm da
11
do quang tuyến, nhiễm HPV,… Sau một thời gian tiến triển kéo dài, trên thương tổn
da mãn tính xuất hiện sùi hoặc mảng cứng nổi cao, chắc, màu hồng đến màu đỏ, loét,
dễ chảy máu, đóng vảy tiết nâu đen.
b.6 Ung thư tế bào hắc tố
Ung thư tế bào hắc tố (malignant melanoma) chiếm khoảng 5% các ung thư da
và khoảng 1% các loại ung thư, theo nhiều nghiên cứu thì số lượng bệnh nhân ung
thư tế bào hắc tố những năm gần đây, tốc độ tăng của bệnh vẫn duy trì ở mức độ cao
trên toàn thế giới, đặc biệt ở châu Úc, bắc Mỹ, và các nước bắc Âu. Ở Mỹ năm 2006
có 111.900 trường hợp ung thư tế bào hắc tố được phát hiện, bệnh gặp ở mọi chủng
tộc trong đó người da trắng mắc bệnh nhiều nhất. Ung thư tế bào hắc tố thường gặp ở
người nhiều tuổi và hiếm gặp ở trẻ em, tỉ lệ mắc bệnh ở cả hai giới là tương đương
nhau. Phần lớn các u hắc tố có màu đen hoặc nâu, nhưng cũng có thể là màu da, hồng,
đỏ, tím, xanh hoặc trắng. Ung thư hắc tố chủ yếu do sự tiếp xúc cường độ cao với tia
cực tím, đặc biệt là ở những người dễ mang gen bệnh. Ung thư hắc tố mỗi năm giết
chết khoảng 10.130 người tại Mỹ.
Nếu ung thư hắc tố được phát hiện sớm, bệnh có thể chữa trị. Ngược lại, nếu
bệnh đã tiến triển tới giai đoạn muộn và di căn sang các phần khác của cơ thể, việc
điều trị rất khó và tỉ lệ tử vong cao. Dù bệnh này không phải là dạng phổ biến nhất
trong các dạng ung thư da nhưng nó gây ra hầu hết các trường hợp tử vong. Trong
năm 2016, ước tính có khoảng 76.380 trường hợp có khối u ác tính xâm lấn, với
khoảng 46.870 ca bệnh ở nam giới và 29.510 ca bệnh ở nữ giới.
b.7 Bệnh bạch biến
Bạch biến (Vilitigo) là một loại bệnh do một số tế bào sắc tố trong da bị hư
khiến làn da mất đi sắc tố melamin do đó làm da biến thành màu trắng hoặc nổi đốm
trắng và có khi ảnh hưởng tới những vùng như lông, tóc. Bệnh bạch biến có thể khởi
phát ở bất kỳ tuổi nào, nhưng thường gặp ở người trẻ nam chiếm 32,5% và nữ là
67,5%. Một số trường hợp bệnh có tính chất gia đình, bệnh ảnh hưởng nhiều đến tâm
sinh lý và thẩm mỹ của người bệnh.
Nguyên nhân có thể do di truyền hoặc phát sinh trong quá trình phát triển đột
biến ở gen DR4, B13, B35 của HLA. Ảnh hưởng của một bệnh tự miễn, cơ chế bệnh
sinh hình thành các tự kháng thể chống lại kháng nguyên của tế bào sắc tố, gây độc
cho tế bào, hoặc làm giảm sản xuất sắc tố melanin. Khoảng 20-30% người bệnh bạch
biến có tự kháng thể chống tuyến giáp, tuyến thượng thận. Một số người bệnh bạch
biến phát sinh bệnh là do hoá chất phá huỷ hoặc ức chế hoạt động của tế bào sắc tố
- Xem thêm -