Đăng ký Đăng nhập
Trang chủ Sử dụng kỹ thuật học sâu nhận dạng một số bệnh ngoài da: luận văn thạc sĩ...

Tài liệu Sử dụng kỹ thuật học sâu nhận dạng một số bệnh ngoài da: luận văn thạc sĩ

.PDF
52
104
87

Mô tả:

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC LẠC HỒNG TRẦN THỊ HỒNG SỬ DỤNG KỸ THUẬT HỌC SÂU NHẬN DẠNG MỘT SỐ BỆNH NGOÀI DA LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN Đồng Nai, Năm 2019 BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC LẠC HỒNG TRẦN THỊ HỒNG SỬ DỤNG KỸ THUẬT HỌC SÂU NHẬN DẠNG MỘT SỐ BỆNH NGOÀI DA Chuyên ngành: Công Nghệ Thông Tin Mã ngành: 8480201 LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN NGƯỜI HƯỚNG DẪN KHOA HỌC PGS. TS. TRẦN VĂN LĂNG Đồng Nai, Năm 2019 i LỜI CẢM ƠN Qua quá trình học tập và rèn luyện tại Trường Đại Học Lạc Hồng, với sự biết ơn và kính trọng, xin gửi lời cảm ơn chân thành đến Ban Giám Hiệu nhà trường, các phòng ban, khoa Công Nghệ Thông Tin và các Thầy đã nhiệt tình hướng dẫn, giảng dạy, giúp đỡ em trong suốt thời gian học tập, nghiên cứu và hoàn thiện đề tài nghiên cứu khoa học này. Đặc biệt, em xin bày tỏ lòng biết ơn sâu sắc tới Thầy PGS.TS Trần Văn Lăng đã trực tiếp hướng dẫn rất nhiệt tình và luôn đồng hành cùng em trong quá trình thực hiện đề tài. Em cũng xin gửi lời cảm ơn đến những người thân trong gia đình cùng anh chị, các bạn trong lớp đã luôn quan tâm giúp đỡ tôi trong suốt thời gian học tập cũng như làm luận văn. Mặc dù đã cố gắng rất nhiều, tuy nhiên điều kiện về năng lực bản thân còn hạn chế, nên luận văn không tránh khỏi những thiếu sót. Kính mong nhận được sự đóng góp ý kiến của các Quý thầy cô giáo, bạn bè và đồng nghiệp để bài nghiên cứu được hoàn thiện hơn. Tôi xin chân thành cảm ơn! Đồng Nai, Ngày 20 tháng 11 năm 2019 Học viên Trần Thị Hồng ii LỜI CAM ĐOAN Tôi cam đoan kết quả đạt được trong luận văn này là sản phẩm của riêng cá nhân tôi, là kết quả đạt được trong quá trình học tập và nghiên cứu khoa học độc lập. Các nội dung luận văn tham khảo từ các tài liệu được trích dẫn và chú thích đầy đủ. Không có sản phẩm hay nghiên cứu nào của người khác được sử dụng trong luận văn mà không có trích dẫn theo đúng quy định. Tôi xin chịu trách nhiệm về luận văn của mình. Đồng Nai, Ngày 20 tháng 11 năm 2019 Học viên Trần Thị Hồng iii TÓM TẮT ĐỀ TÀI ( Dùng cho học viên và người hướng dẫn) Đề tài: Sử Dụng Kỹ Thuật Học Sâu Nhận Dạng Một Số Bệnh Ngoài Da Ngành: Công nghệ thông tin Mã số: 916000200 Học viên: Trần Thị Hồng Người hướng dẫn: PGS.TS Trần Văn Lăng NỘI DUNG TÓM TẮT Nội dung được giao và kết quả mong đợi của người hướng dẫn Thu thập các dữ liệu liên quan nằm trong phạm nghiên cứu đề tài: Bài toán nhận dạng một số bệnh ngoài da trong thời gian gần đây đã có những kết quả nỗi bật tuy nhiên cũng đang còn gặp vài khó khăn trong việc thu thập và xử lý dữ liệu, chưa xây dựng được một mô hình chuẩn trong việc nhận dạng bệnh ngoài da. Các mô hình học sâu như ANN, CNN, RNN, LSTM,…đang là những mô hình được áp dụng nhiều trong các bài toán từ bài toán phân loại đến bài toán nhận dạng và thu được nhiều thành tựu nỗi bật. Sử dụng mô hình huấn luyện bằng ResNet 101, sử dụng kỹ thuật tinh chỉnh để cập nhật các trọng số đã được huấn luyện trên tập ảnh IMAGENET. Tập huấn luyện sử dụng Tensorflow trên Google Colab với GPU. Hiện nay các kỹ thuật học sâu không chỉ dừng lại ở mức cơ bản mà còn được nhiều nhà nghiên cứu phát triển, cải tiến để áp dụng nâng cao hiệu quả cho từng bài toán khác nhau. Việc nghiên cứu kỹ thuật học sâu không thể thiếu trong luận văn. Đề tài “Sử dụng kỹ thuật học sâu nhận dạng một số bệnh ngoài da”. Sẽ xây dựng mô hình nhận dạng một số bệnh ngoài da dựa trên bộ dữ liệu thu thập được, đồng thời đưa ra một quy trình cụ thể để huấn luyện mô hình bắt đầu từ bước xử lý dữ liệu đến trích xuất đặc trưng và cuối cùng là xây dựng mô hình nhận dạng dựa trên kỹ thuật học sâu. Đồng Nai, Ngày 20 tháng 11 năm 2019 Người hướng dẫn Học viên PGS.TS. Trần Văn Lăng Trần Thị Hồng iv MỤC LỤC LỜI CẢM ƠN .............................................................................................................i LỜI CAM ĐOAN ..................................................................................................... ii TÓM TẮT ĐỀ TÀI ................................................................................................. iii MỤC LỤC .................................................................................................................iv DANH MỤC HÌNH VẼ ...........................................................................................vi DANH MỤC BẢNG BIỂU .................................................................................... vii DANH MỤC VIẾT TẮT ....................................................................................... vii CHƯƠNG 1 GIỚI THIỆU TỔNG QUAN .............................................................. 1 1.1 Về đề tài ............................................................................................................. 1 1.1.1 Đặt vấn đề nghiên cứu ................................................................................ 1 1.1.2 Mục tiêu nghiên cứu ................................................................................... 1 1.2 Về cơ sở lý thuyết .............................................................................................. 4 1.2.1 Giới thiệu về xử lý ảnh ............................................................................... 4 1.2.2 Bài toán nhận dạng ..................................................................................... 5 1.2.3 Bài toán nhận dạng bệnh về da ................................................................... 7 CHƯƠNG 2 TỔNG QUAN VỀ PHƯƠNG PHÁP HỌC MÁY .......................... 13 2.1 Phương pháp học máy truyền thống ................................................................ 13 2.2 Phương pháp học sâu ....................................................................................... 16 2.3 Mạng neural tích chập .................................................................................... 18 2.3.1 Kiến trúc mạng neural tích chập ............................................................... 19 2.3.2 Một số kiến trúc mạng tích chập học sâu ................................................. 21 CHƯƠNG 3 TỔNG QUAN VỀ GOOGLE COLAB ........................................... 28 3.1 Tổng quan về công nghệ ................................................................................. 28 3.2 Một số ứng dụng công nghệ thông minh (AI) trong nghành y tế .................... 29 3.2.1 Phẫu thuật với sự hỗ trợ từ robot .............................................................. 29 3.2.2 Trợ lý y tá ảo ............................................................................................. 29 3.2.3 Giúp gánh bớt khối lượng công việc và nhiệm vụ quản trị ...................... 29 3.2.4 Phân tích hình ảnh .................................................................................... 29 3.2.5 Hỗ trợ chẩn đoán lâm sàng ....................................................................... 30 3.3 Ứng dụng trong học máy ................................................................................. 30 v CHƯƠNG 4 NHẬN DẠNG BỆNH NGOÀI DA .................................................. 33 4.1 Thiết kế hệ thống ............................................................................................. 33 4.2 Các bước thực nghiệm với kỹ thuật mạng neural tích chập ............................ 33 4.3 Xây dựng cấu trúc mạng neural tích chập ....................................................... 34 4.4 Dữ liệu thực nghiệm nhận dạng bệnh ngoài da ............................................... 34 4.5 Kết quả thực nghiệm ....................................................................................... 35 4.6 Kết luận ........................................................................................................... 40 TÀI LIỆU THAM KHẢO vi DANH MỤC HÌNH VẼ Hình 2.1 Hình ảnh dịch vụ chăm sóc sức khỏe [6] ...................................................13 Hình 2.2 Ứng dụng Strems của công ty DeepMind [28] ..........................................14 Hình 2.3 Sự khác biệt giữa AI, Machine learning và Deep learning [9] ..................17 Hình 2.4 Bài toán phân loại ảnh [5] ..........................................................................18 Hình 2.5 Kiến trúc mạng neural tích chập [11].........................................................19 Hình 2.6 Ví dụ bộ lọc tích chập được sử dụng ma trận điểm ảnh. [7] ......................20 Hình 2.7 Phương thức Avarage Pooling và Max Pooling [8] ...................................20 Hình 2.8 Minh họa hoạt động của lớp pooling [26] ..................................................21 Hình 2.9 Ví dụ nhận dạng khuôn mặt người [5] .......................................................23 Hình 2.10 Kiến trúc mạng LeNet5 [7] ......................................................................23 Hình 2.11 Kiến trúc mạng AlexNet [21]...................................................................24 Hình 2.12 Kiến trúc mạng ZFNet [20] ......................................................................25 Hình 2.13 Một dạng cụ thể của kiến trúc mạng GooLeNet [25] ..............................26 Hình 2.14 Kiến trúc mạng VGGNet [14] ..................................................................27 Hình 3.1 Google ứng dụng trong chăm sóc sức khỏe [31] .......................................28 Hình 3.2 Ung thư tế bào hắc tố [30]..........................................................................31 Hình 3.4 Sử dụng AI chuẩn đoán bệnh nhiễm hắc tố da [30] ...................................32 Hình 4.1 Sơ đồ nhận dạng bệnh ngoài da .................................................................33 Hình 4.2 Một vài hình ảnh của tập dữ liệu ISIC .......................................................34 Hình 4.3 Một vài hình ảnh sử dụng ResNet [34]. .....................................................35 Hình 4.4 Một vài hình ảnh của tập dữ liệu ................................................................35 Hình 4.5 Tải dữ liệu đầu vào .....................................................................................37 Hình 4.6 Lấy một vài mẫu ( hình ảnh) để Train .......................................................37 Hình 4.7 Quá trình Train ...........................................................................................38 Hình 4.8 Thống kê kết quả quá trình huần luyện ......................................................38 Hình 4.9 Test dữ liệu .................................................................................................39 Hình 4.10 Thống kê kết quả. huấn luyện ResNet101 ...............................................40 Hình 4.11 Thống kê kết quả huấn luyện ResNet152 ................................................40 vii DANH MỤC BẢNG BIỂU Bảng 4.1 Bộ dữ liệu hình ảnh của bảy loại bệnh khác nhau .....................................36 Bảng 4.2 Thống kê quá trình huấn luyện ..................................................................39 DANH MỤC VIẾT TẮT Các từ viết tắt Tiếng Anh Tiếng Việt DNN Deep Neural Network Mạng ̣nơ-ron sâu CNN Convolutional Neural Networks Mạng nơ-ron tích chập ANN Artificial Neural Network Mạng nơ-ron nhân tạo SVM Support vector machine Máy vector hỗ trợ LSTM Long Short Term Memory Bộ nhớ ngắn hạn AI Artificial Intelligence Trí tuệ nhân tạo 1 CHƯƠNG 1 GIỚI THIỆU TỔNG QUAN 1.1 Về đề tài 1.1.1 Đặt vấn đề nghiên cứu Ngày nay, với sự phát triển của khoa công nghệ thì việc giao tiếp giữa con người với máy tính càng trở nên dễ dàng hơn. Với nhiều kiến trúc học máy khác nhau được áp dụng như mạng neural nhân tạo (ANN), mạng neural học sâu (DNN), đã từng bước được áp dụng vào các lĩnh vực khác nhau của đời sống như lĩnh vực thị giác máy tính, lĩnh vực tự động nhận dạng giọng nói, xử lý ngôn ngữ tự nhiên, lĩnh vực y khoa, ... kết quả đã vượt trội so với các phương pháp truyền thống. Đặc biệt cùng với sự phát triển của phần cứng mạnh mẽ cho phép tính toán hàng tỷ phép tính trong một giây, tạo tiền đề cho mạng CNN trở nên phổ biến hơn. Một trong những ứng dụng quan trọng của mạng CNN đó là cho phép các máy tính có khả năng nhìn và phân tích, mạng CNN được sử dụng để nhận dạng hình ảnh của đối tượng bằng cách đưa nó qua nhiều lớp với một bộ lọc tích chập để sau đó có thể nhận dạng được đối tượng đó. Da là bộ phận quan trọng nhất của cơ thể, da có nhiệm vụ bảo vệ cơ thể che chở cho cơ thể chúng ta khỏi những tác nhân gây bệnh nguy hiểm. Vì thế, cách tốt nhất để bảo vệ làn da của chúng ta chính là tìm ra các bệnh ngoài da để có cách chữa trị kịp thời nhanh chóng. Ngày nay, bệnh ngoài da càng ngày càng phổ biến đặc biệt là ở nước có điều kiện khí hậu nóng ẩm như ở Việt Nam. Vì vậy, để nhận dạng một số bệnh ngoài da luận văn áp dụng các kỹ thuật học sâu để nhận dạng bệnh ngoài da tự động, đặc biệt là các bệnh ngoài da phổ biến hiện nay là rất cần thiết. 1.1.2 Mục tiêu nghiên cứu Mục tiêu nghiên cứu của đề tài là xây dựng được mô hình nhận dạng một số bệnh ngoài da, đánh giá và phân tích độ chính xác của mô hình dựa trên bộ dữ liệu cụ thể. Đối tượng nghiên cứu là tập trung nghiên cứu và nhận dạng bảy loại bệnh: Nhọt, trứng cá, bệnh vẩy nến, ung thư tế bào đáy, ung thư tế bào vảy, ung thư tế bào hắc tố, bệnh bạch biến. a) Tổng quan về các nghiên cứu liên quan Trong bài nghiên cứu của Jang Hyung Lee và Kwang Gi Kim về một số bài toán y khoa hiện nay đã quan tâm đến việc ứng dụng kỹ thuật học sâu trong việc hỗ trợ 2 phân tích hình ảnh y khoa,thực hiện để ước tính độ tuổi của xương [17]. Từ nhu cầu ước tính độ tuổi xương tay trong độ tuổi tăng trưởng, Lee và Kim đã áp dụng kỹ thuật học sâu vào phân tích hình ảnh y khoa làm chỉ số tiên lượng tăng trưởng chiều cao của đối tượng. Trong [17] các tác giả đã sử dụng mô hình hồi quy cùng platforms Caffenet (một trong nhiều nền tảng được sử dụng trong kỹ thuật học sâu hiện nay) để huấn luyện bộ dữ liệu hình ảnh X-Quang xương tay của bệnh nhân mục đích so sánh tiên lượng tuổi của xương tay. Liên quan đến việc sử dụng kỹ thuật học sâu trong việc phân tích ảnh, nhóm tác giả Jae-Hong Lee và đồng sự sử dụng mạng lưới học sâu mạng neural tích chập để chẩn đoán và dự đoán răng bị tổn thương dựa trên thư viện Keras [4]. Trong công trình này các tác giả đã sử dụng dữ liệu đầu vào là những hình ảnh X-Quang chất lượng cao được phân loại bởi những bác sĩ nha khoa có kinh nghiệm kết hợp sử dụng CNN trên kiến trúc mạng VGG-19 cải tiến (kiến trúc mạng neural tích chập cải tiến từ kiến trúc VGG) giúp tăng hiệu suất phát hiện đối tượng và phân loại hình ảnh. Trong bài nghiên cứu Deep CNN and Data Augmentation for Skin Lesion Classification các tác giả Tri-Cong Pham, Chi-Mai Luong, Muriel Visani, and VanDung Hoang [3], Trong nghiên cứu này họ đề xuất một hệ thống phân loại khối u ác tính bao gồm ba thành phần chính: tăng thêm mô-đun dữ liệu, trích xuất các mô-đun tính năng và phân loại. Trong hệ thống phân loại, việc tăng cường dữ liệu được áp dụng bằng cách sử dụng phép biến đổi truyền thống của TensorFlow của Google, trình trích xuất tính năng được Deep CNN triển khai, lớp được xây dựng bởi các thuật toán truyền thống như NN, SVM, RF. Trình tự của quá trình đào tạo là: tăng cường hình ảnh tổn thương da, trích xuất các tính năng của hình ảnh được tạo ra, đào tạo mô hình phân loại và lưu mô hình phân loại thành mô hình. Trong quá trình dự đoán các bước này là: làm tăng hình ảnh tổn thương da, trích xuất vectơ tính năng trung bình và mô hình của phân loại. Còn trong bài báo Deep – CLASS at ISIC Machine Learning Challenge 2018 nhóm tác giả Sara Nasiri, Matthias Jung, Julien Helsper, Madjid Fathi [4], báo cáo phương pháp, kết quả đánh giá của nhóm cho nhiệm vụ thử thách ISIC. Một trong những mô hình đại diện giữa các mô hình học sâu khác nhau là một mạng neural tính chập (CNN). Trong nghiên cứu này họ áp dụng mạng CNN để phát hiện các tổn thương ác tính bằng cách sử dụng hình ảnh từ tập dữ liệu lưu trữ ISIC. Họ đã áp dụng các loại 3 tối ưu hóa khác nhau và chọn sự kết hợp tốt nhất của các CNN được tinh chỉnh tốt. [4]. CNN sẽ hữu ích cho việc phân loại các bệnh và đặc biệt là để phát hiện sớm ung thư da. Phân tích các kết quả thu được bằng cách kiểm tra số liệu ISIC cho thấy rằng việc sử dụng hệ thống dựa trên trường hợp của họ để biểu diễn các trường hợp thông qua CNN phù hợp với mục đích hỗ trợ người dùng bằng cách cung cấp thông tin liên quan đến từng bệnh. Trong lĩnh vực chăm sóc sức khỏe chủ yếu dựa vào các thuật toán để phân tích dữ liệu và đề xuất phương pháp điều trị. Cụ thể, máy tính được nạp một lượng lớn dữ liệu đã biết, sau đó sử dụng các quy tắc hoặc thuật toán do những chuyên gia thiết lập để trích xuất thông tin và áp dụng nó cho một vấn đề sức khỏe. Trong các nghiên cứu của các nhà khoa học tại Đại học Tôn Dật Tiên, Trung Quốc đang dùng một mạng neural nhân tạo mới được gọi là CC-Cruiser, để nhận biết và chẩn đoán bệnh đục thủy tinh thể bẩm sinh một cách chính xác như các bác sĩ nhãn khoa. Mạng này đã xác định những trường hợp bị đục thủy tinh thể bẩm sinh với độ chính xác 98,25%, ước lượng được vị trí đục thủy tinh thể với độ chính xác 100%, đề xuất phương pháp điều trị thích hợp với độ chính xác 92,86%. b) Phạm vi nghiên cứu Phạm vi nghiên cứu của đề tài là dựa vào đặc trưng các loại tổn thương da của bảy bệnh như: Nhọt, trứng cá, bệnh vẩy nến, ung thư tế bào đáy, ung thư tế bào vảy, ung thư tế bào hắc tố, bệnh bạch biến từ tập dữ liệu lưu trữ ISIC2018. c) Ý nghĩa khoa học và ý nghĩa thực tiễn của đề tài c.1 Ý nghĩa khoa học Đưa ra mô hình mới cho bài toán nhận dạng một số bệnh ngoài da. Đánh giá thực nghiệm trên các dữ liệu thực. 4 c.2 Ý nghĩa thực tiễn Kết quả nghiên cứu của đề tài có thể làm tài liệu tham khảo cho bài toán nhận dạng bệnh ngoài da trên các thiết bị di động. d) Phương pháp nghiên cứu d.1 Phương pháp nghiên cứu lý thuyết Phương pháp học sâu rất hiệu quả trong những bài toán nhận dạng. Vì vậy, đề tài sẽ nghiên cứu các mô hình học sâu để áp dụng giải quyết bài toán nhận dạng trên. d.2 Phương pháp nghiên cứu thực nghiệm Xây dựng dữ liệu để huấn luyện mô hình cho phương pháp và đánh giá phương pháp. Tiến hành thực nghiệm và đánh giá kết quả dựa trên mô hình và dữ liệu. 1.2 Về cơ sở lý thuyết 1.2.1 Giới thiệu về xử lý ảnh Xử lý ảnh là đối tượng nghiên cứu trong lĩnh vực thị giác máy tính, là quá trình biến đổi từ một ảnh ban đầu sang một ảnh mới với các đặc tính và tuân theo ý muốn của người sử dụng. Xử lý ảnh có thể gồm quá trình phân tích, phân lớp các đối tượng, làm tăng chất lượng, phân đoạn và tách cạnh, gán nhãn cho vùng hay quá trình biên dịch các thông tin hình ảnh của ảnh. Cũng như xử lý dữ liệu bằng đồ hoạ, xử lý ảnh số là một lĩnh vực của tin học ứng dụng. Xử lý dữ liệu bằng đồ họa đề cập đến những ảnh nhân tạo, các ảnh này được xem xét như là một cấu trúc dữ liệu và được tạo bởi các chương trình. Xử lý ảnh số bao gồm các phương pháp và kỹ thuật biến đổi, để truyền tải hoặc mã hoá các ảnh tự nhiên. Mục đích của xử lý ảnh gồm: Biến đổi ảnh làm tăng chất lượng ảnh. Tự động nhận dạng ảnh, đoán nhận ảnh, đánh giá các nội dung của ảnh. Nhận biết và đánh giá các nội dung của ảnh là sự phân tích một hình ảnh thành những phần có ý nghĩa để phân biệt đối tượng này với đối tượng khác, dựa vào đó ta có thể mô tả cấu trúc của hình ảnh ban đầu. Có thể liệt kê một số phương pháp nhận dạng cơ bản như nhận dạng ảnh của các đối tượng trên ảnh, tách cạnh, phân đoạn hình ảnh, … Kỹ thuật này được dùng nhiều trong y học (xử lý tế bào, nhiễm sắc thể), nhận dạng chữ trong văn bản. Thu nhận ảnh: Đây là công đoạn đầu tiên mang tính quyết định đối với quá trình xử lý ảnh. Ảnh đầu vào sẽ được thu nhận qua các thiết bị như camera, sensor, máy scanner, … và sau đó các tín hiệu này sẽ được số hóa. Việc lựa chọn các thiết bị thu nhận ảnh sẽ phụ thuộc vào đặc tính của các đối tượng cần xử lý. Các thông số 5 quan trọng ở bước này là độ phân giải, chất lượng màu, dung lượng bộ nhớ và tốc độ thu nhận ảnh của các thiết bị. Tiền xử lý: Ở bước này, ảnh sẽ được cải thiện về độ tương phản, khử nhiễu, khử bóng, khử độ lệch, … với mục đích làm cho chất lượng ảnh trở lên tốt hơn nữa, chuẩn bị cho các bước xử lý phức tạp hơn về sau trong quá trình xử lý ảnh. Quá trình này thường được thực hiện bởi các bộ lọc. Phân đoạn ảnh: phân đoạn ảnh là bước quan trọng trong xử lý ảnh. Giai đoạn này phân tích ảnh thành những thành phần có cùng tính chất nào đó dựa theo biên hay các vùng liên thông. Tiêu chuẩn để xác định các vùng liên thông có thể là cùng màu, cùng mức xám, … Mục đích của phân đoạn ảnh là để có một miêu tả tổng hợp về nhiều phần tử khác nhau cấu tạo lên ảnh thô. Vì lượng thông tin chứa trong ảnh rất lớn, trong khi đa số các ứng dụng chúng ta chỉ cần trích một vài đặc trưng nào đó, do vậy cần có một quá trình để giảm lượng thông tin khổng lồ đó. Quá trình này bao gồm phân vùng ảnh và trích chọn đặc tính chủ yếu. Nhận dạng và giải thích: Đây là bước cuối cùng trong quá trình xử lý ảnh, nhận dạng ảnh có thể được nhìn nhận một cách đơn giản là việc gán nhãn cho các đối tượng trong ảnh, giải thích là công đoạn gán nghĩa cho một tập các đối tượng đã được nhận biết. Xử lý ảnh đã đem lại nhiều ứng dụng trong nhiều lĩnh vực khác nhau: lĩnh vực chăm sóc sức khỏe, khoa học hình hình sự, khí tượng thuỷ văn, quản lý,… 1.2.2 Bài toán nhận dạng Nhận dạng đối tượng trong ảnh được coi là bài toán cơ bản nhất trong lĩnh vực thị giác máy tính, khả năng kết hợp các phương pháp trí tuệ nhân tạo với xử lý đặc trưng ảnh vào việc phát hiện, nhận dạng và định danh đối tượng. Khó khăn để máy tính có thể hiểu được các thông tin trong một bức ảnh đó là phải kể đến [3]:  Sự đa dạng trong điểm nhìn( Viewpoint): Cùng một vật thể nhưng có thể có rất nhiều vị trí và góc nhìn khác nhau, dẫn đến các hình ảnh thu được về đối tượng đó sẽ không giống nhau. Việc huấn luyện để máy tính có thể hiểu được điều này thực sự là một thách thức khó khăn.  Sự đa dạng trong kích thước: Các bức ảnh không có cách nào thể hiện trường thông tin về kích thước của vật thể trong đời thực, và máy tính cũng chỉ có thể tính toán được tỉ lệ tương đối của vật thể so với bức ảnh bằng cách đếm theo số lượng các điểm ảnh vật thể đó chiếm trong ảnh. 6  Các điều kiện khác nhau của chiếu sáng: Ánh sáng có ảnh hưởng mạnh mẽ đến thông tin thể hiện trong một bức ảnh, đặc biệt là ở mức độ thấp như mức độ điểm ảnh.  Sự ẩn giấu một phần của vật thể sau các đối tượng khác trong ảnh: Trong các bức ảnh, vật thể không nhất định phải xuất hiện với đầy đủ hình dạng mà có thể bị che lấp một phần nào đó bởi nền hoặc các vật thể xung quanh. Sự không đầy đủ về hình dạng của vật thể sẽ dẫn đến việc thiếu thông tin, đặc trưng và càng làm bài toán nhận dạng khó khăn hơn.  Sự lộn xộn phức tạp của nền: Trong nhiều trường hợp, đối tượng cần nhận dạng bị lẫn gần như hoàn toàn vào nền của bức ảnh, sự lẫn lộn về màu sắc, họa tiết giữa vật thể và nền khiến cho việc nhận dạng trở nên vô cùng khó khăn, kể cả với thị giác con người.  Sự đa dạng về chủng loại đối tượng: Đối tượng cần nhận dạng có thể bao gồm nhiều chủng loại khác nhau, với hình dạng, màu sắc, biểu hiện không rõ ràng. Đây chính là một thách thức nữa với bài toán nhận dạng, đó là làm thế nào để các mô hình nhận dạng của máy tính có thể nhận biết được các biến thể về chủng loại của đối tượng. Với sự phát triển của khoa học kỹ thuật thì bài toán nhận dạng ngày càng áp dụng rộng rãi trên nhiều lĩnh vực khác nhau của đời sống hằng ngày như các ứng dụng liên quan đến nhận dạng đối tượng có thể kể đến như:  Hệ thống phát hiện tội phạm: Qua hình ảnh từ camera được đặt tại một số điểm công cộng như ở siêu thị, nhà sách, trạm xe buýt, sân bay.  Hệ thống theo dõi nhân sự trong một đơn vị: giám sát giờ ra vào của từng nhân viên và chấm công.  Hệ thống giao tiếp người máy: Thay thế việc tương tác giữa người và máy theo những cách truyền thống như: bàn phím, chuột được thay vào đó là sử dụng các giao tiếp trực qua biểu cảm khuôn mặt, dấu hiệu, cử chỉ bằng tay.  Các hệ thống bảo mật dựa trên thông tin trắc sinh học: mặt người, vân tay thay vì xác nhận mật khẩu, khóa... Như vậy, một hệ thống nhận dạng đối tượng là hệ thống nhận vào một ảnh hoặc một đoạn video (một chuỗi các ảnh). Qua xử lý tính toán hệ thống xác định được vị trí đối tượng trong ảnh (nếu có) và xác định là đối tượng nào trong số những đối 7 tượng hệ thống đã được biết (qua quá trình học) hay là đối tượng mới. Yêu cầu đặt ra đối với hệ thống nhận dạng đối tượng là độ chính xác cao vì vậy hệ thống đòi hỏi phải có các đặc trưng tốt. Hệ thống phải biết chọn đặc trưng như thế nào để có thể biểu diễn tốt được thông tin đối tượng cần nhận dạng. Đồng thời, đặc trưng phải được tính toán nhanh để không làm chậm công việc nhận dạng, thêm vào đó hệ thống phải có phương pháp học hiệu quả, có khả năng nhận dạng tốt các mẫu mới chứ không chỉ làm tốt các mẫu đã học. Xét trường hợp đối tượng là phi tuyến có độ phức tạp cao, nếu sử dụng phương pháp giải thích thông thường để nhận dạng sẽ rất là khó khăn, thậm chí không thực hiện được do dữ liệu quá ít về đối tượng. Nhận dạng mạng neural gồm hai loại: nhận dạng mô hình và nhận dạng tham số. Nhận dạng mô hình: là quá trình xác định mô hình của đối tượng và thông số trên đầu vào và đầu ra của đối tượng. Mô hình thu được sau khi nhận dạng gọi là tốt nếu nó thể hiện được là đúng đối tượng. Như vậy có thể sử dụng mô hình cho đối tượng để dự báo, kiểm tra và điều khiển. Mạng neural được huấn luyện để mô hình hóa quan hệ vào ra của đối tượng. Như vậy quy trình nhận dạng mô hình có bản chất của thuật toán huấn luyện mạng. Cấu trúc mạng neural giải bài toán nhận dạng mô hình rất đa dạng, tùy thuộc vào bài toán cụ thể. Nhận dạng tham số: chính là huấn luyện mạng, được biểu diễn trên tín hiệu sai số là cơ sở cho quá trình huấn luyện mạng neural ở đây có thể là mạng neural nhiều lớp hoặc các dạng khác . 1.2.3 Bài toán nhận dạng bệnh về da a) Khái niệm Hàng ngày, làn da của chúng ta cũng phải chống chọi với nắng, gió, khói bụi, vi khuẩn, vì thế nếu không bảo vệ và chăm sóc da thật tốt, làn da sẽ rất dễ bị tổn thương và có nguy cơ mắc phải những căn bệnh ngoài da nguy hiểm. Bệnh ngoài da là bệnh gây ảnh hưởng trực tiếp đến bề mặt da của chúng ta. Bệnh có thể không nguy hiểm đến sức khỏe tính mạng của chúng ta nhưng lại tác động vào bề mặt da gây mất thẩm mỹ, mất tự tin khi giao tiếp, khó khăn trong sinh hoạt trong cuộc sống, những cảm giác khó chịu, đau rát do bệnh ngoài da gây nên. Dấu hiệu các bệnh ngoài da: là hiện tượng da bị dị ứng, nhiễm khuẩn, nổi ngứa, mẩn đỏ, phát ban bất kỳ vị trí nào trên cơ thể chúng ta, làm cho chúng ta đứng ngồi không yên, ăn không ngon miệng, ngủ không đủ giấc. Vì vậy, bệnh ngoài da đã trở 8 thành một trong những bệnh phổ biến nhất trên toàn thế giới, bên cạnh những tác động đau đớn của chúng gây ra cho người bệnh. Để chẩn đoán các bệnh về da đòi hỏi mức độ hiểu biết cao về chuyên môn, người bệnh phải cần có tư vấn của bác sĩ da liễu. Một số bệnh ngoài da thường gặp: nhọt, trứng cá, bệnh vẩy nến, ung thư tế bào đáy, ung thư tế bào vảy, ung thư tế bào hắc tố, bệnh bạch biến. Bài toán nhận dạng và chuẩn đoán bệnh ngoài da, cũng gặp nhiều khó khăn như số lượng khổng lồ về chủng loại bệnh ngoài da, bệnh có thể gặp theo mùa, theo vùng miền, … với vô số loại bệnh ngoài da có những biểu hiện bệnh khác nhau hoặc gần giống nhau làm cho người bệnh hay chủ quan không thăm hỏi ý kiến bác sĩ dẫn tới bệnh ngày một nặng hơn. Ví dụ: Bệnh da do nhiễm khuẩn bao gồm nhiều bệnh như bệnh chốc, bệnh nhọt, bệnh viêm nang lông, hội chứng bong vảy da do tụ cầu, bệnh trứng cá, bệnh phong, bệnh lao da. Bên cạnh đó dấu hiệu nặng nhẹ của bệnh ngoài da biểu hiện trên mỗi người là khác nhau tùy thuộc vào kết cấu, tình trạng da của mỗi người. Đối với bệnh ngoài da nhẹ có thể dễ dàng chữa khỏi tuy nhiên, đối với bệnh da liễu nặng thì cần phải có biện pháp điều trị đặc biệt. b) Mô tả bài toán Đầu vào của bài toán là tập ảnh về bệnh ngoài da có thể thu nhận qua các thiết bị như: máy scanner ,camera, sensor, … mỗi ảnh được gắn nhãn tạo thành ảnh đầu vào. Tập dữ liệu này được đưa vào mạng CNN để huấn luyện phát hiện vùng bệnh ngoài da và trích xuất đặc trưng bệnh. Sau đó nhận dạng bệnh dựa trên việc trích xuất đặc trưng của hình ảnh thu được, với dữ liệu đã huấn luyện để phát hiện bệnh ngoài da và cho ra kết quả đó là bệnh gì. Đầu ra của bài toán là nhận dạng được bệnh ngoài da là bệnh gì. Một số bệnh ngoài da hay gặp [27]: 9 b.1 Nhọt Nhọt (Furuncle) là tình trạng viêm cấp tính gây hoại tử nang lông và tổ chức xung quanh. Bệnh thường gặp về mùa hè, nam nhiều hơn nữ. Mọi lứa tuổi đều có thể mắc bệnh, tuy nhiên, bệnh thường gặp hơn ở trẻ em. Nguyên nhân gây bệnh là tụ cầu vàng (Staphylococcus aereus). Bình thường,vi khuẩn này sống ký sinh trên da, nhất là các nang lông ở các nếp gấp như rãnh mũi má, rãnh liên mông…hoặc các hốc tự nhiên như lỗ mũi. Khi nang lông bị tổn thương kết hợp với những điều kiện thuận lợi như tình trạng miễn dịch kém, suy dinh dưỡng, mắc bệnh tiểu đường…vi khuẩn sẽ phát triển và gây bệnh. Thống kê cho thấy, có khoảng 80% số người trong độ tuổi từ 11 – 30 tuổi bị mụn nhọt. Tình trạng này tiếp tục phát triển trong đời sống của người trưởng thành, với khoảng 5% phụ nữ và 1% đàn ông trên 25 tuổi tiếp tục mắc bệnh lý về da này. b.2 Trứng Cá Trứng cá (acne) là bệnh da thông thường gây nên do tăng tiết chất bã và viêm của hệ thống nang lông tuyến bã. Bệnh biểu hiện bằng nhiều loại tổn thương khác nhau như mụn cám, sẩn, viêm, mụn mủ, mụn bọc, nang, ... khu trú ở vị trí tiết nhiều chất bã như mặt, lưng, ngực. Khoảng 80% trường hợp trứng cá gặp ở tuổi thanh thiếu niên, đặc biệt giai đoạn dậy thì. Trứng cá không ảnh hưởng nghiêm trọng đến tính mạng, tuy nhiên, do tồn tại dai dẳng, mụn, sẩn hay sẹo lồi, sẹo lõm ở vùng mặt ảnh hưởng tới thẩm mỹ và chất lượng cuộc sống người bệnh. Trứng cá là mối quan tâm của nhiều bạn trẻ hiện nay do nhiều nguyên nhân khác nhau, đặc biệt trong đó rối loạn nội tiết và trứng cá do dùng thuốc. Một số loại mụn trứng cá thông dụng như bệnh trứng cá do nghề nghiệp, trứng cá ở trẻ em, trứng cá thông thường, trứng cá đỏ, trứng cá mạch lươn, trứng cá sẹo lồi, trứng cá kê hoại tử, trứng cá do thuốc. b.3 Bệnh vẩy nến Bệnh vẩy nến chiếm 5% dân số Châu Âu, 2% dân số Châu Á và Châu Phi, xấp xỉ 10% tổng số các bệnh nhân đến khám ở các phòng khám Da liễu. Bệnh lành tính, thường không ảnh hưởng đến sức khỏe nhưng ảnh hưởng đến thẩm mỹ, tâm lý và những hệ lụy của nó, nam gặp nhiều hơn nữ, người lớn nhiều hơn trẻ em. Bệnh phát thành từng đợt, có khi tăng giảm theo mùa. Bệnh vẩy nến là một căn bệnh ngoài da mãn tính, có xu hướng ngày càng trầm trọng thêm. Dạng bệnh vẩy nến thường xuyên xảy ra là gây nên các mảng da có màu xám hoặc hồng khác nhau với lớp vảy bạc phủ lên. Các mảng này có thể gây nên 10 chứng sắc tố trên da. Các triệu chứng đầu tiên có thể xuất hiện ở bât cứ độ tuổi nào, tuy nhiên, chúng có xu hướng xuất hiện ở giai đoạn đầu của tuổi trưởng thành, hoặc lúc lớn tuổi khoảng 50- 60 tuổi. Nguyên nhân gây ra căn bệnh vẩy nến là không rõ ràng, mặc dù có nguyên nhân đã được chấp nhận là do một thành phần di truyền cơ bản nào đó, khi được kích hoạt sẽ làm cho hệ thống miễn dịch sản xuất một số lượng quá nhiều tế bào da. Như vậy hiện tượng này được gọi là một rối loạn da tự miễn dịch. Hiện nay chưa có cách chữa khỏi hoàn toàn căn bệnh này mà không tái phát bệnh. Một số loại bệnh vẩy nến thường gặp: Bệnh vẩy nến thể mảng bám, bệnh vẩy nến thể tròn, bệnh vẩy nến thể mụn mủ, bệnh vẩy nến thể đốm, bệnh vẩy nến bàn tay, bàn chân, bệnh vẩy nến móng, viêm khớp vảy nến, bệnh vẩy nến da tiết bã, bệnh vẩy nến toàn thân. b.4 Ung thư tế bào đáy Ung thư tế bào đáy (Basal cell carcinoma - BCC): là loại u ác tính gồm những tế bào giống với tế bào ở lớp đáy của thượng bì. Nguồn gốc thực sự của ung thư tế bào đáy còn chưa rõ ràng. Đây là loại ung thư da hay gặp nhất, chiếm khoảng 75% các loại ung thư da, bệnh thường gặp ở người trên 50 tuổi. Nhiều nghiên cứu đã xác định tia cực tím là nguyên nhân chủ yếu gây ung thư da, nhất là ung thư biểu mô tế bào đáy. Những người làm việc ngoài trời có tỉ lệ mắc ung thư biểu mô tế bào đáy rất cao, khoảng 80% các thương tổn ung thư biểu mô tế bào đáy ở vùng da hở. Trong phổ của ánh sáng mặt trời thì các tia cực tím (UV: Ultra Violet) bao gồm các chùm tia UVC, UVB, UVA được coi tác tác nhân chủ yếu gây ung thư biểu mô tế bào đáy. Tế bào cơ sở ung thư thường phát triển trên các phần tiếp xúc với ánh nắng của cơ thể, đặc biệt là đầu và cổ, một số lượng nhỏ hơn nhiều xảy ra trên thân và chân. Tuy nhiên, ung thư tế bào đáy cũng có thể xảy ra trên các bộ phận của cơ thể mà ít khi tiếp xúc ánh sáng ban ngày. b.5 Ung thư tế bào vảy Ung thư tế bào vảy (squamous cell carcinoma-SCC) là ung thư khởi phát từ tế bào sừng của da và niêm mạc, chiếm khoảng 20% các ung thư da và đứng hàng thứ hai sau ung thư tế bào đáy. Ung thư tế bào vảy có thể xâm lấn và di căn xa, tại bệnh viện da liễu Trung ương, số người bị ung thư tế bào vảy đến khám và điều trị ngày càng tăng. Phần lớn người bệnh đến khám muộn, khi tổn thương lan rộng hoặc đã di căn. Ung thư biểu mô tế bào vảy thường xuất hiện trên các tổn thương da mãn tính như dày sừng ánh sáng (actinic keratosis), bạch sản (leucoplasia), các sẹo bỏng, viêm da 11 do quang tuyến, nhiễm HPV,… Sau một thời gian tiến triển kéo dài, trên thương tổn da mãn tính xuất hiện sùi hoặc mảng cứng nổi cao, chắc, màu hồng đến màu đỏ, loét, dễ chảy máu, đóng vảy tiết nâu đen. b.6 Ung thư tế bào hắc tố Ung thư tế bào hắc tố (malignant melanoma) chiếm khoảng 5% các ung thư da và khoảng 1% các loại ung thư, theo nhiều nghiên cứu thì số lượng bệnh nhân ung thư tế bào hắc tố những năm gần đây, tốc độ tăng của bệnh vẫn duy trì ở mức độ cao trên toàn thế giới, đặc biệt ở châu Úc, bắc Mỹ, và các nước bắc Âu. Ở Mỹ năm 2006 có 111.900 trường hợp ung thư tế bào hắc tố được phát hiện, bệnh gặp ở mọi chủng tộc trong đó người da trắng mắc bệnh nhiều nhất. Ung thư tế bào hắc tố thường gặp ở người nhiều tuổi và hiếm gặp ở trẻ em, tỉ lệ mắc bệnh ở cả hai giới là tương đương nhau. Phần lớn các u hắc tố có màu đen hoặc nâu, nhưng cũng có thể là màu da, hồng, đỏ, tím, xanh hoặc trắng. Ung thư hắc tố chủ yếu do sự tiếp xúc cường độ cao với tia cực tím, đặc biệt là ở những người dễ mang gen bệnh. Ung thư hắc tố mỗi năm giết chết khoảng 10.130 người tại Mỹ. Nếu ung thư hắc tố được phát hiện sớm, bệnh có thể chữa trị. Ngược lại, nếu bệnh đã tiến triển tới giai đoạn muộn và di căn sang các phần khác của cơ thể, việc điều trị rất khó và tỉ lệ tử vong cao. Dù bệnh này không phải là dạng phổ biến nhất trong các dạng ung thư da nhưng nó gây ra hầu hết các trường hợp tử vong. Trong năm 2016, ước tính có khoảng 76.380 trường hợp có khối u ác tính xâm lấn, với khoảng 46.870 ca bệnh ở nam giới và 29.510 ca bệnh ở nữ giới. b.7 Bệnh bạch biến Bạch biến (Vilitigo) là một loại bệnh do một số tế bào sắc tố trong da bị hư khiến làn da mất đi sắc tố melamin do đó làm da biến thành màu trắng hoặc nổi đốm trắng và có khi ảnh hưởng tới những vùng như lông, tóc. Bệnh bạch biến có thể khởi phát ở bất kỳ tuổi nào, nhưng thường gặp ở người trẻ nam chiếm 32,5% và nữ là 67,5%. Một số trường hợp bệnh có tính chất gia đình, bệnh ảnh hưởng nhiều đến tâm sinh lý và thẩm mỹ của người bệnh. Nguyên nhân có thể do di truyền hoặc phát sinh trong quá trình phát triển đột biến ở gen DR4, B13, B35 của HLA. Ảnh hưởng của một bệnh tự miễn, cơ chế bệnh sinh hình thành các tự kháng thể chống lại kháng nguyên của tế bào sắc tố, gây độc cho tế bào, hoặc làm giảm sản xuất sắc tố melanin. Khoảng 20-30% người bệnh bạch biến có tự kháng thể chống tuyến giáp, tuyến thượng thận. Một số người bệnh bạch biến phát sinh bệnh là do hoá chất phá huỷ hoặc ức chế hoạt động của tế bào sắc tố
- Xem thêm -

Tài liệu liên quan