BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC QUY NHƠN
NGUYỄN NGỌC HUẤN
ỨNG DỤNG HỌC MÁY TRONG VIỆC
CHẨN ĐOÁN BỆNH NÁM MÁ THÔNG QUA
DỮ LIỆU HÌNH ẢNH
LUẬN VĂN THẠC SĨ KHOA HỌC DỮ LIỆU ỨNG DỤNG
Bình Định - Năm 2022
BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC QUY NHƠN
NGUYỄN NGỌC HUẤN
ỨNG DỤNG HỌC MÁY TRONG VIỆC
CHẨN ĐOÁN BỆNH NÁM MÁ THÔNG QUA
DỮ LIỆU HÌNH ẢNH
Ngành: Khoa học dữ liệu ứng dụng
Mã số: 8904648
Người hướng dẫn: TS. Hồ Văn Lâm
LỜI CAM ĐOAN
Tôi xin cam đoan đây là công trình nghiên cứu và thực hiện luận văn
thực sự của riêng tôi, dưới sự hướng dẫn của TS. Hồ Văn Lâm. Mọi tham khảo
từ các tài liệu, công trình nghiên cứu liên quan trong nước và quốc tế đều được
trích dẫn rõ ràng trong luận văn. Mọi sao chép không hợp lệ, vi phạm quy chế
hay gian trá tôi xin hoàn toàn chịu trách nhiệm và chịu mọi kỷ luật của trường
Đại học Quy Nhơn.
Bình Định, ngày tháng
năm 2022
Học viên
Nguyễn Ngọc Huấn
LỜI CẢM ƠN
Trong quá trình thực hiện và hoàn thiện luận văn này, tôi xin gửi lời cảm
ơn chân thành nhất đến các thầy cô trong Khoa Công nghệ thông tin, khoa Toán
và Thống kê trường Đại học Quy Nhơn cũng như các thầy thính giảng ở các
trường, các viện ở Hà Nội và thành phố Hồ Chí Minh đã cung cấp cho tôi những
kiến thức quý báu trong suốt 2 năm học qua. Đặc biệt cho tôi gửi lời cảm ơn
sâu sắc nhất tới TS. Hồ Văn Lâm đã dành nhiều thời gian vô cùng quý báu để
định hướng và tận tình hướng dẫn tôi cũng như tạo mọi điều kiện thuận lợi để
tôi có thể hoàn thành tốt nhất luận văn của mình.
Tôi xin chân thành cảm ơn!
HỌC VIÊN THỰC HIỆN
Nguyễn Ngọc Huấn
DANH MỤC TỪ VIẾT TẮT
AI
: Artifical Intelligence (Trí thông minh nhân tạo)
CĐHA
: Chẩn đoán hình ảnh
ĐTNC
: Đối tượng nghiên cứu
HGĐ
: Hộ gia đình
PN
: Phụ nữ
MỤC LỤC
LỜI CAM ĐOAN
LỜI CẢM ƠN
DANH MỤC TỪ VIẾT TẮT
DANH MỤC BẢNG, BIỂU
DANH MỤC CÁC BIỂU ĐỒ
DANH MỤC CÁC HÌNH ẢNH
MỞ ĐẦU ....................................................................................................... 1
1. Lý do chọn đề tài ..................................................................................... 1
2. Tính cấp thiết của đề tài .......................................................................... 2
3. Đối tượng và phạm vi nghiên cứu........................................................... 3
4. Bố cục luận văn ....................................................................................... 4
CHƯƠNG I: TỔNG QUAN......................................................................... 5
1.1 Khái quát khả năng sử dụng dữ liệu cho bài toán chẩn đoán bệnh....... 5
1.1.1 Cơ sở thực hiện ............................................................................. 5
1.1.2 Nguồn dữ liệu hình ảnh hỗ trợ chẩn đoán bệnh Nám má ............ 5
1.1.3 Công nghệ hỗ trợ CĐHA y tế và vai trò của AI............................ 6
1.2 Tổng quan về học máy và trí tuệ nhân tạo ............................................ 8
1.2.1 Tổng quan về học máy .................................................................. 8
1.2.2 Các ứng dụng của học máy........................................................... 9
1.2.3 Tổng quan ứng dụng trí tuệ nhân tạo trong y khoa ........................ 10
1.3 Thuật toán rút trích đặt trưng và nhận dạng đối tượng trong hình ảnh ............ 15
1.3.1 Khái quát về trích chọn đặc trưng ảnh và tìm kiếm theo đặc trưng ảnh.... 15
1.3.2 Đặc trưng nội dung ảnh và tìm kiếm theo đặc trưng nội dung. ......... 17
1.3.3 Các phương pháp trích chọn đặc trưng và độ đo tương đồng giữa
các ảnh
..................................................................................................... 21
1.4 Một số ứng dụng điển hình sử dụng dữ liệu hình ảnh trong chẩn đoán
bệnh
........................................................................................................... 28
1.4.1 Công nghệ trí tuệ nhân tạo trong y tế ......................................... 28
1.4.2 Những thành tựu bước đầu tại Việt Nam .................................... 29
1.4.3 Ứng dụng “AI Trợ lý bác sĩ trong chẩn đoán hình ảnh”. ... Error!
Bookmark not defined.
1.4.4 Ứng dụng của trí tuệ nhân tạo trong chẩn đoán hình ảnh ung thư
tuyến tụy
..................................................................................................... 31
1.5 Tổng quan về bệnh nám má .............................................................. 32
1.5.1 Định nghĩa .................................................................................. 32
1.5.2 Dịch tễ học .................................................................................. 33
CHƯƠNG II: BÀI TOÁN CHẨN ĐOÁN BỆNH NÁM MÁ BẰNG HÌNH
ẢNH ............................................................................................................ 34
2.1 Phát biểu bài toán .............................................................................. 34
2.1.1 Dữ liệu đầu vào........................................................................... 34
2.1.2 Kết quả đầu ra ............................................................................ 36
2.2 Sử dụng yolo rút trích đặc trưng và nhận dạng hình ảnh.................. 38
2.2.1 Giới thiệu chung YOLO .............................................................. 38
2.2.2 Mạng YOLO là gì? ...................................................................... 38
2.2.3 Quá trình phát triển của YOLO .................................................. 39
2.2.4 Kiến trúc mạng YOLO ................................................................ 41
2.2.5 Đầu ra của YOLO ....................................................................... 44
2.2.6 Dự báo trên nhiều feature map ................................................... 46
CHƯƠNG III: XÂY DỰNG MÔ HÌNH HỌC MÁY VÀ CÀI ĐẶT THỬ
NGHIỆM .................................................................................................... 48
3.1 Mô tả dữ liệu hình ảnh ...................................................................... 48
3.2 Xây dựng dữ liệu đầu vào ................................................................. 49
3.2.1 Huấn luyện mô hình .................................................................... 49
3.2.2 Gán nhãn dữ liệu ........................................................................ 50
3.3 Xây dựng mô hình. ........................................................................... 51
3.3.1 Tìm hiểu về YOLO v5 .................................................................. 51
3.3.2 Tổ chức thư mục.......................................................................... 52
3.3.3 Chọn mô hình .............................................................................. 53
3.3.4 Xây dựng mô hình YOLOv5 trên môi trường Colab................... 53
3.4 Đánh giá mô hình .............................................................................. 57
3.4.1 Một thông số cho mô hình phát hiện đối tượng .......................... 57
3.5 Thực nghiệm ..................................................................................... 61
3.6 Sử dụng mô hình dự đoán một bức ảnh bất kỳ ................................. 62
KẾT LUẬN VÀ KIẾN NGHỊ .................................................................... 64
TÀI LIỆU THAM KHẢO
QUYẾT ĐỊNH GIAO ĐỀ TÀI LUẬN VĂN THẠC SĨ (BẢN SAO)
DANH MỤC BẢNG
Bảng 1.1 Một số phương pháp lựa chọn đặc trưng ......................................... 26
Bảng 2.1 Các layer trong mạng darknet-53. ................................................... 43
DANH MỤC CÁC BIỂU ĐỒ
Biểu đồ 2.1 So sánh một số thuật toán phiên bản YOLO ............................... 40
Biểu đồ 3.1 Tương quan giữa các tọa độ ........................................................ 56
Biểu đồ 3.2 Phân bố x,y, height, width ........................................................... 57
Biểu đồ 3.3 Đánh giá Precision ....................................................................... 59
Biểu đồ 3.4 Đánh giá khả năng tìm kiếm toàn bộ các nhãn của mô hình....... 59
Biểu đồ 3.5 Đánh giá độ tin cậy của mô hình ................................................. 60
Biểu đồ 3.6 Các thông số đánh giá mô hình ................................................... 60
DANH MỤC CÁC HÌNH
Hình 1.1 AI hỗ trợ các bác sĩ đọc hình ảnh y khoa. .......................................... 6
Hình 1.2 Artifical Intelligence ........................................................................ 10
Hình 1.3 Ví dụ hiển thị một ảnh...................................................................... 16
Hình 1.4 Ví dụ truy vấn của Google ............................................................... 17
Hình 1.5 Ví dụ truy vấn của Google ............................................................... 17
Hình 1.6 Ví dụ về một số lọai kết cấu............................................................. 18
Hình 1.7 Một kết quả trả về của Google Image Swirl .................................... 19
Hình 1.8 Một kết quả trả về của Tiltomo ........................................................ 20
Hình 1.9 Một kết quả trả về của Byo Image Search ....................................... 20
Hình 1.10 Hình ảnh X-quang đầu tiên. ........................................................... 28
Hình 1.11 VinDr hỗ trợ chẩn đoán ảnh X-quang cột sống với độ chính xác lên
tới 90% ............................................................................................................ 30
Hình 1.12 Ứng dụng AI trong mô phỏng và chuẩn đoán hình ảnh trong điều trị
bệnh. ................................................................ Error! Bookmark not defined.
Hình 1.13 Đại diện lãnh đạo VinBrain, Vinmec và Bệnh viện Phổi TƯ trao bản
ghi nhớ hợp tác và triển khai ứng dụng “AI Trợ lý bác sĩ trong chẩn đoán hình
ảnh”. ................................................................ Error! Bookmark not defined.
Hình 1.14 Đánh giá tuyến tụy thường gặp khó khăn do tụy nằm sau phúc mạc
và dạ dày.......................................................................................................... 32
Hình 2.1 vị trí gán nhãn các thể nám má ........................................................ 35
Hình 2.2 Một số hình ảnh về gán nhãn ........................................................... 35
Hình 2.3 Tên và tọa độ của nhãn ................................................................... 36
Hình 2.4 Ảnh minh họa các thách thức của bài toán Phát hiện đối tượng...... 37
Hình 2.5 Kiến trức một đầu ra của mô hình YOLO. ...................................... 45
Hình 2.6 Các feature maps của mạng YOLOv3 ............................................. 46
Hình 3.1 Một số dữ liệu hình ảnh bệnh nhân .................................................. 48
Hình 3.2 Gán nhãn dữ liệu .............................................................................. 50
Hình 3.3 Nội dung trong một file annotation .................................................. 51
Hình 3.6 Kiến trúc của các mô hình YOLOv5 ............................................... 52
Hình 3.7 Tổ chức dữ liệu ................................................................................ 53
Hình 3.8 Kiến trúc của các mô hình YOLOv5 ............................................... 53
Hình 3.9 Kết quả xây dựng mô hình ............................................................... 56
Hình 3.10 Tập dữ liệu val label ....................................................................... 62
Hình 3.11 Tập dữ liệu val predict ................................................................... 62
Hình 3.12 Kết quả nhận diện của mô hình...................................................... 63
1
0 MỞ ĐẦU
1. LÝ DO CHỌN ĐỀ TÀI
Dữ liệu lớn (Big Data) và công nghệ trí tuệ nhân tạo (AI) đang tạo ra
những đột phá rộng khắp trên mọi lĩnh vực. Ứng dụng AI và khai thác dữ liệu
y tế trong hỗ trợ chẩn đoán bệnh và xây dựng nền y tế thông minh đã trở thành
vấn đề cốt lõi trong lộ trình phát triển y tế của mọi quốc gia, trong đó có Việt
Nam.
Hình ảnh y khoa được tạo ra từ các kỹ thuật tạo ảnh bên trong cơ thể
người (bao gồm cả các mô sinh học), nhằm hỗ trợ phân tích lâm sàng hoặc can
thiệp y tế. Hiểu một cách đơn giản, hình ảnh y khoa là các hình ảnh sinh học
được tạo ra với sự hỗ trợ của các công nghệ hình ảnh như X-quang, cắt lớp vi
tính (CT), cộng hưởng từ (MRI), siêu âm (Ultrasound), nội soi (Endoscopy),
ảnh nhiệt (Thermography) trên tia UV, hay các hình ảnh y học hạt nhân như
chụp cắt lớp phát xạ positron (PET) và chụp cắt lớp vi tính phát xạ photon đơn
(SPECT).
Trong lĩnh vực Y khoa ở Việt Nam, hiện nay các tuyến y tế phường, xã,
vùng sâu, vùng xa còn thiếu nhân lực y tế có trình độ chuyên môn và thiếu các
trang thiết bị cần thiết trong chẩn đoán bệnh. Vì vậy xây dựng hệ hỗ trợ trong
chẩn đoán rất cần thiết cho ngành y tết hiện nay ở Việt Nam. Hệ hỗ trợ sẽ kết
hợp với cán bộ y tế giúp chẩn đoán sớm một số bệnh phát hiện sớm được những
bệnh nguy hiểm và giảm gánh nặng kinh tế cho gia đình bệnh nhân và cho xã
hội. Để chứng minh cho những lợi ích mà hệ hỗ trợ chẩn đoán mang lại, đề tài
chọn dữ liệu bệnh Nám má để thử nghiệm và đánh giá
Học máy hay máy học là một lĩnh vực trong ngành Trí tuệ nhân tạo, là
kỹ thuật giúp cho máy tính có thể tự học mà không cần phải cài đặt các luật
quyết định. Thường một chương trình máy tính cần các quy tắc, luật lệ để có
thể thực thi được một tác vụ nào đó nhưng với học máy, các máy tính có thể tự
2
động thực thi tác vụ khi nhận dữ liệu đầu vào, hay nói cách khác máy tính có
được cảm quan và suy nghĩ được như con người cũng có một cách tiếp cận
khác về học máy là phương pháp vẽ các đường thể hiện mối quan hệ của tập
dữ liệu. Từ các kiến thức chuyên gia của Bác sỹ, các nghiên cứu về bệnh Nám
má từ hình ảnh thu thập từ người bệnh điều trị tại bệnh viện, chúng tôi sử dụng
một số mô hình phân tích hình ảnh để chỉ ra các đặc trưng trong dữ liệu hình
ảnh về bệnh Nám má.
Nám má (Melasma) là bệnh da tăng sắc tố mắc phải, có căn nguyên và
cơ chế bệnh sinh rất phức tạp. Thương tổn cơ bản của bệnh là các dát hoặc các
mảng màu nâu đen, đối xứng, ở vùng tiếp xúc với ánh sáng mặt trời. Vị trí
thường gặp là 2 má, môi trên, cằm và trán. Bệnh tuy lành tính nhưng ảnh hưởng
nhiều đến tâm lý và thẩm mỹ của người bệnh.
Chị em phụ nữ hiểu biết rất ít về nám má, về các tổn thương liên quan
đến nám má. Hiện nay với thiết bị di động thông minh, các chị em phụ nữ có
thể thông qua mô hình học máy để hổ trợ chẩn đoán bệnh nám má. Vì vậy, em
thực hiện nghiên cứu: “Ứng dụng học máy trong việc chẩn đoán bệnh nám má
thông qua dữ liệu hình ảnh”
2. TÍNH CẤP THIẾT CỦA ĐỀ TÀI
Đặc điểm địa lý
Khu vực Nam Trung bộ và Tây nguyên là khu vực thời gian nắng nhiều
và cường độ bức xạ mặt trời cao nhất cả nước dễ làm tăng tỷ lệ nám má ở phụ nữ.
Thiếu thông tin và thiếu hiểu biết về chăm sóc bảo vệ da, quan điểm
trắng là đẹp
Điều kiện kinh tế của phụ nữ Miền Trung - Tây Nguyên còn nhiều khó
khăn; việc tin dùng các sản phẩm tẩy trắng da không an toàn quảng cáo tràn lan
để lại hậu quả nặng nề làm tăng thêm gánh nặng chi phí điều trị cho người bệnh…
Thực tế cho thấy số lượng bác sĩ chuyên khoa da liễu Thẩm mỹ của miền
Trung- Tây nguyên còn rất ít, đặc biệt ở các tuyến Y tế cơ sở cộng với thói quen
3
tin theo những điều trị không đúng chuyên môn làm xuất hiện nguy cơ chẩn
đoán nhầm Nám má với các rối loạn tăng sắc tố khác, nguy cơ kéo dài thời gian
bị bệnh, nguy cơ tai biến do điều trị sai, nguy cơ tốn kém do các điều trị quảng
cáo không đúng chuyên môn.
Dễ chẩn đoán nhầm
Nám má dễ chẩn đoán nhầm với các rối loạn tăng sắc tố vùng mặt khác
như Bớt sắc tố Hori, Xạm da Riehl, Tàn nhang, Dày sừng ánh sáng, Tăng sắc
tố sau viêm... Chẩn đoán sai có thể dẫn đến quyết định điều trị sai. Lỗi chẩn
đoán là một mối đe dọa nghiêm trọng đối với chất lượng và an toàn trong chăm
sóc sức khỏe.
Lợi ích của AI
Ứng dụng Trí tuệ nhân tạo dự đoán nguy cơ giúp phụ nữ dự đoán được
nguy cơ mắc bệnh của bản thân đồng thời có thể khuyến cáo các biện pháp dự
phòng nguy cơ mắc bệnh nám má. Sau khi xác định được các yếu tố nguy cơ
của người tham gia khảo sát có được sự tiếp cận nhanh chóng hơn với các
phương pháp điều trị đúng chuyên khoa. Đồng thời ứng dụng Trí tuệ nhân tạo
hỗ trợ chẩn đoán sớm nám má dựa trên ảnh chụp vùng mặt, cổ của người bệnh
sẽ giúp hỗ trợ chẩn đoán sớm, tiết kiệm chi phí cho người bệnh và hỗ trợ tư vấn
điều trị chuyên khoa tránh các tai biến không đáng có.
3.
ĐỐI TƯỢNG VÀ PHẠM VI NGHIÊN CỨU
- Dữ liệu hình ảnh bệnh nhân nám má.
- Mô hình học máy cho bài toán chẩn đoán bệnh nám má
Phương pháp nghiên cứu
a) Phương pháp nghiên cứu lý luận: Thu thập, đọc hiểu, phân tích
thông tin, dữ liệu từ các giáo trình, sách, các bài báo liên quan đến thuật toán
rút trích đặc trưng và nhận dạng đối tượng trong hình ảnh.
b) Phương pháp nghiên cứu thực tiễn:
- Nghiên cứu lý thuyết: Đọc tài liệu, các bài báo, để tìm hiểu kế thừa, tổng
4
hợp những nghiên cứu của các tác giả đi trước trong lĩnh vực nghiên cứu.
- Nghiên cứu độc lập, tăng cường trao đổi khoa học với các nhóm nghiên
cứu quan tâm cùng vấn đề.
- Thực nghiệm trên dữ liệu hình ảnh
4. BỐ CỤC LUẬN VĂN
Luận văn này được chia thành ba chương như sau:
Chương 1. Tổng quan
Giới thiệu tổng quan về khả năng sử dụng dữ liệu cho bài toán chẩn đoán
bệnh, sử dụng học máy, bài toán rút trích và nhận dạng hình ảnh, một số ứng
dụng nhận dạng hình ảnh trong Y khoa.
Chương 2. Bài toán chẩn đoán bệnh nám má bằng hình ảnh
Trong chương này, luận văn tìm hiểu nội dung các yêu cầu, dữ liệu đầu
vào và kết quả đầu ra của bài toán chẩn đoán bệnh nám má thông qua dữ liệu
hình ảnh. Tìm hiểu thuật toán rút trích đặc trưng và nhận dạng hình ảnh trong
mô hình học máy để giải quyết bài toán chẩn đoán các thể bệnh nám má trên
dữ liệu hình ảnh bệnh nhân.
Chương 3. Xây dựng Mô hình học máy và Cài đặt thử nghiệm
Trình bày ý tưởng, phương pháp và kỹ thuật ứng dụng học máy vào việc
chẩn đoán bệnh nám má bằng hình ảnh, phân tích, đánh giá kết quả đạt được
so với phương pháp truyền thống vẫn đang được sử dụng phổ biến. Cài đặt thử
nghiệm chương trình trên hệ thống thực và đánh giá kết quả đạt được.
5
1
CHƯƠNG I: TỔNG QUAN
1.1 KHÁI QUÁT KHẢ NĂNG SỬ DỤNG DỮ LIỆU CHO BÀI TOÁN
CHẨN ĐOÁN BỆNH
1.1.1 Cơ sở thực hiện
Bệnh viện Phong- Da liễu TW Quy Hòa là cơ sở chuyên khoa Da liễu
hàng đầu khu vực miền Trung- Tây nguyên. Những năm gần đây, tỷ lệ phụ nữ
bị Nám má đến khám và điều trị tại Bệnh viện Phong- Da liễu Trung ương Quy
Hòa ngày càng gia tăng. Đa số trong đó là những trường hợp Nám má đến muộn
và mắc nhiều biến chứng do bệnh nhân tự điều trị bằng các phương pháp không
an toàn và chăm sóc da không phù hợp. Mỗi năm, Bệnh viện Phong- Da liễu
TW Quy Hòa khám, tư vấn và điều trị cho hơn 25.000 lượt bệnh nhân bị các
rối loạn sắc tố da thẩm mỹ như Nám má, tàn nhang, dày sừng ánh sáng, dày
sừng da dầu, tăng sắc tố sau viêm, bớt tăng sắc tố, sạm da Riehl…
Một trong những nguyên nhân gây nên tình trạng Nám má nặng, kháng
trị làm gia tăng chi phí điều trị và hạn chế hiệu quả điều trị là do người bệnh
thiếu thông tin hỗ trợ chẩn đoán và điều trị kịp thời, an toàn, phù hợp. Chính vì
vậy, cần phải có những phần mềm hỗ trợ chẩn đoán bệnh từ xa, tư vấn điều trị
an toàn, phù hợp để tiết kiệm chi phí, thời gian, tăng cường kiến thức dự phòng,
tăng cường hiệu quả điều trị, phòng tránh tai biến cho người bệnh Nám má.
1.1.2 Nguồn dữ liệu hình ảnh hỗ trợ chẩn đoán bệnh Nám má
Bệnh viện Phong- Da liễu TW Quy Hòa là cơ sở chuyên khoa Da liễu
hàng đầu khu vực miền Trung- Tây nguyên, đã có nguồn tư liệu lớn ảnh chụp
bệnh nhân rối loạn tăng sắc tố da vùng mặt bằng máy ảnh kỹ thuật số từ năm
2009 đến nay cùng với bộ dữ liệu nghiên cứu dự đoán khả năng bị bệnh Nám
má đây là một trong những thuận lợi lớn để tiếp cận đến công nghệ hỗ trợ trong
việc dự đoán, chẩn đoán cũng như tư vấn điều trị bệnh Nám má tại Bệnh Viện.
6
1.1.3 Công nghệ hỗ trợ CĐHA y tế và vai trò của AI
Trong y khoa, các hệ thống hỗ trợ phát hiện (computer-aided detection CADe) và hỗ trợ chẩn đoán (computer-aided diagnosis - CADx) được thiết kế
để giúp bác sĩ đưa ra quyết định nhanh và chính xác hơn [13], [19]. Cụ thể, các
hệ thống này cho phép phân tích và đánh giá các bất thường từ dữ liệu y khoa
trong thời gian ngắn. Chúng có thể giúp cải thiện chất lượng hình ảnh y khoa,
làm nổi bật các cấu trúc bất thường bên trong cơ thể và thực hiện đo đạc các
chỉ số lâm sàng [13]. Các hệ thống CADe/x được xây dựng dựa trên các công
nghệ lõi gồm xử lý hình ảnh, thị giác máy tính, và đặc biệt là AI.
Hình 1.1 AI hỗ trợ các bác sĩ đọc hình ảnh y khoa.
Trong 5 năm trở lại đây, sự bùng nổ của dữ liệu lớn và năng lực tính toán
đã giúp cho các mô hình AI đạt được những bước tiến vượt bậc. Các đột phá
trong nghiên cứu cơ bản và nghiên cứu ứng dụng về AI trong y tế liên tiếp được
công bố và đưa vào triển khai thực tế. Nói một cách vắn tắt, các mô hình AI có
thể tham gia hỗ trợ bác sĩ trong toàn bộ quy trình khám chữa bệnh lâm sàng
dựa trên hình ảnh y tế. AI cho phép tạo ra các hình ảnh y khoa nhanh hơn, chất
7
lượng hơn với giá thành rẻ hơn. Việc phân tích, chẩn đoán bệnh và tự động xuất
báo cáo… cũng đều có thể đảm nhiệm bởi các thuật toán AI. Trong các tác vụ
trên, AI được đã được ứng dụng rộng rãi nhất nhằm phục vụ chẩn đoán bệnh
dựa trên hình ảnh [9], [4].
Năng lực của một hệ thống AI trong CĐHA y tế có thể chia làm 3 mức độ:
(1) Detection: phát hiện các bất thường tiềm tàng từ hình ảnh, phân loại
giữa các hình ảnh bệnh nhân mắc bệnh và bệnh nhân không mắc bệnh. Chức
năng này của AI giúp giải quyết các bài toán sàng lọc diện rộng hoặc tối ưu
việc phân luồng bệnh nhân theo tính ưu tiên.
(2) Characterization: đặc tả các tính chất của tổn thương, tiến hành
khoanh vùng, phân loại mức độ nguy hiểm theo các tiêu chuẩn y khoa. Ví dụ
phân loại mức độ ung thư hoá của một tổn thương.
(3) Monitoring: giám sát và đánh giá sự tiến triển của các tổn thương trên
hình ảnh. Theo dõi và đánh giá theo thời gian thực các tình huống khẩn cấp
nguy hiểm tới tính mạng của người bệnh.
Sự thiếu hụt nguồn lực y tế so với nhu cầu là một thực tế trên toàn thế
giới hiện nay. Theo thống kê, tại Nhật Bản chỉ có 36 bác sĩ CĐHA/triệu dân.
Cả Liberia chỉ có 2 bác sĩ CĐHA và 14 quốc gia tại châu Phi không có bác sĩ
CĐHA. Ngay cả đối với những quốc gia phát triển nhất, sự thiếu hụt nguồn
nhân lực cũng là một vấn đề nhức nhối. Tại Anh, ước tính có hơn 300.000 hình
ảnh X-quang phải chờ đến hơn 30 ngày trước khi được phân tích tại một thời
điểm bất kỳ trong năm. AI được coi là xu hướng tất yếu và là công cụ mạnh
nhất giúp bù đắp những thiếu hụt này. Một loạt các công cụ AI mới đã được
phát triển và ứng dụng trong phân tích và chẩn đoán nhiều phương thức hình
ảnh khác nhau như X-quang phổi, X-quang vú, CT/MRI sọ não. Tại Mỹ, một
số phần mềm AI đã được Cục quản lý Thực phẩm và Dược phẩm Hoa Kỳ
(FDA) cấp giấy phép hoạt động.
8
Qua tập dữ liệu hình ảnh và công nghệ AI hỗ trợ nhận diện đối tượng tổn
thương của bệnh nám má sẽ giúp chúng ta đưa ra một giải pháp cụ thể để giải
quyết bài toán hỗ trợ chẩn đoán bệnh nám má.
1.2 TỔNG QUAN VỀ HỌC MÁY VÀ TRÍ TUỆ NHÂN TẠO
1.2.1 Tổng quan về học máy
Khái niệm: Học máy (Machine Learning) là một ngành khoa học nghiên
cứu các thuật toán cho phép máy tính có thể học được các khái niệm (concept).
Học máy hay máy học là một lĩnh vực trong ngành Trí tuệ nhân tạo, là kỹ thuật
giúp cho máy tính có thể tự học mà không cần phải cài đặt các luật quyết định.
Thường một chương trình máy tính cần các quy tắc, luật lệ để có thể thực thi
được một tác vụ nào đó nhưng với học máy, các máy tính có thể tự động thực
thi tác vụ khi nhận dữ liệu đầu vào, hay nói cách khác máy tính có được cảm
quan và suy nghĩ được như con người cũng có một cách tiếp cận khác về học
máy là phương pháp vẽ các đường thể hiện mối quan hệ của tập dữ liệu.
Phân loại: Có hai loại phương pháp học máy chính
Phương pháp quy nạp: Máy học/phân biệt các khái niệm dựa trên dữ liệu
đã thu thập được trước đó. Phương pháp này cho phép tận dụng được nguồn dữ
liệu rất nhiều và sẵn có.
Phương pháp suy diễn: Máy học/phân biệt các khái niệm dựa vào các
luật. Phương pháp này cho phép tận dụng được các kiến thức chuyên ngành để
hỗ trợ máy tính.
Hiện nay, các thuật toán đều cố gắng tận dụng được ưu điểm của hai
phương pháp này.
Các ngành khoa học liên quan: Lý thuyết thống kê: các kết quả trong
xác suất thống kê là tiền đề cho rất nhiều phương pháp học máy. Đặc biệt, lý
thuyết thống kê cho phép ước lượng sai số của các phương pháp học máy.
9
Các phương pháp tính: các thuật toán học máy thường sử dụng các
tính toán số thực/số nguyên trên dữ liệu rất lớn. Trong đó, các bài toán như: tối
ưu có/không ràng buộc, giải phương trình tuyến tính v.v… được sử dụng rất
phổ biến.
Khoa học máy tính: là cơ sở để thiết kế các thuật toán, đồng thời đánh
giá thời gian chạy, bộ nhớ của các thuật toán học máy.
Các nhóm giải thuật học máy:
Học có giám sát: Máy tính được xem một số mẫu gồm đầu vào (input)
và đầu ra (output) tương ứng trước. Sau khi học xong các mẫu này, máy tính
quan sát một đầu vào mới và cho ra kết quả.
Học không giám sát: Máy tính chỉ được xem các mẫu không có đầu
ra, sau đó máy tính phải tự tìm cách phân loại các mẫu này và các mẫu mới.
Học nửa giám sát: Một dạng lai giữa hai nhóm giải thuật trên.
Học tăng cường: Máy tính đưa ra quyết định hành động (action) và
nhận kết quả phản hồi (response/reward) từ môi trường (environment). Sau đó
máy tính tìm cách chỉnh sửa cách ra quyết định hành động của mình.
1.2.2 Các ứng dụng của học máy
Ứng dụng: Học máy có ứng dụng rộng khắp trong các ngành khoa
học/sản xuất, đặc biệt những ngành cần phân tích khối lượng dữ liệu khổng lồ.
Một số ứng dụng thường thấy
Xử lý ngôn ngữ tự nhiên (Natural Language Processing): xử lý văn bản,
giao tiếp người – máy, …
Nhận dạng (Pattern Recognition): nhận dạng tiếng nói, chữ viết tay, vân
tay, thị giác máy (Computer Vision) …
Tìm kiếm (Search Engine)
Chẩn đoán trong y tế: phân tích ảnh X-quang, các hệ chuyên gia chẩn
đoán tự động.
- Xem thêm -