ĐẠI HỌC QUỐC GIA TP. HCM
TRƯỜNG ĐẠI HỌC BÁCH KHOA
--------------------
TRƯƠNG THANH NGHĨA
CÁC PHƯƠNG PHÁP HỌC MÁY TRONG
HIỂN THỊ TRỰC QUAN CƠ THỂ NGƯỜI
Ngành: Khoa Học Máy Tính
Mã số: 60480101
LUẬN VĂN THẠC SĨ
TP. HỒ CHÍ MINH, tháng 08 năm 2018
i
CÔNG TRÌNH ĐƯỢC HOÀN THÀNH TẠI TRƯỜNG ĐẠI HỌC BÁCH
KHOA – ĐHQG – HCM
Cán bộ hướng dẫn khoa học: TS. Lê Thành Sách ................................
..............................................................................................................
Cán bộ chấm nhận xét 1: PGS.TS. Trần Minh Triết ............................
..............................................................................................................
Cán bộ chấm nhận xét 2: TS. Nguyễn Hồ Mẫn Rạng ..........................
..............................................................................................................
Luận văn thạc sĩ được bảo vệ tại Trường Đại học Bách Khoa, ĐHQG
Tp. HCM ngày 18 tháng 07 năm 2018.
Thành phần Hội đồng đánh giá luận văn thạc sĩ gồm:
1. PGS.TS. Phạm Trần Vũ....................................................................
2. TS.Lê Hồng Trang ............................................................................
3. TS.Nguyễn Hồ Mẫn Rạng ................................................................
4. PGS.TS.Trần Minh Triết ..................................................................
5. TS.Trần Tuấn Anh ............................................................................
Xác nhận của Chủ tịch Hội đồng đánh giá LV và Trưởng Khoa quản lý
chuyên ngành sau khi luận văn đã được sửa chữa (nếu có).
CHỦ TỊCH HỘI ĐỒNG
TRƯỞNG KHOA KH&KTMT
ii
iii
LỜI CẢM ƠN
Trong suốt thời gian học chương trình cao học tại Đại học Bách Khoa thành phố
Hồ Chí Minh, đặc biệt là giai đoạn làm luận văn tốt nghiệp, tôi đã nhận được rất nhiều
sự quan tâm, động viên, giúp đỡ của gia đình, thầy cô, bạn bè.
Trước hết, tôi xin gửi lời cảm ơn sâu sắc đến gia đình mình, đặc biệt là ba mẹ
mình. Ba mẹ là người luôn bên tôi những lúc khó khăn nhất, ba mẹ vất vả rất nhiều để
tôi có được cuộc sống no đủ để học tập ở một trường đại học xa quê. Ba mẹ đã cho tôi
nguồn động lực mạnh để nỗ lực vươn lên học tập thật tốt.
Tiếp theo tôi xin gửi lời cảm ơn chân thành nhất đến thầy hướng dẫn của tôi,
Tiến sĩ Lê Thành Sách, là người đã định hướng và dìu dắt tôi từ những bước đầu tiên,
thầy luôn quan tâm, chỉ cho tôi cách nhìn và hướng giải quyết vấn đề một cách rõ ràng,
chính xác để tôi hoàn thành tốt luận văn.
Tôi cũng xin gửi lời cám ơn đến các thầy cô đã giảng dạy cho tôi trong suốt thời
gian cao học, những người đã trang bị cho tôi các kiến thức, kĩ năng quý báu và cần
thiết cho con đường phía trước của tôi.
Cuối cùng tôi xin cảm ơn trường Đại học Bách Khoa thành phố Hồ Chí Minh,
tất cả các thầy cô, các bạn sinh viên, đã tạo cho tôi một môi trường học tập thật tốt, thật
hào hứng, thật ý nghĩa.
Một lần nữa, tôi xin chân thành cảm ơn!
Trương Thanh Nghĩa
18/06/2018
iv
LỜI CAM ĐOAN
Luận văn của tôi có tham khảo các tài liệu, bài báo, trang web như được trình
bày ở mục tài liệu tham khảo và ở mỗi tham khảo tôi đều trích dẫn nguồn gốc. Tôi xin
cam đoan rằng ngoài những trích dẫn từ các tham khảo trên, toàn bộ nội dung trong báo
cáo là do tôi tự soạn thảo từ những kết quả nghiên cứu tôi và các kết quả của nhóm
nghiên cứu GVLab do thầy Lê Thành Sách hướng dẫn, không sao chép từ bất kì tài liệu
nào khác.
Tôi sẽ hoàn toàn chịu xử lí theo qui định nếu có bất cứ sai phạm nào so với lời
cam kết.
Trương Thanh Nghĩa
v
TÓM TẮT LUẬN VĂN
Trong thời đại số hóa ngày nay, công nghệ thông tin là một ngành cực kỳ quan
trọng và có tốc độ phát triển rất nhanh. Nó có mặt ở gần như hầu hết các lĩnh vực trong
cuộc sống của chúng ta, từng bước cải thiện đời sống của chúng ta ngày một tốt hơn.
Công nghệ thông tin đã thay đổi cách chúng ta tiếp cận, xử lý và lưu trữ thông tin. Một
trong những điều rất quan trọng để có thể xử lý thông tin đó là trực quan hóa thông tin.
Một trong các lĩnh vực có nhu cầu cao trong việc trực quan hóa thông tin đó là lĩnh vực
Y học trong việc chuẩn đoán thông qua hình ảnh chụp cắt lớp vi tính (Computer
Tomography – CT) và chụp cộng hưởng từ (Magnetic Resonance - MR).
Từ chuỗi hình ảnh từ thiết bị chụp (scanner device), bác sĩ có thể thực hiện việc
chuẩn đoán dấu hiệu bệnh lý cũng như tình trạng của bệnh nhân. Tuy nhiên, do chuỗi
hình ảnh là các hình ảnh hai chiều, phần nào sẽ gây khó khăn cho bác sĩ khi muốn nhìn
một cách chi tiết và toàn diện các cơ quan của cơ thể bệnh nhân, đặc biệt là sự tương
quan giữa các mô bình thường (khỏe mạnh) và các phần bị lây nhiễm (bệnh). Từ vấn
đề trên, việc trực quan hóa ảnh y khoa thành mô hình 3D đã trở thành thiết
yếu. Nhờ kỹ thuật trực quan khối (volume rendering), các bác sĩ có khả năng khám phá
dữ liệu của bệnh nhân một cách linh động và dễ dàng hơn. Cộng với việc sức mạnh xử
lý của máy tính ngày càng có nhiều tiến bộ, các công trình trước MeshBK [1] của sinh
viên trường Đại học Bách Khoa TP.HCM đã xây dựng một hệ thống hiển thị một cách
trực quan, giúp bác sĩ có thể xem được lát cắt ở bất kỳ góc độ nào. Đồng thời, hệ thống
còn có thể hiển thị các cơ quan dưới dạng 3D. Cộng với việc áp dụng các phương pháp
phân đoạn ảnh y khoa (image segmentation) bằng các hàm biến đổi (transfer function
[2]) và biểu diễn hệ thống các cơ quan theo cấu trúc cây, MeshBK đã cung cấp một bộ
công cụ khá hiệu quả để giúp bác sĩ xem xét các cơ quan một cách trực quan và thực tế.
Tuy nhiên, hệ thống MeshBK xây dựng đòi hỏi người bác sĩ phải phân đoạn ảnh
một cách thủ công (sử dụng phương pháp Histogram 1D, Histogram 2D, Space
selection) hoặc bán thủ công (sử dụng phương pháp Region growing). Do đó, mục tiêu
của đề tài này là xây dựng một hệ thống có thể tự động phân đoạn các cơ quan trong cơ
thể hoặc các bất thường (khối u) trên tập ảnh y khoa đầu vào bằng các kỹ thuật học máy.
vi
Từ đó, hệ thống có thể phân đoạn các cơ quan trong cơ thể người một cách tự động,
giảm thiểu sự can thiệp của bác sĩ nhằm giúp đẩy nhanh quá trình xem xét và chuẩn
đoán tình hình của bệnh nhân.
vii
ABSTRACT
In our modern life nowaday, technology is a very important thing and fast
increasing. Technology is contained in almost things and make our life better.
Technology changed the way we collect, process and store information. One of the most
fields that have highly need on technology is medicine, especially in the visualize
medical image process in computer tomography or magnetic resonance.
From a sequence of medical images from scanner device, the doctor will have
some examination of that medical images and will provide the patient some diagnosis.
However, examining on a set of images will have some disadvantage that the doctor
can’t have a full view of the data, especially the correlation between body organs. That
is the most motivation to develop a visualization system to present a sequence of
medical images in 3D model. That visualization system can possible implemented by
volume rendering technique. Many students it Ho Chi minh University of Technology
have developed a visualization system called MeshBK [1] to visualize medical image
in a 3D model based on volume rendering technique. MeshBK performs very well on
visualize sequence of images in 3D model and also provide some image segmentation
such as histogram transform (in 1D and 2D), space selection and region growing to help
user select the correct organ to visualize.
However, MeshBK also has some disadvantages that the process of image
segmentation needs to be handled by hand. It’s required the user some experience in
medical image to process image segmentation. This problem inspired me to do an
automated system based on modern machine learning trend to automatically classify
body organs from sequence of medical images. This system will provide the easier way
to visualize medical image, helping the doctor quickly provide diagnosis.
viii
MỤC LỤC
LỜI CẢM ƠN .................................................................................................................. i
LỜI CAM ĐOAN ........................................................................................................... v
TÓM TẮT LUẬN VĂN ................................................................................................ vi
ABSTRACT ................................................................................................................viii
MỤC LỤC ..................................................................................................................... ix
DANH MỤC HÌNH...................................................................................................... xii
DANH MỤC BẢNG ................................................................................................... xiv
DANH MỤC CÁC TỪ VIẾT TẮT .............................................................................. xv
CHƯƠNG 1:
TỔNG QUAN ................................................................................... 16
1.1 Giới thiệu .............................................................................................. 16
1.2 Mục tiêu của đề tài ................................................................................ 18
1.3 Ý nghĩa của đề tài ................................................................................. 18
1.3.1 Ý nghĩa thực tiễn: ........................................................................... 19
1.3.2 Ý nghĩa khoa học: .......................................................................... 19
1.4 Phạm vi của đề tài ................................................................................. 19
1.5 Bố cục luận văn..................................................................................... 20
CHƯƠNG 2:
CÁC CÔNG TRÌNH NGHIÊN CỨU LIÊN QUAN ........................ 21
2.1 Tổng quan về các hướng nghiên cứu về bài toán phân đoạn ảnh y khoa
21
2.2 Các phương pháp tự động ..................................................................... 22
2.2.1 Phương pháp sử dụng các đặc trưng cơ bản .................................. 23
2.2.2 Phương pháp sử dụng các đặc trưng máy học ............................... 29
2.3 Các phương pháp bán tự động .............................................................. 33
ix
2.3.1 Phương pháp dựa vào tập mức (level set) ...................................... 33
2.3.2 Phương pháp Livewire ................................................................... 34
2.3.3 Phương pháp tăng trưởng vùng (region growing) ......................... 36
2.3.4 Phương pháp graph-cut .................................................................. 37
2.4 Tổng kết ................................................................................................ 38
2.4.1 Phương pháp tự động ..................................................................... 38
2.4.2 Phương pháp bán tự động .............................................................. 39
2.4.3 Nhận xét chung .............................................................................. 39
CHƯƠNG 3:
CƠ SỞ LÝ THUYẾT ........................................................................ 41
3.1 DICOM ................................................................................................. 41
3.2 Rừng ngẫu nhiên (Random Forest) ....................................................... 42
3.3 Tích chập trong miền rời rạc................................................................. 43
3.4 Gabour filter .......................................................................................... 45
3.5 Mạng nơ ron tích chập .......................................................................... 48
3.6 Mạng nơ ron tích chập đầy đủ FCN .................................................... 49
3.7 Layer Recurrent Neural Network (L-RNN) ......................................... 51
3.8 Mạng nơ ron tích chập đầy đủ U-Net ................................................... 53
3.9 Trường điều kiện ngẫu nhiên ................................................................ 55
3.10 Chuẩn hóa mức sáng dữ liệu................................................................. 55
3.11 Làm giàu dữ liệu ................................................................................... 58
3.11.1 Tăng cường 2D ............................................................................ 58
3.11.2 Tăng cường trong chuỗi các hình ảnh CT.................................... 58
3.11.3 Tăng cường 3D ............................................................................ 59
CHƯƠNG 4:
PHƯƠNG PHÁP ĐỀ XUẤT ............................................................ 62
4.1 Phương pháp sử dụng các đặc trưng cơ bản ......................................... 62
x
4.1.1 Các đặc trưng thông tin cơ bản ...................................................... 63
4.1.2 Các đặc trưng thống kê .................................................................. 64
4.1.3 Đặc trưng Gabour........................................................................... 64
4.2 Phương pháp sử dụng các đặc trưng máy học ...................................... 64
CHƯƠNG 5:
THÍ NGHIỆM ................................................................................... 67
5.1 Quá trình thí nghiệm ............................................................................. 67
5.2 Tiêu chí đánh giá................................................................................... 69
5.2.1 Đánh giá định tính .......................................................................... 69
5.2.2 Đánh giá định lượng....................................................................... 69
5.3 Dữ liệu đánh giá .................................................................................... 71
5.3.1 Tập dữ liệu ..................................................................................... 71
5.3.2 Chuẩn hóa dữ liệu .......................................................................... 72
5.4 Cài đặt thí nghiệm ................................................................................. 73
5.4.1 Phương pháp sử dụng các đặc trưng cơ bản .................................. 73
5.4.2 Phương pháp sử dụng các đặc trưng máy học ............................... 74
5.4.3 Cấu hình phần cứng và phần mềm ................................................. 77
5.5 Kết quả thí nghiệm ................................................................................ 78
5.5.1 Kết quả phương pháp sử dụng đặc trưng cơ bản ........................... 78
5.5.2 Kết quả phương pháp sử dụng đặc trưng máy học ........................ 83
CHƯƠNG 6:
KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN ........................................ 91
CHƯƠNG 7:
TÀI LIỆU THAM KHẢO ................................................................. 93
LÝ LỊCH TRÍCH NGANG .......................................................................................... 99
PHỤ LỤC BÀI BÁO KHOA HỌC ............................................................................ 100
xi
DANH MỤC HÌNH
Hình 1-1 Trực quan hóa các bộ phận ......................................................................... 17
Hình 1-2 Hai bước để hiển thị trực quan hóa các bộ phận từ ảnh CT........................ 18
Hình 2-1 Các phương pháp phân đoa ̣n ảnh đươ ̣c khảo sát ......................................... 21
Hình 2-2 Phân hoạch từ min-cut ................................................................................ 37
Hình 3-1 Một ảnh DICOM ......................................................................................... 41
Hình 3-2 Mô hình huấn luyện và kiểm thử với thuật toán rừng ngẫu nhiên .............. 43
Hình 3-3: Ảnh minh họa và kết quả tích chập với một số mặt nạ khác nhau. ........... 45
Hình 3-4 Hình ảnh trong không gian 1 chiều [41] ..................................................... 46
Hình 3-5 Hình ảnh trong không gian 2 chiều [41] ..................................................... 46
Hình 3-6 Hình ảnh của Gabor kernel với các hướng và tần số khác nhau [41] ......... 46
Hình 3-7 Các hướng gabor filter bank được sử dụng................................................. 47
Hình 3-8 Hình ảnh được dùng để filter ...................................................................... 47
Hình 3-9 Phần thực của ảnh sau khi được filtering .................................................... 48
Hình 3-10 Phần ảo của ảnh sau khi được filtering ..................................................... 48
Hình 3-11 Ví dụ về mạng nơ ron tích chập ................................................................ 49
Hình 3-12 Hình Minh họa cho mạng tích chập đầu đủ [28]. Chỉ cần một lần chạy mạng
duy nhất, nhãn của mỗi điểm ảnh sẽ có được ở đầu ra. .............................. 50
Hình 3-13 Cấu trúc mạng tích chập đầy đủ [28]. ....................................................... 51
Hình 3-14 Một module L-RNN .................................................................................. 52
Hình 3-15 Mô hình kết hợp mạng nơ ron tích chập đầy đủ FCN và mạng L-RNN .. 53
Hình 3-16 Kiến trúc mạng U-Net [36] ....................................................................... 54
Hình 3-17 Mức xám của gan phân bố không đều trong tập dữ liệu ........................... 56
Hình 3-18 Mức xám của gan trên tập dữ liệu sau khi được chuẩn hóa ...................... 56
Hình 3-19 Giới hạn các mức sáng .............................................................................. 57
Hình 3-20 Nội suy ảnh ............................................................................................... 59
Hình 3-21 Lát cắt trong khối dữ liệu 3 chiều ............................................................. 60
Hình 3-22 Các hướng xoay trong tăng cường dữ liệu 3D .......................................... 60
Hình 3-23 Một lát cắt mẫu theo hướng tăng cường 3D ............................................. 61
Hình 4-1 Mô hình phân đoạn dựa trên các đặc trưng cơ bản ..................................... 63
xii
Hình 4-2 Mô hình phân đoạn dựa trên các đặc trưng máy học .................................. 65
Hình 5-1 Hình ảnh hai mươi bệnh nhân trong tập dữ liệu ......................................... 72
Hình 5-2 Ví dụ đơn giản về chuẩn hóa dữ liệu .......................................................... 73
Hình 5-3 Kết quả mô hình sử dụng đặc trưng Gabour kết hợp với 18 đặc trưng cơ bản
(bên trái) và kết quả hậu xử lý bằng phương pháp tăng trưởng vùng(phải)
cho dữ liệu bệnh nhân 1.1 ........................................................................... 82
Hình 5-4 Kết quả mô hình sử dụng đặc trưng Gabour kết hợp với 18 đặc trưng cơ bản
(bên trái) và kết quả hậu xử lý bằng phương pháp tăng trưởng vùng(phải)
cho dữ liệu bệnh nhân 2.1 ........................................................................... 82
Hình 5-5 Kết quả hiện thị trực quan các bộ phận dùng mô hình mạng học sâu FCN 83
Hình 5-6 Một vài ảnh kết quả phân đoạn với mô hình FCNs .................................... 84
Hình 5-7 Một vài kết quả phân đoạn với mô hình sử dụng kết hợp mạng FCN và LRNN ............................................................................................................ 86
Hình 5-8 Kết quả định lượng của các bộ phận trong dữ liệu dữ liệu bệnh nhân 2.1 và
bệnh nhân 2.2 – được so sánh giữa hai phương pháp FCNs và FCNs kết hợp
L-RNNs ....................................................................................................... 87
Hình 5-9 Một vài kết quả phân đoạn với mô hình sử dụng mô hình mạng hai tầng FCN
với phương pháp làm giàu số liệu ............................................................... 90
xiii
DANH MỤC BẢNG
Bảng 5-1 Thông tin tập dữ liệu được thử nghiệm ........................................................ 71
Bảng 5-2 Thời gian chạy các thí nghiệm trên các máy ................................................ 78
Bảng 5-3 Độ đo Accuracy cho mỗi tập dữ liệu sử dụng các loại đặc trưng sau 10 đặc
trưng thông tin cơ bản, 18 đặc trưng cơ bản và sử dụng kết hợp đặc trưng Gabor.
........................................................................................................................... 79
Bảng 5-4 Độ đo Precision của gan trên mỗi tập dữ liệu sử dụng các loại đặc trưng sau
10 đặc trưng thông tin cơ bản, 18 đặc trưng cơ bản và sử dụng kết hợp đặc trưng
Gabor ................................................................................................................. 80
Bảng 5-5 Độ đo Recall của gan trên mỗi tập dữ liệu sử dụng các loại đặc trưng sau 10
đặc trưng thông tin cơ bản, 18 đặc trưng cơ bản và sử dụng kết hợp đặc trưng
Gabor ................................................................................................................. 81
Bảng 5-6 Kết quả định lượng của các bộ phận trong tập dữ liệu kiểm thử 3DIRCADb –
được so sánh giữa các phương pháp FCN, FCN kết hợp L-RNNs và mô hình
sử dụng các đặc trưng cơ bản ............................................................................ 84
Bảng 5-7 Kết quả định lượng của các thí nghiệm sử dụng mạng CFCN ..................... 89
xiv
DANH MỤC CÁC TỪ VIẾT TẮT
Từ đầy đủ
Từ viết tắt
CT
Computed tomography
SVM
Support vector Machine
FCN
Fully convolutional neural network
CNN
Convolutional neural network
L-RNN
Layer recurrent neural network
ReLU
Rectified linear unit
ROI
Region of interest
3D
Three Dimensionality
2D
Two Dimensionality
GPU
Graphics processing unit
MRI
Magnetic resonance imaging
DICOM
RF
Digital Imaging and Communications in Medicine
Random Forests
xv
CHƯƠNG 1: TỔNG QUAN
1.1 Giới thiệu
Trong những năm gần đây, do sự phát triển nhanh chóng về nhiều mặt, các trung
tâm kinh tế lớn của Việt Nam đang phải đương đầu với các vấn đề xã hội phức tạp, một
trong số đó là vấn đề về y tế. Số lượng các ca bệnh liên quan đến vấn đề bên trong cơ
thể ngày càng xuất hiện nhiều. Đặc biệt là bệnh ung thư và các khối u bên trong cơ thể,
các bác sĩ không thể nhìn trực quan cơ thể người bệnh nên khó có thể chuẩn đoán bệnh
nhanh chóng và chính xác. Tính chất các loại bệnh bên trong cơ thể cần chuẩn đoán
nhanh chóng, chính xác để có các phương án chữa trị thích hợp. Hơn thế nữa, để tiến
hành phẫu thuật đối với các bộ phận bên trong cơ thể, các bác sĩ cần biết được chính
xác cấu trúc của bộ phận đó. Để xác định được cấu trúc các bộ phận bên trong cơ thể,
các bác sĩ phải sử dụng các thiết bị chụp cộng hưởng từ, chụp cắt lớp, đồng thời phải
bỏ ra nhiều giờ để phân tích các ảnh thu được. Để đẩy nhanh quá trình này, chúng ta có
thể triển khai các mô hình, hệ thống thông minh hỗ trợ trực quan hóa cơ thể người tại
các bệnh viện.
Một hướng tiếp cận hệ thống thông minh phân tích các ảnh chụp cắt lớp, ảnh MRI
là sử dụng các thiết bị chụp kết hợp với khả năng tính toán nhanh của máy tính để máy
tính để phân tích thay con người. Với sự phát triển mạnh mẽ của lĩnh vực học máy,
người ta nghĩ đến sử dụng các máy tính học các đặc trưng trong ảnh thu được từ quá
trình chụp cắt lớp, chụp cộng hưởng từ. Sau đó, khi có dữ liệu của một người bệnh mới,
máy tính sẽ phân tích dựa trên mô hình đã được học từ trước để đưa ra kết quả cấu trúc
cơ thể người bệnh. Đồng thời chúng ta có thể kết hợp với các phần mềm để hiển thị trực
quan các kết quả sau khi xử lý. Như vậy việc chuẩn đoán, mô hình các cấu trúc bên
trong cơ thể người bệnh được tiến hành nhanh chóng, chính xác hơn.
16
Hình 1-1 Trực quan hóa các bộ phận
Ở Việt Nam hiện nay, các bệnh viện đã đưa các máy chụp vào quá trình chuẩn đoán
và điều trị cho bệnh nhân. Tuy nhiên, cách phân tích còn cần nhiều sự tương tác của các
bác sĩ và phải mất nhiều giờ để xử lý kết quả của một bệnh nhân. Với tình trạng nhu
cầu về việc khám chữa bệnh liên quan đến các bộ phận trong cơ thể người ngày càng
nhiều thì nhu cầu cần một qui trình xử lý thông tin tự động để đẩy nhanh tốc độ, tăng
tính chính xác và giảm công sức con người là thật sự cần thiết.
Hiện nay trên thế giới đã có nhiều hệ thống hỗ trợ trực quan hóa cơ thể người
như [3], [4], [5], [6]. Và trong bài báo [2], [7] có trình bày các hàm biến đổi để trực
quan hóa một khối trong không gian ba chiều. Từ đó, ta có thể thấy rõ là các hệ thống
hiện có mới chỉ hỗ trợ trực quan hóa bằng cách sử dụng các hàm biến đổi đơn giản như
dựa vào mức sáng, đạo hàm, …. Các bác sĩ còn cần phải tương tác nhiều để thu được
kết quả trực quan cuối cùng. Đồng thời [2], [8], [9] cũng trình bày một hướng tiếp cận
là sử dụng các phương pháp học máy làm hàm chuyển đổi để máy tính có thể tự động
phân tích các ảnh chụp cắt lớp, chụp cộng hưởng để thu được kết quả trực quan cuối
cùng. Với hướng tiếp cận này, các bác sĩ có thể tương tác ít hơn hoặc không cần tương
tác trong quá trình xử lý kết quả, quá trình phân tích sẽ chính xác và nhanh hơn.
17
Hình 1-2 Hai bước để hiển thị trực quan hóa các bộ phận từ ảnh CT
Với các lý do này, cùng với nhu cầu thực tế từ quá trình khám chữa bệnh ở Việt
Nam, đề tài được hình thành với mục tiêu tìm ra được phương pháp học máy để giải
quyết tốt cho vấn đề phân đoạn các bộ phận trong ảnh chụp CT để dùng cho hiển thị
trực quan cơ thể người.
1.2 Mục tiêu của đề tài
Mục tiêu của đề tài la đề xuất phương pháp phân đoạn hiệu quả các bộ phận bên
trong cơ thể người như xương, thận và gan, từ đó phục vụ cho quá trình trực quan hóa.
Phương pháp đề xuất tốt cần là sự kết hợp giữa các phương pháp học máy vác trích các
đặc trưng phù hợp để xây dựng mô hình phân đoạn hiệu quả. Độ chính xác yêu cầu cần
đạt được là hơn 80% cho các điểm ảnh trong các bộ phận. Ngoài ra, đề tài cũng chú
trọng đến việc phân đoạn rõ đối tượng gan và các khối u trong gan.
1.3 Ý nghĩa của đề tài
Phân đoạn ảnh là một bài toán khó của xử lý ảnh nói chung. Với ảnh CT có chứa
các bộ phận như xương, thận, gan và các khối u, công việc này gặp nhiều trở ngại hơn
nữa. Những nguyên nhân gây ra các trở ngại này có thể bao gồm:
-
Ảnh CT thường là ảnh có độ tương phản thấp và các cạnh mờ, một số hiệu
ứng của máy chụp có thể làm xuất hiện các thông tin sai lệch như các vằn
hay sọc hình miệng chén (hiệu ứng beam hardening).
-
Tuy có bề mặt khá đồng nhất về độ sáng nhưng độ sáng của các bộ phận trong
ảnh CT khá giống với các cơ quan khác nằm gần kề, đặc biệt là các bộ phận
nhỏ như khối u.
18
-
Trong quá trình chụp ảnh CT, ảnh có thể bị mờ do cử động của bệnh nhân
hoặc do chuyển động thở của người bệnh.
-
Một vài cơ quan có hình dạng phức tạp, kích thước cũng không giống nhau
trong các trường hợp bệnh nhân khác nhau, như gan, khối u gan, …
Vì những nguyên nhân trên, vấn đề phân đoạn các bộ phận trong ảnh y khoa
nhận được sự quan tâm của cộng đồng nghiên cứu trên thế giới. Việc giải quyết bài toán
phân đoạn các bộ phận trong ảnh y khoa có nhiều ý nghĩa thực tiễn và khoa học.
1.3.1 Ý nghĩa thực tiễn:
-
Góp phần làm tăng tốc độ, tăng tính chính xác trong quá trình trực quan hóa
cơ thể người bệnh.
-
Giúp các bác sĩ đưa ra các phán đoán chuẩn xác trong quá trình điều trị bệnh
nhân.
-
Giảm thiểu yêu cầu về nhân lực trong việc phân tích các kết quả ảnh chụp cắt
lớp, chụp cộng hưởng, làm giảm thiểu chi phí trong quá trình khám chữa
bệnh.
-
Góp phần cải thiện công tác quản lý trong quá trình khám chữa bệnh.
1.3.2 Ý nghĩa khoa học:
-
Hiện nay, trên thế giới có nhiều phương pháp học máy. Nếu bài toán được
giải quyết sẽ tìm ra phương pháp phù hợp cho vấn đề trực quan hóa cơ thể
người.
-
Các phương pháp liên quan hiện tại còn tập trung vào các đặc trưng đơn giản.
Việc thực hiện đề tài sẽ tìm ra được các đặc trưng hiệu quả để các kết quả
trực quan cơ thể người chính xác hơn.
1.4 Phạm vi của đề tài
Đề tài quan tâm đến đối tượng là các ảnh chụp cắt lớp vùng bụng chứa xương,
thận, gan, khối u gan và các phương pháp dùng học máy để phân đoạn các bộ phận
trong ảnh chụp CT. Bước hiển thị trực quan sử dụng phần mềm tích hợp để hiển thị.
19
1.5 Bố cục luận văn
Trong báo cáo này có tất cả 7 chương. Chương 2 có mục đích giới thiệu các công
trình nghiên cứu liên quan, các hướng giải quyết cho bài toán phân đoạn ảnh y khoa.
Chương 3 cung cấp một số cơ sở lý thuyết đặt nền móng cho các mô hình được đề xuất
trong chương 4. Chương 5 đưa ra thông tin thí nghiệm, các chỉ tiêu đánh giá và kết quả
đánh giá của các phương pháp cùng với một số nhận xét dựa vào các kết quả đấy.
Chương 6 kết luận báo cáo và trình bày hướng phát triển trong tương lai. Chương 7
trình bày danh sách các tài liệu tham khảo được trích dẫn trong đề tài.
20
- Xem thêm -