VŨ ĐÌNH KHÔI
ĐẠI HỌC ĐÀ NẴNG
TRƢỜNG ĐẠI HỌC BÁCH KHOA
TRẦN HỮU LỘC
---------------------------------------
VŨ ĐÌNH KHÔI
LUẬN VĂN THẠC SĨ KỸ THUẬT ĐIỆN TỬ
C
C
R
L
T.
NGHIÊN CỨU THUẬT TOÁN KHỬ NHIỄU
ẢNH DỰA TRÊN PHƢƠNG PHÁP BIẾN PHÂN
U
D
LUẬN VĂN THẠC SĨ KỸ THUẬT ĐIỆN TỬ
NĂM 2019
Đà Nẵng – Năm 2019
ĐẠI HỌC ĐÀ NẴNG
TRƢỜNG ĐẠI HỌC BÁCH KHOA
---------------------------------------
VŨ ĐÌNH KHÔI
C
C
R
L
T.
NGHIÊN CỨU THUẬT TOÁN KHỬ NHIỄU ẢNH
DỰA TRÊN PHƢƠNG PHÁP BIẾN PHÂN
U
D
Chuyên nghành: KỸ THUẬT ĐIỆN TỬ
Mã số: 8520203
LUẬN VĂN THẠC SĨ KỸ THUẬT ĐIỆN TỬ
NGƯỜI HƯỚNG DẪN KHOA HỌC:
TS. PHAN TRẦN ĐĂNG KHOA
Đà Nẵng – Năm 2019
LỜI CAM ĐOAN
Tôi cam đoan đây là công trình nghiên cứu của riêng tôi. Nội dung công trình
luận văn “Nghiên cứu thuật toán khử nhiễu ảnh dựa trên phƣơng pháp biến
phân”; các số liệu và kết quả nêu trong luận văn là trung thực và chưa từng được ai
công bố trong bất kỳ công trình nào khác.
Học viên cao học
Vũ Đình Khôi
C
C
R
L
T.
U
D
I
1
MỤC LỤC
CHƢƠNG 1: GIỚI THIỆU TỔNG QUAN ...................................................... 7
1.1. Đặt vấn đề ............................................................................................................. 7
1.2. Các phương pháp xử lý ảnh .................................................................................. 9
1.2.1. Phương pháp hình thái học ............................................................................ 9
1.2.2. Phân tích phổ .................................................................................................. 9
1.2.3. Phân tích đa phân giải .................................................................................. 10
1.2.4. Phương pháp dựa trên mô hình ngẫu nhiên ................................................. 11
1.2.5. Phương pháp biến phân ................................................................................ 12
1.2.6. Phương trình đạo hàm riêng ........................................................................ 12
1.2.7. Mối liên hệ giữa các phương pháp ............................................................... 12
C
C
1.3. Các thuật toán khử nhiễu phổ biến...................................................................... 13
1.3.1. Bộ lọc trung bình .......................................................................................... 13
R
L
T.
1.3.2. Bộ lọc Gauss ................................................................................................. 13
U
D
1.3.3. Bộ lọc trung vị .............................................................................................. 14
1.3.4. Bộ lọc Wiener ............................................................................................... 14
1.4. Mục tiêu nghiên cứu............................................................................................ 15
CHƢƠNG 2: THUẬT TOÁN KHỬ NHIỄU ẢNH DỰA TRÊN PHƢƠNG
PHÁP BIẾN PHÂN .......................................................................................... 16
2.1. Hàm năng lượng .................................................................................................. 16
2.2. Hàm lồi ................................................................................................................ 18
2.3. Functional ............................................................................................................ 20
2.4. Đạo hàm Gâteaux ................................................................................................ 20
2.5. Phương trình Euler-Lagrange.............................................................................. 21
2.6. Thuật toán Gradient Descent ............................................................................... 21
2.7. Toán tử gradient và divergence rời rạc ............................................................... 23
2.8. Thuật toán khử nhiễu ảnh sử dụng tổng biến phân ............................................. 24
CHƢƠNG 3: KẾT QUẢ THỰC NGHIỆM VÀ ĐÁNH GIÁ ....................... 26
3.1. Mô tả thực nghiệm .............................................................................................. 26
3.2. Tiêu chí đánh giá ................................................................................................. 27
3.3. Kết quả và đánh giá thuật toán TV-GD .............................................................. 27
2
3.3.1. Ảnh hưởng của tham số ............................................................................. 27
3.3.2. Ảnh hưởng của số vòng lặp .......................................................................... 29
3.3.3. Ảnh hưởng của hệ số ................................................................................. 31
3.4. Kết quả so sánh các thuật toán ............................................................................ 33
3.4.1. Kết quả định lượng ....................................................................................... 33
3.4.2. Đánh giá chủ quan........................................................................................ 37
KẾT LUẬN ........................................................................................................ 42
TÀI LIỆU THAM KHẢO ................................................................................ 43
PHỤ LỤC ........................................................................................................... 45
Chương trình thuật toán khử nhiễu dựa trên phương pháp biến phân sử dụng tổng
biến phân .................................................................................................................... 45
C
C
U
D
R
L
T.
3
NGHIÊN CỨU THUẬT TOÁN KHỬ NHIỄU ẢNH DỰA TRÊN PHƢƠNG
PHÁP BIẾN PHÂN
Học viên: Vũ Đình Khôi. Chuyên ngành: Kỹ thuật điện tử
Mã số: CH678. Khóa: 36. Trường Đại học Bách khoa – Đại học Đà Nẵng.
Tóm tắt: Khử nhiễu ảnh là một trong các vấn đề nghiên cứu quan trọng trong
lĩnh vực xử lý ảnh. Trong luận văn này, chúng tôi nghiên cứu thuật toán khử nhiễu ảnh
bằng phương pháp biến phân. Thuật toán tìm nghiệm ảnh khử nhiễu bằng cách tối
thiểu hóa hàm mục tiêu bao gồm thành phần đo khoảng cách giữa ảnh khử nhiễu và
ảnh nhiễu và thành phần đo độ mượt của ảnh thông qua tổng biến phân. Quá trình tối
ưu được thực hiện bởi phương pháp Gradient Descent. Trong phần thực nghiệm, thuật
toán nghiên cứu được đánh giá và so sánh với các thuật toán khử nhiễu phổ biến khác
dựa trên các tiêu chí đánh giá PSNR, SSIM và đánh giá chủ quan. Kết quả thực
nghiệm cho thấy, thuật toán khử nhiễu ảnh bằng phương pháp biến phân cho kết quả
tốt hơn so với các thuật toán khác.
C
C
Từ khóa: khử nhiễu ảnh, phương pháp biến phân, tổng biến phân, gradient
descent.
R
L
T.
U
D
VARIATIONAL METHOD BASED DENOISING ALGORITHM
Student: Vu Dinh Khoi. Major of Master program: Electrical engineering.
Student code: CH678. Course: K36. The University of Science and Technology – The
University of Danang.
Abstract: Image denoising is an important research problem in the field of
digital image processing. In this thesis, we study a denoising algorithm based on
variational method. The algorithm search the denoised image by minimizing the
energy function, which consists of two terms – the fitting term measuring the distance
between the denoised image and the noisy image and the regularization term
measuring the smoothness of the denoised image using the total variation. The
optimization process is based on the Gradient Descent method. In the experiments, the
algorithm is compared with widely used denoising algorithms based on criteria PSNR,
SSIM and visual quality. The experimental results show that the variational method
based denoising algorithm outperforms other competing methods.
Key words: image denoising, variational method, total variation, gradient
descent.
4
DANH SÁCH CÁC KỸ HIỆU, CHỮ VIẾT TẮT
PSNR
SSIM
MSE
VM
PDE
GD
TV-GD
AF
GF
MF
WF
Sob-GD
Peak Signal-to-Noise Ratio
Structural Similaritykj
Mean Squared Error
Tỉ số tín hiệu cực đại trên nhiễu
Variational method
Partial Differential Equation
Phương pháp biến phân
Phương trình đạo hàm riêng
Gradient Descent
Total variation – Gradient
Descent
Average Filter
Gauss Filter
Median Filter
Wiener Filter
Sobolev - Gradient Descent
Thuật toán Gradient Descent
Hệ số tương đồng cấu trúc
Sai số bình phương trung bình
Bộ lọc trung bình
Bộ lọc Gauss
Bộ lọc trung vị
Bộ lọc Wiener
U
D
R
L
T.
C
C
5
DANH MỤC BẢNG BIỂU
Thứ tự
Nôi dung tên bảng biểu
Trang
Bảng 3.1:
Sự phụ thuộc của PSNR và SSIM vào số giá trị của tham số
34
Bảng 3.2:
PSNR và SSIM của 6 thuật toán
35
Bảng 3.3:
PSNR và SSIM của 6 thuật toán
36
Bảng 3.4:
PSNR và SSIM của 6 thuật toán
37
Bảng 3.5:
PSNR và SSIM của 6 thuật toán
38
C
C
U
D
R
L
T.
6
DANH MỤC HÌNH
Thứ tự
Nôi dung tên hình
Hình 1.1.
Quá trình gây nhiễu ảnh và khử nhiễu
8
Hình 1.2.
Ảnh tách đường biên
9
Hình 1.3.
Một số toán tử hình thái học [6]
10
Hình 1.4.
Biến đổi Fourier đối với các bộ lọc [6]
11
Hình 1.5.
Biến đổi wavelet đối với ảnh [6]
12
Hình 1.6.
Mối liên hệ giữa các phương pháp
14
Hình 1.7.
Hàm Gauss với các giá trị
Hình 1.8.
Bộ lọc trung vị [6]
Hình 2.1.
Ba hàm khác nhau có cùng giá trị tổng biến phần bằng 2 [2]
Hình 2.2.
Hàm lồi [5]
Hình 2.3.
Ví dụ về các hàm lồi
21
Hình 2.4.
Minh họa phương pháp GD [5]
24
Hình 2.5.
So sánh 2 hàm | | và √
26
Hình 3.1.
Các ảnh thực nghiệm
27
Hình 3.2.
Sự phụ thuộc của ảnh khử nhiễu vào giá trị của tham số
29
Hình 3.3.
Hình 3.4.
Trang
và
C
C
khác nhau [6]
R
L
T.
U
D
15
16
20
21
| | với các giá trị khác nhau
Sự phụ thuộc của (a) hàm năng lượng, (b) PSNR và (c)
SSIM vào số vòng lặp
Ảnh
và ảnh khử nhiễu với giá trị của tham số khác
nhau
30
33
Hình 3.5.
Kết quả khử nhiễu của 6 thuật toán
)
40
Hình 3.6.
Kết quả khử nhiễu của 6 thuật toán
)
42
7
CHƢƠNG 1: GIỚI THIỆU TỔNG QUAN
Chương này trình bày tổng quan về bài toán khử nhiễu ảnh, các phương
pháp xử lý ảnh và thuật toán khử nhiễu ảnh phổ biến.
1.1. Đặt vấn đề
Khử nhiễu ảnh (image denoising) là một trong các vấn đề nghiên cứu
quan trọng trong lĩnh vực xử lý ảnh và là một bước tiền xử lý cần thiết cho nhiều
ứng dụng. Trong quá trình thu nhận, truyền và ghi dữ liệu, hình ảnh sẽ bị nhiễu
do khiếm khuyết trong cấu tạo của thiết bị thu phát hình ảnh hoặc do môi trường
bên ngoài. Do đó, việc khử các hiệu ứng nhiễu là cần thiết nhằm phục vụ cho
các bước xử lý ảnh tiếp theo.
Gọi là ảnh gốc (không nhiễu) và là ảnh nhiễu của được gây ra bởi
nhiễu . Quá trình khử nhiễu được mô hình hóa đơn giản như sau
(1.1)
trong đó, toán tử có thể là phép cộng hoặc nhân.
Trong luận văn này, chúng ta xem xét nhiễu cộng Gauss. Mô hình nhiễu
như sau
(1.2)
trong đó,
là nhiễu Gauss với giá trị trung bình
và độ lệch
chuẩn . Quá trình gây nhiễu ảnh bởi nhiễu Gauss được thể hiện ở Hình 1.1.
C
C
R
L
T.
U
D
Hình 1.1. Quá trình gây nhiễu ảnh và khử nhiễu [1]
Để hiểu rõ hơn tầm quan trọng của việc khử nhiễu trong phân tích ảnh, ta
xem một ví dụ về ảnh hưởng của khử nhiễu đến thuật toán tách đường biên
(edge detection) cho ảnh siêu âm. Thuật toán tách đường biên phổ biến là toán
tử Sobel có dạng như sau [3]:
(
)
(
)
(1.3)
8
Toán tử Sobel được áp dụng với ảnh thông qua phép chập:
với độ lớn tại pixel
được xác định bởi
√
(
)
và
(1.4)
Giá trị
lớn tại các vị trí gần đường biên và nhỏ tại các vùng có độ
sáng đồng nhất. Hình 1.2 cho thấy rằng, việc khử nhiễu ảnh giúp cho việc tách
đường biên trở nên tốt hơn, cụ thể là các đường biên nét hơn và các đường biên
gây ra bởi nhiễu giảm đi đáng kể.
C
C
R
L
T.
U
D
(a) Ảnh gốc và ảnh tách đường biên
(b) Ảnh khử nhiễu và ảnh tách đường biên
Hình 1.2. Ảnh tách đường biên [2]
Trong thực tế, chúng ta gần như không thể xác định các loại nguồn gây
nhiễu, cũng như các tham số liên quan. Điều này dẫn đến vấn đề khử nhiễu ảnh
9
trở thành bài toán ngược (inverse problem) với nghiệm chỉ có thể là gần đúng và
không duy nhất. Một thuật toán khử nhiễu tốt đòi hỏi phải giảm được nhiễu
tương đương với làm mượt ảnh, tuy nhiên đồng thời phải giữ cho các chi tiết của
ảnh như đường biên không bị mất đi.
1.2. Các phƣơng pháp xử lý ảnh
Mục này trình bày các phương pháp xử lý ảnh chính. Mỗi phương pháp
đều có ưu điểm và nhược điểm, và việc áp dụng phương pháp nào tùy thuộc vào
bài toán cụ thể cũng như cấu trúc dữ liệu của ảnh được cho [2].
1.2.1. Phương pháp hình thái học
Do ảnh ghi nhận thông tin của đối tượng nên xử lý ảnh xem xét vấn đề
liên quan đến đối tượng trên ảnh. Một đối tượng có thể được xác định bởi hàm
đặc trưng nhị phân:
(1.5)
Toán tử hình thái là phép biến đổi giữa các đối tượng
(1.6)
thường mang tính cục bộ, tức một pixel thuộc sẽ được xác định bởi các
pixel lân cận của trong .
Một số toán tử hình thái học cơ bản như dilation, erosion, closing,
opening,… (Hình 1.3). Dựa trên các toán tử cơ bản này, ta có thể tách các đặc
trưng quan trọng trong ảnh như đường biên (edge), điểm đặc trưng (feature
point) để phục vụ cho các bài toán phát hiện, nhận dạng,…
C
C
R
L
T.
U
D
(a) Ảnh gốc
(b) Toán tử Erosion
(d) Toán tử Opening
(c) Toán tử Dilation
(e) Toán tử Closing
Hình 1.3. Một số toán tử hình thái học [6]
1.2.2. Phân tích phổ
10
Phân tích phổ và phương pháp đại diện cho trường phái này là biến đổi
Fourier là một trong những công cụ phân tích ảnh mạnh nhất trong xử lý ảnh cổ
điển. Biến đổi Fourier là phép biến đổi một hàm trong miền thời gian sang miền
tần số. Thông tin về tần số đóng vai trò quan trọng trong việc thiết kế các bộ lọc.
Hình 1.4 cho thấy biến đổi Fourier đối với các bộ lọc, qua đó ta có thể
thấy được tính chất của từng bộ lọc.
C
C
R
L
T.
U
D
Hình 1.4. Biến đổi Fourier đối với các bộ lọc [6]
1.2.3. Phân tích đa phân giải
Nhược điểm của biến đổi Fourier là không có tính cục bộ do đó không
hiệu quả trong việc tách các đặc trưng quan trọng của ảnh như điểm đặc trưng,
tức các điểm ảnh có sự khác biệt so với các điểm ảnh lân cận. Trong khi đó, các
nghiên cứu về nhận thức của con người cho thấy chúng ta có khả năng xác định
các đặc trưng rất hiệu quả. Biến đổi wavelet giải quyết nhược điểm của biến đổi
Fourier bằng cách phân tích ảnh ở các các độ phân giải khác nhau. Nhờ đó, biến
đổi wavelet là một công cụ hữu hiệu trong biểu diễn ảnh và nén ảnh. Hình 1.5
biểu diễn biến đổi wavelet đối với ảnh ở các độ phân giải khác nhau. Tại mỗi độ
phân giải, biến đổi wavelet cho 2 thành phần: chi tiết và xấp xỉ của ảnh. Các bài
toán xử lý ảnh khai thác thông tin ở các độ phân giải khác nhau để tạo ra các
thuật toán chính xác và ổn định hơn.
11
C
C
R
L
T.
U
D
Hình 1.5. Biến đổi wavelet đối với ảnh [6]
1.2.4. Phương pháp dựa trên mô hình ngẫu nhiên
Mỗi pixel là giá trị đo lường cường độ sáng đến từ không gian xung
quanh. Do đó, các phương pháp dựa trên mô hình ngẫu nhiên sẽ hiệu quả hơn
các hướng tiếp cận dựa trên mô hình xác định. Có 2 nguyên nhân dẫn đến bản
chất ngẫu nhiên của ảnh:
- Ảnh tự nhiên có thể phân chia thành 2 thành phần: thành phần lý tưởng
(mang tính chất xác định) và thành phần ngẫu nhiên (ví dụ như nhiễu);
- Ảnh tự nhiên có thể được xem như mẫu của một trường ngẫu nhiên.
Một số phương pháp ngẫu nhiên để xử lý ảnh bao gồm suy luận Bayes,
mô phỏng Monte-Carlo, thuật toán EM (Expectation Maximization),… Trong
đó, phương pháp Bayes đóng vai trò nền tảng trong các phương pháp ngẫu
nhiên. Gọi là thông tin quan sát được, và là đặc trưng ẩn thuộc . Suy luận
Bayes được biểu diễn như sau:
12
|
|
(1.7)
| thường được gọi là mô hình
trong đó,
là xác suất tiền nghiệm;
thông tin, biểu diễn phân bố xác suất của nếu biết .
Nếu không có bất kỳ thông tin biết trước về , ta có
̂
|
(1.8)
được gọi là ước lượng Maximum Likelihood (ML).
Tuy nhiên, trong xử lý ảnh, do số chiều không gian của ảnh là lớn nên
thông tin biết trước về ảnh là rất quan trọng để đảm bảo thu được kết quả
nghiệm ổn định. Khi đó, ta có ước lượng Maximum A Posterior (MAP) như sau:
̂
|
|
(1.9)
Suy luận Bayes nêu trên được sử dụng phổ biến trong nhiều bài toán xử lý
ảnh.
1.2.5. Phương pháp biến phân
Phương pháp biến phân (variational method) là một lĩnh vực trong toán
giải tích, sử dụng biến phân (variation), tức một sự thay đổi nhỏ của hàm, để tìm
cực trị của hàm đó. Ở đây, hàm (functional) được định nghĩa là ánh xạ từ tập các
hàm đến tập số thực. Hàm thông thường được biểu diễn thông qua tích phân của
C
C
U
D
R
L
T.
các hàm và đạo hàm của chúng, ví dụ
. Hàm dùng để
∫
tìm cực trị của hàm thường là phương trình Euler-Lagrange.
Trong ước lượng MAP đã được trình bày ở trên, ta có thể biến đổi thành
bài toàn tối thiểu hóa hàm năng lượng sau:
[ | ]
[ | ]
[ ]
(1.10)
Nếu và thuộc không gian hàm như không gian Sobolev hoặc không
gian biến phân chặn (Bounded Variation) thì bài toán sẽ được đưa về hướng tiếp
cận của phương pháp biến phân.
1.2.6. Phương trình đạo hàm riêng
Phương trình đạo hàm riêng (Partial Differential Equation, viết tắt là
PDE) là công cụ hiệu quả để mô hình hóa các quá trình động và cân bằng trong
vật lý như quá trình khuếch tán. PDE được ứng dụng rộng rãi trong xử lý ảnh do
nhiều bài toán liên quan đến phương pháp biến phân có thể được giải bằng
phương trình Euler-Lagrange thường được mô tả dưới dạng phương trình vi
phân.
1.2.7. Mối liên hệ giữa các phương pháp
Theo như trình bày tóm tắt các phương pháp ở trên, có thể thấy rằng các
phương pháp có mối liên hệ với nhau. Hình 1.6 mô tả mối liên hệ giữa các
phương pháp.
13
Hình 1.6. Mối liên hệ giữa các phương pháp
C
C
1.3. Các thuật toán khử nhiễu phổ biến
Mục này giới thiệu một số thuật toán khử nhiễu phổ biến, bao gồm bộ lọc
trung bình, bộ lọc Gauss, bộ lọc trung vị, bộ lọc Wiener và thuật toán biến phân
sử dụng thành phần ổn định hóa Sobolev.
1.3.1. Bộ lọc trung bình
Bộ lọc trung bình là bộ lọc tuyến tính, hoạt động như một bộ lọc thông
thấp. Bộ lọc trung bình sử dụng cửa sổ là trung bình của các pixel trong cửa sổ.
Ví dụ về cửa sổ của bộ lọc trung bình có kích thước
như sau [3]:
R
L
T.
U
D
(
)
Để lọc ảnh, ta thực hiện phép chập bộ lọc và ảnh. Giá trị điểm ảnh của
ảnh đầu ra là giá trị trung bình của tất cả các điểm ảnh trong cửa sổ lọc. Việc
tính toán này khá đơn giản với hai bước gồm tính tổng các thành phần trong cửa
sổ lọc và sau đó chia tổng này cho số các phần tử của cửa sổ lọc.
1.3.2. Bộ lọc Gauss
Khác với bộ lọc trung bình, các trọng số của các thành phần trong cửa sổ
của bộ lọc Gauss thay đổi theo vị trí, được mô tả bởi hàm Gauss [3]
với
√
là giá trị trung bình; là độ lệch chuẩn.
Đồ thị của hàm Gauss được thể hiện ở Hình 1.7.
(1.11)
14
Hình 1.7. Hàm Gauss với các giá trị
và
khác nhau [6]
Ví dụ về cửa sổ của bộ lọc Gauss:
(
)
C
C
Có thể thấy rằng, thành phần của cửa sổ xa vị trí trung tâm có giá trị nhỏ
hơn. Điều này là hợp lý vì các pixel lân cận pixel trung tâm phải có tầm quan
trọng lớn hơn các pixel ở xa.
1.3.3. Bộ lọc trung vị
Bộ lọc trung vị là bộ lọc phi tuyến. Hoạt động của bộ lọc trung vị như sau:
ta sử dụng một cửa sổ lọc quét qua lần lượt từng điểm ảnh của ảnh đầu vào. Tại
mỗi vị trí của cửa sổ, ta sắp xếp các điểm ảnh trong cửa sổ này theo thứ tự; sau
đó, gán điểm ảnh có giá trị nằm chính giữa của dãy giá trị điểm ảnh đã được sắp
xếp ở trên cho giá trị điểm ảnh đang xét. Mô tả hoạt động của bộ lọc trung vị ở
Hình 1.8.
R
L
T.
U
D
Hình 1.8. Bộ lọc trung vị [6]
1.3.4. Bộ lọc Wiener
15
Xem xét ảnh và nhiễu là các đại lượng ngẫu nhiên. Mục tiêu của việc tìm
ảnh khử nhiễu là tối thiểu hóa sai số bình phương trung bình giữa ảnh khử nhiễu
ước lượng và ảnh nhiễu [3]. Hàm mục tiêu này được biểu diễn như sau
̂) }
(1.12)
{(
với
là giá trị trung bình.
Giả sử rằng ảnh và nhiễu là độc lập, và cường độ sáng của các pixel trong
ảnh ước lượng và ảnh nhiễu phụ thuộc tuyến tính. Từ đó, ta có
|
̂
|
[
|
(1.13)
|
]
với
và
– năng lượng phổ của nhiễu và ảnh nhiễu;
và
– biến đổi Fourier của ảnh nhiễu và hàm gây nhiễu.
1.3.5. Thuật toán khử nhiễu sử dụng thành phần ổn định hóa Sobolev
Thuật toán tìm nghiệm ảnh bằng cách tối thiểu hóa hàm năng lượng được
xây dựng dựa trên các ràng buộc đối với ảnh khử nhiễu. Gọi là ảnh gốc và là
ảnh nhiễu của . Hàm năng lượng có dạng như sau [1]
C
C
U
D
R
L
T.
( ∫
∫ |
|
)
(1.14)
với
là gradient của ảnh; là không gian ảnh.
1.4. Mục tiêu nghiên cứu
Qua các nghiên cứu tổng quan nêu trên, chúng tôi chọn phương pháp biến
phân để giải quyết bài toán khử nhiễu do phương pháp này có mối liên hệ với
phương pháp ngẫu nhiên và phương pháp PDE, qua đó ta có thể xây dựng và
giải mô hình một cách chặt chẽ dựa trên nền tảng toán học.
Mục tiêu nghiên cứu: Nghiên cứu, thực thi và đánh giá thuật toán khử
nhiễu ảnh dựa trên phương pháp biến phân.
Để thực hiện được mục tiêu này, ta cần giải quyết một số vấn đề sau:
- Xây dựng mô hình ảnh khử nhiễu
- Giải bài toán tối ưu từ mô hình
- Xây dựng thuật toán dưới dạng rời rạc
16
CHƢƠNG 2: THUẬT TOÁN KHỬ NHIỄU ẢNH DỰA TRÊN PHƢƠNG PHÁP
BIẾN PHÂN
Chương này trình bày hàm năng lượng của bài toán khử nhiễu ảnh dựa
trên phương pháp biến phân và phương pháp giải bài toán tối ưu liên quan bằng
thuật toán Gradient Descent.
2.1. Hàm năng lƣợng
Xét bài toán khử nhiễu ảnh với nhiễu Gauss. Theo phương pháp biến
phân, trước tiên, ta cần xây dựng hàm năng lượng từ bài toán đặt ra để mô hình
hóa ảnh khử nhiễu. Một trong các hướng tiếp cận để xây dựng hàm năng lượng
là dựa trên Suy luận Bayes (Bayesian inference).
Gọi là ảnh gốc và là ảnh bị nhiễu. Phân bố xác suất hợp của và
được viết như sau:
|
|
(2.1)
Từ đây, ta có thể suy ra mối quan hệ giữa 2 phân bố xác suất điều kiện
| và
| như sau:
|
(2.2)
|
C
C
R
L
T.
biểu thức này được gọi là Định lý Bayes, trong đó
| được gọi là xác suất
hậu nghiệm của nếu biết ;
là xác suất tiền nghiệm của , tức thông tin
| là xác
biết trước về và được gọi là prior;
là xác suất biên của ;
suất của nếu biết và được gọi là likelihood (tạm dịch là khả năng).
Phương pháp Maximum A Posteriori (MAP) ước lượng như là mode
của xác suất hậu nghiệm
| :
̂
|
(2.3)
Áp dụng Định lý Bayes, ta có:
|
(2.4)
̂
|
U
D
Vì mẫu số của biểu thức trên không phụ thuộc vào nên
|
̂
(2.5)
Như vậy, phương pháp MAP ước lượng bằng cách tối đa hóa tích giữa
khả năng và xác suất tiền nghiệm theo biến .
Giả sử rằng ảnh và có cùng kích thước gồm pixel. Đối với mỗi
pixel , cường độ sáng được mô hình bằng cường độ sáng gốc cộng với
nhiễu Gauss.
(2.6)
trong đó,
là nhiễu Gauss với giá trị trung bình
và độ lệch
chuẩn .
17
|
Như vậy, xác suất
được biểu diễn như sau:
|
(2.7)
√
Giả sử rằng nhiễu trên các pixel là độc lập, tức nhiễu của các pixel không
| đối với toàn bộ các pixel
phụ thuộc lẫn nhau. Từ đó, ta thu được xác suất
|
|
∏
|
∏
∏
(2.8)
Đối với xác suất tiền nghiệm
, giả sử rằng xác suất
thỏa mãn
thuộc tính Markov, tức
chỉ phụ thuộc vào các pixel lân cận. Từ đó, ta có
thể biểu diễn
như sau:
|
(2.9)
|
∏
C
C
Xác suất tiền nghiệm
đặc trưng cho thông tin biết trước về ảnh gốc
. Nhận định rằng, ảnh tự nhiên có thể được mô hình hóa bởi các vùng có cường
độ sáng đồng nhất được giới hạn bởi các đường biên (edge). Do đó, ta có thể sử
dụng thông tin biết trước về ảnh gốc là tính mượt của ảnh được thể hiện thông
qua sự biến thiên cường độ sáng của các pixel lân cận [4]
R
L
T.
U
D
|
∏
Kết hợp khả năng
|
nghiệm
|
|
|
∏
(2.10)
|
và xác suất tiền nghiệm
∏
∏
|
, ta có xác suất hậu
(2.11)
|
| , ta có thể tối thiểu hóa hàm
Thay vì tối đa hóa phân bố xác suất
logarithm với dấu âm của xác suất này do hàm logarithm là hàm đơn điệu. Như
vậy, ta thu được hàm năng lượng như sau
|
∑
|
|
∑|
|
(2.12)
Bài toán khử nhiễu được quy về bài toán tối ưu hóa hàm năng lượng theo
̂
(∑
|
|
∑|
|)
(2.13)
- Xem thêm -