ĐẠI HỌC THÁI NGUYÊN
TRƯỜNG ĐẠI HỌC CNTT&TT
-------------------
VŨ VĂN DƯƠNG
KHÔI PHỤC HÌNH DẠNG ẢNH VÀ ỨNG DỤNG
LUẬN VĂN THẠC SỸ KHOA HỌC MÁY TÍNH
Chuyên ngành : Khoa học máy tính
Mã số
: 60 48 01
Thái Nguyên, năm 2011
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
http://www.lrc-tnu.edu.vn
Luận văn thạc sỹ: “Khôi phục hình dạng ảnh và ứng dụng”
MỤC LỤC
MỤC LỤC ...................................................................................................................1
LỜI CAM ĐOAN .......................................................................................................4
LỜI CẢM ƠN .............................................................................................................5
Phần 1: PHẦN MỞ ĐẦU ............................................................................................6
1. Giới thiệu tổng quan về đề tài .............................................................................6
2. Lý do chọn đề tài .................................................................................................7
3. Bố cục của luận văn .............................................................................................7
Phần 2: NỘI DUNG ....................................................................................................9
Chƣơng 1: KHÁI QUÁT VỀ XỬ LÝ ẢNH VÀ KHÔI PHỤC ẢNH ....................9
1.1. Một số khái niệm cơ bản trong xử lý ảnh .....................................................9
1.1.1. Xử lý ảnh ................................................................................................9
1.1.2. Các vấn đề cơ bản trong xử lý ảnh .......................................................10
1.1.2.1. Một số khái niệm cơ bản ...............................................................10
1.1.2.2. Nắn chỉnh biến dạng ......................................................................10
1.1.2.3 Khử nhiễu .......................................................................................11
1.1.2.4. Chỉnh mức xám .............................................................................11
1.1.2.5. Trích chọn đặc điểm ......................................................................11
1.1.2.6. Nhận dạng......................................................................................12
1.1.2.7. Nén ảnh..........................................................................................13
1.1.3. Thu nhận và biểu diễn ảnh ...................................................................13
1.1.3.1. Thu nhận, các thiết bị thu nhận ảnh. .............................................13
1.1.3.2. Biểu diễn ảnh .................................................................................14
1.2. Khôi phục ảnh .............................................................................................16
1.2.1. Khái niệm khôi phục ảnh .....................................................................16
1.2.2. Định nghĩa khôi phục ảnh ....................................................................16
1.2.3. Các nguồn biến dạng ............................................................................17
1.2.4.Các kỹ thuật khôi phục ảnh ...................................................................17
1.2.5. Các mô hình quan sát và tạo ảnh .........................................................17
1.2.5.1. Mô hình quan sát ...........................................................................17
1.2.5.2. Mô hình nhiễu ...............................................................................18
1.2.5.3. Các bộ lọc ......................................................................................19
1.2.5.4. Khôi phục ảnh bằng phƣơng pháp bình phƣơng tối thiểu .............20
Chƣơng 2: CÁC KỸ THUẬT KHÔI PHỤC HÌNH DẠNG ẢNH .......................21
2.1. Phép biến đổi ảnh ........................................................................................21
2.1.1. Hệ tọa độ Barycentric và phép nội suy Affine .....................................21
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
1
http://www.lrc-tnu.edu.vn
Luận văn thạc sỹ: “Khôi phục hình dạng ảnh và ứng dụng”
2.1.1.1.Hệ tọa độ Barycentric .....................................................................21
2.1.1.2. Phép nội suy Affine .......................................................................22
2.1.2. Phép biến đổi ảnh Morphing ................................................................ 23
2.1.2.1. Mục đích ........................................................................................23
2.1.2.2. Khái niệm ......................................................................................23
2.1.3. Một số thuật toán biến đổi ảnh thƣờng gặp .........................................23
2.1.3.1.Thuật toán bóp méo ảnh( Image Warping) ....................................23
2.1.3.2. Thuật toán thay đổi kích thƣớc ảnh.(Image Scale) .......................24
2.1.3.3. Thuật toán quay ảnh (Image Rotate) .............................................25
2.1.3.4. Thuật toán xoáy ảnh, cuộn (Image Fun) .......................................26
2.2. Thuật toán bóp méo ảnh .............................................................................27
2.2.1. Giới thiệu .............................................................................................27
2.2.2. Thuật toán bóp méo ảnh .......................................................................30
2.2.2.1. Ý tƣởng cơ bản của thuật toán ......................................................30
2.2.2.2. Xây dựng thuật toán ......................................................................31
2.3. Một số kỹ thuật thƣờng dùng trong bóp méo ảnh ......................................32
2.3.1. Kỹ thuật xếp chồng ảnh .......................................................................32
2.3.2. Kỹ thuật nắn chỉnh ...............................................................................33
2.3.3. Kỹ thuật cải tiến ...................................................................................35
2.3.4. Kỹ thuật dựa trên các điểm tƣơng đƣơng.............................................36
Chƣơng 3: CHƢƠNG TRÌNH THỬ NGHIỆM ....................................................37
3.1. Bài toán biến đổi hình dạng ảnh .................................................................37
3.1.1. Giới thiệu bài toán ................................................................................37
3.1.2. Xây dựng thuật toán. ............................................................................38
3.2. Chƣơng trình thử nghiệm............................................................................40
3.2.1. Các khối modul chính trong chƣơng trình ...........................................40
3.2.1.1. Khối đọc và thao tác ảnh ...............................................................40
3.2.1.2. Khối thực hiện biến đổi ảnh dựa trên điểm đặc trƣng ...................40
3.2.1.2.1. Hàm tính tọa độ Barycentric của M đối với ba điểm P1, P2, P3 ....41
3.2.1.3. Khối hiển thị kết quả ảnh ..............................................................48
3.2.2. Giao diện chƣơng trình. .......................................................................49
3.2.2.1. Giao diện chính của chƣơng trình .................................................49
3.2.2.2. Giao diện khi tiếp nhận một ảnh đầu vào ......................................49
3.2.2.3. Giao diện khi tiếp nhận hai ảnh đầu vào .......................................49
3.2.2.4. Giao diện khi đọc các điểm đặc trƣng từ tệp .................................50
3.2.2.5. Giao diện thực hiện nội suy khôi phục hình dạng ảnh ..................50
3.2.3. Kết quả chạy thử nghiệm .....................................................................52
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
2
http://www.lrc-tnu.edu.vn
Luận văn thạc sỹ: “Khôi phục hình dạng ảnh và ứng dụng”
3.2.3.1. Bộ ảnh của em Hằng lúc 6 tuổi và lúc 18 tuổi. .............................52
3.2.3.2. Bộ ảnh của bác Lộng lúc 35 tuổi và lúc 65 tuổi. ...........................53
3.2.3.3. Bộ ảnh của một ngƣời Nhật lúc 7 tuổi và lúc 45 tuổi. ..................53
Phần 3: PHẦN KẾT LUẬN ......................................................................................54
1. Các kết quả đạt đƣợc .........................................................................................54
2. Hƣớng phát triển của đề tài ...............................................................................55
TÀI LIỆU THAM KHẢO .........................................................................................55
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
3
http://www.lrc-tnu.edu.vn
Luận văn thạc sỹ: “Khôi phục hình dạng ảnh và ứng dụng”
LỜI CAM ĐOAN
Tôi xin cam đoan luận văn “Khôi phục hình dạng ảnh và ứng dụng” là công
trình nghiên cứu của riêng tôi dƣới sự hƣớng dẫn của PGS.TS. Đỗ Năng Toàn. Các
số liệu, hình ảnh đƣợc sử dụng trong luận văn cũng nhƣ các kết quả nghiên cứu
đƣợc trình bày trong luận văn là trung thực.
VŨ VĂN DƢƠNG
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
4
http://www.lrc-tnu.edu.vn
Luận văn thạc sỹ: “Khôi phục hình dạng ảnh và ứng dụng”
LỜI CẢM ƠN
Để hoàn thành luận văn này, em xin bày tỏ lòng biết ơn sâu sắc đến cô giáo
TS. Nguyễn Thị Hồng Minh đã tận tình hƣớng dẫn trong suốt quá trình em thực
hiện luận văn.
Em chân thành cảm ơn quý Thầy, Cô trong Trƣờng Đại học Công nghệ
thông tin & truyền thông - Đại học Thái Nguyên; quý Thầy, Cô trong Việc công
nghệ thông tin đã tận tình truyền đạt kiến thức cho chúng em trong 2 năm học tập
và nghiên cứu. Với vốn kiến thức đƣợc tiếp thu trong quá trình học không chỉ là nền
tảng cho quá trình nghiên cứu luận văn này mà còn là hành trang quí báu, nền tảng
vững chắc để em tiếp tục nghiên cứu, hoạt động trong lĩnh vực công nghệ thông tin.
Cuối cùng em kính chúc quý Thầy, Cô sức khỏe, hạnh phúc và thành công
hơn nữa trong cuộc sống.
Trân trọng cảm ơn!
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
5
http://www.lrc-tnu.edu.vn
Luận văn thạc sỹ: “Khôi phục hình dạng ảnh và ứng dụng”
Phần 1: PHẦN MỞ ĐẦU
1. Giới thiệu tổng quan về đề tài
Khôi phục ảnh là một lĩnh vực phát triển trong xử lý ảnh nói riêng và trong
ngành đồ họa nói chung. Kỹ thuật dùng để khôi phục ảnh: “Kỹ thuật nắn chỉnh biến
dạng hình học ảnh – thực hiện biến đổi ảnh”.
Nắn chỉnh ảnh là một kỹ thuật đƣợc sử dụng nhiều trong đồ hoạ máy tính. Nó
đóng vai trò quan trọng trong một số ngành nhƣ: ánh xạ bề mặt, biến hình, tạo bề
mặt,…Ngoài ra, các kết quả của nó còn có nhiều ý nghĩa trong các ngành xử lý ảnh,
cảm ứng từ xa, thƣ giãn-giải trí,…
Nắn chỉnh ảnh thực hiện việc biến đổi hình học giữa hai ảnh: ảnh nguồn và
ảnh đích. Sự biến đổi hình học định nghĩa mối quan hệ giữa các điểm ảnh nguồn và
điểm ảnh đích. Mối quan hệ này có thể đƣợc xác định bằng các hàm toán học đƣợc
áp dụng trên toàn bộ ảnh hoặc chỉ trên một vùng ảnh nào đó. Trong nhiều trƣờng
hợp ngoài việc xác định các hàm toán học nắn chỉnh ảnh, phải xác định thêm các
đặc trƣng sử dụng trong quá trình nắn chỉnh.
Có rất nhiều tiêu chí để phân lớp các thuật toán nắn chỉnh ảnh. Nếu phân
chia theo luồng dữ liệu biến đổi thì có thể phân lớp nắn chỉnh ảnh ra thành 2 lớp:
các phƣơng pháp tính xuôi và các phƣơng pháp tính ngƣợc. Trong các phƣơng pháp
tính xuôi, các điểm ảnh trên ảnh nguồn đƣợc xử lý theo từng dòng quét và các kết
quả đƣợc thiết lập trên ảnh đích. Trong khi đó các phƣơng pháp tính ngƣợc ánh xạ
ngƣợc các điểm ảnh đích tới các điểm ảnh nguồn. Đối với các ảnh số thì việc thực
thi theo các phƣơng pháp tính xuôi thƣờng không cho kết quả tốt. Do vậy, hầu hết
các thuật toán hiện nay đều là các phƣơng pháp tính ngƣợc.
Nếu phân biệt theo miền tác động của thuật toán nắn chỉnh thì ta có 2
phƣơng pháp: phƣơng pháp tác động toàn cục và phƣơng pháp tác động cục bộ.
Phƣơng pháp tác động toàn cục là phƣơng pháp áp dụng thuật toán, tiêu chí nhƣ
nhau đối với mọi điểm ảnh. Đối với phƣơng pháp cục bộ thì việc nắn chỉnh ảnh chỉ
áp dụng trên một số vùng ảnh, các vùng khác đƣợc giữ nguyên.
Các thuật toán nắn chỉnh toàn cục có tốc độ xử lý tƣơng đối nhanh, tuy nhiên
chỉ áp dụng đƣợc đối với các yêu cầu đơn giãn nhƣ co, giãn ảnh, nắn chỉnh cả ảnh
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
6
http://www.lrc-tnu.edu.vn
Luận văn thạc sỹ: “Khôi phục hình dạng ảnh và ứng dụng”
thành hình tứ giác hay một số hiệu ứng khác nhƣ mắt cá, kính núp,…Thuật toán nắn
chỉnh ảnh cục bộ là thuật toán cho kết quả ấn tƣợng hơn. Tuy nhiên, để có thể bóp
méo cục bộ theo từng vùng thì nó đòi hỏi phải xác định thêm tập các đặc trƣng. Đặc
trƣng này có thể tập các đoạn thẳng, điểm, lƣới tam giác,…Ngoài ra, việc xây dựng
thuật toán cũng tƣơng đối phức tạp.
2. Lý do chọn đề tài
Cùng với sự phát triển của Multimedia, với khối lƣợng hình ảnh và phim lƣu
trữ ngày càng lớn, cùng với sự phát triển vƣợt bậc của các thiết bị điện tử, tin học và
viễn thông đã thu hút khá nhiều chuyên gia đi vào nghiên cứu những công cụ cung
cấp cho việc lấy thông tin từ dữ liệu là các file ảnh.
Khi máy tính ra đời việc xử lý thông tin bằng hình ảnh ngày càng trở nên phổ
biến. Ngày nay, thông tin hình ảnh đóng vai trò ngày càng quan trọng trong việc
trao đổi thông tin, bởi phần lớn thông tin mà con ngƣời thu đƣợc là qua thị giác.
Bên cạnh đó, lƣợng dữ liệu là video số tăng lên cùng với việc ứng dụng đa phƣơng
tiện trong giáo dục, giải trí, kinh doanh, y tế,…Thực tế này đặt ra bài toán: giảm
dung lƣợng video và tăng tốc độ xử lý, tổ chức lƣu trữ và tìm kiếm video hiệu quả,
hiểu nội dung video, nhận dạng đối tƣợng trong video. Một trong những lĩnh vực
giúp thực hiện đƣợc vấn đề này chính là xử lý ảnh.
Xuất phát từ mục đích trên, em đã xây dựng đề tài: “Khôi phục hình dạng
ảnh và ứng dụng”. Thuật toán biến đổi ảnh là sự kết hợp của các thuật toán biến
đổi ảnh truyền thống đó là: thuật toán trộn ảnh, thuật toán biến đổi ảnh Morphing và
phép nội suy tam giác Barycentric. Kết quả cuối cùng, là việc áp dụng các thuật
toán trên để xây dựng hệ thống nội suy ảnh với ảnh đầu vào sẽ cho ra ảnh đích là
các góc nhìn khác nhau của ảnh gốc.
Ứng dụng này đƣợc xây dựng cũng đã góp phần giải quyết đƣợc vấn đề tốn
kém dung lƣợng bộ nhớ khi lƣu trữ dữ liệu là các file ảnh. Bởi vì, chúng ta chỉ cần
lƣu trữ ít nhất hai ảnh đầu vào thay vì phải lƣu trữ một chuỗi các hình ảnh ở từng
góc nhìn khác nhau.
3. Bố cục của luận văn
Phần mở đầu: Nêu lý do chọn đề tài và bố cục luận văn
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
7
http://www.lrc-tnu.edu.vn
Luận văn thạc sỹ: “Khôi phục hình dạng ảnh và ứng dụng”
Nội dung:
CHƢƠNG 1: KHÁI QUÁT VỀ XỬ LÝ ẢNH VÀ KHÔI PHỤC ẢNH
1.1. Một số khái niệm cơ bản trong xử lý ảnh.
1.2. Tổng quan về khôi phục ảnh.
CHƢƠNG 2: CÁC KỸ THUẬT KHÔI PHỤC HÌNH DẠNG ẢNH
2.1. Phép biến đổi ảnh
2.1.1. Hệ tọa độ Barycentric và phép nội suy Affine
2.1.2. Phép biến đổi ảnh Morphing
2.1.3. Các thuật toán biến đổi ảnh thƣờng gặp
2.1.3.1.Thuật toán bóp méo ảnh ( Image Warping)
2.1.3.2. Thuật toán thay đổi kích thước ảnh. (Image Scale)
2.1.3.3. Thuật toán quay ảnh (Image Rotate)
2.1.3.4. Thuật toán xoáy ảnh, cuộn (Image Fun)
2.2. Các kỹ thuật thƣờng dùng trong khôi phục hình dạng ảnh
2.2.1. Kỹ thuật xếp chồng ảnh
2.2.2. Kỹ thuật nắn chỉnh
2.2.4. Kỹ thuật dựa trên các điểm tƣơng đƣơng
2.3. Thuật toán bóp méo ảnh áp dụng vào khôi phục hình dạng ảnh.
2.3.1. Giới thiệu.
2.3.2. Thuật toán bóp méo ảnh áp dụng vào khôi phục ảnh
2.3.2.1. Ý tưởng cơ bản của thuật toán
2.3.2.2. Xây dựng thuật toán
CHƢƠNG 3: CHƢƠNG TRÌNH THỬ NGHIỆM
3.1. Bài toán biến đổi hình dạng ảnh ứng dụng cho khôi phục ảnh
3.1.1. Giới thiệu bài toán
3.1.2. Xây dựng thuật toán
3.2. Chƣơng trình thử nghiệm
3.2.1. Các khối modul chính trong chƣơng trình
3.2.2. Giao diện chƣơng trình.
3.2.3. Kết quả chạy thử nghiệm
Phần kết luận: Tóm tắt các kết quả đạt đƣợc, hƣớng phát triển tiếp
Tài liệu tham khảo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
8
http://www.lrc-tnu.edu.vn
Luận văn thạc sỹ: “Khôi phục hình dạng ảnh và ứng dụng”
Phần 2: NỘI DUNG
Chƣơng 1: KHÁI QUÁT VỀ XỬ LÝ ẢNH VÀ KHÔI PHỤC ẢNH
1.1. Một số khái niệm cơ bản trong xử lý ảnh
1.1.1. Xử lý ảnh
Con ngƣời thu nhận thông tin qua các giác quan, trong đó thị giác
đóng vai trò quan trọng nhất. Những năm trở lại đây với sự phát triển của phần
cứng máy tính, xử lý ảnh và đồ hoạ đó phát triển một cách mạnh mẽ và có nhiều
ứng dụng trong cuộc sống. Xử lý ảnh và đồ hoạ đóng một vai trò quan trọng
trong tƣơng tác ngƣời máy.
Quá trình xử lý ảnh đƣợc xem nhƣ là quá trình thao tác ảnh đầu vào
nhằm cho ra kết quả mong muốn. Kết quả đầu ra của một quá trình xử lý ảnh có
thể là một ảnh “tốt hơn” hoặc một kết luận.
ẢNH TỐT
HƠN
XỬ LÝ
ẢNH
ẢNH
KẾT LUẬN
Hình 1.1.1.1. Quá trình xử lý ảnh
Ảnh có thể xem là tập hợp các điểm ảnh và mỗi điểm ảnh đƣợc xem nhƣ
là đặc trƣng cƣờng độ sáng hay một dấu hiệu nào đó tại một vị trí nào đó của đối
tƣợng trong không gian và nó có thể xem nhƣ một hàm n biến P(c1, c2,..., cn). Do
đó, ảnh trong xử lý ảnh có thể xem nhƣ ảnh n chiều.
Sơ đồ tổng quát của một hệ thống xử lý ảnh:
Hệ quyết đinh
Thu nhận
ảnh (Scaner,
camera,
Sensor)
Tiền xử
lý
Trích chọn
đặc trƣng
Đối sánh
rút ra kết
luận
Hậu xử lý
Lƣu trữ
Hình 1.1.1.2. Sơ đồ tổng quát của xử lý ảnh
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
9
http://www.lrc-tnu.edu.vn
Luận văn thạc sỹ: “Khôi phục hình dạng ảnh và ứng dụng”
1.1.2. Các vấn đề cơ bản trong xử lý ảnh
1.1.2.1. Một số khái niệm cơ bản
*. Ảnh và điểm ảnh
Điểm ảnh đƣợc xem nhƣ là dấu hiệu hay cƣờng độ sáng tại 1 toạ độ
trong không gian của đối tƣợng và ảnh đƣợc xem nhƣ là 1 tập hợp các điểm
ảnh.
*. Mức xám và màu: Là số các giá trị có thể có của các điểm ảnh của ảnh.
1.1.2.2. Nắn chỉnh biến dạng
Ảnh thu nhận đƣợc thƣờng bị các biến dạng do các thiết bị quang học và điện
tử.
P’
i i)
f(
P
Pi
Ảnh thu nhận
Ảnh mong muốn
Hình 1.1.2.2. Ảnh thu nhận và ảnh mong muốn
Để khắc phục ngƣời ta sử dụng các phép chiếu, các phép chiếu thƣờng
đƣợc xây dựng trên tập các điểm điều khiển.
Có 2 ảnh gốc và ảnh đích, tập các điểm điều khiển của chúng là: (Pi,Pi’) với i
= 1 n
n
Ta đi tìm hàm f: Pi f(Pi ) sao cho
f p p
i 1
i
'
i
2
min
Giả sử ảnh bị biến đổi chỉ bao gồm: Tịnh tiến, quay, tỷ lệ, biến dạng bậc nhất
tuyến tính. Khi đó hàm f có dạng:
f(x,y)= (a1x + b1y + c1 , a2x + b2y + c2 )
Ta có:
= ni=1 [ (a1xi + b1yi + c1 – xi’ )2 + ( a2xi + b2yi + c2 - yi’ )2]
Để đạt min thì :
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
10
http://www.lrc-tnu.edu.vn
Luận văn thạc sỹ: “Khôi phục hình dạng ảnh và ứng dụng”
0
a
1
0
b1
0
c1
n
n
n
n
2
'
a
x
b
x
y
c
x
1 i 1 i i 1 i xi xi
i 1
i 1
i 1
i 1
n
n
n
n
2
'
a1 xi y i b1 y i c1 y i y i xi
i 1
i 1
i 1
i 1
n
n
n
'
a1 xi b1 y i nc1 xi xi
i 1
i 1
i 1
Giải hệ phƣơng trình tuyến tính tìm đƣợc: a1 , b1, c1
Tƣơng tự tìm đƣợc: a2 , b2 , c2
Tìm ra hàm f
1.1.2.3 Khử nhiễu
Có 2 loại nhiễu cơ bản trong quá trình thu nhận ảnh
- Nhiễu hệ thống: Là nhiễu có quy luật có thể khử bằng các phép biến đổi.
- Nhiễu ngẫu nhiên: Vết bẩn không rõ nguyên nhân Khắc phục bằng các
phép lọc.
1.1.2.4. Chỉnh mức xám
Nhằm khắc phục tính không đồng đều của hệ thống gây ra. Thông thƣờng có
hai hƣớng tiếp cận:
- Giảm số mức xám: Thực hiện bằng cách nhóm các mức xám gần nhau
thành một bó. Trƣờng hợp chỉ có 2 mức xám thì chính là chuyển về ảnh đen trắng.
Ứng dụng để in ảnh màu ra máy in đen trắng.
- Tăng số mức xám: Thực hiện nội suy ra các mức xám trung gian bằng kỹ
thuật nội suy. Kỹ thuật này nhằm tăng cƣờng độ mịn cho ảnh.
1.1.2.5. Trích chọn đặc điểm
Các đặc điểm của đối tƣợng đƣợc trích chọn tuỳ theo mục đích nhận dạng
trong quá trình xử lý ảnh. Có thể nêu ra một số đặc điểm của ảnh sau đây:
- Đặc điểm không gian: Phân bố mức xám, phân bố xác suất, biên độ, điểm
uốn, v.v..
- Đặc điểm biến đổi: Các đặc điểm loại này đƣợc trích chọn bằng việc thực
hiện lọc vùng (zonal filtering). Các bộ vùng đựoc gọi là “mặt nạ đặc điểm” (feature
mask) thƣờng là các khe hẹp với hình dạng khác nhau (chữ nhật, tam giác, cung
tròn, v.v..)
- Đặc điểm biên và đƣờng biên: Đặc trƣng cho đƣờng biên của đối tƣợng và
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
11
http://www.lrc-tnu.edu.vn
Luận văn thạc sỹ: “Khôi phục hình dạng ảnh và ứng dụng”
do vậy rất hữu ích trong việc trích trọn các thuộc tính bất biến đƣợc dùng khi nhận
dạng đối tƣợng. Các đặc điểm này có thể đƣợc trích chọn nhờ toán tử gradient, toán
tử la bàn, toán tử Laplace, toán tử “chéo không” (zero crossing) v.v..
Việc trích chọn hiệu quả các đặc điểm giúp cho việc nhận dạng các đối
tƣợng ảnh chính xác, với độ tính toán cao và dung lƣợng nhớ lƣu trữ giảm xuống.
1.1.2.6. Nhận dạng
Nhận dạng tự đông (automatic recognition), mô tả đối tƣợng, phân loại và
phân nhóm các mẫu là những vấn đề quan trọng trong thị giác máy, đƣợc ứng
dụng trong nhiều ngành khoa học khác nhau. Tuy nhiên, một câu hỏi đặt ra là:
mẫu (pattern) là gì? Watanabe, một trong những ngƣời đi đầu trong lĩnh vực này
đã định nghĩa: “Ngƣợc lại với hỗn loạn (chaos), mẫu là một thực thể (entity), đƣợc
xác định một cách ang áng (vaguely defined) và có thể gán cho nó một tên gọi nào
đó”. Ví dụ mẫu có thể là ảnh của vân tay, ảnh của một vật nào đó đƣợc chụp, một
chữ viết, khuôn mặt ngƣời hoặc một ký đồ tín hiệu tiếng nói. Khi biết một mẫu
nào đó, để nhận dạng hoặc phân loại mẫu đó có thể:
Hoặc phân loại có mẫu (supervised classification), chẳng hạn phân tích
phân biệt (discriminant analyis), trong đó mẫu đầu vào đƣợc định danh nhƣ một
thành phần của một lớp đã xác định.
Hoặc phân loại không có mẫu (unsupervised classification hay
clustering) trong đó các mẫu đƣợc gán vào các lớp khác nhau dựa trên một tiêu
chuẩn đồng dạng nào đó. Các lớp này cho đến thời điểm phân loại vẫn chƣa biết
hay chƣa đƣợc định danh.
Hệ thống nhận dạng tự động bao gồm ba khâu tƣơng ứng với ba giai đoạn
chủ yếu sau đây:
1. Thu nhận dữ liệu và tiền xử lý.
2. Biểu diễn dữ liệu.
3. Nhận dạng, ra quyết định.
Bốn cách tiếp cận khác nhau trong lý thuyết nhận dạng là:
1 Đối sánh mẫu dựa trên các đặc trƣng đƣợc trích chọn.
2. Phân loại thống kê.
3. Đối sánh cấu trúc.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
12
http://www.lrc-tnu.edu.vn
Luận văn thạc sỹ: “Khôi phục hình dạng ảnh và ứng dụng”
4. Phân loại dựa trên Nơ-ron nhân tạo.
Trong các ứng dụng rõ ràng là không thể chỉ dùng có một cách tiếp cận
đơn lẻ để phân loại “tối ƣu” do vậy cần sử dụng cùng một lúc nhiều phƣơng
pháp và cách tiếp cận khác nhau. Do vậy, các phƣơng thức phân loại tổ hợp hay
đƣợc sử dụng khi nhận dạng và nay đã có những kết quả có triển vọng dựa trên
thiết kế các hệ thống lai (hybrid system) bao gồm nhiều mô hình kết hợp.
Việc giải quyết bài toán nhận dạng trong những ứng dụng mới, nảy
sinh trong cuộc sống không chỉ tạo ra những thách thức về thuật giải, mà còn đặt
ra những yêu cầu về tốc độ tính toán. Đặc điểm chung của tất cả những ứng dụng
đó là những đặc điểm đặc trƣng cần thiết thƣờng là nhiều, không thể do chuyên
gia đề xuất, mà phải đƣợc trích chọn dựa trên các thủ tục phân tích dữ liệu.
1.1.2.7. Nén ảnh
Nhằm giảm thiểu không gian lƣu trữ. Thƣờng đƣợc tiến hành theo cả hai
cách khuynh hƣớng là nén có bảo toàn và không bảo toàn thông tin. Nén
không bảo toàn thì thƣờng có khả năng nén cao hơn nhƣng khả năng phục hồi
thì kém hơn. Trên cơ sở hai khuynh hƣớng, có 4 cách tiếp cận cơ bản trong nén
ảnh:
Nén ảnh thống kê: Kỹ thuật nén này dựa vào việc thống kê tần xuất xuất
hiện của giá trị các điểm ảnh, trên cơ sở đó mà có chiến lƣợc mã hóa thích hợp.
Một ví dụ điển hình cho kỹ thuật mã hóa này là *.TIF
Nén ảnh không gian: Kỹ thuật này dựa vào vị trí không gian của các
điểm ảnh để tiến hành mã hóa. Kỹ thuật lợi dụng sự giống nhau của các điểm ảnh
trong các vùng gần nhau. Ví dụ cho kỹ thuật này là mã nén *.PCX
Nén ảnh sử dụng phép biến đổi: Đây là kỹ thuật tiếp cận theo hƣớng
nén không bảo toàn và do vậy, kỹ thuật thƣớng nến hiệu quả hơn. *.JPG chính là
tiếp cận theo kỹ thuật nén này.
Nén ảnh Fractal: Sử dụng tính chất Fractal của các đối tƣợng ảnh, thể
hiện sự lặp lại của các chi tiết. Kỹ thuật nén sẽ tính toán để chỉ cần lƣu trữ phần
gốc ảnh và quy luật sinh ra ảnh theo nguyên lý Fractal
1.1.3. Thu nhận và biểu diễn ảnh
1.1.3.1. Thu nhận, các thiết bị thu nhận ảnh.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
13
http://www.lrc-tnu.edu.vn
Luận văn thạc sỹ: “Khôi phục hình dạng ảnh và ứng dụng”
Các thiết bị thu nhận ảnh bao gồm camera, scanner các thiết bị thu nhận
này có thể cho ảnh đen trắng
Các thiết bị thu nhận ảnh có 2 loại chính ứng với 2 loại ảnh thông
dụng Raster, Vector.
Các thiết bị thu nhận ảnh thông thƣờng Raster là camera các thiết bị thu
nhận ảnh thông thƣờng Vector là sensor hoặc bàn số hoá Digitalizer hoặc đƣợc
chuyển đổi từ ảnh Raster.
Nhìn chung các hệ thống thu nhận ảnh thực hiện 1 quá trình
Cảm biến: biến đổi năng lƣợng quang học thành năng lƣợng điện
Tổng hợp năng lƣợng điện thành ảnh
1.1.3.2. Biểu diễn ảnh
Ảnh trên máy tính là kết quả thu nhận theo các phƣơng pháp số hoá
đƣợc nhúng trong các thiết bị kỹ thuật khác nhau. Quá trình lƣu trữ ảnh nhằm
2 mục đích:
+ Tiết kiệm bộ nhớ
+ Giảm thời gian xử lý
Việc lƣu trữ thông tin trong bộ nhớ có ảnh hƣởng rất lớn đến việc hiển thị,
in ấn và xử lý ảnh đƣợc xem nhƣ là 1 tập hợp các điểm với cùng kích thƣớc nếu
sử dụng càng nhiều điểm ảnh thì bức ảnh càng đẹp, càng mịn và càng thể hiện rõ
hơn chi tiết của ảnh ngƣời ta gọi đặc điểm này là độ phân giải.
Việc lựa chọn độ phân giải thích hợp tuỳ thuộc vào nhu cầu sử dụng và
đặc trƣng của mỗi ảnh cụ thể, trên cơ sở đó các ảnh thƣờng đƣợc biểu diễn theo
2 mô hình cơ bản
1.1.3.2.1. Biểu diễn ảnh theo mô hình Raster
Đây là cách biểu diễn ảnh thông dụng nhất hiện nay, ảnh đƣợc biểu diễn
dƣới dạng ma trận các điểm (điểm ảnh). Thƣờng thu nhận qua các thiết bị
nhƣ camera, scanner. Tuỳ theo yêu cầu thực thế mà mỗi điểm ảnh đƣợc biểu
diễn qua 1 hay nhiều bít
Mô hình Raster thuận lợi cho hiển thị và in ấn. Ngày nay công nghệ
phần cứng cung cấp những thiết bị thu nhận ảnh Raster phù hợp với tốc độ nhanh
và chất lƣợng cao cho cả đầu vào và đầu ra. Một thuận lợi cho việc hiển thị
trong môi trƣờng Windows là Microsoft đƣa ra khuôn dạng ảnh DIB (Device
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
14
http://www.lrc-tnu.edu.vn
Luận văn thạc sỹ: “Khôi phục hình dạng ảnh và ứng dụng”
Independent Bitmap) làm trung gian. Hình 1.4 thể hình quy trình chung để hiển
thị ảnh Raster thông qua DIB.
Một trong những hƣớng nghiên cứu cơ bản trên mô hình biểu diễn này là
kỹ thuật nén ảnh các kỹ thuật nén ảnh lại chia ra theo 2 khuynh hƣớng là nén bảo
toàn và không bảo toàn thông tin nén bảo toàn có khả năng phục hồi hoàn toàn
dữ liệu ban đầu còn nếu không bảo toàn chỉ có khả năng phục hồi độ sai số
cho phép nào đó. Theo cách tiếp cận này ngƣời ta đã đề ra nhiều quy cách khác
nhau nhƣ BMP, TIF, GIF, PCX…
Hiện nay trên thế giới có trên 50 khuôn dạng ảnh thông dụng bao gồm cả
trong đó các kỹ thuật nén có khả năng phục hồi dữ liệu 100% và nén có khả năng
phục hồi với độ sai số nhận đƣợc.
Paint
BMP
PCC
DIB2
Cửa sổ
Thay đổi
Hình 1.1.3.2.1. Quá trình hiển thị và chỉnh sửa, lƣu trữ ảnh thông qua DIB
1.1.3.2.2. Biểu diễn ảnh theo mô hình Vector
Biểu diễn ảnh ngoài mục đích tiết kiệm không gian lƣu trữ dễ dàng cho
hiển thị và in ấn còn đảm bảo dễ dàng trong lựa chọn sao chép di chuyển tìm
kiếm… Theo những yêu cầu này kỹ thuật biểu diễn vector tỏ ra ƣu việt hơn.
Trong mô hình vector ngƣời ta sử dụng hƣớng giữa các vector của
điểm ảnh lân cận để mã hoá và tái tạo hình ảnh ban đầu ảnh vector đƣợc thu nhận
trực tiếp từ các thiết bị số hoá nhƣ Digital hoặc đƣợc chuyển đổi từ ảnh Raster
thông qua các chƣơng trình số hoá.
Công nghệ phần cứng cung cấp những thiết bị xử lý với tốc độ nhanh và
chất lƣợng cho cả đầu vào và ra nhƣng lại chỉ hỗ trợ cho ảnh Raster.
Do vậy, những nghiên cứu về biểu diễn vectơ đều tập trung từ chuyển đổi
từ ảnh Raster.
RASTER
Vector
hóa
VECTOR
Raster
hóa
RASTER
Hình 1.1.3.2.2. Sự chuyển đổi giữa các mô hình biểu diễn ảnh
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
15
http://www.lrc-tnu.edu.vn
Luận văn thạc sỹ: “Khôi phục hình dạng ảnh và ứng dụng”
1.2. Khôi phục ảnh
1.2.1. Khái niệm khôi phục ảnh
Khôi phục ảnh là phục hồi lại ảnh gốc so với ảnh ghi đƣợc đã bị biến dạng.
Nói cách khác, khôi phục ảnh là các kỹ thuật cải thiện chất lƣợng những ảnh ghi
đảm bảo gần đƣợc nhƣn thật khi ảnh bị méo.
Để khôi phục đƣợc ảnh có kết quả, điều cần thiết là phải biết đƣợc các
nguyên nhân, các hàm (hay dạng) gây ra biến dạng ảnh. Các nguyên nhân biến
dạng thƣơng do:
+ Do camera, đầu thuảnh chất lƣợng kém.
+ Do môi trƣờng, ánh sáng, hiện trƣờng (scene), khí quyển, nhiễu xung.
+ Do chất lƣợng.
1.2.2. Định nghĩa khôi phục ảnh
Kỹ thuật khôi phục ảnh có thể đƣợc xác định nhƣ việc ƣớc lƣợng lại ảnh
gốc hay ảnh lý tƣởng từảnh quan sát đƣợc bằng cách đo ngƣợc lại những hiện
tƣợng gây biếndạng, qua đó ảnh đƣợc chụp. Nhƣ vậy, kỹ thuật khôi phục ảnh đòi
hỏi kiến thức về các hiện tƣợng gây biến dạng ảnh.
Mô hình chung: Hầu hết các mô hình xác định ảnh gốc (mô hình tuyến
tính, phi tuyến, khả biến, bất biến trong không gian) đều dựa trên hàm đáp ứng
xung hai chiều h(m, n) (hay còn gọi là hàm trái điểm PSF (Point-Spread Function)
nhƣ sau:
N 1 M 1
vm, n u m, n hm k , n l m, n
(1.2.2-1)
k 0 l 0
Trong đó:
u(m,n) là ảnh gốc; m 0, M 1, n 0, N 1
v(m,n) là ảnh ghi đƣợc.
h(m-k,n-l) hàm đáp ứng xung 2 chiều; l 0, M 1, k 0, N 1
Viết (1.2.2-1) ở dạng Vecto ma trận ta có:
V Hu
(1.2.2-2)
Ở đây u,v,η là các véctơ MxN chiều, H là ma trận khối vòng MN × MN
chiều; hàm h hoặc ma trận H mô tả quá trình biến dạng, nhƣng trong quá trình tạo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
16
http://www.lrc-tnu.edu.vn
Luận văn thạc sỹ: “Khôi phục hình dạng ảnh và ứng dụng”
(hay quá trình hình thành: formation) ảnh nên còn gọi là ma trận biến dạng trong
quá trình khôi phục.
1.2.3. Các nguồn biến dạng
Về mặt phƣơng pháp, các nguồn tạo biến dạng có thể nhóm lại theo các xử
lý nhƣ sau:
- Biến dạng điểm.
- Biến dạng không gian
- Biến dạng thƣờng (Temporal)
- Biến dạng màu sắc (Chromatic)
Do quá trình tạo ảnh ghi đƣợc liên quan đến điểm ảnh xung quanh, chúng
ta tập trung xét các biến dạng trong không gian. Một số ví dụ điển hình của biến
dạng không gian đƣợc xem xét nhƣ sau.
- Nhiễu loạn của khí quyển (thiên văn) giữa các ống kính thu và đối tƣợng
trong quá trình chụp ảnh. Do sai số hệ thống (hệ phi tuyến).
-Sai lệch hệ thống có thể biểu diễn bằng sai lệch hàm truyền (ví dụ: sự dịch
pha hàm truyền cohenent trong quang học…)
1.2.4.Các kỹ thuật khôi phục ảnh
- Mô hình khôi phục ảnh có: mô hình tạo ảnh, mô hình gây nhiễu, mô hình
quan sát.
- Lọc tuyến tính có: lọc ngƣợc, đáp ứng xung, lọc hữu hạn FIR.
- Các kỹ thuật khác: Entropy cực đại, mô hình Bayes, giải chập.
1.2.5. Các mô hình quan sát và tạo ảnh
1.2.5.1. Mô hình quan sát
Đầu tiên, cần xem xét ảnh đƣợc hình thành nhƣ thế nào; sau đó biến đổi
ngƣợc (thực hiện lọc ngƣợc) khử nhiễu để thu lại ảnh nguyên thủy.
Từ phƣơng trình biến đổi tín hiệu ảnh có nhiễu, chúng ta có thể viết:
vm, n g wm, n m, n
(1.2.5.1-1)
Với w(m, n) là đầu ra của hệ thống tuyến tính với đáp ứng hai chiều h(m,
n) ta có
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
17
http://www.lrc-tnu.edu.vn
Luận văn thạc sỹ: “Khôi phục hình dạng ảnh và ứng dụng”
w(m, n) u m, n hm k , n l
(1.2.5.1-2)
Nhiễu η (m, n) có thể gồm hai phần: nhiễu tích η1(m, n) , nhiễu cộng η 2
(m.n) đều đƣợc giả thiết là nhiễu trắng Gauss độc lập tƣơng hỗ với trung bình 0:
m, n f g wm, n1 m, n 2 m, n
(1.2.5.1-3)
Trong đó: các hàm g(.), f(.) là các biến đổi (nói chung là phi tuyến) đặc
trƣng cho quá trình phát hiện và lƣu trữ ảnh. Từ (1.2.5.1-3) mô hình đó đƣợc biễu
diễn theo hình khối nhƣ sau:
U(m,n)
h(m,n)
w(m,n)
∑
g(.)
1 (m ,n) 2 (m ,n)
f(.)
∑
X
v(m,n)
∑
Hình 1.2.5.1. Quá trình phát hiện và lƣu trữ ảnh
1.2.5.2. Mô hình nhiễu
Mô hình nhiễu là mô hình tổng quát. Trong hệ thống cụ thể nhƣ quang điện,
mô hình nhiễu gây biến dạng đƣợc biểu diễn cụ thể nhƣ sau:
m, n g m, n 1 m, n 2 m, n
(1.2.5.2-1)
Trongđó 1 m, n là nhiễu phụ thuộc thiết bị,ở đ ó xảy ra việc truyềnđiện tử
ngẫu nhiên. Việc truyềnđiện tử ngẫu nhiên thƣờngđƣợc biểu diễn bằng phân bổ
Poisson (một số trƣờng hợp phân bổ nhiễu này tiệm cận đến phân bổ Gauss). Do
phân bổ Poisson có sai lệch bằng nhau nên nếu 1 có sai lệch là đơn vị thì thành
phần sai lệch gắn liền với 1 là . Thành phần 2 m, n biểu diễn gây ra do nhiệt
và thƣờng đƣợc mô hình hóa theo nhiễu trắng.
- Một số mô hình không gian ảnh hƣởng nhiệt một cách đáng kể do đó nhƣ
hệ thống phim
m, n g m, n 1 m, n
(1.2.5.2-2)
- Mô hình phim khác
m, n eg m, n21 m, n
(1.2.5.2-3)
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
18
http://www.lrc-tnu.edu.vn
Luận văn thạc sỹ: “Khôi phục hình dạng ảnh và ứng dụng”
Trong đó e 1 / 3;1 / 2 là hệ số chuẩn hóa
*. Tính khoảng cách gần đúng: Các thành phần bị nhiễu 1 m, n tác động
gây khó khăn cho việc khôi phục ảnh. Để giải quyết theo phƣơng pháp tƣơng đƣơng
(hay gần đúng) ngƣời ta dùng giá trị trung bình không gian w thay cho w.
w W m, n
(1.2.5.2-4)
Khi đó:
m, n f g w 1 m, n 2 m, n
(1.2.5.2-5)
Và m, n trở thành mô hình nhiễm trắng Gauss.
Nhiễu đốm: Ngoài một số mô hình trên ảnh còn có thể bị biến dạng bởi
nhiễu đốm (Specke Noise). Nhiễu đốm xảy ra nếu bề mặt đối tƣợng có bị lồi lõm
dạng bức sóng và tăng mức độ nếu đối tƣợng đó có độ phân giải thấp. Mô hình
nhiễu đốm có thể đƣợc mô tả nhƣ sau:
vm, n um, nsm, n m, n
(1.2.5.2-6)
1.2.5.3. Các bộ lọc
Các kỹ thuật lọc ngƣợc (Invese Filter)
U(m,n)
W(m,n)
h(.,.)
V(m,n)
g-1(.,.)
g(.,.)
W’(m,n
)
U(m,n)
h-1(.,.)
Hình 1.2.5.3. Kỹ thuật lọc ngƣợc
g T x g 1 g x Với
g 1 x x
h T x, y, k , l h 1 x, y, k , l
(3-47)
(3-48)
FT h T x, y, l hk , l; k , l x k , y l
(3-49)
k 1
Việc thiết kế bộ lọc ngƣợc khá khó khăn, do đó chuyển sang biến đổi
Fourier 2 về (3-49).
Chú ý rằng: H w1 , w2 H T w1 , w2 1
Do đó: H T w1 , w2 1 H w , w
1
2
Trong đó biến đổi ngƣợc Fourier của H w1 , w2 là h(x,y). Nhƣ vậy ta tìm
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
19
http://www.lrc-tnu.edu.vn
- Xem thêm -