TRƯỜNG ĐẠI HỌC KHOA HỌC HUẾ
KHOA CÔNG NGHỆ THÔNG TIN
# "
GIÁO TRÌNH
Người soạn: TS. NGUYỄN ĐĂNG BÌNH
HUẾ, 9 - 2011
LỜI MỞ ĐẦU
Xử lý ảnh số là một trong những lĩnh vực phát triển rất nhanh của ngành Công nghệ
thông tin. Trong những năm trở lại đây, phần cứng máy tính và các thiết bị liên
quan xử lý ảnh số đã có sự tiến bộ vượt bậc về tốc độ tính toán, khả năng lưu trữ và
xử lý đã thúc đầy nghiên cứu xử lý ảnh số ngày một đẩy mạnh trong cả lý thuyết và
ứng dụng. Khái niệm ảnh số đã trở nên thông dụng với hầu hết mọi người trong xã
hội và việc thu nhận ảnh số bằng các thiết bị cá nhân hay chuyên dụng cùng với
việc đưa vào máy tính xử lý đã trở nên đơn giản. Nó được ứng dụng rộng rãi trong
nhiều lĩnh vực khoa học và công nghệ. Chẵng hạn như thị giác máy tính, rô bốt, tìm
kiếm tài liệu ảnh, hỗ trợ chẩn đoán hình ảnh y học, thiết kế ảnh, giải trí... xử lý ảnh
số bằng máy tính đã giúp chúng ta thay đổi cách cảm nhận và sử dụng máy tính, nó
đã trở thành những công cụ trực quan quan trọng không thể thiếu trong đời sống
hằng ngày. Vì vậy môn “xử lý ảnh số” đã trở thành một trong những môn học chính
trong các chuyên ngành Công nghệ thông tin ở các trường đại học trên cả nước. Với
mong muốn đóng góp vào sự nghiệp đào tạo và nghiên cứu trong lĩnh vực này, tác
giả biên soạn cuốn giáo trình Xử lý ảnh số dựa trên đề cương môn học hệ tín chỉ đã
được duyệt. Cuốn sách tập trung vào các vấn đề từ cơ bản đến nâng cao của xử lý
ảnh nhằm cung cấp một nền tảng kiến thức đầy đủ và chọn lọc nhằm giúp người đọc
có thể tự tìm hiểu và xây dựng các chương trình ứng dụng liên quan trong xử lý
ảnh.
Cuốn sách “Giáo trình xử lý ảnh số” được biên soạn theo sát nội dung chương
trình đào tạo cử nhân Công nghệ thông tin. Nội dung của giáo trình tập trung vào
các vấn đề cơ bản của xử lý ảnh nhằm cung cấp một nền tảng kiến thức đầy đủ và
chọn lọc nhằm giúp người đọc có thể tự tìm hiểu, tự học và nắm được những kiến
thức từ cơ bản đến nâng cao của xử lý ảnh số, trên cơ sở đó có thể tiếp tục tự nghiên
cứu sâu hơn cũng như giúp cho sinh viên xây dựng các chương trình liên quan đến
xử lý ảnh, những thư viện cho riêng mình và phát triển các phần mềm ứng dụng xử
lý ảnh cao hơn.
Giáo trình được chia làm 6 chương, sau mỗi chương đều có phần bài tập để
kiểm tra kiến thức và rèn luyện khả năng lập trình cho bạn đọc. Chương 1, trình bày
tổng quan về xử lý ảnh, các ứng dụng của xử lý ảnh số, các khái niệm cơ bản, sơ đồ
tổng quát của một hệ thống xử lý ảnh và các vấn đề cơ bản trong xử lý ảnh. Chương
2 trình bày về quá trình thu nhận, số hóa, biểu diễn và lưu trữ ảnh. Chương 3, trình
bày các kỹ thuật nâng cao chất lượng ảnh dựa vào các thao tác với điểm ảnh, nâng
cao chất lượng ảnh thông qua việc xử lý các điểm ảnh trong lân cận điểm ảnh đang
xét. Chương này cũng trình bày các kỹ thuật nâng cao chất lượng ảnh nhờ vào các
phép lọc không gian làm trơn, và lọc làm nét. Chương 4 giáo trình trình bày về các
ý tưởng và một số phương pháp cơ bản sử dụng trong khôi phục ảnh như ước lược
sự xuống cấp. bộ lọc Wiener, phục hồi ảnh dựa vào thích nghi. Chương 5, trình bày
các kỹ thuật cơ bản trong việc trích chọn dấu hiệu đặc trưng của ảnh, kỹ thuật tìm
xương theo khuynh hướng tính toán trục trung vị và hướng tiếp cận xấp xỉ nhờ các
thuật toán làm mảnh song song và gián tiếp. Phát hiện biên và tách biên ảnh của các
đối tượng ảnh theo cả hai khuynh hướng: Phát hiện biên trực tiếp và phát hiện biên
gián tiếp và các phương pháp phân vùng ảnh. Cuối cùng là Chương 6 trình bày về
nén ảnh, các khái niệm cơ bản của nén ảnh, nét dữ liệu ảnh có mất mát thông tin và
nén không mất mát thông tin, các phương pháp nén cơ bản như nén mã loạt dài thay
đổi (RLC), nén Huffman và nén LZW.
Tác giả bày tỏ lòng biết ơn chân thành tới các bạn đồng nghiệp trong Bộ môn
Khoa học máy tính, Khoa công nghệ thông tin, trường Đại học Khoa học Huế đã
động viên, góp ý và giúp đỡ để hoàn chỉnh nội dung cuốn sách này. Xin cám ơn
Lãnh đạo Khoa Công nghệ thông tin, Ban giám hiệu Đại học Khoa học, Ban Giám
đốc Đại học Huế và Dựa án đào tạo cán bộ tin học và đưa tin học vào nhà trường
thuộc CTMTQG GD & ĐT năm 2011 đã hỗ trợ và tạo điều kiện để cho ra đời giáo
trình này.
Mặc dù rất cố gắng nhưng tài liệu này chắc chắn không tránh khỏi những sai
sót. Chúng tôi xin trân trọng tiếp thu tất cả những ý kiến đóng góp của bạn đọc cũng
như các bạn đồng nghiệp để có chỉnh lý kịp thời.
Thư góp ý xin gửi về:
Nguyễn Đăng Bình
Khoa Công nghệ thông tin – ĐH Khoa Học Huế.
77 Nguyễn Huệ, Thành phố Huế.
Điện thoại: 0543.826767
Email:
[email protected]
Huế, ngày 27 tháng 9 năm 2011
TÁC GIẢ
MỤC LỤC
Chương 1 - TỔNG QUAN VỀ XỬ LÝ ẢNH SỐ
1.1. Giới thiệu về xử lý ảnh ............................................................................................ 2
1.1.1. Xử lý ảnh số là gì................................................................................................. 4
1.1.2. Lịch sử của xử lý ảnh........................................................................................... 6
1.2. Các ứng dụng của xử lý ảnh ................................................................................... 8
1.2.1. Ảnh gamma........................................................................................................ 10
1.2.2. Ảnh X quang...................................................................................................... 11
1.2.3. Ảnh trong dải nhìn thấy được và ảnh hồng ngoại.............................................. 11
1.2.4. Ảnh trong dải sóng radio ................................................................................... 12
1.3. Các bước cơ bản của xử lý ảnh ............................................................................ 13
1.4. Một số khái niệm cơ bản về xử lý ảnh ................................................................. 15
1.4.1. Ảnh số là gì? ...................................................................................................... 15
1.4.2. Phần tử ảnh ........................................................................................................ 15
1.4.3. Mức xám ............................................................................................................ 16
1.4.4. Độ phân giải của ảnh ......................................................................................... 17
1.4.5. Biểu diễn ảnh ..................................................................................................... 17
1.4.6. Tăng cường, nâng cao chất lượng ảnh............................................................... 18
1.4.7. Khôi phục ảnh.................................................................................................... 18
1.4.8. Biến đổi ảnh ....................................................................................................... 19
1.4.9. Phân tích ảnh...................................................................................................... 19
1.4.10. Nhận dạng ảnh ................................................................................................. 20
1.4.11. Tra cứu ảnh ...................................................................................................... 22
1.4.12. Nén ảnh ............................................................................................................ 22
1.5. Một số quan hệ cơ bản giữa các điểm ảnh .......................................................... 23
1.5.1. Lân cận của điểm ảnh ........................................................................................ 23
1.5.2. Tính liền kề, tính liên thông, vùng và biên........................................................ 24
1.5.3. Thuật toán tìm các thành phần liên thông.......................................................... 26
1.5.4. Độ đo khoản cách giữa các điểm ....................................................................... 28
Câu hỏi ôn tập ............................................................................................................... 30
Chương 2- THU NHẬN, SỐ HÓA, BIỂU DIỄN, LỮU TRỮ ẢNH
2.1. Cấu trúc mắt người ............................................................................................... 31
2.2. Sự hình thành ảnh trong mắt người ................................................................... 34
2.3. Ánh sáng và phổ điện từ của ảnh sáng ............................................................... 35
2.4. Cảm biến và thu nhận ảnh ................................................................................... 36
2.4.1. Thu nhận ảnh sử dụng thiết bị cảm biến............................................................ 37
2.4.2. Mô hình tạo ảnh đơn giản .................................................................................. 38
2.5. Lấy mẫu và lượng hóa .......................................................................................... 40
2.5.1. Các khái niệm cơ bản trong lấy mẫu và lượng hóa ........................................... 40
2.5.2. Biểu diễn ảnh số................................................................................................. 43
2.5.3. Độ phân giải không gian và độ phân giải cấp xám............................................ 44
2.6. Các không gian màu thông dụng ........................................................................ 46
2.6.1. Màu sắc .............................................................................................................. 46
2.6.2. Tổng hợp màu .................................................................................................... 47
2.6.3. Không gian biểu diễn màu và hệ tọa độ màu .................................................... 47
2.6.4. Một số kỹ thuật hiển thị màu ............................................................................. 55
2.7. Một số mô hình và phương pháp biểu diễn ảnh ................................................ 56
2.7.1. Mô hình Raster................................................................................................... 56
2.7.2. Mô hình Vector.................................................................................................. 57
2.7.3. Một số phương pháp biểu diễn ảnh ................................................................... 57
2.8. Các loại định dạng tập tin cơ bản ....................................................................... 59
2.8.1. Khái niệm chung................................................................................................ 59
2.8.2. Quá trình đọc một tệp ảnh ................................................................................. 59
Câu hỏi ôn tập ............................................................................................................... 60
Chương 3 - NÂNG CAO CHẤT LƯỢNG ẢNH
3.1. Kiến thức cơ sở ...................................................................................................... 62
3.2. Các toán tử xử lý điểm ảnh................................................................................... 65
3.2.1. Phép biến đổi âm bản......................................................................................... 68
3.2.2. Phép biến đổi Log .............................................................................................. 69
3.2.3. Phép biến đổi lũy thừa ....................................................................................... 69
3.2.4. Các hàm biến đổi tuyến tính từng phần ............................................................. 73
3.3. Xử lý lược đồ mức xám ......................................................................................... 37
3.3.1. Cân bằng lược đồ mức xám ............................................................................... 77
3.3.2. Biến đổi độ tương phản dựa trên biến đổi lược đồ mức xám ............................ 81
3.4. Lọc tuyến tính ........................................................................................................ 81
3.5. Các bộ lọc không gian làm trơn ........................................................................... 87
3.5.1. Lọc tuyến tính làm trơn ..................................................................................... 87
3.5.2. Lọc thống kê thứ tự............................................................................................ 91
3.6. Các bộ lọc không gian tăng cường độ nét............................................................ 92
3.6.1. Khái niệm bộ lọc dựa trên đạo hàm................................................................... 92
3.6.2. Toán tử đạo hàm bậc nhất.................................................................................. 95
3.6.3. Toán tử đạo hàm bậc hai.................................................................................... 98
3.7. Cải thiện nâng cao chất lượng ảnh .................................................................... 102
3.6.1. Tăng cường ảnh sử dụng toán tử số học và logic ............................................ 102
3.6.1.1. Phép trừ ảnh .................................................................................................. 104
3.6.1.2. Phép trung bình ảnh ...................................................................................... 105
3.6.2. Tăng cường biên ảnh ....................................................................................... 107
Bài tập.......................................................................................................................... 107
Chương 4 - KHÔI PHỤC ẢNH
4.1. Giới thiệu .............................................................................................................. 112
4.2. Một số phương pháp khôi phục ảnh .................................................................. 113
4.2.1. Ước lượng sự xuống cấp.................................................................................. 113
4.2.2. Làm giảm nhiễu cộng ngẫu nhiên.................................................................... 115
4.2.2.1. Bộ lọc Wiener ............................................................................................ 115
4.2.2.2. Các biến thể của bộ lọc Wiener ................................................................. 120
4.2.2.3. Xử lý ảnh thích nghi .................................................................................. 122
4.2.2.4. Bộ lọc Wiener thích nghi........................................................................... 126
4.2.2.5. Phục hồi ảnh thích nghi dựa vào hàm rõ nhiễu ......................................... 131
4.2.2.6. Phục hồi ảnh thích nghi nhậy biên............................................................. 136
4.2.3. Giảm nhòe ảnh ................................................................................................. 140
Chương 5 - PHÂN TÍCH ẢNH
5.1. Trích chọn dấu hiệu đặc trưng của ảnh ............................................................ 145
5.1.1. Đặc trưng Topo................................................................................................ 145
5.1.1.1. Lược đồ phân bố mức xám ........................................................................ 145
5.1.1.2. Các vùng thuần nhất .................................................................................. 146
5.1.2. Đặc trưng về hình dạng.................................................................................... 145
5.1.2.1. Đặc trưng hình học .................................................................................... 145
5.1.2.2. Đặc trưng độ lệch cơ sở ............................................................................. 146
5.2. Xương và các kỹ thuật tìm xương...................................................................... 154
5.2.1. Giới thiệu ......................................................................................................... 154
5.2.2. Tìm xương dựa trên làm mảnh ........................................................................ 155
5.2.2.1. Sơ lược về thuật toán làm mảnh ................................................................ 155
5.2.2.2. Một số thuật toán làm mảnh ...................................................................... 156
5.2.3. Tìm xương không dựa trên làm mảnh ............................................................. 157
5.2.3.1. Khái quát về lược đồ Voronoi ................................................................... 157
5.2.3.2. Trục trung vị Voronoi rời rạc .................................................................... 158
5.2.3.3. Xương Voronoi rời rạc .............................................................................. 157
5.2.3.4. Thuật toán tìm xương................................................................................. 157
5.3. Phát hiện và trích chọn biên ảnh........................................................................ 163
5.3.1. Giới thiệu ......................................................................................................... 163
5.3.2. Các phương pháp phát hiện biên trực tiếp....................................................... 164
5.3.2.1. Kỹ thuật phát hiện biên Gradient............................................................... 164
5.3.2.1.1. Kỹ thuật Prewitt................................................................................... 166
5.3.2.1.2. Kỹ thuật Sobel ..................................................................................... 167
5.3.2.1.3. Kỹ thuật la bàn..................................................................................... 166
5.3.2.2. Kỹ thuật phát hiện biên Laplace ............................................................... 167
5.3.2.3. Kỹ thuật Canny ......................................................................................... 167
5.3.3. Các phương pháp phát hiện biên gián tiếp ...................................................... 164
5.3.3.1. Một số khái niệm cơ bản........................................................................... 170
5.3.3.2. Chu tuyến của một đối tượng ................................................................... 171
5.3.3.3. Thuật toán dò biên tổng quát .................................................................... 173
5.3.4. Phương pháp phát hiện biên dựa vào trung bình cục bộ ................................. 176
5.3.4.1. Biên và độ biến đổi về mức xám .............................................................. 176
5.3.4.2. Phát hiện biên dựa vào trung bình cục bộ................................................. 177
5.3.5. Phát hiện biên dựa vào các phép toán hình thái............................................... 176
5.3.5.1. Xấp xỉ trên và xấp xỉ dưới đối tượng ảnh ................................................. 180
5.4. Phân vùng ảnh ..................................................................................................... 183
5.4.1. Khái quát chung ............................................................................................... 183
5.4.2. Thuộc tính điểm ảnh, vùng ảnh ....................................................................... 186
5.4.3. Phân vùng ảnh theo ngưỡng biên độ ............................................................... 187
5.4.4. Phân vùng ảnh theo miền đồng nhất................................................................ 189
5.4.5. Phân vùng ảnh dựa vào phát triển vùng cục bộ ............................................... 189
5.4.6. Phân vùng ảnh dựa trên hợp và tách vùng....................................................... 191
5.4.7. Phân vùng ảnh dựa trên phân tích kết cấu ....................................................... 192
5.4.8. Phân vùng ảnh dựa trên sự phân lớp điểm ảnh................................................ 196
5.4.9. Phân vùng ảnh dựa vào lý thuyết đồ thị .......................................................... 198
5.4.10. Phân vùng ảnh dựa trên xử lý đa phân giải ................................................... 208
Câu hỏi ôn tập ............................................................................................................. 210
Chương 6 - NÉN ẢNH
6.1. Tổng quan về nén dữ liệu.................................................................................... 212
6.1.1. Khái niệm về nén ảnh ...................................................................................... 212
6.1.2. Phân loại dư thừa dữ liệu ................................................................................. 215
6.1.3. Phân loại phương pháp nén.............................................................................. 216
6.1.4. Sơ đồ của quá trình nén ảnh dựa trên phép biến đổi ảnh................................. 219
6.1.5. Ví dụ về phương pháp nén ảnh theo chuẩn JPEG ........................................... 219
6.2. Phương pháp nén ảnh mã độ dài thay đổi ........................................................ 222
6.3. Phương pháp nén ảnh Huffman......................................................................... 222
6.3.1. Ý tưởng ............................................................................................................ 222
6.3.2. Xây dựng cây mã Huffman.............................................................................. 230
6.3.3. Sử dụng cây mã Huffman ................................................................................ 234
6.3. Phương pháp nén ảnh LZW ............................................................................... 222
6.3.1. Giới thiệu ......................................................................................................... 222
6.3.2. Phương pháp .................................................................................................... 230
Câu hỏi ôn tập ............................................................................................................. 240
Tài liệu tham khảo...................................................................................................... 241
CHƯƠNG 1
TỔNG QUAN VỀ XỬ LÝ ẢNH SỐ
Chương này trình bày những vấn đề chính sau đây:
1.1 Giới thiệu về xử lý ảnh.
1.2 Các ứng dụng của xử lý ảnh
1.3 Các bước cơ bản trong xử lý ảnh
1.4 Một số khái niệm cơ bản về xử lý ảnh
1.5 Một số quan hệ cơ bản giữa các điểm ảnh
Mô hình quang trắc hình thành ảnh
Biểu đồ phân bố mức xám
Phân vùng ảnh
Cấu trúc ảnh từ chuyển động
Ảnh thu nhận (quả táo)
Trích lọc đặc tính (PCA, key point,…)
Phát hiện biên
Đối sánh, nhận dạng đối tượng
Hình minh họa một số ứng dụng cơ bản trong xử lý ảnh
Giáo trình xử lý ảnh số
1.1 Giới thiệu về xử lý ảnh
Xử lý ảnh là một lĩnh vực mang tính khoa học và công nghệ. Nó là một ngành
khoa học mới mẻ so với nhiều ngành khoa học khác nhưng tốc độ phát triển của nó
rất nhanh, kích thích các trung tâm nghiên cứu, ứng dụng, đặc biệt là máy tính
chuyên dụng riêng cho nó. Xử lý ảnh được đưa vào giảng dạy ở bậc đại học ở nước
ta khoảng chục năm nay. Nó là môn học liên quan đến nhiều lĩnh vực và cần nhiều
kiến thức cơ sở khác. Đầu tiên phải kể đến Xử lý tín hiệu số là một môn học hết sức
cơ bản cho xử lý tín hiệu chung, các khái niệm về tích chập, các biến đổi Fourier,
biến đổi Laplace, các bộ lọc hữu hạn… Thứ hai, các công cụ toán như Đại số tuyến
tính, Sác xuất, thống kê. Một số kiến thứ cần thiết như Trí tuệ nhân tao, Mạng nơ
ron nhân tạo cũng được đề cập trong quá trình phân tích và nhận dạng ảnh.
Cùng với ngôn ngữ tự nhiên, hình ảnh đã đóng một vai trò hết sức quan trọng
trong việc trao đổi thông tin. Tính trực quan của hình ảnh đã giúp cho con người
hiểu rõ và sâu sắc hơn các thông tin cần thu thập. Người ta đã chứng minh được
rằng, trong tất cả các kênh thu nhận thông tin của con người thì lượng thông tin thu
nhận qua kênh thị giác chiếm khoảng 70%. Hình ảnh là kết quả của việc thu nhận và
biểu diễn của năng lượng ánh sáng trải dài từ tia gamma (có bước sóng nhỏ) đến
sóng radio (có bước sóng lớn). Tuy nhiên, mắt người chỉ cảm nhận được một vùng
giới hạn rất nhỏ trong phổ điện từ. Ngược lại, máy tính có thể đọc được một vùng rất
rộng trong phổ điện từ, từ tia gamma đến sóng radio. Nó có thể biểu diễn và xử lý
những bức ảnh được sinh ra bởi những nguồn mà con người không thể nhận biết
được, như ảnh siêu âm, ảnh hồng ngoại, ảnh trong vùng tia X, …. Do đó xử lý ảnh
có một phạm vi ứng dụng tương đối rộng.
Xử lý ảnh là một trong những cách tiếp cận phân tích, tổng hợp hình ảnh theo ý
tưởng và mục đích của người sử dụng. Tuy xử lý ảnh là một trong những khoa học
còn tương đối mới so với nhiều ngành khoa học khác, song những năm gần đây, xử
lý ảnh và đồ hoạ đã phát triển một cách mạnh mẽ và đã gặt hái được khá nhiều thành
công góp phần vào sự phát triển chung của ngành công nghệ thông tin.
Chương 1 – Tổng quan về xử lý ảnh số
Trang 2
Giáo trình xử lý ảnh số
Các phương pháp xử lý ảnh bắt nguồn từ hai ứng dụng: nâng cao chất lượng
thông tin hình ảnh đối với mắt người và xử lý số liệu cho máy tự động. Một trong
những ứng dụng đầu tiên xử lý ảnh là nâng cao chất lượng ảnh báo truyền qua cáp
giữa London và NewYork vào những năm 1920. Thiết bị đặc biệt mã hóa hình ảnh
(báo), truyền qua cáp và khôi phục lại ở phía thu. Vấn đề nâng cao chất lượng hình
ảnh lúc đầu có liên quan đến việc lựa chọn quá trình in và phân bố các mức sáng
(tông và độ phân giải của ảnh).
Hệ thống đầu tiên (Bartlane) có khả năng mã hóa hình ảnh với 5 mức sáng. Khả
năng này tăng lên 15 mức vào 1929. Việc nâng cao chất lượng ảnh bằng các phương
pháp xử lý để truyền ảnh được nghiên cứu 35 năm sau đó. Do kỹ thuật máy tính phát
triển, nên xử lý hình ảnh ngày càng phát triển. Năm 1964, các bức ảnh chụp mặt
trăng được vệ tinh Ranger 7 (Mỹ) truyền về trái đất, được xử lý bằng máy tính để
sửa méo (gây ra do camera truyền hình đặt trên vệ tinh ở các góc độ khác nhau). Các
kỹ thuật cơ bản cho phép nâng cao chất lượng hình ảnh như làm nổi đường biên và
lưu hình ảnh.
Từ năm 1964 đến nay, phạm vi xử lý ảnh lớn mạnh không ngừng. Các kỹ thuật
xử lý ảnh hiện nay được sử dụng để giải quyết hàng loạt các vấn đề, nhằm nâng cao
chất lượng thông tin hình ảnh.
Trong y học, các thuật toán máy tính nâng cao độ tương phản, hoặc mã hóa các
mức sáng thành các màu để nội suy ảnh X-Quang và các hình ảnh y sinh học dễ
dàng. Các nhà địa vật lý sử dụng kỹ thuật tương tự để nghiên cứu các mẫu vật chất
từ vệ tinh. Các thuật toán nâng cao chất lượng ảnh và khôi phục hình ảnh được sử
dụng để xử lý hình ảnh giảm chất lượng. Trong thiên văn học, các phương pháp xử
lý ảnh nhằm khôi phục hình ảnh bị nhiễu hoặc bị mất do bóng (artifacts) sau khi
chụp. Trong vật lý và các lĩnh vực có liên quan, kỹ thuật máy tính nâng cao được
chất lượng ảnh trong các lĩnh vực như Plamas (có năng lượng cao) và microscopy
điện tử. Tương tự, người ta đã ứng dụng xử lý ảnh có kết quả tốt trong viễn thám,
sinh học, y tế hạt nhân, quân sự, công nghiệp... Nâng cao chất lượng và khôi phục
ảnh bị nhiễu là quá trình xử lý ảnh dùng cho mục đích nội suy của mắt người. Lĩnh
Chương 1 – Tổng quan về xử lý ảnh số
Trang 3
Giáo trình xử lý ảnh số
vực ứng dụng quan trọng thứ hai là xử lý ảnh số gắn liền với việc cảm nhận của
máy. Trong lĩnh vực thứ hai, các cố gắng đều tập trung vào các quá trình trích thông
tin ảnh và chuyển thành dạng thích hợp cho xử lý máy tính. Ví dụ như thông tin
dùng cho máy tính là các moments thống kê, các hệ số biến đổi Fourier và đo
khoảng cách nhiều chiều. Những vấn đề tiêu biểu của kỹ thuật xử lý ảnh được ứng
dụng nhiều trong thực tế, có thể kể như: tự động nhận dạng đặc trưng, máy nhìn
công nghiệp để điều khiển và kiểm tra sản phẩm, nhận dạng mục tiêu quân sự, tự
động xử lý vân tay, hiển thị lên màn hình ảnh X-Quang và các mẫu máu, xử lý bằng
máy các hình ảnh chụp từ vệ tinh để dự báo thời tiết, nén ảnh để lưu và truyền được
nhiều hơn tín hiệu ảnh trong thông tin, máy tính, truyền hình thông thường và truyền
hình có độ phân giải cao.
1.1.1 Xử lý ảnh số là gì
Xử lý ảnh số là một ngành khoa học nhằm trang bị phương pháp luận, kỹ thuật
để trang bị cho máy tính xử lý ảnh đầu vào trên máy tính với mục tiêu nhận được
ảnh kết quả ở đầu ra theo mong muốn của con người…. Như vậy xử lý ảnh là một
quá trình từ ảnh thu nhận đầu vào xử lý tăng cường và nâng cao chất lượng ảnh,
phân tích ảnh, hiểu ảnh, mã hóa, nén ảnh… cho đến khi thu nhận được ảnh kết quả
tốt hơn theo mong muốn của con người. Từ đó giúp cho con người có được cách
nhìn trực quan hơn và sinh động hơn về hình ảnh. Xử lý ảnh số còn là việc sử dụng
các thuật toán máy tính để xử lý các ảnh số dưới sự trợ giúp của máy tính.
Xử lý ảnh số có thể chia làm bốn lĩnh vực, tùy thuộc vào loại công việc. Đó là
cải thiện và nâng cao chất lượng ảnh, phục hồi ảnh, mã hóa ảnh, và hiểu ảnh. Trong
cải thiện và nâng cao chất lượng ảnh, ảnh được xử lý để xem, như trong truyền hình,
hoặc là được xử lý trước để trợ giúp hoạt động của máy móc, như trong nhận dạng
đối tượng. Trong phục hồi ảnh, ảnh bị xuống cấp một số trường hợp, chẳng hạn bị
nhòe, và mục đích là để giảm bớt hoặc loại bỏ hẳn ảnh hưởng sự xuống cấp. Phục
hồi ảnh có liên quan mật thiết đến cải thiện ảnh. Khi ảnh xuống cấp, việc cải thiện
ảnh thường đem lại kết quả làm giảm sự xuống cấp. Tuy nhiên có một số sự khác
nhau giữa phục hồi ảnh và cải thiện ảnh. Trong phục hồi ảnh, một số ảnh lý tưởng
Chương 1 – Tổng quan về xử lý ảnh số
Trang 4
Giáo trình xử lý ảnh số
thường bị xuống cấp và mục đích phục hồi là tạo ra ảnh sau xử lý giống như ảnh ban
đầu. Trong việc cải thiện ảnh, mục đích cải thiện ảnh là làm cho ảnh sau khi xử lý
trong đẹp hơn ảnh chưa xử lý. Để minh họa sự khác nhau này, hãy lưu ý rằng một
ảnh gốc chưa xuống cấp không thể phục chế hơn nữa nhưng vẫn có thể được cải
thiện bằng cách tăng độ nét. Trong mã hóa ảnh, mục đích là biểu diễn với một số ít
bít nhất trong điều kiện chất lượng ảnh và độ rõ chấp nhận được cho từng ứng dụng
cụ thể, chẳng hạn như hội nghị video. Mã hóa ảnh liên quan đến cải thiện ảnh và
phục hồi ảnh. Nếu có thể cải tiến dáng vẻ bên ngoài của ảnh được phục hồi, hoawjcl
àm giảm sự xuống cấp do các nguồn nhiễu, như nhiễu lượng tử mà thuật toán mã
hóa ảnh gây ra, thì ta có thể làm giảm số lượng bít cần thiết để đại diện ảnh ở một
mức chất lượng và độ rõ chấp nhận được. Trong việc hiểu (understanding) ảnh, đầu
vào là ảnh, mục đích là diễn đạt nội dung ảnh bằng một hệ ký hiệu nào đó. Những
ứng dụng của “hiểu ảnh” bao gồm thị giác máy tính, kỹ thuật rô bốt và nhận dạng
mục tiêu. “Hiểu ảnh” khác với ba lĩnh vực khác của xử lý ảnh ở một khía cạnh
chính. Trong cải tiến, phục hồi và mã hóa ảnh cả đầu vào và đầu ra đều là ảnh và
khâu xử lý tiến hiệu là phần then chốt của các hệ thông đã thành công trên các lĩnh
vực đó. Trong “hiểu ảnh”, đầu vào là ảnh, nhưng đầu ra thường là một biểu diễn
bằng ký hiệu nội dung của ảnh đầu vào. Sự phát triển thành công của các hệ thống
trong lĩnh vực này cần đến cả xử lý tín hiệu và những khái niệm trí tuệ nhân tạo.
Trong hệ “hiểu ảnh” điển hình, xử lý tín hiệu được dùng cho công việc xử lý mức
thấp như làm giảm sự xuống cấp và trích chọn các đường biên ảnh hoặc các đặc tính
khác của ảnh, còn trí tuệ nhân tạo được dùng cho những công việc xử lý mức cao
như thao tấc kí hiệu và quản lý cơ sở tri thức. Chúng ta chỉ nghiên cứu một số kỹ
thuật xử lý ở mức thấp dùng trong “hiểu ảnh”, coi như một bộ phận của cải thiện,
phục hồi và mã hóa ảnh. Nghiên cứu kỹ hơn về “hiểu ảnh” sẽ vượt qua phạm vi của
giáo trình này và sẽ được đề cập trong các giáo trình về thị giác máy tính và nhận
dạng tiếp theo.
Trong chương này, chúng tôi trình bày cơ sở của xử lý ảnh. Những cơ sở đó sẽ
đặt nền móng cho phần thảo luận về thu nhận, số hóa, biểu diễn, lưu trữ ảnh; cải
Chương 1 – Tổng quan về xử lý ảnh số
Trang 5
Giáo trình xử lý ảnh số
thiện và nâng cao chất lượng ảnh; khôi phục ảnh; phân tích ảnh và mã hóa, nén ảnh
trong các chương sau.
1.1.2 Lịch sử của xử lý ảnh
Ngành công nghiệp báo chí có thể được xem là ngành có ứng dụng đầu tiên của
xử lý ảnh khi những bức ảnh lần đầu tiên được gửi đi giữa hai thành phố London và
New York thông qua cáp Bartlane vào đầu những năm 1920. Trước đó, việc truyền
dữ liệu ảnh giữa hai thành phố này mất khoảng một tuần bằng đường biển. Từ khi có
cáp Bartlane, thời gian truyền dữ liệu ảnh xuyên qua Đại Tây Dương được giảm đi
rất nhiều - xuống chỉ còn chưa đầy 3 tiếng. Một thiết bị chuyên dụng đã mã hóa dữ
liệu ảnh trước khi truyền qua cáp, và sau đó, khi dữ liệu đến nơi sẽ được giải mã để
tái tạo lại bức ảnh ban đầu.
Hình 1.1. Ảnh số được tạo ra vào năm Hình 1.2. Ảnh số được tạo năm 1922 từ
1921 từ băng mã hóa của một máy in card đục lỗ sau 2 lần truyền qua
điện tín. (Nguồn: McFarlane)
Đại Tây Dương. (Nguồn: McFarlane)
Ảnh trong hình 1.1 và hình 1.2 được tạo ra từ các băng được đục lỗ bởi máy điện
tín (ở nơi nhận). Vấn đề đầu tiên trong việc cải thiện chất lượng hiển thị ảnh trong
những bức ảnh đầu tiên này là phương thức in ảnh và số cấp độ xám hiển thị.
Chương 1 – Tổng quan về xử lý ảnh số
Trang 6
Giáo trình xử lý ảnh số
Các hệ thống cáp Bartlane đầu tiên chỉ có khả năng mã hóa ảnh với 5 cấp độ
xám, khả năng này tăng lên 15 cấp độ xám vào năm 1929.
Hình 1.3. Ảnh 15 cấp độ xám được truyền từ Luân Đôn đến New York năm 1929.
(Nguồn: McFarlane)
Trong khoảng thời gian này, người ta chỉ nói đến ảnh số, chứ chưa đề cập đến xử
lý ảnh số, vì một lý do đơn giản là chưa có máy tính để xử lý nó. Do đó, có thể nói
rằng lịch sử của xử lý ảnh gắn liền với lịch sử phát triển của máy tính điện tử. Khả
năng lưu trữ, năng lực xử lý và hiển thị của máy tính là những nhân tố quan trọng
trong quá trình xử lý ảnh. Việc nâng cao chất lượng ảnh bằng các phương pháp xử
lý để truyền ảnh được liên tục nghiên cứu trong suốt 35 năm sau đó. Với sự phát
triển của kỹ thuật máy tính, việc xử lý hình ảnh ngày càng hoàn thiện hơn. Máy tính
đầu tiên đủ mạnh cho việc xử lý ảnh xuất hiện vào đầu những năm 1960. Năm 1964,
tàu thăm dò vũ trụ Ranger 7 của Jet Propulsion Laboratory (Pasadena, California,
USA) đã chụp được một bức ảnh của bề mặt mặt trăng.
Từ năm 1964 đến nay, phạm vi xử lý ảnh số lớn mạnh không ngừng. Trong y
học, các thuật toán nâng cao chất lượng hình ảnh, độ tương phản, hoặc mã hóa các
mức xám đã được áp dụng để nội suy ảnh X-quang và các hình ảnh y học giúp cho
việc chuẩn đoán và điều trị của các bác sĩ được thực hiện một cách dễ dàng và hiệu
quả hơn. Việc phát minh ra kỹ thuật CAT (Computerized Axial Tomography: chụp
cắt lớp điện toán theo trục) hay chụp CT (Computerized Tomography: chụp cắt lớp
điện toán) là một trong những sự kiện quan trọng trong ứng dụng của xử lý ảnh
trong việc chẩn đoán y học. Song song đó, các nhà địa vật lý, thiên văn học cũng sử
Chương 1 – Tổng quan về xử lý ảnh số
Trang 7
Giáo trình xử lý ảnh số
dụng kỹ thuật tương tự để nghiên cứu các mẫu vật chất từ ảnh vệ tinh, theo dõi tài
nguyên trái đất và thiên văn học.
Hình 1.4. Ảnh đầu tiên của mặt trăng được chụp bởi tàu vũ trụ Ranger 7 của Mỹ,
vào 9 giờ 09 phút sáng ngày 31/7/1964 (Nguồn: NASA).
1.2 Các ứng dụng của xử lý ảnh
Xử lý ảnh có nhiều ứng dụng trong thực tế. Một trong những ứng dụng sớm
nhất là xử lý ảnh từ nhiêm vụ Ranger 7 tại phòng thí nghiệm JetPulsion vào những
năm đầu của thập kỷ 60. Hệ thống chụp hình gắn trên tàu vũ trụ có một số hạn chế
về kích thước và trọng lượng, do đó ảnh nhận được bị giảm chất lượng như bị mờ,
méo hình học và nhiễu nền. Các ảnh đó được xử lý thành công nhờ máy tính số.
Hình ảnh của mặt trăng và sao hỏa mà chúng ta thấy trong tất cả các tạp chí đều
được xử lý bằng những máy tính số. Ngày nay, hầu hết các thông tin ảnh đều được
chuyển sang dạng ảnh số. Vì vậy, trong gần như tất cả các lĩnh vực của các ngành kỹ
thuật đều có ít nhiều liên quan đến ảnh số và sử dụng kỹ thuật xử lý ảnh số. Ứng
dụng của xử lý ảnh có khả năng tác động mạnh mẽ nhất đến cuộc sống của chúng ta
là lĩnh vực y tế. Soi chụp ảnh bừng máy tính dựa rteen cơ sở định lý cắt lớp (project
slice) được dùng thường xuyên trong xét nghiệm lâm sang, ví dụ phát hiện và nhận
dạng u não. Những ứng dụng y khoa khác của xử lý ảnh gồm cải thiện ảnh X quang
và nhận dạng đường biên mạch máu từ những ảnh chụp bằng tia X (angiograms).
Chương 1 – Tổng quan về xử lý ảnh số
Trang 8
Giáo trình xử lý ảnh số
Có những dụng khác gần gủi hơn với cuộc sông gia đình là cải tiến ảnh tivi.
Hình ảnh mà chúng ta thấy trên màn hình tivi có các khuyết tật do độ phân giải hạn
chế, bi rung rinh, có ảnh ma, nhiều nền và trượt hình do đan dòng ở những mức độ
khác nhau. Xử lý ảnh sô có tác động quyết định đến việc cải thiện chất lượng hình
ảnh của những hệ truyền hình hiện tại và làm phát triển những hệ truyền hình mới có
độ phân giải cao (HDTV). Một vấn đề nữa cúa chính truyền thông video như hội
nghị video, điện thoại video là cần có dải tần rộng. Việc mã hóa thẳng chương trình
video chất lượng quảng bá yêu cầu đến 100 triệu bit/giây. Nếu hy sinh một phần
chất lượng và dùng các sơ đô mã hóa ảnh số thì có thể đưa ra thị trường những hệ
truyền hình chất lượng đủ rõ với nhịp bit chỉ dưới 100 nghìn bit/giây.
Người máy càng ngày đóng vai trò quan trọng trong công nghiệp và gia đinh.
Chúng sẽ thực hiện những công việc rất nhàm chán hoặc nguy hiểm và những công
việc mà tốc độ và độ chính xác vượt quá khả năng của con người. Khi người máy trở
nên tinh vi hơn, thị giác máy tinh sẽ đóng vai trò ngày càng quan trọng. Người ta sẽ
đòi hỏi người máy không những phát hiện và nhận dạng các bộ phận công nghiệp,
mà còn “hiểu” được những gì chúng “thấy” và đưa ra những hành động phù hợp. Xử
lý ảnh số có tác động rất lớn đến thị giác máy tính.
Ngoài những lĩnh vực ứng dụng mọi người thường biết đến, xử lý ảnh số còn
có một số ứng dụng khác ít được nói đến hơn. Người thi hành pháp luật thương chụp
hình trong những môi trường không thuận lợi, và ảnh nhận được thường bị xuống
cấp. Ví dụ, bức ảnh chụp thường bị nhòe, việc làm giảm độ nhòe là cần thiết trong
nhận dạng.
Những ứng dụng của xử lý ảnh số là rất lớn. Ngoài những ứng dụng đã thảo
luận ở trên thì còn bao gồm các ứng dụng trong các lĩnh vực như điện tử gia đình,
thiên văn học, sinh vật học, vật lý, nông nghiệp, địa lý, nhân chủng học, và nhiều
lĩnh vực khác. Khả năng nhìn và nghe thấy hà hai phương tiện quan trọng nhất để
Chương 1 – Tổng quan về xử lý ảnh số
Trang 9
Giáo trình xử lý ảnh số
con người nhận thức thế giới bên ngoài, do vậy không có gì đáng ngạc nhiên khi mà
xử lý ảnh số có nhiều khả năng ứng dụng, không chỉ trong khoa học và kỹ thuật mà
còn cả trong mọi hoạt động khác của con người.
1.2.1 Ảnh gramma
(a)
(b)
Hình 1.5. Ví dụ về ảnh Gamma (a) Ảnh bộ xương người (b) Ảnh PET (Positron
Emission Tomography) (Nguồn: G.E. Medical Systems, Tiến sĩ Michael E.
Casey)
Ảnh gamma được sử dụng nhiều trong y học hạt nhân và thiên văn học. Trong y học
hạt nhân, người ta tiêm vào người bệnh nhân một đồng vị phóng xạ có thể phát ra tia
gamma (đồng vị phóng xạ này trong quá trình phát tin gamma sẽ tự phân hủy). Một
máy dò tia gamma đặt ở ngoài sẽ thu những tia phóng xạ này để tạo ra ảnh gamma.
Ảnh ở hình 1.5(a) thường được dùng trong việc xác định nhiễm trùng hay khối u
trong cơ thể người. Hình 1.5(b) được tạo ra bởi kỹ thuật chụp PET (Positrion
Emission Tomography: Quét cắt lớp phóng xạ ion dương). Nguyên tắc của kỹ thuật
này tương tự như trong chụp CT nhưng thay vì sử dụng nguồn tia X ngoài cơ thể,
bệnh nhân sẽ được tiêm vào một đồng vị phóng xạ có thể phóng các positron (ion
Chương 1 – Tổng quan về xử lý ảnh số
Trang 10
Giáo trình xử lý ảnh số
dương) trong quá trình tự phân hủy. Khi một positron sau khi bay khoảng 3-5mm sẽ
gặp một electron ở trong môi trường xung quanh, cả hai sẽ bị phân hủy và phát ra 2
tia gamma. Các tia này sẽ được hấp thụ bởi bộ dò tìm và ảnh 3D của bệnh nhân sẽ
được tạo ra theo cơ chế như chụp cắt lớp CT.
1.2.2 Ảnh X-quang
Kỹ thuật chụp bằng tia X sử dụng một ống phóng tia X (ống chân không) có
cathode và anode. Khi Cathode được làm nóng sẽ phóng ra các electron ở trạng thái
tự do, các electron này di chuyển với vận tốc cực lớn về phía anode (phía anode có
rất nhiều positron). Khi các electron đánh vào một nguyên tử thì năng lượng sẽ được
phát ra dưới dạng bức xạ tia X.
Kỹ thuật chụp CT: có một máy dò hình khung tròn bao quanh đối tượng (bệnh
nhân,…), một nguồn tia X được phóng ra và đi xuyên qua đối tượng. Tại mỗi vị trí
của đối tượng, khung này sẽ quay. Các tia X này sẽ được thu lại tại đầu bên kia của
khung. Khi đối tượng được di chuyển theo phương vuông góc với mặt phẳng của
khung, máy sẽ vẽ được các lớp của đối tượng. Các lớp này sẽ được tổ hợp lại và để
tạo nên hình ảnh không gian 3 chiều của đối tượng.
Hình 1.6. Chụp CT (Nguồn: Vietnamnet)
1.2.3 Ảnh trong dải nhìn thấy được và ảnh hồng ngoại
Các nhà khí tượng học sử dụng các ảnh vệ tinh trong vùng tia hồng ngoại để xác
định độ nóng của các vùng của khí quyển. Dữ liệu được chuyển thành một ảnh nhìn
Chương 1 – Tổng quan về xử lý ảnh số
Trang 11
Giáo trình xử lý ảnh số
thấy được bằng mắt thường, sau khi đã được nâng cao chất lượng và phối màu để
thể hiện các nhiệt độ khác nhau. Trong các ảnh đã được nâng cao chất lượng, màu
đỏ thường biểu diễn nhiệt độ cao (nóng), ngược lại màu tím thường biểu diễn nhiệt
độ thấp (lạnh).
Hình 1.7. Ảnh hồng ngoại của một cơn bão (Nguồn: Encarta)
1.2.4 Ảnh trong dải sóng radio
Hình 1.8. Ảnh cộng hưởng từ (MRI: Magnetic Resonance Imaging, Nguồn:
Encarta)
Hình 1.8 là ảnh chụp phần đầu của một người trưởng thành bình thường (không có
bệnh tật). Ta thấy rõ não, các đường và các mô mềm; tiểu não nằm ở giữa phía bên
trái, màu đỏ. Ảnh MRI: Sở dĩ có thể sử dụng kỹ thuật MRI cho con người vì trong
Chương 1 – Tổng quan về xử lý ảnh số
Trang 12
Giáo trình xử lý ảnh số
cơ thể người chứa rất nhiều “nam châm” sinh học (lưỡng cực điện: thay vì từ tính, ở
đây là điện tích). MRI tận dụng phân bố ngẫu nhiên của các proton, có từ tính cơ
bản. Khi bệnh nhân được đặt vào khung tròn từ tính, quá trình phân tích diễn ra theo
3 bước. Đầu tiên, MRI tạo một trạng thái bình thường (steady state) trong cơ thể
người bệnh bằng cách đưa người bệnh vào một từ trường đều mạnh khoảng 30.000
lần so với từ trường trái đất. Sau đó MRI kích thích cơ thể người bệnh bởi sóng
radio để thay đổi hướng của các photon đang ở trong trạng thái bình thường (steadystate orientation of photons). Sau một thời gian nó sẽ ngừng phát sóng radio và bắt
đầu “lắng nghe” sự phát sóng điện từ của cơ thể người bệnh tại một tần số nào đó
(được chọn trước). Tín hiện phát ra này được sử dụng để tạo ra hình ảnh của cơ thể
người theo nguyên lý tương tự như chụp cắt lớp CT.
1.3 Các bước cơ bản trong xử lý ảnh
Để dễ hình dung, xét các bước cần thiết trong xử lý ảnh. Đầu tiên, ảnh tự nhiên
từ thế giới ngoài được thu nhận qua các thiết bị thu (như Camera, máy chụp ảnh).
Trước đây, ảnh thu qua Camera là các ảnh tương tự (loại Camera ống kiểu CCIR).
Gần đây, với sự phát triển của công nghệ, ảnh màu hoặc đen trắng được lấy ra từ
Camera, sau đó nó được chuyển trực tiếp thành ảnh số tạo thuận lợi cho xử lý tiếp
theo. (Máy ảnh số hiện nay là một thí dụ gần gũi). Mặt khác, ảnh cũng có thể tiếp
nhận từ vệ tinh; có thể quét từảnh chụp bằng máy quét ảnh. Hình 1.1 dưới đây mô tả
các bước cơ bản trong xử lý ảnh.
Hình 1.9. Tổng quan các giai đoạn cơ bản trong xử lý ảnh
Chương 1 – Tổng quan về xử lý ảnh số
Trang 13