BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC LẠC HỒNG
_________________
TRẦN MINH TÂN
NGHIÊN CỨU KỸ THUẬT SVM TRONG
KIỂM SOÁT NỘI DUNG HÌNH ẢNH
LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN
Đồng Nai, Năm 2012
BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC LẠC HỒNG
____________________
TRẦN MINH TÂN
NGHIÊN CỨU KỸ THUẬT SVM TRONG
KIỂM SOÁT NỘI DUNG HÌNH ẢNH
Chuyên ngành: CÔNG NGHỆ THÔNG TIN
Mã số: 60.48.02.01
LUẬN VĂN THẠC SĨ NGÀNH CÔNG NGHỆ THÔNG TIN
NGƢỜI HƢỚNG DẪN KHOA HỌC:
PGS. TS ĐỖ NĂNG TOÀN
Đồng Nai, Năm 2012
LỜI CẢM ƠN
Tôi chân thành cảm ơn PGS.TS Đỗ Năng Toàn, thầy đã tận tình hƣớng
dẫn, giúp đỡ và đóng góp ý kiến cho tôi trong suốt quá trình thực hiện đề tài luận
văn.
Tôi chân thành cảm ơn các thầy, cô Khoa Công nghệ Thông tin - Trƣờng
Đại học Lạc Hồng và các thầy, cô khác đã tận tình giảng dạy, truyền đạt cho tôi
những kiến thức quý báu trong quá trình học tập.
Tôi chân thành cảm ơn các thầy cô phòng Sau đại học - Trƣờng Đại học
Lạc Hồng, các đồng nghiệp và các bạn học lớp Cao học Công nghệ thông tin
khoá 2 - Trƣờng Đại học Lạc Hồng đã hỗ trợ, tạo điều kiện thuận lợi cũng nhƣ
đóng góp những ý kiến thiết thực cho tôi trong suốt quá trình học tập và đặc biệt
đã giúp luận văn của tôi đƣợc hoàn thiện hơn.
Cuối cùng, tôi muốn gửi lời cảm ơn đến gia đình, những ngƣời thân yêu
luôn bên cạnh và động viên tôi trong suốt quá trình học tập và thực hiện đề tài
luận văn này.
Đồng Nai, ngày 21 tháng 9 năm 2012
Trần Minh Tân
LỜI CAM ĐOAN
Tôi xin cam đoan đây là công trình nghiên cứu độc lập của bản thân. Các
số liệu, kết quả trình bày trong luận văn này là trung thực. Những tƣ liệu đƣợc
sử dụng trong luận văn có nguồn gốc và trích dẫn rõ ràng, đầy đủ.
Tác giả
Trần Minh Tân
TÓM TẮT LUẬN VĂN
Tên đề tài luận văn: NGHIÊN CỨU KỸ THUẬT SVM TRONG KIỂM
SOÁT NỘI DUNG HÌNH ẢNH.
Học viên thực hiện: Trần Minh Tân
sinh ngày: 05/08/1980
Ngƣời hƣớng dẫn khoa học: PGS.TS Đỗ Năng Toàn.
1. Mục tiêu của luận văn:
Hiểu rõ lý thuyết về xử lý ảnh và kỹ thuật SVM trong kiểm soát nội dung
hình ảnh. Xây dựng ứng dụng phát hiện ảnh nghi ngờ là ảnh đen (ảnh đồi trụy).
2. Nội dung thực hiện:
- Tìm hiểu khái quát về xử lý ảnh và bài toán kiểm soát nội dung hình ảnh;
- Nghiên cứu một số vấn đề về SVM (Support vector machines) và ứng
dụng trong bài toán phát hiện, nhận dạng hình ảnh;
- Nghiên cứu một số đặc điểm của hình ảnh đen;
- Thiết kế, phát triển chƣơng trình thử nghiệm;
- Xây dựng báo cáo sơ bộ và hoàn chỉnh báo cáo.
3. Phƣơng pháp thực hiện:
- Nghiên cứu nội dung lý thuyết về xử lý ảnh trong giáo trình “Xử lý ảnh”
của PGS. TS. Đỗ Năng Toàn và TS. Phạm Việt Bình, năm 2008.
- Nghiên cứu các tài liệu trên mạng, sách và các luận văn thạc sĩ về kỹ
thuật SVM. Đối với phƣơng pháp SVM: gồm hai giai đoạn là huấn luyện và
nhận dạng:
Giai đoạn huấn luyện: Các ảnh mẫu đƣợc véc tơ hóa x =
{x1, . .,x100} rồi dùng phƣơng pháp PCA để rút trích đặc trƣng thành véc tơ y =
{y1, . .,y100} rồi đƣa vào bộ huấn luyện SVM.
Giai đoạn nhận dạng: Mẫu cần nhận dạng đƣợc cũng đƣợc véc tơ
hóa và rút trích nhƣ trên sau đó đƣa vào bộ nhận dạng SVM để xác định lớp cho
mẫu.
- Nghiên cứu những đặc điểm, đặc trƣng của “ảnh đen”.
- Thiết kế, phát triển và cài đặt thử nghiệm chƣơng trình ứng dụng.
4. Kết quả đạt đƣợc:
- Trình bày khái quát về xử lý ảnh và bài toán kiểm soát hình ảnh.
- Hệ thống hóa một số vấn đề về ứng dụng kỹ thuật SVM trong nhận dạng
hình ảnh.
- Cài đặt thử nghiệm chƣơng trình nhận dạng ảnh đen sử dụng kỹ thuật
SVM.
5. Hƣớng phát triển tiếp theo:
Phát triển thành chƣơng trình phát hiện ảnh “đen” trên máy tính cá nhân.
Tích hợp, phát triển thành ứng dụng phát hiện và lọc, chặn ảnh “đen” đối
với các Website. Đồng thời có thể thƣơng mại hóa ứng dụng phục vụ công tác
quản lý nhà nƣớc cho ngành thông tin và truyền thông cũng nhƣ các lĩnh vực
khác.
Phát hiện ảnh chuyển động (video, ảnh GIF, flash…)
Mở rộng nghiên cứu một số lĩnh vực liên quan: nhận dạng ảnh bạo lực,
nhận dạng vân tay, nhận dạng mống mắt,…
MỤC LỤC
Trang
Trang phụ bìa
Lời cảm ơn
Lời cam đoan
Tóm tắt luận văn
Mục lục
Danh mục các từ viết tắt
Danh mục hình vẽ
PHẦN MỞ ĐẦU .......................................................................................................................... 01
Chƣơng 1: KHÁI QUÁT VỀ XỬ LÝ ẢNH VÀ KIỂM SOÁT HÌNH ẢNH ........................... 03
1.1. KHÁI QUÁT VỀ XỬ LÝ ẢNH ........................................................................................... 03
1.1.1. Các khái niệm cơ bản ................................................................................................ 03
1.1.1.1. Xử lý ảnh .................................................................................................... 03
1.1.1.2. Điểm ảnh .................................................................................................... 03
1.1.1.3. Ảnh.............................................................................................................. 04
1.1.1.4. Mức xám của ảnh....................................................................................... 04
1.1.1.5. Độ phân giải của ảnh ................................................................................. 05
1.1.2. Các bƣớc xử lý ảnh số ............................................................................................... 05
1.1.2.1. Thu nhận ảnh.............................................................................................. 06
1.1.2.2. Tiền xử lý ................................................................................................... 06
1.1.2.3. Phân vùng ảnh ............................................................................................ 13
1.1.2.4. Trích chọn đặc trƣng.................................................................................. 14
1.1.2.5. Nhận dạng và nội suy ảnh ......................................................................... 15
1.1.2.6. Hậu xử lý .................................................................................................... 16
1.2. KIỂM SOÁT THÔNG TIN HÌNH ẢNH ............................................................................. 19
1.2.1. Nhận dạng ảnh ........................................................................................................... 19
1.2.1.1. Giới thiệu .................................................................................................... 19
1.2.1.2. Nhận dạng ảnh theo miền không gian ...................................................... 22
1.2.1.3. Nhận dạng dựa theo cấu trúc..................................................................... 26
1.2.2. Kiểm soát thông tin dựa trên hình ảnh ..................................................................... 29
Chƣơng 2: KỸ THUẬT SVM TRONG PHÁT HIỆN ẢNH ĐEN ............................................ 30
2.1. Những khái niệm cơ bản về SVM ........................................................................................ 30
2.1.1. Bài toán phân lớp ....................................................................................................... 31
2.1.2. Phân lớp tuyến tính.................................................................................................... 32
2.1.3. SVM và phân cách với khoảng cách lớn nhất ......................................................... 32
2.1.4. Không gian đặc trƣng. ............................................................................................... 34
2.2. Cơ sở lý thuyết SVM ............................................................................................................. 36
2.2.1. Bài toán phân 2 lớp với SVM ................................................................................... 36
2.2.2. Bài toán phân nhiều lớp với SVM ............................................................................ 41
2.2.3. Trƣờng hợp dữ liệu không thể phân tách đƣợc........................................................ 41
2.3. Kỹ thuật SVM trong bài toán phát hiện ảnh đen ................................................................. 44
2.3.1. Giai đoạn huấn luyện................................................................................................. 44
2.3.2. Giai đoạn xử lý phát hiện ảnh đen............................................................................ 51
Chƣơng 3: CHƢƠNG TRÌNH THỬ NGHIỆM .......................................................................... 52
3.1. BÀI TOÁN PHÁT HIỆN ẢNH “ĐEN” ............................................................................... 52
3.2.1. Một số đặc điểm ảnh “đen”....................................................................................... 52
3.2.2. Các vấn đề gây nhầm lẫn .......................................................................................... 52
3.2. KIỂM SOÁT ẢNH “ĐEN” SỬ DỤNG SVM ..................................................................... 53
3.2.1. Thu thập, phân tích và xử lý dữ liệu......................................................................... 53
3.2.2. Cài đặt chƣơng trình .................................................................................................. 54
3.2.2.1. Module tiền xử lý ....................................................................................... 54
3.2.2.2. Module trích chọn đặc trƣng ..................................................................... 54
3.2.2.3. Module huấn luyện SVM .......................................................................... 56
3.2.3. Chƣơng trình kiểm soát ảnh “đen” BreastSVM ...................................................... 57
3.2.3.1. Một số hình ảnh về chƣơng trình .............................................................. 57
3.2.3.2. Môi trƣờng thử nghiệm ............................................................................. 61
3.2.3.3. Kết quả thực nghiệm.................................................................................. 61
PHẦN KẾT LUẬN ....................................................................................................................... 63
TÀI LIỆU THAM KHẢO
DANH MỤC CÁC TỪ VIẾT TẮT
Ảnh đen: Ảnh có nội dung đồi trụy
CGA: Color Graphic Adaptor
CNTT: Công nghệ Thông tin
DIB: Device Independent Bitmap
KKT: Karush-Kuhn-Tucker
PLD: Picture Language Description
SRM: Structural Risk Minimization
SVM: Support Vector Machines
DANH MỤC CÁC HÌNH VẼ
Hình 1.1: Quá trình xử lý ảnh ............................................................................... 03
Hình 1.2: Các bƣớc cơ bản trong một hệ thống xử lý ảnh....................................... 05
Hình 1.3: Sơ đồ phân tích, xử lý ảnh và lƣu đồ thông tin giữa các khối .................. 06
Hình 1.4: Ảnh thu nhận và ảnh mong muốn ........................................................... 07
Hình 1.5: Dãn độ tƣơng phản ................................................................................. 12
Hình 1.6: Quá trình hiển thị và chỉnh sửa, lƣu trữ ảnh thông qua DIB .................... 18
Hình 1.7: Sự chuyển đổi giữa các mô hình biểu diễn ảnh ....................................... 19
Hình 1.8: Mô hình cấu trúc của đối tƣợng nhà ....................................................... 21
Hình 1.9: Sơ đồ tổng quát hệ thống nhận dạng ảnh ................................................ 22
Hình 1.10: Các phép toán trong ngôn ngữ PLD...................................................... 28
Hình 2.1 Phân tách theo siêu phẳng (w,b) trong không gian 2 chiều của tập mẫu ... 33
Hình 2.2 Siêu Phẳng tối ƣu .................................................................................... 34
Hình 2.3 Ánh xạ Φ từ không gian dữ liệu X sang không gian đặc trƣng F .............. 36
Hình 2.4. Minh họa cho bài toán phân hai lớp ........................................................ 37
Hình 2.5. Minh họa bài toán phân hai lớp với phƣơng pháp SVM.......................... 39
Hình 2.6. Bài toán SVM trong TH dữ liệu mẫu không phân tách tuyến tính ........... 40
Hình 2.7 Mô phỏng phân lớp có quá nhiều đặc trƣng hay biến động ...................... 47
Hình 3.1: Xử lý dữ liệu .......................................................................................... 53
Hình 3.2: Hình ảnh đầu vào và hình ảnh sau quá trình phát hiện da ....................... 55
Hình 3.3: Ảnh đƣợc trích chọn đặc trƣng ............................................................... 56
Hình 3.4: Giao diện ban đầu khi chạy chƣơng trình ............................................... 58
Hình 3.5: Phân vùng bộ phận “đen” trên video ...................................................... 59
Hình 3.6: Phân 2 vùng bộ phận “đen” trên ảnh ...................................................... 60
Hình 3.7: Không phân vùng bộ phận “đen” trên ảnh .............................................. 60
Hình 3.8: Phát hiện không chính xác ảnh đen......................................................... 61
1
PHẦN MỞ ĐẦU
Trong thời đại hiện nay, sự phát triển của CNTT kéo theo sự phát triển
của nhiều lĩnh vực khác, làm tăng số lượng giao dịch thông tin trên Internet.
Thông tin ngày một nhiều, tốc độ thay đổi của chúng cũng cực kỳ nhanh, hoạt
động của các lĩnh vực cũng đặt ra nhu cầu xử lý một khối lượng thông tin đồ
sộ. Một yêu cầu lớn đặt ra là làm thế nào để tổ chức, tìm kiếm thông tin một
cách hiệu quả và phân loại thông tin là một trong những giải pháp hợp lý cho
yêu cầu này. Nếu xử lý và phân loại dữ liệu thủ công là điều không tưởng với
số lượng dữ liệu khổng lồ như vậy. Giải pháp được đặt ra là sử dụng máy tính
để tự động phân loại các thông tin. Kỹ thuật SVM được đánh giá là công cụ
mạnh và tinh vi nhất hiện nay cho những bài toán phân lớp phi tuyến. Nhiều
ứng dụng đã và đang được xây dựng trên kỹ thuật SVM rất hiệu quả, trong đó
có những bài toán trong lĩnh vực xử lý ảnh.
Ở Việt Nam, những nghiên cứu mang tính thực nghiệm cũng đang được
định hướng và thu được một số kết quả ban đầu tuy còn hạn chế. Vì vậy, việc
cập nhật kiến thức và tiếp cận một lĩnh vực mũi nhọn của khoa học công nghệ
trong việc giải quyết một bài toán cụ thể là rất cần thiết.
Trước sự bùng nổ của các website với đủ loại nội dung sex, bạo lực,
phản động... các nhà quản lý bối rối vì khó kiểm soát, chuyên gia an ninh
mạng cho rằng không thể tận diệt, còn phụ huynh thì lo lắng. Để giải quyết
bài toán trên, luận văn sẽ nghiên cứu giải pháp kiểm soát ảnh đen. Từ đó có
thể phát triển thành ứng dụng có khả năng lọc, chặn ảnh đen góp phần giúp
các phụ huynh quản lý, bảo vệ con em mình khỏi những thông tin độc hại trên
Internet. Ngoài ra cũng giúp ngăn chặn những trang web xấu cho các đại lý
Internet công cộng, hệ thống mạng máy tính của các công sở, trường học, các
tổ chức, doanh nghiệp có kết nối Internet. Và đặc biệt góp phần phục vụ hiệu
quả cho công tác quản lý nhà nước về thông tin điện tử trên địa bàn tỉnh Đồng
Nai.
2
Từ mục tiêu đó, luận văn tập trung nghiên cứu kỹ thuật SVM và áp dụng
kỹ thuật này cho bài toán phát hiện ảnh có nội dung đ ồi trụy (gọi tắt là ảnh
“đen”).
Cấu trúc luận văn gồm Phần mở đầu, Phần kết luận và ba chương nội
dung cụ thể:
• Chương 1: Khái quát về xử lý ảnh và kiểm soát hình ảnh
• Chương 2: Kỹ thuật SVM trong phát hiện ảnh đen
• Chương 3: Xây dựng chương trình thử nghiệm phát hiện ảnh “đen” sử
dụng SVM.
3
Chƣơng 1:
KHÁI QUÁT VỀ XỬ LÝ ẢNH VÀ KIỂM SOÁT HÌNH ẢNH
1.1. KHÁI QUÁT VỀ XỬ LÝ ẢNH
1.1.1. Các khái niệm cơ bản
1.1.1.1. Xử lý ảnh
Xử lý ảnh là một lĩnh vực mang tính khoa học và công nghệ. Tuy là một
ngành khoa học mới mẽ so với nhiều ngành khoa học khác, nhưng tốc độ phát
triển rất nhanh, được rất nhiều các Viện, Trường đại học và các nhà khoa học
nghiên cứu và ứng dụng.
Những năm trở lại đây với sự phát triển của phần cứng máy tính, xử lý
ảnh và đồ họa đã phát triển một cách mạnh mẽ và có nhiều ứng dụng được áp
dụng trong cuộc sống. Xử lý ảnh và đồ hoạ đóng một vai trò quan trọng trong
tương tác người - máy.
Mục đích của xử lý ảnh là nâng cao chất lượng ảnh phục vụ con người
và xử lý ảnh dữ liệu dạng hình ảnh để máy tính có thể hiểu được từ đó đưa ra
những quyết định cần thiết.
Hình 1.1: Quá trình xử lý ảnh
Xử lý ảnh có nhiều ứng dụng trong đời sống như: nhận dạng ảnh vệ tinh,
dự báo thời tiết, viễn thám, ảnh y tế, khoa học hình sự, điện ảnh…
1.1.1.2. Điểm ảnh
Điểm ảnh (Pixel) là một phần tử của ảnh số tại tọa độ (x, y) với độ xám
hoặc màu nhất định. Kích thước và khoảng cách giữa các điểm ảnh đó được
chọn thích hợp sao cho mắt người cảm nhận sự liên tục về không gian và mức
xám (hoặc màu) của ảnh số gần như ảnh thật. Mỗi phần tử trong ma trận được
gọi là một phần tử ảnh.
4
1.1.1.3. Ảnh
Ảnh số là tập hợp các điểm ảnh với mức xám phù hợp dùng để mô tả ảnh
gần giống với ảnh thật.
Ảnh được tạo nên từ hàng trăm ngàn cho đến hàng triệu ô vuông rất nhỏ
- được coi là những nhân tố của bức ảnh và thường được biết dưới tên gọi là
điểm ảnh. Máy tính hay máy in sử dụng những ô vuông nhỏ này để hiển thị
hay in ra bức ảnh. Để làm được điều đó máy tính hay máy in chia màn hình,
trang giấy thành một mạng lưới chứa các ô vuông, sau đó sử dụng các giá trị
chứa trong file ảnh để định ra màu sắc, độ sáng, tối của từng pixel trong mạng
lưới đó, đó là cơ sở để ảnh số được hình thành. Việc kiểm soát, định ra địa chỉ
theo mạng lưới như trên được gọi là bit mapping và ảnh số còn được gọi là
ảnh bitmap.
1.1.1.4. Mức xám của ảnh
Định nghĩa: Mức xám (grey level) của điểm ảnh là cường độ sáng của
nó được gán bằng giá trị số tại điểm đó.
Các thang giá trị mức xám thông thường: 16, 32, 64, 128, 256 (Mức
256 là mức phổ dụng bởi vì trong kỹ thuật máy tính dùng 1 byte (8
bit) để biểu diễn mức xám: Mức xám dùng một byte biểu diễn:
28=256 mức, tức là từ 0 đến 255).
Ảnh đen trắng: là ảnh có hai màu đen, trắng (không chứa màu khác)
với mức xám ở các điểm ảnh có thể khác nhau.
Ảnh nhị phân: ảnh chỉ có hai mức đen trắng phân biệt, tức dùng một
bit mô tả 2 mức khác nhau. Nói cách khác: mỗi điểm ảnh của ảnh nhị
phân chỉ có thể là 0 hoặc 1.
Ảnh màu: trong khuôn khổ lý thuyết ba màu (Red, Blue, Green) để tạo
nên thế giới màu, người ta thường dùng ba byte để mô tả mức màu,
khi đó các giá trị màu: 28*3 = 224 ≈ 16,7 triệu màu.
5
1.1.1.5. Độ phân giải của ảnh
Định nghĩa: Độ phân giải (Resolution) của ảnh là mật độ điểm ảnh được
ấn định trên một ảnh số được hiển thị.
Theo định nghĩa, khoảng cách giữa các điểm ảnh phải được chọn sao cho
mắt người vẫn thấy được sự liên tục của ảnh. Việc lựa chọn khoảng cách thích
hợp tạo nên một mật độ phân bổ, đó chính là độ phân giải và được phân bố
theo trục x và y trong không gian hai chiều.
Ví dụ: Độ phân giải của ảnh trên màn hình CGA (Color Graphic
Adaptor) là một lưới điểm theo chiều ngang màn hình: 320 điểm, chiều dọc ×
200 điểm ảnh (320×200). Rõ ràng, cùng màn hình CGA 12” ta nhận thấy mịn
hơn màn hình CGA 17” độ phân giải 320×200. Lý do: cùng một mật độ (độ
phân giải) nhưng diện tích màn hình rộng hơn thì độ mịn (liên tục của các
điểm) kém hơn.
1.1.2. Các bƣớc xử lý ảnh số
Một hệ thống xử lý ảnh có sơ đồ tổng quát như sau:
Hình 1.2: Các bước cơ bản trong một hệ thống xử lý ảnh
6
Hình 1.3: Sơ đồ phân tích, xử lý ảnh và lưu đồ thông tin giữa các khối
Sau đây sẽ trình bày một số kỹ thuật xử lý ảnh cần thiết phục vụ cho việc
cài đặt chương trình thử nghiệm (theo các bước trong hình 1.2), còn các thành
phần khác sẽ được giới thiệu ở mức cơ bản.
1.1.2.1. Thu nhận ảnh
Các thiết bị thu nhận ảnh bao gồm: camera, scanner các thiết bị thu nhận
này có thể cho ảnh đen trắng.
Các thiết bị thu nhận ảnh có hai loại chính ứng với hai loại ảnh thông
dụng là Raster, Vector.
Các thiết bị thu nhận ảnh Raster thông thường là camera, các thiết bị thu
nhận ảnh thông thường Vector là sensor hoặc bàn số hoá Digitalizer hoặc
được chuyển đổi từ ảnh Raster.
Nhìn chung các hệ thống thu nhận ảnh thực hiện 1 quá trình:
Cảm biến: biến đổi năng lượng quang học thành năng lượng điện.
Tổng hợp năng lượng điện thành ảnh.
1.1.2.2. Tiền xử lý
Sau bộ thu nhận, ảnh có thể nhiễu và độ tương phản thấp nên cần đưa
vào bộ tiền xử lý (Image Processing) để nâng cao chất lượng. Chức năng
chính của bộ tiền xử lý là nắn chỉnh biến dạng, lọc nhiễu, chỉnh mức xám,
nâng độ tương phản để làm ảnh rõ hơn, nét hơn.
7
Các thuật toán triển khai việc nâng cao chất lượng ảnh hầu hết dựa trên
các kỹ thuật trong miền điểm, không gian và tần số. Toán tử điểm là phép
biến đổi đối với từng điểm ảnh đang xét, không liên quan đến các điểm lân
cận khác. Trong khi đó, toán tử không gian sử dụng các điểm lân cận để quy
chiếu tới điểm ảnh đang xét. Một số phép biến đổi có tính toán phức tạp được
chuyển sang miền tần số để thực hiện, kết quả cuối cùng được chuyển trở lại
miền không gian nhờ các biến đổi ngược.
a. Nắn chỉnh biến dạng
Ảnh thu nhận thường bị biến dạng do các thiết bị quang học và điện tử.
Ảnh thu nhận
Ảnh mong muốn
Hình 1.4: Ảnh thu nhận và ảnh mong muốn
Các nguyên nhân biến dạng do:
Do camera, đầu thu ảnh chất lượng kém.
Do môi trường, ánh sáng, hiện trường (scene), khí quyển, nhiễu xung.
Do chất lượng.
Để khắc phục người ta sử dụng các phép chiếu, các phép chiếu thường
được xây dựng trên tập các điểm điều khiển.
Giả sử (P i, P i‟) với i = 1,.. n có n các tập điều khiển
Tìm hàm f: P i → f (P i) sao cho:
1.1
Giả sử ảnh bị biến đổi chỉ bao gồm: Tịnh tiến, quay, tỷ lệ, biến dạng bậc
nhất tuyến tính. Khi đó hàm f có dạng:
f (x, y) = (a1x + b1y + c1, a2x + b2y + c2)
1.2
8
Ta có:
Để cho Φ → min, ta có:
Giải hệ phương trình tuyến tính tìm được a1, b1, c1, tương tự tìm được a2,
b2, c2; từ đó ta xác định được hàm f.
b. Lọc nhiễu
Thường ảnh thu nhận được có nhiễu nên cần phải loại bỏ nhiễu. Để tách
nhiễu (hay làm trơn nhiễu), người ta sử dụng các bộ lọc tuyến tính (lọc trung
bình, thông thấp) hay lọc phi tuyến (trung vị, giả trung vị, lọc đồng hình). Từ
bản chất của nhiễu (thường tương ứng với tần số cao) và từ cơ sở lý thuyết lọc
là: bộ lọc chỉ cho tín hiệu có tần số nào đó thông qua. Do đó, để lọc nhiễu
người ta thường dùng lọc thông thấp (theo quan điểm tần số không gian) hay
lấy tổ hợp tuyến tính để san bằng (lọc trung bình).
Trước khi xem xét chi tiết các kỹ thuật áp dụng, cần phân biệt các loại
nhiễu hay can thiệp trong quá trình xử lý ảnh. Trên thực tế tồn tại nhiều loại
nhiễu; tuy nhiên người ta thường xem xét ba loại nhiễu chính: nhiễu cộng,
nhiễu nhân và nhiễu xung:
Nhiễu cộng: Nhiễu cộng thường phân bố khắp ảnh. Nếu gọi ảnh quan
sát (ảnh thu được) là Xqs, ảnh gốc là Xgốc, nhiễu là η, ảnh thu được có
thể biểu diễn bởi:
Xqs = Xgốc + η
Nhiễu nhân: Nhiễu nhân thường phân bố khắp ảnh và ảnh thu được sẽ
biểu diễn với công thức:
9
Xqs = Xgốc * η
Nhiễu xung: Nhiễu xung thường gây đột biến tại một số điểm ảnh.
Làm trơn nhiễu bằng lọc tuyến tính: lọc trung bình và lọc dải thông
thấp
Do có nhiều loại nhiễu can thiệp vào quá trình xử lý ảnh nên cần có
nhiều bộ lọc thích hợp. Với nhiễu cộng và nhiễu nhân ta dùng các bộ lọc
thông thấp, trung bình và lọc đồng hình (Homomorphie); với nhiễu xung ta
dùng lọc trung bị, giả trung vị, lọc ngoài (Outlier).
i. Lọc trung bình không gian
Với lọc trung bình, mỗi điểm ảnh được thay thế bằng trung bình trọng số
của các điểm lân cận và được định nghĩa như sau:
1.3
Nếu trong kỹ thuật lọc trên, ta dùng các trọng số như nhau, phương trình
1.3 trên sẽ trở thành:
với :
y(m, n): ảnh đầu vào,
v(m, n): ảnh đầu ra,
a(k, l) : là cửa sổ lọc.
với
và Nw là số điểm ảnh trong cửa sổ lọc W.
Lọc trung bình có trọng số chính là thực hiện chập ảnh đầu vào với nhân
chập H. Nhân chập H trong trường hợp này có dạng:
Trong lọc trung bình, thường người ta ưu tiên cho các hướng để bảo vệ
biên của ảnh khỏi bị mờ khi làm trơn ảnh. Các kiểu mặt nạ được sử dụng tùy
10
theo các trường hợp khác nhau. Các bộ lọc trên là bộ lọc tuyến tính theo nghĩa
là điểm ảnh ở tâm cửa số sẽ được thay bởi tổ hợp các điểm lân cận chập với
mặt nạ.
Giả sử đầu vào biểu diễn bởi ma trận I:
Ảnh số thu được bởi lọc trung bình Y=H⊗ I có dạng:
Một bộ lọc trung bình không gian khác cũng hay được sử dụng. Phương
trình của bộ lọc đó có dạng:
Ở đây, nhân chập H có kích thuớc 2x2 và mỗi điểm ảnh kết quả có giá trị
bằng trung bình cộng của nó với trung bình cộng của bốn lân cận gần nhất.
Lọc trung bình trọng số là một trường hợp riêng của lọc thông thấp.
ii. Lọc thông thấp
Lọc thông thấp thường được sử dụng để làm trơn nhiễu.Về nguyên lý
của bộ lọc thông thấp giống như đã trình bày trên. Trong kỹ thuật này người
ta hay dùng một số nhân chập có dạng sau:
- Xem thêm -