Tài liệu Nghiên cứu kỹ thuật svm trong kiểm soát nội dung hình ảnh

  • Số trang: 75 |
  • Loại file: PDF |
  • Lượt xem: 66 |
  • Lượt tải: 0
nhattuvisu

Đã đăng 27125 tài liệu

Mô tả:

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC LẠC HỒNG _________________ TRẦN MINH TÂN NGHIÊN CỨU KỸ THUẬT SVM TRONG KIỂM SOÁT NỘI DUNG HÌNH ẢNH LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN Đồng Nai, Năm 2012 BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC LẠC HỒNG ____________________ TRẦN MINH TÂN NGHIÊN CỨU KỸ THUẬT SVM TRONG KIỂM SOÁT NỘI DUNG HÌNH ẢNH Chuyên ngành: CÔNG NGHỆ THÔNG TIN Mã số: 60.48.02.01 LUẬN VĂN THẠC SĨ NGÀNH CÔNG NGHỆ THÔNG TIN NGƢỜI HƢỚNG DẪN KHOA HỌC: PGS. TS ĐỖ NĂNG TOÀN Đồng Nai, Năm 2012 LỜI CẢM ƠN Tôi chân thành cảm ơn PGS.TS Đỗ Năng Toàn, thầy đã tận tình hƣớng dẫn, giúp đỡ và đóng góp ý kiến cho tôi trong suốt quá trình thực hiện đề tài luận văn. Tôi chân thành cảm ơn các thầy, cô Khoa Công nghệ Thông tin - Trƣờng Đại học Lạc Hồng và các thầy, cô khác đã tận tình giảng dạy, truyền đạt cho tôi những kiến thức quý báu trong quá trình học tập. Tôi chân thành cảm ơn các thầy cô phòng Sau đại học - Trƣờng Đại học Lạc Hồng, các đồng nghiệp và các bạn học lớp Cao học Công nghệ thông tin khoá 2 - Trƣờng Đại học Lạc Hồng đã hỗ trợ, tạo điều kiện thuận lợi cũng nhƣ đóng góp những ý kiến thiết thực cho tôi trong suốt quá trình học tập và đặc biệt đã giúp luận văn của tôi đƣợc hoàn thiện hơn. Cuối cùng, tôi muốn gửi lời cảm ơn đến gia đình, những ngƣời thân yêu luôn bên cạnh và động viên tôi trong suốt quá trình học tập và thực hiện đề tài luận văn này. Đồng Nai, ngày 21 tháng 9 năm 2012 Trần Minh Tân LỜI CAM ĐOAN Tôi xin cam đoan đây là công trình nghiên cứu độc lập của bản thân. Các số liệu, kết quả trình bày trong luận văn này là trung thực. Những tƣ liệu đƣợc sử dụng trong luận văn có nguồn gốc và trích dẫn rõ ràng, đầy đủ. Tác giả Trần Minh Tân TÓM TẮT LUẬN VĂN Tên đề tài luận văn: NGHIÊN CỨU KỸ THUẬT SVM TRONG KIỂM SOÁT NỘI DUNG HÌNH ẢNH. Học viên thực hiện: Trần Minh Tân sinh ngày: 05/08/1980 Ngƣời hƣớng dẫn khoa học: PGS.TS Đỗ Năng Toàn. 1. Mục tiêu của luận văn: Hiểu rõ lý thuyết về xử lý ảnh và kỹ thuật SVM trong kiểm soát nội dung hình ảnh. Xây dựng ứng dụng phát hiện ảnh nghi ngờ là ảnh đen (ảnh đồi trụy). 2. Nội dung thực hiện: - Tìm hiểu khái quát về xử lý ảnh và bài toán kiểm soát nội dung hình ảnh; - Nghiên cứu một số vấn đề về SVM (Support vector machines) và ứng dụng trong bài toán phát hiện, nhận dạng hình ảnh; - Nghiên cứu một số đặc điểm của hình ảnh đen; - Thiết kế, phát triển chƣơng trình thử nghiệm; - Xây dựng báo cáo sơ bộ và hoàn chỉnh báo cáo. 3. Phƣơng pháp thực hiện: - Nghiên cứu nội dung lý thuyết về xử lý ảnh trong giáo trình “Xử lý ảnh” của PGS. TS. Đỗ Năng Toàn và TS. Phạm Việt Bình, năm 2008. - Nghiên cứu các tài liệu trên mạng, sách và các luận văn thạc sĩ về kỹ thuật SVM. Đối với phƣơng pháp SVM: gồm hai giai đoạn là huấn luyện và nhận dạng:  Giai đoạn huấn luyện: Các ảnh mẫu đƣợc véc tơ hóa x = {x1, . .,x100} rồi dùng phƣơng pháp PCA để rút trích đặc trƣng thành véc tơ y = {y1, . .,y100} rồi đƣa vào bộ huấn luyện SVM.  Giai đoạn nhận dạng: Mẫu cần nhận dạng đƣợc cũng đƣợc véc tơ hóa và rút trích nhƣ trên sau đó đƣa vào bộ nhận dạng SVM để xác định lớp cho mẫu. - Nghiên cứu những đặc điểm, đặc trƣng của “ảnh đen”. - Thiết kế, phát triển và cài đặt thử nghiệm chƣơng trình ứng dụng. 4. Kết quả đạt đƣợc: - Trình bày khái quát về xử lý ảnh và bài toán kiểm soát hình ảnh. - Hệ thống hóa một số vấn đề về ứng dụng kỹ thuật SVM trong nhận dạng hình ảnh. - Cài đặt thử nghiệm chƣơng trình nhận dạng ảnh đen sử dụng kỹ thuật SVM. 5. Hƣớng phát triển tiếp theo:  Phát triển thành chƣơng trình phát hiện ảnh “đen” trên máy tính cá nhân.  Tích hợp, phát triển thành ứng dụng phát hiện và lọc, chặn ảnh “đen” đối với các Website. Đồng thời có thể thƣơng mại hóa ứng dụng phục vụ công tác quản lý nhà nƣớc cho ngành thông tin và truyền thông cũng nhƣ các lĩnh vực khác.  Phát hiện ảnh chuyển động (video, ảnh GIF, flash…)  Mở rộng nghiên cứu một số lĩnh vực liên quan: nhận dạng ảnh bạo lực, nhận dạng vân tay, nhận dạng mống mắt,… MỤC LỤC Trang Trang phụ bìa Lời cảm ơn Lời cam đoan Tóm tắt luận văn Mục lục Danh mục các từ viết tắt Danh mục hình vẽ PHẦN MỞ ĐẦU .......................................................................................................................... 01 Chƣơng 1: KHÁI QUÁT VỀ XỬ LÝ ẢNH VÀ KIỂM SOÁT HÌNH ẢNH ........................... 03 1.1. KHÁI QUÁT VỀ XỬ LÝ ẢNH ........................................................................................... 03 1.1.1. Các khái niệm cơ bản ................................................................................................ 03 1.1.1.1. Xử lý ảnh .................................................................................................... 03 1.1.1.2. Điểm ảnh .................................................................................................... 03 1.1.1.3. Ảnh.............................................................................................................. 04 1.1.1.4. Mức xám của ảnh....................................................................................... 04 1.1.1.5. Độ phân giải của ảnh ................................................................................. 05 1.1.2. Các bƣớc xử lý ảnh số ............................................................................................... 05 1.1.2.1. Thu nhận ảnh.............................................................................................. 06 1.1.2.2. Tiền xử lý ................................................................................................... 06 1.1.2.3. Phân vùng ảnh ............................................................................................ 13 1.1.2.4. Trích chọn đặc trƣng.................................................................................. 14 1.1.2.5. Nhận dạng và nội suy ảnh ......................................................................... 15 1.1.2.6. Hậu xử lý .................................................................................................... 16 1.2. KIỂM SOÁT THÔNG TIN HÌNH ẢNH ............................................................................. 19 1.2.1. Nhận dạng ảnh ........................................................................................................... 19 1.2.1.1. Giới thiệu .................................................................................................... 19 1.2.1.2. Nhận dạng ảnh theo miền không gian ...................................................... 22 1.2.1.3. Nhận dạng dựa theo cấu trúc..................................................................... 26 1.2.2. Kiểm soát thông tin dựa trên hình ảnh ..................................................................... 29 Chƣơng 2: KỸ THUẬT SVM TRONG PHÁT HIỆN ẢNH ĐEN ............................................ 30 2.1. Những khái niệm cơ bản về SVM ........................................................................................ 30 2.1.1. Bài toán phân lớp ....................................................................................................... 31 2.1.2. Phân lớp tuyến tính.................................................................................................... 32 2.1.3. SVM và phân cách với khoảng cách lớn nhất ......................................................... 32 2.1.4. Không gian đặc trƣng. ............................................................................................... 34 2.2. Cơ sở lý thuyết SVM ............................................................................................................. 36 2.2.1. Bài toán phân 2 lớp với SVM ................................................................................... 36 2.2.2. Bài toán phân nhiều lớp với SVM ............................................................................ 41 2.2.3. Trƣờng hợp dữ liệu không thể phân tách đƣợc........................................................ 41 2.3. Kỹ thuật SVM trong bài toán phát hiện ảnh đen ................................................................. 44 2.3.1. Giai đoạn huấn luyện................................................................................................. 44 2.3.2. Giai đoạn xử lý phát hiện ảnh đen............................................................................ 51 Chƣơng 3: CHƢƠNG TRÌNH THỬ NGHIỆM .......................................................................... 52 3.1. BÀI TOÁN PHÁT HIỆN ẢNH “ĐEN” ............................................................................... 52 3.2.1. Một số đặc điểm ảnh “đen”....................................................................................... 52 3.2.2. Các vấn đề gây nhầm lẫn .......................................................................................... 52 3.2. KIỂM SOÁT ẢNH “ĐEN” SỬ DỤNG SVM ..................................................................... 53 3.2.1. Thu thập, phân tích và xử lý dữ liệu......................................................................... 53 3.2.2. Cài đặt chƣơng trình .................................................................................................. 54 3.2.2.1. Module tiền xử lý ....................................................................................... 54 3.2.2.2. Module trích chọn đặc trƣng ..................................................................... 54 3.2.2.3. Module huấn luyện SVM .......................................................................... 56 3.2.3. Chƣơng trình kiểm soát ảnh “đen” BreastSVM ...................................................... 57 3.2.3.1. Một số hình ảnh về chƣơng trình .............................................................. 57 3.2.3.2. Môi trƣờng thử nghiệm ............................................................................. 61 3.2.3.3. Kết quả thực nghiệm.................................................................................. 61 PHẦN KẾT LUẬN ....................................................................................................................... 63 TÀI LIỆU THAM KHẢO DANH MỤC CÁC TỪ VIẾT TẮT Ảnh đen: Ảnh có nội dung đồi trụy CGA: Color Graphic Adaptor CNTT: Công nghệ Thông tin DIB: Device Independent Bitmap KKT: Karush-Kuhn-Tucker PLD: Picture Language Description SRM: Structural Risk Minimization SVM: Support Vector Machines DANH MỤC CÁC HÌNH VẼ Hình 1.1: Quá trình xử lý ảnh ............................................................................... 03 Hình 1.2: Các bƣớc cơ bản trong một hệ thống xử lý ảnh....................................... 05 Hình 1.3: Sơ đồ phân tích, xử lý ảnh và lƣu đồ thông tin giữa các khối .................. 06 Hình 1.4: Ảnh thu nhận và ảnh mong muốn ........................................................... 07 Hình 1.5: Dãn độ tƣơng phản ................................................................................. 12 Hình 1.6: Quá trình hiển thị và chỉnh sửa, lƣu trữ ảnh thông qua DIB .................... 18 Hình 1.7: Sự chuyển đổi giữa các mô hình biểu diễn ảnh ....................................... 19 Hình 1.8: Mô hình cấu trúc của đối tƣợng nhà ....................................................... 21 Hình 1.9: Sơ đồ tổng quát hệ thống nhận dạng ảnh ................................................ 22 Hình 1.10: Các phép toán trong ngôn ngữ PLD...................................................... 28 Hình 2.1 Phân tách theo siêu phẳng (w,b) trong không gian 2 chiều của tập mẫu ... 33 Hình 2.2 Siêu Phẳng tối ƣu .................................................................................... 34 Hình 2.3 Ánh xạ Φ từ không gian dữ liệu X sang không gian đặc trƣng F .............. 36 Hình 2.4. Minh họa cho bài toán phân hai lớp ........................................................ 37 Hình 2.5. Minh họa bài toán phân hai lớp với phƣơng pháp SVM.......................... 39 Hình 2.6. Bài toán SVM trong TH dữ liệu mẫu không phân tách tuyến tính ........... 40 Hình 2.7 Mô phỏng phân lớp có quá nhiều đặc trƣng hay biến động ...................... 47 Hình 3.1: Xử lý dữ liệu .......................................................................................... 53 Hình 3.2: Hình ảnh đầu vào và hình ảnh sau quá trình phát hiện da ....................... 55 Hình 3.3: Ảnh đƣợc trích chọn đặc trƣng ............................................................... 56 Hình 3.4: Giao diện ban đầu khi chạy chƣơng trình ............................................... 58 Hình 3.5: Phân vùng bộ phận “đen” trên video ...................................................... 59 Hình 3.6: Phân 2 vùng bộ phận “đen” trên ảnh ...................................................... 60 Hình 3.7: Không phân vùng bộ phận “đen” trên ảnh .............................................. 60 Hình 3.8: Phát hiện không chính xác ảnh đen......................................................... 61 1 PHẦN MỞ ĐẦU Trong thời đại hiện nay, sự phát triển của CNTT kéo theo sự phát triển của nhiều lĩnh vực khác, làm tăng số lượng giao dịch thông tin trên Internet. Thông tin ngày một nhiều, tốc độ thay đổi của chúng cũng cực kỳ nhanh, hoạt động của các lĩnh vực cũng đặt ra nhu cầu xử lý một khối lượng thông tin đồ sộ. Một yêu cầu lớn đặt ra là làm thế nào để tổ chức, tìm kiếm thông tin một cách hiệu quả và phân loại thông tin là một trong những giải pháp hợp lý cho yêu cầu này. Nếu xử lý và phân loại dữ liệu thủ công là điều không tưởng với số lượng dữ liệu khổng lồ như vậy. Giải pháp được đặt ra là sử dụng máy tính để tự động phân loại các thông tin. Kỹ thuật SVM được đánh giá là công cụ mạnh và tinh vi nhất hiện nay cho những bài toán phân lớp phi tuyến. Nhiều ứng dụng đã và đang được xây dựng trên kỹ thuật SVM rất hiệu quả, trong đó có những bài toán trong lĩnh vực xử lý ảnh. Ở Việt Nam, những nghiên cứu mang tính thực nghiệm cũng đang được định hướng và thu được một số kết quả ban đầu tuy còn hạn chế. Vì vậy, việc cập nhật kiến thức và tiếp cận một lĩnh vực mũi nhọn của khoa học công nghệ trong việc giải quyết một bài toán cụ thể là rất cần thiết. Trước sự bùng nổ của các website với đủ loại nội dung sex, bạo lực, phản động... các nhà quản lý bối rối vì khó kiểm soát, chuyên gia an ninh mạng cho rằng không thể tận diệt, còn phụ huynh thì lo lắng. Để giải quyết bài toán trên, luận văn sẽ nghiên cứu giải pháp kiểm soát ảnh đen. Từ đó có thể phát triển thành ứng dụng có khả năng lọc, chặn ảnh đen góp phần giúp các phụ huynh quản lý, bảo vệ con em mình khỏi những thông tin độc hại trên Internet. Ngoài ra cũng giúp ngăn chặn những trang web xấu cho các đại lý Internet công cộng, hệ thống mạng máy tính của các công sở, trường học, các tổ chức, doanh nghiệp có kết nối Internet. Và đặc biệt góp phần phục vụ hiệu quả cho công tác quản lý nhà nước về thông tin điện tử trên địa bàn tỉnh Đồng Nai. 2 Từ mục tiêu đó, luận văn tập trung nghiên cứu kỹ thuật SVM và áp dụng kỹ thuật này cho bài toán phát hiện ảnh có nội dung đ ồi trụy (gọi tắt là ảnh “đen”). Cấu trúc luận văn gồm Phần mở đầu, Phần kết luận và ba chương nội dung cụ thể: • Chương 1: Khái quát về xử lý ảnh và kiểm soát hình ảnh • Chương 2: Kỹ thuật SVM trong phát hiện ảnh đen • Chương 3: Xây dựng chương trình thử nghiệm phát hiện ảnh “đen” sử dụng SVM. 3 Chƣơng 1: KHÁI QUÁT VỀ XỬ LÝ ẢNH VÀ KIỂM SOÁT HÌNH ẢNH 1.1. KHÁI QUÁT VỀ XỬ LÝ ẢNH 1.1.1. Các khái niệm cơ bản 1.1.1.1. Xử lý ảnh Xử lý ảnh là một lĩnh vực mang tính khoa học và công nghệ. Tuy là một ngành khoa học mới mẽ so với nhiều ngành khoa học khác, nhưng tốc độ phát triển rất nhanh, được rất nhiều các Viện, Trường đại học và các nhà khoa học nghiên cứu và ứng dụng. Những năm trở lại đây với sự phát triển của phần cứng máy tính, xử lý ảnh và đồ họa đã phát triển một cách mạnh mẽ và có nhiều ứng dụng được áp dụng trong cuộc sống. Xử lý ảnh và đồ hoạ đóng một vai trò quan trọng trong tương tác người - máy. Mục đích của xử lý ảnh là nâng cao chất lượng ảnh phục vụ con người và xử lý ảnh dữ liệu dạng hình ảnh để máy tính có thể hiểu được từ đó đưa ra những quyết định cần thiết. Hình 1.1: Quá trình xử lý ảnh Xử lý ảnh có nhiều ứng dụng trong đời sống như: nhận dạng ảnh vệ tinh, dự báo thời tiết, viễn thám, ảnh y tế, khoa học hình sự, điện ảnh… 1.1.1.2. Điểm ảnh Điểm ảnh (Pixel) là một phần tử của ảnh số tại tọa độ (x, y) với độ xám hoặc màu nhất định. Kích thước và khoảng cách giữa các điểm ảnh đó được chọn thích hợp sao cho mắt người cảm nhận sự liên tục về không gian và mức xám (hoặc màu) của ảnh số gần như ảnh thật. Mỗi phần tử trong ma trận được gọi là một phần tử ảnh. 4 1.1.1.3. Ảnh Ảnh số là tập hợp các điểm ảnh với mức xám phù hợp dùng để mô tả ảnh gần giống với ảnh thật. Ảnh được tạo nên từ hàng trăm ngàn cho đến hàng triệu ô vuông rất nhỏ - được coi là những nhân tố của bức ảnh và thường được biết dưới tên gọi là điểm ảnh. Máy tính hay máy in sử dụng những ô vuông nhỏ này để hiển thị hay in ra bức ảnh. Để làm được điều đó máy tính hay máy in chia màn hình, trang giấy thành một mạng lưới chứa các ô vuông, sau đó sử dụng các giá trị chứa trong file ảnh để định ra màu sắc, độ sáng, tối của từng pixel trong mạng lưới đó, đó là cơ sở để ảnh số được hình thành. Việc kiểm soát, định ra địa chỉ theo mạng lưới như trên được gọi là bit mapping và ảnh số còn được gọi là ảnh bitmap. 1.1.1.4. Mức xám của ảnh  Định nghĩa: Mức xám (grey level) của điểm ảnh là cường độ sáng của nó được gán bằng giá trị số tại điểm đó.  Các thang giá trị mức xám thông thường: 16, 32, 64, 128, 256 (Mức 256 là mức phổ dụng bởi vì trong kỹ thuật máy tính dùng 1 byte (8 bit) để biểu diễn mức xám: Mức xám dùng một byte biểu diễn: 28=256 mức, tức là từ 0 đến 255).  Ảnh đen trắng: là ảnh có hai màu đen, trắng (không chứa màu khác) với mức xám ở các điểm ảnh có thể khác nhau.  Ảnh nhị phân: ảnh chỉ có hai mức đen trắng phân biệt, tức dùng một bit mô tả 2 mức khác nhau. Nói cách khác: mỗi điểm ảnh của ảnh nhị phân chỉ có thể là 0 hoặc 1.  Ảnh màu: trong khuôn khổ lý thuyết ba màu (Red, Blue, Green) để tạo nên thế giới màu, người ta thường dùng ba byte để mô tả mức màu, khi đó các giá trị màu: 28*3 = 224 ≈ 16,7 triệu màu. 5 1.1.1.5. Độ phân giải của ảnh Định nghĩa: Độ phân giải (Resolution) của ảnh là mật độ điểm ảnh được ấn định trên một ảnh số được hiển thị. Theo định nghĩa, khoảng cách giữa các điểm ảnh phải được chọn sao cho mắt người vẫn thấy được sự liên tục của ảnh. Việc lựa chọn khoảng cách thích hợp tạo nên một mật độ phân bổ, đó chính là độ phân giải và được phân bố theo trục x và y trong không gian hai chiều. Ví dụ: Độ phân giải của ảnh trên màn hình CGA (Color Graphic Adaptor) là một lưới điểm theo chiều ngang màn hình: 320 điểm, chiều dọc × 200 điểm ảnh (320×200). Rõ ràng, cùng màn hình CGA 12” ta nhận thấy mịn hơn màn hình CGA 17” độ phân giải 320×200. Lý do: cùng một mật độ (độ phân giải) nhưng diện tích màn hình rộng hơn thì độ mịn (liên tục của các điểm) kém hơn. 1.1.2. Các bƣớc xử lý ảnh số Một hệ thống xử lý ảnh có sơ đồ tổng quát như sau: Hình 1.2: Các bước cơ bản trong một hệ thống xử lý ảnh 6 Hình 1.3: Sơ đồ phân tích, xử lý ảnh và lưu đồ thông tin giữa các khối Sau đây sẽ trình bày một số kỹ thuật xử lý ảnh cần thiết phục vụ cho việc cài đặt chương trình thử nghiệm (theo các bước trong hình 1.2), còn các thành phần khác sẽ được giới thiệu ở mức cơ bản. 1.1.2.1. Thu nhận ảnh Các thiết bị thu nhận ảnh bao gồm: camera, scanner các thiết bị thu nhận này có thể cho ảnh đen trắng. Các thiết bị thu nhận ảnh có hai loại chính ứng với hai loại ảnh thông dụng là Raster, Vector. Các thiết bị thu nhận ảnh Raster thông thường là camera, các thiết bị thu nhận ảnh thông thường Vector là sensor hoặc bàn số hoá Digitalizer hoặc được chuyển đổi từ ảnh Raster. Nhìn chung các hệ thống thu nhận ảnh thực hiện 1 quá trình:  Cảm biến: biến đổi năng lượng quang học thành năng lượng điện.  Tổng hợp năng lượng điện thành ảnh. 1.1.2.2. Tiền xử lý Sau bộ thu nhận, ảnh có thể nhiễu và độ tương phản thấp nên cần đưa vào bộ tiền xử lý (Image Processing) để nâng cao chất lượng. Chức năng chính của bộ tiền xử lý là nắn chỉnh biến dạng, lọc nhiễu, chỉnh mức xám, nâng độ tương phản để làm ảnh rõ hơn, nét hơn. 7 Các thuật toán triển khai việc nâng cao chất lượng ảnh hầu hết dựa trên các kỹ thuật trong miền điểm, không gian và tần số. Toán tử điểm là phép biến đổi đối với từng điểm ảnh đang xét, không liên quan đến các điểm lân cận khác. Trong khi đó, toán tử không gian sử dụng các điểm lân cận để quy chiếu tới điểm ảnh đang xét. Một số phép biến đổi có tính toán phức tạp được chuyển sang miền tần số để thực hiện, kết quả cuối cùng được chuyển trở lại miền không gian nhờ các biến đổi ngược. a. Nắn chỉnh biến dạng Ảnh thu nhận thường bị biến dạng do các thiết bị quang học và điện tử. Ảnh thu nhận Ảnh mong muốn Hình 1.4: Ảnh thu nhận và ảnh mong muốn Các nguyên nhân biến dạng do:  Do camera, đầu thu ảnh chất lượng kém.  Do môi trường, ánh sáng, hiện trường (scene), khí quyển, nhiễu xung.  Do chất lượng. Để khắc phục người ta sử dụng các phép chiếu, các phép chiếu thường được xây dựng trên tập các điểm điều khiển. Giả sử (P i, P i‟) với i = 1,.. n có n các tập điều khiển Tìm hàm f: P i → f (P i) sao cho: 1.1 Giả sử ảnh bị biến đổi chỉ bao gồm: Tịnh tiến, quay, tỷ lệ, biến dạng bậc nhất tuyến tính. Khi đó hàm f có dạng: f (x, y) = (a1x + b1y + c1, a2x + b2y + c2) 1.2 8 Ta có: Để cho Φ → min, ta có: Giải hệ phương trình tuyến tính tìm được a1, b1, c1, tương tự tìm được a2, b2, c2; từ đó ta xác định được hàm f. b. Lọc nhiễu Thường ảnh thu nhận được có nhiễu nên cần phải loại bỏ nhiễu. Để tách nhiễu (hay làm trơn nhiễu), người ta sử dụng các bộ lọc tuyến tính (lọc trung bình, thông thấp) hay lọc phi tuyến (trung vị, giả trung vị, lọc đồng hình). Từ bản chất của nhiễu (thường tương ứng với tần số cao) và từ cơ sở lý thuyết lọc là: bộ lọc chỉ cho tín hiệu có tần số nào đó thông qua. Do đó, để lọc nhiễu người ta thường dùng lọc thông thấp (theo quan điểm tần số không gian) hay lấy tổ hợp tuyến tính để san bằng (lọc trung bình). Trước khi xem xét chi tiết các kỹ thuật áp dụng, cần phân biệt các loại nhiễu hay can thiệp trong quá trình xử lý ảnh. Trên thực tế tồn tại nhiều loại nhiễu; tuy nhiên người ta thường xem xét ba loại nhiễu chính: nhiễu cộng, nhiễu nhân và nhiễu xung:  Nhiễu cộng: Nhiễu cộng thường phân bố khắp ảnh. Nếu gọi ảnh quan sát (ảnh thu được) là Xqs, ảnh gốc là Xgốc, nhiễu là η, ảnh thu được có thể biểu diễn bởi: Xqs = Xgốc + η  Nhiễu nhân: Nhiễu nhân thường phân bố khắp ảnh và ảnh thu được sẽ biểu diễn với công thức: 9 Xqs = Xgốc * η  Nhiễu xung: Nhiễu xung thường gây đột biến tại một số điểm ảnh. Làm trơn nhiễu bằng lọc tuyến tính: lọc trung bình và lọc dải thông thấp Do có nhiều loại nhiễu can thiệp vào quá trình xử lý ảnh nên cần có nhiều bộ lọc thích hợp. Với nhiễu cộng và nhiễu nhân ta dùng các bộ lọc thông thấp, trung bình và lọc đồng hình (Homomorphie); với nhiễu xung ta dùng lọc trung bị, giả trung vị, lọc ngoài (Outlier). i. Lọc trung bình không gian Với lọc trung bình, mỗi điểm ảnh được thay thế bằng trung bình trọng số của các điểm lân cận và được định nghĩa như sau: 1.3 Nếu trong kỹ thuật lọc trên, ta dùng các trọng số như nhau, phương trình 1.3 trên sẽ trở thành: với : y(m, n): ảnh đầu vào, v(m, n): ảnh đầu ra, a(k, l) : là cửa sổ lọc. với và Nw là số điểm ảnh trong cửa sổ lọc W. Lọc trung bình có trọng số chính là thực hiện chập ảnh đầu vào với nhân chập H. Nhân chập H trong trường hợp này có dạng: Trong lọc trung bình, thường người ta ưu tiên cho các hướng để bảo vệ biên của ảnh khỏi bị mờ khi làm trơn ảnh. Các kiểu mặt nạ được sử dụng tùy 10 theo các trường hợp khác nhau. Các bộ lọc trên là bộ lọc tuyến tính theo nghĩa là điểm ảnh ở tâm cửa số sẽ được thay bởi tổ hợp các điểm lân cận chập với mặt nạ. Giả sử đầu vào biểu diễn bởi ma trận I: Ảnh số thu được bởi lọc trung bình Y=H⊗ I có dạng: Một bộ lọc trung bình không gian khác cũng hay được sử dụng. Phương trình của bộ lọc đó có dạng: Ở đây, nhân chập H có kích thuớc 2x2 và mỗi điểm ảnh kết quả có giá trị bằng trung bình cộng của nó với trung bình cộng của bốn lân cận gần nhất. Lọc trung bình trọng số là một trường hợp riêng của lọc thông thấp. ii. Lọc thông thấp Lọc thông thấp thường được sử dụng để làm trơn nhiễu.Về nguyên lý của bộ lọc thông thấp giống như đã trình bày trên. Trong kỹ thuật này người ta hay dùng một số nhân chập có dạng sau:
- Xem thêm -