Đăng ký Đăng nhập
Trang chủ Giáo dục - Đào tạo Cao đẳng - Đại học Phát hiện ảnh giả mạo dạng lồng ghép trên miền tần số và sai phân cấp hai ...

Tài liệu Phát hiện ảnh giả mạo dạng lồng ghép trên miền tần số và sai phân cấp hai

.PDF
65
166
62

Mô tả:

i LỜI CAM ĐOAN Tôi xin cam đoan luận văn thạc sĩ khoa học máy tính: “Phát hiện ảnh giả mạo dạng lồng ghép trên miền tần số và sai phân cấp hai” là kết quả của quá trình học tập, nghiên cứu khoa học độc lập, nghiêm túc. Các số liệu trong luận văn là trung thực, có nguồn gốc rõ ràng, được trích dẫn và có tính kế thừa, phát triển từ các tài liệu, tạp chí, các công trình nghiên cứu đã được công bố trên các website, … Các phương pháp nêu trong luận văn được rút ra từ những cơ sở lý luận và quá trình nghiên cứu tìm hiểu của tác giả. Học viên Nguyễn Hoàng Long Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn ii LỜI CẢM ƠN Luận văn này được thực hiện tại Trường Đại học Công nghệ Thông tin và Truyền thông Thái Nguyên dưới sự hướng dẫn, chỉ bảo tận tình của PGS.TS. Phạm Văn Ất và các cộng sự, những người mà từ đó học viên đã học được rất nhiều điều quý báu, các thầy là tấm gương sáng cho em trong nghiên cứu chuyên môn cũng như trong cuộc sống. Em xin gửi gửi lời cảm ơn thầy PGS. TS. Phạm Văn Ất và các cộng sự đã tận tình giúp đỡ em trong suốt thời gian học tập vừa qua, đặc biệt là định hướng nghiên cứu và tận tình hướng dẫn cho em trong suốt quá trình làm luận văn. Nếu không có sự giúp đỡ tận tình của thầy, em khó có thể hoàn thành luận văn này. Bên cạnh đó em cũng xin chân thành cảm ơn các thầy cô T r ư ờ ng Đạ i h ọc Công nghệ Thông tin & Tr u y ề n t h ô n g đã tận tình giảng dạy, chỉ bảo và cung cấp cho e7m những kiến thức cần thiết trong suốt thời gian học và cũng xin gửi lời cám ơn chân thành đến những người thân, bạn bè và đồng nghiệp đã giúp đỡ và động viên tôi trong suốt thời gian học tập cũng như trong thời gian thực hiện luận văn. Chân thành cảm ơn ! Thái Nguyên, ngày 10 tháng 6 năm 2016 Học viên Nguyễn Hoàng Long Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn iii MỤC LỤC LỜI CAM ĐOAN ......................................................................................................................... i LỜI CẢM ƠN ............................................................................................................................. ii DANH MỤC CÁC HÌNH VẼ ................................................................................................. vi DANH MỤC KÝ HIỆU VÀ CHỮ VIẾT TẮT.....................................................................vii MỞ ĐẦU..................................................................................................................................... 1 1. Đặt vấn đề................................................................................................................................ 1 2. Đối tượng, phạm vi nghiên cứu ......................................................................................... 2 3. Hướng nghiên cứu của đề tài ............................................................................................. 2 4. Những nội dung nghiên cứu chính: .................................................................................. 2 CHƯƠNG 1: TỔNG QUAN VỀ XỬ LÝ ẢNH VÀ BÀI TOÁN PHÁT HIỆN ẢNH GIẢ MẠO ............................................................................................................................................ 4 1.1. TỔNG QUAN VỀ XỬ LÝ ẢNH ...................................................................................... 4 1.1.1. Xử lý ảnh là gì?................................................................................................................. 4 1.1.1.1. Thu nhận ảnh ..........................................................................................5 1.1.1.2. Tiền xử lý ..............................................................................................6 1.1.1.3. Phân đoạn ảnh .......................................................................................6 1.1.1.4. Hệ quyết định ........................................................................................7 1.1.1.5. Trích chọn đặc điểm ...............................................................................7 1.1.1.6. Nhận dạng ..............................................................................................8 1.1.2. Các khái niệm cơ bản trong xử lý ảnh.......................................................................... 10 1.1.3. Các vấn đề cơ bản trong xử lý ảnh ............................................................................... 10 1.1.3.1. Biểu diễn ảnh .......................................................................................10 1.1.3.2. Nắn chỉnh biến dạng ............................................................................12 1.1.3.3. Khử nhiễu ............................................................................................12 1.1.3.4. Nhận dạng ảnh .....................................................................................13 1.2. BÀI TOÁN PHÁT HIỆN ẢNH GIẢ MẠO ................................................................... 13 1.2.1. Khái niệm về ảnh giả mạo ......................................................................................... 13 1.2.2. Phân loại ảnh giả mạo. ................................................................................................ 14 Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn iv 1.3. KỸ THUẬT PHÒNG CHỐNG VÀ PHÁT HIỆN ẢNH GIẢ MẠO .......................... 17 1.3.1. Kỹ thuật phòng chống ảnh giả mạo............................................................................. 17 1.3.1.1.Giới thiệu và phân loại thủy vân ..........................................................18 1.3.1.2. Tính chất của lược đồ thủy vân ...........................................................20 1.3.1.3.Ứng dụng của thủy vân.........................................................................21 1.3.2. Một số kỹ thuật phát hiện ảnh giả mạo ................................................................... 21 1.3.2.1. Dựa vào sự không tương thích hướng nguồn sáng .................................21 1.3.2.2. Dựa vào sự không tương thích về nhiễu ................................................22 1.3.2.3. Dựa vào sự không tương thích về các pixel ...........................................22 1.3.2.4. Dựa vào sự không tương thích về màu sắc ............................................23 1.3.2.5. Dựa vào sự xuất hiện nhiều lần của một vùng trên ảnh ..........................23 1.3.2.6. Dựa vào dấu vết của việc lấy mẫu lại ..................................................23 1.4. MỘT SỐ PHƯƠNG PHÁP PHÁT HIỆN VÙNG ẢNH ĐƯỢC LẤY MẪU LẠI.... 24 1.4.1. Khái niệm lấy mẫu lại (Resample) ............................................................................... 24 1.4.1.1. Lấy mẫu lại tín hiệu .............................................................................24 1.4.1.2. Lấy mẫu lại trên ảnh ............................................................................25 1.4.1.3 Tính chất của phép lấy mẫu tăng trên ảnh ............................................25 1.4.2. Giới thiệu về phương pháp phát hiện vùng ảnh được lấy mẫu lại ............................ 27 1.4.2.1. Phương pháp của Popescu và Kichner ................................................27 1.4.2.2. Phương pháp dựa trên mật độ năng lượng ..........................................28 1.4.2.3. Phương pháp dựa trên phép phân tích SVD ........................................28 1.4.2.4. Phương pháp dựa trên sai phân cấp hai ...............................................28 1.4.2.5. Phương pháp sử dụng phép biến đổi DCT, DWT. ..............................29 CHƯƠNG II: PHÁT HIỆN ẢNH GIẢ MẠO ĐƯỢC LẤY MẪU TĂNG BẰNG CÁC PHÉP BIẾN ĐỔI TRÊN MIỀN TẦN SỐ VÀ SAI PHÂN CẤP HAI................................ 30 2.1. PHƯƠNG PHÁP DỰA TRÊN PHÉP BIẾN ĐỔI COSIN RỜI RẠC (DCT) ........... 30 2.1.1. Phép biến đổi Cosin rời rạc (DCT) của ma trận ảnh ............................................ 30 2.1.2. Phương pháp phát hiện dựa trên phép biến đổi DCT ........................................... 33 2.2. PHƯƠNG PHÁP DỰA TRÊN PHÉP BIẾN ĐỔI DWT .............................................. 34 2.2.1. Một số ký hiệu và khái niệm ..................................................................34 Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn v 2.2.2. Ý tưởng chung của phép biến đổi DWT trực chuẩn...............................34 2.2.3. Phép biến đổi DWT dạng Haar (DWT Haar) .........................................35 2.2.4. Phép biến đổi DWT dạng Daubechies D4 (DWT D4) ...........................36 2.3. PHÁT HIỆN ẢNH GIẢ MẠO BẰNG PHÉP BIẾN ĐỔI SONG TRỰC GIAO BIOR3.5 VÀ LỌC THÔNG CAO CỦA PHÉP BIẾN ĐỔI DWT...................................... 37 2.3.1. Phát hiện vùng giả mạo bằng phép biến đổi song trưc giao Bior 3.5................ 37 2.3.2. Phương pháp dựa trên lọc thông cao của phép biến đổi DWT ................................. 39 2.3.2.1. Phép biến đổi DWT theo bộ lọc ..........................................................39 2.3.2.2. Phương pháp giảm độ phức tạp tính toán (ký hiệu LTC) ....................41 2.4. PHƯƠNG PHÁP PHÁT HIỆN BẰNG PHÉP BIẾN ĐỔI HIỆU:............................... 43 2.4.1. Xây dựng phép biến đổi hiệu trên ma trận điểm ảnh.................................................. 43 2.4.2. Phương pháp phát hiện ảnh giả mạo dựa trên phép biến đổi hiệu (ký hiệu BĐH) 44 2.5. PHƯƠNG PHÁP SAI PHÂN CẤP HAI (Ký hiệu là SPB2): ..................................... 44 2.6. Đánh giá độ phức tạp tính toán và tính bền vững của các phương pháp. ..........45 CHƯƠNG III: THỬ NGHIỆM VÀ ỨNG DỤNG................................................................ 49 3.1. LỰA CHỌN BỘ ẢNH THỬ NGHIỆM .................................................................... 49 3.2. TẠO ẢNH GIẢ MẠO DẠNG LỒNG GHÉP ......................................................... 49 3.3. XÂY DỰNG CHƯƠNG TRÌNH THỬ NGHIỆM TRÊN MATLAB................ 50 3.4. MỘT SỐ ỨNG DỤNG PHÁT HIỆN ẢNH GIẢ MẠO DẠNG LỒNG GHÉP ..... 53 KẾT LUẬN............................................................................................................................... 55 Hướng phát triển của luận văn ................................................................................................. 56 TÀI LIỆU THAM KHẢO ....................................................................................................... 57 Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn vi DANH MỤC CÁC HÌNH VẼ Hình 1.1. Các giai đoạn trong xử lý ảnh .....................................................................5 Hình 1.2. Các thành phần chính trong hệ thống xử lý ảnh .........................................9 Hình 1.3. Minh họa về việc giả mạo ảnh .................................................................14 Hình 1.4. Minh họa cho loại ảnh giả mạo tăng cường ảnh: ......................................15 Hình 1.5. Ảnh che phủ và bỏ đi đối tượng ................................................................16 Hình 1.6. Hai hướng trong phòng chống và phát hiện ảnh số giả mạo .....................17 Hình 1.7. Quá trình nhúng thủy vân ..........................................................................18 Hình 1.8. Quá trình trích thủy vân ............................................................................18 Hình 1.9. Kết quả mô tả do độ đồng đều của các khối ảnh sau khi lấy mẫu tăng. ...26 Hình 2.1 : Sơ đồ phương pháp phát hiện dựa theo phép biến đổi DCT ....................33 Hình 2.2: Áp dụng phép biến đổi DWT theo hàng và cột ........................................36 Hinh 2.3: Áp dụng phép biến đổi DWT theo hai mức ..............................................36 Hình 2.4. Sơ đồ các bước trong phương pháp dựa trên phép biến đổi DWT song trực giao 3.5...............................................................................................................38 Hình 2.5. Sơ đồ thực hiện phép biến đổi DWT thuận...............................................39 Hình 2.6. Sơ đồ phép biến đổi DWT ngược. ............................................................40 Hình 2.7. Sơ đồ các bước trong phương pháp LTC. .................................................42 Bảng 3.1. Một số hình ảnh giả mạo được dùng để thực nghiệm. .............................50 Bảng 3.2. Một số hình ảnh giả mạo và kết quả phát hiện. ........................................51 Bảng 3.3. Minh họa tính bền vững của các phương pháp. ........................................52 Bảng 3.4. Thời gian thực hiện của 3 phương pháp (đơn vị là giây). ........................52 Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn vii DANH MỤC KÝ HIỆU VÀ CHỮ VIẾT TẮT Ký hiệu/ chữ viết tắt Ý nghĩa BMP Bitmap (định dạng ảnh) DCT Discrete Cosine Transform (biến đổi cosine rời rạc) DFT Discrete Fourier Transform (Phép biến đổi Fourier rời rạc) DWT Discrete Wavelet Transform (biến đổi wavelet rời rạc) IDCT Inverse Discrete Cosine Transform (phép biến đổi DCT ngược) IDWT Inverse Discrete Wavelet Transform (biến đổi DWT ngược) JPEG Joint Photographic Experts Group (một định dạng ảnh nén) NMF Non-negative Matrix Factorization (khai triển ma trận không âm) SVD Singular Value Decomposition (phân tích giá trị đặc trưng) TIFF Tagged Image File Format (định dạng ảnh) Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 1 MỞ ĐẦU 1. Đặt vấn đề Ngày nay, ảnh số là phương tiện truyền thông được sử dụng rộng rãi, đóng vai trò quan trọng trong đời sống con người, có tác động đến xã hội, tham gia vào các quá trình pháp lý và kinh tế như: làm bằng chứng trong điều tra, xử án, bảo hiểm, gian lận khoa học,… Hơn nữa, với sự phổ biến của máy ảnh kĩ thuật số và các phần mềm chỉnh sửa (Photoshop, GIMP,…) dẫn đến ảnh số có thể dễ dàng được chỉnh sửa mà không cần đến các kiến thức chuyên gia và việc chỉnh sửa hầu như không để lại dấu vết mà mắt thường có thể nhận biết được. Kết quả là khi những hình ảnh được chỉnh sửa sử dụng cho mục đích xấu nó có thể dẫn đến những hậu quả nghiêm trọng. Do vậy, việc phát hiện ảnh giả mạo là vấn đề đặt ra ngày càng cấp bách và càng trở nên khó khăn. Có nhiều cách để tạo ra hình ảnh giả mạo, trong đó lồng ghép các vùng ảnh từ các ảnh khác nhau là một cách rất phổ biến. Trong khi làm như vậy, để tạo ra hình ảnh thuyết phục, người ta thường phải sửa kích thước, quay, hay co giãn các phần của ảnh, quá trình này đòi hỏi lấy mẫu lại (resampling). Mặc dù việc lấy mẫu lại thường không thể nhìn thấy bằng mắt thường nhưng nó vẫn để lại các dấu vết về mặt tương quan giữa các điểm ảnh. Vì vậy, dựa vào dấu vết của việc lấy mẫu lại để phát hiện ảnh giả mạo có các vùng được lồng chép từ các nguồn khác nhau là một hướng quan trọng, thu hút nhiều sự quan tâm nghiên cứu. Đã có nhiều nghiên cứu để phát hiện ra dạng giả mạo này, tuy nhiên hiệu quả chưa cao và đòi hỏi thời gian tính toán lớn. Gần đây có một số phương pháp dựa trên miền tần số và sai phân cấp hai để phát hiện ảnh giả mạo dạng lồng ghép và khoanh được vùng giả mạo. So với các phương pháp khác thì các phương pháp này có đặc điểm là đơn giản và khoanh được vùng giả mạo khá rõ Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 2 ràng. Chính vì những ưu điểm trên và đây là một hướng nghiên cứu mới có nhiều ứng dụng nên em đã chọn đề tài “Phát hiện ảnh giả mạo dạng lồng ghép trên miền tần số và sai phân cấp hai” cho luận văn của mình. 2. Đối tượng, phạm vi nghiên cứu - Đối tượng : Ảnh giả dạng lồng ghép : là ảnh nhận được bằng cách ghép các phần của ảnh khác vào một ảnh đa mức xám gốc (phần được chèn vào gọi là vùng giả mạo). - Phạm vi nghiên cứu : Ảnh có các vùng giả mạo được lấy mẫy tăng (phóng to) cho phù hợp với kích thước và độ phân giải của ảnh gốc. 3. Hướng nghiên cứu của đề tài - Nghiên cứu việc phát hiện và khoanh vùng giả mạo được lấy mẫu tăng bằng phương pháp DCT, DWT và sai phân cấp 2. - Xây dựng chương trình thử nghiệm để so sánh tính hiệu quả của các phương pháp trên. 4. Những nội dung nghiên cứu chính: Dựa trên mục tiêu đã xác định, nội dung nghiên cứu chính sẽ được trình bày qua 3 chương với cấu trúc sau: Chương 1 : Tổng quan về xử lý ảnh và Bài toán phát ảnh giả mạo Trình bày những kiến thức cơ bản về xử lý ảnh, khái niệm về ảnh giả mạo giúp chúng ta có cái nhìn trực quan về ảnh giả mạo và phân loại ảnh giả mạo, bên cạnh đó đưa ra một số phương pháp phòng chống, phát hiện ảnh giả mạo. Chương 2: Phát hiện ảnh giả mạo được lấy mẫu tăng bằng các phép biến đổi trên miền tần số và sai phân cấp hai Nội dung Chương này sẽ trình bày cụ thể các phương pháp phát hiện ảnh giả mạo bằng các phép biến đổi trên miền tần số như: DCT, DWT ( DWT song trực giao Bior 3.5, Lọc thông cao DWT) và phương pháp Sai phân cấp hai. Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 3 Chương 3: Thử nghiệm và Ứng dụng Tiến hành xây dựng c á c chương trình thực nghiệm để phát hiện ảnh kỹ thuật số giả mạo dạng lồng ghép; Phân tích và so sánh các phương pháp qua kết quả thử nghiệm. Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 4 CHƯƠNG 1 TỔNG QUAN VỀ XỬ LÝ ẢNH VÀ BÀI TOÁN PHÁT HIỆN ẢNH GIẢ MẠO 1.1. TỔNG QUAN VỀ XỬ LÝ ẢNH 1.1.1. Xử lý ảnh là gì? Xử lý ảnh là một khoa học tương đối mới mẻ so với nhiều ngành khoa học khác, nhất là trong quy mô công nghiệp, song trong xử lý ảnh đã bắt đầu xuất hiện những máy tính chuyên dụng. Để có thể hình dung cấu hình một hệ thống xử lý ảnh chuyên dụng hay một hệ thống xử lý ảnh dùng trong nghiên cứu, đào tạo, trước hết chúng ta sẽ xem xét các bước cần thiết trong xử lý ảnh. Trước hết là quá trình thu nhận ảnh. Ảnh có thể thu nhận qua camera. Thường ảnh thu nhận qua camera là tín hiệu tương tự (loại camera ống kiểu CCIR), nhưng cũng có thể là tín hiệu số hóa (loại-Change Coupled Device). Ảnh cũng có thể thu nhận từ vệ tinh qua các bộ cảm ứng (sensor), hay ảnh, tranh được quét trên scanner. Tiếp theo là quá trình số hóa để biến đổi tín hiệu liên tục sang tín hiệu rời rạc (lấy mẫu) và số hóa bằng lượng hóa, trước khi chuyển sang giai đoạn xử lý, phân tích hay lưu trữ lại. Quá trình phân tích ảnh bao gồm nhiều công đoạn nhỏ. Trước hết là công việc tăng cường ảnh để nâng cao chất lượng ảnh. Do những nguyên nhân khác nhau: Có thể do chất lượng thiết bị thu nhận ảnh, do nguồn sáng hay do nhiễu ảnh có thể bị suy biến. Do vậy cần phải tăng cường và khôi phục lại ảnh để làm nổi bật một số đặc tính chính của ảnh, hay làm cho ảnh gần giống nhất với trạng thái gốc - trạng thái trước khi ảnh bị biến dạng. Giai đoạn tiếp theo là phát hiện các đặc tính như biên, phân vùng ảnh, trích chọn các đặc tính,v.v… Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 5 Cuối cùng, tùy theo mục đích của người xử dụng, sẽ là giai đoạn nhận dạng, phân lớp hay các quyết định khác. Các giai đoạn chính trong quá trình xử lý ảnh được mô tả qua hình 1.1. Thu nhận (Camera, Scanner, Sensor…) Trích chọn đặc trưng Tiền xử lý (Nắn chỉnh, xóa, nhiễu…) Lưu trữ Hậu xử lý (Chính xác hóa, rút gọn,…) Kết Luận Hệ quyết định Hình 1.1. Các giai đoạn trong xử lý ảnh 1.1.1.1. Thu nhận ảnh Đây là bước đầu tiên trong quá trình xử lý ảnh. Để thực hiện điều này, ta cần có bộ thu ảnh và khả năng số hoá những tín hiệu liên tục được sinh ra bởi bộ thu ảnh đó. Bộ thu ảnh ở đây có thể là máy chụp ảnh đơn sắc hay màu, máy quét ảnh, ... Trong trường hợp bộ thu ảnh cung cấp chưa phải là dạng số hoá ta còn phải chuyển đổi hay số hoá ảnh. Quá trình chuyển đổi ADC (Analog to Digital Converter) để thu nhận dạng số hoá của ảnh. Các thông số quan trọng ở bước này là độ phân giải, chất lượng màu, dung lượng bộ nhớ và tốc độ thu nhận ảnh của các thiết bị. Mặc dù đây chỉ là công đoạn đầu tiên song kết quả của nó có ảnh hưởng rất nhiều đến công đoạn kế tiếp. Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 6 1.1.1.2. Tiền xử lý Ở bước này, ảnh sẽ được cải thiện về độ tương phản, khử nhiễu, khử bóng, khử độ lệch, v.v với mục đích làm cho chất lượng ảnh trở nên tốt hơn nữa, chuẩn bị cho các bước xử lý phức tạp hơn về sau trong quá trình xử lý ảnh. Quá trình này thường được thực hiện bởi các bộ lọc. + Khử nhiễu: Nhiễu được chia thành hai loại: nhiễu hệ thống và nhiễu ngẫu nhiên. Đặc trưng của nhiễu hệ thống là tính tuần hoàn. Do vậy, có thể khử nhiễu này bằng việc sử dụng phép biến đổi Fourier và loại bỏ các đỉnh điểm. Đối với nhiễu ngẫu nhiên, trường hợp đơn giản là các vết bẩn tương ứng với các điểm sáng hay tối, có thể khử bằng phương pháp nội suy, lọc trung vị và trung bình. + Chỉnh mức xám: Đây là kỹ thuật nhằm chỉnh sửa tính không đồng đều của thiết bị thu nhận hoặc độ tương phản giữa các vùng ảnh. + Chỉnh tán xạ: Ảnh thu nhận được từ các thiết bị quang học hay điện tử có thể bị mờ, nhoè. Phương pháp biến đổi Fourier dựa trên tích chập của ảnh với hàm tán xạ cho phép giải quyết việc hiệu chỉnh này. 1.1.1.3. Phân đoạn ảnh Phân đoạn ảnh có nghĩa là chia một ảnh đầu vào thành nhiều phần khác nhau hay còn gọi là các đối tượng để biểu diễn phân tích, nhận dạng ảnh. Ví dụ: để nhận dạng chữ (hoặc mã vạch) trên phong bì thư cho mục đích phân loại bưu phẩm, cần chia các câu, chữ về địa chỉ hoặc tên người thành các từ, các chữ, các số (hoặc các vạch) riêng biệt để nhận dạng. Đây là phần phức tạp khó khăn nhất trong xử lý ảnh và cũng dễ gây lỗi, làm mất độ chính xác của ảnh. Kết quả nhận dạng ảnh phụ thuộc rất nhiều vào công đoạn này. Mục đích của phân đoạn ảnh là để có một miêu tả tổng hợp về Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 7 nhiều phần tử khác nhau cấu tạo lên ảnh thô. Vì lượng thông tin chứa trong ảnh rất lớn, trong khi đa số các ứng dụng chúng ta chỉ cần trích một vài đặc trưng nào đó, do vậy cần có một quá trình để giảm lượng thông tin khổng lồ đó. Quá trình này bao gồm phân vùng ảnh và trích chọn đặc tính chủ yếu. 1.1.1.4. Hệ quyết định Ảnh là một đối tượng khá phức tạp về đường nét, độ sáng tối, dung lượng điểm ảnh, môi trường để thu ảnh phong phú kéo theo nhiễu. Trong nhiều khâu xử lý và phân tích ảnh ngoài việc đơn giản hóa các phương pháp toán học đảm bảo tiện lợi cho xử lý, người ta mong muốn bắt chước quy trình tiếp nhận và xử lý ảnh theo cách của con người. Trong các bước xử lý đó, nhiều khâu hiện nay đã xử lý theo các phương pháp trí tuệ con người. Vì vậy, ở đây các cơ sở tri thức được phát huy. 1.1.1.5. Trích chọn đặc điểm Việc giải quyết bài toán nhận dạng trong những ứng dụng mới nảy sinh trong cuộc sống không chỉ tạo ra những thách thức về giải thuật, mà còn đặt ra những yêu cầu về tốc độ tính toán. Đặc điểm chung của tất cả ứng dụng đó là những đặc điểm đặc trưng cần thiết thường là nhiều, không thể do chuyên gia đề xuất, mà phải được trích chọn dựa trên các thủ tục phân tích dữ liệu. Việc trích chọn hiệu quả các đặc điểm giúp cho việc nhận dạng các đối tượng ảnh chính xác, với tốc độ tính toán cao và dung lượng nhớ lưu trữ giảm xuống. Các đặc điểm của đối tượng được trích chọn tuỳ theo mục đích nhận dạng trong quá trình xử lý ảnh. Có thể nêu ra một số đặc điểm của ảnh sau đây: Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 8 - Đặc điểm không gian: phân bố mức xám, phân bố xác suất, biên độ, điểm uốn v.v - Đặc điểm biến đổi: các đặc điểm loại này được trích chọn bằng việc thực hiện lọc vùng (zonal filtering). Các bộ vùng được gọi là “mặt nạ đặc điểm” (feature mask) thường là các khe hẹp với hình dạng khác nhau (chữ nhật, tam giác, cung tròn v.v..). - Đặc điểm biên và đường biên: Đặc trưng cho đường biên của đối tượng và do vậy rất hữu ích trong việc trích chọn các thuộc tính bất biến được dùng khi nhận dạng đối tượng. Các đặc điểm này có thể được trích chọn nhờ toán tử Gradient, toán tử la bàn, toán tử Laplace, toán tử “chéo không” (zero crossing) ... 1.1.1.6. Nhận dạng Đây là bước cuối cùng trong quá trình xử lý ảnh. Nhận dạng ảnh là quá trình xác định nội dung ảnh. Quá trình này thường thu được bằng cách so sánh với mẫu chuẩn đã được lọc (hoặc lưu) từ trước. Nhận dạng ảnh có thể được nhìn nhận một cách đơn giản là việc gán nhãn cho các đối tượng trong ảnh. Ví dụ như khi nhận dạng chữ viết, các đối tượng trong ảnh cần nhận dạng là các mẫu chữ, ta cần tách riêng các mẫu chữ đó ra và tìm cách gán đúng các ký tự của bảng chữ cái tương ứng cho các mẫu chữ thu được trong ảnh. Giải thích là công đoạn gán nghĩa cho một tập các đối tượng đã được nhận biết. Chúng ta cũng có thể thấy rằng, không phải bất kỳ một ứng dụng xử lý ảnh nào cũng bắt buộc phải tuân theo tất cả các bước xử lý đã nêu ở trên, ví dụ như các ứng dụng chỉnh sửa ảnh nghệ thuật chỉ dừng lại ở bước tiền xử lý. Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 9 Một cách tổng quát thì những chức năng xử lý bao gồm cả nhận dạng và giải thích thường chỉ có mặt trong hệ thống phân tích ảnh tự động hoặc bán tự động, được dùng để rút trích ra những thông tin quan trọng từ ảnh, ví dụ như các ứng dụng nhận dạng ký tự quang học, nhận dạng chữ viết tay v.v… Với các giai đoạn trên, một hệ thống xử lý ảnh gồm các thành phần tối thiểu như hình sau: Màn hình Đồ họa Camera Bộ nhớ ngoài Màn hình Bộ xử lý tương tự Bộ nhớ ảnh Màn hình đồ họa Bộ xử lý ảnh số Bàn phím Máy in Hình 1.2. Các thành phần chính trong hệ thống xử lý ảnh  Đối với một hệ thống xử lý ảnh thu nhận qua camera-camera như là con mắt của hệ thống: có hai loại camera ống loại CCIR và camera CCD. Loại camera ứng với chuẩn CCIR quét ảnh với tần số 1/25 và mỗi ảnh gồm 625 dòng. Loại CCD gồm các photo điốt và làm tương ứng một cường độ sáng tại một điểm ảnh với một phần tử ảnh (pixel). Như vậy, ảnh là tập hợp các điểm ảnh. Số pixel tạo nên một ảnh gọi là độ phân giải  Bộ xử lý tương tự thực hiện các chức năng sau: - Chọn camera thích hợp nếu hệ thống có nhiều camera. - Chọn màn hình hiển thị tín hiệu. Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 10 - Thu nhận tín hiệu video bởi bộ số hóa. Thực hiện lấy mẫu và mã hóa. - Tiền xử lý ảnh khi thu nhận: dùng kỹ thuật bảng tra (Look Up Table).  Bộ xử lý ảnh số gồm nhiều bộ xử lý chuyên dụng: xử lý lọc, trích chọn đường bao, nhị phân hóa ảnh.  Máy chủ đóng vai trò điều khiển các thành phần ở trên.  Bộ nhớ ngoài: Dữ liệu ảnh cũng như các dữ liệu khác, để có thể chuyển giao cho các quá trình khác, nó cần được lưu trữ. 1.1.2. Các khái niệm cơ bản trong xử lý ảnh Điểm ảnh (pixel): Biểu diễn cường độ sáng hay một dấu hiệu nào đó tại một tọa độ nào đó của đối tượng trong không gian. Điểm ảnh là một hàm nhiều biến P(x1, x2,..., xn) trong đó n là số chiều của ảnh. Ảnh: là một tập hợp các điểm ảnh, thông thường được biểu diễn dưới dạng ma trận các điểm ảnh. Mức xám: là kết quả sự mã hóa tương ứng của mỗi cường độ sáng của một điểm ảnh với một giá trị số - kết quả của quá trình lượng hóa. Cách mã hóa kinh điển thường dùng 16, 32 hay 64 mức. Biểu đồ tần suất: biểu đồ tần xuất của một mức xám g của ảnh I là số điểm ảnh của I có mức xám g. 1.1.3. Các vấn đề cơ bản trong xử lý ảnh 1.1.3.1. Biểu diễn ảnh Ảnh được thu nhận từ các thiết bị thu nhận ảnh. Sau khi thu nhận, ảnh được lưu trữ trên máy tính. Quá trình lưu trữ gồm 2 mục đích: tiết kiệm bộ nhớ và giảm thời gian xử lý. Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 11 Ảnh được lưu trữ trong bộ nhớ có ảnh hưởng rất lớn đến việc hiển thị, in ấn và xử lý. Ảnh là tập hợp các điểm ảnh có cùng kích thước do đó nếu sử dụng càng nhiều điểm ảnh thì càng mịn càng đẹp và càng thể hiện rõ hơn chi tiết của ảnh, người ta gọi đặc điểm này là độ phân giải. Việc lựa chọn độ phân giải phụ thuộc vào nhu cầu sử dụng và đặc trưng của từng loại ảnh cụ thể. Chẳng hạn, ảnh dùng trong văn bản thường thể hiện dưới dạng đen trắng có độ phân giải 300 DPI, ảnh bản vẽ, bản đồ có độ phân giải 200DPI. Trên cơ sở đó, các ảnh được biểu diễn theo 2 mô hình cơ bản là RASTER và VECTOR. Mô hình RASTER: Theo mô hình này, ảnh được biểu diễn dưới dạng ma trận các điểm ảnh. Tùy theo yêu cầu thực tế mà mỗi điểm ảnh được biểu diễn bằng một hoặc nhiều bit. Ngày nay thiết bị phần cứng phát triển nhưng chủ yếu là theo định hướng Raster cho cả thiết bị đầu vào cũng như đầu ra. Ví dụ: máy in, máy quét, v.v… Một trong những nghiên cứu chủ yếu trong mô hình raster là kỹ thuật nén ảnh, chia ra hai khuynh hướng đó là nén bảo toàn và nén không bảo toàn thông tin. Nén bảo toàn thông tin là có khả năng phục hồi hoàn toàn dữ liệu ban đầu. Nén không bảo toàn thông tin là có khả năng phục hồi dữ liệu ban đầu nhưng với sai số chấp nhận được. Trên cơ sở đó người ta xây dựng được nhiều khuôn dạng ảnh khác nhau: *.pcx, *.tif, *.gif, *.jpg, *.jpeg, v.v… Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 12 Mô hình VECTOR: Ảnh lưu trữ trên máy tính ngoài yêu cầu về giảm không gian lưu trữ, thời gian xử lý, dễ dàng cho hiển thị và in ấn còn phải đảm bảo dễ dàng trong sự lựa chọn, sao chép, di chuyển và tìm kiếm. Theo những yêu cầu này, kỹ thuật biểu diễn Vector tỏ ra ưu việt hơn. Trong mô hình Vector, ảnh được biểu diễn bởi các điểm ảnh và các đường thể hiện hướng của một điểm. Ảnh dạng vector được thu nhận từ các thiết bị như sensor, digitalier, v.v…. Ngày nay, các thiết bị phần cứng phát triển mạnh theo hướng Raster cho cả đầu vào và đầu ra nên một trong những nghiên cứu chủ yếu của mô hình Vector là tập trung cho chuyển đổi từ ảnh Raster sang ảnh Vector. 1.1.3.2. Nắn chỉnh biến dạng Ảnh thu được sau quá trình thu nhận thường bị biến dạng do những thiết bị quang học và điện tử. Do đó cần phải có khâu nắn chỉnh biến dạng. Để nắn chỉnh biến dạng ta dựa vào tập các điểm điều khiển (pi, p’i), ( i= 1, …, n). Cần tìm hàm: : Pi  (Pi) sao cho: n  i 1 2 f ( pi )  pi  min 1.1.3.3. Khử nhiễu Trong quá trình thu nhận ảnh không thể tránh khỏi bị nhiễu. Có 2 loại nhiễu cơ bản: - Nhiễu hệ thống: là loại nhiễu gây ra bởi hệ thống, như vết xước hoặc nguồn sáng ngoại lai. Loại nhiễu này có tính chất chu kỳ và có thể dễ khắc phục bằng các phép biến đổi. Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 13 - Nhiễu ngẫu nhiên: là các vết bẩn không rõ nguyên nhân. Loại nhiễu này thường khó khử, tùy vào từng ảnh cụ thể mà có cách khắc phục. Thông thường sử dụng các phép lọc. 1.1.3.4. Nhận dạng ảnh Nhận dạng ảnh là quá trình liên quan đến các mô tả đối tượng mà người ta muốn đặc tả nó. Quá trình nhận dạng thường đi sau quá trình trích chọn các đặc tính chủ yêu của đối tượng. Có 2 kiểu đối tượng: - Mô tả tham số (nhận dạng theo tham số) - Mô tả theo cấu trúc (nhận dạng theo cấu trúc) Trên thực tế, người ta đã áp dụng kỹ thuật nhận dạng khá thành công với nhiều đối tượng khác nhau như: nhận dạng ảnh vân tay, nhận dạng chữ (chữ cái, chữ số, chữ có dấu). Nhận dạng chữ in hoặc đánh máy phục vụ cho việc tự động hóa quá trình đọc tài liệu, tăng nhanh tốc độ và chất lượng thu nhận thông tin từ máy tính. Nhận dạng chữ viết tay (với mức độ ràng buộc khác nhau về cách viết, kiểu chữ, v.v...) phục vụ cho nhiều lĩnh vực. Ngoài hai kỹ thuật nhận dạng trên, hiện nay một kỹ thuật nhận dạng mới dựa vào kỹ thuật mạng nơron đang được áp dụng và cho kết quả khả quan. 1.2. BÀI TOÁN PHÁT HIỆN ẢNH GIẢ MẠO 1.2.1. Khái niệm về ảnh giả mạo Ảnh giả mạo được xem là ảnh không có thật, việc có được ảnh là do sự ngụy tạo bởi các chương trình xử lý ảnh hoặc quá trình thu nhận ảnh. Sức mạnh của các chương trình xử lý ảnh số như PhotoShop, Corel Draw, v.v...giúp việc tạo ra các ảnh giả mạo từ một hay nhiều ảnh khác nhau trở nên dễ dàng. Một trong những ví dụ cho việc giả mạo này là hình 1.3. Hình này được tạo lập từ 3 bức ảnh: Nhà trắng, Bill Clinton và Saddam Hussein. Bill Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn
- Xem thêm -

Tài liệu liên quan