Đăng ký Đăng nhập
Trang chủ Phát hiện ảnh giả mạo...

Tài liệu Phát hiện ảnh giả mạo

.PDF
67
3
81

Mô tả:

1 CÁC THUẬT NGỮ VÀ CÁC TỪ VIẾT TẮT 2-D 2- Dimension 3-D AC CCD Covariance Matrix DC DCT DPI EM Image Enhancement PCA 3- Dimension Alternating Current Change Coupled Divice Ma trận đồng biến Direct Current Discrete Cosin Transform Dot per inch Expectation/Maximization algorithm Tăng cƣờng ảnh Principal Component Analysis 2 DANH MỤC CÁC HÌNH Hình 1.1. Các giai đoạn chính trong xử lý ảnh.................................................................................................. 6 Hình 1.2. Các thành phần chính trong hệ thống xử lý ảnh ................................................................. 6 Hình 1.3. Minh họa về việc giả mạo ảnh ...............................................................................................................10 Hình 1.4. Minh họa cho loại giả mạo ghép ảnh ............................................................................................11 Hình 1.5. Minh họa cho loại giả mạo tăng cƣờng ảnh ..........................................................................12 Hình 1.6. Ảnh che phủ và bỏ đi đối tƣợng...........................................................................................................13 Hình 1.7. Ảnh bổ sung đối tƣợng ....................................................................................................................................14 Hình 1.8. Sơ đồ việc phát hiện giả mạo dựa vào cơ sở dữ liệu ..................................................15 Hình 2.1. Minh họa các loại nguồn sáng ...............................................................................................................21 Hình 2.2. Kết quả áp dụng thuật toán so khớp bền vững cho hình 1.7b .........................29 Hình 2.3. Kết quả của thuật toán phát hiện dựa trên PCA ...............................................................33 Hình 2.4. Lấy mẫu lại một tín hiệu với tỷ lệ 4/3 ..........................................................................................35 Hình 2.5. Kết quả thực hiện thuật toán EM cho các tín hiệu ở hình 2.4 ........................40 Hình 2.6. Ví dụ về lấy mẫu lại ảnh ...............................................................................................................................42 Hình 2.7. Kết quả của thuật toán EM áp dụng để ƣớc lƣợng xác suất ..............................43 Hình 2.8. Ví dụ cho thuật toán phát hiện việc lấy mẫu lại ...............................................................44 Hình 2.9. Minh họa biểu đồ xác suất nhân tạo ...............................................................................................47 Hình 2.10. Độ chính xác của thuật toán phát hiện với các tham số lấy mẫu lại khác nhau.......................................................................................................................................................................................................49 Hình 3.1. Ảnh giả đƣợc tạo ra bằng việc copy một vùng khói và dán vào ảnh nhiều lần.........................................................................................................................................................................................................50 Hình 3.2. Ảnh bổ sung đối tƣợng ....................................................................................................................................51 Hình 3.3. Ảnh giả đƣợc tạo ra từ 2 ảnh ở hình 3.4 ....................................................................................52 Hình 3.4. Hai ảnh gốc để tạo ra ảnh giả ở hình 3.3 ...................................................................................52 Hình 3.5. Kết quả của thuật toán ƣớc lƣợng hƣớng nguồn sáng cho 2 đối tƣợng trong ảnh.........................................................................................................................................................................................................53 Hình 3.6. Giao diện chƣơng trình ...................................................................................................................................55 Hình 3.7. (a) ảnh gốc; (b) ảnh giả mạo; (c) Kết quả thực hiện thuật toán ....................56 Hình 3.8. Kết quả của thuật toán phát hiện với các kích thƣớc khối khác nhau ...57 Hình 3.9. Kết quả của thuật toán phát hiện ảnh giả mạo ở hình 3.2b ................................57 3 MỞ ĐẦU Ngày nay, với sự phát triển mạnh mẽ của ngành Khoa học máy tính cũng nhƣ sự bùng nổ của lĩnh vực Công nghệ thông tin đã đẩy nhanh sự phát triển của nhiều lĩnh vực nhƣ quân sự, y học, giáo dục, kinh tế, giải trí v.v... Sự phát triển của phần cứng cả về phƣơng diện thu nhận, hiển thị, cùng với tốc độ xử lý đã mở ra nhiều hƣớng mới cho sự phát triển phần mềm, đặc biệt là Công nghệ xử lý ảnh đã ra đời và phát triển nhanh. Sức mạnh của các phần mềm soạn thảo và xử lý ảnh nhƣ Photoshop đã giúp cho việc tạo ra ảnh giả mạo ngày càng dễ dàng hơn. Các chƣơng trình xử lý ảnh này có thể thêm vào hoặc bỏ đi các đặc trƣng của ảnh mà ít để lại các dấu hiệu về sự giả mạo v.v... Ngƣời ta tạo ra các ảnh giả mạo thƣờng nhằm vào các mục đích nhƣ vu cáo, tạo ra các tin giật gân, đánh lừa đối thủ, làm sai lệch chứng cứ phạm tội v.v... Do vậy, việc phát hiện ra ảnh giả mạo là vấn đề phải đặt ra ngày càng cấp bách và càng trở nên khó khăn. Mặc dù nhu cầu về việc phát hiện các giả mạo ảnh số đã đƣợc công nhận bởi cộng đồng các nhà nghiên cứu, nhƣng hiện nay rất ít tài liệu có giá trị về lĩnh vực này. Trong việc chống giả mạo ảnh, ngƣời ta đã nghiên cứu các kỹ thuật về tạo bản quyền ảnh trên cơ sở giấu các thông tin cần thiết vào bức ảnh trƣớc khi phát hành để tránh tình trạng sao chép bất hợp pháp hoặc để tiện cho việc phát hiện các sửa đổi hoặc cắt ghép sau này. Theo cách tiếp cận này, các thiết bị máy ảnh số và camera ngày nay thƣờng bổ sung các tính năng bản quyền ngay trong quá trình thu nhận ảnh. Dựa vào đó sau này ta có thể biết đƣợc nguồn gốc của bức ảnh. Nhờ đó mà có thể biết đƣợc đó có phải là ảnh gốc hay không? Cách tiếp cận này dựa vào giả thiết rằng việc giả mạo ảnh sẽ làm thay đổi thông tin bản quyền. Tuy nhiên, hạn chế của cách tiếp cận này là thông tin bản quyền phải đƣợc chèn vào tại thời gian thu nhận ảnh nên chỉ giới hạn với các camera số đƣợc trang bị đặc biệt. Trên đây đã điểm qua tầm quan trọng của vấn đề phát hiện ảnh giả mạo và điều đó cho ta thấy rõ tính cần thiết cũng nhƣ tính thời sự đồng thời là ý nghĩa khoa học và thực tiễn của vấn đề. Nhận thức đƣợc điều này, tôi đã chọn đề tài: “Phát hiện ảnh giả mạo” cho luận văn của mình. 4 Bố cục của luận văn bao gồm phần mở đầu, phần kết luận và ba chƣơng nội dung đƣợc tổ chức nhƣ sau: Chƣơng 1: Tổng quan về xử lý ảnh và giả mạo ảnh Chƣơng này trình bày tổng quan về một hệ thống xử lý ảnh, các vấn đề cơ bản trong xử lý ảnh, đồng thời trình bày tổng quan về ảnh giả mạo và phát hiện ảnh giả mạo, cụ thể là các dạng ảnh giả mạo cơ bản cùng các cách tiếp cận chính để phát hiện ảnh giả mạo. Chƣơng 2: Một số phƣơng pháp phát hiện ảnh giả mạo Chƣơng này trình bày một số kỹ thuật phát hiện ảnh giả mạo nhƣ: Kỹ thuật phát hiện dựa vào phân tích nguồn sáng, kỹ thuật phát hiện dựa vào việc tìm ra dấu vết của việc lấy mẫu lại và các kỹ thuật phát hiện dựa vào việc tìm ra các vùng lặp trong ảnh. Chƣơng 3: Ứng dụng Trình bày các ứng dụng của các kỹ thuật phát hiện ảnh giả mạo và sử dụng Visual C++ cài đặt kỹ thuật phát hiện các vùng lặp trong ảnh để phát hiện loại ảnh giả mạo sinh bởi thao tác copy và dịch chuyển vùng trên ảnh. 5 Chƣơng 1 – TỔNG QUAN VỀ XỬ LÝ ẢNH VÀ GIẢ MẠO ẢNH Chương này trình bày tổng quan về một hệ thống xử lý ảnh, các vấn đề cơ bản trong xử lý ảnh, đồng thời trình bày tổng quan về ảnh giả mạo và phát hiện ảnh giả mạo, cụ thể là các dạng ảnh giả mạo cơ bản cùng với các cách tiếp cận chính để phát hiện ảnh giả mạo. 1.1 Xử lý ảnh, các vấn đề cơ bản trong xử lý ảnh 1.1.1 Xử lý ảnh là gì? Xử lý ảnh là một khoa học tƣơng đối mới mẻ so với nhiều ngành khoa học khác, nhất là trong quy mô công nghiệp, song trong xử lý ảnh đã bắt đầu xuất hiện những máy tính chuyên dụng. Để có thể hình dung cấu hình một hệ thống xử lý ảnh chuyên dụng hay một hệ thống xử lý ảnh dùng trong nghiên cứu, đào tạo, trƣớc hết chúng ta sẽ xem xét các bƣớc cần thiết trong xử lý ảnh. Trƣớc hết là quá trình thu nhận ảnh. Ảnh có thể thu nhận qua camera. Thƣờng ảnh thu nhận qua camera là tín hiệu tƣơng tự (loại camera ống kiểu CCIR), nhƣng cũng có thể là tín hiệu số hóa (loại CCD-Change Coupled Device). Ảnh cũng có thể thu nhận từ vệ tinh qua các bộ cảm ứng (sensor), hay ảnh, tranh đƣợc quét trên scanner. Tiếp theo là quá trình số hóa để biến đổi tín hiệu liên tục sang tín hiệu rời rạc (lấy mẫu) và số hóa bằng lƣợng hóa, trƣớc khi chuyển sang giai đoạn xử lý, phân tích hay lƣu trữ lại. Quá trình phân tích ảnh bao gồm nhiều công đoạn nhỏ. Trƣớc hết là công việc tăng cƣờng ảnh để nâng cao chất lƣợng ảnh. Do những nguyên nhân khác nhau: có thể do chất lƣợng thiết bị thu nhận ảnh, do nguồn sáng hay do nhiễu, ảnh có thể bị suy biến. Do vậy cần phải tăng cƣờng và khôi phục lại ảnh để làm nổi bật một số đặc tính chính của ảnh, hay làm cho ảnh gần giống nhất với trạng thái gốc – trạng thái trƣớc khi ảnh bị biến dạng. Giai đoạn tiếp theo là phát hiện các đặc tính nhƣ biên, phân vùng ảnh, trích chọn các đặc tính, v.v... 6 Cuối cùng, tùy theo mục đích của ngƣời sử dụng, sẽ là giai đoạn nhận dạng, phân lớp hay các quyết định khác. Các giai đoạn chính trong quá trình xử lý ảnh đƣợc mô tả qua hình 1.1[1]. Thu nhận (Camera, scanner, sensor, ...) Tiền xử lý (Nắn chỉnh, xóa nhiễu, ...) Trích chọn đặc trƣng Lƣu trữ Hậu xử lý (Chính xác hóa, rút gọn, ...) Kết luận Hệ quyết định Hình 1.1. Các giai đoạn chính trong xử lý ảnh Với các giai đoạn trên, một hệ thống xử lý ảnh gồm các thành phần tối thiểu nhƣ hình sau: Màn hình đồ họa Camera Bộ nhớ Bộ xử lý tƣơng tự Bộ nhớ ảnh Máy chủ Bộ xử lý ảnh số ngoài Màn hình Bàn phím Máy in Hình 1.2. Các thành phần chính trong hệ thống xử lý ảnh 7  Đối với một hệ thống xử lý ảnh thu nhận qua camera - camera nhƣ là con mắt của hệ thống. Có 2 loại camera: camera ống loại CCIR và camera CCD. Loại camera ứng với chuẩn CCIR quét ảnh với tần số 1/25 và mỗi ảnh gồm 625 dòng. Loại CCD gồm các photo điốt và làm tƣơng ứng một cƣờng độ sáng tại một điểm ảnh với một phần tử ảnh (pixel). Nhƣ vậy, ảnh là tập hợp các điểm ảnh. Số pixel tạo nên một ảnh gọi là độ phân giải.  Bộ xử lý tƣơng tự thực hiện các chức năng sau:  Chọn camera thích hợp nếu hệ thống có nhiều camera.  Chọn màn hình hiển thị tín hiệu.  Thu nhận tín hiệu video bởi bộ số hóa. Thực hiện lấy mẫu và mã hóa.  Tiền xử lý ảnh khi thu nhận: dùng kỹ thuật bảng tra (Look Up Table).  Bộ xử lý ảnh số gồm nhiều bộ xử lý chuyên dụng: xử lý lọc, trích chọn đƣờng bao, nhị phân hóa ảnh.  Máy chủ đóng vai trò điều khiển các thành phần miêu tả ở trên.  Bộ nhớ ngoài: Dữ liệu ảnh cũng nhƣ các dữ liệu khác, để có thể chuyển giao cho các quá trình khác, nó cần đƣợc lƣu trữ.  Các khái niệm cơ bản trong xử lý ảnh Điểm ảnh (pixel): Biểu diễn cƣờng độ sáng hay một dấu hiệu nào đó tại một tọa độ nào đó của đối tƣợng trong không gian. Điểm ảnh là một hàm nhiều biến P(x1, x2, ..., xn) trong đó n là số chiều của ảnh. Ảnh: là một tập hợp các điểm ảnh, thông thƣờng đƣợc biểu diễn dƣới dạng ma trận các điểm ảnh. Mức xám: là kết quả của sự mã hóa tƣơng ứng một cƣờng độ sáng của một điểm ảnh với một giá trị số - kết quả của quá trình lƣợng hóa. Cách mã hóa kinh điển thƣờng dùng 16, 32 hay 64 mức. Biểu đồ tần suất: Biều đồ tần suất của một mức xám g của ảnh I là số điểm ảnh của I có mức xám g. 8 1.1.2 Các vấn đề cơ bản trong xử lý ảnh 1.1.2.1 Biểu diễn ảnh Ảnh đƣợc thu nhận từ các thiết bị thu nhận ảnh. Sau khi thu nhận, ảnh đƣợc lƣu trữ trên máy tính. Quá trình lƣu trữ gồm 2 mục đích: tiết kiệm bộ nhớ và giảm thời gian xử lý. Ảnh đƣợc lƣu trữ trong bộ nhớ có ảnh hƣởng rất lớn đến việc hiển thị, in ấn và xử lý. Ảnh là tập hợp các điểm ảnh có cùng kích thƣớc do đó nếu sử dụng càng nhiều điểm ảnh thì ảnh càng mịn càng đẹp và càng thể hiện rõ hơn chi tiết của ảnh, ngƣời ta gọi đặc điểm này là độ phân giải. Việc lựa chọn độ phân giải phụ thuộc vào nhu cầu sử dụng và đặc trƣng của từng loại ảnh cụ thể. Chẳng hạn, ảnh dùng trong văn bản thƣờng thể hiện dƣới dạng đen trắng có độ phân giải 300 DPI, ảnh bản vẽ, bản đồ có độ phân giải 200DPI. Trên cơ sở đó, các ảnh đƣợc biểu diễn theo 2 mô hình cơ bản là RASTER và VECTOR. Mô hình RASTER: Theo mô hình này, ảnh đƣợc biểu diễn dƣới dạng ma trận các điểm ảnh. Tùy theo yêu cầu thực tế mà mỗi điểm ảnh đƣợc biểu diễn bằng một hoặc nhiều bít. Ngày nay thiết bị phần cứng phát triển nhƣng chủ yếu là theo định hƣớng Raster cho cả thiết bị đầu vào cũng nhƣ đầu ra. Ví dụ: máy in, máy quét v.v... Một trong những nghiên cứu chủ yếu trong mô hình raster là kỹ thuật nén ảnh, chia ra 2 khuynh hƣớng là nén bảo toàn và nén không bảo toàn thông tin. Nén bảo toàn thông tin là có khả năng phục hồi hoàn toàn dữ liệu ban đầu. Nén không bảo toàn thông tin là có khả năng phục hồi dữ liệu ban đầu nhƣng với sai số chấp nhận đƣợc. Trên cơ sở đó ngƣời ta đã xây dựng đƣợc nhiều khuôn dạng ảnh khác nhau: *.pcx, *.tif, *.gif, *.jpg, *.jpeg, v.v... Mô hình VECTOR: Ảnh lƣu trữ trên máy tính ngoài yêu cầu về giảm không gian lƣu trữ, thời gian xử lý, dễ dàng cho hiển thị và in ấn còn phải đảm bảo dễ dàng trong lựa chọn, sao chép, di chuyển và tìm kiếm. Theo những yêu cầu này, kỹ thuật biểu diễn Vector tỏ ra ƣu việt hơn. 9 Trong mô hình Vector, ảnh đƣợc biểu diễn bởi các điểm ảnh và các đƣờng thể hiện hƣớng của một điểm. Ảnh dạng Vector đƣợc thu nhận từ các thiết bị nhƣ sensor, digitalier, v.v... Ngày nay, các thiết bị phần cứng phát triển mạnh theo hƣớng Raster cho cả đầu vào và đầu ra nên một trong những nghiên cứu chủ yếu của mô hình Vector là tập trung cho chuyển đổi từ ảnh Raster sang ảnh Vector. 1.1.2.2 Nắn chỉnh biến dạng Ảnh thu đƣợc sau quá trình thu nhận thƣờng bị biến dạng do những thiết bị quang học và điện tử. Do đó cần phải có khâu nắn chỉnh biến dạng. Để nắn chỉnh biến dạng ta dựa vào tập các điểm điều khiển ( Pi , Pi ' ) (i  1,..., n). Cần tìm hàm: f : Pi  f (Pi ) sao cho: n  i 1 2 f ( Pi )  Pi '  min 1.1.2.3 Khử nhiễu Trong quá trình thu nhận ảnh không thể tránh khỏi bị nhiễu. Có 2 loại nhiễu cơ bản: - Nhiễu hệ thống: là loại nhiễu gây ra bởi hệ thống, nhƣ vết xƣớc hoặc nguồn sáng ngoại lai. Loại nhiễu này có tính chất chu kỳ và có thể dễ khắc phục bằng các phép biến đổi. - Nhiễu ngẫu nhiên: là các vết bẩn không rõ nguyên nhân. Loại nhiễu này thƣờng khó khử, tùy vào từng ảnh cụ thể mà có cách khắc phục. Thông thƣờng sử dụng các phép lọc. 1.1.2.4 Nhận dạng ảnh Nhận dạng ảnh là quá trình liên quan đến các mô tả đối tƣợng mà ngƣời ta muốn đặc tả nó. Quá trình nhận dạng thƣờng đi sau quá trình trích chọn các đặc tính chủ yếu của đối tƣợng. Có hai kiểu mô tả đối tƣợng: - Mô tả tham số (nhận dạng theo tham số). - Mô tả theo cấu trúc (nhận dạng theo cấu trúc). Trên thực tế, ngƣời ta đã áp dụng kỹ thuật nhận dạng khá thành công với nhiều đối tƣợng khác nhau nhƣ: nhận dạng ảnh vân tay, nhận dạng chữ (chữ cái, chữ số, chữ có dấu). 10 Nhận dạng chữ in hoặc đánh máy phục vụ cho việc tự động hóa quá trình đọc tài liệu, tăng nhanh tốc độ và chất lƣợng thu nhận thông tin từ máy tính. Nhận dạng chữ viết tay (với mức độ ràng buộc khác nhau về cách viết, kiểu chữ, v.v...) phục vụ cho nhiều lĩnh vực. Ngoài hai kỹ thuật nhận dạng trên, hiện nay một kỹ thuật nhận dạng mới dựa vào kỹ thuật mạng nơron đang đƣợc áp dụng và cho kết quả khả quan. 1.2 Ảnh giả mạo và phát hiện ảnh giả mạo 1.2.1 Ảnh giả mạo Ảnh giả mạo đƣợc xem là ảnh không có thật, việc có đƣợc ảnh là do sự ngụy tạo bởi các chƣơng trình xử lý ảnh hoặc quá trình thu nhận ảnh. Sức mạnh của các chƣơng trình xử lý ảnh số nhƣ PhotoShop, Corel Draw, v.v... giúp việc tạo ra các ảnh giả mạo từ một hay nhiều ảnh khác nhau trở nên dễ dàng. Một trong những ví dụ cho việc giả mạo này là hình 1.3. Hình này đƣợc tạo lập từ 3 bức ảnh: Nhà trắng, Bill Clinton và Saddam Hussein. Bill Clinton và Saddam Hussein đƣợc cắt và dán vào bức ảnh Nhà trắng. Các hiệu ứng về bóng và ánh sáng cũng đƣợc tạo ra làm cho bức ảnh nhìn có vẻ hoàn toàn nhƣ thật. Hình 1.3. Minh họa về việc giả mạo ảnh 11 1.2.2 Các loại ảnh giả mạo cơ bản Ảnh giả mạo thƣờng chia làm hai loại chính [2]. Ảnh giả nhƣng thật, tức là hiện trƣờng đƣợc dựng thật và việc thu nhận ảnh là thật. Loại thứ hai là ảnh giả đƣợc tạo lập trên cơ sở các phần của ảnh gốc thật nhƣ hình 1.3 hoặc đƣợc cắt dán để thêm vào hay che đi các chi tiết trên ảnh. Trong luận văn này tôi quan tâm đến một số dạng giả mạo thuộc loại thứ hai. Trong dạng ảnh giả mạo thứ hai có thể chia ra làm 3 loại chính: Ghép ảnh, tăng cƣờng ảnh và copy/di chuyển vùng trên ảnh. 1.2.2.1 Ghép ảnh Ghép ảnh là dạng giả mạo ảnh số phổ biến nhất, trong đó hai hay nhiều ảnh số đƣợc ghép lại với nhau để tạo ra một ảnh số hoàn chỉnh. Một ví dụ cho ghép ảnh là hình 1.4a. Ảnh này đƣợc ghép từ 2 ảnh có cùng tỷ lệ. Rõ ràng nếu chỉ ra đây là ảnh thật hay ảnh giả mạo thì cũng có nghĩa là chứng minh đƣợc mối quan hệ giữa họ. (a) Ghép ảnh từ các ảnh riêng rẽ (b) Ghép ảnh từ các ảnh thay đổi tỷ lệ Hình 1.4. Minh họa cho loại giả mạo ghép ảnh Một ví dụ khác của dạng giả mạo loại này là hình 1.4b. Hình này là ảnh ghép từ hai ảnh có sự thay đổi tỷ lệ. Nếu không chứng minh đƣợc ảnh này là giả thì sẽ phải có cách nhìn khác về sự tiến hóa của loài ngƣời? Độ tin cậy của sự giả mạo loại này phụ thuộc vào mức độ phù hợp giữa các thành phần trong ảnh về mặt kích thƣớc, tƣ thế, màu sắc, chất lƣợng và ánh sáng. Nếu có một cặp ảnh tƣơng thích tốt, đƣợc thực hiện bởi một chuyên gia giàu kinh nghiệm thì việc giả mạo hoàn toàn nhƣ thật. 12 1.2.2.2 Tăng cƣờng ảnh (a) (c) (b) (d) Hình 1.5. Minh họa cho loại giả mạo tăng cƣờng ảnh: (a) ảnh gốc, (b) ảnh đƣợc thay đổi màu sắc, (c) ảnh tăng độ tƣơng phản, (d) ảnh đƣợc làm mờ nền Hình 1.5 gồm một ảnh gốc (hình 1.5a), và 3 ví dụ cho loại giả mạo tăng cƣờng ảnh: (1) Xe mô tô màu xanh đƣợc chuyển thành màu lục lam và xe tải màu đỏ trong nền đƣợc chuyển thành màu vàng (hình 1.5b); (2) Tăng độ tƣơng phản của toàn cảnh làm cho ảnh này giống nhƣ đƣợc chụp vào một ngày trời nắng (hình 1.5c); (3) Các xe ôtô đỗ trong ảnh này bị làm mờ khiến cho chiều sâu 13 của khung cảnh trở nên hẹp hơn (hình 1.5d) v.v... Không giống nhƣ ghép ảnh, trong Photoshop loại thao tác này thƣờng sử dụng ít click chuột hơn. Mặc dù loại giả mạo này không thể thay đổi cơ bản hình dạng hay ý nghĩa của ảnh gốc nhƣ loại ghép ảnh, nhƣng nó vẫn có tác động khéo léo lên cách hiểu ảnh. Ví dụ, có thể sửa đổi thời tiết và thời gian trong ngày hay có thể làm mờ đi vài chi tiết để thổi phồng các chi tiết khác trong ảnh, v.v... 1.2.2.3 Copy và dịch chuyển vùng trên ảnh a) Ảnh gốc b) Ảnh đã che phủ đối tƣợng c) Ảnh gốc d) Ảnh bỏ đi đối tƣợng Hình 1.6. Ảnh che phủ và bỏ đi đối tƣợng 14 a) Ảnh gốc b) Ảnh bổ sung đối tƣợng Hình 1.7. Ảnh bổ sung đối tƣợng Một dạng khác thƣờng thấy nữa của ảnh giả mạo loại hai là việc sao chép/dịch chuyển các phần của ảnh gốc. Thể hiện của loại này có thể là việc bớt đi các đối tƣợng trong ảnh, và cũng đƣợc xem nhƣ là che phủ đối tƣợng hoặc xóa đi đối tƣợng. Hình 1.6a là ảnh gốc với 2 chiếc ô tô, một xe con và một xe tải. Hình 1.6b là hình 1.6a giả tạo với việc che phủ chiếc xe tải bằng một cành cây cũng lấy từ trong chính ảnh đó. Trong khi hình 1.6c là ảnh gốc với chiếc trực thăng nhỏ còn hình 1.6d chính là ảnh gốc 1.6c đã đƣợc bỏ đi đối tƣợng chiếc trực thăng. Trong cả hai trƣờng hợp giả mạo này đều đƣợc thực hiện từ một ảnh nên độ tƣơng đồng về ánh sáng và bóng là nhƣ nhau. Do đó, bằng mắt thƣờng rất khó xác định. Hình 1.7 thể hiện một dạng khác thƣờng thấy của giả mạo sinh ra bởi thao tác copy và dịch chuyển vùng trên ảnh là việc bổ sung thêm đối tƣợng. Hình 1.7a là ảnh gốc chỉ có một chiếc máy bay trực thăng, nhƣng hình 1.7b đã đƣợc bổ sung thêm thành 3 chiếc trực thăng ở các vị trí khác nhau. Các trực thăng này chính là đƣợc copy từ trực thăng gốc nên góc độ và hƣớng là giống nhau, do đó khó cho việc xác định. 1.2.3 Các cách tiếp cận chính trong phát hiện ảnh giả mạo 1.2.3.1 Dựa vào hình dạng Việc phân tích để xác định tính giả mạo có thể dựa vào hình dạng vì việc cắt dán và ghép ảnh thƣờng đƣợc thực hiện dựa theo các đƣờng biên, nơi có sự thay đổi không liên tục của cƣờng độ sáng của các điểm ảnh. 15 1.2.3.2 Dựa vào phân tích nguồn sáng Việc ghép các ảnh khác nhau hoặc bổ sung thêm đối tƣợng không phải thực hiện thao tác copy có thể đƣợc thực hiện bằng việc phân tích nguồn sáng đối với từng đối tƣợng, các đối tƣợng đƣợc ghép thƣờng có hƣớng của nguồn sáng không cùng với các đối tƣợng trong ảnh gốc. 1.2.3.3 Dựa vào biến đổi màu sắc Ảnh gốc thu nhận thƣờng đƣợc thực hiện bởi một thiết bị. Do tính chất biến đổi của ống kính bao gồm góc độ chụp, độ mở v.v... nên ảnh thu đƣợc thƣờng bị biến dạng theo các tính chất đặc trƣng của các nhà sản xuất. Phần ảnh đƣợc ghép vào hay bổ sung thƣờng không có sự biến đổi tƣơng đồng về độ sáng. 1.2.3.4 Dựa vào cơ sở dữ liệu Hình 1.8. Sơ đồ việc phát hiện giả mạo dựa vào cơ sở dữ liệu Việc giả mạo ảnh thƣờng dựa vào các ảnh đã có, tức là các ảnh đã đƣợc xuất bản bởi một nơi nào đó nhƣ: báo chí, trang Web, tạp chí v.v... Các ảnh này 16 đã đƣợc lƣu trữ nên khi xuất hiện một ảnh nghi là giả mạo ngƣời ta có thể tìm ảnh này với các phần trong nguồn ảnh nằm trong cơ sở dữ liệu ảnh. Trong trƣờng hợp tốt nhất là các ảnh trong cơ sở dữ liệu đều đã đƣợc ẩn giấu một thông tin về bản quyền nào đó. Hình 1.8 là sơ đồ tổng quát cho một hệ thống phát hiện giả mạo thuộc loại này. Cách tiếp cận này cũng thƣờng đƣợc áp dụng với trƣờng hợp xóa bớt hoặc bổ sung thêm đối tƣợng từ chính ảnh gốc. Trƣờng hợp mà việc phân tích nguồn sáng hay sự biến đổi về màu sắc không có tác dụng. Cơ sở dữ liệu trong trƣờng hợp này có thể xem là các phần có thể của ảnh gốc. 17 Chƣơng 2 – MỘT SỐ PHƢƠNG PHÁP PHÁT HIỆN ẢNH GIẢ MẠO Chương này trình bày một số kỹ thuật phát hiện ảnh giả mạo như: Kỹ thuật phát hiện dựa vào phân tích các mâu thuẫn trong hướng chiếu sáng, kỹ thuật phát hiện dựa vào việc tìm ra dấu vết của việc lấy mẫu lại và các kỹ thuật phát hiện ra sự giả mạo dựa vào việc tìm ra các vùng lặp trong ảnh. 2.1 Phát hiện dựa vào phân tích nguồn sáng Khi tạo ra một ảnh giả mạo bằng việc ghép các đối tƣợng từ các ảnh khác nhau thƣờng khó tƣơng thích về các điều kiện ánh sáng. Hầu nhƣ các đối tƣợng đƣợc ghép vào có hƣớng nguồn sáng không cùng với các đối tƣợng trong ảnh gốc. Do vậy, các khác nhau về hƣớng nguồn sáng này có thể là một gợi ý tốt để ta phát hiện ảnh giả mạo. Từ gợi ý đó ngƣời ta đã tìm ra một cách phát hiện ảnh giả mạo dựa vào mâu thuẫn trong nguồn sáng. Chúng ta biết rằng mỗi đối tƣợng trong ảnh đều đƣợc chiếu sáng bởi các nguồn sáng và nếu một ảnh không phải là ảnh giả mạo thì các đối tƣợng trong ảnh đó phải đƣợc chiếu sáng cùng nguồn sáng tại cùng thời gian. Còn nếu một ảnh là ảnh giả đƣợc tạo thành bằng việc ghép các đối tƣợng từ các bức ảnh khác nhau thì nguồn sáng của chúng thƣờng khác nhau. Do đó từ các đối tƣợng này ta tìm hƣớng chiếu của nguồn sáng đến từng đối tƣợng và đem so sánh với nhau, nếu chênh lệch nhiều thì kết luận đó là ảnh giả mạo. Trong phần này, trƣớc hết tôi trình bày sơ lƣợc về các loại nguồn sáng, sau đó trình bày một số phƣơng pháp ƣớc lƣợng hƣớng các nguồn sáng để dựa vào đó ta có thể phát hiện ra ảnh giả mạo. 2.1.1 Các loại nguồn sáng Nguồn sáng có thể chia thành hai loại là nguồn sáng đơn (một nguồn sáng) và đa nguồn sáng (nhiều nguồn sáng). Nếu các đối tƣợng của một ảnh đƣợc chiếu sáng bởi duy nhất một nguồn sáng thì ta gọi ảnh đó đƣợc chiếu sáng bởi nguồn sáng đơn, 18 ngƣợc lại nếu có nhiều nguồn sáng chiếu đến các đối tƣợng của ảnh thì ta gọi ảnh đó đƣợc chiếu sáng bởi nhiều nguồn sáng. Nguồn sáng đơn đƣợc chia làm 2 loại: nguồn sáng xa (xa vô hạn) và nguồn sáng cục bộ (nguồn sáng ở gần). Nguồn sáng đƣợc coi là nguồn sáng xa nếu khoảng cách từ nguồn sáng đến đối tƣợng là rất lớn so với kích thƣớc của đối tƣợng (lớn tới mức có thể coi đối tƣợng nhƣ một chất điểm). Ngƣợc lại thì gọi là nguồn sáng gần. Trên thực tế chỉ có các nguồn sáng tự nhiên (mặt trời, mặt trăng, v.v...) đƣợc xem là nguồn sáng xa. Đối với trƣờng hợp nguồn sáng ở xa vô hạn, việc ƣớc lƣợng hƣớng chiếu sáng là đơn giản nhất. Do khoảng cách từ đối tƣợng đến nguồn sáng là quá lớn nên có thể xem hƣớng chiếu sáng từ nguồn sáng đến mọi điểm trên đối tƣợng đều trùng nhau. Và vì vậy với mỗi đối tƣợng ta chỉ cần tìm ra một hƣớng chiếu sáng. Trƣờng hợp nguồn sáng cục bộ thì khó hơn nhiều. Vì nguồn sáng ở gần đối tƣợng nên hƣớng chiếu sáng từ nguồn sáng đến các điểm trên đối tƣợng sẽ khác nhau và đồng quy tại một điểm. Điểm đó chính là vị trí của nguồn sáng. Ánh sáng có một đặc tính tuyệt vời là cộng tuyến. Do vậy, trong trƣờng hợp nhiều nguồn sáng, hƣớng nguồn sáng đƣợc xác định bằng cách cộng các hƣớng nguồn sáng thành phần và xem nhƣ chỉ có một nguồn sáng (ảo) chiếu vào đối tƣợng. 2.1.2 Các phƣơng pháp ƣớc lƣợng hƣớng nguồn sáng Thuật toán ƣớc lƣợng hƣớng nguồn sáng không thể áp dụng chung cho mọi loại nguồn sáng mà mỗi loại có một cách ƣớc lƣợng riêng. Trong phần này, tôi trình bày các phƣơng pháp ƣớc lƣợng hƣớng chiếu sáng của nguồn sáng xa, nguồn sáng cục bộ và nhiều nguồn sáng để sử dụng cho việc phát hiện ảnh giả mạo [11]. 2.1.2.1 Nguồn sáng xa (3-D) Các cách tiếp cận chuẩn cho việc ƣớc lƣợng hƣớng nguồn sáng bắt đầu bằng một số giả định đơn giản sau: (1) Bề mặt đối tƣợng là bề mặt Lambertian (bề mặt phản chiếu ánh sáng bằng nhau theo mọi hƣớng); (2) Bề mặt đối tƣợng có hệ số phản chiếu không thay đổi; 19 (3) Bề mặt đối tƣợng đƣợc chiếu sáng bằng một nguồn sáng điểm vô cùng xa; (4) Góc giữa pháp tuyến bề mặt và hƣớng ánh sáng nằm trong khoảng 0 0 đến 900. Với các giả định này, cƣờng độ ảnh đƣợc biểu diễn nhƣ sau:   I ( x, y)  R( N ( x, y).L)  A (2.1)  Trong đó R là giá trị hệ số phản chiếu cố định của bề mặt, L là véctơ 3  chiều chỉ hƣớng chiếu của nguồn sáng, N ( x, y) là véctơ 3 chiều chỉ pháp tuyến của bề mặt tại điểm (x,y), và A là hệ số phản chiếu của môi trƣờng, hình 2.1(a). Nếu chúng ta chỉ quan tâm đến hƣớng của nguồn sáng thì hệ số phản chiếu, R,   có thể xem là hằng số. Từ ảnh ta có thể tính đƣợc I(x,y) và N ( x, y) còn L và A là các ẩn mà chúng ta phải tìm. Với ít nhất 4 điểm có hệ số phản chiếu giống nhau, R, và các pháp tuyến  của bề mặt cụ thể, N , hƣớng nguồn sáng và hệ số ánh sáng nền A có thể đƣợc tính bằng phƣơng pháp ƣớc lƣợng bình phƣơng tối thiểu chuẩn. Trƣớc hết xét hàm sai số có dạng nhƣ sau:  L   I (x , y )   x  1 1   L   I (x , y )   E ( L, A)  M  y    2 2   L   ...   z   I (x , y )  A   p p       2 2 (2.2)  M v b  Trong đó Lx, Ly, và Lz là các thành phần của hƣớng nguồn sáng L , và  N x ( x1 , y1 ) N y ( x1 , y1 ) N z ( x1 , y1 ) 1     N x ( x2 , y2 ) N y ( x2 , y2 ) N z ( x2 , y2 ) 1  M         N x ( x p , y p ) N y ( x p , y p ) N z ( x p , y p ) 1   (2.3)  Với Nx(xi,yi), Ny(xi,yi), Nz(xi,yi) là các thành phần của pháp tuyến bề mặt N tại tọa độ (xi, yi). Hàm lỗi trên đƣợc cực tiểu bằng việc lấy đạo hàm hàm sai số  trên theo v và thiết lập kết quả bằng không, ta có:
- Xem thêm -

Tài liệu liên quan