1
CÁC THUẬT NGỮ VÀ CÁC TỪ VIẾT TẮT
2-D
2- Dimension
3-D
AC
CCD
Covariance Matrix
DC
DCT
DPI
EM
Image Enhancement
PCA
3- Dimension
Alternating Current
Change Coupled Divice
Ma trận đồng biến
Direct Current
Discrete Cosin Transform
Dot per inch
Expectation/Maximization algorithm
Tăng cƣờng ảnh
Principal Component Analysis
2
DANH MỤC CÁC HÌNH
Hình 1.1. Các giai đoạn chính trong xử lý ảnh.................................................................................................. 6
Hình 1.2. Các thành phần chính trong hệ thống xử lý ảnh ................................................................. 6
Hình 1.3. Minh họa về việc giả mạo ảnh ...............................................................................................................10
Hình 1.4. Minh họa cho loại giả mạo ghép ảnh ............................................................................................11
Hình 1.5. Minh họa cho loại giả mạo tăng cƣờng ảnh ..........................................................................12
Hình 1.6. Ảnh che phủ và bỏ đi đối tƣợng...........................................................................................................13
Hình 1.7. Ảnh bổ sung đối tƣợng ....................................................................................................................................14
Hình 1.8. Sơ đồ việc phát hiện giả mạo dựa vào cơ sở dữ liệu ..................................................15
Hình 2.1. Minh họa các loại nguồn sáng ...............................................................................................................21
Hình 2.2. Kết quả áp dụng thuật toán so khớp bền vững cho hình 1.7b .........................29
Hình 2.3. Kết quả của thuật toán phát hiện dựa trên PCA ...............................................................33
Hình 2.4. Lấy mẫu lại một tín hiệu với tỷ lệ 4/3 ..........................................................................................35
Hình 2.5. Kết quả thực hiện thuật toán EM cho các tín hiệu ở hình 2.4 ........................40
Hình 2.6. Ví dụ về lấy mẫu lại ảnh ...............................................................................................................................42
Hình 2.7. Kết quả của thuật toán EM áp dụng để ƣớc lƣợng xác suất ..............................43
Hình 2.8. Ví dụ cho thuật toán phát hiện việc lấy mẫu lại ...............................................................44
Hình 2.9. Minh họa biểu đồ xác suất nhân tạo ...............................................................................................47
Hình 2.10. Độ chính xác của thuật toán phát hiện với các tham số lấy mẫu lại
khác nhau.......................................................................................................................................................................................................49
Hình 3.1. Ảnh giả đƣợc tạo ra bằng việc copy một vùng khói và dán vào ảnh
nhiều lần.........................................................................................................................................................................................................50
Hình 3.2. Ảnh bổ sung đối tƣợng ....................................................................................................................................51
Hình 3.3. Ảnh giả đƣợc tạo ra từ 2 ảnh ở hình 3.4 ....................................................................................52
Hình 3.4. Hai ảnh gốc để tạo ra ảnh giả ở hình 3.3 ...................................................................................52
Hình 3.5. Kết quả của thuật toán ƣớc lƣợng hƣớng nguồn sáng cho 2 đối tƣợng
trong ảnh.........................................................................................................................................................................................................53
Hình 3.6. Giao diện chƣơng trình ...................................................................................................................................55
Hình 3.7. (a) ảnh gốc; (b) ảnh giả mạo; (c) Kết quả thực hiện thuật toán ....................56
Hình 3.8. Kết quả của thuật toán phát hiện với các kích thƣớc khối khác nhau ...57
Hình 3.9. Kết quả của thuật toán phát hiện ảnh giả mạo ở hình 3.2b ................................57
3
MỞ ĐẦU
Ngày nay, với sự phát triển mạnh mẽ của ngành Khoa học máy tính cũng
nhƣ sự bùng nổ của lĩnh vực Công nghệ thông tin đã đẩy nhanh sự phát triển của
nhiều lĩnh vực nhƣ quân sự, y học, giáo dục, kinh tế, giải trí v.v... Sự phát triển
của phần cứng cả về phƣơng diện thu nhận, hiển thị, cùng với tốc độ xử lý đã mở
ra nhiều hƣớng mới cho sự phát triển phần mềm, đặc biệt là Công nghệ xử lý ảnh
đã ra đời và phát triển nhanh. Sức mạnh của các phần mềm soạn thảo và xử lý
ảnh nhƣ Photoshop đã giúp cho việc tạo ra ảnh giả mạo ngày càng dễ dàng hơn.
Các chƣơng trình xử lý ảnh này có thể thêm vào hoặc bỏ đi các đặc trƣng của
ảnh mà ít để lại các dấu hiệu về sự giả mạo v.v... Ngƣời ta tạo ra các ảnh giả mạo
thƣờng nhằm vào các mục đích nhƣ vu cáo, tạo ra các tin giật gân, đánh lừa đối
thủ, làm sai lệch chứng cứ phạm tội v.v... Do vậy, việc phát hiện ra ảnh giả mạo
là vấn đề phải đặt ra ngày càng cấp bách và càng trở nên khó khăn.
Mặc dù nhu cầu về việc phát hiện các giả mạo ảnh số đã đƣợc công nhận
bởi cộng đồng các nhà nghiên cứu, nhƣng hiện nay rất ít tài liệu có giá trị về lĩnh
vực này. Trong việc chống giả mạo ảnh, ngƣời ta đã nghiên cứu các kỹ thuật về
tạo bản quyền ảnh trên cơ sở giấu các thông tin cần thiết vào bức ảnh trƣớc khi
phát hành để tránh tình trạng sao chép bất hợp pháp hoặc để tiện cho việc phát
hiện các sửa đổi hoặc cắt ghép sau này. Theo cách tiếp cận này, các thiết bị máy
ảnh số và camera ngày nay thƣờng bổ sung các tính năng bản quyền ngay trong
quá trình thu nhận ảnh. Dựa vào đó sau này ta có thể biết đƣợc nguồn gốc của
bức ảnh. Nhờ đó mà có thể biết đƣợc đó có phải là ảnh gốc hay không? Cách
tiếp cận này dựa vào giả thiết rằng việc giả mạo ảnh sẽ làm thay đổi thông tin
bản quyền. Tuy nhiên, hạn chế của cách tiếp cận này là thông tin bản quyền phải
đƣợc chèn vào tại thời gian thu nhận ảnh nên chỉ giới hạn với các camera số
đƣợc trang bị đặc biệt.
Trên đây đã điểm qua tầm quan trọng của vấn đề phát hiện ảnh giả mạo và
điều đó cho ta thấy rõ tính cần thiết cũng nhƣ tính thời sự đồng thời là ý nghĩa
khoa học và thực tiễn của vấn đề. Nhận thức đƣợc điều này, tôi đã chọn đề tài:
“Phát hiện ảnh giả mạo” cho luận văn của mình.
4
Bố cục của luận văn bao gồm phần mở đầu, phần kết luận và ba chƣơng nội
dung đƣợc tổ chức nhƣ sau:
Chƣơng 1: Tổng quan về xử lý ảnh và giả mạo ảnh
Chƣơng này trình bày tổng quan về một hệ thống xử lý ảnh, các vấn đề cơ
bản trong xử lý ảnh, đồng thời trình bày tổng quan về ảnh giả mạo và phát hiện
ảnh giả mạo, cụ thể là các dạng ảnh giả mạo cơ bản cùng các cách tiếp cận chính
để phát hiện ảnh giả mạo.
Chƣơng 2: Một số phƣơng pháp phát hiện ảnh giả mạo
Chƣơng này trình bày một số kỹ thuật phát hiện ảnh giả mạo nhƣ: Kỹ thuật
phát hiện dựa vào phân tích nguồn sáng, kỹ thuật phát hiện dựa vào việc tìm ra
dấu vết của việc lấy mẫu lại và các kỹ thuật phát hiện dựa vào việc tìm ra các
vùng lặp trong ảnh.
Chƣơng 3: Ứng dụng
Trình bày các ứng dụng của các kỹ thuật phát hiện ảnh giả mạo và sử dụng
Visual C++ cài đặt kỹ thuật phát hiện các vùng lặp trong ảnh để phát hiện loại
ảnh giả mạo sinh bởi thao tác copy và dịch chuyển vùng trên ảnh.
5
Chƣơng 1 –
TỔNG QUAN VỀ XỬ LÝ ẢNH VÀ GIẢ MẠO ẢNH
Chương này trình bày tổng quan về một hệ thống xử lý ảnh, các vấn đề cơ bản
trong xử lý ảnh, đồng thời trình bày tổng quan về ảnh giả mạo và phát hiện ảnh giả
mạo, cụ thể là các dạng ảnh giả mạo cơ bản cùng với các cách tiếp cận chính để
phát hiện ảnh giả mạo.
1.1 Xử lý ảnh, các vấn đề cơ bản trong xử lý ảnh
1.1.1 Xử lý ảnh là gì?
Xử lý ảnh là một khoa học tƣơng đối mới mẻ so với nhiều ngành khoa học
khác, nhất là trong quy mô công nghiệp, song trong xử lý ảnh đã bắt đầu xuất hiện
những máy tính chuyên dụng. Để có thể hình dung cấu hình một hệ thống xử lý ảnh
chuyên dụng hay một hệ thống xử lý ảnh dùng trong nghiên cứu, đào tạo, trƣớc hết
chúng ta sẽ xem xét các bƣớc cần thiết trong xử lý ảnh.
Trƣớc hết là quá trình thu nhận ảnh. Ảnh có thể thu nhận qua camera.
Thƣờng ảnh thu nhận qua camera là tín hiệu tƣơng tự (loại camera ống kiểu
CCIR), nhƣng cũng có thể là tín hiệu số hóa (loại CCD-Change Coupled
Device).
Ảnh cũng có thể thu nhận từ vệ tinh qua các bộ cảm ứng (sensor), hay ảnh,
tranh đƣợc quét trên scanner. Tiếp theo là quá trình số hóa để biến đổi tín hiệu
liên tục sang tín hiệu rời rạc (lấy mẫu) và số hóa bằng lƣợng hóa, trƣớc khi
chuyển sang giai đoạn xử lý, phân tích hay lƣu trữ lại.
Quá trình phân tích ảnh bao gồm nhiều công đoạn nhỏ. Trƣớc hết là công
việc tăng cƣờng ảnh để nâng cao chất lƣợng ảnh. Do những nguyên nhân khác
nhau: có thể do chất lƣợng thiết bị thu nhận ảnh, do nguồn sáng hay do nhiễu,
ảnh có thể bị suy biến. Do vậy cần phải tăng cƣờng và khôi phục lại ảnh để làm
nổi bật một số đặc tính chính của ảnh, hay làm cho ảnh gần giống nhất với trạng
thái gốc – trạng thái trƣớc khi ảnh bị biến dạng. Giai đoạn tiếp theo là phát hiện
các đặc tính nhƣ biên, phân vùng ảnh, trích chọn các đặc tính, v.v...
6
Cuối cùng, tùy theo mục đích của ngƣời sử dụng, sẽ là giai đoạn nhận dạng,
phân lớp hay các quyết định khác. Các giai đoạn chính trong quá trình xử lý ảnh
đƣợc mô tả qua hình 1.1[1].
Thu nhận
(Camera, scanner,
sensor, ...)
Tiền xử lý
(Nắn chỉnh, xóa
nhiễu, ...)
Trích chọn
đặc trƣng
Lƣu trữ
Hậu xử lý
(Chính xác hóa, rút
gọn, ...)
Kết luận
Hệ quyết định
Hình 1.1. Các giai đoạn chính trong xử lý ảnh
Với các giai đoạn trên, một hệ thống xử lý ảnh gồm các thành phần tối thiểu
nhƣ hình sau:
Màn hình
đồ họa
Camera
Bộ nhớ
Bộ xử lý
tƣơng tự
Bộ nhớ ảnh
Máy chủ
Bộ xử lý
ảnh số
ngoài
Màn hình
Bàn phím
Máy in
Hình 1.2. Các thành phần chính trong hệ thống xử lý ảnh
7
Đối với một hệ thống xử lý ảnh thu nhận qua camera - camera nhƣ là con mắt
của hệ thống. Có 2 loại camera: camera ống loại CCIR và camera CCD. Loại
camera ứng với chuẩn CCIR quét ảnh với tần số 1/25 và mỗi ảnh gồm 625
dòng. Loại CCD gồm các photo điốt và làm tƣơng ứng một cƣờng độ sáng tại
một điểm ảnh với một phần tử ảnh (pixel). Nhƣ vậy, ảnh là tập hợp các điểm
ảnh. Số pixel tạo nên một ảnh gọi là độ phân giải.
Bộ xử lý tƣơng tự thực hiện các chức năng sau:
Chọn camera thích hợp nếu hệ thống có nhiều camera.
Chọn màn hình hiển thị tín hiệu.
Thu nhận tín hiệu video bởi bộ số hóa. Thực hiện lấy mẫu và mã hóa.
Tiền xử lý ảnh khi thu nhận: dùng kỹ thuật bảng tra (Look Up Table).
Bộ xử lý ảnh số gồm nhiều bộ xử lý chuyên dụng: xử lý lọc, trích chọn đƣờng
bao, nhị phân hóa ảnh.
Máy chủ đóng vai trò điều khiển các thành phần miêu tả ở trên.
Bộ nhớ ngoài: Dữ liệu ảnh cũng nhƣ các dữ liệu khác, để có thể chuyển giao
cho các quá trình khác, nó cần đƣợc lƣu trữ.
Các khái niệm cơ bản trong xử lý ảnh
Điểm ảnh (pixel): Biểu diễn cƣờng độ sáng hay một dấu hiệu nào đó tại
một tọa độ nào đó của đối tƣợng trong không gian. Điểm ảnh là một hàm nhiều
biến P(x1, x2, ..., xn) trong đó n là số chiều của ảnh.
Ảnh: là một tập hợp các điểm ảnh, thông thƣờng đƣợc biểu diễn dƣới dạng
ma trận các điểm ảnh.
Mức xám: là kết quả của sự mã hóa tƣơng ứng một cƣờng độ sáng của một
điểm ảnh với một giá trị số - kết quả của quá trình lƣợng hóa. Cách mã hóa kinh
điển thƣờng dùng 16, 32 hay 64 mức.
Biểu đồ tần suất: Biều đồ tần suất của một mức xám g của ảnh I là số điểm
ảnh của I có mức xám g.
8
1.1.2 Các vấn đề cơ bản trong xử lý ảnh
1.1.2.1 Biểu diễn ảnh
Ảnh đƣợc thu nhận từ các thiết bị thu nhận ảnh. Sau khi thu nhận, ảnh đƣợc
lƣu trữ trên máy tính. Quá trình lƣu trữ gồm 2 mục đích: tiết kiệm bộ nhớ và
giảm thời gian xử lý.
Ảnh đƣợc lƣu trữ trong bộ nhớ có ảnh hƣởng rất lớn đến việc hiển thị, in ấn
và xử lý. Ảnh là tập hợp các điểm ảnh có cùng kích thƣớc do đó nếu sử dụng
càng nhiều điểm ảnh thì ảnh càng mịn càng đẹp và càng thể hiện rõ hơn chi tiết
của ảnh, ngƣời ta gọi đặc điểm này là độ phân giải. Việc lựa chọn độ phân giải
phụ thuộc vào nhu cầu sử dụng và đặc trƣng của từng loại ảnh cụ thể. Chẳng
hạn, ảnh dùng trong văn bản thƣờng thể hiện dƣới dạng đen trắng có độ phân
giải 300 DPI, ảnh bản vẽ, bản đồ có độ phân giải 200DPI.
Trên cơ sở đó, các ảnh đƣợc biểu diễn theo 2 mô hình cơ bản là RASTER
và VECTOR.
Mô hình RASTER:
Theo mô hình này, ảnh đƣợc biểu diễn dƣới dạng ma trận các điểm ảnh.
Tùy theo yêu cầu thực tế mà mỗi điểm ảnh đƣợc biểu diễn bằng một hoặc
nhiều bít.
Ngày nay thiết bị phần cứng phát triển nhƣng chủ yếu là theo định hƣớng
Raster cho cả thiết bị đầu vào cũng nhƣ đầu ra. Ví dụ: máy in, máy quét v.v...
Một trong những nghiên cứu chủ yếu trong mô hình raster là kỹ thuật nén
ảnh, chia ra 2 khuynh hƣớng là nén bảo toàn và nén không bảo toàn thông tin.
Nén bảo toàn thông tin là có khả năng phục hồi hoàn toàn dữ liệu ban đầu. Nén
không bảo toàn thông tin là có khả năng phục hồi dữ liệu ban đầu nhƣng với sai
số chấp nhận đƣợc. Trên cơ sở đó ngƣời ta đã xây dựng đƣợc nhiều khuôn dạng
ảnh khác nhau: *.pcx, *.tif, *.gif, *.jpg, *.jpeg, v.v...
Mô hình VECTOR:
Ảnh lƣu trữ trên máy tính ngoài yêu cầu về giảm không gian lƣu trữ, thời
gian xử lý, dễ dàng cho hiển thị và in ấn còn phải đảm bảo dễ dàng trong lựa
chọn, sao chép, di chuyển và tìm kiếm. Theo những yêu cầu này, kỹ thuật biểu
diễn Vector tỏ ra ƣu việt hơn.
9
Trong mô hình Vector, ảnh đƣợc biểu diễn bởi các điểm ảnh và các đƣờng
thể hiện hƣớng của một điểm. Ảnh dạng Vector đƣợc thu nhận từ các thiết bị
nhƣ sensor, digitalier, v.v...
Ngày nay, các thiết bị phần cứng phát triển mạnh theo hƣớng Raster cho cả
đầu vào và đầu ra nên một trong những nghiên cứu chủ yếu của mô hình Vector
là tập trung cho chuyển đổi từ ảnh Raster sang ảnh Vector.
1.1.2.2 Nắn chỉnh biến dạng
Ảnh thu đƣợc sau quá trình thu nhận thƣờng bị biến dạng do những thiết bị
quang học và điện tử. Do đó cần phải có khâu nắn chỉnh biến dạng.
Để nắn chỉnh biến dạng ta dựa vào tập các điểm điều khiển
( Pi , Pi ' ) (i 1,..., n).
Cần tìm hàm: f : Pi f (Pi ) sao cho:
n
i 1
2
f ( Pi ) Pi ' min
1.1.2.3 Khử nhiễu
Trong quá trình thu nhận ảnh không thể tránh khỏi bị nhiễu. Có 2 loại nhiễu
cơ bản:
- Nhiễu hệ thống: là loại nhiễu gây ra bởi hệ thống, nhƣ vết xƣớc hoặc
nguồn sáng ngoại lai. Loại nhiễu này có tính chất chu kỳ và có thể dễ khắc phục
bằng các phép biến đổi.
- Nhiễu ngẫu nhiên: là các vết bẩn không rõ nguyên nhân. Loại nhiễu này
thƣờng khó khử, tùy vào từng ảnh cụ thể mà có cách khắc phục. Thông thƣờng
sử dụng các phép lọc.
1.1.2.4 Nhận dạng ảnh
Nhận dạng ảnh là quá trình liên quan đến các mô tả đối tƣợng mà ngƣời ta
muốn đặc tả nó. Quá trình nhận dạng thƣờng đi sau quá trình trích chọn các đặc
tính chủ yếu của đối tƣợng. Có hai kiểu mô tả đối tƣợng:
- Mô tả tham số (nhận dạng theo tham số).
- Mô tả theo cấu trúc (nhận dạng theo cấu trúc).
Trên thực tế, ngƣời ta đã áp dụng kỹ thuật nhận dạng khá thành công với
nhiều đối tƣợng khác nhau nhƣ: nhận dạng ảnh vân tay, nhận dạng chữ (chữ cái,
chữ số, chữ có dấu).
10
Nhận dạng chữ in hoặc đánh máy phục vụ cho việc tự động hóa quá trình đọc
tài liệu, tăng nhanh tốc độ và chất lƣợng thu nhận thông tin từ máy tính.
Nhận dạng chữ viết tay (với mức độ ràng buộc khác nhau về cách viết, kiểu
chữ, v.v...) phục vụ cho nhiều lĩnh vực.
Ngoài hai kỹ thuật nhận dạng trên, hiện nay một kỹ thuật nhận dạng mới
dựa vào kỹ thuật mạng nơron đang đƣợc áp dụng và cho kết quả khả quan.
1.2 Ảnh giả mạo và phát hiện ảnh giả mạo
1.2.1 Ảnh giả mạo
Ảnh giả mạo đƣợc xem là ảnh không có thật, việc có đƣợc ảnh là do sự
ngụy tạo bởi các chƣơng trình xử lý ảnh hoặc quá trình thu nhận ảnh.
Sức mạnh của các chƣơng trình xử lý ảnh số nhƣ PhotoShop, Corel Draw,
v.v... giúp việc tạo ra các ảnh giả mạo từ một hay nhiều ảnh khác nhau trở nên dễ
dàng. Một trong những ví dụ cho việc giả mạo này là hình 1.3. Hình này đƣợc
tạo lập từ 3 bức ảnh: Nhà trắng, Bill Clinton và Saddam Hussein. Bill Clinton và
Saddam Hussein đƣợc cắt và dán vào bức ảnh Nhà trắng. Các hiệu ứng về bóng
và ánh sáng cũng đƣợc tạo ra làm cho bức ảnh nhìn có vẻ hoàn toàn nhƣ thật.
Hình 1.3. Minh họa về việc giả mạo ảnh
11
1.2.2 Các loại ảnh giả mạo cơ bản
Ảnh giả mạo thƣờng chia làm hai loại chính [2]. Ảnh giả nhƣng thật, tức là
hiện trƣờng đƣợc dựng thật và việc thu nhận ảnh là thật. Loại thứ hai là ảnh giả
đƣợc tạo lập trên cơ sở các phần của ảnh gốc thật nhƣ hình 1.3 hoặc đƣợc cắt
dán để thêm vào hay che đi các chi tiết trên ảnh.
Trong luận văn này tôi quan tâm đến một số dạng giả mạo thuộc loại thứ
hai. Trong dạng ảnh giả mạo thứ hai có thể chia ra làm 3 loại chính: Ghép ảnh,
tăng cƣờng ảnh và copy/di chuyển vùng trên ảnh.
1.2.2.1 Ghép ảnh
Ghép ảnh là dạng giả mạo ảnh số phổ biến nhất, trong đó hai hay nhiều ảnh
số đƣợc ghép lại với nhau để tạo ra một ảnh số hoàn chỉnh. Một ví dụ cho ghép
ảnh là hình 1.4a. Ảnh này đƣợc ghép từ 2 ảnh có cùng tỷ lệ. Rõ ràng nếu chỉ ra
đây là ảnh thật hay ảnh giả mạo thì cũng có nghĩa là chứng minh đƣợc mối quan
hệ giữa họ.
(a) Ghép ảnh từ các ảnh riêng rẽ
(b) Ghép ảnh từ các ảnh thay đổi tỷ lệ
Hình 1.4. Minh họa cho loại giả mạo ghép ảnh
Một ví dụ khác của dạng giả mạo loại này là hình 1.4b. Hình này là ảnh
ghép từ hai ảnh có sự thay đổi tỷ lệ. Nếu không chứng minh đƣợc ảnh này là giả
thì sẽ phải có cách nhìn khác về sự tiến hóa của loài ngƣời?
Độ tin cậy của sự giả mạo loại này phụ thuộc vào mức độ phù hợp giữa các
thành phần trong ảnh về mặt kích thƣớc, tƣ thế, màu sắc, chất lƣợng và ánh sáng.
Nếu có một cặp ảnh tƣơng thích tốt, đƣợc thực hiện bởi một chuyên gia giàu kinh
nghiệm thì việc giả mạo hoàn toàn nhƣ thật.
12
1.2.2.2 Tăng cƣờng ảnh
(a)
(c)
(b)
(d)
Hình 1.5. Minh họa cho loại giả mạo tăng cƣờng ảnh: (a) ảnh gốc, (b) ảnh đƣợc thay đổi
màu sắc, (c) ảnh tăng độ tƣơng phản, (d) ảnh đƣợc làm mờ nền
Hình 1.5 gồm một ảnh gốc (hình 1.5a), và 3 ví dụ cho loại giả mạo tăng
cƣờng ảnh: (1) Xe mô tô màu xanh đƣợc chuyển thành màu lục lam và xe tải
màu đỏ trong nền đƣợc chuyển thành màu vàng (hình 1.5b); (2) Tăng độ tƣơng
phản của toàn cảnh làm cho ảnh này giống nhƣ đƣợc chụp vào một ngày trời
nắng (hình 1.5c); (3) Các xe ôtô đỗ trong ảnh này bị làm mờ khiến cho chiều sâu
13
của khung cảnh trở nên hẹp hơn (hình 1.5d) v.v... Không giống nhƣ ghép ảnh,
trong Photoshop loại thao tác này thƣờng sử dụng ít click chuột hơn.
Mặc dù loại giả mạo này không thể thay đổi cơ bản hình dạng hay ý nghĩa
của ảnh gốc nhƣ loại ghép ảnh, nhƣng nó vẫn có tác động khéo léo lên cách hiểu
ảnh. Ví dụ, có thể sửa đổi thời tiết và thời gian trong ngày hay có thể làm mờ đi
vài chi tiết để thổi phồng các chi tiết khác trong ảnh, v.v...
1.2.2.3 Copy và dịch chuyển vùng trên ảnh
a) Ảnh gốc
b) Ảnh đã che phủ đối tƣợng
c) Ảnh gốc
d) Ảnh bỏ đi đối tƣợng
Hình 1.6. Ảnh che phủ và bỏ đi đối tƣợng
14
a) Ảnh gốc
b) Ảnh bổ sung đối tƣợng
Hình 1.7. Ảnh bổ sung đối tƣợng
Một dạng khác thƣờng thấy nữa của ảnh giả mạo loại hai là việc sao
chép/dịch chuyển các phần của ảnh gốc. Thể hiện của loại này có thể là việc bớt
đi các đối tƣợng trong ảnh, và cũng đƣợc xem nhƣ là che phủ đối tƣợng hoặc
xóa đi đối tƣợng. Hình 1.6a là ảnh gốc với 2 chiếc ô tô, một xe con và một xe tải.
Hình 1.6b là hình 1.6a giả tạo với việc che phủ chiếc xe tải bằng một cành cây
cũng lấy từ trong chính ảnh đó. Trong khi hình 1.6c là ảnh gốc với chiếc trực
thăng nhỏ còn hình 1.6d chính là ảnh gốc 1.6c đã đƣợc bỏ đi đối tƣợng chiếc
trực thăng. Trong cả hai trƣờng hợp giả mạo này đều đƣợc thực hiện từ một ảnh
nên độ tƣơng đồng về ánh sáng và bóng là nhƣ nhau. Do đó, bằng mắt thƣờng rất
khó xác định.
Hình 1.7 thể hiện một dạng khác thƣờng thấy của giả mạo sinh ra bởi thao
tác copy và dịch chuyển vùng trên ảnh là việc bổ sung thêm đối tƣợng. Hình 1.7a
là ảnh gốc chỉ có một chiếc máy bay trực thăng, nhƣng hình 1.7b đã đƣợc bổ
sung thêm thành 3 chiếc trực thăng ở các vị trí khác nhau. Các trực thăng này
chính là đƣợc copy từ trực thăng gốc nên góc độ và hƣớng là giống nhau, do đó
khó cho việc xác định.
1.2.3 Các cách tiếp cận chính trong phát hiện ảnh giả mạo
1.2.3.1 Dựa vào hình dạng
Việc phân tích để xác định tính giả mạo có thể dựa vào hình dạng vì việc
cắt dán và ghép ảnh thƣờng đƣợc thực hiện dựa theo các đƣờng biên, nơi có sự
thay đổi không liên tục của cƣờng độ sáng của các điểm ảnh.
15
1.2.3.2 Dựa vào phân tích nguồn sáng
Việc ghép các ảnh khác nhau hoặc bổ sung thêm đối tƣợng không phải thực
hiện thao tác copy có thể đƣợc thực hiện bằng việc phân tích nguồn sáng đối với
từng đối tƣợng, các đối tƣợng đƣợc ghép thƣờng có hƣớng của nguồn sáng
không cùng với các đối tƣợng trong ảnh gốc.
1.2.3.3 Dựa vào biến đổi màu sắc
Ảnh gốc thu nhận thƣờng đƣợc thực hiện bởi một thiết bị. Do tính chất biến
đổi của ống kính bao gồm góc độ chụp, độ mở v.v... nên ảnh thu đƣợc thƣờng bị
biến dạng theo các tính chất đặc trƣng của các nhà sản xuất. Phần ảnh đƣợc ghép
vào hay bổ sung thƣờng không có sự biến đổi tƣơng đồng về độ sáng.
1.2.3.4 Dựa vào cơ sở dữ liệu
Hình 1.8. Sơ đồ việc phát hiện giả mạo dựa vào cơ sở dữ liệu
Việc giả mạo ảnh thƣờng dựa vào các ảnh đã có, tức là các ảnh đã đƣợc
xuất bản bởi một nơi nào đó nhƣ: báo chí, trang Web, tạp chí v.v... Các ảnh này
16
đã đƣợc lƣu trữ nên khi xuất hiện một ảnh nghi là giả mạo ngƣời ta có thể tìm
ảnh này với các phần trong nguồn ảnh nằm trong cơ sở dữ liệu ảnh. Trong
trƣờng hợp tốt nhất là các ảnh trong cơ sở dữ liệu đều đã đƣợc ẩn giấu một thông
tin về bản quyền nào đó. Hình 1.8 là sơ đồ tổng quát cho một hệ thống phát hiện
giả mạo thuộc loại này.
Cách tiếp cận này cũng thƣờng đƣợc áp dụng với trƣờng hợp xóa bớt hoặc
bổ sung thêm đối tƣợng từ chính ảnh gốc. Trƣờng hợp mà việc phân tích nguồn
sáng hay sự biến đổi về màu sắc không có tác dụng. Cơ sở dữ liệu trong trƣờng
hợp này có thể xem là các phần có thể của ảnh gốc.
17
Chƣơng 2 –
MỘT SỐ PHƢƠNG PHÁP PHÁT HIỆN ẢNH GIẢ MẠO
Chương này trình bày một số kỹ thuật phát hiện ảnh giả mạo như: Kỹ thuật
phát hiện dựa vào phân tích các mâu thuẫn trong hướng chiếu sáng, kỹ thuật
phát hiện dựa vào việc tìm ra dấu vết của việc lấy mẫu lại và các kỹ thuật phát
hiện ra sự giả mạo dựa vào việc tìm ra các vùng lặp trong ảnh.
2.1 Phát hiện dựa vào phân tích nguồn sáng
Khi tạo ra một ảnh giả mạo bằng việc ghép các đối tƣợng từ các ảnh khác
nhau thƣờng khó tƣơng thích về các điều kiện ánh sáng. Hầu nhƣ các đối tƣợng
đƣợc ghép vào có hƣớng nguồn sáng không cùng với các đối tƣợng trong ảnh
gốc. Do vậy, các khác nhau về hƣớng nguồn sáng này có thể là một gợi ý tốt để
ta phát hiện ảnh giả mạo.
Từ gợi ý đó ngƣời ta đã tìm ra một cách phát hiện ảnh giả mạo dựa vào mâu
thuẫn trong nguồn sáng. Chúng ta biết rằng mỗi đối tƣợng trong ảnh đều đƣợc
chiếu sáng bởi các nguồn sáng và nếu một ảnh không phải là ảnh giả mạo thì các
đối tƣợng trong ảnh đó phải đƣợc chiếu sáng cùng nguồn sáng tại cùng thời gian.
Còn nếu một ảnh là ảnh giả đƣợc tạo thành bằng việc ghép các đối tƣợng từ các
bức ảnh khác nhau thì nguồn sáng của chúng thƣờng khác nhau. Do đó từ các
đối tƣợng này ta tìm hƣớng chiếu của nguồn sáng đến từng đối tƣợng và đem so
sánh với nhau, nếu chênh lệch nhiều thì kết luận đó là ảnh giả mạo.
Trong phần này, trƣớc hết tôi trình bày sơ lƣợc về các loại nguồn sáng,
sau đó trình bày một số phƣơng pháp ƣớc lƣợng hƣớng các nguồn sáng để dựa
vào đó ta có thể phát hiện ra ảnh giả mạo.
2.1.1 Các loại nguồn sáng
Nguồn sáng có thể chia thành hai loại là nguồn sáng đơn (một nguồn sáng) và
đa nguồn sáng (nhiều nguồn sáng). Nếu các đối tƣợng của một ảnh đƣợc chiếu sáng
bởi duy nhất một nguồn sáng thì ta gọi ảnh đó đƣợc chiếu sáng bởi nguồn sáng đơn,
18
ngƣợc lại nếu có nhiều nguồn sáng chiếu đến các đối tƣợng của ảnh thì ta gọi ảnh
đó đƣợc chiếu sáng bởi nhiều nguồn sáng.
Nguồn sáng đơn đƣợc chia làm 2 loại: nguồn sáng xa (xa vô hạn) và nguồn
sáng cục bộ (nguồn sáng ở gần). Nguồn sáng đƣợc coi là nguồn sáng xa nếu
khoảng cách từ nguồn sáng đến đối tƣợng là rất lớn so với kích thƣớc của đối
tƣợng (lớn tới mức có thể coi đối tƣợng nhƣ một chất điểm). Ngƣợc lại thì gọi là
nguồn sáng gần. Trên thực tế chỉ có các nguồn sáng tự nhiên (mặt trời, mặt
trăng, v.v...) đƣợc xem là nguồn sáng xa.
Đối với trƣờng hợp nguồn sáng ở xa vô hạn, việc ƣớc lƣợng hƣớng chiếu
sáng là đơn giản nhất. Do khoảng cách từ đối tƣợng đến nguồn sáng là quá lớn
nên có thể xem hƣớng chiếu sáng từ nguồn sáng đến mọi điểm trên đối tƣợng
đều trùng nhau. Và vì vậy với mỗi đối tƣợng ta chỉ cần tìm ra một hƣớng chiếu
sáng. Trƣờng hợp nguồn sáng cục bộ thì khó hơn nhiều. Vì nguồn sáng ở gần đối
tƣợng nên hƣớng chiếu sáng từ nguồn sáng đến các điểm trên đối tƣợng sẽ khác
nhau và đồng quy tại một điểm. Điểm đó chính là vị trí của nguồn sáng.
Ánh sáng có một đặc tính tuyệt vời là cộng tuyến. Do vậy, trong trƣờng
hợp nhiều nguồn sáng, hƣớng nguồn sáng đƣợc xác định bằng cách cộng các
hƣớng nguồn sáng thành phần và xem nhƣ chỉ có một nguồn sáng (ảo) chiếu
vào đối tƣợng.
2.1.2 Các phƣơng pháp ƣớc lƣợng hƣớng nguồn sáng
Thuật toán ƣớc lƣợng hƣớng nguồn sáng không thể áp dụng chung cho
mọi loại nguồn sáng mà mỗi loại có một cách ƣớc lƣợng riêng. Trong phần
này, tôi trình bày các phƣơng pháp ƣớc lƣợng hƣớng chiếu sáng của nguồn
sáng xa, nguồn sáng cục bộ và nhiều nguồn sáng để sử dụng cho việc phát hiện
ảnh giả mạo [11].
2.1.2.1 Nguồn sáng xa (3-D)
Các cách tiếp cận chuẩn cho việc ƣớc lƣợng hƣớng nguồn sáng bắt đầu
bằng một số giả định đơn giản sau:
(1) Bề mặt đối tƣợng là bề mặt Lambertian (bề mặt phản chiếu ánh sáng
bằng nhau theo mọi hƣớng);
(2) Bề mặt đối tƣợng có hệ số phản chiếu không thay đổi;
19
(3) Bề mặt đối tƣợng đƣợc chiếu sáng bằng một nguồn sáng điểm vô cùng xa;
(4) Góc giữa pháp tuyến bề mặt và hƣớng ánh sáng nằm trong khoảng 0 0
đến 900.
Với các giả định này, cƣờng độ ảnh đƣợc biểu diễn nhƣ sau:
I ( x, y) R( N ( x, y).L) A
(2.1)
Trong đó R là giá trị hệ số phản chiếu cố định của bề mặt, L là véctơ 3
chiều chỉ hƣớng chiếu của nguồn sáng, N ( x, y) là véctơ 3 chiều chỉ pháp tuyến
của bề mặt tại điểm (x,y), và A là hệ số phản chiếu của môi trƣờng, hình 2.1(a).
Nếu chúng ta chỉ quan tâm đến hƣớng của nguồn sáng thì hệ số phản chiếu, R,
có thể xem là hằng số. Từ ảnh ta có thể tính đƣợc I(x,y) và N ( x, y) còn L và A
là các ẩn mà chúng ta phải tìm.
Với ít nhất 4 điểm có hệ số phản chiếu giống nhau, R, và các pháp tuyến
của bề mặt cụ thể, N , hƣớng nguồn sáng và hệ số ánh sáng nền A có thể đƣợc
tính bằng phƣơng pháp ƣớc lƣợng bình phƣơng tối thiểu chuẩn. Trƣớc hết xét
hàm sai số có dạng nhƣ sau:
L I (x , y )
x 1 1
L I (x , y )
E ( L, A) M y 2 2
L ...
z I (x , y )
A
p p
2
2
(2.2)
M v b
Trong đó Lx, Ly, và Lz là các thành phần của hƣớng nguồn sáng L , và
N x ( x1 , y1 ) N y ( x1 , y1 ) N z ( x1 , y1 ) 1
N x ( x2 , y2 ) N y ( x2 , y2 ) N z ( x2 , y2 ) 1
M
N x ( x p , y p ) N y ( x p , y p ) N z ( x p , y p ) 1
(2.3)
Với Nx(xi,yi), Ny(xi,yi), Nz(xi,yi) là các thành phần của pháp tuyến bề mặt N
tại tọa độ (xi, yi). Hàm lỗi trên đƣợc cực tiểu bằng việc lấy đạo hàm hàm sai số
trên theo v và thiết lập kết quả bằng không, ta có:
- Xem thêm -