HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
---------------------------------------
Phạm Thị Lương
NGHIÊN CỨU SỬ DỤNG WAVELET TRONG THỦY VÂN ẢNH SỐ
Chuyên ngành: Kỹ thuật viễn thông
Mã số: 60.52.0.80
TÓM TẮT LUẬN VĂN THẠC SĨ
HÀ NỘI - 2013
Luận văn được hoàn thành tại:
HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
Người hướng dẫn khoa học: PGS. TS. Lê Hữu Lập
Phản biện 1: ……………………………………………………………………………
Phản biện 2: …………………………………………………………………………..
Luận văn sẽ được bảo vệ trước Hội đồng chấm luận văn thạc sĩ tại Học viện Công
nghệ Bưu chính Viễn thông
Vào lúc:
....... giờ ....... ngày ....... tháng ....... .. năm ...............
Có thể tìm hiểu luận văn tại:
- Thư viện của Học viện Công nghệ Bưu chính Viễn thông
24
KẾT LUẬN
1
LỜI MỞ ĐẦU
Thuỷ vân đang là một lĩnh vực được quan tâm và nghiên
cứu trên toàn thế giới, trong khuân khổ luận văn này tác giả đã
nghiên cứu về kỹ thuật thuỷ vân ảnh số dựa vào phép biến đổi
sóng nhỏ rời rạc. Tác giả đã thu thập, khảo sát và tiến hành xây
dựng cài đặt chương trình thử nghiệm chương trình kỹ thuật thuỷ
vân trên Matlab. Đây là một công cụ hỗ trợ mạnh cho việc xử lý
ảnh. Chương trình đã sử dụng thuật toán nhúng được thông tin
vào trong một file ảnh và lấy thông tin từ các file ảnh có chứa
thông tin trong đó. Thông tin được giấu là một bức ảnh có tác dụng
bảo vệ bản quyền. Từ đó chúng ta có cái nhìn thực nghiệm về kết
quả của thuật toán để có những đánh giá, so sánh tốt hơn.
HƯỚNG NGHIÊN CỨU VÀ PHÁT TRIỂN
Kỷ nguyên thông tin số hình thành do sự bùng nổ của
Internet và các phương tiện multimedia, những vấn nạn như ăn cắp
bản quyền, xuyên tạc thông tin, truy nhập thông tin trái phép... ngày
càng gia tăng, đòi hỏi phải không ngừng tìm các giải pháp mới, hữu
hiệu cho an toàn và bảo mật thông tin. Cùng với đó là nhu cầu được
bảo vệ bản quyền tác giả, quyền sở hữu trí tuệ được pháp luật công
nhận đối với các sản phẩm số, đã thúc đẩy các nhà nghiên cứu phải
tìm ra một phương pháp hữu hiệu.
Dựa trên kết quả tìm hiểu, nghiên cứu và thực
nghiệm bằng chương trình Matlab tác giả nhận thấy thủy vân ảnh số
sử dụng phép biến đổi Wavelet là một phương pháp tương đối tốt,
tuy thời gian xử lý chậm nhưng lại bền vững hơn so với phương pháp
thủy vân DCT nên có thể áp dụng tốt trong một số ứng dụng đòi hỏi
thủy vân bền vững, đặc biệt là ứng dụng bảo vệ bản quyền tác giả. Vì
vậy, tác giả đề xuất hướng nghiên cứu phát triển tiếp theo có thể là:
- Nghiên cứu cải tiến thuật toán để khắc phục những nhược
điểm còn tồn tại của thủy vân DWT
- Nghiên cứu tối ưu thuật toán cho một ứng dụng tốt nhất thể
để đạt được hiệu quả cao.
Thủy vân số là một phương pháp mới dựa trên lý thuyết tổng
hợp của nhiều lĩnh vực khác nhau như mật mã học, lý thuyết thông
tin, lý thuyết truyền thông, xử lý tín hiệu số, xử lý ảnh...đã và đang
được nghiên cứu, ứng dụng mạnh mẽ ở nhiều nước trên thế giới
nhằm đáp ứng yêu cầu cấp thiết này. Một thông tin nào đó mang ý
nghĩa quyền sở hữu tác giả (người ta gọi nó là thuỷ vân - Watermark)
sẽ được nhúng vào trong các sản phẩm, thuỷ vân đó chỉ một mình
người chủ sở hữu hợp pháp các sản phẩm đó có và được dùng làm
minh chứng cho bản quyền sản phẩm. Giả sử có một thành phẩm dữ
liệu dạng đa phương tiện như ảnh, âm thanh, video cần được lưu
thông trên mạng. Để bảo vệ các sản phẩm chống lại hành vi lấy cắp
hoặc làm nhái cần phải có một kỹ thuật để “dán tem bản quyền” vào
sản phẩm này. Việc dán tem hay chính là việc nhúng thuỷ vân cần
phải đảm bảo không để lại một ảnh hưởng lớn nào đến việc cảm nhận
sản phẩm. Yêu cầu kỹ thuật đối với ứng dụng này là thuỷ vân phải
tồn tại bền vững cùng với sản phẩm, muốn bỏ thuỷ vân này mà
không được phép của người chủ sở hữu thì chỉ còn cách là phá huỷ
sản phẩm.
Trên cơ sở đó, cùng với sự hướng dẫn tận tình của GS.TSKH
Nguyễn Ngọc San, tôi đã tiến hành tìm hiểu, nghiên cứu và hoàn
thành luận văn với đề tài: “NGHIÊN CỨU SỬ DỤNG WAVELET
TRONG THỦY VÂN ẢNH SỐ“. Kết quả nghiên cứu được chương
mục hóa trong phần nội dung như sau:
2
Chương 1. Giới thiệu tổng quan về lịch sử hình thành và
phát triển của
thủy vân số, khái niệm, các đặc tính của thủy vân số và phương pháp
tiếp cận lĩnh vực thủy vân số.
Chương 2. Tập trung vào cơ sở lý thuyết và thuật toán thủy
vân ảnh số sử dụng phép biến đổi Wavelet.
Chương 3. Trình bày các ứng dụng tiêu biểu của thủy vân số
đang được quan tâm nhiều.
Chương 4. Trình bày chương trình thực nghiệm mô phỏng
thuật toán dựa trên Mablab.
Chương 1 - TỔNG QUAN VỀ THỦY VÂN ẢNH SỐ
1.1 Giới thiệu chương
Trong chương này, luận văn sẽ trình bày những vấn đề tổng quan
về thủy vân số, bao gồm: Lịch sử ra đời, khái niệm và so sánh thủy
vân số với các kỹ thuật giấu tin khác như mã hóa, giấu tin mật. Đồng
thời luận văn cũng trình bày các yêu cầu cơ bản và các đặc tính của
hệ thủy vân ảnh số; các kỹ thuật thủy vấn số cơ bản và các tấn công
có thể xảy ra trên hệ thống thủy vân.
1.2 Tổng quan về các kĩ thuật giấu tin
Hình 1-1: Phân loại các phương pháp trong ngành mật mã
23
4.3.2 Đánh giá kết quả
Trong quá trình thuỷ vân ta sử dụng khoá K làm trạng thái
cho bộ sinh chuỗi giả ngẫu nhiên. Bằng thực nghiệp cho thấy: Nếu
giá trị khoá K càng lớn thì chất lượng ảnh sau khi nhúng thuỷ vân
càng kém.
Khi ta thay đổi giá trị khác nhau của khoá K trên cùng một
ảnh chủ và watermark sẽ thấy sự khác nhau của chất lượng ảnh sau
khi thuỷ vân bằng cách quan sát trực quan và qua giá trị độ lớn của
nhiễu nền psnr (tiêu chuẩn để đánh giá chất lượng của ảnh được
thuỷ vân và các ảnh bị tấn công dựa vào tỷ số giữa giá trị cực đại
của tín hiệu và độ lớn của nhiễu nền PSNR – Peak Signal To Noise).
Phương pháp thuỷ vân ở miền DWT bền vững hơn nhiều
(giá trị tương quan lớn hơn) so với thực hiện ở miền DCT, nhất
là trong các tấn công nén JPEG2000, lọc trung bình, lọc Gaussian,
lọc sắc nét và co dãn ảnh.
Trong quá trình khôi phục watermark, xuất hiện hai loại lỗi:
Lỗi không phát hiện được và lỗi phát hiện sai.
Về mặt thời gian: Quá trình thuỷ vân bằng kỹ thuật DWT
được thực hiện chậm hơn so với thuỷ vân bằng kỹ thuật DCT. Kết
quả so sánh này được rút ra khi sử dụng trên một máy tính, ảnh chủ
và ảnh thuỷ vân giống nhau.
Ta thấy kết quả thuỷ vân tìm lại được trong kỹ thuật thuỷ
vân DWT rõ nét hơn so với kỹ thuật thuỷ vân DCT.
Nhìn chung kỹ thuật thuỷ vân trong miền DWT tuy mất
nhiều thời gian nhưng mức độ cảm thụ vẫn chấp nhận được và bền
vững hơn so với kỹ thuật thuỷ vân DCT (thuỷ vân tìm lại rõ nét
hơn). Vì vậy với những mục đích của việc thuỷ vân trên ảnh đã
được đưa ra trong phần đầu thì kỹ thuật thuỷ vân trong miền
DWT nên được sử dụng.
4.5 Kết luận chương
22
- Thời gian thực hiện: 13.0885 s
Hệ số nhúng k = 20
-
Thời gian thực hiện: 6.9576 s
SNR Signal to Noise Ratio: 2.2571 db
PSNR Peak Signal to Noise Ratio: 7.5664 db
-
Thời gian thực hiện: 12.4333 s
3
Cùng với sự bùng nổ của công nghệ thông tin, đặc biệt là sự
bùng nổ của Internet và các phương tiện multimedia mang lại nhiều
thuận lợi nhưng lại xẩy ra những vẫn nạn như ăn cắp bản quyền,
xuyên tạc thông tin, truy cập thông tin trái phép… gia tăng, đòi hỏi
không ngừng phải tìm các giải pháp mới đảm bảo cho sự an toàn và
bảo mật thông tin.
Nhiều phương pháp bảo vệ thông tin đã được đưa ra trong đó
giải pháp dùng mật mã được ứng dụng rộng rãi nhất. Thông tin ban
đầu được mã hoá và gửi đi, người nhận được sẽ giải mã thông tin nhờ
khoá của hệ mật mã. Có nhiều hệ mã phức tạp được sử dụng như
DES, RSA, NAPSACK…mang lại hiệu quả cao. Bên cạnh đó, một
phương pháp được sử dụng mang lại nhiều lợi ích tối ưu đó là kỹ
thuật giấu tin (DataHiding).
Có thể coi giấu tin là một nhánh của ngành mật mã với mục
tiêu là nghiên cứu các phương pháp che giấu thông tin mật.
1.2.1 Mật mã và giấu thông tin
Mật mã (Cryptography hay Secret Writing) là phương pháp
gửi thông điệp dưới những hình thức khác nhau sao cho chỉ có người
nhận mong đợi mới bỏ đi che giấu để đọc được thông điệp. Thông
điệp muốn gửi đi gọi là bản rõ. Thông điệp bị che giấu gọi là bản mã
hóa. Sau khi người nhận loại bỏ che giấu để đọc thông tin thì thông
điệp không còn được bảo vệ nữa.
Giấu thông tin là kỹ thuật nhúng (emberdding) một lượng
thông tin số nào đó vào trong một đối tượng dữ liệu số khác. Một
trong những yêu cầu cơ bản của giấu tin là đảm bảo tính chất ẩn
của thông tin được giấu đồng thời không làm ảnh hưởng đến chất
lượng của dữ liệu gốc.
Sự khác biệt chủ yếu giữa mã hoá thông tin và giấu thông tin
là mã hoá thông tin làm cho các thông tin hiện rõ là nó có được mã
hoá hay không, giấu thông tin thì lại khác, người ta khó phát hiện
trong đối tượng đó có thông tin được giấu hay không. Giấu thông tin
và mã hóa thông tin tuy cùng có mục đính là để đối phương không
4
phát hiện ra tin cần giấu, nhưng chúng khác nhau ở chỗ: Mã hóa
thông tin là giấu đi ý nghĩa của bản thông tin được mã hóa, trong khi
đó giấu thông tin lại là giấu đi sự hiện diện của thông tin được giấu.
1.2.2 Giấu tin mật và thủy vân số
Giấu tin mật (Steganography tức giấu tin, viết phủ) là lĩnh
vực nghiên cứu việc nhúng các mẩu tin mật vào một môi trường
phủ. Trong quá trình giấu tin, để tăng bảo mật có thể dùng một khoá
viết mật, người ta gọi đó là Intrinsic Steganography (giấu tin có xử
lý). Khi đó, để giải mã người dùng cũng phải có khoá viết mật đó.
Chú ý rằng khoá này không phải là khoá dùng để lập mật mã mẩu
tin, ví dụ nó có thể là khoá để sinh ra hàm băm phục vụ việc rải tin
vào môi trường phủ.
Thủy vân số (Digital Watermarking) là kỹ thuật nhúng “dấu
ấn số” (Watermark – tin giấu) vào một sản phẩm số (text, image,
audio, video), mà tin giấu này có thể được phát hiện và tách ra sau
đó, nhằm chứng thực (đánh dấu, xác thực) nguồn gốc hay chủ sở hữu
của sản phầm số này.
So sánh thủy vân số với giấu tin mật
Mặc dù thủy vân số (Watermarking) và giấu tin mật
(steganography) cùng nằm trong lĩnh vực nghiên cứu nhằm che dấu
đi sự hiện diện của thông tin nhưng chúng có một số đặc điểm khác
biệt:
Steganography
Watermarking
- Mục đích là bảo vệ thông tin - Mục đích là bảo vệ môi
được giấu.
trường giấu tin.
- Giấu được càng nhiều thông - Chỉ cần thông tin đủ để đặc
tin càng tốt, ứng dụng trong trưng cho bản quyền của chủ
truyền dữ liệu thông tin mật.
sở hữu.
- Thông tin được giấu phải ẩn,
không cho người khác thấy - Thông tin giấu có thể ẩn
được bằng mắt thường.
(invisible Watermarking) hoặc
- Chỉ tiêu quan trọng nhất là hiện (visible Watermarking).
21
Minh họa kết quả tìm lại thủy vân
4.3 Một số kết quả thực nghiệm khi thay đổi các tham số hệ
thống
4.3.1 Kết quả minh họa
Hệ số nhúng k =0.5
-
Thời gian thực hiện: 6.9888s
SNR Signal to Noise Ratio: 34.2983 db
PSNR Peak Signal to Noise Ratio: 39.6076 db
20
Chương 4 - CHƯƠNG TRÌNH THỰC NGHIỆM THỦY VÂN
ẢNH SỐ SỬ DỤNG BIẾN ĐỔI WAVELET BẰNG MATLAB
4.1 Giới thiệu chương
Trong chương này, luận văn sẽ trình bày các kết quả của
chương trình thực nghiệm thuật toán thủy vân ảnh viết bằng
MATLAB. Chức năng chính của chương trình là thuỷ vân ảnh và
giải thuỷ vân. Đây là một trong những minh chứng cho ứng dụng bảo
vệ bản quyền của thủy vân ảnh số.
4.2 Chương trình thực nghiệm trên MATLAB
4.2.1 Chương trình nhúng thủy vân
Chuẩn bị:
- Cài đặt Matlab (Phiên bản từ 7.0 trở lên)
- Khởi động chương trình Matlab
- Chuẩn bị các fie ảnh chủ, ảnh làm thủy vân đặt tại thư mục
hiện hành của Matlab
Minh họa kết quả nhúng với hệ số nhúng k=2
4.2.2 Chương trình tìm lại thủy vân
Chuẩn bị:
- File ảnh đã thủy vân
- Khóa key đã sử dụng ở chương trình nhúng
- File ảnh dùng làm thủy vân để so sánh
- Hệ số nhúng đã sử dụng
-
5
dung lượng của tin được giấu.
- Chỉ tiêu quan trọng nhất là
tính bền vững của tin được
giấu.
1.2.3 Nguồn gốc thủy vân số
Thủy vân trên giấy (paper Watermark): Thủy vân trên giấy
xuất hiện trong ngành sản xuất giấy cách đây hơn 700 năm. Thủy vân
trên giấy (paper Watermark) đầu tiên được tìm thấy có nguồn gốc từ
Fabriano, Italy.
Thủy vân số (digital Watermark): Khái niệm thủy vân số cũng
xuất phát từ khái niệm thủy vân trên giấy. Tuy nhiên, thật khó để nói
chính xác khi nào khái niệm “thủy vân số” (digital Watermarking)
bắt đầu được nói đến. Năm 1979, Szepanski mô tả một mẫu thông tin
số có thể nhúng vào tài liệu nhằm mục đích chống giả mạo. Chín
năm sau, Holt và các đồng nghiệp mô tả một phương pháp để nhúng
mã định danh vào tín hiệu âm thanh. Tuy nhiên, mãi đến năm 1988,
Komatsu và Tominaga mới lần đầu tiên sử dụng cụm từ “digital
Watermark”. Nhưng phải đến đầu những năm 90 thì thủy vân số với
thực sự nhận được sự quan tâm của công chúng.
1.2.4. Phân loại thủy vân số
Có rất nhiều cách phân loại thủy vân số khác nhau:
Theo khả năng cảm nhận, người ta phân thành hai loại thủy vân
số sau:
- Visible/Perceptible (hữu hình)
- Invisible (vô hình)
Theo tính bền vững, ta có ba loại thủy vân số như sau:
- Robust Watermarking:
- Fragile Watermarking:
- Semi-fragile Watermarking:
Theo sự yêu cầu ảnh gốc cho việc tách Watermark, người ta phân
thành ba loại thủy vân số như sau:
- Blind Watermarking:
- Non-blind Watermarking:
6
- Semi-blind Watermarking:
Theo khuynh hướng tiếp cận, người ta phân thành hai loại như
sau:
Thủy vân miền không gian (Spatial domain):
- Thủy vân miền tần số (Frequency domain):
Theo tính phụ thuộc ảnh, chúng ta có hai loại thủy vân số sau:
- Image-adaptive (phụ thuộc ảnh):
- Image-independent (độc lập ảnh):
Dựa vào những đặc trưng, tính chất, ứng dụng của từng kỹ
thuật mà người ta phân loại các kỹ thuật thuỷ vân như sau:
Watermarking
Thủy vân số
Hình1-10: Phân loại các kỹ thuật thuỷ vân
Imperceptible
Visible
1.3 Yêu cầu và các đặc tính của thủy vân số
Fraigile
Tùy theo mỗi loại thủy vân, Robust
các yêu cầu với
chúng cũng có
Watermarking
Watermarking
một số điểm khác biệt:
Thuỷ vân hiện Watermarking
1.3.1 Tính bền Thuỷ
vững vân ẩn Copyright marking
19
3.2.2 Điều khiển và ngăn chặn sao chép
Ta biết rằng sẽ tốt hơn nếu ngăn ngay từ đầu những hành vi
bất hợp pháp như sao chép dữ liệu mà không được phép, như vậy nếu
có một ứng dụng kiểm soát sao chép ngăn chặn sẽ không cho tạo ra
các bản sao bất hợp pháp từ nội dung đã có bản quyền.
Mã hóa cũng có thể dùng để cài đặt cho ứng dụng dạng này.
Tài liệu được mã hóa với một khóa duy nhất, nếu không có khóa thì
không dùng được. Tuy nhiên khóa này được cung cấp theo kiểu khó
mà sao chép hay phân phối lại (nhằm hạn chế thấp nhất khả năng
khách hàng cho khóa của họ cho người khác xài miễn phí).
3.2.3 Chống giả mạo và gian lận
Một ứng dụng khác của thuỷ vân là xác thực ảnh và phát hiện
giả mạo. Ảnh số ngày càng được sử dụng như các bằng chứng quan
trọng trong điều tra của cảnh sát, bằng chứng trước pháp luật ngày
nay, sự giả mạo có thể gây ra nhiều vấn đề nghiêm trọng. Các tác
phẩm kỹ thuật số ngày nay đứng trước nguy cơ bị làm giả nhiều hơn,
dễ dàng hơn và tinh vi hơn. Vấn đề là cần xác thực được tính hợp
pháp của ảnh này. Thuỷ vân được sử dụng ở đây để xác định xem
ảnh là nguyên bản hay đã chịu tác động của con người, bằng các ứng
dụng xử lý ảnh. Thuỷ vân được dấu lúc đầu phải mang tính chất
không bền vững, để bất kỳ sự thay đổi nhỏ nào tới ảnh cũng có thể
làm hỏng thuỷ vân hoặc phát hiện được thay đổi đối với thuỷ vân
này. Tuy vậy, thuỷ vân vẫn phải tồn tại với các phép biến đổi ảnh
thông thường như chuyển đổi định dạng, lấy mẫu, nén…
3.3 Kết luận chương
Đây là tính chất quan trọng nhất của hệ thuỷ vân bền vững.
Trong chương 3, luận văn đã trình bày 3 ứng dụng tiêu biểu
Thủy vân bền vững
Thủy vân “dễ vỡ”
Nghĩa là hệ thuỷ vân phải chống lại được các phép biến đổi, hay
nhất của thủy vân ảnh số là bảo vệ bản quyền tác giả, điều khiển và
tấn công có chủ đích hoặc không có chủ đích lên thuỷ vân. Nhìn
ngăn chặn sao chép; chống giả mạo và gian lận. Trong chương sau,
chung, một thủy vân phải bền vững với các phép biến đổi như
luận văn sẽ trình bày kết quả mô phỏng thuật toán bằng chương trình
chuyển đổi tín hiệu A/D (analog to digital – tín hiệu tương tự sang tín
thực nghiệm Matlab minh họa ứng dụng bảo vệ bản quyền tác giả.
hiệu số) và D/A, các phép nén mất dữ liệu, in, quét, nhiễu trên đường
truyền. Với ảnh nói riêng, thủy vân phải bền vững với các phép biến
-
18
Output: Ảnh thuỷ vân
2.5 Kết luận chương
Chương 3 - CÁC ỨNG DỤNG CỦA THỦY VÂN ẢNH SỐ
3.1 Giới thiệu chương
Trong chương này, luận văn sẽ trình bày một số ứng dụng cơ
bản và khả dụng nhất của thủy vân ảnh số.
3.2 Một số ứng dụng cơ bản của thủy vân ảnh số
3.2.1 Bảo vệ bản quyền tác giả
Mục đích của thuỷ vân với bảo vệ bản quyền là gắn một “dấu
hiệu” vào dữ liệu ảnh mà có thể xác định được người nắm giữ bản
quyền. Và ta cũng có thể gắn thêm một dấu hiệu khác gọi là vân tay
để xác định người dùng của sản phẩm. Dấu hiệu có thể là một dãy số
như mã hàng hoá quốc tế, một message hoặc một logo… Thuật ngữ
thuỷ vân xuất phát từ phương thức đánh dấu giấy tờ với một logo từ
thời xa xưa với mục đích tương tự.
Do các Watermark có thể vừa không thể nhận thấy vừa
không thể tách rời tác phẩm chứa nó nên chúng là giải pháp tốt hơn
dòng chữ đối với việc nhận ra người sở hữu nếu người dùng tác
phẩm được cung cấp bộ dò Watermark. Digimarc cho ảnh là ứng
dụng mà ta đang đề cập. Nó được tích hợp vào Photoshop. Khi bộ dò
của Digimarc nhận ra một Watermark, nó liên lạc với cơ sở dữ liệu
trung tâm trên Internet và dùng thông điệp Watermark như một khóa
để tìm thông tin liên lạc cho người sở hữu ảnh. Tính hợp pháp của
một ứng dụng lương thiện dễ dàng tìm ra người họ muốn liên lạc để
dùng ảnh. Như vậy, nhúng thông tin của người giữ tác quyền của một
tác phẩm như là một Watermark.
Watermark không chỉ được dùng để chỉ ra thông tin tác
quyền mà còn được dùng để chứng minh tác quyền.
7
đổi hình học như phép dịch chuyển, co dãn, hoặc cắt xén. Phương
pháp thủy vân số phải đảm bảo sao cho việc không lấy lại được thủy
vân tương đương với việc ảnh đã bị biến đổi quá nhiều, không có giá
trị thương mại.
1.3.2 Tính bảo mật
Sau khi đã được thủy vân ảnh, thì yêu cầu là chỉ cho phép
những người có quyền sử dụng được chỉnh sửa và phát hiện được
thủy vân. Điều này được thực hiện nhờ vào khóa mã dùng làm
khóa trong giải thuật đưa thủy vân vào ảnh số và giải thuật phát
hiện ra thủy vân trong ảnh số.
1.3.3 Tính ẩn
Việc nhúng thông tin vào ảnh sẽ làm biến đổi ảnh ít hay nhiều.
Tính ẩn (trong loại thủy vân ẩn - invisible Watermarking) yêu cầu sự
biến đổi ảnh mang là nhỏ nhất có thể. Với các phương pháp thủy vân
số tốt sẽ làm cho thông tin được nhúng trở nên vô hình trong ảnh
mang, theo nghĩa là người dùng khó có thể nhận ra trong bức ảnh có
giấu thông tin bằng mắt thường. Điều này có nghĩa là thủy vân làm
ảnh hưởng rất ít đến chất lượng ảnh mang.
Trái với thủy vân ẩn, thủy vân hiện (visible Watermarking)
không cần tính chất ẩn đối với thủy vân được nhúng. Thực tế, loại
thủy vân số này yêu cầu thông tin nhúng vào ảnh phải được nhìn thấy
để bảo vệ bản quyền.
Trong các loại thuỷ vân thì thuỷ vân ẩn và bền vững được
quan tâm nghiên cứu nhiều hơn vì nó có nhiều ứng dụng lớn.
1.3.4 Dung lượng
Đối với giấu tin, chỉ tiêu này gần như là quan trọng nhất vì
mục đích của giấu tin là giấu được càng nhiều thông tin càng tốt. Tuy
nhiên, đối với thủy vân, chỉ cần một lượng thông tin vừa đủ, chẳng
hạn để chứng thực bản quyền, nhúng vào ảnh mang.
Với ảnh số, chỉ tiêu này đề cập đến số lượng bit thủy vân có
thể nhúng vào ảnh.
8
1.3.5 Tính dễ vỡ
Đối với các ứng dụng để phát hiện giả mạo ảnh gốc thì thủy
vân nhúng vào phải có tính giòn (fragile) nghĩa là sẽ bị vỡ nếu chịu
sự biến đổi mất thông tin. Một cách thực hiện điều này mà vẫn đảm
bảo tính ẩn của thủy vân là dấu nó vào các phần dữ liệu ít đáng chú ý
về mặt trực giác. Đối với ảnh, đó có thể là các bít thấp của các điểm
ảnh (LSB).
Loại thủy vân nửa giòn (semi-fragile) được dùng trong việc
phân biệt các loại biến đổi mất thông tin đã được sử dụng: Biến đổi
mất thông tin nhưng không thay đổi nội dung và biến đổi mất thông
tin gây thay đổi nội dung.
1.4 Các miền thủy vân ảnh số
Gần đây, đa số các thuật toán Watermarking số được phát
triển nhằm mục đích bảo vệ bảo quyền ảnh số và xác minh tình trạng
nguyên vẹn dữ liệu. Hầu hết các thuật toán Watermarking đều
chuyển đổi ảnh gốc sang một miền mà thuận tiện cho việc nhúng
thông tin Watermark nhằm bảo đảm tính bền vững và không nhìn
thấy.
Có thể chia các kỹ thuật thuỷ vân theo hai hướng tiếp cận
chính:
Hướng thứ nhất dựa trên miền không gian ảnh tức là tiến
hành khảo sát tín hiệu và hệ thống rời rạc một cách trực tiếp trên
miền giá trị rời rạc của các điểm ảnh gọi là trên miền biến số độc lập
tự nhiên.
Hướng thứ hai là sử dụng các phương pháp khảo sát gián
tiếp khác thông qua các kỹ thuật biến đổi. Các kỹ thuật biến đổi này
làm nhiệm vụ chuyển miền biến số độc lập sang các miền khác và
như vậy tín hiệu và hệ thống rời rạc sẽ được biểu diễn trong các miền
mới với các biến số mới. Sau đó, tìm cách nhúng thuỷ vân vào ảnh
bằng cách thay đổi các hệ số biến đổi trong những miền thích hợp để
đảm bảo chất lượng ảnh và sự bền vững của thuỷ vân sau khi nhúng.
17
Ảnh sau khi thuỷ vân bị nhiễu nhiều hơn so với ảnh gốc
Qui trình tìm lại thuỷ vân
Hình 2-9: Quy trình tìm lại thủy vân
Input: Ảnh đã thủy vân
16
Một ảnh sau khi thuỷ vân, F’
Quy trình nhúng thủy vân
Đọc ảnh chủ, thủy vân và
khóa bí mật K
Dùng DWT, Phân tích ảnh chủ
thành băng A1, H1, V1, D1
Đặt khóa K làm giống và
sinh 2 chuỗi giả ngẫn nhiên
Tại những điểm thủy vân bằng 0, cộng thêm cho
giá trị tương ứng của băng H1 và V1 một số
giả ngẫu nhiên tương ứng trong hai chuỗi
Tổng hợp ảnh chủ bằng IDWT từ các băng A1, D1
và các băng đã nhúng thủy vân H1 và H2
Hình 2-7: Quy trình nhúng thủy vân
Ảnh sau khi thủy vân với hệ số k = 6
9
Các phép biến đổi được sử dụng phổ biến là DCT, DFT (Discrete
Fourier Transform) và DWT.
1.4.1 Phương pháp Watermarking trong miền không gian ảnh
(spatial domain)
Watermarking trong miền không gian tín hiệu được khảo sát
bằng cách rời rạc trực tiếp. Các giá trị rời rạc của điểm ảnh gọi là
miền biến số độc lập tự nhiên. Sau đó tìm cách nhúng thông tin vào
ảnh bằng cách thay đổi các giá trị điểm ảnh sao cho không làm ảnh
hưởng nhiều đến chất lượng ảnh và đảm bảo sự bền vững của thông
tin nhúng trước những tấn công có thể có đối với bức ảnh đã nhúng.
Có hai phương pháp điển hình là phương pháp tách bit có trọng số ít
quan trọng nhất (LSB- Least Significant Bit) và phương pháp sử
dụng chuỗi giả ngẫu nhiên.
1.4.2 Phương pháp Watermarking dùng biến đổi DCT
Biến đổi cosine rời rạc là một công cụ toán học xử lý các
tín hiệu như ảnh hay video. Nó sẽ chuyển đổi các tín hiệu từ miền
không gian sang miền tần số và biến dổi ngược lại từ miền tần số
quay trở lại miền không gian mà không gây tổn hao đến chất
lượng.
Lý do chọn biến đổi cosine cho xử lý ảnh số là biến đổi
cosine rời rạc yêu cầu ít sự phức tạp tính toán và tài nguyên hơn.
1.5 Các tấn công có thể lên hệ thống thủy vân ảnh số
Phương pháp thủy vân phải chống lại một số phép xử lý
ảnh thông thường (ví dụ như lỗi khi ảnh truyền đi, nén ảnh,..) và
một số tấn công có chủ đích nhằm xuyên tác, phá hoại bức ảnh.
Trong thực tế thì thủy vân phải cân đối giữa tính bền vững với
các tính chất khác như lượng thông tin dấu, tính ẩn…Dựa trên
yêu cầu thực tế của ứng dụng, người ta sẽ lựa chọn phương pháp
thủy vân thích hợp nhất.
Từ những biến đổi có chủ đích hay không có chủ đích đã
biết với thủy vân mà ta có thể phân biệt thành hai nhóm xuyên
tạc sau: Một là các biến đổi xem như là nhiễu với dữ liệu, hai là
10
làm mất tính đồng bộ để không thể lấy tin ra được.
Một vài phép biến đổi thường gặp:
- Biến đổi tín hiệu: Làm sắc nét, thay đổi độ tương phản,
màu,..
- Nhiễu cộng, nhiễu nhân,….
- Lọc tuyến tính.
- Nén mất thông tin.
- Biến đổi affine cục bộ hoặc toàn cục.
- Giảm dữ liệu: Cropping, sửa histogram.
- Chuyển mã (gif Jpeg)
- Chuyển đổi tương tự - số
- Thuỷ vân nhiều lần.
Nguyên tắc cơ bản của phương pháp thuỷ vân là đảm bảo
đủ tính bền vững sao cho các tấn công không làm cho giá trị
thương mại của ảnh gốc bị ảnh hưởng.
1.6 Các phương pháp tiếp cận nhằm tạo Watermarking có độ an
toàn cao
Trong hầu hết các ứng dụng Watermarking, một yêu cầu luôn
được đặt lên hàng đầu đó là làm sao thiết kế một Watermark có thể
dò ra được ngay cả trong trường hợp tài liệu được nhúng đã bị sửa
đổi xử lý. Một Watermark có độ an toàn cao là Watermark có khả
năng sống sót khi nội dung tài liệu bị chỉnh sửa trong một chừng
mực được phép. Người thiết kế phải lường trước các tấn công có thể
xảy ra và giới hạn lại yêu cầu Watermark của mình chỉ quan tâm
một số xử lý cụ thể nào đó. Các tiến trình xảy ra giữa khâu nhúng và
dò cần được xác định rõ, chẳng hạn, chúng có thể bao gồm: nén có
mất thông tin, chuyển tín hiệu từ tuần tự sang số và ngược lại, thâu
âm thanh, in và quét, giảm nhiễu, chuyển đổi định dạng.
Một số phương pháp nhằm tạo watermarking có độ an toàn
cao như sau:
1.6.1 Nhúng thừa, nhúng lặp
Phương pháp này giúp Watermark không bị mất khi ảnh được
15
bao gồm hàm Harr, các hàm Daubechies và các biorthogonal.
Ngoài ra, MATLAB còn giúp kiểm tra rất nhanh và chính xác
các thực nghiệm về độ bền vững và chất lượng của thuỷ vân trên
ảnh.
Biến đổi sóng nhỏ có rất nhiều lợi thế so với các biến đổi
khác, đó chính là:
- Biến đổi sóng nhỏ là một mô tả đa độ phân giải của ảnh.
Quá trình giải mã có thể được xử lý tuần tự từ độ phân giải
thấp cho đến độ phân giải cao.
- Biến đổi DWT gần gũi với hệ thống thị giác người hơn
biến đổi DCT.
Vì vậy, có thể nén với tỉ lệ cao bằng DWT mà sự biến đổi
ảnh khó nhận thấy hơn nếu dùng DCT với tỉ lệ tương tự.
2.4 Thuật toán thủy vân ảnh số dựa vào phép biến đổi Wavelet
Mô tả thuật toán
Input:
o Một ảnh nhỏ được sử dụng làm thuỷ vân (kích thước
256 x 256)
oMột ảnh F cần nhúng thuỷ vân để bảo vệ bản quyền
oMột khoá bí mật để nhúng và giải thuỷ vân (khóa k)
Output:
14
Tương tự như các tín hiệu một chiều, các tín hiệu hai chiều
(tức là các bức ảnh) cũng có thể được phân tích tương tự bằng
DWT nhưng theo cả hai chiều dọc và ngang. Một bộ lọc tần số
thấp và một bộ lọc tần số cao sẽ được sử dụng kết hợp để lọc các
tín hiệu. Đầu tiên, ảnh gốc sẽ được lọc thấp theo chiều dọc. Sau
đó, nếu lọc lại bằng chính bộ lọc này theo chiều ngang ta sẽ có
băng LL và nếu lọc lại bằng bộ lọc cao ta sẽ có băng LH. Tiếp
theo, ảnh gốc sẽ được lọc cao theo chiều dọc và sau đó sẽ được
lọc lại theo chiều ngang bằng lọc thấp để có băng HL và bằng lọc
cao để có băng HH.
Quá trình trên lại có thể tiếp tục đối với băng LL để tạo
ra phép biến đổi DWT hai mức như minh hoạ trong hình dưới đây:
LL2
HL2
LH2
HH2
LH1
HL1
HH1
Qúa trình tổng hợp ảnh gốc từ các bức ảnh xấp xỉ và chi tiết
cũng được làm tương tự như tổng hợp tín hiệu một chiều. Qúa trình
này bao gồm 2 phần, đầu tiên là tăng mẫu và sau đó lọc tổng hợp. Nếu
ảnh được phân tích thành nhiều mức thì sẽ tổng hợp từ mức cao đến
mức thấp hơn.
Đến đây chúng ta đã có thể thấy ứng dụng của DWT trong
thuỷ vân số ở chỗ nào. Hầu hết các lược đồ thuỷ vân đều tìm cách
thay đổi các hệ số của một hoặc một số trong bốn băng tần để
nhúng thuỷ vân trước khi tổng hợp.
Qua những trình bày trên đây, chúng ta thấy phân tích và
tổng hợp tín hiệu bằng DWT bao gồm nhiều công đoạn và đòi hỏi
rất nhiều tính toán phức tạp. Nhưng cũng rất may cho các nhà
nghiên cứu trong lĩnh vực nén và thuỷ vân ảnh là tất cả những
phức tạp này đã được MATLAB giải quyết giúp. MATLAB cho
phép thực hiện các biến đổi DWT bằng một họ các hàm sóng nhỏ
11
nhúng bị xử lý bằng các phép như xén ảnh, lọc, cộng nhiễu.
1.6.2 Mã hóa tán phổ
1.6.3 Nhúng trong các hệ số quan trọng cảm nhận được
1.6.4 Nhúng trong các hệ số được cho là mạnh mẽ
1.6.5 Đảo nhiễu trong bộ dò
1.7 Kết luận chương
Chương 2 - THỦY VÂN ẢNH SỐ SỬ DỤNG PHÉP BIẾN ĐỔI
WAVELET
2.1 Giới thiệu chương
Sự phát triển của các kỹ thuật nén ảnh, như JPEG, MPEG và
mới đây là JPEG2000, cho phép sử dụng rộng rãi các ứng dụng đa
phương tiện hơn. Các kỹ thuật Watermarking trước đây được nghiên
cứu trên miền không gian thường sử dụng các thành phần có tần số
thấp để nhúng thông tin Watermark, điều này giúp cho Watermark có
thể không cảm nhận được (vô hình). Tuy nhiên, khi đối mặt với yêu
cầu về tính an toàn đối với các kỹ thuật nén và tấn công Watermark
thì các phương pháp Watermark trên miền không gian tỏ ra rất yếu
kém. Các nghiên cứu gần đây cho thấy rằng các yêu cầu về tính vô
hình và độ an toàn của Watermark có thể được thực hiện dễ hơn nếu
sử dụng các biến đổi cho dữ liệu chủ, thông tin Watermark sẽ được
chứa nhiều trong miền biến đổi này.
Nhiều biến đổi ảnh đã được xem xét, nổi lên trong đó là biến
đổi cosine rời rạc (DCT). Trước đây biến đổi này đặc biệt ưa chuộng
cho các chuẩn mã hóa video và ảnh. Từ đó, một số lớn kỹ thuật
Watermarking đã tận dụng biến đổi này. Ngoài ra, còn có các biến
đổi khác cũng được đề nghị dùng trong kỹ thuật Watermarking bao
gồm biến đổi Fourier rời rạc (DFT), biến đổi Fourier-Mellin, …
Trong những tác phẩm mới đây nhất, các tác giả thường đề cập đến
việc dùng biến đổi Wavelet rời rạc (DWT) cho kỹ thuật
Watermarking.
12
Trong lĩnh vực ảnh số, cùng với trào lưu tiêu chuẩn hóa theo
JPEG2000 và dịch chuyển các phương pháp nén ảnh từ dựa trên
DCT sang DWT, các mô hình Watermark hoạt động trên miền
Wavelet ngày càng trở nên được quan tâm hơn. Các yêu cầu mới như
truyền tải từng phần và có tỉ lệ bit thấp, độ phân giải và tính có thể
thay đổi tỷ lệ chất lượng, khả năng phục hồi lỗi và mã hóa vùng quan
tâm (ROI), được đòi hỏi với hiệu suất mã hóa cao hơn và đa năng
hơn. Những yêu cầu này được đáp ứng nhờ vào hệ thống “mã hóa
khối được nhúng có làm tròn tối ưu” (EBCOT) dựa theo Wavelet,
điều này được chấp nhận với các bổ sung nhỏ trong chuẩn mã hóa
ảnh JPEG2000. Biến đổi Wavelet có một số thuận lợi hơn so với các
biến đổi khác, chẳng hạn DCT, là vì nó có thể triển khai trên cả hai
ứng dụng là nén ảnh và Watermarking.
2.2 Cơ sở toán học của phép biến đổi Wavelet
Biến đổi Wavelet liên tục
Biến đổi Wavelet liên tục (Continuous Wavelet TransformCWT) của một hàm f(t) được bắt đầu từ một hàm Wavelet mẹ
(mother Wavelet ψ (t). Hàm Wavelet mẹ có thể là bất kỳ một hàm số
thực hoặc phức liên tục nào thỏa mãn các tính chất sau đây:
- Tích phân suy rộng trên toàn bộ trục t của hàm ψ (t) là bằng 0
- Tích phân năng lượng của hàm trên toàn bộ trục t là một số hữu
hạn.
Biến đổi Wavelet rời rạc
Việc tính toán các hệ số Wavelet tại tất cả các tỉ lệ là một
công việc hết sức phức tạp. Để giảm thiểu công việc tính toán người
ta chỉ chọn ra một tập nhỏ các giá trị tỉ lệ và các vị trí để tiến hành
tính toán. Quá trình chọn các tỉ lệ và các vị trí để tính toán như trên
tạo thành lưới nhị tố (dyadic). Một phân tích trên hoàn toàn có thể
thực hiện được nhờ biến đổi Wavelet rời rạc (DWT). Do đó, việc tính
toán biến đổi DWT thực chất là sự rời rạc hóa biến đổi Wavelet liên
tục (CWT); việc rời rạc hóa được thực hiện với sự lựa chọn các hệ số
a và b như sau:
13
A = 2 ; b =2 n; m, n ϵ Z
Việc tính toán hệ số của biến đổi Wavelet có thể dễ dàng
thực hiện bằng các băng lọc số nhiều nhịp đa kênh, một lý thuyết rất
quen thuộc trong xử lý tín hiệu.
m
m
2.3 Phép biến đổi sóng nhỏ rời rạc
Đây là phép biến đổi mới nhất được áp dụng cho ảnh số.
Ý tưởng của DWT cho tín hiệu một chiều như sau:
Tín hiệu được chia thành 2 phần, phần tần số cao và phần tần
số thấp. Đối với nhiều tín hiệu, phần nội dung có tần số thấp chứa
những thông tin quan trọng nhất - những đặc tính nhận dạng. Trái lại,
phần nội dung có tần số cao chỉ mang sắc thái của tín hiệu.
Quá trình phân tích và tổng hợp một tín hiệu có thể được
mô tả như sau:
Hình 2-2: Quá trình phân tích và tổng hợp tín hiệu
Quá trình này được gọi là phân tích một mức. Có thể lặp
lại quá trình này bằng cách tiếp tục phân tích tín hiệu xấp xỉ thành
hai tín hiệu ở giải tần thấp hơn. Từ đây xuất hiện một khái niệm
được gọi là phân tích nhiều mức.
Về mặt lý thuyết, quá trình này có thể lặp lại vô hạn. Tuy
nhiên, trong thực tế, việc phân tích chỉ có thể tiếp diễn cho đến
khi phần chi tiết chỉ còn một mẫu hay một điểm. Việc lựa chọn số
mức phân tích hoàn toàn phụ thuộc vào bản chất của tín hiệu.
- Xem thêm -