Bé gi¸o dôc vµ ®µo t¹o
Trêng §¹i häc B¸ch Khoa Hµ Néi
-----------------------------------------------
ĐÁNH DẤU ẤN BẢO VỆ BẢN QUYỀN SỐ TRÊN MIỀN HỆ SỐ
BIẾN ĐỔI
LÊ ANH ĐỨC
LuËn V¨n Th¹c SÜ Khoa Häc
CHUYÊN NGÀNH: CÔNG NGHỆ THÔNG TIN
Hµ Néi - 2005
Bé gi¸o dôc vµ ®µo t¹o
Trêng §¹i häc B¸ch Khoa Hµ Néi
-----------------------------------------------
ĐÁNH DẤU ẤN BẢO VỆ BẢN QUYỀN SỐ TRÊN MIỀN HỆ SỐ
BIẾN ĐỔI
LÊ ANH ĐỨC
LuËn V¨n Th¹c SÜ Khoa Häc
CHUYÊN NGÀNH: CÔNG NGHỆ THÔNG TIN
NGƯỜI HƯỚNG DẪN
TS. NGUYỄN LINH GIANG
Hµ Néi - 2005
Lu©n v¨n th¹c sÜ
2
LỜI CAM ĐOAN
Tôi xin cam đoan bản luận văn này là kết quả nghiên cứu của bản thân
tôi dưới sự hướng dẫn của Ts.Nguyễn Linh Giang. Nếu có gì sai phạm tôi xin
hoàn toàn chịu trách nhiệm.
Người làm cam đoan
Lê Anh Đức
Lª Anh §øc – Líp CNTT2003
Lu©n v¨n th¹c sÜ
3
MỤC LỤC
LỜI NÓI ĐẦU ...................................................................................................................... 5
TỔNG QUAN LUÂN VĂN ................................................................................................. 7
MỘT SỐ THUẬT NGỮ ...................................................................................................... 9
NỘI DUNG CHÍNH CỦA LUẬN VĂN ........................................................................... 12
CHƯƠNG I. TỔNG QUAN VỀ HỆ THỐNG ĐÁNH DẤU ẨN.................................... 13
I. Khái niệm:............................................................................................... 13
II. Hệ thống nhúng thông tin trên dữ liệu đa phương tiện .......................... 13
1. Sơ đồ hệ thống.................................................................................... 13
2. Các đặc trưng và tính chất:.................................................................. 18
3. Các yêu cầu đối với quá trình đánh dấu thông tin .............................. 20
III. Phân loại và ứng dụng các kỹ thuật đánh dấu ẩn .................................. 21
1. Phân loại kỹ thuật đánh dấu ẩn ........................................................... 21
2. Ứng dụng các kỹ thuật đánh dấu ẩn ................................................... 24
IV. Các phương thức tấn công đối tượng đánh dấu ẩn ............................... 25
1. Giới thiệu các kiểu tấn công................................................................ 26
2. Các kiểu tấn công đơn giản ................................................................. 26
3. Các kiểu tấn công Dò tìm – Vô hiệu hóa ............................................ 27
4. Tấn công tạo sự nhập nhằng, khóa chết hay loại bỏ dấu ẩn............... 27
CHƯƠNG II. MỘT SỐ KỸ THUẬT ĐÁNH DẤU ẨN BẢO VỆ BẢN QUYỀN SỐ
TRÊN MIỀN KHÔNG GIAN VÀ MIỀN HỆ SỐ BIẾN ĐỔI........................................ 28
I. Đánh dấu ẩn dựa trên miền không gian ................................................... 28
1. Giải thuật thay thế bit có trọng số thấp nhất ....................................... 28
2. Giải thuật dựa trên tính tương quan trong miền không gian ............... 31
3. Kỹ thuật đánh dấu ẩn CDMA ............................................................. 33
II. Đánh dấu ẩn dựa trên miền hệ số biến đổi ............................................. 34
1. Giải thuật đánh dấu thông tin dựa trên quá trình điều chế biên độ biến
đổi Fourier rời rạc (DFT Amplitude Modulation) .................................. 34
2. Giải thuật đánh dấu thông tin trên miền các hệ số biến đổi Cosin rời
rạc ............................................................................................................ 36
Lª Anh §øc – Líp CNTT2003
Lu©n v¨n th¹c sÜ
4
2. Đánh dấu ẩn sử dụng lựa chọn vị trí khối và ràng buộc miền biến đổi
Cosince rời rạc. ....................................................................................... 51
3. Nhúng dấu ẩn mức xám sử dụng biến đổi Cosince rời rạc ................. 63
4. Đánh dấu ẩn video sử dụng các hệ số biến đổi DCT .......................... 71
III. Kỹ thuật kiểm định đánh dấu ẩn ........................................................... 75
CHƯƠNG III. THỬ NGHIỆM CHƯƠNG TRÌNH ĐÁNH DẤU ẨN DỰA TRÊN KỸ
THUẬT MIỀN HỆ SỐ BIẾN ĐỔI ................................................................................... 76
I. Bài toán: ................................................................................................... 76
II. Thực hiện ................................................................................................ 77
III. Sơ đồ một số modul trong chương trình ............................................... 81
1. Sơ đồ mô đun đánh dấu ẩn trên miền không gian............................... 81
2. Sơ đồ mô đun đánh dấu ẩn trên miền hệ số biến đổi. ......................... 82
3. Sơ đồ mô đun tách dấu ẩn. .................................................................. 83
IV. Kết quả thực hiện .................................................................................. 84
1. Thực hiện quá trình nhúng thông tin có dạng Text ............................. 85
2. Tách thông tin dấu ẩn dạng text .......................................................... 86
3. Nhúng thông tin dấu ẩn dạng ảnh ....................................................... 87
4. Quá trình tách thông tin dạng ảnh ....................................................... 88
5. Đánh giá .............................................................................................. 90
HƯỚNG PHÁT TRIỂN CỦA LUẬN VĂN..................................................................... 91
KẾT LUẬN ......................................................................................................................... 92
TÀI LIỆU THAM KHẢO ................................................................................................. 94
Lª Anh §øc – Líp CNTT2003
Lu©n v¨n th¹c sÜ
5
LỜI NÓI ĐẦU
Ngày nay, sự phát triển như vũ bão của thông tin kỹ thuật số đã đem lại
những thay đổi sâu sắc trong xã hội và trong cuộc sống của chúng ta. Bên
cạnh những thuận lợi mà thông tin kỹ thuật số mang lại cũng sinh ra những
thách thức và cơ hội mới. Sự ra đời những phần mềm có tính năng rất mạnh,
các thiết bị mới như máy ảnh kỹ thuật số, máy quét chất lượng cao, máy in,
máy ghi âm kỹ thuật số v.v… đã thúc đẩy khả năng sáng tạo, xử lý và thưởng
thức các dữ liệu đa phương tiện (multimedia data). Mạng Internet toàn cầu đã
tạo ra những cơ cấu ảo – nơi diễn ra các quá trình trao đổi thông tin trong mọi
lĩnh vực chính trị, quân sự, quốc phòng, kinh tế, thương mại…Bên cạnh đó,
trong môi trường mở và tiện nghi như thế xuất hiện những vấn nạn, tiêu cực
đang rất cần các giải pháp hữu hiệu nhằm đảm bảo an toàn thông tin, chống
lại các nạn ăn cắp bản quyền, xuyên tạc thông tin, truy nhập thông tin trái
phép, sử dụng bất hợp pháp các sản phẩm số (file tài liệu, chương trình, âm
thanh, hình ảnh và Video,...) ngày càng gia tăng, và việc quản lý các sản
phẩm số không được đảm bảo, do các đặc tính của các file số có thể sao chép
qua lại giữa các máy tính với nhau bằng nhiều phương pháp. Kết quả là hiện
nay tình trạng vi phạm bản quyền số đang xảy ra hàng ngày, hàng giờ trên
khắp thế giới. Nhằm bảo vệ các sản phẩm số không bị sử dụng trái phép, song
song với việc kêu gọi ý thức tự giác thực thi luật bản quyền thì các công ty
công nghệ lớn trên thế giới đã và đang thực hiện các giải pháp kỹ thuật kiểm
soát bản quyền số. Kỹ thuật đánh dấu ẩn dữ liệu đa phương tiện là một lĩnh
vực còn khá mới ở Viêt Nam, dường như mọi người mới chỉ biết ứng dụng nó
từ các chương trình và các thư viện có sẵn
Lª Anh §øc – Líp CNTT2003
Lu©n v¨n th¹c sÜ
6
Để giải quyết vấn đề bẳo vệ quyền sở hữu với các sản phẩm dữ liệu số
trong luận văn đưa ra một số kỹ thuật bảo vệ bản quyền dựa trên phương pháp
miền không gian và miền hệ số đã được biến đổi giúp cho quá trình bảo vệ
bản quyền số được đảm bảo hơn.
Do thời gian tìm hiều và nghiên cứu về bản quyền số còn hạn chế nên
trong luận văn còn có những thiếu sót. Em rất mong được sự đánh giá và góp
ý bổ sung của các thầy giáo, cô giáo và các bạn để luận văn được hoàn chỉnh
hơn.
Em xin chân thành cảm ơn Thầy giáo TS. Nguyễn Linh Giang đã tận
tình hướng dẫn em trong quá trình thực hiện luận văn này. Em xin chân thành
cảm ơn các thầy cô giáo trong khoa CNTT và các bạn cùng lớp đã tham gia
góp ý trong quá trình hoàn thiện lận văn.
Hà nội, tháng 11 năm 2005
Học viên thực hiện
Lê Anh Đức
Lª Anh §øc – Líp CNTT2003
Lu©n v¨n th¹c sÜ
7
TỔNG QUAN LUÂN VĂN
Từ nhu cầu thực tế là bảo vệ quyền sở hữu đối với các dữ liệu đa
phương tiện, có nhiều phương pháp khác nhau để đạt được mục đích này. Bài
toán đặt ra cho chúng ta là đưa ra một phương pháp xác nhận quyền sở hữu
của tác giả đối với các thông tin đa phương tiện.
Các phương pháp được thực hiện bởi quá trình trao đổi, xác thực sử
dụng các dữ liệu được đánh dấu ẩn. Qúa trình đánh dấu ẩn trên dữ liệu thực
hiện việc nhúng một thông tin nào đó mang ý nghĩa quyền sở hữu của tác giả
vào trong sản phẩm của tác giả và được dùng làm thông tin xác nhận quyền sở
hữu sản phẩm. Quá trình đánh dấu ẩn này phải đảm bảo là không ảnh hưởng
lớn đến sản phẩm của tác giả, nó phải tồn tại bền vững cùng sản phẩm và
muốn gỡ bỏ dấu thông tin mà không được phép của chủ sở hữu thì khó thực
hiện được, ngoại trừ việc phá huỷ sản phẩm. Sản phẩm đã được đánh dấu, sau
đó được sử dụng cho quá trình trao đổi theo các giao thức cụ thể đảm bảo
được các yêu cầu đặt ra về xác thực quyền sử dụng và bảo vệ quyền sở hữu.
Để đạt được mục đích nêu ra trong đề tài, em đã tìm hiểu các vấn đề lý
thuyết liên quan đến hệ thống đánh dấu ẩn, các giải thuật đánh dấu ẩn trên dữ
liệu đa phương tiện, các giao thức trao đổi thông tin trong quá trình đánh dấu
ẩn và các cơ chế xác thực người sử dụng cũng như người sở hữu đối với các
dữ liệu đa phương tiện.
Các giải thuật đánh dấu ẩn, trong luận văn em đã tìm hiểu và nghiên
cứu một số giải thuật thực hiện quá trình đánh dấu ẩn trên miền không gian và
trên miền các hệ số biến đổi đối với dữ liệu số giúp bảo vệ quyền sở hữu,
chống sao chép bất hợp pháp (Bảo vệ bản quyền tác giả), nhận thức thông tin
Lª Anh §øc – Líp CNTT2003
Lu©n v¨n th¹c sÜ
8
hay phát hiện xuyên tạc thông tin và có khả năng theo dõi quá trình sử dụng,
truyền thông...
Các giao thức trao đổi thông tin giữa người sở hữu và người sử dụng
trong đánh dấu ẩn như:
Giao thức trao đổi thông tin trong quá trình phát sinh dấu ẩn để thực
hiện quá trình ẩn với sự tham gia của người sử dụng, trung tâm chứng
thực
Giao thức chèn dấu ẩn thực hiện quá trình chèn dấu ẩn đã được tạo ra.
Giao thức này có sự tham gia của hai bên là người sử dụng và người sở
hữu.
Giao thức xác định vi phạm khi người sở hữu phát hiện có sự vi phạm
bản quyền đối với tác phẩm của mình. Giao thức này chỉ có sự tham gia
của người sở hữu.
Giao thức giải quyết khi có sự vi phạm xảy ra để đảm bảo xác định
đúng người đã vi phạm. Giao thức này có sự tham gia của đầy đủ ba
bên là người sử dụng, người sở hữu và trung tâm chứng thực.
Các giao thức này đóng vài trò quan trọng bởi vì nó làm đảm bảo sự an
toàn, xác thực đối với các dữ liệu được đánh dấu ẩn trong quá trình trao đổi.
Trong phần mô phỏng giải thuật, sử dụng công cụ lập trình là Ngôn
ngữ lập trình Visual C++ và sử dụng các thư viện của hệ điều hành Windows.
Do ngôn ngữ Visual C++ cung cấp nhiều công cụ lập trình và khả năng xử lý
bộ nhớ tốt đối với các ứng dụng xử lý dữ liệu lớn, ngôn ngữ cung cấp các tính
năng giúp lập trình giao diện dễ sử dụng và gần gũi
Lª Anh §øc – Líp CNTT2003
Lu©n v¨n th¹c sÜ
9
MỘT SỐ THUẬT NGỮ
- Host signal (Phương tiện chứa): là phương tiện gốc được dùng để
nhúng thông tin. Trong giấu thông tin trong ảnh thì nó mang tên ảnh chứa,
còn trong audio là audio chứa .v.v. Đôi khi ta cũng gọi phương tiện chứa là
môi trường.
- Embeded data (Thông tin giấu): là lượng thông tin được nhúng vào
trong phương tiện chứa. Trong giấu tin mật steganograpy thông tin giấu được
gọi là thông điệp giấu (message), còn trong kỹ thuật đánh dấu ẩn số thì thông
tin giấu được gọi là dấu ẩn (watermark).
- Cryptographic Service Provider: Mô đun cung cấp dịch vụ mã
- Spatial Domain : Miền không gian
- Frequency domain : Miền tần số
- DCT-Discrete Cosine Transform : Biến đổi Cosin rời rạc
- DFT-Discrete Fourier Transform : Biến đổi Fourier rời rạc
- IPR-intellectual property rights : Quyền sở hữu trí tuệ
- Watermark Embedder : Bộ nhúng dấu ẩn
- Watermark Detector : Bộ tách dấu ẩn
- Imperceptibility : Tính không thể cảm nhận được
- Robustness : Tính bền vững
- Inseparability : Tính không phân chia
- Security: Bảo mật
- Copyright Protection : Bảo vệ bản quyền
- Copy Protection : Bảo vệ, chống sao chép bất hợp pháp
- Tracking: Dò vết dữ liệu theo dõi quá trình truyền thông
- Tamper Proofing : Chống giả mạo
- Broadcast Monitoring : Giám sát truyền thông
Lª Anh §øc – Líp CNTT2003
Lu©n v¨n th¹c sÜ
10
- Concealed Communication : Truyền tin bí mật
- Space : Dấu cách
- Syntax: Cú pháp
- Wavelet Transform : Biến đổi sóng con
- Block-wise: (biến đổi) theo khối
- LSB-Least Significant Bit: Thuật toán sử dụng bit có trọng số thấp
nhất
- Correlation :Độ tương quan
- Amplitude Modulation : Điều chế biên độ
- Human Visible System : Hệ thống thị giác của con người
- Human audible system : Hệ thống thính giác của con người
- JPEG-Joint Photographic Expert Group : Chuẩn quốc tế về nén
ảnh tĩnh
- MPEG-Moving Picture Expert Group : Chuẩn mã hoá và nén tín
hiệu video-audio
- Reduce: Giản lược
- Encrypt: Mã hoá, nghĩa hẹp, sử dụng phương pháp biến đổi thông
tin bằng các thuật toán mã hoá để đảm bảo tính bí mật cho thông tin
- Encode: Mã hoá, nghĩa rộng, thông tin sau khi được biến đổi nhờ mã
hoá cùng các biến đổi tương tự như lấy hàm băm, chữ ký ... được trừu
tượng hoá thành thông điệp chuẩn.
- Key container : Hộp khoá
- Block Transformation : Biến đổi khối
- Shape-adaptive DCT: Biến đổi cosin rời rạc tương ứng với hình
dạng
- Permutation: Sự hoán vị
- Pseudorandom : Giả ngẫu nhiên
Lª Anh §øc – Líp CNTT2003
Lu©n v¨n th¹c sÜ
11
- Original Image: Ảnh gốc
- Middle frequency : Tần số trung bình
- GOP-Group of picture : Cấu trúc nhóm ảnh
- Low bit coding : Mã hoá bit thấp
- Phase coding : Mã hoá pha
- Hash object : Đối tượng dùng để tham chiếu đến dữ liệu băm
- Picture element : Điểm ảnh
Lª Anh §øc – Líp CNTT2003
Lu©n v¨n th¹c sÜ
12
NỘI DUNG CHÍNH CỦA LUẬN VĂN
Chương I. Tổng quan về hệ thống đánh dấu ẩn.
- Đưa ra khái niệm và sơ đồ hệ thống đánh dấu ẩn
- Các đặc trưng và tính chất cơ bản của hệ thống.
- Phân loại các kỹ thuật và ứng dụng của các kỹ thuật đánh dấu
ẩn
Chương II. Một số kỹ thật đánh dấu ẩn bảo vệ bản quyền số trên miền không
gian và miền hệ số biến đổi
- Dựa trên tính tương quan của miền không gian
- Thay thế các bit có trọng số thấp.
- Dựa trên quá trình điều biến biên độ biến đổi Fourier rời rạc
- Dựa trên miền hệ số biến đổi Cosince rời rạc
- Sử dụng lựa chọn vị trí khối và ràng buộc miền biến đổi
Cosince rời rạc.
- Nhúng dấu ẩn trong mức xám sử dụng biến đổi Cosince rời
rạc
Chương III. Xây dựng chương trình mô phỏng nhúng dấu ẩn dựa trên miền
không gian và miền các hệ số biến đổi.
Bài toán:
- Đầu vào là một ảnh màu hoặc đen trắng, sử dụng các kỹ thuật đánh dấu
ẩn thông tin trên miền không gian và miền các hệ số ảnh đã được biến đổi để
nhúng thông tin cần dấu vào ảnh.
- Sử dụng các phép biến đổi hình học thông dụng như: giãn ảnh tương
phản, chuyển đổi Ellip.
- Sau khi sử dụng các phép biến đổi làm thay đổi hình dạng ảnh, dung kỹ
thuật dò tìm thông tin ẩn và đưa ra thông tin ẩn đó.
Lª Anh §øc – Líp CNTT2003
Lu©n v¨n th¹c sÜ
13
CHƯƠNG I. TỔNG QUAN VỀ HỆ THỐNG ĐÁNH DẤU ẨN
I. Khái niệm:
Hệ thống đánh dấu ẩn là kỹ thuật đưa vào nội dung của thông tin đa
phương tiện một dữ liệu số khác (thông tin ẩn) dùng để xác nhận quyền sở
hữu hay xác thực đối với sản phẩm này. Việc đưa dấu ẩn vào nội dung của
thông tin đa phương tiện được thực hiện bằng một giải thuật thích hợp. Thông
thường giải thuật để chèn dấu ẩn vào thông tin đa phương tiện dựa vào giới
hạn ở khả năng cảm nhận của người.
Ý tưởng cơ bản của quá trình nhúng dấu ẩn là thêm một dấu thông tin
vào dữ liệu gốc cần được đánh dấu thoả mãn điều kiện tín hiệu đánh dấu phải
kín đáo, để cho người sử dụng không thấy được sự khác biệt giữa thông tin
chứa chứa dấu ẩn và thông tin ban đầu cũng như không dễ dàng nhận thấy
được sự hiện diện của dấu ẩn. Đồng thời, phải có tính bảo mật trong một dữ
liệu được đánh dấu nhưng sau đó có thể giải mã từng phần hoặc toàn bộ từ dữ
liệu này nếu khoá bảo mật được sử dụng cho quá trình khôi phục dấu ẩn.
II. Hệ thống nhúng thông tin trên dữ liệu đa phương tiện
1. Sơ đồ hệ thống
Sơ đồ tổng quan môi trường hệ thống nhúng thông tin ẩn trên dữ liệu
đa phương tiện:
Lª Anh §øc – Líp CNTT2003
Lu©n v¨n th¹c sÜ
14
Dữ liệu nén
hay chưa nén
Dữ liệu đã
watermark
Kênh truyền
thông
Bộ nhúng
Watermark
Hàm nhúng
Các dạng tấn
công và nhiễu
trên đường
ề
Bộ xác
định
Thông tin
Nhúng
Thông tin
đã xác định
Tùy chọn
Thông tin
ẩn
Khóa
Thông số
người dùng
Dữ liệu
nguyên thủy
Hình 1.1: Sơ đồ hệ thống đánh dấu ẩn
Hệ thống đánh dấu thông tin trên dữ liệu đa phương tiện về cơ bản gồm
hai phần, thứ nhất là bộ phận nhúng thông tin-Watermark Embedder, thứ hai
là bộ phận giải mã thông tin Watermark Detector. Bộ phận nhúng thông tin
Watermark Embedder sử dụng để nhúng thông tin ẩn vào nội dung dữ liệu đa
phương tiên-Multimedia Content. Còn bộ phận giải mã Watermark Detector
được sử dụng để xác định sự hiện diện của tín hiệu thông tin ẩn-Watermark
Signal.
Thực thể khoá-Watermark Key được sử dụng trong suốt quá trình
nhúng tín hiệu và tách tín hiệu ẩn. Khoá Watermark Key có sự tương ứng 1-1
với tín hiệu Watermark Signal. Khoá này được giữ mật và chỉ có người được
uỷ quyền mới có thể biết được và có thể xác định được sự hiện diện của dấu
watermark khi sử dụng khoá.
Ngoài ra quá trình truyền thông tin đa phương tiện trên môi trường
mạng có thể bị nhiễu và các dạng thức tấn công, vì vậy kỹ thuật đánh dấu ẩn
cũng cần quan tâm đến hai khía cạnh này. Tuy nhiên hai bộ phân chính cần
Lª Anh §øc – Líp CNTT2003
Lu©n v¨n th¹c sÜ
15
được quan tâm đấy là, bộ phân thực hiện quá trình đánh dấu ẩn và bộ phân
thực hiện quá trình tách dấu ẩn, chúng thể hiện ở hai sơ đồ sau đây:
Thông tin ẩn
Dữ liệu
ban đầu
Hệ thống đánh
dấu thông tin
Dữ liệu được
đánh dấu ẩn
Khoá mật/khoá
công khai
Mô hình đánh dấu ẩn nói chung
Thông tin ẩn
hoặc ảnh gốc
Dữ liệu có
nhúng dấu ẩn
Hệ thống khôi phục
dấu thông tin
Dấu thông tin hoặc
các độ đo khác
Khoá mật/khoá
công khai
Hệ thống giải mã dấu ẩn nói chung
Hình 1.2: Hệ thống nhúng và tách dấu ẩn nói chung.
Dưa trên hai mô hình trên, chúng ta quan tâm đến ba bước trong quá
trình thiết kế một phương thức đánh dấu ẩn:
Lª Anh §øc – Líp CNTT2003
Lu©n v¨n th¹c sÜ
16
Bước 1: Quá trình thiết kế tín hiệu W được thêm vào dữ liệu gốc,
thông thường tín hiệu thông tin W phụ thuộc vào một khoá K và thông tin ẩn
I:
W = f 0 (I , K )
Dấu thông tin W cũng có thể phụ thuộc vào dữ liệu gốc X khi nó được
nhúng:
W = f 0 (I , K , X )
Bước 2: Thiết kế phương thức đánh dấu ẩn để kết hợp dấu thông tin W
với dữ liệu gốc X để thu được dữ liệu được đánh dấu Y:
Y = f1 (X ,W )
Bước 3: Thiết kế quá trình giải mã dấu thông tin tương ứng để phục hồi
thông tin được đánh dấu trong một tín hiệu hỗn hợp bằng việc sử dụng khoá
và có sự hỗ trợ của dữ liệu gốc:
∧
I = g(X , Y , K )
hoặc không có sự hỗ trợ của dữ liệu gốc:
∧
I = g (Y , K )
Hai bước đấu là quá trình thiết kế dấu thông tin và quá trình nhúng dấu
thông tin thường được kết hợp làm một. Dữ liệu gốc phụ thuộc vào loại ứng
dụng, có thể là dữ liệu nén hoặc không nén, hầu hết các phương pháp đưa ra
đều làm việc trên dữ liệu không nén. Dấu thông tin có thể là một số hiệu, một
đoạn văn bản hay một ảnh. Khoá ở đây được sử dụng để tăng cường tính bảo
mật cho dữ liệu số.
Lª Anh §øc – Líp CNTT2003
Lu©n v¨n th¹c sÜ
17
Sơ đồ kỹ thuật hệ thống nhúng thông tin ẩn trong tập tin đa phương
tiện:
Tập tin đa
phương tiện
gốc
101010..
Văn
bản
Tập tin đa
phương tiện
được nhúng
Dữ liệu ẩn
Văn
bản
Nhúng
“Hello World”
Nén
Chạy tập tin đa
phương tiện
101010..
Xử lý
Tách
“Hello World”
Hình 1.3: Sơ đồ kỹ thuật
Theo sơ đồ kỹ thuật này, cấu trúc của dữ liệu bao gồm tập tin chứa dữ
liệu ẩn gọi là tập tin mang, dữ liệu ẩn được nhúng trực tiếp vào tập tin mang.
Việc xem hoặc nghe tập tin mang theo cách thông thường không thể phát hiện
ra được dữ liệu ẩn. Do vậy cần có công cụ phần cứng đặc biệt hoặc phần mềm
để thực hiện việc nhúng và phát hiện dữ liệu ẩn.
Theo sơ đồ này, về nguyên lý nhúng dữ liệu ẩn thì hiện nay có nhiều kỹ
thuật nhúng dữ liệu ẩn. Về cơ bản thì các kỹ thuật này đều thực hiện việc ghi
chèn thông tin yêu cầu vào dữ liệu hình hoặc âm thanh theo cách thức không
làm hư hỏng dữ liệu gốc. Sự biến đổi của dữ liệu hầu như không thể nhận biết
được. Có ba cách thức chính để giấu thông tin vào tập tin đa phương tiện:
Lª Anh §øc – Líp CNTT2003
Lu©n v¨n th¹c sÜ
18
- Cách đầu tiên là chèn thẳng thông tin vào tập tin đa phương tiện
mang.
- Cách thứ hai đòi hỏi thực hiện một số phân tích để tìm ra mức độ biến
đổi màu sắc để đặt thông tin ẩn vào vùng khó phát hiện nhất.
- Cách thứ ba là chèn thông tin ẩn một cách ngẫu nhiên vào tập tin
mang.
2. Các đặc trưng và tính chất:
Sau đây là các tính chất của quá trình đánh dấu ẩn. Các tính chất này
cũng giúp chúng ta đánh giá chất lượng của giải thuật:
Tính phổ dụng: Phương pháp đánh dấu ẩn cần được ứng dụng cho
nhiều loại dữ liệu số.
Tính vô hình (Imperceptibility): Khi đưa dấu ẩn vào chứa bên trong
thông tin đa phương tiện, thì ta phải đưa theo giải thuật thích hợp để người
dùng không nhận thấy sự thay đổi đó. Dấu ẩn phải không ảnh hưởng nhiều
đến chất lượng của thông tin đa phương tiện. Thông thường các bit ít cảm
nhận được bởi con người sẽ được ưu tiên dùng để chứa dấu ẩn. Để đạt được
độ bền vững cao, một điều mong muốn là cường độ của dấu ẩn được nhúng
càng cao càng tốt. Vì vậy trong quá trình thiết kế các phương pháp đánh dấu
thông tin luôn luôn có sự cân nhắc giữa tính chất không thể cảm nhận được và
tính bền vững của dấu ẩn. Để đảm bảo tính chất không thể cảm nhận của các
thao tác gây ra bởi quá trình nhúng thông tin, một tiêu chuẩn sắp xếp được sử
dụng đối với các phương pháp đánh dấu ẩn. Vấn đề này có thể tường minh
hoặc không, dữ liệu gốc có thể biến đổi hoặc cố định. Bởi vì đòi hỏi về tính
không thể cảm nhận được, các mẫu(có thể là các điểm ảnh hoặc các hệ số
biến đổi) được sử dụng cho quá trình nhúng dấu thông tin chỉ có thể được
biến đổi ít đến giá trị trung bình của chúng.
Lª Anh §øc – Líp CNTT2003
Lu©n v¨n th¹c sÜ
19
Tính bền vững (Robustness): Tùy vào từng loại ứng dụng mà ta có
thể xem tính bền vững này bằng nhiều quan điểm khác nhau, nếu như đối với
các ứng dụng dùng để bảo vệ quyền sở hữu thì dấu ẩn cần phải bền vững qua
một số các hành động cập nhật nội dung thông tin. Với ứng dụng để chống
làm giả hoặc chống lại sự thay đổi trên thông tin đòi hỏi dấu ẩn phải huỷ bỏ
khi có các tác vụ này xảy ra. Để đảm bảo tính bền vững mặc dù chỉ biến đổi
ít, thông tin đánh dấu phải luôn luôn phân tán một cách dư thừa trên nhiều
mẫu của dữ liệu gốc, vì vậy chúng ta đưa ra khai niệm độ bền vững giao
thoa(“holographic” robustness), có nghĩa là dấu ẩn luôn luôn có thể được
phục hồi từ một phần nhỏ của dữ liệu được đánh dấu, nhưng quá trình phục
hồi dấu thông tin có thể bền vững hơn nếu như có nhiều dữ liệu gốc có sẵn
cho quá trình phục hồi.
Tính không phân chia (Inseparability): Sau khi thông tin đa phương
tiện chứa dấu ẩn thì yêu cầu là phải rất khó hoặc không thể phân chia thành 2
thành phần riêng biệt lúc đầu.
Bảo mật (Security): Sau khi đã đưa dấu ẩn vào thông tin đa phương
tiện, thì yêu cầu là chỉ cho phép những người sử dụng có quyền mới chỉnh sửa
và phát hiện được dấu ẩn điều này được thực hiện nhờ vào khoá trong giải
thuật nhúng dấu ẩn vào thông tin và giải thuật phát hiện ra dấu ẩn trong thông
tin đa phương tiện.
Chẳng hạn như với nhiều mô hình, các tín hiệu ngẫu nhiên được nhúng
vào dữ liệu như các dấu ẩn. Trong trường hợp này, quá trình mô tả và bộ sinh
số hiệu ngẫu nhiên đầu tiên phải sử dụng khoá. Có hai mức bảo mật, trong
mức đầu tiên thì người sử dụng không được uỷ quyền không thể đọc, giải mã
dấu ẩn và anh ta cũng không thể dò ra nếu một tập tin dữ liệu chứa dấu. Mức
thứ hai cho phép người dùng không được uỷ quyền dò ra được nếu thông tin
Lª Anh §øc – Líp CNTT2003
- Xem thêm -