LỜI CAM ĐOAN
Tôi xin cam đoan đây là công trình nghiên cứu của riêng tôi. Các số liệu, kết quả
nêu trong luận án là trung thực và chưa từng được ai công bố trong các công trình
nào khác.
Hà Nội, ngày
Tập thể hướng dẫn
GS.TSKH. Lê Hùng Sơn
tháng
năm 2015
Nghiên cứu sinh
PGS.TS. Phạm Văn Ất
i
Đỗ Văn Tuấn
LỜI CẢM ƠN
Luận án này được thực hiện tại Trường Đại học Bách khoa Hà Nội dưới sự
hướng dẫn của GS.TSKH. Lê Hùng Sơn và PGS.TS. Phạm Văn Ất. Nghiên cứu
sinh xin gửi lời cảm ơn sâu sắc đến các thầy về sự giúp đỡ, chỉ dẫn tận tình trong
quá trình nghiên cứu. Các thầy là tấm gương sáng cho tôi trong nghiên cứu chuyên
môn cũng như trong cuộc sống.
Nghiên cứu sinh xin gửi lời cảm ơn đến các thầy giáo, cô giáo ở Viện Toán ứng
dụng và Tin học; các thầy giáo, cô giáo ở Viện Đào tạo Sau đại học Trường Đại học
Bách khoa Hà Nội đã tạo điều kiện thuận lợi và giúp đỡ nghiên cứu sinh trong thời
gian học tập tại Trường.
Tôi cũng xin gửi lời cảm ơn tới lãnh đạo nhà trường, các đồng nghiệp tại Khoa
Công nghệ thông tin Trường Cao đẳng Thương mại và Du lịch Hà Nội đã tạo điều
kiện thuận lợi trong quá trình tôi vừa làm nghiên cứu sinh vừa công tác tại Trường.
Cuối cùng tác giả xin bày tỏ lòng biết ơn đến gia đình và bạn bè đã động viên,
giúp đỡ về tinh thần, thời gian để tác giả hoàn thành luận án.
Hà Nội, ngày
tháng
Nghiên cứu sinh
Đỗ Văn Tuấn
ii
năm 2015
MỤC LỤC
DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT ........................................ 1
DANH MỤC CÁC BẢNG ................................................................................... 2
DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ ............................................................ 3
MỞ ĐẦU
........................................................................................................ 4
CHƯƠNG 1. MỘT SỐ KIẾN THỨC CƠ SỞ ................................................... 7
1.1. Khái niệm về giấu tin ................................................................................... 7
1.1.1. Định nghĩa giấu tin ................................................................................... 7
1.1.2. Mô hình giấu tin ....................................................................................... 8
1.1.3. Các tính chất của một lược đồ giấu tin .................................................... 9
1.1.3.1. Khả năng nhúng tin ........................................................................... 9
1.1.3.2. Tính che giấu ..................................................................................... 9
1.1.3.3. Tính bảo mật ................................................................................... 10
1.1.4. Một số hướng tiếp cận của phương pháp giấu tin .................................. 10
1.2. Một số khái niệm về thủy vân trên dữ liệu đa phương tiện .................... 11
1.2.1. Dữ liệu đa phương tiện ........................................................................... 11
1.2.1.1. Ảnh số ............................................................................................. 11
1.2.1.2. Âm thanh ......................................................................................... 12
1.2.1.3. Video ............................................................................................... 12
1.2.2. Phân loại phương pháp thủy vân ............................................................ 13
1.2.2.1. Thủy vân bền vững.......................................................................... 14
1.2.2.2. Thủy vân dễ vỡ ................................................................................ 14
1.3. Một số phép biến đổi dữ liệu ..................................................................... 15
1.3.1. Phép biến đổi cosine rời rạc ................................................................... 15
1.3.1.1. Phép biến đổi cosine rời rạc một chiều ........................................... 15
1.3.1.2. Phép biến đổi cosine rời rạc hai chiều ............................................ 16
1.3.2. Phép biến đổi wavelet rời rạc ................................................................. 17
1.4. Một số khái niệm trong mật mã ................................................................ 18
1.4.1. Số nguyên tố và thuật toán kiểm tra số nguyên tố ................................. 19
1.4.2. Ký hiệu Legendre ................................................................................... 21
iii
1.4.3. Ký hiệu Jacobi ........................................................................................ 21
1.4.4. Định lý đồng dư Trung Hoa ................................................................... 21
1.4.5. Hệ mật mã Rabin .................................................................................... 22
1.5. Một số phép toán trên ma trận nguyên .................................................... 23
1.6. Kết luận chương 1....................................................................................... 24
CHƯƠNG 2. GIẤU TIN VÀ HỆ MẬT MÃ RABIN CẢI TIẾN ................... 25
2.1. Bảo mật dữ liệu bằng sự kết hợp giữa giấu tin và mật mã ..................... 25
2.2. Một số kết quả gần đây về các sơ đồ Rabin cải tiến ................................ 26
2.2.1. Sơ đồ Shimada ....................................................................................... 26
2.2.1.1. Thuật toán mã hóa ........................................................................... 26
2.2.1.2. Thuật toán giải mã ........................................................................... 27
2.2.2. Sơ đồ Chen-Tsu...................................................................................... 28
2.3. Đề xuất một sơ đồ Rabin mới .................................................................... 28
2.3.1. Phương trình Rabin ................................................................................ 29
2.3.2. Thuật toán mã hóa .................................................................................. 31
2.3.3. Thuật toán giải mã .................................................................................. 31
2.3.4. Xét ví dụ minh họa sơ đồ Rabin đề xuất ................................................ 32
2.3.5. Chứng minh tính đúng đắn của sơ đồ Rabin đề xuất ............................. 34
2.3.6. Phân tích các sơ đồ cải tiến hệ mật mã Rabin ........................................ 34
2.3.6.1. Độ phức tạp tính toán ...................................................................... 35
2.3.6.2. Phạm vi ứng dụng ........................................................................... 36
2.3.6.3. Thực nghiệm ................................................................................... 36
2.4. Giấu tin trên ảnh nhị phân ........................................................................ 37
2.4.1. Lược đồ giấu tin TCP ............................................................................. 38
2.4.1.1. Thuật toán nhúng tin ....................................................................... 38
2.4.1.2. Thuật toán trích tin .......................................................................... 39
2.4.2. Lược đồ giấu tin CTL............................................................................. 39
2.4.2.1. Thuật toán nhúng tin ....................................................................... 40
2.4.2.2. Thuật toán trích tin .......................................................................... 40
2.4.2.3. Chính xác hóa lược đồ CTL ............................................................ 41
2.5. Đề xuất một lược đồ giấu tin mới trên ảnh nhị phân .............................. 42
iv
2.5.1. Thuật toán nhúng dãy bít trên một khối điểm ảnh ................................. 42
2.5.2. Thuật toán trích dãy bít trên một khối điểm ảnh .................................... 43
2.5.3. Chứng minh tính đúng đắn của thuật toán nhúng dãy bít trên một khối
điểm ảnh .............................................................................................. 44
2.5.4. Lược đồ giấu tin trên ảnh nhị phân ........................................................ 45
2.5.5. Phân tích tính bảo mật của các lược đồ giấu tin trên ảnh nhị phân ....... 46
2.5.6. So sánh chất lượng ảnh của các lược đồ giấu tin trên ảnh nhị phân ...... 47
2.6. Đề xuất một lược đồ giấu tin mới trên ảnh chỉ số màu ........................... 48
2.6.1. Thuật toán nhúng tin .............................................................................. 50
2.6.2. Thuật toán trích tin ................................................................................. 51
2.6.3. Chứng minh tính đúng đắn của lược đồ đề xuất .................................... 52
2.6.4. So sánh chất lượng ảnh chứa tin của các lược đồ trên ảnh chỉ số màu .. 53
2.7. Kết luận chương 2....................................................................................... 54
CHƯƠNG 3. THỦY VÂN THUẬN NGHỊCH ................................................ 56
3.1. Sơ lược về thủy vân thuận nghịch ............................................................. 56
3.2. Một số kết quả gần đây về thủy vân thuận nghịch trên ảnh JPEG ....... 57
3.2.1. Qui trình nén ảnh JPEG ......................................................................... 57
3.2.2. Lược đồ nhúng tin thuận nghịch CLTT ................................................. 60
3.2.2.1. Thuật toán nhúng tin ....................................................................... 60
3.2.2.2. Thuật toán trích tin .......................................................................... 62
3.2.2.3. Thuật toán khôi phục ảnh gốc ......................................................... 62
3.2.3. Lược đồ nhúng tin thuận nghịch LS ...................................................... 64
3.3. Đề xuất lược đồ thủy vân thuận nghịch mới trên ảnh JPEG ................. 64
3.3.1. Thuật toán nhúng dấu thủy vân .............................................................. 64
3.3.2. Thuật toán trích dấu thủy vân và khôi phục ảnh gốc ............................. 65
3.3.3. Phân tích khả năng nhúng tin và chất lượng ảnh thủy vân .................... 67
3.3.3.1. Phân tích khả năng nhúng tin .......................................................... 68
3.3.3.2. Phân tích sự thay đổi của khối DCT lượng tử................................. 68
3.3.3.3. Phân tích chất lượng ảnh ................................................................. 69
3.3.3.4. Thực nghiệm ................................................................................... 70
v
3.4. Một số kết quả gần đây về thủy vân thuận nghịch dựa trên phép biến
đổi mở rộng hiệu đối với véc tơ điểm ảnh ............................................... 73
3.4.1. Lược đồ Alattar ...................................................................................... 74
3.4.2. Lược đồ Mohammad .............................................................................. 75
3.4.3. Lược đồ Lee ........................................................................................... 76
3.4.3.1. Thuật toán nhúng tin trên véc tơ U.................................................. 76
3.4.3.2. Thuật toán khôi phục....................................................................... 77
3.4.4. Lược đồ Khodaei .................................................................................... 78
3.5. Đề xuất một lược đồ thủy vân thuận nghịch mới sử dụng phép biến đổi
mở rộng hiệu trên véc tơ điểm ảnh .......................................................... 79
3.5.1. Thuật toán nhúng tin và khôi phục véc tơ điểm ảnh bằng phương pháp
mở rộng hiệu ....................................................................................... 79
3.5.1.1. Thuật toán nhúng tin ....................................................................... 79
3.5.1.2. Thuật toán khôi phục ....................................................................... 80
3.5.1.3. Tính đúng đắn của thuật toán .......................................................... 80
3.5.2. Thuật toán nhúng tin và khôi phục bằng cách chèn bít thấp .................. 80
3.5.2.1. Thuật toán nhúng tin ....................................................................... 81
3.5.2.2. Thuật toán khôi phục ....................................................................... 81
3.5.3. Thuật toán thủy vân trên ảnh .................................................................. 82
3.5.4. Thuật toán trích dấu thủy vân và khôi phục ảnh gốc ............................. 84
3.5.5. So sánh khả năng nhúng tin và chất lượng ảnh của các lược đồ sử dụng
phép biến đổi mở rộng hiệu ................................................................ 85
3.5.5.1. Khả năng nhúng tin ......................................................................... 85
3.5.5.2. So sánh chất lượng ảnh ................................................................... 86
3.6. Đề xuất mô hình thủy vân thuận nghịch dễ vỡ khóa công khai dùng
trong xác thực tính toàn vẹn của ảnh số .................................................. 86
3.6.1. Mô hình nhúng dấu thủy vân ................................................................. 87
3.6.2. Mô hình xác thực tính toàn vẹn ............................................................. 87
3.7. Đề xuất mô hình bảo mật và xác thực dữ liệu trên đường truyền ......... 88
3.7.1. Mô hình nhúng tin mật và dấu thủy vân ................................................ 89
3.7.2. Mô hình xác thực và trích tin mật .......................................................... 90
3.8. Kết luận chương 3....................................................................................... 90
vi
CHƯƠNG 4. THỦY VÂN BỀN VỮNG KHÓA CÔNG KHAI SỬ DỤNG
KỸ THUẬT TRẢI PHỔ ............................................................ 92
4.1. Khái quát về thủy vân bền vững ............................................................... 92
4.2. Một số kết quả gần đây về thủy vân bền vững sử dụng kỹ thuật trải phổ
trên miền cosine rời rạc ............................................................................ 93
4.2.1. Lược đồ thủy vân bền vững khóa bí mật Cox ........................................ 94
4.2.2. Lược đồ thủy vân bền vững khóa bí mật Barni ..................................... 95
4.2.3. Lược đồ thủy vân bền vững khóa công khai Munir ............................... 96
4.3. Đề xuất lược đồ thủy vân bền vững khóa công khai bằng phương pháp
trải phổ trên miền cosine rời rạc .............................................................. 96
4.3.1. Phân tích tính bền vững của lược đồ Munir ........................................... 96
4.3.2. Phương pháp xây dựng khóa bí mật....................................................... 97
4.3.3. Thuật toán thủy vân ................................................................................ 98
4.3.4. Thuật toán kiểm tra dấu thủy vân ........................................................... 99
4.3.5. Đánh giá tính bền vững của các lược đồ thủy vân trên miền DCT ........ 99
4.3.5.1. Độ đo tính bền vững ...................................................................... 100
4.3.5.2. So sánh tính bền vững của lược đồ Munir và New2 ..................... 101
4.3.5.3. Đánh giá tính bền vững của lược đồ đề xuất theo tham số m ....... 104
4.3.5.4. So sánh tính bền vững thông qua thực nghiệm ............................. 104
4.4. Đề xuất lược đồ thủy vân bền vững khóa công khai bằng phương pháp
trải phổ trên miền wavelet rời rạc ......................................................... 106
4.4.1. Thuật toán thủy vân .............................................................................. 107
4.4.2. Thuật toán kiểm tra dấu thủy vân ......................................................... 107
4.5. Kết luận chương 4..................................................................................... 108
KẾT LUẬN .................................................................................................... 109
TÀI LIỆU THAM KHẢO ............................................................................... 111
DANH MỤC CÁC CÔNG TRÌNH ĐÃ CÔNG BỐ CỦA LUẬN ÁN ........ 117
vii
DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT
Ký hiệu/
Ý nghĩa
chữ viết tắt
⌊𝑎 ⌋
Giá trị phần nguyên dưới của 𝑎
⌈𝑎 ⌉
Giá trị phần nguyên trên của 𝑎
𝑏|𝑎
𝑎 chia hết cho 𝑏
𝑏⏋a
𝑎 không chia hết cho 𝑏
𝑑(𝑈)
Số phần tử (độ dài) của véc tơ U
AES
Advanced Encryption Standard (chuẩn mật mã nâng cao)
CLTT
Chang – Lin – Tseng – Tai
CTL
Chang – Tseng - Lin
DCT
Discrete Cosine Transform (biến đổi cosine rời rạc)
DE
Difference Expansion (mở rộng hiệu)
DES
Data Encryption Standard (chuẩn mật mã dữ liệu)
DWT
Discrete Wavelet Transform (biến đổi sóng nhỏ rời rạc)
IDCT
Inverse Discrete Cosine Transform (phép biến đổi DCT ngược)
IDWT
Inverse Discrete Wavelet Transform (biến đổi DWT ngược)
JPEG
Joint Photographic Experts Group (một định dạng ảnh nén)
LS
Lin - Shiu
MCU
Minimum Coded Unit (đơn vị mã tối thiểu)
NMF
Non-negative Matrix Factorization (khai triển ma trận không âm)
PSNR
Peak Signal-to-Noise Ratio (Tỉ số đỉnh tín hiệu trên nhiễu)
RSA
Rivest – Shamir – Adleman
SHA
Secure Hash Algorithm (hàm băm mật)
SVD
Singular Value Decomposition (phân tích giá trị đặc trưng)
TCP
Tseng – Chen - Pan
1
DANH MỤC CÁC BẢNG
Bảng 2.1. Độ phức tạp của thuật toán giải mã trong các sơ đồ Rabin cải tiến ........ 36
Bảng 2.2. Thời gian thực hiện thuật toán giải mã trong các sơ đồ Rabin cải tiến ... 37
Bảng 2.3. Hệ số PSNR giữa các ảnh chứa tin so với các ảnh gốc của 3 lược đồ giấu
tin trên ảnh nhị phân ................................................................................................. 48
Bảng 3.1. Kết quả tiền xử lý và nhúng tin trên khối DCT lượng tử ở Hình 3.4 của
lược đồ CLTT (k là không nhúng tin). ..................................................................... 61
Bảng 3.2. Kết quả trích tin và khôi phục ảnh gốc của lược đồ CLTT (k là không
nhúng tin) .................................................................................................................. 63
Bảng 3.3. Kết quả nhúng dãy bít dấu thủy vân trên khối DCT lượng tử ở Hình 3.4
của lược đồ đề xuất trên ảnh JPEG........................................................................... 65
Bảng 3.4. Kết quả trích dãy bít dấu thủy vân và khôi phục các dãy hệ số lượng tử
gốc của lược đồ đề xuất trên ảnh JPEG .................................................................... 66
Bảng 3.5. Kết quả khảo sát 9 đường chéo trên 10.000 khối DCT lượng tử theo lược
đồ CLTT ................................................................................................................... 67
Bảng 3.6. Kết quả khảo sát 5 đường chéo trên 10.000 khối DCT lượng tử theo lược
đồ đề xuất trên ảnh JPEG. ........................................................................................ 67
Bảng 3.7. Khả năng nhúng tin trên bộ ảnh thử nghiệm của các lược đồ giấu tin
thuận nghịch trên ảnh JPEG ..................................................................................... 71
Bảng 3.8. Kết quả thực nghiệm chất lượng ảnh của các lược đồ thủy vân thuận
nghịch trên ảnh JPEG ............................................................................................... 72
Bảng 3.9. Khả năng nhúng tin của các lược đồ thủy vân thuận nghịch sử dụng phép
biến đổi mở rộng hiệu ............................................................................................... 85
Bảng 3.10. Hệ số PSNR của các lược đồ thủy vân thuận nghịch sử dụng phép biến
đổi mở rộng hiệu ứng với độ dài dấu thủy vân khác nhau ....................................... 86
Bảng 4.1 Hệ số tương quan và PSNR của ảnh thủy vân ứng với các lược đồ thủy
vân bền vững trên miền DCT ................................................................................. 105
Bảng 4.2. Hệ số tương quan của ảnh thủy vân sau khi bị tấn công của các lược đồ
thủy vân bền vững trên miền DCT ......................................................................... 105
2
DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ
Hình 1.1. Phân loại phương pháp giấu tin ................................................................. 7
Hình 1.2. Mô hình nhúng tin..................................................................................... 8
Hình 1.3. Mô hình trích tin ....................................................................................... 8
Hình 1.4. Phân loại phương pháp thủy vân ............................................................ 13
Hình 1.5. Ma trận wavelet Haar cấp 8×8 ................................................................ 18
Hình 1.6. Sơ đồ áp dụng wavelet hai chiều ............................................................. 18
Hình 2.1. Các ảnh nhị phân dùng để nhúng tin ....................................................... 47
Hình 2.2. Dữ liệu dùng để nhúng trên các ảnh nhị phân ......................................... 47
Hình 2.3. Kết quả thực nghiệm chất lượng ảnh chứa tin có 8 màu của các lược đồ
giấu tin trên ảnh chỉ số màu ...................................................................................... 54
Hình 3.1. Sơ đồ nén ảnh JPEG chuẩn Baseline ....................................................... 58
Hình 3.2. Khối hệ số DCT ....................................................................................... 59
Hình 3.3. Bảng lượng tử của thành phần Y với tỷ lệ nén 15:1 trong PhotoShop ... 59
Hình 3.4. Một khối DCT lượng tử của ảnh Pepper ................................................. 59
Hình 3.5. Các đường chéo của khối DCT lượng tử ................................................. 60
Hình 3.6. Sơ đồ nhúng tin thuận nghịch của lược đồ LS ......................................... 64
Hình 3.7. Sự thay đổi trên khối DCT lượng tử sau khi nhúng dãy bít dấu thủy vân
của lược đồ đề xuất trên ảnh JPEG và lược đồ CLTT.............................................. 69
Hình 3.8. Bộ ảnh thử nghiệm các lược đồ nhúng tin trên ảnh JPEG ....................... 71
Hình 3.9. Bộ ảnh thử nghiệm các lược đồ thủy vân thuận nghịch sử dụng phép biến
đổi mở rộng hiệu ....................................................................................................... 85
Hình 3.10. Quá trình tạo và nhúng dấu thủy vân của mô hình thủy vân thuận nghịch
dễ vỡ khóa công khai ................................................................................................ 87
Hình 3.11. Quá trình xác thực tính toàn vẹn của lược đồ thủy vân thuận nghịch dễ
vỡ khóa công khai ..................................................................................................... 88
Hình 3.12. Quá trình nhúng tin mật và dấu thủy vân .............................................. 89
Hình 3.13. Quá trình xác thực tính toàn vẹn và trích tin mật .................................. 90
Hình 4.1. Ảnh thực nghiệm tính bền vững của lược đồ thủy vân miền DCT ....... 106
Hình 4.2. Sơ đồ áp dụng phép biến đổi wavelet hai mức. ..................................... 106
3
MỞ ĐẦU
Trong những năm đầu của thế kỷ 21, với sự phát triển của mạng Internet đã giúp
cho quá trình phân phối các sản phẩm đa phương tiện (văn bản, ảnh, âm thanh,
video) giữa những nhà cung cấp với người dùng trở nên dễ dàng, nhanh chóng. Bên
cạnh đó, vấn nạn xuyên tạc thông tin, vi phạm bản quyền trên những sản phẩm đa
phương tiện cũng ngày một gia tăng. Do vậy, nhu cầu bảo mật, xác thực tính toàn
vẹn, bảo vệ quyền tác giả đối với sản phẩm đa phương tiện trên môi trường trao đổi
công khai ngày càng cấp thiết và đòi hỏi sự an toàn cao hơn.
Một trong những phương pháp hữu hiệu trong lĩnh vực an toàn thông tin là mật
mã học. Theo đó, người gửi sẽ biến đổi dữ liệu gốc (bản rõ) thành dữ liệu mã (bản
mã) dựa trên một sơ đồ mật mã nào đó đã được thỏa thuận giữa người gửi và người
nhận. Khi có bản mã, người nhận sử dụng khóa và thuật toán giải mã tương ứng để
khôi phục lại dữ liệu gốc. Do đó, phương pháp này phù hợp với bài toán bảo mật dữ
liệu trên đường truyền công khai, nhưng lại tỏ ra có hạn chế trong việc kiểm soát
nội dung sau khi giải mã. Bởi sau khi giải mã, người dùng có thể sử dụng các
chương trình, thiết bị để chỉnh sửa, làm nhái sản phẩm gốc và tái phân phối. Vì vậy,
có thể nói phương pháp mật mã không an toàn đối với dữ liệu sau khi giải mã.
Ngoài ra, việc trao đổi bản mã trên môi trường công khai cũng gây ra sự chú ý với
các đối thủ, những người muốn biết ý nghĩa bản mã một cách bất hợp pháp.
Bên cạnh phương pháp mật mã, gần đây trong lĩnh vực an toàn thông tin xuất
hiện một hướng nghiên cứu mới đó là giấu tin (information hiding hay data hiding).
Giấu tin là phương pháp nhúng thêm một lượng thông tin (dữ liệu nhúng) vào dữ
liệu đa phương tiện (sản phẩm đa phương tiện), để tránh sự theo dõi của đối thủ,
hoặc dùng để xác định tính chân thực hoặc bảo vệ quyền tác giả đối với các sản
phẩm đa phương tiện chứa tin. Theo [31], giấu tin có thể được chia thành hai nhóm
là giấu tin mật (steganography) và thủy vân số (digital watermarking).
Đối với giấu tin mật, dữ liệu nhúng là những thông điệp mật cần trao đổi giữa
người gửi và người nhận. Việc nhúng thông tin mật vào những dữ liệu được truyền
tải phổ biến trên Internet nhằm ngụy trang cho sự tồn tại của tin mật trước các đối
thủ. Trái với giấu tin mật, dữ liệu nhúng trong các lược đồ thủy vân số (thủy vân)
dùng để bảo vệ dữ liệu chứa tin. Việc nhúng thêm thông tin (dấu thủy vân) vào các
4
sản phẩm đa phương tiện có thể làm giảm chất lượng sản phẩm nhưng nó là dấu vết
để phát hiện sự thay đổi trái phép, hoặc chứng minh quyền sở hữu các sản phẩm
chứa dấu thủy vân.
Theo [65], các lược đồ thủy vân có thể được chia thành thủy vân dễ vỡ (fragile
watermarking)
[28,43,48,55,57,61,63,65]
và thủy vân
bền
vững (robust
watermarking) [22,25,30,34,37,53,62]. Đối với thủy vân dễ vỡ, dấu thủy vân cần
phải nhạy cảm (dễ vỡ) trước sự thay đổi trái phép trên dữ liệu chứa dấu thủy vân.
Do đó, các lược đồ thủy vân dễ vỡ thường được ứng dụng trong bài toán xác định
tính chân thực (tính toàn vẹn) của dữ liệu chứa dấu thủy vân. Trái với thủy vân dễ
vỡ, thủy vân bền vững yêu cầu dấu thủy vân phải tồn tại (bền vững) trước sự tấn
công nhằm loại bỏ dấu thủy vân. Vì vậy, thủy vân bền vững được dùng trong việc
chứng minh quyền sở hữu hay bảo vệ quyền tác giả (bảo vệ bản quyền).
Theo [9,41,50], nhiều ứng dụng trong y tế, quân sự và nghệ thuật, ngoài việc xác
định tính chân thực của ảnh chứa dấu thủy vân, thì việc khôi phục lại ảnh gốc từ ảnh
chứa dấu thủy vân là yêu cầu bắt buộc. Các lược đồ thủy vân có khả năng như vậy
được gọi là thủy vân thuận nghịch (reversible). Đây là một trong những hướng
nghiên cứu mới của lĩnh vực giấu tin nói chung và thủy vân nói riêng.
Để đảm bảo sự an toàn, dữ liệu nhúng có thể được mã hóa trước khi giấu vào các
sản phẩm đa phương tiện và được giải mã ở phía người trích tin. Ngoài việc được sử
dụng để mã hóa thông tin nhúng, các hệ mật mã khóa công khai còn được dùng để
trao đổi khóa bí mật của lược đồ giấu tin, hoặc kết hợp với lược đồ giấu tin để xây
dựng lược đồ thủy vân khóa công khai [65]. Đây là hướng nghiên cứu có nhiều tiềm
năng ứng dụng và đang nhận được sự quan tâm của cộng đồng nghiên cứu.
Chính vì vậy, tác giả chọn đề tài “Kỹ thuật thủy vân và mật mã học trong xác
thực, bảo vệ bản quyền dữ liệu đa phương tiện” để thực hiện luận án Tiến sĩ của
mình. Mục đích chính của luận án là đề xuất một số lược đồ thủy vân ứng dụng
trong xác thực tính toàn vẹn và bảo vệ quyền tác giả đối với các sản phẩm đa
phương tiện nói chung và sản phẩm ảnh số nói riêng.
Các kết quả nghiên cứu được trình bày trong bốn chương của luận án, ngoài phần
mở đầu và kết luận. Cụ thể như sau:
Chương 1 - Một số kiến thức cơ sở: Chương này trình bày một số kiến thức cơ
bản được sử dụng trong luận án. Ngoài các khái niệm về giấu tin và thủy vân,
5
chương này còn nhắc lại một số khái niệm trong mật mã học và định nghĩa các phép
toán làm việc trên ma trận.
Chương 2 - Giấu tin và hệ mật mã Rabin cải tiến: Nội dung chính của chương
này đề xuất một sơ đồ Rabin mới (đã được công bố trong công trình số 1). Ngoài
khả năng xác định bản rõ duy nhất, sơ đồ Rabin mới còn có tốc độ giải mã nhanh
hơn và phạm vi ứng dụng rộng hơn so với các sơ đồ cải tiến liên quan. Ngoài nội
dung trên, chương này còn đề xuất hai lược đồ giấu tin mới trên ảnh nhị phân và
ảnh chỉ số màu (đã được công bố trong các công trình số 2 và số 3). Các kết quả đề
xuất trong chương này được dùng để xây dựng mô hình bảo mật và xác thực dữ liệu
trên đường truyền ở Chương 3.
Chương 3 - Thủy vân thuận nghịch: Chương này đề xuất hai lược đồ thủy vân
thuận nghịch mới dựa trên đặc trưng ảnh nén JPEG và phép biến đổi mở rộng hiệu
trên véc tơ điểm ảnh (đã được công bố trong các công trình số 5 và số 6). Đây là hai
lược đồ thủy vân thuộc loại dễ vỡ nên có thể được sử dụng trong bài toán xác định
tính chân thực của các sản phẩm đa phương tiện. Ngoài ra, chương này còn đề xuất
hai mô hình: thủy vân thuận nghịch dễ vỡ khóa công khai dùng trong xác thực tính
toàn vẹn sản phẩm ảnh số; bảo mật và xác thực dữ liệu trên đường truyền.
Chương 4 - Thủy vân bền vững khóa công khai sử dụng kỹ thuật trải phổ:
Nội dung chính của chương này đề xuất hai lược đồ thủy vân bền vững khóa công
khai mới trên hai miền cosine rời rạc và wavelet rời rạc (đã được công bố trong
công trình số 4). Hai lược đồ này thuộc nhóm thủy vân bền vững nên có thể được sử
dụng để bảo vệ bản quyền sản phẩm ảnh số nói riêng và sản phẩm đa phương tiện
nói chung.
Các đề xuất mới trong luận án đều được chứng minh, phân tích lý thuyết và so
sánh trên nhiều thực nghiệm. Những kết quả chính của luận án đã được công bố
trong 06 công trình và đã được trình bày Xemina tại Bộ môn Toán Tin – Viện Toán
ứng dụng và Tin học, Trường Đại học Bách khoa Hà Nội.
6
CHƯƠNG 1. MỘT SỐ KIẾN THỨC CƠ SỞ
1.1. Khái niệm về giấu tin
Mục này trình bày một số khái niệm về giấu tin, phân loại phương pháp giấu tin
và các tính chất cơ bản của một lược đồ giấu tin.
1.1.1. Định nghĩa giấu tin
Giấu tin là phương pháp nhúng một đối tượng dữ liệu số 𝐴 (dữ liệu nhúng) vào
sản phẩm đa phương tiện 𝐵 (dữ liệu môi trường) để nhận được sản phẩm đa phương
tiện 𝐶 (dữ liệu chứa tin) chứa 𝐴. Dữ liệu nhúng có thể là thông điệp mật cần trao đổi
giữa người gửi và người nhận, hoặc là những thông tin được dùng để bảo vệ dữ liệu
chứa tin.
Dựa vào mục đích sử dụng, trong [31] chia các lược đồ giấu tin thành 2 loại như
hình sau:
Giấu tin
(Information hiding)
Giấu tin mật
(Steganography)
Thủy vân số
(Digital watermarking)
Hình 1.1. Phân loại phương pháp giấu tin.
Đối với giấu tin mật, dữ liệu nhúng là những thông điệp mật cần trao đổi giữa
người gửi và người nhận. Việc nhúng thông điệp mật vào những dữ liệu được
truyền tải phổ biến trên Internet như ảnh, âm thanh, video... sẽ tránh được sự chú ý
của các đối thủ. Để đảm bảo sự an toàn, trong ứng dụng thường mã hóa thông điệp
mật trước khi nhúng vào dữ liệu đa phương tiện, và sử dụng các hệ mật mã khóa
công khai để trao đổi khóa bí mật của lược đồ giấu tin.
Trái với giấu tin mật, dữ liệu nhúng (dấu thủy vân) trong các lược đồ thủy vân số
(thủy vân) được dùng để bảo vệ dữ liệu chứa tin. Việc nhúng dấu thủy vân vào các
sản phẩm đa phương tiện sẽ làm giảm chất lượng sản phẩm nhưng nó là dấu vết để
7
xác định tính chân thực của sản phẩm, hoặc dùng để chứng minh quyền sở hữu sản
phẩm đa phương tiện chứa dấu thủy vân.
1.1.2. Mô hình giấu tin
Một lược đồ giấu tin gồm hai quá trình nhúng tin và trích tin. Quá trình nhúng tin
được thực hiện ở phía người gửi, thủ tục trích tin thực hiện bên phía người nhận.
Dựa vào các tài liệu [23,28,43,45,48,49,50,64] ta có thể mô hình hóa quá trình
nhúng tin như sau:
Khóa
Dữ liệu môi trường
(Dữ liệu gốc)
Thuật toán nhúng tin
Dữ liệu chứa tin
Dữ liệu nhúng
Hình 1.2. Mô hình nhúng tin.
Trên Hình 1.2, ngoài dữ liệu nhúng và dữ liệu môi trường, thuật toán nhúng tin
thường được trang bị các khóa nhằm nâng cao sự an toàn cho hệ thống. Vì trong
ứng dụng thường phải công khai nội dung lược đồ giấu tin. Do đó, việc sử dụng hệ
thống khóa trong phương pháp giấu tin sẽ chỉ cho phép những người dùng hợp lệ
(những người biết khóa) mới có khả năng trích tin. Sau khi nhúng tin, dữ liệu chứa
tin được trao đổi trên các kênh truyền công khai. Thủ tục trích tin ở phía người nhận
thực hiện như sau:
Khóa
Dữ liệu gốc
Dữ liệu chứa tin
Thuật toán trích tin
Dữ liệu nhúng
Hình 1.3. Mô hình trích tin.
8
Với những người dùng hợp lệ, ngoài việc trích được dữ liệu đã nhúng (dữ liệu
trích) một số lược đồ giấu tin còn có khả năng khôi phục lại dữ liệu gốc. Các lược
đồ có khả năng như vậy được gọi là giấu tin thuận nghịch (reversible data hiding).
1.1.3. Các tính chất của một lược đồ giấu tin
Theo [31], phương pháp giấu tin có một số tính chất cơ bản như: khả năng nhúng
tin, tính che giấu (tính ẩn) và tính bảo mật.
1.1.3.1. Khả năng nhúng tin
Khả năng nhúng tin của một lược đồ là số bít dữ liệu có thể nhúng được trên một
đơn vị dữ liệu môi trường. Lược đồ nào nhúng được nhiều dữ liệu hơn thì có khả
năng nhúng tin cao hơn và ngược lại. Khả năng nhúng tin là một trong những tính
chất quan trọng của phương pháp giấu tin.
1.1.3.2. Tính che giấu
Như luận án đã đề cập, giấu tin là phương pháp nhúng đối tượng 𝐴 vào đối tượng
𝐵 để nhận được đối tượng 𝐶. Khi nhúng 𝐴 vào 𝐵, các lược đồ giấu tin thường phải
biến đổi 𝐵 theo một qui tắc nào đó để nhận được 𝐶. Do vậy, giữa 𝐶 và 𝐵 thường có
một sự sai khác nhất định. Sự sai khác này có thể được phát hiện bằng các chương
trình, hoặc bằng hệ thống thị giác đối với dữ liệu dạng hình ảnh, hoặc bằng hệ thống
thính giác đối với dữ liệu âm thanh. Lược đồ có tính che giấu càng cao thì càng khó
phát hiện. Nói cách khác, sự sai khác giữa dữ liệu gốc và dữ liệu chứa tin càng ít thì
tính che giấu càng cao.
Theo [31], đối với dữ liệu hình ảnh, tính che giấu của phương pháp giấu tin có
thể được đánh giá thông qua chất lượng ảnh chứa tin so với ảnh gốc bằng hệ số
PSNR (Peak Signal-to-Noise Ratio). Lược đồ nào có giá trị PSNR càng lớn thì chất
lượng ảnh càng cao (tính che giấu càng cao). Hệ số PSNR giữa ảnh chứa tin 𝐼′ so
với ảnh gốc 𝐼 kích thước 𝑚 × 𝑛 được tính theo công thức:
𝑀𝐴𝑋
)
𝑃𝑆𝑁𝑅 = 20𝑙𝑜𝑔10 (
√𝑀𝑆𝐸
Trong đó, MAX là giá trị cực đại của điểm ảnh và sai số bình phương trung bình
MSE xác định như sau:
9
𝑚
𝑛
1
∑ ∑[𝐼(𝑖, 𝑗) − 𝐼′ (𝑖, 𝑗)]2
𝑀𝑆𝐸 =
𝑚𝑛
𝑖=1 𝑗=1
và giá trị PSNR tính theo đơn vị decibel (dB).
Đối với một lược đồ giấu tin, khả năng nhúng tin và tính che giấu có quan hệ mật
thiết với nhau. Đối với một lược đồ, khi tăng dữ liệu nhúng thì thường làm giảm
chất lượng ảnh chứa tin. Do vậy, tùy thuộc vào từng trường hợp, các lược đồ giấu
tin đưa ra những giải pháp khác nhau nhằm cân bằng hai tính chất này.
1.1.3.3. Tính bảo mật
Giống như các hệ mật mã, nội dung của lược đồ giấu tin thường được công khai
khi ứng dụng. Do đó, sự an toàn của phương pháp giấu tin phụ thuộc vào hệ thống
khóa dùng trong các thuật toán nhúng tin và trích tin. Khi đó, tính bảo mật của một
lược đồ giấu tin là độ khó của bài toán thám khóa. Lược đồ nào có số tổ hợp khóa
càng lớn thì tính bảo mật càng cao.
Ngoài hệ thống khóa của lược đồ giấu tin, dữ liệu nhúng có thể được mã hóa
bằng một sơ đồ mật mã nào đó trước khi nhúng vào dữ liệu đa phương tiện. Khi đó,
tính an toàn của hệ thống sẽ được nâng cao.
1.1.4. Một số hướng tiếp cận của phương pháp giấu tin
Giấu tin trên dữ liệu đa phương tiện có ba hướng tiếp cận chính là: miền quan sát
(miền không gian, miền thời gian) [4,12,13,19,23,47], miền biến đổi [8,22,30,37,51,
53,62] và miền dữ liệu nén [11,16,18,39].
Đối với miền quan sát, các lược đồ thường biến đổi trực tiếp trên các giá trị của
dữ liệu đa phương tiện theo một quy luật nào đó để nhúng dữ liệu. Đây là hướng
tiếp cận tự nhiên, bởi khi nói đến giấu tin người ta thường nghĩ ngay đến việc thay
đổi trực tiếp các giá trị của dữ liệu. Một phương pháp phổ biến của hướng tiếp cận
này là tác động lên những bít ít quan trọng (bít thấp) của dữ liệu [59]. Các lược đồ
giấu tin trên miền quan sát có ưu điểm là thực hiện nhanh và có thể lựa chọn những
vị trí dữ liệu phù hợp để biến đổi nhằm tăng tính che giấu. Tuy nhiên, dữ liệu nhúng
khó có thể bền vững trước các phép biến đổi thông dụng như: nén không bảo toàn
dữ liệu, nhiễu đường truyền, lọc, lấy lại mẫu (resample)... Điều này là dễ hiểu vì các
10
biến đổi nói trên cũng loại bỏ hoặc làm sai lệch giá trị các bít ít quan trọng của dữ
liệu đa phương tiện.
Để nâng cao tính bền vững, các lược đồ giấu tin thường biến đổi dữ liệu đa
phương tiện từ miền quan sát sang một miền biểu diễn mới (miền biến đổi), và lựa
chọn những đặc trưng thích hợp để nhúng tin, sau đó dùng phép biến đổi ngược
tương ứng để chuyển dữ liệu từ miền biến đổi về miền quan sát. Một số phép biến
đổi thường được sử dụng trong các lược đồ thủy vân như: DCT (Discrete Cosine
Transform) [21], DWT (Discrete Wavelet Transform) [21], NMF (Non-negative
Matrix Factorization) [58], SVD (Singular Value Decomposition) [21] và phép biến
đổi QR [8]. Tuy các phép biến đổi này thực hiện theo cách thức khác nhau nhưng có
chung tính chất: năng lượng của dữ liệu đa phương tiện sau khi biến đổi thường tập
trung vào một số phần tử (vùng tập trung năng lượng) trên miền biến đổi. Do vậy,
nếu dữ liệu được nhúng vào vùng tập trung năng lượng thì tính bền vững sẽ được
cải thiện hơn.
Với mục đích giảm không gian lưu trữ và tăng tốc độ truyền tải, dữ liệu hình ảnh
và âm thanh thường được lưu trữ dưới dạng dữ liệu nén (miền dữ liệu nén). Do vậy
các lược đồ giấu tin trên miền dữ liệu này cần phải giải nén trước khi nhúng dữ liệu,
và thực hiện nén sau khi nhúng dữ liệu. Ngoài những chiến lược như miền quan sát
và miền biến đổi, các lược đồ giấu tin trên miền dữ liệu nén còn khai thác các tính
chất, đặc trưng của phép nén để tăng cường tính bền vững và cải thiện chất lượng
dữ liệu chứa tin. Theo [21], một số phép nén thường được sử dụng đối với dữ liệu
đa phương tiện như: cosine rời rạc, wavelet (sóng nhỏ) rời rạc, Run-length (độ dài
thay đổi), Huffman và mã hóa số học [1].
1.2. Một số khái niệm về thủy vân trên dữ liệu đa phương tiện
1.2.1. Dữ liệu đa phương tiện
Dữ liệu đa phương tiện là những dạng dữ liệu như: văn bản (text), ảnh số (image)
âm thanh (audio) và video. Khi nói đến dữ liệu đa phương tiện, người ta thường
quan tâm đến các tệp ảnh số, âm thanh và video.
1.2.1.1. Ảnh số
Trên phương diện toán học, ảnh số (ảnh tĩnh) được xem như các ma trận số
nguyên. Như vậy, ảnh hai màu (nhị phân) được xem như một ma trận nhị phân, ảnh
11
đa cấp xám ứng với một ma trận nguyên có giá trị thuộc [0, 255] và ảnh màu (true
color) được biểu diễn bởi 3 ma trận nguyên ứng với các thành phần màu 𝑅, 𝐺, 𝐵.
Giá trị các điểm ảnh được lưu trữ theo hai hình thức bảo toàn hoặc không bảo
toàn (nén không bảo toàn). Đối với hình thức lưu trữ bảo toàn (không nén hoặc nén
bảo toàn), thì từ tệp dữ liệu ảnh ta có thể khôi phục chính xác ảnh gốc (ảnh trước
khi lưu trữ). Một số định dạng tệp ảnh lưu trữ theo hình thức bảo toàn như DIB,
BMP, TIFF và PCX. Trái với hình thức lưu trữ bảo toàn, ta chỉ khôi phục được ảnh
gần đúng so với ảnh gốc từ những tệp lưu trữ theo hình thức không bảo toàn. Lưu
trữ không bảo toàn thường sử dụng qui trình nén JPEG, qui trình này được trình bày
ở mục 3.2.1.
Như vậy, giấu tin trên ảnh thực chất là nhúng dãy bít vào ma trận số nguyên. Do
đó, một phương pháp thực hiện tốt trên ma trận nhị phân thì có thể phát triển và ứng
dụng trên ma trận nguyên có giá trị thuộc [0, 255]. Nói cách khác, một thuật toán
giấu tin tốt trên ảnh nhị phân thì thực hiện tốt trên ảnh đa cấp xám hoặc ảnh màu.
1.2.1.2. Âm thanh
Theo [21], âm thanh số (âm thanh) được lấy mẫu từ tín hiệu liên tục một chiều.
Như vậy, dữ liệu âm thanh (các mẫu âm thanh) là một dãy số nguyên và cũng được
lưu trữ theo hai hình thức bảo toàn hoặc không bảo toàn giống như ảnh số. Một số
chuẩn lưu trữ dữ liệu âm thanh thông dụng như: WAV, AIFF, WMA, MP3. Trong
đó, các định dạng WAV, AIFF, WMA lưu trữ theo hình thức bảo toàn. Chuẩn MP3
sử dụng phương pháp nén không bảo toàn dữ liệu.
Như vậy, giấu tin trên âm thanh thực chất là phương pháp nhúng một dãy bít vào
một dãy số. Do đó, các phương pháp giấu tin tốt trên ảnh số thì hoàn toàn có thể
phát triển và ứng dụng đối với dữ liệu âm thanh. Bởi, ta có thể dễ dàng chuyển một
dãy số thành ma trận và ngược lại.
1.2.1.3. Video
Video là sự kết hợp giữa âm thanh và ảnh động. Ảnh động là một dãy liên tiếp
nhiều ảnh tĩnh (các frame). Để mắt người không nhận biết được sự rời rạc giữa các
ảnh tĩnh, chuẩn video yêu cầu hiển thị tối thiểu 24 frame/s. Do đó, số lượng ảnh tĩnh
của tệp video là khá lớn. Vì vậy, các chuẩn video thường sử dụng nén không bảo
toàn để giảm không gian lưu trữ.
12
Theo [21], dữ liệu video có sự dư thừa trên hai miền không gian (spatial domain)
và thời gian (time domain). Sự dư thừa trên miền không gian thể hiện qua sự tương
tự về giá trị giữa các điểm ảnh của một frame. Trong khi, dư thừa trên miền thời
gian biểu hiện qua sự tương tự giữa các frame liên tiếp. Trong thực tế, sự sai khác
giữa hai frame liên tiếp là khá nhỏ. Nên sự dư thừa trên miền thời gian là khá lớn.
Với mỗi nhóm frame liên tiếp (Group Of Pictures - GOP), chuẩn MPEG xét 3
dạng frame, ký hiệu 𝐼, 𝐵 và 𝑃. Trong đó, 𝐼 là frame đầu tiên của GOP; 𝑃 là các
frame được suy luận từ 𝐼; 𝐵 là những frame được suy luận từ 𝐼 và 𝑃. Theo chuẩn
MPEG [21], các frame dạng 𝐼 được nén độc lập như ảnh JPEG, các frame dạng 𝑃 và
𝐵 được nén theo phương pháp ước lượng chuyển động (motion estimation). Trong
khi chuẩn AVI coi các frame của GOP đều thuộc dạng frame 𝐼 và nén như ảnh
JPEG. Do đó, các phương pháp giấu tin trên ảnh JPEG đều có thể phát triển và ứng
dụng trên dữ liệu video [30,31].
Như vậy, một phương pháp giấu tin nói chung và thủy vân nói riêng nếu thực
hiện tốt trên ảnh số thì hoàn toàn có thể phát triển, ứng dụng trên dữ liệu âm thanh
và video. Do đó, trong luận án tập trung nghiên cứu, đề xuất các phương pháp giấu
tin, thủy vân trên sản phẩm ảnh số.
1.2.2. Phân loại phương pháp thủy vân
Theo [65], các lược đồ thủy vân có thể được chia thành hai nhóm như hình sau:
Thủy vân
(Watermarking)
Thủy vân bền vững
(Robust watermarking)
Thủy vân dễ vỡ
(Fragile watermarking)
Hình 1.4. Phân loại phương pháp thủy vân.
Ngoài cách phân loại như trên, dựa vào việc dấu thủy vân hiển thị (hiện) hay
không hiển thị (ẩn) trên sản phẩm đa phương tiện, người ta còn chia các lược đồ
thành thủy vân hiện (visible watermarking) và thủy vân ẩn (invisible
watermarking). Trong luận án chỉ tập trung nghiên cứu các lược đồ thủy vân ẩn và
sử dụng cách phân loại như Hình 1.4.
13
- Xem thêm -