Đăng ký Đăng nhập
Trang chủ Kỹ thuật thủy vân và mật mã học trong xác thực, bảo vệ bản quyền dữ liệu đa phươ...

Tài liệu Kỹ thuật thủy vân và mật mã học trong xác thực, bảo vệ bản quyền dữ liệu đa phương tiện

.PDF
124
187
98

Mô tả:

LỜI CAM ĐOAN Tôi xin cam đoan đây là công trình nghiên cứu của riêng tôi. Các số liệu, kết quả nêu trong luận án là trung thực và chưa từng được ai công bố trong các công trình nào khác. Hà Nội, ngày Tập thể hướng dẫn GS.TSKH. Lê Hùng Sơn tháng năm 2015 Nghiên cứu sinh PGS.TS. Phạm Văn Ất i Đỗ Văn Tuấn LỜI CẢM ƠN Luận án này được thực hiện tại Trường Đại học Bách khoa Hà Nội dưới sự hướng dẫn của GS.TSKH. Lê Hùng Sơn và PGS.TS. Phạm Văn Ất. Nghiên cứu sinh xin gửi lời cảm ơn sâu sắc đến các thầy về sự giúp đỡ, chỉ dẫn tận tình trong quá trình nghiên cứu. Các thầy là tấm gương sáng cho tôi trong nghiên cứu chuyên môn cũng như trong cuộc sống. Nghiên cứu sinh xin gửi lời cảm ơn đến các thầy giáo, cô giáo ở Viện Toán ứng dụng và Tin học; các thầy giáo, cô giáo ở Viện Đào tạo Sau đại học Trường Đại học Bách khoa Hà Nội đã tạo điều kiện thuận lợi và giúp đỡ nghiên cứu sinh trong thời gian học tập tại Trường. Tôi cũng xin gửi lời cảm ơn tới lãnh đạo nhà trường, các đồng nghiệp tại Khoa Công nghệ thông tin Trường Cao đẳng Thương mại và Du lịch Hà Nội đã tạo điều kiện thuận lợi trong quá trình tôi vừa làm nghiên cứu sinh vừa công tác tại Trường. Cuối cùng tác giả xin bày tỏ lòng biết ơn đến gia đình và bạn bè đã động viên, giúp đỡ về tinh thần, thời gian để tác giả hoàn thành luận án. Hà Nội, ngày tháng Nghiên cứu sinh Đỗ Văn Tuấn ii năm 2015 MỤC LỤC DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT ........................................ 1 DANH MỤC CÁC BẢNG ................................................................................... 2 DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ ............................................................ 3 MỞ ĐẦU ........................................................................................................ 4 CHƯƠNG 1. MỘT SỐ KIẾN THỨC CƠ SỞ ................................................... 7 1.1. Khái niệm về giấu tin ................................................................................... 7 1.1.1. Định nghĩa giấu tin ................................................................................... 7 1.1.2. Mô hình giấu tin ....................................................................................... 8 1.1.3. Các tính chất của một lược đồ giấu tin .................................................... 9 1.1.3.1. Khả năng nhúng tin ........................................................................... 9 1.1.3.2. Tính che giấu ..................................................................................... 9 1.1.3.3. Tính bảo mật ................................................................................... 10 1.1.4. Một số hướng tiếp cận của phương pháp giấu tin .................................. 10 1.2. Một số khái niệm về thủy vân trên dữ liệu đa phương tiện .................... 11 1.2.1. Dữ liệu đa phương tiện ........................................................................... 11 1.2.1.1. Ảnh số ............................................................................................. 11 1.2.1.2. Âm thanh ......................................................................................... 12 1.2.1.3. Video ............................................................................................... 12 1.2.2. Phân loại phương pháp thủy vân ............................................................ 13 1.2.2.1. Thủy vân bền vững.......................................................................... 14 1.2.2.2. Thủy vân dễ vỡ ................................................................................ 14 1.3. Một số phép biến đổi dữ liệu ..................................................................... 15 1.3.1. Phép biến đổi cosine rời rạc ................................................................... 15 1.3.1.1. Phép biến đổi cosine rời rạc một chiều ........................................... 15 1.3.1.2. Phép biến đổi cosine rời rạc hai chiều ............................................ 16 1.3.2. Phép biến đổi wavelet rời rạc ................................................................. 17 1.4. Một số khái niệm trong mật mã ................................................................ 18 1.4.1. Số nguyên tố và thuật toán kiểm tra số nguyên tố ................................. 19 1.4.2. Ký hiệu Legendre ................................................................................... 21 iii 1.4.3. Ký hiệu Jacobi ........................................................................................ 21 1.4.4. Định lý đồng dư Trung Hoa ................................................................... 21 1.4.5. Hệ mật mã Rabin .................................................................................... 22 1.5. Một số phép toán trên ma trận nguyên .................................................... 23 1.6. Kết luận chương 1....................................................................................... 24 CHƯƠNG 2. GIẤU TIN VÀ HỆ MẬT MÃ RABIN CẢI TIẾN ................... 25 2.1. Bảo mật dữ liệu bằng sự kết hợp giữa giấu tin và mật mã ..................... 25 2.2. Một số kết quả gần đây về các sơ đồ Rabin cải tiến ................................ 26 2.2.1. Sơ đồ Shimada ....................................................................................... 26 2.2.1.1. Thuật toán mã hóa ........................................................................... 26 2.2.1.2. Thuật toán giải mã ........................................................................... 27 2.2.2. Sơ đồ Chen-Tsu...................................................................................... 28 2.3. Đề xuất một sơ đồ Rabin mới .................................................................... 28 2.3.1. Phương trình Rabin ................................................................................ 29 2.3.2. Thuật toán mã hóa .................................................................................. 31 2.3.3. Thuật toán giải mã .................................................................................. 31 2.3.4. Xét ví dụ minh họa sơ đồ Rabin đề xuất ................................................ 32 2.3.5. Chứng minh tính đúng đắn của sơ đồ Rabin đề xuất ............................. 34 2.3.6. Phân tích các sơ đồ cải tiến hệ mật mã Rabin ........................................ 34 2.3.6.1. Độ phức tạp tính toán ...................................................................... 35 2.3.6.2. Phạm vi ứng dụng ........................................................................... 36 2.3.6.3. Thực nghiệm ................................................................................... 36 2.4. Giấu tin trên ảnh nhị phân ........................................................................ 37 2.4.1. Lược đồ giấu tin TCP ............................................................................. 38 2.4.1.1. Thuật toán nhúng tin ....................................................................... 38 2.4.1.2. Thuật toán trích tin .......................................................................... 39 2.4.2. Lược đồ giấu tin CTL............................................................................. 39 2.4.2.1. Thuật toán nhúng tin ....................................................................... 40 2.4.2.2. Thuật toán trích tin .......................................................................... 40 2.4.2.3. Chính xác hóa lược đồ CTL ............................................................ 41 2.5. Đề xuất một lược đồ giấu tin mới trên ảnh nhị phân .............................. 42 iv 2.5.1. Thuật toán nhúng dãy bít trên một khối điểm ảnh ................................. 42 2.5.2. Thuật toán trích dãy bít trên một khối điểm ảnh .................................... 43 2.5.3. Chứng minh tính đúng đắn của thuật toán nhúng dãy bít trên một khối điểm ảnh .............................................................................................. 44 2.5.4. Lược đồ giấu tin trên ảnh nhị phân ........................................................ 45 2.5.5. Phân tích tính bảo mật của các lược đồ giấu tin trên ảnh nhị phân ....... 46 2.5.6. So sánh chất lượng ảnh của các lược đồ giấu tin trên ảnh nhị phân ...... 47 2.6. Đề xuất một lược đồ giấu tin mới trên ảnh chỉ số màu ........................... 48 2.6.1. Thuật toán nhúng tin .............................................................................. 50 2.6.2. Thuật toán trích tin ................................................................................. 51 2.6.3. Chứng minh tính đúng đắn của lược đồ đề xuất .................................... 52 2.6.4. So sánh chất lượng ảnh chứa tin của các lược đồ trên ảnh chỉ số màu .. 53 2.7. Kết luận chương 2....................................................................................... 54 CHƯƠNG 3. THỦY VÂN THUẬN NGHỊCH ................................................ 56 3.1. Sơ lược về thủy vân thuận nghịch ............................................................. 56 3.2. Một số kết quả gần đây về thủy vân thuận nghịch trên ảnh JPEG ....... 57 3.2.1. Qui trình nén ảnh JPEG ......................................................................... 57 3.2.2. Lược đồ nhúng tin thuận nghịch CLTT ................................................. 60 3.2.2.1. Thuật toán nhúng tin ....................................................................... 60 3.2.2.2. Thuật toán trích tin .......................................................................... 62 3.2.2.3. Thuật toán khôi phục ảnh gốc ......................................................... 62 3.2.3. Lược đồ nhúng tin thuận nghịch LS ...................................................... 64 3.3. Đề xuất lược đồ thủy vân thuận nghịch mới trên ảnh JPEG ................. 64 3.3.1. Thuật toán nhúng dấu thủy vân .............................................................. 64 3.3.2. Thuật toán trích dấu thủy vân và khôi phục ảnh gốc ............................. 65 3.3.3. Phân tích khả năng nhúng tin và chất lượng ảnh thủy vân .................... 67 3.3.3.1. Phân tích khả năng nhúng tin .......................................................... 68 3.3.3.2. Phân tích sự thay đổi của khối DCT lượng tử................................. 68 3.3.3.3. Phân tích chất lượng ảnh ................................................................. 69 3.3.3.4. Thực nghiệm ................................................................................... 70 v 3.4. Một số kết quả gần đây về thủy vân thuận nghịch dựa trên phép biến đổi mở rộng hiệu đối với véc tơ điểm ảnh ............................................... 73 3.4.1. Lược đồ Alattar ...................................................................................... 74 3.4.2. Lược đồ Mohammad .............................................................................. 75 3.4.3. Lược đồ Lee ........................................................................................... 76 3.4.3.1. Thuật toán nhúng tin trên véc tơ U.................................................. 76 3.4.3.2. Thuật toán khôi phục....................................................................... 77 3.4.4. Lược đồ Khodaei .................................................................................... 78 3.5. Đề xuất một lược đồ thủy vân thuận nghịch mới sử dụng phép biến đổi mở rộng hiệu trên véc tơ điểm ảnh .......................................................... 79 3.5.1. Thuật toán nhúng tin và khôi phục véc tơ điểm ảnh bằng phương pháp mở rộng hiệu ....................................................................................... 79 3.5.1.1. Thuật toán nhúng tin ....................................................................... 79 3.5.1.2. Thuật toán khôi phục ....................................................................... 80 3.5.1.3. Tính đúng đắn của thuật toán .......................................................... 80 3.5.2. Thuật toán nhúng tin và khôi phục bằng cách chèn bít thấp .................. 80 3.5.2.1. Thuật toán nhúng tin ....................................................................... 81 3.5.2.2. Thuật toán khôi phục ....................................................................... 81 3.5.3. Thuật toán thủy vân trên ảnh .................................................................. 82 3.5.4. Thuật toán trích dấu thủy vân và khôi phục ảnh gốc ............................. 84 3.5.5. So sánh khả năng nhúng tin và chất lượng ảnh của các lược đồ sử dụng phép biến đổi mở rộng hiệu ................................................................ 85 3.5.5.1. Khả năng nhúng tin ......................................................................... 85 3.5.5.2. So sánh chất lượng ảnh ................................................................... 86 3.6. Đề xuất mô hình thủy vân thuận nghịch dễ vỡ khóa công khai dùng trong xác thực tính toàn vẹn của ảnh số .................................................. 86 3.6.1. Mô hình nhúng dấu thủy vân ................................................................. 87 3.6.2. Mô hình xác thực tính toàn vẹn ............................................................. 87 3.7. Đề xuất mô hình bảo mật và xác thực dữ liệu trên đường truyền ......... 88 3.7.1. Mô hình nhúng tin mật và dấu thủy vân ................................................ 89 3.7.2. Mô hình xác thực và trích tin mật .......................................................... 90 3.8. Kết luận chương 3....................................................................................... 90 vi CHƯƠNG 4. THỦY VÂN BỀN VỮNG KHÓA CÔNG KHAI SỬ DỤNG KỸ THUẬT TRẢI PHỔ ............................................................ 92 4.1. Khái quát về thủy vân bền vững ............................................................... 92 4.2. Một số kết quả gần đây về thủy vân bền vững sử dụng kỹ thuật trải phổ trên miền cosine rời rạc ............................................................................ 93 4.2.1. Lược đồ thủy vân bền vững khóa bí mật Cox ........................................ 94 4.2.2. Lược đồ thủy vân bền vững khóa bí mật Barni ..................................... 95 4.2.3. Lược đồ thủy vân bền vững khóa công khai Munir ............................... 96 4.3. Đề xuất lược đồ thủy vân bền vững khóa công khai bằng phương pháp trải phổ trên miền cosine rời rạc .............................................................. 96 4.3.1. Phân tích tính bền vững của lược đồ Munir ........................................... 96 4.3.2. Phương pháp xây dựng khóa bí mật....................................................... 97 4.3.3. Thuật toán thủy vân ................................................................................ 98 4.3.4. Thuật toán kiểm tra dấu thủy vân ........................................................... 99 4.3.5. Đánh giá tính bền vững của các lược đồ thủy vân trên miền DCT ........ 99 4.3.5.1. Độ đo tính bền vững ...................................................................... 100 4.3.5.2. So sánh tính bền vững của lược đồ Munir và New2 ..................... 101 4.3.5.3. Đánh giá tính bền vững của lược đồ đề xuất theo tham số m ....... 104 4.3.5.4. So sánh tính bền vững thông qua thực nghiệm ............................. 104 4.4. Đề xuất lược đồ thủy vân bền vững khóa công khai bằng phương pháp trải phổ trên miền wavelet rời rạc ......................................................... 106 4.4.1. Thuật toán thủy vân .............................................................................. 107 4.4.2. Thuật toán kiểm tra dấu thủy vân ......................................................... 107 4.5. Kết luận chương 4..................................................................................... 108 KẾT LUẬN .................................................................................................... 109 TÀI LIỆU THAM KHẢO ............................................................................... 111 DANH MỤC CÁC CÔNG TRÌNH ĐÃ CÔNG BỐ CỦA LUẬN ÁN ........ 117 vii DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT Ký hiệu/ Ý nghĩa chữ viết tắt ⌊𝑎 ⌋ Giá trị phần nguyên dưới của 𝑎 ⌈𝑎 ⌉ Giá trị phần nguyên trên của 𝑎 𝑏|𝑎 𝑎 chia hết cho 𝑏 𝑏⏋a 𝑎 không chia hết cho 𝑏 𝑑(𝑈) Số phần tử (độ dài) của véc tơ U AES Advanced Encryption Standard (chuẩn mật mã nâng cao) CLTT Chang – Lin – Tseng – Tai CTL Chang – Tseng - Lin DCT Discrete Cosine Transform (biến đổi cosine rời rạc) DE Difference Expansion (mở rộng hiệu) DES Data Encryption Standard (chuẩn mật mã dữ liệu) DWT Discrete Wavelet Transform (biến đổi sóng nhỏ rời rạc) IDCT Inverse Discrete Cosine Transform (phép biến đổi DCT ngược) IDWT Inverse Discrete Wavelet Transform (biến đổi DWT ngược) JPEG Joint Photographic Experts Group (một định dạng ảnh nén) LS Lin - Shiu MCU Minimum Coded Unit (đơn vị mã tối thiểu) NMF Non-negative Matrix Factorization (khai triển ma trận không âm) PSNR Peak Signal-to-Noise Ratio (Tỉ số đỉnh tín hiệu trên nhiễu) RSA Rivest – Shamir – Adleman SHA Secure Hash Algorithm (hàm băm mật) SVD Singular Value Decomposition (phân tích giá trị đặc trưng) TCP Tseng – Chen - Pan 1 DANH MỤC CÁC BẢNG Bảng 2.1. Độ phức tạp của thuật toán giải mã trong các sơ đồ Rabin cải tiến ........ 36 Bảng 2.2. Thời gian thực hiện thuật toán giải mã trong các sơ đồ Rabin cải tiến ... 37 Bảng 2.3. Hệ số PSNR giữa các ảnh chứa tin so với các ảnh gốc của 3 lược đồ giấu tin trên ảnh nhị phân ................................................................................................. 48 Bảng 3.1. Kết quả tiền xử lý và nhúng tin trên khối DCT lượng tử ở Hình 3.4 của lược đồ CLTT (k là không nhúng tin). ..................................................................... 61 Bảng 3.2. Kết quả trích tin và khôi phục ảnh gốc của lược đồ CLTT (k là không nhúng tin) .................................................................................................................. 63 Bảng 3.3. Kết quả nhúng dãy bít dấu thủy vân trên khối DCT lượng tử ở Hình 3.4 của lược đồ đề xuất trên ảnh JPEG........................................................................... 65 Bảng 3.4. Kết quả trích dãy bít dấu thủy vân và khôi phục các dãy hệ số lượng tử gốc của lược đồ đề xuất trên ảnh JPEG .................................................................... 66 Bảng 3.5. Kết quả khảo sát 9 đường chéo trên 10.000 khối DCT lượng tử theo lược đồ CLTT ................................................................................................................... 67 Bảng 3.6. Kết quả khảo sát 5 đường chéo trên 10.000 khối DCT lượng tử theo lược đồ đề xuất trên ảnh JPEG. ........................................................................................ 67 Bảng 3.7. Khả năng nhúng tin trên bộ ảnh thử nghiệm của các lược đồ giấu tin thuận nghịch trên ảnh JPEG ..................................................................................... 71 Bảng 3.8. Kết quả thực nghiệm chất lượng ảnh của các lược đồ thủy vân thuận nghịch trên ảnh JPEG ............................................................................................... 72 Bảng 3.9. Khả năng nhúng tin của các lược đồ thủy vân thuận nghịch sử dụng phép biến đổi mở rộng hiệu ............................................................................................... 85 Bảng 3.10. Hệ số PSNR của các lược đồ thủy vân thuận nghịch sử dụng phép biến đổi mở rộng hiệu ứng với độ dài dấu thủy vân khác nhau ....................................... 86 Bảng 4.1 Hệ số tương quan và PSNR của ảnh thủy vân ứng với các lược đồ thủy vân bền vững trên miền DCT ................................................................................. 105 Bảng 4.2. Hệ số tương quan của ảnh thủy vân sau khi bị tấn công của các lược đồ thủy vân bền vững trên miền DCT ......................................................................... 105 2 DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ Hình 1.1. Phân loại phương pháp giấu tin ................................................................. 7 Hình 1.2. Mô hình nhúng tin..................................................................................... 8 Hình 1.3. Mô hình trích tin ....................................................................................... 8 Hình 1.4. Phân loại phương pháp thủy vân ............................................................ 13 Hình 1.5. Ma trận wavelet Haar cấp 8×8 ................................................................ 18 Hình 1.6. Sơ đồ áp dụng wavelet hai chiều ............................................................. 18 Hình 2.1. Các ảnh nhị phân dùng để nhúng tin ....................................................... 47 Hình 2.2. Dữ liệu dùng để nhúng trên các ảnh nhị phân ......................................... 47 Hình 2.3. Kết quả thực nghiệm chất lượng ảnh chứa tin có 8 màu của các lược đồ giấu tin trên ảnh chỉ số màu ...................................................................................... 54 Hình 3.1. Sơ đồ nén ảnh JPEG chuẩn Baseline ....................................................... 58 Hình 3.2. Khối hệ số DCT ....................................................................................... 59 Hình 3.3. Bảng lượng tử của thành phần Y với tỷ lệ nén 15:1 trong PhotoShop ... 59 Hình 3.4. Một khối DCT lượng tử của ảnh Pepper ................................................. 59 Hình 3.5. Các đường chéo của khối DCT lượng tử ................................................. 60 Hình 3.6. Sơ đồ nhúng tin thuận nghịch của lược đồ LS ......................................... 64 Hình 3.7. Sự thay đổi trên khối DCT lượng tử sau khi nhúng dãy bít dấu thủy vân của lược đồ đề xuất trên ảnh JPEG và lược đồ CLTT.............................................. 69 Hình 3.8. Bộ ảnh thử nghiệm các lược đồ nhúng tin trên ảnh JPEG ....................... 71 Hình 3.9. Bộ ảnh thử nghiệm các lược đồ thủy vân thuận nghịch sử dụng phép biến đổi mở rộng hiệu ....................................................................................................... 85 Hình 3.10. Quá trình tạo và nhúng dấu thủy vân của mô hình thủy vân thuận nghịch dễ vỡ khóa công khai ................................................................................................ 87 Hình 3.11. Quá trình xác thực tính toàn vẹn của lược đồ thủy vân thuận nghịch dễ vỡ khóa công khai ..................................................................................................... 88 Hình 3.12. Quá trình nhúng tin mật và dấu thủy vân .............................................. 89 Hình 3.13. Quá trình xác thực tính toàn vẹn và trích tin mật .................................. 90 Hình 4.1. Ảnh thực nghiệm tính bền vững của lược đồ thủy vân miền DCT ....... 106 Hình 4.2. Sơ đồ áp dụng phép biến đổi wavelet hai mức. ..................................... 106 3 MỞ ĐẦU Trong những năm đầu của thế kỷ 21, với sự phát triển của mạng Internet đã giúp cho quá trình phân phối các sản phẩm đa phương tiện (văn bản, ảnh, âm thanh, video) giữa những nhà cung cấp với người dùng trở nên dễ dàng, nhanh chóng. Bên cạnh đó, vấn nạn xuyên tạc thông tin, vi phạm bản quyền trên những sản phẩm đa phương tiện cũng ngày một gia tăng. Do vậy, nhu cầu bảo mật, xác thực tính toàn vẹn, bảo vệ quyền tác giả đối với sản phẩm đa phương tiện trên môi trường trao đổi công khai ngày càng cấp thiết và đòi hỏi sự an toàn cao hơn. Một trong những phương pháp hữu hiệu trong lĩnh vực an toàn thông tin là mật mã học. Theo đó, người gửi sẽ biến đổi dữ liệu gốc (bản rõ) thành dữ liệu mã (bản mã) dựa trên một sơ đồ mật mã nào đó đã được thỏa thuận giữa người gửi và người nhận. Khi có bản mã, người nhận sử dụng khóa và thuật toán giải mã tương ứng để khôi phục lại dữ liệu gốc. Do đó, phương pháp này phù hợp với bài toán bảo mật dữ liệu trên đường truyền công khai, nhưng lại tỏ ra có hạn chế trong việc kiểm soát nội dung sau khi giải mã. Bởi sau khi giải mã, người dùng có thể sử dụng các chương trình, thiết bị để chỉnh sửa, làm nhái sản phẩm gốc và tái phân phối. Vì vậy, có thể nói phương pháp mật mã không an toàn đối với dữ liệu sau khi giải mã. Ngoài ra, việc trao đổi bản mã trên môi trường công khai cũng gây ra sự chú ý với các đối thủ, những người muốn biết ý nghĩa bản mã một cách bất hợp pháp. Bên cạnh phương pháp mật mã, gần đây trong lĩnh vực an toàn thông tin xuất hiện một hướng nghiên cứu mới đó là giấu tin (information hiding hay data hiding). Giấu tin là phương pháp nhúng thêm một lượng thông tin (dữ liệu nhúng) vào dữ liệu đa phương tiện (sản phẩm đa phương tiện), để tránh sự theo dõi của đối thủ, hoặc dùng để xác định tính chân thực hoặc bảo vệ quyền tác giả đối với các sản phẩm đa phương tiện chứa tin. Theo [31], giấu tin có thể được chia thành hai nhóm là giấu tin mật (steganography) và thủy vân số (digital watermarking). Đối với giấu tin mật, dữ liệu nhúng là những thông điệp mật cần trao đổi giữa người gửi và người nhận. Việc nhúng thông tin mật vào những dữ liệu được truyền tải phổ biến trên Internet nhằm ngụy trang cho sự tồn tại của tin mật trước các đối thủ. Trái với giấu tin mật, dữ liệu nhúng trong các lược đồ thủy vân số (thủy vân) dùng để bảo vệ dữ liệu chứa tin. Việc nhúng thêm thông tin (dấu thủy vân) vào các 4 sản phẩm đa phương tiện có thể làm giảm chất lượng sản phẩm nhưng nó là dấu vết để phát hiện sự thay đổi trái phép, hoặc chứng minh quyền sở hữu các sản phẩm chứa dấu thủy vân. Theo [65], các lược đồ thủy vân có thể được chia thành thủy vân dễ vỡ (fragile watermarking) [28,43,48,55,57,61,63,65] và thủy vân bền vững (robust watermarking) [22,25,30,34,37,53,62]. Đối với thủy vân dễ vỡ, dấu thủy vân cần phải nhạy cảm (dễ vỡ) trước sự thay đổi trái phép trên dữ liệu chứa dấu thủy vân. Do đó, các lược đồ thủy vân dễ vỡ thường được ứng dụng trong bài toán xác định tính chân thực (tính toàn vẹn) của dữ liệu chứa dấu thủy vân. Trái với thủy vân dễ vỡ, thủy vân bền vững yêu cầu dấu thủy vân phải tồn tại (bền vững) trước sự tấn công nhằm loại bỏ dấu thủy vân. Vì vậy, thủy vân bền vững được dùng trong việc chứng minh quyền sở hữu hay bảo vệ quyền tác giả (bảo vệ bản quyền). Theo [9,41,50], nhiều ứng dụng trong y tế, quân sự và nghệ thuật, ngoài việc xác định tính chân thực của ảnh chứa dấu thủy vân, thì việc khôi phục lại ảnh gốc từ ảnh chứa dấu thủy vân là yêu cầu bắt buộc. Các lược đồ thủy vân có khả năng như vậy được gọi là thủy vân thuận nghịch (reversible). Đây là một trong những hướng nghiên cứu mới của lĩnh vực giấu tin nói chung và thủy vân nói riêng. Để đảm bảo sự an toàn, dữ liệu nhúng có thể được mã hóa trước khi giấu vào các sản phẩm đa phương tiện và được giải mã ở phía người trích tin. Ngoài việc được sử dụng để mã hóa thông tin nhúng, các hệ mật mã khóa công khai còn được dùng để trao đổi khóa bí mật của lược đồ giấu tin, hoặc kết hợp với lược đồ giấu tin để xây dựng lược đồ thủy vân khóa công khai [65]. Đây là hướng nghiên cứu có nhiều tiềm năng ứng dụng và đang nhận được sự quan tâm của cộng đồng nghiên cứu. Chính vì vậy, tác giả chọn đề tài “Kỹ thuật thủy vân và mật mã học trong xác thực, bảo vệ bản quyền dữ liệu đa phương tiện” để thực hiện luận án Tiến sĩ của mình. Mục đích chính của luận án là đề xuất một số lược đồ thủy vân ứng dụng trong xác thực tính toàn vẹn và bảo vệ quyền tác giả đối với các sản phẩm đa phương tiện nói chung và sản phẩm ảnh số nói riêng. Các kết quả nghiên cứu được trình bày trong bốn chương của luận án, ngoài phần mở đầu và kết luận. Cụ thể như sau: Chương 1 - Một số kiến thức cơ sở: Chương này trình bày một số kiến thức cơ bản được sử dụng trong luận án. Ngoài các khái niệm về giấu tin và thủy vân, 5 chương này còn nhắc lại một số khái niệm trong mật mã học và định nghĩa các phép toán làm việc trên ma trận. Chương 2 - Giấu tin và hệ mật mã Rabin cải tiến: Nội dung chính của chương này đề xuất một sơ đồ Rabin mới (đã được công bố trong công trình số 1). Ngoài khả năng xác định bản rõ duy nhất, sơ đồ Rabin mới còn có tốc độ giải mã nhanh hơn và phạm vi ứng dụng rộng hơn so với các sơ đồ cải tiến liên quan. Ngoài nội dung trên, chương này còn đề xuất hai lược đồ giấu tin mới trên ảnh nhị phân và ảnh chỉ số màu (đã được công bố trong các công trình số 2 và số 3). Các kết quả đề xuất trong chương này được dùng để xây dựng mô hình bảo mật và xác thực dữ liệu trên đường truyền ở Chương 3. Chương 3 - Thủy vân thuận nghịch: Chương này đề xuất hai lược đồ thủy vân thuận nghịch mới dựa trên đặc trưng ảnh nén JPEG và phép biến đổi mở rộng hiệu trên véc tơ điểm ảnh (đã được công bố trong các công trình số 5 và số 6). Đây là hai lược đồ thủy vân thuộc loại dễ vỡ nên có thể được sử dụng trong bài toán xác định tính chân thực của các sản phẩm đa phương tiện. Ngoài ra, chương này còn đề xuất hai mô hình: thủy vân thuận nghịch dễ vỡ khóa công khai dùng trong xác thực tính toàn vẹn sản phẩm ảnh số; bảo mật và xác thực dữ liệu trên đường truyền. Chương 4 - Thủy vân bền vững khóa công khai sử dụng kỹ thuật trải phổ: Nội dung chính của chương này đề xuất hai lược đồ thủy vân bền vững khóa công khai mới trên hai miền cosine rời rạc và wavelet rời rạc (đã được công bố trong công trình số 4). Hai lược đồ này thuộc nhóm thủy vân bền vững nên có thể được sử dụng để bảo vệ bản quyền sản phẩm ảnh số nói riêng và sản phẩm đa phương tiện nói chung. Các đề xuất mới trong luận án đều được chứng minh, phân tích lý thuyết và so sánh trên nhiều thực nghiệm. Những kết quả chính của luận án đã được công bố trong 06 công trình và đã được trình bày Xemina tại Bộ môn Toán Tin – Viện Toán ứng dụng và Tin học, Trường Đại học Bách khoa Hà Nội. 6 CHƯƠNG 1. MỘT SỐ KIẾN THỨC CƠ SỞ 1.1. Khái niệm về giấu tin Mục này trình bày một số khái niệm về giấu tin, phân loại phương pháp giấu tin và các tính chất cơ bản của một lược đồ giấu tin. 1.1.1. Định nghĩa giấu tin Giấu tin là phương pháp nhúng một đối tượng dữ liệu số 𝐴 (dữ liệu nhúng) vào sản phẩm đa phương tiện 𝐵 (dữ liệu môi trường) để nhận được sản phẩm đa phương tiện 𝐶 (dữ liệu chứa tin) chứa 𝐴. Dữ liệu nhúng có thể là thông điệp mật cần trao đổi giữa người gửi và người nhận, hoặc là những thông tin được dùng để bảo vệ dữ liệu chứa tin. Dựa vào mục đích sử dụng, trong [31] chia các lược đồ giấu tin thành 2 loại như hình sau: Giấu tin (Information hiding) Giấu tin mật (Steganography) Thủy vân số (Digital watermarking) Hình 1.1. Phân loại phương pháp giấu tin. Đối với giấu tin mật, dữ liệu nhúng là những thông điệp mật cần trao đổi giữa người gửi và người nhận. Việc nhúng thông điệp mật vào những dữ liệu được truyền tải phổ biến trên Internet như ảnh, âm thanh, video... sẽ tránh được sự chú ý của các đối thủ. Để đảm bảo sự an toàn, trong ứng dụng thường mã hóa thông điệp mật trước khi nhúng vào dữ liệu đa phương tiện, và sử dụng các hệ mật mã khóa công khai để trao đổi khóa bí mật của lược đồ giấu tin. Trái với giấu tin mật, dữ liệu nhúng (dấu thủy vân) trong các lược đồ thủy vân số (thủy vân) được dùng để bảo vệ dữ liệu chứa tin. Việc nhúng dấu thủy vân vào các sản phẩm đa phương tiện sẽ làm giảm chất lượng sản phẩm nhưng nó là dấu vết để 7 xác định tính chân thực của sản phẩm, hoặc dùng để chứng minh quyền sở hữu sản phẩm đa phương tiện chứa dấu thủy vân. 1.1.2. Mô hình giấu tin Một lược đồ giấu tin gồm hai quá trình nhúng tin và trích tin. Quá trình nhúng tin được thực hiện ở phía người gửi, thủ tục trích tin thực hiện bên phía người nhận. Dựa vào các tài liệu [23,28,43,45,48,49,50,64] ta có thể mô hình hóa quá trình nhúng tin như sau: Khóa Dữ liệu môi trường (Dữ liệu gốc) Thuật toán nhúng tin Dữ liệu chứa tin Dữ liệu nhúng Hình 1.2. Mô hình nhúng tin. Trên Hình 1.2, ngoài dữ liệu nhúng và dữ liệu môi trường, thuật toán nhúng tin thường được trang bị các khóa nhằm nâng cao sự an toàn cho hệ thống. Vì trong ứng dụng thường phải công khai nội dung lược đồ giấu tin. Do đó, việc sử dụng hệ thống khóa trong phương pháp giấu tin sẽ chỉ cho phép những người dùng hợp lệ (những người biết khóa) mới có khả năng trích tin. Sau khi nhúng tin, dữ liệu chứa tin được trao đổi trên các kênh truyền công khai. Thủ tục trích tin ở phía người nhận thực hiện như sau: Khóa Dữ liệu gốc Dữ liệu chứa tin Thuật toán trích tin Dữ liệu nhúng Hình 1.3. Mô hình trích tin. 8 Với những người dùng hợp lệ, ngoài việc trích được dữ liệu đã nhúng (dữ liệu trích) một số lược đồ giấu tin còn có khả năng khôi phục lại dữ liệu gốc. Các lược đồ có khả năng như vậy được gọi là giấu tin thuận nghịch (reversible data hiding). 1.1.3. Các tính chất của một lược đồ giấu tin Theo [31], phương pháp giấu tin có một số tính chất cơ bản như: khả năng nhúng tin, tính che giấu (tính ẩn) và tính bảo mật. 1.1.3.1. Khả năng nhúng tin Khả năng nhúng tin của một lược đồ là số bít dữ liệu có thể nhúng được trên một đơn vị dữ liệu môi trường. Lược đồ nào nhúng được nhiều dữ liệu hơn thì có khả năng nhúng tin cao hơn và ngược lại. Khả năng nhúng tin là một trong những tính chất quan trọng của phương pháp giấu tin. 1.1.3.2. Tính che giấu Như luận án đã đề cập, giấu tin là phương pháp nhúng đối tượng 𝐴 vào đối tượng 𝐵 để nhận được đối tượng 𝐶. Khi nhúng 𝐴 vào 𝐵, các lược đồ giấu tin thường phải biến đổi 𝐵 theo một qui tắc nào đó để nhận được 𝐶. Do vậy, giữa 𝐶 và 𝐵 thường có một sự sai khác nhất định. Sự sai khác này có thể được phát hiện bằng các chương trình, hoặc bằng hệ thống thị giác đối với dữ liệu dạng hình ảnh, hoặc bằng hệ thống thính giác đối với dữ liệu âm thanh. Lược đồ có tính che giấu càng cao thì càng khó phát hiện. Nói cách khác, sự sai khác giữa dữ liệu gốc và dữ liệu chứa tin càng ít thì tính che giấu càng cao. Theo [31], đối với dữ liệu hình ảnh, tính che giấu của phương pháp giấu tin có thể được đánh giá thông qua chất lượng ảnh chứa tin so với ảnh gốc bằng hệ số PSNR (Peak Signal-to-Noise Ratio). Lược đồ nào có giá trị PSNR càng lớn thì chất lượng ảnh càng cao (tính che giấu càng cao). Hệ số PSNR giữa ảnh chứa tin 𝐼′ so với ảnh gốc 𝐼 kích thước 𝑚 × 𝑛 được tính theo công thức: 𝑀𝐴𝑋 ) 𝑃𝑆𝑁𝑅 = 20𝑙𝑜𝑔10 ( √𝑀𝑆𝐸 Trong đó, MAX là giá trị cực đại của điểm ảnh và sai số bình phương trung bình MSE xác định như sau: 9 𝑚 𝑛 1 ∑ ∑[𝐼(𝑖, 𝑗) − 𝐼′ (𝑖, 𝑗)]2 𝑀𝑆𝐸 = 𝑚𝑛 𝑖=1 𝑗=1 và giá trị PSNR tính theo đơn vị decibel (dB). Đối với một lược đồ giấu tin, khả năng nhúng tin và tính che giấu có quan hệ mật thiết với nhau. Đối với một lược đồ, khi tăng dữ liệu nhúng thì thường làm giảm chất lượng ảnh chứa tin. Do vậy, tùy thuộc vào từng trường hợp, các lược đồ giấu tin đưa ra những giải pháp khác nhau nhằm cân bằng hai tính chất này. 1.1.3.3. Tính bảo mật Giống như các hệ mật mã, nội dung của lược đồ giấu tin thường được công khai khi ứng dụng. Do đó, sự an toàn của phương pháp giấu tin phụ thuộc vào hệ thống khóa dùng trong các thuật toán nhúng tin và trích tin. Khi đó, tính bảo mật của một lược đồ giấu tin là độ khó của bài toán thám khóa. Lược đồ nào có số tổ hợp khóa càng lớn thì tính bảo mật càng cao. Ngoài hệ thống khóa của lược đồ giấu tin, dữ liệu nhúng có thể được mã hóa bằng một sơ đồ mật mã nào đó trước khi nhúng vào dữ liệu đa phương tiện. Khi đó, tính an toàn của hệ thống sẽ được nâng cao. 1.1.4. Một số hướng tiếp cận của phương pháp giấu tin Giấu tin trên dữ liệu đa phương tiện có ba hướng tiếp cận chính là: miền quan sát (miền không gian, miền thời gian) [4,12,13,19,23,47], miền biến đổi [8,22,30,37,51, 53,62] và miền dữ liệu nén [11,16,18,39]. Đối với miền quan sát, các lược đồ thường biến đổi trực tiếp trên các giá trị của dữ liệu đa phương tiện theo một quy luật nào đó để nhúng dữ liệu. Đây là hướng tiếp cận tự nhiên, bởi khi nói đến giấu tin người ta thường nghĩ ngay đến việc thay đổi trực tiếp các giá trị của dữ liệu. Một phương pháp phổ biến của hướng tiếp cận này là tác động lên những bít ít quan trọng (bít thấp) của dữ liệu [59]. Các lược đồ giấu tin trên miền quan sát có ưu điểm là thực hiện nhanh và có thể lựa chọn những vị trí dữ liệu phù hợp để biến đổi nhằm tăng tính che giấu. Tuy nhiên, dữ liệu nhúng khó có thể bền vững trước các phép biến đổi thông dụng như: nén không bảo toàn dữ liệu, nhiễu đường truyền, lọc, lấy lại mẫu (resample)... Điều này là dễ hiểu vì các 10 biến đổi nói trên cũng loại bỏ hoặc làm sai lệch giá trị các bít ít quan trọng của dữ liệu đa phương tiện. Để nâng cao tính bền vững, các lược đồ giấu tin thường biến đổi dữ liệu đa phương tiện từ miền quan sát sang một miền biểu diễn mới (miền biến đổi), và lựa chọn những đặc trưng thích hợp để nhúng tin, sau đó dùng phép biến đổi ngược tương ứng để chuyển dữ liệu từ miền biến đổi về miền quan sát. Một số phép biến đổi thường được sử dụng trong các lược đồ thủy vân như: DCT (Discrete Cosine Transform) [21], DWT (Discrete Wavelet Transform) [21], NMF (Non-negative Matrix Factorization) [58], SVD (Singular Value Decomposition) [21] và phép biến đổi QR [8]. Tuy các phép biến đổi này thực hiện theo cách thức khác nhau nhưng có chung tính chất: năng lượng của dữ liệu đa phương tiện sau khi biến đổi thường tập trung vào một số phần tử (vùng tập trung năng lượng) trên miền biến đổi. Do vậy, nếu dữ liệu được nhúng vào vùng tập trung năng lượng thì tính bền vững sẽ được cải thiện hơn. Với mục đích giảm không gian lưu trữ và tăng tốc độ truyền tải, dữ liệu hình ảnh và âm thanh thường được lưu trữ dưới dạng dữ liệu nén (miền dữ liệu nén). Do vậy các lược đồ giấu tin trên miền dữ liệu này cần phải giải nén trước khi nhúng dữ liệu, và thực hiện nén sau khi nhúng dữ liệu. Ngoài những chiến lược như miền quan sát và miền biến đổi, các lược đồ giấu tin trên miền dữ liệu nén còn khai thác các tính chất, đặc trưng của phép nén để tăng cường tính bền vững và cải thiện chất lượng dữ liệu chứa tin. Theo [21], một số phép nén thường được sử dụng đối với dữ liệu đa phương tiện như: cosine rời rạc, wavelet (sóng nhỏ) rời rạc, Run-length (độ dài thay đổi), Huffman và mã hóa số học [1]. 1.2. Một số khái niệm về thủy vân trên dữ liệu đa phương tiện 1.2.1. Dữ liệu đa phương tiện Dữ liệu đa phương tiện là những dạng dữ liệu như: văn bản (text), ảnh số (image) âm thanh (audio) và video. Khi nói đến dữ liệu đa phương tiện, người ta thường quan tâm đến các tệp ảnh số, âm thanh và video. 1.2.1.1. Ảnh số Trên phương diện toán học, ảnh số (ảnh tĩnh) được xem như các ma trận số nguyên. Như vậy, ảnh hai màu (nhị phân) được xem như một ma trận nhị phân, ảnh 11 đa cấp xám ứng với một ma trận nguyên có giá trị thuộc [0, 255] và ảnh màu (true color) được biểu diễn bởi 3 ma trận nguyên ứng với các thành phần màu 𝑅, 𝐺, 𝐵. Giá trị các điểm ảnh được lưu trữ theo hai hình thức bảo toàn hoặc không bảo toàn (nén không bảo toàn). Đối với hình thức lưu trữ bảo toàn (không nén hoặc nén bảo toàn), thì từ tệp dữ liệu ảnh ta có thể khôi phục chính xác ảnh gốc (ảnh trước khi lưu trữ). Một số định dạng tệp ảnh lưu trữ theo hình thức bảo toàn như DIB, BMP, TIFF và PCX. Trái với hình thức lưu trữ bảo toàn, ta chỉ khôi phục được ảnh gần đúng so với ảnh gốc từ những tệp lưu trữ theo hình thức không bảo toàn. Lưu trữ không bảo toàn thường sử dụng qui trình nén JPEG, qui trình này được trình bày ở mục 3.2.1. Như vậy, giấu tin trên ảnh thực chất là nhúng dãy bít vào ma trận số nguyên. Do đó, một phương pháp thực hiện tốt trên ma trận nhị phân thì có thể phát triển và ứng dụng trên ma trận nguyên có giá trị thuộc [0, 255]. Nói cách khác, một thuật toán giấu tin tốt trên ảnh nhị phân thì thực hiện tốt trên ảnh đa cấp xám hoặc ảnh màu. 1.2.1.2. Âm thanh Theo [21], âm thanh số (âm thanh) được lấy mẫu từ tín hiệu liên tục một chiều. Như vậy, dữ liệu âm thanh (các mẫu âm thanh) là một dãy số nguyên và cũng được lưu trữ theo hai hình thức bảo toàn hoặc không bảo toàn giống như ảnh số. Một số chuẩn lưu trữ dữ liệu âm thanh thông dụng như: WAV, AIFF, WMA, MP3. Trong đó, các định dạng WAV, AIFF, WMA lưu trữ theo hình thức bảo toàn. Chuẩn MP3 sử dụng phương pháp nén không bảo toàn dữ liệu. Như vậy, giấu tin trên âm thanh thực chất là phương pháp nhúng một dãy bít vào một dãy số. Do đó, các phương pháp giấu tin tốt trên ảnh số thì hoàn toàn có thể phát triển và ứng dụng đối với dữ liệu âm thanh. Bởi, ta có thể dễ dàng chuyển một dãy số thành ma trận và ngược lại. 1.2.1.3. Video Video là sự kết hợp giữa âm thanh và ảnh động. Ảnh động là một dãy liên tiếp nhiều ảnh tĩnh (các frame). Để mắt người không nhận biết được sự rời rạc giữa các ảnh tĩnh, chuẩn video yêu cầu hiển thị tối thiểu 24 frame/s. Do đó, số lượng ảnh tĩnh của tệp video là khá lớn. Vì vậy, các chuẩn video thường sử dụng nén không bảo toàn để giảm không gian lưu trữ. 12 Theo [21], dữ liệu video có sự dư thừa trên hai miền không gian (spatial domain) và thời gian (time domain). Sự dư thừa trên miền không gian thể hiện qua sự tương tự về giá trị giữa các điểm ảnh của một frame. Trong khi, dư thừa trên miền thời gian biểu hiện qua sự tương tự giữa các frame liên tiếp. Trong thực tế, sự sai khác giữa hai frame liên tiếp là khá nhỏ. Nên sự dư thừa trên miền thời gian là khá lớn. Với mỗi nhóm frame liên tiếp (Group Of Pictures - GOP), chuẩn MPEG xét 3 dạng frame, ký hiệu 𝐼, 𝐵 và 𝑃. Trong đó, 𝐼 là frame đầu tiên của GOP; 𝑃 là các frame được suy luận từ 𝐼; 𝐵 là những frame được suy luận từ 𝐼 và 𝑃. Theo chuẩn MPEG [21], các frame dạng 𝐼 được nén độc lập như ảnh JPEG, các frame dạng 𝑃 và 𝐵 được nén theo phương pháp ước lượng chuyển động (motion estimation). Trong khi chuẩn AVI coi các frame của GOP đều thuộc dạng frame 𝐼 và nén như ảnh JPEG. Do đó, các phương pháp giấu tin trên ảnh JPEG đều có thể phát triển và ứng dụng trên dữ liệu video [30,31]. Như vậy, một phương pháp giấu tin nói chung và thủy vân nói riêng nếu thực hiện tốt trên ảnh số thì hoàn toàn có thể phát triển, ứng dụng trên dữ liệu âm thanh và video. Do đó, trong luận án tập trung nghiên cứu, đề xuất các phương pháp giấu tin, thủy vân trên sản phẩm ảnh số. 1.2.2. Phân loại phương pháp thủy vân Theo [65], các lược đồ thủy vân có thể được chia thành hai nhóm như hình sau: Thủy vân (Watermarking) Thủy vân bền vững (Robust watermarking) Thủy vân dễ vỡ (Fragile watermarking) Hình 1.4. Phân loại phương pháp thủy vân. Ngoài cách phân loại như trên, dựa vào việc dấu thủy vân hiển thị (hiện) hay không hiển thị (ẩn) trên sản phẩm đa phương tiện, người ta còn chia các lược đồ thành thủy vân hiện (visible watermarking) và thủy vân ẩn (invisible watermarking). Trong luận án chỉ tập trung nghiên cứu các lược đồ thủy vân ẩn và sử dụng cách phân loại như Hình 1.4. 13
- Xem thêm -

Tài liệu liên quan

Tài liệu xem nhiều nhất