Tìm hiểu phương pháp thủy vân số thuận nghịch và xây dựng ứng dụng

  • Số trang: 59 |
  • Loại file: PDF |
  • Lượt xem: 37 |
  • Lượt tải: 1
nhattuvisu

Đã đăng 26946 tài liệu

Mô tả:

ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ PHẠM CÔNG HÒA TÌM HIỂU PHƯƠNG PHÁP THỦY VÂN SỐ THUẬN NGHỊCH VÀ XÂY DỰNG ỨNG DỤNG LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN Hà Nội - 2012 1 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ PHẠM CÔNG HÒA TÌM HIỂU PHƯƠNG PHÁP THỦY VÂN SỐ THUẬN NGHỊCH VÀ XÂY DỰNG ỨNG DỤNG Ngành: Chuyên ngành: Mã số: Công nghệ thông tin Hệ thống thông tin 60 48 05 LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS. TS. NGÔ QUỐC TẠO Hà Nội - 2012 2 MỤC LỤC LỜI CAM ĐOAN ........................................................................................................... 4 DANH MỤC CHỮ VIẾT TẮT ....................................................................................... 5 DANH MỤC CÁC BẢNG VÀ HÌNH VẼ ...................................................................... 6 MỞ ĐẦU ........................................................................................................................ 8 CHƢƠNG 1: TỔNG QUAN VỀ KỸ THUẬT GIẤU TIN VÀ THỦY VÂN SỐ .......... 10 1.1. Kỹ thuật giấu tin trong phƣơng tiện số ................................................................ 10 1.1.1. Khái niệm giấu tin và lý thuyết cơ sở ........................................................... 10 1.1.2. Phân loại các kỹ thuật giấu tin ...................................................................... 11 1.1.3. Mô hình kỹ thuật giấu tin ............................................................................. 11 1.1.4. Giấu tin trong dữ liệu đa phƣơng tiện ........................................................... 12 1.1.4.1. Giấu tin trong ảnh số ............................................................................. 12 1.1.4.2. Giấu tin trong Audio .............................................................................. 14 1.1.4.3. Giấu tin trong Video .............................................................................. 15 1.1.4.4. Giấu tin trong văn bản ........................................................................... 15 1.2. Kỹ thuật thủy vân số ........................................................................................... 16 1.2.1. Lịch sử phƣơng pháp thủy vân số ................................................................. 16 1.2.2. Mô hình thủy vân số .................................................................................... 17 1.2.3. Các tính chất quan trọng của kỹ thuật thủy vân số ........................................ 18 1.2.4. Hệ thống thủy vân số ................................................................................... 19 1.2.4.1. Quá trình nhúng thủy vân ...................................................................... 19 1.2.4.2. Quá trình trích thủy vân ......................................................................... 20 1.2.5. Các hƣớng ứng dụng của thủy vân ............................................................... 20 1.3. Phân biệt giữa giấu tin và thủy vân ..................................................................... 22 CHƢƠNG 2: THỦY VÂN THUẬN NGHỊCH TRÊN ẢNH SỐ ................................... 23 2.1. Thủy vân số thuận nghịch ................................................................................... 23 2.2. Thủy vân số trên miền không gian ...................................................................... 24 2.2.1. Cơ sở lý thuyết............................................................................................. 24 2.2.2. Một số thuật toán ......................................................................................... 25 2.2.2.1. Thuật toán 1(SW) .................................................................................. 25 2.2.2.2. Thuật toán 2 (Wu-Lee) .......................................................................... 27 2.2.2.3. Thuật toán 3 (PCT) ................................................................................ 30 2.2.2.4. Thuật toán 4 (LSB) ................................................................................ 33 3 2.3. Thủy vân số trên miền tần số .............................................................................. 35 2.3.1. Biến đổi cosin rời rạc (DCT) ........................................................................ 35 2.3.2. Kỹ thuật thủy vân trên miền DCT ................................................................ 37 2.3.2.1. Thuật toán DCT 1 .................................................................................. 38 2.3.2.2. Thuật toán DCT 2 .................................................................................. 39 2.3.2.3. Thuật toán DCT 3.................................................................................. 41 2.4. Thủy vân số trên miền Wavelet .......................................................................... 43 2.4.1. Phép biến đổi DWT ..................................................................................... 43 2.4.2. Các thuật toán thủy vân trên miền DWT ...................................................... 45 2.4.2.1. Thuật toán DWT-1 ................................................................................ 45 2.4.2.2. Thuật toán DWT-2 ................................................................................ 46 CHƢƠNG 3: XÂY DỰNG CHƢƠNG TRÌNH THỬ NGHIỆM ................................... 48 3.1. Phát biểu bài toán ............................................................................................... 48 3.2. Phân tích và thiết kế hệ thống ............................................................................. 48 3.2.1. Mô tả chức năng hệ thống ............................................................................ 48 3.2.2. Ứng dụng thử nghiệm .................................................................................. 52 3.2.3. Đánh giá độ phức tạp và các tấn công trên ảnh ............................................. 55 KẾT LUẬN .................................................................................................................. 57 TÀI LIỆU THAM KHẢO............................................................................................. 58 5 DANH MỤC CHỮ VIẾT TẮT CHỮ VIẾT TẮT CP Ý NGHĨA Bảo vệ bản quyền tác giả (CopyRight Protection) CWT Biến đổi wavelet liên tục (Continuous Wavelet Transform) DCT Biến đổi Cosine rời rạc (Discrete Cosine Transform) iDCT Biến đổi Cosine rời rạc nghịch (Discrete Cosine Transform) DFT Biến đổi Fourier rời rạc (Discrete Fourier Transform) DWT Biến đổi sóng nhỏ rời rạc (Discrete Wavelet Transform) iDWT Biến đổi sóng nhỏ rời rạc ngƣợc (Inverse Discrete Wavelet Transform) JPEG Chuẩn nén ảnh của ủy ban JPEG quố tế (Joint Photographic Experts Group) LSB Bít quan trọng nhất (Least Significant Bit) PCT Thuật toán thủy vân đặt theo tên 3 tác giả Hsiang-Kuang Pan, Yu-YuanChen và Yu-chee Tseng SW Thuật toán thủy vân đơn giản (Simple Watermarking) Wu-Lee Thuật toán thủy vân đặt theo tên 2 tác giả M.Y.Wu và J.H.Lee 6 DANH MỤC CÁC BẢNG VÀ HÌNH VẼ 1. Danh mục bảng: Bảng 1.1: Ví dụ bảng các hệ số DCT ......................................................... 35 Bảng 1.2: Minh họa thuật toán DCT3 ........................................................ 41 2. Danh mục hình vẽ: Hình 1.1: Quá trình chèn (giấu) tin và tách tin ........................................... 11 Hình 1.2: Sơ đồ phân loại kỹ thuật giấu tin của A.P Pentitcolas 1999 theo hai hƣớng nghiên cứu chính là giấu tin mật và thủy vân số. ............................................................................ 15 Hình 1.3: Ví dụ về thủy vân ẩn và thủy vân hiện........................................ 16 Hình 1.4: Mô hình thủy vân do Sviatoslav Voloshynovskiy và các cộng sự đề xuất ..................................................................... 16 Hình 1.5: Sơ đồ hệ thống thủy vân số ........................................................ 19 Hình 2.1: Mô hình thủy vân thuận nghịch .................................................. 22 Hình 2.2: Minh họa thuật toán 1(SW): nhúng bit 1 vào khối ảnh B ............ 25 Hình 2.3: Minh họa chọn điểm ảnh giấu tin vào những khối ảnh một màu ..................................................................................... 26 Hình 2.4: Minh họa thuật toán Wu-Le: nhúng đoạn bit 011 ...................... 27 Hình 2.5. Minh họa thuật toán 3 (TCP) ...................................................... 31 Hình 2.6: Minh họa thuật toán 4 (LSB) ...................................................... 33 Hình 2.7. Phân chia 3 miền tần số thấp giữa, cao của phép biến đổi DCT ..................................................................................... 35 Hình 2.8. Quy trình nhúng và tách thủy vân theo kỹ thủy vân trên miền DCT .................................................................................. 36 Hình 2.9. Sự khác nhau giữa sóng (a) và sóng nhỏ (b) ............................... 42 Hình 3.1. Sơ đồ chức năng hệ thống .......................................................... 48 7 Hình 3.2: Giao diện khi mở ảnh gốc .......................................................... 51 Hình 3.3: Giao diện ghi lại ảnh đã thủy vân ............................................... 52 Hình 3.4: Giao diện mở ảnh đã thủy vân .................................................... 53 Hình 3.5: Giao diện ghi ảnh đã trích thủy vân ............................................ 54 8 MỞ ĐẦU 1. Lý do chọn đề tài Trong kỷ nguyên số, thông tin số đƣợc sử dụng rộng rãi trong một môi trƣờng mở: tài nguyên đƣợc phân phối cho nhiều ngƣời sử dụng, nhu cầu đƣợc bảo vệ bản quyền và sở hữu trí tuệ các sản phẩm số đã trở thành một vấn đề quan trọng và đƣợc nhiều cơ sở nghiên cứu quan tâm. Thuỷ vấn số hay nhúng thuỷ vân trong một phƣơng tiện là một công nghệ mới đƣợc đánh giá mang lại nhiều hứa hẹn trong ứng dụng bảo vệ bản quyền, phát hiện xuyên tạc, điều khiển truy cập đối với các dữ liệu đa phƣơng tiện. Bằng cách sử dụng thủy vân, dữ liệu số sẽ bảo vệ khỏi sự sao chép bất hợp pháp. Tạo thuỷ vân là một phƣơng pháp nhúng một lƣợng thông tin nào đó vào trong dữ liệu đa phƣơng tiện cần đƣợc bảo vệ sở hữu mà không để lại ảnh hƣởng nào đến chất lƣợng của sản phẩm. Thuỷ vân phải tồn tại bền vững với sản phẩm số và không thể loại bỏ bằng bất kì những tấn công có chủ đích hay không chủ đích nào trừ khi phá hủy sản phẩm. Thủy vân luôn gắn kết với dữ liệu số. Bằng trực quan thì khó có thể phát hiện đƣợc thủy vân trong dữ liệu chứa nhƣng ta có thể tách đƣợc chúng bằng các chƣơng trình có cài đặt thuật toán thủy vân. Thủy vân tách đƣợc từ dữ liệu số chính là bằng chứng kết luận dữ liệu số có bị xuyên tạc thông tin hay vi phạm bản quyền không. Thủy vân thuận nghịch sử dụng một phƣơng pháp biến đổi trực giao nào đó, chẳng hạn nhƣ Cosine rời rạc, hay Fourier… để chuyển miền không gian ảnh sang miền tần số. Thuỷ vân sẽ đƣợc nhúng trong miền không gian tần số của ảnh theo kĩ thuật trải phổ trong truyền thông. Sau khi trích rút thông tin thủy vân thì vật mang tin (sản phẩm số) vẫn đảm bảo đƣợc chất lƣợng gần nhƣ ban đầu. Đây là kĩ thuật phổ biến với nhiều thuật toán và đƣợc hứa hẹn là một phƣơng pháp tốt giải quyết vấn đề đảm bảo hai thuộc tính quan trọng của thuỷ vân sau khi giấu – đó là tính ẩn và tính bền vững. Dựa vào ý tƣởng trên, tôi chọn đề tài “Tìm hiểu phƣơng pháp thủy vân số thuận nghịch và xây dựng ứng dụng” làm nội dung nghiên cứu cho luận văn tốt nghiệp của mình. 2. Mục đích của luận văn Mục đích của luận văn là nghiên cứu hệ thống lý thuyết liên quan đến giấu tin trong đó tập trung vào nhánh thứ hai của giấu tin là thủy vân thuận nghịch trên các phƣơng tiện số. Từ đó, xây dựng chƣơng trình thử nghiệm cài đặt một số thuật toán thủy trên vân thuận nghịch trên ảnh số nhằm ứng dụng xác thực thông tin và bảo vệ bản quyền cho dữ liệu ảnh số. 9 3. Đối tƣợng và phạm vi nghiên cứu Luận văn tập trung nghiên cứu các kỹ thuật thủy vân thuận nghịch trên ảnh số. Chƣơng trình thử nghiệm mà luận văn xây dựng là hệ thống nhúng và tách thủy vân nhằm xác thực nội dung thông tin và bảo về bản quyền ảnh số nhƣng vẫn đảm bảo chất lƣợng của ảnh số nhƣ ban đầu sau khi trích thủy vân. 4. Phƣơng pháp thực hiện Phƣơng pháp thực hiện đề tài là nghiên cứu các vấn đề liên quan đến thủy vân số, sau đó tiến hành xây dựng và cài đặt chƣơng trình thử nghiệm. 5. Kết quả đạt đƣợc Luận văn đã hệ thống lại các kiến thức cơ bản về giấu tin và thủy vân số, nghiên cứu một số thuật toán thủy vân trên miền không gian và miền tần số. Đồng thời cài đặt thành công thuật toán thủy vân trên miền DCT nhằm ứng dụng xác định bản quyền tác giả. 6. Bố cục của luận văn Luận văn đƣợc chia làm 3 chƣơng. Chương 1. Tổng quan về kỹ thuật giấu tin và thủy vân số. Nội dung chƣơng 1 đƣa ra các kiến thức cơ bản về kỹ thuật giấu tin và thủy vân, từ đó chỉ ra thủy vân là một nhánh của giấu tin. So sánh các phƣơng pháp thủy vân trên miền không gian, miền tần số và thủy vân thuận nghịch. Tuy nhiên, mục đích của thủy vân khác hoàn toàn so với mục đích của giấu tin mật và mã hóa. Điều này đƣợc thể hiện cụ thể ở phần phân tích các hƣớng ứng dụng quan trọng của thủy vân trong đời thƣờng. Có nhiều môi trƣờng đa phƣơng tiện để thực hiện giấu tin và cũng có chừng đó môi trƣờng để thực hiện thủy vân. Chương 2. Thủy vân thuận nghịch trên ảnh số Chƣơng này trình bày một số thuật toán thủy vân trên các miền: miền không gian, miền tần số dựa vào biến đổi Cosine rời rạc DCT và miền tần số dựa vào biến đổi sóng nhỏ rời rạc DWT. Chương 3. Xây dựng chương trình thử nghiệm. Phần này sẽ phân tích và thiết kế các modul cho hệ thống, cài đặt thuật toán thủy vân thuận nghịch và chạy thử nghiệm chƣơng trình. Thuật toán đƣợc lựa chọn cài đặt là thuật toán thủy vân CPT trên miền không gian và thuật toán thủy vân dựa vào DCT trên miền tần số. 10 CHƢƠNG 1: TỔNG QUAN VỀ KỸ THUẬT GIẤU TIN VÀ THỦY VÂN SỐ 1.1. Kỹ thuật giấu tin trong phƣơng tiện số 1.1.1. Khái niệm giấu tin và lý thuyết cơ sở Steganography có nguồn gốc từ tiếng Hy Lạp và đƣợc sử dụng tới ngày nay, nó có nghĩa là “tài liệu đƣợc phủ” (covered writing). Các câu chuyện kể về kỹ thuật giấu thông tin đã có từ rất lâu. Những tài liệu tìm thấy ghi chép về kỹ thuật giấu thông tin sớm nhất thuộc về sử gia Hy Lạp Herodotus (khoảng năm 440 trƣớc Công nguyên). Khi bạo chúa Hy Lạp Histiaeus bị vua Darius bắt giữ ở Susa vào thế kỷ thứ 5 trƣớc Công nguyên, ông ta đã cố gửi thông báo bí mật cho con rể của mình là Aristagoras ở Miletus. Histiaeus đã cạo trọc đầu của một nô lệ tin cậy và xăm một thông báo trên da đầu của ngƣời nô lệ đó. Khi tóc của ngƣời nô lệ mọc đủ dài, anh ta đƣợc gửi tới Miletus. Trong một câu chuyện khác về thời Hy Lạp cổ đại cũng do Herodotus ghi lại, thì môi trƣờng để ghi văn bản lại là những viên thuốc. Demeratus, một ngƣời Hy Lạp, cần thông báo cho Sparta rằng Xerxes định xâm chiếm Hy Lạp. Để tránh bị phát hiện, anh ta đã bọc lớp sáp khỏi các viên thuốc, khắc thông báo lên bề mặt những viên thuốc này, rồi sau đó bọc lại các viên thuốc bằng một lớp sáp mới. Những viên thuốc đƣợc để ngỏ và lọt qua mọi sự kiểm tra một cách dễ dàng. Ý tƣởng về che giấu thông tin đã có từ hàng nghìn năm trƣớc, nhƣng trƣớc kia kỹ thuật này chỉ đƣợc dùng chủ yếu trong quân đội và các cơ quan tình báo. Trong vài thập niên gần đây, giấu tin giành đƣợc rất nhiều sự quan tâm của các nhà nghiên cứu, các viện công nghệ, và nhiều công trình nghiên cứu có giá trị đã ra đời. Nguyên nhân dẫn tới sự thay đổi này chính là cuộc cách mạng số hóa thông tin và sự phát triển nhanh chóng của mạng truyền thông. Những phiên bản sao chép hoàn hảo, các kỹ thuật thay thế, sửa đổi tinh vi, cộng với sự trao đổi dữ liệu đa phƣơng tiện trên mạng đã sinh ra nhiều vấn đề nhức nhối về nạn ăn cắp bản quyền, phân phối bất hợp pháp, xuyên tạc thông tin trái phép,… Vậy giấu tin là gì? Giấu thông tin là một kỹ thuật nhúng (giấu) một lƣợng thông tin số nào đó vào một đối tƣợng dữ liệu số khác. Kỹ thuật giấu thông tin nhằm bảo đảm an toàn và bảo mật thông tin với hai mục đích. Một là bảo mật cho dữ liệu đƣợc đem giấu, hai là bảo vệ cho chính đối tƣợng dùng để giấu dữ liệu vào.Yêu cầu cơ bản của kỹ thuật giấu tin là không làm ảnh hƣởng đến dữ liệu gốc. 11 Kỹ thuật giấu thông tin nhằm mục đích đảm bảo an toàn và bảo mật mật thông tin ở cả hai khía cạnh. Một là bảo mật cho dữ liệu đƣợc đem giấu, hai là bảo mật cho chính đối tƣợng đƣợc dùng để giấu tin. Điều này dẫn đến hai khuynh hƣớng chủ yếu của giấu tin:  Khuynh hƣớng thứ nhất là giấu tin mật (steganography). Khuynh hƣớng này tập trƣng vào các kỹ thuật giấu tin sao cho thông tin giấu đƣợc nhiều và quan trọng là ngƣời khác khó phát hiện dƣợc một đối tƣợng có bị giấu tin bên trong hay không.  Khuynh hƣớng thứ hai là thủy vân số (watermarking). Khuynh hƣớng thủy vân số đánh giấu vào đối tƣợng nhằm khẳng định bản quyền quyền sở hữu hay phát hiện sự xuyên tạc thông tin. 1.1.2. Phân loại các kỹ thuật giấu tin Hai mục đích khác nhau của kỹ thuật giấu tin dẫn đến hai hƣớng kỹ thuật chủ yếu là giấu tin mật và thủy vân. Giấu tin mật là kỹ thuật giấu một lƣợng thông tin lớn vào một dữ liệu chứa nào đó sao cho ngƣời khác khó phát hiện đƣợc một đối tƣợng có giấu tin bên trong hay không nhằm bảo vệ lƣợng thông tin đem nhúng. Đồng thời, các kỹ thuật giấu tin mật còn quan tâm lƣợng tin có thể đƣợc giấu, lƣợng thông tin giấu đƣợc càng nhiều càng tốt. Tuy nhiên, lƣợng thông tin giấu càng lớn thì tính ẩn của thông tin giấu càng thấp. Các thành phần trong quá trình giấu tin:  Dữ liệu nguồn (Host Signal): là dữ liệu gốc đƣợc dùng làm nơi giấu dữ liệu. Ví dụ nếu giấu tin trong bức ảnh thì bức ảnh là dữ liệu nguồn.  Dữ liệu nhúng (Embed Data): là dữ liệu cần giấu, nó đƣợc nhúng vào dữ liệu nguồn, còn gọi là phƣơng tiện giấu tin.  Khoá và chìa (nếu cần): để mã hóa thông tin trƣớc khi giấu vào ảnh.  Dữ liệu mang thông tin ẩn: là sản phẩm của quá trình giấu tin. 1.1.3. Mô hình kỹ thuật giấu tin Hệ thống giấu tin nói chung bao gồm 2 phần chính: chèn tin và tách tin Giai đoạn chèn tin, các thông tin khoá (công khai hoặc bí mật) và tin giấu đƣợc chèn vào ảnh gốc để đƣợc sản phẩm mang tin giấu. Giai đoạn tách tin, dữ liệu, khoá (bí mật) và hoặc ảnh gốc (ảnh không chèn tin) sẽ làm dữ liệu cơ sở để tách tin từ sảm phẩm mang tin giấu. 12 Thông điệp M Ảnh gốc Chèn tin Ảnh mang tin Khóa K a) Chèn tin Ảnh gốc Ảnh mang tin Tách tin Thông điệp M Khóa K b) Tách tin Hình 1.1: Quá trình chèn (giấu) tin và tách tin Trong đó:  Mẩu tin mật: có thể là văn bản hoặc tệp ảnh hay bất kỳ một tệp nhị phân nào, vì quá trình xử lý chúng ta đều chuyển chúng thành chuỗi các bit.  Ảnh phủ hay ảnh gốc: ảnh đƣợc dùng để làm môi trƣờng nhúng tin mật.  Khoá K: khoá viết mật tham gia vào quá trình giấu tin, tăng tính bảo mật.  Ảnh mang tin: là ảnh sau khi đã nhúng tin mật vào đó. 1.1.4. Giấu tin trong dữ liệu đa phƣơng tiện Kỹ thuật giấu tin đã đƣợc nghiên cứu và áp dụng trong nhiều môi trƣờng dữ liệu khác nhau nhƣ trong dữ liệu đa phƣơng tiện (văn bản, hình ảnh, âm thanh, phim), trong sản phẩm phần mềm và gần đây là những nghiên cứu trên lĩnh vực cơ sở dữ liệu quan hệ. Trong các dữ liệu đó, dữ liệu đa phƣơng tiện là môi trƣờng chiếm tỷ lệ chủ yếu trong các kỹ thuật giấu tin. 1.1.4.1. Giấu tin trong ảnh số Thông tin sẽ đƣợc giấu cùng với dữ liệu ảnh nhƣng chất lƣợng ảnh ít thay đổi và không ai biết đƣợc đằng sau đó mang những thông tin có ý nghĩa. Ngày nay, khi ảnh số đã đƣợc sử dụng phổ biến, giấu thông tin trong ảnh đã đem lại nhiều những ứng dụng 13 quan trọng trên nhiều lĩnh vực trong đời sống xã hội. Ví dụ đối với các nƣớc phát triển, chữ ký tay đã đƣợc số hóa và lƣu trữ sử dụng nhƣ hồ sơ các nhân của các dịch vụ ngân hàng và tài chính, nó đƣợc dùng để xác thực trong các thẻ tín dụng của ngƣời tiêu dùng. Phần mềm WinWord của Microsoft cũng cho phép ngƣời dùng lƣu trữ chữ ký trong ảnh nhị phân rồi gắn vào vị trí nào đó trong file văn bản để đảm bảo tính an toàn của thông tin. Tài liệu sau đó đƣợc truyền trực tiếp qua máy fax hoặc lƣu truyền trên mạng. Theo đó, việc xác thực chữ ký, xác thực thông tin đã trở thành một vấn đề quan trọng khi việc ăn cắp thông tin hay xuyên tạc thông tin bởi các tin tặc đang trở thành một vấn nạn đối với bất kỳ quốc gia nào, tổ chức nào. Hơn nữa có nhiều loại thông tin quan trọng cần đƣợc bảo mật nhƣ những thông tin về an ninh, thông tin về bảo hiểm hay các thông tin về tài chính, các thông tin này đƣợc số hóa và lƣu trữ trong hệ thống máy tính hay trên mạng. Chúng dễ bị lấy cắp và bị thay đổi bởi các phần mềm chuyên dụng. Việc xác thực cũng nhƣ phát hiện thông tin xuyên tạc đã trở nên vô cùng quan trọng và cấp thiết. Một đặc điểm của giấu thông tin trong ảnh là thông tin đƣợc giấu trong ảnh một cách vô hình, tƣơng tự cách truyền thông tin mật cho nhau mà ngƣời khác không thể biết đƣợc bởi sau khi giấu thông tin chất lƣợng ảnh gần nhƣ không thay đổi đặc biệt đối với ảnh mầu hay ảnh đa cấp xám. Các kỹ thuật giấu tin trong ảnh hiện nay đều thuộc vào một trong 3 nhóm: Giấu tin trong miền quan sát. Đây là kỹ thuật giấu tin vào các bit có trọng số thấp (Least Significant Bit). Phƣơng pháp này đƣợc áp dụng trên các ảnh bitmap không nén, các ảnh dùng bảng mầu. Ý tƣởng chính của phƣơng pháp là lấy từng bit của mẫu tin mật rồi rải nó lên ảnh mang, thay đổi bit có trọng số thấp của ảnh bằng các bit của mẫu tin mật và mắt ngƣời không cảm nhận đƣợc sự thay đổi đó. Các phƣơng pháp dựa vào kỹ thuật biến đổi ảnh. Ví dụ biến đổi từ miền không gian sang miền tần số nhằm đảm bảo tính bền vững của thông tin đƣợc gấu, sử dụng cho kỹ thuật thủy vân bền vững. Ý tƣởng chính là nhúng thông tin bằng cách điều chế các hệ số của phép biến đổi Cosin rời rạc theo các bit tin cần giấu và sự làm tròn lỗi khi lƣợng hóa. Một số phƣơng pháp khác thuộc nhóm này sử dụng ảnh nhƣ mô hình vật lý với các dải phổ thể hiện mức năng lƣợng. Khi đó giấu tin giống nhƣ việc điều chế một tín hiệu dải hẹp vào một dải tần rộng (ảnh phủ). Các phƣơng pháp sử dụng mặt nạ giác quan. Nhóm này dựa trên nguyên lý đánh lừa giác quan của con ngƣời bằng cách làm mờ bức ảnh. “Mặt nạ” ở đây ám chỉ hiện tƣợng mắt ngƣời không cảm nhận đƣợc một tín hiệu nếu nó ở bên cạnh một tín hiệu nhất định nào đó. 14 1.1.4.2. Giấu tin trong Audio Giấu thông tin trong audio mang những đặc điểm riêng khác với giấu thông tin trong các đối tƣợng đa phƣơng tiện khác. Một trong những yêu cầu cơ bản của giấu tin là đảm bảo tính chất ẩn của thông tin đƣợc giấu đồng thời không làm ảnh hƣởng nhiều đến chất lƣợng của dữ liệu gốc. Để đảm bảo yêu cầu này, kỹ thuật giấu thông tin trong ảnh phụ thuộc vào hệ thống thị giác của con ngƣời, còn kỹ thuật giấu thông tin trong audio lại phụ thuộc vào hệ thống thính giác. Và một vấn đề khó khăn ở đây là hệ thống thích giác của con ngƣời khá nhạy cảm, nghe đƣợc các tín hiệu ở các giải tần rộng và công suất lớn nên những đoạn thông tin nhiễu dễ dàng bị phát hiện làm cho việc giấu tin gặp khó khăn. Nhƣng hệ thống thính giác lại kém trong việc phát hiện sự khác biệt của các giải tần và công suất. Điều này có nghĩa là các âm thanh to, cao tần có thể che giấu đƣợc các âm thanh nhỏ thấp một cách dễ dàng. Các mô hình phân tích tâm lý đã chỉ ra điểm yếu trên và thông tin này sẽ giúp ích cho việc chọn các audio thích hợp cho việc giấu tin. Vấn đề khó khăn thứ hai của giấu thông tin trong audio là kênh truyền tin. Kênh truyền hay băng thông chậm sẽ ảnh hƣởng đến chất lƣợng thông tin sau khi giấu. Các phƣơng pháp giấu thông tin trong audio đều lợi dụng điểm yếu trong hệ thống thính giác của con ngƣời. Các thuật toán giấu tin trong audio đƣợc thực hiện trong miền biến đổi tần số, sử dụng kỹ thuật: mã hóa bit thấp, mã hóa tiếng vang, mã hóa pha,... Mã hóa bít thấp: Cũng nhƣ các file ảnh, phƣơng pháp chèn vào các bit ít quan trọng cũng lƣu trữ dữ liệu giấu vào trong các bit ít quan trọng của file audio. Phƣơng pháp mã hóa LSB là cách đơn giản nhất để nhúng thông tin vào trong dữ liệu audio. Phƣơng pháp này sẽ thay thế bít ít quan trọng nhất (thƣờng là bít cuối) của mỗi mẫu dữ liệu bằng bit thông tin giấu. Mã hóa pha là kỹ thuật thực hiện giấu tin trong audio thông qua việc thay thế pha của một segment audio ban đầu bằng một pha tham chiếu (referency phase) thể hiện dữ liệu. Pha của các segment tiếp theo sẽ đƣợc điều chỉnh sao cho duy trì mối quan hệ giữa các đoạn. Kỹ thuật giấu dựa vào tiếng vang thực hiện giấu tin bằng cách thêm vào tiếng vang trong tín hiệu gốc. Dữ liệu nhúng đƣợc giấu bằng cách thay đổi 3 tham số của tiếng vang: biên độ ban đầu, tỉ lệ phân rã và độ trễ. Khi thời gian giữa tín hiệu gốc và tiếng vang giảm xuống, hai tín hiệu có thể trộn lẫn và ngƣời nghe khó có thể phân biệt giữa hai tín hiệu. Số lƣợng tin giấu có liên quan đến thời gian trễ của tiếng vang và biên độ của nó. 15 1.1.4.3. Giấu tin trong Video Cũng giống nhƣ giấu tin trong ảnh hay trong audio, giấu tin trong video cũng đƣợc quan tâm và đƣợc phát triển mạnh mẽ cho nhiều ứng dụng nhƣ kiểm soát sao chép thông tin, nhận thực thông tin và bảo vệ bản quyền tác giả. Nhiều kỹ thuật giấu tin trong ảnh đƣợc áp dụng cho giấu tin trong video nhƣng đảm bảo các ràng buộc:  Do dữ liệu video là rất lớn nên thời gian để giấu tin cũng rất lớn. Vì vậy, việc giấu tin phải đƣợc thực hiện trong thời gian thực để truyền các tín hiệu video đi.  Do giới hạn của băng thông nên việc giấu tin không đƣợc làm thay đổi kích thƣớc của dữ liệu.  Các dữ liệu video thƣờng đƣợc lƣu ở dạng nén, thông thƣờng dựa vào quá trình xử lý sự thay đổi ảnh từ khung hình này đến khung hình khác. Vì vậy, khi giấu tin cần đảm bảo rằng thông tin không quá dễ phát hiện ra bằng mắt thƣờng. 1.1.4.4. Giấu tin trong văn bản Trong trao đổi thông tin qua hệ thống máy tính, văn bản chiếm một tỷ lệ rất lớn so với các loại phƣơng tiện chứa khác. Tuy vậy, giấu tin trong văn bản lại chƣa đƣợc quan tâm nghiên cứu nhiều. Các nghiên cứu về giấu tin trong văn bản đƣợc chia theo hai hƣớng: Thứ nhất, văn bản đƣợc sử dụng để giấu tin là những văn bản đƣợc chụp lại và lƣu trên máy nhƣ một bức ảnh nhị phân. Theo hƣớng này, các kỹ thuật giấu tin đƣợc thực hiện nhƣ kỹ thuật giấu tin trong ảnh. Thứ hai, phƣơng tiện chứa sử dụng cho quá trình giấu tin đƣợc lƣu dƣới dạng văn bản. Theo hƣớng này, giấu tin đƣợc thực hiện bằng cách điều chỉnh khoảng cách giữa các dòng hoặc thay đổi kích thƣớc một số ký tự tại một số vị trí trên văn bản mà không làm ảnh hƣởng nhiều đến nội dung văn bản gốc. 16 1.2. Kỹ thuật thủy vân số 1.2.1. Lịch sử phƣơng pháp thủy vân số Phƣơng pháp thủy vân đầu tiền đƣợc thực hiện là thủy vân trên giấy. Đó là một thông tin nhỏ đƣợc nhúng chìm trong giấy để thể hiện bản gốc hoặc bản chính thức. Theo Hartung và Kutter, thủy vân trên giấy đã bắt đầu đƣợc sử dụng vào năm 1292 ở Fabriano, Italy – nơi đƣợc coi là nơi sinh của thủy vân. Sau đó, thủy vân đã nhanh chóng lan rộng trên toàn Italy và rồi trên các nƣớc châu Âu và Mỹ. Ban đầu, thủy vân giấy đƣợc dùng với mục đích xác định nhãn hàng và nhà máy sản xuất. Sau này đƣợc sử dụng để xác định định dạng, chất lƣợng và độ dài, ngày tháng của sản phẩm. Đến thế kỷ thứ 18, nó bắt đầu đƣợc dùng cho tiền tệ và cho đến nay thủy vân vẫn là một công cụ đƣợc dùng rộng rãi với mục đích bảo mật cho tiền tệ, chống làm tiền giả. Thuật ngữ “thủy vân” (watermarking) đƣợc đƣa ra vào cuối thế 18, nó bắt nguồn từ một loại mực vô hình khi viết lên giấy và chỉ hiển thị khi nhúng giấy đó vào nƣớc. Năm 1988, Komatsu và Tominaga đã đƣa ra thuật ngữ “thủy vân số” (Digital watermarking). Vậy thủy vân số là quá trình sử dụng các thông tin (ảnh, chuỗi bít, chuỗi số) nhúng một cách tinh vi vào dữ liệu số (ảnh số, audio, video hay text) nhằm xác định thông tin bản quyền của tác phẩm số. Mục đích của thủy vân số là bảo vệ bản quyền cho phƣơng tiện dữ liệu số mang thông tin thủy vân. Tùy theo mục đích của hệ thủy vân mà ngƣời ta lại chia thành các hƣớng nhỏ nhƣ thủy vân dễ vỡ và thủy vân bền vững. Giấu tin (Information hiding) Giấu tin mật (steganography) Thủy vân số (watermaking) Thủy vân dễ vỡ (Fragile watermarking) Thủy vân bền vững (robust copyright marking) Thủy vân ẩn (Imperseptipl Mermarking) Thủy vân hiện (Visible watermarking) Hình 1.2: Sơ đồ phân loại kỹ thuật giấu tin của A.P Pentitcolas 1999 theo hai hướng nghiên cứu chính là giấu tin mật và thủy vân số 17 Thủy vân bền vững quan tâm nhiều đến việc nhúng những mẩu tin đòi hỏi độ bền vững cao của thông tin đƣợc giấu trƣớc các biến đổi thông thƣờng trên dữ liệu chứa. Hƣớng này đƣợc sử dụng để bảo vệ bản quyền tác giả. Thủy vân dễ vỡ yêu cầu thông tin giấu sẽ bị sai lệch nếu có bất kỳ sự thay đổi nào trên dữ liệu chứa. Hƣớng này đƣợc sử dụng để phát hiện xuyên tạc thông tin. Ở mỗi loại thủy vân bền vững hoặc thủy vân dễ vỡ lại chia thành hai loại dựa theo đặc tính đó là thủy vân ẩn và thủy vân hiện. Thủy vân hiện cho phép nhìn thấy thông tin đem nhúng vào dữ liệu chứa. Loại này đƣợc sử dụng cho mục đích công bố công khai về quyền sở hữu. Ngƣợc lại, thủy vân ẩn không cho phép nhìn thấy nội dung thông tin nhúng và nó đƣợc sử dụng với mục đích gài bí mật các thông tin xác nhận quyền sở hữu. Hình 1.3: Ví dụ về thủy vân ẩn và thủy vân hiện 1.2.2. Mô hình thủy vân số Hình 1.4: Mô hình thủy vân do Sviatoslav Voloshynovskiy và các cộng sự đề xuất 18 Mô Mô hình thủy vân Sviatoslav Voloshynovskiy đƣợc chia làm 3 phần chính:  Nhúng thủy vân  Các tấn công trên thủy vân  Trích thủy vân Thủy vân có thể đƣợc mã hóa để tăng cƣờng tính bền vững. Thông thƣờng, tài liệu đã nhúng thủy vân sẽ trải qua một số bƣớc tấn công trƣớc khi đƣợc trích thủy vân. Sau quá trình trích đƣợc thực hiện, dựa vào kết quả trích rút để có quyết định tài liệu có đƣợc nhúng thủy vân hay không, và nếu có thì thực hiện giải mã trên dữ liệu trích để nhận đuợc giá trị thủy vân. 1.2.3. Các tính chất quan trọng của kỹ thuật thủy vân số Tính bền vững: Chất lƣợng của thuật toán phụ thuộc vào tính bền vững của thủy vân. Đặc biệt đối với thủy vân bền vững, yêu cầu quan trọng là thủy vân không bị thay đổi sau một số phép xử lý trên đối tƣợng đƣợc nhúng. Đối với ảnh số, các phép xử lý này có thể là phép nén thông tin, lọc, tính tiến, quay, làm sắc ảnh, xén ảnh,… Tính vô hình: Đối với thủy vân ẩn thì mọi thuật toán đều cố gắng nhúng thủy vân sao cho chúng không bị phát hiện bởi ngƣời sử dụng. Thông thƣờng đối với một thuât toán nếu tính bền vững cao thì tính vô hình kém và ngƣợc lại, do đó cần có sự cân nhắc giữa tính bền vững và tính vô hình để đảm bảo thủy vân đạt đƣợc cả tính bền vững cũng nhƣ tính vô hình. Tính bảo mật: Bảo mật đối với khóa, thủy vân sao cho nếu một ai đó không có quyền thì không thể dò đƣợc thủy vân. Tính phức tạp của kỹ thuật thuỷ vân thể hiện ở hai tính chất mâu thuẫn (tính bền vững và tính ẩn) lẫn nhau này. Nếu nhƣ để đảm bảo tính ẩn thì thuỷ vân phải đƣợc giấu trong những vị trí ít có ý nghĩa tri giác nhất, ít bị chú ý nhất, nhƣng để đảm bảo đƣợc tính bền vững thì thuỷ vân phải chịu đƣợc những phép xử lí ảnh phổ biến nhƣ dịch chuyển ảnh, co giãn ảnh, quay ảnh hoặc nén ảnh. Đơn cử nhƣ phép nén JPEG lại loại bỏ ảnh những thông tin ít có tính tri giác nhất để làm giảm kích thƣớc của ảnh mà vẫn đảm bảo đƣợc chất lƣợng ảnh. Căn cứ trên các giải pháp đã đƣợc công bố, ta có thể phân loại các kĩ thuật hiện nay thành hai nhóm chính:  Nhóm các kĩ thuật biến đổi miền không gian ảnh (spatial image transfroms): nhóm kĩ thuật này tập trung vào việc thay đổi trực tiếp lên không gian các điểm ảnh và sử dụng các mô hình tri giác và phƣơng pháp hình học. Tuy nhiên, các kĩ thuật này chỉ đảm bảo đƣợc thuộc tính ẩn mà không có 19 tính bền vững. Kĩ thuật này thƣờng đƣợc sử dụng trong các ứng dụng nhận thực thông tin, phát hiện xuyên tạc.  Nhóm các kĩ thuật biến đổi miền tần số ảnh (frequency image transforms): Nhóm kĩ thuật này sử dụng một phƣơng pháp biến đổi trực giao nào đó, chẳng hạn nhƣ Cosine rời rạc, hay Fourier… để chuyển miền không gian ảnh sang miền tần số. Thuỷ vân sẽ đƣợc nhúng trong miền không gian tần số của ảnh theo kĩ thuật trải phổ trong truyền thông. Đây là kĩ thuật phổ biến nhất với nhiều thuật toán và đƣợc hứa hẹn là một phƣơng pháp tốt giải quyết vấn đề đảm bảo hai thuộc tính quan trọng của thuỷ vân sau khi giấu. Ngoài hai nhóm trên, gần đây đã xuất hiện những ký thuật dựa trên đặc thù của ảnh. 1.2.4. Hệ thống thủy vân số Hệ thống thủy vân số là quá trình sử dụng một thủy vân nhúng vào trong một dữ liệu số để đƣợc một dữ liệu số có chứa thủy vân hay gọi là dữ liệu có bản quyền. Dữ liệu có bản quyền này sẽ đƣợc phân phối trên kênh truyền tin. Trong quá trình phân phối, dữ liệu bản quyền có thể bị tấn công trái phép hoặc yếu tố gây nhiễu. Nếu dữ liệu số bản quyền bị nghi ngờ sao chép trái phép hoặc chỉnh sửa thông tin thì có thể xác minh nhờ quá trình tách thủy vân đã nhúng. Nhƣ vậy, hệ thống thủy vân số nói chung bao gồm 2 quá trình là quá trình nhúng thủy vân và quá trình tách thủy vân. Thủy vân mang thông tin bảo mật hoặc bản quyền về dữ liệu chứa. Khóa thủy vân đƣợc dùng cho cả phiên nhúng và phát hiện thủy vân. Khóa thủy vân là duy nhất với mỗi thủy vân. Khóa đó là khóa bí mật, chỉ tác giả mới biết. Điều đó nói lên rằng chỉ tác giả mới phát hiện ra đƣợc thủy vân. Tùy từng bộ nhúng thủy vân mà có các yêu cầu với khóa thủy vân. 1.2.4.1. Quá trình nhúng thủy vân Giai đoạn này gồm thông tin khóa thủy vân, thủy vân, dữ liệu chứa và bộ nhúng thủy vân. Dữ liệu chứa bao gồm các đối tƣợng nhƣ văn bản, audio, video, ảnh… dạng số, đƣợc dùng làm môi trƣờng để giấu tin. Bộ nhúng thủy vân là chƣơng trình đƣợc cài đặt những thuật toán thủy vân và đƣợc thực hiện với một khóa bí mật. Thủy vân sẽ đƣợc nhúng vào trong dữ liệu chứa nhờ một bộ nhúng thủy vân. Kết quả quá trình này là đƣợc dữ liệu chứa đã nhúng thủy vân gọi là dữ liệu có bản quyền và đƣợc 20 phân phối trên các môi trƣờng khác nhau. Trên đƣờng phân phối có nhiễu và sự tấn công từ bên ngoài. Do đó yêu cầu các kỹ thuật thủy vân số phải bền vững với cả nhiễu và sự tấn công trên. 1.2.4.2. Quá trình trích thủy vân Quá trình tách thủy vân đƣợc thực hiện thông qua một bộ tách thủy vân tƣơng ứng với bộ nhúng thủy vân cùng với khóa của quá trình nhúng. Kết quả thu đƣợc là một thủy vân. Thủy vân thu đƣợc có thể giống với thủy vân ban đầu hoặc sai khác do nhiễu và sự tấn công trên đƣờng truyền. Khóa thủy vân Dữ liệu số Bộ nhúng thủy vân Dữ liệu bản quyền Thủy vân Tấn công Thủy vân Bộ tách thủy vân Kênh truyền tin Nhiễu Dữ liệu bản quyền Khóa thủy vân Hình 1.5: Sơ đồ hệ thống thủy vân số 1.2.5. Các hƣớng ứng dụng của thủy vân Bảo vệ bản quyền tác giả CP (copyright protection): Đây là ứng dụng cơ bản nhất của kỹ thuật thủy vân. Trong thực tế, nhiều tác phẩm đã có tác quyền nhƣng vẫn bị sử dụng sai mục đích. Các thông báo tác quyền này thƣờng đƣợc đặt ở một vị trí nào đó trên tác phẩm đƣợc phân phối. Chẳng hạn, ta thƣờng thấy trên các tài liệu văn bản là “copyright ngày ... ngƣời sở hữu ...” hay trên các tác phẩm âm thanh thì đƣợc đặt trên băng đĩa vật lý hoặc trên bao bì,... Vấn đề bảo vệ bản quyền này không đƣợc đảm bảo vì không quá khó để loại bỏ nó ra khỏi một tài liệu khi cần sao chép. Ví dụ, một giáo viên sao chép một số trang từ quyển sách mà quên sao chép thông báo tác quyền ở trang tiêu
- Xem thêm -