Tài liệu Thủy vân số và ứng dụng trong xác thực nội dung ảnh số

  • Số trang: 76 |
  • Loại file: PDF |
  • Lượt xem: 55 |
  • Lượt tải: 0
nhattuvisu

Đã đăng 27125 tài liệu

Mô tả:

1 ĐẠI HỌC THÁI NGUYÊN TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN&TRUYỀN THÔNG ............................... ĐÀO TRUNG DŨNG THỦY VÂN SỐ VÀ ỨNG DỤNG TRONG XÁC THỰC NỘI DUNG ẢNH SỐ LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH Thái Nguyên - 2014 Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn/ 2 ĐẠI HỌC THÁI NGUYÊN TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN&TRUYỀN THÔNG .............................. ĐÀO TRUNG DŨNG THỦY VÂN SỐ VÀ ỨNG DỤNG TRONG XÁC THỰC NỘI DUNG ẢNH SỐ Chuyên ngành: Khoa học máy tính Mã số: 60 48 0101 LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH NGƢỜI HƢỚNG DẪN KHOA HỌC PGS. TS. Trịnh Nhật Tiến Thái Nguyên - 2014 Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn/ 3 MỞ ĐẦU Lí do chọn đề tài Chúng ta đang sống trong một xã hội thông tin, đặc trưng lớn nhất đó là sự thâm nhập của các loại dữ liệu số vào mọi mặt của đời sống xã hội. Dữ liệu số có thể lưu trữ với chất lượng cao, có thể được xử lý một cách dễ dàng. Mặt khác, cùng với sự phát triển mạnh mẽ của mạng Internet quá trình phân phối các sản phẩm kỹ thuật số trở nên thuận tiện và nhanh chóng, thì vấn đề bảo vệ bản quyền, quyền sở hữu trí tuệ, hạn chế truy nhập thông tin trái phép, xác thực dữ liệu số,... ngày càng trở lên quan trọng và là yêu cầu cấp thiết đặt ra trong bối cảnh hiện nay, bởi vì dữ liệu số có những đặc trưng riêng như: - Dễ dàng sao chép, chỉnh sửa: Chỉ cần một vài thao tác đơn giản trên máy tính, mạng máy tính thì một tài liệu dày hàng nghìn trang hay một tác phẩm nghệ thuật (bức tranh, ảnh, bản nhạc, logo,…) giá trị được sao chép chỉ trong vòng vài giây. Điều quan trọng là khi sao chép thì chất lượng bản sao được giữ nguyên so với bản gốc, giống tài liệu gốc và dễ dàng chỉnh sửa. - Dễ dàng tìm kiếm: Với sự ra đời và ứng dụng mạnh mẽ mạng máy tính internet thì việc xây dựng các ứng dụng và các kho dữ liệu số trên tất cả các lĩnh vực của đời sống như: văn hóa, chính trị, kinh tế, quân sự, an ninh, quốc phòng, dữ liệu bản đồ,… cùng với nhiều công cụ tìm kiếm dữ liệu đã giúp cho việc tìm kiếm các loại dữ liệu số trở nên nhanh chóng hơn. - Dễ dàng phát tán: Ngày nay một người sử dụng bình thường có thể trở thành nguồn phát tán tài liệu dễ dàng thông qua các ứng dụng, phương tiện kỹ thuật số như máy tính, điện thoại, các ứng dụng nhắn tin, truyền file ftp, mạng xã hội hay các dịch vụ chia sẻ file trực tuyến,… dữ liệu số có thể được truyền một cách nhanh chóng thông qua mạng truyền thông mà không bị suy giảm tín hiệu, chất lượng. Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn/ 4 - Dễ dàng lưu trữ: Dung lượng các thiết bị lưu trữ ngày càng lớn, giá thành các thiết bị lưu trữ ngày càng rẻ đã khiến cho việc lưu trữ các dữ liệu số hóa càng trở lên đơn giản hơn. Từ tất cả các đặc trưng trên của dữ liệu số làm cho vấn đề bảo vệ bản quyền, xác thực, phát hiện thay đổi, xuyên tạc thông tin số nói chung và ảnh số nói riêng được quan tâm sâu sắc. Thủy vân số đã có từ lâu, tuy nhiên việc ứng dụng của thuỷ vân đối với các lĩnh vực trên lại là những vấn đề mới, mang tính thời sự. Nhận thức được ý nghĩa khoa học, thực tiễn của thuỷ vân số và yêu cầu của việc xác thực nội dung thông tin đối với ảnh số, được sự hướng dẫn của thầy giáo PGS.TS Trịnh Nhật Tiến, tôi đã chọn đề tài “Thủy vân số và ứng dụng trong xác thực nội dung ảnh số” làm Luận văn của mình. Luận văn này sẽ tập trung tìm hiểu tổng quan về ảnh số, ẩn giấu tin và thủy vân số; một số thuật toán thủy vân trong miền không gian, miền biến đổi, đồng thời tiến hành phân tích các lĩnh vực quảng cáo trong đó có lĩnh vực quảng cáo trực tuyến và lập trình để xây dựng phần mềm thử nghiệm cho việc xác thực nhãn hiệu quảng cáo trực tuyến. Ngoài phần mở đầu, phần kết luận và tài liệu tham khảo, luận văn gồm 3 chương, cụ thể như sau: Chƣơng 1. Tổng quan về ảnh số, ẩn - giấu tin và thủy vân số. Nêu tổng quan về các nội dung cơ bản, bao gồm các khái niệm, tính chất và ứng dụng của ảnh số; ẩn - giấu tin số, phân loại kỹ thuật, mô hình giấu tin số; các khái niệm, đặc tính, phân loại, quy trình, ứng dụng và các nguy cơ tấn công đối với hệ thuỷ vân số. Chƣơng 2. Một số kỹ thuật thủy vân trên ảnh số ứng dụng trong xác thực nội dung ảnh số. Chương này tập trung trình bày về hướng tiếp cận chính của thủy vân; các biến đổi thường dùng trên ảnh số như DFT, DCT, DWT… một số kỹ thuật tiêu biểu thủy vân ảnh số trên miền không gian và miền tần số. Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn/ 5 Chƣơng 3: Ứng dụng thủy vân để xác thực nội dung nhãn hiệu quảng cáo trực tuyến. Phân tích các hình thức quảng cáo trong đó có hình thức quảng cáo trực tuyến. Đề xuất giải pháp, mô hình sử dụng thủy vân để xác thực hình ảnh quảng cáo trực tuyến. Ứng dụng bộ chương trình Visual Studio 2010, ngôn ngữ C# để lập trình ứng dụng kỹ thuật thủy vân hợp ảnh để thực hiện bài toán trên. Đối tƣợng và phạm vi nghiên cứu: Tập trung vào tìm hiểu tổng quan về ảnh số, vấn đề giấu thông tin, thủy vân trên ảnh số. Trong đó xác định hướng tiếp cận chính của thủy vân, một số kỹ thuật, thuật toán thuỷ vân và ứng dụng trong xác nội dung ảnh số. Hƣớng nghiên cứu của đề tài: Tổng quan về ảnh số. Tổng quan vấn đề giấu thông tin. Một số kỹ thuật, thuật toán thuỷ vân; cài đặt chương trình ứng dụng kỹ thuật thuỷ vân để xác thực nhãn hiệu quảng cáo trực tuyến. Phƣơng pháp nghiên cứu: Sử dụng các phương pháp nghiên cứu chính sau: Phương pháp nghiên cứu lý thuyết, thực nghiệm; Phân tích, so sánh các thuật toán giấu tin; Phương pháp trao đổi khoa học, lấy ý kiến chuyên gia; Thử nghiệm các thuật toán trên máy tính. Ý nghĩa khoa học của đề tài: Nghiên cứu, phân tích một số thuật toán thuỷ vân và xây dựng mô hình ứng dụng xác nội dung ảnh số để xác thực các loại ảnh số, ứng dụng vào việc xác thực nhãn hiệu quảng cáo trực tuyến. Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn/ 6 Chương 1. TỔNG QUAN VỀ ẢNH SỐ, ẨN - GIẤU TIN VÀ THỦY VÂN 1.1. ẢNH SỐ 1.1.1. Điểm ảnh (Picture Element) Gốc của ảnh (ảnh tự nhiên) là ảnh liên tục về không gian và độ sáng. Để xử lý bằng máy tính điện tử, ảnh cần phải được số hoá. Số hoá ảnh là sự biến đổi gần đúng một ảnh liên tục thành một tập điểm phù hợp với ảnh thật về vị trí (không gian) và độ sáng (mức xám). Khoảng cách giữa các điểm ảnh đó được thiết lập sao cho mắt người không phân biệt được ranh giới giữa chúng. Mỗi một điểm như vậy gọi là điểm ảnh hay gọi tắt là pixel. Trong khuôn khổ ảnh hai chiều, mỗi pixel ứng với tọa độ (x, y). Điểm ảnh (pixel) là một phần tử của ảnh số tại toạ độ (x, y) với độ xám hoặc màu nhất định. Kích thước và khoảng cách giữa các điểm ảnh đó được chọn thích hợp sao cho mắt người cảm nhận sự liên tục về không gian và mức xám (hoặc màu) của ảnh số gần như ảnh thật. Mỗi phần tử trong ma trận được gọi là một phần tử ảnh. 1.1.2. Độ phân giải của ảnh Độ phân giải (Resolution) của ảnh là mật độ điểm ảnh được ấn định trên một ảnh số được hiển thị. Khoảng cách giữa các điểm ảnh phải được chọn sao cho mắt người vẫn thấy được sự liên tục của ảnh. Việc lựa chọn khoảng cách thích hợp tạo nên một mật độ phân bổ, đó chính là độ phân giải và được phân bố theo trục x và y trong không gian hai chiều. Ví dụ: Độ phân giải của ảnh trên màn hình CGA (Color Graphic Adaptor) là một lưới điểm theo chiều ngang màn hình: 320 điểm chiều dọc * 200 điểm ảnh (320*200). Rõ ràng, cùng màn hình CGA 12” ta nhận thấy mịn Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn/ 7 hơn màn hình CGA 17” độ phân giải 320*200. Lý do: cùng mật độ nhưng diện tích màn hình rộng hơn thì độ mịn của các điểm ảnh thấp hơn. 1.1.3. Mức xám của ảnh Một điểm ảnh có hai đặc trưng cơ bản là vị trí (x, y) của điểm ảnh và độ xám của nó. Mức xám của điểm ảnh là cường độ sáng của nó được gán bằng giá trị số tại điểm đó. - Các thang giá trị mức xám thông thường: 16, 32, 64, 128, 256 (Mức 256 là mức phổ dụng. Lý do: từ kỹ thuật máy tính dùng 01 byte (8 bit) để biểu diễn mức xám: Mức xám dùng 01 byte biểu diễn: 28=256 mức, từ 0 đến 255). - Ảnh đen trắng: Là ảnh có hai màu đen, trắng (không chứa màu khác) với mức xám ở các điểm ảnh có thể khác nhau. - Ảnh nhị phân: Ảnh chỉ có 02 mức đen trắng phân biệt tức dùng 01 bit mô tả 21 mức khác nhau. Nói cách khác, mỗi điểm ảnh của ảnh nhị phân chỉ có thể là 0 hoặc 1. - Ảnh màu: Trong khuôn khổ lý thuyết ba màu (Red, Blue, Green) để tạo nên thế giới màu, người ta thường dùng 03 byte để mô tả mức màu, khi đó các giá trị màu: 28*3=224K, sấp xỉ 16,7 triệu màu. 1.1.4. Ảnh số Hình ảnh có thể là bức vẽ, họa hình (Picture, Photograph) hay nói cách khác đó là các dữ liệu có thể được cảm nhận bằng thị giác (Visual data). Một hình ảnh số thông thường có số chiều là 2 hoặc 3 [2]. Ảnh số là tập hợp các điểm ảnh với mức xám phù hợp dùng để mô tả ảnh gần với ảnh thật. Như vậy, có thể định nghĩa ảnh số là một ảnh đã được rời rạc hóa trong không gian hai chiều có ảnh hưởng do cường độ ánh sáng và được mô tả như ma trận hai chiều. Dựa trên màu sắc có thể phân loại ảnh số thành ảnh đen trắng và ảnh màu. Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn/ 8 1.1.5. Biểu diến ảnh số - Ảnh véctơ: Là các dữ liệu đồ họa (graphics). Ba loại đối tượng đồ họa riêng biệt là điểm, đường và vùng. Ảnh véctơ được hình thành từ nhiều đối tượng đồ họa đơn giản: đoạn thẳng, elíp. Khuôn mẫu ảnh có thể là DXF, WMF, PIC, CGM... - Ảnh raster: Bao gồm các dữ liệu ảnh (Image). Khuôn mẫu ảnh raster có thể là BMP, JPEG, GIF... Mỗi điểm ảnh (pixel) của loại ảnh này cần được xác định màu cụ thể. Ảnh raster có thể là đa mức xám hay ảnh màu. Biểu diễn ảnh đa mức xám Ảnh được hiển thị trên màn hình bởi các pixel. Các pixel có độ chói (cường độ) khác nhau. Dải cường độ từ đen đến trắng phụ thuộc vào chất lượng ảnh, hay tổng số bít sử dụng cho mỗi pixel. Thí dụ với 8 bit biểu diễn điểm ảnh thì có tới 255 mức cường độ khác nhau có thể biểu diễn. Tóm lại, ảnh đa mức xám được biểu diễn bằng mảng 2 chiều. Mỗi phần tử của mảng tương ứng với 01 điểm ảnh. Việc sắp xếp các giá trị pixel này trong vùng bộ nhớ liên tục được gọi là bitmap. Khái niệm này xuất phát từ ánh xạ (map) các pixel ảnh vật lý vào các địa chỉ liên tục trong bộ nhớ. Bộ nhớ sử dụng để lưu trữ dữ liệu ảnh bitmap được gọi là “frame buffer”. Biểu diễn ảnh màu Ảnh màu cũng bao gồm trường chữ nhật các pixel. Khác biệt với các ảnh đa cấp xám là cần 3 giá trị để biểu diễn ảnh. Mỗi giá trị biểu diễn một màu cơ sở. Cách biểu diễn này xuất phát từ lý thuyết rằng màu có thể hình thành từ trộn ba màu cơ sở. Các màu cơ sở sử dụng trong vô tuyến truyền hình và màn hình máy tính là Red, Green và Blue. Ảnh màu có thể biểu diễn bởi ba mảng hai chiều tương ứng với các màu Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn/ 9 cơ sở Red, Green và Blue của ảnh. Màu và mô hình màu Màu là phân bổ bước sóng ánh sáng (màu blue - 440 nm, màu green 545 nm và màu red - 580 nm). Mắt người cảm nhận ba màu red, green và blue nhờ các tế bào hình nón (khoảng 6-7 triệu) trên võng mạc. Mắt người cảm nhận màu (bước sóng điện từ) trong dải từ 400 nm đến 700 nm. Phần lớn màu sắc xung quanh ta không có bước sóng đơn mà chúng được tạo bởi do trộn nhiều bước sóng khác nhau, mắt người nhạy với bước sóng trội. Mô hình màu là mô hình toán học trừu tượng mô tả cách biểu diễn màu mà con người có thể nhận biết bởi bộ các giá trị (thông thường là 3 hay 4 giá trị) hay bởi các thành phần màu. Có nhiều mô hình màu khác nhau dành cho các mục đích sử dụng khác nhau. Thí dụ, mô hình màu RGB dành cho màn hình máy tính, CMYK dành cho máy in màu, HSV dành cho người sử dụng (trực quan hơn), YUV dành cho nén ảnh, nén video và là chuẩn của Tivi. 1.2. ẨN - GIẤU TIN SỐ 1.2.1. Ẩn - giấu tin số, phân loại kỹ thuật giấu tin Từ trước đến nay, nhiều phương pháp bảo vệ thông tin đã được đưa ra, trong đó giải pháp dùng mật mã được ứng dụng rộng rãi nhất. Thông tin ban đầu được mã hoá, sau đó sẽ được giải mã nhờ khoá của hệ mã. Đã có rất nhiều hệ mã phức tạp được sử dụng như DES, RSA, NAPSACK... rất hiệu quả và phổ biến. Một phương pháp mới khác đã và đang được nghiên cứu và ứng dụng mạnh mẽ ở nhiều nước trên thế giới, đó là phương pháp giấu tin (Data Hiding), Giấu thông tin là kỹ thuật nhúng (embedding) một lượng thông tin số Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn/ 10 nào đó vào trong một đối tượng dữ liệu số khác. Một trong những yêu cầu cơ bản của giấu tin là đảm bảo tính chất ẩn của thông tin được giấu đồng thời không làm ảnh hưởng đến chất lượng của dữ liệu gốc. Sự khác biệt chủ yếu giữa mã hoá thông tin và giấu thông tin là mã hoá làm cho các thông tin hiện rõ là nó có được mã hoá hay không, còn với giấu thông tin thì người ta sẽ khó biết được là có thông tin giấu bên trong. Kỹ thuật giấu thông tin nhằm mục đích đảm bảo an toàn và bảo mật thông tin. Việc bảo đảm an toàn và bảo mật này có thể được xem xét ở hai khía cạnh. Một là bảo mật cho dữ liệu được đem giấu, hai là bảo mật cho chính đối tượng được dùng để giấu tin. Hai khía cạnh này dẫn đến hai khuynh hướng kỹ thuật giấu tin. Khuynh hướng thứ nhất là giấu tin mật (steganography). Khuynh hướng này tập trung vào các kỹ thuật giấu tin sao cho thông tin giấu được nhiều và quan trọng là người khác khó phát hiện được một đối tượng có bị giấu tin bên trong hay không. Khuynh hướng thứ hai là thuỷ vân số (watermarking). Khuynh hướng thuỷ vân số đánh giấu vào đối tượng nhằm khẳng định bản quyền sở hữu hay phát hiện xuyên tạc thông tin. Thuỷ vân số có miền ứng dụng lớn hơn nên được quan tâm nghiên cứu nhiều hơn và thực tế đã có nhiều những kỹ thuật dành cho khuynh hướng này. Hình 1.1 dưới đây phân loại các kỹ thuật giấu tin dưới đây chia ra các lĩnh vực của giấu tin. Có thể chia lĩnh vực giấu tin ra làm hai hướng lớn, đó là watermarking và steganography. Nếu như watermarking quan tâm nhiều đến các ứng dụng giấu các mẩu tin ngắn nhưng đòi hỏi độ bền vững cao của thông tin cần giấu đối với các biến đổi thông thường của tệp dữ liệu môi trường thì steganography lại quan tâm tới các ứng dụng che giấu các bản tin với độ mật và dung lượng càng lớn càng tốt. Đối với từng hướng lớn này, quá trình phân loại có thể tiếp tục theo các tiêu chí khác, ví dụ dựa theo ảnh hưởng các tác động từ bên ngoài có thể chia watermark thành hai loại, một loại bền vững với các tác Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn/ 11 động sao chép trái phép, loại thứ hai lại cần tính chất hoàn toàn đối lập, phải dễ bị phá huỷ trước các tác động nói trên. Information hiding Giấu thông tin Watermarking Thuỷ vân số Steganography Giấu tin mật Robust Watermarking Thuỷ vân bền vững Imperceptible Watermarking Thuỷ vân ẩn Fragile Watermarking Thuỷ vân “dễ vỡ” Visible Watermarking Thuỷ vân hiện Hình 1.1 Phân loại các kỹ thuật giấu tin Bảng 1.1. Bảng so sánh giữa giấu tin và thủy vân số Giấu tin Thủy vân số - Mục đích bảo vệ thông tin được giấu. - Mục đích bảo vệ môi trường giấu tin. - Giấu được càng nhiều thông tin càng - Chỉ cần thông tin đủ để đặc trưng cho tốt, ứng dụng trong truyền dữ liệu bản quyền của chủ sở hữu. thông tin mật. - Thông tin giấu có thể ẩn (thủy vân - Thông tin được giấu phải ẩn, không ẩn) hoặc hiện (thủy vân hiện). cho người khác thấy được bằng mắt thường. - Chỉ tiêu quan trọng nhất là tính bền - Chỉ tiêu quan trọng nhất là dung Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn/ 12 lượng của tin được giấu vững của tin được giấu. Có nhiều cách để tiến hành phân loại các phương pháp giấu thông tin theo các tiêu chí khác nhau, như theo các phương tiện chứa tin, các phương pháp tác động lên phương tiện chứa tin, hay phân loại theo ứng dụng, cụ thể: - Phân loại theo phương tiện chứa tin: + Giấu thông tin trong ảnh. + Giấu thông tin trong các file âm thanh. + Giấu thông tin trong video. + Giấu thông tin trong văn bản dạng text. - Phân loại theo cách thức tác động lên phương tiện: + Phương pháp chèn dữ liệu: Tìm vị trí trong file dễ bị bỏ qua, và chèn các dữ liệu cần giấu vào đó (ví dụ: dữ liệu được giấu sau các ký tự EOF). + Phương pháp thay thế: Thay thế các phần tử không quan trọng của phương tiện chứa, bằng các dữ liệu của thông điệp cần giấu (vd: thay thế các bit ít quan trọng, thay thế trong miền tần số, các kỹ thuật trải phổ, thống kê…) + Phương pháp tạo các phương tiện chứa: Từ thông điệp cần chuyển đi, sẽ tạo ra hợp lý phương tiện chứa, để phục vụ cho việc truyền thông tin đó. - Phân loại theo mục đích sử dụng: + Giấu thông tin bí mật. + Giấu thông tin thuỷ vân. 1.2.2. Mô hình giấu tin Mô hình giấu tin được mô tả trong Hình 1.2 và Hình 1.3 dưới đây. Trong đó, Hình 1.2 biểu diễn quá trình giấu tin, phương tiện chứa bao gồm các đối tượng được dùng làm môi trường để giấu tin như các tệp Multimedia. Thông Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn/ 13 tin cần giấu là một lượng thông tin mang một ý nghĩa nào đó tuỳ thuộc vào mục đích của người sử dụng. Thông tin được giấu vào trong môi trường chứa nhờ một bộ nhúng (là những chương trình, thuật toán để giấu tin và được thực hiện với một khoá bí mật giống như các hệ mật mã cổ điển). Sau khi giấu tin ta thu được môi trường đã giấu tin và được phân phối trên các phương tiện truyền thông khác nhau. Hình 1.3 chỉ ra các công việc của quá trình giải mã thông tin đã được giấu. Quá trình giải mã tin được thực hiện thông qua một bộ giải mã tương ứng với bộ nhúng thông tin kết hợp với khoá để giải mã thông tin. Khoá để giải mã thông tin có thể giống hoặc khác với khoá để nhúng thông tin. Kết quả thu được gồm môi trường gốc và thông tin đã được giấu. Với một hệ thống giấu tin mật, tính an toàn của dữ liệu cần giấu được quan tâm đặc biệt. Một hệ thống được xem là có độ bảo mật cao nếu độ phức tạp của các thuật toán thám mã khó có thể thực hiện được trên máy tính. Tuy nhiên, một số hệ thống lại quan tâm đến số lượng thông tin được giấu, hoặc quan tâm đến sự ảnh hưởng của thông tin mật đến môi trường chứa dữ liệu. Tổng quát hóa quá trình thực hiện như sau: - Giấu tin: M + F + K → F’ - Giải mã tin giấu: F’ + K → M + F Trong đó: M- Thông tin cần giấu, F - vật mang (ảnh, audio, video,. . .), K - một hoặc nhiều khóa tùy thuộc và ứng dụng, F’ - vật mang chứa thông tin giấu Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn/ 14 Hình 1.2. Mô hình của quá trình giấu tin Hình 1.3. Mô hình của quá trình giải mã tin giấu 1.3. THỦY VÂN SỐ 1.3.1. Khái niệm Thủy vân không phải là một kỹ thuật mới. Nó là một nhánh của kỹ thuật ẩn giấu tin đã tồn tại vài trăm năm trước. Ẩn giấu tin là một kỹ thuật sử dụng cho việc truyền các thông tin mật. Thông điệp được truyền ở đây là một bí mật mà sự tồn tại của nó là chỉ được biết đến bởi các bên liên quan trong giao tiếp. Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn/ 15 Như vậy, có thể định nghĩa, “thủy vân số” là quá trình đó nhúng những dữ liệu (được gọi là “thủy vân” - watermark) vào một đối tượng đa phương tiện theo một cách nào đó, để sau đó có thể phát hiện hoặc trích xuất “thủy vân” cho mục đích xác thực nguồn gốc sản phẩm [16]. “Thủy vân” là một phần đặc trưng của thông tin được nhúng vào các dữ liệu được bảo vệ. Một yêu cầu quan trọng đối với “thủy vân” là rất khó để trích xuất hoặc gỡ bỏ được từ các đối tượng được nhúng “thủy vân” nếu không biết chìa khóa bí mật. Một cách định nghĩa khác về thủy vân số: Thủy vân số là kỹ thuật giấu thông tin theo kiểu đánh dấu (watermarking) để bảo vệ bản quyền đối tượng chứa tin [5]. Một ví dụ của thủy vân số là một dấu hiệu (như chữ ký) trên một bức ảnh để chứng thực nguồn gốc và chủ sở hữu của bức ảnh đó. 1.3.2. Các đặc tính của thủy vân Trước đây, đã có nhiều bài báo đã thảo luận về các đặc tính của thủy vân, một số thuộc tính thường được thảo luận như: tính phức tạp, tính trung thực của hình ảnh, độ tin cậy phát hiện, tính bền vững, dung lượng, bảo mật... Trong thực tế, không thể thiết kế một hệ thống “thủy vân” đảm bảo tất cả các thuộc tính trên. Do đó, việc đảm bảo cân bằng giữa các thuộc tính là thực sự cần thiết và vấn đề đảm bảo cân bằng phải dựa trên sự phân tích ứng dụng một cách cẩn thận, dưới đây là một số thuộc tính thường được quan tâm khi xây dựng và phát triển các ứng dụng thủy vân: - Độ trung thực: Nghĩa là người theo dõi không thể phát hiện ra dấu thủy vân hay nói cách khác dấu thủy vân không làm giảm chất lượng hình ảnh. Để tín hiệu thực sự là không thể cảm thấy thì thông tin phải được nhúng vào những bit ít quan trọng. Tuy nhiên, tín hiệu lại dễ dàng bị loại bỏ trong quá trình nén có tổn thất thông tin. - Tính ẩn: Là khả năng khó bị nhận ra của thủy vân sau khi đã nhúng vào Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn/ 16 tài liệu điện tử, mà chủ yếu là các giác quan của con người. Nói cách khác, các tài liệu điện tử phải chịu ít sự thay đổi về mặt chất lượng khi nhúng vân. - Tính bền vững: Hình ảnh được thủy vân có thể phải trải qua nhiều loại xử lý biến đổi khác nhau, ví dụ, tăng độ tương phản ảnh, lọc thông, làm mờ... Do vậy, dấu thủy vân phải có tính bền vững chịu được các phép biến đổi ảnh cũng như biến đổi tín hiệu số thành tín hiệu tương tự, tương tự thành số và nén... Ngoài ra, ảnh chứa thủy vân phải chịu được các phép biến đổi hình học như di chuyển vị trí, co giãn kích thước và cắt xén. Thủy vân đạt được tính bền vững thực sự khi dấu thủy vân vẫn còn trong dữ liệu sau khi biến đổi và bộ phát hiện/trích xuất vẫn có thể phát hiện ra thủy vân. Ví dụ: Dấu thủy vân vẫn tồn tại trong ảnh sau phép biến đổi hình học nhưng thuật toán phát hiện/trích xuất chỉ phát hiện và đưa ra thủy vân sau khi loại bỏ phép biến đổi. Trong trường hợp, không xác định rõ phép biến đổi để thực hiện biến đổi ngược thì bộ phát hiện/trích xuất không thể phát hiện và đưa ra thủy vân mặc dù thủy vân vẫn còn tồn tại trong ảnh số. Thủy vân có thể được nhúng trong hình ảnh bằng cách thay đổi các giá trị điểm ảnh. Trong trường hợp biến đổi miền không gian, thủy vân đơn giản có thể được nhúng vào trong ảnh bằng cách thay đổi các giá trị điểm ảnh hoặc giá trị các bit ít quan trọng nhất (LSB, CPT). Tuy nhiên, thủy vân bền vững hơn nếu được nhúng vào trong miền biến đổi của hình ảnh bằng cách thay đổi các hệ số. Tính bền vững được hiểu tùy vào mục đích của từng lại thủy vân, ví dụ với thủy vân dùng để bảo vệ bản quyền, thì thủy vân phải bền với các phép tấn công hay biến đổi, trong khi với thủy vân dùng để chống xuyên tạc hoặc đảm bảo toàn vẹn dữ liệu, thì thủy vân phải bị phá hủy ngay khi có sự tác động hoặc tấn công. - Tính dễ hỏng: Tính dễ hỏng là thuộc tính đối ngược với tính bền vững Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn/ 17 của thủy vân. Thuộc tính này thường được ứng dụng trong lược đồ thủy vân dễ vỡ. Với lược đồ này yêu cầu đặt ra là dấu thủy vân hoặc bị phá hủy bởi bất cứ phương thức sao chép nào ngoại trừ các phương pháp sao chép hợp pháp. - Tính bảo mật: Sau khi thủy vân số đã được nhúng vào tài liệu, thì yêu cầu chỉ cho những người có quyền mới có thể chỉnh sửa và phát hiện thủy vân. - Dung lượng giấu: Thuật toán thủy vân cho phép giấu càng nhiều thông tin càng tốt. Tuy nhiên, các yêu cầu trên thường là trái ngược nhau, và người ta phải cân đối giữa các yêu cầu để phù hợp với từng bài toán cụ thể. - Tính hiệu quả: Yêu cầu thuật toán thủy vân phải làm việc được một vùng lớn các ảnh có thể. - Tỷ lệ lỗi sai dương: Là xác suất hệ thống phát hiện nhầm, đó là xác định một mẩu dữ liệu không mang dấu thủy vân là mang dấu thủy vân và ngược lại.Tùy theo ứng dụng mà ảnh hưởng của lỗi là khác nhau, trong một số ứng dụng có thể là rất nghiêm trọng. Do đó, trong ứng dụng, người ta phải tính toán trước sao cho tỷ lệ lỗi sai dương nhỏ hơn mức cho phép. - Khả năng chống giả mạo (tính toàn vẹn): Đối với thủy vân thì khả năng chống giả mạo là yêu cầu vô cùng quan trọng, vì có như vậy mới bảo vệ được bản quyền, minh chứng tính pháp lý của sản phẩm. Để có thể chống lại giả mạo thì bất cứ sự thay đổi nào về nội dung của các ảnh số thì thuỷ vân này sẽ bị huỷ đi. Do đó rất khó làm giả các ảnh số có chứa thuỷ vân. 1.3.3. Phân loại thủy vân Theo không gian xử lý Theo kiểu tài liệu Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên Theo tri giác http://www.lrc-tnu.edu.vn/ 18 Tùy theo từng tiêu chí phân loại mà “Thủy vân” có thể được chia thành nhiều loại khác nhau [8]. Một trong những tiêu chí để phân loại là “miền nhúng” là nơi chứa “thủy vân” khi thực hiện kĩ thuật “thủy vân”. Thủy vân được phân biệt nhau bởi những đặc trưng, tính chất của từng kỹ thuật và ứng dụng những kỹ thuật đó. - Nếu phân biệt theo vùng làm việc thì có thể phân loại theo kỹ thuật thủy vân theo miền không gian hoặc thủy vân theo miền tần số. - Nếu phân loại theo kiểu dữ liệu thì có thể phân loại thủy vân trong text, trong ảnh, trong audio hoặc trong video… - Nếu theo khả năng tri giác của con người, có thể phân loại thủy vân theo thủy vân hiện, thủy vân ẩn hoặc kết hợp. Trong đó thủy vân ẩn được chia làm thủy vân dễ vỡ và thủy vân bền vững. Thủy vân ẩn là hướng được nghiên cứu chủ yếu. Thuỷ vân “dễ vỡ” (fragile) là kỹ thuật nhúng thuỷ vân vào trong ảnh sao cho khi phân bố sản phẩm trong môi trường mở nếu có bất cứ một phép biến đổi nào làm thay đổi đối tượng sản phẩm gốc thì thuỷ vân được giấu trong đối tượng sẽ không còn nguyên vẹn như trước khi giấu. Các kỹ thuật thuỷ vân có tính chất này được sử dụng trong các ứng dụng xác thực thông tin (authentication) và phát hiện xuyên tạc thông tin (tamper detection). Rất dễ Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn/ 19 hiểu vì sao những ứng dụng này cần đến kỹ thuật thuỷ vân dễ vỡ. Ví dụ như để bảo vệ chống xuyên tạc một ảnh nào đó ta nhúng một thuỷ vân vào trong ảnh và sau đó phân phối, quảng bá ảnh đó. Khi cần kiểm tra lại ảnh ta sử dụng hệ thống đọc thủy vân. Nếu không đọc được thuỷ vân hoặc thuỷ vân đã bị sai lệch nhiều so với thuỷ vân ban đầu đã nhúng vào ảnh thì có nghĩa là có thể ảnh đó đã bị thay đổi. Cái khó ở đây là ta phải phân biệt giữa sai lệch thuỷ vân do xuyên tạc và sai lệch do lỗi đường truyền. Ngược lại, với kỹ thuật thuỷ vân dễ vỡ là kỹ thuật thuỷ vân bền vững (robust). Các kỹ thuật thuỷ vân bền vững thường được ứng dụng trong các ứng dụng bảo vệ bản quyền. Trong những ứng dụng đó, thuỷ vân đóng vai trò là thông tin sở hữu của người chủ hợp pháp. Thuỷ vân được nhúng trong sản phẩm như một hình thức dán tem bản quyền. Trong trường hợp như thế, thuỷ vân phải tồn tại bền vững cùng với sản phẩm nhằm chống việc tẩy xoá, làm giả hay biến đổi phá huỷ thuỷ vân. Một yêu cầu lí tưởng đối với thuỷ vân bền vững là nếu muốn loại bỏ thuỷ vân thì chỉ có một cách duy nhất là phá huỷ sản phẩm. Thuỷ vân bền vững lại được chia thành hai loại là thuỷ vân ẩn và thuỷ vân hiện. Thuỷ vân hiện là loại thuỷ vân được hiện ngay trên sản phẩm và người dùng có thể nhìn thấy được giống như các biểu tượng kênh chương trình vô tuyến mà chúng ta thường thấy như: VTV1, VTV3, TTV… Các thuỷ vân hiện trên ảnh thường dưới dạng chìm, mờ hoặc trong suốt để không gây ảnh hưởng đến chất lượng ảnh gốc. Đối với thuỷ vân hiện, thông tin bản quyền hiển thị ngay trên sản phẩm. 1.3.4. Quy trình tạo thủy vân Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn/ 20 Hình 1.5. Mô hình hệ thống thuỷ vân ảnh số Quá trình liên quan đến xử lý thuỷ vân cơ bản gồm 04 bước chính như sau [13]: * Bước 1 - Tạo thuỷ vân Thuỷ vân có thể là một logo hay dãy nhị phân với độ dài cho trước. Thủy vân dạng ảnh có khả năng chống chịu trước các phép xử lý ảnh tốt hơn nhiều hơn so với thủy vân dạng ký tự. Thuỷ vân có thể được biến đổi (bằng mã hoá, chuyển đổi định dạng), trước khi dấu vào ảnh. Các thuật toán nhúng thuỷ vân là một logo được gọi là thuật toán thuỷ vân hợp nhất ảnh (image-fusion). Thuỷ vân dạng ảnh có lợi ích là dễ dàng nhận biết về mặt trực giác và đưa ra một chứng minh đúng đắn về quyền sở hữu ảnh. Bình thường sẽ có một khoá bí mật K dùng để tăng tính bảo mật cho dữ liệu được nhúng. Do tính bền vững được đảm bảo hơn nên thủy vân dạng ảnh được sử dụng nhiều hơn. Để tăng thêm tính an toàn và dung lượng, thì thủy vân trước khi nhúng vào ảnh mang có thể được mã hóa hay nén lại. Theo cơ chế này, đầu tiên thủy vân số sẽ được nén lại để lượng dữ liệu thủy vân có thể tăng lên, sau đó được Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn/
- Xem thêm -