Đăng ký Đăng nhập
Trang chủ Xác thực sự toàn vẹn của cơ sở dữ liệu quan hệ bằng kỹ thuật thủy vân số dựa vào...

Tài liệu Xác thực sự toàn vẹn của cơ sở dữ liệu quan hệ bằng kỹ thuật thủy vân số dựa vào hệ mật mã khóa công khai

.PDF
71
68169
129

Mô tả:

i ĐẠI HỌC THÁI NGUYÊN TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN & TRUYỀN THÔNG DƢƠNG THỊ LAN HƢƠNG XÁC THỰC SỰ TOÀN VẸN CỦA CƠ SỞ DỮ LIỆU QUAN HỆ BẰNG KỸ THUẬT THỦY VÂN SỐ DỰA VÀO HỆ MẬT MÃ KHÓA CÔNG KHAI Chuyên ngành: Khoa học máy tính Mã số: 60 48 01 01 LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH NGƢỜI HƢỚNG DẪN KHOA HỌC PGS.TS BÙI THẾ HỒNG Thái Nguyên, 2014 Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ ii LỜI CAM ĐOAN Tôi xin cam đoan: luận văn “Xác thực sự toàn vẹn của cơ sở dữ liệu quan hệ bằng kỹ thuật thủy vân số dựa vào hệ mật mã khóa công khai” là công trình nghiên cứu của cá nhân tôi, các nội dung nghiên cứu và trình bày trong luận văn trung thực, rõ ràng. Tác giả luận văn Dƣơng Thị Lan Hƣơng Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ iii LỜI CẢM ƠN Tôi xin cảm ơn Trƣờng Đại học Công nghệ thông tin và Truyền thông Đại học Thái Nguyên đã tạo điều kiện thuận lợi cho tôi hoàn thành khóa học và khóa luận này. Tôi xin gửi lời cảm ơn chân thành nhất tới PGS.TS Bùi Thế Hồng. Thầy đã cho tôi những định hƣớng nghiên cứu, giúp đỡ tôi trong suốt thời gian hoàn thành luận văn này. Để hoàn thành khóa học còn có công sức vô cùng to lớn của các thầy, cô đã nhiệt tình giảng dạy, trang bị cho tôi những kiến thức quý báu trong thời gian học tập tại trƣờng. Cảm ơn các bạn trong lớp đã nhiệt tình giúp đỡ trong suốt thời gian học tập tại trƣờng. Thái Nguyên, ngày tháng năm 2014 Học viên Dƣơng Thị Lan Hƣơng Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ iv MỤC LỤC Trang LỜI CAM ĐOAN ............................................................................................. ii LỜI CẢM ƠN .................................................................................................. iii MỤC LỤC ........................................................................................................ iv DANH MỤC CÁC KÝ HIỆU, VIẾT TẮT ..................................................... vi DANH MỤC CÁC BẢNG.............................................................................. vii DANH MỤC CÁC HÌNH .............................................................................. viii MỞ ĐẦU ........................................................................................................... 1 CHƢƠNG I. TỔNG QUAN VỀ THỦY VÂN SỐ 1.1. Tổng quan về thủy vân cơ sở dữ liệu quan hệ .......................................... 3 1.1.1. Một số khái niệm cơ bản ................................................................... 3 1.1.2. Các yêu cầu cơ bản của thuỷ vân trên cơ sở dữ liệu quan hệ ........... 9 1.1.3. Những tấn công trên hệ thuỷ vân cơ sở dữ liệu quan hệ ................ 11 1.1.4. Các ứng dụng chủ yếu của thuỷ vân cơ sở dữ liệu quan hệ............ 13 1.2. Các kỹ thuật thủy vân số cho các cơ sở dữ liệu quan hệ ........................ 14 1.2.1. Kỹ thuật thủy vân số làm thay đổi dữ liệu trong CSDL quan hệ ... 15 1.2.2. Các kỹ thuật thủy vân số không làm thay đổi dữ liệu trong CSDL 25 1.3. Nhận xét về các lƣợc đồ thủy vân ........................................................... 27 1.4. Kết luận ................................................................................................... 31 CHƢƠNG II. XÁC THỰC SỰ TOÀN VẸN CỦA CƠ SỞ DỮ LIỆU QUAN HỆ BẰNG KĨ THUẬT THỦY VÂN DỰA VÀO HỆ MẬT MÃ KHÓA CÔNG KHAI 2.1. Giới thiệu................................................................................................. 32 2.2. Kỹ thuật thủy vân số với cơ chế xác thực công khai .............................. 33 2.2.1. Ý tƣởng của kỹ thuật thủy vân số với cơ chế xác thực công khai .. 33 Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ v 2.2.2. Tạo ra mã xác thực .......................................................................... 36 2.2.3. Quá trình xác thực tính toàn vẹn của dữ liệu .................................. 38 2.2.4. So sánh giữa hai thủy vân ............................................................... 41 2.3. Kết luận ................................................................................................... 42 CHƢƠNG III. XÂY DỰNG CHƢƠNG TRÌNH THỬ NGHIỆM 3.1. Xây dựng chƣơng trình ........................................................................... 43 3.1.1. Bài toán thực nghiệm ...................................................................... 43 3.1.2. Thiết kế chƣơng trình ...................................................................... 43 3.2. Thử nghiệm chƣơng trình ....................................................................... 51 3.3. Đánh giá kết quả thử nghiệm .................................................................. 52 KẾT LUẬN VÀ KIẾN NGHỊ......................................................................... 60 TÀI LIỆU THAM KHẢO ............................................................................... 61 Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ vi DANH MỤC CÁC KÝ HIỆU, VIẾT TẮT Ký hiệu Diễn giải Ý nghĩa Cơ sở dữ liệu CSDL MKSD Multi Key Single Data Đa khóa, đơn dữ liệu SKMD Single Key Multi Data Đơn khóa, đa dữ liệu LSB Least Significant Bit Bít ít ý nghĩa nhất EMC Encrypted Mark Code Mã đánh dấu đƣợc mã hóa SVR Support Vector Regression Hồi quy vector hỗ trợ Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ vii DANH MỤC CÁC BẢNG Bảng 2.1: Giải thích các ký hiệu sử dụng trong lƣợc đồ thủy vân.................. 33 Bảng 3.1: Thông tin kết quả học tập của sinh viên ......................................... 49 Bảng 3.2: Kết quả thử nghiệm ........................................................................ 58 Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ viii DANH MỤC CÁC HÌNH Hình 1.1. Sơ đồ mô tả lƣợc đồ thủy vân cơ sở dữ liệu quan hệ ........................ 6 Hình 3.1 Giao diện chính của chƣơng trình .................................................... 44 Hình 3.2 Giao diện chính của chƣơng trình .................................................... 45 Hình 3.3: Giao diện kết quả tạo cặp khóa ....................................................... 46 Hình 3.4: Giao diện minh họa các bƣớc tạo ra mã xác thực ........................... 46 Hình 3.5: Giao diện minh họa các bƣớc lấy thủy vân WM’’.......................... 47 Hình 3.6: Giao diện thông báo kết quả kiểm tra dữ liệu ................................. 48 Hình 3.7: Giao diện kết quả kiểm tra dữ liệu .................................................. 48 Hình 3.8: CSDL thử nghiệm trong SQL 2012 ................................................ 50 Hình 3.9: Thủy vân số gốc đƣợc dùng trong thử nghiệm ............................... 51 Hình 3.10: Giao diện kết quả sau khi chạy với mô hình thử nghiệm 1 .......... 52 Hình 3.11: a) Thủy vân gốc; b) Thủy vân thu đƣợc sau khi không thay đổi dữ liệu theo thử nghiệm 1..................................................................................... 53 Hình 3.12: Giao diện thông báo kết quả sau khi chạy với mô hình thử nghiệm 2 ......................................................................................................................... 53 Hình 3.13: Giao diện kết quả sau khi chạy với mô hình thử nghiệm 2 .......... 54 Hình 3.14: a) Thủy vân gốc; b) Thủy vân thu đƣợc sau khi thay đổi dữ liệu theo thử nghiệm 2.................................................................................................... 55 Hình 3.15: Giao diện thông báo kết quả sau khi chạy với mô hình thử nghiệm 3 ......................................................................................................................... 55 Hình 3.16: Giao diện kết quả sau khi chạy với mô hình thử nghiệm 3 .......... 56 Hình 3.17: a) Thủy vân gốc; b) Thủy vân thu đƣợc sau khi thay đổi dữ liệu theo thử nghiệm 3.................................................................................................... 56 Hình 3.18: Giao diện thông báo kết quả sau khi chạy với mô hình thử nghiệm 4 ......................................................................................................................... 57 Hình 3.19: Giao diện kết quả sau khi chạy với mô hình thử nghiệm 4 .......... 57 Hình 3.20: a) Thủy vân gốc; b) Thủy vân thu đƣợc sau khi thay đổi dữ liệu theo thử nghiệm 4.................................................................................................... 58 Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ 1 MỞ ĐẦU Ngày nay, nhờ có Internet việc trao đổi các dữ liệu số đã trở nên cực kỳ đơn giản nhƣng cũng vì thế mà các dữ liệu này rất dễ bị sao chép và sửa đổi. Vì vậy, có một vấn đề đặt ra là “Bảo vệ quyền sở hữu trí tuệ và tính toàn vẹn của những dữ liệu này nhƣ thế nào?”. Một trong những kỹ thuật đang đƣợc nhiều nhà nghiên cứu quan tâm để giải quyết vấn đề này đó là kỹ thuật thủy vân số. Kỹ thuật này có thể đƣợc sử dụng để bảo vệ bản quyền và bảo vệ sự toàn vẹn của các dữ liệu số chống lại sự sao chép bất hợp pháp cũng nhƣ sự giả mạo và xuyên tạc. Gần đây, các tác giả của bài báo [8] đã đƣa ra một lƣợc đồ thủy vân mới có thể xác thực một cách công khai sự toàn vẹn của cơ sở dữ liệu quan hệ dựa vào hệ mật mã khóa công khai. Kỹ thuật này giúp ngƣời cung cấp cũng nhƣ ngƣời sử dụng có đƣợc một cơ chế có thể kiểm tra đƣợc tính toàn vẹn của các cơ sở dữ liệu đã đƣợc thủy vân. Bài báo trên đã mở ra một hƣớng mới trong việc xác thực tính nguyên bản của dữ liệu. Vì vậy để tiếp tục nghiên cứu theo hƣớng này, học viên đã lựa chọn đề tài: “Xác thực sự toàn vẹn của cơ sở dữ liệu quan hệ bằng kỹ thuật thủy vân số dựa vào hệ mật mã khóa công khai”. Mục tiêu của đề tài là: Nghiên cứu tổng quan về thủy vân cơ sở dữ liệu quan hệ nhƣ các khái niệm, định nghĩa cơ bản liên quan đến CSDL quan hệ, các mô hình dữ liệu, cụ thể là mô hình thực thể kết hợp và mô hình dữ liệu quan hệ. Nghiên cứu tổng quan về kỹ thuật thủy vân số nói chung nhƣ khái niệm thủy vân số, quy trình thực hiện thủy vân số. Từ đó nghiên cứu chi tiết một kỹ thuật thủy vân số cho cơ sở dữ liệu quan hệ để xác thực tính toàn vẹn của cơ sở dữ liệu. Cuối cùng là viết chƣơng trình demo để thử nghiệm kỹ thuật đã nghiên cứu và đánh giá. Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ 2 Ngoài phần mở đầu và phần kết luận, luận văn bao gồm ba chƣơng nhƣ sau: Chƣơng I. Tổng quan thủy vân số Trình bày những kiến thức cơ bản liên quan đến thủy vân số nhƣ: Khái niệm thủy vân số, khái niệm thủy vân cơ sở dữ liệu quan hệ, khóa thủy vân, lƣợc đồ thủy vân, các ứng dụng của thủy vân số,.... Đồng thời cũng trình bày các kỹ thuật thủy vân số cho các cơ sở dữ liệu, đƣợc chia ra làm hai nhóm kỹ thuật, đó là: Các kỹ thuật thủy vân số làm thay đổi dữ liệu và các kỹ thuật thủy vân số không làm thay đổi dữ liệu trong CSDL quan hệ. Đồng thời cũng đƣa ra một số nhận xét về các lƣợc đồ thủy vân. Chƣơng II. Xác thực sự toàn vẹn của cơ sở dữ liệu quan hệ bằng kỹ thuật thủy vân dựa vào hệ mật mã khóa công khai Trình bày chi tiết một kỹ thuật thủy vân số. Đó là kỹ thuật thủy vân số với cơ chế xác thực công khai. Kỹ thuật này bao gồm hai giai đoạn: giai đoạn tạo mã xác thực (dành cho chủ sở hữu CSDL) và giai đoạn xác thực tính toàn vẹn của dữ liệu (dành cho ngƣời sử dụng CSDL). Chƣơng III. Xây dựng chƣơng trình thử nghiệm Trình bày bài toán, dữ liệu thử nghiệm và các mô hình thử nghiệm. Dùng chƣơng trình demo để chạy các mô hình thử nghiệm và đƣa ra kết quả đánh giá cho chƣơng trình demo. Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ 3 CHƢƠNG I. TỔNG QUAN VỀ THỦY VÂN SỐ 1.1. Tổng quan về thủy vân cơ sở dữ liệu quan hệ 1.1.1. Một số khái niệm cơ bản  Thủy vân Từ “thuỷ vân” có xuất xứ từ kỹ thuật đánh dấu nƣớc thời xƣa. Đây là kỹ thuật đánh dấu chìm một hình ảnh, một logo, hay một dữ liệu nào đó lên trên giấy nhằm mục đích trang trí và phân biệt đƣợc xuất xứ của sản phẩm giấy. Nhƣ vậy, thông tin cần giấu đƣợc gọi là thuỷ vân (watermark). Thuỷ vân mô tả thông tin có thể đƣợc dùng để chứng minh quyền sở hữu hoặc chống xuyên tạc. Có hai loại thuỷ vân, đó là: thuỷ vân bền vững và thuỷ dễ vỡ.  Thuỷ vân bền vững (robust watermark): Là thuỷ vân tồn tại bền vững cùng với dữ liệu, không dễ dàng bị phá huỷ trƣớc những biến đổi, tấn công lên dữ liệu. Các kỹ thuật này thƣờng đƣợc dùng trong các ứng dụng bảo vệ bản quyền, chứng minh quyền sở hữu.  Thuỷ vân dễ vỡ (fragile watermark): Là thuỷ vân dễ bị biến đổi trƣớc những biến đổi hay tấn công lên dữ liệu. Các kỹ thuật này thƣờng đƣợc dùng trong các ứng dụng nhận thực thông tin, đảm bảo sự toàn vẹn dữ liệu.  Thủy vân cơ sở dữ liệu quan hệ Ngày nay, việc sử dụng các cơ sở dữ liệu trong các ứng dụng càng ngày càng tăng lên đang tạo ra một nhu cầu tƣơng tự đối với thủy vân cơ sở dữ liệu. Internet hiện đang đƣa đến một sức ép rất nặng nề cho những ngƣời muốn bảo vệ dữ liệu trong việc tạo ra các dịch vụ (thƣờng đƣợc gọi là các dịch vụ web Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ 4 hoặc các tiện ích điện tử) cho phép ngƣời sử dụng tìm kiếm và truy cập cơ sở dữ liệu từ xa. Mặc dù xu hƣớng này là hữu ích cho ngƣời dùng cuối nhƣng nó cũng bộc lộ một mối nguy hiểm cho những nhà cung cấp dữ liệu trƣớc những kẻ trộm cắp dữ liệu. Do đó, những ngƣời cung cấp dữ liệu đòi hỏi phải có công nghệ nhận dạng đƣợc những bản sao các cơ sở dữ liệu của họ bị đánh cắp. Thủy vân cơ sở dữ liệu quan hệ là một kỹ thuật nhúng một số thông tin nào đó (đƣợc gọi là thông tin thủy vân W) vào cơ sở dữ liệu quan hệ nhằm mục đích bảo vệ bản quyền hoặc đảm bảo sự toàn vẹn cho cơ sở dữ liệu này. Thủy vân có thể ở dạng ẩn hoặc hiện và có thể là bền vững hoặc dễ vỡ.  Khóa thủy vân Để chủ sở hữu cơ sở dữ liệu có thể giữ bí mật cho thông tin thủy vân W và là ngƣời duy nhất có thể tìm lại đƣợc thông tin này thì cần phải trộn W với một dữ liệu đƣợc gọi là khóa do chính chủ cơ sở dữ liệu lựa chọn. Thông tin thứ hai này đƣợc gọi là khóa thủy vân. Khóa thủy vân là một lƣợng dữ liệu do chủ sở hữu cơ sở dữ liệu lựa chọn và nhằm mục đích xác định thủy vân trong lƣợc đồ thủy vân. Ký hiệu là K. Khóa K sẽ đƣợc kết hợp với thủy vân W để nhúng vào cơ sở dữ liệu. Khóa thủy vân chính là mấu chốt của lƣợc đồ thủy vân cơ sở dữ liệu có sử dụng khóa thủy vân. Khóa thủy vân sẽ đƣợc nhúng vào trong cơ sở dữ liệu quan hệ bằng nhiều cách. Thông thƣờng khóa thủy vân sẽ đƣợc nhúng với dữ liệu trong cơ sở dữ liệu quan hệ rồi đƣa vào trong thuật toán sử dụng. Điều quan trọng ở đây chính là việc giấu khóa thủy vân vào trong thuật toán nhƣ thế nào để không bị phát hiện đồng thời có thể chứng minh đƣợc đây chính là cơ sở Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ 5 dữ liệu quan hệ của mình. Hay nói cách khác, việc đƣa khóa vào trong cơ sở dữ liệu quan hệ là một trong những điểm quan trọng của bài toán bảo vệ bản quyền và đảm bảo sự toàn vẹn dữ liệu trong cơ sở dữ liệu quan hệ có sử dụng khóa. Một trong những cách giấu khóa hữu hiệu nhất là sử dụng hàm băm vì kỹ thuật này đảm bảo đƣợc yêu cầu bảo mật cũng nhƣ chi phí tính toán. Hàm băm (Hash function) là giải thuật nhằm sinh ra các giá trị băm tƣơng ứng với mỗi khối dữ liệu (có thể là một chuỗi kí tự, một đối tƣợng, v.v...). Ký hiệu là H. Cho hàm băm H thao tác trên một thông điệp đầu vào có độ dài tùy ý M và kết quả là một chuỗi bít có độ dài cố định h: h = H(M). Hàm này có các đặc trƣng sau: i) với M đã cho, dễ dàng tính đƣợc h ii) với h đã cho, khó tìm đƣợc M sao cho H(M) = h iii) với M đã cho, khó tìm đƣợc một thông điệp khác M’ sao cho H(M)= H(M’). Trong lƣợc đồ thủy vân trình bày ở chƣơng II, một hàm băm sẽ đƣợc sử dụng để băm khóa thủy vân cùng với cơ sở dữ liệu. Hàm H(K || r.A) băm khóa K cùng với giá trị thuộc tính A của bộ r, hàm H(K || ri.A1 || ri.A2 || …. || ri.Ay) băm khóa K cùng với các giá trị thuộc tính của bộ ri của cơ sở dữ liệu, trong đó || là phép ghép nối. Trong thực tế, hai hàm băm thông dụng nhất là MD5 và SHA [4]. Trong phần thử nghiệm, luận văn dùng hàm băm MD5.  Lƣợc đồ thủy vân Lƣợc đồ thủy vân cơ sở dữ liệu quan hệ bao gồm 2 phần: nhúng thủy vân và phát hiện thủy vân [2]. Khi nhúng thủy vân, một khóa thủy vân K do Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ 6 chủ sở hữu cơ sở dữ liệu tự chọn sẽ đƣợc sử dụng để nhúng thủy vân W vào cơ sở dữ liệu gốc. Sau khi nhúng thủy vân, các cơ sở dữ liệu sẽ đƣợc đƣa vào môi trƣờng Internet. Để xác minh quyền sở hữu của một cơ sở dữ liệu đáng ngờ, cần phải lấy đƣợc thủy vân đã nhúng trong CSDL này. Nếu thủy vân lấy ra trùng với thủy vân đã nhúng, điều này chứng tỏ đây là CSDL của chủ sở hữu. Tuy nhiên, nếu thủy vân lấy ra khác với thủy vân đã nhúng thì CSDL của chủ sở hữu đã bị thay đổi. Hình 1.1 là sơ đồ mô tả lƣợc đồ thủy vân cơ sở dữ liệu quan hệ [2]. Khóa K Cơ sở dữ liệu gốc Cơ sở dữ liệu đã nhúng thủy vân Nhúng thủy vân Thông tin thủy vân (W) Khóa K Cơ sở dữ liệu nghi ngờ Khẳng định đúng hoặc sai Phát hiện thủy vân Thông tin thủy vân (W) Hình 1.1. Sơ đồ mô tả lƣợc đồ thủy vân cơ sở dữ liệu quan hệ Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ 7  Sự cần thiết của các kỹ thuật thủy vân cơ sở dữ liệu quan hệ Hiện nay, có khá nhiều tài liệu về thuỷ vân các dữ liệu đa phƣơng tiện. Hầu hết các kỹ thuật này ban đầu đƣợc phát triển cho các bức ảnh tĩnh và sau đó đƣợc mở rộng cho video và audio. Cho dù có khá nhiều điều có thể học hỏi đƣợc từ các kết quả đã đạt đƣợc về thuỷ vân dữ liệu đa phƣơng tiện nhƣng cho đến nay vẫn còn rất nhiều thách thức kỹ thuật mới đối với lĩnh vực thuỷ vân cơ sở dữ liệu quan hệ bởi vì các dữ liệu quan hệ và các dữ liệu đa phƣơng tiện khác nhau ở khá nhiều khía cạnh quan trọng. Những khác biệt đó bao gồm: Một đối tƣợng đa phƣơng tiện chứa một lƣợng rất lớn các bít với sự dƣ thừa đáng kể. Vì vậy, các kỹ thuật thuỷ vân có một cái mặt nạ (vỏ) rất rộng để có thể giấu tin vào trong. Trong khi đó, một quan hệ cơ sở dữ liệu chứa các bộ, mỗi bộ này biểu diễn một đối tƣợng riêng biệt. Thuỷ vân cần phải đƣợc trải rộng trên tất cả các đối tƣợng riêng biệt này. Vị trí tƣơng đối về không gian/thời gian của các phần khác nhau của một đối tƣợng đa phƣơng tiện có đặc thù là không thay đổi. Nhƣng các bộ của một quan hệ lại cấu thành một tập hợp, do vậy không cần phải áp đặt một thứ tự nào giữa các đối tƣợng này. Các phần khác nhau của một đối tƣợng đa phƣơng tiện không thể bị cắt bỏ hoặc thay thế một cách tuỳ ý mà không gây ra những thay đổi về cảm quan trong đối tƣợng. Ngƣợc lại, việc thêm, bớt, và cập nhật các bộ của một bảng quan hệ lại là những phép toán chuẩn trong cơ sở dữ liệu. Do đó, sẽ rất khó để phát hiện những xâm hại đơn giản nhƣ xóa bỏ một số bộ hoặc thay thế chúng bằng các bộ của các quan hệ khác. Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ 8 Do có những khác nhau nhƣ đã nêu trên đây mà các kỹ thuật đƣợc phát triển cho các dữ liệu đa phƣơng tiện không thể đƣợc sử dụng trực tiếp để thuỷ vân các dữ liệu quan hệ. Thật vậy, giả sử ánh xạ một quan hệ thành một bức ảnh bằng cách xem mỗi giá trị thuộc tính nhƣ một điểm ảnh. Nhƣng không may là “bức ảnh” đƣợc định nghĩa nhƣ vậy sẽ thiếu rất nhiều tính chất của một bức ảnh thật. Ví dụ, các điểm ảnh nằm cạnh nhau trong một bức ảnh thật thƣờng có quan hệ mật thiết với nhau và quan hệ này là cơ sở cho nhiều kỹ thuật thuỷ vân ảnh tĩnh. Các kỹ thuật thuỷ vân trên miền biến đổi của ảnh thƣờng thực hiện theo quy trình: trƣớc hết áp dụng một phép biến đổi (cosine rời rạc - DCT, sóng nhỏ - DWT, . . .) miền giá trị của bức ảnh, sau đó nhúng thuỷ vân vào miền đã biến đổi rồi biến đổi ngƣợc trở lại. Cách làm này trải các tín hiệu thuỷ vân nhƣ phủ một màn nhiễu trên toàn bộ bức ảnh. Áp dụng trực tiếp các kỹ thuật này cho một quan hệ sẽ làm sai lệch giá trị của tất cả các thuộc tính. Điều đó có thể sẽ không đƣợc chấp nhận. Hơn nữa, một thuỷ vân nhƣ vậy có thể không tồn tại đƣợc ngay cả trƣớc những cập nhật nhỏ đối với quan hệ. Các kỹ thuật thủy vân văn bản thƣờng lợi dụng các tính chất đặc biệt của văn bản đã đƣợc định dạng. Thủy vân thƣờng đƣợc nhúng vào văn bản bằng cách thay đổi khoảng cách giữa các từ và các dòng văn bản. Một số kỹ thuật dựa vào việc nhấn mạnh một vài câu trong văn bản. Nhìn chung, các kỹ thuật này có thể sử dụng để thủy vân các quan hệ chỉ chứa các thuộc tính kiểu văn bản, còn đối với các quan hệ chứa các thuộc tính kiểu đơn giản thì rất khó áp dụng. Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ 9 1.1.2. Các yêu cầu cơ bản của thuỷ vân trên cơ sở dữ liệu quan hệ Chúng ta có thể thấy rằng thủy vân các dữ liệu quan hệ có những thách thức kỹ thuật đáng kể và có các ứng dụng thực tế có ý nghĩa xứng đáng đƣợc quan tâm thích đáng từ phía cộng đồng những ngƣời nghiên cứu cơ sở dữ liệu. Cần phải xác định một hệ thống thủy vân và kèm theo đó là phát triển các kỹ thuật nhất định. Những kỹ thuật này chắc chắn là sẽ dựa phần lớn vào các nguyên tắc thủy vân đang tồn tại. Tuy nhiên, chúng cũng sẽ đòi hỏi phải có những mở rộng và các sáng kiến mới. Để minh họa cho sự khả thi của một lƣợc đồ thủy vân cơ sở dữ liệu quan hệ, ở đây trình bày một kỹ thuật hữu hiệu thỏa mãn những tiêu chuẩn của một hệ thống thủy vân. Kỹ thuật này chỉ đánh dấu các thuộc tính kiểu số và giả thiết là các thuộc tính đƣợc đánh dấu có thể chấp nhận những thay đổi nhỏ ở một số giá trị. Ý tƣởng cơ bản là đảm bảo tại một số vị trí bit của một số thuộc tính trong một số bộ có chứa các giá trị nhất định. Các bộ, các thuộc tính trong một bộ, các vị trí bit trong một thuộc tính và các giá trị bit nhất định này đều phải đƣợc xác định một cách chính xác và logic dƣới sự kiểm soát của một khóa bí mật của chủ nhân quan hệ. Mẫu bit này sẽ hình thành ra thủy vân. Chỉ duy nhất chủ nhân của khóa bí mật mới có thể tìm lại đƣợc thủy vân với một xác suất cao. Các phân tích chi tiết chỉ ra rằng thủy vân này có thể đứng vững trƣớc một loạt các tấn công gây hại khác nhau. Để đơn giản trong khi biện luận, phần này sử dụng ba nhân vật điển hình vẫn thƣờng đƣợc dùng trong các ví dụ về mật mã, giấu tin và thủy vân. Đó là một cô gái tên là Alice và bạn trai của cô tên là Bob. Hai ngƣời này thƣờng hay gửi thƣ cho nhau và ở giữa là một anh chàng tên là Mallory thƣờng xuyên làm phiền họ. Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ 10 bộ, trong đó cô đã Giả dụ, Alice là chủ nhân của quan hệ R chứa đánh dấu bộ. Hệ thống thủy vân cần phải thỏa mãn những tính chất sau đây:  Khả năng có thể phát hiện (Detectability) Alice cần phải có khả năng phát hiện thủy vân của cô bằng cách xem xét bộ từ cơ sở dữ liệu nghi ngờ. Rõ ràng là nếu mẫu bít của cô (thủy vân) có mặt ở tất cả bộ thì cô có lý do xác đáng để nghi ngờ có sự sao chép trái phép. Tuy nhiên, Alice cũng có thể ngờ vực ngay cả khi mẫu của cô chỉ có mặt ở ít nhất là bộ ( ), trong đó phụ thuộc vào và một giá trị trƣớc, đƣợc gọi là mức ý nghĩa của phép thử. Giá trị của cho đƣợc xác định sao cho xác suất để Alice sẽ tìm thấy mẫu bit của cô trong ít nhất bộ từ bộ là nhỏ hơn .  Tính bền vững (Robustness) Các thủy vân cần phải bền vững trƣớc những tấn công nhằm xóa bỏ chúng. Ví thể với tƣ cách là kẻ tấn công, Mallory thay đổi bộ trong quan hệ R của Alice. Chúng ta nói rằng thủy vân là an toàn đối với tấn công này nếu kẻ tấn công không thể phá hủy các dấu hiệu thủy vân ở ít nhất bộ, trong đó phụ thuộc vào và nhƣ đã nói ở trên.  Cập nhật phần tăng thêm (Incremental Updatability) Sau khi có quan hệ R đã thủy vân, Alice có thể cập nhật R khi cần thiết mà không làm hỏng thủy vân. Khi Alice thêm/ bớt các bộ hoặc sửa đổi các giá trị của các thuộc tính của R, thủy vân cần phải có khả năng cập nhật trên những phần gia tăng. Tức là, các giá trị thủy vân chỉ phải tính toán lại đối với các bộ đƣợc thêm vào hoặc bị sửa đổi. Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ 11  Không dễ cảm nhận đƣợc (Imperceptibility) Thuỷ vân ẩn, không dễ nhận thấy đƣợc bằng mắt thƣờng của con ngƣời. Sự thay đổi do các dấu hiệu thuỷ vân gây ra cho dữ liệu quan hệ không đƣợc làm giảm giá trị sử dụng của cơ sở dữ liệu. Hơn nữa, các phép đo thống kê thông thƣờng nhƣ trung bình, phƣơng sai của các thuộc tính số cũng không nên bị ảnh hƣởng.  Hệ thống mù ( Blind System) Việc phát hiện thuỷ vân không đòi hỏi các thông tin về cơ sở dữ liệu gốc và cả thuỷ vân gốc. Một hệ thống thủy vân nhƣ vậy đƣợc gọi là hệ thống mù. Tính chất này rất quan trọng vì nó cho phép có thể phát hiện thuỷ vân trong bản sao của quan hệ cơ sở dữ liệu cho dù quan hệ gốc đã đƣợc cập nhật. 1.1.3. Những tấn công trên hệ thuỷ vân cơ sở dữ liệu quan hệ Vì các quan hệ cơ sở dữ liệu luôn đƣợc cập nhật nên các thuỷ vân đƣợc giấu trong một quan hệ có thể bị mất do những cập nhật thông thƣờng cũng nhƣ các tấn công có chủ đích.  Cập nhật thông thƣờng Giả sử Mallory lấy trộm dữ liệu của Alice mà không nhận ra nó đã đƣợc thủy vân. Sau đó, Mallory có thể cập nhật dữ liệu đã ăn trộm khi anh ta sử dụng nó. Kỹ thuật đánh dấu cần đảm bảo rằng Alice không bị mất thủy vân của cô ngay trong các dữ liệu bị ăn trộm, thậm chí đối với cả những cập nhật của Mallory. Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ 12 Tức là các phép toán cập nhật thông thƣờng nhƣ xóa, sửa, bổ sung các bộ trong cơ sở dữ liệu quan hệ. Các kỹ thuật thuỷ vân cần đảm bảo rằng ngƣời chủ cơ sở dữ liệu không bị mất thuỷ vân ngay trong dữ liệu bị kẻ khác ăn trộm, thậm chí đối với những cập nhật của tên trộm đó.  Tấn công có chủ đích Mallory có thể biết dữ liệu anh ta ăn trộm có chứa thủy vân, nhƣng anh ta có thể cố xóa thủy vân này hoặc thử dùng các phƣơng tiện khác để đòi quyền sở hữu trái phép. Hệ thống đánh dấu cần phải bảo vệ Alice trƣớc những tấn công gây hại của Mallory. Nghĩa là các cơ sở dữ liệu có thể bị những kẻ xấu ăn trộm, tấn công nhằm mục đích đòi quyền sở hữu trái phép hay phá huỷ dữ liệu, phá huỷ thuỷ vân,... Do đó, hệ thống thuỷ vân cần phải bảo vệ ngƣời chủ cơ sở dữ liệu trƣớc những tấn công gây hại của kẻ trộm. Một số tấn công gây hại nhƣ : Tấn công vào các bít: Cách tấn công gây hại đơn giản nhất là cố gắng phá huỷ thuỷ vân bằng cách cập nhật một số bít. Nếu tên trộm Mallory có thể thay đổi tất cả các bít, thì anh ta có thể dễ dàng phá huỷ thuỷ vân. Tuy nhiên, việc này cũng làm cho dữ liệu của anh ta không còn sử dụng đƣợc nữa. Do đó, tác hại của một tấn công cần phải đƣợc xem xét trên cơ sở mối quan hệ giữa số bít mà Mallory và Alice thay đổi, vì mỗi thay đổi có thể đƣợc coi nhƣ một sai sót. Càng có nhiều sai sót càng làm cho dữ liệu kém hữu dụng. Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/
- Xem thêm -

Tài liệu liên quan