BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƢỜNG ĐẠI HỌC SƢ PHẠM HÀ NỘI 2
TRẦN THỊ KIM DUNG
BẢO VỆ SỰ TOÀN VẸN CỦA CƠ SỞ DỮ LIỆU
QUAN HỆ BẰNG KỸ THUẬT THỦY VÂN
LUẬN VĂN THẠC SĨ MÁY TÍNH
HÀ NỘI, 2014
BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƢỜNG ĐẠI HỌC SƢ PHẠM HÀ NỘI 2
TRẦN THỊ KIM DUNG
BẢO VỆ SỰ TOÀN VẸN CỦA CƠ SỞ DỮ LIỆU
QUAN HỆ BẰNG KỸ THUẬT THỦY VÂN
Chuyên ngành: KHOA HỌC MÁY TÍNH
Mã số: 60 48 01 01
LUẬN VĂN THẠC SĨ MÁY TÍNH
Ngƣời hƣớng dẫn khoa học: PGS. TS BÙI THẾ HỒNG
HÀ NỘI, 2014
LỜI CẢM ƠN
Để hoàn thành luận văn này tôi đã nhận đƣợc sự giúp đỡ tận tình của
thầy hƣớng dẫn khoa học, của các thầy cô trƣờng Đại học Sƣ phạm Hà Nội 2.
Tôi xin chân thành cảm ơn các thầy cô trƣờng Đại học Sƣ phạm Hà Nội 2 đã
tạo điều kiện học tập, nghiên cứu và giúp đỡ tôi rất nhiều trong quá trình làm
luận văn. Đặc biệt tôi xin cảm ơn thầy PGS.TS Bùi Thế Hồng đã tận tình
hƣớng dẫn, chỉ bảo tôi trong suốt quá trình học tập, nghiên cứu đề tài và giúp
tôi hoàn thành bản luận văn này.
Vĩnh Phúc, ngày 12 tháng 12 năm 2014
Học viên
Trần Thị Kim Dung
LỜI CAM ĐOAN
Tôi xin cam đoan luận văn “Bảo vệ sự toàn vẹn của cơ sở dữ liệu
quan hệ bằng kỹ thuật thủy vân” là kết quả nghiên cứu của riêng tôi dƣới sự
hƣớng dẫn khoa học của PGS. TS Bùi Thế Hồng.
Các số liệu, kết quả nêu trong luận văn là trung thực và chƣa từng đƣợc
công bố trong bất kỳ công trình nào khác.
Học viên
Trần Thị Kim Dung
MỤC LỤC
MỞ ĐẦU ............................................................................................................ 1
1. Lý do chọn đề tài ............................................................................................ 1
2. Mục đích nghiên cứu ...................................................................................... 1
3. Nhiệm vụ nghiên cứu ..................................................................................... 2
4. Đối tƣợng và phạm vi nghiên cứu .................................................................. 2
7. Cấu trúc luận văn ........................................................................................... 2
CHƢƠNG 1: TỔNG QUAN VỀ KỸ THUẬT THỦY VÂN ............................ 4
CHO CƠ SỞ DỮ LIỆU QUAN HỆ................................................................... 4
1.1. Kiến thức cơ bản về giấu tin ...................................................................... 4
1.1.1. Khái niệm giấu tin ................................................................................... 4
1.1.2. Phân loại các kỹ thuật giấu tin ................................................................. 5
1.1.3. Môi trƣờng giấu tin .................................................................................. 6
1.2. Kiến thức cơ bản về thủy vân.................................................................... 10
1.2.1. Khái niệm thuỷ vân ................................................................................ 10
1.2.2. Một số vấn đề có liên quan đến thuỷ vân ............................................... 11
1.2.3. Các ứng dụng của thủy vân .................................................................... 12
1.2.4. Quá trình thực hiện thủy vân nói chung................................................. 13
1.3. Kỹ thuật thủy vân cho các cơ sở dữ liệu quan hệ ..................................... 13
1.3.1. Kỹ thuật thủy vân làm thay đổi dữ liệu trong CSDL quan hệ ............... 14
1.3.2. Các kỹ thuật thủy vân không làm thay đổi dữ liệu trong CSDL ........... 22
1.4. Kết luận ..................................................................................................... 23
CHƢƠNG 2: KỸ THUẬT THỦY VÂN BẢO VỆ SỰ TOÀN VẸN ............. 25
CỦA CƠ SỞ DỮ LIỆU VỚI CƠ CHẾ XÁC THỰC CÔNG KHAI ............... 25
2.1. Giới thiệu................................................................................................... 25
2.2. Kỹ thuật thủy vân với cơ chế xác thực công khai ..................................... 26
2.2.1. Ý tƣởng của kỹ thuật thủy vân với cơ chế xác thực công khai .............. 26
2.2.2. Tạo mã xác thực ..................................................................................... 28
2.2.3. Xác thực tính toàn vẹn của dữ liệu......................................................... 30
2.2.4. So sánh giữa hai thủy vân ...................................................................... 32
2.3. Ứng dụng kỹ thuật thủy vân với cơ chế xác thực công khai để bảo vệ sự
toàn vẹn của CSDL .......................................................................................... 33
CHƢƠNG 3: CÀI ĐẶT VÀ THỬ NGHIỆM ................................................. 35
3.1. Đặt vấn đề.................................................................................................. 35
3.2. Dữ liệu thử nghiệm ................................................................................... 35
3.3. Các mô hình thử nghiệm ........................................................................... 39
TÀI LIỆU THAM KHẢO ................................................................................ 45
DANH MỤC CÁC KÝ HIỆU, VIẾT TẮT
Ký hiệu
Diễn giải
Ý nghĩa
CSDL
Cơ sở dữ liệu
RBTV
Ràng buộc toàn vẹn
MKSD
Multi Key Single Data
Đa khóa, đơn dữ liệu
SKMD
Single Key Multi Data
Đơn khóa, đa dữ liệu
LSB
Least Significat Bit
Bít ít ý nghĩa
EMC
Encrypted Mark Code
Mã đánh dấu đƣợc mã hóa
BCH
Bose-Chaudhuri-Hocquenhem
SVR
Support Vector Regression
Hồi qui vector hỗ trợ
DANH MỤC CÁC BẢNG
Số hiệu
Tên bảng
bảng
Trang
2.1
Danh mục các ký hiệu
27
3.1
Thông tin trong mỗi giao dịch
36
DANH MỤC CÁC HÌNH
Số hiệu
hình
Tên hình
Trang
1.1
Sơ đồ biểu diễn quá trình giấu tin
4
1.2
Sơ đồ biểu diễn quá trình giải mã
5
1.3
Phân loại kỹ thuật giấu tin
6
1.4
Cách phân loại thủy vân tiêu biểu
11
1.5
Mô tả kỹ thuật thủy vấn cơ bản cho các cơ sở dữ liệu quan hệ
14
2.1
Kỹ thuật thủy vân với cơ chế xác thực công khai vào thực tế
33
3.1
Giao diện chính của chƣơng trình thực nghiệm
36
3.2
Minh họa các bƣớc tạo ra R mã hóa
37
3.3
Minh họa các bƣớc lấy thủy vân WM’’
38
3.4
Thủy vân số gốc đƣợc dùng trong thực nghiệm
39
3.5
Giao diện chƣơng trình mô hình thực nghiệm 1
39
3.6
a) Thủy vân gốc; b) Thủy vân thu đƣợc theo thực nghiệm 1
40
3.7
Giao diện chƣơng trình mô hình thực nghiệm 2
40
3.8
a) Thủy vân gốc; b) Thủy vân thu đƣợc theo thực nghiệm 2
41
3.9
Giao diện chƣơng trình mô hình thực nghiệm 3
41
3.10
a) Thủy vân gốc; b) Thủy vân thu đƣợc theo thực nghiệm 3
42
3.11
Giao diện chƣơng trình mô hình thực nghiệm 4
42
3.12
a) Thủy vân gốc; b) Thủy vân thu đƣợc theo thực nghiệm 4
43
1
MỞ ĐẦU
1. Lý do chọn đề tài
Ngày nay, việc sử dụng các cơ sở dữ liệu, đặc biệt là cơ sở dữ liệu quan
hệ trong các ứng dụng ngày càng tăng. Tốc độ phát triển Internet và các công
nghệ có liên quan đang đƣa đến một sức ép khá nặng nề cho những ngƣời bảo
vệ dữ liệu trong việc tạo ra các dịch vụ (thƣờng đƣợc gọi là các dịch vụ web
hoặc các tiện ích điện tử) cho phép ngƣời dùng có thể tìm kiếm và truy cập cơ
sở dữ liệu từ xa hoặc trong các dịch vụ thuê khoán bên ngoài. Mặc dù các xu
hƣớng này là hữu ích cho ngƣời dùng cuối nhƣng nó cũng bộc lộ mối nguy
hiểm cho những nhà cung cấp dữ liệu trƣớc những kẻ trộm cắp và giả mạo dữ
liệu. Do đó, những nhà cung cấp dữ liệu đòi hỏi phải có các công cụ hỗ trợ
cho việc bảo vệ bản quyền sản phẩm của họ, nhận dạng đƣợc những bản sao
các cơ sở dữ liệu bị đánh cắp hoặc bị xuyên tạc với ý đồ xấu.
Một trong những công cụ rất hữu ích dùng để bảo vệ bản quyền và
chống giả mạo đối với các cơ sở dữ liệu quan hệ đó là kỹ thuật thủy vân số.
Hiện tại, đã có khá nhiều lƣợc đồ thủy vân đƣợc đề xuất, trong đó có thể chia
thành hai lớp. Một lớp là các lƣợc đồ thủy vân dùng để bảo vệ bản quyền cho
các cơ sở dữ liệu quan hệ. Lớp thứ hai là các lƣợc đồ thủy vân dùng để bảo vệ
sự toàn vẹn cho các cơ sở dữ liệu quan hệ.
Từ thực tế trên, em chọn đề tài nghiên cứu thuộc lớp thứ hai: “Bảo vệ
sự toàn vẹn của cơ sở dữ liệu quan hệ bằng kỹ thuật thủy vân”.
2. Mục đích nghiên cứu
- Nghiên cứu kỹ thuật thủy vân để bảo vệ sự toàn vẹn cho các cơ sở dữ
liệu quan hệ với cơ chế xác thực công khai.
- Phát triển chƣơng trình thử nghiệm bảo vệ sự toàn vẹn cho các cơ sở
dữ liệu quan hệ với cơ chế xác thực công khai.
2
3. Nhiệm vụ nghiên cứu
- Nghiên cứu các cơ sở lý thuyết về cơ sở dữ liệu quan hệ và thủy vân số.
- Tìm hiểu về hệ mã hóa khóa đối xứng và khóa công khai.
- Sử dụng công cụ lập trình để phát triển chƣơng trình thử nghiệm thủy
vân cơ sở dữ liệu quan hệ.
4. Đối tƣợng và phạm vi nghiên cứu
- Phạm vi nghiên cứu của đề tài là lý thuyết về thủy vân nói chung và
về cơ sở dữ liệu.
- Nghiên cứu cơ chế mã hóa và giải mã thủy vân cơ sở dữ liệu quan hệ
với cơ chế xác thực công khai.
5. Những đóng góp mới của đề tài
- Tìm hiểu và nghiên cứu các kỹ thuật thủy vân để bảo vệ sự toàn vẹn
cho cơ sở dữ liệu quan hệ.
- Cải tiến và nâng cao độ chính xác khi bảo vệ tính toàn vẹn của cơ sở
dữ liệu lớn.
- Cài đặt chƣơng trình thử nghiệm để bảo vệ sự toàn vẹn của cơ sở dữ
liệu với cơ chế xác thực công khai.
6. Phƣơng pháp nghiên cứu
- Phƣơng pháp nghiên cứu chủ yếu ở đây là phƣơng pháp tiếp cận lý
thuyết, sau đó áp dụng lý thuyết để kiểm chứng. Dựa trên kết quả kiểm chứng
đó để đƣa ra kết luận và các đề xuất nhằm hoàn thành mục tiêu nghiên cứu.
- Nghiên cứu về lý thuyết thủy vân cơ sở dữ liệu. Nghiên cứu ứng dụng
và mô tả chi tiết về kỹ thuật thủy vân với cơ chế xác thực công khai.
7. Cấu trúc luận văn
Luận văn gồm: Lời mở đầu, ba chƣơng nội dung, phần kết luận và sau
cùng là tài liệu tham khảo.
3
Chƣơng 1: Tổng quan về kỹ thuật thủy vân cho cơ sở dữ liệu quan hệ.
Chƣơng 2: Kỹ thuật thủy vân bảo vệ sự toàn vẹn của cơ sở dữ liệu với
cơ chế xác thực công khai.
Chƣơng 3: Cài đặt và thử nghiệm.
4
CHƢƠNG 1: TỔNG QUAN VỀ KỸ THUẬT THỦY VÂN
CHO CƠ SỞ DỮ LIỆU QUAN HỆ
1.1. Kiến thức cơ bản về giấu tin
1.1.1. Khái niệm giấu tin
Từ trƣớc đến nay, nhiều phƣơng pháp bảo vệ thông tin đã đƣợc đƣa ra,
trong đó giải pháp dùng mật mã đƣợc ứng dụng rộng rãi nhất. Thông tin ban đầu
đƣợc mã hoá, sau đó sẽ đƣợc giải mã nhờ khoá của hệ mã. Đã có nhiều hệ mã
phức tạp đƣợc sử dụng nhƣ DES, RSA, NAPSACK..., rất hiệu quả và phổ biến.
Một phƣơng pháp mới khác đã và đang đƣợc nghiên cứu và ứng dụng
mạnh mẽ ở nhiều nƣớc trên thế giới, đó là phƣơng pháp giấu tin. Giấu thông
tin là kỹ thuật nhúng một lƣợng thông tin số nào đó vào trong một đối tƣợng
dữ liệu số khác. Một trong những yêu cầu cơ bản của giấu tin là đảm bảo tính
chất ẩn của thông tin đƣợc giấu đồng thời không làm ảnh hƣởng đến chất
lƣợng của dữ liệu gốc.
Sự khác biệt chú yếu giữa mã hoá thông tin và giấu thông tin là mã hoá
làm cho các thông tin thể hiện là có đƣợc mã hoá hay không, còn với giấu
thông tin thì ngƣời ta sẽ khó biết đƣợc là có thông tin giấu bên trong.
Hình 1.1: Sơ đồ biểu diễn quá trình giấu tin
5
Hình 1.2: Sơ đồ biểu diễn quá trình giải mã
1.1.2. Phân loại các kỹ thuật giấu tin
Do kỹ thuật giấu thông tin mới đƣợc hình thành trong thời gian gần đây
nên xu hƣớng phát triển chƣa ổn định. Nhiều phƣơng pháp mới, theo nhiều
khía cạnh khác nhau đang đƣợc đề xuất, vì vậy đã tồn tại nhiều cách phân loại
rất khác nhau.
Dựa trên việc thống kê các công trình đã công bố trên các tạp chí, cùng
với thông tin về tên và tóm tắt nội dung của các công trình đã công bố trên
Internet, ngƣời ta chia lĩnh vực giấu tin ra làm hai hƣớng lớn, đó là thủy vân
và giấu tin bí mật.
Steganography (giấu tin bí mật) quan tâm tới ứng dụng che giấu các bản
tin đòi hỏi độ bí mật cao và dung lƣợng lớn.
Watermark (thủy vân) quan tâm nhiều đến ứng dụng giấu các mẩu tin
ngắn nhƣng đòi hỏi độ bền vững lớn của thông tin cần giấu (trƣớc các biến
đổi thông thƣờng của tệp dữ liệu môi trƣờng).
6
Hình 1.3: Phân loại kỹ thuật giấu tin
Đối với từng hƣớng lớn trên, quá trình phân loại theo các tiêu chí khác
nhau dựa theo ảnh hƣởng các tác động từ bên ngoài, ngƣời ta có thể chia thủy
vân thành hai loại, một loại bền vững với các tác động sao chép trái phép, loại
thứ hai có tính chất hoàn toàn đối lập: dễ bị phá huỷ trƣớc các tác động nói
trên. Cũng có thể chia thủy vân theo đặc tính, một loại cần đƣợc che giấu để
chỉ có một số ngƣời tiếp xúc với nó có thể thấy đƣợc thông tin, loại thứ hai
đối lập, cần đƣợc mọi ngƣời nhìn thấy.
1.1.3. Môi trƣờng giấu tin
Kỹ thuật giấu tin đã đƣợc nghiên cứu và áp dụng trong nhiều môi
trƣờng dữ liệu khác nhau nhƣ trong dữ liệu đa phƣơng tiện (văn bản, hình
ảnh, âm thanh, phim… ), trong sản phẩm phần mềm và gần đây là những
nghiên cứu trên lĩnh vực cơ sở dữ liệu quan hệ. Trong các dữ liệu đó, dữ liệu
đa phƣơng tiện là môi trƣờng chiếm tỉ lệ chủ yếu trong các kỹ thuật giấu tin.
7
1.1.3.1. Giấu tin trong ảnh (image)
Giấu thông tin trong ảnh, hiện nay, là một bộ phận chiếm tỉ lệ lớn nhất
trong các chƣơng trình ứng dụng, các phần mềm, hệ thống giấu tin trong đa
phƣơng tiện do lƣợng thông tin đƣợc trao đổi bằng ảnh là rất lớn và hơn nữa
giấu thông tin trong ảnh cũng đóng vai trò quan trọng trong hầu hết các ứng
dụng bảo vệ an toàn thông tin nhƣ: xác thực thông tin, xác định xuyên tạc
thông tin, bảo vệ bản quyền tác giả, điều khiển truy cập, giấu tin bí mật... Do
đó vấn đề này đã nhận đƣợc sự quan tâm lớn của các cá nhân, tổ chức, trƣờng
đại học và viện nghiên cứu trên thế giới.
Thông tin sẽ đƣợc giấu cùng với dữ liệu ảnh nhƣng chất lƣợng ảnh ít
thay đổi và không ai biết đƣợc rằng sau ảnh đó mang những thông tin có ý
nghĩa. Ngày nay, khi ảnh số đã đƣợc sử dụng phổ biến, giấu thông tin trong
ảnh đã đem lại nhiều những ứng dụng quan trọng trong nhiều lĩnh vực trong
đời sống xã hội. Ví dụ đối với các nƣớc phát triển, chữ kí tay đã đƣợc số hoá
và lƣu trữ sử dụng nhƣ hồ sơ cá nhân của các dịch vụ ngân hàng và tài chính,
nó đƣợc dùng để xác thực trong các thẻ tín dụng của ngƣời tiêu dùng. Phần
mềm WinWord của Microsoft cũng cho phép ngƣời dùng lƣu trữ chữ kí trong
ảnh nhị phân rồi gắn vào vị trí nào đó trong file văn bản để đảm bảo tính an
toàn của thông tin. Tài liệu sau đó đƣợc truyền trực tiếp qua máy fax hoặc lƣu
truyền trên mạng. Theo đó, việc xác thực chữ kí, xác thực thông tin đã trở
thành một vấn đề quan trọng khi việc ăn cắp thông tin hay xuyên tạc thông tin
bởi các tin tặc đang trở thành một vấn nạn đối với bất kì quốc gia nào, tổ chức
nào. Hơn nữa có nhiều loại thông tin quan trọng cần đƣợc bảo mật nhƣ những
thông tin về an ninh, thông tin về bảo hiểm hay các thông tin về tài chính, các
thông tin này đƣợc số hoá và lƣu trữ trong hệ thống máy tính hay trên mạng.
Chúng dễ bị lấy cắp và bị thay đổi bởi các phần mềm chuyên dụng. Việc xác
thực cũng nhƣ phát hiện thông tin xuyên tạc đã trở nên vô cùng quan trọng,
8
cấp thiết. Một đặc điểm của giấu thông tin trong ảnh là thông tin đƣợc giấu
trong ảnh một cách vô hình, tƣơng tự cách truyền thông tin mật cho nhau mà
ngƣời khác không thể biết đƣợc bởi sau khi giấu thông tin chất lƣợng ảnh gần
nhƣ không thay đổi đặc biệt đối với ảnh mầu hay ảnh xám. Ví dụ về vụ việc
ngày 11-9 gây chấn động nƣớc Mĩ và toàn thế giới, chính tên trùm khủng bố
quốc tế Osma BinLaDen đã dùng cách thức giấu thông tin trong ảnh để liên
lạc với đồng bọn, và hắn đã qua mặt đƣợc cục tình báo trung ƣơng Mĩ CIA và
các cơ quan an ninh quốc tế. Chắc chắn sau vụ việc này, việc nghiên cứu các
vấn đề liên quan đến giấu thông tin trong ảnh sẽ rất đƣợc quan tâm.
1.1.3.2. Giấu tin trong âm thanh (audio)
Giấu thông tin trong âm thanh mang những đặc điểm riêng khác với
giấu thông tin trong các đối tƣợng đa phƣơng tiện khác. Một trong những
yêu cầu cơ bản của giấu tin là đảm bảo tính chất ẩn của thông tin đƣợc giấu
đồng thời không làm ảnh hƣởng đến chất lƣợng của dữ liệu gốc. Để đảm
bảo yêu cầu này, kỹ thuật giấu thông tin trong ảnh phụ thuộc vào hệ thống
thị giác của con ngƣời - HVS còn kỹ thuật giấu thông tin trong âm thanh lại
phụ thuộc vào hệ thống thính giác - HAS. Một vấn đề khó khăn là hệ thống
thính giác của con ngƣời nghe đƣợc các tín hiệu ở các dải tần rộng và công
suất lớn nên đã gây khó khăn đối với các phƣơng pháp giấu tin trong âm
thanh. Nhƣng hệ thống thính giác của con ngƣời lại kém trong việc phát
hiện sự khác biệt các dài tần và công suất, điều này có nghĩa là các âm
thanh to, cao tần có thể che giấu đƣợc các âm thanh nhỏ thấp một cách dễ
dàng. Các mô hình phân tích tâm lí đã chỉ ra điểm yếu trên và thông tin này
sẽ giúp ích cho việc chọn các âm thanh thích hợp cho việc giấu tin. Vấn đề
khó khăn thứ hai đối với giấu thông tin trong âm thanh là kênh truyền tin.
Kênh truyền hay băng thông chậm sẽ ảnh hƣởng đến chất lƣợng thông tin
sau khi giấu.
9
Ví dụ: Để nhúng một đoạn java applet vào một đoạn âm thanh (16 bit,
44.100 Hz) có chiều dài bình thƣờng thì các phƣơng pháp nói chung cũng cần
ít nhất là 20 bits. Giấu thông tin trong âm thanh đòi hỏi yêu cầu cao về tính
đồng bộ và tính an toàn của thông tin, Các phƣơng pháp giấu thông tin trong
âm thanh đều lợi dụng điểm yếu trong hệ thống thính giác của con ngƣời.
1.1.3.3. Giấu tin trong video
Cũng giống nhƣ giấu thông tin trong ảnh hay trong âm thanh, giấu tin
trong video cũng đƣợc quan tâm và đƣợc phát triển mạnh mẽ cho nhiều ứng
dụng nhƣ điều khiển truy cập thông tin, xác thực thông tin và bảo vệ bản
quyền tác giả. Các kỹ thuật giấu tin trong video cũng đƣợc phát triển mạnh
mẽ và theo hai khuynh hƣớng là thuỷ vân số và giấu thông tin. Một phƣơng
pháp giấu tin trong video đƣợc Cox đƣa ra là phƣơng pháp phân bố đều. Ý
tƣởng cơ bản của phƣơng pháp này là phân phối thông tin giấu dàn trải theo
tần số của dữ liệu gốc. Nhiều nhà nghiên cứu đã dùng những hàm cosin riêng
và các hệ số truyền sóng riêng để giấu tin. Trong các thuật toán đầu tiên
thƣờng các kỹ thuật cho phép giấu các ảnh vào trong video nhƣng thời gian
gần đây các kỹ thuật cho phép giấu cả âm thanh và hình ảnh vào video.
Giấu tin là một công nghệ mới phức tạp, đang đƣợc các nhà khoa học
tập trung nghiên cứu ở nhiều nƣớc trên thế giới nhƣ Đức, Mỹ, Ý, Canada,
Nhật Bản,.. Tuy nhiên, những kết quả thực nghiệm cho thấy để có thể ứng
dụng thực tế thì lĩnh vực này cần phải có thêm thời gian để nghiên cứu thẩm
định nhƣng các nhà khoa học cũng khẳng định rằng đây là một công nghệ mới
đầy hứa hẹn cho vấn đề an toàn và bảo mật thông tin. Công việc hiện nay của
các nhà khoa học là đang tập trung xây dựng một hệ thống lí thuyết chính xác
cho vấn đề giấu tin, đây là một mảnh đất mới cho các nhà khoa học khám phá.
Một trong những kỹ thuật quan trọng của giấu tin đang đƣợc rất nhiều các nhà
khoa học quan tâm và phát triến nhất, đó là kỹ thuật thuỷ vân (watermark).
10
1.2. Kiến thức cơ bản về thủy vân
1.2.1. Khái niệm thuỷ vân
Thuỷ vân số (digital watermarking) là quá trình chèn thông tin vào dữ
liệu số đảm bảo không thể cảm nhận đƣợc bằng các giác quan của con ngƣời
nhƣng lại dễ dàng phát hiện bởi các thuật toán của máy tính. Một dấu thuỷ
vân (watermark) mà một mẫu thông tin trong suốt và không thể nhìn thấy
đƣợc bằng các giác quan đƣợc chèn vào một vị trí thích hợp trong dữ liệu số
bằng cách sử dụng một thuật toán đặc biệt.
Tuỳ thuộc vào mục đích và ứng dụng mà các yêu cầu của hệ thống thủy
vân đƣợc đặt ra. Với các hệ thống thực tế, hệ thống thuỷ vân đòi hỏi các yêu
cầu sau:
+ Tính không nhận thấy đƣợc (Imperceptibility): Các điều chỉnh gây ra
do nhúng thủy vân phải thấp hơn ngƣỡng cảm thụ của con ngƣời, nghĩa là các
mẫu dùng trong nhúng thủy vân chỉ đƣợc phép thay đổi rất nhỏ trong giới hạn
cho phép.
+ Tính bền vững (Robustness): Tùy vào từng loại ứng dụng mà tính
bền vững này đƣợc nhìn nhận dƣới nhiều quan điểm khác nhau, nếu nhƣ đối
với các ứng dụng dùng để bảo vệ quyền sờ hữu thì thủy vân cần phải bền
vững qua một số các hành động cập nhật của dữ liệu. Nếu nhƣ đối với ứng
dụng để chống làm giả hoặc chống lại sự thay đổi trên dữ liệu thì đòi hỏi thủy
vân phải huỷ bỏ khi có các tác vụ này xảy ra.
+ Tính không chia tách đƣợc (Inseparability): Sau khi dữ liệu đƣợc
nhúng thủy vân thì yêu cầu là phải rất khó hoặc không thể tách thành 2 phần
riêng biệt nhƣ lúc đầu.
+ Bảo mật (Security): Sau khi đã nhúng thủy vân vào dữ liệu, thì yêu cầu
là chỉ cho phép những ngƣời sử dụng có quyền mới chỉnh sửa và phát hiện đƣợc
thủy vân điều này đƣợc thực hiện nhờ vào key dùng làm khoá trong giải thuật
nhúng thủy vân vào dữ liệu và giải thuật phát hiện ra thủy vân trong dữ liệu.
11
+ Tìm lại thủy vân: Có thể cần hoặc không cần đến dữ liệu gốc vẫn có
thể tìm lại đƣợc thuỷ vân đã nhúng.
+ Trích thủy vân hay kiểm chứng: Cho phép kiểm tra sự tồn tại của
thủy vân trong dữ liệu đã nhúng .
1.2.2. Một số vấn đề có liên quan đến thuỷ vân
Có nhiều phƣơng pháp để phân loại thủy vân, dƣới đây trình bày
phƣơng pháp phân loại phổ biến nhất:
Hệ thống thủy vân
Dựa vào miền
tác động
Tác động vào
không gian ảnh
Văn bản
Dựa vào dữ
liệu
Tác động
miền tần số
Hình
ảnh
Dựa vào tác động thị
giác tới con ngƣời
Thủy vân
ẩn
Audio
Video
Thủy vân
bền vững
Thủy vân
hiện
Thủy vân
dễ vỡ
Hình 1.4: Cách phân loại thủy vân tiêu biểu
Dựa vào miền tác động, chúng ta có thể phân loại thủy vân thành tác
động lên miền không gian ảnh (spatial domain) và tác động lên miền tần số
ảnh (frequency domain).
Dựa vào kiểu dữ liệu đƣợc nhúng thủy vân số, chúng ta có thủy vân
đƣợc nhúng vào ảnh, vào audio, video hay text.
Dựa vào tác động tới thị giác con ngƣời, chúng ta có thủy vân hiện
(visible watermark) hoặc thủy vân ẩn (invisible watermark). Thủy vân ẩn lại
đƣợc chia thành thủy vân bền vững (robust watermark) và thủy vân dễ vỡ
(fraglie watermark).
- Xem thêm -