Cuộc cách mạng thông tin kỹ thuật số đã đem lại những thay đổi sâu
sắc trong xã hội và trong cuộc sống của chúng ta. Bên cạnh những thuận lợi
mà thông tin kỹ thuật số mang lại cũng sinh ra những thách thức và cơ hội
mới. Sự ra đời những phần mềm có tính năng rất mạnh, các thiết bị mới như
máy ảnh kỹ thuật số, máy quét chất lượng cao, máy in, máy ghi âm kỹ thuật
số v.v.. đã thúc đẩy khả năng sáng tạo, xử lý và thưởng thức các dữ liệu đa
phương tiện (multimedia data). Mạng Internet toàn cầu đã tạo ra những cơ
cấu ảo - nơi diễn ra các quá trình trao đổi thông tin trong mọi lĩnh vực chính
trị, quân sự, quốc phòng, kinh tế, thương mại. Và chính trong môi trường
mở và tiện nghi như thế xuất hiện những vấn nạn, tiêu cực đang rất cần các
giải pháp hữu hiệu nhằm đảm bảo an toàn thông tin, chống lại các nạn ăn
cắp bản quyền, xuyên tạc thông tin, truy nhập thông tin trái phép v.v.. Việc
tìm giải pháp cho những vấn đề này không chỉ giúp ta hiểu thêm về công
nghệ phức tạp đang phát triển rất nhanh này mà còn tạo ra những cơ hội
phát triển mới.
Giải pháp nào cho những vấn đề trên ?
Trong một thời gian dài, nhiều phương pháp bảo vệ thông tin đã được
đưa ra, trong đó giải pháp dùng mật mã được ứng dụng rộng rãi nhất. Các hệ
mã đã được phát triển nhanh chóng và được ứng dụng rất phổ biến. Thông
tin ban đầu sẽ được mã hoá thành các kí hiệu vô nghĩa, sau đó sẽ được lấy
lại thông qua việc giải mã nhờ khoá của hệ mã. Đã có nhiều hệ mã phức tạp
và hiệu quả được sử dụng như DES, RSA, KNAPSACK... [4].
Trong khuôn khổ của luận văn tốt nghiệp này, chúng ta không nghiên
cứu về các hệ mã mật mà chỉ tìm hiểu về một phương pháp đã và đang được
nghiên cứu và ứng dụng mạnh mẽ ở nhiều nước trên thế giới. Đó là phương
pháp giấu tin (data hiding) - đây là phương pháp mới đang được xem như
một công nghệ chìa khoá cho vấn đề bảo vệ bản quyền, xác nhận thông tin
và điều khiển truy cập, ứng dụng trong an toàn và bảo mật thông tin.
Giả sử ta có đối tượng cần bảo mật R (một văn bản, một tấm bản đồ
hoặc một tệp âm thanh ...). Nếu dùng phương pháp mã hoá để bảo mật R ta
sẽ thu được bản mật mã của R là R’ chẳng hạn. Thông thường, R’ mang
những giá trị “vô nghĩa” và chính điều này làm cho đối phương nghi ngờ và
Luận văn tốt nghiệp cao học
Dương Đức Hải
ch¬ng 1. giíi thiÖu tæng quan
10
tìm mọi cách thám mã. Ngược lại, nếu dùng phương pháp giấu R vào một
đối tượng khác, một bức ảnh F chẳng hạn ta sẽ thu được bức ảnh F’ hầu
như không sai khác với F. Sau đó chỉ cần gửi ảnh F’ cho người nhận. Để
lấy ra bản tin R từ ảnh F’ ta không cần ảnh gốc F. Xem như vậy, khi đối
phương bắt được tấm ảnh F’ nếu đó là ảnh lạ (ảnh cá nhân, ảnh phong cảnh
của những nơi không nổi tiếng) thì khó nảy sinh nghi ngờ về khả năng chứa
tin mật trong F’.
D¬ng §øc H¶i
Bé gi¸o dôc vµ ®µo t¹o
trêng ®¹i häc b¸ch khoa hµ néi
D¬ng §øc H¶i
Ngµnh: C«ng nghÖ th«ng tin
nghiªn cøu vµ c¶i tiÕn
mét sè kü thuËt giÊu th«ng tin trong m«i trêng ¶nh
LuËn v¨n th¹c sü C«ng nghÖ th«ng tin
Khãa: 2002 - 2004
Hµ Néi – N¨m 2004
Bé gi¸o dôc vµ ®µo t¹o
trêng ®¹i häc b¸ch khoa hµ néi
D¬ng §øc H¶i
nghiªn cøu vµ c¶i tiÕn
mét sè kü thuËt giÊu th«ng tin trong m«i trêng ¶nh
LuËn v¨n th¹c sü Khoa Häc
Chuyªn ngµnh C«ng nghÖ th«ng tin
Ngêi híng dÉn khoa häc: PGS.TS NguyÔn Ngäc
Trêng §¹i häc B¸ch Khoa Hµ Néi
Hµ Néi – N¨m 2004
B×nh
Luận văn tốt nghiệp cao học
Dương Đức Hải
2
danh môc c¸c ch÷ viÕt t¾t
Số TT
Từ viết tắt
Từ đầy đủ
1
BMP
Bitmap
2
CPT
Chen – Pan – Tseng
3
DCT
Discrete Cosine Transformation
4
DES
Data Encryption Standard
5
EOF
End Of File
6
GIF
Graphics Interchanger Format
7
HAS
Human Auditory System
8
HVS
Human Vision System
9
JPEG
Joint Photograph Expert Group
10
LSB
Least Significant Bit
11
RSA
Rivets - Shamir - Adleman
12
RLC
Run Length Coding
13
TIFF
Targed Image File Format
C¸c danh môc
3
Luận văn tốt nghiệp cao học
Dương Đức Hải
danh môc c¸c b¶ng
Số
TT
Bảng
1
1.1
Phân biệt giữa Steganography với Watermark
18
2
1.2
Một số kiểu tấn công điển hình
26
3
2.1
Header của ảnh Bitmap
35
4
2.2
Palette của ảnh Bitmap
36
5
2.3
Sự khác nhau giữa giấu thông tin trong ảnh đen trắng
và ảnh mầu
37
6
2.4
Số bit biểu diễn một điểm ảnh của một số loại ảnh
40
7
3.1
Số bit biểu diễn một điểm ảnh của một số loại ảnh
57
8
3.2
Kết quả thực nghiệm giấu tin bằng kỹ thuật DCT
(không nén JPEG)
71
9
3.3
Kết quả thực nghiệm giấu tin bằng kỹ thuật DCT (có
nén JPEG)
71
10
4.1
So sánh hiệu quả của hai giải thuật cài đặt
95
11
5.1
So sánh hệ DataHiding & hệ The Third Eye
99
Tên bảng
Trang
C¸c danh môc
4
Luận văn tốt nghiệp cao học
Dương Đức Hải
danh môc c¸c h×nh vÏ
Số
TT
Hình
1
1.1
Phân cấp các lĩnh vực nghiên cứu của mật mã học
10
2
1.2
Phân loại các kỹ thuật giấu tin theo hai khuynh hướng
nghiên cứu chính
13
3
1.3
Lược đồ chung cho quá trình giấu thông tin
18
4
1.4
Lược đồ của quá trình giải mã thông tin
19
5
1.5
Ứng dụng bảo vệ bản quyền tác giả
20
6
1.6
Ứng dụng nhận thực thông tin
21
7
1.7
Ứng dụng trong phân phối sản phẩm
21
8
2.1
Bảng mầu cơ sở của Paint Shop Pro đã sắp thứ tự
32
9
2.2
Phương pháp quét dòng liên tiếp
32
10
2.3
Phương pháp quét dải các dòng liên tiếp
32
11
2.4
So sánh ảnh mầu gốc và ảnh đã giấu tin
37
12
2.5
So sánh ảnh đen trắng gốc và ảnh đã giấu tin
38
13
2.6
Minh họa bit LSB của ảnh 256 mầu
41
14
2.7
Phối mầu RGB
42
15
3.1
Kỹ thuật giấu tin trong khối bit
46
16
3.2
Kỹ thuật giấu tin trên đường biên ảnh
47
17
3.3
Phương thức tính hệ số phân bố bit
48
18
3.4
Quan hệ láng giềng của các điểm ảnh trong khối bit
49
19
3.5
Minh họa phép AND giữa các cặp bit của hai ma trận
50
20
3.6
Minh họa phép XOR giữa các cặp bit của hai ma trận
50
21
3.7
Minh họa ma trận ảnh và ma trận khóa
52
22
3.8
Một số phương pháp trượt ma trận khóa trên các khối
ảnh
53
23
3.9
Minh họa một ma trận ảnh, ma trận khóa và ma trận
trọng số
54
24
3.10
Minh họa phép hai ma trận
55
25
3.11
Minh họa bit LSB
58
26
3.12
Minh họa kỹ thuật giấu tin vào các điểm LSB
59
Tên hình
Trang
C¸c danh môc
5
Luận văn tốt nghiệp cao học
Dương Đức Hải
Số
TT
Hình
27
3.13
Giải thuật nhúng tin bằng kỹ thuật DCT
68
28
3.14
Giải thuật giải tin bằng kỹ thuật DCT
69
29
4.1
Thuật toán giấu tin trực tiếp vào điểm ảnh
77
30
4.2
Thuật toán giải tin theo phương pháp giấu trực tiếp
vào điểm ảnh
78
31
4.3
Thuật toán CPT áp dụng cho ảnh mầu và ảnh đa cấp
xám
79
32
4.4
Thuật toán giải tin theo CPT
80
33
4.5
Sơ đồ phân cấp chức năng của ứng dụng DataHiding
84
34
4.6
Giao diện chính của ứng dụng DataHiding
84
35
4.7
Giao diện lựa chọn thông số giấu tin theo phương pháp
giấu trực tiếp vào điểm ảnh.
85
36
4.8
Giao diện lựa chọn giấu tin theo phương pháp CPT
86
37
4.9
Giao diện lựa chọn giải tin
87
38
4.10
Giao diện giới thiệu về ứng dụng
87
39
4.11
Giao diện thông báo giấu tin thành công
87
40
4.12
Giao diện thông báo giải tin thành công
87
41
4.13
Một số thông báo lỗi điển hình của ứng dụng
88
42
4.14
Ảnh kết quả thực nghiệm giấu 2.69 MB thông tin vào
ảnh Text 24 bit mầu.
89
43
4.15
Kết quả thực nghiệm giấu 2.69MB thông tin vào ảnh
24 bit mầu
89
44
4.16
So sánh các ảnh gốc và ảnh đã giấu tin bằng cách
Zoom 400%
90
45
4.17
Kết quả thực nghiệm giấu 74KB thông tin vào ảnh 8
bit mầu
90
46
4.18
Kết quả thực nghiệm giấu 105KB thông tin vào ảnh 8
bit mầu
90
47
4.19
Kết quả giấu ảnh hoa hồng 24 bit mầu vào ảnh đa cấp
xám
91
48
4.20
So sánh ảnh hoa hồng trước khi giấu và sau khi được
giải tin từ ảnh đa cấp xám
91
Tên hình
Trang
C¸c danh môc
6
Luận văn tốt nghiệp cao học
Dương Đức Hải
Số
TT
Hình
49
4.21
Kết quả thực nghiệm giấu 352 byte thông tin vào ảnh
24bit mầu
91
50
4.22
Kết quả thực nghiệm giấu 317 byte thông tin vào ảnh
8bit mầu
92
51
4.23
Kết quả thực nghiệm giấu 317 byte thông tin vào ảnh
đa cấp xám
92
52
4.24
Kết quả thực nghiệm giấu 317 byte thông tin vào ảnh
đen trắng.
92
53
4.25
Các ảnh gốc dùng trong thực nghiệm dung lượng giấu
tin
93
54
4.26
Kết quả thực nghiệm dung lượng giấu tin
93
55
5.1
Kết quả thực nghiệm so sánh hệ DataHiding và The
Third Eye
99
Tên hình
Trang
C¸c danh môc
1
Luận văn tốt nghiệp cao học
Dương Đức Hải
môc lôc
Nội dung
Trang
Môc lôc
1
Danh môc c¸c tõ viÕt t¾t
2
Danh môc c¸c b¶ng
3
Danh môc c¸c h×nh vÏ
6
Më ®Çu
7
Ch¬ng1. Tæng quan vÒ c¸c ph¬ng ph¸p b¶o mËt th«ng tin
9
1.1. S¬ lîc vÒ lÞch sö giÊu tin
10
1.2. Định nghĩa vµ ph©n lo¹i
11
1.3. M« h×nh c¬ b¶n cña kü thuËt giÊu tin
18
1.4. Nh÷ng øng dông c¬ b¶n cña giÊu tin
20
1.5. GiÊu th«ng tin trong d÷ liÖu ®a ph¬ng tiÖn
22
1.6. §é an toµn cña mét hÖ thèng giÊu tin
25
1.7. C¸c tÊn c«ng vµ biÖn ph¸p kh¨c phôc cña kü thuËt giÊu
tin
26
Ch¬ng 2. Mét sè vÊn ®Ò c¬ b¶n vÒ giÊu th«ng tin trong ¶nh
27
2.1. GiÊu th«ng tin trong ¶nh, nh÷ng ®Æc trng vµ tÝnh chÊt
27
2.2. BiÓu diÔn ¶nh trªn m¸y tÝnh
29
2.3. GiÊu th«ng tin trong ¶nh ®en tr¾ng, ¶nh mÇu vµ ¶nh ®a
cÊp x¸m
36
2.4. Mét sè tiªu chÝ ®¸nh gi¸ kü thuËt giÊu th«ng tin trong ¶nh sè
38
2.5. C¸c kü thuËt xö lý ®iÓm ¶nh
40
2.6. §¸nh gi¸ mét sè hÖ giÊu tin trong ¶nh
43
Ch¬ng 3. Mét sè thuËt to¸n giÊu tin trong ¶nh
45
3.1. ThuËt to¸n giÊu th«ng tin trong khèi bit
45
3.2. ThuËt to¸n thay thÕ bit cã träng sè thÊp nhÊt LSB ( Least
Significant Bit)
57
3.3. Một số kỹ thuật giấu tin khác
64
3.4. C¸c h¹n chÕ cña kü thuËt giÊu tin
73
Ch¬ng 4. TriÓn khai øng dông
74
4. 1. Giíi thiÖu
74
4. 2. Lùa chän c«ng cô vµ thuËt to¸n
76
4.3. Cµi ®Æt øng dông
77
4. 4. KÕt qu¶ thö nghiÖm
88
4. 5. C¸c kÕt luËn dùa trªn kÕt qu¶ thö nghiÖm
95
Ch¬ng 5. Tæng kÕt vµ ®¸nh gi¸
97
5.1. C¸c vÊn ®Ò ®· gi¶i quyÕt ®îc
97
5.2. §¸nh gi¸ néi dung ®· thùc hiÖn
98
5.3. Híng ph¸t triÓn cña ®Ò tµi
99
Tµi liÖu tham kh¶o
101
Phô lôc
104
Môc lôc
7
Luận văn tốt nghiệp cao học
Dương Đức Hải
Më ®Çu
Cuộc cách mạng thông tin kỹ thuật số đã đem lại những thay đổi sâu
sắc trong xã hội và trong cuộc sống của chúng ta. Bên cạnh những thuận lợi
mà thông tin kỹ thuật số mang lại cũng sinh ra những thách thức và cơ hội
mới. Sự ra đời những phần mềm có tính năng rất mạnh, các thiết bị mới như
máy ảnh kỹ thuật số, máy quét chất lượng cao, máy in, máy ghi âm kỹ thuật
số v.v.. đã thúc đẩy khả năng sáng tạo, xử lý và thưởng thức các dữ liệu đa
phương tiện (multimedia data). Mạng Internet toàn cầu đã tạo ra những cơ
cấu ảo - nơi diễn ra các quá trình trao đổi thông tin trong mọi lĩnh vực chính
trị, quân sự, quốc phòng, kinh tế, thương mại…Và chính trong môi trường
mở và tiện nghi như thế xuất hiện những vấn nạn, tiêu cực đang rất cần các
giải pháp hữu hiệu nhằm đảm bảo an toàn thông tin, chống lại các nạn ăn
cắp bản quyền, xuyên tạc thông tin, truy nhập thông tin trái phép v.v.. Việc
tìm giải pháp cho những vấn đề này không chỉ giúp ta hiểu thêm về công
nghệ phức tạp đang phát triển rất nhanh này mà còn tạo ra những cơ hội
phát triển mới.
Nhiệm vụ của luận văn này là tìm hiểu và trình bầy một số kỹ thuật
giấu thông tin mật trong môi trường ảnh tĩnh, một trong những giải pháp
hiện đang được quan tâm để đảm bảo an toàn thông tin trên mạng nói riêng
và trong lĩnh vực bảo mật thông tin nói chung. Luận văn chia thành 5
chương:
Chương 1. Tổng quan về các phương pháp bảo mật thông tin
Giới thiệu tổng quan về lĩnh vực giấu tin trong ảnh: từ lịch sử phát
triển đến những phương pháp giấu tin đang ứng dụng hiện nay. Chương này
cũng nêu các định nghĩa, phân loại, mô hình và những ứng dụng cơ bản của
các kỹ thuật giấu tin. Xem xét đánh giá độ an toàn, các tấn công với các hệ
giấu tin và một số biện pháp khắc phục các tấn công.
Chương 2. Một số vấn đề cơ bản về giấu thông tin trong ảnh
Đề cập tới những kiến thức cơ bản liên quan đến các kỹ thuật giấu tin
trong ảnh như: hệ thống thị giác người và các mô hình màu cho ảnh; Các kỹ
thuật biểu diễn ảnh trên máy tính và một số định dạng ảnh thông dụng; Các
kỹ thuật xử lý điểm ảnh; Xem xét đánh giá một số hệ giấu tin trong ảnh...
Më ®Çu
Luận văn tốt nghiệp cao học
Dương Đức Hải
8
Chương 3. Một số thuật toán giấu tin trong ảnh
Nghiên cứu và trình bày một số kỹ thuật giấu tin trong ảnh: Giấu
thông tin trong khối bít; Thay thế bit có trọng số thấp nhất; Giấu thông tin
trên miền tần số; Thông qua nghiên cứu các thuật toán đưa ra một số các hạn
chế của các kỹ thuật giấu tin trong môi trường ảnh.
Chương 4. Triển khai ứng dụng
Trình bầy thiết kế và cài đặt một hệ giấu tin trong ảnh dựa trên việc
cải tiến hai thuật toán CPT và LSB. Các kết quả và đánh giá dựa trên kết quả
thử nghiệm của hệ nhằm ứng dụng vào giải quyết một bài toán thực tế:
Chuyển phát đề thi.
Chương 5. Tổng kết và đánh giá
Nêu các nhận xét, các kết quả đã thực hiện được và phương hướng
phát triển của đề tài.
Tác giả luận văn bày tỏ lòng kính trọng và biết ơn sâu sắc tới PGS.TS
Nguyễn Ngọc Bình – Người thầy đã chỉ ra hướng đi đúng, đã tận tình
hướng dẫn để tác giả hoàn thành luận văn. Tác giả chân thành cảm ơn các
Thầy Cô, bè bạn và người thân đã động viên và giúp đỡ trong suốt qua trình
nghiên cứu, triển khai đề tài.
Vì trình độ có hạn, luận văn không thể tránh khỏi những sai sót. Tác
giả kính mong nhận được những góp chân thành để luận văn ngày một hoàn
thiện.
Hà Nội, tháng 11 năm 2004
Më ®Çu
9
Luận văn tốt nghiệp cao học
Dương Đức Hải
ch¬ng 1. giíi thiÖu Tæng quan
Cuộc cách mạng thông tin kỹ thuật số đã đem lại những thay đổi sâu
sắc trong xã hội và trong cuộc sống của chúng ta. Bên cạnh những thuận lợi
mà thông tin kỹ thuật số mang lại cũng sinh ra những thách thức và cơ hội
mới. Sự ra đời những phần mềm có tính năng rất mạnh, các thiết bị mới như
máy ảnh kỹ thuật số, máy quét chất lượng cao, máy in, máy ghi âm kỹ thuật
số v.v.. đã thúc đẩy khả năng sáng tạo, xử lý và thưởng thức các dữ liệu đa
phương tiện (multimedia data). Mạng Internet toàn cầu đã tạo ra những cơ
cấu ảo - nơi diễn ra các quá trình trao đổi thông tin trong mọi lĩnh vực chính
trị, quân sự, quốc phòng, kinh tế, thương mại. Và chính trong môi trường
mở và tiện nghi như thế xuất hiện những vấn nạn, tiêu cực đang rất cần các
giải pháp hữu hiệu nhằm đảm bảo an toàn thông tin, chống lại các nạn ăn
cắp bản quyền, xuyên tạc thông tin, truy nhập thông tin trái phép v.v.. Việc
tìm giải pháp cho những vấn đề này không chỉ giúp ta hiểu thêm về công
nghệ phức tạp đang phát triển rất nhanh này mà còn tạo ra những cơ hội
phát triển mới.
Giải pháp nào cho những vấn đề trên ?
Trong một thời gian dài, nhiều phương pháp bảo vệ thông tin đã được
đưa ra, trong đó giải pháp dùng mật mã được ứng dụng rộng rãi nhất. Các hệ
mã đã được phát triển nhanh chóng và được ứng dụng rất phổ biến. Thông
tin ban đầu sẽ được mã hoá thành các kí hiệu vô nghĩa, sau đó sẽ được lấy
lại thông qua việc giải mã nhờ khoá của hệ mã. Đã có nhiều hệ mã phức tạp
và hiệu quả được sử dụng như DES, RSA, KNAPSACK... [4].
Trong khuôn khổ của luận văn tốt nghiệp này, chúng ta không nghiên
cứu về các hệ mã mật mà chỉ tìm hiểu về một phương pháp đã và đang được
nghiên cứu và ứng dụng mạnh mẽ ở nhiều nước trên thế giới. Đó là phương
pháp giấu tin (data hiding) - đây là phương pháp mới đang được xem như
một công nghệ chìa khoá cho vấn đề bảo vệ bản quyền, xác nhận thông tin
và điều khiển truy cập, ứng dụng trong an toàn và bảo mật thông tin.
Giả sử ta có đối tượng cần bảo mật R (một văn bản, một tấm bản đồ
hoặc một tệp âm thanh ...). Nếu dùng phương pháp mã hoá để bảo mật R ta
sẽ thu được bản mật mã của R là R’ chẳng hạn. Thông thường, R’ mang
những giá trị “vô nghĩa” và chính điều này làm cho đối phương nghi ngờ và
ch¬ng 1. giíi thiÖu tæng quan
10
Luận văn tốt nghiệp cao học
Dương Đức Hải
tìm mọi cách thám mã. Ngược lại, nếu dùng phương pháp giấu R vào một
đối tượng khác, một bức ảnh F chẳng hạn ta sẽ thu được bức ảnh F’ hầu
như không sai khác với F. Sau đó chỉ cần gửi ảnh F’ cho người nhận. Để
lấy ra bản tin R từ ảnh F’ ta không cần ảnh gốc F. Xem như vậy, khi đối
phương bắt được tấm ảnh F’ nếu đó là ảnh lạ (ảnh cá nhân, ảnh phong cảnh
của những nơi không nổi tiếng) thì khó nảy sinh nghi ngờ về khả năng chứa
tin mật trong F’.
Như vậy, sự khác biệt giữa mã hoá thông tin và giấu thông tin là mức
độ lộ liễu của đối tượng mang tin mật. Nếu ta phối hợp hai phương pháp
trên thì mức độ lộ liễu được giảm đến mức tối đa, đồng thời độ an toàn cũng
được nâng cao. Chẳng hạn, ta có thể mã hoá R thành R’ sau đó mới giấu R’
vào ảnh F để thu được ảnh F’. Tóm lại, giấu thông tin và hệ mã mật có quan
hệ mật thiết với nhau, cùng xây dựng nên một hệ thống an toàn và bảo mật
thông tin.
Cryptology
Ngành mật mã
Cryptography
Mật mã
Steganography
Giấu tin mật
Hình 1.1. Phân cấp các lĩnh vực nghiên cứu của mật mã học.
1.1. Sơ lược về lịch sử giấu tin
Từ Steganography bắt nguồn từ Hi Lạp và được sử dụng cho tới ngày
nay, nó có nghĩa là tài liệu được phủ (covered writing) hoặc viết bí mật. Các
câu chuyện kể về kỹ thuật giấu thông tin được truyền qua nhiều thế hệ. Có lẽ
những ghi chép sớm nhất về kỹ thuật giấu thông tin (thông tin được hiểu
theo nghĩa nguyên thủy của nó) thuộc về sử gia Hy-Lạp Herodotus. Khi bạo
chúa Hy-Lạp Histiaeus bị vua Darius bắt giữ ở Susa vào thế kỷ thứ năm
trước Công nguyên, ông ta đã gửi một thông báo bí mật cho con rể của mình
là Aristagoras ở Miletus. Histiaeus đã cạo trọc đầu của một nô lệ tin cậy và
xăm một thông báo trên da đầu của người nô lệ ấy. Khi tóc của người nô lệ
này mọc đủ dài người nô lệ được gửi tới Miletus.
ch¬ng 1. giíi thiÖu tæng quan
11
Luận văn tốt nghiệp cao học
Dương Đức Hải
Một câu chuyện khác về thời Hy-Lạp cổ đại cũng do Herodotus ghi
lại. Môi trường để ghi văn bản chính là các viên thuốc được bọc trong sáp
ong. Demeratus, một người Hy-Lạp, cần thông báo cho Sparta rằng Xerxes
định xâm chiếm Hy-Lạp. Để tránh bị phát hiện, anh ta đã bóc lớp sáp ra khỏi
các viên thuốc và khắc thông báo lên bề mặt các viên thuốc này, sau đó bọc
lại các viên thuốc bằng một lớp sáp mới. Những viên thuốc được để ngỏ và
lọt qua mọi sự kiểm tra một cách dễ dàng.
Mực không màu là phương tiện hữu hiệu cho bảo mật thông tin trong
một thời gian dài. Người Romans cổ đã biết sử dụng những chất sẵn có như
nước quả, nước tiểu và sữa để viết các thông báo bí mật giữa những hàng
văn tự thông thường. Khi bị hơ nóng, những thứ mực không nhìn thấy này
trở nên sẫm màu và có thể đọc dễ dàng. Mực không màu cũng được sử dụng
rất gần đây, như trong thời gian chiến tranh Thế giới II.
Ý tưởng về che giấu thông tin đã có từ hàng nghìn năm về trước
nhưng kỹ thuật này được dùng chủ yếu trong quân đội và trong các cơ quan
tình báo. Mãi cho tới vài thập niên gần đây, giấu thông tin mới nhận được sự
quan tâm của các nhà nghiên cứu và các viện công nghệ thông tin với hàng
loạt công trình nghiên cứu giá trị. Cuộc cách mạng số hoá thông tin và sự
phát triển nhanh chóng của mạng truyền thông là nguyên nhân chính dẫn
đến sự thay đổi này. Những phiên bản sao chép hoàn hảo, các kỹ thuật thay
thế, sửa đổi tinh vi, cộng với sự lưu thông phân phối trên mạng của các dữ
liệu đa phương tiện đã sinh ra nhiều vấn đề nhức nhối về nạn ăn cắp bản
quyền, phân phối bất hợp pháp, xuyên tạc trái phép...
1.2. Định nghĩa và phân loại
1.2.1. Các định nghĩa [18]
Định nghĩa 1: Giấu thông tin
Giấu thông tin là một kỹ thuật nhúng (giấu) một lượng thông tin số
nào đó vào trong một đối tượng dữ liệu số khác
Kỹ thuật giấu thông tin chủ yếu hướng vào hai mục đích sau đây: một
là bảo mật cho dữ liệu được đem giấu, hai là bảo mật cho chính đối tượng
được dùng để giấu tin. Hai mục đích khác nhau này dẫn đến hai khuynh
hướng kỹ thuật chủ yếu của giấu tin.
ch¬ng 1. giíi thiÖu tæng quan
12
Luận văn tốt nghiệp cao học
Dương Đức Hải
Khuynh hướng thứ nhất là giấu tin mật (steganography). Khuynh
hướng này tập trung vào các kỹ thuật giấu tin sao cho thông tin giấu được
nhiều và quan trọng là làm người khác khó phát hiện được một đối tượng có
được giấu tin bên trong hay không.
Khuynh hướng thứ hai là thuỷ vân số (watermark). Khuynh hướng
thuỷ vân số có miền ứng dụng lớn hơn nên được quan tâm nghiên cứu nhiều
hơn và thực tế đã có rất nhiều kỹ thuật thuộc về khuynh hướng này. Thuỷ
vân số tập trung vào việc sử dụng kỹ thuật giấu tin, dùng thông tin giấu để
bảo vệ sản phẩm thông tin số như ảnh, audio hay video. Nổi bật nhất là ứng
dụng trong bảo vệ bản quyền.
Định nghĩa 1 mang tính tổng quát về giấu tin. Xét riêng trong kỹ thuật
giấu tin mật, những định nghĩa sau đây cụ thể hơn và được chia theo các hệ
giấu tin mật. Theo đó, các hệ thống giấu tin mật có thể chia thành ba loại
như:
Định nghĩa 2: Giấu tin thuần tuý (Pure Steganography)
Một bộ 4 σ(C,M,D,E), trong đó C là tập các phương tiện chứa thông
tin cần giấu, M là tập thông điệp cần giấu với |C|≥|M|, E: C×M → C là một
hàm nhúng thông điệp M vào phương tiện chứa C và D: C → M là hàm giải
tin sao cho D(E(c,m)) = m với mọi m ∈ M, c ∈ C được gọi là một hệ Pure
Steganography.
Định nghĩa 3: Giấu tin dùng khoá bí mật (Secret key Steganography)
Một bộ 5 σ(C,M,K,Dk,Ek), trong đó C là tập các phương tiện chứa
thông tin cần giấu, M là tập thông điệp cần giấu với |C|≥|M|, K là một tập
khoá bí mật, Ek: C×M×K → C là một hàm nhúng thông điệp M vào phương
tiện chứa C sử dụng khoá K và Dk: C × K→ M là hàm giải tin sao cho
Dk(Ek(c,m,k),k) = m với mọi m ∈ M, c ∈ C và k ∈ K được gọi là một hệ
Secret Key Stegangraphy
Định nghĩa 4: Giấu tin dùng khoá công khai (Public Key Steganography)
Giống như là hệ mã mật khoá công khai, hệ giấu tin mật khoá công
khai không sử dụng việc truyền khoá bí mật mà sử dụng hai khoá là khoá bí
mật và khoá công khai. Khoá công khai được lưu trong cơ sở dữ liệu công
cộng. Được sử dụng trong quá trình giấu tin. Còn khoá bí mật được sử dụng
trong quá trình giải tin.
ch¬ng 1. giíi thiÖu tæng quan
Luận văn tốt nghiệp cao học
Dương Đức Hải
13
1.2.2. Phân loại kỹ thuật giấu tin
Do kỹ thuật giấu thông tin số mới được hình thành trong thời gian gần
đây nên xu hướng phát triển vẫn chưa ổn định. Nhiều phương pháp mới,
theo nhiều khía cạnh khác nhau đang và sẽ được đề xuất, bởi vậy một định
nghĩa chính xác, một sự đánh giá phân loại rõ ràng chưa thể có được. Một số
tác giả đã đưa ra các cách đánh giá phân loại và các định nghĩa, nhưng
không lâu sau lại có các định nghĩa khác, một sự phân loại khác được đề
xuất. Sơ đồ phân loại trên hình 1.2 được Fabien A. P. Petitcolas đề xuất năm
1999 [10].
Infomation
hiding
Giấu thông tin
Watermarking
Thuỷ vân số
Steganography
Giấu tin mật
Intrinsic
Giấu tin có xử lý
Pure
Giấu tin đơn thuần
Robust
Copyright marking
Thuỷ vân bền vững
Imperceptible
Watermarking
Thuỷ vân ẩn
Fragile
Watermarking
Thuỷ vân “dễ vỡ”
Visible
Watermarking
Thuỷ vân hiển
Hình 1.2. Phân loại các kỹ thuật giấu tin
theo hai khuynh hướng nghiên cứu chính
Sơ đồ phân loại này như một bức tranh khái quát về kỹ thuật giấu
thông tin. Dựa trên việc thống kê sắp xếp khoảng 100 công trình đã công bố
trên một số tạp chí, cùng với thông tin về tên và tóm tắt nội dung của
khoảng 200 công trình công bố trên Internet, có thể chia lĩnh vực giấu dữ
liệu ra làm hai hướng lớn, đó là watermarking và steganography. Nếu như
watermark quan tâm nhiều đến các ứng dụng giấu các mẩu tin ngắn nhưng
đòi hỏi độ bền vững cao của thông tin cần giấu đối với các biến đổi thông
thường của tệp dữ liệu môi trường thì steganography lại quan tâm tới các
ứng dụng che giấu các bản tin với độ mật và dung lượng càng lớn càng tốt.
Đối với từng hướng lớn này, quá trình phân loại có thể tiếp tục theo các tiêu
ch¬ng 1. giíi thiÖu tæng quan
14
Luận văn tốt nghiệp cao học
Dương Đức Hải
chí khác, ví dụ dựa theo ảnh hưởng các tác động từ bên ngoài có thể chia
watermark thành hai loại, một loại bền vững với các tác động sao chép trái
phép, loại thứ hai lại cần tính chất hoàn toàn đối lập: phải dễ bị phá huỷ
trước các tác động nói trên. Cũng có thể chia watermark theo đặc tính, một
loại cần được che giấu để chỉ có một số những người tiếp xúc với nó có thể
thấy được thông tin, loại thứ hai đối lập, cần được mọi người nhìn thấy .
1.2.2.1. Thủy vân (Watermark)
Thủy vân là một lượng thông tin nhỏ được nhúng vào một sản phẩm
số nhằm đảm bảo an toàn dữ liệu cho sản phẩm đó như trong những ứng
dụng chứng thực thông tin, bảo vệ bản quyền, phát hiện xuyên tạc...Trong
thực tế, thủy vân thường là một Logo, thông tin tác giả, mã sản phẩm...
Những đặc trưng quan trọng của watermark là khả năng bền vững sau
các biến dạng thông thường của môi trường, khả năng chống lại sự tấn công,
có thể cùng tồn tại với những watermark khác và yêu cầu một thuật toán tốt
theo nghĩa độ phức tạp tính toán nhỏ, nhất là giai đoạn khôi phục thông tin.
Sự quan trọng tương đối của những đặc trưng này nói chung phụ thuộc vào
các ứng dụng cụ thể. Sau đây là các tính chất chung của watermark.
- Tính vô hình (Invisibility): watermark phải không gây ra bất kỳ sự
chú ý nào cũng như không làm giảm chất lượng của tệp dữ liệu môi trường.
Đặc biệt, dữ liệu watermark trước và sau quá trình nhúng và giải tin phải
giống nhau.
- Tính bền vững (Robust): Những tệp âm thanh, hình ảnh và video vì
lý do nào đó có thể được biến đổi theo một phép xử lý số. Ví dụ như việc
thay đổi độ tương phản các tệp video, điều chỉnh âm sắc cho các tệp âm
thanh...một watermark phải đủ bền vững trước những biến đổi thông
thường như vậy. Tính bền vững được thể hiện: watermark vẫn còn hiện hữu
trong dữ liệu sau các biến dạng thông thường và các công cụ đọc watermark
có thể phát hiện ra nó dễ dàng.
- Tính dễ vỡ (Fragility): Trong một số ứng dụng, thủy vân cần đến
đặc trưng ngược với bền vững đó là “dễ vỡ”, tính dễ vỡ thể hiện qua sự thay
đổi, biến dạng của thủy vân dưới tác động của một phép biến đổi nào đó. Ví
dụ các watermark trong cổ phiếu, tiền hay hóa đơn và các giấy tờ quan trọng
phải được phá hủy trong mọi bản sao bất hợp lệ. Thuộc tính này của
watermark gọi là tính dễ vỡ.
ch¬ng 1. giíi thiÖu tæng quan
15
Luận văn tốt nghiệp cao học
Dương Đức Hải
- Khả năng chống giả mạo (Tamper – resistance): Đây là khả năng
tồn tại của thủy vân trước mọi dự định nhằm loại bỏ và thay thế chúng,
ngoài nghĩa bền vững chống lại những sự biến dạng tín hiệu trong các xử lý
bình thường. Tuy nhiên, đây là một yêu cầu khó khăn vì một tấn công được
coi là đạt hiệu quả khi loại bỏ watermark mà không thay đổi chất lượng của
dữ liệu vỏ.
- Phụ thuộc khóa (Key restrictions): Đây là sự phân biệt theo giới
hạn khả năng truy cập. Các giải thích, thông báo mô tả trong watermark phải
sẵn sàng được phát hiện bởi càng nhiều cơ chế dò tìm watermark càng tốt.
Ngược lại, những watermark phục vụ mục đích riêng tư như chữ ký số, đánh
giấu bản quyền... lại cần được che đậy ở một mức nhất định nào đó. Người
ta phân biệt sự khác nhau đó bởi mức độ giới hạn của khóa và phân chia
watermark thành watermark khóa không giới hạn và watermark khóa hạn
chế. Đương nhiên một giải thuật khóa không giới hạn phải kháng cự trước
một sự tấn công quyết liệt hơn một giải thuật khóa hạn chế.
- Biến thể và watermark kép (Modification and Multiple watermark):
trong đa số các ứng dụng cần thiết phải có sự phân biệt giữa dữ liệu có chứa
watermark và dữ liệu không chứa watermark. Lỗi phát hiện sai của hệ thống
dò tìm watermark là sác xuất mà nó xác định nhầm dữ liệu không chứa
watermark thành có chứa watermark. Mức độ nghiêm trọng của lỗi như vậy
phụ thuộc vào các ứng dụng cụ thể. Trong một số ứng dụng, lỗi này có thể là
thảm họa, ví dụ trong việc điều khiển trong việc chống sao chép cho đĩa
DVD; thiết bị sẽ từ chối chơi Video từ một đĩa nó tìm thấy một watermark
nói rằng dữ liệu không được phép sao chép. Những lỗi như vậy hiếm khi
xảy ra, tuy nhiên nếu có, nó sẽ để lại một ảnh hưởng nghiêm trọng tới thị
trường của các nhà sản xuất và phát hành. Những dự chi ngân sách hàng
triệu USD đang được dành cho các công ty thiết kế phương pháp watermark
có xác suất sai nhầm nhỏ.
- Chi phí tính toán (Computational cost): Chi phí này xảy ra trong cả
quá trình nhúng và phát hiện watermark. Tuy nhiên, chi phí của phát hiện
watermark thường quan trọng hơn, đặc biệt là việc phát hiện ra watermark
trong các ứng dụng Video thời gian thực hoặc âm thanh.
- Tính tiêu chuẩn (Standards): Trong công nghệ watermark có những
ứng dụng cần được tiêu chuẩn hóa để sử dụng được trong phạm vi toàn cầu,
ch¬ng 1. giíi thiÖu tæng quan
16
Luận văn tốt nghiệp cao học
Dương Đức Hải
ví dụ tiêu chuẩn cho watermark DVD. Hệ thống bảo vệ chống sao chép dựa
vào watermark được tích hợp ngay vào thiết bị đọc đĩa.
- Độ tin cậy (Reliability): Thiết bị cứng hoặc phần mềm có khả năng
phát hiện thông tin che giấu được gọi là bộ dò tìm. Gọi “lỗi phát hiện sai ”
là xác suất phát hiện sai nhầm các thông tin che giấu. Thống kê cho thấy các
bộ dò tìm thường mắc phải các lỗi sau:
+ Bộ dò tìm phát hiện thấy tín hiệu watermark trong một môi trường
không giấu thông tin. Người ta nói bộ dò tìm có lỗi sai dương tính (false
positive error).
+ Ngược lại với trường hợp nói trên, nếu bộ dò tìm không phát hiện
được tín hiệu watermark trong một môi trường có giấu thông tin. Người ta
nói bộ dò tìm có lỗi sai âm tính (false negative error).
+ Trường hợp phát hiện được tín hiệu watermark nhưng sai nội dung
người ta nói bộ dò tìm có lỗi sai bit.
Một bộ dò tìm được gọi là có độ tin cậy cao nếu như nó ít mắc phải
các lỗi trên đây.
1.2.2.2. Giấu tin mật (Steganography)
Steganography – giấu một thông tin vào một thông tin khác. Đó là
một phương pháp phần nào tương tự với truyền thông qua kênh thông tin bí
mật, truyền thông an toàn bằng kỹ thuật trải phổ...một thông báo được mã
hóa có thể gây ra sự hoài nghi trong khi một thông tin được giấu thì tránh
được điều đó.
Steganography vừa là nghệ thuật vừa là khoa học của truyền thông bí
mật. Khác với mật mã nơi mà người thám mã có được bản mã và có thể giải
mã, mục đích của Steganography là che giấu những thông điệp bên trong
những thông tin khác mà không làm ảnh hưởng đáng kể đến chất lượng của
thông tin gốc; và bằng một cách thức nào đó sao cho người không có thẩm
quyền không thể phát hiện hoặc phá hủy chúng.
Steganography có các đặc điểm sau:
- Dung lượng giấu tin (Hiding Capacity): Khả năng giấu tin được
đánh giá theo mối liên quan giữa lượng thông tin có thể giấu với kích thước
ch¬ng 1. giíi thiÖu tæng quan
17
Luận văn tốt nghiệp cao học
Dương Đức Hải
của dữ liệu môi trường. Dung lượng thông tin giấu phụ thuộc vào từng ứng
dụng cụ thể.
- Tính trong suốt đối với tri giác (Perceptual Transparency): Việc
giấu thông tin vào ảnh nguồn gây ra một số nhiễu trên ảnh nguồn. Điều này
có thể giải thích như sau: việc giấu thông tin được thực hiện bằng cách thay
đổi giá trị một số các bít không quan trọng, điều này có thể gây ra một chút
nhiễu cho ảnh môi trường. Nếu môi trường ban đầu hoàn toàn không có
nhiễu thì việc giấu tin coi như thất bại, ngược lại các nhiễu được tạo ra sau
khi giấu thông tin sẽ không phân biệt được với các nhiễu vốn có sẵn của môi
trường, chính tính trong suốt được thể hiện ở điểm này.
- Tính bền vững (Robust): Tính bền vững thể hiện qua việc các thông
tin giấu không bị thay đổi khi ảnh môi trường bị tác động bởi các phép xử
lý ảnh như:
+ Các phép lọc tuyến tính, lọc phi tuyến.
+ Phép cộng nhiễu.
+ Các phép làm sắc nét hoặc làm mờ.
+ Phép biến đổi tỉ lệ.
+ Phép quay ảnh.
+ Phép nén có mất thông tin.
+ Các phép chuyển đổi từ ảnh số sang ảnh tương tự và ngược lại
(chẳng hạn việc in một ảnh có giấu thông tin sau đó dùng máy quét ảnh để
quét lại ảnh đó).
Tính bền vững rất quan trọng trong việc bảo vệ bản quyền watermark
vì người vi phạm bản quyền sẽ tìm cách lọc và hủy bỏ các watermark được
nhúng trong ảnh. Hiện đã có các phần mềm chống lại watermark thực hiện
việc loại bỏ các watermark một cách có hiệu quả [12,20] thậm chí kỹ thuật
này còn có thể loại bỏ được cả những thông tin nhúng trong ảnh.
- Khả năng chống giả mạo (Tamper - resistance): Khả năng chống
giả mạo nói tới sự khó khăn khi đối phương định thay thế hoặc làm giả mạo
một thông tin nhúng trong ảnh, chẳng hạn khi người vi phạm bản quyền thay
thế một giấu bản quyền của người khác bằng một quyền sở hữu hợp lệ của
ch¬ng 1. giíi thiÖu tæng quan
Luận văn tốt nghiệp cao học
Dương Đức Hải
18
mình. Một ứng dụng đòi hỏi có tính bền vững cao thường cũng đòi hỏi khả
năng mạnh chống tính giả mạo.
- Một số đặc điểm khác: kỹ thuật giấu tin còn một số đặc điểm khác,
chẳng hạn việc mã hóa và giải mã đòi hỏi tính toán phức tạp. Ngoài ra một
số đặc điểm còn tùy theo các yêu cầu đối với từng ứng dụng độc lập.
1.2.2.3. Những khác biệt giữa Steganography với Watermarking
Bảng 1.1. Phân biệt giữa Steganography và Watermarking
Steganography
Watermarking
- Tập trung vào việc giấu được càng
- Không cần giấu nhiều thông tin, chỉ
nhiều thông tin càng tốt, ứng dụng trong cần lượng thông tin nhỏ đặc trưng cho
truyền dữ liệu thông tin mật.
bản quyền của người sở hữu.
- Cố gắng làm nhỏ nhất những ảnh - Trong trường hợp thuỷ vân nhìn thấy
hưởng đến chất lượng của đối tượng vỏ thì thuỷ vân sẽ hiện ra.
để không bị chú ý đến dữ liệu đã được
giấu trong đó.
- Thay đổi stego-object cũng làm cho - Thuỷ vân phải bền vững với mọi tấn
dữ liệu giấu bị sai lệch (nhất là ứng dụng công có chủ đích hoặc không có chủ
đích vào sản phẩm.
trong nhận thực thông tin)
1.3. Mô hình cơ bản của kỹ thuật giấu tin
Mô hình của kỹ thuật giấu tin cơ bản được trình bày trên hai hình vẽ
sau:
M
I
S
E
K
Hình 1.3. Lược đồ chung cho quá trình giấu thông tin
Hình 1.3 biểu diễn quá trình giấu thông tin cơ bản. Phương tiện chứa
bao gồm các đối tượng được dùng làm môi trường để giấu tin như văn bản,
ảnh, audio, video…, dữ liệu giấu là một lượng thông tin mang ý nghĩa nào
đó, tuỳ thuộc vào mục đích của người sử dụng. Thông tin sẽ được giấu vào
trong phương tiện chứa nhờ một bộ nhúng, bộ nhúng là những chương trình,
ch¬ng 1. giíi thiÖu tæng quan
- Xem thêm -