BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
-------------------------------
TRẦN SƠN TÙNG
XÂY DỰNG ỨNG DỤNG GIẤU THÔNG TIN CHỦ SỞ
HỮU VÀO FILE ÂM THANH
LUẬN VĂN THẠC SỸ KỸ THUẬT
CHUYÊN NGÀNH: KỸ THUẬT MÁY TÍNH
Hà Nội – 2017
BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
-------------------------------
TRẦN SƠN TÙNG
XÂY DỰNG ỨNG DỤNG GIẤU THÔNG TIN CHỦ SỞ
HỮU VÀO FILE ÂM THANH
LUẬN VĂN THẠC SỸ KỸ THUẬT
CHUYÊN NGÀNH: KỸ THUẬT MÁY TÍNH
NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS.TS. ĐẶNG VĂN CHUYẾT
Hà Nội – 2017
MỤC LỤC
CÁC TỪ VIẾT TẮT ...................................................................................................4
DANH MỤC CÁC HÌNH VẼ.....................................................................................5
LỜI MỞ ĐẦU .............................................................................................................7
CHƢƠNG I. TỔNG QUAN VỀ GIẤU TIN TRONG FILE ÂM THANH................9
1.1.
Giới thiệu chung ............................................................................................9
1.2.
Phân loại các phƣơng pháp giấu tin.............................................................10
1.2.1.
Phân loại theo phƣơng tiện chứa tin .....................................................10
a) Giấu tin trong ảnh ........................................................................................10
b) Giấu tin trong audio .....................................................................................11
c) Giấu tin trong video .....................................................................................12
d) Giấu tin trong văn bản dạng text .................................................................12
1.2.2.
Phân loại theo cách thức tác động lên phƣơng tiện ..............................12
a) Phƣơng pháp chèn dữ liệu ...........................................................................12
b) Phƣơng pháp thay thế ..................................................................................12
c) Phƣơng pháp tạo các phƣơng tiện chứa.......................................................13
1.2.3.
Phân loại theo mục đích sử dụng ..........................................................13
a) Steganography .............................................................................................13
b) Watermarking ..............................................................................................14
1.3.
Các tính chất của giấu tin trong file âm thanh .............................................14
a) Tính vô hình.................................................................................................15
b) Dung lƣợng giấu tin .....................................................................................15
c) Tính bền vững ..............................................................................................15
d) Độ phức tạp tính toán ..................................................................................15
e) File âm thanh môi trƣờng đối với quá trình giải mã....................................16
1.4.
Một số ứng dụng của giấu tin trong file âm thanh ......................................16
a) Bảo vệ bản quyền ........................................................................................16
b) Điểm chỉ số ..................................................................................................16
c) Gán nhãn ......................................................................................................16
1
d) Liên lạc bí mật .............................................................................................17
1.5.
Tăng độ an toàn cho thông tin đem giấu .....................................................17
1.6.
Đánh giá chất lƣợng âm thanh sau khi giấu tin ...........................................17
CHƢƠNG II. CƠ SỞ LÝ THUYẾT VÀ CÁC CÔNG CỤ HỖ TRỢ GIẤU TIN
TRONG FILE ÂM THANH .....................................................................................19
2.1.
Âm thanh và cấu trúc lƣu trữ của âm thanh ................................................19
2.1.1.
Sóng âm và cảm giác âm ......................................................................19
2.1.2.
Mã hóa âm thanh wave .........................................................................19
a) Lấy mẫu .......................................................................................................19
b) Chiều sâu bit ................................................................................................20
c) Kênh âm thanh (Channels) ..........................................................................20
2.1.3.
Cấu trúc tập tin âm thanh WAVE .........................................................20
a) RIFF chunk ..................................................................................................21
b) FORMAT chunk ..........................................................................................21
c) DATA chunk ...............................................................................................22
2.2.
Một số phƣơng pháp giấu tin trong file âm thanh .......................................22
2.2.1.
Least Significant Bit .............................................................................22
a) Giới thiệu Least Significant Bit ...................................................................22
b) Mã hóa .........................................................................................................24
c) Giải mã: .......................................................................................................25
2.2.2.
Mã hóa Parity (Parity Coding) ..............................................................25
2.2.3.
Kỹ thuật trải phổ ...................................................................................26
a) Giới thiệu kỹ thuật trải phổ..........................................................................26
b) Các phƣơng pháp trải phổ............................................................................27
c) Ƣu điểm của kỹ thuật thông tin trải phổ ......................................................30
2.2.4.
Kỹ thuật mã hóa echo (echo hiding) .....................................................31
2.2.5.
Mã hóa Phase (Phase Coding) ..............................................................31
a) Giới thiệu mã hóa Phase ..............................................................................31
b) Mã hóa .........................................................................................................32
2
c) Giải mã ........................................................................................................33
CHƢƠNG III. CÀI ĐẶT, THỬ NGHIỆM VÀ ĐÁNH GIÁ ...................................34
3.1.
Môi trƣờng cài đặt .......................................................................................34
3.2.
Triển khai cài đặt chƣơng trinh ...................................................................34
a) Mã hóa và Giải mã bằng thuật toán LSB ....................................................35
b) Mã hóa và Giải mã bằng thuật toán Phase coding.......................................35
c) Đánh giá chất lƣợng âm thanh dựa trên tham số PSNR ..............................35
3.3.
Kịch bản thử nghiệm ...................................................................................35
3.4.
Thử nghiệm..................................................................................................36
a) Tính tái tạo thông tin ...................................................................................37
b) Tính vô hình.................................................................................................38
c) Dung lƣợng giấu tin .....................................................................................41
d) Tính bền vững ..............................................................................................41
e) Độ phức tạp thuật toán.................................................................................43
f)
Đánh giá PSNR ............................................................................................44
3.5.
Nhận xét và đánh giá ...................................................................................44
KẾT LUẬN ...............................................................................................................46
DANH MỤC TÀI LIỆU THAM KHẢO ..................................................................47
3
CÁC TỪ VIẾT TẮT
DES
Data Encryption Standard
RSA
Là một thuật toán mật mã hóa khóa công khai
HAS
Human Auditory System
HVS
Human Vision System
CBR
Constant bitrate
ABR
Average bitrate
VBR
Variable bitrate
LSB
Least Significant Bit
MSB
Most Significant Bit
SNR
Signal-To-Noise Ratio
DSSS
Direct Sequency Spread Spectrum
FHSS
Frenquency Hopped Spread Spectrum
DFT
Dicrete Fourier Transform
RIFF
Resource Interchange File Format
PCM
Pulse Code Modulation
4
DANH MỤC CÁC HÌNH VẼ
Hình 1. Phân Loại Các Phƣơng Pháp Giấu ...............................................................13
Hình 2. Quá Trình Lấy Mẫu (Sampling) Đối Với Tín Hiệu Âm Thanh ...................20
Hình 3. Giá Trị 8 Bit Của Tín Hiệu A = 218 ............................................................22
Hình 4. Giá Trị 8 Bit Của Tín Hiệu B=219 Sau Khi Giấu Bit 1 Vào Lsb Của A.....23
Hình 5. Giá Trị 8 Bit Của Tín Hiệu C=219 Sau Khi Giấu Bit 0 Vào Lsb Của A.....23
Hình 6. Lsb Coding Cho Mẫu Wave Âm Thanh Tiêu Chuẩn 16bit .........................23
Hình 7. Parity Coding ...............................................................................................26
Hình 8. Mô Hình Kỹ Thuật Trải Phổ ........................................................................27
Hình 9. Khối Điều Chế Và Khối Giải Điều Chế DSSS ............................................27
Hình 10. Biểu Diễn Tín Hiệu Dƣới Dạng NRZ ........................................................28
Hình 11. Dạng Sóng Của Tín Hiệu Trƣớc Trải Phổ Và Sau Trải Phổ DSSS ...........29
Hình 12. Phổ Của Tín Hiệu FHSS ............................................................................29
Hình 13. Sơ Đồ Khối Tạo Và Khối Thu Tín Hiệu FHSS .........................................29
Hình 14. Echo Hiding ...............................................................................................31
Hình 15. Sự Dịch Chuyển Pha Của Tín Hiệu ...........................................................32
Hình 16. Các Hệ Điều Hành Hỗ Trợ Của Matlab .....................................................34
Hình 17. Giao Diện Chính Của Chƣơng Trình .........................................................34
DANH MỤC CÁC BẢNG BIỂU
Bảng 1. So sánh sự khác biệt giữa giấu tin mật và thủy vân số ................................14
Bảng 2. Minh họa đặc tả RIFF chunk .......................................................................21
Bảng 3. Minh họa đặc tả FORMAT chunk ...............................................................21
Bảng 4. Minh họa đặc tả Data chunk ........................................................................22
Bảng 5. Thông tin tín hiệu âm thanh đầu vào ...........................................................37
Bảng 6. Tái tạo thông điệp sau khi mã hóa ...............................................................38
Bảng 7. So sánh tín hiệu của các file âm thanh trƣớc và sau khi giấu tin LSB ........39
Bảng 8. So sánh tín hiệu của file âm thanh trƣớc và sau khi giấu tin Phase coding .40
Bảng 9. Dung lƣợng file tín hiệu trƣớc và sau khi giấu thông điệp ..........................41
5
Bảng 10. Tái tạo thông tin sau khi thực hiện khử nhiễu trên file âm thanh ..............42
Bảng 11. Tái tạo thông tin sau khi thực hiện add noise trên file âm thanh...............42
Bảng 12. So sánh thời gian Mã hóa của 2 thuật toán ................................................43
Bảng 13. So sánh thời gian Giải mã của 2 thuật toán ...............................................43
6
LỜI MỞ ĐẦU
Ngày nay, khi mạng Internet phát triển mạnh mẽ, các ứng dụng công nghệ
thông tin ngày càng trở nên phổ biến rộng rãi Việc truyền nhận thông tin đã trở nên
dễ dàng, thuận tiện và tiết kiệm chi phí hơn. Hàng ngày, một khối lƣợng thông tin
vô cùng lớn đƣợc máy tính tiếp nhận, quản lý và truyền đi trên hệ thống mạng. Đối
với những thông tin bình thƣờng thì không ai để ý đến, nhƣng đối với những thông
tin mang tính chất “bí mật” của một số cá nhân, đơn vị thì vấn đề “bí mật” thông tin
thực sự vô cùng quan trọng. Bên cạnh đó, cùng với sự bùng nổ của Internet và các
phƣơng tiện multimedia, những vấn nạn nhƣ ăn cắp bản quyền, không tôn trọng
quyền chủ sở hữu... cũng gia tăng đòi hỏi phải không ngừng tìm các giải pháp bảo
mật mới. Nhiều phƣơng án đã đƣợc các cá nhân, đơn vị tìm kiếm và đƣa ra, một
trong các giải pháp có nhiều triển vọng là giấu tin.
Căn cứ vào tình hình thực tế đó em nhận đề tài luận văn tốt nghiệp: “xây
dựng ứng dụng giấu thông tin Chủ sở hữu vào file âm thanh”.
Luận văn đƣợc thực hiện với mục đích Tìm hiểu công nghệ giấu tin trong file
âm thanh, qua đó tìm giải pháp đáp ứng nhu cầu an toàn, bảo mật thông tin cho chủ
sở hữu dữ liệu âm thanh đó.
Nhiệm vụ của em đặt ra trong qua trình thực hiện luận văn tốt nghiệp này là
tìm hiểu một số phƣơng pháp giấu tin trong các file âm thanh, tìm hiểu một số thuật
toán qua đó minh họa thử nghiệm, so sánh đánh giá tính tối ƣu của thuật toán.
Qua quá trình nghiên cứu và căn cứ vào nhiệm vụ đề tài, em đặt ra bố cục của
luận văn tốt nghiệp gồm những phần sau:
-
Lời mở đầu
-
Chƣơng I. Tổng quan về giấu tin trong file âm thanh
-
Chƣơng II: Cơ sở lý thuyết và các công cụ hỗ trợ giấu tin trong file âm thanh.
-
Chƣơng III: Cài đặt, Thử nghiệm và Đánh giá.
-
Kết luận
Trong quá trình làm luận văn, em xin chân thành cảm ơn các thầy cô giáo
giảng dạy tại khoa Sau đại học – ĐH Bách Khoa Hà Nội đã trang bị cho em vốn
7
kiến thức trong suốt thời gian học tập tại đây. Đặc biệt, em xin chân thành cảm ơn
thầy PGS. TS. Đặng Văn Chuyết đã tận tình giảng dạy, chỉ bảo và hƣớng dẫn em
hoàn thành luận văn này.
Do thời gian thực hiện luận văn có hạn cũng nhƣ kiến thức thức của bản thân
còn nhiều hạn chế nên việc thực hiện luận văn chắc chắn sẽ có nhiều thiếu sót. Bản
thân em kính mong nhận đƣợc sự chỉ bảo của quý thầy cô và ý kiến góp ý của các
bạn cùng khóa.
Hà Nội, ngày 10 tháng 11 năm 2017
Học Viên
Trần Sơn Tùng
8
CHƢƠNG I. TỔNG QUAN VỀ GIẤU TIN TRONG FILE ÂM THANH
1.1.
Giới thiệu chung
Hiding information là kỹ thuật giấu thông tin quan trọng vào đối tƣợng dữ
liệu số mà không làm ảnh hƣởng trực giác đến chất lƣợng ban đầu của dữ liệu số.
Dữ liệu số dùng để che giấu tin có thể là ảnh số (image), âm thanh số (audio), phim
hoặc đoạn clip (video)...
Từ thời kỳ cổ đại ngƣời ta đã sử dụng phƣơng pháp này để liên lạc mật cho
nhau. Một ví dụ cổ điển hình về giấu tin (485-525 trƣớc công nguyên) là câu
chuyện của một ngƣời tên là Histaiæus [3] muốn gửi thông tin quan trọng về “Kế
hoạch ủng hộ cuộc nổi dậy chống lại đức vua Ba tƣ Xerxes” cho nhà nhiếp chính
thành phố Miletus bằng cách xăm thông tin lên da đầu ngƣời nô lệ tin cậy của mình,
cho đến khi tóc mọc dài trở lại ông ta cử ngƣời nô lệ đó đến gặp nhà nhiếp chính,
trên đƣờng đi không bị lộ thông tin, có thể vƣợt qua mọi cuộc kiểm soát, khi đến
gặp nhà nhiếp chính, nhà nhiếp chính chỉ việc cạo trọc đầu ngƣời nô lệ là có thể đọc
đƣợc thông tin. Hay một phát minh khác của Pliny T. Elder (23-79 sau công
nguyên) về mực “không màu” chính là sữa của một số loại động vật, khi mực này
viết trên giấy để khô khó phát hiện ra, và chỉ khi giấy đó đƣợc hơ nóng các vết mực
sẽ chuyển sang nâu, có thể đọc các dòng chữ đã viết. Vào thời kỳ phục hƣng, năm
1518 Johannes Trithemius viết cuốn sách về mã hóa “Polygraphia”. Trong cuốn
sách này ngƣời ta thấy xuất hiện đầu tiên thuật ngữ “Steganographia”, đây là một từ
ghép bắt nguồn từ ngôn ngữ Hy lạp steganos nghĩa là bao bọc “cover” và graphia
nghĩa là bản viết “writing”
Trải qua nhiều thời kỳ biến động của xã hội loài ngƣời, ngày nay khi mà kỹ
thuật số bùng nổ, con ngƣời cũng “số hoá” lĩnh vực giấu tin phục vụ cho cuộc sống
hiện đại.
Giấu tin có một ƣu điểm mà mật mã học (Cryptography) còn hạn chế đó là
có thể “bảo vệ đƣợc bản quyền số, hay khi giữa các đối tƣợng liên lạc mật với nhau
trên các kênh thông tin công cộng mà ít bị nghi ngờ”. Lý do vì bản quyền số đã mã
9
hóa sau khi đƣợc giải mã thì khó có thể giữ đƣợc bản quyền, hay thông tin mật cần
trao đổi giữa các bên, sau khi đƣợc mã hóa sẽ làm cho ngƣời khác biết rõ là các bên
có trao đổi thông tin mật nào đó cho nhau. Giấu tin trong dữ liệu đa phƣơng tiện
chính là bổ sung những thiếu sót cho các vấn đề trên của mật mã học.
Về nguyên lý, giấu tin trong dữ liệu video, dữ liệu âm thanh hay trong dữ
liệu ảnh số không khác gì nhiều. Giấu tin trong audio dựa vào hệ thống thính giác
của con ngƣời nên thƣờng khó hơn trong các dữ liệu số khác do hệ thống thính giác
của con ngƣời khá nhạy cảm với các nhiễu, tuy nhiên audio là loại dữ liệu đƣợc sử
dụng khá phổ biến trên internet hiện nay vì vậy nó vẫn đƣợc quan tâm và nghiên
cứu rộng rãi cho nhiều mục đích khác nhau nhƣ: bảo vệ bản quyền, chống sao chép,
xuyên tạc nội dung.
1.2.
Phân loại các phƣơng pháp giấu tin
Do các phƣơng pháp giấu thông tin số đƣợc hình thành trong thời gian gần
đây nên xu hƣớng phát triển vẫn chƣa ổn định. Nhiều phƣơng pháp mới vẫn đang
đƣợc tiếp tục nghiên cứu đề xuất. Các phƣơng pháp có thể đƣợc phân loại theo
phƣơng tiện chứa tin, theo cách thức tác động lên phƣơng tiện hoặc theo mục đích
sử dụng. [3]
1.2.1. Phân loại theo phƣơng tiện chứa tin
a)
Giấu tin trong ảnh
Thông tin sẽ đƣợc giấu cùng với dữ liệu ảnh nhƣng chất lƣợng ảnh ít thay đổi
và không ai biết đƣợc đằng sau ảnh đó mang những thông tin có ý nghĩa. Ngày nay,
khi ảnh số đã đƣợc sử dụng rất phổ biến, thì giấu thông tin trong ảnh đã đem lại rất
nhiều những ứng dụng quan trọng trên nhiều lĩnh vực trong đời sống xã hội. Ví dụ
nhƣ đối với các nƣớc phát triển, chữ kí tay đã đƣợc số hoá và lƣu trữ sử dụng nhƣ là
hồ sơ cá nhân của các dịch vụ ngân hàng và tài chính, nó đƣợc dùng để nhận thực
trong các thẻ tín dụng của ngƣời tiêu dùng. Phần mềm WinWord của MicroSoft
cũng cho phép ngƣời dùng lƣu trữ chữ kí trong ảnh nhị phân rồi gắn vào vị trí nào
đó trong file văn bản để đảm bảo tính an toàn của thông tin. Tài liệu sau đó đƣợc
truyền trực tiếp qua máy fax hoặc lƣu truyền trên mạng. Theo đó, việc xác thực chữ
10
kí, thông tin đã trở thành một vấn đề cực kì quan trọng khi mà việc ăn cắp thông tin
hay xuyên tạc thông tin bởi các tin tặc đang trở thành một vấn nạn đối với bất kì
quốc gia nào, tổ chức nào. Thêm vào đó, lại có rất nhiều loại thông tin quan trọng
cần đƣợc bảo mật nhƣ những thông tin về an ninh, thông tin về bảo hiểm hay các
thông tin về tài chính, các thông tin này đƣợc số hoá và lƣu trữ trong hệ thống máy
tính hay trên mạng. Chúng rất dễ bị lấy cắp và bị thay đổi bởi các phần mềm chuyên
dụng. Việc xác thực cũng nhƣ phát hiện thông tin xuyên tạc đã trở nên vô cùng
quan trọng, cấp thiết. Và một đặc điểm của giấu thông tin trong ảnh đó là thông tin
đƣợc giấu trong ảnh một cách vô hình, nó nhƣ là một cách mà truyền thông tin mật
cho nhau mà ngƣời khác không thể biết đƣợc bởi sau khi giấu thông tin thì chất
lƣợng ảnh gần nhƣ không thay đổi.
b)
Giấu tin trong audio
Giấu thông tin trong audio mang những đặc điểm riêng, khác với giấu thông
tin trong các đối tƣợng đa phƣơng tiện khác. Một trong những yêu cầu cơ bản của
giấu tin là đảm bảo tính chất ẩn của thông tin đƣợc giấu đồng thời không làm ảnh
hƣởng đến chất lƣợng của dữ liệu gốc. Để đảm bảo yêu cầu này, kỹ thuật giấu thông
tin trong ảnh phụ thuộc vào hệ thống thị giác của con ngƣời - HVS (Human Vision
System) còn kỹ thuật giấu thông tin trong audio lại phụ thuộc vào hệ thống thính
giác HAS (Human Auditory System). Và một vấn đề khó khăn ở đây là hệ thống
thính giác của con ngƣời nghe đƣợc các tín hiệu ở các giải tần rộng và công suất lớn
nên đã gây khó dễ đối với các phƣơng pháp giấu tin trong audio. Tuy nhiên HAS lại
kém trong việc phát hiện sự khác biệt các dải tần và công suất điều này có nghĩa là
các âm thanh to, cao tần có thể che giấu đƣợc các âm thanh nhỏ thấp một cách dễ
dàng. Các mô hình phân tích tâm lí đã chỉ ra điểm yếu trên và thông tin này sẽ giúp
ích cho việc chọn các audio thích hợp cho việc giấu tin. Vấn đề khó khăn thứ hai
đối với giấu thông tin trong audio là kênh truyền tin. Kênh truyền hay băng thông
chậm sẽ ảnh hƣởng đến chất lƣợng thông tin sau khi giấu. Ví dụ để nhúng một đoạn
java applet vào một đoạn audio (16 bit, 44.100 Hz) có chiều dài bình thƣờng thì các
phƣơng pháp nói chung cũng cần ít nhất là 20 bit/s. Giấu thông tin trong audio đòi
11
hỏi yêu cầu rất cao về tính đồng bộ và tính an toàn của thông tin. Các phƣơng pháp
giấu thông tin trong audio đều lợi dụng điểm yếu trong hệ thống thính giác của con
ngƣời.
c)
Giấu tin trong video
Cũng giống nhƣ giấu thông tin trong ảnh hay trong audio, giấu tin trong
video cũng đƣợc quan tâm và đƣợc phát triển mạnh mẽ cho nhiều ứng dụng nhƣ
điều khiển truy cập thông tin, xác thực thông tin và bảo vệ bản quyền tác giả. Ta có
thể lấy một ví dụ là các hệ thống chƣơng trình trả tiền xem theo đoạn với các video
clip (pay per view application). Các kỹ thuật giấu tin trong video cũng đƣợc phát
triển mạnh mẽ và cũng theo hai khuynh hƣớng là thuỷ vân số và giấu tin mật.
d)
Giấu tin trong văn bản dạng text
Giấu thông tin vào các văn bản dạng text khó thực hiện hơn do có ít các
thông tin dƣ thừa, để làm đƣợc điều này phải khéo léo khai thác các dƣ thừa tự
nhiên của ngôn ngữ. Một cách khác là tận dụng các định dạng văn bản (mã hóa
thông tin và khoảng cách giữa các từ hay các dòng văn bản). Từ nội dung của thông
điệp cần truyền đi, ngƣời ta cũng có thể sử dụng văn phạm phi ngữ cảnh để tạo nên
các văn bản “phƣơng tiện chứa” rồi truyền đi.
1.2.2. Phân loại theo cách thức tác động lên phƣơng tiện
a)
Phương pháp chèn dữ liệu
Phƣơng pháp này tìm các vị trí trong tệp (file) dễ bị bỏ qua và chèn các dữ
liệu cần giấu vào đó, cách giấu này không làm ảnh hƣởng gì tới sự thể hiện của các
file dữ liệu ví dụ nhƣ dữ liệu đƣợc giấu sau các ký tự EOF (End of file)[3].
b)
Phương pháp thay thế
Thực hiện việc thay thế các phần tử không quan trọng của phƣơng tiện chứa
bằng các dữ liệu của thông điệp cần chuyển đi. Vì thay thế vào các phần tử không
quan trọng của phƣơng tiện chứa nên dễ đánh lừa đƣợc cảm nhận của con ngƣời.
Phƣơng pháp thay thế có nhiều cách thực hiện nhƣ: thay thế các bit ít quan trọng,
thay thế trong miền tần số, các kỹ thuật trải phổ, thống kê.
12
c)
Phương pháp tạo các phương tiện chứa
Từ các thông điệp cần giấu phƣơng pháp này sẽ tạo ra các phƣơng tiện chứa
để phục vụ cho việc truyền thông tin đó, tại phía ngƣời nhận dựa trên các phƣơng
tiện chứa này có thể tái tạo lại các thông điệp.
1.2.3. Phân loại theo mục đích sử dụng
Phƣơng pháp phân loại theo mục đích sử dụng đƣợc đề xuất năm 1999 bởi
Fabien A. P. Petiscolas (Hình 1)
Giấu tin
(Hiding Information)
Thủy vân số
Giấu tin mật
(Digital Watermarking)
(Steganography)
Thủy vân
Dấu vân tay
Ẩn thông
Trong suốt
(Watermarking)
(Fingerprinting)
tin
(Pure)
(Intrinsic)
Hình 1. Phân loại các phương pháp giấu
Theo Fabien thì có thể chia lĩnh vực giấu tin thành hai hƣớng lớn đó là
steganography (giấu tin mật) và watermarking (thủy vân số).
a)
Steganography
Đây là kỹ thuật giấu tin phổ biến nhất từ trƣớc tới nay, steganography là kỹ
thuật ẩn dấu một file, message, image hoặc video bên trong một file, message,
image hoặc video khác.
Đối với phƣơng pháp này ngƣời ta quan tâm chủ yếu tới các mục tiêu: độ an
toàn của thông điệp và lƣợng thông điệp tối đa có thể giấu mà vẫn đảm bảo an toàn,
độ bảo mật của thông tin trong trƣờng hợp giấu tin bị phát hiện.
13
b)
Watermarking
Do yêu cầu bảo vệ bản quyền, xác thực và chống xuyên tạc... nên giấu tin
thuỷ vân có yêu cầu khác với giấu tin bí mật. Yêu cầu đầu tiên là các dấu hiệu thuỷ
vân phải đủ bền vững trƣớc các tấn công vô tình hay cố ý gỡ bỏ nó. Thêm vào đó
các dấu hiệu thuỷ vân phải có ảnh hƣởng tối thiểu (về mặt cảm nhận) đối với các
phƣơng tiện chứa. Nhƣ vậy các thông tin cần giấu sẽ càng nhỏ càng tốt.
Phân biệt giấu thông tin bí mật và thuỷ vân đƣợc mô tả tóm lƣợc trong
Bảng1
Bảng 1. So sánh sự khác biệt giữa giấu tin mật và thủy vân số [3]
Mục tiêu
Cách
-
-
thức thực
Giấu thông tin mật
Thủy vân số
(steganography)
(watermark)
Tàng hình các phiên liên -
Chủ yếu phục vụ cho mục đích
lạc, để bảo mật thông tin.
bảo vệ bản quyền.
Dùng trong các liên lạc xác -
Chủ yếu dùng trong các hoạt động
định.
xuất bản.
Không làm “thay đổi” -
Có thể tác động nhỏ về cảm nhận
phƣơng tiện chứa.
tới phƣơng tiện chứa.
Giấu đƣợc nhiều thông tin -
Chỉ cần nhúng ít dữ liệu.
nhất.
Dữ liệu nhúng cần phải mạnh.
hiện
-
Yêu cầu
-
Không quan tâm nhiều tới -
Đảm bảo bền vững trƣớc các
độ bền vững của phƣơng
phƣơng pháp nén dữ liệu.
tiện chứa.
-
-
Không kiểm tra đƣợc nếu
không có khóa thích hợp.
Dữ liệu nhúng có thể nhận thấy
hay không nhận thấy.
-
Không kiểm tra đƣợc nếu không
có khóa thích hợp.
1.3.
Các tính chất của giấu tin trong file âm thanh
14
Vì là một lĩnh vực mới phát triển nhƣng đã và đang đƣợc ứng dụng rộng rãi
nên có rất nhiều phƣơng pháp giấu tin trong các phƣơng tiện mutilmedia đƣợc
nghiên cứu và thực nghiệm. Để đánh giá một phƣơng pháp so với các phƣơng pháp
khác ngƣời ta dựa vào một số các tính chất của phƣơng pháp hay các tiêu chí đánh
giá sau [2]
a)
Tính vô hình
Khái niệm này dựa trên dặc điểm của hệ thống thị giác hay thính giác của
con ngƣời. Thông tin nhúng là không nhìn thấy đƣợc nếu một ngƣời với thính giác
bình thƣờng không phân biệt đƣợc âm thanh gốc và âm thanh đã đƣợc nhúng thông
tin. Giấu tin trong file âm thanh sẽ làm biến đổi một phần các tính chất, thông số
của file âm thanh môi trƣờng. Tính vô hình thể hiện ở mức độ biến đổi của file âm
thanh môi trƣờng. Một phƣơng pháp tốt sẽ làm cho thông tin mật trở nên vô hình
trên file âm thanh môi trƣờng, ngƣời dùng bình thƣờng sẽ không phát hiện đƣợc
trong file âm thanh đó có ẩn chứa thông tin.
b)
Dung lượng giấu tin
Dung lƣợng giấu tin đƣợc tính bằng tỉ lệ của lƣợng tin giấu so với kích thƣớc
file âm thanh. Vì tin mật đƣợc gửi cùng với file âm thanh môi trƣờng qua mạng
hoặc qua các hình thức lƣu trữ khác nên đây cũng là một chỉ tiêu quan trọng. Các
phƣơng pháp đều cố gắng làm sao giấu đƣợc càng nhiều tin trong khi vẫn giữ đƣợc
bí mật. Tuy nhiên trong thực tế ngƣời ta vẫn phải cân nhắc giữa dung lƣợng và các
chỉ tiêu khác nhƣ tính vô hình, tính bền vững.
c)
Tính bền vững
Sau khi giấu tin vào file âm thanh, bản thân file âm thanh môi trƣờng có thể
trải qua các khâu biến đổi khác nhau nhƣ lọc thông, thêm nhiễu, lọc nhiễu, cắt, nén
file âm thanh. Tính bền vững là tiêu chí đánh giá sự nguyên vẹn của thông tin mật
sau những biến đổi nhƣ vậy.
d)
Độ phức tạp tính toán
15
Chỉ tiêu về độ phức tạp trong mã hóa và giải mã cũng là một yếu tố quan
trọng trong đánh giá các phƣơng pháp giấu tin trong file âm thanh. Yêu cầu về độ
phức tạp tính toán phụ thuộc vào từng ứng dụng.
e)
File âm thanh môi trường đối với quá trình giải mã
Yêu cầu cuối cùng là phƣơng pháp phải cho phép lấy lại đƣợc thông tin đã
giấu trong file âm thanh mà không cần phải có file âm thanh gốc.
1.4.
Một số ứng dụng của giấu tin trong file âm thanh
Giấu tin trong file âm thanh ngày càng đƣợc ứng dụng rộng rãi, các ứng
đụng đƣợc phát triển tùy theo từng hoàn cảnh cụ thể và mục đích sử dụng khác
nhau. Dƣới đây là một số ứng dụng đang đƣợc triển khai phổ biến trên thế giới [2].
a)
Bảo vệ bản quyền
Một biểu tƣợng bí mật đƣợc nhúng vào trong file âm thanh để xác nhận
quyền sở hữu. Biểu tƣợng thủy vân (watermark) mang ý nghĩa quyền sở hữu tác giả,
có thể có cấu trúc phức tạp đƣợc đính lên file âm thanh khi bán hoặc phân phối,
thêm vào đó có thể gán một nhãn thời gian (time stamp) để chống giải mạo. Một
watermark cũng có thể đƣợc dùng để phát hiện xem các file âm thanh có bị giả mạo
hay không.
b)
Điểm chỉ số
Mục tiêu của điểm chỉ số là để chuyển thông tin đến ngƣời nhận (chứ không
phải chủ sở hữu) sản phẩm phƣơng tiện số nhằm xác định đây là bản sao duy nhất
của sản phẩm. Về mặt ý nghĩa điểm chỉ số tƣơng tự nhƣ số sê ri của phần mềm.
c)
Gán nhãn
Gán tiêu đề, nhãn thời gian, chú giải và các minh họa khác có thể đƣợc
nhúng vào file âm thanh, ví dụ nhƣ đính tên ca sĩ, nhạc sĩ, trung tâm phát hành,
ngƣời phát ngôn...lên các file âm thanh. Khi đó nếu sao chép file âm thanh thì cũng
sao chép cả những dữ liệu nhứng trong nó và chỉ có chủ sở hữu hoặc những ngƣời
đƣợc ủy quyền mới có có khóa mật (stego – key) để có thể tách ra và xem đƣợc các
nội dung, thông điệp này.
16
d)
Liên lạc bí mật
Trong nhiều trƣờng hợp, sử dụng mật mã có thể gây chú ý không mong
muốn. Ngoài ra việc sử dụng công nghệ mã hóa có thể bị hạn chế và thậm chí có thể
bị cấm sử dụng. Ngƣợc lại, việc giấu tin trong môi trƣờng nào đó rồi gửi đi trên môi
trƣờng mạng thì lại ít gây ra sự chú ý. Có thể dùng phƣơng pháp này để gửi đi một
thông tin bí mật về thƣơng mại, chính trị, quân sự, hoặc các thông tin nhạy cảm
khác.
1.5.
Tăng độ an toàn cho thông tin đem giấu
Mặc dù giấu tin trong audio là vô hình so với các phƣơng pháp an toàn bảo
mật khác. Tuy nhiên trong trƣờng hợp nghi ngờ ngƣời ta có thể sử dụng các phƣơng
pháp tấn công hoặc quan sát quy luật tự nhiên của các tín hiệu audio để tách ra đƣợc
thông tin đã giấu. Trong trƣờng hợp này để tăng tính an toàn cho thông tin đem giấu
ngƣời ta có thể sử dụng phƣơng pháp mã hóa cho thông tin mật trƣớc khi giấu sử
dụng các kỹ thuật mã hóa nhƣ RSA, Elgama, AES hoặc DES. Tuy nhiên, luận văn
này chỉ sử dụng kỹ thuật mã hóa đơn giản đó là chuyển thông tin cần giấu sang
chuỗi bit nhị phân, sau đó sử dụng phép toán XOR giữa chuỗi bit thông điệp với
chuỗi khóa đƣợc sinh ngẫu nhiên dựa trên mật khẩu do ngƣời dùng nhập vào và độ
dài của thông điệp.
1.6.
Đánh giá chất lƣợng âm thanh sau khi giấu tin
Để đánh giá chất lƣợng của tín hiệu âm thanh ở đầu ra của bộ mã hoá, ngƣời
ta thƣờng sử dụng hai tham số, sai số bình phƣơng trung bình – MSE (Mean Square
Error) giữa tín hiệu gốc và tín hiệu đã giấu tin và tham số PSNR (Peak Signal to
Noise Ratio) tham số này đƣợc tính bằng hệ số tỷ lệ tín hiệu cực đại / tín hiệu nhiễu,
hay nói cách khác PSNR cho biết chất lƣợng tín hiệu khôi phục của các thuật toán
nén có mất mát dữ liêu [5]. MSE đƣợc tính theo biển thức (1) trong khi PSNR đƣợc
tính theo biểu thức (2)
∑
(
)2
PSNR (dB) = 20
(
17
(1)
)
(2)
Trong đó:
biểu thị giá trị tín hiệu gốc
biểu thị giá trị tín hiệu đã bị biến đổi
N là độ dài của tín hiệu âm thanh.
RMSE: Sai số bình phƣơng trung bình giữa tín hiệu gốc và tín hiệu đã giấu
tin RMSE = √
n: là số bit sử dụng trong quá trình lƣợng tử hóa tín hiệu âm thanh.
Thông thƣờng, nếu PSNR > 35dB thì hệ thống mắt ngƣời gần nhƣ không
phân biệt đƣợc sự khác biệt giữa tín hiệu gốc và tín hiệu bị biến đổi để giấu tin.
PSNR càng cao thì chất lƣợng của tín hiệu càng ít bị thay đổi so với gốc [5].
18
- Xem thêm -