ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
TẠ MINH THẮNG
NGHIÊN CỨU MỘT SỐ PHƯƠNG PHÁP
BẢO VỆ BẢN QUYỀN ÂM THANH VÀ ỨNG DỤNG
LUẬN VĂN THẠC SĨ
HẢI PHÒNG - 2011
ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
TẠ MINH THẮNG
NGHIÊN CỨU MỘT SỐ PHƯƠNG PHÁP
BẢO VỆ BẢN QUYỀN ÂM THANH VÀ ỨNG DỤNG
Công nghệ thông tin
Hệ thống thông tin
60.48.05
Ngành:
Chuyên ngành:
Mã số:
LUẬN VĂN THẠC SĨ
NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS TS. TRỊNH NHẬT TIẾN
HẢI PHÒNG - 2011
2
MỤC LỤC
MỤC LỤC ..................................................................................................................1
DANH MỤC CÁC KÝ HIỆU, CHỮ VIẾT TẮT ...................................................4
DANH SÁCH HÌNH VẼ ...........................................................................................5
MỞ ĐẦU ....................................................................................................................6
Chương 1 : CÁC KHÁI NIỆM CƠ BẢN ................................................................7
1.1. KHÁI NIỆM VỀ AN TOÀN THÔNG TIN ..................................................7
1.1.1. Vấn đề An toàn thông tin .........................................................................7
1.1.2. Mục tiêu của An toàn thông tin ...............................................................8
1.1.3. Các kỹ thuật bảo đảm An toàn thông tin................................................8
1.2. KHÁI NIỆM TRONG SỐ HỌC VÀ ĐẠI SỐ ..............................................9
1.2.1. Tính chia hết, quan hệ đồng dƣ và số nguyên tố ....................................9
1.2.2. Không gian
và cấu trúc nhóm...........................................................10
1.2.3. Độ phức tạp thuật toán ...........................................................................11
1.3. ĐẶC TRƢNG CỦA DỮ LIỆU ÂM THANH .............................................13
1.4. XỬ LÝ TÍN HIỆU SỐ ..................................................................................17
1.4.1. Đại cƣơng về tín hiệu và nhiễu...............................................................17
1.4.1.1 Khái niệm tín hiệu ..............................................................................17
1.4.1.2 Khái niệm nhiễu ..................................................................................17
1.4.1.3. Phân loại tín hiệu ...............................................................................18
1.4.2. Phân tích Fourier ....................................................................................19
1.4.2.1 Biến đổi Fourier rời rạc (DFT) ..........................................................19
1.4.2.2 Biến đổi Fourier nhanh (FFT) ..........................................................19
1.4.2.3. Ứng dụng ............................................................................................20
1.4.3. Lý thuyết trải phổ ...................................................................................22
1.4.3.1. Định nghĩa trải phổ ...........................................................................22
1.4.3.2. Đặc điểm của trải phổ ........................................................................22
1.4.4. Chuỗi giả ngẫu nhiên (PN – Pseudo Noise) ..........................................23
1.4.5. Mô hình giả lập hệ thính giác.................................................................24
1
Chương 2: MỘT SỐ PHƢƠNG PHÁP BẢO VỆ BẢN QUYỀN ÂM THANH 26
2.1. THUỶ VÂN SỐ (DIGITAL WATERMARKING) ....................................26
2.1.1. Tổng quan về thuỷ vân số .......................................................................26
2.1.1.1. Khái niệm thủy vân số .......................................................................26
2.1.1.2. Các ứng dụng của thủy vân số ..........................................................28
2.1.1.3. Các đặc tính của thủy vân .................................................................29
2.1.1.4. Phân loại thủy vân .............................................................................30
2.1.2. Thuỷ vân trên audio................................................................................31
2.1.2.1. Giới thiệu ............................................................................................31
2.1.2.2. Phân loại thuỷ vân trên audio ...........................................................33
2.1.3. Nhóm các phƣơng pháp giao thoa tín hiệu gốc ....................................33
2.1.3.1. Nhận xét chung ..................................................................................33
2.1.3.2. Phương pháp mã hóa pha .................................................................34
2.1.3.3. Phương pháp điều biến pha ..............................................................34
2.1.4. Nhóm các phƣơng pháp không giao thoa tín hiệu gốc ........................35
2.1.4.1. Nhận xét chung ..................................................................................35
2.1.4.2. Nhóm các phương pháp trải phổ ......................................................35
2.1.4.3. Nhóm phương pháp tập đôi (two - set method) ................................43
2.1.4.4. Nhóm các phương pháp sử dụng bản sao ........................................44
2.1.4.5 Nhóm các phương pháp tự đánh dấu ................................................48
2.2. CHỮ KÝ SỐ ..................................................................................................50
2.2.1. Khái niệm “chữ ký số” ...........................................................................50
2.2.1.1. Giới thiệu “chữ ký số” .......................................................................50
2.2.1.2. Sơ đồ “chữ ký số” ..............................................................................51
2.2.2. Phân loại “chữ ký số” .............................................................................52
2.2.2.1. Phân loại chữ ký theo đặc trưng kiểm tra chữ ký ............................52
2.2.2.2. Phân loại chữ ký theo mức an toàn ..................................................52
2.2.2.3. Phân loại chữ ký theo ứng dụng đặc trưng ......................................52
2.2.3. Một số loại chữ ký số ..............................................................................53
2
2.2.3.1. Chữ ký RSA ........................................................................................53
2.2.3.2. Chữ ký Elgamal .................................................................................54
2.2.3.3. Chữ ký DSS ........................................................................................56
2.3. MỘT SỐ KHẢ NĂNG TẤN CÔNG BẢN QUYỀN ÂM THANH ...........59
2.3.1. Phân loại các kiểu tấn công .......................................................................59
2.3.2. Một số kiểu tấn công bản quyền âm thanh ..............................................59
2.3.2.1. Tấn công đơn giản ................................................................................59
2.3.2.2. Tấn công gây nhập nhằng ....................................................................60
2.3.2.3. Tấn công hình học ................................................................................60
Chương 3: CHƢƠNG TRÌNH THỬ NGHIỆM ...................................................61
3.1. CHƢƠNG TRÌNH THUỶ VẤN SỐ ............................................................61
3.1.1. Cấu hình hệ thống ...................................................................................61
3.1.2. Các thành phần của chƣơng trình .........................................................61
3.1.3. Hƣớng dẫn sử dụng chƣơng trình Audio Watermarking ...................62
3.1.3.1. Hướng dẫn sử dụng chương trình nhúng thuỷ vân .........................62
3.1.3.2. Hướng dẫn sử dụng chương trình tách thuỷ vân ............................64
3.2. CHƢƠNG TRÌNH KÝ SỐ TRÊN ÂM THANH .......................................66
3.2.1. Cấu hình hệ thống ...................................................................................66
3.2.2. Các thành phần của chƣơng trình .........................................................66
3.2.3. Hƣớng dẫn sử dụng chƣơng trình Digital Signature ...........................67
3.2.3.1. Hướng dẫn sử dụng phần Tính khoá ...............................................67
3.2.3.2. Hướng dẫn sử dụng phần Ký số .......................................................69
3.2.3.3. Hướng dẫn sử dụng phần Kiểm tra ..................................................71
KẾT LUẬN ..............................................................................................................73
TÀI LIỆU THAM KHẢO ......................................................................................74
PHỤ LỤC .................................................................................................................75
3
DANH MỤC CÁC KÝ HIỆU, CHỮ VIẾT TẮT
Ký hiệu
Thuật ngữ
Ý nghĩa
1
ABR
Average Bitrate
Tốc độ bit trung bình
2
BPSK
Binary Phase Shift Keying
Điều chế khoá chuyển
pha cơ số 2
3
CBR
Constant Bitrate
Tốc độ bit không đổi
4
dB
Decibel
Đơn vị âm thanh
5
DFT
Discrete Fourier Transform
Biến đổi Fourier rời rạc
6
DS
Direct Sequence
Chuỗi trực tiếp
7
FFT
Fast Fourier Transform
Biến đổi Fourier nhanh
8
HAS
Human Auditory System
Hệ thính giác người
9
ISS
Improvements Spread Spectrum
Trải phổ cải tiến
10
LSB
Least Significant Bit
Bit ít quan trọng nhất
11
MP3
MPEG-1 Audio Layer 3
File âm thanh nén
12
PCM
Pulse Code Modulation
File âm thanh không nén
13
PDF
Probability Distribution Function
Hàm mật độ xác suất
14
PN
Pseudo Noise
Giả tạp âm
15
PSD
Power Spectrial Density
Mật độ phổ công suất
16
VBR
Variable Bitrate
Tốc độ bit thay đổi
17
WAV
Waveform Audio File Format
File âm thanh không nén
18
WMA
Windows Media Audio
File âm thanh nén
STT
4
DANH SÁCH HÌNH VẼ
Hình 1: Biến đổi sóng âm thanh thành tín hiệu số
14
Hình 2: Hình minh hoạ cho sóng của tín hiệu
17
Hình 3: Nhiễu đều
18
Hình 4: Nhiễu phân bố Gaussian
18
Hình 5: Đáp ứng xung
21
Hình 6: Mạch thanh ghi dịch cơ số 2
23
Hình 7: Mô hình giả lập hệ thính giác
24
Hình 8: Phương pháp phân loại thủy vân
30
Hình 9: Phân loại Watermarking trên Audio
33
Hình 10: Ý tưởng của phương pháp trải phổ truyền thống.
36
Hình 11: Tiền xử lý tín hiệu âm thanh Watermark.
37
Hình 12: Thành phần tín hiệu sau khi thủy vân
39
Hình 13: Sơ đồ tạo thủy vân
40
Hình 14: Sơ đồ nhúng thủy vân.
41
Hình 15: Sơ đồ tách thủy vân
42
Hình 16: Ẩn dữ liệu theo phương pháp echo.
46
Hình 17: Điều chỉnh tỉ lệ thời gian trong Watermarking
48
5
MỞ ĐẦU
Ngày nay sự phát triển mạnh mẽ của Internet cùng với cuộc cách mạng thông
tin số đã đem lại những bước phát triển vượt bậc trong xã hội. Truyền thông băng
tần rộng cùng với các định dạng dữ liệu số phong phú hiện nay đã mở ra nhiều cơ
hội cũng như không ít thách thức. Các thiết bị số, các phần mềm xử lý đa phương
tiện ngày càng mạnh mẽ hiện đại, dễ dàng sử dụng dẫn đến vấn nạn xâm phạm bản
quyền như giả mạo, ăn cắp tác phẩm, sử dụng các tác phẩm không có bản
quyền,…ngày càng trở nên phổ biến và tinh vi. Theo kết quả thống kê của Hiệp hội
bảo vệ tác quyền thế giới (International Intellectual Property Alliance - gọi tắt là
IIPA), mỗi năm ngành công nghiệp giải trí nói chung và âm nhạc nói riêng thất
thoát hàng ngàn tỉ đô-la.Các nước đang phát triển có tỉ lệ vi phạm bản quyền rất cao
(trên 90%), trong đó Việt Nam dẫn đầu (với 92% ). Tuy nhiên với các phương pháp
bảo vệ dữ liệu truyền thống như mã hoá, sử dụng khóa đều không đem lại hiệu quả
cao trong tình hình hiện nay. So với các loại truyền thông đa phương tiện khác, âm
thanh số là dạng dữ liệu rất khó bảo vệ bởi đặc tính thu – phát trực tiếp.
So với các loại truyền thông sử dụng tín hiệu tương tự truyền thống thì
truyền thông số ngày nay mang lại rất nhiều lợi ích: dung lượng lớn, thao tác đơn
giản (sao chép, lưu trữ, phát tán),… Tuy nhiên đó cũng là những điểm hạn chế để
nạn vi phạm bản quyền tấn công. Trong các phương tiện giải trí số đang tồn tại ở
nước ta hiện nay : game, hình ảnh, video,.. thì âm thanh có thể được xem là hình
thức giải trí thông dụng và gần gũi nhất. Trên cở sở các kiến thức đã có đề tài tập
trung tìm hiểu, nghiên cứu, so sánh đánh giá các phương pháp bảo vệ bản quyền âm
thanh số (chủ yếu vào hai hướng chính là “Giấu tin” -Steganography và “Thuỷ ấn
số” -Watermarking ) và một số các phương pháp tấn công bản quyền âm thanh số.
6
Chương 1 : CÁC KHÁI NIỆM CƠ BẢN
1.1. KHÁI NIỆM VỀ AN TOÀN THÔNG TIN
1.1.1. Vấn đề An toàn thông tin
Sự phát triển của Internet và các mạng cục bộ giúp cho việc trao đổi thông
tin trở nên nhanh chóng, dễ dàng, thương mại điện tử cho phép thực hiện các giao
dịch buôn bán trên mạng,… Tuy nhiên những thông tin quan trọng nằm trong kho
dữ liệu hay trên đường truyền có thể bị lấy trộm, làm sai lệch hoặc giả mạo, điều
này có thể làm ảnh hưởng đến các tổ chức, công ty hay cả một quốc gia. Ngoài ra
khi trao đổi thông tin trên mạng còn nảy sinh vấn đề đó là khi nhận một tài liệu số
(văn bản, tranh ảnh, âm thanh,…) truyền qua mạng thì lấy gì để đảm bảo rằng nó là
của đối tác gửi cho mình và làm sao xác định được tài liệu này có bị làm thay đổi
hay sai lệch đi, cũng như vậy làm thế nào để chứng minh rằng một tài liệu số thuộc
bản quyền của một tổ chức hay cá nhân nào.
Để giải quyết các vấn đề trên, An toàn thông tin đã được đặt ra cấp thiết và
cùng với sự phát triển mạnh mẽ của Công nghệ thông tin An toàn thông tin đã trở
thành một ngành khoa học thực thụ.
Các ứng dụng của khoa học An toàn thông tin
-
An ninh Quốc phòng
-
Các hoạt động xã hội: bỏ phiếu điện tử, thăm dò điện tử,….
-
Các giao dịch hành chính
-
Thương mại điện tử
-
Phục vụ đào tạo
-
Bảo vệ bản quyền thông tin: Bảo vệ các tài liệu số ( hình ảnh, âm thanh,
văn bản,….)
7
1.1.2. Mục tiêu của An toàn thông tin
- Bảo đảm bí mật: Tin tức không bị lộ đối với người không được ủy quyền.
- Bảo đảm toàn vẹn: Ngăn cản, hạn chế việc tạo mới, bổ sung, xóa hay sửa
dữ liệu mà không được sự uỷ thác.
- Bảo đảm xác thực: Xác thực đúng nguồn gốc thông tin, hay xác thực sự
toàn vẹn của thông tin.
- Bảo đảm sẵn sàng: Thông tin sẵn sàng cho người dùng hợp pháp.
1.1.3. Các kỹ thuật bảo đảm An toàn thông tin.
+ Kỹ thuật Diệt trừ: VIRUS máy tính, chương trình trái phép,…
+ Kỹ thuật Tường lửa (Firewall): Ngăn chặn truy cập trái phép, lọc thông tin
không hợp pháp.
+ Kỹ thuật Mạng riêng ảo (Virtual Private Network)
+ Kỹ thuật Giấu tin (Information Hiding)
+ Kỹ thuật Truy tìm dấu vết trộm tin.
+ Kỹ thuật Mật mã.
8
1.2. KHÁI NIỆM TRONG SỐ HỌC VÀ ĐẠI SỐ
1.2.1. Tính chia hết, quan hệ đồng dƣ và số nguyên tố
1/.Tính chia hết
Xét 2 số nguyên a và b. Ta gọi a chia hết cho b
số nguyên n thỏa mãn
a=b*n. Khi đó a được gọi là bội số của b, b được gọi là ước số của a. Ký hiệu a|b.
a được gọi là chia cho b dư r
số nguyên k và r thỏa mãn a = k.b + r. Khi
đó r gọi là số dư của phép chia a cho b.
Xét dãy số ( a1, a2,… an).
Nếu b là ước số chung của tất cả các số trong dãy số trên, và tất cả các ước
số chung khác của dãy đều là ước số của b, thì ta gọi b là ước số chung lớn nhất của
dãy.
Ký hiệu b = UCLN (a1, a2,… an) = gcd (a1, a2,… an).
Nếu b là bội số chung của tất cả các dãy trong dãy số trên, và tất cả các bội
số chung khác của dãy đều là bội số của b, thì ta gọi b là bội số chung nhỏ nhất của
dãy.
Ký hiệu b = BCNN (a1, a2,… an) = lcm (a1, a2,… an).
Ta có: gcd (a, b) = 1 với mọi a và b nguyên tố cùng nhau.
2/.Quan hệ đồng dư
a và b đồng dư theo modulo n
Ký hiệu a
(a - b)|r.
b (mod n).
3/.Số nguyên tố
Số nguyên tố là số tự nhiên lớn hơn 1, chỉ chia hết cho 1 và chính nó.
Các số tự nhiên không phải là số nguyên tố thì gọi là hợp số.
Số nguyên tố đóng một vai trò rất quan trọng trong lĩnh vực an toàn thông
tin. Ví dụ: số nguyên tố là tham số để tính các khoá mật mã
9
Số lượng các số nguyên tố là vô hạn, đồng thời cho đến nay người ta vẫn
chưa tìm ra được quy luật của dãy số nguyên tố.
Số nguyên tố đã được nghiên cứu từ trước Công nguyên. Hiện nay, đã có rất
nhiều thuật toán được nghiên cứu nhằm xác định một số có phải là số nguyên tố hay
không.
Gần đây nhất, vào tháng 8 năm 2008, đã tìm ra số nguyên tố có gần 13 triệu
chữ số, là một số nguyên tố dạng Mersenne.
1.2.2. Không gian
và cấu trúc nhóm
và các phép tính cơ bản:
1/.Không gian
được định nghĩa là tập hợp các số tự nhiên nhỏ hơn n.
= {1, 2, … n - 1}.
* được định nghĩa là tập hợp các số tự nhiên nhỏ hơn n và nguyên tố cùng
nhau với n.
*= {x|x
, gcd (x, n) = 1}.
Trong không gian
, các phép toán đều được thực hiện theo modulo n.
Phép cộng, phép trừ và phép nhân được thực hiện bình thường như trong
không gian Z, tuy nhiên kết quả cuối cùng phải được tính lại theo modulo n.
Phép chia trong không gian liên quan tới khái niệm phần tử nghịch đảo.
Phần tử nghịch đảo của a
ký hiệu b =
định nghĩa là b
thỏa mãn a.b=1(mod n),
(mod n).
Vì vậy, phép chia a cho b trong không gian
nghịch đảo, bởi vì a/b = a.
chỉ có nghĩa nếu b có phần tử
.
2/.Cấu trúc nhóm:
* Nhóm là một bộ hai phần tử (G, *), trong đó G là tập hợp khác rỗng, * là
phép toán hai ngôi thỏa mãn:
Tính kết hợp: (a * b) * c = a * (b * c) với
a,b,c
G.
10
Tồn tại phần tử trung lập e
Với
x
G,
G thỏa mãn: e * x = x * e = e với
phần tử nghịch đảo
x
G.
của x thỏa mãn: x * = * x = e.
* Nhóm con của nhóm (G, *) là nhóm (S, *) thỏa mãn:
S
G.
Phần tử trung lập e của G nằm trong S.
S khép kín đối với phép * và lấy nghịch đảo trong G.
Nhóm được gọi là nhóm cyclic nếu nó được sinh ra từ một trong các phần tử
của nó. Phần tử đó gọi là phần tử nguyên thủy.
1.2.3. Độ phức tạp thuật toán
Thuật toán được định nghĩa là một dãy hữu hạn các chỉ thị mô tả một quá
trình tính toán nào đó.
Một bài toán được gọi là “giải được” nếu tồn tại thuật toán giải quyết bài
toán đó. Ngược lại bài toán gọi là “không giải được”.
Tuy nhiên, không phải bài toán nào thuộc lớp bài toán “giải được” cũng có
thể giải được trong thực tế. Do đó, người ta đưa ra khái niệm chi phí để giải một bài
toán, chi phí này liên quan mật thiết tới thuật toán giải bài toán đó, phụ thuộc vào
bốn tiêu chí sau:
Thuật toán có dễ hiểu không.
Thuật toán có dễ cài đặt không.
Số lượng bộ nhớ dùng trong thuật toán.
Thời gian thực hiện thuật toán.
Trong các tiêu chí đó, tiêu chí thời gian thực hiện thuật toán là quan trọng
nhất.
11
Độ phức tạp thời gian của thuật toán, thường được hiểu là số các phép tính
cơ bản mà thuật toán phải thực hiện, trong trường hợp xấu nhất. Với cỡ dữ liệu đầu
vào là n, thời gian thực hiện thuật toán là t(n) được gọi là tiệm cận tới hàm f(n) nếu
với n đủ lớn thì tồn tại số c thỏa mãn t(n)
c.f(n). Nếu f(n) là một hàm đa thức thì
thuật toán được gọi là có độ phức tạp thời gian đa thức.
Hiện nay, hầu hết các bài toán giải được trong thực tế đều là các bài toán có
độ phức tạp thời gian đa thức. Các bài toán có độ phức tạp số mũ thực tế là khó thể
giải được (có thể mất nhiều triệu tới nhiều tỷ năm).
Lý thuyết độ phức tạp tính toán là lý thuyết quan trọng của khoa học máy
tính. Nó cũng là cơ sở cho các phép toán gần đúng và xấp xỉ, hiện đang có nhiều
ứng dụng trong khoa học.
Từ lý thuyết độ phức tạp tính toán, xuất hiện một khái niệm rất quan trọng
trong lĩnh vực an toàn thông tin: hàm một phía và hàm một phía có cửa sập.
Hàm một phía (one way function): hàm số y = f(x) được gọi là hàm một
phía, nếu khi biết giá trị của x thì ta dễ dàng tính được giá trị của y, nhưng ngược
lại, nếu biết giá trị của y, ta “khó” tính được giá trị của x.
12
1.3. ĐẶC TRƢNG CỦA DỮ LIỆU ÂM THANH
Âm thanh số (digital audio) là kết quả của quá trình biến đổi từ sóng âm
thanh thành tín hiệu số. Sóng âm thanh là các sóng cơ học có dạng hình sin tuần
hoàn liên tục (analog), trong khi “âm thanh số” chỉ là những xung điện tử rời rạc
(digital). Do đó, bằng những “mẩu” rời rạc, âm thanh số chỉ có thể mô phỏng một
cách gần giống nhất với âm thanh thực tế mà thôi. Việc mô phỏng đó được đặc
trưng bởi các thông số sau:
- BitRate: Là thông số thu gọn, đại diện cơ bản cho các thuộc tính trên.
Bitrate có đơn vị Kbps (Kilobits per second) – dung lượng (tính theo bit) của âm
thanh số trên một giây. Với Bitrate, ta có thể xác định nhanh chóng dung lượng
cũng như phần nào chất lượng của bản nhạc. Một phút nhạc 128 kbps có dung
lượng khoảng 1 MB và bản nhạc 320 kbps thì chắc chắn sẽ hay hơn bản nhạc 128
kbps.
- Sample: Là một bộ phận của âm thanh analog được mã hóa thành dạng số.
Sample có thể dùng để chỉ một điểm đơn lẻ trong stream âm thanh số (là đơn vị nhỏ
nhất của dữ liệu dùng để biểu diễn một tín hiệu âm thanh tại một khoảng thời gian
nhất định). Một âm thanh hoàn chỉnh hay toàn bộ một stream âm thanh số được cấu
tạo từ việc kết hợp những sample riêng biệt (một chuỗi sample) cũng có thể được
coi là một sample.
- Sample Rate: Là số sample (tạm dịch là mẫu) trong một khoảng thời gian
nhất định (thường là 1 giây) của âm thanh kỹ thuật số, quyết định trực tiếp tới chất
lượng âm thanh. Khi một tập tin âm thanh dạng số được ghi lại, nó phải được
convert vào một chuỗi những mẫu (series of sample) mà bản thân chúng có thể lưu
lại được trên bộ nhớ, trên các thiết bị lưu trữ kỹ thuật số. Sample rate sẽ thông báo
cho ta biết trong tập tin âm thanh có bao nhiêu mẫu được ghi lại trong một giây.
Đơn vị của sample rate là Hz.
13
Ví dụ dễ hiểu, một tập tin âm thanh được ghi ở sample rate 44100 sẽ cần đến
44100 mẫu/giây để lưu giữ âm thanh trong một chuỗi mẫu.
Sample rate càng cao, chất lượng của chuỗi mẫu càng tốt và càng ít xảy ra
hiện tượng gọi là aliasing (là hiện tượng xuất hiện những tần số âm thanh không
mong muốn sinh ra bởi việc thiếu hụt thông tin từ sample rate). Mỗi mẫu sẽ cần một
lượng bit nhất định để lưu trữ gọi là sample size, và ta có thể tính toán dung lượng
cần thiết cho một sample.
Ví dụ: với âm thanh 16 bit, ta cần sử dụng 16bit hay 2byte cho một mẫu (8bit
= 1byte). Như vậy 1 giây âm thanh với sample rate 44100/16 bit mono (một kênh
âm thanh) sẽ có độ lớn là 44100x2=88200byte.
Nếu cũng với các thông số như vậy nhưng thay vì mono, ta sử dụng stereo (2
kênh âm thanh), dung lượng sẽ phải nhân đôi và trở thành 176400 byte. Đây là lý do
vì sao âm thanh vòm (5.1) hay các loại âm thanh sử dụng nhiều kênh khác (6.1, 7.1,
…) lớn hơn rất nhiều sơ với âm thanh stereo hay mono mặc dù chúng cũng có được
nén ở cùng chất lượng.
Hình 1: Biến đổi sóng âm thanh thành tín hiệu số
14
- BitDepth: Để lưu lại dưới dạng số, mỗi mẫu được biểu diễn bằng một
lượng bit dữ liệu nhất định, gọi là BitDepth. Các bản nhạc hiện nay thường có
BitDepth là 16 bits, 24 bits…BitDepth càng lớn âm thanh càng sắc nét, trung thực
nên nó còn được gọi là Resolution (độ nét).
- Kênh âm thanh (Channel): Bằng các thuật toán, tín hiệu số sẽ được tách ra
thành nhiều kênh sao cho khi nghe bằng hệ thống loa thích hợp sẽ có cảm giác như
khi đang nghe nhạc trong không gian thực tế.
- Âm thanh Lossy, lossless và uncompressed
Âm thanh uncompressed là loại âm thanh không áp dụng bất kỳ một phương
pháp nén nào. Được sử dụng dưới định dạng WAV hay PCM.
Âm thanh lossless là loại âm thanh sử dụng phương pháp loại bỏ những dữ
liệu không liên quan tồn tại trong file gốc để thu được một file nhỏ hơn nhưng vẫn
giữ được chất lượng như ban đầu. Âm thanh xử lý lossless sẽ có bitrate thấp hơn so
với âm thanh chưa nén.Âm thanh lossless được sử dụng rộng rãi và phát triển thành
những định dạng quen thuộc như AC3, AAC, DTS, MPEG-1/2/3, Vorbis, Real
Audio...
Âm thanh lossy là loại âm thanh thu được khi sử dụng những phần mềm
encode âm thanh phổ biến hiện nay để chuyển đổi các định dạng âm thanh. Đây là
loại âm thanh bị giảm chất lượng vì quá trình lossy encode sẽ không giữ nguyên
những phần cần thiết trong file âm thanh gốc. Lấy ví dụ, khi encode từ WAV sang
MP3, bạn đã thực hiện phương pháp lossy encode cho file âm thanh WAV chưa nén
của mình, và file MP3 thu được đã bị giảm chất lượng so với file gốc, nó là âm
thanh lossy. Mọi chuyện thậm chí còn tồi tệ hơn với việc encode file MP3 lossy đó
thành OGG (có thể là định dạng khác), file OGG thu được đã bị quá trình encode
lossy giảm chất lượng tới 2 lần.
15
- Các dạng bitrate CBR/ABR/VBR
CBR-Constant bitrate: nghĩa là bitrate của stream là một hằng số và không
thay đổi tại bất kỳ điểm nào của stream.
ABR-Average bitrate: nghĩa là stream có thể sử dụng bitrate thay đổi cho
mỗi frame, nhưng bitrate trung bình của toàn bộ stream là cố định.
VBR-Variable bitrate: nghĩa là stream có thể sử dụng bitrate thay đổi cho
mỗi frame và tùy biến để đạt được bitrate cần thiết cho mỗi frame,vì vậy bitrate
trung bình không thể xác định trước khi encode hay tính toán cụ thể.
- Âm thanh Stereo, joint stereo, và dual channel:
Dual channel tích hợp bởi 2 kênh mono, nghĩa là mỗi kênh sẽ được encode
với một nửa của toàn bộ bitrate.
Stereo tích hợp bởi 2 kênh âm thanh độc lập với nhau. Bitrate cung cấp giữa
2 kênh âm thanh thay đổi phù hợp với lượng thông tin được chứa trong mỗi kênh.
Joint stereo cũng tích hợp 2 kênh âm thanh nhưng có một bước tiến xa hơn vì
có thể sử dụng được những mẫu chung thường xuất hiện ở cả 2 kênh. Do đó độ nén
sẽ tốt hơn so với stereo bình thường.
16
1.4. XỬ LÝ TÍN HIỆU SỐ
1.4.1. Đại cƣơng về tín hiệu và nhiễu
1.4.1.1 Khái niệm tín hiệu
Tín hiệu là sự biến thiên của biên độ theo thời gian. Biên độ có thể là điện
áp, dòng điện, công suất, . . . nhưng thường được hiểu là điện áp. Các yếu tố trong
tín hiệu mà chúng ta thường nhắc tới là biên độ và thời gian.
Ví dụ: Xét sóng của tín hiệu x = sin(2*pi *100 *t) .
Hình 2: Hình minh hoạ cho sóng của tín hiệu
1.4.1.2 Khái niệm nhiễu
Nhiễu là tín hiệu do chính bản thân mạch điện tử và môi trường truyền thông
phát sinh ra. Giảm nhiễu hoặc khử nhiễu là thao tác chính trong xử lý tín hiệu số.
Nhiễu trắng là nhiễu có độ lớn như nhau ở mọi tần số (trên lý thuyết), trong thực tế
chúng ta chỉ xét trong phạm vi giới hạn băng tần khá rộng hay nói đúng hơn nhiễu
trắng là tín hiệu có mật độ công suất phổ (PSD) cố định ở mọi băng tần.
Có hai loại phân bố xác suất của nhiễu thường nhắc tới là nhiễu phân bố đều
và nhiễu Gauss.
+ Phân bố đều là phân bố có hàm mật độ PDF f(x) không đổi trong khoảng
biến thiên của biến số x, có giá trị kỳ vọng là μ = 0 .
+ Phân bố Gauss là phân bố chuẩn. Dạng nhiễu phổ biến nhất trong thực tế
là nhiễu trắng có phân bố Gauss.
17
Hình 3: Nhiễu đều
Hình 4: Nhiễu phân bố Gaussian
1.4.1.3. Phân loại tín hiệu
Tuỳ theo từng tiêu chuẩn mà có nhiều cách phân loại khác nhau:
Dạng sóng: tín hiệu sin, vuông, tam giác, xung. . . .
Tần số: hạ tần, cao tần (HF), âm tần (AF), siêu cao tần (VHF) . . .
Sự liên tục: tín hiệu liên tục, tín hiệu rời rạc.
Tính xác định: tín hiệu xác định, tín hiệu ngẫu nhiên.
18
- Xem thêm -