Nghiên cứu một số phương pháp bảo vệ bản quyền âm thanh và ứng dụng

  • Số trang: 87 |
  • Loại file: PDF |
  • Lượt xem: 16 |
  • Lượt tải: 0
tailieuonline

Đã đăng 27372 tài liệu

Mô tả:

ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ TẠ MINH THẮNG NGHIÊN CỨU MỘT SỐ PHƯƠNG PHÁP BẢO VỆ BẢN QUYỀN ÂM THANH VÀ ỨNG DỤNG LUẬN VĂN THẠC SĨ HẢI PHÒNG - 2011 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ TẠ MINH THẮNG NGHIÊN CỨU MỘT SỐ PHƯƠNG PHÁP BẢO VỆ BẢN QUYỀN ÂM THANH VÀ ỨNG DỤNG Công nghệ thông tin Hệ thống thông tin 60.48.05 Ngành: Chuyên ngành: Mã số: LUẬN VĂN THẠC SĨ NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS TS. TRỊNH NHẬT TIẾN HẢI PHÒNG - 2011 2 MỤC LỤC MỤC LỤC ..................................................................................................................1 DANH MỤC CÁC KÝ HIỆU, CHỮ VIẾT TẮT ...................................................4 DANH SÁCH HÌNH VẼ ...........................................................................................5 MỞ ĐẦU ....................................................................................................................6 Chương 1 : CÁC KHÁI NIỆM CƠ BẢN ................................................................7 1.1. KHÁI NIỆM VỀ AN TOÀN THÔNG TIN ..................................................7 1.1.1. Vấn đề An toàn thông tin .........................................................................7 1.1.2. Mục tiêu của An toàn thông tin ...............................................................8 1.1.3. Các kỹ thuật bảo đảm An toàn thông tin................................................8 1.2. KHÁI NIỆM TRONG SỐ HỌC VÀ ĐẠI SỐ ..............................................9 1.2.1. Tính chia hết, quan hệ đồng dƣ và số nguyên tố ....................................9 1.2.2. Không gian và cấu trúc nhóm...........................................................10 1.2.3. Độ phức tạp thuật toán ...........................................................................11 1.3. ĐẶC TRƢNG CỦA DỮ LIỆU ÂM THANH .............................................13 1.4. XỬ LÝ TÍN HIỆU SỐ ..................................................................................17 1.4.1. Đại cƣơng về tín hiệu và nhiễu...............................................................17 1.4.1.1 Khái niệm tín hiệu ..............................................................................17 1.4.1.2 Khái niệm nhiễu ..................................................................................17 1.4.1.3. Phân loại tín hiệu ...............................................................................18 1.4.2. Phân tích Fourier ....................................................................................19 1.4.2.1 Biến đổi Fourier rời rạc (DFT) ..........................................................19 1.4.2.2 Biến đổi Fourier nhanh (FFT) ..........................................................19 1.4.2.3. Ứng dụng ............................................................................................20 1.4.3. Lý thuyết trải phổ ...................................................................................22 1.4.3.1. Định nghĩa trải phổ ...........................................................................22 1.4.3.2. Đặc điểm của trải phổ ........................................................................22 1.4.4. Chuỗi giả ngẫu nhiên (PN – Pseudo Noise) ..........................................23 1.4.5. Mô hình giả lập hệ thính giác.................................................................24 1 Chương 2: MỘT SỐ PHƢƠNG PHÁP BẢO VỆ BẢN QUYỀN ÂM THANH 26 2.1. THUỶ VÂN SỐ (DIGITAL WATERMARKING) ....................................26 2.1.1. Tổng quan về thuỷ vân số .......................................................................26 2.1.1.1. Khái niệm thủy vân số .......................................................................26 2.1.1.2. Các ứng dụng của thủy vân số ..........................................................28 2.1.1.3. Các đặc tính của thủy vân .................................................................29 2.1.1.4. Phân loại thủy vân .............................................................................30 2.1.2. Thuỷ vân trên audio................................................................................31 2.1.2.1. Giới thiệu ............................................................................................31 2.1.2.2. Phân loại thuỷ vân trên audio ...........................................................33 2.1.3. Nhóm các phƣơng pháp giao thoa tín hiệu gốc ....................................33 2.1.3.1. Nhận xét chung ..................................................................................33 2.1.3.2. Phương pháp mã hóa pha .................................................................34 2.1.3.3. Phương pháp điều biến pha ..............................................................34 2.1.4. Nhóm các phƣơng pháp không giao thoa tín hiệu gốc ........................35 2.1.4.1. Nhận xét chung ..................................................................................35 2.1.4.2. Nhóm các phương pháp trải phổ ......................................................35 2.1.4.3. Nhóm phương pháp tập đôi (two - set method) ................................43 2.1.4.4. Nhóm các phương pháp sử dụng bản sao ........................................44 2.1.4.5 Nhóm các phương pháp tự đánh dấu ................................................48 2.2. CHỮ KÝ SỐ ..................................................................................................50 2.2.1. Khái niệm “chữ ký số” ...........................................................................50 2.2.1.1. Giới thiệu “chữ ký số” .......................................................................50 2.2.1.2. Sơ đồ “chữ ký số” ..............................................................................51 2.2.2. Phân loại “chữ ký số” .............................................................................52 2.2.2.1. Phân loại chữ ký theo đặc trưng kiểm tra chữ ký ............................52 2.2.2.2. Phân loại chữ ký theo mức an toàn ..................................................52 2.2.2.3. Phân loại chữ ký theo ứng dụng đặc trưng ......................................52 2.2.3. Một số loại chữ ký số ..............................................................................53 2 2.2.3.1. Chữ ký RSA ........................................................................................53 2.2.3.2. Chữ ký Elgamal .................................................................................54 2.2.3.3. Chữ ký DSS ........................................................................................56 2.3. MỘT SỐ KHẢ NĂNG TẤN CÔNG BẢN QUYỀN ÂM THANH ...........59 2.3.1. Phân loại các kiểu tấn công .......................................................................59 2.3.2. Một số kiểu tấn công bản quyền âm thanh ..............................................59 2.3.2.1. Tấn công đơn giản ................................................................................59 2.3.2.2. Tấn công gây nhập nhằng ....................................................................60 2.3.2.3. Tấn công hình học ................................................................................60 Chương 3: CHƢƠNG TRÌNH THỬ NGHIỆM ...................................................61 3.1. CHƢƠNG TRÌNH THUỶ VẤN SỐ ............................................................61 3.1.1. Cấu hình hệ thống ...................................................................................61 3.1.2. Các thành phần của chƣơng trình .........................................................61 3.1.3. Hƣớng dẫn sử dụng chƣơng trình Audio Watermarking ...................62 3.1.3.1. Hướng dẫn sử dụng chương trình nhúng thuỷ vân .........................62 3.1.3.2. Hướng dẫn sử dụng chương trình tách thuỷ vân ............................64 3.2. CHƢƠNG TRÌNH KÝ SỐ TRÊN ÂM THANH .......................................66 3.2.1. Cấu hình hệ thống ...................................................................................66 3.2.2. Các thành phần của chƣơng trình .........................................................66 3.2.3. Hƣớng dẫn sử dụng chƣơng trình Digital Signature ...........................67 3.2.3.1. Hướng dẫn sử dụng phần Tính khoá ...............................................67 3.2.3.2. Hướng dẫn sử dụng phần Ký số .......................................................69 3.2.3.3. Hướng dẫn sử dụng phần Kiểm tra ..................................................71 KẾT LUẬN ..............................................................................................................73 TÀI LIỆU THAM KHẢO ......................................................................................74 PHỤ LỤC .................................................................................................................75 3 DANH MỤC CÁC KÝ HIỆU, CHỮ VIẾT TẮT Ký hiệu Thuật ngữ Ý nghĩa 1 ABR Average Bitrate Tốc độ bit trung bình 2 BPSK Binary Phase Shift Keying Điều chế khoá chuyển pha cơ số 2 3 CBR Constant Bitrate Tốc độ bit không đổi 4 dB Decibel Đơn vị âm thanh 5 DFT Discrete Fourier Transform Biến đổi Fourier rời rạc 6 DS Direct Sequence Chuỗi trực tiếp 7 FFT Fast Fourier Transform Biến đổi Fourier nhanh 8 HAS Human Auditory System Hệ thính giác người 9 ISS Improvements Spread Spectrum Trải phổ cải tiến 10 LSB Least Significant Bit Bit ít quan trọng nhất 11 MP3 MPEG-1 Audio Layer 3 File âm thanh nén 12 PCM Pulse Code Modulation File âm thanh không nén 13 PDF Probability Distribution Function Hàm mật độ xác suất 14 PN Pseudo Noise Giả tạp âm 15 PSD Power Spectrial Density Mật độ phổ công suất 16 VBR Variable Bitrate Tốc độ bit thay đổi 17 WAV Waveform Audio File Format File âm thanh không nén 18 WMA Windows Media Audio File âm thanh nén STT 4 DANH SÁCH HÌNH VẼ Hình 1: Biến đổi sóng âm thanh thành tín hiệu số 14 Hình 2: Hình minh hoạ cho sóng của tín hiệu 17 Hình 3: Nhiễu đều 18 Hình 4: Nhiễu phân bố Gaussian 18 Hình 5: Đáp ứng xung 21 Hình 6: Mạch thanh ghi dịch cơ số 2 23 Hình 7: Mô hình giả lập hệ thính giác 24 Hình 8: Phương pháp phân loại thủy vân 30 Hình 9: Phân loại Watermarking trên Audio 33 Hình 10: Ý tưởng của phương pháp trải phổ truyền thống. 36 Hình 11: Tiền xử lý tín hiệu âm thanh Watermark. 37 Hình 12: Thành phần tín hiệu sau khi thủy vân 39 Hình 13: Sơ đồ tạo thủy vân 40 Hình 14: Sơ đồ nhúng thủy vân. 41 Hình 15: Sơ đồ tách thủy vân 42 Hình 16: Ẩn dữ liệu theo phương pháp echo. 46 Hình 17: Điều chỉnh tỉ lệ thời gian trong Watermarking 48 5 MỞ ĐẦU Ngày nay sự phát triển mạnh mẽ của Internet cùng với cuộc cách mạng thông tin số đã đem lại những bước phát triển vượt bậc trong xã hội. Truyền thông băng tần rộng cùng với các định dạng dữ liệu số phong phú hiện nay đã mở ra nhiều cơ hội cũng như không ít thách thức. Các thiết bị số, các phần mềm xử lý đa phương tiện ngày càng mạnh mẽ hiện đại, dễ dàng sử dụng dẫn đến vấn nạn xâm phạm bản quyền như giả mạo, ăn cắp tác phẩm, sử dụng các tác phẩm không có bản quyền,…ngày càng trở nên phổ biến và tinh vi. Theo kết quả thống kê của Hiệp hội bảo vệ tác quyền thế giới (International Intellectual Property Alliance - gọi tắt là IIPA), mỗi năm ngành công nghiệp giải trí nói chung và âm nhạc nói riêng thất thoát hàng ngàn tỉ đô-la.Các nước đang phát triển có tỉ lệ vi phạm bản quyền rất cao (trên 90%), trong đó Việt Nam dẫn đầu (với 92% ). Tuy nhiên với các phương pháp bảo vệ dữ liệu truyền thống như mã hoá, sử dụng khóa đều không đem lại hiệu quả cao trong tình hình hiện nay. So với các loại truyền thông đa phương tiện khác, âm thanh số là dạng dữ liệu rất khó bảo vệ bởi đặc tính thu – phát trực tiếp. So với các loại truyền thông sử dụng tín hiệu tương tự truyền thống thì truyền thông số ngày nay mang lại rất nhiều lợi ích: dung lượng lớn, thao tác đơn giản (sao chép, lưu trữ, phát tán),… Tuy nhiên đó cũng là những điểm hạn chế để nạn vi phạm bản quyền tấn công. Trong các phương tiện giải trí số đang tồn tại ở nước ta hiện nay : game, hình ảnh, video,.. thì âm thanh có thể được xem là hình thức giải trí thông dụng và gần gũi nhất. Trên cở sở các kiến thức đã có đề tài tập trung tìm hiểu, nghiên cứu, so sánh đánh giá các phương pháp bảo vệ bản quyền âm thanh số (chủ yếu vào hai hướng chính là “Giấu tin” -Steganography và “Thuỷ ấn số” -Watermarking ) và một số các phương pháp tấn công bản quyền âm thanh số. 6 Chương 1 : CÁC KHÁI NIỆM CƠ BẢN 1.1. KHÁI NIỆM VỀ AN TOÀN THÔNG TIN 1.1.1. Vấn đề An toàn thông tin Sự phát triển của Internet và các mạng cục bộ giúp cho việc trao đổi thông tin trở nên nhanh chóng, dễ dàng, thương mại điện tử cho phép thực hiện các giao dịch buôn bán trên mạng,… Tuy nhiên những thông tin quan trọng nằm trong kho dữ liệu hay trên đường truyền có thể bị lấy trộm, làm sai lệch hoặc giả mạo, điều này có thể làm ảnh hưởng đến các tổ chức, công ty hay cả một quốc gia. Ngoài ra khi trao đổi thông tin trên mạng còn nảy sinh vấn đề đó là khi nhận một tài liệu số (văn bản, tranh ảnh, âm thanh,…) truyền qua mạng thì lấy gì để đảm bảo rằng nó là của đối tác gửi cho mình và làm sao xác định được tài liệu này có bị làm thay đổi hay sai lệch đi, cũng như vậy làm thế nào để chứng minh rằng một tài liệu số thuộc bản quyền của một tổ chức hay cá nhân nào. Để giải quyết các vấn đề trên, An toàn thông tin đã được đặt ra cấp thiết và cùng với sự phát triển mạnh mẽ của Công nghệ thông tin An toàn thông tin đã trở thành một ngành khoa học thực thụ. Các ứng dụng của khoa học An toàn thông tin - An ninh Quốc phòng - Các hoạt động xã hội: bỏ phiếu điện tử, thăm dò điện tử,…. - Các giao dịch hành chính - Thương mại điện tử - Phục vụ đào tạo - Bảo vệ bản quyền thông tin: Bảo vệ các tài liệu số ( hình ảnh, âm thanh, văn bản,….) 7 1.1.2. Mục tiêu của An toàn thông tin - Bảo đảm bí mật: Tin tức không bị lộ đối với người không được ủy quyền. - Bảo đảm toàn vẹn: Ngăn cản, hạn chế việc tạo mới, bổ sung, xóa hay sửa dữ liệu mà không được sự uỷ thác. - Bảo đảm xác thực: Xác thực đúng nguồn gốc thông tin, hay xác thực sự toàn vẹn của thông tin. - Bảo đảm sẵn sàng: Thông tin sẵn sàng cho người dùng hợp pháp. 1.1.3. Các kỹ thuật bảo đảm An toàn thông tin. + Kỹ thuật Diệt trừ: VIRUS máy tính, chương trình trái phép,… + Kỹ thuật Tường lửa (Firewall): Ngăn chặn truy cập trái phép, lọc thông tin không hợp pháp. + Kỹ thuật Mạng riêng ảo (Virtual Private Network) + Kỹ thuật Giấu tin (Information Hiding) + Kỹ thuật Truy tìm dấu vết trộm tin. + Kỹ thuật Mật mã. 8 1.2. KHÁI NIỆM TRONG SỐ HỌC VÀ ĐẠI SỐ 1.2.1. Tính chia hết, quan hệ đồng dƣ và số nguyên tố 1/.Tính chia hết Xét 2 số nguyên a và b. Ta gọi a chia hết cho b số nguyên n thỏa mãn a=b*n. Khi đó a được gọi là bội số của b, b được gọi là ước số của a. Ký hiệu a|b. a được gọi là chia cho b dư r số nguyên k và r thỏa mãn a = k.b + r. Khi đó r gọi là số dư của phép chia a cho b. Xét dãy số ( a1, a2,… an). Nếu b là ước số chung của tất cả các số trong dãy số trên, và tất cả các ước số chung khác của dãy đều là ước số của b, thì ta gọi b là ước số chung lớn nhất của dãy. Ký hiệu b = UCLN (a1, a2,… an) = gcd (a1, a2,… an). Nếu b là bội số chung của tất cả các dãy trong dãy số trên, và tất cả các bội số chung khác của dãy đều là bội số của b, thì ta gọi b là bội số chung nhỏ nhất của dãy. Ký hiệu b = BCNN (a1, a2,… an) = lcm (a1, a2,… an). Ta có: gcd (a, b) = 1 với mọi a và b nguyên tố cùng nhau. 2/.Quan hệ đồng dư a và b đồng dư theo modulo n Ký hiệu a (a - b)|r. b (mod n). 3/.Số nguyên tố Số nguyên tố là số tự nhiên lớn hơn 1, chỉ chia hết cho 1 và chính nó. Các số tự nhiên không phải là số nguyên tố thì gọi là hợp số. Số nguyên tố đóng một vai trò rất quan trọng trong lĩnh vực an toàn thông tin. Ví dụ: số nguyên tố là tham số để tính các khoá mật mã 9 Số lượng các số nguyên tố là vô hạn, đồng thời cho đến nay người ta vẫn chưa tìm ra được quy luật của dãy số nguyên tố. Số nguyên tố đã được nghiên cứu từ trước Công nguyên. Hiện nay, đã có rất nhiều thuật toán được nghiên cứu nhằm xác định một số có phải là số nguyên tố hay không. Gần đây nhất, vào tháng 8 năm 2008, đã tìm ra số nguyên tố có gần 13 triệu chữ số, là một số nguyên tố dạng Mersenne. 1.2.2. Không gian và cấu trúc nhóm và các phép tính cơ bản: 1/.Không gian được định nghĩa là tập hợp các số tự nhiên nhỏ hơn n. = {1, 2, … n - 1}. * được định nghĩa là tập hợp các số tự nhiên nhỏ hơn n và nguyên tố cùng nhau với n. *= {x|x , gcd (x, n) = 1}. Trong không gian , các phép toán đều được thực hiện theo modulo n. Phép cộng, phép trừ và phép nhân được thực hiện bình thường như trong không gian Z, tuy nhiên kết quả cuối cùng phải được tính lại theo modulo n. Phép chia trong không gian liên quan tới khái niệm phần tử nghịch đảo. Phần tử nghịch đảo của a ký hiệu b = định nghĩa là b thỏa mãn a.b=1(mod n), (mod n). Vì vậy, phép chia a cho b trong không gian nghịch đảo, bởi vì a/b = a. chỉ có nghĩa nếu b có phần tử . 2/.Cấu trúc nhóm: * Nhóm là một bộ hai phần tử (G, *), trong đó G là tập hợp khác rỗng, * là phép toán hai ngôi thỏa mãn: Tính kết hợp: (a * b) * c = a * (b * c) với a,b,c G. 10 Tồn tại phần tử trung lập e Với x G, G thỏa mãn: e * x = x * e = e với phần tử nghịch đảo x G. của x thỏa mãn: x * = * x = e. * Nhóm con của nhóm (G, *) là nhóm (S, *) thỏa mãn: S G. Phần tử trung lập e của G nằm trong S. S khép kín đối với phép * và lấy nghịch đảo trong G. Nhóm được gọi là nhóm cyclic nếu nó được sinh ra từ một trong các phần tử của nó. Phần tử đó gọi là phần tử nguyên thủy. 1.2.3. Độ phức tạp thuật toán Thuật toán được định nghĩa là một dãy hữu hạn các chỉ thị mô tả một quá trình tính toán nào đó. Một bài toán được gọi là “giải được” nếu tồn tại thuật toán giải quyết bài toán đó. Ngược lại bài toán gọi là “không giải được”. Tuy nhiên, không phải bài toán nào thuộc lớp bài toán “giải được” cũng có thể giải được trong thực tế. Do đó, người ta đưa ra khái niệm chi phí để giải một bài toán, chi phí này liên quan mật thiết tới thuật toán giải bài toán đó, phụ thuộc vào bốn tiêu chí sau:  Thuật toán có dễ hiểu không.  Thuật toán có dễ cài đặt không.  Số lượng bộ nhớ dùng trong thuật toán.  Thời gian thực hiện thuật toán. Trong các tiêu chí đó, tiêu chí thời gian thực hiện thuật toán là quan trọng nhất. 11 Độ phức tạp thời gian của thuật toán, thường được hiểu là số các phép tính cơ bản mà thuật toán phải thực hiện, trong trường hợp xấu nhất. Với cỡ dữ liệu đầu vào là n, thời gian thực hiện thuật toán là t(n) được gọi là tiệm cận tới hàm f(n) nếu với n đủ lớn thì tồn tại số c thỏa mãn t(n) c.f(n). Nếu f(n) là một hàm đa thức thì thuật toán được gọi là có độ phức tạp thời gian đa thức. Hiện nay, hầu hết các bài toán giải được trong thực tế đều là các bài toán có độ phức tạp thời gian đa thức. Các bài toán có độ phức tạp số mũ thực tế là khó thể giải được (có thể mất nhiều triệu tới nhiều tỷ năm). Lý thuyết độ phức tạp tính toán là lý thuyết quan trọng của khoa học máy tính. Nó cũng là cơ sở cho các phép toán gần đúng và xấp xỉ, hiện đang có nhiều ứng dụng trong khoa học. Từ lý thuyết độ phức tạp tính toán, xuất hiện một khái niệm rất quan trọng trong lĩnh vực an toàn thông tin: hàm một phía và hàm một phía có cửa sập. Hàm một phía (one way function): hàm số y = f(x) được gọi là hàm một phía, nếu khi biết giá trị của x thì ta dễ dàng tính được giá trị của y, nhưng ngược lại, nếu biết giá trị của y, ta “khó” tính được giá trị của x. 12 1.3. ĐẶC TRƢNG CỦA DỮ LIỆU ÂM THANH Âm thanh số (digital audio) là kết quả của quá trình biến đổi từ sóng âm thanh thành tín hiệu số. Sóng âm thanh là các sóng cơ học có dạng hình sin tuần hoàn liên tục (analog), trong khi “âm thanh số” chỉ là những xung điện tử rời rạc (digital). Do đó, bằng những “mẩu” rời rạc, âm thanh số chỉ có thể mô phỏng một cách gần giống nhất với âm thanh thực tế mà thôi. Việc mô phỏng đó được đặc trưng bởi các thông số sau: - BitRate: Là thông số thu gọn, đại diện cơ bản cho các thuộc tính trên. Bitrate có đơn vị Kbps (Kilobits per second) – dung lượng (tính theo bit) của âm thanh số trên một giây. Với Bitrate, ta có thể xác định nhanh chóng dung lượng cũng như phần nào chất lượng của bản nhạc. Một phút nhạc 128 kbps có dung lượng khoảng 1 MB và bản nhạc 320 kbps thì chắc chắn sẽ hay hơn bản nhạc 128 kbps. - Sample: Là một bộ phận của âm thanh analog được mã hóa thành dạng số. Sample có thể dùng để chỉ một điểm đơn lẻ trong stream âm thanh số (là đơn vị nhỏ nhất của dữ liệu dùng để biểu diễn một tín hiệu âm thanh tại một khoảng thời gian nhất định). Một âm thanh hoàn chỉnh hay toàn bộ một stream âm thanh số được cấu tạo từ việc kết hợp những sample riêng biệt (một chuỗi sample) cũng có thể được coi là một sample. - Sample Rate: Là số sample (tạm dịch là mẫu) trong một khoảng thời gian nhất định (thường là 1 giây) của âm thanh kỹ thuật số, quyết định trực tiếp tới chất lượng âm thanh. Khi một tập tin âm thanh dạng số được ghi lại, nó phải được convert vào một chuỗi những mẫu (series of sample) mà bản thân chúng có thể lưu lại được trên bộ nhớ, trên các thiết bị lưu trữ kỹ thuật số. Sample rate sẽ thông báo cho ta biết trong tập tin âm thanh có bao nhiêu mẫu được ghi lại trong một giây. Đơn vị của sample rate là Hz. 13 Ví dụ dễ hiểu, một tập tin âm thanh được ghi ở sample rate 44100 sẽ cần đến 44100 mẫu/giây để lưu giữ âm thanh trong một chuỗi mẫu. Sample rate càng cao, chất lượng của chuỗi mẫu càng tốt và càng ít xảy ra hiện tượng gọi là aliasing (là hiện tượng xuất hiện những tần số âm thanh không mong muốn sinh ra bởi việc thiếu hụt thông tin từ sample rate). Mỗi mẫu sẽ cần một lượng bit nhất định để lưu trữ gọi là sample size, và ta có thể tính toán dung lượng cần thiết cho một sample. Ví dụ: với âm thanh 16 bit, ta cần sử dụng 16bit hay 2byte cho một mẫu (8bit = 1byte). Như vậy 1 giây âm thanh với sample rate 44100/16 bit mono (một kênh âm thanh) sẽ có độ lớn là 44100x2=88200byte. Nếu cũng với các thông số như vậy nhưng thay vì mono, ta sử dụng stereo (2 kênh âm thanh), dung lượng sẽ phải nhân đôi và trở thành 176400 byte. Đây là lý do vì sao âm thanh vòm (5.1) hay các loại âm thanh sử dụng nhiều kênh khác (6.1, 7.1, …) lớn hơn rất nhiều sơ với âm thanh stereo hay mono mặc dù chúng cũng có được nén ở cùng chất lượng. Hình 1: Biến đổi sóng âm thanh thành tín hiệu số 14 - BitDepth: Để lưu lại dưới dạng số, mỗi mẫu được biểu diễn bằng một lượng bit dữ liệu nhất định, gọi là BitDepth. Các bản nhạc hiện nay thường có BitDepth là 16 bits, 24 bits…BitDepth càng lớn âm thanh càng sắc nét, trung thực nên nó còn được gọi là Resolution (độ nét). - Kênh âm thanh (Channel): Bằng các thuật toán, tín hiệu số sẽ được tách ra thành nhiều kênh sao cho khi nghe bằng hệ thống loa thích hợp sẽ có cảm giác như khi đang nghe nhạc trong không gian thực tế. - Âm thanh Lossy, lossless và uncompressed Âm thanh uncompressed là loại âm thanh không áp dụng bất kỳ một phương pháp nén nào. Được sử dụng dưới định dạng WAV hay PCM. Âm thanh lossless là loại âm thanh sử dụng phương pháp loại bỏ những dữ liệu không liên quan tồn tại trong file gốc để thu được một file nhỏ hơn nhưng vẫn giữ được chất lượng như ban đầu. Âm thanh xử lý lossless sẽ có bitrate thấp hơn so với âm thanh chưa nén.Âm thanh lossless được sử dụng rộng rãi và phát triển thành những định dạng quen thuộc như AC3, AAC, DTS, MPEG-1/2/3, Vorbis, Real Audio... Âm thanh lossy là loại âm thanh thu được khi sử dụng những phần mềm encode âm thanh phổ biến hiện nay để chuyển đổi các định dạng âm thanh. Đây là loại âm thanh bị giảm chất lượng vì quá trình lossy encode sẽ không giữ nguyên những phần cần thiết trong file âm thanh gốc. Lấy ví dụ, khi encode từ WAV sang MP3, bạn đã thực hiện phương pháp lossy encode cho file âm thanh WAV chưa nén của mình, và file MP3 thu được đã bị giảm chất lượng so với file gốc, nó là âm thanh lossy. Mọi chuyện thậm chí còn tồi tệ hơn với việc encode file MP3 lossy đó thành OGG (có thể là định dạng khác), file OGG thu được đã bị quá trình encode lossy giảm chất lượng tới 2 lần. 15 - Các dạng bitrate CBR/ABR/VBR CBR-Constant bitrate: nghĩa là bitrate của stream là một hằng số và không thay đổi tại bất kỳ điểm nào của stream. ABR-Average bitrate: nghĩa là stream có thể sử dụng bitrate thay đổi cho mỗi frame, nhưng bitrate trung bình của toàn bộ stream là cố định. VBR-Variable bitrate: nghĩa là stream có thể sử dụng bitrate thay đổi cho mỗi frame và tùy biến để đạt được bitrate cần thiết cho mỗi frame,vì vậy bitrate trung bình không thể xác định trước khi encode hay tính toán cụ thể. - Âm thanh Stereo, joint stereo, và dual channel: Dual channel tích hợp bởi 2 kênh mono, nghĩa là mỗi kênh sẽ được encode với một nửa của toàn bộ bitrate. Stereo tích hợp bởi 2 kênh âm thanh độc lập với nhau. Bitrate cung cấp giữa 2 kênh âm thanh thay đổi phù hợp với lượng thông tin được chứa trong mỗi kênh. Joint stereo cũng tích hợp 2 kênh âm thanh nhưng có một bước tiến xa hơn vì có thể sử dụng được những mẫu chung thường xuất hiện ở cả 2 kênh. Do đó độ nén sẽ tốt hơn so với stereo bình thường. 16 1.4. XỬ LÝ TÍN HIỆU SỐ 1.4.1. Đại cƣơng về tín hiệu và nhiễu 1.4.1.1 Khái niệm tín hiệu Tín hiệu là sự biến thiên của biên độ theo thời gian. Biên độ có thể là điện áp, dòng điện, công suất, . . . nhưng thường được hiểu là điện áp. Các yếu tố trong tín hiệu mà chúng ta thường nhắc tới là biên độ và thời gian. Ví dụ: Xét sóng của tín hiệu x = sin(2*pi *100 *t) . Hình 2: Hình minh hoạ cho sóng của tín hiệu 1.4.1.2 Khái niệm nhiễu Nhiễu là tín hiệu do chính bản thân mạch điện tử và môi trường truyền thông phát sinh ra. Giảm nhiễu hoặc khử nhiễu là thao tác chính trong xử lý tín hiệu số. Nhiễu trắng là nhiễu có độ lớn như nhau ở mọi tần số (trên lý thuyết), trong thực tế chúng ta chỉ xét trong phạm vi giới hạn băng tần khá rộng hay nói đúng hơn nhiễu trắng là tín hiệu có mật độ công suất phổ (PSD) cố định ở mọi băng tần. Có hai loại phân bố xác suất của nhiễu thường nhắc tới là nhiễu phân bố đều và nhiễu Gauss. + Phân bố đều là phân bố có hàm mật độ PDF f(x) không đổi trong khoảng biến thiên của biến số x, có giá trị kỳ vọng là μ = 0 . + Phân bố Gauss là phân bố chuẩn. Dạng nhiễu phổ biến nhất trong thực tế là nhiễu trắng có phân bố Gauss. 17 Hình 3: Nhiễu đều Hình 4: Nhiễu phân bố Gaussian 1.4.1.3. Phân loại tín hiệu Tuỳ theo từng tiêu chuẩn mà có nhiều cách phân loại khác nhau:  Dạng sóng: tín hiệu sin, vuông, tam giác, xung. . . .  Tần số: hạ tần, cao tần (HF), âm tần (AF), siêu cao tần (VHF) . . .  Sự liên tục: tín hiệu liên tục, tín hiệu rời rạc.  Tính xác định: tín hiệu xác định, tín hiệu ngẫu nhiên. 18
- Xem thêm -