LỜI CAM ĐOAN
Tôi xin cam đoan:
Những kết quả nghiên cứu, các số liệu, hình vẽ, biểu bảng, kết quả tính toán
được trình bày trong luận văn là hoàn toàn trung thực, không vi phạm bất cứ điều gì
trong luật sở hữu trí tuệ và pháp luật Việt Nam.
TÁC GIẢ LUẬN VĂN
Đào Văn Đã
DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT
1. SBC(442)
Mã hóa băng con 3 kênh dùng tổ hợp phân chia [4, 4, 2]
2. SBC(8842)
Mã hóa băng con 4 kênh dùng tổ hợp phân chia [8,8,4,2]
3. Tone
Một thành phần đơn âm
4. ∆f
Độ rộng dải tần của tín hiệu (đơn vị là Hz)
5. BB
Độ rộng dải thông của bộ lọc thông dải(đơn vị là rad)
6. Bbkn
Hệ số của bộ lọc thông dải đã nhân với kn phụ thuộc vào n
7. Bbn
Hệ số của bộ lọc thông dải phụ thuộc vào n
8. BH
Độ rộng dải thông của bộ lọc thông cao (đơn vị là rad)
9. bi
Số bit cấp cho dải con thứ i
10. BL
Độ rộng dải thông của bộ lọc thông thấp (đơn vị là rad)
11. bTB
Số bit trung bình/mẫu trong mã hóa băng con
12. bTBi
Số bit trung bình/mẫu cấp cho tín hiệu băng con thứ i
13. Btr
Độ rộng dải chuyển tiếp của bộ lọc (đơn vị là rad)
14. D
Hệ số phân chia của bộ phân chia
15. F
Tần số (đơn vị Hz)
16. fmax
Tấn số cực đại của tín hiệu âm thanh (đơn vị Hz)
17. fSr
Tần số lấy mẫu của tín hiệu đầu ra
18. fSv
Tần số lấy mẫu của tín hiệu đầu vào.
19. G
Đáp ứng biên độ của bộ lọc
20. GB
Đáp ứng biên độ của bộ lọc thông dải
21. GBdB
Đáp ứng biên độ của bộ lọc thông dải tính dB
22. GdB
Đáp ứng biên độ của bộ lọc tính theo dB
23. GH
Đáp ứng biên độ của bộ lọc thông cao
24. GHdB
Đáp ứng biên độ của bộ lọc thông cao tính dB
25. GL
Đáp ứng biên độ của bộ lọc thông thấp
26. GLdB
Đáp ứng biên độ của bộ lọc thông thấp tính dB
27. HB(ejF)
Đáp ứng tần số của bộ lọc thông dải theo thang tần số F
28. Hbkn
Hệ số của bộ lọc thông cao đã nhân với kn phụ thuộc vào n
29. Hbn
Hệ số của bộ lọc thông cao phụ thuộc vào n
30. HH(ejF)
Đáp ứng tần số của bộ lọc thông cao theo thang tần số F
31. HL(ejF)
Đáp ứng tần số của bộ lọc thông thấp theo thang tần số F
32. kn
Hàm cửa sổ
33. L
Hệ số nội suy của bộ nội suy
34. Lbkn
Hệ số của bộ lọc thông thấp đã nhân với kn phụ thuộc vào n
35. Lbn
Hệ số của bộ lọc thông thấp phụ thuộc vào n
36. M
Số kênh trong bộ mã hóa băng con
37. N
Bậc của bộ lọc
38. ni
Hệ số phân chia của dải con thứ i
39. p
Cấp phân chia trong phân tích Wavelet
40. R
Tốc độ bit trong SBC
41. Ts
Chu kỳ lấy mẫu (đơn vị là giây)
42. TSr
Chu kỳ lấy mẫu của tín hiệu đầu ra
43. TSv
Chu kỳ lấy mẫu của tín hiệu đầu vào.
44. X(ejω)
Tín hiệu trong miền tần số liên tục
45. x(n)
Tín hiệu trong miền thời gian rời rạc chuẩn hóa theo Ts
46. X(z)
Tín hiệu trong miền z
47. δp
Độ gợn sóng trong dải thông của bộ lọc
48. δs
Độ gợn sóng trong dải chắn của bộ lọc
49. ε
Lỗi khôi phục trong mã hóa băng con
50. ωcB1
Tần số cắt dưới của bộ lọc thông dải (đơn vị là rad)
51. ωcB2
Tần số cắt trên của bộ lọc thông dải (đơn vị là rad)
52. ωcH
Tần số cắt của bộ lọc thông cao (đơn vị là rad)
53. ωsB1
Tần số giới hạn dưới của bộ lọc thông dải ở mức -20dB ( rad)
54. ωsB2
Tần số giới hạn trên của bộ lọc thông dải ở mức -20dB ( rad)
55. ωsH
Tần số giới hạn của bộ lọc thông cao ở mức -20dB ( rad)
56. ωsL
Tần số giới hạn của bộ lọc thông thấp ở mức -20dB (rad)
57. ADC
Analog to Digital Converter
Bộ chuyển đổi tương tự
sang số
Adaptive Transform
Mã hóa âm thanh biến đổi
Acoustic Coding
thích nghi.
59. BPF
Bandpass Filter
Bộ lọc thông dải
60. CD
Compact Disc
Đĩa Compact
61. DAC
Digital to Analog Converter
Bộ chuyển đổi số sang
58. ATRAC
tương tự
62. DF
Digital Filter Bộ lọc số
Bộ lọc số
63. DFT
Discrete Fourier Transform
Biến đổi Fourier rời rạc
64. FFT
Fast Fourier Transform
Biến đổi Fourier nhanh.
65. FIR
Finite Impulse Response
Đáp ứng xung hữu hạn
66. HPF
Highpass Filter
Bộ lọc thông cao
67. IDFT
Inverse Discrete Fourier
Biến đổi Fourier rời rạc
Transform
ngược.
International
Ủy ban Điện quốc tế
68. IEC
Electrotechnical
Commission
69. IIR
Infinite Impulse Response
Đáp ứng xung vô hạn
70. ISO
International Organization
Tổ chức tiêu chuẩn quốc tế.
for Standardization
71. LPF
Lowpass Filter
Bộ lọc thông thấp
72. MDCT
Modified Discrete Cosine
Biến đổi cosin rời rạc
Transform
73.
Motion Picture Experts
Nhóm chuyên gia hình ảnh
MPEG/audio
Group/audio
chuyển động/âm thanh
74. PASC
Precision Adaptive Subband
Mã hóa băng con thích nghi
Coding
chính xác
75. QMF
Quadrature Mirror Filter
Bộ lọc gương cầu phương
76. SBC
SubBand Coding
Mã hóa băng con
DANH MỤC CÁC BẢNG
trang
Bảng 1.1.1 : Các phép toán cơ bản của xử lý tín hiệu
17
DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ
Chương 1: Cơ bản về bộ lọc và bank lọc số
trang
Hình 1.5.1: Đáp ứng biên độ của bộ lọc số thông thấp
10
Hình 1.7.1: Bộ phân chia
12
Hình 1.7.2: Bộ phân chia
12
Hình 1.7.3: Phổ của một tín hiệu x(n)
13
Hình 1.7.4: Phổ của tín hiệu ra bộ phân chia với hệ số D = 2
14
Hình 1.7.5: Sơ đồ tương đương của bộ lấy mẫu Fs = Fnsy
15
Hình 1.7.6: Ký hiệu bộ nội suy trong miền n
15
Hình 1.7.7: Bộ nội suy
16
Hình 1.7.8: Phổ của một tín hiệu x(n)
17
Hình 1.7.9: Phổ của tín hiệu tại đầu ra bộ nội suy với L = 2
17
Hình 1.7.10: Bộ biến đổi nhịp với hệ số
18
D
L
Hình 1.7.11: Ký hiệu bộ biến đổi nhịp hệ số
Hình 1.7.12: Y↓↑2/3(ejω) và Y↑↓2/3(ejω)
D
L
19
20
Hình 1.7.13: Sơ đồ tổng quát của bộ lọc nội suy
21
Hình 1.7.14: Y↑2H(ejω)
22
Hình 1.7.15: Bộ lọc biến đổi nhịp hệ số D/L
23
Hình 1.7.16: Sơ đồ khối của bộ lọc biến đổi nhịp hệ số D/L
24
Hình 1.8.1: Cấu trúc của bank lọc số phân tích
25
Hình 1.8.2: Cấu trúc của bank lọc số tổng hợp
25
Hình 1.9.1: Bank lọc số nhiều nhịp 2 kênh
26
Hình 1.9.2: Một vài trường hợp của đáp ứng biên độ
27
Hình 1.9.3: Phổ tín hiệu vào, ra bộ lọc số lý tưởng
29
Hình 1.9.4: Sơ đồ tổng quát của bank lọc số M kênh
30
Chương 2: Mã hóa băng con
Hình 2.1.1: Sơ đồ mã hoá băng con 2 kênh
31
32
Hình 2.1.2: Sơ đồ mã hoá băng con tổng quát M kênh
Hình 2.1.3: Bank lọc phân tích 4 kênh đơn phân giải
34
Hình 2.1.4: Bank lọc tổng hợp 4 kênh đơn phân giải
34
Hình 2.1.5: Bank lọc số 4 kênh
35
Hình 2.1.6: Bank lọc phân tích 2 tầng đa phân giải
36
Hình 2.1.7: Bank lọc tổng hợp 2 tầng đa phân giải
36
Hình 2.1.8: Quá trình mã hóa băng con
37
Hình 2.1.9: Phân bố các băng con theo các hệ số phân chia
39
Hình 2.1.10: Quan hệ giữa đầu ra và đầu vào của bộ phân chia
42
Hình 2.1.11: Tín hiệu vào (a) và tín hiệu ra (b) của bộ phân chia trong
miền thời gian rời rạc, đã chuẩn hoá theo chu kỳ lấy mẫu.
Hình 2.1.12: Phổ của tín hiệu vào (a) và tín hiệu ra (b) bộ phân chia
D = 2.
Hình 2.1.13: Quan hệ giữa đầu ra và đầu vào của bộ nội suy
43
43
Hình 2.1.14: Tín hiệu vào (a) và tín hiệu ra (b) của bộ nội suy trong
44
43
miền thời gian rời rạc, đã chuẩn hoá theo chu kỳ lấy mẫu.
Hình 2.1.15: Phổ của tín hiệu vào (a) và tín hiệu ra (b) bộ nội suy với
L = 2.
44
Hình 2.2.1: Minh họa các bộ lọc có dải chuyển tiếp bằng nhau
47
Hình 2.2.2: Đặc tuyến biên độ của BPF khi thiết kế bằng phương pháp
trực tiếp theo đáp ứng tần số với N = 20.
50
Hình 2.2.3: Đặc tuyến biên độ của BPF khi thiết kế bằng phương pháp
trực tiếp theo đáp ứng tần số với N = 40.
50
Hình 2.2.4 : Đáp ứng biên độ của LPF với các dải chuyển tiếp
50
Hình 2.2.5 : Đáp ứng biên độ của BPF với các dải chuyển tiếp
52
Hình 2.2.6 : Đáp ứng biên độ của HPF với các dải chuyển tiếp
54
Hình 2.2.7: Đặc tuyến biên độ của BPF khi thiết kế bằng phương pháp
ấn định dải chuyển tiếp với N = 20, tgα=40/π.
56
Hình 2.2.8: Đặc tuyến biên độ của BPF khi thiết kế bằng phương pháp
ấn định dải chuyển tiếp với N = 40, tgα=40/π.
56
Hình 2.2.9: Đặc tuyến biên độ của BPF khi thiết kế bằng phương pháp
dải chuyển tiếp - cửa sổ với N = 20, tgα=40/π, cửa sổ Hamming.
59
Hình 2.2.10: Đặc tuyến biên độ của BPF khi thiết kế bằng phương pháp
dải chuyển tiếp - cửa sổ với N = 40, tgα=40/π, cửa sổ Hamming.
60
Hình 3.2.1: Các băng con tại đầu ra bank lọc phân tích nhiều nhịp đơn
phân giải
Chương 3: Mã hóa băng con ứng dụng trong xử lý tiếng nói
61
Hình 3.2.2: Bank lọc phân tích nhiều nhịp đơn phân giải
62
Hình 3.2.3: Bank lọc tổng hợp nhiều nhịp đơn phân giải
63
Hình 3.2.4:Các băng con tại đầu ra bank lọc phân tích nhiều nhịp đa
phân giải
Hình 3.2.5: Bank lọc phân tích nhiều nhịp đa phân giải
64
Hình 3.2.6: Bank lọc tổng hợp nhiều nhịp đa phân giải
66
Hình 3.3.1: Phân chia băng con và tạo khung dữ liệu của các lớp
MPEG-1/audio
67
Hình 3.3.2: Bộ mã hóa MPEG-1/audio
68
Hình 3.3.3: Sơ đồ khối bộ SBC(442)
72
Hình 3.3.4: Sơ đồ khối mã hóa âm thanh theo thuật toán ATRAC1
72
Hình 3.3.5: Phổ tần của tín hiệu vào x(n)
72
Hình 3.3.6: Phổ tần của ba tín hiệu băng con tại đầu ra các bộ lọc
73
Hình 3.3.7: Phổ tần của ba tín hiệu băng con tại đầu ra các bộ phân chia
74
Hình 3.3.8: Phổ tần của ba tín hiệu băng con tại đầu ra các bộ nội suy
75
Hình 3.3.5: Sơ đồ khối bộ SBC(8842)
76
Hình 3.4.1: Các dải con ứng với tổ hợp phân chia [6,3,2]
78
Hình 3.4.2: Sơ đồ khối bộ mã hóa băng con SBC(632)
79
Hình 3.4.4: Đặc tuyến biên độ G(F), GdB(F) của 3 bộ lọc khi chọn
83
N= 10, α= 750
64
Hình 3.4.5: Đặc tuyến biên độ G(F), GdB(F) của 3 bộ lọc khi chọn
83
N= 12, α= 780
Hình 3.4.6: Đặc tuyến biên độ G(F), GdB(F) của 3 bộ lọc khi chọn
83
N= 20, α= 82,50
Hình 3.4.7: Đặc tuyến biên độ G(F), GdB(F) của 3 bộ lọc khi chọn
83
N= 35, α= 85,50
Hình 3.4.8: Đặc tuyến biên độ G(F), GdB(F) của 3 bộ lọc khi chọn
84
N= 100, α= 88,50
Hình 3.4.4: Phổ tần của tín hiệu vào x(n) khi fs = fNy
85
Hình 3.4.4: Phổ tần của tín hiệu băng con tại đầu ra bank lọc phân tích
86
Hình 3.4.6: Phổ tần của tín hiệu băng con tại đầu ra bank lọc tổng hợp
87
Hình 3.4.7: Phổ tần của 3 tín hiệu dải con sau khi qua các bộ lọc nôi suy
88
Hình 3.4.8: Phổ tần của 3 tín hiệu dải con sau khi qua các bộ lọc
89
tổng hợp
Hình 3.4.9: Phổ tần của 3 tín hiệu ra y(n)
89
MỤC LỤC
Trang
Danh mục các ký hiệu, các chữ viết tắt
Danh mục các bảng
Danh mục các hình vẽ, đồ thị
MỞ ĐẦU
1
Chương 1: Cơ bản về bộ lọc và bank lọc số
1.1. Giới thiệu chung về bộ lọc số
5
1.2. Các loại bộ lọc số
6
1.3. Bộ lọc số đa nhịp và các băng lọc
7
1.4. Tính ưu việt của bộ lọc số
8
1.5. Các chỉ tiêu thiết kế của bộ lọc số
9
1.6. Vai trò của cửa sổ
11
1.7. Thay đổi nhịp lấy mẫu
1.7.1. Khái niệm phân chia và nội suy
12
1.7.2. Thay đổi nhịp lấy mẫu với hệ số D/L
18
1.7.3. Bộ lọc nội suy
21
1.7.4. Bộ lọc biến đổi nhịp lấy mẫu với hệ số D/L không nguyên
23
1.8. Bank lọc số
24
1.8.1. Định nghĩa bank lọc số
24
1.8.2. Định nghĩa bank lọc số phân tích
24
1.8.3. Định nghĩa bank lọc số tổng hợp
25
1.9. Bank lọc số nhiều nhịp hai kênh
26
1.9.1. Bank lọc số nhiều nhịp 2 kênh và bank lọc gương cầu phương
26
1.9.2. Bank lọc số nhiều nhịp M kênh
30
Chương 2: Mã hóa băng con
2.1. Tổng quan về mã hóa băng con
31
2.1.1. Giới thiệu
31
2.1.2. Cấu trúc dạng cây của bank lọc số
33
2.1.3. Nguyên lý mã hóa băng con
36
2.1.4. Các thông số kỹ thuật của SBC
38
2.1.5. Các điều kiện của mã hóa băng con
41
2.1.6. Điều kiện để tăng hệ số nén tín hiệu trong mã hóa băng con
44
2.2. Thiết kế bộ lọc FIR bằng phương pháp kết hợp dải chuyển tiếp-cửa sổ
46
2.2.1. Giới thiệu
46
2.2.2. Thiết kế bộ lọc FIR bằng phương pháp trực tiếp
48
2.2.3. Thiết kế bộ lọc FIR bằng phương pháp dải chuyển tiếp
50
2.2.4. Thiết kế bộ lọc FIR bằng phương pháp dải chuyển tiếp-cửa sổ
56
Chương 3: Mã hóa băng con ứng dụng trong xử lý tiếng nói
3.1. Giới thiệu
61
3.2. Bank lọc theo phân tích Wavelet
61
3.2.1. Bank lọc nhiều nhịp đơn phân giải
61
3.2.2. Bank lọc nhiều nhịp đa phân giải
64
3.3. Mã hóa băng con đã ứng dụng trong xử lý âm thanh số
66
3.3.1. Chuẩn âm thanh số MPEG/audio
66
3.3.2. Thuật toán PASC
70
3.3.3. Thuật toán ATRAC
71
3.4 Đề xuất phương pháp xác định tổ hợp phân chia
77
3.4.1 Phương pháp phân chia liên tiếp cộng cuối
77
3.4.2 Xác định tổ hợp phân chia tối ưu
78
3.4.3 Ứng dụng vào mã hóa băng con SBC(632)
78
3.4.4 Biến đổi hệ số và so sánh kết quả SBC(632) với SBC(442)
85
KẾT LUẬN & KIẾN NGHỊ
92
TÀI LIỆU THAM KHẢO
PHỤ LỤC
MỞ ĐẦU
Các loại tín hiệu trong tự nhiên, tiếng nói là một trong những tín hiệu được
nghiên cứu nhiều nhất và sớm nhất do mục đích cơ bản nhất của các hệ thống thông
tin là truyền đi tiếng nói. Ứng dụng âm thanh trong lĩnh vực thông tin rất đa dạng
như phát thanh vô tuyến, phát thanh qua vệ tinh, qua cáp quang, truyền âm thanh
qua Internet, ghi và phát lại âm thanh, điện thoại, nhận diện qua tiếng nói, chuyển
đổi văn bản âm thanh, các phần mềm ghi đọc âm thanh, âm thanh trong truyền hình,
âm thanh đa kênh trong DVD và phim ảnh, âm thanh trong các ứng dụng truyền
thông đa phương tiện khác. Trong lịch sử phát triển, một trong những tiến bộ quan
trọng nhất trong mã hóa âm thanh là việc phát minh ra bộ mã hóa băng con.
Tất cả các mã hóa băng con đã ứng dụng theo phân tích Wavelet có hai dạng:
+Mã hóa băng con đơn phân giải.
+Mã hóa băng con đa phân giải tương đối.
Đối với mã hóa băng con đơn phân giải: Hiện nay, trong mã hóa – nén tín
hiệu âm thanh có chuẩn MPEG/audio ra đời năm 1990. Chuẩn này thực hiện mã hóa
băng con đơn phân giải với 32 băng con bằng nhau. Ưu điểm nhất của chuẩn
MPEG/audio là hệ số nén dữ liệu cao nhưng chất lượng âm thanh vẫn đảm bảo.
Hiện nay, chuẩn MPEG/audio ra đời nhiều phiên bản khác, ứng dụng trong nhiều
lĩnh vực. Nhược điểm cơ bản của MPEG/audio là số lượng băng con lớn, bank lọc
phức tạp.
Đối với mã hóa băng con đa phân giải tương đối: Hiện nay, đã ứng dụng
chuẩn ATRAC do Sony phát minh, dùng mã hóa băng con đa phân giải tương đối 3
kênh và 4 kênh tương ứng các tổ hợp phân chia là [4 4 2] và [8 8 4 2]. Chuẩn
ATRAC cho hệ số nén dữ liệu cao, chất lượng âm thanh tốt.
Trong phạm vi đề tài này, em xin giới thiệu về mã hóa băng con đơn phân
giải, đa phân giải tương đối 3 kênh và nghiên cứu mã hóa băng con đã được ứng
dụng thực tế trong xử lý tín hiệu âm thanh số. Đồng thời đưa ra phương pháp thiết
kế bộ lọc bằng phương pháp kết hợp dải chuyển tiếp-cửa sổ và giải pháp mới để xác
định lại hệ số phân chia tối ưu hơn SBC đã ứng dụng trong thực tế.
1
Em xin chân thành cảm ơn viện đào tạo sau đại học, các thầy giáo, cô giáo
trong viện điện tử viễn thông trường Đại học Bách khoa Hà nội, đặc biệt là thầy
PGS.TS Nguyễn Quốc Trung đã hướng dẫn, giúp đỡ để em hoàn thành được luận
văn này.
1. Lý do chọn đề tài:
Trong lịch sử phát triển, một trong những tiến bộ quan trọng nhất trong mã hóa
âm thanh là việc phát minh ra bộ mã hóa băng con (Subband Coding – SBC). Ứng
dụng đầu tiên của mã hóa băng con trong xử lý âm thanh số theo chuẩn
MPEG/audio. Chuẩn MPEG/audio ra đời vào năm 1990 bởi ISO/IEC, được ứng
dụng rộng rãi, trong đó có phát thanh số vô tuyến. Ngoài ra, ATRAC cũng là thuật
toán mã hóa băng con, được phát minh bởi Sony và được ứng dụng trong ghi đọc
âm thanh trên MiniDisc, phát thanh số trên Internet.
Hiện nay, phát thanh Việt nam đang nghiên cứu để chuyển đổi từ phát thanh
tương tự sang phát thanh số. Một số nước đã và đang phát triển hệ thống phát thanh
số riêng. Các hệ thống phát thanh số hiện nay trên thế giới đều dùng kỹ thuật mã
hóa băng con để nén dữ liệu âm thanh, với tỷ lệ nén rất cao. Mã hóa băng con là
một trong những thuật toán mã hóa nén dữ liệu có tổn hao, đã được ứng dụng trong
mã hóa âm thanh. Việc nghiên cứu SBC (Subband Coding) trong việc nén dữ liệu
âm thanh và ứng dụng nó trong phát thanh số có ý nghĩa quan trọng trong việc định
hướng cho phát thanh số ở Việt nam. Đó cũng là lý do để em lựa chọn nghiên cứu
và thực hiện đề tài này.
2. Mục đích nghiên cứu của luận văn, đối tượng, phạm vi nghiên cứu.
+ Mục đích nghiên cứu: Mục đích của luận văn là nghiên cứu các vấn đề cơ bản
của bộ lọc và bank lọc số nhiều nhịp, từ đó mô tả và xây dựng mô hình mã hóa băng
con ứng dụng trong xử lý âm thanh số
+ Đối tượng và phạm vi nghiên cứu: Luận văn nghiên cứu mã hóa băng con đơn
phân giải và đa phân giải tương đối theo phân tích wavelet. Cụ thể là chuẩn
ATRAC (Adaptive Transform Acoustic Coding) mã hóa âm thanh biến đổi thích
nghi do SONY phát minh dùng mã hóa dải con đa phân giải tương đối 3 kênh và 4
2
kênh với các tổ hợp phân chia [442] và [8842]. Luận văn nghiên cứu và đề xuất xây
dựng bank lọc đa phân giải tương đối dùng phương pháp kết hợp dải chuyển tiếpcửa sổ. Khảo sát chúng trên các file âm thanh khác nhau, kết quả kiểm chứng qua
phần mềm Matlab.
3. Tóm tắt cô đọng các luận điểm cơ bản và đóng góp mới của tác giả
Đối với mã hóa băng con đơn phân giải hiện nay trong mã hóa nén tín hiệu
âm thanh có chuẩn MPEG/audio ra đời năm 1990. Chuẩn này thực hiện mã hóa với
32 dải con bằng nhau, tỷ lệ nén cao, cho chất lượng âm thanh tốt nhưng số lượng
dải con lớn bank lọc phức tạp. Đối với đa phân giải tương đối, cụ thể là chuẩn
ATRAC do SONY phát minh dùng mã hóa dải con đa phân giải tương đối 3 kênh
và 4 kênh với các tổ hợp phân chia [442] và [8842] khắc phục được hạn chế về số
kênh. Tuy nhiên có hạn chế là hệ số phân chia phải là lũy thừa của 2 và có ít nhất có
2 dải con có độ rộng bằng nhau, để khắc phục hạn chế đó luận văn đưa ra giải pháp
thiết kế mới bằng cách thiết kế lại bộ lọc bên trong bằng phương pháp kết hợp dải
chuyển tiếp –cửa sổ và thay đổi lại hệ số phân chia trong bank lọc phân tích và tổng
hợp để đạt được ưu điểm hơn so với SBC đã ứng dụng bằng mô hình mới SBC 3
kênh tổ hợp phân chia [632] .
4. Phương pháp nghiên cứu.
Luận văn nghiên cứu trên phương diện lý thuyết kết hợp với mô phỏng qua
Matlab và phương pháp thống kê với nhiều file âm thanh khác nhau.
5. Nội dung của luận văn:
Cấu trúc của luận văn gồm: Mở đầu
Chương 1: Cơ bản về bộ lọc và bank lọc số
Chương 2: Mã hóa băng con
Chương 3: Mã hóa băng con ứng dụng trong xử lý tiếng nói
Kết luận và kiến nghị; tài liệu tham khảo và phần phụ lục.
Chương 1: Nghiên cứu các vấn đề cơ bản về bộ lọc & bank lọc số, bao gồm
các phép toán, các loại bộ lọc số và các ưu, nhược điểm, các chỉ tiêu kỹ thuật yêu
cầu khi thiết kế bộ lọc và các loại cửa sổ. Đồng thời nghiên cứu quá trình thay đổi
3
nhịp lấy mẫu gồm có phép phân chia và phép nội suy, bộ lọc biến đổi nhịp lấy mẫu
gồm có bộ lọc phân chia và bộ lọc nội suy từ đó ứng dụng để tạo ra các bank lọc số.
Chương 2: Nghiên cứu về cấu trúc, nguyên lý, thông số kỹ thuật và các điều
kiện của mã hóa băng con. Đề xuất thiết kế phương pháp mới kết hợp dải chuyển
tiếp-cửa sổ trong bộ lọc FIR.
Chương 3: Nghiên cứu về mã hóa băng con đơn phân giải và đa phân giải
tương đối, đưa ra mô hình mã hóa băng con đã ứng dụng trong xử lý âm thanh số
theo chuẩn MPEG/audio của Sony. Giới thiệu thuật toán PASC, ATRAC. Phân tích
thuật toán ATRAC1 và ATRAC3 áp dụng trong mã hóa âm thanh 3 và 4 kênh, với
tổ hợp phân chia [442] và [8842]. Đề xuất mới phương pháp xác định tổ hợp phân
chia tối ưu, từ đó so sánh kết quả đề xuất SBC(632) với bộ mã hóa đa phân giải
tương đối 3 kênh SBC[442] (ATRAC1) đã ứng dụng trong thực tế.
4
Chương 1: Cơ bản về bộ lọc và bank lọc số
1.1.
Giới thiệu chung về bộ lọc số
Tín hiệu là biểu diễn vật lý của thông tin. Về mặt toán học tín hiệu được biểu
diễn bởi hàm của một hoặc nhiều biến độc lập. Tín hiệu được chia làm hai nhóm
lớn, đó là tín hiệu liên tục và tín hiệu rời rạc. Tín hiệu liên tục là tín hiệu luôn được
xác định tại mọi thời điểm trong thời gian tồn tại của nó, gồm có tín hiệu tương tự
và tín hiệu lượng tử hoá. Tín hiệu rời rạc là tín hiệu chỉ được xác định tại các thời
điểm rời rạc cách biệt nhau, gồm có tín hiệu lấy mẫu và tín hiệu số.
Tín hiệu số cũng như tín hiệu tương tự có thể biểu diễn bằng hàm của tần số
và được gọi là phổ tần số của tín hiệu, phổ tần số chính là sự mô tả ý nghĩa tần số
của tín hiệu.
Lọc tín hiệu là quá trình mà trong đó phổ tần số của tín hiệu có thể được biến
điệu, phục hồi hình dạng hoặc được xử lý theo các chỉ tiêu đã cho. Trong quá trình
biến điệu đó các thành phần tần số có thể được khuếch đại hoặc làm suy giảm, được
tách ra hoặc loại bỏ. Tóm lại, bộ lọc chỉ cho qua những tín hiệu có ích, còn những
tín hiệu nhiễu do sự xâm nhập hoặc sinh ra trong quá trình xử lý cần phải loại bỏ.
Bộ lọc số là một hệ thống số dùng để lọc những tín hiệu rời rạc, sơ đồ
nguyên lý của một quá trình lọc được minh họa trong sơ đồ hình 1.1.1.
Tín hiệu vào tương tự x(t) được lấy mẫu theo tần số lấy mẫu Ts thành tín hiệu
rời rạc x(nTs), tín hiệu này được đưa qua bộ biến đổi tương tự số ADC (Analog to
Digital Converter). Trong khối ADC này mỗi mẫu được lượng tử hoá và được
chuyển thành từ mã ở dạng mã nhị phân, từ mã càng dài thì sự chính xác của phép
lấy mẫu càng lớn. Dãy mẫu đã mã hoá được đưa vào bộ lọc số DF (Digital Filter), ở
đây các từ mã được tính toán, xử lý theo một thuật toán được gọi là thuật toán lọc.
Sau khi được thực hiện các thuật toán này thì các từ số mới sẽ xuất hiện ở đầu ra
của bộ lọc số DF. Đó chính là tín hiệu số đã được lọc y(n). Số liệu này sẽ được đưa
vào máy tính lưu trữ và xử lý hoặc được đưa qua bộ biến đổi số tương tự DAC
(Digital to Analog Converter). Sau đó được lọc bởi mạch lọc thông thấp để khôi
phục lại tín hiệu tương tự y(t).
5
x(t)
Khối
Bộ
Lọc
Bộ
Lọc
trích
AD
số
DA
khôi
mẫu
(DF)
y(t)
phục
Lưu trữ
và xử lý
T.T điều khiển
Hình 1.1.1: Sơ đồ khối của hệ thống lọc số
Như vậy, theo quá trình trên thì tín hiệu vào bị tác động bởi nhiều yếu tố.
Bản chất của tín hiệu tự nhiên là tín hiệu tương tự, theo như trên hình 1.1.1 thì tín
hiệu tương tự được biến đổi thành tín hiệu số rồi mới được phân tích xử lý, sau đó
mới được tái tạo lại thành tín hiệu tương tự. Do đó mối quan hệ giữa tín hiệu số và
tín hiệu tương tự trong hệ thống lọc phải được xác định một cách hài hoà và đồng
nhất.
Các phép toán cơ bản trong xử lý tín hiệu số được trình bày trên bảng 1.1.1.
Phép toán
Cộng
Bảng 1.1.1 : Các phép toán cơ bản của xử lý tín hiệu số
Ký hiệu
Biểu thức
x1(n)
x2(n)
y(n)
y(n) = Σxi(n)
xk(n)
Nhân điều
chế
Nhân hằng
số
Trễ
1.2.
x1(n)
x(n)
x(n)
x2(n)
y(n)
α
y(n) = x1(n).x2(n)
y(n)
y(n)
Z-1
Các loại bộ lọc số
6
y(n) = α.x(n)
y(n) = x(n-1)
- Bộ lọc số có đáp ứng xung chiều dài hữu hạn FIR (Finite Impulse Response):
h(n)
≠0
với N1 ≤ n ≤ N2
=0
với n còn lại
(1.2.1)
Phương trình sai phân của bộ lọc số FIR:
y (n) =
1 M
∑ br x(n − r )
a0 r = 0
(1.2.2)
Ta thấy bộ lọc số FIR có đáp ứng ra y(n) chỉ phụ thuộc vào tín hiệu kích
thích tại thời điểm hiện tại và quá khứ nên còn được gọi là bộ lọc số không đệ quy.
Có thể biểu diễn bộ lọc số FIR dưới dạng:
y(n) = F[x(n), x(n-1),…,x(n-M)]
Bộ lọc số FIR luôn luôn ổn định do:
∞
∑ h ( n) < ∞
(1.2.3)
(1.2.4)
n = −∞
- Bộ lọc số có đáp ứng xung chiều dài vô hạn IIR (Infinite Impulse Response).
Phương trình sai phân của bộ lọc số IIR:
N
M
k =0
r =0
∑ ak y (n − k ) = ∑ br x(n − r )
(1.2.5)
Ta thấy bộ lọc số IIR có đáp ứng ra y(n) không chỉ phụ thuộc vào tín hiệu
kích thích tại thời điểm hiện tại, quá khứ mà còn phụ thuộc vào cả đáp ứng ra ở thời
điểm quá khứ nên còn được gọi là bộ lọc số đệ quy. Có thể biểu diễn bộ lọc số IIR
dưới dạng:
y(n) = F[y(n-1), y(n-2),…,y(n-N),x(n), x(n-1),…,x(n-M)]
(1.2.6)
Bộ lọc số IIR không phải luôn ổn định, để bộ lọc IIR ổn định thì phải có điều kiện.
1.3.
Bộ lọc số đa nhịp và các băng lọc
Bộ lọc số có nhịp lấy mẫu đầu vào và đầu ra như nhau được gọi là bộ lọc số
đơn nhịp (Single rate digital filtera). Bộ lọc số có nhịp lấy mẫu thay đổi theo thời
gian hoặc nhịp lấy mẫu giữa đầu ra và đầu vào khác nhau thì được gọi là bộ lọc số
đa nhịp (Multi rate digital filter). Trên thực tế tuỳ thuộc vào ứng dụng cụ thể mà
người ta phân ra các loại cụ thể, như: bộ lọc thông thấp (Lowpass Digital Filter), bộ
lọc thông cao (Highpass Digital Filter), bộ lọc thông dải (Pass-band Digital Filter),
7
bộ lọc chắn dải (Stop-band Digital Filter), bộ lọc thông tất (All-pass Digital Filter),
bộ lọc số dải hẹp (Narrow-band Digital Filter), bộ lọc số dải rộng (Wide-band
Digital Filter). Phụ thuộc vào cách sử dụng hàm cửa sổ và phương pháp xấp xỉ hoá
ta có bộ lọc số Butter Worth, bộ lọc số Chebyshev, bộ lọc số Bassel,…
Bộ lọc số được thể hiện bằng nhiều cách khác nhau như: thể hiện trực tiếp
(Direct realization), không gian trạng thái (State space realization), hình bậc thang
(Ladder), hình mắt lưới (Lattice), song song hoặc nối tiếp…Khi hệ thống lọc được
phân chia thành các băng lọc như băng lọc gương cầu phương (QMF banks), băng
lọc biến đổi Fourier rời rạc đồng dạng (Uniform DFT banks)…Ngoài ra phụ thuộc
vào các tính năng và ứng dụng cụ thể bộ lọc số mà có tên gọi trực tiếp như bộ lọc
phân chia (Decimation), bộ lọc nội suy (Interpolation) và bộ lọc vi phân.
1.4.
Tính ưu việt của bộ lọc số
Về mặt thiết kế, bộ lọc đệ quy và không đệ quy có nhiều phương pháp thiết
kế khác nhau. Trên thực tế bộ lọc số đệ quy thực hiện dễ dàng hơn nhưng chúng có
độ ổn định không cao nên việc sử dụng bị hạn chế. Các bộ lọc số không đệ quy tuy
thực hiện phức tạp hơn, nhất là khi bậc của bộ lọc cao, nhưng chúng được sử dụng
rộng rãi vì những lý do sau đây:
- Có thể dễ dàng thiết kế bộ lọc FIR có đặc tuyến pha tuyến tính trong khi
thực hiện đặc tuyến biên độ theo chỉ tiêu cho trước. Vì vậy trong hệ thống đòi hỏi
nhất thiết phải có pha tuyến tính (như truyền số liệu, xử lý tiếng nói) thì bắt buộc
phải dùng bộ lọc FIR.
- Do sự liên quan chặt chẽ đến các thuật toán FFT, bộ lọc FIR được thực hiện
có hiệu quả với tích chập nhanh. Trong trường hợp bộ lọc FIR bậc cao, có thể dùng
kỹ thuật đa nhịp và phân hoạch đa pha chia thành các băng con, mà kỹ thuật này
không áp dụng cho bộ lọc IIR.
- Có thể thực hiện bộ lọc FIR bằng tích chập trực tiếp. Các cấu trúc dù ở
dạng số hoặc tương tự rời rạc đều ổn định, không có nhánh phản hồi giữa đầu ra và
đầu vào.
8
- Trong các hệ thống rời rạc việc tăng hay giảm tần số lấy mẫu thường xảy
ra. Các quá trình nội suy, phân chia lúc này cũng đòi hỏi phải lọc bổ sung, các bộ
lọc này thực hiện theo FIR tiện lợi hơn nhiều so với IIR.
- Các lỗi sinh ra do thực hiện mạch không lý tưởng trong trường hợp lọc FIR
có thể điều khiển dễ hơn nhiều, có nghĩa là trong khi thiết kế ta có thể dễ dàng phát
hiện nhiễu làm tròn khi thực hiện số hoá, cũng như các vấn đề tổn hao khi thực hiện
bằng mạch tương tự, bởi vì nó không có nhánh phản hồi nên dễ dàng điều chỉnh
hơn.
- Thiết kế bộ lọc FIR có nhiều thông số tự do hơn so với thiết kế bộ lọc IIR.
Chúng ta có thể xấp xỉ dễ dàng hơn nhiều bằng bộ lọc FIR so với bộ lọc IIR một
đặc tuyến biên độ phức tạp, tổng quát, tối ưu nào đó.
Việc dùng bộ lọc FIR không thể tránh khỏi một số vấn đề sau:
- Thiết kế bộ lọc FIR là một vấn đề mới căn bản so với các phương pháp đã
biết, bởi vì các kết quả của bộ lọc tương tự không được dùng hoặc chỉ được dùng
rất ít trong trường hợp này.
- Thiết kế bộ lọc FIR đòi hỏi kỹ thuật tính toán khá lớn và tăng tuyến tính với
bậc của bộ lọc.
- Trong bộ lọc FIR đòi hỏi bộ nhớ Ram và bộ ghi dịch tỷ lệ với bậc của bộ
lọc và khá cao so với IIR, đổi lại điều này bộ lọc FIR có độ ổn định tốt và điều kiện
logic đơn giản hơn.
1.5. Các chỉ tiêu thiết kế của bộ lọc số
Ta đã biết các bộ lọc số lý tưởng không thể thực hiện được về mặt vật lý vì h(n)
không nhân quả và có chiều dài vô hạn.
Với bộ lọc số thực tế đáp ứng biên độ thõa mãn :
1 − δ p ≤ H (e jω ) ≤ 1 + δ p : trong dải thông
H (e jω ) ≤ δ s : trong dải chắn
Đáp ứng biên độ bộ lọc số thông thấp thực tế cho trên hình 1.5.1, trong thực tế
chỉ có tần số dương nên ta chỉ cần vẽ trong khoảng 0 ≤ ω ≤ π .
Bộ lọc thực tế có bốn chỉ tiêu kỹ thuật sau:
9
δ p: độ gợn sóng ở dải thông
δs: độ gợn sóng ở dải chắn
ωp: tần số giới hạn dải thông.
ωs: tần số giới hạn dải chắn.
Ta có: ∆ω = ωs - ωp gọi là bề rộng dải quá độ.
H ( e jω )
1+δp
1-δp
δs
ωS
ωP
ω
π
Dải thông Dải quá
Dải chắn
độ
Hình 1.5.1: Đáp ứng biên độ của bộ lọc số thông thấp
0
Các độ gợn sóng dải thông và dải chắn càng nhỏ càng tốt (cỡ vài %), tần số giới
hạn dải thông và dải chắn càng gần nhau càng tốt (để bề rộng dải quá độ càng hẹp).
Tuy nhiên trên thực tế đây là các tham số nghịch nhau và đó chính là vấn đề khó
khăn gặp phải trong quá trình thiết kế bộ lọc.
Đối với bộ lọc số thông cao, thông dải và chắn dải cũng có các tham số kỹ thuật
tương ứng.
Nguyên tắc chung để thiết kế bộ lọc số là từ hàm đáp ứng tần số, từ yêu cầu về
độ gơn sóng, độ rộng dải quá độ và độ suy giảm ở dải chắn ta dùng phương pháp
thiết kế để tính các hệ số h(n).
Khi thiết kế các bộ lọc số cần đáp ứng các yêu cầu chính sau đây:
1. Tính các hệ số đáp ứng xung h(n): Các mẫu đáp ứng tần số của bộ lọc sao cho
đường đặc tuyến tần số nhận được gần với đường đặc tuyến lý tưởng, nghĩa là tối
ưu hoá các hệ số.
2. Xây dựng cấu trúc hàm truyền đạt H(Z) sao cho thời gian là nhanh nhất mà
không bị méo pha , méo biên độ, nghĩa là đảm bảo tính tái xây dựng hoàn chỉnh.
10
- Xem thêm -