Nghiên cứu tiêu chuẩn nén h.264 và ứng dụng trong truyền hình có độ phân giải cao (HDTV)Nghiên cứu tiêu chuẩn nén h.264 và ứng dụng trong truyền hình có độ phân giải cao (HDTV)Nghiên cứu tiêu chuẩn nén h.264 và ứng dụng trong truyền hình có độ phân giải cao (HDTV)Nghiên cứu tiêu chuẩn nén h.264 và ứng dụng trong truyền hình có độ phân giải cao (HDTV)Nghiên cứu tiêu chuẩn nén h.264 và ứng dụng trong truyền hình có độ phân giải cao (HDTV)Nghiên cứu tiêu chuẩn nén h.264 và ứng dụng trong truyền hình có độ phân giải cao (HDTV)Nghiên cứu tiêu chuẩn nén h.264 và ứng dụng trong truyền hình có độ phân giải cao (HDTV)Nghiên cứu tiêu chuẩn nén h.264 và ứng dụng trong truyền hình có độ phân giải cao (HDTV)Nghiên cứu tiêu chuẩn nén h.264 và ứng dụng trong truyền hình có độ phân giải cao (HDTV)Nghiên cứu tiêu chuẩn nén h.264 và ứng dụng trong truyền hình có độ phân giải cao (HDTV)Nghiên cứu tiêu chuẩn nén h.264 và ứng dụng trong truyền hình có độ phân giải cao (HDTV)Nghiên cứu tiêu chuẩn nén h.264 và ứng dụng trong truyền hình có độ phân giải cao (HDTV)Nghiên cứu tiêu chuẩn nén h.264 và ứng dụng trong truyền hình có độ phân giải cao (HDTV)Nghiên cứu tiêu chuẩn nén h.264 và ứng dụng trong truyền hình có độ phân giải cao (HDTV)
HỌC VIỆN CÔNG NGHỆ BƢU CHÍNH VIỄN THÔNG
---------------------------------------
Nguyễn Đức Thiệp
NGHIÊN CỨU TIÊU CHUẨN NÉN H.264 VÀ ỨNG DỤNG TRONG
TRUYỀN HÌNH CÓ ĐỘ PHÂN GIẢI CAO (HDTV)
LUẬN VĂN THẠC SĨ KỸ THUẬT
(Theo định hướng ứng dụng)
HÀ NỘI – 2017
HỌC VIỆN CÔNG NGHỆ BƢU CHÍNH VIỄN THÔNG
---------------------------------------
Nguyễn Đức Thiệp
NGHIÊN CỨU TIÊU CHUẨN NÉN H.264 VÀ ỨNG DỤNG TRONG
TRUYỀN HÌNH CÓ ĐỘ PHÂN GIẢI CAO (HDTV)
CHUYÊN NGÀNH: KỸ THUẬT VIỄN THÔNG
MÃ SỐ: 60.52.02.08
LUẬN VĂN THẠC SĨ KỸ THUẬT
(Theo định hướng ứng dụng)
NGƯỜI HƯỚNG DẪN KHOA HỌC:
TS. NGUYỄN QUÝ SỸ
HÀ NỘI – 2017
i
LỜI CAM ĐOAN
Tôi cam đoan đây là công trình nghiên cứu của riêng tôi.
Các số liệu, kết quả nêu trong luận văn là trung thực và chưa từng được ai
công bố trong bất kỳ công trình nào khác.
Học viên
Nguyễn Đức Thiệp
ii
MỤC LỤC
LỜI CAM ĐOAN
i
MỤC LỤC
ii
DANH MỤC CÁC THUẬT NGỮ, CHỮ VIẾT TẮT
vi
DANH SÁCH BẢNG
ix
DANH SÁCH HÌNH VẼ
x
LỜI MỞ ĐẦU
1
CHƢƠNG 1: NGHIÊN CỨU VỀ CƠ SỞ LÝ THUYẾT CỦA
SỐ HÓA TÍN HIỆU VIDEO VÀ NÉN VIDEO SỐ
1.1 Mục đích của nén tín hiệu
2
2
1.1.1 Nhu cầu của công nghệ nén trong truyền hình
2
1.1.2 Mục đích của nén tín hiệu
2
1.2 Quá trính số hóa tín hiệu
3
1.2.1 Lấy mẫu
3
1.2.2 Lượng tử hóa
4
1.2.3 Mã hóa
5
1.3 Tốc độ bít và thông lƣợng kênh truyền tín hiệu số
5
1.3.1 Tốc độ bit
5
1.3.2 Thông lượng kênh truyền tín hiệu số
5
1.4 Quá trình biến đổi tín hiệu màu
6
1.5 Các tiêu chuẩn lấy mẫu video tín hiệu số
7
1.6 Mô hình nén tín hiệu Video
9
1.6.1 Nén tín hiệu Video
10
1.6.2 Lượng tin trung bình
10
1.7 Phân loại kĩ thuật nén
13
1.8 Quá trình biến đổi
13
1.8.1 Điều xung mã vi sai DPCM
14
1.8.2 Mã hóa biến đổi
14
iii
1.9 Quá trình lƣợng tử
16
1.9.1 Lượng tử vô hướng
16
1.9.2 Lượng tử vector
16
1.10 Quá trình mã hóa
17
1.10.1 Mã hóa độ dài thay đổi
17
1.10.1.1 Mã hóa Huffman
18
1.10.1.2 Mã hóa mức dọc chiều dài RLC
18
1.11 Tiêu chuẩn đánh giá chất lƣợng ảnh nén
19
1.12 Kết luận chƣơng 1
20
CHƢƠNG 2: NGHIÊN CỨU TIÊU CHUẨN NÉN H.264/AVC
2.1 Tổng quan về các chuẩn video
2.1.1 Dòng H.26x
21
21
21
2.1.1.1 Chuẩn H.261
21
2.1.1.2 Chuẩn H.263
22
2.1.1.3 Chuẩn H.264/AVC
22
2.1.2 Dòng MPEG
23
2.1.2.1 Chuẩn MPEG – 1
23
2.1.2.2 Chuẩn MPEG – 2
23
2.1.2.3 Chuẩn MPEG – 4
23
2.2 Cấu trúc H.264
24
2.2.1 Không gian màu YCrCb và kiểu lấy mẫu 4:2:0
24
2.2.2 Macroblock
24
2.2.3 Slice
25
2.2.4 Profile
27
2.3 Qui trình nén và giải nén của H.264
2.3.1 Quy trình nén
28
28
2.3.1.1 Dự đoán
29
2.3.1.1.1 Dự đoán Inter
29
2.3.1.1.2 Dự đoán Intra
35
iv
2.3.1.2 Biến đổi và lượng tử hóa
38
2.3.1.2.1 Biến đổi DCT và lượng tử vô hướng
39
2.3.1.2.2 Quá trình biến đổi và lượng tử với block khác biệt 4x4
41
2.3.1.2.3 Biến đổi và lượng tử block 4x4 luma gồm các hệ số DC
45
2.3.1.2.4 Biến đổi và lượng tử các block 2x2 chroma gồm các
hệ số DC
45
2.3.1.3 Tái sắp xếp
46
2.3.1.4 Mã hóa luồng bit nén hay mã hóa Entropy
47
2.3.1.4.1 Mã hóa Entropy Exp-Golomb
47
2.3.1.4.2 Mã hóa chiều dài thay đổi ứng ngữ cảnh CAVLC
49
2.3.1.4.3 Mã hóa nhị phân số học ứng ngữ cảnh CABAC
50
2.3.1.5 Lọc tách khối
50
2.3.2 Quy trình giải nén
51
2.3.2.1 Giải mã luồng bit nén
52
2.3.2.2 Rescaling và biến đổi ngược
52
2.3.2.3 Tái xây dựng
52
2.4 Những ƣu điểm của chuẩn nén H.264 so với các chuẩn trƣớc đó
52
2.5 Kết luận chƣơng 2
55
Chƣơng 3: ỨNG DỤNG TIÊU CHUẨN NÉN H.264/AVC TRONG
TRUYỀN HÌNH CÓ ĐỘ PHÂN GIẢI CAO HDTV
56
3.1 Các thông số kỹ thuật cơ bản đặc trƣng cho hệ thống
Truyền hình độ phân giải cao HDTV
3.1.1 Một số khái niệm cơ bản về truyền hình
3.1.1.1 Các thông số kỹ thuật của màn hình
56
56
56
3.1.1.1.1 Điểm ảnh (pixel)
56
3.1.1.1.2 Độ phân giải của màn hình
56
3.1.1.1.3 Tần số quét, cách quét
56
3.1.1.1.4 Tỉ lệ khuôn hình
57
3.1.1.1.5 Thời gian đáp ứng (Response Time)
57
v
3.1.1.2.6 Độ tương phản
3.1.2 Công nghệ HDTV
57
58
3.1.2.1 Khái niệm Truyền hình HDTV
58
3.1.2.2 Kỹ thuật xử lý tín hiệu và các thông số đặc trưng cơ bản
58
3.1.2.2.1 Đối với truyền hìn số độ phân giải tiêu chuẩn (SDTV)
58
3.1.2.2.2 Đối với truyền hình số độ phân giải cao (HDTV)
58
3.2 Ứng dụng H.264 trong truyền dẫn phát sóng HDTV
3.2.1 Sơ đồ tổng quan truyền dẫn phát sóng của một Đài Truyền hình
61
61
3.2.1.1 Nhiệm vụ của phòng Tổng khống chế
61
3.2.1.2 Khảo sát nguyên lý hoạt động của một phòng phát sóng
62
3.2.2 Truyền dẫn phát sóng HDTV của kênh Truyền hình Quốc Phòng
63
3.2.2.1 Chuẩn file phát sóng của kênh
63
3.2.2.2 Sơ đồ tổng quan của Kênh
64
3.2.2.3 Ưu nhược điểm của việc ứng dụng triển khai chuẩn nén H.264/AVC
cho truyền dẫn phát sóng của Kênh
67
3.2.2.4 Sơ đồ đấu nối thiết bị truyền dẫn phát sóng
68
3.3 Kết luận chƣơng 3
69
KẾT LUẬN VÀ HƢỚNG PHÁT TRIỂN CỦA ĐỀ TÀI
70
DANH MỤC TÀI LIỆU THAM KHẢO
71
vi
DANH MỤC CÁC THUẬT NGỮ, CHỮ VIẾT TẮT
Viết tắt
AVC
CABAC
CAVLC
Tiếng Anh
Tiếng Việt
Advanced Video Coding
Chuẩn mã hóa video tiên tiến
Context-based Apdaptive
Mã hóa entropy dùng thuật toán mã
Binary Arithmetic Coding
hóa số học ứng ngữ cảnh
Context-based Adaptive
Mã hóa chiều dài thay đổi ứng ngữ
Variable Length Coding
cảnh
Định dạng mã hóa hình ảnh có kích
CIF
Common Intermediate Format
CODEC
Coder and Decoder
Bộ mã hóa và giải mã
DCT
Discrete Cosine Transform
Biến đổi cosin rời rạc
DPCM
DWT
ExpGolomb
GOP
Differential Pulse Code
Modulation
thước 352 x 288
Điều xung mã vi sai
Discrete Wavelet Transform
Biến đổi Wavelet rời rạc
Exponential Golomb
Mã Exponential Golomb
Group of Picture
Nhóm ảnh
Là một chuẩn nén tín hiệu tiến tiến
hay còn gọi là AVC/MPEG-4 Part
H.264
10
HDTV
IEC
IDCT
High Definition Television
International Electrotechnical
Commission
Inverse Discrete Cosine
Transform
Truyền hình phân giải cao
Ủy ban Kỹ thuật Điện tử Quốc tế
Biến đổi ngược Cosine rời rạc
vii
Viết tắt
Tiếng Anh
International Standards
ISO
ITU
Organization
International
Telecommunication Union
Tiếng Việt
Tổ chức tiêu chuẩn hóa quốc tế
Liên minh Viễn thông quốc tế
Kỹ thuật nén ảnh không tổn hao
LOSSLESS
(không mất dữ liệu)
Kỹ thuật nén ảnh có tổn hao (có mất
LOSSY
dữ liệu)
MAE
Mean Absolute Error
Sai số tuyệt đối trung bình
MB
Macroblock
Đa khối(khối macro)
MC
Motion Compensation
Bù chuyển động
ME
Motion Estimate
Ước lượng chuyển động
MSE
Mean squared error
Sai số bình phương trung bình
MF
Multipy Factor
Hệ số nhân
MPEG
Moving Pictures Experts
Group
Nhóm chuyên gia nén ảnh động
NAL
Network Abstraction Layer
Lớp trừu tượng mạng
SNR
Signal-to-noise ratio
Tỉ số tín hiệu trên nhiễu
PCM
Pulse Code Modulation
Điều xung mã
PSNR
Peak to Signal to Noise Ratio
QCIF
QP
Tỉ số tín hiệu trên nhiễu đỉnh
Quarter Common Intermediate Định dạng hình ảnh có kích thước
Format
176 x 144
Quantization Parameter
Thông số lượng tử
viii
Viết tắt
RGB
Tiếng Anh
Tiếng Việt
Ba màu cơ bản màu đỏ/Xanh/Lam
Modified Discrete Cosine
MDCT
Red/Green/Blue
Chuyển đổi cosine rời rạc sửa đổi
Transform
Truyền hình tiêu chuẩn
SDTV
Standard Televison
VCEG
Video Coding Experts Groups
VCL
Video Coding Layer
VLC
Variable Length Code
VRML
Virtual Reality Modeling
Language
Nhóm chuyên gia về mã hóa Video
Lớp mã hóa Video
Mã có chiều dài thay đổi
Ngôn ngữ mô hình thực tại ảo
Luminance, Blue
YCbCr
chrominance, Red
chrominance
Độ chói, màu lam, màu đỏ
ix
DANH SÁCH BẢNG
Bảng 1.1: Kích thước 4x8 pixels
11
Bảng 1.2: Độ dư thừa của các pixel trong ảnh
11
Bảng 1.3: Mức xám thực tế
12
Bảng 1.4: Chênh lệch mức xám của 2 pixel liên tiếp
12
Bảng 2.1: Các loại slice mã hóa trong H.264
26
Bảng 2.2: Ví dụ về tổ chức bộ nhớ ảnh tham chiếu
với ảnh hiện tại là 250, số ảnh tham chiếu là 5
31
Bảng 2.3: Các kích thước bước lượng tử trong H.264/AVC Codec
43
Bảng 2.4: Hệ số nhân MF
44
Bảng 2.5: Hệ số scaling V
44
Bảng 2.6: Các từ mã Exp-Golomb
48
Bảng 2.7: Ánh xạ các code-Num cho các syntax elements có dấu
48
Bảng 3.1: Các thông số cơ bản đặc trưng cho hệ thống truyền hình
độ phân giải tiêu chuẩn SDTV
59
Bảng 3.2: Các thông số cơ bản đặc trưng cho hệ thống truyền hình
độ phân giải cao HDTV
60
x
DANH SÁCH HÌNH VẼ
Hình 1.1: Sơ đồ quá trình tạo tín hiệu số
4
Hình 1.2: Quá trình biến đổi tín hiệu màu
6
Hình 1.3: Tiêu chuẩn 4:4:4
7
Hình 1.4: Tiêu chuẩn 4:2:2
8
Hình 1.5: Tiêu chuẩn 4:2:0
8
Hình 1.6: Tiêu chuẩn 4:1:1
9
Hình 1.7: Sơ đồ khối nén tín hiệu video
9
Hình 1.8: Mô hình hệ thống nén tổn hao
13
Hình 1.9: Bộ mã hóa và giải mã DPCM
14
Hình 1.10: Quá trình lượng tử vector
17
Hình 1.11: Cây mã Huffman
18
Hình 1.12: Minh họa mã hóa RLC
19
Hình 2.1: Quá trình phát triển các dòng video H.26x và MPEG
21
Hình 2.2: Một ảnh video được nén với cùng bitrate dùng MPEG-2 (trái),
MPEG-4 (giữa) và h.264 (phải)
23
Hình 2.3: Macroblock 16x16 được đại diện bởi các block thành phần
Y, Cr, Cb theo tỷ lệ lấy mẫu (4:2:0) trong H.264
25
Hình 2.4: Minh họa cách phân chia ảnh thành nhiều slice
25
Hình 2.5: Cấu trúc slice
27
Hình 2.6: Các profile của H.264/AVC và các công cụ
với ứng dụng mỗi profile
27
Hình 2.7: Tổng quan về qui trình nén và giải nén của H.264
28
Hình 2.8: Quá trình nén H.264/AVC
29
Hình 2.9: Mô tả ước lượng chuyển động trong dự báo Inter
30
Hình 2.10: Sự phân chia marcoblock khi mã hóa
32
Hình 2.11: Các phần chia khác nhau trong một ảnh
32
Hình 2.12: Các điểm ảnh sub-sample trong ảnh tham chiếu
33
xi
Hình 2.13: Nội suy các điểm ảnh tại các vị trí half-pixel
trong ảnh tham chiếu
34
Hình 2.14: Nội suy các điểm ảnh tại các vị trí quarter-pixel
35
Hình 2.15: Mô hình dự báo Intra
35
Hình 2.16: Block 4x4 luma cần được dự đoán Intra
36
Hình 2.17: Các điểm ảnh đã được nén dùng để tham chiếu
36
Hình 2.18: Các mode dự đoán cho block 4x4 luma
36
Hình 2.19: Macroblock 16x16 (luma) cần dự đoán
37
Hình 2.20: Các block được dự đoán Intra 16x16
37
Hình 2.21: Thứ tự truyền dẫn của các block bên trong macroblock
39
Hình 2.22: Minh họa biến đổi DCT và lượng tử hóa
40
Hình 2.23: Quét Zig-Zag đối với block 4x4 luma
46
Hình 2.24: Mô hình biến đổi block 4x4 thành mảng sau khi tái sắp xếp
46
Hình 2.25: Thứ tự lọc các cạnh của thành phần luma và
chroma trong 1 macroblock
Hình 2.26: Quy trình giải nén video của chuẩn H.264/AVC
51
51
Hình 2.27: MPEG-4 AVC có thể phân chia thành phần chói của từng
Macroblock theo nhiều cách để tối ưu hóa việc bù chuyển động
53
Hình 3.1: Các tín hiệu vào và ra của phòng tổng khống
61
Hình 3.2: Sơ đồ khối đơn giản của hệ thống phát sóng
62
Hình 3.3: Phần mềm convert Adobe Premiere Pro CC 2017
62
Hình 3.4: Sơ đồ truyền dẫn phát sóng của kênh Truyền hình Quốc phòng
66
Hình 3.5: Nén video H.264 và MPEG-2
66
Hình 3.6: Phần mềm mã hóa và giải mã video định dạng H.264
68
Hình 3.7: Sơ đồ đấu nối thiết bị
69
1
LỜI MỞ ĐẦU
Trong kỹ thuật truyền hình, việc nén Video là một vấn đề quan trọng cho
việc truyền tải các chương trình truyền hình. Những Video này thường là những
dữ liệu có dung lượng rất lớn, với truyền hình có độ phân giải cao (HDTV) không
nén sẽ tiêu thụ khoảng 1,5 Gb/s đến 2Gb/s băng thông, như vậy để truyền tải được
là rất khó. Với chuẩn H.264/MPEG-4 AVC hiện nay, các nhà cung cấp nội dung có
thể mã hóa video HD (High Definition) full HD với dung lượng chỉ còn từ 5Mb/s
đến 10Mb/s, tùy thuộc vào độ phân giải, chất lượng yêu cầu và phương thức mã
hóa. Do vậy các chuẩn nén video ra đời nhằm loại bỏ những dữ liệu dư thừa mà vẫn
đảm bảo chất lượng. Tiêu chuẩn mã hóa (nén) H.264 là một chuẩn tiên tiến, nó đã
tạo ra sự đột phá, cho phép nén video một cách tốt hơn đồng thời cải thiện được
chất lượng so với các tiêu chuẩn nén trước đó.
Với mong muốn đóng góp thêm nghiên cứu về tiêu chuẩn nén H.264 và ứng
dụng của H.264, người viết đã lựa chọn đề tài “Nghiên cứu tiêu chuẩn nén H.264 và
ứng dụng trong truyền hình có độ phân giải cao (HDTV)”.
Luận văn của em gồm 3 chương:
Chương 1: Nghiên cứu về cơ sở lý thuyết của số hóa tín hiệu và nén video số
Chương 2: Nghiên cứu tiêu chuẩn nén H.264/AVC
Chương 3: Ứng dụng tiêu chuẩn nén H.264/AVC trong truyền hình có độ
phân giải cao HDTV
Em xin gửi lời cảm ơn chân thành tới thầy Nguyễn Quý Sỹ đã tận tình hướng
dẫn em thực hiện luận văn này. Em cũng xin gửi lời cảm ơn tới gia đình, các thầy
cô, đồng nghiệp và các bạn đã giúp đỡ em trong suốt thời gian học tập.
2
CHƢƠNG 1: NGHIÊN CỨU VỀ CƠ SỞ LÝ THUYẾT CỦA
SỐ HÓA TÍN HIỆU VIDEO VÀ NÉN VIDEO SỐ
1.1 Mục đích của nén tín hiệu
1.1.1 Nhu cầu của công nghệ nén trong truyền hình
Tín hiệu video sau khi được số hóa 8 bit có tốc độ 216 Mbps, với tốc độ này
vượt quá khả năng truyền của một kênh truyền hình, vì vậy trong lĩnh vực truyền
hình việc sử dụng công nghệ nén gần như là tất yếu để giảm tốc độ bit mà vẫn đảm
bảo chất lượng dữ liệu cần lưu trữ hoặc truyền tải.
Trung tâm của mạng phát sóng video số bao gồm hệ thống nén, nó cung cấp
chương trình video, audio chất lượng cao cho người xem bằng cách chỉ sử dụng một
phần nhỏ độ rộng băng tần mạng.
1.1.2 Mục đích của nén tín hiệu
Với sự phát triển của khoa học kỹ thuật, ngày nay đã sản xuất được bộ cảm
biến màu có độ phân giải lên đến 16 triệu pixel tương đương với một bức ảnh có độ
phân giải 4096x4096 pixels, nhưng thực tế ứng dụng cần độ phân giải cao nhất hiện
nay cũng chỉ dùng lại ở 1920x1080 pixel, do đó để có thể tiết kiệm không gian lưu
trữ và băng thông kênh truyền thì cần nén tín hiệu[1].
Quá trình nén ảnh thực hiện được là do thông tin trong bức ảnh có tổ chức,
có trật tự, vì vậy nếu xem xét kỹ tính trật tự, cấu trúc ảnh sẽ phát hiện và loại bỏ
được các lượng thông tin dư thừa, chỉ giữa lại các thông tin quan trọng nhằm giảm
số lượng bit khi lưu trữ cũng như khi truyền mà vẫn đảm bảo tính thẩm mỹ của bức
ảnh. Tại đầu thu, bộ giải mã sẽ tổ chức, sắp xếp lại được bức ảnh xấp xỉ gần chính
xác so với ảnh gốc nhưng vẫn đảm bảo thông tin cần thiết[1].
Tín hiệu video thường chứa đựng một lượng lớn các thông tin dư thừa, chúng
thường được chia thành 5 loại như sau:
+ Có sự dư thừa thông tin về không gian: giữa các điểm ảnh lân cận trong phạm vi
một bức ảnh hay một khung video, còn gọi là thừa tĩnh bên trong từng frame.
+ Có sự dư thừa thông tin về thời gian: giữa các điểm ảnh của các khung video
3
trong chuỗi ảnh video, còn gọi là thừa động giữa các frame
+ Có sự dư thừa thông tin về phổ: giữa các mẫu của các dữ liệu thu được từ các bộ
cảm biến trong camera, máy quay…
+ Có sự dư thừa do thống kê: do bản thân của các ký hiệu xuất hiện trong dòng bit
với các xác suất xuất hiện không đồng đều.
+ Có sự dư thừa thị giác: thông tin không phù hợp với hệ thống thị giác con người,
những tần số quá cao so với cảm nhận của mắt người.
Ưu điểm của việc nén tín hiệu:
+ Tiết kiệm băng thông kênh truyền ( trong thời gian thực hoặc nhanh hơn).
+ Kéo dài thời giản sử dụng, giảm chi phí đầu tư cho thiết bị lưu trữ.
+ Giảm dung lượng thông tin mà không làm mất tính trung thực của hình ảnh. Có
nhiều phương pháp nén tín hiệu, phương pháp nén bằng cách số hóa tín hiệu vẫn tỏ
ra hữu hiệu trong mọi thời đại; nó có thể làm giảm lượng thông tin không quan
trọng một cách đáng kể, mặt khác nó còn giúp cho tín hiệu được bảo mật hơn[6].
1.2 Quá trính số hóa tín hiệu
Quá trình số hoá tín hiệu tương tự, bao gồm quá trình lọc trước (prefiltering),
lấy mẫu, lượng tử và mã hoá minh họa như hình 1.1. Quá trình lọc trước nhằm loại
bỏ các tần số không cần thiết ở tín hiệu cũng như nhiễu, bộ lọc này còn gọi là bộ lọc
chống nhiễu xuyên kênh Aliasing[1].
1.2.1 Lấy mẫu
Thực chất đây là một phép toán rời rạc hay là một phép điều biên xung PAM
và được thực hiện bằng các mạch Op-amp có cực khiển strobe. Nó tạo ra giá trị tín
hiệu tương tự tại một số hữu hạn các giá trị có biến rời rạc gọi là các mẫu. Các mẫu
được lấy cách đều nhau gọi là chu kỳ lấy mẫu. Tần số lấy mẫu phải thoả mãn định
lý Nyquist-Shannon [4]:
fs 2 fmax
Trong đó:
(1.1)
+ fs là tần số lấy mẫu.
+ fmax là tần số cực đại của phổ tín hiệu tương tự.
4
1.2.2 Lượng tử hóa
Quá trình lượng tử là quá trình chuyển một xung lấy mẫu thành một xung có
biên độ bằng mức lượng tử gần nhất hay nói cách khác là lượng tử chuyển đổi các
mức biên độ của tín hiệu đã lấy mẫu sang một trong các giá trị hữu hạn các mức nhị
phân. Lượng tử hoá biến đổi tín hiệu liên tục theo thời gian thành tín hiệu có biên
độ rời rạc, nhằm làm giảm ảnh hưởng của tạp âm trong hệ thống, hạn chế các mức
cho phép của tín hiệu lấy mẫu và chuẩn bị truyền tín hiệu gốc từ tương tự sang số.
Giá trị thập phân của các mẫu sau khi lượng tử hoá sẽ được biểu diễn dưới
dạng số nhị phân n bit (N= 2n), với n là độ phân giải lượng tử hoá, n càng lớn thì độ
chia càng mịn, do đó độ chính xác càng cao[5]. Do làm tròn các mức nên tín hiệu bị
méo dạng do sai số lượng tử gọi là méo lượng tử, tỷ số tín hiệu trên méo lượng tử
(S/N) được xác định bởi:
S 1
6,02n + 1,76(dB)
N n
Hình 1.1: Sơ đồ quá trình tạo tín hiệu số[4]
Lượng tử hóa có hai loại:
+ Lượng tử tuyến tính: phép nén tín hiệu theo quy luật đường cong đồng
đều, bước lượng tử bằng nhau.
5
+ Lượng tử phi tuyến: phép nén tín hiệu theo quy luật đường cong không
đồng đều, tập trung nhiều mức lượng tử ở những vùng tín hiệu nhỏ. Trong kỹ thuật
nén ảnh, nén video thì loại lượng tử phi tuyến được dùng nhiều hơn vì nó giảm
dung lượng đến mức tối đa với độ méo lượng tử có thể chấp nhận được[5].
1.2.3 Mã hóa
Là quá trình thay thế mỗi mức điện áp cố định sau khi lượng tử bằng một dãy
nhị phân gọi là từ mã.Tất cả các từ mã đều chứa số xung nhị phân cố định và được
truyền trong khoảng thời gian giữa 2 thời điểm lấy mẫu cạnh nhau.Bộ mã được sử
dụng để tái tạo các xung nhị phân hoặc các từ mã từ các giá trị đã lượng tử xuất hiện
ở đầu ra của bộ lượng tử hoá[5].
1.3 Tốc độ bít và thông lƣợng kênh truyền tín hiệu số
1.3.1 Tốc độ bit
Tốc độ bit là số lượng bit được truyền đi hay lưu trữ trong một đơn vị thời
gian[5].
C = fs * n (bit/s)
(1.3)
Trong đó :
+ fs là tần số lấy mẫu (Hz).
+ n là số bit nhị phân trong một ký hiệu.
+ C là tốc độ bit (bps).
1.3.2 Thông lượng kênh truyền tín hiệu số
Là tốc độ số liệu cực đại có thể truyền được trên kênh truyền có độ rộng
băng tần B.
C = B.log2(1 +
S
) (bps)
N
Trong đó:
+ C là tốc độ bit (bps)
+
S
là tỷ số tín hiệu trên nhiễu trắng
N
+ B là băng thông kênh truyền (Hz)
(1.4)
6
Tốc độ bit càng lớn thì tín hiệu tương tự khôi phục lại càng trung thực tuy
nhiên nó sẽ là cho dung lượng lưu trữ và băng thông kênh truyền càng lớn[3].
Trong thực tế để truyền tín hiệu có tốc độ bit là C (bps) thì cần băng thông kênh
truyền là:
B
3
C (Hz)
4
Ví dụ: với n = 4, fs = 44,1Khz thì:
Tốc độ truyền thông tin là : C = n x fs = 4 x 44,1 = 176,4.103 bits/s
Và độ rộng băng tần là B
3
3
C = x176,4.103 = 132,3 Khz
4
4
1.4 Quá trình biến đổi tín hiệu màu
Hình 1.2: Quá trình biến đổi tín hiệu màu[6]
Một bức ảnh được chuyển từ RGB sang YUV (Y là thành phần độ chói, UV
là 2 thành phần màu) nhằm giảm dung lượng lưu trữ cũng như truyền đi, trong quá
trình giải mã, trước khi hiển thị ảnh thì nó được biến đổi ngược lại thành RGB[9].
Công thức minh họa ( với k là hằng số, Cr, Cb là những thành phần màu sắc):
Y = krR + (1- kb – kr)G + kbB, với Cr =
0,5
(R – Y)
1 kr
Cb =
0,5
(B – Y)
1 kb
(1.5)
Với Kb + Kr + Kg = 1, Kb = 0.114; Kr = 0,299; Thay vào công thức (1.5)
ta được:
Y = 0.229R + 0.587G + 0,114B
7
Cb =
0,5
(B – Y) = - 0,169R – 0,331G + 0,5B
1 0,114
Cr =
0,5
(R – Y) = 0,5R – 0,419G – 0,081B
1 0, 299
Nên ta có ma trận biến đổi từ RGB sang YUV như sau:
Y 0, 299 0,587 0,114 R
Cb = 0,169 0,331 0,5 G
Cr 0,5
0, 419 0, 081 B
(1.6)
Thực hiện tương tự ta suy ra được ma trận biến đổi từ YUV sang RGB như sau:
0
1, 402
R 1
G = 1 0,344 0, 71 4
B 1 1, 772
0
Y
Cb
Cr
(1.7)
1.5 Các tiêu chuẩn lấy mẫu video tín hiệu số
Kiểu lấy mẫu cho ảnh video cũng là một vấn đề khá quan trọng của kỹ thuật
nén ảnh[6].
Một số kiểu lấy mẫu phổ biến:
+ Tiêu chuẩn 4:4:4
- Mẫu tín hiệu chỉ được lấy với các thành phần tích cực của tín hiệu video
- Các tín hiệu chói Y, tín hiệu màu Cr, Cb được lấy mẫu tại tất cả các điểm lấy mẫu
trên dòng tích cực của tín hiệu video.
Hình 1.3: Tiêu chuẩn 4:4:4
Tần số lấy mẫu: Y: 13,5 MHz; Cr/Cb: 13,5 MHz
Ví dụ: tốc độ truyền ( hệ màu Pal):
+> Lấy mẫu 8 bít: (720 + 720 + 720) x 576 x 8 x 25 = 249 Mbit/s
- Xem thêm -