Đánh giá hiệu năng của kỹ thuật mã hóa video hevch.265 truyền hình qua mạng IP (tt)Đánh giá hiệu năng của kỹ thuật mã hóa video hevch.265 truyền hình qua mạng IP (tt)Đánh giá hiệu năng của kỹ thuật mã hóa video hevch.265 truyền hình qua mạng IP (tt)Đánh giá hiệu năng của kỹ thuật mã hóa video hevch.265 truyền hình qua mạng IP (tt)Đánh giá hiệu năng của kỹ thuật mã hóa video hevch.265 truyền hình qua mạng IP (tt)Đánh giá hiệu năng của kỹ thuật mã hóa video hevch.265 truyền hình qua mạng IP (tt)Đánh giá hiệu năng của kỹ thuật mã hóa video hevch.265 truyền hình qua mạng IP (tt)Đánh giá hiệu năng của kỹ thuật mã hóa video hevch.265 truyền hình qua mạng IP (tt)Đánh giá hiệu năng của kỹ thuật mã hóa video hevch.265 truyền hình qua mạng IP (tt)Đánh giá hiệu năng của kỹ thuật mã hóa video hevch.265 truyền hình qua mạng IP (tt)Đánh giá hiệu năng của kỹ thuật mã hóa video hevch.265 truyền hình qua mạng IP (tt)Đánh giá hiệu năng của kỹ thuật mã hóa video hevch.265 truyền hình qua mạng IP (tt)Đánh giá hiệu năng của kỹ thuật mã hóa video hevch.265 truyền hình qua mạng IP (tt)Đánh giá hiệu năng của kỹ thuật mã hóa video hevch.265 truyền hình qua mạng IP (tt)Đánh giá hiệu năng của kỹ thuật mã hóa video hevch.265 truyền hình qua mạng IP (tt)Đánh giá hiệu năng của kỹ thuật mã hóa video hevch.265 truyền hình qua mạng IP (tt)Đánh giá hiệu năng của kỹ thuật mã hóa video hevch.265 truyền hình qua mạng IP (tt)
HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
---------------------------------------
NGUYỄN HỮU BẰNG
ĐÁNH GIÁ HIỆU NĂNG CỦA KỸ THUẬT MÃ HÓA
VIDEO HEVC/H.265 TRUYỀN HÌNH QUA MẠNG IP
CHUYÊN NGÀNH :
KỸ THUẬT VIỄN THÔNG
MÃ SỐ:
60.52.02.08
TÓM TẮT LUẬN VĂN THẠC SĨ KỸ THUẬT
HÀ NỘI - 2017
i
Luận văn được hoàn thành tại:
HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
Người hướng dẫn khoa học: TS. VŨ VĂN SAN
Phản biện 1: …………………………………………………………………
Phản biện 2: …………………………………………………….……………..
Luận văn sẽ được bảo vệ trước Hội đồng chấm luận văn thạc sĩ tại Học viện Công
nghệ Bưu chính Viễn thông
Vào lúc:
....... giờ ....... ngày ....... tháng ....... .. năm ...............
Có thể tìm hiểu luận văn tại:
- Thư viện của Học viện Công nghệ Bưu chính Viễn thông
ii
LỜI NÓI ĐẦU
Với sự bùng nổ của Internet, đặc biệt là Internet băng thông rộng đã làm thay
đổi cả nội dung và kỹ thuật truyền hình. Hiện tại, phần lớn các nội dung truyền hình
chỉ dừng lại ở mức độ nét cao, nhưng trong tương lai độ nét siêu cao sẽ là một xu thế
tất yếu. Hệ quả của sự phát triển này là sức ép ngày càng lớn lên hạ tầng truyền dẫn.
Để giải quyết vấn đề này, chuẩn mã hóa video thế hệ tiếp theo đã được phát triển với
tên gọi mã hóa video hiệu suất cao (HEVC/H.265).
Với mục đích đưa những đánh giá khách quan về hiệu năng của kỹ thuật mã
hóa video HEVC/H.265 khi truyền hình qua mạng IP, em xin chọn đề tài nghiên cứu
“Đánh giá hiệu năng của kỹ thuật mã hóa video HEVC/H.265 truyền hình qua mạng
IP.”.
Tổng quan, luận văn gồm 3 chương:
Chương 1 trình bày về mã hóa video hiệu suất cao HEVC.
Chương 2 giới thiệu về truyền hình qua mạng IP.
Chương 3 đánh giá hiệu năng của chuẩn mã hóa HEVC trong kịch bản truyền
hình qua mạng IP.
Sau hơn một thời gian nỗ lực tìm hiểu cùng với sự chỉ bảo tận tình của các
thầy cô trong khoa, đặc biệt là giảng viên TS. Vũ Văn San, em đã hoàn thành bài luận
văn này. Do đây là đề tài còn khá mới và vốn kiến thức bản thân còn hạn chế nên
không tránh được các sai sót, kính mong quý thầy cô và các bạn đóng góp ý kiến để
bài luận văn này hoàn thiện hơn.
Em xin chân thành cảm ơn thầy Vũ Văn San và các thầy cô trong Khoa Quốc tế
và Đào tạo đã tận tình giúp đỡ em trong suốt thời gian qua.
Hà Nội, tháng 5 năm 2017
Nguyễn Hữu Bằng
1
CHƯƠNG 1:
1.1.
1.1.1.
KỸ THUẬT MÃ HÓA VIDEO HEVC/H.265
Giới thiệu chung mã hóa video
Tổng quan mã hóa video
Một tín hiệu video số thường chứa một lượng lớn dữ liệu, do đó sẽ gặp rất
nhiều khó khăn trong việc lưu trữ và truyền đi trên băng thông kênh truyền hạn chế.
Vì vậy để có thể tiết kiệm không gian lưu trữ và băng thông kênh truyền thì ta cần
nén (mã hóa) tín hiệu.
Để đánh giá chất lượng của bức ảnh (hay khung ảnh video) ở đầu ra của bộ
mã hóa, ta thường sử dụng các tham số sau để đánh giá:
- Sai số bình phương trung bình – MSE (Mean Square Error) định nghĩa cho
cường độ sai khác giữa ảnh gốc và ảnh dự đoán [1]:
Mean Squared Error
: MSE
1
N2
N 1
N 1
(C
i 0
j 0
ij
Ri j ) 2
(1.1)
- Tỉ số tín hiệu trên nhiễu đỉnh – PSNR (Peak to Signal to Noise Ratio) [1].
(2b 1)2
Peak signal to noise ratio : PSNR 10log10
(db)
MSE
(1.2)
Trong đó: + N×N kích thước bù chuyển động
+ hệ số Ci, j và Ri, j tương ứng với mẫu hiện tại và vùng mẫu tham khảo.
+ b số lượng bit/ mẫu.
Thông thường, nếu PSNR ≥ 40dB thì hệ thống mắt người gần như không
phân biệt được giữa ảnh gốc và ảnh khôi phục, tức là ảnh nén có chất lượng xuất
sắc.
• Nếu 30 dB PSNR < 33 dB thì chất lượng ảnh nén bình thường, mắt người
có sự phân biệt được.
• Nếu PSNR < 30 dB thì chất lượng ảnh nén kém.
2
1.1.2.
GOP
Một GOP (nhóm các hình ảnh) xác định thứ tự mà khung hình intra và inter
được sắp xếp. Một chuỗi video thường gồm các GOP liên tiếp. Cấu trúc GOP thường
được xác định bằng một số cho biết khoảng cách giữa hai ảnh (I hoặc P). Việc lựa
chọn kích thước GOP phụ thuộc vào nhiều yếu tố khác như kích cỡ DPB và độ trễ
[2].
1.1.3.
Lớp mạng trừu tượng (NAL)
Lớp mạng trừu tượng là một tính năng thiết yếu, có sẵn trên cả H.264/AVC và
HEVC. Về cơ bản, đó là một phương pháp chia luồng bit video thành các đơn vị
NAL. Nhìn chung, HEVC và H.264/AVC có chung một cấu trúc trừ một số bit tại
mào đầu [3].
1.2.
1.2.1.
Chuẩn mã hóa video H.264/AVC
Bối cảnh ra đời và sự phát triển
H.264 được chấp thuận bởi tổ chức truyền thông quốc tế ITU-T với tên gọi
Recommendation H.264 và bởi tổ chức chuẩn hóa quốc tế (ISO/IEC) với tên gọi
International Standard 14496-10 (MPEG-4 part 10) Advanced Video Coding.
1.2.2.
Nguyên lý hoạt động cơ bản
Ngoại trừ tính năng lọc tách khối, H.264 vẫn bao gồm các khối chức năng cơ
bản như các chuẩn mã hóa trước đó như dự đoán, biến đổi, lượng tử hóa và mã hóa
entropy. Sự thay đổi quan trọng trong H.264 đến từ sự cải tiến chi tiết bên trong cách
khối chức năng đó.
1.2.3.
Các đặc điểm nổi bật
So với các chuẩn mã hóa video trước đó, H.264/AVC có một số những đặc
điểm nổi bật sau:
• Bù chuyển động với kích cỡ khối thay đổi
• Bủ chuyển động chính xác đến một phần tư mẫu
3
• Tách riêng hình ảnh tham khảo và hình ảnh hiển thị
• Dự đoán trọng số
• Sử dụng bộ lọc tách khối
• Dự đoán trong ảnh sử dụng không gian định hướng
Ngoài ra, H.264/AVC còn có một số đặc tính làm tăng cường khả năng chống
sai số và mất dữ liệu như:
• Tham số cấu trúc
• Cấu trúc cú pháp của NAL
• Kích cỡ mảnh linh hoạt
• Dữ liệu dư của ảnh
1.3.
Chuẩn mã hóa video HEVC/H.265
Bối cảnh ra đời và sự phát triển
1.3.1.
Tiêu chuẩn Mã hóa video hiệu suất cao (High Efficiency Video Coding) phản
ánh kinh nghiệm được tích lũy trong khoảng bốn thập kỷ nghiên cứu và ba thập kỉ
chuẩn hóa cho công nghệ mã hóa video kỹ thuật số. Kết quả, nó đã chính thức được
chuẩn hóa trong ITU-T Recommendation H.265 và ISO/IEC International Standard
23008-2 (MPEG-H part 2).
Nguyên lý hoạt động cơ bản
1.3.2.
Tiêu chuẩn HEVC được thiết kế cho nhiều mục đích, bao gồm hiệu năng mã
hóa, dễ dàng tích hợp hệ thống truyền dẫn và phục hồi dữ liệu bị mất cũng như tính
khả thi khi sử dụng kiến trúc xử lý song song.
1.3.3.
Các đặc điểm nổi bật
Về cơ bản HEVC/H.265 có cấu trúc tương tự như các chuẩn trước đó, tuy
nhiên HEVC có nhiều cải tiến mới để đem lại khả năng mã hóa với hiệu suất cao.
1.3.3.1.
Cấu trúc khối linh hoạt
Thay vì sử dụng khối macroblock như H.264/AVC và các tiêu chuẩn mã hóa
trước đó, trong HEVC/H.265, một hình ảnh được chia thành nhiều khối vuông, gọi là
4
khối cây mã hóa (CTB – Coding Tree Blocks). Mỗi thành phần CTB sáng kết hợp
với hai thành phần CTB màu và các cú pháp được gộp chung gọi là đơn vị cây mã
hóa (CTU – Coding Tree Units). CTU đại diện cho đơn vị xử lý cơ bản trong HEVC
và nó tương tự như khái niệm macroblock trong các tiêu chuẩn mã hóa video trước
đây. Kích thước CTU lớn hơn thường cho hiệu suất mã hóa tốt hơn nhưng làm tăng
thời gian mã hóa và giải mã cũng như yêu cầu bộ nhớ và khả năng tính toán phức tạp
hơn.
Hình 1.10: Chia CTU thành CU theo cấu trúc cây tứ phân [4]
Các CTB có thể được chia nhỏ hơn nữa theo cấu trúc cây mã hóa thành các
khối mã hóa (CB). Đó là đối tượng mà bộ mã hóa quyết định giữa dự đoán trong ảnh
hay dự đoán bù chuyển động.
Một CTU có thể chia thành các CU với kích cỡ khác nhau. Tương tự như CTU,
mỗi thành phần CB sáng kết hợp với hai thành phần CB màu cùng với các cú pháp
liên quan tạo thành một đơn vị mã hóa (CU). Một CTB chứa một hoặc thành nhiều
CU. Và mỗi CU được phân chia thành đơn vị dự đoán (PU) và đơn vị biến đổi (TU).
5
Hình 1.11 : Chia CU thành các PU [4]
Hình 1.12: Chia CTB thành TB và CB theo cấu trúc cây tứ phân [4]
Quyết định mã hóa bằng dự đoán liên ảnh hay trong ảnh được thực hiện ở cấp
CU.
1.3.3.2.
Phân vùng hình ảnh
Giống như H.264/AVC, trong HEVC/H.265, một hình ảnh được phân chia
thành một hoặc nhiều mảnh (slice). Một mảnh chứa một hoặc nhiều CTU hoặc
macroblock. Sự khác biệt trong HEVC/H.265 là một mảnh có thể giải mã độc lập mà
không phụ thuộc vào những mảnh khác trong cùng một ảnh.
6
1.3.3.3.
Xử lý song song
Phần cứng ngày nay cho phép tận dụng khả năng đa luồng ngay cả trên những
kiến trúc tiết kiệm điện. Nhờ khả năng đa luồng, hiệu năng xử lý được cải thiện đáng
kể. Trong HEVC/H.265 giới thiệu hai công cụ hỗ trợ xử lý đa luồng:
• Xử lý song song đầu sóng (WPP)
• Tile
1.3.3.4.
Dự đoán trong ảnh
Với tiêu chuẩn HEVC, quá trình dự đoán trong ảnh bao gồm ba bước: xây
dựng mảng mẫu tham khảo, dự đoán mẫu và hậu xử lý. Ba bước trên đều được thiết
kế tối ưu để đạt hiệu quả mã hóa cao trong khi giảm thiểu các yêu cầu tính toán trong
cả bộ mã hóa và giải mã. Các thiết lập chế độ dự đoán bao gồm phương pháp mô hình
hóa các loại nội dung thường xuất hiện trong video và hình ảnh tĩnh. Phương pháp
dự đoán trong ảnh có thể chia thành hai loại. Loại đầu tiên là dự đoán hướng. Dự
đoán hướng cung cấp khả năng mô hình hóa với độ chính xác cao cho các đối tượng
có cấu trúc định hướng. Phương pháp thứ hai, dự đoán phẳng và dự đoán DC hiệu
quả với các khu vực hình ảnh mịn. Tổng cộng có 35 chế độ được hỗ trợ.
1.3.3.5.
Dự đoán liên ảnh
Trong khi dự đoán trong ảnh chủ yếu khai thác mối tương quan giữa các mẫu
không gian lân cận thì dự đoán liên ảnh lại tận dụng sự tương quan thời gian giữa các
hình ảnh để xây dựng dự đoán bù chuyển động (MCP) cho một khối mẫu ảnh. Một
khối tương ứng trong một hình ảnh được giải mã trước có thể sử dụng làm yếu tố dự
báo cho các hình ảnh sau.
HEVC sử dụng hai chế độ: dự đoán vector chuyển động nâng cao (AMVP) và
chế độ kết hợp. Bộ mã hóa quyết định giữa hai chế độ này cho mỗi PU. Mỗi chế độ
xây dựng một danh sách ứng viên MV. Sau đó, nó chọn một trong số đó làm chỉ số
mã hóa và truyền đi trong luồng dữ liệu.
Đối với chế độ AMVP, vector chuyển động được dự đoán từ năm không gian
lân cận và một ứng viên thời gian.
7
Tương tự như H.264, HEVC hỗ trợ vector chuyển động với độ chính xác một
phần tư điểm ảnh cho thành phần chói và một phần tám điểm ảnh cho thành phần
màu. Hoạt động này được thực hiện chủ yếu bằng cách sử dụng bộ lọc nội suy. Quá
trình nội suy là một thủ tục chuyển hóa các mẫu phân số bằng cách sử dụng các mẫu
nguyên.
Nội suy mẫu phân số cho các mẫu chói trong HEVC ứng dụng một bộ lọc 8tap cho vị trí nửa mẫu và 7-tap cho vị trí một phần tư mẫu. Số lượng tap là một thông
số quan trọng cho các bộ lọc nội suy vì nó ảnh hưởng trực tiếp đến hiệu quả mã hóa
và độ phức tạp khi thực hiện.
Dự đoán trọng số là một phương pháp điều chỉnh mẫu cho dữ liệu bù chuyển
động. Nó rất hữu ích cho việc mã hóa các hiệu ứng mờ dần ứng dụng trong mã hóa
mặt người hay chuyển động. Trong HEVC, nó được đơn giản hóa bằng cách áp dụng
trọng số cho mỗi dự đoán bù chuyển động hoặc trung bình hai dự đoán bù chuyển
động.
1.4.
Tổng kết chương 1
Phần đầu tiên của chương 1 giới thiệu tổng quan về chuẩn mã hóa video. Cùng
với đó là cách thức đánh giá chất lượng video khi bị nén có tổn hao. Nhóm hình ảnh
cũng là một yếu tố quan trọng, cần phải được lưu ý trong quá trình nén video. Lớp
trừu tượng mạng (NAL) là một tính năng mới trong H.264/AVC và được phát triển
trong HEVC cũng được giới thiệu tại phần tổng quan. Sau đó, luận văn giới thiệu
những nét nổi bật của hai chuẩn nén H.264/AVC và HEVC. Trong đó, tập trung chủ
yếu vào HEVC với nhiều tính năng cải tiến.
8
CHƯƠNG 2:
2.1.
2.1.1.
TRUYỀN HÌNH QUA MẠNG IP
Mô hình hệ thống truyền hình qua mạng IP
Internet video
Hình 2.1 cho thấy một cái nhìn đơn giản về một mạng Internet video. Sơ đồ
này được chia thành hai phần, khâu sản xuất và phân phối. Trong khâu sản xuất, nội
dung video được chụp từ một nguồn, được số hóa, chỉnh sửa, gắn nhãn và được nhóm
vào một tệp được đặt trên máy chủ nơi nó có thể được truy cập. Trong khâu phân
phối, một người sử dụng một máy tính kết nối Internet để tìm kiếm nội dung, kết nối
với máy chủ, có quyền xem nội dung và sau đó tải tệp tin video hoặc yêu cầu luồng
video để xem trên máy tính cá nhân của họ bằng cách sử dụng phần mềm đa phương
tiện chuyên biệt.
Hình 2.1 Mạng cung cấp Internet Video [9]
2.1.2.
IPTV
IPTV chủ yếu được sử dụng để cung cấp các nội dung và dịch vụ mà CATV
hoặc hệ thống vệ tinh không thể cung cấp. Các nhà cung cấp dịch vụ muốn cung cấp
nhiều dịch vụ tiêu dùng qua một mạng đơn lẻ thường chọn công nghệ IP vì nó có thể
cung cấp nhiều dịch vụ và tốc độ cao trên một nền tảng duy nhất. Trong một hệ thống
9
điển hình, một mạng IP tốc độ cao tư nhân được sử dụng để liên tục cung cấp chương
trình video cho hàng trăm hoặc hàng ngàn người xem đồng thời.
Trên thực tế, các mạng IPTV là những hệ thống khá phức tạp được cấu thành
từ rất nhiều phần tử, đó là một trong những lý do mà chúng khó thiết kế và phát triển.
2.1.3.
Tình hình phát triển IPTV tại Việt Nam
Mặc dù, IPTV chỉ mới chiếm hơn 10% thị phần truyền hình trả tiền tại Việt
Nam [9]. Tuy nhiên, đây dần được xem là xu hướng phát triển tất yếu khi lộ trình số
hóa hoàn tất và người xem truyền hình đòi hỏi nhu cầu ngày càng cao về loại hình
truyền hình thông minh, kết nối và có tính tương tác cao.
Hiện tại, các dịch vụ truyền hình trong nước mới chỉ dừng lại ở mức HDTV.
Không thể phủ nhận HDTV là một trong những thành tựu to lớn của truyền hình,
nhưng với nhu cầu ngày càng cao của người sử dụng, truyền hình độ nét siêu cao sẽ
là xu thế tất yếu trong tương lại.
Nếu chỉ sử dụng các kỹ thuật mã hóa hiện nay như MPEG-4, tốc độ luồng dữ
liệu cần thiết để truyền một kênh UHDTV sẽ gấp 3-4 lần yêu cầu của một kênh HD
và các hệ thống truyền dẫn sẽ không đáp ứng được.
2.2.
Mã hóa và giải mã
Video nếu không được nén sẽ có chất lượng cao nhưng không thể chuyển tín
hiệu qua mạng truyền thông vì dung lượng quá lớn, trong khi nhu cầu xem và sử dụng
video ngày càng cao. Đã từ lâu, nén video được xem như một giải pháp quan trọng
nhằm giải quyết vấn đề dung lượng và truyền tải video trên mạng.
2.3.
Ghép kênh
Ở đầu ra bộ mã hóa hình ảnh là các luồng cơ sở (ES). Các luồng cơ sở này cần
được ghép kênh với các luồng cơ sở mang tín hiệu âm thanh và các thông tin khác.
Luồng cơ sở đóng gói (PES) là phiên bản “dễ xử lý” hơn của các luồng cơ sở
và chứa thông tin thời gian cho phép đồng bộ hóa các luồng âm thanh và hình ảnh.
10
Các luồng chương trình kết hợp nhiều loại luồng cơ sở đóng gói (âm thanh,
hình ảnh) để hỗ trợ các tác vụ sản xuất (như là ứng dụng ghi lên đĩa DVD, Bluray).
Các luồng truyền tải là một cách khác để kết hợp một luồng cơ sở đóng gói
thành một thực thể duy nhất và có thể được vận chuyển qua mạng. Các gói luồng
truyền tải có độ dài cố định và các luồng sẽ mang theo thông tin đồng hồ cần thiết
cho tín hiệu thời gian thực.
2.4.
2.4.1.
Truyền dẫn qua mạng IP
Giao thức giao vận
Giao thức giao vận được sử dụng để kiểm soát việc truyền tải các gói dữ liệu
kết hợp với IP. Chúng ta sẽ thảo luận về ba giao thức chính thường được sử dụng
trong việc truyền video theo thời gian thực:
UDP (User Datagram Protocol): Đây là một trong những giao thức IP đơn giản
và xuất hiện sớm nhất. UDP thường được sử dụng cho dữ liệu video và các dữ liệu
nhạy cảm về độ trễ khác.
TCP (Transmission Control Protocol): Đây là một giao thức Internet được sử
dụng rộng rãi để truyền dữ liệu. Phần lớn các thiết bị kết nối Internet có khả năng hỗ
trợ TCP trên IP (hoặc đơn giản là TCP/IP).
RTP: Giao thức truyền tải thời gian thực: Giao thức này được phát triển cụ thể
để hỗ trợ truyền dữ liệu thời gian thực, chẳng hạn như video.
2.4.2.
Đóng gói
Đóng gói là quá trình lấy một dòng dữ liệu, định dạng nó thành các gói tin IP,
và thêm các tiêu đề và dữ liệu khác cần thiết để phù hợp với một giao thức cụ thể.
Quá trình này không phải là một công thức dùng chung cho tất cả. Thay vào đó, quá
trình đóng gói có thể được thay đổi để đáp ứng yêu cầu hoạt động của các ứng dụng
và mạng khác nhau.
11
2.4.3.
Truyền thông điểm-điểm (unicast) và điểm-đa điểm (multicast)
Multicast là quá trình gửi một tín hiệu video cùng lúc tới nhiều người dùng.
Tất cả người xem đều có cùng một tín hiệu và được phát cùng một lúc, giống như
truyền hình truyền thống. Hầu như tất cả các chương trình phát sóng video thương
mại đều hoạt động bằng cách sử dụng multicasting, bao gồm truyền hình cáp, truyền
hình vệ tinh, truyền hình qua vô tuyến và IPTV. Tuy nhiên, đối với video trực tuyến
và video trên Internet, multicast là một ngoại lệ.
Để hiểu về multicast, chúng ta so sánh nó với quá trình unicast. Trong unicast,
mỗi luồng video sẽ được gửi đến chính xác một người nhận. Nếu nhiều người nhận
muốn có cùng một video, thì phía phát phải tạo một luồng unicast riêng cho mỗi
người nhận. Các luồng này sẽ truyền từ nguồn đến đích thông qua mạng IP.
Server
Video
Bộ định tuyến
multicast
Bộ định tuyến
PIM
Video
Client
Switch L2 với
IGMP
IGMP
IGMP
Luồng multicast UDP
Hình 2.10: Kiến trúc mạng cơ bản thiết kế cung cấp dịch vụ multicast bằng PIM và
IGMP
2.5.
2.5.1.
Một số đặc điểm truyền dẫn qua mạng IP
Mất gói
Một trong những vấn đề của mạng IP là sự mất mát gói tin gây ra bởi nhiều lý
do gặp phải tại các lớp mạng. Việc mất gói dữ liệu là một trong những lỗi phổ biến
nhất có thể xảy ra trên hệ thống phân phối video IP. Nó có thể gây ra bởi nhiều nguồn,
12
bao gồm lỗi bit, liên kết bị quá tải buộc các bộ định tuyến loại bỏ các gói dữ liệu, thiết
bị mạng bị hỏng và các nguyên nhân khác.
2.5.2.
Jitter
Jitter gói dữ liệu là hiện tượng các luồng gói tin không đến đích sau một khoảng
thời gian như nhau. Ví dụ, một ứng dụng đang cố gửi 100 gói dữ liệu trong vòng một
giây. Nó sẽ cố gắng gửi một gói tin trong vòng 10mili giây. Nếu các gói tin này được
gửi qua mạng không có jitter, các gói tin sẽ đến đích vào đúng thời điểm, mỗi gói
cách nhau 10mili giây. Khi các gói tin đến sớm hoặc muộn hơn 10mili giây, khi đó
jitter xảy ra. Điều này làm cho khoảng trống giữa các gói tin khác nhau, quá ngắn
hoặc quá dài.
2.5.3.
Trễ
Sự chậm trễ sẽ xảy ra trong bất kỳ mạng nào, dù là từ máy tính để bàn đến máy
chủ hoặc trên toàn cầu. Có hai nguồn trễ chính trên mạng IP: sự chậm trễ lan truyền
và sự chậm trễ chuyển đổi.
2.6.
Tổng kết chương 2
Chương 2 của luận văn đã giới thiệu một cách sơ lược về truyền hình qua mạng
IP. Trong đó, chúng ta cần phân biệt giữa Internet Video và IPTV. Mô hình của
Internet Video và IPTV cũng đã được trình bày. Phần tiếp theo, luận văn trình bày về
tình hình phát triển IPTV tại Việt Nam và xu hướng của loại hình dịch vụ này trong
tương lai là cung cấp truyền hình độ nét siêu cao UHDTV. Tiếp đó, luận văn trình
bày về cách thức thực hiện việc truyền hình qua mạng IP theo hướng tiếp cận là dịch
vụ IPTV. Phần cuối cùng, luận văn điểm qua một số đặc điểm đáng lưu ý của mạng
IP có thể ảnh hưởng tới việc truyền hình.
13
CHƯƠNG 3:
ĐÁNH GIÁ HIỆU NĂNG CỦA HEVC/H.265
TRONG KỊCH BẢN TRUYỀN HÌNH QUA MẠNG IP
3.1.
Giới thiệu chung
Trong chương 3, một số mô hình mô phỏng sẽ được xây dựng để đánh giá hiệu
năng của HEVC/H.265. Kết quả nhận được sẽ được so sánh với chuẩn nén video tiền
nhiệm H.264/AVC. Các video được sử dụng để truyền dẫn trong kịch bản này là các
video yuv chưa qua xử lý với nhiều độ phân giải và độ chi tiết khác nhau. Tất cả video
đều sử dụng dải động chuẩn với độ sâu màu bằng 8.
Bảng 3.1
Thông số kĩ
Các video mẫu được sử dụng trong bài đánh giá
Traffic and
Mobcal
Sun flower
Blue Sky
Độ phân
720p
1080p
1080p
4K
giải
(1280×720)
(1920×1080)
(1920×1080)
(3840×2160)
Độ sâu màu
8
8
8
8
4:2:0
4:2:0
4:2:0
4:2:0
50
25
25
30
504
500
217
300
thuật
Lấy mẫu
màu
Tốc độ
khung hình
Số khung
hình
Video mô tả Video
mô
Building
tả Video mô tả Video
mô
tả
một quyển lịch một bông hoa quang cảnh một đường phố
Mô tả bức
tranh
với hình ảnh hướng
dương. bầu trời với với nhiều làn xe.
chi tiết của con Một con ong tại tán cây. Góc Xe
tàu Vasa. Góc tâm của bông quay
quay di chuyển hoa. Góc quay chuyển
ô
di chuyển
tô
di
chậm
với trong các làn.
14
chậm từ trên cố định. Mức độ tốc độ trung Dọc
xuống
dưới. chi tiết ở mức bình
cuối trung bình.
Phần
chiều
hai
bên
thuận đường là nhiều
kim tòa
nhà
video là một
đồng
đoàn
cao
Mức độ chi cố định.
tàu
đồ
hồ. tầng. Góc quay
chơi di chuyển
tiết ở mức
nhanh từ phải
thấp
sang trái. Mức
độ chi tiết cao.
3.2.
Mô hình và kịch bản mô phỏng
3.2.1.
Kịch bản mô phỏng thứ nhất
Hiệu năng của HEVC sẽ được kiểm nghiệm qua hai bài đánh giá. Bài đánh giá
đầu tiên dựa trên tham số lượng tử QP được giữ cố định đối với từng đoạn video. Một
vài giá trị QP sẽ được chọn để làm tăng số mẫu phục vụ cho việc đánh giá kết quả.
Các giá trị QP được cân nhắc giữa mỗi mô phỏng để cân bằng về mặt chất lượng
(tham số PSNR) giữa hai chuẩn mã hóa HEVC và H.264/AVC. Đầu tiên, giá trị PSNR
sẽ được xác định dựa trên chuẩn mã hóa HEVC, các mẫu mã hóa bằng H.264/AVC
sẽ được tinh chỉnh để phù hợp với tham số chất lượng trên chuẩn mã hóa HEVC.
Hình 3.1 Mô hình mô phỏng trong bài đánh giá thứ hai
15
3.2.2.
Kịch bản mô phỏng thứ hai.
Bài đánh giá thứ hai là một kịch bản truyền dẫn qua môi trường IP/UDP được
xây dựng như Hình 3.1. Tốc độ bit được tinh chỉnh để trong điều kiện thường, đoạn
video được phát không bị mất gói. Trong bài đánh giá này sử dụng phần mềm
FFMPEG [16] để mã hóa, giải mã, đóng gói, và thực hiện phát trực tuyến. Tương tự
như bài đánh giá trước, giá trị PSNR sẽ được tinh chỉnh trước để đạt được sự cân
bằng giữa 2 bộ mã hóa HEVC và H.264/AVC. Sau khi được mã hóa, luồng dữ liệu
sẽ được đóng gói bằng mpegts, trước khi được đóng vào gói tin udp và truyền đi theo
phương thức multicast.
Để đánh giá khả năng che giấu lỗi của các bộ mã hóa, chúng ta cần một kênh
truyền bị mất gói. Trong bài mô phòng này, quá trình rớt gói được mô phỏng với sự
trợ giúp của phần mềm iptables [17]
3.3.
Kết quả phân tích, đánh giá và khuyến nghị
3.3.1.
Kết quả phân tích, đánh giá và khuyến nghị của bài mô phỏng thứ nhất
Trong phần này, kết quả của các hai bài mô phỏng sẽ được trình bày. Trong
bài đánh giá đầu tiên, hai tiêu chí được đánh giá là hiệu năng nén và độ phức tạp.
Hình 3.2 Đường cong tỉ lệ giữa HEVC và H.264 trong video 720p
16
Hình 3.3 Đường cong tỉ lệ giữa HEVC và H.264 trong video 1080p
Hình 3.4 Đường cong tỉ lệ giữa HEVC và H.264 trong video 4K
17
Hình 3.5 Thời gian nén giữa HEVC và H.264/AVC
Hình 3.6 Thời gian giải nén giữa HEVC và H.264/AVC
Hiệu quả nén là một yêu cầu cơ bản nhất đối với mọi chuẩn mã hóa. Trong
Hình 3.2, Hình 3.3, Hình 3.4 thể hiện một đường cong biến dạng tỷ lệ cho cả hai tiêu
chuẩn HEVC và H.264/AVC.Từ những hình vẽ này, ta có thể nhận thấy một khoảng
cách hiệu quả nén đáng chú ý giữa hai tiêu chuẩn. Điểm đáng chú ý là HEVC thể hiện
được sự hiệu quả đối với độ phân giải 4K.
- Xem thêm -