ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
LÊ HÙNG DŨNG
XÂY DỰNG ỨNG DỤNG TRUYỀN VIDEO TRÊN THIẾT BỊ CẦM TAY
(PDA) QUA MÔI TRƯỜNG MẠNG KHÔNG DÂY
LUẬN VĂN THẠC SĨ
Hà Nội- 2006
ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
LÊ HÙNG DŨNG
XÂY DỰNG ỨNG DỤNG TRUYỀN VIDEO TRÊN THIẾT
BỊ CẦM TAY (PDA) QUA MÔI TRƯỜNG MẠNG KHÔNG
DAY
Luận Văn TS:Công nghệ TT
Mã số: 0.01.10
Người Hướng Dẫn :
Hà Nội- 2006
1
MỤC LỤC
THUẬT NGỮ .............................................................................................................3
DANH SÁCH BẢNG BIỂU .......................................................................................5
DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ .....................................................................6
MỞ ĐẦU .....................................................................................................................8
CHƢƠNG 1: TỔNG QUAN VỀ NÉN VIDEO........................................................10
1.1 Giới thiệu về nén Video .................................................................................. 10
1.1.1 Giới thiệu ................................................................................................. 10
1.1.2 Tại sao lại phải nén Video ....................................................................... 13
1.1.3 Nén Video ................................................................................................ 14
1.2 Các chuẩn nén Video hiện đại ........................................................................ 15
1.2.1 MPEG 1 ................................................................................................... 15
1.2.2 MPEG 2 ................................................................................................... 19
1.2.3 MPEG 4 ................................................................................................... 24
1.2.4 H.261 ....................................................................................................... 34
1.2.5 H.263 ....................................................................................................... 36
1.2.6 H.264 ....................................................................................................... 45
CHƢƠNG 2: STREAMING VIDEO .......................................................................50
2.1 Tổng quan về Streaming Media ...................................................................... 50
2.1.1 Lịch sử ..................................................................................................... 50
2.1.1 Băng thông và dung lƣợng lƣu trữ streaming.......................................... 51
2.2 Tổng quan về Streaming Video ...................................................................... 52
2.2.1 Streaming Video là gì? ............................................................................ 52
2.2.2 Tại sao phải sử dụng Streaming Video? .................................................. 53
2.2.3 Các phƣơng thức Streaming .................................................................... 54
2.2.4 Mô hình Streaming .................................................................................. 56
2.3 Các giao thức Streaming Video ...................................................................... 58
2.3.1 Giao thức truyền thời gian thực (RTP) .................................................... 58
2.3.1 Giao thức điều khiển truyền thời gian thực (RTCP) ............................... 60
2.4 Streaming Video trên mạng không dây .......................................................... 61
2
2.4.1 Video Streaming qua một kết nối không dây .......................................... 61
2.4.2 Nâng cao chất lƣợng Streaming Video qua kết nối không dây ............... 62
CHƢƠNG 3: XÂY DỰNG CHƢƠNG TRÌNH ỨNG DỤNG .................................65
3.1 Thiết bị hỗ trợ kỹ thuật số cá nhân - PDA ...................................................... 65
3.1.1 Tổng quan về PDA? ................................................................................ 65
3.1.2 Lịch sử phát triển ..................................................................................... 65
3.1.3 Đặc điểm của thiết bị PDA ...................................................................... 66
3.1.4 Hệ điều hành ............................................................................................ 67
3.2 Giao thức H.323 .............................................................................................. 68
3.2.1 Tổng quan về H.323 ................................................................................ 68
3.2.2 Các thành phần của H.323 ....................................................................... 69
3.2.3 Các giao thức đƣợc tham chiếu bởi H.323 .............................................. 75
3.2.4 Ƣu điểm của H.323.................................................................................. 75
3.3 Mạng không dây ............................................................................................. 76
3.3.1 Giới thiệu ................................................................................................. 76
3.3.2 Lịch sử phát triển ..................................................................................... 76
5.3.3 Lợi ích của mạng không dây ................................................................... 77
3.3.4 Nhƣợc điểm của mạng không dây ........................................................... 78
3.3.5 Kiến trúc của một mạng không dây........................................................ 79
3.3.6 Các kiểu mạng không dây ....................................................................... 81
3.3.7 Các chuẩn mạng không dây hiện đại ....................................................... 82
3.4 Xây dựng chƣơng trình thử nghiệm ................................................................ 83
3.4.1 Yêu cầu chung ......................................................................................... 83
3.4.2 Mô hình kiến trúc của chƣơng trình ........................................................ 83
3.4.2 Đánh giá kết quả ...................................................................................... 91
KẾT LUẬN ...............................................................................................................92
Những kết quả thu đƣợc........................................................................................ 92
Những hƣớng phát triển tiếp theo ......................................................................... 93
TÀI LIỆU THAM KHẢO .........................................................................................94
3
THUẬT NGỮ
AP
Điểm truy cập không dây
API
Application Programming Interface – giao diện lập trình ứng dụng hỗ trợ các hàm, các lớp viết sẵn của hệ thống.
ATM
Phƣơng thức truyền đồng bộ đƣợc sử dụng trong truyền thông
AVI
Một định dạng đa phƣơng tiện do Microsoft đƣa ra
BSS
Bộ dịch vụ cơ sở
CD
Đĩa quang ghi dữ liệu
CIF
Một định dạng hình ảnh màu – Common Intermediate Format
CIF
Định dạng ảnh - Common Intermediate Format
CODEC
Một thiết bị hay chƣơng trình mã hóa và giải mã dữ liệu số
DCT
Hàm chuyển cosin rời rạc
DSL
Là công nghệ phổ biến truyền dữ liệu số hóa qua mạng có dây
DVD
Đĩa Video quang chất lƣợng cao
H.261
Một chuẩn nén Video
H.263
Một chuẩn nén Video
H.264
Một chuẩn nén Video
HTTP
Một giao thức truyền và nhận thông tin trên WWW
IEEE
Viện Công nghệ điện và điện tử
IETF
Tổ chức kỹ thuật Internet (Internet Engineering Task Force)
IP
Giao thức Internet; địa chỉ mạng
ISDN
Mạng dịch vụ tích hợp kỹ thuật số
ISO
Tổ chức tiêu chuẩn quốc tế
ITU
Hiệp hội Viễn thông quốc tế
JPEG
Một định dạng ảnh hay một chuẩn nén ảnh chụp phổ biến
LAN
Mạng cục bộ
MCU
Bộ đa điều khiển
4
MP3
Một định dạng âm thanh – Âm thanh MPEG-1 Lớp 3
MPEG
Nhóm chuyên gia hình ảnh chuyển động, một ủy ban của ISO/IEC
MPEG-1
Chuẩn mã hóa đa phƣơng tiện
MPEG-2
Chuẩn mã hóa đa phƣơng tiện
MPEG-4
Chuẩn mã hóa đa phƣơng tiện
PDA
Thiết bị hỗ trợ kỹ thuật cá nhân
QCIF
Định dạng ảnh – Quarter Common Intermediate Format
QoS
Chất lƣợng dịch vụ
RTCP
Giao thức điều khiển truyền thời gian thực
RTP
Giao thức truyền thời gian thực
RTSP
Giao thức Streaming thời gian thực
STD
Chuẩn
TCP
Giao thức điều khiển truyền dữ liệu
UDP
Giao thức gói dữ liệu ngƣời dùng
VCD
Đĩa quang Video
VHS
Hệ thống Video gia đình
WLAN
Mạng cục bộ không dây
5
DANH SÁCH BẢNG BIỂU
Bảng 1: Các mô tả MPEG-2......................................................................................21
Bảng 2: Các chuẩn mạng không dây hiện đại ...........................................................82
6
DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ
Hình 1-1: Khung hình Video (ví dụ về các vùng đồng nhất)....................................11
Hình 1-2: Khung hình Video (nền đã đƣợc lọc –filter) ............................................11
Hình 1-3: Khung hình Video 2..................................................................................12
Hình 1-4: Bộ mã hóa / Giải mã (CODEC) ................................................................14
Hình 1-5: Tƣơng quan không gian và thời gian trong một đoạn video ....................15
Hình 1-6: Nguyên mẫu ISO/ bộ giải mã IEC 11172 .................................................17
Hình 1-7: Mẫu cấu trúc hình ảnh theo thời gian. ......................................................18
Hình 1-8: Cấu trúc cơ bản của bộ mã hóa âm thanh. ................................................19
Hình 1-9: Mô hình của các hệ thống MPEG-2 .........................................................20
Hình 1-10: Cấu trúc của một khối dữ liệu âm thanh MPEG-2 .................................22
Hình 1-11: Mô hình tham chiếu DSM-CC................................................................23
Hình 1-12: Cấu hình tham chiếu cho Giao diện thời gian thực ................................24
Hình 1-13: Ví dụ vể một cảnh MPEG-4 ...................................................................27
Hình 1-14: Mô hình lớp hệ thống MPEG-4 ..............................................................28
Hình 1-15: Quan hệ giữa các phiên bản MPEG-4 ....................................................31
Hình 1-16: Bộ mã hóa H.261 ....................................................................................35
Hình 1-17: Bộ giải mã H.261 ....................................................................................36
Hình 1-18: Sơ đồ khối codec của H.263 ...................................................................38
Hình 1-19: Minh họa một hệ thống mã hóa/giải mã video .......................................39
Hình 1-20: Bộ mã hóa H.263 ....................................................................................40
Hình 1-21: Bộ giải mã H.263 ....................................................................................42
Hình 2- 1: Kiến trúc của một ứng dụng truyền dữ liệu thời gian thực......................61
Hình 3-1: Minh họa một thiết bị PalmPilot sử dụng hệ điều hành Palm OS ............68
Hình 3-2: Giao thức H.323........................................................................................72
Hình 3-3: H.323/PSTN Gateway ..............................................................................73
7
Hình 3-4: H.323/ISDN Gateway ...............................................................................73
Hình 3-5: Vùng H.323...............................................................................................74
Hình 3-6: Kiến trúc mạng không dây........................................................................79
Hình 3-7: Mạng không dây ngang hàng hoặc ad-hoc ...............................................81
Hình 3-8: Mô hình kiến trúc chƣơng trình thử nghiệm.............................................84
Hình 3-9: Mô hình kế thừa của lớp H.323 ................................................................85
Hình 3- 10: Cây kế thừa của lớp Kênh H323............................................................86
Hình 3-11: Cây kế thừa của lớp H323Codec ............................................................86
Hình 3-12: Cây kế thừa của lớp H323SignalPDU ....................................................87
Hình 3-13: Cây kế thừa lớp PSocket .........................................................................89
8
MỞ ĐẦU
Hiện nay, truyền video trong các môi trƣờng mạng tốc độ bit thấp ngày càng trở nên
phổ biến và trở thành yêu cầu cấp thiết trong một số lĩnh vực của xã hội. Một số
ứng dụng điển hình có thể kể đến là: ứng dụng hội nghị truyền hình qua mạng
intranet và internet (Video Conferencing) đƣợc sử dụng trong công tác điều hành;
ứng dụng chẩn đoán hình ảnh trong y học (Telemedicine); các ứng dụng truyền
video thời gian thực đƣợc sử dụng trong lĩnh vực đào tạo trực tuyến …
Sự ra đời và phát triển mạnh mẽ của công nghệ không dây (wireless) và các thiết bị
cầm tay (nhƣ thiết bị hỗ trợ kỹ thuật cá nhân PDA, máy tính cầm tay Pocket PC, các
điện thoại di động có sử dụng hệ điều hành …) đã mở ra một cách thức khai thác
công nghệ mới, khác với cách thức truyền thống (làm việc tại văn phòng và sử dụng
các mạng có dây để khai thác các dịch vụ) và thật sự đem lại nhiều sự thuận tiện và
hiệu quả cho ngƣời sử dụng. Chỉ với một thiết bị cầm tay hỗ trợ công nghệ kết nối
mạng không dây, ngƣời dùng có thể làm việc, duyệt web và khai thác các dịch vụ
giải trí tại bất kỳ nơi nào, trong đó các ứng dụng và dịch vụ video đóng một vai trò
quan trọng.
Tính cấp thiết của đề tài: truyền video qua các môi trƣờng mạng tốc độ bit
thấp là một công nghệ hiện đại, có ứng dụng trong nhiều lĩnh vực, nổi cộm là
các ứng dụng hội nghị truyền hình, các dịch vụ giải trí, đào tạo trực tuyến …
Đặc biệt đối với các ứng dụng trên các thiết bị hỗ trợ kỹ thuật cầm tay chạy
trong môi trƣờng mạng không dây.
Ý nghĩa khoa học: Nghiên cứu truyền video trên thiết bị cầm tay qua môi
trƣờng mạng không dây cho phép xây dựng đƣợc các ứng dụng và dịch vụ
hiệu quả. Kết quả thu đƣợc sẽ là cơ sở cho việc phát triển một số ứng dụng
đƣợc đánh giá là sẽ rất phổ biến trong tƣơng lai.
Phạm vi nghiên cứu: Luận văn nghiên cứu phần cơ sở lý thuyết của các
phƣơng pháp nén video, cơ sở lý thuyết về Streaming video và chuẩn công
9
nghệ về tổ chức, truyền dữ liệu video qua các hệ thống mạng tốc độ bit thấp
với nhiều ngƣời dùng tham gia. Đặc biệt là trên môi trƣờng mạng không dây
với thiết bị cầm tay PDA.
Kết quả đạt được: Luận văn trình bày cơ sở lý thuyết của các phƣơng pháp nén
video nhƣ các chuẩn MPEG, chuẩn H.26x; Streaming video và chuẩn H.323.
Đây là các lý thuyết cơ sở cho việc xây dựng các ứng dụng truyền video. Luận
văn cũng đã xây dựng đƣợc chƣơng trình thử nghiệm truyền video thời gian
thực kết nối hai thiết bị cầm tay (Pocket PC) qua môi trƣờng mạng không dây.
Nội dung luận văn bao gồm:
-
Chương 1. Tổng quan về nén Video – Trình bày về sự cần thiết phải
nén video và các lý thuyết về các chuẩn nén Video hiện đại.
-
Chương 2. Video streaming – Trình bày các khái niệm về video
streaming, các giao thức truyền dữ liệu thời gian thực. Đây là các cơ sở
cho việc xây dựng ứng dụng truyền dữ liệu video trong các ứng dụng và
dịch vụ trên mạng.
-
Chương 3. Xây dựng chương trình ứng dụng – Giới thiệu về các
công nghệ thiết bị PDA, giao thức chuẩn H.323 và xây dựng kiến trúc
chƣơng trình thử nghiệm.
-
Kết luận - Cho biết những kết quả, hạn chế và hƣớng phát triển của
luận văn.
10
CHƢƠNG 1: TỔNG QUAN VỀ NÉN VIDEO
1.1 Giới thiệu về nén Video
1.1.1 Giới thiệu
Với sự phát triển mạnh mẽ của công nghệ thông tin nhƣ hiện nay, đặc biệt là khả
năng kết nối mạng internet (qua mạng có dây và không dây) với băng thông ngày
càng nâng cao. Bên cạnh đó, nhu cầu sử dụng các dịch vụ và ứng dụng âm thanh,
hình ảnh và video ngày càng nhiều, điều này nói lên đƣợc tầm quan trọng của việc
tối ƣu hóa chất lƣợng dữ liệu đa phƣơng tiện khi đƣợc truyền đi trên mạng, trong đó
nén dữ liệu video là một trong những việc làm hết sức cần thiết.
Việc nén dữ liệu video đem lại hai ƣu điểm sau:
-
Nâng cao khả năng sử dụng video số hóa trong các môi trƣờng trao đổi và
lƣu trữ. Ví dụ, với tốc độ đƣờng truyền internet nhƣ hiện nay vẫn không đủ
để hỗ trợ thực hiện dữ liệu video không nén theo thời gian thực (thậm chí
trong cả tƣờng hợp video ở tốc độ và kích thƣớc khung hình thấp) trong khi
đó một đĩa DVD chỉ có thể lƣu đƣợc một đoạn video có độ dài vài giây với
chất lƣợng hình ảnh và độ phân giải của Tivi.
-
Nâng cao hiệu quả sử dụng các tài nguyên lƣu trữ và truyền video. Nếu có
một kênh truyền tốc độ cao, chúng ta có thể thực hiện truyền video nén với
độ phân giải và chất lƣợng cao hoặc có thể truyền trên nhiều kênh thay vì
đơn kênh.
Với các ƣu điểm trong lƣu trữ và truyền dữ liệu, nén dữ liệu video đƣợc coi là
một thành phần quan trọng trong hầu hết tất các các ứng dụng và dịch vụ đa
phƣơng tiện hiện nay và trong những năm tiếp theo.
11
Hình 1-1: Khung hình Video (ví dụ về các vùng đồng nhất)
Hình 1-2: Khung hình Video (nền đã đƣợc lọc –filter)
12
Hình 1-3: Khung hình Video 2
Một tín hiệu mang thông tin có thể đƣợc nén bằng cách bỏ đi các bit dƣ thừa. Trong
một hệ thống nén không mất dữ liệu, các bit dƣ thừa thống kê sẽ bị loại bỏ do đó tín
hiệu ban đầu có thể đƣợc khôi phục lại một cách hoàn hảo tại điểm nhận. Tuy
nhiên, tại thời điểm hiện nay, hầu hết các phƣơng thức nén không mất dữ liệu hình
ảnh và video chỉ đạt kết quả vừa phải, không có khả năng khôi phục 100% so với
tín hiệu ban đầu. Hầu hết các kỹ thuật nén video đƣợc sử dụng hiện nay đều dựa
trên nguyên tắc mất dữ liệu khi nén. Mục đích của các thuật toán nén video là nâng
cao hiệu năng nén trong khi mong muốn giảm thiểu sự méo và giảm chất lƣợng
trong quá trình nén. Các thuật toán nén thực hiện loại bỏ phần dƣ thừa trong các
vùng dữ liệu theo thời gian, không gian và/hoặc tần suất xuất hiện. Hình 1-1 thể
hiện ví dụ về một khung video đơn. Với các vùng đƣợc khoanh, ít có sự biến đổi về
nội dung hình ảnh và do đó đây là sự dƣ thừa về mặt không gian của dữ liệu. Hình
1-2 thể hiện cùng khung hình sau khi vùng ảnh nền đã đƣợc lọc (làm mịn), loại bỏ
một số nội dung với tần suất xuất hiện cao. Hệ thần kinh và mắt ngƣời rất nhạy cảm
đối với các nội dung có tần suất xuất hiện thấp hơn và do đó hình ảnh vẫn có thể
đƣợc nhận biết trong khi một số nhiều thông tin đã đƣợc loại bỏ [6]. Hình 1-3 thể
hiện khung hình tiếp theo trong đoạn video. Hình ảnh minh họa này đƣợc lấy từ một
13
nguồn máy quay camera với tỷ lệ 25 khung hình/giây và do đó có rất ít thay đổi
giữa hai khung hình trong một khoảng thời gian 1/25 giây. Điều này cho thấy rất rõ
ràng về sự dƣ thừa của dữ liệu. Bằng cách loại bỏ các dữ liệu dƣ thừa (nhƣ dữ liệu
không gian, tần suất xuất hiện và/hoặc thời gian), chúng ta có thể nén dữ liệu một
cách đáng kể. Hơn nữa còn có thể nén video bằng cách mã hóa dữ liệu bằng lƣợc đồ
mã entropy nhƣ mã Huffman hoặc mã số học.
Nén hình ảnh và video đã trở thành một vấn đề nóng bỏng trong các nghiên cứu và
phát triển trong vòng hai mƣơi năm nay và cũng đã có rất nhiều các thuật toán và hệ
thống khác nhau đƣợc xây dựng để thực hiện điều này. Một vấn đề đƣợc đặt ra là
làm thế nào có thể thống nhất đƣợc cách thức nén/giải nén, nâng cao khả năng sử
dụng các sản phẩm từ nhiều nhà sản xuất khác nhau cũng nhƣ giao tiếp, trao đổi với
nhau một cách hiệu quả. Các tiêu chuẩn quốc tế cho nén hình ảnh và video đã đƣợc
ra đời nhƣ JPEG, MPEG và các chuẩn H.26x
1.1.2 Tại sao lại phải nén Video
Do dữ liệu video đƣợc ghi trên các phƣơng tiện lƣu trữ nhƣ đĩa CD và DVD hoặc
truyền trên mạng, kích thƣớc của dữ liệu video số hóa là một vấn đề quan trọng
trong công nghệ đa phƣơng tiện. Mặt khác, do sự đòi hỏi băng thông lớn của các tín
hiệu video thô (raw video), các ứng dụng video khi chạy sẽ chiếm rất nhiều tài
nguyên về băng thông nếu các khung hình video đƣợc truyền ở dạng không nén. Ví
dụ, giả sử rằng một khung hình video đƣợc biểu diễn trọng một lƣới rời rạc các
điểm ảnh với độ phân giải 176 điểm ảnh trên một dòng và 144 dòng trên một hình.
Nếu màu của hình ảnh đƣợc biểu diễn bởi hai khung màu, và mỗi khung có độ phân
giải một nửa của hình ảnh chói thì mỗi khung video sẽ cần xấp xỉ 38 kbyte để biểu
diễn nội dung của nó trong khi mỗi thành phần màu và độ chói đƣợc biểu diễn bởi
8-bit. Nếu các khung video đƣợc truyền ở dạng không nén với tỷ lệ 25 khung hình /
giây thì tốc độ dữ liệu thô cho một cảnh video sẽ vào khoảng 7.6 Mbit/giây và một
đoạn video có độ dài một phút sẽ yêu cầu băng thông là 57 Mbyte. Đối với một định
dạng video CIF ở độ phân giải 352x288 điểm ảnh, với 8-bit đối với mỗi thành phần
14
màu hoặc độ chói và độ phân giải một nửa thì mỗi hình ảnh sẽ cần 152 kbyte bộ
nhớ để biểu diễn nội dung số hóa. Với cùng tỷ lệ hình ảnh nhƣ trên, tốc độ dữ liệu
video thô cho một cảnh vào khoảng 30 Mbit/s và một đoạn phim có độ dài một phút
sẽ yêu cầu băng thông khoảng 225 Mbyte. Do đó, dữ liệu video số hóa cần phải
đƣợc nén trƣớc khi truyền để bảo đảm yêu cầu băng thông tối thiều của các dịch vụ
hoặc ứng dụng đa phƣơng tiện [1].
1.1.3 Nén Video
Nén là một quá trình “cô đọng” dữ liệu thành dữ liệu mới có tổng số bit nhỏ hơn.
Nén video (mã hóa video) là một quá trình “cô đọng” một cảnh video số hóa với số
lƣợng bit nhỏ hơn. Video số hóa “thô” hay không nén thông thƣờng yêu cầu một tỷ
lệ bit lớn (khoảng 216 Mbits cho một giây video không nén với chất lƣợng TV) và
do đó nén dữ liệu là cần thiết cho việc lƣu trữ và truyền tín hiệu video.
Nén dữ liệu đòi hỏi có hai hệ thống, bộ nén (bộ mã hóa) và bộ giải nén (bộ giải mã).
Bộ mã hóa chuyển đổi dữ liệu nguồn thành một mẫu nén (giảm bớt số lƣợng bit) ƣu
tiên cho việc truyền hoặc lƣu trữ và bộ giải mã có nhiệm vụ chuyển đổi từ mẫu nén
về dạng biểu diễn ban đầu của dữ liệu video. Cặp bộ mã hóa/giải mã thông thƣờng
đƣợc mô tả nhƣ một CODEC (enCOder/ DECoder) (Hình 1-4).
Hình 1-4: Bộ mã hóa / Giải mã (CODEC)
Hầu hết các phƣơng thức mã hóa đều sử dụng cả dữ liệu không gian và thời gian dƣ
thừa trong khi mã hóa. Trong một vùng thời gian, thƣờng có độ tƣơng quan cao
(giống nhau) giữa các khung video đƣợc chụp gần nhƣ trong cùng một thời điểm.
Các khung liền kề nhau về mặt thời gian thƣờng có độ tƣơng quan cao, đặc biệt nếu
tốc độ mẫu theo thời gian (tỷ lệ khung hình trên giây) lớn. Trong một vùng theo
không gian, thông thƣờng có độ tƣơng quan cao giữa các điểm ảnh (các mẫu) ở gần
15
nhau. Ví dụ. giá trị của các mẫu liền kề nhau thông thƣờng rất giống nhau (Hình 15)
Hình 1-5: Tƣơng quan không gian và thời gian trong một đoạn video
1.2 Các chuẩn nén Video hiện đại
1.2.1 MPEG 1
MPEG-1 định nghĩa một nhóm các mã âm thanh - hình ảnh (AV – Audio và Video)
và các chuẩn nén đƣợc công nhận bởi MPEG (Nhóm chuyên gia hình ảnh động Moving Picture Experts Group) [20]. MPEG-1 video thƣờng đƣợc dùng cho định
dạng Video CD (VCD). Độ phân giải và tốc độ bit của chuẩn VCD bằng xấp xỉ so
với băng từ VHS. Âm thanh MPEG-1 Lớp 3 là tên đầy đủ của định dạng âm thanh
rất phổ biến MP3 (MPEG-1 audio layer 3). Ngày nay, với sự phát triển nhanh của
công nghệ phần cứng của các thiết bị mã hóa, ngày càng có nhiều định dạng âm
thanh tiên tiến đƣợc phát triển nhƣ MPEG-2 và MPEG-4. Các định dạng mới này
16
ngày càng phức tạp và yêu cầu các thiết bị phần cứng cao hơn, tuy nhiên chúng tỏ ra
rất hiệu quả về mặt chất lƣợng.
MPEG-1 bao gồm một số thành phần nhƣ sau:
1. Phần 1: Đồng bộ và trộn video - âm thanh
2. Phần 2: Codec nén cho các tín hiệu video không kết hợp.
3. Phần 3: Codec nén cho mã hóa tín hiệu âm thanh. Chuẩn định nghĩa mã hóa
âm thanh MPEG ở ba mức một cách phức tạp:
a. MP1 hoặc MPEG-1 Phần 3 Lớp 1 (MPEG-1 Audio Layer 1)
b. MP2 hoặc MPEG-1 Phần 3 Lớp 2 (MPEG-1 Audio Layer 2)
c. MP3 hoặc MPEG-1 Phần 3 Lớp 3 (MPEG-1 Audio Layer 3)
4. Phần 4: Các thủ tục kiểm thử.
5. Phần 5: Phần mềm tham chiếu.
Trong đó:
Phần 1 có nhiệm vụ đánh địa chỉ các vấn đề xảy ra khi kết hợp một hoặc nhiều
dòng dữ liệu (data stream) từ các phần âm thanh và Video của chuẩn MPEG-1 với
thông tin thời gian để tạo thành một dòng đơn nhƣ trong Hình 1-6 dƣới đây. Đây là
một chức năng quan trọng vì khi kết hợp thành một dòng đơn, tất cả dữ liệu sẽ trong
một mẫu, điều này sẽ rất phù hợp với việc lƣu trữ và truyền dữ liệu số.
17
Hình 1-6: Nguyên mẫu ISO/ bộ giải mã IEC 11172
Phần 2 xác định một biểu diễn mã hóa có thể đƣợc sử dụng cho việc nén video.
Có một số kỹ thuật đƣợc sử dụng để nén dữ liệu với tỷ lệ cao. Đầu tiên sẽ lựa chọn
một độ phân giải không gian thích hợp cho tín hiệu. Thuật toán đƣợc dùng sẽ sử
dụng khối chuyển động bù để làm giảm các dữ liệu dƣ thừa về mặt thời gian. Bù
chuyển động đƣợc sử dụng cho việc ƣớc lƣợng hình ảnh hiện tại từ hình ảnh trƣớc
đó, và cho việc dự đoán hình ảnh hiện tại từ một hình tiếp theo, hoặc sử dụng cho
việc ƣớc lƣợng nội suy từ các hình ảnh trƣớc và sau. Tín hiệu sai, lỗi dự đoán sẽ
đƣợc nén bằng cách sử dụng phép biến đổi cosin rời rạc (DCT) để loại bỏ tƣơng
quan không gian và sau đó sẽ đƣợc lƣợng tử. Cuối cùng, các vector chuyển động
đƣợc kết hợp với thông tin DCT và đƣợc mã hóa bằng cách sử dụng Mã độ dài biến
thiên.
Hình dƣới đây minh họa khả năng kết hợp của ba kiểu hình ảnh chính đƣợc sử dụng
trong chuẩn.
18
Hình 1-7: Mẫu cấu trúc hình ảnh theo thời gian.
Phần 3 xác định một biểu diễn mã hóa đƣợc sử dụng cho nén âm thanh – cả âm
dạng mono và stereo. Thuật toán đƣợc minh họa trong Hình 1-8 dƣới đây. Các mẫu
âm thanh đầu vào đƣợc đƣa vào bộ mã hóa. Bộ đánh địa chỉ (mapping) sẽ tạo ra một
mẫu con đã đƣợc lọc từ dòng âm thanh đầu vào. Mô hình hệ tâm lý âm thanh
(psychoacoustic model) tạo ra một tập các dữ liệu để điều khiển bộ lƣợng tử và mã
hóa. Khối lƣợng tử và mã hóa tạo ta tập các ký hiệu mã hóa từ mẫu dữ liệu đầu vào
đã đƣợc đánh địa chỉ. Khối đóng gói khung (frame packing) lắp ráp các dòng bit từ
dữ liệu đầu ra của các khối khác đồng thời thêm một số thông tin khác (ví dụ, tƣơng
quan lỗi) nếu cần thiết.
- Xem thêm -