Tài liệu Báo cáo thực tập-truyền hình số

.PDF

841

quangtran Báo vi phạm

Tải xuống 98

Mô tả:

A- Truyền hình số 1. Giới thiệu chung Ta đều biết truyền hình màu gồm 3 hệ: NTSC, PAL, SECAM, phát triển trên cơ sở lý thuyết 3 màu, xuất hiện vào những thập kỉ 50, 60 đã tạo nên một bước ngoặt lớn trong quá trình phát triển của công nghệ truyền hình. Cả 3 hệ này đều sử dụng các tín hiệu thành phần là tín hiệu chói (E’Y) và hai tín hiệu màu (E’R-E’Y và E’B-E’Y). Điều khác nhau cơ bản giữa 3 hệ thống này là phương pháp điều chế tín hiệu màu, tần số sóng mang màu và phương thức ghép kênh. Trong những năm gần đây, công nghệ truyền hình đang chuyển sang một bước ngoặt mới- quá trình chuyển đổi công nghệ từ Analog sang Digital (từ Truyền hình tương tự sang Truyền hình số). Truyền hình số là phương pháp truyền hình hoàn toàn mới. Trên thế giới, các nhà điều hành cáp, vệ tinh, trên mặt đất đều đang chuyển động đến môi trường số. Hầu hết các nhà phân tích công nghiệp đều dự báo việc chuyển dịch lên Truyền hình số là một sự tiến hóa hơn là một cuộc cách mạng. Truyền hình số đã làm thay đổi cuộc sống của hàng trăm triệu gia đình trên thế giới. Các công ty cho rằng, sự hội tụ giữa máy tính cá nhân, máy thu hình (TV sets) và Internet đã bắt đầu, và điều đó dẫn đến sự chuyển hóa cực đại về máy tính. Đối với người tiêu dùng, kỷ nguyên mới về số sẽ nâng cao việc xem truyền hình ngang với chất lượng chiếu phim, âm thanh ngang với chất lượng CD, cùng với hàng trăm kênh truyền hình mới và nhiều dịch vụ mới. Truyền hình số cho thuê bao xem được nhiều chương trình truyền hình nhất, với chất lượng cao nhất. Đố với các nhà phát sóng truyền hình, việc chuyển dịch lên truyền hình số sẽ giảm việc sử dụng băng tần/kênh, làm tăng khả năng cung cấp các ứng dụng Internet cho thuê bao và mở ra 1 lĩnh vực mới, các cơ hội về thương mại. Nhiều dịch vụ mới trên cơ sở truyền số sẽ được hình thành • Truy cập Internet các tốc độ • Chơi Games trên mạng với nhiều người • Video theo yêu cầu VOD (Video-on-demand) • Cung cấp các dòng Video và Audio • Các dịch vụ thương mại điện tử • Truyền thanh, truyền hình đa phương tiện(Multimedia) • Đọc báo điện tử • V.v.. Công nghệ truyền hình số đang bộc lộ thế mạnh tuyệt đối so với truyền hình tương tự trên nhiều lĩnh vực: • Có khả năng phát hiện và sửa lỗi • Tính phân cấp (HDTV + SDTV) • Thu di động tốt : người xem dù là ở trên ô tô hay tàu hỏa thì vẫn có thể xem được các chương trình truyền hình do xử lý tốt hiện tượng Doppler ( tần số và bước sóng của các sóng âm, sóng điện từ hay các sóng nói chung bị thay đổi khi mà nguồn phát sóng chuyển động tương đối với người quan sát). • Truyền tải được nhiều loại hình thông tin • Ít nhạy với nhiễu và các dạng méo xảy ra trên đường truyền. Bảo toàn chất lượng đường truyền. ChÊt lîng tÝn hiÖu sè tÝn hiÖu t¬ng tù Kho¶ng c¸ch gi÷a m¸y ph¸t vµ m¸y thu • Có khả năng chống lại can nhiễu của tín hiệu truyền hình tương tự cùng kênh hoặc tín hiệu truyền hình tương tự kênh lân cận. • Tiết kiệm tại nguyên tần số ( phát nhiều chương trình truyền hình trên một kênh truyền hình). Vd: 1 kênh 8 Mhz( trên mặt đất) chỉ truyền được 01 chương trình truyền hình tương tự, song có thể truyền được 4÷5 chương trình truyền hình số đối với hệ thống ATSC, 4÷ 8 chương trình đối với DVB-T ( tùy thuộc vào M-QAM, khoảng bảo vệ và FEC) • Tiết kiệm năng lượng, chi phí khai thác thấp: Công suất phát không cần quá lớn vì cường độ điện trường cho thu số thấp hơn cho thu analog ( độ nhậy máy thu số thấp hơn -30 đến -20dB so với máy thu analog) • Mạng đơn tần(Sfn): cho khả năng thiết lập mạng đơn kênh (đơn tần- Single Frequency Network), nghĩa là nhiều máy phát trên cùng moat kênh sóng. Đây là sự hiệu quả lớn xét về mặt công suất và tần số. • Tín hiệu số dễ xử lý, môi trường quản lý điều khiển và xử lý rất thân thiện với máy tính. • Thị trường đa dạng, có khả năng cung cấp nhiều loại hình dịch vụ. Tuy nhiên, việc chuyển đổi tín hiệu truyền hình tương tự sang truyền hình số cùng gặp phải nhiều vấn đề cần phải xem xét, nghiên cứu thêm. Một quá trình số hóa bao gồm 3 công đoạn: lấy mẫu, lượng tử hóa, số hóa. Tín hiệu Video chuẩn OIRT có tần số nhỏ hơn hoặc bằng 6MHz, để đảm bảo chất lượng tần số lấy mẫu phải lớn hơn 12MHz, với số hóa 8bit/s, để truyền tải đầy đủ thông tin 1 tín hiệu Video thành phần với độ phân giải tiêu chuẩn, tốc độ bit phải hớn hơn 200bit/s. Riêng đối với truyền hình số độ phân giải cao (HDTV) thì tốc độ bit phải lớn hơn 1Gbit/s. Dung lượng này quá lớn, các kênh truyền hình thông thường không có khả năng truyền tải.Có một số vấn đề mấu chốt cần xem cté trong quá trình số hóa tín hiệu truyền hình, bao gồm: • Tần số lấy mẫu • Phương thức lấy mẫu • Tỷ lệ giữa tần số lấy mẫu tín hiệu chói và tín hiệu màu (trong trường hợp số hóa các tín hiệu thành phần) • Nén tín hiệu Video để có thể truyền tín hiệu truyền hình số trên các kênh truyền hình thông thường trong khi vẫn đảm bảo chất lượng tín hiệu theo mục đích sử dụng. 2. Đặc điểm của Truyền hình số 1.1.Yêu cầu về băng tần Tín hiệu số gắn liền với yêu cầu băng tần rộng hơn rất nhiều so với tín hiệu tương tự. Ví dụ đối với tín hiệu tổng hợp yêu cầu tần số lấy mẫu phải bằng 4fSC như đối với hệ NTSC là 14,4MHz. Nếu thực hiện mã hóa 8bit/mẫu, tốc độ dòng bit sẽ là 115,2Mbit/s, độ rộng băng tần khoảng 58MHz. Trong khi đó tín hiệu tương tự cần 1 băng tần là 4,2MHz. Vì vậy biện pháp khắc phục là nén tín hiệu. 1.2.Tỷ lệ tín hiệu trên tạp âm (Signal/Noise) Tỷ lệ S/N trong tín hiệu tương tự có tính chất cộng. Vì vậy tỷ lệ S/N của toàn bộ hệ thống là do cộng các nguồn nhiều thành phần gây ra. Vì vậy S/N của toàn bộ hệ thống nhỏ hơn S/N có tỷ lệ thấp nhất rất nhiều lần. Đối với tín hiệu số nhiễu là các bit lỗi được khắc phục bằng cách sửa mạch lỗi. Khi có quá nhiều bit lỗi, sự ảnh hưởng của nhiễu được làm giảm bằng cách che lỗi, tỷ số S/N của hệ thống sẽ giảm rất ít hoặc không đổi trừ trường hợp tỷ lệ lỗi quá lớn làm cho mạch sửa lỗi mất tác dụng, khi đó dòng bit không còn ý nghĩa tin tức. Ý nghĩa: đây là đặc điểm có ích cho việc sản xuất chương trình truyền hình với các chức năng biên tập phức tạp, cần nhiều lần đọc ghi, việc truyền tín hiệu qua nhiều chặng cũng được thực hiện rất thuận lợi với tín hiệu số mà không làm suy giảm chất lượng tín hiệu hình. 1.3.Méo phi tuyến Tín hiệu số không bị ảnh hưởng bởi méo phi tuyến trong quá trình ghi và truyền. Cũng như đối với tỷ lệ S/N tính chất này rất quan trọng trong quá trình ghi đọc nhiều lần. 1.4.Chồng phổ (Aliasing) Một tín hiệu số được lấy mẫu theo cả chiều ngang và chiều dọc nên có khả năng chồng phổ theo cả hai hướng. Theo chiều dọc, chồng phổ trong hệ thống tương tự và số là như nhau. Độ lớn của méo chồng phổ theo chiều ngang phụ thuộc vào thành phần tần số vượt quá tần số lấy mẫu giới hạn Nyquist. Để ngăn ngừa hiện tượng chồng phổ theo chiều ngang có thể thực hiện bằng cách sử dụng tần số lấy mẫu bằng hai lần tần số cao nhất trong hệ thống tương tự. 1.5.Xử lý tín hiệu Tín hiệu số có thể được chuyển đổi và xử lý tốt các chức năng mà hệ thống tương tự không làm được hoặc gặp nhiều khó khăn. Có thể thao tác các công việc phức tạp mà không làm giảm chất lượng hình ảnh. Khả năng này được tăng cường nhờ khả năng lưu trữ các bit trong bộ nhớ và có thể đọc ra với tốc độ nhanh. Công việc tín hiệu số có thể thực hiện dễ dàng là: sửa lỗi gốc thời gian, chuyển đổi tiêu chuẩn, dựng hậu kì, giảm độ rộng băng tần. 1.6. Khoảng cách giữa các trạm truyền hình đồng kênh Tín hiệu số cho pháp các trạm truyền hình đồng kênh ở 1 khoảng cách gần nhau hơn nhiều so với hệ thống tương tự mà không bị nhiễu. Một phần vì tín hiệu số ít chịu ảnh hưởng của nhiễu đồng kênh, một pầhn là do khả năng thay thế xung hóa và xung đồng bộ bằng các từ mã, nơi mà hệ thống tương tự gây ra nhiễu lớn nhất. 1.7.Hiện tượng Ghosts (bóng ma) Hiện tượng này xảy ra trong hệ thống tương tự do tín hiệu truyền đến máy thu theo nhiều đường. Việc tránh nhiễu đồng kênh của hệ thống số cũng làm giảm đi hiện tượng này trong truyền hình quảng bá. 3. Sơ đồ cấu trúc tổng quát của hệ thống. Sơ đồ khối hệ thống truyền hình số 4. Nguyên lý hoạt động của hệ thống Đầu vào của thiết bị truyền hình số sẽ được tiếp nhận tín hiệu truyền hình tương tự. Bộ biến đổi tín hiệu tương tự thành tín hiệu số (A/D) sẽ biến đổi tín hiệu truyền hình tương tự thành tín hiệu truyền hình số, các tham số và đặc trưng của tín hiệu này được xác định từ hệ thống truyền hình lựa chọn. Tín hiệu truyền hình số tại đầu ra bộ biến đổi A/D được đưa tới bộ mã hóa nguồn, tại nay tín hiệu truyền hình số có tốc độ dòng bit cao sẽ được nén thành dòng bit có tốc độ thấp hơn phù hợp cho từng ứng dụng. Dòng bit tại đầu ra bộ mãi hóa nguồn được đưa tới thết bị phát (mã hóa kênh thông tin và điều chế tín hiệu), truyền tới bên thu qua kênh thông tin. Khi truyền qua kênh thông tin, tín hiệu truyền hình số được mã hóa kênh. Mã hóa kênh đảm bảo chống sai sót, trong tín hiệu trong kênh thông tin khi tín hiệu truyền hình số được truyền đi theo kênh thông tin, các thiết bị biến đổi trên được gọi là bộ điều chế và bộ giải điều chế. Mã hóa trong kênh thông tin được phổ biến không những trong đường thông tin mà trong cả một số khâu của hệ thống, ví dụ như máy ghi hình số, gia công tín hiệu truyền hình số. Tại bên thu, tín hiệu truyền hình số được biến đổi ngược lại với quá trình xử lý tại phía phát. Giải mã tín hiệu truyền hình thực hiện biến đổi tín hiệu truyền hình số thành tín hiệu truyền hình tương tự. Hệ thống truyền hình số sẽ trực tiếp xác định cấu trúc mã hóa và giải mã tín hiệu truyền hình. 5. Một số tiêu chuẩn của truyền hình số hiện nay • Cho đến năm 1997, 3 hệ tiêu chuẩn của truyền hình số mặt đất đã được công bố. Đó là  ATSC (Advance Television System Committee) của Mỹ  DVB-T (Digital Video Broadcasting- Terestrial) của Châu Âu  DIBEG (Digital Broadcasting Expert Group) của Nhật • Mỗi một tiêu chuẩn đều có mặt mạnh và yếu khác nhau. Các cuộc tranh luận liên tiếp nổ ra.Vì vậy nhiều cuộc thử nghiệm quy mô tầm cỡ quốc gia đã được tiến hành với sự tham gia của các cơ quan phát thanh- truyền hình, cơ quan nghiên cứu khoa học và thậm chí là các cơ quan của chính phủ. • Từ đó đã đưa ra kết luận chung về các tiêu chuẩn này như sau:  ATSC – phương pháp điều chế 8-VSB cho tỷ số tín hiệu trên tạp âm... tốt hơn nhng lại không có khả năng thu di động và không thích hợp lắm với các nớc đang sử dụng hệ PAL.  DIBEG có tính phân lớp cao, cho phép đa loại hình dịch vụ, linh hoạt, mềm dẻo, tận dụng tối đa dải thông, có khả năng thu di động nhng không tơng thích với các dịch vụ truyền hình qua vệ tinh, cáp.  DVB-T với phơng pháp điều chế COFDM tỏ ra có nhiều đặc điểm u việt, nhất là đối với các nớc có địa hình phức tạp, có nhu cầu sử dụng mạng đơn tần (SFN - Single Frequency Network) và đặc biệt là khả năng thu di động. Quá trình chuyển đổi truyền hình tương tự sang truyền hình số 6. Đây là hệ thống truyền hình mới mà tất cả các thiết bị kỹ thuật từ Studio cho đến máy thu đều làm việc theo nguyên lý kỹ thuật số. Trong đó, một hình ảnh quang học do camera thu được qua hệ thống ống kính, thay vì được biến đổi thành tín hiệu điện biến thiên tương tự như hình ảnh quang học nói trên (cả về độ chói và màu sắc) sẽ được biến đổi thành một dãy tín hiệu nhị phân (dãy các số 0 và 1) nhờ quá trình biến đổi tương tự_số. Quá trình thực hiện biến đổi này dựa theo nguyên tắc chuyển đổi từng phần và xen kẽ. Quá trình chuyển đổi công nghệ từ truyền hình tương tự sang truyền hình số Khái niệm từng phần và xen kẽ được hiểu là sự xuất hiện dần các camera số gọn nhẹ, các studio số, các phòng phân phối phát sóng số tiến đến một dây truyền sản xuất hoàn toàn số. Mô hình trên cũng cho chúng ta thấy rằng: đến một giai đoạn nào đó, sẽ xuất hiện tình trạng song song cùng tồn tại cả hai hệ thống công nghệ. Đó là thời kỳ bắt đầu ra đời máy phát số đồng thời các máy thu hoàn toàn số và các hộp SETTOP là các hộp chuyển đổi (từ số sang tương tự) dành cho các máy thu thông thường hiện nay. Lí do cho việc chuyển đổi từng phần và xen kẽ là do chi phí tài chính cũng như phải bảo đảm duy trì sản xuất và phát sóng thường xuyên. B- Nén tín hiệu trong truyền hình số 1. Khái niệm chung về nén 1.1. Mục đích nén Với công nghệ hiện nay, các thiết bị đều có dải thông nhất định.Các dòng số tốc độ cao yêu cầu dải thông rất rộng vượt quá khả năng cho phép của thiết bị. Một cách sơ bộ, nén là quá trình làm giảm tốc độ bit của các dòng dữ liệu tốc độ cao mà vẫn đảm bảo chất lợng hình ảnh hoặc âm thanh cần truyền tải. 1.2. Bản chất của nén Khác với nguồn dữ liệu một chiều như nguồn âm, đặc tuyến đa chiều của nguồn hình ảnh cho thấy: nguồn ảnh chứa nhiều sự dư thừa hơn các nguồn thông tin khác. Đó là: ♦ Sự dư thừa về mặt không gian (spatial redundancy): Các điểm ảnh kề nhau trong một mành có nội dung gần giống nhau. ♦ Sự dư thừa về mặt thời gian (temporal redundancy): Các điểm ảnh có cùng vị trí ở các mành kề nhau rất giống nhau. ♦ Sự dư thừa về mặt cảm nhận của con người: Mắt người nhạy cảm hơn với các thành phần tần số thấp và ít nhạy cảm với sự thay đổi nhanh, tần số cao. Do vậy, có thể coi nguồn hình ảnh là nguồn có nhớ (memory source). Nén ảnh thực chất là quá trình sử dụng các phép biến đổi để loại bỏ đi các sự dư thừa và loại bỏ tính có nhớ của nguồn dữ liệu, tạo ra nguồn dữ liệu mới có lượng thông tin nhỏ hơn. Đồng thời sử dụng các dạng mã hoá có khả năng tận dụng xác suất xuất hiện của các mẫu sao cho số lượng bít sử dụng để mã hoá một lượng thông tin nhất định là nhỏ nhất mà vẫn đảm bảo chất lượng theo yêu cầu. Nhìn chung quá trình nén và giải nén một cách đơn giản như sau: Sơ đồ khối quá trình nén và giải nén ♦ Biến đổi: Một số phép biến đổi và kỹ thuật được sử dụng để loại bỏ tính có nhớ của nguồn dữ liệu ban đầu, tạo ra một nguồn dữ liệu mới tương đương chứa lượng thông tin ít hơn. Ví dụ như kỹ thuật tạo sai số dự báo trong công nghệ DPCM hay phép biến đổi cosin rời rạc của công nghệ mã hoá chuyển đổi. Các phép biến đổi phải có tính thuận nghịch để có thể khôi phục tín hiệu ban đầu nhờ phép biến đổi ngược. ♦ Mã hoá: Các dạng mã hoá được lựa chọn sao cho có thể tận dụng được xác suất xuất hiện của mẫu. Thông thường sử dụng mã RLC (run length coding: mã hoá loạt dài) và mã VLC (variable length coding): gắn cho mẫu có xác suất xuất hiện cao từ mã có độ dài ngắn sao cho chứa đựng một khối lượng thông tin nhiều nhất với số bit truyền tải ít nhất mà vẫn đảm bảo chất lượng yêu cầu. 1.3. Phân loại nén Các thuật toán nén có thể phân làm hai loại: Nén không tổn thất (lossless compression) và nén có tổn thất (lossy compression). ♦ Thuật toán nén không tổn thất: không làm suy giảm, tổn hao dữ liệu. Do vậy, ảnh khôi phục hoàn toàn chính xác với ảnh nguồn. ♦ Các thuật toán nén có tổn thất: chấp nhận loại bỏ một số thông tin không quan trọng như các thông tin không quá nhạy cảm với cảm nhận của con người để đạt được hiệu suất nén cao hơn, Do vậy, ảnh khôi phục chỉ rất gần chứ không phải là ảnh nguyên thủy. Đối với nén có tổn thất, chất lượng ảnh là mội yếu tố vô cùng quan trọng, Tuỳ theo yêu cầu ứng dụng mà các mức độ loại bỏ khác nhau được sử dụng, cho mức độ chất lượng theo yêu cầu. 1.4. Một số dạng mã hóa sử dụng trong công nghệ nén Khái niệm Entropy (H) của nguồn tín hiệu: được dùng để do thông tin của 1 nguồn tin chứa đựng. Nó quy định giới hạn dưới tại đầu ra của bộ mã hóa. Phương pháp mã hóa nào có độ dài mã trung bình (số bit trung bình cần để mã hóa 1 mẫu) càng gần giá trị H thì phương pháp mã hóa đó càng hiệu quả.  Mã hóa loạt dài RLC (Run Length Coding): Do có sự liên hệ tương hỗ giữa các điểm ảnh lân cận nên trong ảnh số thường có các chuỗi điểm lặp lại, đặc biệt dễ thấy đối với ảnh nhị phân. Khi đó, nếu sử dụng số đếm để thay thế dãy các điểm giống nhau, có thể tiết kiệm số bit cần để mã hoá. ý tưởng này được phát triển trong một dạng mã gọi là “mã hoá loạt dài” (RLC). Trong mã này điểm đại diện đầu tiên được thay thế bằng một biểu trưng và xem như điểm xuất phát, còn độ dài dãy dùng để thay thế loạt dài.  Mã hóa độ dài thay đổi VLC (Variable Length Coding)- Mã hóa thống kê Huffman: Trong các công nghệ nén, mã Huffman là dạng mã được sử dụng phổ biến nhất. Bảng mã Huffman có thể cho độ dài mã trung bình để mã hoá cho một mẫu là nhỏ nhất do tận dụng xác suất xuất suất hiện của các mẫu trong nguồn tín hiệu. Trong đó, mẫu có xác suất xuất hiện cao nhất sẽ được gắn với một từ mã có độ dài ngắn nhất.  Mặc dù có độ dài mã thay đổi song mã Huffman vẫn có khả năng giải mã đúng do có thuộc tính tiền tố duy nhất (không có bất cứ từ mã nào lại là phần đầu của từ mã tiếp theo). Mã Huffman hiệu quả nhưng chúng ta phải hiểu rằng mã hoá Huffman chỉ tối ưu khi đã biết trước xác suất của mã nguồn và mỗi biểu trưng của mã nguồn được mã hoá bằng một số bit nguyên. Đặc biệt mã hoá Huffman được phát triển cho ảnh số nhưng áp dụng cho rất nhiều loại ảnh, mỗi ảnh có xác suất xuất hiện biểu trưng của riêng nó. Do đó mã Huffman không phải là tối ưu cho bất cứ loại ảnh đặc biệt nào. Mã hóa dự đoán (Predictive Coding): Như đã nói, nguồn ảnh chứa một lượng thông tin rất lớn. Nếu mã hoá trực tiếp nguồn tin này theo PCM, tốc độ dòng bit thu được sẽ rất cao. Mặt khác, nguồn ảnh lại chứa đựng sự dư thừa và tính “có nhớ”: giữa các điểm ảnh lân cận có mối quan hệ tương hỗ với nhau.  Mã hoá dự đoán đóng một vai trò vô cùng quan trọng trong các chuẩn nén như: MPEG, JPEG, JBIG nhằm tạo một hiệu suất nén cao. Mã hóa chuyển đổi (Transform Coding): Trong phương pháp mã hoá chuyển đổi, tính có nhớ của nguồn tín hiệu được loại bỏ đi bằng một phép biến đổi. Một khối các điểm ảnh được chuyển sang miền tần số theo một ma trận biến đổi phù hợp. Từ khối N giá trị mẫu điểm lân cận nhau s={s(n),s(n+1),.., s(n-N+1)}, thu được khối N hê số c= (c1, c2,.., cN). Phép biến đổi này có tính thuận nghịch, các hệ số này hoàn toàn có thể hồi phục thành giá trị tín hiệu ban đầu bằng phép chuyển đổi ngược. So với nguồn giá trị thực của điểm ảnh, nguồn các hệ số là không có nhớ. Mặt khác, thông tin của nguồn ảnh tập trung phần lớn ở các thành phần tần số thấp, nên trong khối các hệ số, thông tin cũng tập trung tại một số ít các hệ số chuyển đổi ci. Do vậy sẽ giảm được lượng bit nếu mã hoá các hệ số này thay cho việc mã hoá trực tiếp các mẫu.  Số lượng bit mã hoá còn có thể giảm hơn nữa nếu lợi dụng đặc điểm cúa mắt người không nhạy cảm với sai số ở tần số cao. Bởi vậy,có thể sử dụng bước lượng tử thô cho các hệ số ứng với tần số cao mà không làm giảm sút chất lượng ảnh khôi phục. 2. Nén Video Hai công nghệ nén được sử dụng phổ biến nhất hiện nay là: công nghệ nén “Điều xung mã vi sai ” (Differential pulse code modullation-DPCM) và “mã hoá chuyển đổi“(Transform Coding-TC). Chúng đóng vai trò quan trọng trong rất nhiều tiêu chuẩn nén như: JPEG, JBIG, MPEG. 2.1. Nén Video công nghệ “Điều xung mã vi sai” (Differential Pulse Code Modullation-DPCM) Đây là một phuơng pháp nén ảnh quan trọng và hiệu quả. Nguyên lý cơ bản của nó là: chỉ truyền tải tín hiệu vi sai giữa mẫu đã cho và trị dự báo (đuợc tạo ra từ các mẫu truớc đó). Hầu hết các cách thức nén ảnh đều có sử dụng vòng lặp DPCM. 2.1.1. Xử lý giải tương hỗ công nghệ DPCM Công nghệ DPCM thực hiện loại bỏ tính có nhớ và các thông tin dư thừa của nguồn tín hiệu bằng một bộ lọc đặc biệt có đáp ứng đầu ra là hiệu số giữa mẫu đầu vào và giá trị dự báo của chính nó. Rất nhiều giá trị vi sai này gần 0 nếu các điểm ảnh biến đổi đồng đều. Còn với ảnh có nhiều chi tiết , giá trị sai số dự báo có thể lớn. Khi đó có thể lượng tử hoá chúng bằng bước lượng tử cao hơn do đặc điểm của mắt người không nhạy cảm với những chi tiết có độ tương phản cao, thay đổi nhanh. Sự giảm tốc độ bit ở đây thu được từ quá trình lượng tử hoá và mã hoá . Hình vẽ sau đây minh hoạ quá trình làm suy giảm entropy của nguồn tín hiệu: Sự giảm Entropy của nguồn tín hiệu 2.1.2. Kỹ thuật tạo dự báo Như đã đề cập, nếu trực tiếp lượng tử hoá và mã hoá các mẫu của một nguồn ảnh với đầy đủ thông tin dư thừa và quan hệ tương hỗ giữa các điểm ảnh thì hiệu suất nén sẽ rất thấp do lượng thông tin của nguồn quá lớn. Do vậy trong các công nghệ nén, cần loại bỏ đi tính có nhớ của nguồn tín hiệu, tức thực hiện “giải tương hỗ” (deccorelation) giữa các mẫu điểm lân cận nhau. Trong công nghệ nén “điều xung mã vi sai” DPCM, quá trình giải tương hỗ được thực hiện bằng một bộ lọc có đáp ứng đầu ra là hiệu số giữa các mẫu điểm Liên tiếp đầu vào và một giá trị “dự báo” của mẫu điểm đó tạo được dựa trên giá trị các mẫu lân cận theo một qui luật nhất định. Trong mục này, chúng ta xét các luật tạo giá trị dự báo cho mẫu điểm hiện hành từ các điểm lân cận nó. 2.1.2.1. Sai số dự báo (Prediction Error)-Yếu tố đánh giá chất lượng dự báo. Bộ tạo dự báo có nhiệm vụ tạo ra giá trị điểm tiếp theo từ giá trị các điểm đã truyền tải trước đó được lưu trữ. Quá trình tạo dự báo càng tốt thì sự sai khác giữa giá trị thực của mẫu hiện hành và trị dự báo cho nó (gọi là sai số dự báo) càng nhỏ. Khi đó, tốc độ dòng bit càng được giảm nhiều. Chúng ta cần phải phân biệt giữa sai số dự báo và sai số lượng tử. Hai khái niệm này có bản chất khác nhau: ♦ Sai số dự báo (prediction error) chỉ là sự chênh lệch giữa giá trị dự báo và giá trị thực. Nó không làm tổn thất thông tin dẫn đến suy giảm chất lượng ảnh. Giá trị sai số này quyết định tốc độ bit giảm đi nhiều hay ít, tức ảnh hưởng đến hiệu suất nén. ♦ Sai số lượng tử (quantization error) là sai số đặc trưng cho sự tổn thất dữ liệu dẫn đến làm suy giảm chất lượng ảnh phục hồi. Chúng ta có thể quan sát chất lượng tạo dự báo bằng màn hiển thị tín hiệu sai số dự báo. ảnh tạo được càng đen tức giá trị tín hiệu này càng nhỏ và việc tạo dự báo càng chính xác. 2.1.2.2. Tạo dự báo cho ảnh truyền hình-Các phương thức thực hiện. Dự báo cho ảnh truyền hình được thực hiện với dòng dữ liệu ảnh đơn thuần (không chứa đựng tín hiệu âm thanh). Phương pháp quét điển hình trong truyền hình là quét cách dòng. Các dòng không được quét liên tiếp nhau mà chia làm hai mành: mành chẵn chứa thông tin của dòng chẵn, mành lẻ gồm các dòng lẻ xuất hiện giữa hai mành chẵn liên tiếp nhau. Một khung (frame) tương ứng với một ảnh sẽ gồm một mành chẵn và một mành lẻ kề nhau. Từ phương pháp quét đó, có các phương pháp tạo dự báo như sau: Tạo dự báo trong mành (Intrafield Prediction): Chỉ sử dụng các điểm thuộc nửa ảnh (một mành) để tạo dự báo. Dự báo trong mành không tận dụng được quan hệ giữa các điểm ảnh lân cận nhau theo chiều đứng nên có thể cho sai số dự báo cao.  Tạo dự báo trong ảnh (Intraframe Prediction): Với sự hỗ trợ của một bộ nhớ mành, dự báo trong ảnh sử dụng tất cả các điểm thuộc cả hai mành của một khung để tạo dự báo. Như vậy sẽ lợi dụng được quan hệ tương hỗ của các điểm lân cận theo cả phương ngang và phương đứng nên dự báo chính xác hơn, cho sai số dự báo nhỏ hơn.  Tạo dự báo liên mành (Interfield prediction): Phương pháp tạo dự báo này sử dụng cả khung hiện hành và khung tham chiếu khác. Dự báo liên mành chỉ sử dụng một mành (chẵn hoặc lể) ở các khung khác nhau.  Tạo dự báo liên ảnh (Interframe prediction): Phương pháp này sử dụng cả hai mành ở các ảnh kề nhau.  2.1.2.3. Tạo dự báo Intra (Intra prediction) Đối với dự báo intra, giá trị dự báo của điểm hiện hành sẽ là tổng giá trị các điểm lân cận a,b,c,d của nó theo một trọng số xác định. S(n) = ka.s(a) + kb.s(b) + kc.s(c) + kd.s(d) Thông thường, ka + kb +kc + kd = 1 vì giá trị điểm truyền tải thường không vượt quá giá trị trung bình xung quanh. Nếu ka= 1, kb= kc = kd = 0 ta có dự báo một chiều (1_D prediction). Dự báo này cho giá trị tốt nếu ảnh có rìa theo chiều ngang. Nếu ảnh có rìa đứng (theo chiều ngang giá trị điểm ảnh biến đổi nhiều) thì sai số tạo ra sẽ lớn. Như vậy, 1_D prediction sẽ cho sai số dự báo nhỏ nếu rìa ảnh đúng chiều dự báo. Bộ tạo dự báo hai chiều (2_D prediction) sử dụng tất cả các giá trị a,b,c,d theo luật trọng số lớn nhất tập trung cho điểm sát bên trái điểm cần dự báo. Dự báo 2_D tốt cho ảnh bề mặt (tức ảnh không có sự thay đổi theo rìa). Nếu ảnh có sự thay đổi rõ rệt giá trị các điểm ảnh theo một đường rìa nhất định thì dự báo 2_D lại cho sai số dự báo lớn hơn khi sử dụng dự báo 1_D có chiều phù hợp. 2.1.2.4. Tạo dự báo Inter Việc tạo dự báo sẽ có chất lượng cao hơn nếu sử dụng nhiều điểm ảnh có cùng toạ độ (x,y) trong một chuỗi ảnh liên tiếp nhau. Trong dự báo Inter còn có khái niệm “ bù chuyển động”. Tạo dự báo Inter có bù chuyển động được sử dụng trong các công nghệ nén nhằm đạt được hiệu suất nén cao. Phương pháp tạo dự báo này sẽ được đề cập chi tiết khi nói về chuẩn nén MPEG. 2.1.3. Lượng tử hóa sai số dự báo Giá trị biên độ vi sai phụ thuộc vào tính chất ảnh. Trong vùng ảnh thuần nhất, giá trị này thường nhỏ. Đối với các rìa ảnh và ảnh có nhiều chi tiết, giá trị dự báo sẽ kém chính xác đi dẫn tới sai số dự báo sẽ lớn lên. Do những đặc điểm này, nếu sử dụng bộ lượng tử hoá tuyến tính với một bước lượng tử, sẽ gây ra nhiều lỗi: ♦ Tại vùng ảnh thuần nhất, giá trị dự báo vi sai sấp xỉ bằng 0. Bước lượng tử lớn gây ra nhiễu hạt. ♦ Tại vùng ảnh có rìa hoặc nhiều chi tiết, bậc độ tương phản giữa các điểm ảnh cao dẫn tới một giá trị sai số dự báo lớn làm quá tải thang lượng tử. Độ dốc tín hiệu giải mã không theo kịp độ dốc tín hiệu thực tế tại các rìa. Bởi vậy các nét ảnh không rõ ràng, nhoè nhoẹt. Tất cả vấn đề này sẽ giải quyết được nếu sử dụng bộ lượng tử phi tuyến có bước lượng tử lớn dần theo độ lớn mẫu đưa vào lượng tử. Mặt khác sử dụng lượng tử hoá phi tuyến còn tận dụng được đặc tính của mắt người là kém nhạy cảm với các sai số tại vùng ảnh có rìa và nhiều chi tiết. Do vậy tiết kiệm được số bit cần dùng để mã hoá thông tin. 2.1.4. Hệ thống DPCM có bù chuyển động  Khái niệm Bù chuyển động (motion compensation): Trong dòng tín hiệu Video thông thường, các khung liền nhau thường giống nhau. Do vậy trong dự báo Interframe một chiều (tức lấy khung liền trước làm ảnh dự báo cho khung liền sau), giá trị dự báo rất gần giá trị ảnh thực tế dẫn tới sai số dự báo nhỏ, tốc độ dòng bit dữ liệu nhỏ. Khi có chuyển động xảy ra, các điểm có cùng vị trí trong hai khung liền nhau là rất khác biệt. Do vậy sai số dự báo tăng lên, tốc độ bit tăng lên và hiệu suất nén giảm. Với trường hợp ảnh động, nếu chọn ảnh dự báo là khung liền trước sẽ không hợp lý. Để tạo một khung dự báo tối ưu ở đây ta phải sử dụng khái niệm “bù chuyển động” (motion compensation). Do chuyển động, sự tương đồng giá trị điểm ảnh của hai khung kề nhau sẽ giảm nhưng nội dung ảnh chỉ thay đổi theo nguyên tắc: vật thể đã xuất hiện ở khung trước chỉ thay đổi vị trí ở khung ảnh kế sau. Như vậy có thể tái tạo lại sự tương đồng giữa hai khung ảnh bằng phép dự báo hướng chuyển động của vật thể, di chuyển vật thể tới vị trí mới. Đó là khái niệm “bù chuyển động”. Quá trình tìm kiếm hướng chuyển động của vật thể gọi là “ước lượng chuyển động” (motion estimation). Kết quả về sự chuyển dịch của vật thể theo hai hướng x,y được phản ánh bằng giá trị vecto gọi là “vecto chuyển động “ (motion vector). Khi có chuyển động, ảnh dự báo không phải là ảnh kề trước đó mà là ảnh có bù chuyển động. Giá trị sai số dự báo: P = khung trước đó - khung hiện hành + vecto chuyển động Nên vẫn giữ được giá trị rất nhỏ. Nếu quan sát sai số dự báo, ta dễ thấy được chất lượng dự báo có bù chuyển động. ảnh tạo bởi tín hiệu sai số biến đổi có bù chuyển động đen hơn rất nhiều với trường hợp dự báo không bù chuyển động.  Hệ thống DPCM có bù chuyển động là hệ thống có bộ tạo dự báo không nhân quả. Mã hóa/ giải mã DPCM 2.2. Nén Video công nghệ: mã hóa chuyển đổi (Transform Coding) Công nghệ mã hoá chuyển đổi có một vai trò vô cùng quan trọng trong nén ảnh truyền hình. Nếu công nghệ DPCM chỉ cho ảnh chất lượng cao tại tốc độ dòng bit cao thì công nghệ nén “ mã hoá chuyển đổi” “transform coding” có khả năng sử dụng cùng một thuật toán cho một dải tốc độ bit và chỉ làm suy giảm chất lượng ảnh phục hồi tại tốc độ dòng bit vô cùng thấp. 2.2.4. Xử lí giải tương hỗ trong công nghệ TC Trong khi công nghệ “điều xung mã vi sai” DPCM xử lý tín hiệu trong miền thời gian thì công nghệ “mã hoá chuyển đổi” TC xử lý tín hiệu trong miền tần số. Phép biến đổi phù hợp nhất cho nén tín hiệu Video là phép biến đổi cosin rời rạc (discrete cosine transform- DCT). Thay vì lượng tử hoá và mã hóa trực tiếp biên độ điểm ảnh, người ta sẽ lượng tử hoá và mã hoá các hệ số DCT. 2.2.5. Biến đổi Cosin rời rạc (DCT) DCT là phép biến đổi giá trị một khối các điểm ảnh thành một khối các hệ số trong miền tần số. Bản thân DCT không nén dữ liệu , nó không làm giảm tốc độ bít . Bởi vậy, để nén dữ liệu người ta phải lượng tử hoá các hệ số DCT theo một bảng trọng số nhất định sao cho số các hệ số khác 0 ứng với lượng thông tin trong một khối là nhỏ nhất. Đồng thời , các hệ số DCT cũng được quét theo một cách đặc biệt để số hệ số 0 đi liền nhau nhiều nhất nhằm giảm số bít cần dùng cho mã hoá hệ số DCT. 2.2.6. Lượng tử hóa các hệ số DCT Qúa trình lượng tử hoá và mã hoá các hệ số DCT chính là các quá trình làm giảm tốc độ bít vì bản thân phép biến đổi DCT không nén thông tin. Đây là khâu nhạy cảm nhất trong một hệ thống nén vì nó quyết định trực tiếp chất lượng ảnh khôi phục. 2.2.7. Quét các hệ số DCT Dòng số là dòng truyền tải các bit nối tiếp theo thời gian. Do vậy cần một quá trình sắp xếp các hệ số DCT đã lượng tử trong ma trận hai chiều thành dãy một chiều nối tiếp nhau.Quá trình đó gọi là quét hệ số DCT. Theo nghiên cứu, có hai dạng thức quét cho số hệ số “0” đứng cạnh nhau lớn nhất, tạo thuận lợi cho việc giảm tốc độ bit khi mã hoá. Đó là quét “zig_zag” và quét luân phiên “alternate”. Quét các hệ số DCT 2.2.8. Mã hóa các hệ số DCT Sau khi quét, các hệ số DCT gồm rất nhiều hệ số 0 đi liền nhau nên được mã hoá bằng loạt dài RLC (run length coding) rồi tiếp tục mã hoá bằng mã Huffman VLC (varriable length coding) sao cho giảm tối thiểu được tốc độ dòng bit. Việc mã hoá được qui định bởi các bảng mã. ứng với mẫu đầu vào đối chiếu theo bảng mã sẽ cho từ mã đầu ra tương ứng. 2.2.9. Hệ thống nén Video công nghệ mã hóa chuyển đổi TC Sơ đồ khối hệ thống nén sử dụng công nghệ “mã hoá chuyển đổi “ như sau: Hệ thống nén TC Sơ đồ khối giải nén Hệ thống giải mã TC

- Xem thêm -

Tài liệu Báo cáo thực tập-truyền hình số

Tài liệu liên quan

Tài liệu vừa đăng

Tài liệu xem nhiều nhất