Tài liệu Nghiên cứu phát triển một số giải pháp nén ảnh tiên tiến cho màn hình tinh thể lỏng (tt)

  • Số trang: 25 |
  • Loại file: PDF |
  • Lượt xem: 128 |
  • Lượt tải: 0
tailieuonline

Đã đăng 39801 tài liệu

Mô tả:

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI NGUYỄN HỮU TÀI NGHIÊN CỨU PHÁT TRIỂN MỘT SỐ GIẢI PHÁP NÉN ẢNH TIÊN TIẾN CHO MÀN HÌNH TINH THỂ LỎNG Chuyên ngành: Hệ thống Thông tin Mã số: 62480104 TÓM TẮT LUẬN ÁN TIẾN SĨ HỆ THỐNG THÔNG TIN Hà Nội – 2015 Công trình được hoàn thành tại: Trường Đại học Bách khoa Hà Nội Người hướng dẫn khoa học: 1. PGS. TS. NGUYỄN THỊ HOÀNG LAN 2. GS. TS. LÊ ĐÌNH CHƠN TÂM Phản biện 1: Phản biện 2: Phản biện 3: Luận án sẽ được bảo vệ trước Hội đồng chấm luận án tiến sĩ cấp Trường họp tại Trường Đại học Bách khoa Hà Nội Vào hồi …….. giờ, ngày ….. tháng ….. năm ……… Có thể tìm hiểu luận án tại thư viện: 1. Thư viện Tạ Quang Bửu - Trường ĐHBK Hà Nội 2. Thư viện Quốc gia CHƢƠNG 1: MỞ ĐẦU 1.1. Đặt vấn đề Trong những năm gần đây, chúng ta đã được chứng kiến sự thông dụng của công nghệ màn hình tinh thể lỏng, hay thường được gọi tắt là công nghệ LCD (Liquid Crystal Display), qua những chiếc ti-vi tinh thể lỏng (LCD và LED) trong các hộ gia đình, cho đến các màn hình tinh thể lỏng dùng cho máy tính cá nhân trong các văn phòng, các màn hình quan sát và điều khiển trong công nghiệp, màn hình di động. Dữ liệu khung hình Dữ liệu khung hình hiện tại Fn Overdrive Frame memory Dữ liệu khung hình thời điểm trước, Fn-1 (LUT) Overdriven Frame Hình 1.2. Mô hình một hệ thống overdrive trong màn hình tinh thể lỏng. Hiện nay các nhà sản xuất đang cần áp dụng các chuẩn định dạng Ti-vi độ phân giải cao (High-Definition Television) và siêu cao (Ultra High-Definition Television) đối với các thiết bị màn hình tinh thể lỏng, với tốc độ hiện thị khung hình lên mức 60fps đến 120fps. Từ đó làm nảy sinh hai vấn đề đối với bộ nhớ khung hình (frame memory) trong hệ thống overdrive (xem Hình 1.2) dùng để tăng tốc độ đáp ứng cho các phần tử tinh thể lỏng. Cụ thể: (1) Yêu cầu dung lượng tăng cao theo sự tăng trưởng số điểm ảnh trên màn hình. Ví dụ với chuẩn UHD 4320p (8K) sẽ là 7680×4320×24bit  759.4Mb (2) Yêu cầu băng thông ở mức rất cao. Ví dụ với chuẩn UHD 4320p (8K) tốc độ 120fps sẽ là 7680×4320×24bit×120×2  178Gbit/s Với yêu cầu cao về dung lượng và tốc độ băng thông, sẽ đẩy giá thành của bộ nhớ khung hình lên cao, làm tăng giá thành của sản 1 phẩm màn hình tinh thể lỏng. Từ đó bài toán nén ảnh khung hình áp dụng vào trong hệ thống overdrive đã được đặt ra nhằm mục đích thu nhỏ dung lượng dữ liệu ảnh khung hình trước khi nó được lưu trữ lên bộ nhớ khung hình (frame memory), giúp giảm yêu cầu dung lượng và cả tốc độ trao đổi dữ liệu đối với bộ nhớ khung hình. Tiến đến khả năng giảm giá thành của sản phẩm màn hình tinh thể lỏng. Xuất phát từ yêu cầu thực tiễn trên, nhiều nghiên cứu đã được triển khai nhằm tìm ra những giải pháp nén ảnh khung hình áp dụng phù hợp và hiệu quả trên hệ thống overdrive của màn hình tinh thể lỏng. Kết quả đã có khá nhiều các giải pháp nén ảnh khung hình cho màn hình tinh thể lỏng được đề xuất qua các bài báo [[5], [9], [10], [11], [12], [13], [14], [15], [17], [18], [19], [20], [21], [22], [24], [28]]. Qua quá trình nghiên cứu tổng quan chúng tôi nhận thấy rằng vẫn còn tồn tại nhiều khiếm khuyết trong một số giải pháp có hiệu năng tiên tiến đã được đề xuất trong những năm đầu của luận án [[5], [19], [21]]. Từ thực trạng đó, đã mở ra hướng nghiên cứu cải tiến một số giải pháp nén ảnh khung hình cho màn hình tinh thể lỏng đã được các tác giả nước ngoài đề xuất, nhằm nâng cao hiệu quả áp dụng vào hệ thống overdrive, hoặc tiến xa hơn sẽ nghiên cứu đề xuất các giải pháp nén tiên tiến về mặt hiệu năng, nhằm mang lại hiệu quả cao khi áp dụng vào hệ thống overdrive trong màn hình tinh thể lỏng. 1.2. Tình hình nghiên cứu trên thế giới Hiện nay, nhiều giải pháp nén khác nhau đã được đề xuất áp dụng cho hệ thống overdriver trong màn hình tinh thể lỏng. Từ giải pháp đơn giản chỉ áp dụng phép biến đổi không gian màu và kỹ thuật mã hóa lượng tử BTC (block truncation coding) trong [13] với tỷ số nén (compression ratio) CR = 3 đến 3.42. Cho đến các giải pháp nén có kiến trúc phức tạp hơn, sử dụng phối hợp nhiều kỹ thuật biến đổi và lượng tử hóa khác nhau nhằm tăng chất lượng ảnh nén hay tỷ số nén, đã được đề xuất trong các bài báo [9, 10, 12, 14, 15, 17, 18, 20, 21, 24, 28]. Sau cùng, và cũng đáng được chú ý hơn cả, là một số giải pháp nén có hiệu năng cao, dựa trên mô hình kiến trúc khá đơn giản như đề xuất trong [19], hay không quá phức tạp và có thể thực hiện được theo thời gian thực, như trong [5]. Qua quá trình nghiên cứu và phân tích thực nghiệm, chúng tôi nhận thấy các giải pháp nén tiên tiến được đề xuất trong thời gian gần đây vẫn còn mắc phải một số nhược điểm cần khắc phục. Từ đó 2 cho thấy vấn đề nghiên cứu các giải pháp nén ảnh áp dụng vào trong công nghệ màn hình tinh thể lỏng vẫn đang cần các nghiên cứu cải tiến và phát triển, để ngày càng có được các giải pháp hoàn thiện hơn với hiệu năng cao hơn. 1.3. Mục tiêu và phạm vi nghiên cứu của luận án Mục tiêu của luận án là nghiên cứu phát triển các giải pháp tiên tiến nén dữ liệu ảnh khung hình áp dụng cho màn hình tinh thể lỏng độ phân giải cao, trên cơ sở phân tích các công trình đã có để đề xuất cải tiến cải thiện hiệu năng. Nghiên cứu kế thừa và phát triển đề xuất các giải pháp nén mới nâng cao hiệu năng so với những giải pháp hiện đã được đề xuất. Theo một số các tiêu chí đánh giá hiệu năng nén gồm: chỉ số nén, chất lượng nén, và độ phức tạp tính toán. Phạm vi nghiên cứu của luận án bao gồm: 1. Nghiên cứu phát triển các giải pháp nén ảnh áp dụng cho màn hình tinh thể lỏng độ phân giải cao nhằm tăng cường hiệu năng nén. 2. Nghiên cứu đề xuất cải tiến các giải pháp để khắc phục những nhược điểm còn tồn tại trong một số giải pháp nén tiên tiến như AHIC, DAMS, nhằm nâng cao hiệu năng của giải pháp nén về cải thiện chất lượng ảnh, giảm độ phức tạp tính toán. 3. Nghiên cứu phân tích các ưu và nhược điểm của các giải pháp nén ảnh đã có. Từ đó đề xuất xây dựng các giải pháp nén mới thể hiện được nhiều ưu điểm vượt trội về chất lượng ảnh, tỷ số nén, độ phức tạp tính toán hay sơ đồ thực hiện, có khả năng thích nghi theo sự thay đổi của tín hiệu ảnh, tránh mắc phải các khuyết điểm về thị giác. 1.4. Phƣơng pháp nghiên cứu - Xác định rõ mục tiêu và phạm vi nghiên cứu. - Phương pháp nghiên cứu kế thừa và phát triển trên cơ sở nghiên cứu phân tích tổng quan các giải pháp đã đề xuất, cải tiến nâng cao hiệu năng và phát triển đề xuất giải pháp mới. - Phương pháp nghiên cứu kết hợp giữa lý thuyết và nghiên cứu thực nghiệm cài đặt chương trình kiểm chứng kết quả, biện luận và giải thích. 3  Về nghiên cứu lý thuyết: Nghiên cứu cơ sở lý thuyết về tín hiệu ảnh và các phép biến đổi tín hiệu ảnh, lý thuyết về lượng tử hóa,…  Về nghiên cứu thực nghiệm: Đã tiến hành cài đặt lập trình thực nghiệm cho hầu hết các giải pháp nén tiên tiến được xem xét và đánh giá trong luận án. Thực nghiệm đo lường, thống kê số liệu tạo cơ sở cho các phân tích đánh giá. Ý nghĩa khoa học và thực tiễn của đề tài Ý nghĩa khoa học của luận án được thể hiện trong đề xuất hai giải pháp tiên tiến nén ảnh khung hình, nâng cao hiệu năng nén nhằm áp dụng cho hệ thống màn hình tinh thể lỏng, “Advanced Robust Adaptive Image Coding” và “Wavelet Lifting Transform base MultiAdaptive Image Coding”, tương ứng với hai hướng tiếp cận khác nhau mà luận án đã thực hiện. Đề xuất phát triển về kỹ thuật lượng tử hóa, kỹ thuật tối ưu hóa quá trình lượng tử các khối ảnh thông qua giải pháp phân phối bit, những kỹ thuật mới được đề xuất này không bị bó hẹp trong lĩnh vực nén ảnh khung hình cho màn hình tinh thể lỏng mà chúng có khả năng áp dụng cho lĩnh vực nén ảnh nói chung. Ý nghĩa thực tiễn của luận án được thể hiện qua các giải pháp nén đề xuất hướng áp dụng vào công nghệ màn hình tinh thể lỏng cho phép sản xuất thế hệ màn hình tinh thể lỏng có độ phân giải cao, chất lượng hiển thị hình ảnh tốt với một giá thành thấp hơn. Tóm lại, có thể khẳng định rằng đề tài của luận án này thật sự mang nhiều ý nghĩa khoa học và thực tiễn. Bố cục luận án Bố cục của luận án gồm 5 chương, ngoài hai chương MỞ ĐẦU và KẾT LUẬN, ba chương còn lại tập trung vào trình bày lý thuyết tổng quan cũng những kết quả nghiên cứu mà luận án đã đạt được, cụ thể: Chƣơng 2: Trình bày sơ lược về lịch sử phát triển của công nghệ màn hình tinh thể lỏng và kỹ thuật tăng tốc overdrive giúp tăng tốc độ đáp ứng của các phần tử tinh thể lỏng. Một số cơ sở lý thuyết áp dụng trong bài toán nén ảnh khung hình. Nghiên cứu tổng quan về lĩnh vực nén ảnh khung hình trong hệ thống overdrive. Phân tích và thực nghiệm nhằm đánh giá ưu và nhược điểm của một số giải pháp nén ảnh tiên tiến đã được đề xuất áp dụng cho màn hình tinh thể lỏng. Trên cơ sở đó đưa ra một số định hướng nghiên cứu cải tiến. 4 Chƣơng 3: Nghiên cứu và phân tích sâu hơn các khuyết điểm trong một số giải pháp nén ảnh tiên tiến sử dụng nền tảng cơ bản là các kỹ thuật mã hóa khối và biến đổi không gian màu. Từ đó đề xuất các kỹ thuật khắc phục áp dụng vào trong các sơ đồ giải pháp cải tiến nhằm nâng cao hiệu năng nén. Nghiên cứu đề xuất áp dụng lý thuyết phân phối bít vào nén ảnh khung hình cùng một số kỹ thuật lượng tử hóa tối ưu, dựa vào đó từng bước nâng cao chất lượng ảnh nén và giảm độ phức tạp tính toán qua từng giải pháp. Kết quả đã đạt được một số đề xuất cải tiến có tính kế thừa từng bước một nhằm nâng cao chất lượng ảnh hay cải thiện độ phức tạp tính toán. Sau cùng, luận án đã đi đến được một giải pháp nén ảnh khung hình có tính tiên tiến về hiệu năng với tên gọi ARAIC, mang lại sự cải tiến vượt trội về chất lượng ảnh, giảm độ phức tạp tính toán và sơ đồ kiến trúc phần cứng thực thi có phần tinh gọn. Tất cả các đề xuất trong chương này đều được cài đặt thực nghiệm, phân tích, so sánh và đánh giá. Chƣơng 4: Nghiên cứu và phân tích các nhược điểm của giải pháp nén ảnh DAMS. Từ đó tìm kiếm giải pháp khắc phục thông qua các đề xuất như kỹ thuật ngưỡng thích nghi, kỹ thuật biến đổi wavelet lifting integer to integer, và một số điều chỉnh về sơ đồ giải pháp. Trải qua hai giai đoạn nghiên cứu cải tiến và phát triển có tính kế thừa: Giai đoạn một luận án đã đưa ra đề xuất cải tiến DAMS bằng cách tích hợp kỹ thuật ngưỡng thích nghi để hình thành nên giải pháp DBMAIC cho khả năng thích nghi cao và mang lại chất lượng ảnh vượt trội; Giai đoạn hai là cải thiện độ phức tạp tính toán của DBMAIC với kỹ thuật biến đổi tín hiệu ảnh Wavelet Lifting Integer to Integer, cùng một số cải tiến về mặt lượng tử để hình thành nên giải pháp WLT-MAIC. Những phân tích và đánh giá cho thấy tính tiến tiến của WLT-MAIC thể hiện qua hiệu năng vượt trội của nó so với giải pháp gốc DAMS. Trong chương này cũng đồng thời đưa ra các so sánh và đánh giá giữa hai hướng tiếp cận trong luận án. Tập trung một số phân tích và đánh giá so sánh trên hai kết quả tốt nhất của hai hướng tiếp cận là ARAIC và WLT-MAIC, các so sánh và đánh giá nhằm thể hiện rõ những ưu - khuyết điểm và đưa ra những nhận định hay khuyến nghị đối với nhà sản xuất khi chọn lựa giải pháp. Cuối cùng là phần so sánh đánh giá với 2 giải pháp nén tiên tiến nổi bật nhất mới được đề xuất trên thế giới vào cuối giai đoạn nghiên cứu của luận án là LTC [22] và SAMS [11]. 5 Chƣơng 5: Tóm tắt các nội dung nghiên cứu chính của luận án. Trình bày cô đọng các kết quả mới mà luận án đã đạt được, và cuối cùng là nêu lên hướng phát triển tiếp theo của luận án. CHƢƠNG 2: TỔNG QUAN VỀ VẤN ĐỀ NÉN ẢNH CHO MÀN HÌNH TINH THỂ LỎNG 2.1. Lịch sử phát triển của màn hình tinh thể lỏng và vấn đề chất lƣợng hiện thị hình ảnh động 2.1.1. Lịch sử phát triển của màn hình tinh thể lỏng Màn hình tinh thể lỏng đã có một lịch sử phát triển lâu dài qua nhiều giai đoạn. Mốc lịch sử đầu tiên phải kể đến đó là và năm 1888, nhà thực vật học và hóa học người Áo, Friedrich Reinitzer, đã tìm ra các phần tử tinh thể (liquid-crystal) trong chất béo được chiết xuất từ cà-rốt. Giữa những năm 1964 và 1968, George Heilmeier với Louis Zanoni và Lucian Barton, đã phát minh ra một phương pháp sử dụng điện áp để điều khiển ánh sáng phản xạ từ các phần tử tinh thể lỏng, nó minh chứng cho màn hình tinh thể lỏng đầu tiên. Cho đến thời điểm hiện nay, năm 2015, thì hầu hết các hãng sản xuất màn hình tinh thể lỏng lớn trên thế giới đều đã cho ra đời các sản phẩm màn hình tinh thể lỏng độ phân giải UHD 4K/8K, mặc dù hiện tại giá thành của chúng còn rất đắt. 1.1.2. Vấn đề chất lượng hiển thị hình ảnh động trên màn hình tinh thể lỏng Điểm yếu của màn hình tinh thể lỏng là hiện tượng hiển thị không rõ nét đối với các cảnh động, được gọi là hiệu ứng motion-blur, được minh họa qua Hình 1.1. Nguyên nhân là do các phần tử tinh thể lỏng đáp ứng lại sự thay đổi độ sáng khi chuyển đổi từ khung hình trước sang khung hình sau với một tốc độ chậm (slow response). 2.2. Overdrive – một kỹ thuật tăng tốc cho các phần tử tinh thể. 6 Hình 2.6. So sánh thời gian đáp ứng [1]. (a) Kỹ thuật điều khiển (dẫn động) thông thường (b) Kỹ thuật overdrive. Kỹ thuật overdrive giúp tăng tốc độ đáp ứng cho các phần tử tinh thể. Khả năng tăng tốc cho các phần tử tinh thể của overdrive dựa trên ý tưởng khá đơn giản là: điện áp liên quan đến động lực chuyển động của các tinh thể, vì vậy điện áp càng lớn thì tốc độ chuyển động càng cao, hay nói cách khác là các phần tử tinh thể sẽ đáp ứng nhanh hơn khi điện áp được tăng lên. 2.3. Mô hình hệ thống Overdrive và yêu cầu nén ảnh giảm bộ nhớ khung hình Dữ liệu khung hình Dữ liệu khung hình hiện tại Fn Codec module Frame encoder Frame memory Overdrive Frame decoder 𝐹𝑛−1 (LUT) Overdriven Frame Dữ liệu khôi phục của khung hình thời điểm trước Hình 2.7. Mô hình hệ thống overdrive có sử dụng kỹ thuật nén ảnh nhằm giảm yêu cầu về dung lượng và tốc độ truy xuất dữ liệu của frame memory. Vấn đề đặt ra cho bài toán nén ảnh khung hình cho hệ thống overdrive của màn hình tinh thể lỏng độ phân giải cao là: - Đầu vào là ảnh khung hình có độ phân giải cao, với rất nhiều điểm ảnh cần xử lý. - Đầu ra để phục vụ cho khâu hiện thị ảnh trên màn hình. - Bộ nén (codec) phải thực hiện đồng thời hai nhiệm vụ nén dữ liệu (encode) và giải nén dữ liệu (decode) với khối lượng dữ liệu lớn trong một khoảng thời gian ngắn, ví dụ với màn hình có tốc độ 120fps thì khoảng thời gian chỉ ở mức 1/120 giây. Vì vậy bộ nén phải đảm bảo tốc độ xử lý cao. - Chất lượng ảnh phải cao để đảm bảo độ trung thực cho hệ thống hiển thị. - Tỷ số nén lớn và độ phức tạp tính toán không cao để đảm bảo tính thực tiễn khi triển khai áp dụng thực tiễn. 7 Với những yêu cầu trên, có thể thấy giải quyết bài toán nén ảnh khung hình cho màn hình tinh thể lỏng độ phân giải cao là một nhiệm vụ không đơn giản. Cần có những nghiên cứu để có thể đưa ra được các giải pháp nén phù hợp với những yêu cầu nói trên. Để có thể triển khai áp dụng vào thực tiễn nhằm giảm giá thành cho hệ thống overdrive. 2.4. Các đặc trƣng của phƣơng pháp nén ảnh áp dụng cho hệ thống Overdrive. Từ mục tiêu cụ thể của bài toán là: giảm dung lượng bộ nhớ khung hình, tiến đến giảm giá thành của sản phẩm. Đã làm nảy sinh ba đặc trưng thiết yếu của một giải pháp nén ảnh áp dụng trong hệ thống overdrive là: • Thứ nhất, giải pháp nén phải đạt được tỷ số nén cố định. • Thứ hai, độ phức tạp tính toán ở mức chấp nhận được. • Chất lượng ảnh nén phải ở mức cao. 2.5. Một số cơ sở lý thuyết trong nén ảnh Luận án xem xét và nghiên cứu một số kỹ thuật biến đổi tiên tiến như Biến đổi cosin rời rạc DCT, biến đổi hàm sóng con wavelet và các kỹ thuật DWT, WLT integer to integer. Và một số phương pháp lượng tử hóa tối ưu thông dụng trong nén ảnh. 2.6. Tổng quan về các giải pháp nén ảnh cho màn hình tinh thể lỏng Trong khoảng thời gian từ 2002 đến nay đã có khá nhiều các nghiên cứu và đề xuất các giải pháp nén ảnh áp dụng cho hệ thống overdrive trong màn hình tinh thể lỏng, từ những giải pháp đơn giản chỉ áp dụng duy nhất kỹ thuật lượng tử hóa với hiệu năng thấp được đề cập trong [12], cho đến những giải pháp khá phức tạp áp dụng đồng thời nhiều phép biến đổi, biến đổi không gian màu và biến đổi wavelet, cùng với mô hình lượng tử hóa đa chế độ, BTC (block truncation coding) và AQC (Adaptive Quantization Coding), nhằm nâng cao hiệu năng nén được đề cập trong [5]. Để đánh giá giải pháp nén ảnh cho hệ thống overdrive của màn hình tinh thể lỏng, chúng tôi dựa trên 3 tiêu chí cơ bản là: Chất lượng ảnh, tỷ số nén, và cuối cùng là độ phức tạp tính toán được xem xét trong mối liên hệ với yêu cầu kiến trúc thực thi. 8 Một số kết quả thu được trong phần phân tích và đánh giá một số giải pháp nén ảnh tiến tiến: • Giải pháp AHIC: Bị hiệu ứng nhiễu khối do lỗi mã hóa kép. Bị hiện tượng sai lệch màu quá mức do áp dụng giảm số mẫu tín hiệu quá mức trên Cb&Cr. • AM-BTC: Bị hiện tượng nhiễu đốm, và rung mờ trong một số tình huống ảnh. • DAMS: Bị nhiễu đốm trên vùng ảnh có độ chi tiết cao, và bị hiệu ứng khối với những vùng ảnh có màu biến thiên chậm, sử dụng quỹ bit chưa tối ưu. CHƢƠNG 3: PHÂN TÍCH VÀ ĐỀ XUẤT MỘT SỐ GIẢI PHÁP NÉN ẢNH DỰA TRÊN MÃ HÓA KHỐI VÀ BIẾN ĐỔI KHÔNG GIAN MÀU 3.1 Nghiên cứu cải tiến và phát triển giải pháp nén ảnh dựa trên mã hóa khối và biến đổi không gian màu 3.1.1. Tóm tắt 6 giai đoạn nghiên cứu phát triển giải pháp Hình 3.1. Sơ đồ mô tả sơ lược các bước phát triển đề xuất 9 Theo hướng nghiên cứu áp dụng mã hóa khối và biến đổi không gian màu, luận án đã có nhiều đề xuất cải tiến cũng như đề xuất kết hợp một số kỹ thuật trao đổi hay phân phối bit nhằm tối ưu hóa chất lượng ảnh nén. Trải qua 5 giai đoạn nghiên cứu với dấu mốc là 5 đề xuất cải tiến có tính kế thừa và phát triển từng bước một gồm MAIC (Mean Adaptive Image Coding), AAIC (Advanced Adaptive Image Coding), AHAIC (Advanced High-Adaptive Image Coding), ACAIC (Advanced Content-Adaptive Image Coding), RAIC (Robust Adaptive Image Coding). Giai đoạn sau cùng tập trung cho những nghiên cứu đánh giá ưu nhược điểm của các kết quả đã đạt được ở những giai đoạn trước, phân tích và tổng hợp, nghiên cứu hiệu chỉnh mô hình xử lý để có thể tích hợp các ưu điểm trong các mô hình phát triển trước đó. Từ đó tổng hợp và đề xuất một giải pháp nén ảnh khung hình có hiệu năng vượt trội với tên gọi ARAIC (Advanced Robust Adaptive Image Coding). Hình 3.1 mô tả sơ lược tính kế thừa và các bước cải tiến. Với mỗi giải pháp nén được đề xuất, luận án luôn có phần thực nghiệm và so sánh nhằm thể hiện rõ các ưu và nhược điểm của mỗi bước phát triển. 3.1.2. Môi trường thực nghiệm cài đặt và các bộ dữ liệu. Tất cả các nghiên cứu cải tiến trình bày trong sơ đồ Hình 3.1, cũng như các nghiên cứu trình bày trong những phần khác của luận án, đều được cài đặt lập trình và thực nghiệm.  Môi trƣờng lập trình: Matlab và Simulink  Môi trƣờng cài đặt: máy tính PC  Các bộ dữ liệu: Dữ liệu cho quá trình nghiên cứu đánh giá của luận án là một tập hợp các hình ảnh và các chuỗi khung hình (với tổng số 8765 ảnh) chuyên dùng cho việc đánh giá thực nghiệm trong lĩnh vực xử lý ảnh và video, được lấy từ các trung tâm nghiên cứu hàng đầu về xử lý ảnh và video của Arizona State University, Video Quality Experts Group, Laboratory for Image and Video Engineering - Texas: Các bộ dữ liệu thực nghiệm trong luận án hội tụ đầy đủ các đặc tính thiết yếu cho việc kiểm nghiệm các giải pháp nén ảnh. Trong đó chứa nhiều hình ảnh và chuỗi khung hình video với độ nét và độ chi tiết cao, chúng sẽ tạo ra những thách thức lớn cho các giải pháp nén 10 ảnh và làm cho nhiều giải pháp nén đã được đề xuất bộ lộ rõ những điểm yếu. 3.2. Khắc phục hiện tƣợng nhiễu khối trong AHIC với giải pháp cải tiến MAIC. Có ba điểm khác biệt của mô hình mới MAIC so với mô hình AHIC: Thứ nhất, thay vì dùng giá trị Min Max là những giá trị thường thiếu ổn định do dễ bị tác động bởi nhiễu, chúng tôi dùng giá trị trung bình (mean) là giá trị có tính ổn định cao hơn trong tín hiệu ảnh, nó ít bị tác động bởi nhiễu. Thứ hai, chúng tôi thực hiện trừ giá trị tín hiệu đầu vào bởi giá trị trung bình đã giải mã (mean decoded) để thu được tín hiệu "zero mean" trước khi được lượng tử hóa với 3bit/giá trị, bằng con đường này, sẽ tránh được lượng tử hóa kép gây nên nhiễu khối mà mô hình AHIC mắc phải. Thứ ba, là chúng tôi sử dụng bộ lượng tử hóa MUQ (Midrise Uniform Quantizer) thay vì sử dụng AQC như trong AHIC. Từ những phân tích lý thuyết và thực nghiệm cho thấy giải pháp nén mà chúng tôi đề xuất MAIC (Mean Adaptive Image Coding) kế thừa từ mô hình giải pháp AHIC đã tránh được hiện tượng nhiễu khối, là loại nhiễu mà giải pháp AHIC mắc phải qua đó gián tiếp làm suy giảm chất lượng hình ảnh hiển thị trên màn hình. Kết quả nghiên cứu về giải pháp cải tiến MAIC đã được đăng trong công trình số 3 thuộc danh mục các công trình khoa học đã công bố của luận án. 3.3. Cải thiện chất lƣợng ảnh nén với kỹ thuật trao đổi bit CBBET Với mục tiêu tìm kiếm giải pháp tích hợp nhằm tối ưu hóa hơn quá trình lượng tử hóa các khối ảnh để nâng cao chất lượng ảnh nén, chúng tôi đã tiến hành phân tích ưu và nhược điểm của kỹ thuật lượng tử hóa với phân phối bit đều trong trong AHIC cũng như trong phần lớn các giải pháp lượng tử hóa khác đã đề xuất (ngoại trừ giải pháp DAMS). Từ đó nghiên cứu và đề xuất kỹ thuật trao đổi bit để tối ưu hơn quá trình lượng tử hóa các khối ảnh. Tích hợp CBBET (Content-based Bit Exchange Techniques) vào sơ đồ giải pháp MAIC để hình thành nên giải pháp AAIC. Từ những phân tích và lập luận cho đến thực nghiệm kiểm chứng đã chứng tỏ khả năng cải thiện chất lượng ảnh nén trên thành phần 11 độ chói một cách mạnh mẽ. Đưa đến khả năng nâng cao độ chính xác cho hệ thống overdrive trong màn hình tinh thể lỏng nhằm tiến gần đến chất lượng gần tương đương với hệ thống overdrive không sử dụng công nghệ nén ảnh để tiết kiệm bộ nhớ và giảm băng thông. 46 45 AAIC (K=11) 44 PSNR (dB) 43 AAIC (K=1) 42 AAIC (w /o CBBET) 41 40 39 AHIC 38 37 36 0 100 200 300 Frame number Hình 3.17. So sánh hiệu năng của AAIC với MAIC và AHIC xét trên thành phần độ chói Y. Kết quả nghiên cứu về giải pháp cải tiến AAIC đã được đăng trong công trình số 1 thuộc danh mục các công trình khoa học đã công bố của luận án. 3.4. Cải thiện chất lƣợng nén với kỹ thuật phân phối bit CBBDT Kỹ thuật trao đổi bit CBBET trong AAIC đã giúp cải thiện chất lượng ảnh một cách đáng kể. Tuy nhiên, nó vẫn chưa thật sự tối ưu khi sự trao đổi bit chỉ diễn ra bên trong các cặp block được kết đôi với nhau. Kế thừa hàm phân phối bít do Huang and Schultheiss (1963) và Segall(1976) đề xuất. Chúng tôi đã nghiên cứu và đề xuất một hàm tính phân phối bít dạng: Bi  B N  1 2 log 2 Q S _ use i 1  N N   Q S _ use j   j 1  , 1 i  N (3.10) Nghiên cứu và tích hợp công thức (3.10) vào một mô hình có tên gọi AHAIC đã mang lại những kết quả khả quan. Thực nghiệm cho thấy chất lượng ảnh đã được nâng lên so với AAIC một cách đáng kể thể hiện qua Hình 3.22. 12 45 AHAIC (K=11) 44 PSNR (dB) 43 AHAIC (K=1) 42 AAIC (K=11) 41 40 AAIC (K=1) 39 AHIC 38 37 0 50 100 150 200 250 300 Frame number Hình 3.22. So sánh chất lượng ảnh trên chuỗi khung hình CIF Hall. 3.4.3. Cải tiến hiệu năng của AHAIC thông qua giải pháp ACAIC. ACAIC là một giải pháp nén kế thừa từ AHAIC nhưng được cải tiến hàm phân phối bít dựa trên giá trị Max(block) nhằm hạn chế sai lệch trong việc tính toán bước lượng tử hóa. Những kết quả thực nghiệm đã chứng tỏ ACAIC thực sự hiệu quả hơn AHAIC nhờ độ chính xác trong tính toán bước lượng tử. Từ đó ACAIC đã mang lại chất lượng ảnh nén cao hơn sơ với AHAIC. Kết quả nghiên cứu về giải pháp cải tiến AHAIC và ACAIC đã được đăng trong công trình số 4 và số 2 thuộc danh mục các công trình khoa học đã công bố của luận án. 3.5. Đề xuất giải pháp nén RAIC. Giải pháp nén RAIC (Robust Adaptive Image Coding) mà chúng tôi đề xuất được hình thành trên cơ sở các đề xuất mới gồm: (1) Kỹ thuật mã hóa lượng tử thích nghi theo Min-Max cho dữ liệu có phân phối đều MMAUQC (Min-Max Adaptive Uniform Quantization Coding). (2) Kỹ thuật phân phối bit dựa trên giá trị phạm vi của block với tên gọi RBBDT (Range-based Bit Distribution Technique). (3) Kỹ thuật mã hóa lượng tử đa thích nghi MAQC (Multiple Adaptive Quantization Coding). Thực nghiệm cho thấy chất lượng ảnh nén của RAIC đã được cải thiện vượt trội so với các giải pháp nén AHIC, AM-BTC, AHAIC, ACAIC. Các phân tích và thực nghiệm đã minh chứng khả năng thích nghi mạnh mẽ của RAIC, cũng như chứng minh cho các ưu điểm của các kỹ thuật đã được chúng tôi đề xuất gồm MMAUQC, RBBDT, và MAQC. Kết quả nghiên cứu về giải pháp cải tiến RAIC đã được đăng tóm tắt một phần trong công trình số 5, và đăng toàn văn chi tiết trong 13 RGBtoYCbCr RGB (24 bits) YCbCr 4:2:0 bit stream công trình số 7, thuộc danh mục các công trình khoa học đã công bố của luận án. 3.6. Đề xuất ARAIC nâng cao hiệu năng nén RAIC Line buffer  Y: 4 Line  Cb: 2x½ Line  Cr: 2x½ Line Get Block  Y: Kx8 block 4x4  Cb: Kx2 block 2x8  Cr: Kx2 block 2x8 Kx12 block (block size is 16 element) MAQC Encoder Coded Data (Kx512 bits) ARAIC Encoder Hình 3.34. Sơ đồ bộ nén của ARAIC. Qua một quá trình nghiên cứu lý thuyết cùng thực nghiệm, chúng tôi đã đi đến một giải pháp ARAIC (Advanced Robust Adaptive Image Coding) được mô tả chi tiết qua sơ đồ khối thể hiện trong Hình 3.34. Đây là một giải pháp mang tính đột phá giúp giải quyết trọn vẹn những nhược điểm mà AHIC mắc phải bao gồm nhiễu khối và hiện tượng sai lệch màu. Nhờ khả năng giảm tỷ lệ downsampling cho Cb&Cr từ 1/16 trong AHIC xuống còn 1/4, sau đó áp dụng kỹ thuật mã hóa lượng tử đa thích nghi MAQC giúp phân phối bít một cách mềm dẻo giữa các thành phần Y và Cb&Cb tùy thuộc vào nội dung của chúng. Các phân tích lý thuyết và đánh giá thực nghiệm đã chỉ ra ưu thế vượt trội của ARAIC so với những giải pháp trước đó. (a) Comparision of performances on RGB (b) Comparision of performances on Y 30 38 29 36 PSNR (dB) PSNR (dB) 28 27 26 25 24 34 32 30 23 22 0 50 100 150 200 250 300 Frame number (c) Comparision of performances on Cb 28 AHIC AM-BTC RAIC ARAIC 36 0 50 100 150 200 250 Frame number (d) Comparision of performances on Cr 36 Hình 3.36. So sánh chất lượng ảnh của các giải pháp nén trên chuỗi khung hình CIF MobileCalendar. 34 PSNR (dB) PSNR (dB) 34 32 30 32 30 CHƢƠNG 4: PHÂN TÍCH VÀ ĐỀ XUẤT MỘT SỐ GIẢI PHÁP NÉN ẢNH DỰA TRÊN BIẾN ĐỔI WAVELET VÀ LỰA CHỌN THÍCH NGHI 28 26 28 26 0 50 100 150 Frame number 200 250 300 24 0 50 100 4.1. Đề xuất cải tiến DAMS với sự tích hợp cơ chế ngƣỡng thích nghi qua giải pháp DBMAIC 14 150 Frame number 200 250 Phân tích và thực nghiệm cho thấy các khuyết điểm của DAMS có nguyên nhân từ sự bất hợp lý khi sử dụng giá trị ngưỡng là hằng số. Từ đó luận án đã đề xuất kỹ thuật ngưỡng thích nghi để tích hợp vào DAMS hình thành nên giải pháp DBMAIC. Cr_LL MB 4x8 Cb_LH Cb Cb_HL Cb_HH Cr Cr_LL O nl 8- y p lin ro e ce im ss ag o n e Cr_LH Macroblock 4 row x 8 column Block group Y_LH MB 4x8 Y_HL MB 4x8 Y_HH MB 4x8 Coding 2D-DWT Y_HL Cb_LL (Daubechies 4/4 tap) RGB to YCbCr S/P Line Memory Y_LL MB 4x8 Cb_LL MB 4x8 Y_HH Y RGB 24 bits Y_LL Y_LH Grouping and priority assignment 4-line image Coded Data DAMS Encoder Cb_LH MB 4x8 Cr_LH MB 4x8 Cb_HL MB 4x8 Adaptive Threshold Controller Cr_HL MB 4x8 Cr_HL Cb_HH MB 4x8 Cr_HH Cr_HH MB 4x8 DAMS-AT Encoder DBMAIC Encoder Hình 4.2. Sơ đồ khối của bộ mã hóa DBMAIC, được tích hợp với một bộ điều khiển ngưỡng thích nghi. Kết quả thực nghiệm cho thấy chất lượng ảnh đã tăng mạnh sau khi áp dụng kỹ thuật ngưỡng thích nghi như thể hiện qua hình 4.8. PSNR (dB) 45 44 43 42 41 40 39 38 37 36 35 34 33 32 31 30 29 28 27 26 25 AHIC AM-BTC DAMS DBMAIC (with only 6 Mode Encoder) Plane Ocean Statue Monarch Parrots WomanHat Sailing4 Woman Sailing3 Sailing2 Sailing1 LightHouse2 House LightHouse Caps rapids Buildings Building2 bikes DBMAIC Hình 4.8. So sánh hiệu năng của các giải pháp nén 4.2. Đề xuất áp dụng biến đổi Wavelet Lifting integer to integer nhằm cải thiện độ phức tạp qua giải pháp WLT-MAIC. 15 Macroblock 4 row x 8 column Y_H Y Cb_L Cb Cb_H Cr Cr_L O nl 4- y p lin ro e ce im ss ag o n e Cr_H Y_L MB 4x8 Block group Cb_L MB 4x8 Cr_L MB 4x8 Coding Wavelet Lifting 1D (for rows) Le’Gall filter 5/3-tap RGB to YCbCr RGB 24 bits S/P Line Memory (4-line) Y_L Grouping and priority assignment 4-line image Coded Data DAMS Encoder Y_H MB 4x8 Cb_H MB 4x8 Cr_H MB 4x8 Adaptive Threshold Controller DAMS-AT Encoder WLT-MAIC Encoder Hình 4.14. Sơ đồ khối cho bộ mã hóa WLT-MAIC Giải pháp WLT-MAIC (Wavelet Lifting Transform base MultiAdaptive Image Coding) được hình thành trên cơ sở kế thừa giải pháp DBMAIC nhưng được tích hợp biến đổi wavelet lifting một chiều trên 4 dòng ảnh trên trường số nguyên, nhằm thay thế cho phép biến đổi wavelet rời rạc hai chiều trên trường số thực, giúp phép biến đổi trở nên giản đơn theo các công thức (4.7) và (4.8). Hơn thế nữa, bộ đệm dòng (line buffer) được giảm xuống còn 4-line. Tích hợp với bộ lượng tử MMAUQC nhằm mang lại khả năng xử lý nhất quán trên trường số nguyên của tất cả các bộ phận (module) xử lý trong WLT-MAIC. Từ đó giải pháp WLT-MAIC có thể được xử lý trên vi xử lý số nguyên. Đánh giá thực nghiệm cho thấy chất lượng ảnh của WLT-MAIC là xấp xỉ với DBMAIC và vượt trội hơn hẳn giải pháp gốc DAMS. Từ đó cho thấy ưu thế vượt trội của WLT-MAIC so với DAMS và kể cả DBMAIC. Hình 4.17. So sánh hiệu năng của các giải pháp nén. 16 4.3. So sánh và phân tích đánh giá hai giải pháp tiêu biểu cho hai hƣớng tiếp cận Quá trình thực nghiệm và các phân tích đã cho thấy, hai giải pháp tiêu biểu cho hai hướng tiếp cận là ARAIC và WLT-MAIC đều có những ưu và nhược điểm riêng, và có tính cạnh tranh với nhau, không thể phủ định nhau trong không gian bài toán nén ảnh khung hình cho hệ thống tăng tốc trong màn hình tinh thể lỏng. Tuy nhiên, giải pháp WLT-MAIC tỏ ra nhiều ưu việt hơn nếu phạm vi bài toán được mở rộng ra thành bài toán nén ảnh khung hình với chất lượng cao cho các chíp xử lý video. Điều này đã được một số chuyên gia của Qualcomm Canada khảo sát và kết luận, được trình bày trong phần phụ lục của luận án. 4.4. So sánh ARAIC và WLT-MAIC với những giải pháp tiên tiến nổi bật trong thời gian gần đây Những phân tích và so sánh trong luận án đã chỉ ra rằng hai giải pháp tiêu biểu của luận án là ARAIC và WLT-MAIC thể hiện ưu điển vượt trội so với hai giải pháp mới nhất hiện nay là LTC (nguồn [22]) và SAMS (nguồn [11]) trên cả hai phương diện: chất lượng ảnh và độ phức tạp tính toán. CHƢƠNG 5: KẾT LUẬN 5.1. Tóm tắt nội dung nghiên cứu và kết quả mới của luận án 5.1.1. Những nội dung nghiên cứu chính của luận án Luận án đã tiến hành nghiên cứu những nội dung chính sau đây: • • • Nghiên cứu cơ sở lý thuyết tổng quan về nén ảnh, các kỹ thuật biến đổi và kỹ thuật lượng tử cùng cách thức áp dụng vào các giải pháp nén. Nghiên cứu phân tích từ lý thuyết đến thực nghiệm để xác định được nguyên nhân của các tồn tại trong một số giải pháp nén tiên tiến. Trên cơ sở đó đề ra định hướng nghiên cứu cải tiến Nghiên cứu phát triển một số các kỹ thuật như: kỹ thuật lượng tử hóa, kỹ thuật biến đổi ảnh, kỹ thuật phân phối bit,… làm 17 • Các kết quả trung gian của luận án • cơ sở xây dựng nên các giải pháp nén cải tiến, và là nền tảng cốt lõi để phát triển nên các giải pháp đề xuất mới. Nghiên cứu phát triển các giải pháp nén cải tiến cải thiện hiệu năng. Nghiên cứu phân tích và tổng hợp những ưu điểm trên các giải pháp nén hiện có và những đề xuất cải tiến của luận án, để từ đó nghiên cứu đề xuất một số giải pháp nén mới với hiệu năng cao hơn và hạn chế các khuyết điểm của những giải pháp đi trước. Hình 5.1. Sơ đồ quá trình đề xuất cải tiến và phát triển các giải pháp nén ảnh của luận án trên cơ sở kế thừa hai giải pháp AHIC và DAMS cùng một 18
- Xem thêm -