Tài liệu Nghiên cứu một số kỹ thuật nội suy ảnh

  • Số trang: 24 |
  • Loại file: PDF |
  • Lượt xem: 151 |
  • Lượt tải: 0
nganguyen

Đã đăng 34345 tài liệu

Mô tả:

HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG ---------------------------------------- NGUYỄN VĂN HẠT NGHIÊN CỨU MỘT SỐ KỸ THUẬT NỘI SUY ẢNH Chuyên ngành: Truyền dữ liệu và Mạng máy tính Mã số: 60.48.15 Người hướng dẫn khoa học: PGS. TS ĐỖ NĂNG TOÀN TÓM TẮT LUẬN VĂN THẠC SĨ KỸ THUẬT HÀ NỘI – 2012 1 PHẦN MỞ ĐẦU Trong những năm gần đây công nghệ thông tin phát triển với tốc độ chóng mặt về cả phần cứng và phần mềm. Sự phát triển của công nghệ thông tin đã thúc đẩy sự phát triển của nhiều lĩnh vực xã hội khác nhƣ y học, giáo dục, giải trí, kinh tế,… Sự phát triển của phần cứng cả về phƣơng diện thu nhận, hiển thị, cùng với tốc độ xử lý đã mở ra nhiều hƣớng mới cho sự phát triển phần mềm, đặt biệt là lĩnh vực xử lý ảnh và thâm nhập mạnh mẽ vào đời sống thực tế của con ngƣời. Ảnh thu đƣợc sau quá trình thu nhận ảnh hoặc các phép biến đổi không tránh khỏi nhiễu, khuyết thiếu hoặc không thể xử lý đƣợc các trƣờng hợp có độ phức tạp cao, hay không đƣa dữ liệu bề mặt vào một định dạng làm cho gọn và thích hợp để mô phỏng, hiển thị hoặc định vị. Sự sai sót này một phần bởi phần cứng, các thiết bị quang học và điện tử, kỹ năng sử dụng các thiết bị chƣa tốt, phần khác bởi bản thân các phép biến đổi không phải là toàn ánh, nên có sự ánh xạ thiếu hụt đến những điểm trên ảnh kết quả. Việc khắc phục những nhƣợc điểm này luôn là vấn đề đặt ra cho các hệ thống xử lý ảnh. Xuất phát trong hoàn ảnh đó luận văn lựa chọn đề tài: Nghiên cứu một số kỹ thuật nội suy ảnh có ý nghĩa khoa học và còn mang tính thực tiễn cao trong hoàn cảnh Việt Nam chƣa có nhiều hệ thống xử lý ảnh mà thực tế đang đặt ra những yêu cầu trong ứng dụng các đối tƣơng ảnh. Mục đích của đề tài Thứ nhất, tìm hiểu khái quát về xử lý ảnh, các kỹ thuật trong khâu xử lý ảnh. Nghiên cứu các kỹ thuật nội suy ảnh trong việc xử lý ảnh, trợ giúp cho việc nâng cao chất lƣợng ảnh, làm biến đổi, xử lý đƣợc các ảnh có độ phức tạp cao. Phục vụ cho các hoạt cảnh hoặc các ứng dụng chuyển động tƣơng tác trong xử lý ảnh. Thứ hai, trên cơ sở các kiến thức đã thu thập và nghiên cứu, tổng hợp các kỹ thuật để hƣớng đến ứng dụng thực tế cho các kỹ thuật tìm hiểu này. Căn cứ vào những vấn đề đã tìm hiểu và nghiên cửu của đề tài luận văn đƣợc chia làm 3 chƣơng: 2 CHƢƠNG 1: KHÁI QUÁT VỀ XỬ LÝ ẢNH VÀ NỘI SUY ẢNH Khái quát về xử lý ảnh , tìm hiểu những vấn đề cơ bản trong xử lý ảnh. khái niệm nội suy ảnh, nghiên cứu các vấn đề với nội suy ảnh. CHƢƠNG 2: MỘT SỐ KỸ THUẬT NỘI SUY ẢNH Nghiên cứu các kỹ thuật nội suy ảnh: Kỹ thuật nội suy ảnh dựa vào các điểm láng giềng, nội suy tuyến tính và nội suy sử dụng hàm cơ sở bán kính. CHƢƠNG 3: CHƢƠNG TRÌNH THỬ NGHIỆM Sử dụng kỹ thuật nội suy để chuyển hóa hình ảnh khuôn mặt 3D từ trạng thái cân bằng sang trạng thái tâm lý đích đã lựa chọn ở đầu vào. 3 CHƢƠNG 1: KHÁI QUÁT VỀ XỬ LÝ ẢNH VÀ NỘI SUY ẢNH 1.1 Khái quát về xử lý ảnh Quá trình xử lý ảnh là một quá trình thao tác biến đổi ảnh đầu vào nhằm cho ra kế t quả ảnh nhƣ mong muốn . Kế t quả đầ u ra của mô ̣t quá triǹ h xƣ̉ lý ảnh có thể là một ảnh “tốt hơn” hoặc một kết luâ ̣n. Ảnh “Tốt hơn” Ảnh đầu vào Xƣ̉ lý ảnh Kế t luâ ̣n Hình 1.1 Quá trình xử lý ảnh Nhƣ vâ ̣y mu ̣c tiêu của xƣ̉ lý ảnh có thể chia làm ba hƣớng nhƣ sau: Xƣ̉ lý ảnh ban đầ u để cho ra mô ̣t ảnh mới tôt hơn theo mon g muốn của ngƣời dùng, ví dụ ảnh mờ cầ n xƣ̉ lý để rõ nét hơn. Phân tích ảnh để thu đƣơ ̣c thông tin nào đó giúp cho viê ̣c phân loa ̣i và nhâ ̣n biế t ảnh. Ví dụ phân tích ảnh vân tay để trích chọn các đặc trƣng vân tay . Tƣ̀ ảnh đầ u vào mà có mức nhận xét, kế t luâ ̣n ở mƣ́c cao hơn, sâu hơn. Ví dụ ảnh một vụ tai nạn giao thông phác họa hiện trƣờng một vụ tai nạn. Ảnh có thể xem là tập hợp các điểm ảnh và mỗi điểm ảnh đƣợc xem nhƣ là đặc trƣng cƣờng độ sáng hay một dấu hiệu nào đó tại một vị trí nào đó của đối tƣơ ̣ng trong không gian. Sơ đồ tổng quát của mô ̣t hê ̣ thống xƣ̉ lý ảnh: Hệ quyết định Thu nhận ảnh Tiền xử lý Trích chọn đặc điểm Đối sánh rút ra kết luận Hậu xử lý Lƣu trữ Hình 1.2 Các bƣớc cơ bản trong một hệ thống xử lý ảnh 4 1.2 Những vấn đề cơ bản trong xử lý ảnh 1.2.1 Ảnh và điểm ảnh Điểm ảnh (pixel) đƣợc xem là dấu hiệu hay cƣờng độ sáng tại một tọa độ trong không gian của đối tƣợng. Mỗi pixel gồm một cặp tọa độ (x,y) và màu. Ảnh là tập hợp các điểm ảnh. Khi đƣợc số hóa, thƣờng đƣợc biểu diễn bằng mảng hai chiều I(n,p), trong đó n dòng và p cột. Ta nói ảnh gồm n×p pixels. Ngƣời ta thƣờng kí hiệu I(x,y) để chỉ một pixel. 1.2.2 Độ Phân giải của ảnh Định nghĩa: Độ phân giải của ảnh là mật độ điểm ảnh đƣợc ấn định trên một ảnh số đƣợc hiển thị. 1.2.3 Mức xám của ảnh Mức xám của điểm ảnh là cƣờng độ sáng của điểm ảnh đƣợc gán bằng giá trị số tại điểm đó. Trong biểu diễn số của các ảnh đa mức xám, một ảnh đƣợc biểu diễn dƣới dạng một ma trận hai chiều. Mỗi phần tử trong ma trận biểu diễn cho mức xám hay cƣờng độ sáng của ảnh tại vị trí đó. Mỗi phần tử trong ma trận đƣợc gọi là một phần tử ảnh hoặc điểm ảnh. Một điểm ảnh có hai đặc trƣng cơ bản là vị trí (x,y) của điểm ảnh và độ xám của nó. 1.2.4 Nắn chỉnh biến dạng Nắn chỉnh biến dạng là việc biến đổi hình học giữa hai ảnh: ảnh nguồn và ảnh đích. Sự biến đổi hình học đƣợc định nghĩa về mối quan hệ giữa các điểm ảnh nguồn và điểm ảnh đích. Thuật toán nắn chỉnh ảnh có hai khuynh hƣớng: tác động toàn cục hoặc tác động cục bộ. Tác động toàn cục là ta áp dụng thuật toán, tiêu chí nhƣ nhau đối với mọi điểm ảnh trên toàn bộ ảnh. Còn tác động cục bộ thì ta chỉ tác động trên các điểm ảnh ở một số vùng của ảnh, còn các vùng khác của ảnh ta giữ nguyên. Các thuật toán nắn chỉnh toàn cục có tốc độ xử lý tƣơng đối nhanh nhƣng chỉ áp dụng đƣợc với các yêu cầu đơn giản nhƣ co, giãn ảnh, bóp méo cả ảnh thành tứ giác hay một số hiệu ứng khác nhƣ mắt cá, kính núp,… 5 Thuật toán nắn chỉnh cục bộ cho kết quả ấn tƣợng hơn. Tuy nhiên để nắn chỉnh từng vùng, ta phải xác định thêm tập đặc trƣng. Trong trƣờng hợp này việc xây dựng thuật toán tƣơng đối phức tạp. a) Ảnh gốc b) Ảnh qua xử lý Hình 1.3 Ví dụ về nắn chỉnh hình biến dạng Nắn chỉnh biến dạng là một khâu trong xử lý ảnh. Với mỗi ảnh tùy theo mức độ, hiện trạng, và chủng loại ảnh mà ngƣời ta sử dụng ứng dụng nào cho phù hợp nhất trong xử lý ảnh. 1.2.5 Các kiểu ảnh a. Ảnh chỉ số Ảnh chỉ số sử dụng ánh xạ trực tiếp giữa giá trị của pixel ảnh tới giá trị trong bản đồ màu. Màu sắc của mỗi pixel ảnh đƣợc tính toán bằng cách sử dụng giá trị tƣơng ứng của X ánh xạ tới một giá trị chỉ số của bản đồ màu b. Ảnh cường độ Một ảnh cƣờng độ là một ma trận dự liệu ảnh mà giá trị của nó đại diện cho cƣờng độ trong một số vùng nào đó của ảnh. c. Ảnh nhi phân Trong một ảnh nhi phân, mỗi pixel chỉ chứa một trong hai giá trị nhị phân 0 hoặc 1. Hai giá trị này tƣơng ứng với bật hoặc tắt (on hoặc off). d. Ảnh RGB Một ảnh RGB đƣợc lƣu trữ dƣới dạng một mảng dữ liệu có kích thƣớc 3 chiều m×n×3 định nghĩa các giá trị màu red, green và blue cho mỗi pixel riêng biệt. 6 1.2.6 Quan hệ giữa các điểm ảnh Khi nội suy ảnh ta thƣờng tìm lân cận của điểm ảnh để xác định giá trị màu, phục vụ cho công việc nội suy tô màu hay lấp lỗ hổng. Giả sử một ảnh số đƣợc biểu diễn bằng hàm ƒ(x,y). Tập con của các điểm ảnh là s, cặp điểm ảnh có quan hệ với nhau là p, q. 1.2.7 Một số thuộc tính của ảnh a. Đường viền: Đƣờng viền của một vùng ảnh R là tập hợp các điểm ảnh trong vùng đó mà có một hay nhiều lân cận bên ngoài vùng R. b. Biên ảnh: Một điểm ảnh có thể đƣợc coi là biên nếu ở đó có sự thay đổi đột ngột về mức xám. Tập hợp các điểm biên tạo thành đƣờng bao của ảnh. 1.2.8 Toạ độ ảnh a. Toạ độ pixel Phƣơng pháp thuận tiện nhất cho việc biểu diễn vị trí trong một ảnh là sử dụng toạ độ pixel. Ở hệ toạ độ này, ảnh đƣợc xử lý nhƣ một lƣới của các phần tử riêng biệt đƣợc đánh thứ tự từ đỉnh tới đáy và từ trái sang phải. b. Toạ độ không gian Trong toạ độ không gian vị trí ảnh đƣợc định vị trên một mặt phẳng, chúng đƣợc mô tả bằng một cặp x và y (không phải r(hàng) và c(cột) nhƣ toạ độ pixel). 1.3 Nội suy ảnh 1.3.1 Khái niệm nội suy ảnh Trong toán học, nội suy là phƣơng pháp xây dựng các điểm mới dự liệu trong phạm vi của tập hợp những điểm rời rạc dữ liệu đã biết. Trong kỹ thuật và khoa học có một số điểm thu đƣợc bằng việc lấy mẫu hay thí nghiệm, sau đó ta xây dựng một chức năng cho gần gũi phù hợp với những điểm đó. Nội suy là một giải thuật phần mềm dùng để thêm vào (hoặc bỏ bớt) số điểm ảnh trên ảnh, nó làm thay đổi dung lƣợng của tập tin, nhƣng không thêm thông tin gì mới cho ảnh. Trong xử lý ảnh phép nội suy ảnh thƣờng đƣợc sử dụng trong các công đoạn nhƣ bóp méo, nắn chỉnh, lấp lỗ hổng hay trong sự phóng to của bức ảnh. 7 Các ứng dụng của nội suy bao gồm hình ảnh luân chuyển, mở rộng quy mô, độ phóng đại, nén hoặc tái tạo ảnh. Tiến trình nội suy dựa trên màu sắc của các điểm ảnh cũ để xác định màu cho các điểm ảnh mới gần nó nhất. Trong xử lý ảnh, ảnh có thể đƣợc mở rộng để chỉnh sửa chỉ tiết. 1.3.2 Các vấn đề với nội suy ảnh Để nhận đƣợc bức ảnh cỡ lớn mà chất lƣợng đảm bảo thì chúng ta cần tạo ra nhiều điểm ảnh (pixel). Quá trình tạo ra nhiều điểm ảnh hơn đƣợc gọi là nội suy. Điều này đƣợc thực hiện bởi phần mềm nội suy ảnh. Phần mềm nội suy ảnh phân tích các điểm ảnh trong một ảnh và thêm các điểm ảnh nhiều hơn dựa trên phân tích đó. 1.3.2.1 Nội suy không tạo mới dự liệu Khi phóng to ảnh, nội suy chỉ chèn thêm điểm ảnh (pixel) vào ảnh, số lƣợng điểm ảnh (pixel) lớn hơn chứ không tạo mới dự liệu. 1.3.2.2 Nội suy khắc phục hiện tƣợng răng cƣa Răng cƣa là thuật ngữ dùng để mô tả đƣờng thẳng hay đƣờng cong không trơn tru, lởm chởm. Do bản chất của ảnh, mỗi ảnh đƣợc tạo ra bởi một mạng lƣới các điểm ảnh. Nên các đƣờng thẳng và đƣờng cong trong ảnh không thực sự là đƣờng thẳng hay đƣờng cong trơn mà là mô hình răng cƣa của các điểm ảnh. 1.3.2.3 Nội suy là nguyên nhân làm mất độ sắc nét của ảnh Một hình ảnh có cạnh sắc nét, đẹp là có sự chuyển đổi ngẫu nhiên giữa màu đen và trắng. Khi nội suy thì việc chuyển đổi màu đen/trắng thành màu đen/xám/trắng một cách mềm mại hơn. Điều này đã làm giảm đi độ sắc nét của ảnh. 1.3.2.4 Nội suy có tính ƣớc lƣợng Nội suy hoạt động bằng cách sử dụng các dự liệu đƣợc biết đến để ƣớc tính giá trị tại các điểm chƣa rõ. 8 1.3.2.5 Nội suy còn xảy ra khi quay ảnh, bóp méo ảnh Phép nội suy ảnh xuất hiện trong mọi bức ảnh số tại giai đoạn nào đó nhƣ bóp méo, nắn chỉnh, lấp lỗ hổng hay trong sự phóng to bức ảnh. Nó xuất hiện bất cứ khi nào thay đổi kích thƣớc hay làm méo ảnh. Thay đổi kích cỡ Ảnh ban đầu Bóp méo Sau nội suy Hình 1.15 Minh họa ảnh khi phóng to và bóp méo sau khi nội suy Ngay cả khi cùng một hình ảnh thay đổi kích cỡ hoặc bóp méo đƣợc thực hiện, kết quả có thể khác nhau đáng kể tùy thuộc vào thuật toán nội suy. 1.3.3 Một số hướng tiếp cận nội suy ảnh Trong xử lý ảnh để có những bức ảnh nhƣ mong muốn ta cần phải hiểu ảnh cần xử lý thuộc loại nào và áp dụng phƣơng pháp nội suy ảnh nào cho phù hợp. Trong chƣơng này đã nghiên cứu khái quát về xử lý ảnh và nội suy ảnh.Chƣơng tiếp theo sẽ nghiên cứu cụ thể kỹ thuật nội suy láng giềng, nội suy tuyến tính và nội suy sử dụng hàm cơ sở bán kính. 9 CHƢƠNG 2: MỘT SỐ KỸ THUẬT NỘI SUY ẢNH Hầu hết các phần mềm xử lý ảnh đều sử dụng một hoặc nhiều phƣơng pháp nội suy trong quá trình biến đổi ảnh. Kết quả sau quá trình biến đổi ảnh thƣơng cho ảnh nhƣ mong muốn. Ảnh thƣờng mịn màng, trơn chu không bị vỡ hạt khi phóng to, thu nhỏ hay bóp méo ảnh. Kết quả ảnh sau khi xử lý còn phụ thuộc vào đối tƣợng xử lý và giải thuật nội suy. Điều quan trọng là trong giải thuật nội suy sẽ không thêm thông tin gì mới cho ảnh mà nó chỉ thêm điểm ảnh (pixel) và làm tăng dung lƣợng tập tin. Khi phóng to ảnh thƣờng ảnh bị vỡ hạt nên ta không thể in hay chỉnh sửa đƣợc. Khi đó muốn phóng to ảnh ngƣời ta thƣờng dùng phƣơng pháp chụp, rửa hình, dùng máy quét để quét ảnh với độ phân giải cao nhƣng làm nhƣ thế rất mất thời gian lại không kinh tế. Đến nay có nhiều nhà sản xuất phần mềm xử lý ảnh đã khắc phục đƣợc các vấn đề này bằng cách dùng các phƣơng pháp nội suy ảnh trong quá trình biến đổi ảnh. Nhiều phần mềm nội suy ảnh cho phép phóng to ảnh, bóp méo ảnh hay biến đổi ảnh, sinh ảnh trung gian mà ảnh vẫn trơn chu rõ nét. Mặc dù nội suy ảnh còn có những hạn chế nhƣng để có thể khắc phục những nhƣợc điểm của ảnh ta vẫn nên thực hiện nội suy ảnh để có đƣợc những bức ảnh tốt hơn. Chất lƣợng của hình ảnh phụ thuộc rất nhiều vào việc sử dụng giải thuật nội suy vì giải thuật nội suy chính là thuật toán xác định các giá trị màu sắc của điểm ảnh mới đƣợc tính toán. 2.1 Nội suy ảnh dựa vào các điểm láng giềng 2.1.1 Khái quát nội suy ảnh dựa vào các điểm láng giềng Trong số các phƣơng pháp thông thƣờng để cải thiện độ phân giải của hình ảnh, nội suy láng giềng gần nhất là một phƣơng pháp nội suy không gian phân bổ một giá trị điểm ảnh của một hình ảnh ban đầu, đó là gần nhất để một điểm ảnh mục tiêu giá trị điểm sẽ đƣợc phân bổ. 2.1.2 Phương pháp nội suy ảnh dựa vào các điểm láng giềng Phƣơng pháp nội suy hình ảnh dựa trên sự kết hợp của hai thủ tục khác nhau. Đầu tiên, một thuật toán thích nghi đƣợc áp dụng nội suy các giá trị điểm 10 ảnh tại địa phƣơng theo hƣớng thứ hai phát sinh để hình ảnh thấp. Giá trị sau đó nội suy đƣợc sửa đổi bằng cách sử dụng sàng lọc lặp đi lặp lại giảm thiểu sự khác biệt trong các dẫn xuất hình ảnh thứ hai để tối đa hóa giá trị để hàm bậc hai và đƣờng cong làm mịn. Các thuật toán đầu tiên của chính nó cung cấp hình ảnh cạnh bảo quản là đo đƣợc tốt hơn. Phƣơng pháp đầy đủ cung cấp nội suy hình ảnh với một diện mạo "tự nhiên" mà không trình bày các hiện vật ảnh hƣởng đến phƣơng pháp tuyến tính và phi tuyến. Kiểm tra khách quan và chủ quan về một loạt các hình ảnh tự nhiên rõ ràng cho thấy những ƣu điểm của kỹ thuật đề xuất trên phƣơng pháp tiếp cận hiện có. Hình ảnh mở rộng thƣờng là cần thiết cho một loạt các ứng dụng, chẳng hạn nhƣ in ấn, video, xử lý ảnh, lập bản đồ kết cấu cho mô hình, kỹ thuật đơn giản nhƣ nhân rộng pixel hoặc suy tuyến tính là không thỏa đáng do việc tạo ra các hiện vật trực quan nhƣ điểm ảnh, đƣờng nét lởm chởm. Để khắc phục những vấn đề này, các thuật toán mới tạo ra các hình ảnh với các cạnh sắc nét hơn. Một phƣơng pháp tối ƣu cung cấp các hình ảnh hợp lý tự nhiên và tạo tác. Mục đích phƣơng pháp hình ảnh mở rộng trong đó sử dụng thông tin địa phƣơng thứ hai để thích ứng và sàng lọc, lặp đi lặp lại có thể để loại bỏ các hiện vật trong khi vẫn giữ các tính năng hình ảnh có liên quan và kết cấu tự nhiên. 2.1.2.1 Kỹ thuật nội suy các điểm láng giềng xét lại Một số phƣơng pháp đã đƣợc đề xuất để đoán hợp lý mô hình độ phân giải cao từ các hình ảnh độ phân giải thấp ban đầu. Vấn đề là khá phức tạp, nói chung, không có gợi ý về các tín hiệu độ phân giải cao thực sự có sẵn. Các phƣơng pháp nội suy tinh vi nhất cố gắng để trích xuất thông tin thống kê về mối quan hệ giữa các hình ảnh độ phân giải cao và thấp từ một tập hợp đào tạo các hình ảnh tự nhiên (hoặc hình ảnh quan tâm). Trong phƣơng pháp lặp đi lặp lại dựa trên mức độ tập hợp và đƣờng cong, cƣờng độ liên tục làm mịn đƣợc áp dụng, cùng với một số quy tắc quảng cáo đặc biệt để ngăn chặn sự thay đổi trong cấu trúc liên kết và tác dụng phụ khác. Phƣơng pháp sử dụng chẩn đoán đơn giản để xác định hƣớng cạnh từ 4 điểm lân cận trong độ phân giải hình ảnh thấp và sau đó thêm nội suy điểm ảnh 11 thu đƣợc là trung bình có trọng số của những ngƣời hàng xóm, với trọng lƣợng tùy thuộc vào hƣớng cạnh. Một cách tiếp cận tƣơng tự cũng là cơ sở của kỹ thuật sử dụng một miếng vá lớn xung quanh 4 điểm để ƣớc tính trọng lƣợng. 2.1.2.2 Nội suy láng giềng dựa trên dẫn xuất hình ảnh thứ hai Phƣơng pháp phóng to hình ảnh xấp xỉ hệ số 2 bằng cách sao chép các pixel gốc (lập chỉ mục của i, j) vào một mạng lƣới mở rộng (lập chỉ mục bởi 2i, 2j) và sau đó điền khoảng cách với quy tắc dựa trên địa phƣơng cạnh thủ tục phân tích. Thủ tục thƣờng đƣợc thực hiện theo hai bƣớc: Bước 1: Điểm ảnh lập chỉ mục của hai giá trị lẻ (tối điểm ảnh trong hình 2.1.A) đƣợc tính nhƣ một trung bình có trọng số. Bước 2: Các lỗ còn lại (ví dụ nhƣ màu đen điểm ảnh trong hình 2.1.B) đƣợc làm đầy với cùng một quy tắc, nhƣ là một trung bình có trọng số của gần nhất 4 hàng xóm (theo hƣớng ngang và dọc). Hình 2.1 Hai bƣớc nội suy dựa vào cấu hình của bốn nƣớc láng giềng Phƣơng pháp sử dụng nhanh chóng bằng cách nhân rộng điểm ảnh tƣơng tự và lỗ điền phƣơng pháp tiếp cận là cực kỳ hiệu quả, thậm chí nếu chất lƣợng của các kết quả không phải tốt. Các điểm trung tâm thu đƣợc nội suy hai cái đối diện theo hƣớng mà sự khác biệt điểm ảnh thấp. Phƣơng pháp nội suy gồm hai thủ tục, đầu tiên là một phƣơng pháp dựa trên quy tắc lỗ điền đơn giản mà tính mẫu mới bằng cách nội suy theo hƣớng thứ tự hình ảnh thứ hai phái sinh là thấp hơn FCBI (Fast Curvature Based Interpolation). Thứ hai lọc các giá trị của các điểm ảnh nội suy thông qua một thuật toán lặp cố gắng để buộc phái sinh để thứ hai liên tục với một số hạn chế 12 bổ sung để bảo quản cạnh. Kết quả là một thuật toán nội suy mới mà chúng ta gọi ICBI (Iterative Curvature Based Interpolation) nội suy dựa trên độ cong lặp đi lặp lại. 2.1.2.3 Nội suy láng giềng dựa trên độ cong FCBI Phƣơng pháp này là tƣơng tự nhƣ các tam giác phụ thuộc dữ liệu, nhƣng thay vì có đƣợc các giá trị điểm ảnh mới bằng cách trung bình hai nƣớc láng giềng đối diện với sự khác biệt thấp hơn, ta tính toán các dẫn xuất thứ tự thứ hai trong hai hƣớng đƣờng chéo và nội suy hai điểm đối diện hàng xóm theo hƣớng nơi phái sinh thấp hơn. Bƣớc thứ hai đƣợc thực hiện trong cùng một cách, tính toán xấp xỉ của các dẫn xuất bậc hai hƣớng ngang và dọc. Ta chỉ tránh việc sử dụng các quy tắc đơn giản này khi dẫn xuất đầu tiên của cƣờng độ lớn hơn, các dẫn xuất lớn thứ hai đƣờng chéo để xác định hƣớng nội suy. Hình 2.2 Nội suy dựa trên một khu phố 12-pixel Hình ảnh thu đƣợc với phƣơng pháp này nhanh là tốt hơn so với phƣơng pháp có tốc độ tƣơng tự. Do đó, ta cải thiện các thuật toán bằng cách thêm một sàng lọc lặp đi lặp lại có thể để nâng cao chất lƣợng cạnh tại mỗi bƣớc nội suy bằng cách làm mịn các dẫn xuất thứ hai hƣớng giữ giá trị pixel. 13 2.1.2.4 Nội suy láng giềng lặp đi lặp lại ICBI Trong phần sau đây, mô tả các thủ tục và các điều kiện năng lƣợng đƣợc sử dụng cho các bƣớc nội suy đầu tiên lấp đầy những khoảng trống trong lƣới mở rộng tại các địa điểm (2i + 1; 2j + 1). Sau khi bƣớc thứ hai lỗ điền (gán giá trị cho tất cả các pixel trống còn lại), các thủ tục lặp đi lặp lại đƣợc lặp đi lặp lại một cách tƣơng tự, chỉ cần thay thế theo chiều ngang và chiều dọc và lặp đi lặp lại sửa đổi các giá trị của các điểm ảnh mới đƣợc thêm vào. 2.1.2.5 Nội suy láng giềng tự nhiên NN(Natural Neighbor Interpolation) Xây dựng mô hình độ cao (DEM) kỹ thuật số từ điểm dày đặc trở nên ngày càng quan trọng. Nội suy láng giềng tự nhiên NNI (Natural Neighbor Interpolation) là một phƣơng pháp phổ biến để DEM xây dựng từ bộ dữ liệu điểm nhƣng là tính toán chuyên sâu. Mô hình số độ cao (DEM) cần phải đƣợc tạo ra dựa trên các điểm quét qua DEM nội suy. Kết quả thƣờng đƣợc biểu diễn nhƣ là lƣới, nơi giá trị chiều cao (độ cao) đƣợc kết hợp với mỗi ô lƣới. a. Sơ đồ Voronoi của nội suy láng giềng tự nhiên Sơ đồ Voronoi là không gian phân hủy của một không gian dựa trên một tập hợp các điểm bằng cách sử dụng một khoảng cách. Ta xem xét sơ đồ Voronoi 2D, với một 2D không gian R2 và một tập hợp điểm S = {p1,…,pn} không gian có thể đƣợc chia thành một tập hợp các không gian con VorS (p) cho mỗi p ϵ S. b. Phương pháp nội suy láng giềng tự nhiên Nội suy láng giềng tự nhiên là một không gian nội suy đƣợc sử dụng rộng rãi. NNI dựa trên điểm ảnh trong một mặt phẳng 2D. Định nghĩa chính thức của nội suy láng giềng tự nhiên là nhƣ sau, cho một điểm truy vấn q trong không gian R2, và một tập hợp hữu hạn các điểm S trong R2 đó là láng giềng tự nhiên của q. Sau đó, nội suy láng giềng tự nhiên truy vấn trên q đƣợc định nghĩa là: v (q) =∑ wpv(p) (2.14) pϵ s Wp là trọng lƣợng của p, v là giá trị của điểm tƣơng ứng (trong trƣờng hợp này là nâng cao giá trị). Đề xuất xây dựng DEM dựa trên NNI cách tiếp 14 cận của chúng ta có hai thành phần. Các thành phần đầu tiên là để tạo ra sơ đồ Voronoi rời rạc từ các điểm bằng cách sử dụng một đại diện và thành phần thứ hai là để truy vấn các sơ đồ Voronoi cho mỗi điểm ảnh lƣới và tạo ra một DEM. c. Cột chuyển nhượng nội suy láng giềng tự nhiên Thiết kế ở đây hoạt động trên điểm ảnh bằng cách sử dụng quét song song trực tiếp. Chúng ta tiếp tục phân chia giao cột thành hai giai đoạn. Giai đoạn đầu tiên là để tạo ra một tập hợp cho mỗi cột. Và giai đoạn thứ hai là gán mỗi điểm với Voronoi tƣơng ứng 2D phối hợp sử dụng ứng cử viên của mỗi cột, đƣợc độc lập với nhau, mà không làm mất tính tổng quát chúng ta chỉ xem xét trƣờng hợp một cột. d. Xây dựng lưới DEM nội suy láng giềng tự nhiên Lƣới DEM đƣợc xây dựng dựa trên nội suy láng giềng tự nhiên cho mỗi điểm lƣới. Quá trình gán giá trị cho mỗi điểm lƣới nhƣ lƣới truy vấn. Để xem xét chất lƣợng của DEM, chúng ta cũng nên xem xét các khoảng trống trong dữ liệu gốc. Những khoảng trống đƣợc đánh dấu là "NO_DATA". Thay đổi các phƣơng pháp có thể đƣợc sử dụng để chế biến những khoảng trống này, hoặc trong tiền xử lý, chế biến sau hoặc trong quá trình nội suy. Kết luận nội suy láng riềng tự nhiên Trong mô tả thuật toán phƣơng trình đƣợc viết cho màu xám, tất nhiên, hình ảnh màu sắc có thể đƣợc mở rộng trong cùng một cách bằng cách lặp lại các thủ tục một cách độc lập cho mỗi thành phần màu hoặc hệ số nội suy tính toán độ sáng hình ảnh và sử dụng chúng cho tất cả các kênh, giảm bằng cách này, chi phí tính toán và đồ tạo tác màu tránh đặt màu nguyên gốc trong lƣới mở rộng tại các địa điểm (2i, 2j) Chèn điểm ảnh tại các địa điểm (2i +1, 2j+1) với phƣơng pháp FCBI áp dụng lặp đi lặp lại điều chỉnh cho đến khi sự thay đổi hình ảnh trên một ngƣỡng hoặc số lần lặp lại tối đa đạt đƣợc. Chèn điểm ảnh trong các địa điểm còn lại với phƣơng pháp FCBI áp dụng lặp đi lặp lại 4 điều chỉnh để các điểm ảnh tăng. Lặp lại toàn bộ thủ tục về hình ảnh mới cho to hơn nữa. 15 Vậy việc xây dựng DEM lƣới, hai phần của giải pháp đề xuất bao gồm cả thế hệ sơ đồ Voronoi và các truy vấn lƣới, đáng kể tốt hơn NNI cho lƣới điện dựa trên NNI DEM xây dựng. 2.2 Nội suy tuyến tính (Linear interpolation) Nội suy là một phƣơng pháp xác định giá trị của một điểm dữ liệu không rõ dựa trên các giá trị của các điểm dữ liệu đƣợc biết xung quanh. Nội suy tuyến tính là một phƣơng pháp nội suy đơn giản, cho rằng một đƣờng thẳng (tuyến tính) mối quan hệ giữa các điểm đã biết, về cơ bản nó có nghĩa là trung bình hai tỷ lệ trên. Nội suy tuyến tính Có nhiều ứng dụng cần thiết phải phóng đại một vùng của ảnh. Có nghĩa là lấy một vùng của ảnh đã cho và cho hiện lên nhƣ một ảnh lớn. Có 2 phƣơng pháp đƣợc dùng là lặp (Replication) và nội suy tuyến tính (linear interpolation). 2.2.1 Nội suy theo phương pháp lặp Ngƣời ta lấy một vùng của ảnh kích thƣớc M × N và quét theo hàng. Mỗi điểm ảnh nằm trên đƣờng quét sẽ đƣợc lặp lại 1 lần và hàng quét cũng đƣợc lặp lại 1 lần nữa. 2.2.2 Thuật toán nội suy tuyến tính Thực hiện nội suy tuyến tính giữa hai điểm đã biết. Trƣớc tiên, các điểm ảnh theo hàng. Tiếp theo, mỗi điểm ảnh dọc theo cột đƣợc nội suy theo đƣờng thẳng. Nếu biết trƣớc hai điểm thì nội suy tuyến tính là đƣờng thẳng nối hai điểm đó, điểm nội suy chính là điểm giữa của hai điểm đã biết. 2.2.3 Nội suy tuyến tính hàm bậc nhất Nội suy tuyến tính sử dụng một đa thức tuyến tính nhƣ chức năng nội suy. Giữa hai điểm, (x[1], y[1]) và (x[2], y[2]) với x[1] < x[2], ta suy ra một đa thức tuyến tính của biểu mẫu. ƒ(x)=β2x + β1 (2.21) 2.2.4 Nội suy tuyến tính hàm bậc hai Nội suy bậc hai sử dụng một đa thức bậc hai nhƣ chức năng nội suy của nó. Giả sử chúng ta muốn nội suy đa thức bậc hai giữa 5 điểm. K (x1 [k] 16 ,x2[k]) y[k] 1 (1,1) 2 2 (2,3) 2 3 (2,5) 5 4 (4,2) 1 5 (5,5) 6 Bảng 5 điểm thông qua đó để suy một đa thức bậc hai. Hình thức chung của một đa thức bậc hai từ R2 đến R là ƒ(x1,x2) = β6x1x2 + β5x21 + β4x22 + β3x1 + β2x2 + β1 (2.25) Giải (2.25) hằng số βj dựa trên năm điểm (x[k],x[k]) của bảng trên sẽ đòi hỏi một hệ thống các phƣơng trình trong 6 ẩn số. 2.2.5 Nội suy tuyến tính giữa hai đường Hãy xem xét một chức năng hai chiều y (x, z), và giả sử rằng đối với bất kỳ giá trị cố định của z có một mối quan hệ tuyến tính giữa x và y. Nói cách khác, chức năng có thể đƣợc viết dƣới dạng: Y(x,z) = a(z)x + b(z) (2.35) Cho một số chức năng một chiều a(z) và b(z), đại diện cho bất kỳ giá trị của z "độ dốc" và "đánh chặn" của y là một chức năng của x. Kết luận nội suy tuyến tính Phƣơng pháp nội suy tuyến tinh là phƣơng pháp đơn giản và tính toán nhanh, tốc độ phụ thuộc vào số lƣợng quét, nhƣng thƣờng không đủ tinh vi để có hiệu quả nội suy trạm dữ liệu vào một lƣới. Nhƣợc điểm của phƣơng pháp nội suy tuyến tính là không ổn định nếu mật độ lƣới điện cao. Nội suy tuyến tính thƣờng đƣợc dùng để tập hợp dữ liệu đồng đều khoảng cách đều nhau. 2.3 Nội suy sử dụng hàm cơ sở bán kính Hàm cơ sở bán kính RBF là hàm có giá trị chỉ phụ thuộc vào khoảng cách d của một điểm p trung tâm c. Hầu hết hàm cơ sở bán kính mất thêm một tham số, ví dụ hàm Gaussian có chiều rộng của đƣờng cong nhƣ một tham số. Số lƣợng lớn các RBF có sẵn và các thông số khác nhau của họ, làm cho nội suy RBF rất linh hoạt. 17 2.3.1 Khái quát về hàm cơ sở bán kính RBF Muốn khắc phục những hạn chế của ma trận khoảng cách nội suy, nhƣng giữ cấu trúc tổng thể ta kết hợp tính toán ma trận khoảng cách với các hàm cơ bản tốt. Định nghĩa: Hàm Φ: Rs  R đƣợc gọi là hàm bán kính nếu tồn tại hàm đơn biến φ: [0, +∞)  R Thỏa mãn: ( X )   (r ) (2.47) Với r x Và ||.|| là một số chỉ tiêu trên Rs, thƣờng chỉ tiêu Euclide. Hàm φ tƣơng ứng gọi là hàm cơ sở bán kính. Nhƣ vậy cho một hàm bán kính ||X1|| = ||X2||  (X1) = (X2), X1, X2  RS (2.48) 2.3.2 Các thuộc tính của hàm cơ sở bán kính RBF Bất biến theo tất cả các biến đổi Euclide (tức là, bản dịch, quay, và phản xạ). Nó không quan trọng cho dù lần đầu tiên tính toán RBF sau đó áp dụng cách chuyển Euclide, hoặc nếu lần đầu tiên chuyển đổi dữ liệu. Thật sự kể từ khi chuyển đổi Euclide đƣợc đặc trƣng bởi ma trận chuyển đổi trực giao và do đó 2 tiêu chuẩn bất biến. Bất biến theo luân chuyển, dịch thuật và phản ánh là thƣờng mong muốn trong các ứng dụng. 2.3.3 Nội suy sử dụng hàm bán kính cơ sở RBF Thay vì ma trận khoảng cách bây giờ chúng ta sử dụng một hàm cơ sở xuyên tâm mở rộng để giải quyết các vấn đề nội suy dữ liệu phân tán giả định N  Pf ( x)   Ck x  xk k 1 2 , x  RS (2.60) 18 Sử dụng các điều kiện nội suy pƒ(xi) = f(xi), i= 1, . . ., N, chúng tôi nhận đƣợc ck từ   x 1  x 1 2   x 1  x 2    x 2  x 1 2   x 2  x 2      x N  x 1 2   x N  x 2 2   2  2      x 1  x N  x 2  x N   x N  x N     C1   f ( x 1 )   C   f (x )  2  2  2           C N   f (x N )  2  2 (2.61) 2.3.4 Phép nội suy thời gian và bù chuyển động Phép nội suy có bù chuyển động có ứng dụng trong việc thay đổi nhịp khung. Sự thay đổi nhịp khung có thể phối hợp với việc thay đổi thang thời gian của âm thanh để thay đổi độ dài của ảnh động của chƣơng trình. Với một số cảnh điển hình sự thay đổi nhịp khung của video qua phép nội suy bù chuyển động có thể tạo ra tín hiệu video có chất lƣợng so sánh đƣợc với tín hiệu gốc. Kết luận nội suy sử dụng hàm cơ sở bán kính RBF Hàm cơ sở bán kính khôi phục lại các bề mặt nhẵn, đa tạp từ tập các điểm dữ liệu tập trung và phục hồi các lƣới điểm không đầy đủ. Sự hỗ trợ này sinh ra các lƣới đều và chúng ta thấy sự biểu diễn RBF có các lợi ích cho việc rút gọn lƣới và sự áp dụng lại lƣới. Bản chất hàm số biểu diễn bằng hàm RBF cung cấp các triển vọng mới cho các thuật toán cân chỉnh bề mặt, rút gon lƣới, nén và các thuật toán làm nhẵn. 19 CHƢƠNG 3: CHƢƠNG TRÌNH THỬ NGHIỆM 3.1 Bài toán Biểu diễn khuôn mặt có rất nhiều ứng dụng trong cuộc sống. Đây cũng là bài toán có tính tƣơng tác ngƣời máy, tính hoạt ảnh đóng vai trò tích cực trong ứng dụng cài đặt. Bài toán sử dụng phƣơng pháp nội suy ảnh để biểu diễn trạng thái hoạt hóa của khuôn mặt. Biểu diễn khuôn mặt là quan trọng và cần thiết cho bất kỳ hệ thống xử lý tƣơng tác nào nhƣ các chƣơng trình huấn luyện, biểu thị thông tin, chữa bệnh, giáo dục, giải trí…Nhiệm vụ của hệ thống thể hiện khuôn mặt nhằm biểu thị sinh động tính hoạt ảnh, từ đó mô phỏng chính xác, sinh động thế giới thực, rút trích ra những tri thức hữu ích phục vụ thực tiến.  Đầu vào: Mô hình mặt 3D ở trạng thái mặt cân bằng và trạng thái tâm lý đích cần biểu diễn  Đầu ra: Hình ảnh chuyển hóa khuôn mặt 3D từ trạng thái cân bằng sang trạng thái tâm lý đích đã lựa chọn ở đầu vào 3.2 Phân tích bài toán Thực chất của quá trình hoạt hóa mặt, đó là hoạt hóa các thành phần mô phỏng khuôn mặt. Chúng ta sẽ áp dụng để xây dựng khung hình cho mặt, quá trình hoạt hóa khuôn mặt là quá trình biến đổi các khung hình phù hợp theo thời gian, cách làm này cho phép chúng ta tạo nên những thể hiện đa dạng trong cùng một trạng thái cảm xúc, quá trình quan sát và biến đổi sẽ thực tế hơn. Quá trình hoạt hóa mặt đƣợc biến đổi từ trạng thái tự nhiên sang trạng thái đích, đứng trên một phƣơng diện nào đó thì các trạng thái làm trơn đều có thể coi là trạng thái đích vì nó phù hợp với đa dạng nét mặt trong thực tế. Bài toán biểu diễn trạng thái khuôn mặt dựa bao gồm những vấn đề chính đó là: Bƣớc 1: Xây dựng mô hình hóa khuôn mặt bằng mô hình 3D. Bƣớc 2: Hoạt hóa khuôn mặt thể hiện trạng thái biểu cảm, bằng các cử động của vùng đặc trƣng. Nhƣ vậy đầu vào của bài toán là mô hình khuôn mặt 3D chƣơng trình có nhiệm vụ tác động lên mô hình này để tạo nên sự hoạt ảnh 3D thể hiện đƣợc nét mặt dựa trên những đặt trƣng rõ nhất của cảm xúc nét mặt.
- Xem thêm -