Đăng ký Đăng nhập
Trang chủ Áp dụng độ đo entropy cho bài toán tách đặc trưng của bọt khí trên video và đề x...

Tài liệu Áp dụng độ đo entropy cho bài toán tách đặc trưng của bọt khí trên video và đề xuất kết hợp svm cho vấn đề tự động theo dõi sục khí tại trạm quan trắc môi trường

.PDF
63
1
128

Mô tả:

UBND TỈNH BÌNH DƯƠNG TRƯỜNG ĐẠI HỌC THỦ DẦU MỘT  TRỊNH VĂN DŨNG ÁP DỤNG ĐỘ ĐO ENTROPY CHO BÀI TOÁN TÁCH ĐẶC TRƯNG CỦA BỌT KHÍ TRÊN VIDEO VÀ ĐỀ XUẤT KẾT HỢP SVM CHO VẤN ĐỀ TỰ ĐỘNG THEO DÕI SỤC KHÍ TẠI TRẠM QUAN TRẮC MÔI TRƯỜNG CHUYÊN NGÀNH: HỆ THỐNG THÔNG TIN Mã ngành: 8480104 LUẬN VĂN THẠC SỸ BÌNH DƯƠNG – NĂM 2019 i UBND TỈNH BÌNH DƯƠNG TRƯỜNG ĐẠI HỌC THỦ DẦU MỘT  TRỊNH VĂN DŨNG MSHV: 1694801040007 ÁP DỤNG ĐỘ ĐO ENTROPY CHO BÀI TOÁN TÁCH ĐẶC TRƯNG CỦA BỌT KHÍ TRÊN VIDEO VÀ ĐỀ XUẤT KẾT HỢP SVM CHO VẤN ĐỀ TỰ ĐỘNG THEO DÕI SỤC KHÍ TẠI TRẠM QUAN TRẮC MÔI TRƯỜNG CHUYÊN NGÀNH: HỆ THỐNG THÔNG TIN Mã ngành: 8480104 LUẬN VĂN THẠC SỸ NGƯỜI HƯỚNG DẪN KHOA HỌC: TS. HOÀNG MẠNH HÀ BÌNH DƯƠNG – NĂM 2019 ii LỜI CAM ĐOAN Tôi xin cam đoan luận văn “Áp dụng độ đo entropy cho bài toán tách đặc trưng của bọt khí trên video và đề xuất kết hợp SVM cho vấn đề tự động theo dõi sục khí tại trạm quan trắc môi trường” là công trình nghiên cứu của riêng tôi dưới sự định hướng của và hướng dẫn của Thầy TS Hoàng Mạnh Hà. Mọi thông tin và dữ liệu được sử dụng trong luận văn đều có nguồn gốc rõ ràng, tuân thủ đúng nguyên tắc. Các kết quả nghiên cứu được trình bày trong luận văn được là hoàn toàn trung thực, không vi phạm bất cứ điều gì trong luật sở hữu trí tuệ và pháp luật Việt Nam. Nếu sai, tôi hoàn toàn chịu trách nhiệm trước pháp luật. Thủ Dầu Một, ngày … tháng … năm 2019 Tác giả luận văn: Trịnh Văn Dũng i LỜI CẢM ƠN Luận văn này được hoàn thành tại Trường Đại học Thủ Dầu Một dưới sự hướng dẫn tận tình của Thầy TS Hoàng Mạnh Hà. Lời đầu tôi xin bày tỏ lòng biết ơn đến Thầy TS Hoàng Mạnh Hà, Giảng viên Trường Đại học Thủ Dầu Một đã tâm giảng dạy, hướng dẫn và đưa ra những góp ý, điều chỉnh vô cùng xác thực cho luận văn, đồng thời Thầy cũng cho tôi những lời động viên quý báu giúp tôi có những định hướng đúng đắn để hoàn thành luận văn này. Tôi cũng xin gửi lời cảm ơn chân thành đến toàn thể quý Thầy, Cô là giảng viên giảng dạy tại Trường Đại học Thủ Dầu Một đã tận tình giảng dạy, truyền đạt những kiến thức quý báu và tạo điều kiện thuận lợi cho tôi trong suốt quá trình học tập, nghiên cứu và khi thực hiện luận văn. Nhân đây tôi cũng xin gửi lời cảm ơn đến bạn bè cùng khóa, bạn bè cùng chuyên môn, đồng nghiệp đã nhiệt tình hỗ trợ những thông tin, chia sẻ những kiến thức cũng như kinh nghiệm giúp cho việc thực hiện luận văn. Trân trọng! Tác giả luận văn: Trịnh Văn Dũng ii TÓM TẮT Ngày nay, để có được môi trường trong sạch mà đặc biệt là môi trường nước, ngành công nghiệp xử lý nước sạch đang được nhà nước và cộng đồng quan tâm sâu sắc. Để có được nguồn nước sạch, người ta cần cải tạo môi trường và hệ sinh thái bằng cách nuôi những con vi sinh trong những cái bể lớn nhằm cung cấp vi sinh cho những chỗ nước bị nhiễm bẩn, hệ sinh thái bị biến đổi. Trong quá trình nuôi vi sinh người ta cần phải sục khí liên tục vào bể để cung cấp đủ oxi để nuôi sống vi sinh, nếu không được sục khí thường xuyên thì những con vi sinh sẽ không thể sống được do thiếu oxi. Xuất phát từ thực tế này, chúng ta cần có những phần mềm để theo dõi và giám sát xem bể nuôi vi sinh có được sục khí liên tục hay không. Trong đó, vấn đề liên quan đến xử lý video, xử lý frame ảnh và nhận dạng frame ảnh trong video sẽ phục vụ cho nhu cầu phát hiện và cảnh báo vấn đế không có bọt khí (khi bể không được sục khí) thông qua việc giám sát tự động bởi các camera. Với nhu cầu trên, được sự hướng dẫn của Thầy TS. Hoàng Mạnh Hà, tôi tiến hành nghiên cứu và thực nghiệm đề tài “Áp dụng độ đo entropy cho bài toán tách đặc trưng của bọt khí trên video và đề xuất kết hợp SVM cho vấn đề tự động theo dõi sục khí tại trạm quan trắc môi trường”. Trong khuôn khổ của luận văn này, tôi đã tìm hiểu, nghiên cứu một số phương pháp xử lý trích chọn đặc trưng, đồng thời cài đặt thử nghiệm và đề xuất theo hai hướng sau: - Hướng thứ nhất: Trích chọn đặc trưng bằng việc xác định độ đo Entropy cho các điểm ảnh (pixel) để xác định độ bất định cho các điểm ảnh có khả năng là bọt khí hay không bọt khí cho ảnh. Đồng thời kết hợp Fuzzy Logic để khử những pixel ảnh không rõ ràng là bọt khí hay không (trường hợp Entropy gần bằng 0). Sau đó sử dụng phép biến đổi Wavelet Haar để thu gọn kích thước dữ liệu ảnh về một dạng nhỏ mà tại đây vẫn giữ lại đủ các thông tin quan trọng cho các điểm ảnh. Từ đây, có được những tập ảnh mang đặc trưng tốt nhất để phục vụ cho huấn luyện phân lớp mẫu ảnh phục vụ cho bài toán nhận dạng ảnh bọt khí. - Hướng thứ hai: Trích chọn đặc trưng bằng việc sử dụng kỹ thuật tìm biên ảnh Gradient (sử dụng một số toán tử như: Roberts, Prewitt, Sobel, Canny) dựa vào tính giá trị cực đại và cực tiểu của đạo hàm bậc nhất của ảnh. Từ đó so sánh, đánh giá các kết quả và chọn ra phương pháp tìm biên phù hợp nhất là Canny (còn gọi là bộ lọc Canny), mang lại những ảnh có chất lượng biên tốt nhất để huấn luyện phân lớp. Với ảnh đã trích chọn đặc trưng ở 2 hướng trên, tôi đã tiến hành cài đặt thực nghiệm và tiếp cận phương pháp học SVM để huấn luyện phân lớp mẫu. Đồng thời kiểm thử phân lớp và nhận dạng với frame ảnh từ 4 video clip (trên dưới 10.000 frame ảnh cho mỗi clip) tương ứng 4 trạm từ đơn vị quan trắc môi trường Bình Dương, cụ thể như sau: - Đối với hướng thứ nhất: Huấn luyện cho 80 tập (mỗi tập là 100 ảnh) dữ liệu ảnh (40 tập cho ảnh bọt khí và 40 tập cho ảnh không bọt khí) lấy đều theo thời gian và số lượng, trích xuất từ 4 video clip trên. Đồng thời cũng thử nghiệm test kiểm thử cho các tập ảnh không được huấn luyện cũng từ 4 video clip ở 4 trạm khác nhau và đạt được kết quả phân loại với độ chính xác cao. iii - Đối với hướng thứ hai: Huấn luyện cho 200 ảnh (100 ảnh có bọt khí và 100 ảnh không có bọt khí) lấy đều theo thời gian và số lượng, trích xuất từ 4 video clip trên. Đồng thời cũng thử nghiệm test nhận dạng cho 4 video clip ở 4 trạm khác nhau (tương ứng 8805 frame ảnh cho mỗi clip) và đạt được kết quả nhận dạng đúng 100%. Như vậy, qua quá trình nghiên cứu và kết quả thực nghiệm tôi đề xuất với hai phương pháp trích chọn đặc trưng: Một là ứng dụng độ đo Entropy kết hợp Fuzzy Logic và Wavelet Haar để đưa ra những ảnh có đặc trưng tốt nhất cho huấn luyện phân lớp; Hai là ứng ứng dụng bộ lọc Canny để tìm ra những đường biên tốt nhất cho ảnh cho huấn luyện phân lớp. Từ đó có thể huấn luyện phân lớp và có được mô hình phân lớp mẫu tốt nhất nhằm sử dụng cho bài toán nhận dạng ảnh bọt khí /không bọt khí ứng dụng cho việc quản lý, giám sát quá trình sục khí cho các bể nuôi vi sinh. Đồng thời có thể giúp cho các đơn vị quan trắc môi trường hay các công ty sản xuất có nước xả thải có thể xử lý tốt hơn trước khi xả thải ra môi trường. Đặc biệt là đối với hướng ứng dụng bộ lọc canny được cài đặt trên Visual Studio C++ và sử dụng thư viện mã nguồn mở OpenCV có kết quả nhận dạng với độ chính xác rất cao (100%) và thuận tiện cho việc xây dựng ứng dụng người dùng, có thể đưa vào ứng dụng thực tế được ngay cho các camera giám sát bể nuôi vi sinh. iv MỤC LỤC LỜI CAM ĐOAN .................................................................................................................. i LỜI CẢM ƠN ....................................................................................................................... ii TÓM TẮT ............................................................................................................................ iii MỤC LỤC ............................................................................................................................. v DANH MỤC CÁC HÌNH VÀ ĐỒ THỊ............................................................................. viii DANH MỤC CÁC BẢNG................................................................................................... ix PHẦN MỞ ĐẦU ................................................................................................................... 1 Chương 1: TỔNG QUAN VỀ XỬ LÝ VÀ NHẬN DẠNG ẢNH....................................... 3 1.1. CÁC KHÁI NIỆM CƠ BẢN VỀ ẢNH ......................................................................... 3 1.1.1. Khái niệm về ảnh (Image) ..................................................................................... 3 1.1.2. Điểm ảnh (Picture element hay Pixel) ................................................................... 3 1.1.3. Độ phân giải ảnh (Image resolution) ..................................................................... 4 1.1.4. Cường độ sáng của một ảnh tại một điểm ảnh (Brightness intensity)................... 4 1.1.5. Mức xám của ảnh (Gray image) ............................................................................ 4 1.1.6. Ảnh nhị phân (Binary image) ................................................................................ 5 1.1.7. Ảnh màu (Color image) ......................................................................................... 5 1.1.8. Quan hệ giữa các điểm ảnh.................................................................................... 5 1.1.9. Biên ảnh (Image boundary) ................................................................................... 6 1.2. GIỚI THIỆU CHUNG VỀ XỬ LÝ VÀ NHẬN DẠNG ẢNH ...................................... 6 1.2.1. Thu nhận ảnh (Image acquisition) ......................................................................... 7 1.2.2. Số hóa ảnh (Image digitalizer) .............................................................................. 7 1.2.3. Tiền xứ lý ảnh (Image processing) ........................................................................ 7 1.2.3.1. Lọc nhiễu....................................................................................................... 8 1.2.3.1. Mức xám đồ .................................................................................................. 9 1.2.4. Phân tích và trích chọn đặc trưng ảnh (Image analysis and Feature extraction) . 10 1.2.4.1. Giới thiệu chung về phân tích ảnh .............................................................. 10 1.2.4.2. Tiêu chuẩn hoá và trích chọn đặc trưng ảnh ............................................... 10 1.2.4.3. Kỹ thuật tìm biên ảnh (Image boundary) .................................................... 11 1.2.4.4. Độ đo Entropy ............................................................................................. 15 1.2.4.5. Fuzzy Logic................................................................................................. 18 1.2.4.6. Phép biến đổi Wavelet ................................................................................ 21 v 1.2.5. Phân lớp (Classfication) ...................................................................................... 22 1.2.6. Nhận dạng và nội suy ảnh (Image recognition and Interpretation) ..................... 22 1.2.6.1. Giới thiệu chung về nhận dạng ................................................................... 23 1.2.6.2. Phương pháp số nhận dạng ảnh .................................................................. 23 Chương 2: NGHIÊN CỨU PHƯƠNG PHÁP GIẢI QUYẾT BÀI TOÁN NHẬN DẠNG BỌT KHÍ ............................................................................................................................. 25 2.1. XÂY DỰNG BÀI TOÁN NHẬN DẠNG BỌT KHÍ .................................................. 25 2.1.1. Quá trình xử lý ảnh .............................................................................................. 25 2.1.2. Quá trình huấn luyện phân lớp mẫu .................................................................... 27 2.1.3. Quá trình nhận dạng ............................................................................................ 27 2.2. VẤN ĐỀ TRÍCH CHỌN ĐẶC TRƯNG CHO ẢNH BỌT KHÍ................................. 28 2.2.1. Sử dụng Entropy kết hợp Fuzzylogic và Wavelet ............................................... 28 2.2.2. Sử dụng phương pháp tìm biên ảnh ..................................................................... 29 2.3. VẤN ĐỀ PHÂN LỚP CHO DỮ LIỆU ẢNH BỌT KHÍ ............................................. 30 2.3.1. Huấn luyện mô hình phân lớp dữ liệu ảnh .......................................................... 30 2.3.2. Phân lớp dữ liệu ảnh – Thử nghiệm mô hình ...................................................... 30 2.4. PHƯƠNG PHÁP SVM CHO BÀI TOÁN NHẬN DẠNG BỌT KHÍ ........................ 31 2.4.1. Giới thiệu chung về SVM .................................................................................... 31 2.4.2. SVM cho bài toán 2 lớp ....................................................................................... 32 2.4.3. Xây dựng bài toán tối ưu cho SVM 2 lớp bọt khí ............................................... 34 2.4.4. Ưu điểm của SVM cho phân lớp ảnh bọt khí ...................................................... 35 Chương 3: THỰC NGHIỆM VÀ ĐỀ XUẤT ỨNG DỤNG PHƯƠNG PHÁP TRÍCH CHỌN ĐẶC TRƯNG ẢNH CHO BÀI TOÁN NHẬN DẠNG ẢNH BỌT KHÍ .............. 36 3.1. MÔI TRƯỜNG CÀI ĐẶT VÀ CÔNG CỤ SỬ DỤNG .............................................. 36 3.2. DỮ LIỆU VÀ XÂY DỰNG TẬP DỮ LIỆU ẢNH BỌT KHÍ .................................... 36 3.3. ỨNG DỤNG ĐỘ ĐO ENTROPY KẾT HỢP FUZZY LOGIC VÀ WAVELET CHO TRÍCH CHỌN ĐẶC TRƯNG BỌT KHÍ ........................................................................... 37 3.4. ỨNG DỤNG BỘ LỌC CANNY CHO TRÍCH CHỌN ĐẶC TRƯNG ẢNH BỌT KHÍ ............................................................................................................................................. 39 Chương 4: THỰC NGHIỆM ÁP DỤNG PHƯƠNG PHÁP SVM VÀO BÀI TOÁN THEO DÕI VẤN ĐỀ SỤC KHÍ CHO BỂ NUÔI VI SINH .......................................................... 43 4.1. MÔI TRƯỜNG CÀI ĐẶT VÀ CÔNG CỤ SỬ DỤNG .............................................. 43 4.2. ÁP DỤNG SVM TRÊN ẢNH ĐƯỢC TRÍCH CHỌN ĐẶC TRƯNG DỰA TRÊN ĐỘ ĐO ENTROPY KẾT HỢP FUZZY LOGIC VÀ WAVELET ........................................... 43 vi 4.2.1. Huấn luyện và xây dựng mô hình phân lớp......................................................... 43 4.2.2. Thực hiện kiểm thử với mô hình ......................................................................... 43 4.2.3. Kết quả thực nghiệm và đánh giá ........................................................................ 44 4.3. ÁP DỤNG SVM TRÊN ẢNH ĐƯỢC TRÍCH CHỌN ĐẶC TRƯNG DỰA TRÊN BỘ LỌC CANNY...................................................................................................................... 45 4.3.1. Huấn luyện và xây dựng mô hình ........................................................................ 45 4.3.2. Thực hiện nhận dạng với mô hình ....................................................................... 46 4.2.3. Kết quả thực nghiệm và đánh giá ........................................................................ 46 4.4. KẾT LUẬN CHUNG VÀ ĐỀ XUẤT ......................................................................... 48 TÀI LIỆU THAM KHẢO................................................................................................... 51 vii DANH MỤC CÁC HÌNH VÀ ĐỒ THỊ Hình 1.1: Minh hoạ các bước cơ bản trong một hệ thống xử lý và nhận dạng ảnh. ............ 7 Hình 1.2: Một số kiểu đường biên ảnh thông dụng ............................................................ 11 Hình 1.3: Cửa sổ mặt nạ dùng cho toán tử Sobel ............................................................... 13 Hình 1.4: Cửa sổ mặt nạ dùng cho toán tử Prewitt ............................................................ 14 Hình 1.5: Cửa sổ mặt nạ dùng cho toán tử Roberts ........................................................... 14 Hình 1.6: Ví dụ về các hàm thuộc khác nhau số tập mờ số gần 2 ...................................... 20 Hình 1.7: Ví dụ các tập mờ tốc độ chậm, tốc độ trung bình, tốc độ nhanh. ....................... 20 Hình 1.8: Ví dụ các tập mờ ở dạng hình tam giác .............................................................. 20 Hình 1.9: Hàm ψ (t) của biến đổi Haar .............................................................................. 22 Hình 2.1: Mô hình chung cho bài toán nhận dạng bọt khí. ................................................ 25 Hình 2.2: Biểu diễn tính Entropy các pixel ảnh qua 1 tập ảnh. ......................................... 29 Hình 2.3: Minh hoạ hàm Activation. .................................................................................. 29 Hình 2.4: Hàm ψ (t) của biến đổi Haar .............................................................................. 29 Hình 2.5: Mô hình phân lớp ảnh cho bài toán nhận dạng bọt khí ..................................... 30 Hình 2.6: Mô tả 1 không gian nhiều điểm cho SVM tuyến tính .......................................... 32 Hình 2.7: Mô tả siêu phẳng cho SVM tuyến tính ................................................................ 32 Hình 2.8: Các mặt phân cách hai lớp cho bài toán SVM 2 lớp .......................................... 33 Hình 2.9: Margin của hai lớp là bằng nhau và lớn nhất có thể ......................................... 33 Hình 2.10: Mô tả siêu phẳng cho SVM tuyến tính .............................................................. 34 Hình 3.1: Minh hoạ 1 frame ảnh có bọt khí (xử lý bằng Entropy và Fuzzylogic) .............. 39 Hình 3.2: Minh hoạ 1 frame ảnh không bọt khí (xử lý bằng Entropy và Fuzzylogic) ........ 39 Hình 3.3: Minh hoạ 1 frame ảnh có bọt khí cho việc xử lý tìm biên................................... 41 Hình 3.4: Minh hoạ 1 frame ảnh không bọt khí cho việc xử lý tìm biên ............................ 41 viii DANH MỤC CÁC BẢNG Bảng 1.1: Ví dụ về các tập mờ điểm thi cho A, B, C ........................................................... 18 Bảng 1.2: Ví dụ minh họa các tập mờ điểm thi cho A, B, C dạng tam giác ....................... 21 Bảng 3.1: Kết quả entropy cho ảnh có bọt khí ................................................................... 37 Bảng 3.2: Kết quả entropy cho ảnh không bọt khí ............................................................. 38 Bảng 3.3: So sánh MSE và PSNR cho 1 frame ảnh có bọt ................................................. 40 Bảng 3.4: So sánh MSE và PSNR cho 1 frame ảnh không bọt ........................................... 41 Bảng 4.1: Kết quả phân lớp ảnh (trường hợp sử dụng Entropy và Fuzzy logic) ............... 45 Bảng 4.2: Kết quả nhận dạng ảnh (trường hợp dò biên Canny) ........................................ 47 Bảng 4.3: Minh hoạ lưu kết quả nhận dạng ảnh trên màn hình và lưu file csv ................. 47 ix PHẦN MỞ ĐẦU Trong thế kỷ 21, sự phát triển của công nghệ thông tin đã đẩy nhanh sự phát triển nhiều lĩnh vực của đời sống xã hội. Với sự phát triển nhanh chóng của phần cứng máy tính và các thiết bị liên quan về các phương diện thu nhận và hiển thị đã mở ra nhiều hướng mới cho sự phát triển của phần mềm. Trong số đó phải kể đến lĩnh vực giám sát tự động, lĩnh vực này đã và đang được nhiều người quan tâm, nghiên cứu. Các vấn đề liên quan đến giám sát tự động như: dự đoán, cảnh báo đối tượng đột nhập; dự đoán, cảnh báo các hiện tượng trong tự nhiên; dự đoán, cảnh báo hành vi của con người, loài vật, vv… thông qua hệ thống camera giám sát. Đây chính là những lĩnh vực rất gần gũi và cấp thiết đối với nhu cầu trong cuộc sống của con người. Từ dữ liệu thu được qua camera quan sát dưới dạng video lưu trữ trên máy tính rồi tiến hành tìm hiểu, nghiên cứu các vấn đề liên quan đến nó để từ đó đưa ra các phương pháp, thuật toán và cài đặt phần mềm ứng dụng cho các vấn đề nghiên cứu này. Với những tiến bộ trong lưu trữ dữ liệu video và thiết bị công nghệ máy tính, nhiều ứng dụng mới liên quan đến hệ thống thông tin video đang ngày càng nổi trội. Video là một phương tiện với độ phức tạp cao. Nó chính là dãy các frame ảnh, các frame ảnh này thay đổi qua thời gian và theo không gian. Ngày nay với nền công nghiệp phát triển, đất nước khó tránh khỏi sự ô nhiễm môi trường nói chung và môi trường nước nói riêng. Ngành công nghiệp xử lý nước sạch đang được nhà nước và cộng đồng quan tâm sâu sắc. Để có được nguồn nước sạch, người ta cần cải tạo môi trường và hệ sinh thái bằng cách nuôi những con vi sinh trong những cái bể lớn nhằm cung cấp vi sinh cho những chỗ nước bị nhiễm bẩn, hệ sinh thái bị biến đổi. Trong quá trình nuôi vi sinh người ta cần phải sục khí liên tục vào bể để cung cấp đủ oxi để nuôi sống vi sinh, nếu không được sục khí thường xuyên thì những con vi sinh sẽ không thể sống được do thiếu oxi. Quy mô ngành quản lý nước sạch ở đất nước ta hiện nay cũng rất lớn, số lượng bể nuôi vi sinh ngày cũng được nhân rộng. Điều này đặt ra các yêu cầu cần phải chặt chẽ hơn trong khâu giám sát. Mặt khác, để giảm bớt sự giám sát của con người thì việc vận dụng máy tính vào để quản lý, giám sát thay cho con người ngày càng cần thiết nhằm giúp giảm nhân lực và công sức, từ đó đạt lợi nhuận cao hơn. Xuất phát từ thực tế này, chúng ta cần có những phần mềm để theo dõi và giám sát xem bể nuôi vi sinh có được sục khí liên tục hay không. Trong đó, vấn đề liên quan đến xử lý video, xử lý frame ảnh và nhận dạng frame ảnh trong video sẽ phục vụ cho nhu cầu phát hiện và cảnh báo vấn đế không có bọt khí (khi bể không được sục khí) thông qua việc giám sát tự động bởi các camera. Với nhu cầu trên, được sự hướng dẫn của Thầy TS. Hoàng Mạnh Hà, tôi tiến hành thực hiện đề tài “Áp dụng độ đo entropy cho bài toán tách đặc trưng của bọt khí trên video và đề xuất kết hợp SVM cho vấn đề tự động theo dõi sục khí tại trạm quan trắc môi trường”. Trong khuôn khổ của luận văn này, mục tiêu của đề tài là tìm hiểu và nghiên cứu một số kỹ thuật xử lý phân tích, trích chọn đặc trưng ảnh để có thể lấy ra được những ảnh mẫu 1 tốt nhất phục vụ việc huấn luyện phân lớp mẫu và nhận dạng. Đồng thời khảo sát, nghiên cứu một số thuật toán học phục vụ việc huấn luyện mô hình phân lớp mẫu. Từ đó sử dụng so sánh với các frame ảnh trích xuất từ các camera giám sát bất kỳ nào có thể dự đoán, nhận dạng được frame ảnh đó có bọt khí hay không có bọt khí nhằm giải quyết bài toán nhận dạng ảnh để xác định bể nuôi vi sinh có được sục khí hay không được sục khí. Để đạt được mục tiêu này, các vấn đề cần giải quyết trong đề tài này bao gồm: + Nghiên cứu tổng quan về video, xử lý video, các đặc trưng cơ bản đối với frame ảnh, các phương pháp và kỹ thuật xử lý phân tích trích chọn đặc trưng ảnh như: các bộ lọc làm mịn ảnh, các kỹ thuật tìm biên ảnh, độ đo Entropy cho các điểm ảnh, Fuzzy Logic và phép biến đổi Wavelet Haar. Mục đích để có thể đưa ra các ảnh mẩu tốt nhất phục vụ cho việc huấn luyện mô hình phân lớp và nhận dạng sau này. + Nghiên cứu về học máy cùng một số thuật toán học máy giúp huấn luyện và phân lớp dữ liệu ảnh mẫu nhằm đưa ra được mô hình học phân lớp tốt nhất có thể, giúp phát hiện nhận dạng đúng hiện tượng ảnh có bọt khí (trường hợp bể nuôi có sục khí) hay không bọt khí (trường hợp bể nuôi không được sục khí) chính xác nhất có thể. + Cài đặt thực nghiệm cho một số video clip trích từ camera giám sát của các bể nuôi vi sinh được thu thập từ đơn vị quan trắc môi trường tại tỉnh Bình Dương. Kết cấu của luận văn: gồm các chương sau: Chương 1. Tổng quan về xử lý và nhận dạng ảnh: Chương này giới thiệu tổng quan các khái niệm cơ bản về ảnh, quá trình xử lý, phân tích, trích chọn đặc trưng, phân lớp và nhận dạng ảnh. Chương 2. Nghiên cứu phương pháp giải quyết bài toán nhận dạng ảnh bọt khí: Chương này nghiên cứu và xây dựng bài toán nhận dạng ảnh bọt khí cần thực hiện, vấn đề trích chọn đặc trưng bọt khí, phương pháp phân lớp cho dữ liệu ảnh bọt khí và việc ứng dụng phương pháp SVM cho bài toán nhận dạng bọt khí. Chương 3. Thực nghiệm và đề xuất ứng dụng phương pháp trích chọn đặc trưng ảnh cho bài toán nhận dạng ảnh bọt khí: Chương này cài đặt thực nghiệm và đề xuất 2 phương pháp trích chọn đặc trưng bọt khí trên ảnh là phương pháp sử dụng độ đo Entropy kết hợp Fuzzy Logic và phép biến đổi Wavelet Haar và phương pháp sử dụng bộ lọc Canny cho bài toán nhận ảnh bọt khí từ camera giám sát. Chương 4. Thực nghiệm áp dụng phương pháp SVM vào bài toán theo dõi việc sục khí cho bể nuôi vi sinh: Chương này áp dụng phương pháp SVM cho việc phân lớp ảnh bọt khí dựa trên các ảnh đã được trích chọn đặc trưng với 2 phương pháp là phương pháp sử dụng độ đo Entropy kết hợp Fuzzy Logic và biến đổi Wavelet Haar và phương pháp sử dụng bộ lọc Canny ở chương 3. Đồng thời cài đặt thực nghiệm cho việc huấn luyện phân lớp ảnh và kiểm thử (test), phát hiện (nhận dạng) với dữ liệu đầu vào là một số video clip thực tế thu thập từ các camera giám sát các bể nuôi vi sinh của đơn vị quan trắc môi trường tỉnh Bình Dương. 2 Chương 1: TỔNG QUAN VỀ XỬ LÝ VÀ NHẬN DẠNG ẢNH 1.1. CÁC KHÁI NIỆM CƠ BẢN VỀ ẢNH 1.1.1. Khái niệm về ảnh (Image) Ảnh trắng đen là một hàm hai chiều của cường độ sáng f(x,y), trong đó x và y là các toạ độ không gian và giá trị của hàm f tại một điểm (x,y) tỷ lệ với cường độ sáng của ảnh tại điểm đó. Ảnh màu thì f là một vector mà mỗi thành phần của vector đó chỉ ra cường độ sáng của ảnh tại điểm (x,y) đó tương ứng với dải màu. Ảnh số là một ảnh mà hàm f(x,y) của nó đã được rời rạc hoá theo cả toạ độ không gian và cường độ sáng của nó. Số điểm ảnh xác định độ phân giải của ảnh. Ảnh có độ phân giải càng cao thì càng thể hiện rõ nét các đặt điểm của tấm hình càng làm cho tấm ảnh trở nên thực và sắc nét hơn. Nếu là ảnh trắng đen thì nó được biểu diễn theo một mảng hai chiều, còn nếu là một ảnh màu thì nó được biểu diễn theo một chuỗi các mảng hai chiều mà mỗi mảng hai chiều đó tương ứng với một dải màu. Giá trị cường độ sáng đã được số hoá được gọi là giá trị mức xám. 1.1.2. Điểm ảnh (Picture element hay Pixel) Ảnh trong thực tế là một ảnh liên tục về không gian và về giá trị độ sáng. Để có thể xử lý ảnh bằng máy tính cần thiết phải tiến hành số hóa ảnh. Theo tài liệu [4], số hoá ảnh là sự biến đổi gần đúng một ảnh liên tục thành một tập điểm phù hợp với ảnh thật về vị trí (không gian) và độ sáng (mức xám). Khoảng cách giữa các điểm ảnh đó được thiết lập sao cho mắt người không phân biệt được ranh giới giữa chúng. Mỗi một điểm như vậy gọi là điểm ảnh (Picture element) hay gọi tắt là Pixel. Trong khuôn khổ ảnh hai chiều, mỗi điểm ảnh ứng với cặp tọa độ (x,y). Cũng theo [4], có thể định nghĩa: Điểm ảnh là một phần tử của ảnh số tại toạ độ (x,y) với độ xám hoặc màu nhất định. Kích thước và khoảng cách giữa các điểm ảnh đó được chọn thích hợp sao cho mắt người cảm nhận sự liên tục về không gian và mức xám (hoặc màu) của ảnh số gần như ảnh thật. Mỗi phần tử trong ma trận được gọi là một phần tử ảnh. Ảnh được xem như là một tập hợp các điểm ảnh. Khi được số hóa, nó thường được biểu diễn bởi mảng 2 chiều. Ví dụ: Giả sử ta có ảnh I(m*n): tức ảnh gồm m dòng và n cột và có m*n điểm ảnh. Một điểm ảnh có thể được biểu diễn bằng 1, 4, 8, 24 bits. Mỗi thành phần của mảng được gọi là một phần tử ảnh hay còn gọi là điểm ảnh và nó được biểu diễn như sau: f(0,0) f(0,1) … f(0, n) f(1.0) f(1.1) … f(1, n) ) f(x, y) = ( … f(m, 0) f(m, 1) … f(m, n) Với 0 ≤ f(x,y) ≤ G-1, trong đó thông thường N và G được biểu diễn dưới dạng số mũ của 2 (N=2n, G=2m). 3 1.1.3. Độ phân giải ảnh (Image resolution) Độ phân giải của ảnh (Image resolution) là mật độ điểm ảnh được ấn định trên một ảnh số được hiển thị. Theo định nghĩa trong [4], khoảng cách giữa các điểm ảnh phải được chọn sao cho mắt người vẫn có thể thấy được sự liên tục của ảnh. Việc lựa chọn khoảng cách thích hợp tạo nên một mật độ phân bổ, đó chính là độ phân giải và được phân bố theo trục x và y trong không gian hai chiều. Độ phân giải ảnh biểu diễn mức độ chi tiết của ảnh mà chúng ta có thể nhìn rõ đối tượng. Khi thay đổi các giá trị kích thước ảnh và mức xám thì sẽ có các hiện tượng thay đổi khác nhau. Xong thực tế cho thấy khi giữ nguyên kích thước ảnh và tăng số mức xám lên thì sẽ thể hiện rõ hơn mức độ chi tiết trong ảnh. Ví dụ: Độ phân giải của ảnh trên màn hình CGA (Color Graphic Adaptor) là một lưới điểm theo chiều ngang màn hình: 320 điểm chiều dọc * 200 điểm ảnh (320*200). Như vậy, với màn hình CGA 12” ta nhận thấy mịn hơn màn hình CGA 17” với cùng độ phân giải là 320*200, vì cùng một mật độ phân giải nhưng diện tích màn hình rộng hơn thì độ mịn (liên tục của các điểm) sẽ kém hơn. 1.1.4. Cường độ sáng của một ảnh tại một điểm ảnh (Brightness intensity) Mỗi điểm ảnh của một ảnh tương ứng với một phần của một đối tượng vật lý tồn tại trong thế giới thực. Đối tượng vật lý này được chiếu sáng bởi một vài tia sáng mà tia sáng này bị phản xạ một phần hay hấp thụ một phần khi chiếu lên đối tượng vất lý đó. Phần ánh sáng phản xạ lại đi tới các bộ cảm biến được sử dụng để tạo ảnh cảm nhận và tạo ra các giá trị ghi nhận được đối tượng đối với từng điểm ảnh. Giá trị thu nhận được phụ thuộc vảo phổ ánh sáng phản xạ. Giá trị cường độ sáng của các điểm ảnh khác nhau chỉ có ý nghĩa tương đối mà không có ý nghĩa trong các toán hạng tuyệt đối. Ví dụ: Giả sử ta có ảnh I với kích thước m*n và số nguyên c. Khi đó, kỹ thuật tăng/giảm độ sáng ảnh được thể hiện: I[m,n] = I[m,n] + c; với mọi (m,n). Nếu c>0 thì ảnh sáng lên và c<0 thì ảnh tối đi. 1.1.5. Mức xám của ảnh (Gray image) Theo [4], một điểm ảnh có hai đặc trưng cơ bản là vị trí (x,y) của điểm ảnh và độ xám của nó. Mức xám của ảnh (Gray image) là kết quả của sự biến đổi tương ứng 1 giá trị độ sáng của 1 điểm ảnh với 1 giá trị nguyên dương. Thông thường nó xác định trong phạm vi là [0, 255] tuỳ thuộc vào giá trị mà mỗi điểm ảnh được biểu diễn. Các thang giá trị mức xám thông thường là: 16, 32, 64, 128, 256. Mức 256 là mức phổ dụng, vì từ kỹ thuật máy tính dùng 1 byte (8 bit) để biểu diễn mức xám nên mức xám dùng 1 byte biểu diễn: 28=256 mức, tức là từ 0 đến 255. Như vậy, ảnh xám là ảnh mà các điểm ảnh có mức xám nằm trong khoảng từ 0 đến 255. Nếu ảnh được lưu trữ dưới dạng một mảng hai chiều với kích thước NxN và có 2m mức xám thì số bits cần thiết để lưu trữ ảnh là: b = N * N * 2m 4 Ví dụ: Một ảnh có kích thước 512 * 512 với 256 mức xám (tức m=8) thì cần số bits lưu trữ sẽ là: 512 * 512 * 256 = 2.097.152 bits. 1.1.6. Ảnh nhị phân (Binary image) Ảnh nhị phân (Binary image) là ảnh chỉ có 2 mức đen trắng phân biệt, tức chỉ dùng 1 bit để mô tả 21 mức khác nhau. Mỗi điểm ảnh của ảnh nhị phân chỉ có thể là 0 hoặc 1. Đối với ảnh xám, giá trị xám nằm trong phạm vi từ 0 đến 255. Như vậy mỗi điểm ảnh trong ảnh nhị phân được biểu diễn bởi 1 byte. 1.1.7. Ảnh màu (Color image) Ảnh màu (Color image) là ảnh tổ hợp từ ba màu cơ bản là đỏ (Red), xanh lơ (Blue) và xanh lục (Green) để tạo nên thế giới màu, người ta thường dùng 3 byte để mô tả mức màu, khi đó các giá trị màu: 28*3 = 224 ≈ 16,7 triệu màu. Một số hệ màu như: hệ màu RGB, hệ màu CMY, hệ màu CMYK, vv... 1.1.8. Quan hệ giữa các điểm ảnh  Lân câṇ của điểm ảnh (Image neighbrs): Giả sử có điểm ảnh p tại tọa độ (x,y), p có các lân câṇ gần nhất theo chiều ngang và dọc là: (x+1,y), (x-1,y), (x,y+1), (x,y-1). Theo [4], tập hợp các điểm ảnh này được gọi là lân cận 4 của p, ký hiệu là: N4(p). Mỗi điểm ảnh có khoảng cách đơn vị đến (x,y), và nếu (x,y) nằm trên biên của ảnh thì lân cận của nó có thể nằm ngoài ảnh. Các lân cận chéo của p có tọa độ: (x+1,y+1), (x+1,y-1), (x-1,y+1), (x-1,y-1). Tập lân cận chéo được ký hiệu là NP(p). Tập lân cận chéo cùng với lân cận 4 tạo thành lân cận 8 của p, ký hiệu là: N8(p) như sau: (x-1, y-1) (x-1, y) (x, y-1) (x, y) (x+1, y-1) (x+1, y)  Các mối liên kết điểm ảnh: Theo [4], để xác điṇh tính liên thông của hai điểm ảnh, chúng cần thỏa mãn rằng: chúng phải là các lân cận và các cấp xám phải thỏa mãn tiêu chuẩn đề ra về tính tương tư. Ví dụ: Trong ảnh nhi ̣phân với các giá tri ̣là 0 và 1, hai điểm ảnh có thể là 4 lân câṇ, nhưng chúng chỉ đươc ̣ goị là liên thông nếu và chỉ nếu chúng có các giá trị bằng nhau. Các mối liên kết được sử dụng để xác định giới hạn của đối tượng vật thể hoặc xác định vùng trong một ảnh. Một liên kết được đặc trưng bởi tính liền kề giữa các điểm và mức xám của chúng. Cho V là môṭ tâp ̣ các giá tri ̣cấp xám dùng để xác định tính liền kề trong ảnh, ta có ba loại liền kề sau: + Liên kết 4: hai điểm ảnh p và q với giá tri ̣từ V là liên kết 4 nếu q thuôc ̣ tâp̣ N4(p) + Liên kết 8: hai điểm ảnh p và q với giá tri ̣từ V là liên kết 8 nếu q thuôc ̣ tâp̣ N8(p) 5 + Liên kết m (liên kết hỗn hơp):̣ hai điểm p và q vớ i giá tri ̣từ V là liên kết m nếu thỏa mãn môṭ trong hai điều kiêṇ sau: - Một là: q thuộc N4(p) - Hai là: q thuộc NP(p) 1.1.9. Biên ảnh (Image boundary) Biên ảnh là một vấn đề chủ yếu trong phân tích ảnh, vì các kỹ thuật phân đoạn ảnh chủ yếu dựa vào biên. Theo [3], một điểm ảnh có thể coi là điểm biên nếu ở đó có sự thay đổi mạnh một cách đột ngột về mức xám. Tập hợp các điểm biên tạo thành biên hay đường bao ảnh của ảnh (Boundary). Hay nói cách khác, đường biên ảnh là nơi mà các điểm ảnh lân cận nhau có cường độ thay đổi mạnh một cách đột ngột. Ví dụ: Trong một ảnh nhị phân, một điểm có thể gọi là biên nếu đó là điểm đen và có ít nhất một điểm trắng là lân cận. 1.2. GIỚI THIỆU CHUNG VỀ XỬ LÝ VÀ NHẬN DẠNG ẢNH Cũng như xử lý dữ liệu bằng đồ hoạ, xử lý ảnh là một lĩnh vực của tin học ứng dụng. Xử lý dữ liệu bằng đồ họa đề cập đến những ảnh nhân tạo, các ảnh này được xem xét như là một cấu trúc dữ liệu và được tạo ra bởi các chương trình. Xử lý ảnh bao gồm các phương pháp và kỹ thuật để biến đổi, để truyền tải hoặc mã hóa các ảnh tự nhiên. Mục đích của xử lý ảnh gồm: - Thứ nhất: Biến đổi ảnh và làm đẹp ảnh. - Thứ hai: Tự động nhận dạng hay đoán nhận ảnh và đánh giá các nội dung của ảnh. Thực hiện xử lý ảnh thường theo nguyên tắc: xử lý thông qua việc sử dụng hàm biến đổi ảnh. Biến đổi ảnh là quá trình thực hiện thông qua các toán tử. Một toán tử thực hiện lấy một ảnh vào đầu vào của hệ thống và tạo ra một ảnh khác theo yêu cầu xử lý. Để thực hiện quá trình biến đổi ảnh chúng ta chủ yếu quan tâm tới các toán tử tuyến tính. Giả sử O(f) là toán tử O của một ảnh f thì toán tử O được gọi là tuyến tính nếu ta có: O[af + bg] = aO(f) + bO(g) với mọi f, g và a, b. Trong xử lý ảnh thì các toán tử được định nghĩa là hàm trải điểm. Một hàm trải điểm của một toán tử là kết quả mà chúng ta thu nhận được sau khi thực hiện cung cấp luật của toán tử đó cho nguồn điểm: O[nguồn điểm] = hàm trải điểm. Hay chúng ta có: O[δ(x-α, yβ)] = h(x, α, y, β). Trong đó δ(x-α, y-β) là nguồn điểm có cường độ sáng bằng 1 đặt tại điểm (α,β) và nếu toán tử là tuyến tính thì ta có: O[aδ(x-α, y-β)] = ah(x, α, y, β); tức nếu tăng cường độ sáng lên a lần thì kết quả thu được cũng tăng lên a lần. Nhận dạng ảnh là quá trình liên quan đến các mô tả đối tượng mà người ta muốn đặc tả nó. Quá trình nhận dạng thường đi sau quá trình trích chọn các đặc tính chủ yếu của đối tượng. Có hai kiểu mô tả đối tượng: - Mô tả tham số (nhận dạng theo tham số). 6 - Mô tả theo cấu trúc (nhận dạng theo cấu trúc). Nhận biết và đánh giá các nội dung của ảnh là sự phân tích một hình ảnh thành những phần có nghĩa để phân biệt đối tượng này với đối tượng khác. Dựa vào đó ta có thể mô tả cấu trúc của hình ảnh ban đầu. Có thể liệt kê một số phương pháp nhận dạng cơ bản như nhận dạng biên của một đối tượng trên ảnh, tách cạnh, phân đoạn hình ảnh, vv... Trong thực tế người ta đã áp dụng kỹ thuật nhận dạng khá thành công với nhiều đối tượng khác nhau như: nhận dạng ảnh vân tay, nhận dạng chữ cái, nhận dạng loài hoa, nhận dạng vật nuôi, vv… Các quá trình của xử lý và nhận dạng ảnh có thể được tiến hành theo sơ đồ sau: Thu nhận ảnh Số hoá ảnh Huấn luyện phân lớp Tiền xử lý ảnh Trích chọn đặc trưng Mô hình huấn luyện Dữ liệu huấn luyện Dữ liệu nhận dạng Kết quả nhận dạng Nhận dạng Hình 1.1: Minh hoạ các bước cơ bản trong một hệ thống xử lý và nhận dạng ảnh. 1.2.1. Thu nhận ảnh (Image acquisition) Trong quá trình xử lý ảnh thì trước hết là phải thu nhận ảnh (Image acquisition). Chất lượng của ảnh thu được sẽ quyết định nhiều đến kết quả của việc nhận dạng. Sau đó ảnh phải được lưu trữ theo một định dạng phù hợp với các bước xử lý sau này. Ảnh có thể là ảnh chụp từ ống kính máy ảnh hay điện thoại. Ảnh có thể thu nhận qua camera, thường thì ảnh thu nhận qua camera là tín hiệu tương tự loại camera ống kiểu (CCIR), nhưng cũng có thể là tín hiệu số hoá loại CCD (Charge Coupled Device). Ảnh cũng có thể thu nhận từ vệ tinh qua các bộ cảm ứng (sensor), hay ảnh được quét qua máy quét scanner. 1.2.2. Số hóa ảnh (Image digitalizer) Số hoá ảnh (Image digitalizer) là quá trình số hóa để biến đổi tín hiệu tương tự sang tín hiệu rời rạc (lấy mẫu) và số hóa bằng lượng hóa, trước khi chuyển sang giai đoạn xử lý, phân tích hay lưu trữ lại. 1.2.3. Tiền xứ lý ảnh (Image processing) Bước này tăng khả năng nhận dạng chính xác, có vai trò nâng cao chất lượng ảnh trước khi đem phân tích và nhận dạng. Do những nguyên nhân khác nhau có thể do thiết bị thu nhận ảnh, do nguồn sáng hay do nhiễu, ảnh có thể có độ tương phản thấp, có thể bị suy 7 biến. Do vậy, công việc chính của tiền xử lý ảnh là nâng cao chất lượng ảnh. Nâng cao chất lượng ảnh là một bước quan trọng, nó là tiền đề cho xử lý ảnh. Mục đích chính là nhằm làm nổi bật một số đặc tính ảnh như độ tương phản, làm nổi màu, lọc nhiễu, làm trơn ảnh, khuếch đại ảnh, tăng cường ảnh hay khôi phục lại ảnh để làm nổi bật một số đặc tính chính của ảnh để nâng cao chất lượng ảnh, hay làm cho ảnh gần giống với trạng thái gốc (trạng thái trước khi ảnh bị biến dạng), vv… Tăng cường ảnh là việc cải tiến ảnh sao cho nó thể hiện rõ được các đặc trưng của ảnh, như là điều khiển mức xám, độ tương phản ảnh, giảm nhiễu, vv... Tùy vào yêu cầu mong muốn, song có thể có hai vấn đề quan trọng đó là: thống kê mức xám của ảnh và tần số ảnh. 1.2.3.1. Lọc nhiễu Nhiễu có nhiều loại nhưng có thể phân ra các loại nhiễu như: nhiễu do thiết bị thu nhận ảnh, nhiễu ngẫu nhiên độc lập, nhiễu do vật quan sát. Thường người ta xấp xỉ các loại nhiễu bằng các quá trình tuyến tính bất biến vì có nhiều công cụ tuyến tính có thể giải quyết vấn đề phôi phục ảnh cũng như tăng cường ảnh hơn so với phi tuyến và hơn nữa còn cho phép xử lý dễ dàng hơn trên máy tính. Từ các vấn đề trên ta có thể làm trơn ảnh bằng việc lọc nhiễu theo các loại bộ lọc tuyến tính (Liner filter) hay lọc phi tuyến. Loại bộ lọc tuyến tính bao gồm như bộ lọc trung bình không gian (Mean filter, Average filter), lọc thông thấp (Low pass filter), Bộ lọc thông cao lý tưởng, Lọc Gaussian blur, vv… Loại bộ lọc phi tuyến bao gồm như Lọc trung vị (Median filter), Lọc giả trung vị, Lọc ngoài (Oulier filter), vv… Ở luận văn này tôi chỉ xin đề cập đến bộ lọc tuyến tính Gaussian blur như sau: Theo tài liệu [5], Lọc Gaussian blurring là cách làm mờ một ảnh bằng hàm Gaussian. Phương pháp này được ứng dụng rộng rãi và hiệu quả trong các phần mềm xử lý đồ họa. Nó cũng là công cụ phổ biến để thực hiện quá trình tiền xử lý hình ảnh dùng để làm dữ liệu đầu vào tốt cho các phân tích cao cấp hơn trong thị giác máy tính (Computer vision), hoặc cho các giải thuật được thực hiện trong một tỉ lệ khác của hình đã được cho. Như vậy, ta có thể nói Gaussian blurring là một loại bộ lọc làm mờ ảnh, sử dụng lý thuyết hàm Gaussian cũng được biết đến như là dạng phân tán chuẩn (Normal distribution) trong thống kê để tính toán việc chuyển đổi (Transformation) mỗi điểm ảnh của hình, giúp làm giảm nhiễu và mức độ chi tiết không mong muốn của hình ảnh. Sau đây là phương trình hàm Gaussian (Gaussion distribution) trong không gian hai chiều: Gaussian[m, n] = 1 √2πσ . exp (− m2 + n2 ) 2σ2 (1.1) Mặt nạ của bộ lọc này được xây dựng từ hàm Gaussian (1.6) trên. Mặt nạ Gaussian dạng hình vuông. Các hệ số của mặt nạ thường được tính giới hạn trong khoảng 4σ đến 6σ có thể cho ta hiệu quả cao. 8 1.2.3.1. Mức xám đồ  Mức xám đồ Mức xám đồ của một ảnh xám là lược đồ biểu diễn tần suất xuất hiện của mỗi mức xám tức mức xám đồ của một hình ảnh là một hàm rời rạc. Lược đồ này được biểu diễn theo trục tọa độ (x,y). Trục hoành biểu diễn các mức xám từ 0 đến 255, còn trục tung biểu diễn số lượng điểm ảnh tương ứng với mức xám trên trục hoành. Như vậy ta có mối quan hệ: y = f(x) = số điểm ảnh có cùng mức xám x. Khi hàm được chuẩn hóa mà tổng của các mức xám là 1 thì hàm có thể được coi là một hàm mật độ. Đưa ra giá trị mức xám được tìm thấy trong ảnh. Theo đó thì giá trị mức xám là một giá trị ngẫu nhiên. y = p(x) = h(x) L−1 với L thường bằng 256 (1.2) Như vậy mức xám đồ cung cấp thông tin về mức xám của ảnh, nó là một công cụ hữu hiệu trong nhiều giai đoạn của quá trình xử lý ảnh.  Biến đổi mức xám đồ Mức xám đồ biểu diễn cho một ảnh càng rộng càng tốt. Nếu coi x là giá trị mức xám của ảnh gốc và giá trị mức xám ảnh mới là: s = T(x) với T được gọi là hàm biến đổi mức xám.  Một số biện pháp tăng cường ảnh bằng biến đổi mức xám đồ: - San bằng mức xám đồ: u v = LTHĐ[f(u)] = LTHĐ [∑ p(x)] với 𝑥 = 0,1, … , 𝑢 (1.3) x=0 Với p(x) là hàm mức xám đồ kiểu tỷ lệ, còn LTHĐ là phép lượng tử hóa đều giá trị của f(u) sang các giá trị mức xám từ 0 đến L-1. Sử dụng hàm lấy mẫu phần nguyên Int có thể có LTHĐ như sau: x − xmin (L − 1) + 0,5] với x = f(u) LTHĐ[x] = Int [ (1.4) 1 − xmin - Biến đổi phi tuyến mức xám: Trước khi thực hiện LTHĐ người ta sử dụng phi tuyến hàm f(u) biến đổi mức xám u. Có thể có các dạng hàm f(u) như sau: ∑ux=0[p(x)]1/n f(u) = L−1 ∑x=0[p(x)]1/n với n là số nguyên > 1 (1.5) f(u) = log(1 + u) với u ≥ 0 (1.6) f(u) = u1/n với u ≥ 0 và n là số nguyên > 1 (1.7) 9
- Xem thêm -

Tài liệu liên quan

Tài liệu xem nhiều nhất