Tài liệu Nghiên cứu một số kỹ thuật nâng cao chất lượng ảnh nhị phân và ứng dụng

  • Số trang: 76 |
  • Loại file: PDF |
  • Lượt xem: 37 |
  • Lượt tải: 0
nhattuvisu

Đã đăng 27125 tài liệu

Mô tả:

Lời Cảm Ơn ! Đầu tiên em xin chân thành cảm ơn PGS. TS. Ngô Quốc Tạo - người đã trực tiếp hướng dẫn và định hướng giúp em có thể nhanh chóng tiếp cận, nắm bắt kiến thức và hoàn thành luận văn ”Nghiên cứu một số kỹ thuật nâng cao chất lượng ảnh nhị phân và Ứng dụng”. Em xin gửi lời cảm ơn tới Trung Tâm Thông Tin Tư Liệu - Trường Đại Học Lạc Hồng, nơi em đang công tác, vì đã tạo điều kiện thuận lợi cho em trong suốt quá trình học tập và làm việc tại trường. Em xin gửi lời cảm ơn tới toàn thể thầy cô giáo khoa Công Nghệ Thông Tin Trường Đại Học Lạc Hồng, đã tận tình giảng dạy trang bị cho em những kiến thức quý báu trong những năm học vừa qua. Em xin gửi lời cảm ơn đến những người thân trong gia đình, bạn bè đã động viên và tạo mọi điều kiện giúp chúng em trong quá trình học tập cũng như trong cuộc sống. Em xin chân thành cảm ơn! Đồng Nai, Ngày 30 tháng 05 năm 2011 Học viên thực hiện TRẦN ĐỨC TOÀN 1 Lời Mở Đầu ! Trong thực tế hình dạng thường được chú trọng hơn kích thước và con người nhận ra các đối tượng xung quanh cũng chủ yếu thông qua hình ảnh. Hình ảnh là một dạng dữ liệu đóng vai trò quan trọng trong việc trao đổi, xử lý, lưu giữ thông tin...Trong chúng ta có lẽ không có ai đã không từng sử dụng hình ảnh cho một mục đích nào đấy. Trong nhiều ngành nghề, trong một số các loại hình công việc, người ta điều cần đến hình ảnh để mô tả, minh chứng hay diễn đạt những điều mà đôi khi chữ viết hay ngôn ngữ nói không diễn tả hết được. Đặc biệt trong một số ngành nghề như: cơ khí chế tạo, sản xuất, học tập, báo chí, việc đọc hình ảnh có thể nói là thường xuyên và cực kỳ quan trọng. Bản vẽ kỹ thuật (một dạng của hình ảnh), tài liệu điện tử (giáo trình tham khảo) chính là kết quả ngôn ngữ kỹ thuật. Mà qua nó, một qui trình công nghệ phải được xây dựng trong quá trình sản xuất, cũng như nó chính là cơ sở cho việc nghiệm thu cho bất kỳ sản phẩm nào. Để lưu ảnh của các tài liệu, các bản vẽ hoặc sửa đổi chúng và chuyển chúng sang các dạng đồ hoạ khác tiện cho việc nhận dạng, đối sánh mẫu để sử dụng sau này là điều cần thiết. Nhưng phải tổ chức việc lưu các dạng hình ảnh này như thế nào? Có cần xử lý trước khi lưu chúng không? Câu trả lời là có. Do vậy tiền xử lý ảnh là việc cần làm. Có nhiều phương pháp, nhiều công cụ, nhiều phần mềm xử lý ảnh đã ra đời. Tăng cường chất lượng ảnh, mà công đoạn đầu tiên là một bước tiền xử lý nhằm xác định ảnh, khắc phục những khiếm khuyết do bước thu nhận ảnh không tốt là việc làm quan trọng. Có nhiều phương pháp cho việc nâng cao chất lượng ảnh nói chung và tiền xử lý nói riêng. Trong luận văn này em chỉ mô tả một vài phương pháp tiền xử lý hình ảnh (chú trọng đến ảnh nhị phân, bởi ảnh của các bản vẽ kỹ thuật và sách scan thường chỉ là ảnh 2 màu: đen, trắng) nhằm cải thiện chất lượng hình ảnh bằng các thao tác Hình thái học (Morphology) để ứng dụng vào chương trình nâng cao chất lượng ảnh Scan tài liệu giáo trình điện tử tại thư viện Trường Đại học Lạc Hồng. Các thao tác Hình thái học nói chung, đặc biệt là Hình thái học số được sử dụng chủ yếu vào việc cải thiện ảnh bằng cách làm rõ (tái hiện) những nét đặc trưng 2 của các hình dạng, do vậy mà có thể tính toán được hay nhận biết được chúng một cách dễ dàng. Việc sử dụng các thao tác hình thái và ứng dụng của chúng, đặc biệt là ứng dụng nâng cao chất lượng hình ảnh cho bước tiền xử lý, trước khi thực hiện những bước kế tiếp cho công việc xử lý ảnh . Chính vì vậy em đã lựa chọn luận văn “Nghiên cứu một số kỹ thuật nâng cao chất lượng ảnh nhị phân và Ứng dụng”. Mục tiêu của luận văn là tìm hiểu nghiên cứu một số kỹ thuật nâng cao chất lượng ảnh nhị phân vào xử lý các đối tượng trong hình ảnh và xây dựng chương trình ứng dụng thực tế. Báo cáo luận văn được chia làm 3 chương: Chƣơng I. Tổng quan về phƣơng pháp nâng cao chất lƣợng ảnh: Chương này gồm có các khái niệm ban đầu về xử lý ảnh, ảnh nhị phân, tầm quan trọng, biểu diễn hình dạng cơ bản theo biên và xương và các bước được thực hiện trong quá trình xử lý ảnh. Sau đó nêu mục tiêu trong chương 2 là sử dụng các phép toán hình thái trong việc xử lý ảnh. Chƣơng II. Nâng cao chất lƣợng ảnh bằng phép toán hình thái: Chương này gồm có các phép toán hình thái nâng cao chất lượng ảnh, từ cơ bản đến những khái niệm nâng cao và ứng dụng trong thực tế. Đầu tiên là các khái niệm tập hợp như các quan hệ phép hợp, phép giao, phép bù… sau đó là các phép toán logic liên quan đến quá trình xử lý ảnh nhị phân, để tiện cho việc phân tích và chứng minh các công thức chính của phép toán hình thái. Toàn bộ chương tập trung làm rõ các khái niệm về: phép co nhị phân, phép giãn nhị phân, phép đóng ảnh, phép mở ảnh, phép trúng hoặc trượt (Hit-or-Miss), phép trích biên, phép làm đầy, phép tách các thành phần liên thông, phép bao lồi, phép làm mảnh và tìm xương. Chƣơng III. Ứng dụng của phép toán hình thái trong nâng cao chất lƣợng ảnh: Chương này so sánh cách tiếp cận của luận văn, các ứng dụng của phép toán hình thái đã tìm hiểu trong xử lý ảnh. Trên cơ sở lý thuyết đã tìm hiểu em xây dựng chương trình xử lý ảnh sử dụng các phép toán: phép co nhị phân, phép giãn nhị 3 phân, phép đóng ảnh, phép mở ảnh, tìm biên ảnh và tìm xương làm mảnh các đối tượng trên ảnh nhị phân và thực nghiệm. 4 CHƢƠNG I. TỔNG QUAN VỀ PHƢƠNG PHÁP NÂNG CAO CHẤT LƢỢNG ẢNH Trong ngành khoa học máy tính, xử lý ảnh là một dạng của xử lý tín hiệu cho đầu vào là một ảnh hoặc các frame của phim ảnh. Đầu ra có thể là một hình ảnh, hoặc tập hợp các ký tự hoặc các tham số liên quan tới hình ảnh. Thường thì kỹ thuật xử lý ảnh có liên quan tới xử lý tín hiệu hai chiều và được áp dụng bằng một chuẩn riêng về kỹ thuật xử lý ảnh cho nó. Các khái niệm cơ bản để xử lý tín hiệu như, khái niệm về tích chập, các biến đổi Fourier, biến đổi Laplace, các bộ lọc hữu hạn… Ngoài ra còn cần tới các công cụ toán học như đại số tuyến tính, sác xuất, thống kê. Và một số kiến thức cần thiết như trí tuệ nhân tao, mạng nơron nhân tạo cũng được đề cập trong quá trình phân tích và nhận dạng ảnh. 1.1 Giới thiệu chung về xử lý ảnh Cũng như xử lý dữ liệu bằng đồ hoạ, xử lý ảnh là một lĩnh vực của tin học ứng dụng. Xử lý dữ liệu bằng đồ họa đề cập đến những ảnh nhân tạo, các ảnh này được xem xét như là một cấu trúc dữ liệu và được tạo ra bởi các chương trình. Xử lý ảnh bao gồm các phương pháp và kỹ thuật để biến đổi, để truyền tải hoặc mã hóa các ảnh tự nhiên. Mục đích của xử lý ảnh gồm: Thứ nhất, biến đổi ảnh và làm đẹp ảnh. Thứ hai, tự động nhận dạng ảnh hay đoán nhận ảnh và đánh giá các nội dung của ảnh. Nhận dạng ảnh là quá trình liên quan đến các mô tả đối tượng mà người ta muốn đặc tả nó. Quá trình nhận dạng thường đi sau quá trình trích chọn các đặc tính chủ yếu của đối tượng. Có hai kiểu mô tả đối tượng: - Mô tả tham số (nhận dạng theo tham số). - Mô tả theo cấu trúc(nhận dạng theo cấu trúc). 5 Nhận biết và đánh giá các nội dung của ảnh là sự phân tích một hình ảnh thành những phần có nghĩa để phân biệt đối tượng này với đối tượng khác. Dựa vào đó ta có thể mô tả cấu trúc của hình ảnh ban đầu. Có thể liệt kê một số phương pháp nhận dạng cơ bản như nhận dạng biên của một đối tượng trên ảnh, tách cạnh, phân đoạn hình ảnh ... Kỹ thuật này được sử dụng nhiều trong y học (xử lý tế bào, nhiễm sắc thể). Trong thực tế người ta đã áp dụng kỹ thuật nhận dạng khá thành công với nhiều đối tượng khác nhau như: nhận dạng ảnh vân tay, nhận dạng chữ (chữ cái, chữ số, chữ có dấu). Nhận dạng chữ in hoặc đánh máy trong văn bản phục vụ cho việc tự động hoá quá trình đọc tài liệu, tăng nhanh tốc độ và chất lượng thu nhận thông tin từ máy tính, nhận dạng chữ viết tay (với mức độ ràng buộc khác nhau về cách viết, kiểu chữ, ...). Các quá trình của xử lý ảnh: Các quá trình của xử lý ảnh [1] được tiến hành theo sơ đồ sau: Lưu trữ Lưu trữ Camera Thu nhận ảnh Số hoá Nhận dạng Phân tích ảnh Sensor Hệ quyết định Hình 1.1: Các giai đoạn chính trong xử lý ảnh Trước hết là quá trình thu nhận ảnh. Ảnh có thể thu nhận qua camera. Thường ảnh thu nhận qua camera là tín hiệu tương tự (loại camera ống kiểu CCIR), nhưng cũng có thể là tín hiệu số hoá (loại CCD - Charge Coupled Device). 6 Ảnh có thể thu nhận từ vệ tinh qua các bộ cảm ứng (sensor), hay ảnh, sách được quét qua scanner. Tiếp theo là quá trình số hóa (Digitalizer) để biến đổi tín hiệu tương tự sang tín hiệu rời rạc (lấy mẫu) và số hóa bằng lượng hóa, trước khi chuyển sang giai đoạn xử lý, phân tích hay lưu trữ lại. Quá trình phân tích ảnh thực chất bao gồm nhiều công đoạn nhỏ. Trước hết là công việc tăng cường hình ảnh (Image Enhancement) để nâng cao chất lượng hình ảnh. Do những nguyên nhân khác nhau: có thể do thiết bị thu nhận ảnh, do nguồn sáng hay do nhiễu, ảnh có thể bị suy biến. Do vậy cần phải tăng cường và khôi phục (Image Restoration) lại ảnh để làm nổi bật một số đặc tính chính của ảnh, hay làm cho ảnh gần giống với trạng thái gốc- trạng thái trước khi ảnh bị biến dạng. Giai đoạn tiếp theo là phát hiện các đặc tính như biên (Edge Detection), phân vùng ảnh (Image Segmentation), trích chọn các đặc trưng (Feature Extraction),v.v... Cuối cùng, tuỳ theo mục đích của ứng dụng, sẽ là giai đoạn nhận dạng, phân lớp hay các quyết định khác. Các giai đoạn chính của quá trình xử lý ảnh có thể mô tả ở hình 1.1, việc nâng cao chất lượng ảnh trước khi nhận dạng hay đối sánh là việc cần phải giải quyết. 1.2 Giới thiệu ảnh nhị phân Như đã giới thiệu ở trên. Trong quá trình xử lý ảnh, một ảnh được nhận vào máy tính phải được mã hoá. Hình ảnh khi lưu trữ dưới dạng tập tin phải được số hoá. Tiêu chuẩn đặt ra là ảnh phải lưu trữ thế nào sao cho các ứng dụng khác nhau có thể thao tác trên các loại dữ liệu này. Hiện nay có trên 50 quy cách lưu trữ ảnh khác nhau, trong đó ta thường gặp các dạng ảnh sau: TIFF, GIF, BMP, PCX, JPEG, ... Nói chung mỗi kiểu lưu ảnh có ưu điểm riêng. 1.2.1 Một số khái miệm Pixel (Picture Element): Phần tử ảnh Ảnh trong thực tế là một ảnh liên tục về không gian và về giá trị độ sáng. Để có thể xử lý ảnh bằng máy tính cần thiết phải tiến hành số hoá ảnh. Trong quá trình 7 số hoá, người ta biến đổi tín hiệu liên tục sang tín hiệu rời rạc thông qua quá trình lấy mẫu (rời rạc hoá về không gian) và lượng hoá thành phần giá trị mà về nguyên tắc, mắt thường không phân biệt được hai điểm kề nhau. Trong quá trình này, người ta sử dụng khái niệm Picture Element mà ta quen gọi hay viết là pixel – phần tử ảnh. Như vậy một ảnh là một tập hợp các pixel. Ở đây cũng cần phân biệt khái niệm pixel hay đề cập đến trong các hệ thống đồ hoạ máy tính. Để tránh nhầm lẫn ta tạm gọi khái niệm pixel này là pixel thiết bị. Khái niệm pixel thiết bị có thể xem xét như sau: khi ta quan sát màn hình (trong chế độ đồ hoạ), màn hình không liên tục mà gồm nhiều điểm nhỏ, gọi là pixel. Mỗi pixel gồm một cặp toạ độ (x,y) và màu. Ảnh nhị phân: Tuỳ theo vùng các giá trị mức xám của điểm ảnh, mà các ảnh được phân chia ra thành ảnh màu, ảnh xám, hay ảnh nhị phân. Khi trên một ảnh chỉ có giá trị 0 hoặc 1 thì ta nói đó là một ảnh nhị phân hoặc ảnh đen trắng và các điểm ảnh của nó gọi là điểm ảnh nhị phân. 1.2.2 Nâng cao chất lƣợng ảnh bằng kỹ thuật phát hiện biên và tìm xƣơng Trong xử lý ảnh và nhận dạng ảnh, có một số loại ảnh đường nét gồm các đối tượng (objects) là các đường cong có độ dài lớn hơn nhiều so với độ dày của nó, ví dụ như là ảnh các kí tự, dấu vân tay, sơ đồ mạch điện tử, bản vẽ kỹ thuật, bản đồ v.v... Để xử lý các loại ảnh này người ta thường xây dựng các hệ mô phỏng theo cách phân tích ảnh của con người gọi là hệ thống thị giác máy (Computer Vision System[10]). Có nhiều hệ thống được cài đặt theo phương pháp này như hệ thống nhận dạng chữ viết bằng thiết bị quang học OCR (Optical Character Recognition ), hệ thống nhận dạng vân tay AFIS (Automated fingerprint Identification System) v.v... 8 §äc ¶nh TiÒn (Scanner xö lý (N©ng cÊp vµ /Camer a) kh«i phôc) Tr Ých tr än ®Æc ®iÓm §èi s¸nh NhËn d¹ng Hình 1.2 Mô hình tổng quát của hệ thống nhận dạng ảnh Có nhiều phương pháp trích chọn đặc điểm được biết tới như phương pháp sử dụng sóng ngắn (Wavelet), sử dụng hệ số Fourier, sử dụng các mô men bất biến, sử dụng các đặc trưng của biên như tính trơn và các điểm đặc biệt, sử dụng các đặc trưng tôpô dựa trên phát hiện biên và tìm xương của đường nét ảnh Phương pháp trích chọn đặc điểm sử dụng ảnh được sử dụng nhiều. Kỹ thuật phát hiện biên và tìm xương là một trong nhiều ứng dụng nghiên cứu và giải quyết một số vấn đề của bài toán nêu trên trong công đoạn tiền xử lý ảnh. 1.2.2.1 Phƣơng pháp phát hiện biên. Biên là vấn đề quan trọng trong trích chọn đặc điểm nhằm tiến tới hiểu ảnh. Về mặt toán học người ta xem điểm biên là điểm có sự thay đổi đột ngột về mức xám. Ví dụ: Đối với ảnh đen trắng, một điểm được gọi là điểm biên nếu nó là điểm đen có ít nhất một điểm trắng bên cạnh. Tập hợp các điểm biên tạo nên biên hay đường bao của đối tượng. 9 Xuất phát từ cơ sở này người ta thường sử dụng hai phương pháp phát hiện biên cơ bản: a) Phát hiện biên trực tiếp: Phương pháp này làm nổi biên dựa vào sự biến thiên mức xám của ảnh. Kỹ thuật chủ yếu dùng để phát hiện biên ở đây là dựa vào sự biến đổi theo hướng. Nếu lấy đạo hàm bậc nhất của ảnh ta có kỹ thuật Gradient, nếu lấy đạo hàm bậc hai của ảnh ta có kỹ thuật Laplace.  Kỹ thuật phát hiện biên Gradient: Theo định nghĩa gradient[3] là một véctơ có các thành phần biểu thị tốc độ thay đổi giá trị của điểm ảnh, ta có: f ( x, y ) f ( x  dx, y )  f ( x, y )  fx  x dx f ( x, y ) f ( x, y  dy )  f ( x, y )  fy  y dy Với dx là khoảng cách giữa các điểm theo hướng x (khoảng cách tính bằng số điểm) và tương tự với dy. Việc xấp xỉ đạo hàm bậc nhất theo các hướng x và y được thực hiện thông qua 2 mặt nạ nhân chập tương ứng sẽ cho ta các kỹ thuật phát hiện biên khác nhau( kỹ thuật Sobel, kỹ thuật Prewitt…).  Kỹ thuật phát hiện biên Laplace: Các phương pháp đánh giá gradient ở trên làm việc khá tốt khi mà độ sáng thay đổi rõ nét. Khi mức xám thay đổi chậm, miền chuyển tiếp trải rộng, phương pháp cho hiệu quả hơn đó là phương pháp sử dụng đạo hàm bậc hai Laplace. Toán tử Laplace[3] được định nghĩa như sau: 10 2 f 2 f  f  2  2 dx dy 2 Ta có: 2 f  2 f ( x, y )  f ( x  1, y )  f ( x  1, y ) x 2 2 f  2 f ( x, y )  f ( x, y  1)  f ( x, y  1) y 2 Vậy: 2 f= -f(x-1,y) - f(x,y-1) + 4f(x,y) - f(x,y+1) - f(x+1,y) b) Phát hiện biên gián tiếp: Nếu bằng cách nào đó ta phân được ảnh thành các vùng thì ranh giới giữa các vùng đó gọi là biên. Kỹ thuật dò biên và phân vùng ảnh là hai bài toán đối ngẫu nhau vì dò biên để thực hiện phân lớp đối tượng mà khi đã phân lớp xong nghĩa là đã phân vùng được ảnh và ngược lại, khi đã phân vùng ảnh đã được phân lớp thành các đối tượng, do đó có thể phát hiện được biên. Có hai kỹ thuật dò biên cơ bản. Kỹ thuật thứ nhất xét ảnh biên thu được từ ảnh vùng sau một lần duyệt như một đồ thị, sau đó áp dụng các thuật toán duyệt cạnh đồ thị. Kỹ thuật thứ hai dựa trên ảnh vùng, kết hợp đồng thời quá trình dò biên và tách biên. Ở đây ta quan tâm cách tiếp cận thứ hai. Trước hết, giả sử ảnh được xét chỉ bao gồm một vùng ảnh 8-liên thông, được bao bọc bởi một vành đai các điểm nền. Về cơ bản, các thuật toán dò biên[5] trên một vùng đều bao gồm các bước sau: - Xác định điểm biên xuất phát - Dự báo và xác định điểm biên tiếp theo - Lặp bước 2 cho đến khi gặp điểm xuất phát 11 Do xuất phát từ những tiêu chuẩn và định nghĩa khác nhau về điểm biên, và quan hệ liên thông, các thuật toán dò biên cho ta các đường biên mang các sắc thái rất khác nhau. Kết quả tác động của toán tử dò biên lên một điểm biên là điểm biên +1. Thông thường các toán tử này được xây dựng như một hàm đại số Boolean trên các 8-láng giềng của điểm biên. Mỗi cách xây dựng các toán tử đều phụ thuộc vào định nghĩa quan hệ liên thông và điểm biên. Do đó sẽ gây khó khăn cho việc khảo sát các tính chất của đường biên. Ngoài ra, vì mỗi bước dò biên đều phải kiểm tra tất cả các 8-láng giềng của mỗi điểm nên thuật toán thường kém hiệu quả. Để khắc phục các hạn chế trên, thay vì sử dụng một điểm biên ta sử dụng cặp điểm biên (ngoài và trong), các cặp điểm này tạo nên tập nền vùng, tiếp theo phân tích toán tử dò biên thành 2 bước: - Xác định cặp điểm nền vùng tiếp theo. - Lựa chọn điểm biên Trong đó bước thứ nhất thực hiện chức năng của một ánh xạ trên tập nền vùng lên nền vùng tiếp theo và bước thứ hai thực hiện chức năng chọn điểm biên. Thuật toán dò biên tổng quát Bƣớc 1: Xác định cặp nền-vùng xuất phát Bƣớc 2: Xác định cặp nền-vùng tiếp theo Bƣớc 3: Lựa chọn điểm biên Bƣớc 4: Nếu gặp lại cặp xuất phát thì dừng, nếu không quay lại bước 2. Việc xác định cặp nền-vùng xuất phát được thực hiện bằng cách duyệt ảnh lần lượt từ trên xuống dưới và từ trái qua phải rồi kiểm tra điều kiện lựa chọn cặp nềnvùng. Do việc chọn điểm biên chỉ mang tính chất quy ước, nên ta gọi ánh xạ xác định cặp nền-vùng tiếp theo là toán tử dò biên. 12 c) Kết luận : Phương pháp phát hiện biên trực tiếp tỏ ra khá hiệu quả và ít chịu ảnh hưởng của nhiễu, song nếu sự biến thiên độ sáng không đột ngột, phương pháp tỏ ra kém hiệu quả, phương pháp phát hiện biên gián tiếp tuy khó cài đặt, song lại áp dụng khá tốt trong trường hợp này. 1.2.2.2 Kỹ thuật tìm xƣơng. Xương được coi như hình dạng cơ bản của một đối tượng, với số ít các điểm ảnh cơ bản. Ta có thể lấy được các thông tin về hình dạng nguyên bản của một đối tượng thông qua xương. Một định nghĩa xúc tích về xương (tương tự như hiện tượng cháy đồng cỏ) được đưa ra bởi Blum (1976)[3] như sau: Giả thiết rằng đối tượng là đồng nhất được phủ bởi cỏ khô và sau đó dựng lên một vòng biên lửa. Xương được định nghĩa như nơi gặp của các vệt lửa và tại đó chúng được dập tắt a) Ảnh gốc b) Ảnh xương Hình 1.3: Ví dụ về ảnh và xương Kỹ thuật tìm xương luôn là chủ đề nghiên cứu trong xử lý ảnh những năm gần đây. Mặc dù có những nỗ lực cho việc phát triển các thuật toán tìm xương, nhưng các phương pháp được đưa ra đều bị mất mát thông tin. Có thể chia thành hai loại thuật toán tìm xương cơ bản: 13 a) Các thuật toán tìm xƣơng gián tiếp dựa trên làm mảnh Thuật toán làm mảnh ảnh số nhị phân là một trong các thuật toán quan trọng trong xử lý ảnh và nhận dạng. Xương chứa những thông tin bất biến về cấu trúc của ảnh, giúp cho quá trình nhận dạng hoặc vectơ hoá sau này. Thuật toán làm mảnh là quá trình lặp duyệt và kiểm tra tất cả các điểm thuộc đối tượng. Trong mỗi lần lặp tất cả các điểm của đối tượng sẽ được kiểm tra: nếu như chúng thoả mãn điều kiện xoá nào đó tuỳ thuộc vào mỗi thuật toán thì nó sẽ bị xoá đi. Quá trình cứ lặp lại cho đến khi không còn điểm biên nào được xoá. Đối tượng được bóc dần lớp biên cho đến khi nào bị thu mảnh lại chỉ còn các điểm biên. Các thuật toán làm mảnh được phân loại dựa trên phương pháp xử lý các điểm là thuật toán làm mảnh song song và thuật toán làm mảnh tuần tự. Thuật toán làm mảnh song song[10] là thuật toán mà trong đó các điểm được xử lý theo phương pháp song song, tức là được xử lý cùng một lúc. Giá trị của mỗi điểm sau một lần lặp chỉ phụ thuộc vào giá trị của các láng giềng bên cạnh (thường là 8-láng giềng) mà giá trị của các điểm này đã được xác định trong lần lặp trước đó. Trong máy có nhiều bộ vi xử lý mỗi vi xử lý sẽ xử lý một vùng của đối tượng, nó có quyền đọc từ các điểm ở vùng khác nhưng chỉ được ghi trên vùng của nó xử lý. Trong thuật toán làm mảnh tuần tự[10] các điểm thuộc đối tượng sẽ được kiểm tra theo một thứ tự nào đó (chẳng hạn các điểm được xét từ trái qua phải, từ trên xuống dưới). Giá trị của điểm sau mỗi lần lặp không những phụ thuộc vào giá trị của các láng giềng bên cạnh mà còn phụ thuộc vào các điểm đã được xét trước đó trong chính lần lặp đang xét. Một số thuật toán làm mảnh Trong phần này điểm qua một số đặc điểm, ưu và khuyết điểm của các thuật toán đã được nghiên cứu. 14  Thuật toán làm mảnh cổ điển là thuật toán song song[10] , tạo ra xương 8 liên thông, tuy nhiên nó rất chậm, gây đứt nét, xoá hoàn toàn một số cấu hình nhỏ.  Thuật toán làm mảnh của Toumazet[8] bảo toàn tất cả các điểm cụt không gây đứt nét đối tượng. Tuy nhiên, thuật toán có nhược điểm là rất chậm, rất nhạy cảm với nhiễu, xương chỉ là 4-liên thông và không làm mảnh được với một số cấu hình phức tạp  Thuật toán làm mảnh của Y.Xia[10] dựa trên đường biên của đối tượng, có thể cài đặt theo cả phương pháp song song và tuần tự. Tốc độ của thuật toán rất nhanh. Nó có nhược điểm là gây đứt nét, xương tạo ra là xương giả (có độ dày là 2 phần tử ảnh).  Thuật toán làm mảnh của N.J.Naccache và R.Shinghal[8,12]. Thuật toán có ưu điểm là nhanh, xương tạo ra có khả năng khôi phục ảnh ban đầu của đối tượng. Nhược điểm chính của thuật toán là rất nhạy với nhiễu, xương nhận được phản ánh cấu trúc của đối tượng thấp.  Thuật toán làm mảnh của H.E.Lu P.S.P Wang [8,12]tương đối nhanh, giữ được tính liên thông của ảnh, nhưng lại có nhược điểm là xương tạo ra là xương 4-liên thông và xoá mất một số cấu hình nhỏ.  Thuật toán làm mảnh của P.S.P Wang và Y.Y.Zhang[8,7] dựa trên đường biên của đối tượng, có thể cài đặt theo phương pháp song song hoặc tuần tự, xương là 8-liên thông, ít chịu ảnh hưởng của nhiễu. Nhược điểm chính của thuật toán là tốc độ chậm.  Thuật toán làm mảnh song song thuần tuý[8,12] nhanh nhất trong các thuật toán trên, bảo toàn tính liên thông, ít chịu ảnh hưởng của nhiễu. Nhược điểm là xoá hoàn toàn một số cấu hình nhỏ, xương tạo ra là xương 4-liên thông. 15 b) Các thuật toán tìm xƣơng trực tiếp không dựa trên làm mảnh Để tách được xương của đối tượng không dựa trên làm mảnh (lược đồ Voronoi[9]) có thể sử dụng đường biên của đối tượng. Với điểm p bất kỳ trên đối tượng, ta bao nó bởi một đường biên. Nếu như có nhiều điểm biên có cùng khoảng cách ngắn nhất tới p thì p nằm trên trục trung vị. Tập tất cả các điểm như vậy lập thành trục trung vị hay xương của đối tượng. Việc xác định xương được tiến hành thông qua hai : Bƣớc thứ nhất: tính khoảng cách từ mỗi điểm ảnh của đối tượng đến điểm biên gần nhất. Như vậy cần phải tính toán khoảng cách tới tất cả các điểm biên của ảnh. Bƣớc thứ hai: khoảng cách ảnh đã được tính toán và các điểm ảnh có giá trị lớn nhất được xem là nằm trên xương của đối tượng. 1.2.3 Nâng cao chất lƣợng ảnh bằng các phép toán hình thái. Hình ảnh trong thực tế khi nhận được qua các thiết bị như: Photocopy, Fax, .. ít nhiều đều bị nhiễu, thậm chí có thể biến dạng đến mức độ có thể khiến người nhận được hiểu sai về mặt ý nghĩa. Như chúng ta đã biết trong các ngành thiết kế kỹ thuật như: thiết kế máy, thiết kế xây dựng, thiết kế mạch điện v.v. dù là theo TCVN (tiêu chuẩn Việt Nam) hay ISO(International Standard Oganize), một bản vẽ được thể hiện chỉ xoay quanh một số dạng đường như: đường thẳng, đường cong khép kín, đường cong mở (có thể lồi hoặc lõm), các cung tròn, elip, đường ZigZag...Các dạng đường như thế được biểu diễn bằng những nét vẽ. Nét vẽ có thể là nét liền (Continuous), có thể là nét đứt (dash), có thể là nét chấm gạch như đường tâm (Center), có thể là đường khuất (Hide)... (Hình 1.4), Mỗi độ lớn (high) của nét vẽ (nét mảnh hoặc nét đậm), có khi thể hiện một ý nghiã khác nhau. Như trong thể hiện của đường ren của một bulon chẳng hạn: đường chân ren phải được thể hiện bằng một nét liền mảnh, trong khi đường đỉnh của ren lại phải thể hiện bằng một nét đậm. Hoặc một đường khuất, sẽ thể hiện cho hình chiếu của một đường thuộc một 16 mặt được nằm ở phía sau của một mặt khác theo góc nhìn vuông góc với mặt phẳng chiếu. Trong khi đó, nét liền sử dụng để biểu diễn cho hình chiếu cuả đối tượng ở mặt trước đó. Nét liền mảnh Nét đứt Đường tâm Hình 1.4: Một số dạng biểu diễn đường thẳng trong các bản vẽ kỹ thuật Do vậy, nếu như nét vẽ của một đường thẳng lẽ ra là một nét vẽ liền trong khi đó đường mà chúng ta nhận được lại là một nét đứt thì việc đọc các thông tin trên bản vẽ sẽ dẫn đến việc hiểu sai về mặt ý nghĩa là điều không tránh khỏi. Để giải quyết bài toán này như: nối liền những nét đứt, nối liền chữ, làm trơn biên ảnh ... các phép toán hình thái nhị phân đã ra đời, thông qua đó các phép đóng ảnh, mở ảnh cũng được định nghĩa để giải quyết bài toán nêu trên. 1.2.4 Kết luận và vấn đề nghiên cứu: Nâng cao chất lượng ảnh là một vấn đề quan trọng và không thể thiếu trong quá trình nhận dạng đối tượng. Trong thực tế, hình dạng thường được chú trọng hơn kích thước và con người nhận ra các đối tượng xung quanh chủ yếu thông qua hình dạng. Chương này đã trình bày hệ thống về các phương pháp nâng cao chất lượng ảnh theo xương và biên và giới thiệu sơ lược về phép toán Hình thái học. Các phép toán hình thái học là các phép toán kinh điển trong toán học đã có nhiều ứng dụng trong toán học. Và trong chương kế tiếp sẽ ứng dụng các phép toán hình thái vào việc nâng cao chất lượng ảnh trước khi lưu trữ và đối sánh. 17 So sánh kết quả giữa các thuật toán, sử dụng phép toán hình thái cho ảnh tìm biên khá rõ và nét tốt. Trong hình 1.5a dưới đây là ảnh gốc, hình 1.5b là ảnh biên thu được qua phát hiện biên bằng Sobel, hình 1.5c qua Laplace. Hình 1.5d là ảnh biên kết quả thực hiện bởi thuật toán phát hiện biên bằng các phép toán hình thái trên với ngưỡng tách  = 128 a) Ảnh gốc đa cấp xám c)Ảnh biên thu được qua Laplace b)Ảnh biên thu được qua Sobel d) Ảnh kết quả Hình 1.5. So sánh phát hiện biên bởi các thuật toán 18 CHƢƠNG II. NÂNG CAO CHẤT LƢỢNG ẢNH BẰNG PHÉP TOÁN HÌNH THÁI Ý nghĩa của “Morphology” là hình thái học và cấu trúc của đối tượng, hay nó mô tả những phạm vi và các mối quan hệ giữa các thành phần trong một đối tượng. Hình thái học quá quen thuộc trong các lĩnh vực ngôn ngữ học và sinh học. Trong ngôn ngữ học, hình thái học là sự nghiên cứu về cấu trúc của từ, tập hợp từ, câu… và đó cũng là một lĩnh vực nghiên cứu nhiều năm nay. Còn trong sinh học, hình thái học lại chú trọng tới hình dạng của một cá thể hơn, chẳng hạn có thể phân tích hình dạng của một chiếc lá để từ đó có thể nhận dạng được đó là loại cây gì, nghiên cứu hình dạng của một nhóm vi khuẩn, dựa trên các đặc điểm nhận dạng để phân biệt chúng thuộc nhóm vi khuẩn nào… Tùy theo trường hợp cụ thể mà có cách phân lớp phù hợp với nó: Có thể phân lớp dựa trên những hình dạng của mặt cắt như (Elip, tròn…), kiểu và mức độ của những hình dạng bất quy tắc (lồi, lõm, …), những cấu trúc trong (lỗ, đường thẳng, đường cong, …) mà đã được tích lũy qua nhiều năm quan sát. Tính khoa học của Hình thái học số mới chỉ thực sự phát huy khả năng của nó kể từ khi máy tính điện tử số ra đời và làm cho hình thái học trở lên thông dụng, có nhiều tính năng mới. Những đối tượng trong Hình thái học ta có thể coi như là tập hợp của các điểm ảnh, nhóm lại theo cấu trúc ma trận hai chiều. Những thao tác toán học rời rạc trên tập hợp điểm đó được sử dụng để làm rõ những nét đặc trưng riêng của hình dạng đối tượng, do vậy có thể tính toán được hay nhận biết được chúng một cách dễ dàng. Phần lớn các phép toán hình thái học được định nghĩa từ hai phép toán cơ bản là phép toán co nhị phân (Erosion) và phép toán giãn nhị phân (Dilation) . Phép toán cơ sở được kết hợp với một đối tượng là tiêu chuẩn của các phép toán tập hợp như phép hợp (Union), Phép giao (InterSection), và phép bù (Complement) cộng với phép tịnh tiến nào đó. Vì vậy trong phần tiếp theo sẽ trình bày các khái niệm về tập hợp thường được sử dụng trong phép toán hình thái. 19 2.1. Khái niệm cơ bản Ta đã định nghĩa ảnh nhị phân là tập hợp các điểm ảnh có tọa độ (x,y). Chúng ta còn có định nghĩa khác về ảnh, theo quan sát thì có thể xem ảnh như tập hợp các tọa độ rời rạc hoặc liên tục. Theo một định nghĩa nào đó thì, tập hợp này tương ứng với các điểm ảnh thuộc về các đối tượng hiện hữu trong ảnh. Hình 2.1: Ảnh và đối tượng trong ảnh . Hình vẽ cho thấy hai đối tượng, hay hai tập hợp A và B trong ảnh. Ở đây ta cần phải xác định hệ trục tọa độ như trong hình, quan tâm đến giá trị các điểm ảnh cấu thành lên đối tượng trong ảnh và được giới hạn trên không gian rời rạc Đầu tiên, ta có A là một tập hợp trong không gian rời rạc . . Nếu a = (a1, a2) là một phần tử của tập hợp A thì ta có thể viết như sau: a A (0.1) Như thế, nếu a không phải là một phần tử của tập hợp A thì ta viết: a A (0.2) Tập hợp mà không có phần tử gọi là tập hợp rỗng hoặc tập hợp trống và được biểu thị bằng ký tự  .
- Xem thêm -