Lời Cảm Ơn !
Đầu tiên em xin chân thành cảm ơn PGS. TS. Ngô Quốc Tạo - người đã trực
tiếp hướng dẫn và định hướng giúp em có thể nhanh chóng tiếp cận, nắm bắt kiến
thức và hoàn thành luận văn ”Nghiên cứu một số kỹ thuật nâng cao chất lượng ảnh
nhị phân và Ứng dụng”.
Em xin gửi lời cảm ơn tới Trung Tâm Thông Tin Tư Liệu - Trường Đại Học
Lạc Hồng, nơi em đang công tác, vì đã tạo điều kiện thuận lợi cho em trong suốt
quá trình học tập và làm việc tại trường.
Em xin gửi lời cảm ơn tới toàn thể thầy cô giáo khoa Công Nghệ Thông Tin Trường Đại Học Lạc Hồng, đã tận tình giảng dạy trang bị cho em những kiến thức
quý báu trong những năm học vừa qua.
Em xin gửi lời cảm ơn đến những người thân trong gia đình, bạn bè đã động
viên và tạo mọi điều kiện giúp chúng em trong quá trình học tập cũng như trong
cuộc sống.
Em xin chân thành cảm ơn!
Đồng Nai, Ngày 30 tháng 05 năm 2011
Học viên thực hiện
TRẦN ĐỨC TOÀN
1
Lời Mở Đầu !
Trong thực tế hình dạng thường được chú trọng hơn kích thước và con người
nhận ra các đối tượng xung quanh cũng chủ yếu thông qua hình ảnh. Hình ảnh là
một dạng dữ liệu đóng vai trò quan trọng trong việc trao đổi, xử lý, lưu giữ thông
tin...Trong chúng ta có lẽ không có ai đã không từng sử dụng hình ảnh cho một mục
đích nào đấy. Trong nhiều ngành nghề, trong một số các loại hình công việc, người
ta điều cần đến hình ảnh để mô tả, minh chứng hay diễn đạt những điều mà đôi khi
chữ viết hay ngôn ngữ nói không diễn tả hết được. Đặc biệt trong một số ngành
nghề như: cơ khí chế tạo, sản xuất, học tập, báo chí, việc đọc hình ảnh có thể nói là
thường xuyên và cực kỳ quan trọng. Bản vẽ kỹ thuật (một dạng của hình ảnh), tài
liệu điện tử (giáo trình tham khảo) chính là kết quả ngôn ngữ kỹ thuật. Mà qua nó,
một qui trình công nghệ phải được xây dựng trong quá trình sản xuất, cũng như nó
chính là cơ sở cho việc nghiệm thu cho bất kỳ sản phẩm nào. Để lưu ảnh của các tài
liệu, các bản vẽ hoặc sửa đổi chúng và chuyển chúng sang các dạng đồ hoạ khác
tiện cho việc nhận dạng, đối sánh mẫu để sử dụng sau này là điều cần thiết. Nhưng
phải tổ chức việc lưu các dạng hình ảnh này như thế nào? Có cần xử lý trước khi
lưu chúng không? Câu trả lời là có. Do vậy tiền xử lý ảnh là việc cần làm. Có nhiều
phương pháp, nhiều công cụ, nhiều phần mềm xử lý ảnh đã ra đời. Tăng cường chất
lượng ảnh, mà công đoạn đầu tiên là một bước tiền xử lý nhằm xác định ảnh, khắc
phục những khiếm khuyết do bước thu nhận ảnh không tốt là việc làm quan trọng.
Có nhiều phương pháp cho việc nâng cao chất lượng ảnh nói chung và tiền xử lý
nói riêng. Trong luận văn này em chỉ mô tả một vài phương pháp tiền xử lý hình
ảnh (chú trọng đến ảnh nhị phân, bởi ảnh của các bản vẽ kỹ thuật và sách scan
thường chỉ là ảnh 2 màu: đen, trắng) nhằm cải thiện chất lượng hình ảnh bằng các
thao tác Hình thái học (Morphology) để ứng dụng vào chương trình nâng cao chất
lượng ảnh Scan tài liệu giáo trình điện tử tại thư viện Trường Đại học Lạc Hồng.
Các thao tác Hình thái học nói chung, đặc biệt là Hình thái học số được sử
dụng chủ yếu vào việc cải thiện ảnh bằng cách làm rõ (tái hiện) những nét đặc trưng
2
của các hình dạng, do vậy mà có thể tính toán được hay nhận biết được chúng một
cách dễ dàng. Việc sử dụng các thao tác hình thái và ứng dụng của chúng, đặc biệt
là ứng dụng nâng cao chất lượng hình ảnh cho bước tiền xử lý, trước khi thực hiện
những bước kế tiếp cho công việc xử lý ảnh .
Chính vì vậy em đã lựa chọn luận văn “Nghiên cứu một số kỹ thuật nâng cao
chất lượng ảnh nhị phân và Ứng dụng”.
Mục tiêu của luận văn là tìm hiểu nghiên cứu một số kỹ thuật nâng cao chất
lượng ảnh nhị phân vào xử lý các đối tượng trong hình ảnh và xây dựng chương
trình ứng dụng thực tế.
Báo cáo luận văn được chia làm 3 chương:
Chƣơng I. Tổng quan về phƣơng pháp nâng cao chất lƣợng ảnh: Chương
này gồm có các khái niệm ban đầu về xử lý ảnh, ảnh nhị phân, tầm quan trọng, biểu
diễn hình dạng cơ bản theo biên và xương và các bước được thực hiện trong quá
trình xử lý ảnh. Sau đó nêu mục tiêu trong chương 2 là sử dụng các phép toán hình
thái trong việc xử lý ảnh.
Chƣơng II. Nâng cao chất lƣợng ảnh bằng phép toán hình thái: Chương
này gồm có các phép toán hình thái nâng cao chất lượng ảnh, từ cơ bản đến những
khái niệm nâng cao và ứng dụng trong thực tế. Đầu tiên là các khái niệm tập hợp
như các quan hệ phép hợp, phép giao, phép bù… sau đó là các phép toán logic liên
quan đến quá trình xử lý ảnh nhị phân, để tiện cho việc phân tích và chứng minh các
công thức chính của phép toán hình thái. Toàn bộ chương tập trung làm rõ các khái
niệm về: phép co nhị phân, phép giãn nhị phân, phép đóng ảnh, phép mở ảnh, phép
trúng hoặc trượt (Hit-or-Miss), phép trích biên, phép làm đầy, phép tách các thành
phần liên thông, phép bao lồi, phép làm mảnh và tìm xương.
Chƣơng III. Ứng dụng của phép toán hình thái trong nâng cao chất lƣợng
ảnh: Chương này so sánh cách tiếp cận của luận văn, các ứng dụng của phép toán
hình thái đã tìm hiểu trong xử lý ảnh. Trên cơ sở lý thuyết đã tìm hiểu em xây dựng
chương trình xử lý ảnh sử dụng các phép toán: phép co nhị phân, phép giãn nhị
3
phân, phép đóng ảnh, phép mở ảnh, tìm biên ảnh và tìm xương làm mảnh các đối
tượng trên ảnh nhị phân và thực nghiệm.
4
CHƢƠNG I. TỔNG QUAN VỀ PHƢƠNG PHÁP NÂNG CAO
CHẤT LƢỢNG ẢNH
Trong ngành khoa học máy tính, xử lý ảnh là một dạng của xử lý tín hiệu cho
đầu vào là một ảnh hoặc các frame của phim ảnh. Đầu ra có thể là một hình ảnh,
hoặc tập hợp các ký tự hoặc các tham số liên quan tới hình ảnh. Thường thì kỹ thuật
xử lý ảnh có liên quan tới xử lý tín hiệu hai chiều và được áp dụng bằng một chuẩn
riêng về kỹ thuật xử lý ảnh cho nó. Các khái niệm cơ bản để xử lý tín hiệu như, khái
niệm về tích chập, các biến đổi Fourier, biến đổi Laplace, các bộ lọc hữu hạn…
Ngoài ra còn cần tới các công cụ toán học như đại số tuyến tính, sác xuất, thống kê.
Và một số kiến thức cần thiết như trí tuệ nhân tao, mạng nơron nhân tạo cũng được
đề cập trong quá trình phân tích và nhận dạng ảnh.
1.1 Giới thiệu chung về xử lý ảnh
Cũng như xử lý dữ liệu bằng đồ hoạ, xử lý ảnh là một lĩnh vực của tin học ứng
dụng. Xử lý dữ liệu bằng đồ họa đề cập đến những ảnh nhân tạo, các ảnh này được
xem xét như là một cấu trúc dữ liệu và được tạo ra bởi các chương trình. Xử lý ảnh
bao gồm các phương pháp và kỹ thuật để biến đổi, để truyền tải hoặc mã hóa các
ảnh tự nhiên. Mục đích của xử lý ảnh gồm:
Thứ nhất, biến đổi ảnh và làm đẹp ảnh.
Thứ hai, tự động nhận dạng ảnh hay đoán nhận ảnh và đánh giá các nội dung
của ảnh.
Nhận dạng ảnh là quá trình liên quan đến các mô tả đối tượng mà người ta
muốn đặc tả nó. Quá trình nhận dạng thường đi sau quá trình trích chọn các đặc tính
chủ yếu của đối tượng. Có hai kiểu mô tả đối tượng:
- Mô tả tham số (nhận dạng theo tham số).
- Mô tả theo cấu trúc(nhận dạng theo cấu trúc).
5
Nhận biết và đánh giá các nội dung của ảnh là sự phân tích một hình ảnh thành
những phần có nghĩa để phân biệt đối tượng này với đối tượng khác. Dựa vào đó ta
có thể mô tả cấu trúc của hình ảnh ban đầu.
Có thể liệt kê một số phương pháp nhận dạng cơ bản như nhận dạng biên của
một đối tượng trên ảnh, tách cạnh, phân đoạn hình ảnh ... Kỹ thuật này được sử
dụng nhiều trong y học (xử lý tế bào, nhiễm sắc thể).
Trong thực tế người ta đã áp dụng kỹ thuật nhận dạng khá thành công với
nhiều đối tượng khác nhau như: nhận dạng ảnh vân tay, nhận dạng chữ (chữ cái,
chữ số, chữ có dấu). Nhận dạng chữ in hoặc đánh máy trong văn bản phục vụ cho
việc tự động hoá quá trình đọc tài liệu, tăng nhanh tốc độ và chất lượng thu nhận
thông tin từ máy tính, nhận dạng chữ viết tay (với mức độ ràng buộc khác nhau về
cách viết, kiểu chữ, ...).
Các quá trình của xử lý ảnh:
Các quá trình của xử lý ảnh [1] được tiến hành theo sơ đồ sau:
Lưu trữ
Lưu trữ
Camera
Thu nhận
ảnh
Số hoá
Nhận
dạng
Phân tích
ảnh
Sensor
Hệ quyết
định
Hình 1.1: Các giai đoạn chính trong xử lý ảnh
Trước hết là quá trình thu nhận ảnh. Ảnh có thể thu nhận qua camera. Thường
ảnh thu nhận qua camera là tín hiệu tương tự (loại camera ống kiểu CCIR), nhưng
cũng có thể là tín hiệu số hoá (loại CCD - Charge Coupled Device).
6
Ảnh có thể thu nhận từ vệ tinh qua các bộ cảm ứng (sensor), hay ảnh, sách
được quét qua scanner. Tiếp theo là quá trình số hóa (Digitalizer) để biến đổi tín
hiệu tương tự sang tín hiệu rời rạc (lấy mẫu) và số hóa bằng lượng hóa, trước khi
chuyển sang giai đoạn xử lý, phân tích hay lưu trữ lại.
Quá trình phân tích ảnh thực chất bao gồm nhiều công đoạn nhỏ. Trước hết là
công việc tăng cường hình ảnh (Image Enhancement) để nâng cao chất lượng hình
ảnh. Do những nguyên nhân khác nhau: có thể do thiết bị thu nhận ảnh, do nguồn
sáng hay do nhiễu, ảnh có thể bị suy biến. Do vậy cần phải tăng cường và khôi phục
(Image Restoration) lại ảnh để làm nổi bật một số đặc tính chính của ảnh, hay làm
cho ảnh gần giống với trạng thái gốc- trạng thái trước khi ảnh bị biến dạng. Giai
đoạn tiếp theo là phát hiện các đặc tính như biên (Edge Detection), phân vùng ảnh
(Image Segmentation), trích chọn các đặc trưng (Feature Extraction),v.v...
Cuối cùng, tuỳ theo mục đích của ứng dụng, sẽ là giai đoạn nhận dạng, phân
lớp hay các quyết định khác. Các giai đoạn chính của quá trình xử lý ảnh có thể mô
tả ở hình 1.1, việc nâng cao chất lượng ảnh trước khi nhận dạng hay đối sánh là việc
cần phải giải quyết.
1.2 Giới thiệu ảnh nhị phân
Như đã giới thiệu ở trên. Trong quá trình xử lý ảnh, một ảnh được nhận vào
máy tính phải được mã hoá. Hình ảnh khi lưu trữ dưới dạng tập tin phải được số
hoá. Tiêu chuẩn đặt ra là ảnh phải lưu trữ thế nào sao cho các ứng dụng khác nhau
có thể thao tác trên các loại dữ liệu này. Hiện nay có trên 50 quy cách lưu trữ ảnh
khác nhau, trong đó ta thường gặp các dạng ảnh sau: TIFF, GIF, BMP, PCX, JPEG,
... Nói chung mỗi kiểu lưu ảnh có ưu điểm riêng.
1.2.1 Một số khái miệm
Pixel (Picture Element): Phần tử ảnh
Ảnh trong thực tế là một ảnh liên tục về không gian và về giá trị độ sáng. Để
có thể xử lý ảnh bằng máy tính cần thiết phải tiến hành số hoá ảnh. Trong quá trình
7
số hoá, người ta biến đổi tín hiệu liên tục sang tín hiệu rời rạc thông qua quá trình
lấy mẫu (rời rạc hoá về không gian) và lượng hoá thành phần giá trị mà về nguyên
tắc, mắt thường không phân biệt được hai điểm kề nhau. Trong quá trình này, người
ta sử dụng khái niệm Picture Element mà ta quen gọi hay viết là pixel – phần tử
ảnh. Như vậy một ảnh là một tập hợp các pixel. Ở đây cũng cần phân biệt khái niệm
pixel hay đề cập đến trong các hệ thống đồ hoạ máy tính. Để tránh nhầm lẫn ta tạm
gọi khái niệm pixel này là pixel thiết bị. Khái niệm pixel thiết bị có thể xem xét như
sau: khi ta quan sát màn hình (trong chế độ đồ hoạ), màn hình không liên tục mà
gồm nhiều điểm nhỏ, gọi là pixel. Mỗi pixel gồm một cặp toạ độ (x,y) và màu.
Ảnh nhị phân: Tuỳ theo vùng các giá trị mức xám của điểm ảnh, mà các ảnh
được phân chia ra thành ảnh màu, ảnh xám, hay ảnh nhị phân. Khi trên một ảnh chỉ
có giá trị 0 hoặc 1 thì ta nói đó là một ảnh nhị phân hoặc ảnh đen trắng và các điểm
ảnh của nó gọi là điểm ảnh nhị phân.
1.2.2 Nâng cao chất lƣợng ảnh bằng kỹ thuật phát hiện biên và tìm xƣơng
Trong xử lý ảnh và nhận dạng ảnh, có một số loại ảnh đường nét gồm các đối
tượng (objects) là các đường cong có độ dài lớn hơn nhiều so với độ dày của nó, ví
dụ như là ảnh các kí tự, dấu vân tay, sơ đồ mạch điện tử, bản vẽ kỹ thuật, bản đồ
v.v... Để xử lý các loại ảnh này người ta thường xây dựng các hệ mô phỏng theo
cách phân tích ảnh của con người gọi là hệ thống thị giác máy (Computer Vision
System[10]). Có nhiều hệ thống được cài đặt theo phương pháp này như hệ thống
nhận dạng chữ viết bằng thiết bị quang học OCR (Optical Character Recognition ),
hệ thống nhận dạng vân tay AFIS (Automated fingerprint Identification System)
v.v...
8
§äc ¶nh
TiÒn (Scanner
xö lý (N©ng
cÊp vµ
/Camer
a)
kh«i phôc)
Tr Ých tr än ®Æc ®iÓm
§èi s¸nh NhËn d¹ng
Hình 1.2 Mô hình tổng quát của hệ thống nhận dạng ảnh
Có nhiều phương pháp trích chọn đặc điểm được biết tới như phương pháp sử
dụng sóng ngắn (Wavelet), sử dụng hệ số Fourier, sử dụng các mô men bất biến, sử
dụng các đặc trưng của biên như tính trơn và các điểm đặc biệt, sử dụng các đặc
trưng tôpô dựa trên phát hiện biên và tìm xương của đường nét ảnh Phương pháp
trích chọn đặc điểm sử dụng ảnh được sử dụng nhiều. Kỹ thuật phát hiện biên và
tìm xương là một trong nhiều ứng dụng nghiên cứu và giải quyết một số vấn đề của
bài toán nêu trên trong công đoạn tiền xử lý ảnh.
1.2.2.1 Phƣơng pháp phát hiện biên.
Biên là vấn đề quan trọng trong trích chọn đặc điểm nhằm tiến tới hiểu ảnh.
Về mặt toán học người ta xem điểm biên là điểm có sự thay đổi đột ngột về mức
xám. Ví dụ: Đối với ảnh đen trắng, một điểm được gọi là điểm biên nếu nó là điểm
đen có ít nhất một điểm trắng bên cạnh. Tập hợp các điểm biên tạo nên biên hay
đường bao của đối tượng.
9
Xuất phát từ cơ sở này người ta thường sử dụng hai phương pháp phát hiện
biên cơ bản:
a) Phát hiện biên trực tiếp:
Phương pháp này làm nổi biên dựa vào sự biến thiên mức xám của ảnh. Kỹ thuật
chủ yếu dùng để phát hiện biên ở đây là dựa vào sự biến đổi theo hướng. Nếu lấy
đạo hàm bậc nhất của ảnh ta có kỹ thuật Gradient, nếu lấy đạo hàm bậc hai của ảnh
ta có kỹ thuật Laplace.
Kỹ thuật phát hiện biên Gradient:
Theo định nghĩa gradient[3] là một véctơ có các thành phần biểu thị
tốc độ thay đổi giá trị của điểm ảnh, ta có:
f ( x, y )
f ( x dx, y ) f ( x, y )
fx
x
dx
f ( x, y )
f ( x, y dy ) f ( x, y )
fy
y
dy
Với dx là khoảng cách giữa các điểm theo hướng x (khoảng cách tính
bằng số điểm) và tương tự với dy.
Việc xấp xỉ đạo hàm bậc nhất theo các hướng x và y được thực hiện
thông qua 2 mặt nạ nhân chập tương ứng sẽ cho ta các kỹ thuật phát
hiện biên khác nhau( kỹ thuật Sobel, kỹ thuật Prewitt…).
Kỹ thuật phát hiện biên Laplace:
Các phương pháp đánh giá gradient ở trên làm việc khá tốt khi mà độ
sáng thay đổi rõ nét. Khi mức xám thay đổi chậm, miền chuyển tiếp trải
rộng, phương pháp cho hiệu quả hơn đó là phương pháp sử dụng đạo
hàm bậc hai Laplace.
Toán tử Laplace[3] được định nghĩa như sau:
10
2 f 2 f
f 2 2
dx
dy
2
Ta có:
2 f
2 f ( x, y ) f ( x 1, y ) f ( x 1, y )
x 2
2 f
2 f ( x, y ) f ( x, y 1) f ( x, y 1)
y 2
Vậy: 2 f= -f(x-1,y) - f(x,y-1) + 4f(x,y) - f(x,y+1) - f(x+1,y)
b) Phát hiện biên gián tiếp:
Nếu bằng cách nào đó ta phân được ảnh thành các vùng thì ranh giới giữa các
vùng đó gọi là biên. Kỹ thuật dò biên và phân vùng ảnh là hai bài toán đối ngẫu
nhau vì dò biên để thực hiện phân lớp đối tượng mà khi đã phân lớp xong nghĩa là
đã phân vùng được ảnh và ngược lại, khi đã phân vùng ảnh đã được phân lớp thành
các đối tượng, do đó có thể phát hiện được biên.
Có hai kỹ thuật dò biên cơ bản. Kỹ thuật thứ nhất xét ảnh biên thu được từ ảnh
vùng sau một lần duyệt như một đồ thị, sau đó áp dụng các thuật toán duyệt cạnh đồ
thị. Kỹ thuật thứ hai dựa trên ảnh vùng, kết hợp đồng thời quá trình dò biên và tách
biên. Ở đây ta quan tâm cách tiếp cận thứ hai.
Trước hết, giả sử ảnh được xét chỉ bao gồm một vùng ảnh 8-liên thông, được
bao bọc bởi một vành đai các điểm nền.
Về cơ bản, các thuật toán dò biên[5] trên một vùng đều bao gồm các bước sau:
-
Xác định điểm biên xuất phát
-
Dự báo và xác định điểm biên tiếp theo
-
Lặp bước 2 cho đến khi gặp điểm xuất phát
11
Do xuất phát từ những tiêu chuẩn và định nghĩa khác nhau về điểm biên, và
quan hệ liên thông, các thuật toán dò biên cho ta các đường biên mang các sắc thái
rất khác nhau.
Kết quả tác động của toán tử dò biên lên một điểm biên là điểm biên +1.
Thông thường các toán tử này được xây dựng như một hàm đại số Boolean trên các
8-láng giềng của điểm biên. Mỗi cách xây dựng các toán tử đều phụ thuộc vào định
nghĩa quan hệ liên thông và điểm biên. Do đó sẽ gây khó khăn cho việc khảo sát các
tính chất của đường biên. Ngoài ra, vì mỗi bước dò biên đều phải kiểm tra tất cả các
8-láng giềng của mỗi điểm nên thuật toán thường kém hiệu quả. Để khắc phục các
hạn chế trên, thay vì sử dụng một điểm biên ta sử dụng cặp điểm biên (ngoài và
trong), các cặp điểm này tạo nên tập nền vùng, tiếp theo phân tích toán tử dò biên
thành 2 bước:
-
Xác định cặp điểm nền vùng tiếp theo.
-
Lựa chọn điểm biên
Trong đó bước thứ nhất thực hiện chức năng của một ánh xạ trên tập nền vùng
lên nền vùng tiếp theo và bước thứ hai thực hiện chức năng chọn điểm biên.
Thuật toán dò biên tổng quát
Bƣớc 1: Xác định cặp nền-vùng xuất phát
Bƣớc 2: Xác định cặp nền-vùng tiếp theo
Bƣớc 3: Lựa chọn điểm biên
Bƣớc 4: Nếu gặp lại cặp xuất phát thì dừng, nếu không quay lại bước 2.
Việc xác định cặp nền-vùng xuất phát được thực hiện bằng cách duyệt ảnh lần
lượt từ trên xuống dưới và từ trái qua phải rồi kiểm tra điều kiện lựa chọn cặp nềnvùng. Do việc chọn điểm biên chỉ mang tính chất quy ước, nên ta gọi ánh xạ xác định
cặp nền-vùng tiếp theo là toán tử dò biên.
12
c) Kết luận :
Phương pháp phát hiện biên trực tiếp tỏ ra khá hiệu quả và ít chịu ảnh hưởng
của nhiễu, song nếu sự biến thiên độ sáng không đột ngột, phương pháp tỏ ra kém
hiệu quả, phương pháp phát hiện biên gián tiếp tuy khó cài đặt, song lại áp dụng khá
tốt trong trường hợp này.
1.2.2.2 Kỹ thuật tìm xƣơng.
Xương được coi như hình dạng cơ bản của một đối tượng, với số ít các
điểm ảnh cơ bản. Ta có thể lấy được các thông tin về hình dạng nguyên bản của một
đối tượng thông qua xương.
Một định nghĩa xúc tích về xương (tương tự như hiện tượng cháy đồng cỏ)
được đưa ra bởi Blum (1976)[3] như sau: Giả thiết rằng đối tượng là đồng nhất
được phủ bởi cỏ khô và sau đó dựng lên một vòng biên lửa. Xương được định nghĩa
như nơi gặp của các vệt lửa và tại đó chúng được dập tắt
a) Ảnh gốc
b) Ảnh xương
Hình 1.3: Ví dụ về ảnh và xương
Kỹ thuật tìm xương luôn là chủ đề nghiên cứu trong xử lý ảnh những năm gần
đây. Mặc dù có những nỗ lực cho việc phát triển các thuật toán tìm xương, nhưng
các phương pháp được đưa ra đều bị mất mát thông tin. Có thể chia thành hai loại
thuật toán tìm xương cơ bản:
13
a) Các thuật toán tìm xƣơng gián tiếp dựa trên làm mảnh
Thuật toán làm mảnh ảnh số nhị phân là một trong các thuật toán quan
trọng trong xử lý ảnh và nhận dạng. Xương chứa những thông tin bất biến về cấu
trúc của ảnh, giúp cho quá trình nhận dạng hoặc vectơ hoá sau này.
Thuật toán làm mảnh là quá trình lặp duyệt và kiểm tra tất cả các điểm thuộc
đối tượng. Trong mỗi lần lặp tất cả các điểm của đối tượng sẽ được kiểm tra: nếu
như chúng thoả mãn điều kiện xoá nào đó tuỳ thuộc vào mỗi thuật toán thì nó sẽ bị
xoá đi. Quá trình cứ lặp lại cho đến khi không còn điểm biên nào được xoá. Đối
tượng được bóc dần lớp biên cho đến khi nào bị thu mảnh lại chỉ còn các điểm biên.
Các thuật toán làm mảnh được phân loại dựa trên phương pháp xử lý các điểm
là thuật toán làm mảnh song song và thuật toán làm mảnh tuần tự.
Thuật toán làm mảnh song song[10] là thuật toán mà trong đó các điểm được
xử lý theo phương pháp song song, tức là được xử lý cùng một lúc. Giá trị của mỗi
điểm sau một lần lặp chỉ phụ thuộc vào giá trị của các láng giềng bên cạnh (thường
là 8-láng giềng) mà giá trị của các điểm này đã được xác định trong lần lặp trước
đó. Trong máy có nhiều bộ vi xử lý mỗi vi xử lý sẽ xử lý một vùng của đối tượng,
nó có quyền đọc từ các điểm ở vùng khác nhưng chỉ được ghi trên vùng của nó xử
lý.
Trong thuật toán làm mảnh tuần tự[10] các điểm thuộc đối tượng sẽ được
kiểm tra theo một thứ tự nào đó (chẳng hạn các điểm được xét từ trái qua phải, từ
trên xuống dưới). Giá trị của điểm sau mỗi lần lặp không những phụ thuộc vào giá
trị của các láng giềng bên cạnh mà còn phụ thuộc vào các điểm đã được xét trước
đó trong chính lần lặp đang xét.
Một số thuật toán làm mảnh
Trong phần này điểm qua một số đặc điểm, ưu và khuyết điểm của các thuật
toán đã được nghiên cứu.
14
Thuật toán làm mảnh cổ điển là thuật toán song song[10] , tạo ra xương 8
liên thông, tuy nhiên nó rất chậm, gây đứt nét, xoá hoàn toàn một số cấu
hình nhỏ.
Thuật toán làm mảnh của Toumazet[8] bảo toàn tất cả các điểm cụt
không gây đứt nét đối tượng. Tuy nhiên, thuật toán có nhược điểm là rất
chậm, rất nhạy cảm với nhiễu, xương chỉ là 4-liên thông và không làm
mảnh được với một số cấu hình phức tạp
Thuật toán làm mảnh của Y.Xia[10] dựa trên đường biên của đối tượng,
có thể cài đặt theo cả phương pháp song song và tuần tự. Tốc độ của thuật
toán rất nhanh. Nó có nhược điểm là gây đứt nét, xương tạo ra là xương
giả (có độ dày là 2 phần tử ảnh).
Thuật toán làm mảnh của N.J.Naccache và R.Shinghal[8,12]. Thuật toán
có ưu điểm là nhanh, xương tạo ra có khả năng khôi phục ảnh ban đầu
của đối tượng. Nhược điểm chính của thuật toán là rất nhạy với nhiễu,
xương nhận được phản ánh cấu trúc của đối tượng thấp.
Thuật toán làm mảnh của H.E.Lu P.S.P Wang [8,12]tương đối nhanh, giữ
được tính liên thông của ảnh, nhưng lại có nhược điểm là xương tạo ra là
xương 4-liên thông và xoá mất một số cấu hình nhỏ.
Thuật toán làm mảnh của P.S.P Wang và Y.Y.Zhang[8,7] dựa trên đường
biên của đối tượng, có thể cài đặt theo phương pháp song song hoặc tuần
tự, xương là 8-liên thông, ít chịu ảnh hưởng của nhiễu. Nhược điểm chính
của thuật toán là tốc độ chậm.
Thuật toán làm mảnh song song thuần tuý[8,12] nhanh nhất trong các
thuật toán trên, bảo toàn tính liên thông, ít chịu ảnh hưởng của nhiễu.
Nhược điểm là xoá hoàn toàn một số cấu hình nhỏ, xương tạo ra là xương
4-liên thông.
15
b) Các thuật toán tìm xƣơng trực tiếp không dựa trên làm mảnh
Để tách được xương của đối tượng không dựa trên làm mảnh (lược đồ
Voronoi[9]) có thể sử dụng đường biên của đối tượng. Với điểm p bất kỳ trên đối
tượng, ta bao nó bởi một đường biên. Nếu như có nhiều điểm biên có cùng khoảng
cách ngắn nhất tới p thì p nằm trên trục trung vị. Tập tất cả các điểm như vậy lập
thành trục trung vị hay xương của đối tượng. Việc xác định xương được tiến hành
thông qua hai :
Bƣớc thứ nhất: tính khoảng cách từ mỗi điểm ảnh của đối tượng đến điểm
biên gần nhất. Như vậy cần phải tính toán khoảng cách tới tất cả các điểm biên của
ảnh.
Bƣớc thứ hai: khoảng cách ảnh đã được tính toán và các điểm ảnh có giá trị
lớn nhất được xem là nằm trên xương của đối tượng.
1.2.3 Nâng cao chất lƣợng ảnh bằng các phép toán hình thái.
Hình ảnh trong thực tế khi nhận được qua các thiết bị như: Photocopy,
Fax, .. ít nhiều đều bị nhiễu, thậm chí có thể biến dạng đến mức độ có thể khiến
người nhận được hiểu sai về mặt ý nghĩa. Như chúng ta đã biết trong các ngành
thiết kế kỹ thuật như: thiết kế máy, thiết kế xây dựng, thiết kế mạch điện v.v. dù là
theo TCVN (tiêu chuẩn Việt Nam) hay ISO(International Standard Oganize), một
bản vẽ được thể hiện chỉ xoay quanh một số dạng đường như: đường thẳng, đường
cong khép kín, đường cong mở (có thể lồi hoặc lõm), các cung tròn, elip, đường
ZigZag...Các dạng đường như thế được biểu diễn bằng những nét vẽ. Nét vẽ có thể
là nét liền (Continuous), có thể là nét đứt (dash), có thể là nét chấm gạch như đường
tâm (Center), có thể là đường khuất (Hide)... (Hình 1.4), Mỗi độ lớn (high) của nét
vẽ (nét mảnh hoặc nét đậm), có khi thể hiện một ý nghiã khác nhau. Như trong thể
hiện của đường ren của một bulon chẳng hạn: đường chân ren phải được thể hiện
bằng một nét liền mảnh, trong khi đường đỉnh của ren lại phải thể hiện bằng một nét
đậm. Hoặc một đường khuất, sẽ thể hiện cho hình chiếu của một đường thuộc một
16
mặt được nằm ở phía sau của một mặt khác theo góc nhìn vuông góc với mặt phẳng
chiếu. Trong khi đó, nét liền sử dụng để biểu diễn cho hình chiếu cuả đối tượng ở
mặt trước đó.
Nét liền mảnh
Nét đứt
Đường tâm
Hình 1.4: Một số dạng biểu diễn đường thẳng trong các bản vẽ kỹ
thuật
Do vậy, nếu như nét vẽ của một đường thẳng lẽ ra là một nét vẽ liền trong khi
đó đường mà chúng ta nhận được lại là một nét đứt thì việc đọc các thông tin trên
bản vẽ sẽ dẫn đến việc hiểu sai về mặt ý nghĩa là điều không tránh khỏi. Để giải
quyết bài toán này như: nối liền những nét đứt, nối liền chữ, làm trơn biên ảnh ...
các phép toán hình thái nhị phân đã ra đời, thông qua đó các phép đóng ảnh, mở ảnh
cũng được định nghĩa để giải quyết bài toán nêu trên.
1.2.4 Kết luận và vấn đề nghiên cứu:
Nâng cao chất lượng ảnh là một vấn đề quan trọng và không thể thiếu trong
quá trình nhận dạng đối tượng. Trong thực tế, hình dạng thường được chú trọng hơn
kích thước và con người nhận ra các đối tượng xung quanh chủ yếu thông qua hình
dạng. Chương này đã trình bày hệ thống về các phương pháp nâng cao chất lượng
ảnh theo xương và biên và giới thiệu sơ lược về phép toán Hình thái học.
Các phép toán hình thái học là các phép toán kinh điển trong toán học đã có
nhiều ứng dụng trong toán học. Và trong chương kế tiếp sẽ ứng dụng các phép toán
hình thái vào việc nâng cao chất lượng ảnh trước khi lưu trữ và đối sánh.
17
So sánh kết quả giữa các thuật toán, sử dụng phép toán hình thái cho ảnh tìm
biên khá rõ và nét tốt.
Trong hình 1.5a dưới đây là ảnh gốc, hình 1.5b là ảnh biên thu được qua phát
hiện biên bằng Sobel, hình 1.5c qua Laplace. Hình 1.5d là ảnh biên kết quả thực
hiện bởi thuật toán phát hiện biên bằng các phép toán hình thái trên với ngưỡng tách
= 128
a) Ảnh gốc đa cấp xám
c)Ảnh biên thu được qua Laplace
b)Ảnh biên thu được qua Sobel
d) Ảnh kết quả
Hình 1.5. So sánh phát hiện biên bởi các thuật toán
18
CHƢƠNG II. NÂNG CAO CHẤT LƢỢNG ẢNH BẰNG PHÉP
TOÁN HÌNH THÁI
Ý nghĩa của “Morphology” là hình thái học và cấu trúc của đối tượng, hay nó
mô tả những phạm vi và các mối quan hệ giữa các thành phần trong một đối tượng.
Hình thái học quá quen thuộc trong các lĩnh vực ngôn ngữ học và sinh học. Trong
ngôn ngữ học, hình thái học là sự nghiên cứu về cấu trúc của từ, tập hợp từ, câu…
và đó cũng là một lĩnh vực nghiên cứu nhiều năm nay. Còn trong sinh học, hình thái
học lại chú trọng tới hình dạng của một cá thể hơn, chẳng hạn có thể phân tích hình
dạng của một chiếc lá để từ đó có thể nhận dạng được đó là loại cây gì, nghiên cứu
hình dạng của một nhóm vi khuẩn, dựa trên các đặc điểm nhận dạng để phân biệt
chúng thuộc nhóm vi khuẩn nào… Tùy theo trường hợp cụ thể mà có cách phân lớp
phù hợp với nó: Có thể phân lớp dựa trên những hình dạng của mặt cắt như (Elip,
tròn…), kiểu và mức độ của những hình dạng bất quy tắc (lồi, lõm, …), những cấu
trúc trong (lỗ, đường thẳng, đường cong, …) mà đã được tích lũy qua nhiều năm
quan sát.
Tính khoa học của Hình thái học số mới chỉ thực sự phát huy khả năng của nó
kể từ khi máy tính điện tử số ra đời và làm cho hình thái học trở lên thông dụng, có
nhiều tính năng mới. Những đối tượng trong Hình thái học ta có thể coi như là tập
hợp của các điểm ảnh, nhóm lại theo cấu trúc ma trận hai chiều. Những thao tác
toán học rời rạc trên tập hợp điểm đó được sử dụng để làm rõ những nét đặc trưng
riêng của hình dạng đối tượng, do vậy có thể tính toán được hay nhận biết được
chúng một cách dễ dàng. Phần lớn các phép toán hình thái học được định nghĩa từ
hai phép toán cơ bản là phép toán co nhị phân (Erosion) và phép toán giãn nhị phân
(Dilation) .
Phép toán cơ sở được kết hợp với một đối tượng là tiêu chuẩn của các phép
toán tập hợp như phép hợp (Union), Phép giao (InterSection), và phép bù
(Complement) cộng với phép tịnh tiến nào đó. Vì vậy trong phần tiếp theo sẽ trình
bày các khái niệm về tập hợp thường được sử dụng trong phép toán hình thái.
19
2.1. Khái niệm cơ bản
Ta đã định nghĩa ảnh nhị phân là tập hợp các điểm ảnh có tọa độ (x,y).
Chúng ta còn có định nghĩa khác về ảnh, theo quan sát thì có thể xem ảnh như tập
hợp các tọa độ rời rạc hoặc liên tục.
Theo một định nghĩa nào đó thì, tập hợp này tương ứng với các điểm ảnh
thuộc về các đối tượng hiện hữu trong ảnh.
Hình 2.1: Ảnh và đối tượng trong ảnh .
Hình vẽ cho thấy hai đối tượng, hay hai tập hợp A và B trong ảnh. Ở đây ta
cần phải xác định hệ trục tọa độ như trong hình, quan tâm đến giá trị các điểm ảnh
cấu thành lên đối tượng trong ảnh và được giới hạn trên không gian rời rạc
Đầu tiên, ta có A là một tập hợp trong không gian rời rạc
.
. Nếu a = (a1, a2)
là một phần tử của tập hợp A thì ta có thể viết như sau:
a A
(0.1)
Như thế, nếu a không phải là một phần tử của tập hợp A thì ta viết:
a A
(0.2)
Tập hợp mà không có phần tử gọi là tập hợp rỗng hoặc tập hợp trống và được
biểu thị bằng ký tự .
- Xem thêm -