Đăng ký Đăng nhập
Trang chủ Nghiên cứu các phương pháp phân đoạn ảnh, ứng dụng phân đoạn ảnh hoa...

Tài liệu Nghiên cứu các phương pháp phân đoạn ảnh, ứng dụng phân đoạn ảnh hoa

.PDF
56
1184
72

Mô tả:

LỜI CẢM ƠN Trong suốt quá trình thực hiện đề tài Đồ án tốt nghiệp:” Nghiên cứu các phương pháp phân đoạn ảnh, ứng dụng phân đoạn ảnh hoa” ngoài sự cố gắng của bản thân, em đã nhận được sự giúp đỡ tận tính từ phía nhà trường, thầy cô, gia đình và bạn bè. Đầu tiên em xin gửi lời cảm ơn sâu sắc tới cô giáo ThS. Nguyễn Thị Thanh Nhàn, đã hướng dẫn, chỉ bảo tận tình để em hoàn thành tốt báo cáo đồ án tốt nghiệp này. Em xin gửi lời cảm ơn đến các thầy cô ở trường Đại Học Công nghệ thông tin và Truyền thông. Đặc biệt là các thầy cô trong bộ môn Hệ thống thông tin. Những người đã chỉ đường dẫn lối cho em trên hành trình đi tìm tri thức, những người đã hướng dẫn, dạy bảo em tận tình trong suốt quá trình học tập tại trường. Em cũng xin cảm ơn gia đình và bạn bè đã luôn quan tâm động viên, giúp đỡ và tạo điều kiện tốt nhất để em hoàn thành Đồ án này. Trong quá trình thực hiện đề tài, mặc dù em đã có nhiều cố gắng nhưng do hạn chế về thời gian cũng như kinh nghiệm nên chắc chắn còn mắc phải nhiều thiếu sót, rất mong nhận được sự đóng góp ý kiến của các thầy cô và các bạn để đề tài này được hoàn chỉnh hơn. Em xin chân thành cảm ơn! Thái Nguyên, ngày 01 tháng 06 năm 2016 Sinh viên Nguyễn Thị Thu 1 MụC LụC LỜI CẢM ƠN .............................................................................................................1 MỤC LỤC...................................................................................................................2 DANH MỤC HÌNH ẢNH ...........................................................................................4 LỜI MỞ ĐẦU .............................................................................................................6 CHƯƠNG 1 CƠ SỞ LÝ THUYẾT..............................................................................8 1.1 Quá trình xử lí ảnh .............................................................................................8 1.2 Quan hệ giữa các điểm ảnh ................................................................................9 1.3 Tổng quan về phân đoạn ảnh............................................................................12 1.3.1 Các phương pháp dựa trên không gian đặc trưng.......................................13 1.3.2 Các phương pháp dựa trên không gian ảnh................................................13 1.3.3 Các phương pháp dựa trên mô hình vật lý .................................................14 1.4 Bài toán nhận dạng cây ....................................................................................15 CHƯƠNG 2 MỘT SỐ PHƯƠNG PHÁP PHÂN ĐOẠN ẢNH..................................17 2.1 Phân đoạn dựa vào ngưỡng ..............................................................................17 2.1.1 Chọn ngưỡng cố định ................................................................................18 2.1.2 Chọn ngưỡng dựa trên lược đồ (Histogram) ..............................................18 2.2 Phân đoạn dựa theo đường biên .......................................................................30 2.2.1 Giới thiệu chung........................................................................................30 2.2.2 Phát hiện biên............................................................................................31 2.2.3 Làm mảnh biên .........................................................................................34 2.2.4 Nhị phân hóa đường biên ..........................................................................35 2.2.5 Mô tả biên .................................................................................................35 2.3 Phân đoạn ảnh theo miền đồng nhất .................................................................36 2.3.1 Phương pháp tách cây tứ phân...................................................................37 2.3.2 Phương pháp cục bộ ..................................................................................38 2.3.3 Phương pháp tổng hợp ..............................................................................39 CHƯƠNG 3: ỨNG DỤNG PHÂN ĐOẠN ẢNH HOA .............................................41 3.1 Các phương thức dựa trên sự xuất hiện ............................................................41 3.3 Đường viền và phương thức dựa trên sự xuất hiện .......................................42 2 3.4 Phân đoạn dựa vào giải thuật Watershed ..........................................................44 3.5 Phân đoạn dựa vào thuật toán Salient Region Segmentation (Phân đoạn vùng nổi bật) ........................................................................................................................48 3.6 Cơ sở dữ liệu....................................................................................................50 3.7 Đánh giá và nhận xét........................................................................................52 KẾT LUẬN ...............................................................................................................55 TÀI LIỆU THAM KHẢO .........................................................................................56 3 DANH MụC HÌNH ảNH Hình 1.1: Các bước cơ bản trong xử lí ảnh...................................................................8 Hình 1.2: Lân cận các điểm ảnh tọa độ (x,y) ..............................................................10 Hình 1.3: Quan hệ trong vùng lân cận giữa các điểm ảnh...........................................10 Hình 1.4: Ví dụ phân đoạn ảnh ..................................................................................12 Hình 1.5: Ví dụ về phân đoạn ảnh hoa .......................................................................16 Hình 2.1: Minh họa thuật toán đối xứng nền ..............................................................20 Hình 2.2: Minh họa thuật toán tam giác .....................................................................21 Hình 2.4: Minh họa giải thuật Watershed...................................................................22 Hình 2.5 : Hình minh họa ..........................................................................................24 Hình 2.6. (a) Ảnh gốc. (b) Kết quả phân đoạn bằng ngưỡng toàn cục 100..................25 Hình 2.7. (a) Ảnh gốc (b) Sau khi áp dụng giải thuật watershed.................................26 Hình 2.8: Vùng sáng elip hiển thị khác nhau khi do nền khác nhau............................26 m Hình 2.9: Đồ thị thể hiện của  ( Ri ) trên ba vùng khác nhau của áo người đàn ông.........29 i Hình 2.10: Đường biên lí tưởng .................................................................................30 Hình 2.11: Đường biên bậc thang ..............................................................................31 Hình 2.12: Đường biên thực ......................................................................................31 Hình 2.13: Mô tả khái niệm 4 liên thông và 8 liên thông............................................39 Hình 3.1: Phân đoạn ảnh hoa – (a) ảnh gốc, (b) ảnh còn lại sau khi xóa vùng không thuộc đối tượng, (c) vùng chứa đối tượng ..................................................................41 Hình 3.2: Minh họa cách thức hoạt động của giải thuật watershed .............................44 Hình 3.3: Ảnh hoa khi vẽ vùng bên trong và bên ngoài dùng Watershed....................45 Hình 3.4: Ảnh hoa sau khi chạy chương trình phân đoạn Watershed..........................46 Hình 3.5: Ảnh kết quả sau khi tách ra khỏi nền..........................................................47 Hình 3.6: Kết quả thử nghiệm bằng dữ liệu của Image 2015 ......................................48 Hình 3.7: một số kết quả thực nghiệm của phân đoạn Watershed, từ phải sang trái: ảnh gốc,ảnh kết quả phân đoạn bằng Watershed...............................................................48 Hình 3.8: Từ ảnh gốc sử dụng thuật toán Saliency Detection để đưa ra vùng có mức sáng nổi bật hơn.........................................................................................................48 Hình 3.9: Mô tả các bước xử lí trong thuật toán Saliency Detection...........................49 4 Hình 3.10: Mô tả các bước trong giải thuật phân đoạn vùng nổi bật...........................49 Hình 3.11: Hình ảnh thử nghiệm bằng dữ liệu tự thu thập. Từ trái qua phải: Ảnh gốc, ảnh Min-shift, ảnh ROI, ảnh kết quả ..........................................................................50 Hình 3.12: Hình ảnh thử nghiệm bằng dữ liệu cuộc thi ImageCefl 2015: từ trái qua phải: Ảnh gốc, ảnh MeanShifl, ảnh ROI, ảnh kết quả.................................................50 Hình 3.13: Ảnh hoa tự thu thập..................................................................................51 Hình 3.14: Ảnh hoa trong bộ dữ liệu ImageClef 2015................................................51 Hình 3.15: Phân đoạn dựa trên vùng nổi bật đối với hoa đơn, từ trái qua phải: ảnh gốc, ảnh kết quả ................................................................................................................52 Hình 3.16: Phân đoạn dựa trên vùng nổi bật với hoa chùm, từ trái qua phải: ảnh gôc, ảnh kết quả ................................................................................................................52 Hình 3.17: Phân đoạn bằng giải thuật Watershed với hoa đơn, từ trái qua phải: ảnh gốc, ảnh kết quả.........................................................................................................53 Hình 3.18: Phân đoạn bằng giải thuật Watershed với hoa chùm, từ trái qua phải: ảnh gốc, ảnh kết quả.........................................................................................................53 Hình 3.19: Phân đoạn ảnh đơn, từ trái qua phải: ảnh gốc, kết quả của Watershed, kết quả của phân vùng nổi bật .........................................................................................54 Hình 3.20: Phân đoạn ảnh hoa chùm, từ trái qua phải: ảnh gốc, kết quả của Watershed, kết quả của phân vùng nổi bật....................................................................................54 5 LỜI MỞ ĐẦU Những năm gần đây, thị giác máy tính (Computer Vision) trở thành một lĩnh vực nghiên cứu mới mẻ đầy tiềm năng và rất được quan tâm. Ứng dụng của thị giác máy tính có thể quan sát rất rõ trong các sản phẩm công nghệ cao, những hệ thống giám sát, nhận dạng và quản lí con người, theo dõi đối tượng, phát hiện sự kiện bất thường, nhận dạng vật thể, nhận dạng chữ viết, số, … Phân đoạn ảnh là một thao tác ở mức thấp trong toàn bộ quá trình xử lí ảnh. Quá trình này thực hiện việc phân vùng ảnh thành các vùng rời rạc và đồng nhất với nhau hay nói các khác là xác định các biên của các vùng ảnh đó. Các vùng ảnh đồng nhất này thông thường sẽ tương ứng với toàn bộ hay từng phần của các đối tượng thật sự bên trong ảnh. Vì thế, trong hầu hết các ứng dụng của lĩnh vực xử lí ảnh (image processing), thị giác máy tính, phân đoạn ảnh luôn đóng một vai trò cơ bản và thường là bước tiền xử lí đầu tiên trong toàn bộ quá trình trước khi thực hiện các thao tác khác ở mức cao hơn như nhận dạng đối tượng, biểu diễn đối tượng, nén ảnh dựa trên đối tượng, hay truy vấn ảnh dựa vào nội dung … Vào những thời gian đầu, các phương pháp phân vùng ảnh được đưa ra chủ yếu làm việc trên các ảnh mức xám do các hạn chế về phương tiện thu thập và lưu trữ. Ngày nay, cùng với sự phát triển về các phương tiện thu nhận và biểu diễn ảnh, các ảnh màu đã hầu như thay thế hoàn toàn các ảnh mức xám trong việc biểu diễn và lưu trữ thông tin do các ưu thế vượt trội hơn hẳn so với mức xám. Do đó, các kĩ thuật, giải thuật mới thực hiện việc phân vùng ảnh trên các loại ảnh màu liên tục được phát triển để đáp ứng các nhu cầu mới. các kĩ thuật, giải thuật này thường được phát triển dựa trên nền tảng các giải thuật phân vùng ảnh mức xám đã có sẵn. Nhận dạng các loài cây là một ứng dụng như thế. Nhận dạng cây có tính ứng dụng cao trong giáo dục nhận thức về môi trường sinh thái cho học sinh, nhận biết cây thuốc trong y tế, nhận dạng cây trong môi trường lạ (như rừng núi,…). Trong bài toán nhận dạng cây dựa trên kĩ thuật xử lí ảnh, các thành phần của cây (hoa, lá, thân, rễ, …) đều có thể đóng góp vai trò nhận dạng. Báo cáo này tập trung vào việc ứng dựng các giải thuật đểphân đoạn ảnh hoa góp phần giải quyết bài toán nhận dạng cây. Tiến hành thử nghiệm, đánh giá giải thuật trên bộ dữ liệu có độ tin cậy cao ImageClef và dữ liệu tự thu thập. Ảnh được nghiên cứu ở đây là ảnh hoa. 6 Đồ án được thực hiện trong 10 tuần và báo cáo đồ án bao gồm 3 chương : Chương 1 : Cơ sở lí thuyết Chương 2 : Một số phương pháp phân đoạn ảnh Chương 3 : Ứng dụng phân đoạn ảnh hoa 7 CHƯƠNG 1 CƠ SỞ LÝ THUYẾT 1.1 Quá trình xử lí ảnh Các phương pháp xử lí ảnh bắt đầu từ các ứng dụng chính như nâng cao chất lượng ảnh và phân tích ảnh. Do vậy, quá trình xử lí ảnh bao giờ cũng bắt đầu bằng công việc thu nhận ảnh và kết thúc là việc nhận dạng ảnh hoặc một phán đoán theo ý nghĩa trên cơ sở nhận dạng ảnh. Cụ thể, các bước cơ bản trong quá trình xử lí ảnh được thể hiện thông qua hình 1.1 sau: Hình 1.1: Các bước cơ bản trong xử lí ảnh  Thu nhận ảnh Công việc cụ thể ở giai đoạn này là thu ảnh qua một bộ thu ảnh và số hóa tín hiệu liên tục được sinh ra bởi bộ thu ảnh đó. Bộ thu ảnh có thể là máy chụp ảnh đơn sắc hay màu, máy quét ảnh, máy quay,…  Tiền xử lí ảnh Công việc cụ thể của bước này là cải thiện độ tương phản của ảnh, khử nhiễu. Mục đích của công việc này là làm cho chất lượng ảnh trở lên tốt hơn chuẩn bị cho các bước xử lí tiếp theo.  Phân đoạn ảnh Đây là giai đoạn tách một ảnh đầu vào thành nhiều vùng khác nhau hay còn gọi là các đối tượng để biểu diễn phân tích, nhận dạng ảnh. 8  Biểu diễn và mô tả Ảnh sau khi số hóa sẽ được lưu vào bộ nhớ hoặc chuyển sang các khâu tiếp theo để phân tích. Nếu lưu trữ ảnh trực tiếp từ các ảnh thô đòi hỏi dung lượng bộ nhớ rất lớn và không hiệu quả theo quan điểm ứng dụng và công nghệ. Thông thường, các ảnh thô đó được biểu diễn lại theo các đặc điểm của ảnh được gọi là các đặc trưng ảnh như : biên ảnh, vùng ảnh. Các thông tin này sẽ được chọn các tính chất đặc trưng để thể hiện gọi là trích trọn đặc trưng.  Nhận dạng và nội suy Nhận dạng ảnh là quá trình xác định ảnh bằng cách so sánh ảnh với mẫu chuẩn đã được lưu trữ từ trước. Nội suy là phán đoán theo ý nghĩa trên cơ sơ nhận dạng ảnh. Một số đối tượng nhận dạng khá là phổ biến hiện nay đang được áp dụng trong khoa học và công nghệ là: Nhận dạng kí tự (chữ in, chữ viết tay, chữ kí điện tử), nhận dạng văn bản, nhận dạng vân tay, nhận dạng mã vạch, nhận dạng mặt người,…..  Cơ sở tri thức Trong nhiều khâu xử lí và phân tích ảnh, ngoài việc đơn giản hóa các phương pháp toán học đảm bảo tiện lợi cho xử lí ảnh thì chúng ta luôn hướng đến việc xây dựng hệ thống tự động tiếp nhận và xử lí theo cách của con người. Vì vậy, nhiều khâu hiện nay đã được xử lí theo các phương pháp trí tuệ nhân tạo, sử dụng cơ sở tri thức của con người. 1.2 Quan hệ giữa các điểm ảnh Một ảnh số giả sử được biểu diễn bằng hàm f(x,y). Tập con các điểm ảnh là S: cặp điểm ảnh có quan hệ với nhau kí hiệu là p, q. Chúng ta nêu một số các khái niệm sau: a) Các lân cận của điểm ảnh (Image Neighbors) Giả sử có điểm ảnh p tại tọa độ (x,y). p có 4 điểm lân cận gần nhất theo chiều đứng và ngang (có thể coi như lân cận 4 hướng chính: Đông, Tây, Nam, Bắc). { (x-1,y); (x,y-1); (x,y+1); (x+1,y) } = N4(p) Trong đó: số 1 là giá trị logic; N4(p) là tập 4 điểm lân cận của p 9 Hình 1.2: Lân cận các điểm ảnh tọa độ (x,y) Các lân cận chéo: Các điểm lân cận chéo Np(p) (có thể coi lân cận chéo là 4 hướng: Đông-Nam, Đông-Bắc, Tây-Nam, Tây-Bắc) Np(p) = {(x+1,y+1); (x+1,y-1); (x-1,y+1); (x-1,y-1)} Tập kết hợp: N8(p) = N4(p) + Np(p) là tập hợp 8 lân cận của điểm ảnh p Hình 1.3: Quan hệ trong vùng lân cận giữa các điểm ảnh Chú ý: Nếu (x,y) nằm ở biên (mép) ảnh, một số điểm sẽ nằm ngoài ảnh b) Các mối liên kết điểm ảnh Các mối liên kết được sử dụng để xác định giới hạn (Boundaries) của đối tượng vật thể hoặc xác định vùng trong một ảnh. Một liên kết được đặc trưng bởi tính liền kề giữa các điểm và mức xám của chúng. Giả sử V là tập các giá trị mức xám. Một ảnh có các giá trị cường độ sáng từ thang mức xám từ 32 đến 64 được mô tả như sau: V = {32, 33, … , 63, 64} Có 3 loại liên kết: 10  Liên kết 4: Hai điểm ảnh p và q được nói là liên kết 4 với các giá trị cường độ sáng V nếu q nằm ở một trong các lân cận của p, tức q N4(p)  Liên kết 8: Hai điểm ảnh p và q nằm ở một trong các lân cận 8 của p, tức là q N8(p)  Liên kết m (liên kết hỗn hợp): hai điểm ảnh p và q với các giá trị cường độ sáng V được gọi là liên kết m nếu: 1. q N4(p) 2. q Np(p) c) Khoảng cách giữa các điểm ảnh Định nghĩa: Khoảng cách D(p,q) giữa hai điểm ảnh p(x,y) và q(s,t) là hàm khoảng cách (Distance) hoặc Metric nếu: 1. D(p,q) 0 (với D(p,q) = 0 nếu và chỉ nếu p = q) 2. D(p,q) = D(q,p) 3. D(p,z) D(p,q) + D(q,z) với z là một điểm ảnh khác Khoảng các Euclide: Khoảng cách Euclide giữa hai điểm ảnh p(x,y) và q(s,t) được định nghĩa như sau: De(p,q) = [(x - s)2 + (y - t)2 ]1/2 Khoảng cách khối: Khoảng cách D4(p) được gọi là khoảng cách khối đồ thị (City- Block Distance) và được xác định như sau: D4(p,q) = | x – s | + | y – t | Giá trị khoảng cách giữa các điểm ảnh r. Ví dụ: màn hình CGA 12” (12”*2,54cm = 30,48m = 304,8mm) độ phân giải 320*200, tỉ lệ 4/3 (chiều dai/chiều rộng). Theo định lí Pitago về tam giác vuông, đường chéo sẽ lấy tỉ lệ 5 phần (5/4/3: đường chéo/chiều dài/chiều rộng màn hình), khi đó độ dài thật là (305/244/183) chiều rộng màn hình 183mm ứng với màn hình CGA 200 điểm ảnh theo chiều dọc. Như vậy khoảng cách điểm ảnh lân cận của CGA 12” là 1mm. Khoảng cách bàn cờ (Ches-Board Distance): hay khoảng cách D8(p,q) giữa điểm ảnh p, q được xác định như sau: D8(p,q) = max(|x – s|), |y – t |) 11 1.3 Tổng quan về phân đoạn ảnh Phân đoạn ảnh là một thao tác ở mức thấp và là bước then chốt trong quá trình xử lí ảnh. Giai đoạn này nhằm phân tích ảnh thành những vùng rời rạc có cùng tính chất nào đó dựa vào việc xác định biên và ác vùng liên thông cho từng vùng. Tiêu chuẩn để xác định các vùng liên thông có thể là cùng mức xám , cùng màu hay cùng độ nhám….. Các vùng ảnh này thông thường sẽ tương ứng với toàn bộ hay từng phần của đối tượng thật bên trong ảnh. Hình 1.4: Ví dụ phân đoạn ảnh Các hướng tiếp cận phân đoạn ảnh Phân đoạn ảnh là chia ảnh thành các vùng không trùng lặp. Mỗi vùng gồm một nhóm pixel liên thông và đồng nhất theo một tiêu chí nào đó. Tiêu chí này phụ thuộc vào mục tiêu của quá trình phân đoạn. Ví dụ như đồng nhất về màu sắc, mức xám, kết cấu, độ sâu của các layer… Sau khi phân đoạn mỗi pixel chỉ thuộc về một vùng duy nhất. Để đánh giá chất lượng của quá trình phân đoạn là rất khó. Vì vậy trước khi phân đoạn ảnh cần xác định rõ mục tiêu của quá trình phân đoạn là gì. Xét một cách tổng quát, ta có thể chia các hướng tiếp cận phân đoạn ảnh thành ba nhóm chính như sau: 12  Các kỹ thuật phân đoạn ảnh dựa trên không gian đặc trưng.  Các kỹ thuật dựa trên không gian ảnh.  Các kỹ thuật dựa trên các mô hình vật lý. 1.3.1 Các phương pháp dựa trên không gian đặc trưng Nếu chúng ta giả định màu sắc bề mặt của các đối tượng trong ảnh là một thuộc tính bất biến và các màu sắc đó được ánh xạ vào một không gian màu nào đó, vậy thì chúng ta sẽ có một cái nhìn đối với mỗi đối tượng trong ảnh như là một cụm (cluster) các điểm trong không gian màu đó. Mức độ phân tán của các điểm trong trong một cụm được xác định chủ yếu bởi sự khác biệt về màu sắc. Một cách khác, thay vì ánh xạ các pixel trong ảnh vào một không gian màu cụ thể, ta xây dựng một biểu đồ (histogram) dựa trên các đặc trưng màu dạng ad-hoc cho ảnh đó (ví dụ như Hue), và thông thường, các đối tượng trong ảnh sẽ xuất hiện như các giá trị đỉnh trong biểu đồ(histogram) đó. Do đó, việc phân vùng các đối tượng trong ảnh tương ứng với việc xác định các cụm – đối với cách biểu diễn thứ nhất – hoặc xác định các vùng cực trị của biểu đồ(histogram) đối với cách biểu diễn thứ hai. Các phương pháp tiếp cận này chỉ làm việc trên một không gian màu xác định chẳng hạn phương pháp của Park,áp dụng trên không gian màu RGB, còn phương pháp của Weeks và Hague thì áp dụng trên không gian màu HIS. Dựa trên không gian đặc trưng, ta có các phương pháp phân đoạn: phương pháp phân nhóm đối tượng không giám sát, phương pháp phân lớp trung bình thích nghi, phương pháp lấy ngưỡng biểu đồ (histogram). 1.3.2 Các phương pháp dựa trên không gian ảnh Hầu hết những phương pháp được đề cập trong phần trên đều hoạt động dựa trên các không gian đặc trưng của ảnh(thông thường là màu sắc). Do đó, các vùng ảnh kết quả là đồng nhất tương ứng với các đặc trưng đã chọn cho từng không gian. Tuy nhiên, không có gì đảm bảo rằng tất cả các vùng này thể hiển một sự cô đọng (compactness) về nội dung xét theo ý nghĩa không gian ảnh (ý nghĩa các vùng theo sự cảm nhận của hệ thần kinh con người). Mà đặc tính này là quan trọng thứ hai sau đặc tính về sự thuần nhất của các vùng ảnh. Do các phương pháp gom cụm cũng như xác định ngưỡng biểu đồ(histogram) đã nêu đều bỏ qua thông tin về vị trí của các pixel trong ảnh. 13 Trong các báo cáo khoa học về phân vùng ảnh mức xám, có khá nhiều kỹ thuật cố thực hiện việc thoả mãn cùng lúc cả hai tiêu chí về tính đồng nhất trong không gian đặc trưng của ảnh và tính cô đọng về nội dung ảnh. Tuỳ theo các kỹ thuật mà các thuật giải này áp dụng, chúng được phân thành các nhóm sau:  Các thuật giải áp dụng kỹ thuật chia và trộn vùng.  Các thuật giải áp dụng kỹ thuật tăng trưởng vùng.  Các thuật giải áp dụng lý thuyết đồ thị.  Các giải thuật áp dụng mạng neural.  Các giải thuật dựa trên cạnh. 1.3.3 Các phương pháp dựa trên mô hình vật lý Tất cả các giải thuật được xem xét qua, không ít thì nhiều ở mặt nào đó đều có khả năng phát sinh việc phân vùng lỗi trong các trường hợp cụ thể nếu như các đối tượng trong ảnh màu bị ảnh hưởng quá nhiều bởi các vùng sáng hoặc bóng mờ, các hiện tượng này làm cho các màu đồng nhất trong ảnh thay đổi nhiều hoặc ít một cách đột ngột. Và kết quả là các thuật giải này tạo ra các kết quả phân vùng quá mức mong muốn so với sự cảm nhận các đối tượng trong ảnh bằng mắt thường. Để giải quyết vấn đề này, các giải thuật phân vùng ảnh áp dụng các mô hình tương tác vật lý giữa bề mặt các đối tượng với ánh sáng đã được đề xuất. Các công cụ toán học mà các phương pháp này sử dụng thì không khác mấy so với các phương pháp đã trình bày ở trên, điểm khác biệt chính là việc áp dụng các mô hình vật lý để minh hoạ các thuộc tính phản chiếu ánh sáng trên bề mặt màu sắc của các đối tượng. Cột mốc quan trọng trong lĩnh vực phân vùng ảnh màu dựa trên mô hình vật lý được Shafer đặt ra. Ông giới thiệu mô hình phản xạ lưỡng sắc cho các vật chất điện môi không đồng nhất. Dựa trên mô hình này, Klinker đã đặt ra một giải thuật đặt ra một số giả thiết quang học liên quan đến màu sắc, bóng sáng, bóng mờ của các đối tượng và cố gắng làm phù hợp chúng với hình dạng của các cụm. Hạn chế chính của giải thuật này là nó chỉ làm việc trên các vật chất điện môi không đồng nhất. Hai ông cùng tên Tsang đã áp dụng mô hình phản xạ lưỡng sắc trong không gian HSV để xác định các đường biên trong ảnh màu. Healey đề xuất một mô hình phản xạ đơn sắc cho các vật chất kim loại. Các phương pháp đề cập trong phần này chỉ áp dụng cho hai loại vật chất là kim loại và 14 điện môi không đồng nhất. Một thuật toán tổng quát và phức tạp hơn cũng được Maxwell và Shafer đề xuất trong. Tóm lại, một cái nhìn tổng quan về các phương pháp phân đoạn ảnh như sau: Kỹ thuật phân đoạn ảnh màu Không gian đặc trưng Không gian ảnh Gom cụm Tách và hợp nhất Phân lớp trung bình Vùng tăng trưởng Ngưỡng biểu đồ Dựa trên Cạnh Mô hình vật lý Mạng neural Lí thuyết đồ thị 1.4 Bài toán nhận dạng cây Ứng dụng của thị giác máy tính có thể quan sát rất rõ trong các sản phẩm công nghệ cao, những hệ thống giám sát, nhận dạng như nhận dạng vân tay, nhận dạng chữ viết, nhận dạng tiếng nói, nhận dạng mặt người, nhận dạng cử chỉ hành động,…Trong đó có nhận dạng các loài cây là một trong các ứng dụng ngày càng được sử dụng rộng rãi như nhận biết cây thuốc trong y tế, nhận dạng cây trong môi trường lạ như rừng núi,… Nhận dạng và phân biệt các loại cây là một bài toán có xuất phát từ nhu cầu thực tế. Việc nhận dạng cây giúp cho ta phát hiện được các loài cây quý, các loài cây có tác dụng chữa bệnh cực kỳ quan trọng trong y học, giúp nâng cao hiểu biết của con người về các loại cây có vai trò quan trọng, giúp bảo vệ đa dạng sinh học… Nhận dạng cây hiện nay có 3 hướng tiếp cận: 1. Nhận dạng cây dựa trên từ khóa. 2. Nhận dạng cây theo giao diện mô tả các bộ phận cây thông qua các biểu tượng. 3. Nhận dạng cây dựa trên các kỹ thuật xử lý ảnh. Nhận dạng cây là bài toán xác định tên của cây dựa trên các đặc điểm quan sát của cây. Nhận dạng cây có nhiều ứng dụng khác nhau trong công nghiệp, sinh học, giáo dục và y tế. Tuy nhiên việc xác định chính xác tên của một loài cây là một bài toán khó ngay cả đối với những người có kinh nghiệm như nông dân, nhà sinh vật học 15 do sự đa dạng của các loài cây. Gần đây, với sự phát triển của các công nghệ truy xuất, tìm kiếm bằng hình ảnh, hướng tiếp cận nhận dạng cây dựa trên hình ảnh đang được coi là một hướng đầy hứa hẹn giúp tăng khả năng nhận dạng các loài cây. Trong bài toán nhận dạng cây dựa trên các kỹ thuật xử lý ảnh các nhà nghiên cứu cũng đã đưa ra rất nhiều cách tiếp cận với bài toán nhận dạng dựa trên việc kết hợp giữa các bộ phận của cây như lá, hoa, quả, thân, cành hay cả toàn bộ cây. Ngoài việc nhận dạng dựa trên việc kết hợp các bộ phận ra ta có thể chỉ sử dụng ảnh hoa để nhận dạng. Phương pháp nhận dạng dựa trên hoa có khá nhiều ưu điểm nổi trội hơn so với nhận dạng dựa trên các bộ phận khác. Nguyên nhân là vì hoa mang nhiều nét đặc thù dễ phân biệt các loài, là thành phần chứa đựng nhiều thông tin có tính phân biệt và ít phụ thuộc vào sự biến đổi thời gian, không gian. Để góp phần nhận dạng được cây thì phân đoạn ảnh hoa cũng là một bước vô cùng quan trọng trong việc nhận dạng và trích trọn đặc trưng. Hình 1.5: Ví dụ về phân đoạn ảnh hoa Nhận thức được vai trò quan trọng của thực vật trong vấn đề duy trì an ninh năng lượng, y tế, …, vấn đề giáo dục, nâng cao hiểu biết của con người về các loại cây thực sự có vai trò đặc biệt quan trọng. Cùng với sự phát triển của khoa học kĩ thuật, đặc biệt là công nghệ thông tin và các kĩ thuật nhận dạng tự động, ý tưởng về các chương trình trợ giúp nhận dạng cây đến một cách rất tự nhiên. Các chương trình này sẽ phát huy được tác dụng to lớn trong các trung tâm nghiên cứu thực vật và đa dạng sinh học, các trung tâm y tế, các trung tâm hóa học và dược liệu, thậm chí đến với các trường học để mang lại cho các em học sinh những hiểu biết quý báu về thế giới xung quanh. 16 CHƯƠNG 2 MỘT SỐ PHƯƠNG PHÁP PHÂN ĐOẠN ẢNH Phân đoạn ảnh là bước then chốt trong xử lí ảnh. Giai đoạn này nhằm phân tích ảnh thành những vừng có tính chất nào đó dựa theo biên hay các vùng liên thông. Tiêu chuẩn để xác định các vùng liên thông có thể là cùng mức xám, cùng màu hay cùng độ nhám… Trước hết cần làm rõ khái niệm “vùng ảnh” (Segment) và đặc điểm vật lí của vùng. Vùng ảnh là một chi tiết, một thực thể trông toàn cảnh. Nó là một tập hợp các điểm có cùng hoặc gần cùng một tính chất nào đó: mức xám, mức màu, độ nhám,.. Vùng ảnh là một trong hai thuộc tính của ảnh. Nói đến vùng ảnh là nói đến tính chất bề mặt. Đường bao quanh một vùng ảnh (Boundary) là biên ảnh. Các điểm trong một vùng ảnh cí đọ biến thiên giá trị mức xám tương đối đồng đều hay tính kết cấu tương đồng. Dựa vào đặc tính vật lí của ảnh, người ta có nhiều kĩ thuật phân vùng: phân vùng dựa theo ngưỡng, phân vùng dựa theo biên, phân vùng dựa theo miền đồng nhất… 2.1 Phân đoạn dựa vào ngưỡng Giới thiệu chung Biên độ các tính chất vật lí của ảnh (như là độ phản xạ, độ truyền sáng, màu sắc…) là một đặc tính đơn giản và rất hữu ích. Nếu biên độ đủ lớn đặc trưng cho ảnh thì chúng ta có thể dùng ngưỡng biên độ để phân đoạn ảnh. Ví dụ, biên độ trong bộ cảm biến hồng ngoại có thể phản ánh vùng có nhiệt độ thấp hay vùng có nhiệt độ cao. Đặc biêt, kĩ thuật phân ngưỡng theo biên độ rất có ích đối với ảnh nhị phân như văn bản in, đồ họa, ảnh màu hay ảnh X-quang. Việc chọn ngưỡng trong kĩ thuật này là một bước vô cùng quan trọng, thông thường người ta tiến hành theo các bước như sau:  Xem xét lược đồ xám của ảnh để xác đỉnh và khe. Nếu ảnh có nhiều đỉnh và khe thì các khe có thể sử dụng để chọn ngưỡng.  Chọn ngưỡng T sao cho một phần xác định trước ηcủa toàn bộ số mẫu là thấp hơn T.  Điều chỉnh ngưỡng dựa trên xét lược đồ xám của các điểm lân cận.  Chọn ngưỡng bằng cách xem xét lược đồ xám của những điểm thỏa tiêu chuẩn đã chọn 17 Một thuật toán đơn giản trong kĩ thuật này là: giả sử rằng chúng ta đang quan tâm đên các đối tượng sáng (object) trên nền tối (background), một tham số T- gọi là ngưỡng độ sáng, sẽ được chọn cho một ảnh f(x,y) theo cách: If f(x,y)≥ T f(x,y)= 1 Else f(x,y)= 0 Ngược lại, đối với các đối tượng trên nền sáng chúng ta có thuật toán sau: If f(x,y) T f(x,y)= 1 Else f(x,y)= 0 Vấn đề chính là chúng ta nên chọn ngưỡng T như thế nào để việc phân vùng đạt được kết quả cao nhất? Có rất nhiều thuật toán chọn ngưỡng: ngưỡng cố định, dựa trên lược đồ, sử dụng Entropy, sử dụng tập mở, chọn ngưỡng thông qua sự không ổn định của lớp và tính thuần nhất của vùng vv… Ở đây chúng ta đề cập đến hai thuật toán chọn ngưỡng cố định và chọn ngưỡng dựa trên lược đồ. 2.1.1 Chọn ngưỡng cố định Đây là phương pháp chọn ngưỡng độc lập với dữ liệu ảnh. Nếu chúng ta biết trước là chương trình ứng dụng sẽ làm việc với các ảnh có độ tương phản rất cao, trong đó các đối tượng quan tâm rất tối còn nền gần như là đồng nhất và rất sáng thì việc chọn ngưỡng T= 128 (xét trên thang độ sáng từ 0 đến 255) là một giá trị chọn khá chính xác. Chính xác ở đây hiểu theo nghĩa là số các điểm ảnh bị phân lớp sai là cực tiểu. 2.1.2 Chọn ngưỡng dựa trên lược đồ (Histogram) Trong hầu hết các trường hợp, ngưỡng được chọn từ lược đồ độ sáng của vùng hay ảnh cần phân đoạn. Có rất nhiều kĩ thuật chọn ngưỡng tự động xuất phát từ lược đồ xám { h(b) | b = 0, 1, …, 2B-1} đã được đưa ra. Những kĩ thuật phổ biến sẽ được trình bày dưới đây. Những kí thuật này có thể tận dụng những lợi thế do sự làm trơn dữ liệu lược đồ ban đầu mang lại nhằm loại bỏ những dao động nhỏ về độ sáng. Tuy 18 nhiên các thuật toán làm trơn cần phải cẩn thận, khống được làm dịch chuyển các vị trí đỉnh của lược đồ. Nhận xét này dẫn đến thuật toán làm trơn dưới đây: Hsmooth(b) = W lẻ (1) Trong đó, W thường được chọn là 3 hoặc 5 2.1.2.1 Thuật toán đẳng liệu Đây là kĩ thuật chọn ngưỡng theo kiểu lặp do Ridler và Calvard đưa ra. Thuật toán được mô tả như sau:  B1: Chọn giá trị ngưỡng khởi động θ0 = 2B-1  B2: Tính các trung bình mẫu (mf,0) của những điểm ảnh thuộc đối tượng và (mb,0) của những điểm ảnh nền.  B3: Tính các ngưỡng trung gian theo công thức: (2)  B4: Nếu θk = θk-1 : Kết thúc, dừng thuật toán Ngược lại: Lặp lại bước 2. 2.1.2.2 Thuật toán đối xứng nền Kĩ thuật này dựa trên sự giả định là tồn tại hai đỉnh phân biệt trong lược đồ nằm đối xứng nhau qua đỉnh có giá trị lớn nhất trong phần lược đồ thuộc về các điểm ảnh nền. Kĩ thuật này có thể tận dụng ưu điểm của việc làm trơn được mô tả trong phương trình (1). Đỉnh cực đại maxp được tìm nhờ tiến hành tìm giá trị cực đại trong lược đồ. Sau đó thuật toán sẽ được áp dụng ở phía không phải là điểm ảnh thuộc đối tượng ứng với giá trị cực đại đó nhằm tìm ra giá trị độ sáng a ứng với giá trị phần trăm p% mà P(a) = p%, trong đó P(a) là hàm phân phối xác suất về độ sáng được định nghĩa như sau: Định nghĩa: [hàm phân phối xác suất về độ sáng] Hàm phân phối xác suất P(a) thể hiện xác suất chọn được một giá trị độ sáng từ một vùng ảnh cho trước, sao cho giá trị này không vượt quá một giá trị sáng cho trước a. Khi a biến thiên từ đến + , P(a) sẽ nhận các giá trị từ 0 đến 1. P(a) là hàm đơn điệu không giảm theo a, do vậy dP/da 19 Hình 2.1: Minh họa thuật toán đối xứng nền Ở đây ta đang giả thiết là ảnh gốc có các đối xứng trên nền sáng. Giả sử mức là 5% thì có nghĩa là ta phải ở bên phải đỉnh maxp một giá trị a sao cho P(a) = 95%. Do tính đối xứng đã giả định ở trên, chúng ta sử dụng độ dịch chuyển về phía trái của điểm cực đại tìm giá trị ngưỡng T: T = maxp – (a - maxp) (3) Kĩ thuật này dễ dàng điều chỉnh được cho phù hợp với tình huống ảnh có các đối tượng sáng trên một nền tối. 2.1.2.3 Thuật toán tam giác Khi một ảnh có các điểm ảnh thuộc đối tượng tạo nên một đỉnh yếu trong lược đồ ảnh thì thuật toán tam giác hoạt động rất hiệu quả. Thuật toán này do Zack đề xuất và được mô tả như sau:  B1: Xây dựng đường thẳng là đường nối hai điểm (Hmax,bmax) và (Hmin,bmin) , trong đó Hmax là điểm có Histogram lớn nhất ứng với mức xám bmax và Hmin là diểm có Histogram ứng với độ sáng nhỏ nhất bmin.  B2: Tính khoảng cách d từ Hb của lược đồ (ứng với điểm sáng b) đến Trong đó, b [bmax,bmin].  B3: Chọn ngưỡng T = Max{Hb} Minh họa thuật toán tam giác bởi hình vẽ sau: 20 .
- Xem thêm -

Tài liệu liên quan