Đăng ký Đăng nhập
Trang chủ Xây dựng phần mềm nhận diện biển số xe ô tô ở việt nam...

Tài liệu Xây dựng phần mềm nhận diện biển số xe ô tô ở việt nam

.PDF
52
1
138

Mô tả:

TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI VIỆN VẬT LÝ KỸ THUẬT ------o0o------ BÁO CÁO ĐỒ ÁN TỐT NGHIỆP ĐẠI HỌC ĐỀ TÀI: XÂY DỰNG PHẦN MỀM NHẬN DIỆN BIỂN SỐ XE Ô TÔ Ở VIỆT NAM Sinh viên thực hiện : NGUYỄN VĂN ĐỊNH MSSV : 20130925 Lớp/Khóa : VẬT LÝ KỸ THUẬT K58 Giáo viên hướng dẫn : TS.NGUYỄN HOÀNG THOAN Giáo viên phản biện : TS.Bùi Việt Khoa Hà nội, tháng 1 năm 2019 NHẬN XÉT CỦA GIÁO VIÊN HƯỚNG DẪN Họ và tên sinh viên: Nguyễn Văn Định Lớp: Vật lý kỹ thuật - K58 Tên đề tài: “Xây dựng phần mềm nhận diện biển số xe ô tô ở Việt Nam”. Tính chất của đề tài: ................................................................................................... I. NỘI DUNG NHẬN XÉT: 1. Tiến trình thực hiện khóa luận: .......................................................................... 2. Nội dung của khóa luận: ...................................................................................... - Cơ sở lý thuyết: ...................................................................................................... - Các số liệu, tài liệu thực tế .................................................................................... - Phương pháp và mức độ giải quyết vấn đề: .......................................................... 3. Hình thức của khóa luận: .................................................................................... - Hình thức trình bày: .............................................................................................. - Kết cấu của khóa luận : ......................................................................................... 4. Những nhận xét khác: ..................................................................................... ... ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… II. ĐÁNH GIÁ VÀ CHO ĐIỂM - Tiến trình làm khóa luận : - Nội dung khóa luận : - Hình thức khóa luận : Tổng cộng ...... / 20 ...... / 60 ...... / 20 ……/100 (Điểm : ………) Ngày……tháng……năm 2018 GIÁO VIÊN HƯỚNG DẪN (Ký và ghi rõ họ tên) NHẬN XÉT CỦA GIÁO VIÊN PHẢN BIỆN Họ và tên sinh viên: Nguyễn Văn Định Lớp: Vật lý kỹ thuật - K58 Tên đề tài: “Xây dựng phần mềm nhận diện biển số xe ô tô ở Việt Nam”. I.NỘI DUNG NHẬN XÉT 1.Nội dung của khóa luận: ........................................................................................................................................... ........................................................................................................................................... ........................................................................................................................................... ............................................................................................................... 2.Hình thức của khóa luận: …………........................................................................................................................... ……………………........................................................................................................... ........................................................................................................................................... ............. 3.Những nhận xét khác: ………............................................................................................................................... ........................................................................................................................................... ............................................................................................................................... II.ĐÁNH GIÁ VÀ CHO ĐIỂM - Nội dung khóa luận: - Hình thức khóa luận: ........ / 80 ........ / 20 Tổng cộng ........ / 100 ( Điểm : ............. ) Ngày……tháng……năm 2018 CÁN BỘ PHẢN BIỆN (Ký và ghi rõ họ tên) LỜI CẢM ƠN Trước hết tôi xin chân thành cảm ơn các thầy cô giáo trong trường ĐH Bách khoa Hà Nội nói chung, các thầy cô trong Viện Vật lý kỹ thuật nói riêng đã dạy cho tôi kiến thức về các môn đại cương cũng như các môn chuyên ngành, giúp tôi có được cơ sở lý thuyết vững vàng và tạo điều kiện giúp đỡ tôi trong suốt quá trình học tập. Đặc biệt tôi xin gửi lời cảm ơn sâu sắc nhất tới TS.Nguyễn Hoàng Thoan, người đã không quản vất vả hướng dẫn tôi cả về tư duy khoa học cũng như đã chỉ đạo tận tình, giúp đỡ đưa ra những ý kiến quý giá trong suốt thời gian làm việc và cả trong việc sửa chữa bản thảo này một cách chi tiết nhất để tôi hoàn thành đồ án tốt nghiệp này. Cuối cùng, tôi xin chân thành cảm ơn gia đình và bạn bè, đã luôn tạo điều kiện, quan tâm, giúp đỡ, động viên tôi trong suốt quá trình học tập tại trường Đại học Bách khoa Hà Nội. Nhờ đồ án này mà tôi bổ sung thêm nhiều kiến thức quý giá, nhiều kinh nghiệm thực tế. Tuy nhiên, do kiến thức còn hạn hẹp, kinh nghiệm chưa nhiều nên chắc chắn sẽ không tránh khỏi thiếu sót. Rất mong nhận được sự đóng góp của quý thầy cô cũng như độc giả để cho đồ án được hoàn chỉnh hơn. Xin chân thành cảm ơn. Hà Nội, tháng 1, năm 2019 Sinh viên thực hiện Nguyễn Văn Định MỤC LỤC Danh mục hình ảnh ..........................................................................................................3 MỞ ĐẦU .........................................................................................................................5 CHƯƠNG 1. CƠ SỞ LÝ THUYẾT ................................................................................6 1.1 Biển số xe ô tô ở Việt Nam ....................................................................................6 1.2 Tổng quan chương trình nhận diện biển số xe .......................................................7 1.2.1 Cấu trúc cơ bản của chương trình nhận diện biển số xe .............................7 1.2.2 Các bước xử lý dữ liệu.....................................................................................8 1.3 Đặc trưng LBP .......................................................................................................9 1.3.1 Lý thuyết về LBP .............................................................................................9 1.3.2 Ví dụ về trích rút đặc trưng LBP trên ảnh số .................................................15 1.4 Xác định biển số nhờ giải thuật Cascade of Classifiers trong OpenCV ..............17 1.5 Tesseract OCR .....................................................................................................18 1.5.1. Sơ lược về Tesseract .....................................................................................18 1.5.2 Cấu trúc của Tesseract ..................................................................................19 1.6 Các phần mềm sử dụng trong đề tài .....................................................................20 1.6.1 Visual Studio 2015 ........................................................................................20 1.6.2 EmguCV .......................................................................................................20 1.6.3 Aforge .NET ..................................................................................................21 CHƯƠNG 2. XÂY DỰNG GIẢI THUẬT NHẬN DIỆN BIỂN SỐ............................23 2.1 Nhận diện vùng chứa biển số xe .........................................................................23 2.1.1 Thu thập dữ liệu huấn luyện .........................................................................23 2.1.2 Tag ảnh .........................................................................................................23 2.1.3 Cắt ảnh ..........................................................................................................24 2.1.4 Tập huấn nhận diện vùng biển số .................................................................25 2.2 Nhận diện vùng chứa ký tự ..................................................................................30 2.3 Nhận diện ký tự ....................................................................................................32 2.5. Xây dựng giao diện phần mềm ...........................................................................32 1 2.5.1. Tầm quan trọng .............................................................................................32 2.5.2. Xây dựng giao diện .......................................................................................34 CHƯƠNG 3. KẾT QUẢ VÀ THẢO LUẬN ................................................................35 3.1 Nhận diện vùng biển số ........................................................................................35 3.2 Nhận diện vùng chứa ký tự và nhận diện ký tự ...................................................37 3.3 Xây dựng phần mềm nhận diện biển số ...............................................................40 3.3.1 Xây dựng giao diện ........................................................................................40 3.3.2 Hướng dẫn sử dụng chương trình ..................................................................41 KẾT LUẬN ................................................................................................................45 Kết luận ...................................................................................................................45 Kiến nghị.................................................................................................................46 Tài liệu tham khảo .........................................................................................................47 2 Danh mục hình ảnh Hình 1. Kích thước biển xe ô tô ở Việt Nam...................................................................6 Hình 2. Cấu trúc cơ bản của chương trình nhận diện biển số xe.....................................7 Hình 3. Các bước xử lý dữ liệu .......................................................................................8 Hình 4. Ví dụ về LBP và độ tương phản cục bộ C ........................................................10 Hình 5. Tập hợp các điểm xung quanh Ptt .....................................................................10 Hình 6. Đặc trưng LBP cơ bản ......................................................................................12 Hình 7. Một số biến thể của LBP- LBP đồng dạng .......................................................12 Hình 8. Bảng thống kê các mẫu của LBP đồng dạng ....................................................13 Hình 9. Minh họa các trường hợp của LBP khi quay với góc 15 độ.............................14 Hình 10. Ví dụ về quá trình tính toán đặc trưng ............................................................17 Hình 11. Cấu trức của Tesseract ....................................................................................19 Hình 12. Hình ảnh sau khi tag .......................................................................................24 Hình 13. Quá trình crop ảnh ..........................................................................................25 Hình 14. Ảnh sau khi crop .............................................................................................25 Hình 15. Tập ảnh dương chưa biển số ...........................................................................26 Hình 16. Tập ảnh ấm không chứa biển số .....................................................................26 Hình 17. Minh họa các tham số x, y, w, h .....................................................................27 Hình 18. Minh họa bên trong file negative.txt ..............................................................28 Hình 19. Quá trình huấn luyện định vị biển số .............................................................30 Hình 20. Nhị phân hóa ảnh biển số ...............................................................................31 Hình 21. Khoanh vùng ký tự .........................................................................................32 Hình 22. Phần mềm kiểm tra nhận diện vùng biển số ...................................................35 Hình 23. Nhận diện với biển hai dòng...........................................................................36 Hình 24. Nhận diện với biển một dòng .........................................................................36 Hình 25. Nhận diện không thành công ..........................................................................37 Hình 26. Chương trình demo đọc biển số .....................................................................38 Hình 27. Đọc biển hai dòng ...........................................................................................39 Hình 28. Đọc biển một dòng .........................................................................................39 Hình 29. Đọc không thành công ....................................................................................40 Hình 30. Giao diện chương trình ...................................................................................41 Hình 31. Ví dụ hướng dẫn .............................................................................................42 Hình 32. Kết quả sau khi ấn "Nhận dạng + Ghi thẻ" ....................................................42 Hình 33. Ví dụ nhận diện sai .........................................................................................43 Hình 34. CHức năng sửa lỗi ..........................................................................................44 3 Hình 35. Sửa lỗi khi nhận diện sai ................................................................................45 4 MỞ ĐẦU Cùng với sự phát triển khoa học kỹ thuật và nhu cầu đi lại ngày càng tăng số lượng phương tiện giao thông trên đường ngày càng xuất hiện nhiều. Với số lượng phương tiện giao thông lớn và không ngừng gia tăng như vậy đã làm nảy sinh nhiều vấn đề trong việc kiểm soát cũng như quản lý các phương tiện. Để giải quyết vấn đề này, nhu cầu đặt ra là áp dụng các hệ thống tự động để kiểm soát và quản lý hiệu quả hơn. Một trong những hệ thống như vậy là hệ thống tự động nhận dạng biển số xe, đây là một hệ thống có khả năng thu nhận hình ảnh cũng như là “đọc” và “hiểu” các biển số xe một cách tự động. Một hệ thống như vậy có thể được sử dụng trong rất nhiều các ứng dụng, chẳng hạn như: trạm cân và rửa xe tự động hoàn toàn, bãi giữ xe tự động, kiểm soát lưu lượng giao thông hay trong các ứng dụng về an ninh như tìm kiếm xe mất cắp… Như mọi hệ thống tự động khác, hệ thống như vậy cũng sẽ yêu cầu có cả phần cứng và phần mềm. Phần cứng có phần chính là một camera có tác dụng thu nhận hình ảnh còn phần mềm sẽ có tác dụng xử lý hình ảnh đó. Với sự phát triển của kỹ thuật điện tử, các camera sẽ dễ dàng thu nhận được các hình ảnh, do vậy vấn đề quan trọng nhất mang tính quyết định hiệu quả của hệ thống xử lý ảnh là phần mềm xử lý ảnh. Yêu cầu của bài toán là áp dụng các thuật toán thích hợp tìm vùng chứa biển số, trích vùng biển số, cách li các ký tự trên biển số, từ đó máy tính sẽ xử lý và nhận dạng. Từ những lý do trên, dưới sự hướng dẫn của TS.Nguyễn Hoàng Thoan, em quyết định lựa chọn đề tài “Xây dựng phần mềm nhận diện biển số xe ô tô ở Việt Nam”. 5 CHƯƠNG 1. CƠ SỞ LÝ THUYẾT 1.1 Biển số xe ô tô ở Việt Nam Ở mỗi quốc gia khác nhau, kích thước biển số khác nhau, căn cứ vào các kích thước đó để ta tính tỉ lệ xác định vùng chứa biển. Ở Việt Nam, cần để ý đến một số quy định như sau: - Ký hiệu, kích thước của chữ và số trên biển số đăng ký các loại xe thực hiện theo quy định tại Phụ lục số 02, 03 và 04 ban hành kèm theo Thông tư 36/2010/TT-BCA. - Biển số ô tô có 2 biển, 1 biển gắn phía trước và 1 biển gắn phía sau xe phù hợp với vị trí nơi thiết kế lắp biển số của xe; Biển số có 2 loại, kích thước như sau: Loại biển số dài có chiều cao 110 mm, chiều dài 470 mm; loại biển số ngắn có chiều cao 200 mm, chiều dài 280 mm. Hình 1. Kích thước biển xe ô tô ở Việt Nam Cách bố trí chữ và số trên biển số: - Hai số đầu là ký hiệu địa phương đăng ký xe và sê ri đăng ký được quy định tại Điều 27 Thông tư số 36/2010/TT-BCA. - Nhóm số thứ hai là thứ tự xe đăng ký gồm 05 chữ số tự nhiên, từ 000.01 đến 999.99 Ví dụ: Biển số trên hình thể hiện: 30 là ký hiệu địa phương đăng ký; V là sê ri biển số đăng ký; 246.56 là thứ tự đăng ký. Đối với biển số ngắn: Ký hiệu địa phương nơi đăng ký và sê ri biển số đăng ký được đặt ở chính giữa hàng phần trên của biển số. Nhóm 5 số hàng dưới là thứ tự đăng ký được sắp xếp cân xứng với nhóm số và chữ hàng trên của biển số. Về kích thước của chữ và số: - Chiều cao của chữ và số: 80 mm - Chiều rộng của chữ và số: 40 mm - Nét đậm của chữ và số: 10 mm. 6 - Khoảng cách giữa các chữ và số: 10 mm. Riêng khoảng cách giữa các số với số 1 là 20 mm. Vị trí ký hiệu trên biển số cụ thể như sau: - Đối với biển số dài: Cảnh sát hiệu dập phía trên của gạch ngang, cách mép trên biển số 5 mm. - Đối với biển số ngắn: Cảnh sát hiệu được dập ở vị trí giữa số ký hiệu địa phương đăng ký, cách mép trái biển số 5 mm. 1.2 Tổng quan chương trình nhận diện biển số xe 1.2.1 Cấu trúc cơ bản của chương trình nhận diện biển số xe Chương trình nhận diện biển số xe là chương trình thị giác máy tính. Chương trình thị giác máy tính là phần mềm máy tính dùng để xử lý ảnh số với mục đích phân tích dữ liệu trong ảnh như: - Đọc biển số xe máy, xe hơi trong ảnh - Tìm kiếm và đếm vật thể xuất hiện trong ảnh - Tracking đối tượng từ hình ảnh trong camera - Nhận diện khuôn mặt - … Cấu trúc của chương trình nhận diện biển số xe được biểu diễn trong hình Hình 2. Cấu trúc cơ bản của chương trình nhận diện biển số xe Dữ liệu đầu vào (input) là ảnh số được lấy từ camera, sau quá trình xử lý dữ liệu sẽ cho ta dữ liệu đầu ra (output), ở đây sẽ là biển số xe. Trong chương trình, phần cốt lõi, phần quan trọng nhất là phần xử lý dữ liệu. Phần này gồm ba bước: nhận diện vùng chưa biển số, nhận diện vùng chứa ký tự rồi cách li ký tự, nhận diện ký tự sau khi đã được tách. 7 1.2.2 Các bước xử lý dữ liệu Hình 3. Các bước xử lý dữ liệu Nhận diện vùng chứa biển số: có rất nhiều phương pháp để nhận diện được biển số như khớp mẫu đơn giản, hình thái học, dùng mạng nơ-ron, SVM, thuật toán LBP…  Phương pháp so khớp mẫu thì các mẫu của biển số xe được nhận dạng trước. Từ một ảnh đưa vào, tính các giá trị tương quan so với mẫu chuẩn. Thông qua các giá trị tương quan này mà quyết định có hay không có tồn tại biển số xe trong ảnh. Ưu điểm: Phương pháp đơn giản, dễ cài đặt. Nhược điểm: Không hiệu quả khi tỷ lệ, tư thế và hình dáng thay đổi.  Phương pháp hình thái học dựa vào đặc trưng là biển số xe có độ sáng là tương đối khác so với các vùng khác, cũng như sự phân bố mức xám là khá đồng đều. Vì vậy khi được nhị phân hóa, vùng biển số có đặc thù hình thái, có thể phân biệt được với các vùng khác. Ưu điểm: Phương pháp đơn giản. Nhược điểm: Thời gian xử lý lớn. 8  Nhận dạng vùng chứa biển số bằng mạng nơ-ron: Mạng Neural nhân tạo(Artificial Neural Network) là một mô phỏng xử lý thông tin, được nghiên cứu từ hệ thống thần kinh của sinh vật, giống như bộ não bao gồm số lượng lớn các Neural được gắn kết với nhau để xử lý thông tin. Mạng Neural nhân tạo giống như con người, được học bởi kinh nghiệm (thông qua huấn luyện), lưu những kinh nghiệm hiểu biết và sử dụng trong việc dự đoán các dữ liệu chưa biết.Có ba kiểu học chính, mỗi kiểu mẫu tương ứng với một nhiệm vụ học trừu tượng. Đó là học có giám sát, học không có giám sát và học tăng cường.  Phương pháp sử dụng máy học SVM lên trên các “ứng viên” được xem như là các vùng có kết cấu rời rạc. Ưu điểm: Thực hiện tương đối nhanh. Nhược điểm: Nhận dạng chưa chính xác.  Phương pháp sử dụng đặc trưng LBP ( Local Binary Pattern ), ưu điểm: Thuật toán trích rút đặc trưng LBP cài đặt đơn giản, thời gian tính toán giá trị đặc trưng nhanh vì nó làm việc với giá trị nguyên, độ chính xác khá cao. Với các ưu điểm của LBP, trong đồ án em sử dụng LBP để nhận diện vùng chứa biển số. Nhận diện vùng chứa ký tự: ta tiến hành cắt riêng từng vùng hình chữ nhật nhỏ là kí tự trong hình chữ nhật lớn chứa biển số. Để làm được việc này ta có thể sử dụng phép chiếu histogram, SVM hoặc dùng contour. Trong đồ, án em sử dụng contour, sau khi cắt được ảnh biển số, ta sẽ xử lý ảnh rồi tìm các contour bao lấy ký tự, sau đó ta cắt riêng các ký tự thành các hình chữ nhật nhỏ. Nhận diện ký tự: Sau khi cắt riêng từng kí tự ta chuyển qua bước nhận diện kí tự. Có rất nhiều phương pháp nhận diện kí tự như khớp mẫu đơn giản, SVM hoặc dùng Tesseract OCR. Trong đồ án, em sử dụng thư viện Tesseract OCR để nhận diện các ký tự. 1.3 Đặc trưng LBP 1.3.1 Lý thuyết về LBP LBP là viết tắt của Local Binary Pattern hay là mẫu nhị phân địa phương được Ojala trình bày vào năm 1996 như là một cách đo độ tương phản cục bộ của ảnh. Phiên bản đầu tiên của LBP được dùng với 8 điểm ảnh xung quanh và sử dụng giá trị của điểm ảnh ở trung tâm làm ngưỡng. Giá trị LBP được xác định bằng cách nhân các giá trị ngưỡng với trọng số ứng với mỗi điểm ảnh sau đó cộng tổng lại. 9 Kể từ khi được đưa ra, theo định nghĩa là bất biến với những thay đổi đơn điệu trong ảnh đen trắng. Để cải tiến phương pháp, bổ sung thêm phương pháp tương phản trực giao địa phương. Hình dưới minh họa cách tính độ tương phản trực giao (C) là ký hiệu cấp độ xám trung bình của các điểm ảnh lớn hơn hoặc bằng ngưỡng với các điểm ảnh thấp hơn ngưỡng. Phân phối hai chiều của mã LBP và độ tương phản cục bộ được lấy làm đặc trưng gọi là LBP/C. Hình 4. Ví dụ về LBP và độ tương phản cục bộ C Nguồn gốc: Dãy LBP được Ojala trình bày vào năm 2002. Định nghĩa một cấu trúc điểm ảnh T là một phân phối đại số của cấp độ xám của P +1 (P > 0) điểm ảnh. T = t(gc,g0,…,gp-1) Với gc ứng với cấp độ xám của điểm ảnh trung tâm Ptt , gp (p = 0,…,1) tương ứng với P điểm ảnh xung quanh, P điểm ảnh này nằm trên đường tròn bán kính R và tâm là Ptt . Hình 5. Tập hợp các điểm xung quanh Ptt Không mất thông tin, có thể trừ gp đi một lượng là gc T = t(gc,g0 – gc ,…,gp – gc) 10 Giả sử sự sai số giữa gp và gc là độc lập với gc, ta có thể nhân tử hóa gc như sau: T = t(gc)t(g0- gc,…,gp-1- gc) t(gc) biểu thị xu hướng độ sáng tối của cả bức ảnh nên không liên quan đến kết cấu của ảnh cục bộ do đó có thể bỏ qua T~t((g0 – gc),…,(gp-1 – gc)) Mặc dù tính bất biến ngược với độ thay đổi tỷ lệ xám của điểm ảnh, sự khác biệt ảnh hưởng bởi tỷ lệ. Để thu được đặc điểm bất biến với bất kỳ một sự thay đổi nào của ảnh đen trắng (gray scale) chỉ quan tâm đến dấu của độ lệch: T~t(s(g0 – gc),…,s(gp-1 – gc)) Với s là hàm dấu: Trọng số 2p được dùng cho các hàm dấu, s(gp – gc) để chuyển sự khác biệt giữa các điểm ảnh bên cạnh về một giá trị duy nhất. P 1 LBPP,R =  s( g p 0 p  gc )2 p Với P pixel thì có 2p giá trị LBPP,R trong khoảng [0,2p-1 ] nhưng để đơn giản ta có thể chọn một số giá trị trong 2p giá trị ký hiệu là: LBPPu,2R . Thuật toán LBP: Thông tin LBP của pixel tại trung tâm của mỗi khối ảnh sẽ được tính dựa trên thông tin của các pixel lận cận. Có thể tóm tắt các bước tiến hành như sau: Bước 1: Xác định bán kính làm việc. Bước 2: Tính giá trị LBP cho pixel ở trung tâm (xc, yc) khối ảnh dựa trên thông tin của các pixel lân cận: Trong đó, (gp) là giá trị grayscale của các pixel lân cận, (gc) là giá trị grayscale của các trung tâm và (s) là hàm nhị phân được xác định như sau: s(z) = 1 nếu giá trị z ≥0, s(z) = 0 nếu giá trị z <0. 11 Ví dụ: Hình 6. Đặc trưng LBP cơ bản Hình 7. Một số biến thể của LBP- LBP đồng dạng Một mẫu nhị phân được gọi là đồng dạng khi xét chuỗi bit xoay vòng thì có nhiều nhất là 2 lần thay đổi (transitions) từ giá trị bit 0 sang 1 hoặc từ giá trị bit 1 sang 0. Ví dụ: 00000000 có 0 transitions, 01110000 có 2 transitions, 11001111 có 2 transitions nên đây là uniform LBP. 11001001 có 4 transitions, 01010011 có 6 transitions nên không phải là uniform LBP. Dựa trên định nghĩa này, bảng ánh xạ cho bán kính làm việc P -neighbours sẽ có P(P-1) + 3 nhãn. Có nghĩa là có 59 nhãn trong trường hợp làm việc với 8- 12 neighbour. Hình vẽ sau đây thể hiện 59 nhãn (mẫu) và minh họa về histogram của đặc trưng LBP đồng dạng. Hình 8. Bảng thống kê các mẫu của LBP đồng dạng Nguyên lý phân lớp không tham biến: Trong phân lớp, sự khác biệt giữa mẫu và mô hình phân phối LBP được đánh giả bởi kiểm tra thống kê không tham biến. Phương pháp tiếp cận này có ưu điểm là không cần phải có những giả thiết về phân phối của các đặc trưng. Thông thường, những kiểm tra thống kê được chọn cho mục đích là nguyên lý crossentropy được giới thiệu bởi Kullback (1968). Sau đó, Sokal và Rohlf (1969) gọi cách đo này là thống kê G. G ( S , M )  2*  b 1 Sb log B Sb B  2 b 1[ Sb *log Sb  S b *log M b ] Mb Với S, M kí hiệu phân phối mẫu và mô hình mong muốn. Sb và Mb là xác suất để b thuộc vào phân phối mẫu hoặc mô hình. B là số phần tử trong phân phối. Thống kê G sử dụng trong phân lớp có thể viết lại như sau: L(S , M )  b1 Sb log M b B 13 Kiến trúc mô hình có thể xem như xử lý ngẫu nhiên có đặc tính có thể xác định bởi phân phối LBP. Trong một phân lớp đơn giản , mỗi lớp được biểu diễn bởi một mô hình phân phối đơn giản Mi. Tương tự , một kiến trúc mẫu không xác định có thể miêu tả bởi phân phối S. L là một giả ma trận đo khả năng mẫu S có thể thuộc lớp i. Lớp C của một mẫu không xác định có thể được xác định bởi luật “hàng xóm gần nhất”: C = argmini L(S, Mi) Bên cạnh đó, một thống kê log- likelihood có thể xem như đơn vị đo sự khác biệt và có thể sử dụng để liên kết nhiều bộ phân lớp giống như bộ phân lớp k-NN hoặc self-oganizing map (SOM). Log-likelihood đúng trong một số trường hợp nhưng không ổn định khi mà cỡ mẫu nhỏ.Trong trường hợp này Chi-square- distance thường cho kết quả tốt hơn: X 2 ( S , M )   b 1 B ( Sb  M b ) ( Sb  M b ) Để đạt được độ chính xác cao sử dụng giao histogram: H (S , M )  b1 min(Sb , M b ) B Phép quay bất biến LBP bất biến với phép quay. Giả sử Iα(x, y) là ảnh quay góc (α) của ảnh I(x, y). Với phép quay này điểm ảnh (x, y) sẽ nằm tại vị trí (x', y') như hình vẽ sau đây (hình trái). Trong ví dụ này (hình phải): tất cả 8 mẫu LBP bên dưới được ánh xạ về mẫu LBP đầu tiên vì mẫu đầu tiên cho giá trị nhỏ nhất. Hình 9. Minh họa các trường hợp của LBP khi quay với góc 15 độ LBP đồng dạng có khả năng bất biến với phép quay Kết hợp của mẫu LBP đồng dạng và LBP bất biến với phép quay có thể tạo nên một dạng biến thể khác của LBP (uniform rotation – invariant LBP). Dựa trên định nghĩa này, bảng ánh xạ cho bán kính làm việc P-neighbors sẽ có P + 2 nhãn (label). Có nghĩa là có 10 nhãn trong trường hợp làm việc với 8-neighbour. 14 Để không bị ảnh hưởng bởi sự quay, mỗi giá trị LBP cần quay ngược lại về vị trí ban đầu, cách tốt nhất là tạo ra tất cả các trường hợp quay của một mẫu, sự quay có thể định nghĩa như sau: LBPRri, I  min{ROR( LBPP, R , i)i  0,1,...., P 1} Trong đó ri là viết tắt của rotation invariant (quay bất biến), ROR(x,i) dịch vòng tròn số nhị phân P - bit (x) i lần theo chiều kim đồng hồ. Độ tương phản và kết cấu mẫu: Kết cấu có thể được coi là một hiện tượng hai chiều được đặc trưng bởi hai đặc tính trực giao: cấu trúc không gian (mô hình) và độ tương phản (độ mạnh của mô hình). Quay bất biến tương phản địa phương có thể được đo trong một hình tròn đối xứng xung quanh giống như LBP: VARP , R  Trong đó:   1 P 1 ( g p   )2  p 0 P 1 P 1  gp P p 0 Tổng hợp lại ta có: LBPPri1, R1 / VARP 2, R 2 1.3.2 Ví dụ về trích rút đặc trưng LBP trên ảnh số Ví dụ 1 ảnh có kích thước 4x4: 100 23 27 60 40 15 6 90 1 33 15 72 3 29 65 54 Từ đó, sẽ tiến hành tính giá trị LBP như sau: 100 23 27 15 60 40 15 6 90 1 33 15 72 3 29 65 54 16
- Xem thêm -

Tài liệu liên quan