Nghiên cứu phát triển một số thuật toán phát hiện và phân loại phương tiện từ dữ liệu video giao thông

  • Số trang: 136 |
  • Loại file: PDF |
  • Lượt xem: 788 |
  • Lượt tải: 0
tailieuonline

Đã đăng 27435 tài liệu

Mô tả:

BỘ GIÁO DỤC VÀ ĐÀO TẠO BỘ QUỐC PHÒNG VIỆN KHOA HỌC VÀ CÔNG NGHỆ QUÂN SỰ NGUYỄN VĂN CĂN NGHIÊN CỨU PHÁT TRIỂN MỘT SỐ THUẬT TOÁN PHÁT HIỆN VÀ PHÂN LOẠI PHƯƠNG TIỆN TỪ DỮ LIỆU VIDEO GIAO THÔNG LUẬN ÁN TIẾN SĨ TOÁN HỌC HÀ NỘI, NĂM 2015 BỘ GIÁO DỤC VÀ ĐÀO TẠO BỘ QUỐC PHÒNG VIỆN KHOA HỌC VÀ CÔNG NGHỆ QUÂN SỰ NGUYỄN VĂN CĂN NGHIÊN CỨU PHÁT TRIỂN MỘT SỐ THUẬT TOÁN PHÁT HIỆN VÀ PHÂN LOẠI PHƯƠNG TIỆN TỪ DỮ LIỆU VIDEO GIAO THÔNG Chuyên ngành: CƠ SỞ TOÁN HỌC CHO TIN HỌC Mã số: 62 46 01 10 LUẬN ÁN TIẾN SĨ TOÁN HỌC NGƯỜI HƯỚNG DẪN KHOA HỌC 1. PGS. TS. NGUYỄN ĐỨC HIẾU Học viện Kỹ thuật Quân sự 2. TS. PHẠM VIỆT TRUNG Cục Công nghệ thông tin – Bộ Quốc phòng HÀ NỘI, NĂM 2015 LỜI CAM ĐOAN Tôi xin cam đoan đây là công trình nghiên cứu của riêng tôi. Những nội dung, số liệu và kết quả trình bày trong luận án là hoàn toàn trung thực và chưa có tác giả nào công bố trong bất cứ một công trình nào khác. Tác giả luận án Nguyễn Văn Căn LỜI CẢM ƠN Trước hết tôi xin bày tỏ lòng biết ơn chân thành của tôi với tập thể giáo viên hướng dẫn của tôi, PGS. TS Nguyễn Đức Hiếu, Giám đốc Trung tâm Công nghệ thông tin, Học viện Kỹ thuật Quân sự Việt Nam; TS. Phạm Việt Trung, Phó cục trưởng Cục Công nghệ thông tin - Bộ Quốc phòng trực tiếp hướng dẫn cho tôi thông qua sự tiến bộ nghiên cứu. Tôi muốn cảm ơn tất cả các giảng viên mà tôi đã có vinh dự được cùng làm việc hoặc tham gia các khóa học trong quá trình làm nghiên cứu sinh. Cảm ơn các thầy giáo, cô giáo Viện Công nghệ thông tin, phòng Quản lý đào tạo sau đại học thuộc Viện Khoa học và Công nghệ quân sự - Bộ quốc phòng. Tôi muốn đặc biệt cảm ơn PGS. TS Ngô Quốc Tạo, TS. Nguyễn Đức Dũng, phòng Nhận dạng và Xử lý tri thức, thuộc Viện Công nghệ thông tin, Viện hàn lâm Khoa học Việt Nam; cảm ơn các đồng nghiệp công tác tại Trường Đại học Kỹ thuật – Hậu cần Công an nhân dân đã có những bàn luận, thảo luận hữu ích, cài đặt thử nghiệm trong công việc nghiên cứu của tôi. Cuối cùng, tôi dành luận án này cho gia đình tôi và bạn bè của tôi. Nếu không có sự hỗ trợ của họ đầy đủ, tôi sẽ không có can đảm để đi qua tất cả những khó khăn trong việc nghiên cứu. i MỤC LỤC DANH MỤC CÁC KÝ HIỆU ................................................................................................... iii DANH MỤC CHỮ VIẾT TẮT ................................................................................................. iv DANH MỤC CÁC BẢNG ......................................................................................................... v DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ ................................................................................... vi MỞ ĐẦU ............................................................................................................... 1 Chương 1. TỔNG QUAN VỀ PHÁT HIỆN VÀ PHÂN LOẠI PHƯƠNG TIỆN GIAO THÔNG TỪ VIDEO ........................................................................ 8 1.1. Cơ sở lý thuyết và những khái niệm cơ bản ........................................... 8 1.1.1. Dữ liệu video số ............................................................................... 8 1.1.2. Mô-men bất biến ............................................................................ 12 1.1.3. Hình dạng và Khối đối tượng chuyển động ................................... 13 1.1.4. Đường viền đối tượng .................................................................... 13 1.1.5. Nền và đối tượng chuyển động ...................................................... 21 1.1.6. Entropy của khối ............................................................................ 22 1.1.7. Biểu diễn hình dạng đối tượng theo vector khoảng cách .............. 25 1.2. Một số phương pháp và công trình nghiên cứu liên quan .................... 29 1.2.1. Hệ thống điều khiển giao thông và giám sát an ninh ..................... 30 1.2.2. Hệ thống phát hiện và phân loại xe dựa trên video ....................... 32 1.2.3. Hệ thống giám sát giao thông dựa trên độ dài ............................... 34 1.2.4. Hệ thống giám sát tích hợp phát hiện, theo dõi, phân loại ............ 36 1.2.5. Phát hiện đối tượng ........................................................................ 38 1.2.6. Phân loại đối tượng ........................................................................ 41 1.3. Hướng tiếp cận của luận án .................................................................. 45 1.3.1. Sơ đồ khái quát hướng tiếp cận xử lý bài toán .............................. 45 1.3.2. Xác định vùng quan tâm và nhiệm vụ của luận án ........................ 47 1.4. Kết luận chương 1 ................................................................................. 49 Chương 2. PHÁT HIỆN ĐỐI TƯỢNG CHUYỂN ĐỘNG TỪ VIDEO DỰA TRÊN MÔ HÌNH GAUSS HỖN HỢP THÍCH NGHI VỚI THAY ĐỔI ÁNH SÁNG ........................................................................................................ 51 2.1. Một số thuật toán phát hiện chuyển động ............................................. 51 2.1.1. Thuật toán trừ nền cơ bản .............................................................. 51 2.1.2. Thuật toán trừ nền trung bình: ....................................................... 53 2.1.3. Thuật toán Σ-Δ: .............................................................................. 54 2.1.4. Thuật toán Σ-Δ cải tiến: ................................................................. 56 ii 2.1.5. Thuật toán thống kê khác biệt cơ bản ............................................ 58 2.1.6. Mô hình Gauss hỗn hợp ................................................................. 61 2.1.7. Đánh giá các thuật toán trừ nền thông qua một số phép đo ........... 66 2.2. Mô hình và thuật toán đề nghị .............................................................. 72 2.2.1. Mô hình GMM đề nghị .................................................................. 72 2.2.2. Thuật toán trích chọn khối chuyển động (EMB) ........................... 77 2.3. Phương pháp đếm phương tiện giao thông áp dụng mô hình GMM thích nghi thay đổi ánh sáng kết hợp luồng quang học ............................... 78 2.3.1. Sơ đồ khối tổng quát ...................................................................... 79 2.3.2. Thuật toán phát hiện và gán nhãn cho khối (SLBBI) .................... 82 2.3.3. Thuật toán trích chọn luồng quang học (EBOF) ........................... 83 2.3.4. Kết quả thực nghiệm. ..................................................................... 86 2.4. Kết luận chương 2................................................................................. 91 Chương 3. PHÂN LOẠI PHƯƠNG TIỆN GIAO THÔNG TỪ VIDEO DỰA TRÊN ĐẶC TRƯNG HÌNH DẠNG ........................................................ 93 3.1. Phân đoạn khối phương tiện dựa trên kích thước ................................. 93 3.1.1. Phân tích kích thước phương tiện .................................................. 93 3.1.2. Thuật toán phân loại theo kích thước ............................................ 95 3.2. Phân loại phương tiện bằng kết hợp kích thước ảnh và hình chiếu hình dạng khối phương tiện ......................................................................... 98 3.2.1. Ý tưởng phương pháp .................................................................... 99 3.2.2. Giai đoạn chuẩn bị CSDL ............................................................ 100 3.2.3. Thuật toán phân loại dựa trên độ dài và hình chiếu đối tượng .... 101 3.3. Phân loại phương tiện dựa trên đường viền biểu diễn bằng số phức . 103 3.3.1. Sơ đồ khái quát............................................................................. 104 3.3.2. Xấp xỉ độ dài đường viền và thuật toán Douglas Peucker........... 104 3.3.3. Thuật toán CCAVC...................................................................... 107 3.3.4. Kết quả thực nghiệm: ................................................................... 111 3.4. Kết luận chương 3 ............................................................................... 114 PHẦN KẾT LUẬN ........................................................................................... 116 PHỤ LỤC .............................................................................................................. 1 DANH MỤC CÁC CÔNG TRÌNH ĐÃ CÔNG BỐ ........................................ 118 TÀI LIỆU THAM KHẢO ................................................................................. 119 iii DANH MỤC CÁC KÝ HIỆU Ký hiệu Ý nghĩa  Giá trị ngưỡng cho trước trong trừ nền B(x,y) Giá trị nền cố định tại điểm ảnh (x,y) It(x,y) Giá trị điểm ảnh tại điểm ảnh (x,y) Dt(x,y) Mặt nạ nhị phân của đối tượng tiền cảnh α,,, Hằng số tỷ lệ học cho trước t(x,y) Giá trị tuyệt đối của hiệu giá trị điểm ảnh trừ giá trị nền của điểm ảnh (x,y) tại thời điểm t Vt(x,y) Giá trị điểm ảnh (x,y) của khung hình đang xét thời gian t xy Giá trị trung bình của các điểm ảnh tương ứng của tập hợp điểm ảnh (x,y) theo các khung hình đang xét xy Trung bình độ lệch chuẩn của điểm ảnh (x,y) Mô hình nền thích nghi biến đổi cosin rời rạc Khoảng cách Ơclit giữa các mô hình nền thích nghi P(Xt) (Xt, , ) Xác suất quan sát của điểm ảnh tại thời điểm t Hàm mật độ xác suất tại thời điểm t i,t Ma trận hiệp phương sai của phân bố Gauss thứ i tại thời gian t i,t Giá trị trung bình của các điểm ảnh tại thời điểm t Biến nhận giá trị 1/0 thể hiện sự phù hợp mô hình của điểm ảnh mới k,t Hệ số cập nhật nền K mô hình tại thời điểm t t Hệ số biểu thị mức độ ánh sáng thay đổi Et Giá trị thông tin Entropy của điểm ảnh tại thời điểm t D(t,t-1) i IL(x,y) Hàm biểu diễn cường độ sáng Hệ số lựa chọn sự thay đổi ánh sáng Ảnh điểm ảnh (x,y) biểu diễn mức L trong mô hình kim tự tháp Tập biểu diễn kết quả phát hiện đối tượng tại thời điểm t i Tính chất thứ i của mô-men bất biến  Hằng số xấp xỉ diện tích hai hình đa giác Lrounded Khoảng cách giữa các điểm cơ bản trên biên D(si,c) Khoảng cách giữa điểm mẫu và trọng tâm đa giác SIM(D1,D2) Độ đo tương tự giữa 2 đa giác D1 và D2. iv u Chiều dài đối tượng tính xấp xỉ v Chiều rộng đối tượng tính xấp xỉ  Đường viền Vector  Vector cơ sở đường viền  Tích vô hướng giữa 2 đường viền (m) ( ) Hàm tương quan giữa 2 đường viền m đỉnh ( ) { v DANH MỤC CÁC CHỮ VIẾT TẮT Chữ viết tắt Ý nghĩa ACF Hàm tự tương quan (Auto Correlation Function) BMC Thách thức mô hình trừ nền (Background Models Challenge) BSM Trừ nền (Background Subtraction Method) BGS Thư viện trừ nền (Background Subtraction Library) CA Phân tích đường viền (Contour Analys) CSDL Cơ sở dữ liệu (Database) EV Vector cơ sở (Elementary Vector) FG Tiền cảnh (Foreground) GMM Mô hình hỗn hợp Gauss (Gauss Mixture Model) ICF Hàm tương quan (Intercorrelation Function) NSP Tích vô hướng chuẩn hóa (Normalized Scalar Product) ROI Vùng quan tâm (Region of Interest) TVH Tích vô hướng VC VVDC đường viền vector (Vector Contour) Phát hiện và phân loại phương tiện dựa trên video (Video-based Vehicle Detection and Classification) vi DANH MỤC CÁC BẢNG Bảng 1.1. Phân loại các phương pháp mô hình nền ...................................................... 40 Bảng 1.2. Kết quả sử dụng độ dài đường biên hình chiếu ...........................................42 Bảng 2.1. Ưu điểm và nhược điểm các thuật toán BSM đã trình bày .......................... 64 Bảng 2.2. Hệ số đánh giá toàn cục các thuật toán BS trong tập dữ liệu BMC [36]. ....69 Bảng 2.3. Dữ liệu thực nghiệm..................................................................................... 87 Bảng 2.4. Phản ứng với mật độ xe trên các cung đường ..............................................90 Bảng 2.5. So sánh thời gian xử lý của thuật toán với mỗi khung hình ......................... 90 Bảng 3.1. Kết quả thực nghiệm thuật toán CVIL ......................................................... 98 Bảng 3.2. Bảng kết quả thực nghiệm thuật toán VCALOS .......................................103 vii DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ Hình 1.1. Cấu trúc phân đoạn của video ............................................................... 8 Hình 1.2. Các biến đổi hình dáng đối tượng trong không gian 2D. .................... 12 Hình 1.3. Biểu diễn đường viền bằng vector số phức ......................................... 14 Hình 1.4. NSP trên đường viền vector ................................................................ 18 Hình 1.5. Biểu diễn đường viền và lược đồ xám ................................................ 21 Hình 1.6. Mô tả hình dạng hình tròn ................................................................... 26 Hình 1.7. Đa giác xấp xỉ đối tượng có n cạnh..................................................... 27 Hình 1.8. Điểm mẫu căng đều trên mỗi cạnh biên .............................................. 28 Hình 1.9. Kiến trúc tổng thể hệ thống CadProTMS ........................................... 31 Hình 1.10. Trạm nghiệp vụ xử lý phạt nguội vượt đèn đỏ ngã tư ...................... 32 Hình 1.11. Cấu trúc hệ thống phát hiện và phân loại xe dựa trên video ............. 33 Hình 1.12. Sơ đồ của hệ thống giám sát giao thông tự động .............................. 35 Hình 1.13. Cấu trúc hệ thống tích hợp phát hiện, phân loại, theo dõi đối tượng 36 Hình 1.14. Cấu trúc hệ thống phát hiện đối tượng chuyển động ........................ 37 Hình 1.15. Lược đồ khái quát phân loại đối tượng dựa trên hình chiếu ............. 38 Hình 1.16. Cấu trúc khái quát hệ thống nhận dạng đối tượng chuyển động ...... 46 Hình 1.17. Sơ đồ xác định vùng nghiên cứu ....................................................... 47 Hình 1.18. Hướng tiếp cận xử lý bài toán ........................................................... 49 Hình 2.1. Lược đồ khái quát thuật toán CCA-GMMOF ..................................... 80 Hình 2.2. Minh họa thuật toán gán nhãn cho khối .............................................. 83 Hình 2.3. Dữ liệu video quay trên đường quốc lộ 5, hướng Hải phòng - Hà Nội ............................................................................................................................. 88 Hình 2.4. Một số hình ảnh từ camera đưa vào thực nghiệm ............................... 89 Hình 2.5. Giao diện kết quả thực nghiệm của hệ thống ...................................... 89 Hình 3.1. Phân tích kích thước khối xe ô tô con ................................................. 93 Hình 3.2. Sơ đồ tổng quát phân giải theo độ dài ................................................. 95 Hình 3.3. Sơ đồ tổng quát phân loại theo hình dạng ........................................... 99 Hình 3.4. Sơ đồ khối tổng quát phân loại theo đường viền .............................. 104 Hình 3.5 Đơn giản hóa đường công theo thuật toán Douglas Peucker ............ 105 Hình 3.6. Xấp xỉ hóa đường viền ...................................................................... 106 Hình 3.7. Giao diện hệ thống thực nghiệm thuật toán CCAVC ....................... 111 Hình 3.8. Giao diện hệ thống thực nghiệm thuật toán CCAVC ....................... 112 Hình 3.9. Ví dụ về tập mẫu để so sánh ............................................................. 113 Hình 3.10. Ví dụ kết quả nhận dạng xe ô tô và xe máy .................................... 114 1 MỞ ĐẦU Phần này giới thiệu bài toán phát hiện và phân loại phương tiện giao thông, những vấn đề đặt ra cho bài toán để giải quyết vấn đề tăng độ chính xác với điều kiện giao thông đông đúc và đa dạng ở Việt Nam. Tiếp theo, trình bày mục tiêu, phạm vi, nội dung và phạm vi nghiên cứu của luận án. Cuối cùng là giới thiệu cấu trúc của luận án. 1. Tính cấp thiết của vấn đề nghiên cứu Giám sát và quản lý giao thông đã và đang được các nhà khoa học thế giới và Việt Nam quan tâm nghiên cứu phát triển. Trong điều kiện giao thông Việt Nam, từ các tuyến đường quốc lộ, đường cao tốc, đến giao thông đô thị, giao thông nông thôn mật độ phương tiện rất dày đặc, đa dạng về chủng loại, trong đó hai thành phần chính đó là ô tô và xe máy. Nếu mật độ xe dày đặc, tức là số lượng xe trên một vùng quan sát là lớn, khi đó ảnh giao thông thu được tồn tại các phương tiện trước sau, bên cạnh liên tiếp nhau, các phương tiện tạo thành khối phương tiện, khi đó các đường viền có thể bị che khuất thì việc phân tích đường viền các phương tiện để phát hiện, đếm, phân loại gặp rất nhiều khó khăn. Nhiều nghiên cứu trên thế giới và Việt Nam đã quan tâm đến vấn đề phát hiện và phân loại phương tiện giao thông, tuy nhiên chưa có nghiên cứu đầy đủ nào quan tâm đến mức độ dày đặc của phương tiện trên đường, cũng như quan tâm đặc biệt đến phương tiện giao thông chủ yếu là xe máy và xe ô tô. Việc lựa chọn phương pháp, thuật toán, hay phối kết hợp các thuật toán sử dụng trong hệ thống giám sát tự động, cũng như cải tiến một số thông số kỹ thuật trong thuật toán mang lại lợi ích cho việc phát hiện và phân loại phương tiện giao thông trong bối cảnh Việt Nam là điều cần thiết có ý nghĩa cả về lý thuyết và thực tiễn. Bài toán phát hiện và phân loại phương tiện giao thông dựa trên video là xét xem tại một thời điểm, trong vùng quan tâm, có những loại phương tiện gì, số lượng tương ứng. Về ứng dụng, bài toán thuộc nhóm các ứng dụng liên quan 2 đến giao thông thông minh. Bài toán được ứng dụng nhiều trong lĩnh vực quản lý giao thông, trong nhiều hoạt động an ninh, quốc phòng, kinh tế xã hội, như cảnh báo trộm, cảnh báo cháy, giám sát bảo vệ các mục tiêu quan trọng, thu thập các chứng cứ tại những tình huống nhạy cảm. Yêu cầu cơ bản của bài toán phát hiện và phân loại giao thông là với dữ liệu đầu vào là video giao thông, yêu cầu đầu ra là loại phương tiện tham gia giao thông trong vùng quan sát (ô tô, xe máy và các phương tiện thô sơ khác). Hướng tiếp cận giải quyết bài toán: Thứ nhất, cần xem xét cấu trúc và phương pháp xử lý dữ liệu video. Cấu trúc dữ liệu video được kết cấu từ tập các khung hình, tốc độ hiển thị các khung hình trong một đơn vị thời gian (giây), mỗi khung hình là một ảnh tĩnh,... Phương pháp xử lý dữ liệu video là việc xử lý lưu trữ, trích chọn khung hình, phân đoạn, phân tích, trích chọn đặc trưng dựa trên cơ sở dữ liệu (CSDL) tri thức có sẵn. Từ những tập dữ liệu video, qua quá trình xử lý, mang lại những thông tin hữu ích theo mục đích yêu cầu của con người. Thứ hai, cần xác định tập các đặc trưng riêng có của video giao thông. Các đặc trưng của phương tiện chuyển động trong video được chia thành 2 mức tiếp cận: mức cục bộ và mức toàn cục. Mức toàn cục quan tâm đến các đặc trưng toàn cảnh như nền, đối tượng chuyển động, khối, đốm sáng. Mức cục bộ quan tâm đến các vấn đề xử lý hình dạng, khoảng cách, đường biên,... Đặc trưng tiếp cận ở mức toàn cục gồm:  Vùng quan tâm (ROI), hướng quan sát, khoảng cách quan sát;  Video và khung hình;  Đối tượng chuyển động và nền (Moving Object and Background);  Khối chuyển động (Block);  Đốm sáng (Blob). Đặc trưng ở mức toàn cục ảnh hưởng nhiều đến trích chọn đối tượng chuyển động. ROI ảnh hưởng đến việc xét điểm bắt đầu và điểm kết thúc thời điểm quan sát, hướng quay ảnh hưởng đến hình dạng đối tượng; Video ảnh 3 hưởng đến chất lượng hình ảnh, độ phân giải, tốc độ hình; Khung hình được trích chọn từ video thành ảnh tĩnh để phân tích,... Đặc trưng tiếp cận ở mức cục bộ gồm:  Đối tượng chuyển động và bóng của nó (Moving Object, Shadow);  Độ dài (Visual Length);  Hình dạng đối tượng (Edge, Contour), hình dạng và đường viền;  Mức xám khu vực đèn trước/sau xe;  Mức xám và đặc điểm khu vực biển số xe, kính trước xe;  Các đường biên ngang trên xe. Đặc trưng ở mức cục bộ, đặc biệt là độ dài, hình dạng đối tượng, các đường biên bên ngoài và bên trong phương tiện là những đặc trưng quan trọng trong việc phân loại phương tiện. Sử dụng một đặc trưng, hoặc kết hợp 2 hay nhiều đặc trưng và một số kỹ thuật liên quan để phân loại phương tiện là rất hiệu quả. Yếu tố ảnh hưởng đến phương pháp tiếp cận: Về màu sắc phương tiện thay đổi liên tục theo thời gian, thêm vào đó có nhiều loại phương tiện có màu sắc tương đồng nhau, do vậy việc phân loại dựa trên màu sắc là khó khăn và không mang lại kết quả. Về hình dạng, các phương tiện có thể đi sát nhau trong khung hình quan sát, hợp thành các khối và dẫn đến khó xác định được chính xác đó là phương tiện gì bằng biện pháp thông thường. Đặc biệt trong điều kiện giao thông tại Việt Nam, mật độ phương tiện di chuyển trên đường dày đặc về mật độ, đa dạng về chủng loại thì việc phân loại càng khó khăn. Tuy nhiên hình dạng xe ô tô, hình dạng xe máy, phương tiện thô sơ khác là một tập có thể xác định kể cả khi chúng hợp khối. Ngoài việc xác định tập đặc trưng của phương tiện chuyển động trong video, để có thể nhận dạng, xác định mật độ phương tiện, cần xác định các yếu tố, tình huống ảnh hưởng đến phương pháp xác định các tập thuộc tính liên quan đến phương pháp tiếp cận phát hiện và phân loại phương tiện giao thông. Tình huống liên quan đến chuyển động gồm: 4  Đối tượng bắt đầu vào vùng quan sát;  Đối tượng ra khỏi vùng quan sát;  Đối tượng đang đi rồi dừng lại;  Đối tượng đang dừng thì chuyển động;  Nền động (dao động tự nhiên). Tình huống liên quan đến khối chuyển động gồm:  Các đối tượng di chuyển cạnh nhau tạo thành một khối đối tượng;  Đối tượng đang di chuyển tách khối;  Đối tượng đang di chuyển thì hợp khối. Tình huống liên quan đến chất lượng ảnh gồm nhiều yếu tố liên quan, nhưng chủ yếu là:  Ánh sáng thay đổi;  Điều kiện thời tiết. 2. Mục tiêu nghiên cứu của luận án - Mục tiêu chung: Từ dữ liệu video thu được từ các đường quốc lộ, tìm một số thuật toán hợp lý để phân loại và xác định phương tiện chuyển động. - Mục tiêu cụ thể: + Lựa chọn và cải tiến phương pháp phát hiện phương tiện chuyển động phù hợp với môi trường ngoài trời, chịu tác động nhiều của sự thay đổi ánh sáng. + Trích chọn các đặc trưng của phương tiện chuyển động, phân tích và biểu diễn đặc trưng phù hợp để đề xuất và áp dụng thuật toán phân loại phương tiện chuyển động. + Trên cơ sở phân tích tập thuật toán, đề xuất sự cải tiến, kết hợp các thuật toán cho mục đích phát hiện, phân loại phương tiện giao thông trong điều kiện giao thông đông đúc và đa dạng về chủng loại phương tiện. 3. Đối tượng và phạm vi nghiên cứu Vấn đề "Nghiên cứu phát triển một số thuật toán phát hiện và phân loại phương tiện từ dữ liệu video giao thông” được thực hiện chủ yếu trên môi 5 trường ngoài trời. Dữ liệu video giao thông có thể thu được từ những cung đường khác nhau: từ các cung đường nông thôn (quận, huyện), từ các đường quốc lộ (cao tốc), từ các đường trong đô thị (thành phố). Trong điều kiện ở Việt Nam hiện nay, việc gắn các camera giao thông của các cơ quan quản lý và điều khiển giao thông ở các đường quốc lộ (đường cao tốc) là phổ biến, tập dữ liệu dùng cho việc thực nghiệm cũng thu được một cách dễ dàng hơn. Dữ liệu video nghiên cứu trong luận án tập trung vào việc nghiên cứu dữ liệu video thu được từ các cung đường quốc lộ. Chẳng hạn như quốc lộ 1, quốc lộ 5 và một số đường cao tốc mới xây dựng như đại lộ Thăng long, Bắc Thăng long - Nội bài. Luận án tập trung trình bày và giải quyết cốt lõi của hệ thống phát hiện và phân loại phương tiện giao thông thông qua quá trình xử lý hình ảnh và đưa ra thông tin. Bản chất của quá trình này là: phân tách video thành các khung hình; phát hiện đối tượng chuyển động trong cảnh video; dựa vào các đặc trưng hình học, chuyển động để phân loại và kết hợp với những đặc tính không gian, thời gian khác để đếm các loại đối tượng chuyển động có trong video. Đối tượng nghiên cứu của luận án gồm: Bài toán phát hiện, theo dõi và phân loại đối tượng chuyển động; Các công trình đã và đang nghiên cứu trong và ngoài nước về vấn đề phát hiện, theo dõi và phân loại đối tượng chuyển động; Các thuật toán, phương pháp đã áp dụng trong vấn đề này. Các đoạn video quay cảnh giao thông. Tổng quát lại, đây là một phạm vi rộng, bao gồm: phát hiện, phân loại và theo dõi đối tượng chuyển động. Luận án tập trung vào việc nghiên cứu một số thuật toán phát hiện và phân loại đối tượng chuyển động trong vùng quan tâm; giải quyết vấn đề ô tô, xe máy trong video giao thông mà lưu lượng giao thông đông đúc ("dày đặc") có sự và "dính nhau" trong điều kiện Việt Nam. 4. Phương pháp nghiên cứu Thu thập và nghiên cứu tài liệu về các nghiên cứu đã thực hiện trên thế giới và Việt nam về vấn đề giám sát thông minh bằng hình ảnh. 6 Phân tích cấu trúc một hệ thống giám sát thông minh bằng hình ảnh; thống kê, phân tích và đánh giá các phương pháp đã sử dụng; trên cơ sở đó thực hiện một số công việc giải quyết bài toán:  Lựa chọn phương pháp phù hợp trong từng điều kiện hoàn cảnh khác nhau của bài toán giám sát tự động.  Phân tích và cải tiến hệ thống về mặt cấu trúc, quy trình, khung làm việc của hệ thống giám sát tự động.  Lựa chọn và đề xuất cải tiến một số thuật toán áp dụng. Thử nghiệm và đánh giá kết quả một số phương pháp đề xuất:  Thu thập dữ liệu video trên một số cung đường tại đường quốc lộ.  Viết chương trình thử nghiệm bằng ngôn ngữ lập trình C++ trên môi trường .NET.  Đánh giá và phân tích kết quả. 5. Ý nghĩa khoa học và thực tiễn của luận án Ý nghĩa khoa học: Làm phong phú hơn về lý luận cho phương pháp phát hiện và phân loại đối tượng chuyển động trong video. Tổng hợp và xây dựng một tập các phương pháp trích chọn các đặc trưng phương tiện chuyển động, biểu diễn và xử lý các đặc trưng của phương tiện theo từng cấp độ phù hợp cho phân loại và đếm đối tượng, bao gồm:  Đặc trưng khối chuyển động.  Đặc trưng hình dạng và kích thước đối tượng.  Đặc trưng luồng quang học.  Đặc trưng đường viền đối tượng. Đề xuất khung làm việc chung cho bài toán xác định mật độ phương tiện trong video giao thông. Ý nghĩa thực tiễn: Mở ra khả năng tính toán mới để xác định đối tượng trong ảnh nhanh hơn; có sự phân loại tốt hơn, tránh được những thông tin dư thừa do mật độ đối tượng 7 chuyển động dày đặc, đan xen gây ra... phục vụ cho các ứng dụng thực tế như đo lưu lượng giao thông, xác định hiện trường tai nạn giao thông, chứng thực xe đã đi qua đoạn đường trong khoảng thời gian t,... phục vụ trong công tác an ninh. 6. Cấu trúc của luận án Phần mở đầu. Giới thiệu tổng quát bài toán, phương pháp tiếp cận, phạm vi nghiên cứu, những thách thức đặt ra cho bài toán, hướng nghiên cứu, ý nghĩa khoa học, ý nghĩa thực tiễn của bài toán nghiên cứu. Chương 1. Tổng quan về bài toán phát hiện và phân loại phương tiện trong video giao thông. Đặt vấn đề về bài toán nghiên cứu; trình bày kết quả của một số nghiên cứu liên quan. Đề xuất vấn đề nghiên cứu của luận án. Chương 2. Trình bày phương pháp trích chọn đặc trưng đối tượng chuyển động từ video. Cải tiến phương pháp GMM thích nghi với ánh sáng thay đổi. Áp dụng kết hợp GMM thích nghi với phát hiện luồng quang học để đếm số lượng xe trong vùng quan tâm. Chương 3. Trình bày cách thức phân loại phương tiện giao thông thông qua một số phương pháp: tính toán độ dài; biểu diễn hình dạng đối tượng dựa trên vector khoảng cách từ tâm đến cạnh của đa giác xấp xỉ; kết hợp độ dài và vector khoảng cách để nhận dạng, phân loại phương tiện trong ảnh; Áp dụng một số tính chất của đường viền vector để phân loại phương tiện dựa trên độ dài và hình dáng đường viền dựa trên đối sánh ảnh. Phần kết luận. Trình bày những đóng góp và hướng nghiên cứu phát triển tiếp theo của luận án. 8 Chương 1. TỔNG QUAN VỀ PHÁT HIỆN VÀ PHÂN LOẠI PHƯƠNG TIỆN GIAO THÔNG TỪ VIDEO Chương này trình bày một số phương pháp, kỹ thuật xử lý, kết quả trong bài toán xác định mật độ phương tiện giao thông đã sử dụng. Tập trung phân tích những kỹ thuật, phương pháp liên quan đến hướng tiếp cận của bài toán. Bao gồm 3 nhóm phương pháp chính: phát hiện, phân loại và theo dõi. Tuy nhiên những kỹ thuật liên quan đến máy camera, nén dữ liệu, tiền xử lý dữ liệu không được đề cập đến trong luận án này. 1.1. Cơ sở lý thuyết và những khái niệm cơ bản 1.1.1. Dữ liệu video số Năm 2005, Sagar Deb, University Southem Queensland, Australia, đã tổng hợp và biên tập tài liệu Quản lý dữ liệu video và tìm kiếm thông tin [20], trong đó đã xác định khái niệm, cấu trúc video số, cách tổ chức và xem xét cấu trúc dữ liệu video. Định nghĩa 1.1. Video số Video số là một dãy các khung hình liên tiếp, mỗi khung hình tương ứng với một hình ảnh tĩnh. Khi video được thực hiện, dãy khung hình được hiển thị tuần tự với một tốc độ nhất định. Tốc độ hiển thị các khung hình thường là 30 hoặc 25 khung hình/giây [20]. Hình 1.1 thể hiện cấu trúc tổng quát của dữ liệu Video: khung hình, cảnh quay, cảnh. Hình 1.1. Cấu trúc phân đoạn của video 9 Trong kỹ thuật xử lý dữ liệu video tác động đến nhiều thành phần và các đối tượng kéo theo của video như: cảnh, cảnh quay, khung hình, ảnh, điểm ảnh, ngưỡng, tách ngưỡng, đường viền, nền, phép cộng ảnh, phép nhân ảnh với 1 số... Dữ liệu video và những thành phần liên quan được đặc tả hình thức bằng ngôn ngữ đặc tả hình thức RAISE như sau: scheme Video= class type Video=Scene-list, /*Video là một danh sách các cảnh*/ Scene=Shot-list, /*Cảnh là một danh sách các cảnh quay*/ Shot=Image-list, /*Cảnh quay là một danh sách các ảnh*/ Image=Point-set, /*Ảnh là một tập hợp các điểm ảnh*/ Point=Nat>Real speed(v,t) is real(len(v))/t, /* thời gian hiển thị*/ displaytime:Video>Real displaytime(v,t) is real(Shotnumber(v))/t, /* Số cảnh quay trong một video*/ Shotnumber:Video->Nat Shotnumber(v) is if v=<..> then 0 else Shotnumber(hd(v))+Shotnumber(tl(v)) end, /* Số cảnh quay trong một cảnh */ Shotnumber:Scene->Nat Shotnumber(s) is if s=<..> then 0 else Shotnumber(hd(s))+Shotnumber(tl(s))
- Xem thêm -