Nghiên cứu phương pháp nhận dạng mặt người dựa trên PCA - LDA và mạng Neural

  • Số trang: 86 |
  • Loại file: PDF |
  • Lượt xem: 84 |
  • Lượt tải: 0
nguyetha

Đã đăng 7932 tài liệu

Mô tả:

ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ ĐỖ ĐÌNH LỰC NGHIÊN CỨU PHƯƠNG PHÁP NHẬN DẠNG MẶT NGƯỜI DỰA TRÊN PCA-LDA VÀ MẠNG NEURAL LUẬN VĂN THẠC SĨ NGÀNH CÔNG NGHỆ THÔNG TIN HÀ NỘI - 2015 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ ĐỖ ĐÌNH LỰC NGHIÊN CỨU PHƯƠNG PHÁP NHẬN DẠNG MẶT NGƯỜI DỰA TRÊN PCA-LDA VÀ MẠNG NEURAL Ngành: Công nghệ thông tin Chuyên ngành: Truyền dữ liệu và mạng máy tính Mã số: Chuyên ngành đào tạo thí điểm LUẬN VĂN THẠC SĨ NGÀNH CÔNG NGHỆ THÔNG TIN NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS – TS NGÔ QUỐC TẠO Hà Nội - 2015 1 LỜI CẢM ƠN Em xin chân thành cảm ơn các thầy cô trong Khoa Công nghệ thông tin, trường Đại học Công nghệ, Đại học Quốc Gia Hà Nội và thầy giáo PGS-TS Ngô Quốc Tạo đã tạo điều kiện cho em được học tập và nghiên cứu để hoàn thành luận văn này. Em cũng xin gửi lời cảm ơn tới các thầy cô, đồng nghiệp trong cơ quan nơi em đang công tác đã tạo điều kiện cho em được học tập, nghiên cứu và hoàn thành luận văn này. Hà Nội, ngày 15 tháng 3 năm 2014 Học viên Đỗ Đình Lực 2 LỜI CAM ĐOAN Tôi xin cam đoan luận văn ““Nghiên cứu phương pháp nhận dạng mặt người dựa trên PCA-LDA và mạng neural” này là công trình nghiên cứu của riêng tôi.Các số liệu sử dụng trong luận văn là trung thực.Các kết quả nghiên cứu được trình bày trong luận văn chưa từng được công bố tại bất kỳ công trình nào khác. 3 MỤC LỤC LỜI CẢM ƠN ......................................................................................................... 1 LỜI CAM ĐOAN .................................................................................................... 2 MỤC LỤC .............................................................................................................. 3 DANH MỤC CÁC TỪ VIẾT TẮT .......................................................................... 5 DANH MỤC CÁC BẢNG ....................................................................................... 6 DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ.................................................................... 7 MỞ ĐẦU ................................................................................................................ 9 CHƯƠNG ITỔNG QUAN VỀ NHẬN DẠNG MẶT NGƯỜI ................................. 11 1.1 Giới thiệu về xử lý ảnh .................................................................................... 11 1.1.1 Khái niệm xử lý ảnh số .............................................................................. 13 1.1.2 Các ứng dụng của xử lý ảnh số .................................................................. 14 1.1.3 Các bước cơ bản trong xử lý ảnh số ........................................................... 15 1.2 Giới thiệu chung về phân tích ảnh.................................................................... 16 1.2.1 Khái niệm .................................................................................................. 16 1.2.2 Các ứng dụng của phân tích ảnh................................................................. 18 1.3 Nhận dạng mặt người ...................................................................................... 20 1.3.1 Khái niệm nhận dạng mặt người qua ảnh ................................................... 20 1.3.2 Các ứng dụng của nhận dạng mặt người..................................................... 24 1.4 Các hướng tiếp cận trong nhận dạng mặt người ............................................... 25 1.4.1 Trích chọn đặc trưng sử dụng Eigenface .................................................... 25 1.4.2 Trích chọn đặc trưng sử dụng mô hình Markov ẩn ..................................... 28 1.4.3 Mẫu nhị phân cục bộ (LBP) ....................................................................... 31 1.4.4 Phương pháp phân tích thành phần chính ................................................... 36 CHƯƠNG 2NHẬN DẠNG KHUÔN MẶT DỰA TRÊN PCA-LDA VÀ MẠNG NƠRON ................................................................................................................ 37 2.1 Phương pháp phân tích thành phần chính (PCA).............................................. 37 2.1.1 Cơ sở toán học ........................................................................................... 39 2.1.2 Kỹ thuật trích chọn đặc trưng PCA ............................................................ 48 2.2 Phương pháp LDA ........................................................................................... 54 2.3 Phương pháp mạng neural ............................................................................... 57 4 2.3.1 Giới thiệu mạng nơron ............................................................................... 57 2.3.2. Hàm kích hoạt và các quy tắc xác định tín hiệu ra ..................................... 59 2.3.3 Thuật toán học lan truyền ngược ................................................................ 61 CHƯƠNG 3THỰC NGHIỆM ................................................................................ 65 3.1 Thiết kế hệ thống ............................................................................................. 65 3.1.1 Cơ sở dữ liệu ảnh ....................................................................................... 65 3.1.2 Sơ đồ hệ thống ........................................................................................... 66 3.1.3 Môi trường cài đặt ..................................................................................... 68 3.1.4 Giao diện chương trình .............................................................................. 68 3.2 Kiểm thử và đánh giá ....................................................................................... 71 KẾT LUẬN .......................................................................................................... 76 TÀI LIỆU THAM KHẢO ...................................................................................... 78 PHỤ LỤC ............................................................................................................. 79 5 DANH MỤC CÁC TỪ VIẾT TẮT LDA (Linear Discriminant Analysis): Phân tích phân lớp tuyến tính ORL (Olivetti Research Laboratory, Surrey University): Cơ sở dữ liệu ảnh dùng trong luận văn HMM (Hidden Markov Model): Mô hình Markov ẩn PCA(Principal Components Analysis): Phân tích thành phần chính 6 DANH MỤC CÁC BẢNG Bảng 1.3 Các ứng dụng tiêu biểu của nhận dạng mặt người.................................... 21 Bảng 2.1 Ví dụ về tính độ lệch chuẩn .................................................................... 40 Bảng 2.2 Tập dữ liệu hai chiều và tính toán hiệp phương sai .................................. 42 Bảng 4.1 Các module chính của chương trình ........................................................ 69 7 DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ Hình 1.1 Tổng quan các giai đoạn cơ bản trong xử lý ảnh .......................................... 15 Hình 1.2: Các kỹ thuật phân tích ảnh ......................................................................... 17 Hình 1.4. Mô hình hệ thống nhận dạng mặt người ..................................................... 21 Hình 1.5 Cơ sở dữ liệu ảnh mặt người AT&T (ORL)................................................. 23 Hình1.6 Một số hình ảnh cơ sở dữ liệu ảnh mặt người Yale A ................................... 24 Hình 1.7 Mô hình Markov cho định vị khuôn mặt: .................................................... 30 (a) Các vector quan sát; (b) Các trạng thái ẩn ............................................................. 30 Hình 1.8 Ví dụ sự tính toán LBP ................................................................................ 31 Hình1.9 Minh họa toán tử LBP mở rộng vớị P và R khác nhau. ................................. 33 Hình 1.10 Ví dụ LBP8,1 ............................................................................................ 33 Hình 1.11 LBP giống nhau với các độ sáng khác nhau............................................... 34 Hình 1.12 Ví dụ mẫu đồng nhất và mẫu không đồng nhất .......................................... 34 Hình 1.13 58 Mẫu đồng nhất của ( , ) ........................................................ 35 Hình 1.14 Trích rút đặc trưng khuôn mặt bằng LBP .................................................. 36 Hình 2.1. Ví dụ minh họa PCA .................................................................................. 38 Hình 2.2: Một số không gian riêng của cơ sở dữ liệu ảnh ORL .................................. 38 Hình 2.3 Minh hoạ hướng của véctơ riêng ................................................................. 47 Hình 2.4 Dữ liệu và đồ thị biểu diễn dữ liệu .............................................................. 49 Hình 2.5. Đồ thị biểu diễn dữ liệu đã chuẩn hóa với các vector riêng ......................... 51 Hình 2.6. Ảnh gốc trong cơ sở dữ liệu ORL ............................................................... 53 Hình 2.7 Ảnh sau khi biến đổi theo PCA ................................................................... 54 Hình 2.8 Ví dụ minh họa LDA................................................................................... 55 Hình 2.9 Ảnh sau khi biến đổi theo LDA ................................................................... 57 Hình 2.10 Các thành phần cơ bản của mạng nơron nhân tạo ...................................... 58 8 Hình 2.11 Một số dạng hàm kích hoạt của nơron ....................................................... 59 Hình 2.12 Mạng nơron l lớp....................................................................................... 61 Hình 3.1 Ảnh gốc trong bộ ảnh ORL ......................................................................... 65 Hình 3.2 Sơ đồ khối của quá trình huấn luyện............................................................ 66 Hình 3.3 Ảnh gốc được bổ sung ảnh gương ............................................................... 66 Hình 3.4 Sơ đồ khối của quá trình nhận dạng ............................................................. 68 Hình 3.5. Giao diện chính của chương trình ............................................................... 69 Hình 3.6. Giao diện huấn luyện mạng nơron .............................................................. 70 Hình 3.7 Giao diện nhận dạng.................................................................................... 70 Hình 3.8 Kết quả nhận dạng khi thay đổi hình thái khuôn mặt ................................... 74 Hình 3.9 Kết quả nhận dạng khi có nhiễu .................................................................. 75 9 MỞ ĐẦU Nhận dạng ảnh đang ngày càng chứng tỏ được vai trò quan trọng củamình và đang được ứng dụng ngày càng rộng rãi trong cuộc sống hiện đại. Bên cạnh đó, một lĩnh vực của nhận dạng ảnh là nhận dạng mặt người cũng đang ngày càng được ứng dụng nhiều, đặc biệt là trong các lĩnh vực an ninh. Như chúng ta đã biết,khuôn mặt mỗi người có những nét đặc trưng riêng.Nhận ra được những nét đặc trưng đó, có nghĩa là nhận ra được người đó. Mặc dù đặc trưng của khuôn mặt không đảm bảo được tính duy nhất như vân tay hay võng mạc mắt, tuy nhiên việc xây dựng một hệ thống nhận dạng mặt đơn giản hơn so với một hệ thống nhận dạng vân tay hay nhận dạng mắt. Do đó, trong những trường hợp không thực sự đòi hỏi quá an toàn và chính xác, thì việc xây dựng một hệ thống nhận dạng mặt thay thế cho một hệ thống nhận dạng vân tay hay hệ thống nhận dạng võng mạc mắt là một giải pháp hợp lý. Bên cạnh đó, nhận dạng vân tay và nhận dạng võng mạc đòi hỏi việc thu nhận tín hiệu phải trực tiếp và đòi hỏi độ chính xác cao, mà điều này là không thể trong nhiều trường hợp, đặc biệt là trong khoa học hình sự. Vì thế, trong những trường hợp này thì không tồn tại một giải pháp thay thế nào khác cho nhận dạng mặt người. Cóhaiphươngphápnhậndạngphổbiếnhiệnnaylànhận dạng dựa trên đặc trưng hình học của cácphần tử trên khuôn mặt như biển đổi Sóng Wavelet (Gabor Wavelet)vàMạng Nơron (Neural Network),…và nhận dạng dựa trên xét tổng thể toàn khuôn mặt nhưphươngpháp Phân tích thành phần chính (PrincipalComponent Analysis – PCA) phươngpháp Phân tíchphân lớp tuyếntính (Linear Discriminant Analysis – LDA),... Kết hợp phươngpháp PCA, LDA vàmạngNơronmanglại hiệuquả nhậndạngcao bởinó hoạt độngổn địnhvàcótínhthíchnghi cao với sự thay đổi về ánh sáng, góc độ của ảnh mặt người. Trên cơ sở đó, em đã chọn hướng đề tài “Nghiên cứu phương pháp nhận dạng mặt người dựa trên PCA-LDA và mạng neural” làm luận văn tốt nghiệp của mình.Bố cục của luận văn bao gồm 3 phần: Chương 1:Tổng quan về nhận dạng mặt người: Giới thiệu tổng quan về ứng dụng của xử lý ảnh trong lĩnh vực nhận dạng mặt người Chương 2: Nhận dạng mặt người dựa trên PCA-LDA và mạng nơron: Trình bày các phương pháp phân tích thành phần chính(PCA), phân tích phân lớp 10 tuyến tính(LDA) và mạng nơron. Xây dựng phương pháp nhận dạng với bước trích chọn đặc trưng bằng PCA-LDA và nhận dạng bằng mạng nơron Chương 3: Thực nghiệm: Trình bày sơ đồ hệ thống nhận dạng khuôn mặt dựa trên PCA-LDA và mạng nơron, kiểm thử đánh giá hiệu suất của hệ thống và đưa ra hướng phát triển của đề tài 11 CHƯƠNG I TỔNG QUAN VỀ NHẬN DẠNG MẶT NGƯỜI 1.1 Giới thiệu về xử lý ảnh Xử lý ảnh là một lĩnh vực mang tính khoa học và công nghệ. Nó là một ngành khoa học mới mẻ so với nhiều ngành khoa học khác nhưng tốc độ phát triển của nó rất nhanh, kích thích các trung tâm nghiên cứu, ứng dụng, đặc biệt là máy tính chuyên dụng riêng cho nó. Cùng với ngôn ngữ tự nhiên, hình ảnh đã đóng góp một vai trò hết sức quan trọng trong việc trao đổi thông tin. Tính trực quan của hình ảnh đã giúp cho con người hiểu rõ và sâu sắc hơn các thông tin cần thu thập. Người ta đã chứng minh được rằng, trong tất cả các kênh thu nhận thông tin của con người thì lượng thông tin thu nhận qua kênh thị giác chiếm khoảng 70%. Hình ảnh là kết quả của việc thu nhận và biểu diễn của năng lượng ánh sáng trải dài từ tia gamma (có bước sóng nhỏ) đến sóng radio (có bước sóng lớn). Tuy nhiên, mắt người chỉ cảm nhận được một vùng giới hạn rất nhỏ trong phổ điện từ. Ngược lại, máy tính có thể đọc được một vùng rất rộng trong phổ điện từ, từ tia gamma đến sóng radio. Nó có thể biểu diễn và xử lý những bức ảnh được sinh ra bởi những nguồn mà con người không thể nhận biết được, như ảnh siêu âm, ảnh hồng ngoại, ảnh trong vùng tia X, … Do đó xử lý ảnh có một phạm vi ứng dụng tương đối rộng. Xử lý ảnh là một trong những cách tiếp cận phân tích, tổng hợp hình ảnh theo ý tưởng và mục đích của người sử dụng. Tuy xử lý ảnh là một trong những khoa học còn tương đối mới so với nhiều ngành kho học khác, song những năm gần đây, xử lý ảnh và đồ họa đã phát triển một cách mạnh mẽ và đã gặt hái được nhiều thành công góp phần vào sự phát triển chung của ngành công nghệ thông tin. Các phương pháp xử lý ảnh bắt nguồn từ hai ứng dụng: nâng cao chất lượng thông tin hình ảnh đối với mắt người và xử lý số liệu cho máy tự động. Một trong những ứng dụng đầu tiên của xử lý ảnh là nâng cao chất lượng ảnh báo truyền qua cáp giữa London và NewYork vào những năm 192x. Thiết bị đặc biệt mã hóa hình ảnh (báo), truyền qua cáp và khôi phục lại ở phía thu. Vấn đề nâng cao chất lượng hình ảnh lúc đầu có liên quan đến việc lựa chọn quá trình in và phân bố các mức sáng (tông và độ phân giải của ảnh). 12 Hệ thống đầu tiên (Bartlane) có khả năng mã hóa hình ảnh với 5 mức sáng. Khả năng này tăng lên 15 mức vào 1929. Việc nâng cao chất lượng ảnh bằng các phương pháp xử lý để truyền ảnh được nghiên cứu 35 năm sau đó. Năm 1964, các bức ảnh chụp mặt trăng được vệ tinh Ranger 7 (Mỹ) truyền về trái đất, được xử lý bằng máy tính để sửa méo (gây ra do camera truyền hình đặt trên vệ tinh ở các góc độ khác nhau). Các kỹ thuật cơ bản cho phép nâng cao chất lượng hình ảnh như làm nổi đường biên và lưu hình ảnh. Từ năm 1964 đến nay, phạm vi xử lý ảnh lớn mạnh không ngừng. Các kỹ thuật xử lý ảnh hiện nay được sử dụng để giải quyết hàng loạt các vấn đề, nhằm nâng cao chất lượng thông tin hình ảnh. Trong y học, các thuật toán máy tính nâng cao độ tương phản, hoặc mã hóa các mức sáng thành các màu để nội suy ảnh X-Quang và các hình ảnh y sinh học dễ dàng.Các nhà địa vật lý sử dụng kỹ thuật tương tự để nghiên cứu các mẫu vật chất từ vệ tinh.Các thuật toán nâng cao chất lượng ảnh và khôi phục hình ảnh được sử dụng để xử lý hình ảnh giảm chất lượng. Trong thiên văn học, các phương pháp xử lý ảnh nhằm khôi phục hình ảnh bị nhiễu hoặc bị mất do bóng (artifacts) sau khi chụp. Trong vật lý và các lĩnh vực có liên quan, kỹ thuật máy tính nâng cao được chất lượng ảnh trong các lĩnh vực như Plamas (có năng lượng cao) và microscopy điện tử. Tương tự, người ta đã ứng dụng xử lý ảnh có kết quả tốt trong viễn thám, sinh học, y tế hạt nhân, quân sự, công nghiệp … Nâng cao chất lượng và khôi phục ảnh bị nhiễu là quá trình xử lý ảnh dùng cho mục đích nội suy của mắt người. Lĩnh vực ứng dụng quan trọng thứ hai là xử lý ảnh số gắn liền với việc cảm nhận của máy. Trong lĩnh vực thứ hai, các cố gắng đều tập trung vào các quá trình trích thông tin ảnh và chuyển thành dạng thích hợp cho xử lý máy tính. Những vẫn đề tiêu biểu của kỹ thuật xử lý ảnh được ứng dụng nhiều trong thực tế, có thể kể như: tự động nhận dạng đặc trưng, máy nhìn công nghiệp để điều khiển và kiểm tra sản phẩm, nhận dạng mục tiêu quân sự, tự động xử lý vân tay, hiển thị lên màn hình ảnh X-Quang và các mẫu máu, xử lý bằng máy các hình ảnh chụp từ vệ tinh để dự báo thời tiết, nén ảnh để lưu và truyền được nhiều hơn tín hiệu ảnh trong thông tin, máy tính, truyền hình thông thường và truyền hình có độ phân giải cao. 13 1.1.1 Khái niệm xử lý ảnh số Xử lý ảnh số là một ngành khoa học nhằm trang bị phương pháp luận, kỹ thuật để trang bị cho máy tính xử lý ảnh đầu vào trên máy tính với mục tiêu nhận được ảnh kết quả ở đầu ra theo mong muốn của con người… Như vậy xử lý ảnh là một quá trình từ ảnh thu nhận đầu vào xử lý tăng cường và nâng cao chất lượng ảnh, phân tích ảnh, hiểu ảnh, mã hóa, nén ảnh… cho đến khi thu nhận được ảnh kết quả tốt hơn theo mong muốn của con người. Từ đó giúp cho con người có được cách nhìn trực quan hơn và sinh động hơn về hình ảnh. Xử lý ảnh số còn là việc sử dụng các thuật toán máy tính để xử lý các ảnh số dưới sự trợ giúp của máy tính. Xử lý ảnh số có thể chia làm bốn lĩnh vực, tùy thuộc vào loại công việc. Đó là cải thiện và nâng cao chất lượng ảnh, phục hồi ảnh, mã hóa ảnh và hiểu ảnh. Trong cải thiện và nâng cao chất lượng ảnh, ảnh được xử lý để xem, như trong truyền hình, hoặc là được xử lý trước để trợ giúp hoạt động của máy móc, như trong nhận dạng đối tượng. Trong phục hồi ảnh, ảnh bị xuống cấp một số trường hợp, chẳng hạn bị nhòe, và mục đích là để giảm bớt hoặc loại bỏ hẳn ảnh hưởng sự xuống cấp. Phục hồi ảnh có liên quan mật thiết đến cải thiện ảnh. Khi ảnh xuống cấp, việc cải thiện ảnh thường đem lại kết quả làm giảm sự xuống cấp. Tuy nhiên có một số sự khác nhau giữa phục hồi ảnh và cải thiện ảnh. Trong phục hồi ảnh, một số ảnh lý tưởng thường bị xuống cấp và mục đích phục hồi là tạo ra ảnh sau xử lý giống như ảnh ban đầu. Trong việc cải thiện ảnh, mục đích cải thiện ảnh là làm cho ảnh sau khi xử lý trong đẹp hơn ảnh chưa xử lý. Để minh học sự khác nhau này, lưu ý rằng một ảnh gốc chưa xuống cấp không thể phục chế hơn nữa nhưng vẫn có thể được cải thiện bằng cách tăng độ nét. Trong mã hóa ảnh, mục đích là biểu diễn với một số ít bit nhất trong điều kiện chất lượng ảnh và độ rõ chấp nhận được cho từng ứng dụng cụ thể, chẳng hạn như hội nghị video. Mã hóa ảnh liên quan đến cải thiện ảnh và phục hồi ảnh. Nếu có thể cải tiến dáng vẻ bề ngoài của ảnh được phục hồi, hoặc làm giảm sự xuống cấp do các nguồn nhiễu, như nhiễu lượng tử mà thuật toán mã hóa ảnh gây ra, thì ta có thể làm giảm số lượng bit cần thiết để đại diện ảnh ở một mức chất lượng và độ rõ chấp nhận được. Trong việc hiểu (understanding) ảnh, đầu vào là ảnh, mục đích là diễn đạt nội dung ảnh bằng một hệ ký hiệu nào đó. Những ứng dụng của “hiểu ảnh” bao gồm thị giác máy tính, kỹ thuật rô-bốt và nhận dạng mục tiêu.“Hiểu ảnh” khác với ba lĩnh vực khác của xử lý 14 ảnh ở một khía cạnh chính. Trong cải tiến, phục hồi và mã hóa ảnh cả đầu vào và đầu ra đều là ảnh và khâu xử lý tín hiệu là phần then chốt của các hệ thống đã thành công trên các lĩnh vực đó. Trong “hiểu ảnh”, đầu vào là ảnh, nhưng đầu ra thường là một biểu diễn bằng ký hiệu nội dung của ảnh đầu vào. Sự phát triển thành công của các hệ thống trong lĩnh vực này cần đến cả xử lý tín hiệu và những khái niệm trí tuệ nhân tạo. Trong hệ “hiểu ảnh” điển hình, xử lý tín hiệu được dùng cho công việc xử lý mức thấp như làm giảm sự xuống cấp và trích chọn các đường biên ảnh hoặc các đặc tính khác của ảnh, còn trí tuệ nhân tạo được dùng cho những công việc xử lý mức cao như thao tác kí hiệu và quản lý cơ sở tri thức. 1.1.2 Các ứng dụng của xử lý ảnh số Xử lý ảnh có nhiều ứng dụng trong thực tế.Một trong những ứng dụng sớm nhất là xử lý ảnh từ nhiệm vụ Ranger 7 tại phòng thí nghiệm JetPulsion vào những năm đầu của thập kỷ 60. Hệ thống chụp hình gắn trên tàu vũ trụ có một số hạn chế về kích thước và trọng lượng, do đó ảnh nhận được bị giảm chất lượng như bị mờ, méo hình học và nhiễu nền. Các ảnh đó được xử lý thành công nhờ máy tính số. Hình ảnh của mặt trăng và sao hỏa mà chúng ta thấy trong tất cả các tạp chí đều được xử lý bằng những máy tính số. Ngày nay, hầu hết các thông tin ảnh đều được chuyển sang dạng ảnh số. Vì vậy, trong gần như tất cả các lĩnh vực của các ngành kỹ thuật đều có ít nhiều liên quan đến ảnh số và sử dụng kỹ thuật xử lý ảnh số.Ứng dụng của xử lý ảnh có khả năng tác động mạnh mẽ nhất đến cuộc sống của chúng ta là lĩnh vực y tế. Soi chụp ảnh bằng máy tính dựa trên cơ sở định lý cắt lớp (project slice) được dùng thường xuyên trong xét nghiệm lâm sàng, ví dụ phát hiện và nhận dạng u não. Những ứng dụng y khoa khác của xử lý ảnh gồm cải thiện ảnh X-Quang và nhận dạng đường biênmạch máu từ những ảnh chụp bằng tia X. Có những ứng dụng khác gần gũi hơn với cuộc sống gia đình là cải tiến ảnh tivi. Hình ảnh trên màn hình tivi có các khuyết tật do độ phân giải hạn chế, bị rung rinh,nhiều nền và trượt hình do đan dòng ở những mức độ khác nhau. Xử lý ảnh số có tác động quyết định đến việc cải thiện chất lượng hình ảnh của những hệ truyền hình hiện tại và làm phát triển những hệ truyền hình mới có độ phân giải cao. Một vấn đề nữa của truyền thông video như hội nghị video, điện thoại video là cần có dải tần rộng.Việc mã hóa thẳng chương trình video chất lượng yêu cầu đến 100 triệu bit/giây. 15 Nếu hy sinh một phần chất lượng và dùng các sơ đồ mã hóa ảnh số thì có thể đưa ra thị trường những hệ truyền hình chất lượng đủ rõ với nhịp bit chỉ dưới 100 nghìn bit/giây. Người máy càng ngày càng đóng vai trò quan trọng trong công nghiệp và gia đình. Chúng sẽ thực hiện những công việc rất nhàm chán hoặc nguy hiểm và những công việc mà tốc độ và chính xác vượt quá khả năng của con người. Khi người máy trở nên tinh vi hơn, thị giác máy tính sẽ đóng vai trò ngày càng quan trọng. Người ta sẽ đòi hỏi người máy không những phát hiện và nhận dạng các bộ phận công nghiệp, mà còn “hiểu” được những gì chúng “thấy” và đưa ra những hành động phù hợp. Xử lý ảnh số có tác động rất lớn đến thị giác máy tính. Ngoài những ứng dụng trên thì còn bao gồm các ứng dụng trong các lĩnh vực như điện tử gia đình, thiên văn học, sinh vật học, vật lý, nông nghiệp, địa lý, nhân chủng học và nhiều lĩnh vực khác. Khả năng nhìn và nghe thấy là hai phương tiện quan trọng nhất để con người nhận thức thế giới bên ngoài, do vậy không có gì đáng ngạc nhiên khi mà xử lý ảnh số có nhiều khả năng ứng dụng, không chỉ trong khoa học kỹ thuật mà còn cả trong mọi hoạt động khác của con người. 1.1.3 Các bước cơ bản trong xử lý ảnh số Đầu tiên, ảnh tự nhiên từ thế giới ngoài được thu nhận qua các thiết bị thu (như Camera, máy chụp ảnh). Trước đây, ảnh thu qua camera là các ảnh tương tự (loại camera ống kiểu CCIR). Gần đây, với sự phát triển của công nghệ, ảnh màu hoặc đen trắng được lấy ra từ camera, sau đó nó được chuyển trực tiếp thành ảnh số tạo thuận lợi cho xử lý tiếp theo. Mặt khác, ảnh cũng có thể tiếp nhận từ vệ tinh; có thể quét từ ảnh chụp bằng máy quét ảnh.Hình 1.5 dưới đây mô tả các bước cơ bản trong xử lý ảnh. Hình 1.1 Tổng quan các giai đoạn cơ bản trong xử lý ảnh 16 Sơ đồ này bao gồm các thành phần như sau: Thu nhận ảnh: Ảnh có thể được thu nhận trong thế giới thực qua máy chụp hình, từ tranh ảnh thông qua máy quét hoặc từ vệ tinh qua các bộ cảm biến bằng tín hiệu số hoặc tín hiệu tương tự. Ảnh có thể nhận qua camera màu hoặc đen trắng. Thường ảnh nhận qua camera là ảnh tương tự (loại camera ống chuẩn CCIR với tần số 1/25, mỗi ảnh 25 dòng), cũng có loại camera đã số hóa (như loại CCD – Change Coupled Device) là loại photodiot tạo cường độ sáng tại mỗi điểm ảnh. Số hóa ảnh: Tất cả các thông tin được lưu trong máy tính đều ở dạng số. Vì vậy, ảnh sau khi thu nhận được từ các thiết bị khác cần phải được số hóa để lưu trữ hoặc có thể dùng để xử lý tiếp. Tiền xử lý: Sau bộ thu nhận, ảnh có thể nhiễu độ tương phản thấp nên cần đưa vào bộ tiền xử lý để nâng cao chất lượng. Chức năng chính của bộ tiền xử lý là lọc nhiễu, nâng độ tương phản để làm ảnh rõ hơn, nét hơn. Phân tích ảnh: Phân tích ảnh là một quá trình gồm nhiều giai đoạn nhỏ hơn: tăng cường ảnh để nâng cao chất lượng ảnh và khắc phục những thiếu sót trong quá trình thu nhận ảnh và số hóa ảnh như nhiễu, méo … làm nổi bật các đặc trưng chính của ảnh đảm bảo cho ảnh gần giống với hình ảnh thật nhất. Tiếp theo là phát hiện và trích chọn các đặc trưng như biên, màu, kết cấu … Phân vùng ảnh là tách một ảnh đầu vào thành các vùng thành phần để biểu diễn phân tích, nhận dạng ảnh. Đây là phần phức tạp khó khăn nhất trong xử lý ảnh và cũng dễ gây lỗi, làm mất độ chính xác của ảnh.Kết quả nhận dạng ảnh phụ thuộc rất nhiều vào công đoạn này. Đối sánh, nhận dạng ảnh: Là quá trình đối sánh, phân lớp ảnh, nhận biết được tên gọi của đối tượng. Kết quả của quá trình này phục vụ cho các mục đích và các ứng dụng khác nhau. 1.2Giới thiệu chung về phân tích ảnh 1.2.1 Khái niệm Mục tiêu lớn nhất của phần lớn các ứng dụng xử lý ảnh là phân táchđược những đặc trưng quan trọng từ dữ liệu ảnh đưa vào, để từ đó có thể mô tả, thể hiện cũng như hiểu ảnh. Ví dụ, một hệ thống ảo có khả năng phân biệt các phần khác nhau của một dây chuyền lắp ráp và đưa ra các đặc trưng của nó, ví dụ như kích cỡ, số lượng các 17 khiếm khuyết(hole).Những hệ thống phức tạp hơn còn có khả năng diễn giải các kết quả phân tích, mô tả các đối tượng khác nhau cũng như mối quan hệ của chúng trong một bức ảnh. Phân tích ảnh khác với một số chức năng xử lý ảnh khác như khôi phục ảnh (restoration), cải thiện ảnh (enhancement), mã hoá (coding). Các chức năng này biến đổi ảnh đầu vào thành một ảnh đầu ra kháctheo các mục đích khác nhau. Còn đầu ra của một hệ phân tích ảnh là rút ra các đặc trưng của các đối tượng bên trong ảnh để mô tả, thể hiện ảnh. Lĩnh vực phân tích ảnh bao gồm các công đoạn: trích chọn đặc trưng (features extraction), phân vùng ảnh (segmentation), phân loại (classification). Mỗi công đoạn lại gồm một số kỹ thuật và công nghệ phân tích xử lý.Các kỹ thuật được thể hiện trong sơ đồ 1.2. Các kỹ thuật phân tích ảnh Trích chọn đặc trưng Phân vùng Phân loại  Đặc trưng không gian  Đối sánh mẫu  Phân lớp  Đặc trưng biến đổi  Lấy ngưỡng  Thống kê  Biên và đường bao  Phát hiện đường bao  Cây quyết định  Đặc trưng hình dạng  Phân lớp  Đo sự giống nhau  Mô men Hình1.2: Các kỹ thuật phân tích ảnh. - Trích chọn đặc trưng gồm có trích chọn các đặc trưng về không gian (spatial features), các đặc trưng biến đổi đổi (transform features), biên (edge), các đặc trưng về hình dạng (shape feature), các tham số thống kê, kết cấu bề mặt - Phân vùng gồm có kỹ thuật lấy ngưỡng (thresholding), phát hiện đường bao (boundary detection), kỹ thuật cây tứ phân (quad-trees)... - Phân loại gồm kỹ thuật phân đoạn(clustering), cây quyết định (decision trees)... 18 1.2.2Các ứng dụng của phân tích ảnh Các hệ thống computer vision dùng để phân tích ảnh được áp dụng rộng rãi trong mọi mặt của đời sống xã hội. Có thể là những công việc hàng ngày như các hoạt động rút tiền gửi ngân hàng, thanh toán tiền khi mua hàng cho đến những hệ thống định vị hướng dẫn bằng vô tuyến, các hệ thống dự báo khí tượng... Một hệ thống nhận dạng mẫu tự có thể nhận biết được các ký tự cũng như các ký hiệu cho trước theo một tiêu chuẩn nào đó tuỳ vào từng ứng dụng cụ thể. Từ một ảnh đầu vào cụ thể là những nhãn thư, hoá đơn, văn bản, tài liệu, …, hệ thống sẽ phân tích và đưa ra nội dung tương ứng chứa ở bên trong các tài liệu đó. Các hệ nhận dạng mẫu tự có thể thấy ở nhiều nơi như trong các hệ thống sắp xếp thư tự động, các máy đọc nhãn hiệu, các máy kiểm tra thẻ ngân hàng, các hệ thống nhận dạng văn bản text tự động. Do đó các công việc truyền thống làm bằng tay nay đã được chuyển sang tự động, góp phần giảm bớt thời gian lao động của con người, đồng thời nâng cao hiệu quả làm việc. Trong y học, các ứng dụng của phân tích ảnh được áp dụng chủ yếu trong các lĩnh vực chẩn đoán hình ảnh. Với sự trợ giúp của các hệ computer vision,người ta có thể phát hiện ra các khối u trong cơ thể, tiến hành đo đạc và tính toán kích thước, hình dạng các cơ quan nội tạng của con người, cũng như đếm số lượng các tế bào máu trong cơ thể người. Tất cả những công việc đó, đều trải qua một trình tự, đó là chụp ảnh phân tích ảnh - hiểu ảnh - chẩn đoán hình ảnh.Nhờ có sự ứng dụng các hệ computer vision vào trong y học đã đem lại những thành tựu lớn trong việc chẩn đoán bệnh. Trong công nghiệp, các ứng dụng của phân tích ảnh cũng được áp dụng một cách rộng rãi. Đó là các ứng dụng trong việc phát hiện và kiểm tra lỗi sản phẩm, và đặc biệt là trong lĩnh vực robot tự động. Các robot tự động được sử dụng ngày càng rộng rãi trong công nghiệp nhằm thay thế con người. Với sự trợ giúp của các hệ thống computer vision các robot có thể nhận biết được không gian xung quanh. Hệ thống computer vision sẽ truyền những tín hiệu phản hồi về cho chương trình xử lý của robot và từ đó robot sẽ được điều khiển một cách thích hợp với hoàn cảnh hiện thời. Trong lĩnh vực quân sự, hàng hải và hàng không, các hệ thống computer vision đóng một vai trò to lớn. Từ những bức ảnh chụp được từ vệ tinh, người ta có thể tiến hành phân tích, rồi điều khiển cho các tên lửa hoặc máy bay quân sự đánh trúng những
- Xem thêm -