ĐẠI HỌC QUỐC GIA H[ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
ĐỖ THỊ HỒNG LĨNH
NHẬN DẠNG KHUÔN MẶT NGƯỜI VÀ ỨNG DỤNG TRONG BẢO TOÀN
THÔNG TIN
LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN
Hà Nội, 2014
ĐẠI HỌC QUỐC GIA H[ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
ĐỖ THỊ HỒNG LĨNH
NHẬN DẠNG KHUÔN MẶT NGƯỜI VÀ ỨNG DỤNG TRONG BẢO TOÀN
THÔNG TIN
Ng{nh: Công nghệ thông tin
Chuyên ng{nh: Hệ thống thông tin
M~ số: 60480104
LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN
NGƯỜI HƯỚNG DẪN KHOA HỌC:
PGS.TS: TRỊNH NHẬT TIẾN
Hà Nội, 2014
2
Lời cảm ơn
Trước hết, tôi xin gửi lời cảm ơn sâu sắc nhất đến PGS.TS Trịnh Nhật Tiến,
người đã tận tình hướng dẫn tôi trong suốt quá trình thực hiện luận văn tốt
nghiệp.
Tôi xin cảm ơn trường Đại học Công Nghệ - Đại học Quốc gia Hà Nội và
các thầy cô giáo đã giảng dạy tôi trong suốt thời gian học tập tại trường, tạo điều
kiện, giúp đỡ tôi hoàn thiện luận văn này. Xin cảm ơn gia đình, bạn bè, đồng
nghiệp đã luôn động viên giúp đỡ tôi trong thời gian học tập và hoàn thành luận
văn.
Trong quá trình nghiên cứu, thực hiện, mặc dù đã cố gắng, nỗ lực để hoàn
thiện, luận văn của tôi cũng không tránh khỏi những thiếu sót và hạn chế. Kính
mong nhận được sự đóng góp của thầy cô và các bạn.
Tôi xin chân thành cảm ơn!
Học viên
Đỗ Thị Hồng Lĩnh
3
Lời cam đoan
Tôi xin cam đoan nội dung đề tài “ Nhận dạng khuôn mặt người và ứng
dụng trongbảo toàn thông tin”được trình bày trong luận văn này do tôi thực
hiện dưới sự hướng dẫn của PGS.TS.Trịnh Nhật Tiến.
Tất cả những tham khảo từ các nghiên cứu liên quan đều được nêu nguồn
gốc một cách rõ ràng từ danh mục tài liệu tham khảo của luận văn. Trong luận
văn, không có việc sao chép tài liệu, công trình nghiên cứu của người khác mà
không chỉ rõ về tài liệu tham khảo.
Hà Nội, ngày
tháng
năm 2014
Tác giả
Đỗ Thị Hồng Lĩnh
4
MỤC LỤC
DANH MỤC HÌNH VẼ ..................................................................................................................... 7
MỞ ĐẦU ........................................................................................................................................ 8
Chương 1. CƠ SỞ KHOA HỌC VÀ THỰC TIỄN CỦA VẤN ĐỀ NHẬN DẠNG MẶT NGƯỜI ................ 9
1.1. TỔNG QUAN VỀ SINH TRẮC HỌC........................................................................................ 9
1.1.1 Vân tay (Fingerprint). ................................................................................................. 10
1.1.2. Đường chỉ tay (Palm lines) ........................................................................................ 11
1.1.3. Võng mạc mắt (retina biometrics) ............................................................................ 12
1.1.4. Giọng nói ................................................................................................................... 12
1.1.5. Nhận dạng mặt người (Face recognition) ................................................................. 13
1.1.6. DNA (Dioxyribo Nucleic Acid) .................................................................................... 14
1.2. HỆ THỐNG NHẬN DẠNG MẶT NGƯỜI ............................................................................. 14
1.2.1. Bài toán nhận dạng mặt người và những khó khăn .................................................. 14
1.2.1.1. Bài toán nhận dạng mặt người........................................................................... 14
1.2.1.2. Những khó khăn của nhận dạng khuôn mặt ...................................................... 15
1.2.2. Các ứng dụng liên quan đến nhận dạng mặt người. ................................................. 16
1.2.3. Tổng quan kiến trúc hệ thống nhận dạng khuôn mặt ............................................... 17
1.2.3.1. Phát hiện khuôn mặt .......................................................................................... 17
1.2.3.2. Trích chọn đặc trưng .......................................................................................... 19
1.2.3.3. Nhận dạng khuôn mặt ........................................................................................ 21
Chương 2: PHƯƠNG PHÁP NHẬN DẠNG MẶT NGƯỜI ............................................................... 23
2.1. PHÁT HIỆN KHUÔN MẶT .................................................................................................. 23
2.1.1. Đặc trưng HAAR-LIKE................................................................................................. 23
2.1.2. Adaboosting .............................................................................................................. 26
2.1.3. Giải thuật Viola-Jones................................................................................................ 27
2.2. NHẬN DẠNG MẶT NGƯỜI ................................................................................................ 30
2.2.1. Phương pháp phân tích thành phần chính (PCA: Principal Component Analysis ) ... 30
2.2.2. Nhận dạng khuôn mặt theo phương pháp EIGENFACE. ........................................... 33
2.2.3. Khoảng cách Euclid. ................................................................................................... 35
Chương 3: NHẬN DẠNG MẶT NGƯỜI VÀ VẤN ĐỀ AN TOÀN THÔNG TIN................................... 36
3.1. Vấn đề an toàn thông tin.................................................................................................. 36
3.2. Nhận dạng mặt người trong bảo đảm an toàn thông tin................................................. 38
5
3.3. Đề xuất hướng giải quyết và phạm vi ứng dụng của đề tài ............................................. 39
Chương 4: CHƯƠNG TRÌNH THỬ NGHIỆM ................................................................................. 41
4.1. Sơ lược về EmguCV. ......................................................................................................... 41
4.2. Các bước chính trong hệ thống nhận dạng mặt người. ................................................... 42
4.3. Phân tích hệ thống. .......................................................................................................... 43
4.4. Kết quả chạy chương trình. .............................................................................................. 45
KẾT LUẬN ..................................................................................................................................... 50
TÀI LIỆU THAM KHẢO .................................................................................................................. 51
6
DANH MỤC HÌNH VẼ
Hình 1.1: Các đặc trưng sinh trắc của con người. ......................................................................... 9
Hình 1.2: Bài toán nhận dạng mặt người. ................................................................................... 15
Hình 1.3: Kiến trúc hệ thống nhận dạng mặt người.................................................................... 17
Hình 1.4: Hiệu năng giải thuật PCA theo số lượng đặc trưng trích rút. ...................................... 20
Hình 1.5: Giải thuật trích chọn đặc trưng. .................................................................................. 21
Hình 2.1: 4 đặt trưng Haar-like cơ bản ....................................................................................... 23
Hình 2.2: Các đặc trưng mở rộng của các đặc trưng Haar-like cơ sở ......................................... 24
Hình 2.3: Cách tính Integral Image của ảnh ................................................................................ 25
Hình 2.4: Ví dụ cách tính nhanh các giá trị mức xám của vùng D trên ảnh ................................ 25
Hình 2.5: Mô hình phân tầng kết hợp các bộ phân loại yếu để xác định khuôn mặt ................. 27
Hình 2.6 : Hệ thống xác định vị trí khuôn mặt người (Face detection system) .......................... 28
Hình 2.7: Minh họa PCA: tìm các trục tọa độ mới sao cho dữ liệu có độ biến thiên cao nhất. .. 31
Hình 4.1 : Cấu trúc cơ bản của OpenCV ...................................................................................... 42
Hình 4.2: Chức năng nhận dạng của hệ thống ............................................................................ 43
7
MỞ ĐẦU
Khi bạn đăng nhập máy tính, sử dụng thẻ ATM, xuất nhập cảnh khi đi
máy bay, sử dụng thẻ tín dụng, khi bạn vào các khu vực đòi hỏi an ninh cao,
bạn cần phải xác thực nhận dạng. Xác thực nhận dạng là để kiểm tra bạn có
phải là người mà bạn khai báo hay không.
Các phương pháp xác thực truyền thống bao gồm mật khẩu và các loại
thẻ định danh như chứng minh thư, thẻ ATM… Điều bất lợi khi bạn sử dụng
các phương pháp xác thực truyền thống là bạn có thể quên mật khẩu, bạn có
thể đánh mất chứng minh thư, đánh mất thẻ tín dụng,… dẫn đến việc bạn
không thể đăng nhập để truy cập vào các tài nguyên cá nhân của bạn và các
kho tài liệu mật của bạn. Ngoài ra còn có các nguy cơ nguy hiểm khác nữa là
vô tình các thông tin bảo mật của bạn lại rơi vào tay của người khác, họ sử
dụng thông tin mật của bạn vào các mục đích bất lợi cho bạn và cho mọi
người.
Vấn đề cấp bách đứng hàng đầu hiện nay về công nghệ là nâng cao tính
bảo mật. Hàng ngày, hàng giờ vẫn luôn xảy ra các vấn đề đánh cắp thông tin
mật và các tài khoản ngân hàng … Để hạn chế các vấn đề này, vấn đề bảo mật
về sinh trắc học đang được sự quan tâm của nhiều người trong các lĩnh vực
cần mức độ bảo mật an toàn cao cũng như tính thuận tiện của nó khi xác thực
nhận dạng chủ thể trong đời sống xã hội cũng như trong các lĩnh vực quốc
phòng, an ninh.
Với nhu cầu bảo mật ngày càng cao của các ứng dụng truy nhập, kiểm
soát vào ra … tôi quyết định chọn đề tài nhận dạng khuôn mặt người và ứng
dụng trong bảo toàn thông tin để thực hiện luậnvăn tốt nghiệp của mình.
8
Chương 1.CƠ SỞ KHOA HỌC VÀ THỰC TIỄN CỦA VẤN ĐỀ NHẬN DẠNG
MẶT NGƯỜI
1.1. TỔNG QUAN VỀ SINH TRẮC HỌC
Sinh trắc học hay Công nghệ sinh trắc học (thuật ngữ khoa học:
Biometric) l{ công nghệ sử dụng những thuộc tính vật lý, đặc điểm sinh học
riêng của mỗi c| nh}n như v}n tay, mống mắt, khuôn mặt... để nhận diện.
Mỗi người có một đặc điểm sinh học duy nhất. Dữ liệu sinh trắc học
của từng c| nh}n với đặc điểm khuôn mặt, ảnh chụp võng mạc, giọng nói sẽ
được kết hợp với nhau bằng phần mềm để tạo ra mật khẩu d{nh cho những
giao dịch điện tử, phương thức đó l{ “công nghệ sinh trắc đa nh}n tố”.
Hình 1.1: C|c đặc trưng sinh trắc của con người.
Những thiết bị điện tử có khả năng sử dụng dữ liệu sinh trắc học trong
9
thời gian thực để bảo vệ thông tin bí mật của con người. Con người sẽ không
phải tạo, lưu giữ hay ghi nhớ mật khẩu d{nh cho thư điện tử, thẻ ng}n h{ng.
Chính phủ một số nước đ~ thực hiện việc thắt chặt an ninh v{ quản lý hộ
chiếu bằng c|ch thử nghiệm công nghệ sinh trắc học. H~ng Cross Match
Technologies thiết kế ứng dụng x|c thực sinh trắc học dùng công nghệ nhận
diện gương mặt để lấy được đối tượng từ một đ|m đông.
Tại Mỹ, thẻ tín dụng sắp tới kỳ trở th{nh đồ cổ, trong c|c chuỗi siêu thị
Thrifway, kh|ch h{ng trả tiền mua h{ng bằng ngón tay…Theo c|c nh{ nghiên
cứu của IBM, trong tương lai không xa con người có thể bước tới một m|y
rút tiền tự động v{ đọc tên hoặc nhìn v{o một cảm biến nhỏ xíu để rút tiền.
Nếu cảm biến nhận ra những đặc điểm duy nhất trong võng mạc của kh|ch
h{ng, nó sẽ cho phép người đó giao dịch. Hiện nay đ~ có trên 100 quốc gia sử
dụng hộ chiếu điện tử bằng công nghệ nhận dạng v}n tay. Sử dụng v}n tay
được đ|nh gi| l{ một giải ph|p bảo mật hữu hiệu v{ x|c nhận nh}n th}n
chính x|c.
Nhận dạng khuôn mặt người l{ một công nghệ được ứng dụng rộng r~i
trong đời sống hằng ng{y của con người như c|c hệ thống gi|m s|t, quản lý
v{o ra, tìm kiếm thông tin một người nổi tiếng,...Có rất nhiều phương ph|p
nhận dạng khuôn mặt để n}ng cao hiệu suất tuy nhiên dù ít hay nhiều những
phương ph|p n{y đang vấp phải những thử th|ch về độ s|ng, hướng
nghiêng, kích thước ảnh, hay ảnh hưởng của tham số môi trường.
Nhận dạng khuôn mặt l{ một th|ch thức lớn, vì vậy, nó đ~ thu hút c|c
nh{ nghiên cứu từ c|c lĩnh vực kh|c nhau như: t}m lý học, nhận dạng mẫu,
mạng tế b{o thần kinh, thị gi|c m|y tính, đồ họa m|y tính …
Để tìm hiểu kỹ về vấn đề n{y, ta tìm hiểu về một số công nghệ đ~ được
sử dụng phổ biến hiện nay:
1.1.1 Vân tay (Fingerprint).
10
Đầu thế kỷ XIX, ph|t hiện khoa học thừa nhận hai tính năng quan trọng:
Thứ nhất l{ hai kiểu v}n tay kh|c nhau dẫn đến có 2 người kh|c nhau. C|c
dấu v}n tay rất hiếm khi có 2 người trùng v}n tay. Theo kết quả đó dấu v}n
tay được đưa v{o nhận dạng tội phạm khi họ phạm tội để lại dấu v}n tay.
Những năm 60 của thế kỷ 20, vì m|y tính có khả năng xử lý đồ họa với độ
chính x|c cao nên con người bắt đầu nghiên cứu về dấu v}n tay trong vấn đề
bảo mật. Hệ thống nhận dạng v}n tay tự động AFIS Zai thực hiện c|c nghiên
cứu ph|p luật v{ ứng dụng.
Một hệ thống sinh trắc học tốt yêu cầu phải đạt tốc độ xử lý nhanh
chóng v{ hiệu quả trong thời gian thực thi để ho{n th{nh qu| trình nhận
dạng. Tất cả c|c hệ thống sinh trắc học bao gồm c|c qu| trình xử lý: thu
nhận, giải m~, so s|nh v{ kết hợp. Dấu v}n tay đảm nhận việc xử lý, nó bao
gồm c|c công đoạn chụp lại ảnh dấu v}n tay, xử lý hình ảnh dấu v}n tay, khai
th|c c|c tính năng để so s|nh sau đó kết hợp lại với nhau để đưa ra thông tin.
Thuận lợi của việc sử dụng dấu v}n tay l{ nó đ|ng tin cậy v{ dễ d{ng được
chấp nhận. Bạn chỉ cần bỏ ra một khoảng thời gian rất ngắn để có được hình
ảnh về dấu v}n tay với một thiết bị lấy dấu v}n tay, nhiều nghiên cứu cho
thấy rằng tất cả c|c công nghệ nhận dạng sinh trắc học thì dấu v}n tay hầu
như không cấu th{nh h{nh vi x}m phạm cơ thể con người như c|c phương
tiện công nghệ kh|c.
1.1.2. Đường chỉ tay (Palm lines)
Hầu hết tất cả mọi người đều có c|c khuôn hình b{ntay kh|c nhau, v{
hình dạng b{n tay của con người sau khi đạt đến một độ tuổi nhất định thì nó
sẽ không còn thay đổi đ|ng kể nữa. Khi người dùng đặt b{n tay lên trên m|y
đọc, b{n tay đó sẽ được chụp lại ảnh không gian 3 chiều từ trên xuống. Tiếp
theo, độ d{i v{ hình dạng c|c đốt trên c|c ngón tay được m|y đọc đo đạc.
Theo số liệu được sử dụng để x|c định những người kh|c nhau, công
nghệ đọc b{n tay có thể được chia th{nh 3 lĩnh vực sau: Ứng dụng của lòng
11
b{n tay, hình d|ng mạch b{n tay v{ ph}n tích hình học ngón tay. Lập ra
những nét đặc trưng kh|c nhau của c|c bức ảnh l{ kh| đơn giản, không sản
sinh thiết lập ra một số lượng lớn c|c dữ liệu. Tuy nhiên, với một số lượng
đ|ng kể của c|c bản ghi, hình học b{n tay có thể sẽ không ph}n biệt giữa c|c
con người với nhau bởi vì c|c đặc điểm trên lòng b{n tay của con người
tương tự lẫn nhau. (Nó không giống nhau nhưng nó tương tự nhau nên dẫn
đến khó ph}n biệt.) Do đó, việc sử dụng x|c thực bằng phương ph|p sinh
trắc học so s|nh giữa c|c b{n tay hình học không thể có được mức độ chính
x|c cao nhất.
1.1.3. Võng mạc mắt (retina biometrics)
Sinh trắc học ph}n tích c|c đặc tính phức tạp v{ duy nhất của mắt có
thể được chia th{nh hai lĩnh vực kh|c nhau: mống mắt sinh học (iris
biometrics) v{ sinh trắc học võng mạc (retina biometrics). Mống mắt l{
nhóm m{u bao quanh đồng tử mắt. Một hệ thống nhận dạng mống mắt sử
dụng một camera để chụp ảnh lại trong khi phần mềm so s|nh c|c kết quả
dữ liệu camera vừa chụp với dữ liệu mẫu đ~ có sẵn trong dữ liệu.
Võng mạc l{ một lớp c|c mạch m|u ở phía sau của mắt. Quét võng mạc
được thực hiện bởi một cường độ |nh s|ng hồng ngoại thấp để chụp lại c|c
đặc điểm của võng mạc. Một khu vực được gọi l{ bề mặt, nằm ở trung t}m
của võng mạc, được quét v{ c|c mô hình mạch m|u được chụp lại. Sinh trắc
học võng mạc được xem l{ sinh trắc học tốt nhất. Tuy nhiên, mặc dù kỹ thuật
n{y có độ chính x|c cao nhưng kỹ thuật n{y vẫn được cho l{ bất tiện v{ dễ bị
x}m nhập. V{ như vậy, rất khó được chấp nhận chung bởi người dùng cuối.
M|y quét võng mạc đòi hỏi c| nh}n con người phải đứng yên trong khi nó
đang đọc thông tin võng mạc. Mắt v{ m|y quét võng mạc không có hiệu quả
đối với người bị khiếm thị v{ những người bị đục thủy tinh thể.
1.1.4. Giọng nói
12
X|c nhận giọng nói l{ x|c nhận khoa học của một người dựa trên đặc
điểm giọng nói của họ. Tính năng duy nhất của giọng nói của một người
được số hóa v{ so s|nh với dữ liệu mẫu m{ người đó đ~ được ghi lại từ trước
“voiceprint” (ghi lại bằng đồ thị sóng }m) được lưu trữ trong cơ sở dữ liệu
để x|c minh danh tính. Nó kh|c với nhận dạng giọng nói bởi vì công nghệ
không công nhận lời nói từ chính nó. Thay v{o đó, nó nhận ra người nói c|c
từ bằng c|ch ph}n tích đặc điểm duy nhất, chẳng hạn như tần số giữa c|c
ngữ }m học.
Công nghệ nhận dạng giọng nói có thể l{m cho người nói điều khiển
truy cập v{o dịch vụ một c|ch có giới hạn, ví dụ truy cập từ điện tho{i đến
ng}n h{ng, c|c dịch vụ cơ sở dữ liệu, shopping hoặc thư thoại, v{ truy cập
v{o c|c thiết bị bảo mật.
Trong khi nhận dạng giọng nói được công nhận l{ thuận tiện thì nó lại
không đ|ng tin cậy do những rủi ro mạo danh, truy cập từ xa v{ có độ chính
x|c kém. Một người bị cảm lạnh hoặc viêm thanh quản có thể có vấn đề khi
sử dụng hệ thống nhận dạng giọng nói. Hệ thống có thể sẽ không thừa nhận
giọng nói đó v{ từ chối l{ sai thông tin.
1.1.5. Nhận dạng mặt người (Face recognition)
Hệ thống nhận diện khuôn mặt x|c định một c| nh}n bằng c|ch ph}n
tích hình ảnh, khuôn mẫu v{ đ|nh dấu c|c điểm đặc trưng trên gương mặt.
Có hai phương ph|p cơ bản để xử lý dữ liệu: video v{ hình ảnh nhiệt. Tiêu
chuẩn kỹ thuật video l{ dựa v{o hình ảnh chụp khuôn mặt của m|y camera.
Kỹ thuật hình ảnh nhiệt ph}n tích mô hình nhiệt ph|t sinh của c|c mạch m|u
dưới lớp da mặt.
Sự hấp dẫn của hệ thống sinh trắc học n{y l{ có thể hoạt động “hands =
free” (không sử dụng tay), dẫn đến hạn chế số lượng tường t|c giữa người v{
m|y móc. Tuy nhiên, hệ thống n{y không đ|ng tin cậy v{ m|y móc thì rất đắt
tiền. Ví dụ, nó sẽ không ph}n biệt được c|c cặp sinh đôi v{ sinh ba giống
13
nhau, Không nhận ra người sử dụng sau khi họ cắt tóc v{ không nhận ra
người thay đổi từ đeo kính th{nh không đeo kính.
1.1.6. DNA (Dioxyribo Nucleic Acid)
Thuật ngữ "DNA" viết tắt của Dioxyribo Nucleic Acid. DNA được tìm
thấy trong mọi tế b{o của mọi sinh vật, v{ nó chứa c|c thông tin thực hiện
c|c hoạt động của tế b{o. Kể từ khi ph}n tích được cấu trúc DNA của mỗi
người l{ ho{n to{n l{ độc nhất vô nhị, DNA được ph}n tích một c|ch rất
chính x|c để chứng minh việc nhận dạng. Do thử nghiệm rộng r~i v{ yêu cầu
thuận lợi về công nghệtiên tiến, tuy nó không phải l{ c|ch khoa học nhất để
tiết kiệm chi phí sinh trắc học, nhưng khi x|c định l{ cần thiết phải l{m thì
phương ph|p n{y l{ đ|ng tin cậy nhất.
1.2.HỆ THỐNG NHẬN DẠNG MẶT NGƯỜI
1.2.1. Bài toán nhận dạng mặt người và những khó khăn
1.2.1.1. Bài toán nhận dạng mặt người
Hệ thống nhận dạng mặt người l{ một hệ thống nhận v{o l{ một ảnh
hoặc một đoạn video (một chuỗi c|c ảnh). Qua xử lý tính to|n hệ thống x|c
định được vị trí mặt người trong ảnh (nếu có) v{ x|c định l{ người n{o
trong số những người hệ thống đ~ được biết (qua qu| trình học) hoặc l{
người lạ.
14
Hình 1.2: B{i to|n nhận dạng mặt người.
1.2.1.2. Những khó khăn của nhận dạng khuôn mặt
Khó khăn của b{i to|n nhận dạng mặt người có thể kể như sau:
1/. Tư thế, góc chụp: Ảnh chụp khuôn mặt có thể thay đổi rất nhiều bởi vì
góc chụp giữa camera v{ khuôn mặt. Chẳng hạn như: chụp thẳng, chụp xéo
bên tr|i 450hay xéo bên phải 450, chụp từ trên xuống, chụp từ dưới lên, v.v...),
với c|c tư thế kh|c nhau, c|c th{nh phần trên khuôn mặt như mắt, mũi,
miệng có thể bị khuất một phần hoặc thậm chí khuất hết.
2/. Sự xuất hiện hoặc thiếu một số th{nh phần của khuôn mặt: C|c đặc trưng
như: r}u mép, r}u h{m, mắt kính, v.v…, có thể xuất hiện hoặc không, vấn đề
n{y l{m cho b{i to|n c{ng trở nên khó hơn rất nhiều.
3/. Sự biểu cảm của khuôn mặt: Biểu cảm của khuôn mặt người có thể l{m
ảnh hưởng đ|ng kể lên c|c thông số của khuôn mặt. Chẳng hạn, cùng một
khuôn mặt một người, nhưng có thể sẽ rất kh|c khi họ cười hoặc sợ h~i,v.v...
4/. Sự che khuất: Khuôn mặt có thể bị che khuất bởi c|c đối tượng kh|c hoặc
c|c khuôn mặt kh|c.
15
5/. Hướng của ảnh: C|c ảnh của khuôn mặt có thể biến đổi rất nhiều với c|c
góc quay kh|c nhau của trục camera, chẳng hạnchụp với trục m|y ảnh
nghiêng l{m cho khuôn mặt bị nghiêng so với trục của ảnh.
6/. Điều kiện của ảnh: Ảnh được chụp trong c|c điều kiện kh|c nhau về:
chiếu s|ng, về tính chất camera (m|y kỹ thuật số, m|y hồng ngoại,v.v...), ảnh
hưởng rất nhiều đến chất lượng ảnh khuôn mặt.
1.2.2. Các ứng dụng liên quan đến nhận dạng mặt người.
B{i to|n nhận dạng mặt người có thể |p dụng rộng r~i trong nhiều
ứng dụng thực tế kh|c nhau. Đó chính l{ lý do m{ b{i to|n n{y hấp dẫn rất
nhiều nhóm nghiên cứu trong thời gian d{i. C|c ứng dụng liên quan đến
nhận dạng mặt người có thể kể như:
- Hệ thống ph|t hiện tội phạm: camera được đặt tại một số điểm công
cộng như: siêu thị, nh{ s|ch, trạm xe buýt, s}n bay,v.v... Khi ph|t hiện được
sự xuất hiện của c|c đối tượng l{ tội phạm, hệ thống sẽ gởi thông điệp về cho
trung t}m xử lý.
- Hệ thống theo dõi nh}n sự trong một đơn vị: gi|m s|t giờ ra v{o của
từng nh}n viên v{ chấm công.
- Hệ thống giao tiếp người m|y: thay thế việc tương t|c giữa người v{
m|y theo những c|ch truyền thống như: b{n phím, chuột,v.v...Thay v{o đó l{
sử dụng c|c giao tiếp trực quan: biểu cảm khuôn mặt, dấu hiệu, cử chỉ bằng
tay (visual input, visual interaction).
- Hệ thống tìm kiếm thông tin trên ảnh, video dựa trên nội dung (chỉ
mục theo người). Chẳng hạn như: kênh truyền hình CNN có một kho dữ liệu
video tin tức kh| lớn cần tìm kiếm nhanh những đoạn video n{o có G. Bush
hoặc Bin Laden.
- Các thệ thống bảo mật dựa trên thông tin trắc sinh học: mặt
người, vân tay,v.v... thay vì xác nhận mật khẩu, khóa,v.v...
16
1.2.3. Tổng quan kiến trúc hệ thống nhận dạng khuôn mặt
Hệ thống nhận dạng mặt người l{ hệ thống được thiết kế để tìm thông
tin của một người. Kỹ thuật nhận dạng l{ kiểm tra sự phù hợp dựa trên phép
so s|nh một – nhiều, cụ thể l{ tìm ra một người l{ ai trong số những người
đ~ được lưu trữ trong hệ thống dựa v{o thông tin khuôn mặt.
Đầu v{o của một hệ thống nhận dạng khuôn mặt l{ một hình ảnh hay
một đoạn băng Video. Đầu ra l{ một x|c định hay x|c minh của đối tượng
xuất hiện trong hình ảnh hoặc đoạn băng Video đó. Một số hướng tiếp cận
định nghĩa một hệ thống nhận dạng khuôn mặt gồm ba bước xử lý: ph|t hiện
khuôn mặt, trích rút đặc trưng v{ nhận dạng khuôn mặt.
Phát hiện khuôn
mặt
Trích rút đặc trưng
(Face extraction)
(Face detection)
Nhận dạng khuôn
mặt
(Face recognition)
Hình 1.3: Kiến trúc hệ thống nhận dạng mặt người.
Ph|t hiện khuôn mặt người( Face Detection) l{ một kỹ thuật m|y tính
để x|c định vị trí v{ kích thước của c|c khuôn mặt người trong c|c ảnh bất
kỳ. Kỹ thuật n{y nhận biết c|c đặc trưng của khuôn mặt v{ bỏ qua những thứ
kh|c như: tòa nh{, c}y cối, cơ thể...
Trích rút đặc trưng l{ trích chọn c|c đặc tính đặc trưng cho khuôn mặt
người từ dữ liệu v{o. Những đặc trưng n{y có thể l{ c|c vùng trên khuôn mặt,
c|c biến thể, góc cạnh, hay độ đo (như khoảng c|ch hai mắt…).
Bước cuối cùng l{ nhận dạng khuôn mặt. Trong chức năng nhận dạng
hệ thống sẽ thông b|o danh tính của đối tượng từ một cơ sở dữ liệu. Giai
đoạn n{y liên quan đến phương ph|p so s|nh, giải thuật ph}n lớp, độ đo
chính x|c.
1.2.3.1. Phát hiện khuôn mặt
17
Ng{y nay, một số ứng dụng nhận dạng khuôn mặt có thể không cần
bước ph|t hiện khuôn mặt. Khi đó những ảnh khuôn mặt được lưu trữ trong
cơ sở dữ liệu đ~ được chuẩn hóa.
Ví dụ như hệ thống dữ liệu lưu trữ hồ sơ tội phạm của cơ quan an
ninh, nếu có một vụ |n m{ cảnh s|t đ~ có được hộ chiếu hay chứng minh thư
của tội phạm thì việc nhận diện sẽ không cần bước ph|t hiện khuôn mặt vì
ảnh đầu v{o đ~ chuẩn hóa. Tuy nhiên, thông thường thì những hình ảnh đầu
v{o của hệ thống thị gi|c m|y tính thường chứa cả khuôn mặt v{ những đối
tượng kh|c nên bước ph|t hiện khuôn mặt l{ rất cần thiết. Đặc biệt l{ hệ
thống video gi|m s|t phải bao gồm ph|t hiện khuôn mặt, theo dõi khuôn
mặt, nhận dạng khuôn mặt.
Có nhiều nghiên cứu tìm phương ph|p x|c định khuôn mặt người, từ
ảnh x|m đến ng{y nay l{ ảnh m{u. Dựa v{o tính chất của c|c phương ph|p
x|c định
khuôn mặt người trên ảnh. C|c phương ph|p n{y được chia l{m bốn [9]
hướng tiếp cận chính. Ngo{i bốn hướng n{y, nhiều nghiên cứu có khi liên
quan đến không những một hướng tiếp cận m{ có liên quan nhiều hơn một
hướng chính:
-Hướng tiếp cận dựa trên tri thức: M~ hóa c|c hiểu biết của con người
về c|c loại khuôn mặt người th{nh c|c luật. Thông thường c|c luật mô tả
quan hệ của c|c đặc trưng.
- Hướng tiếp cận dựa trên đặc trưng không thay đổi: Mục tiêu c|c
thuật to|n đi tìm c|c đặc trưng mô tả cấu trúc khuôn mặt người m{ c|c đặc
trưng n{y sẽ không thay đổi khi tư thế khuôn mặt, vị trí đặt thiết bị thu hình
hoặc điều kiện |nh s|ng thay đổi.
- Hướng tiếp cận dựa trên so khớp mẫu: Dùng c|c mẫu chuẩn của
khuôn mặt người (c|c mẫu n{y được chọn lựa v{ lưu trữ) để mô tả cho
18
khuôn mặt người hay c|c đặc trưng khuôn mặt (c|c mẫu n{y phải chọn l{m
sao cho t|ch biệt nhau theo tiêu chuẩn m{ c|c t|c giả định ra để so s|nh). C|c
mối tương quan giữa dữ liệu ảnh đưa v{o v{ c|c mẫu dùng để x|c định
khuôn mặt người.
- Hướng tiếp cận dựa trên diện mạo: Tr|i ngược hẳn với so khớp mẫu,
c|c mô hình (hay c|c mẫu) được học từ một tập ảnh huấn luyện trước đó.
Sau đó hệ thống (mô hình) sẽ x|c định khuôn mặt người. Hay một số t|c giả
còn gọi hướng tiếp cận n{y l{ hướng tiếp cận theo phương ph|p học.
1.2.3.2. Trích chọn đặc trưng
Con người chúng ta có thể nhận diện khuôn mặt khi chúng ta được 5 tuổi. Đó
l{ một qu| trình xử lý tự động, riêng biệt trong bộ n~o người. Con người có
thể nhận ra người quen ngay cả khi họ đội mũ hoặc đeo kính, thậm chí họ
vừa để r}u. Chúng ta có thể nhận ra ảnh cưới của ông b{ mình khi họ mới 23
tuổi một c|ch dễ d{ng. Những xử lý n{y l{ bình thường đối với con người,
nhưng lại l{ th|ch thức đối với m{y tính. Thực sự thì vấn đề cốt lõi của nhận
dạng khuôn mặt l{ trích rút những thông tin từ bức ảnh. Qu| trình trích rút
đặc trưng được định nghĩa như l{ thủ tục trích ra những thông tin liên quan,
quan trọng từ một bức ảnh khuôn mặt. Những thông tin n{y phải có gi| trị
19
sử dụng cho bước x|c định đối tượng sau n{y vói một tỉ lệ sai số chấp nhận
được.
Số lượng đặc trưng
Hình 1.4: Hiệu năng giải thuật PCAtheo số lượng đặc trưng trích rút.
Qu| trình trích chọn đặc trưng cũng phải đảm bảo hiệu năng về thời
gian tính to|n v{ khả năng lưu trữ của m{y tính.Đầu ra của nó phải phù hợp
với bước ph}n lớp sau n{y. Trích rút đặc trưng bao gồm c|c bước: Giảm số
chiều, trích đặc trưng, chọn lọc đặc trưng. Giảm số chiều l{ một nhiệm vụ
quan trọng trong bất cứ một hệ thống nhận dạng mẫu n{o.Hiệu năng của
một bộ ph}n lớp phụ thuộc v{o số lượng ảnh mẫu, số đặc trưng v{ độ phức
tạp của bộ ph}n lớp. Tỷ lệ lỗi của một bộ ph}n lớp có thể không tăng khi số
lượng c|c đặc trưng tăng. Tuy nhiên, khi thêm đặc trưng có thể l{m giảm
hiệu năng của giải thuật ph}n lớp.Điều n{y có thể xảy ra khi số lượng mẫu
học nhỏ hơn so với số lượng đặc trưng.Một c|ch để giải quyết vấn đề n{y l{
số lượng mẫu học cho một lớp gấp 10 lần số đặc trưng. Do đó việc giữ số
lượng đặc trưng nhỏ nhất có thể l{ rất quan trọng.Giảm số đặc trưng bộ ph}n
lớp sẽ nhanh hơn v{ sử dụng ít bộ nhớ hơn.Hơn nữa, một bộ đặc trưng lớn
có thể g}y lỗi khi những chứa những đặc trưng không cần thiết, dư thừa.Số
20
- Xem thêm -