LỜI CẢM ƠN
Em xin trân trọng cảm ơn các thầy giáo, cô giáo trong Viện Công nghệ thông
tin, trường Đại học Công nghệ thông tin và truyền thông, Đại học Thái Nguyên
đã nhiệt tình giảng dạy và hết lòng giúp đỡ em trong quá trình học tập và
nghiên cứu đề tài.
Luận văn được hoàn thành tại trường Đại học Công nghệ thông tin và truyền
thông dưới sự hướng dẫn của TS Vũ Duy Linh. Em xin bày tỏ lòng kính trọng
và biết ơn sâu sắc tới thầy.
Em cũng xin chân thành cảm ơn các bạn đồng nghiệp phòng Khảo thí &
Đảm bảo chất lượng trường Đại học Hải Phòng đã tạo điều kiện giúp đỡ trong
quá trình hoàn thành luận văn này.
Sự quan tâm, giúp đỡ của gia đình và bạn bè, đặc biệt lớp Cao học K9C
trường Đại học Công nghệ thông tin và truyền thông đã cổ vũ, động viên em
trong suốt thời gian học tập và thực hiện đề tài.
Mặc dù có nhiều cố gắng song luận văn không thể tránh khỏi những thiếu
sót, tác giả mong nhận được sự đóng góp ý kiến của các thầy cô và các bạn.
Xin chân thành cảm ơn!
Thái Nguyên, tháng 01 năm 2013
Tác giả
Nguyễn Thị Hương
2
LỜI CAM ĐOAN
Tôi xin cam đoan luận văn “ Hệ thống xác định & đánh giá trạng thái
mắt người ” là do tôi tự tìm hiểu và được hoàn thành dưới sự hướng dẫn của
thầy giáo TS Vũ Duy Linh
3
MỤC LỤC
MỞ ĐẦU...........................................................................................................1
CHƯƠNG I. TỔNG QUAN VỀ XỬ LÝ ẢNH VÀ BÀI TOÁN XÁC ĐỊNH
MẶT NGƯỜI TRONG ẢNH SỐ......................................................................3
1.1. Xử lý ảnh và các vấn đề cơ bản trong xử lý ảnh........................................3
1.1.1. Xử lý ảnh là gì?........................................................................................3
1.1.2. Các vấn đề cơ bản trong xử lý ảnh...........................................................4
1.2. Chuẩn sinh trắc học ( Biometric )..............................................................7
1.2.1. Định nghĩa chuẩn sinh trắc học :..............................................................7
1.2.2. Ứng dụng của chuẩn sinh trắc học...........................................................7
1.3. Bài toán xác định mặt người trong ảnh số...............................................10
1.3.1. Giới thiệu về bài toán xác định mặt người trong ảnh số........................10
1.3.2. Định nghĩa bài toán xác định mặt người................................................10
1.3.3. Các phương pháp chính xác định mặt người..........................................10
1.4. Ưu điểm của việc xác định vị trí mắt.......................................................11
CHƯƠNG 2. CÁC PHƯƠNG PHÁP XÁC ĐỊNH VỊ TRÍ MẮT NGƯỜI
TRÊN KHUÔN MẶT......................................................................................13
2.1. Xác định tọa độ mắt bằng cách sử dụng các so sánh mẫu.......................14
2.1.1. Phương pháp...........................................................................................14
Bằng cách sử dụng hai mô hình.......................................................................14
2.1.2. Những thuận lợi và khó khăn xác định vị trí mắt khi sử dụng phương
pháp so sánh mẫu.............................................................................................19
2.2. Xác định tọa độ mắt sử dụng phương pháp Moments.............................19
2.3. Xác định tọa độ mắt bằng cách sử dụng phương pháp chiếu...................26
2.4. Xác định tọa độ mắt sử dụng phương pháp Knowledge..........................39
CHƯƠNG 3. XÂY DỰNG CHƯƠNG TRÌNH VÀ CÀI ĐẶT THỬ
NGHIỆM..........................................................................................................40
4
3.1. Giới thiệu về Matlab................................................................................40
3.2. Thuật toán để phát hiện vị trí của mắt cho hình ảnh sắc nét....................40
3.3. Mô tả các CSDL dùng cho thực nghiệm..................................................46
3.3.1. CSDL ORL.............................................................................................46
3.3.2. CSDL FERET.........................................................................................47
3.3.3. CSDL SIMILAR....................................................................................48
3.3.4. CSDL BIOID.........................................................................................49
3.4. Phương pháp đánh giá độ chính xác:.......................................................50
3.5. Hệ thống đánh giá trạng thái mắt người...................................................52
3.6. Cấu trúc hệ thống.....................................................................................56
KẾT LUẬN......................................................................................................59
TÀI LIỆU THAM KHẢO...............................................................................60
5
DANH MỤC CÁC HÌNH VẼ, ẢNH CHỤP
Số hiệu
hình vẽ
Tên hình vẽ
Trang
1.1
1.2
Quá trình xử lý ảnh
Các giai đoạn trong xử lý ảnh
1.3
Các điểm trên khuôn mặt
3
3
12
2
2.1
2.2
2.3
2.4
2.5
2.6
2.7
2.8
2.9
2.10
2.11
2.12
2.13
2.14
2.15
2.16
2.17
2.18
2.19
2.20
2.21
2.22
2.23
3.1
3.2
3.3
3.4
3.5
3.6
3.7
Kết quả xác định các thông số khuôn mặt
Tìm kiếm trung tâm mắt sử dụng phương pháp so sánh mẫu
Các biến thể của các mẫu dùng xác định vị trí mắt
Kết quả xác định vị trí của vùng mắt
Kết quả xác định vị trí của mắt bằng việc sử dụng mẫu b4
Trích chọn vùng mắt trái bằng cách xử lý hai giai đoạn
Xác định tọa độ trung tâm trên hình ảnh nhị phân
Xác định tọa độ trung tâm dựa trên hai phương pháp
Ảnh khuôn mặt, cho mà dự toán tọa độ mắt là sai
Ví dụ ước tính chính xác của tọa độ mắt
Sử dụng các thành phần I2 để xác định trung tâm mắt
Thủ tục xác định tọa độ của mắt (biến thể "a").
Chức năng hoạt nghiệm
Kết quả xác định vị trí mắt sử dụng phương pháp chiếu
Cửa sổ hàm W cho các phiên bản khác nhau của phép quay đầu
Hàm S và F cho các phiên bản khác nhau cảu phép quay đầu
Kết quả dùng phương pháp đơn gian hóa
Một số kết quả xác định tọa độ mắt của CSDL ỎL
Mô hình khuôn mặt được sử dụng để thử nghiệm
Tính toán và xác minh tọa độ của mắt
Kết quả tính toán của mắt dòng vị trí trong mỗi nửa mặt
Bám sát vị trí của dòng mắt
Vị trí của dòng mắt trong mỗi nửa mặt.
Tính toán của mắt phối hợp trong chuỗi video
Sơ đồ khối của phương pháp
Kết quả thuật toán xác định vị trí mắt người
Một số kết quả khác
CSDL ORL
Cơ sở dữ liệu hình ảnh khuôn mặt FERE
Mặt hình ảnh cơ sở dữ liệu tương tự
Cơ sở dữ liệu hình ảnh khuôn mặt BIOID
13
14
15
16
17
18
19
21
22
23
25
28
28
30
31
32
32
33
34
34
35
38
38
39
41
45
45
46
47
49
49
6
3.8
3.9
3.10
3.11
3.12
3.13
3.14
Trung tâm phối hợp mắt và mối quan hệ giữa chúng
Định vị trí của mắt trên CSDL FERET
Xác định vị trí của mắt trên CSDL BIOID
Giai đoạn tỉnh táo sắp ngủ và ngủ
Đánh giá hướng quay theo vị trí mắt người
Hệ thống đánh giá trạng thái mắt người
Một ví dụ về việc đánh giá trạng thái của mắt
50
51
51
53
55
57
58
MỞ ĐẦU
Thông tin con người thu nhận từ thế giới bên ngoài, đến hơn 80% được
ghi nhận bằng mắt tức là ở dạng ảnh. Vì vậy xử lý ảnh là một ngành khoa học
đã, đang và sẽ phát triển mạnh có ứng dụng rộng rãi trong khoa học và đời
sống thực tiễn như vẽ bản đồ, trong lĩnh vực quảng cáo, siêu thị, trong quân
sự….
Xác định mắt người trên khuôn mặt là một kỹ thuật máy tính để xác
định các vị trí và các kích thước của mắt người trong các ảnh bất kỳ (ảnh kỹ
thuật số). Nhận dạng mắt người là một trong những công việc cơ sở chủ yếu
cho việc căn chỉnh mặt người và nhận dạng mặt người. Việc nhận dạng mắt
người này đang đối mặt với nhiều thách thức khác nhau như hướng nhìn, biểu
hiện cảm xúc của mặt người thay đổi và các điều kiện ánh sáng khác nhau
thay đổi. Hệ thống nhận dạng làm việc theo cơ chế so sánh ảnh mặt người đầu
vào với các ảnh mặt người được lưu trữ trong CSDL(Face Recognition
System). Công nghệ nhận dạng mặt người là một trong những lĩnh vực phát
7
triển nhanh nhất trong các hệ thống sinh trắc học. Công nghệ sử dụng khuôn
mặt để nhận dạng và điểm đặc biệt là có thể thực hiện việc nhận dạng mà
không cần sự tương tác với người như 1 số công nghệ khác(vân tay, con
ngươi…).
Ngày nay công nghệ nhận dạng mặt người được đưa vào sử dụng trong
nhiều lĩnh vực trong cuộc sống như truy tìm tội phạm, đảm bảo an ninh, hộ chiếu
điện tử… Biometric là một phương pháp nhận ra danh tánh của một người dựa
trên Physiological hoặc hành vi đặc trưng,các tính năng đo được mặt, dấu vân
tay, bàn tay geometry, iris, retinal, giọng nói… biometric xác thực ngày càng
được sử dụng trong các lĩnh vực như ngân hàng, bán lẻ, quốc phòng, sản xuất, y
tế các ngành công nghiệp, chứng khoán, khu vực công, sân bay an ninh…Sự
phát triển của biometric trên cơ sở sử dụng mặt người ngày càng lớn.
Xác định vị trí khuôn mặt là 1 trong những điều kiện quan trọng nhất
trong hệ thống nhận dạng mặt người. Hiệu suất làm việc của hệ thống phụ
thuộc vào việc xác định chính xác vị trí mặt người trong ảnh ở đầu vào cũng
như việc xác định vị trí mặt người khi xây dựng cơ sở dữ liệu cho hệ thống.
Xác định chính xác vị trí mắt người giúp cho các phương pháp xử lý
ảnh mặt người được dễ dàng hơn. Ví dụ sau khi xác định được vị trí mắt
người có thể sử dụng để xác định đường đối xứng của khuôn mặt, xây dựng
model của khuôn mặt, sử dụng trong các bài toán đánh giá trạng thái của mắt
người, chuẩn hóa khuôn mặt theo chuẩn Sinh trắc học.
Đó là lý do mà em chọn đề tài “ Hệ thống xác định & đánh giá trạng thái
mắt người ”.
Luận văn được trình bày gồm có 3 chương:
Chương 1 . Tổng quan về xử lý ảnh và bài toán xác định mặt người.
Chương 2 . Các phương pháp xác định vị trị mắt người
8
Gồm có : 4 phương pháp
1. Xác định tọa độ mắt sử dụng mẫu so sánh.
2. Xác định tọa độ mắt sử dụng phương pháp Moments.
3. Xác định tọa độ mắt sử dụng phương pháp chiếu.
4. Xác định tọa độ mắt sử dụng phương pháp Knowlegde.
Chương 3 . Xây dựng chương trình và cài đặt
9
CHƯƠNG I. TỔNG QUAN VỀ XỬ LÝ ẢNH VÀ BÀI TOÁN XÁC
ĐỊNH MẶT NGƯỜI TRONG ẢNH SỐ
1.1.
Xử lý ảnh và các vấn đề cơ bản trong xử lý ảnh.
1.1.1. Xử lý ảnh là gì?
Quá trình xử lý ảnh được xem như là quá trình thao tác ảnh đầu vào
nhằm cho ra kết quả mong muốn. Kết quả đầu ra của một quá trình xử lý ảnh
có thể là một ảnh “tốt hơn” hoặc một kết luận.
Ảnh
Xử lý ảnh
Ảnh “tốt hơn”
Kết luận
Hình 1.1 Quá trình xử lý ảnh
Mục đích của xử lý ảnh gồm:
-
Biến đổi ảnh, làm tăng chất lượng ảnh.
-
Tự động nhận dạng ảnh, đoán nhận ảnh, đánh giá các nội dung của
ảnh.
Nhận biết và đánh giá được nội dung của ảnh là để phân biệt được đối
tượng này với đối tượng khác, từ đó ta có thể mô tả được ảnh ban đầu. Có
một số phương pháp nhận dạng như: nhận dạng cạnh của một số đối tượng
trên ảnh, tách cạnh, phân đoạn hình ảnh …. Các kỹ thuật này được ứng dụng
nhiều trong y học như: xử lý tế bào, nhiễm sắc thể; nhận dạng chữ viết trong
văn bản…
Thu nhận ảnh
(Scanner, Camera,
Senssor )
Tiền
Trích chọn
xử lý
đặc điểm
lylý
Hậu xử lý
Hệ quyết định
Lưu trữ
Đối sánh rút
ra kết luận
10
Hình 1.2: Các giai đoạn trong xử lý ảnh
1.1.2. Các vấn đề cơ bản trong xử lý ảnh
* Ảnh và điểm ảnh:
- Điểm ảnh được xem như là dấu hiệu hay cường độ sáng tại một tọa độ
trong không gian của đối tượng ảnh.
- Ảnh được xem như là tập hợp các điểm ảnh. Ảnh được biểu diễn bởi
một mảng số thực hai chiều (Ii j) có kích thước (m x n), trong đó mỗi phần tử Ii
j
(i = 1…m; j = 1…n) biểu đồ mức xám của ảnh tại vị trí (i, j) tương ứng.
Ảnh được gọi là ảnh nhị phân nếu các giá trị chỉ nhận 0 hoặc 1.
* Mức xám: Mức xám là kết quả sự mã hóa tương ứng một cường độ
sáng của mỗi điểm ảnh với một giá trị số - kết quả của quá trình lượng hóa.
Cách mã hóa thường dùng là 16, 32 hay 64 mức, mã hóa 256 mức là phổ
dụng nhất.
*
Đối tượng ảnh: Trong quá trình xử lý ảnh, một ảnh được thu nhận vào
máy phải được mã hóa, vì vậy ảnh phải được lưu trữ thế nào sao cho các ứng
dụng khác nhau có thể thao tác trên các loại dữ liệu này. Một số dạng ảnh đã
được chuẩn hóa như: GIF, BMP, PCX,...; mỗi kiểu lưu trữ ảnh đều có điểm
riêng. Tùy theo vùng các giá trị xám của điểm ảnh mà các ảnh được phân chia
ra thành ảnh màu, ảnh xám, ảnh nhị phân. Khi trên một ảnh chỉ có giá trị 0
hoặc 1 thì ta nói đó là ảnh nhị phân hoặc ảnh đen trắng và các điểm ảnh của nó
gọi là điểm ảnh nhị phân. Việc đếm các điểm ảnh trên ảnh nhị phân đã qua biến
đổi tạo điều kiện thuận lợi cho việc tách ra các đặc tính. Để tạo ra một ảnh nhị
phân từ ảnh đa cấp xám ta dùng phương pháp tách ngưỡng. Các giá trị nằm ở
trên ngưỡng được gán giá trị 1 còn ở bên dưới ngưỡng thì được gán giá trị 0.
- Kỹ thuật tách ngưỡng: Ngưỡng trong kỹ thuật tách ngưỡng thường
được cho bởi người sử dụng. Kỹ thuật tìm, tách ngưỡng tự động nhằm tìm ra
11
ngưỡng một cách tự động dựa vào Histogram theo nguyên lý trong vật lý là
vật thể tách làm 2 phần nếu tổng độ lệch trong từng phần là tối thiểu.
Giả sử ta có ảnh I ~ kích thước m x n; G ~ số mức xám của ảnh kể cả
khuyết thiếu; t(g) ~ số điểm ảnh có mức xám ≤ g.
m( g )
1 g
i.h(i) ~ mômen quán tính trung bình có mức xám ≤ g
t ( g ) i 0
g a f (g)
Hàm f: f ( g )
t(g)
2
m( g ) m(G 1)
m n t(g )
{f ( g )}
Tìm sao cho: f ( g ) 0mg ax
G 1
Nắn chỉnh biến dạng
Ảnh thu nhận thường bị biến dạng do các thiết bị quang học và điện tử.
Để khắc phục, người ta sử dụng các phép chiếu, các phép chiếu thường được
xây dựng trên tập các điểm điều khiển.
Khử nhiễu
Có hai loại nhiễu cơ bản trong quá trình thu nhận ảnh:
Nhiễu hệ thống: là nhiễu có quy luật có thể khử bằng các phép biến đổi.
Nhiễu ngẫu nhiên: là dạng vết bẩn không rõ nguyên nhân nên có thể khắc
phục bằng các phép lọc.
Chỉnh mức xám
Nhằm khắc phục tính không đồng đều của hệ thống gây ra, thông thường
có hai hướng tiếp cận:
Giảm số mức xám: thực hiện bằng cách nhóm các mức xám gần nhau thành
một bó. Trường hợp chỉ có hai mức xám thì chính là chuyển về ảnh đen trắng.
Tăng số mức xám: thực hiện nội suy ra các mức xám trung gian bằng kỹ
thuật nội suy. Kỹ thuật này nhằm tăng độ mịn của ảnh.
Phân tích ảnh
12
Là khâu quan trọng trong quá trình xử lý ảnh để tiến tới hiểu ảnh.
Trong phân tích ảnh việc trích chọn đặc điểm là một bước quan trọng, các đặc
điểm của đối tượng được trích chọn tùy theo mục đích nhận dạng trong quá
trình xử lý ảnh. Một số đặc điểm của ảnh như: đặc điểm không gian, đặc điểm
biến đổi, đặc điểm biên và đường biên.
Nhận dạng ảnh
Nhận dạng ảnh là quá trình liên quan đến các mô tả đối tượng mà người
ta muốn đặc tả nó. Quá trình nhận dạng thường đi sau quá trình trích chọn các
đặc tính chủ yếu của đối tượng. Nhận dạng tự động, mô tả đối tượng, phân
loại và phân nhóm các mẫu là những vấn đề quan trọng trong thị giác máy,
được ứng dụng trong nhiều ngành khoa học khác nhau.
Hệ thống nhận dạng tự động bao gồm ba khâu tương ứng với ba giai
đoạn chủ yếu sau: thu nhận dữ kiệu và tiền xử lý, biểu diễn dữ liệu, nhận dạng
và ra quyết định. Bốn cách tiếp cận khác nhau trong lý thuyết nhận dạng là:
Đối sánh mẫu dựa trên các đặc trưng được trích chọn, phân loại thống kê, đối
sánh cấu trúc, phân loại dựa trên mạng nơron nhân tạo.
Nén ảnh
Lượng thông tin để biểu diễn cho một ảnh là rất lớn, vì vậy nén ảnh
nhằm giảm thiểu không gian lưu trữ, thường được tiến hành theo cả hai
khuynh hướng là nén có bảo toàn và nén không bảo toàn thông tin. Nén
không bảo toàn thì thường có khả năng nén cao hơn nhưng có khả năng phục
hồi kém hơn. Các cách nén ảnh:
Nén ảnh thống kê: Dựa vào việc thống kê tần xuất xuất hiện của giá trị các
điểm ảnh, trên cơ sở đó mà có chiến lược mã hóa thích hợp. Ví dụ: mã nén
*.TIF.
13
Nén ảnh không gian: Dựa vào vị trí không gian của các điểm ảnh để tiến
hành mã hóa. Kỹ thuật này dựa vào sự giống nhau của các điểm ảnh trong các
vùng gần nhau. Ví dụ: mã nén *.PCX.
Nén ảnh sử dụng phép biến đổi: Tiếp cận theo hướng nén không bảo toàn,
kỹ thuật này thường nén hiệu quả hơn. Ví dụ: nén *.JPG.
Nén ảnh Fractal: sử dụng tính chất Fractal của các đối tượng ảnh, thể hiện
sự lặp lại của các chi tiết. Kỹ thuật nén sẽ tính toán để chỉ cần lưu trữ phần
gốc của ảnh và quy luật sinh ra ảnh theo nguyên tắc Fractal.
1.2.
Chuẩn sinh trắc học ( Biometric )
1.2.1. Định nghĩa chuẩn sinh trắc học :
Công nghệ Sinh trắc học (Biometric) – là một công nghệ sử dụng
những thuộc tính vật lý hoặc các mẫu hành vi, các đặc điểm sinh học đặc
trưng như dấu vân tay, mẫu mống mắt, giọng nói, khuôn mặt, dáng đi,… để
nhận diện con người
1.2.2. Ứng dụng của chuẩn sinh trắc học
Vân tay
Đầu thế kỷ XIX, phát hiện khoa học vẫn còn được công nhận bởi hai
tính năng quan trọng: Đầu tiên, hai phong cách khác nhau sống núi mẫu vân
tay (Ridge Hoa văn) là khác nhau từ khác có dấu vân tay sống núi của phong
cách sống giống nhau. Nghiên cứu này giúp nhận dạng dấu vân tay tại có thể
có của tội phạm áp dụng chính thức. Thế kỷ XX, các sixties, như là máy tính
có thể xử lý đồ họa, người ta bắt đầu xem xét các máy tính để xử lý các dấu
vân tay, vân tay tự động AFIS Hệ thống xác định trong các lĩnh vực thực thi
pháp luật của nghiên cứu, ứng dụng này bắt đầu tới.
Một yêu cầu hệ thống sinh trắc học tốt một cách nhanh chóng và hiệu
quả trong thời gian thực để hoàn thành quá trình nhận dạng của nó. Tất cả các
hệ thống sinh trắc học bao gồm các quá trình điều trị một số sau đây: mua lại,
14
giải mã, so sánh và kết hợp. Các dấu vân tay cùng công nhận chế biến, bao
gồm chụp ảnh dấu vân tay, vân tay xử lý hình ảnh, tính năng khai thác, tính
năng phù hợp hơn với quá trình. Những lợi thế của việc sử dụng phương pháp
dấu vân tay được, đáng tin cậy của nó thuận tiện và dễ dàng được chấp nhận.
Võng mạc của mắt
Phân tích các đặc tính phức tạp và độc đáo của công nghệ sinh trắc
học mắt được chia thành hai khu vực riêng biệt: các công nghệ nhận dạng
mống mắt, và công nhận iris công nghệ. Iris được bao quanh bởi một lớp mô
màu mống mắt. Iris công nhận hệ thống sử dụng camera để chụp mẫu, sau đó
các dữ liệu thu thập bởi phần mềm này để so sánh với các mẫu lưu trữ. Là
giác mạc mắt ở dưới cùng của lớp tế bào máu. Giác mạc là quét để kiểm tra
mật độ thấp hồng ngoại để nắm bắt đặc điểm độc đáo của giác mạc này.
Chúng tôi biết các khu vực ở trung tâm của giác mạc đều được kiểm tra, các
tế bào máu do đó sẽ là phương thức duy nhất của capturing. Iris công nghệ
nhận dạng sinh trắc học được coi là tốt nhất. Tuy nhiên, mặc dù độ chính xác
cao, mọi người thường nghĩ rằng công nghệ này là không thuận tiện. Vì vậy,
rất khó để có được chấp nhận phổ quát của người dùng cuối. Giác mạc đã
được quét bằng máy quét cần thiết để đọc thông tin giác mạc trong thẳng
đứng cố định của nó. Scanner cho mắt và mù mắt giác mạc và với người dân
là không hợp lệ.
Bề mặt lỗ
Hệ thống nhận dạng khuôn mặt bằng cách phân tích các tính năng mặt
của hình dạng độc đáo, mô hình và vị trí để xác định người dân. Về cơ bản có
hai cách để xử lý dữ liệu: máy ảnh và lập bản đồ nhiệt. Standard camera video
được xây dựng từ máy ảnh để chụp hình ảnh khuôn mặt. Phân tích kỹ thuật
của nhiệt vẽ các mạch máu dưới da xảy ra các mô hình nhiệt. Việc kháng cáo
của sinh trắc học là nó có thể được con người-máy tính tương tác. Tuy nhiên,
15
hệ thống này là rất không đáng tin cậy và đắt tiền. Ví dụ, nó không thể phân
biệt giữa các cặp sinh đôi hoặc sinh ba, không thể nhận ra những lý lẽ làm
người sử dụng cuối cùng không thể xác định được kính không đeo kính với
cùng một người.
Âm thanh
Xác định được dựa trên đặc điểm sinh lý âm thanh và hành vi sử dụng
của người phát biểu của giọng nói và các mẫu ngôn ngữ. Nó khác với công
nghệ nhận dạng giọng nói không phải là để nói những lời tự được xác định.
Nhưng chỉ có thông qua phân tích các tính năng thoại, chẳng hạn như tần số
của âm thanh để xác định các loa. Bài phát biểu công nhận công nghệ cho
phép mọi người có thể có khả năng nói tiếng nói để kiểm soát truy cập vào
khu vực hạn chế. Ví dụ, điện thoại quay số ngân hàng, các dịch vụ cơ sở dữ
liệu, mua sắm hoặc voice mail, và truy cập đến các thiết bị bí mật. Một người
bị cảm lạnh có thể sai một từ chối công nhận không sử dụng hệ thống nhận
dạng giọng nói.
. Chữ ký
Chữ ký công nhận, còn được gọi là việc xác định chữ ký cơ khí. Nó
phân tích các cây bút di chuyển, chẳng hạn như tăng tốc, áp lực, chỉ đạo,
chiều dài của đột quỵ, chứ không phải là chữ ký của các hình ảnh bản thân.
Sự khác biệt chính giữa chữ ký cơ học của các bộ phận khác nhau của chữ ký,
một số, phong tục khác là khác nhau trong mỗi chữ ký. Việc sử dụng chữ ký
đã được chấp nhận rộng rãi, trong các ứng dụng khác nhau, từ Tuyên ngôn
Độc lập vào thẻ tín dụng có thể được nhìn thấy. Tuy nhiên, vấn đề công nhận
chữ ký vẫn còn tồn tại trong quá trình đạt được sự công nhận để sử dụng theo
cách thức và ký đo lặp. Hệ thống kiểm soát đã được lập trong một số cách để
chấp nhận thay đổi.
16
1.3.
Bài toán xác định mặt người trong ảnh số.
1.3.1. Giới thiệu về bài toán xác định mặt người trong ảnh số
Trong những năm qua, có rất nhiều công trình nghiên cứu về bài toán
nhận dạng mặt người. Các nghiên cứu đi từ bài toán đơn giản, từ việc nhận
dạng một mặt người trong ảnh đen trắng cho đến mở rộng cho ảnh mầu và có
nhiều mặt người trong ảnh. Đến nay các bài toán xác định mặt người đã mở
rộng với nhiều miền nghiên cứu như nhận dạng khuôn mặt, định vị khuôn
mặt, xác định trạng thái mắt người, theo dõi mặt người hay nhận dạng cảm
xúc mặt người…
Phát hiện mặt người trong ảnh là phần đầu tiên của một hệ thống nhận
dạng mặt người. Các hệ thống nhận dạng khuôn mặt được bắt đầu xây dựng
từ những năm 1970, tuy nhiên do còn hạn chế về các luật xác định mặt người
nên chỉ được áp dụng trong một số ứng dụng như nhận dạng thẻ căn cước. Nó
chỉ được phát triển mạnh mẽ từ những năm 1990 khi có những tiến bộ trong
công nghệ video và ngày nay thì các ứng dụng của xác định mặt người đã trở
nên phổ biến trong cuộc sống.
1.3.2. Định nghĩa bài toán xác định mặt người.
Xác định khuôn mặt người là một kỹ thuật máy tính để xác định các vị trí
và kích thước của các khuôn mặt người trong các ảnh số bất kì. Kỹ thuật này
nhận biết các đặc trưng của khuôn mặt và bỏ qua những thứ khác xung quanh
đối tượng như: tòa nhà, cây cối, cơ thể…
1.3.3. Các phương pháp chính xác định mặt người
Dựa vào tính chất của các phương pháp xác định mặt người trên ảnh, các
phương pháp này được chia thành bốn loại chính, tương ứng với bốn hướng
tiếp cận khác nhau. Ngoài ra cũng có rất nhiều nghiên cứu mà phương pháp
xác định mặt người không chỉ dựa vào một hướng mà có liên quan đến nhiều
hướng.
17
Hướng tiếp cận dựa trên tri thức: Dựa vào các thuật toán, mã hóa các
đặc trưng và quan hệ giữa các đặc trưng của khuôn mặt thành các luật.
Đây là hướng tiếp cận theo kiểu top-down
Hướng tiếp cận dựa trên đặc trưng không thay đổi: Xây dựng các thuật
toán để tìm các đặc trưng của khuôn mặt mà các đặc trưng này không
thay đổi khi tư thế khuôn mặt hay vị trí đặt camera thay đổi.
Hướng tiếp cận dựa trên so sánh khớp mẫu: Dùng các mẫu chuẩn của
khuôn mặt (các mẫu này đã được chọn và lưu trữ) để mô tả các khuôn
mặt hay các đặc trưng của khuôn mặt (các mẫu này được chọn tách biệt
theo tiêu chuẩn đã được các tác giả đề ra để so sánh). Phương pháp này
có thể dùng để xác định vị trí hay dò tìm khuôn mặt trên ảnh.
Hướng tiếp cận dựa trên diện mạo: Trái ngược với hướng tiếp cận dựa
trên khuôn mẫu, các mô hình (hay các mẫu) sẽ được học từ một tập ảnh
huấn luyện mà thể hiện tính chất tiêu biểu của sự xuất hiện của mặt
người trong ảnh. Sau đó hệ thống (mô hình) sẽ xác định mặt người.
Phương pháp này còn được biết đến với tên gọi tiếp cận theo các phương
pháp học máy.
1.4.
Ưu điểm của việc xác định vị trí mắt
Trích những đặc tính khuôn mặt
Đối với việc rút trích những đặc tính, mắt là đặc tính quan trọng của
khuôn mặt. Do đó, chúng ta cần nghiên cứu để tìm và xác định nó. Lý do mà
chúng ta phải nghiên cứu nó là vì:
- Mắt là nguồn thông tin quan trọng về tình trạng của con người.
- Sự xuất hiện của mắt là ít thay đổi nhất trên khuôn mắt.
- Việc biết vị trí của mắt cho phép chúng ta chỉ ra được tỷ lệ của khuôn mặt.
- Việc định vị chính xác mắt giúp ta chỉ ra được những đặc tính khác
trên khuôn mặt.
18
Từ trung tâm của mắt, chúng ta có thể xác định được những điểm
chuẩn khác.
Hình 1.3 Các điểm trên khuôn mặt
Trong đó : Khuôn mặt có 27 điểm, 13 điểm trích ra từ hình ảnh (màu xanh),
14 điểm suy luận ra (màu đỏ)
Hiện nay, có rất nhiều bài toán liên quan tới việc xác định vị trí mắt
người: Xác định trạng thái mắt nhắm hay mở (hệ thống đặt trên ô tô để kiểm
soát lái xe, hay hệ thống kiểm tra bảo vệ ngủ tại các cơ quan quan trọng, xác
định hướng nhìn của khuôn mặt dựa trên vị trí mắt, xây dựng model khuôn
mặt…
19
CHƯƠNG 2. CÁC PHƯƠNG PHÁP XÁC ĐỊNH VỊ TRÍ MẮT NGƯỜI
TRÊN KHUÔN MẶT
Trong chương này sẽ giới thiệu một số phương pháp phát hiện mắt và
xác định tọa độ của mắt trung tâm.
Mắt là một trong những chỗ tiếp xúc với những nơi biến dạng trên một
khuôn mặt (ví dụ như bằng cách biểu hiện trên khuôn mặt) và đặc biệt : một
phần khác đối mặt với thay đổi như vậy sắc nét. Tìm kiếm mắt là thao tác
chính,nó phụ thuộc tính toán thêm tham số mặt. Ví dụ về các thông số, mà có
thể xác định là: Tam giác nơi kiểm tra một khuôn mặt, đặc điểm trên khuôn
mặt, tọa độ của các mắt trung tâm và trục đối xứng khuôn mặt, khoảng cách
giữa các trung tâm của mắt.
Hình 2 . Kết quả xác định các thông số khuôn mặt
Trục đối xứng khuôn mặt có thể được xác định từ ví dụ trên cơ sở tọa
độ của các mắt trung tâm hay góc của mắt. Tuy nhiên, hiệu quả của phương
pháp phát hiện mắt (hoặc xác định tọa độ của mắt góc) là giới hạn thông qua
đôi mắt có thể đóng cửa hoặc ảnh hưởng của kính.
Có rất nhiều phương pháp tiếp cận được biết đến phát hiện mắt và xác
định tọa độ của các mắt trung tâm, dưới đây em chỉ mô tả cơ bản một số thuật
toán mà dựa trên:
So sánh mẫu
Phương pháp Moments
Phương pháp chiếu
Phương pháp Knowledge
20
2.1.
Xác định tọa độ mắt bằng cách sử dụng các so sánh mẫu
2.1.1. Phương pháp
Bằng cách sử dụng hai mô hình, một trong những nơi có thể chính xác
bản địa hoá mắt trên khuôn mặt. Ví dụ về cách tiếp cận như vậy cho thấy trên
hình 2.1 ta thấy:
1- Hình ảnh ban đầu
2- Mẫu của một phần trung tâm của khuôn mặt
3- Mẫu mắt trái của con người
4- Kết quả của địa phương hoá khu vực mặt từ mẫu 2
5- Vùng mặt, nơi mắt đã tìm thấy và kết quả xác định vị trí của mắt trái
6- Xác định mắt trung tâm bằng cách sử dụng đường chéo của hình
chữ nhật để mô tả khu vực xác định vị trí mắt.
Hình 2.1 Tìm kiếm trung tâm mắt sử dụng phương pháp so sánh mẫu
Trong ví dụ này, mắt trung tâm là giao điểm đường chéo của hình chữ
nhật trên khu vực xác định vị trí mắt. Đây cũng là trung tâm của hình chữ
nhật - điểm này được đặt ở giữa của chiều rộng và chiều cao của hình chữ
nhật. Từ kết quả này, tính chính xác độ tính toán tọa độ của mắt phụ thuộc vào
độ chính xác của việc trích vùng mắt và đối xứng của vùng liên quan với con
người được xác định vị trí mắt. Mặt khác, tính chính xác của trích chọn của
vùng mắt và đối xứng của nó phụ thuộc vào chất lượng của các mẫu và thích
nghi với mắt trên hình ảnh đưa vào.
- Xem thêm -