TRƯỜNG ĐẠI HỌC LẠC HỒNG
KHOA CÔNG NGHỆ THÔNG TIN
----------
BÁO CÁO
NGHIÊN CỨU KHOA HỌC
ĐỀ TÀI:
NGHIÊN CỨU CÔNG NGHỆ NHẬN
DIỆN KHUÔN MẶT KAIROS API VÀ ÁP
DỤNG XÂY DỰNG PHẦN MỀM ĐIỂM
DANH SINH VIÊN
SVTH : ĐINH HỒNG ÂN
GVHD :Th.S TẠ NGUYỄN
BIÊN HÒA, THÁNG 11/2017
i
LỜI CÁM ƠN
Tôi xin chân thành cám ơn các giảng viên trường Đại Học Lạc Hồng, các thầy
cô khoa Công nghệ Thông tin đã giảng dạy và hướng dẫn tôi trong suốt thời gian tôi
theo học tại trường.
Tôi xin gởi lời cám ơn đến thạc sĩ Tạ Nguyễn, là giáo viên đã hướng dẫn tôi
hoàn thành đề tài nghiên cứu khoa học này.
Tôi cũng xin gởi lời cám ơn đến thạc sĩ, giáo viên phản biện đã góp ý giúp tôi
hoàn thiện chương trình hơn.
Tôi xin cám ơn các thầy, các cô trong khoa Công nghệ Thông tin đã có những
ý kiến đóng góp trong các buổi báo cáo tiến độ.
Ngoài ra tôi xin cám ơn thầy Nguyễn Minh Phúc, giáo viên chủ nhiệm lớp
13SE111 và các bạn trong lớp cùng toàn thể gia đình và người thân đã giúp đỡ, động
viên tôi trong quá trình thực hiện đề tài này.
Với vốn kiến thức còn hạn chế cùng những điều kiện khách quan không cho
phép, đề tài của tôi khó tránh khỏi những thiếu sót cũng như chưa đáp ứng đầy đủ các
yêu cầu. Do đó tôi hy vọng tiếp tục nhận được những ý kiến đóng góp và hướng dẫn của
quý thầy cô để đề tài của tôi được hoàn thiện hơn.
Tôi xin chân thành cảm ơn.
Biên Hòa, tháng 11 năm 2017
Sinh viên thực hiện
Đinh Hồng Ân
iii
MỤC LỤC
LỜI CÁM ƠN .................................................................................................................i
MỤC LỤC .................................................................................................................... iii
DANH MỤC HÌNH ẢNH .......................................................................................... vii
DANH MỤC TỪ VIẾT TẮT .......................................................................................ix
PHẦN MỞ ĐẦU ............................................................................................................ x
1. Lý do chọn đề tài .................................................................................................... x
2. Lịch sử nghiên cứu.................................................................................................xi
2.1. Hệ thống điểm danh RFID........................................................................xi
2.2. Hệ thống điểm danh sinh trắc học .......................................................... xii
2.3. Công nghệ nhận diện khuôn mặt. .......................................................... xiii
2.4. So sánh Kairos API với một số sản phẩm khác [24]. .............................xiv
3. Mục tiêu nghiên cứu ......................................................................................... xxiii
4. Đối tượng và phạm vi nghiên cứu .................................................................... xxiii
4.1. Đối tượng nghiên cứu .......................................................................... xxiii
4.2. Phạm vi nghiên cứu ............................................................................. xxiii
5. Phương pháp nghiên cứu .................................................................................. xxiii
6. Những đóng góp mới và những vấn đề mà đề tài chưa thực hiện được ............xxiv
6.1. Những đóng góp mới ............................................................................xxiv
6.2. Những vấn đề chưa thực hiện được ......................................................xxiv
7. Kết cấu của đề tài ...............................................................................................xxiv
CHƯƠNG 1: CƠ SỞ LÝ THUYẾT NHẬN DIỆN KHUÔN MẶT .......................... 1
1. Giới thiệu ................................................................................................................ 1
2. Những khó khăn của nhận dạng khuôn mặt ........................................................... 2
iv
3. Ứng dụng nhận dạng khuôn mặt ............................................................................. 4
4. Các phương pháp chính để xác định măt người. .................................................... 5
5. Hướng tiếp cận dựa trên tri thức ............................................................................. 5
5.1. Tư tưởng .................................................................................................... 5
5.2. Các nghiên cứu .......................................................................................... 6
6. Hướng tiếp cận dựa trên đặc trưng không thay đổi. ............................................... 7
6.1. Các đặc trưng của khuôn mặt .................................................................... 8
6.2. Kết cấu của khuôn mặt. ........................................................................... 10
6.3. Màu sắc da. .............................................................................................. 10
6.4. Đa đặc trưng. ........................................................................................... 11
7. Hướng tiếp cận dựa trên so sánh khớp mẫu.......................................................... 11
7.1. Tư tưởng. ................................................................................................. 11
8. Hướng tiếp cận dựa trên diện mạo. ....................................................................... 14
8.1. Tư tưởng. ................................................................................................. 14
8.2. Một số phương pháp cụ thế trong hướng tiếp cận dựa trên diện mạo ..... 15
8.3. Phân loại Bayes........................................................................................ 19
8.4. Ưu điểm và nhược điểm của hai loại phương pháp. ................................ 19
CHƯƠNG 2: GIỚI THIỆU VỀ KAIROS API ......................................................... 21
1. Giới thiệu tổng quát .............................................................................................. 21
1.1. Kairos API là gì? ..................................................................................... 21
1.2. Tính năng ................................................................................................. 21
2. Một số thuật ngữ ................................................................................................... 22
2.1. API ........................................................................................................... 22
2.2. REST........................................................................................................ 22
v
3. Quy trình xử lý nhận dạng khuôn mặt trên Kairos. .............................................. 24
3.1. Đăng ký hình ảnh (quá trình học máy) .................................................... 24
3.2. Nhận dạng hình ảnh (quá trình xử lý hình ảnh) ....................................... 26
3.3. Đưa ra kết quả (xử lý chuỗi dữ liệu) ........................................................ 26
4. Các phương thức của Kairos API ......................................................................... 27
4.1. POST/ ENROLL ...................................................................................... 27
4.2. POST/ VERIFY ....................................................................................... 32
4.3. POST/ RECOGNIZE ............................................................................... 36
5. API error code ....................................................................................................... 41
CHƯƠNG 3: XÂY DỰNG ỨNG DỤNG VÀ THỰC NGHIỆM ............................. 43
1. Đánh giá hiện trạng và nhu cầu. ........................................................................... 43
1.1. Đánh giá hiện trạng .................................................................................. 43
1.2. Khảo sát nhu cầu. ..................................................................................... 43
1.3. Hướng xây dựng ...................................................................................... 43
2. Bài toán điểm danh bằng nhận diện khuôn mặt. ................................................... 44
2.1. Quy trình ghi danh ................................................................................... 45
2.2. Quy trình điểm danh. ............................................................................... 46
3. Xây dựng chương trình thực tế. ............................................................................ 47
3.1. Qúa trình học máy (Đăng ký thông tin sinh viên) ................................... 47
3.2. Xử lý khuôn mặt (Điểm danh) ................................................................. 50
4. Thực nghiệm ......................................................................................................... 54
4.1. Đối tượng thực nghiệm ............................................................................ 54
4.2. Kết quả thực nghiệm ................................................................................ 55
5. Một số quy tắc đưa ra trong thực nghiệm ............................................................. 56
vi
5.1. Chi tiết kỹ thuật ....................................................................................... 56
5.2. Chụp ảnh: Đề xuất định vị, biểu hiện và trọng tâm. ................................ 57
5.3. Đăng ký khuôn mặt : Đề xuất để tải lên hình ảnh hoặc video. ................ 58
5.4. Thiết lập máy ảnh: Đề xuất vị trí, ánh sáng và khoảng cách. .................. 59
5.5. Định vị máy ảnh: Đề xuất cho màn hình gắn kết, kiốt và thiết bị. .......... 60
5.6. Trên đường đi: Đề xuất cho nhúng, máy ảnh hướng về phía trước......... 61
KẾT LUẬN .................................................................................................................. 62
TÀI LIỆU THAM KHẢO........................................................................................... 63
vii
DANH MỤC HÌNH ẢNH
Hình 0.1 Công nghệ điểm danh bằng hệ thống RFID ....................................................xi
Hình 0.2 Hệ thống điểm danh Sinh trắc vân tay .......................................................... xii
Hình 1.1 Một phương pháp xác định khuôn mặt điền theo huớng tiếp cận top-down. ... 6
Hình 1.2 Một mẫu khuôn mặt........................................................................................ 13
Hình 1.3 Các vector quan sát để huấn luyện cho HMM ............................................... 18
Hình 2.1 Logo nhà sản xuất Kairos API........................................................................ 21
Hình 2.2 Ảnh Elizzabeth được sử dụng để ghi danh. .................................................... 28
Hình 2.3 Yêu cầu tối thiểu khi xây dựng code post/enroll ............................................ 29
Hình 2.4 Code Post ghi danh ảnh lên server bằng PHP. ............................................... 29
Hình 2.5 Code post ghi danh ảnh bằng Node.js ............................................................ 30
Hình 2.6 Code post ghi danh ảnh bằng JavaScript ........................................................ 30
Hình 2.7 Chuỗi Json trả về của server sau khi ghi danh thành công ............................. 31
Hình 2.8 Chuỗi Json trả về của server khi không nhận diện được khuôn mặt nào trong
ảnh. ................................................................................................................................ 32
Hình 2.9 Chuỗi Json trả về của server khi quá nhiều khuôn mặt trên một bức ảnh ...... 32
Hình 2.10 Yêu cầu tối thiểu khi xây dựng code post/verify .......................................... 33
Hình 2.11 Code Post ảnh lên server bằng PHP. ............................................................ 34
Hình 2.12 Code post ảnh bằng Node.js ......................................................................... 34
Hình 2.13 Code post ảnh bằng JavaScript ..................................................................... 35
Hình 2.14 Chuỗi Json trả về của server sau khi gọi verify thành công ......................... 35
Hình 2.15 Chuỗi Json trả về của server khi không tìm thấy gallery trùng khớp ........... 36
Hình 2.16 Chuỗi Json trả về của server khi không nhận diện được khuôn mặt nào trong
ảnh ................................................................................................................................. 36
viii
Hình 2.17 Yêu cầu tối thiểu khi xây dựng code post/recognize .................................... 37
Hình 2.18 Code recognize ảnh lên server bằng PHP. ................................................... 38
Hình 2.19 Code recognize ảnh bằng Node.js ................................................................ 38
Hình 2.20 Code recognize ảnh bằng JavaScript ............................................................ 39
Hình 2.21 Chuỗi Json trả về của server sau khi gọi verify thành công ......................... 40
Hình 2.22 Chuỗi Json trả về của server khi không tìm thấy gallery trùng khớp ........... 40
Hình 2.23 Chuỗi Json trả về của server khi không nhận diện được khuôn mặt nào trong
ảnh ................................................................................................................................. 41
Hình 2.24 Chuỗi Json trả về của server khi quá nhiều khuôn mặt trên một bức ảnh .... 41
Hình 3.1 Hai khối chức năng chính trong công tác điểm danh ..................................... 44
Hình 3.2 Quy trình ghi danh .......................................................................................... 45
Hình 3.3 Quy trình điểm danh. ...................................................................................... 46
Hình 3.4 Quy trình học máy .......................................................................................... 47
Hình 3.5 Giao diện đăng ký thông tin sinh viên của ứng dụng ..................................... 48
Hình 3.6 Quy trình xử lý khuôn mặt ............................................................................. 51
Hình 3.7 Giao diện điểm danh của ứng dụng ................................................................ 51
Hình 3.8 Danh sách ảnh ghi danh .................................................................................. 54
Hình 3.9 Ảnh định danh lần 1 ....................................................................................... 55
Hình 3.10 Ảnh định danh lần 2 ..................................................................................... 55
Hình 3.11 Yêu cầu Pixel đối với ảnh............................................................................. 56
Hình 3.12 Vị trí xoay ảnh .............................................................................................. 58
Hình 3.13 Yêu cầu vị trí và khoảng cách ...................................................................... 59
Hình 3.14 Yêu cầu về độ hiển thị .................................................................................. 60
Hình 3.15 Yêu cầu về hướng trực quan ......................................................................... 61
ix
DANH MỤC TỪ VIẾT TẮT
STT
Từ viết tắt
Giải thích
1
API
Application Programming Interface
2
REST
REpresentational State Transfer
3
HTML
HyperText Markup Language
4
IMS QTI
IMS Question and Test Interoperability
5
JRE
Java Runtime Environment
6
LCMS
Learning Content Management System
7
LMS
Learning Management System
8
Moodle
9
PHP
Hypertext Preprocessor
10
SQL
Structured Query Language
11
URL
Uniform Resource Locator
12
UTF-8
UCS Transformation Format-8 bit
13
XHTML
eXtensible HyperText Markup Language
14
XML
eXtensible Markup Language
Modular
Object-Oriented
Dynamic
Environment
Learning
x
PHẦN MỞ ĐẦU
1. Lý do chọn đề tài
Ngày nay, chúng ta thấy một sự gia tăng về tỷ lệ phần trăm giáo dục so với thập
kỷ trước vì nhận thức trong con người và lợi ích đáng kể của việc giáo dục thích hợp
cho sự phát triển bản thân và xã hội. Việc nhập học của sinh viên ngày càng tăng dần
trong các đại học và cao đẳng một cách không ngừng. Do đó việc theo dõi sự hiện diện
của tất cả các sinh viên trong lớp học gây ra rất nhiều khó khăn. Vì vậy, để thoát khỏi
điều này, tất cả đang tìm kiếm cho nhiều lựa chọn khác nhau trong đó "Face Recognize"
là một sự thay thế.
Ở nhiều trường đại học, cao đẳng và sự hiện diện là tiêu chí rất quan trọng cho
sinh viên trong kết quả học tập. Phương pháp trước đây, trong đó tự thực hiện và duy trì
danh sách điểm danh đi học là công việc rất không thoải mái cho giáo viên, giảng viên.
Theo truyền thống, việc điểm danh sinh viên có mặt hoặc vắng mặt được làm thủ công
bằng cách sử dụng phiếu điểm danh, gọi tên, làm kiểm tra … gây mất rất nhiều thời gian
và nhân lực. Hơn nữa, việc điểm danh còn dễ sai sót bởi học sinh có thể gian lận bằng
nhiều cách. Cho nên điểm danh theo cách thủ công có tỷ lệ chính xác nghịch với số
lượng học sinh trong lớp. Do đó việc áp dụng công nghệ trở thành một phương án thay
thế khi tính toán thủ công tạo ra lỗi, và cũng lãng phí rất nhiều thời gian. Nếu hệ thống
điểm danh tự động được phát triển trong các trường đại học, nó có thể loại bỏ những
yếu tố phiền toái về giấy tờ điểm danh và nhân viên thực hiện. Một hệ thống quản lý tự
động bằng sinh trắc học khuôn mặt sẽ cung cấp những giải pháp cần thiết.
Tuy nhiên, nhằm kế thừa những giá trị ưu tú của các trí tuệ đi trước, vừa áp dụng
và thích nghi với yêu cầu bài toán, đồng thời tạo cơ sở cho các bạn trẻ đam mê công
nghệ có khả năng khám phá và xây dựng một phần mềm nhận diện khuôn mặt cho riêng
mình. Dó đó, đề tài này đưa ra giải pháp bằng việc “Nghiên cứu công nghệ nhận diện
khuôn mặt Kairos API” sau đó “áp dụng vào việc xây dựng một phần mềm điểm danh
sinh viên”.
xi
2. Lịch sử nghiên cứu
2.1. Hệ thống điểm danh RFID
RFID
(Radio
Frequency
Identification) là công nghệ nhận dạng đối
tượng bằng sóng vô tuyến. Công nghệ này
cho phép nhận biết các đối tượng thông qua
hệ thống thu phát sóng radio, từ đó có thể
giám sát, quản lý hoặc lưu vết từng đối
tượng. Một hệ thống RFID thường bao gồm
2 thành phần chính là thẻ tag (chip RFID
Hình 0.1 Công nghệ điểm danh bằng hệ
thống RFID
chứa thông tin) và đầu đọc (reader) đọc các
thông tin trên chip.
Nguyên lý hoạt động:
-
Mỗi học sinh, sinh viên sau khi nhập học sẽ được phát 1 thẻ học sinh, sinh
viên là dạng thẻ từ RFID có in ảnh và thông tin của học sinh, sinh viên đó.
Thẻ từ RFID sẽ được mã hóa tương ứng với mã số riêng tương ứng với
mã học sinh, sinh viên
-
Khi đến giờ học, tiết học của từng môn học sinh, sinh viên đó sẽ quẹt thẻ
của mình lên đầu đọc thẻ gắn trên tường ngay cửa ra vào của từng phòng
học để điểm danh
-
Khi giáo viên lên lớp giảng dạy sẽ nhận được thông tin điểm danh của lớp
đó từ dữ liệu của đầu đọc thẻ chuyển về. Hệ thống sẽ thống kê sỹ số của
lớp và có bao nhiêu học sinh, sinh viên đến lớp. Danh sách của những
người nghỉ. Đồng thời phòng đào tạo cũng nhận được những thông tin này
-
Mỗi thẻ khi quẹt lên đầu đọc trên phần mềm quản lý sẽ hiển thị thông tin
của HS/SV đó như: Tên, Địa chỉ, số điện thoại, Lớp, hình ảnh, thông tin
liên hệ gia đình.
Ưu điểm:
-
Giảm thời gian điểm danh của giáo viên.
xii
Nhược điểm:
-
Đi học phải mang thẻ, mất thẻ thì không thể điểm danh.
-
Gửi thẻ nhờ bạn điểm danh hộ.
-
Thời gian xếp hàng đợi quét thẻ là rất lâu.
2.2. Hệ thống điểm danh sinh trắc học
Công nghệ Sinh trắc học (Biometric)
là một công nghệ sử dụng những thuộc tính vật
lý hoặc các mẫu hành vi, các đặc điểm sinh học
trên cơ thể đặc trưng như dấu vân tay, mẫu
mống mắt, giọng nói, khuôn mặt, dáng đi… để
nhận diện con người.
Công nghệ sinh trắc vân tay được áp
dụng phổ biến từ rất lâu trước đó.
Hình 0.2 Hệ thống điểm danh Sinh
trắc vân tay
Dấu vân tay là một đặc điểm để phân biệt giữa người này và người khác. Vì
vậy, sự phát triển của công nghệ nhận dạng vân tay có thể giúp thu nhận và ghi nhớ
được hàng triệu các mẫu ghi chép dưới dạng số hoá bằng công nghệ thông tin. Kỹ thuật
này được đánh giá sẽ là đột phá của một cuộc cách mạng công nghệ mới, khi những
thiết bị có khả năng nhận dạng vân tay, được dùng để bảo vệ dữ liệu được ứng dụng
ngày càng nhiều.
Nguyên lý hoạt động:
Nguyên lý hoạt động của công nghệ nhận dạng sinh trắc vân tay là khi đặt ngón
tay lên trên một thiết bị nhận dạng dấu vân tay, ngay lập tức thiết bị này sẽ quét hình
ảnh vân ngón tay và đối chiếu các đặc điểm của vân tay đó với dữ liệu đã được lưu trữ
trong hệ thống trước đó. Quá trình xử lý dữ liệu sẽ được thiết bị chuyển sang các dữ liệu
số và ra thông báo rằng dấu vân tay đó là hợp lệ hay không hợp lệ, sau đó để hệ thống
thực hiện các chức năng khác. Khi đến giờ học, tiết học của từng môn học sinh, sinh
viên đó sẽ quẹt thẻ của mình lên đầu đọc thẻ gắn trên tường ngay cửa ra vào của từng
phòng học để điểm danh
xiii
Ưu điểm:
-
Giảm thời gian điểm danh của giáo viên.
-
Không cần phải mang thẻ.
Nhược điểm:
-
Thời gian xếp hàng đợi quét vân tay là rất lâu.
2.3. Công nghệ nhận diện khuôn mặt.
-
TensorFlow
-
Microsoft face API
-
Face Recognition - Stephen here from Lambda Labs. Face (Detection)
-
Animetrics Face Recognition
-
Skybiometry Face Detection and Recognition
-
ImageVision Face Detection
-
OpenCV Face Recognizer - OpenCV
-
Emgu CV
-
Libface
-
CCV OpenBR - Open Source Biometric Recognition
-
Flandmark
-
FaceReader
-
Affdex
-
Faceware
-
Face detection in iOS
-
Face-Recognition-SDK
-
Oddcast face detection API
-
BioID - world’s first webcam-based personal recognition
-
Betaface API - face detection and recognition
-
FaceIT SDK -
-
FaceSDK
-
Verilook SDK
-
Beyond Reality Face SDK
xiv
-
Sightcorp
-
Visage FaceDetect SDK
-
Microsoft Research Face SDK Beta
-
How To
-
FacePhi FaceRecognition SDK
-
360Biometrics Face SDK
-
Hunter TrueID
-
IMRSV
-
Stupeflix
2.4. So sánh Kairos API với một số sản phẩm khác [24].
Mọi người đều nói về nhận dạng khuôn mặt và có rất nhiều công ty khác nhau
Để giúp đưa ra quyết định sự lựa chọn đúng đắn, người nghiên cứu đã so sánh các dịch
vụ nhận dạng khuôn mặt tốt nhất trên thị trường.
Kairos Amazon Google Microsoft IBM Affectiva OpenCV
Face
Detection
Face
Recognition
(Image)
Face
Recognition
(Video)
Emotional
Depth (%)
Emotions
Present
(Y/N)
Age
&
Gender
Multi-face
Tracking
SDK
API
Ethnicity
xv
Amazon Rekognition i
Tổng Quát
Học sâu dựa trên hình ảnh công nhận. Là một phần của hệ sinh thái AWS của
Amazon. Dựa trên việc mua lại Orbeus vào 12/1/2015 và tung ra lại vào ngày 11/30/16.
Tính Năng Cốt Lõi
-
Phân tích đối tượng và cảnh.
-
Phát hiện khuôn mặt.
-
Nhận dạng khuôn mặt.
-
Phân tích tình cảm khuôn mặt
Điều kiện giới hạn
-
Số khuôn mặt tối đa được xử lý trong một hình ảnh là 15.
-
Kích thước hình ảnh tối đa được lưu trữ dưới dạng một đối tượng Amazon
S3 giới hạn đến 15 MB. Độ phân giải pixel tối thiểu cho chiều cao và chiều
rộng là 80 pixel.
-
Kích thước hình ảnh tối đa là byte như tham số cho một API là 5 MB.
-
Chỉ JPG và PNG - không hỗ trợ định dạng video.
-
Không có phân tích cảm xúc.
-
Số khuôn mặt tối đa mà người có thể lưu trữ trong bộ sưu tập khuôn mặt
duy nhất là 1 triệu.
-
Đối sánh tối đa mà API trả về tìm kiếm là 4096.
Nhận định
Amazon đã định hướng lại việc mua lại Orbeus như là một phần của nền tảng
AWS của họ và các tính năng tầm nhìn máy tính này không phải là trọng tâm cốt lõi của
họ. Nền tảng này gắn liền với hệ sinh thái AWS. Những người dùng không phải là AWS
sẽ gặp khó khăn trong việc thực hiện Rekognition trong sản phẩm của mình.
xvi
API Google Vision ii
Tổng Quát
Phân tích hình ảnh và video trên khuôn mặt. Một phần của Nền tảng Dịch vụ
Nhận thức của Microsoft.
Tính Năng Cốt Lõi
-
Phát hiện khuôn mặt.
-
Xác minh khuôn mặt.
-
Xác nhận khuôn mặt (công nhận).
-
Phát hiện cảm xúc.
Điều kiện giới hạn
-
Chỉ API, không có SDK cục bộ.
-
Bộ sưu tập Kích thước bộ sưu tập khuôn mặt giới hạn 1000.
-
Chỉ có 27 điểm trên khuôn mặt, tối đa 64 khuôn mặt cho mỗi hình ảnh.
-
Phân tích Emotion Video giới hạn tối đa 100MB (10-20 giây video ở độ
phân giải 1080p, <30 giây ở độ phân giải 720p HD).
-
Hình ảnh có kích thước tối đa 4MB (nhỏ hơn 2 megapixel).
-
Phân loại cảm xúc: tức giận, khinh thường, ghê tởm, sợ hãi, hạnh phúc,
trung lập, buồn bã, bất ngờ (không chú ý).
-
10 giao dịch mỗi giây đối với API khuôn mặt và hình ảnh API cảm xúc.
-
Tối đa 1 video cho mỗi phút trên Emotion API, giới hạn truy vấn trạng
thái video 2 phút.
-
$1,50 / 1000 cuộc gọi mỗi tháng, gói mở rộng $0,50 trên 1000 khuôn mặt
được lưu trữ trong một thư viện.
-
30k cuộc gọi miễn phí mỗi tháng cho Emotion và Face APIs.
-
Khách hàng nhận diện khuôn mặt = 3004 đô la / tháng.
-
Nếu người dùng thêm các tính năng bổ sung, chẳng hạn như phát hiện biểu
tượng hoặc thuộc tính hình ảnh, người dùng phải trả $1,50 / 1000 * số tính
năng mà người dùng yêu cầu.
xvii
-
Cảm xúc của khách hàng mẫu = $N / A - Video tối đa phải được xử lý là
50 giờ đầu tiên phải được hạ cấp và cắt thành đoạn clip thứ 30, không có
giá cả.
-
API cảm xúc tối đa 3000 video mỗi tháng ở mức $.25 / 1000 cuộc gọi.
Nhận định
Là một phần nhỏ của nền tảng đám mây của Google. Giá cả phức tạp, giới hạn
bởi tính năng combo. Đứng từ nhận thức của nhà phát triển, giống như các dịch vụ khác
của Google, API của Cloud Vision có thể dễ dàng ngưng bất cứ lúc nào.
Microsoft Face API (FKA ‘Project Oxford’) iii
Tổng Quát
Phân tích nội dung. Phân loại hình ảnh và video thành hàng ngàn chủng loại.
Tính Năng Cốt Lõi
-
Phát hiện nội dung không phù hợp.
-
Phân tích tình cảm hình ảnh (khuôn mặt).
-
OCR và nhận dạng ngôn ngữ tự động.
-
'Video Intelligence' - Cảnh, đối tượng và 'thực thể'.
Điều kiện giới hạn
-
Chỉ báo cáo lại 34 mặt mốc.
-
Không nhận dạng khuôn mặt có thể.
-
Chỉ gửi hình ảnh qua mã hóa Base64.
-
Kích thước tối đa 4MB hình ảnh (nhỏ hơn 2 megapixel).
-
10 yêu cầu tối đa mỗi giây.
-
20m hình ảnh mỗi tháng tối đa
-
Chỉ có Cloud API, không có SDK.
-
Phân loại cảm xúc: niềm vui, nỗi buồn, tức giận, và bất ngờ. Chỉ với 'khả
năng', chứ không phải cường độ.
-
1-1000 hình ảnh miễn phí mỗi tháng.
-
1001-5.000.000 hình ảnh 1,50 đô la cho mỗi 1000 hình ảnh.
xviii
-
2 triệu ảnh/ tháng = $3000 chỉ nhận diện khuôn mặt và phát hiện tình cảm
giới hạn, không nhận dạng khuôn mặt, không có phân tích video cảm xúc
nào có thể.
-
Nếu người dùng thêm các tính năng bổ sung, chẳng hạn như phát hiện biểu
tượng hoặc thuộc tính hình ảnh, người dùng phải trả $1,50 / 1000 * số tính
năng mà người dùng yêu cầu.
Nhận định
Microsoft có một dịch vụ phân tích khuôn mặt chắc chắn cho đám mây. Tuy
nhiên, dịch vụ bị giới hạn bởi giới hạn sử dụng và sự mất ổn định về giá - hãy xét "giá
trước" của họ, điều này sẽ tăng 50% khi có sẵn. Là một phần của nền tảng Cognitive
Services lớn hơn của họ, nó cũng thiếu sự tập trung của một nhà cung cấp chuyên dụng.
Họ có một số bản dtôio dễ thương.
IBM Watson Visual Recognition API iv
Tổng Quát
Hiểu nội dung của hình ảnh. Một phần của Cloud phát triển của Watson.
Tính Năng Cốt Lõi
-
Phát hiện khuôn mặt.
-
Người nổi tiếng công nhận.
-
Nhận diện đối tượng và cảnh.
Điều kiện giới hạn
-
Nhận diện khuôn mặt được giới hạn trong những người nổi tiếng.
-
250 hình ảnh / ngày lên đến 5000 hình ảnh.
-
Phát hiện độ tuổi và giới tính.
Nhận định
Một thành phần nhỏ trong khả năng mở rộng của Watson. Không có trọng tâm
rõ ràng về phân tích khuôn mặt và phụ thuộc nhiều vào nền tảng đám mây Blutoix của
xix
IBM. Chiến lược của IBM Watson tập trung không theo nhận dạng trực quan so với các
phân tích dựa trên văn bản chính của nó.
Cognitec v
Tổng Quát
Tìm kiếm cơ sở dữ liệu hình ảnh khuôn mặt, các giải pháp kiểm tra video thời
gian thực.
Tính Năng Cốt Lõi
-
Theo dõi khuôn mặt
-
Nhận dạng khuôn mặt.
-
Phát hiện độ tuổi và giới tính.
-
Nhận dạng khuôn mặt video.
Điều kiện và giới hạn
-
Nhà cung cấp phần mềm nhận dạng khuôn mặt hàng đầu cho các chính
phủ, quân đội, an ninh và các ngành chơi game.
-
Chỉ SDK, không có API web.
-
Hoạt động tốt dưới các kịch bản được kiểm soát như kiểm soát hộ chiếu.
-
Tốc độ ghi danh chậm và tỷ lệ phù hợp.
-
Không có phân tích cảm xúc.
-
C, C + +, Java, và phát triển C # có thể.
-
Hỗ trợ khách hàng chỉ dành cho khách hàng doanh nghiệp quy mô lớn.
-
Cấp phép khó khăn và mô hình định giá.
Nhận định
Là một công ty lớn trong thị trường chính phủ, Cognetic là một sản phẩm rất
phức tạp và tốn kém để thiết lập, sử dụng và duy trì.
NEC Face Recognition vi
Tổng Quát
Một phần của bộ dữ liệu pháp lý và an ninh của NEC.
xx
Tính Năng Cốt Lõi
-
Phân tích ngón tay và cọ.
-
Phát hiện và nhận diện khuôn mặt.
-
Nhận dạng khuôn mặt trên hình ảnh và video.
-
Họ thích xây dựng các giải pháp hoàn chỉnh trong nhà hơn là cấp phép
SDK cho các nhà tích hợp hoặc nhà phát triển bên ngoài.
Điều kiện và giới hạn
-
Không có phân tích cảm xúc.
-
Không có API trên đám mây.
-
SDK chỉ, cũng được phân phối như một thiết bị phần cứng cho các nhà
tích hợp.
-
Rất khó để tìm thấy bất kỳ thông tin nào về SDK của họ.
-
SDK chỉ, cũng được phân phối như một thiết bị phần cứng cho các nhà
tích hợp.
-
NEC cung cấp rất ít thông tin về dòng sản phẩm NeoFace, không có cách
nào rõ ràng để mua nó.
-
Bán hàng và bộ phận hỗ trợ khó khăn để tham gia với.
-
Cung cấp một đóng góp rất nhỏ cho một công ty rất lớn, nó có thể bị cắt
tại bất kỳ điểm nào.
Nhận định
Một bộ phận của NEC có trụ sở tại Nhật Bản. Giống như bất kỳ tổ chức cực lớn
nào, thật khó để liên hệ với họ trên điện thoại hoặc trả lời email. Sản phẩm của họ là tốt,
và trong nhiều năm đã được coi là một đối thủ lớn.
Affectivavii
Tổng Quát
Phần mềm nhận dạng tình cảm và phân tích hình ảnh và video. MIT Spywareff
của Media Lab.
- Xem thêm -