Đăng ký Đăng nhập
Trang chủ Nghiên cứu công nghệ nhận diện khuôn mặt Kairos API và áp dụng xây dựng phần mềm...

Tài liệu Nghiên cứu công nghệ nhận diện khuôn mặt Kairos API và áp dụng xây dựng phần mềm điểm danh sinh viên

.PDF
90
112
86

Mô tả:

TRƯỜNG ĐẠI HỌC LẠC HỒNG KHOA CÔNG NGHỆ THÔNG TIN ---------- BÁO CÁO NGHIÊN CỨU KHOA HỌC ĐỀ TÀI: NGHIÊN CỨU CÔNG NGHỆ NHẬN DIỆN KHUÔN MẶT KAIROS API VÀ ÁP DỤNG XÂY DỰNG PHẦN MỀM ĐIỂM DANH SINH VIÊN SVTH : ĐINH HỒNG ÂN GVHD :Th.S TẠ NGUYỄN BIÊN HÒA, THÁNG 11/2017 i LỜI CÁM ƠN Tôi xin chân thành cám ơn các giảng viên trường Đại Học Lạc Hồng, các thầy cô khoa Công nghệ Thông tin đã giảng dạy và hướng dẫn tôi trong suốt thời gian tôi theo học tại trường. Tôi xin gởi lời cám ơn đến thạc sĩ Tạ Nguyễn, là giáo viên đã hướng dẫn tôi hoàn thành đề tài nghiên cứu khoa học này. Tôi cũng xin gởi lời cám ơn đến thạc sĩ, giáo viên phản biện đã góp ý giúp tôi hoàn thiện chương trình hơn. Tôi xin cám ơn các thầy, các cô trong khoa Công nghệ Thông tin đã có những ý kiến đóng góp trong các buổi báo cáo tiến độ. Ngoài ra tôi xin cám ơn thầy Nguyễn Minh Phúc, giáo viên chủ nhiệm lớp 13SE111 và các bạn trong lớp cùng toàn thể gia đình và người thân đã giúp đỡ, động viên tôi trong quá trình thực hiện đề tài này. Với vốn kiến thức còn hạn chế cùng những điều kiện khách quan không cho phép, đề tài của tôi khó tránh khỏi những thiếu sót cũng như chưa đáp ứng đầy đủ các yêu cầu. Do đó tôi hy vọng tiếp tục nhận được những ý kiến đóng góp và hướng dẫn của quý thầy cô để đề tài của tôi được hoàn thiện hơn. Tôi xin chân thành cảm ơn. Biên Hòa, tháng 11 năm 2017 Sinh viên thực hiện Đinh Hồng Ân iii MỤC LỤC LỜI CÁM ƠN .................................................................................................................i MỤC LỤC .................................................................................................................... iii DANH MỤC HÌNH ẢNH .......................................................................................... vii DANH MỤC TỪ VIẾT TẮT .......................................................................................ix PHẦN MỞ ĐẦU ............................................................................................................ x 1. Lý do chọn đề tài .................................................................................................... x 2. Lịch sử nghiên cứu.................................................................................................xi 2.1. Hệ thống điểm danh RFID........................................................................xi 2.2. Hệ thống điểm danh sinh trắc học .......................................................... xii 2.3. Công nghệ nhận diện khuôn mặt. .......................................................... xiii 2.4. So sánh Kairos API với một số sản phẩm khác [24]. .............................xiv 3. Mục tiêu nghiên cứu ......................................................................................... xxiii 4. Đối tượng và phạm vi nghiên cứu .................................................................... xxiii 4.1. Đối tượng nghiên cứu .......................................................................... xxiii 4.2. Phạm vi nghiên cứu ............................................................................. xxiii 5. Phương pháp nghiên cứu .................................................................................. xxiii 6. Những đóng góp mới và những vấn đề mà đề tài chưa thực hiện được ............xxiv 6.1. Những đóng góp mới ............................................................................xxiv 6.2. Những vấn đề chưa thực hiện được ......................................................xxiv 7. Kết cấu của đề tài ...............................................................................................xxiv CHƯƠNG 1: CƠ SỞ LÝ THUYẾT NHẬN DIỆN KHUÔN MẶT .......................... 1 1. Giới thiệu ................................................................................................................ 1 2. Những khó khăn của nhận dạng khuôn mặt ........................................................... 2 iv 3. Ứng dụng nhận dạng khuôn mặt ............................................................................. 4 4. Các phương pháp chính để xác định măt người. .................................................... 5 5. Hướng tiếp cận dựa trên tri thức ............................................................................. 5 5.1. Tư tưởng .................................................................................................... 5 5.2. Các nghiên cứu .......................................................................................... 6 6. Hướng tiếp cận dựa trên đặc trưng không thay đổi. ............................................... 7 6.1. Các đặc trưng của khuôn mặt .................................................................... 8 6.2. Kết cấu của khuôn mặt. ........................................................................... 10 6.3. Màu sắc da. .............................................................................................. 10 6.4. Đa đặc trưng. ........................................................................................... 11 7. Hướng tiếp cận dựa trên so sánh khớp mẫu.......................................................... 11 7.1. Tư tưởng. ................................................................................................. 11 8. Hướng tiếp cận dựa trên diện mạo. ....................................................................... 14 8.1. Tư tưởng. ................................................................................................. 14 8.2. Một số phương pháp cụ thế trong hướng tiếp cận dựa trên diện mạo ..... 15 8.3. Phân loại Bayes........................................................................................ 19 8.4. Ưu điểm và nhược điểm của hai loại phương pháp. ................................ 19 CHƯƠNG 2: GIỚI THIỆU VỀ KAIROS API ......................................................... 21 1. Giới thiệu tổng quát .............................................................................................. 21 1.1. Kairos API là gì? ..................................................................................... 21 1.2. Tính năng ................................................................................................. 21 2. Một số thuật ngữ ................................................................................................... 22 2.1. API ........................................................................................................... 22 2.2. REST........................................................................................................ 22 v 3. Quy trình xử lý nhận dạng khuôn mặt trên Kairos. .............................................. 24 3.1. Đăng ký hình ảnh (quá trình học máy) .................................................... 24 3.2. Nhận dạng hình ảnh (quá trình xử lý hình ảnh) ....................................... 26 3.3. Đưa ra kết quả (xử lý chuỗi dữ liệu) ........................................................ 26 4. Các phương thức của Kairos API ......................................................................... 27 4.1. POST/ ENROLL ...................................................................................... 27 4.2. POST/ VERIFY ....................................................................................... 32 4.3. POST/ RECOGNIZE ............................................................................... 36 5. API error code ....................................................................................................... 41 CHƯƠNG 3: XÂY DỰNG ỨNG DỤNG VÀ THỰC NGHIỆM ............................. 43 1. Đánh giá hiện trạng và nhu cầu. ........................................................................... 43 1.1. Đánh giá hiện trạng .................................................................................. 43 1.2. Khảo sát nhu cầu. ..................................................................................... 43 1.3. Hướng xây dựng ...................................................................................... 43 2. Bài toán điểm danh bằng nhận diện khuôn mặt. ................................................... 44 2.1. Quy trình ghi danh ................................................................................... 45 2.2. Quy trình điểm danh. ............................................................................... 46 3. Xây dựng chương trình thực tế. ............................................................................ 47 3.1. Qúa trình học máy (Đăng ký thông tin sinh viên) ................................... 47 3.2. Xử lý khuôn mặt (Điểm danh) ................................................................. 50 4. Thực nghiệm ......................................................................................................... 54 4.1. Đối tượng thực nghiệm ............................................................................ 54 4.2. Kết quả thực nghiệm ................................................................................ 55 5. Một số quy tắc đưa ra trong thực nghiệm ............................................................. 56 vi 5.1. Chi tiết kỹ thuật ....................................................................................... 56 5.2. Chụp ảnh: Đề xuất định vị, biểu hiện và trọng tâm. ................................ 57 5.3. Đăng ký khuôn mặt : Đề xuất để tải lên hình ảnh hoặc video. ................ 58 5.4. Thiết lập máy ảnh: Đề xuất vị trí, ánh sáng và khoảng cách. .................. 59 5.5. Định vị máy ảnh: Đề xuất cho màn hình gắn kết, kiốt và thiết bị. .......... 60 5.6. Trên đường đi: Đề xuất cho nhúng, máy ảnh hướng về phía trước......... 61 KẾT LUẬN .................................................................................................................. 62 TÀI LIỆU THAM KHẢO........................................................................................... 63 vii DANH MỤC HÌNH ẢNH Hình 0.1 Công nghệ điểm danh bằng hệ thống RFID ....................................................xi Hình 0.2 Hệ thống điểm danh Sinh trắc vân tay .......................................................... xii Hình 1.1 Một phương pháp xác định khuôn mặt điền theo huớng tiếp cận top-down. ... 6 Hình 1.2 Một mẫu khuôn mặt........................................................................................ 13 Hình 1.3 Các vector quan sát để huấn luyện cho HMM ............................................... 18 Hình 2.1 Logo nhà sản xuất Kairos API........................................................................ 21 Hình 2.2 Ảnh Elizzabeth được sử dụng để ghi danh. .................................................... 28 Hình 2.3 Yêu cầu tối thiểu khi xây dựng code post/enroll ............................................ 29 Hình 2.4 Code Post ghi danh ảnh lên server bằng PHP. ............................................... 29 Hình 2.5 Code post ghi danh ảnh bằng Node.js ............................................................ 30 Hình 2.6 Code post ghi danh ảnh bằng JavaScript ........................................................ 30 Hình 2.7 Chuỗi Json trả về của server sau khi ghi danh thành công ............................. 31 Hình 2.8 Chuỗi Json trả về của server khi không nhận diện được khuôn mặt nào trong ảnh. ................................................................................................................................ 32 Hình 2.9 Chuỗi Json trả về của server khi quá nhiều khuôn mặt trên một bức ảnh ...... 32 Hình 2.10 Yêu cầu tối thiểu khi xây dựng code post/verify .......................................... 33 Hình 2.11 Code Post ảnh lên server bằng PHP. ............................................................ 34 Hình 2.12 Code post ảnh bằng Node.js ......................................................................... 34 Hình 2.13 Code post ảnh bằng JavaScript ..................................................................... 35 Hình 2.14 Chuỗi Json trả về của server sau khi gọi verify thành công ......................... 35 Hình 2.15 Chuỗi Json trả về của server khi không tìm thấy gallery trùng khớp ........... 36 Hình 2.16 Chuỗi Json trả về của server khi không nhận diện được khuôn mặt nào trong ảnh ................................................................................................................................. 36 viii Hình 2.17 Yêu cầu tối thiểu khi xây dựng code post/recognize .................................... 37 Hình 2.18 Code recognize ảnh lên server bằng PHP. ................................................... 38 Hình 2.19 Code recognize ảnh bằng Node.js ................................................................ 38 Hình 2.20 Code recognize ảnh bằng JavaScript ............................................................ 39 Hình 2.21 Chuỗi Json trả về của server sau khi gọi verify thành công ......................... 40 Hình 2.22 Chuỗi Json trả về của server khi không tìm thấy gallery trùng khớp ........... 40 Hình 2.23 Chuỗi Json trả về của server khi không nhận diện được khuôn mặt nào trong ảnh ................................................................................................................................. 41 Hình 2.24 Chuỗi Json trả về của server khi quá nhiều khuôn mặt trên một bức ảnh .... 41 Hình 3.1 Hai khối chức năng chính trong công tác điểm danh ..................................... 44 Hình 3.2 Quy trình ghi danh .......................................................................................... 45 Hình 3.3 Quy trình điểm danh. ...................................................................................... 46 Hình 3.4 Quy trình học máy .......................................................................................... 47 Hình 3.5 Giao diện đăng ký thông tin sinh viên của ứng dụng ..................................... 48 Hình 3.6 Quy trình xử lý khuôn mặt ............................................................................. 51 Hình 3.7 Giao diện điểm danh của ứng dụng ................................................................ 51 Hình 3.8 Danh sách ảnh ghi danh .................................................................................. 54 Hình 3.9 Ảnh định danh lần 1 ....................................................................................... 55 Hình 3.10 Ảnh định danh lần 2 ..................................................................................... 55 Hình 3.11 Yêu cầu Pixel đối với ảnh............................................................................. 56 Hình 3.12 Vị trí xoay ảnh .............................................................................................. 58 Hình 3.13 Yêu cầu vị trí và khoảng cách ...................................................................... 59 Hình 3.14 Yêu cầu về độ hiển thị .................................................................................. 60 Hình 3.15 Yêu cầu về hướng trực quan ......................................................................... 61 ix DANH MỤC TỪ VIẾT TẮT STT Từ viết tắt Giải thích 1 API Application Programming Interface 2 REST REpresentational State Transfer 3 HTML HyperText Markup Language 4 IMS QTI IMS Question and Test Interoperability 5 JRE Java Runtime Environment 6 LCMS Learning Content Management System 7 LMS Learning Management System 8 Moodle 9 PHP Hypertext Preprocessor 10 SQL Structured Query Language 11 URL Uniform Resource Locator 12 UTF-8 UCS Transformation Format-8 bit 13 XHTML eXtensible HyperText Markup Language 14 XML eXtensible Markup Language Modular Object-Oriented Dynamic Environment Learning x PHẦN MỞ ĐẦU 1. Lý do chọn đề tài Ngày nay, chúng ta thấy một sự gia tăng về tỷ lệ phần trăm giáo dục so với thập kỷ trước vì nhận thức trong con người và lợi ích đáng kể của việc giáo dục thích hợp cho sự phát triển bản thân và xã hội. Việc nhập học của sinh viên ngày càng tăng dần trong các đại học và cao đẳng một cách không ngừng. Do đó việc theo dõi sự hiện diện của tất cả các sinh viên trong lớp học gây ra rất nhiều khó khăn. Vì vậy, để thoát khỏi điều này, tất cả đang tìm kiếm cho nhiều lựa chọn khác nhau trong đó "Face Recognize" là một sự thay thế. Ở nhiều trường đại học, cao đẳng và sự hiện diện là tiêu chí rất quan trọng cho sinh viên trong kết quả học tập. Phương pháp trước đây, trong đó tự thực hiện và duy trì danh sách điểm danh đi học là công việc rất không thoải mái cho giáo viên, giảng viên. Theo truyền thống, việc điểm danh sinh viên có mặt hoặc vắng mặt được làm thủ công bằng cách sử dụng phiếu điểm danh, gọi tên, làm kiểm tra … gây mất rất nhiều thời gian và nhân lực. Hơn nữa, việc điểm danh còn dễ sai sót bởi học sinh có thể gian lận bằng nhiều cách. Cho nên điểm danh theo cách thủ công có tỷ lệ chính xác nghịch với số lượng học sinh trong lớp. Do đó việc áp dụng công nghệ trở thành một phương án thay thế khi tính toán thủ công tạo ra lỗi, và cũng lãng phí rất nhiều thời gian. Nếu hệ thống điểm danh tự động được phát triển trong các trường đại học, nó có thể loại bỏ những yếu tố phiền toái về giấy tờ điểm danh và nhân viên thực hiện. Một hệ thống quản lý tự động bằng sinh trắc học khuôn mặt sẽ cung cấp những giải pháp cần thiết. Tuy nhiên, nhằm kế thừa những giá trị ưu tú của các trí tuệ đi trước, vừa áp dụng và thích nghi với yêu cầu bài toán, đồng thời tạo cơ sở cho các bạn trẻ đam mê công nghệ có khả năng khám phá và xây dựng một phần mềm nhận diện khuôn mặt cho riêng mình. Dó đó, đề tài này đưa ra giải pháp bằng việc “Nghiên cứu công nghệ nhận diện khuôn mặt Kairos API” sau đó “áp dụng vào việc xây dựng một phần mềm điểm danh sinh viên”. xi 2. Lịch sử nghiên cứu 2.1. Hệ thống điểm danh RFID RFID (Radio Frequency Identification) là công nghệ nhận dạng đối tượng bằng sóng vô tuyến. Công nghệ này cho phép nhận biết các đối tượng thông qua hệ thống thu phát sóng radio, từ đó có thể giám sát, quản lý hoặc lưu vết từng đối tượng. Một hệ thống RFID thường bao gồm 2 thành phần chính là thẻ tag (chip RFID Hình 0.1 Công nghệ điểm danh bằng hệ thống RFID chứa thông tin) và đầu đọc (reader) đọc các thông tin trên chip.  Nguyên lý hoạt động: - Mỗi học sinh, sinh viên sau khi nhập học sẽ được phát 1 thẻ học sinh, sinh viên là dạng thẻ từ RFID có in ảnh và thông tin của học sinh, sinh viên đó. Thẻ từ RFID sẽ được mã hóa tương ứng với mã số riêng tương ứng với mã học sinh, sinh viên - Khi đến giờ học, tiết học của từng môn học sinh, sinh viên đó sẽ quẹt thẻ của mình lên đầu đọc thẻ gắn trên tường ngay cửa ra vào của từng phòng học để điểm danh - Khi giáo viên lên lớp giảng dạy sẽ nhận được thông tin điểm danh của lớp đó từ dữ liệu của đầu đọc thẻ chuyển về. Hệ thống sẽ thống kê sỹ số của lớp và có bao nhiêu học sinh, sinh viên đến lớp. Danh sách của những người nghỉ. Đồng thời phòng đào tạo cũng nhận được những thông tin này - Mỗi thẻ khi quẹt lên đầu đọc trên phần mềm quản lý sẽ hiển thị thông tin của HS/SV đó như: Tên, Địa chỉ, số điện thoại, Lớp, hình ảnh, thông tin liên hệ gia đình.  Ưu điểm: - Giảm thời gian điểm danh của giáo viên. xii  Nhược điểm: - Đi học phải mang thẻ, mất thẻ thì không thể điểm danh. - Gửi thẻ nhờ bạn điểm danh hộ. - Thời gian xếp hàng đợi quét thẻ là rất lâu. 2.2. Hệ thống điểm danh sinh trắc học Công nghệ Sinh trắc học (Biometric) là một công nghệ sử dụng những thuộc tính vật lý hoặc các mẫu hành vi, các đặc điểm sinh học trên cơ thể đặc trưng như dấu vân tay, mẫu mống mắt, giọng nói, khuôn mặt, dáng đi… để nhận diện con người. Công nghệ sinh trắc vân tay được áp dụng phổ biến từ rất lâu trước đó. Hình 0.2 Hệ thống điểm danh Sinh trắc vân tay Dấu vân tay là một đặc điểm để phân biệt giữa người này và người khác. Vì vậy, sự phát triển của công nghệ nhận dạng vân tay có thể giúp thu nhận và ghi nhớ được hàng triệu các mẫu ghi chép dưới dạng số hoá bằng công nghệ thông tin. Kỹ thuật này được đánh giá sẽ là đột phá của một cuộc cách mạng công nghệ mới, khi những thiết bị có khả năng nhận dạng vân tay, được dùng để bảo vệ dữ liệu được ứng dụng ngày càng nhiều.  Nguyên lý hoạt động: Nguyên lý hoạt động của công nghệ nhận dạng sinh trắc vân tay là khi đặt ngón tay lên trên một thiết bị nhận dạng dấu vân tay, ngay lập tức thiết bị này sẽ quét hình ảnh vân ngón tay và đối chiếu các đặc điểm của vân tay đó với dữ liệu đã được lưu trữ trong hệ thống trước đó. Quá trình xử lý dữ liệu sẽ được thiết bị chuyển sang các dữ liệu số và ra thông báo rằng dấu vân tay đó là hợp lệ hay không hợp lệ, sau đó để hệ thống thực hiện các chức năng khác. Khi đến giờ học, tiết học của từng môn học sinh, sinh viên đó sẽ quẹt thẻ của mình lên đầu đọc thẻ gắn trên tường ngay cửa ra vào của từng phòng học để điểm danh xiii  Ưu điểm: - Giảm thời gian điểm danh của giáo viên. - Không cần phải mang thẻ.  Nhược điểm: - Thời gian xếp hàng đợi quét vân tay là rất lâu. 2.3. Công nghệ nhận diện khuôn mặt. - TensorFlow - Microsoft face API - Face Recognition - Stephen here from Lambda Labs. Face (Detection) - Animetrics Face Recognition - Skybiometry Face Detection and Recognition - ImageVision Face Detection - OpenCV Face Recognizer - OpenCV - Emgu CV - Libface - CCV OpenBR - Open Source Biometric Recognition - Flandmark - FaceReader - Affdex - Faceware - Face detection in iOS - Face-Recognition-SDK - Oddcast face detection API - BioID - world’s first webcam-based personal recognition - Betaface API - face detection and recognition - FaceIT SDK - - FaceSDK - Verilook SDK - Beyond Reality Face SDK xiv - Sightcorp - Visage FaceDetect SDK - Microsoft Research Face SDK Beta - How To - FacePhi FaceRecognition SDK - 360Biometrics Face SDK - Hunter TrueID - IMRSV - Stupeflix 2.4. So sánh Kairos API với một số sản phẩm khác [24]. Mọi người đều nói về nhận dạng khuôn mặt và có rất nhiều công ty khác nhau Để giúp đưa ra quyết định sự lựa chọn đúng đắn, người nghiên cứu đã so sánh các dịch vụ nhận dạng khuôn mặt tốt nhất trên thị trường. Kairos Amazon Google Microsoft IBM Affectiva OpenCV Face Detection Face Recognition (Image) Face Recognition (Video) Emotional Depth (%) Emotions Present (Y/N) Age & Gender Multi-face Tracking SDK API Ethnicity                                                                       xv Amazon Rekognition i  Tổng Quát Học sâu dựa trên hình ảnh công nhận. Là một phần của hệ sinh thái AWS của Amazon. Dựa trên việc mua lại Orbeus vào 12/1/2015 và tung ra lại vào ngày 11/30/16.  Tính Năng Cốt Lõi - Phân tích đối tượng và cảnh. - Phát hiện khuôn mặt. - Nhận dạng khuôn mặt. - Phân tích tình cảm khuôn mặt  Điều kiện giới hạn - Số khuôn mặt tối đa được xử lý trong một hình ảnh là 15. - Kích thước hình ảnh tối đa được lưu trữ dưới dạng một đối tượng Amazon S3 giới hạn đến 15 MB. Độ phân giải pixel tối thiểu cho chiều cao và chiều rộng là 80 pixel. - Kích thước hình ảnh tối đa là byte như tham số cho một API là 5 MB. - Chỉ JPG và PNG - không hỗ trợ định dạng video. - Không có phân tích cảm xúc. - Số khuôn mặt tối đa mà người có thể lưu trữ trong bộ sưu tập khuôn mặt duy nhất là 1 triệu. - Đối sánh tối đa mà API trả về tìm kiếm là 4096.  Nhận định Amazon đã định hướng lại việc mua lại Orbeus như là một phần của nền tảng AWS của họ và các tính năng tầm nhìn máy tính này không phải là trọng tâm cốt lõi của họ. Nền tảng này gắn liền với hệ sinh thái AWS. Những người dùng không phải là AWS sẽ gặp khó khăn trong việc thực hiện Rekognition trong sản phẩm của mình. xvi API Google Vision ii  Tổng Quát Phân tích hình ảnh và video trên khuôn mặt. Một phần của Nền tảng Dịch vụ Nhận thức của Microsoft.  Tính Năng Cốt Lõi - Phát hiện khuôn mặt. - Xác minh khuôn mặt. - Xác nhận khuôn mặt (công nhận). - Phát hiện cảm xúc.  Điều kiện giới hạn - Chỉ API, không có SDK cục bộ. - Bộ sưu tập Kích thước bộ sưu tập khuôn mặt giới hạn 1000. - Chỉ có 27 điểm trên khuôn mặt, tối đa 64 khuôn mặt cho mỗi hình ảnh. - Phân tích Emotion Video giới hạn tối đa 100MB (10-20 giây video ở độ phân giải 1080p, <30 giây ở độ phân giải 720p HD). - Hình ảnh có kích thước tối đa 4MB (nhỏ hơn 2 megapixel). - Phân loại cảm xúc: tức giận, khinh thường, ghê tởm, sợ hãi, hạnh phúc, trung lập, buồn bã, bất ngờ (không chú ý). - 10 giao dịch mỗi giây đối với API khuôn mặt và hình ảnh API cảm xúc. - Tối đa 1 video cho mỗi phút trên Emotion API, giới hạn truy vấn trạng thái video 2 phút. - $1,50 / 1000 cuộc gọi mỗi tháng, gói mở rộng $0,50 trên 1000 khuôn mặt được lưu trữ trong một thư viện. - 30k cuộc gọi miễn phí mỗi tháng cho Emotion và Face APIs. - Khách hàng nhận diện khuôn mặt = 3004 đô la / tháng. - Nếu người dùng thêm các tính năng bổ sung, chẳng hạn như phát hiện biểu tượng hoặc thuộc tính hình ảnh, người dùng phải trả $1,50 / 1000 * số tính năng mà người dùng yêu cầu. xvii - Cảm xúc của khách hàng mẫu = $N / A - Video tối đa phải được xử lý là 50 giờ đầu tiên phải được hạ cấp và cắt thành đoạn clip thứ 30, không có giá cả. - API cảm xúc tối đa 3000 video mỗi tháng ở mức $.25 / 1000 cuộc gọi.  Nhận định Là một phần nhỏ của nền tảng đám mây của Google. Giá cả phức tạp, giới hạn bởi tính năng combo. Đứng từ nhận thức của nhà phát triển, giống như các dịch vụ khác của Google, API của Cloud Vision có thể dễ dàng ngưng bất cứ lúc nào. Microsoft Face API (FKA ‘Project Oxford’) iii  Tổng Quát Phân tích nội dung. Phân loại hình ảnh và video thành hàng ngàn chủng loại.  Tính Năng Cốt Lõi - Phát hiện nội dung không phù hợp. - Phân tích tình cảm hình ảnh (khuôn mặt). - OCR và nhận dạng ngôn ngữ tự động. - 'Video Intelligence' - Cảnh, đối tượng và 'thực thể'.  Điều kiện giới hạn - Chỉ báo cáo lại 34 mặt mốc. - Không nhận dạng khuôn mặt có thể. - Chỉ gửi hình ảnh qua mã hóa Base64. - Kích thước tối đa 4MB hình ảnh (nhỏ hơn 2 megapixel). - 10 yêu cầu tối đa mỗi giây. - 20m hình ảnh mỗi tháng tối đa - Chỉ có Cloud API, không có SDK. - Phân loại cảm xúc: niềm vui, nỗi buồn, tức giận, và bất ngờ. Chỉ với 'khả năng', chứ không phải cường độ. - 1-1000 hình ảnh miễn phí mỗi tháng. - 1001-5.000.000 hình ảnh 1,50 đô la cho mỗi 1000 hình ảnh. xviii - 2 triệu ảnh/ tháng = $3000 chỉ nhận diện khuôn mặt và phát hiện tình cảm giới hạn, không nhận dạng khuôn mặt, không có phân tích video cảm xúc nào có thể. - Nếu người dùng thêm các tính năng bổ sung, chẳng hạn như phát hiện biểu tượng hoặc thuộc tính hình ảnh, người dùng phải trả $1,50 / 1000 * số tính năng mà người dùng yêu cầu.  Nhận định Microsoft có một dịch vụ phân tích khuôn mặt chắc chắn cho đám mây. Tuy nhiên, dịch vụ bị giới hạn bởi giới hạn sử dụng và sự mất ổn định về giá - hãy xét "giá trước" của họ, điều này sẽ tăng 50% khi có sẵn. Là một phần của nền tảng Cognitive Services lớn hơn của họ, nó cũng thiếu sự tập trung của một nhà cung cấp chuyên dụng. Họ có một số bản dtôio dễ thương. IBM Watson Visual Recognition API iv  Tổng Quát Hiểu nội dung của hình ảnh. Một phần của Cloud phát triển của Watson.  Tính Năng Cốt Lõi - Phát hiện khuôn mặt. - Người nổi tiếng công nhận. - Nhận diện đối tượng và cảnh.  Điều kiện giới hạn - Nhận diện khuôn mặt được giới hạn trong những người nổi tiếng. - 250 hình ảnh / ngày lên đến 5000 hình ảnh. - Phát hiện độ tuổi và giới tính.  Nhận định Một thành phần nhỏ trong khả năng mở rộng của Watson. Không có trọng tâm rõ ràng về phân tích khuôn mặt và phụ thuộc nhiều vào nền tảng đám mây Blutoix của xix IBM. Chiến lược của IBM Watson tập trung không theo nhận dạng trực quan so với các phân tích dựa trên văn bản chính của nó. Cognitec v  Tổng Quát Tìm kiếm cơ sở dữ liệu hình ảnh khuôn mặt, các giải pháp kiểm tra video thời gian thực.  Tính Năng Cốt Lõi - Theo dõi khuôn mặt - Nhận dạng khuôn mặt. - Phát hiện độ tuổi và giới tính. - Nhận dạng khuôn mặt video.  Điều kiện và giới hạn - Nhà cung cấp phần mềm nhận dạng khuôn mặt hàng đầu cho các chính phủ, quân đội, an ninh và các ngành chơi game. - Chỉ SDK, không có API web. - Hoạt động tốt dưới các kịch bản được kiểm soát như kiểm soát hộ chiếu. - Tốc độ ghi danh chậm và tỷ lệ phù hợp. - Không có phân tích cảm xúc. - C, C + +, Java, và phát triển C # có thể. - Hỗ trợ khách hàng chỉ dành cho khách hàng doanh nghiệp quy mô lớn. - Cấp phép khó khăn và mô hình định giá.  Nhận định Là một công ty lớn trong thị trường chính phủ, Cognetic là một sản phẩm rất phức tạp và tốn kém để thiết lập, sử dụng và duy trì. NEC Face Recognition vi  Tổng Quát Một phần của bộ dữ liệu pháp lý và an ninh của NEC. xx  Tính Năng Cốt Lõi - Phân tích ngón tay và cọ. - Phát hiện và nhận diện khuôn mặt. - Nhận dạng khuôn mặt trên hình ảnh và video. - Họ thích xây dựng các giải pháp hoàn chỉnh trong nhà hơn là cấp phép SDK cho các nhà tích hợp hoặc nhà phát triển bên ngoài.  Điều kiện và giới hạn - Không có phân tích cảm xúc. - Không có API trên đám mây. - SDK chỉ, cũng được phân phối như một thiết bị phần cứng cho các nhà tích hợp. - Rất khó để tìm thấy bất kỳ thông tin nào về SDK của họ. - SDK chỉ, cũng được phân phối như một thiết bị phần cứng cho các nhà tích hợp. - NEC cung cấp rất ít thông tin về dòng sản phẩm NeoFace, không có cách nào rõ ràng để mua nó. - Bán hàng và bộ phận hỗ trợ khó khăn để tham gia với. - Cung cấp một đóng góp rất nhỏ cho một công ty rất lớn, nó có thể bị cắt tại bất kỳ điểm nào.  Nhận định Một bộ phận của NEC có trụ sở tại Nhật Bản. Giống như bất kỳ tổ chức cực lớn nào, thật khó để liên hệ với họ trên điện thoại hoặc trả lời email. Sản phẩm của họ là tốt, và trong nhiều năm đã được coi là một đối thủ lớn. Affectivavii  Tổng Quát Phần mềm nhận dạng tình cảm và phân tích hình ảnh và video. MIT Spywareff của Media Lab.
- Xem thêm -

Tài liệu liên quan