Tài liệu Ai camera application for image enhancement on smartphone vsmart products

.PDF

121

themask Báo vi phạm

Tải xuống 121

Mô tả:

ĐẠI HỌC QUỐC GIA TP.HCM TRƢỜNG ĐẠI HỌC BÁCH KHOA TP. HỒ CHÍ MINH NGUYỄN THẾ NGỌC ỨNG DỤNG “AI-CAMERA” NÂNG CAO CHẤT LƢỢNG HÌNH ẢNH CHO SMARTPHONE-VSMART Chuyên ngành: Kỹ Thuật Điều Khiển Và Tự Động Hóa Mã số: 60 52 02 16 LUẬN VĂN THẠC SĨ TP. Hồ Chí Minh , tháng 12 năm 2019 i ĐẠI HỌC QUỐC GIA TP.HCM TRƢỜNG ĐẠI HỌC BÁCH KHOA TP. HỒ CHÍ MINH NGUYỄN THẾ NGỌC “AI-CAMERA” APPLICATION FOR IMAGE ENHANCEMENT ON SMARTPHONE-VSMART PRODUCTS Chuyên ngành: Kỹ Thuật Điều Khiển Và Tự Động Hóa Mã số: 60 52 02 16 LUẬN VĂN THẠC SĨ TP. Hồ Chí Minh , tháng 12 năm 2019 ii CÔNG TRÌNH ĐƢỢC HOÀN THÀNH TẠI TRƢỜNG ĐẠI HỌC BÁCH KHOA – ĐHQG-HCM Cán bộ hƣớng dẫn khóa học : Cán bộ chấm nhận xét 1 : Cán bộ chấm nhận xét 2 : Luận văn thạc sĩ đƣợc bảo vệ tại Trƣờng Đại học Bách Khoa, ĐHQG Tp.HCM. Ngày …. Tháng …. Năm…. Thành phần Hội Đồng đánh giá luận văn thạc sĩ gồm: 1. 2. 3. 4. 5. Xác nhận của Chủ tịch Hội đồng đánh giá luận văn và Trƣởng Khoa quản lý chuyên ngành sau khi luận văn đã đƣợc sửa chữa. CHỦ TỊCH HỘI ĐỒNG TRƢỞNG KHOA iii ĐẠI HỌC QUỐC GIA TP.HCM TRƢỜNG ĐẠI HỌC BÁCH KHOA CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM Độc lập - Tự do - Hạnh phúc NHIỆM VỤ LUẬN VĂN THẠC SĨ Họ tên học viên: NGUYỄN THẾ NGỌC MSHV: 1770548 Ngày, tháng, năm sinh: 10/02/1994 Nơi sinh:Quảng Bình Chuyên ngành: Kỹ Thuật Điều Khiển Và Tự Động Hóa Mã số : 60520216 I. TÊN ĐỀ TÀI: ỨNG DỤNG “AI-CAMERA” NÂNG CAO CHẤT LƢỢNG HÌNH ẢNH CHO SMARTPHONE-VSMART II. NHIỆM VỤ VÀ NỘI DUNG: - Tìm hiểu các phƣơng pháp tăng cƣờng chất lƣợng, chuyển đổi phong cách của hình ảnh dựa trên các phƣơng pháp học sâu (Deep Learning). - Tìm hiểu phƣơng pháp phát triển ứng dụng trí tuệ nhân tạo trên nền tảng smartphone. - Xây dựng mô hình học sâu nhằm nâng cao chất lƣợng hình ảnh và chuyển đổi phong cách. - Tối ƣu mô hình và tích hợp OpenCV, Tensorflow trên thiết bị di động sử dụng nền tảng hệ điều hành VOS. - Đánh giá kết quả thực hiện. III. NGÀY GIAO NHIỆM VỤ : 19/08/2019 IV. NGÀY HOÀN THÀNH NHIỆM VỤ: 08/12/2019 V. CÁN BỘ HƢỚNG DẪN : TS.Phạm Việt Cƣờng Tp. HCM, ngày 08 tháng 12 năm 2019 CÁN BỘ HƢỚNG DẪN CHỦ NHIỆM BỘ MÔN ĐÀO TẠO TS. Phạm Việt Cƣờng TRƢỞNG KHOA iv LỜI CẢM ƠN Lời nói đầu tiên, để hoàn thành nghiên cứu trong luận văn này, Tôi xin đƣợc gửi lời cảm ơn đến Quý Thầy Cô ở Bộ Môn Điều Khiển Tự Động, Khoa Điện – Điện Tử, Trƣờng đại học Bách Khoa- Đại học quốc gia TP Hồ Chí Minh đã truyền đạt những kiến thức quý giá trong suốt thời gian Tôi học tập ở Trƣờng. Đặc biệt, Xin gửi lời cảm ơn sâu sắc đến TS.Phạm Việt Cƣờng đã luôn nhiệt tình hƣớng dẫn, góp ý cho Tôi trong suốt quá trình thực hiện luận văn này. Tôi cũng muốn gửi lời cảm ơn đặc biệt đến các Anh: Ngô Huy Ánh, Anh: Phạm Xuân Khánh ở Phòng nghiên cứu phần mềm dự án Smatphone-Vsmart đã cho Tôi cơ hội đƣợc thực hiện luận văn này. Tôi cũng xin gửi lời cảm ơn đến các Bạn Võ Thị Yến Hải, Phạm Thế Vinh đã hỗ trợ về hình ảnh và những kiến thức Photoshop trong suốt thời gian thực hiện luận văn. Một lần nữa, Tôi xin gửi lời cảm ơn chân thành đến tất cả mọi ngƣời. Nguyễn Thế Ngọc 1 TÓM TẮT LUẬN VĂN THẠC SĨ Cùng với sự phát triển không ngừng của trí tuệ nhân tạo (AI) trong thời gian trở lại đây, không chỉ có mặt trên máy tính, AI giờ đây còn đƣợc nhiều hãng sản xuất quan tâm đƣa lên cả smartphone. Hiện này, hầu hết các mẫu smartphone đình đám đều tích hợp thêm AI-Cam để tăng hấp dẫn đối với ngƣời tiêu dùng. Ngày nay, chụp ảnh với các smartphone và chia sẻ trên các mạng xã hội đã trở thành một trào lƣu lớn mạnh. Cùng với các cải tiến về chất lƣợng camera gần đây, ngƣời dùng ngày càng đòi hỏi cao hơn về chất lƣợng hình ảnh và tính nghệ thuật của các bức hình. Nắm bắt xu thế đó, đề tài đƣợc thực hiện nhằm xây dựng công nghệ lõi và phát triển ứng dụng “AI-Camera” có khả năng nâng cao chất lƣợng hình ảnh và chuyển đổi phong cách. Đề tài đƣợc thực hiện dựa trên đề xuất của Phòng Nghiên Cứu Phần Mềm thuộc Công Ty Cổ Phần Nghiên Cứu Và Sản Xuất VINSMART. Trong đó, mục đích chính của đề tài là nghiên cứu và tích hợp các ứng dụng trí tuệ nhân tạo lên các sản phầm smartphone, ban đầu đó là “AI-Camera”. Với việc thực hiện luận văn này, Học viên sử dụng kiến trúc CycleGAN và mạng tích chập U-Net để xây dựng mô hình học sâu. Đồng thời, sử dụng thƣ viện OpenCV và Tensorflow để phát triển ứng dụng trên smartphone. Cuối cùng, luận văn đã phát triển thành công ứng dụng “AI-Camera” nhằm nâng cao chất lƣợng hình ảnh và chuyển đổi phong cách cho hình ảnh. Ứng dụng có khả năng thực thi trên hệ điều hành VOS của dòng smartphone của VSMART. Bƣớc đầu, đã chứng minh đƣợc tính thực tiễn của nghiên cứu và có thể phát triển hơn trong tƣơng lai. Học viên Nguyễn Thế Ngọc 2 ABSTRACT Along with the continuous development of AI in recent times, not only on computers, AI is now also interested in many manufacturers on smartphones. Currently, most of the smartphones have integrated AI to increase attractiveness to consumers. Nowadays, taking photos with smartphones and sharing on social networks has become a growing trend. Along with recent advances in camera quality, users are becoming more and more demanding about the image quality and the artistry of their photographs. Following that trend, the project was conducted to build core technology and develop "AI-Camera" application capable of improving image quality and style transfer. The project was implemented based on the proposal of the Software Research Department of VINSMART Research and Production Joint Stock Company. In particular, the main goal of the thesis is to research and integrate AI applications on smartphone products, initially "AI-Camera". The thesis uses the CycleGAN architecture and the U-Net convolution network to build a deep learning model. Also, use the library OpenCV and Tensorflow to develop applications on smartphone. Finally, the thesis has successfully developed the application "AI-Camera" to enhance image quality and transform style for images. The application could execute on VOS. Initially, it has proved the practicality of the research and can develop more in the future. Student Nguyễn Thế Ngọc 3 LỜI CAM ĐOAN Tôi cam đoan rằng, ngoại trừ các kết quả tham khảo từ các công trình khác nhƣ đã trình bày trong luận văn, các công việc đƣợc trình bày trong luận văn này do chính Tôi trực tiếp thực hiện và chƣa có phần nội dung nào của luận văn này đƣợc nộp để lấy một bằng cấp ở trƣờng này hoặc trƣờng khác. Tp. HCM, ngày 08 tháng 12 năm 2019 Nguyễn Thế Ngọc 4 MỤC LỤC LỜI CẢM ƠN .............................................................................................................1 TÓM TẮT LUẬN VĂN THẠC SĨ .............................................................................2 ABSTRACT ................................................................................................................3 LỜI CAM ĐOAN .......................................................................................................4 DANH MỤC HÌNH ẢNH ..........................................................................................7 DANH MỤC VIẾT TẮT ............................................................................................9 DANH MỤC BẢNG BIỂU ......................................................................................10 CHƢƠNG 1: GIỚI THIỆU ĐỀ TÀI .........................................................................11 1.1 Đặt vấn đề .......................................................................................................11 1.2 Mục đích nghiên cứu .......................................................................................11 1.3 Đối tƣợng và phạm vi nghiên cứu ...................................................................12 1.4 Phƣơng pháp nghiên cứu.................................................................................12 CHƢƠNG 2: TRÍ TUỆ NHÂN TẠO TRÊN SMARTPHONE ................................13 2.1 Giới thiệu trí tuệ nhân tạo trên smartphone ....................................................13 2.2 Giới thiệu AI Camera ......................................................................................16 CHƢƠNG 3: NÂNG CAO CHẤT LƢỢNG HÌNH ẢNH .......................................21 TRÊN SMARTPHONE ............................................................................................21 3.1 Ứng dụng chỉnh sửa ảnh trên smartphone.......................................................21 3.2 Chỉnh sửa ảnh với trí tuệ nhân tạo trên smartphone .......................................24 CHƢƠNG 4: MẠNG HỌC SÂU ỨNG DỤNG CHO ..............................................26 NÂNG CAO CHẤT LƢỢNG HÌNH ẢNH ..............................................................26 4.1 Image-to-Image Translation (I2I) ...................................................................26 4.2 GANs-Generative Adversarial Networks .......................................................30 4.3 Mạng tích chập U-Net .....................................................................................35 CHƢƠNG 5: PHƢƠNG PHÁP ĐÁNH GIÁ ẢNH SỐ ...........................................38 5.1 Sai số trung bình-MSE ....................................................................................38 5.2 Tỷ số tín hiệu cực đại/nhiễu-PSNR .................................................................38 5.3 So sánh tƣơng đồng cấu trúc-SSIM ................................................................40 CHƢƠNG 6: PHÁT TRIỂN ỨNG DỤNG TRÍ TUỆ NHÂN TẠO ........................41 TRÊN SMARTPHONE ............................................................................................41 6.1 Tensorflow trên Android .................................................................................41 5 6.1.1 Giới thiệu Tensorflow ..............................................................................41 6.1.2 Tensorflow trên Android Studio ..............................................................43 6.2 OpenCV trên Andorid .....................................................................................44 CHƢƠNG 7: NỘI DUNG THỰC HIỆN ..................................................................46 7.1 Khảo sát các nghiên cứu liên quan đến nâng cao chất lƣợng hình ảnh bằng trí tuệ nhân tạo ...........................................................................................................46 7.2 Mô hình mạng học sâu ....................................................................................47 7.2.1 Kiến trúc CycleGAN ................................................................................47 7.2.2 Mạng tích chập U-net ...............................................................................49 7.2.3 Loss-function............................................................................................51 7.3 Dữ liệu .............................................................................................................54 7.3.1 Dữ liệu “source domain” .........................................................................54 7.3.2 Dữ liệu “Target Domain” .........................................................................56 7.3.3 Dữ liệu đánh giá .......................................................................................58 7.4 Phát triển ứng dụng trên Android Studio ........................................................59 CHƢƠNG 8: KẾT QUẢ THỰC HIỆN ....................................................................61 8.1 Kết quả phát triển mô hình ..............................................................................61 8.2 Kết quả phát triển ứng dụng. ...........................................................................67 8.2.1 Một số kết quả thực hiện ứng dụng trên VOS .........................................77 8.3 Kết luận ...........................................................................................................80 8.4 Hƣớng phát triển .............................................................................................81 TÀI LIỆU THAM KHẢO .........................................................................................84 6 DANH MỤC HÌNH ẢNH Hình 2.1: Ứng dụng trợ lý ảo trên smartphone. ........................................................13 Hình 2.2: Ứng dụng mở khóa bằng khuôn mặt trên smartphone. .............................14 Hình 2.3: Chip Kirin đƣợc trang bị AI của Huawei ..................................................15 Hình 2.4: Rất nhiều tính năng AI mới đƣợc ra mắt gần đây. ....................................16 Hình 2.5: Smartphone tích hợp AI-Camera của Bphone ..........................................16 Hình 2.6: Face ID trên Iphone...................................................................................17 Hình 2.7: Công nghệ làm đẹp AI 2.0 trên smartphone của Oppo F7 .......................18 Hình 2.8: Nhận diện khung cảnh...............................................................................18 Hình 2.9: Ứng dụng thực tế ảo ..................................................................................20 Hình 3.1: Chỉnh sửa ảnh trƣớc lúc chia sẻ trên mạng xã hội. ...................................21 Hình 3.2: So sánh ảnh trƣớc và sau chỉnh sửa ..........................................................22 Hình 3.3: Ứng dụng chỉnh sửa ảnh Adobe Photoshop Express ................................22 Hình 3.4: Ứng dụng Snapseed của Google ...............................................................23 Hình 3.5: AI-Camera trên điện thoại của LG............................................................24 Hình 3.6: Ứng dụng tạo ảnh nghệ thuật với AI.........................................................25 Hình 4.1: Ứng dụng I2I cho chuyển đổi sắc thái. .....................................................26 Hình 4.2: Ứng dụng I2I cho chuyển đổi mùa ...........................................................27 Hình 4.3: I2I ghép đôi(trái)- I2I không ghép đôi(phải).............................................27 Hình 4.4: Minh họa ý tƣởng của I2I..........................................................................28 Hình 4.5: Minh họa phƣơng pháp I2I ghép đôi và không ghép đôi ..........................28 Hình 4.6: Kiến trúc của GANs ..................................................................................31 Hình 4.7: Nguyên lý hoạt động của GAN .................................................................31 Hình 4.8: Mô tả pg , pz , pdata ......................................................................................33 Hình 4.9: Huấn luyện mạng GAN ............................................................................33 Hình 4.10: Kiến trúc CNNs trong bài toán nhận dạng chữ số ..................................35 Hình 4.11: Ứng U-Net trong bài toán “image segmentation” ..................................36 Hình 4.12: Kiến trúc encoder và decoder mạng U-Net.............................................37 Hình 5.1: Ví dụ về PSNR ..........................................................................................39 Hình 5.2: Ví dụ về giá trị SSIM và MSE ..................................................................40 Hình 6.1: Các framework học máy phổ biến ............................................................41 Hình 6.2: Biểu đồ lƣợt star và repos trên github sử dụng TF ...................................42 Hình 6.3: Kết hợp Android và Tensorflow để phát triển ứng dụng ..........................43 Hình 6.4: Kiến trúc phát triển Tensorflow Lite ........................................................44 Hình 6.5: OpenCV trên nền tảng Android ................................................................45 Hình 7.1: Kiến trúc GAN ..........................................................................................47 Hình 7.2: Kiến trúc mạng CycleGAN .......................................................................47 7 Hình 7.3: Một số ứng dụng mạng CycleGAN theo nghiên cứu [5] ..........................48 Hình 7.4: Kiến trúc U-Net tham khảo .......................................................................49 Hình 7.5: Mạng Generator xây dựng theo kiến trúc U-Net ......................................50 Hình 7.6: Mạng Discriminator ..................................................................................50 Hình 7.7: Dữ liệu MIT-Adobe FiveK Dataset trên Internet. ....................................55 Hình 7.8: Một ảnh trong “target domain” của Flickr. ...............................................57 Hình 7.9: Ảnh gốc-trái, ảnh MIT-C-phải. .................................................................58 Hình 7.10: Ảnh gốc(trái), MIT-C(phải), PSNR=15.75 .............................................58 Hình 7.11: Phát triển ứng dụng .................................................................................60 Hình 8.1: Lƣu đồ giải thuật huấn luyện ....................................................................61 Hình 8.2: Mạng Generator ........................................................................................64 Hình 8.3: Các lớp con của lớp conv-xanh dƣơng trong mạng Generator .................64 Hình 8.4: Mạng Discriminator ..................................................................................65 Hình 8.5: Ảnh chứa đặc tính mà ngƣời dùng thích. ..................................................66 Hình 8.6: Ảnh gốc (trái), Ảnh MIT-C(phải) .............................................................66 Hình 8.7: Giải thuật trên ứng dụng ...........................................................................67 Hình 8.8: Giao diện ứng dụng AI-Camera ................................................................69 Hình 8.9: Ảnh 4937 lần lƣợt từ trái sang phải là gốc, MIT-C, nhãn.........................72 Hình 8.10: Ảnh 4536 lần lƣợt từ trái sang phải là gốc, MIT-C, nhãn.......................72 Hình 8.11: Ảnh 4901 lần lƣợt từ trái sang phải là gốc, Flickr, nhãn. .......................73 Hình 8.12: Ảnh 4772 lần lƣợt từ trái sang phải là gốc, Flickr, nhãn ........................73 Hình 8.13: Ảnh(4937) gốc(trái), ảnh dán nhãn(phải), PSNR=13.11 ........................74 Hình 8.14: Kết quả ảnh(4937) từ MIT-C(trái), Ảnh dán nhãn(phải), PSNR=32.59.74 Hình 8.15: Ảnh(4536) gốc(trái), ảnh dán nhãn(phải), PSNR=15.23 ........................75 Hình 8.16: Kết quả ảnh (4536) từ MIT-C(trái), Ảnh dán nhãn(phải), PSNR=28.24 75 Hình 8.17: Ảnh MIT-C có cảm giác bị thừa sáng. ....................................................82 Hình 8.18: Ảnh chân dung bị nhòe sau khi xử lý với AI. .........................................82 8 DANH MỤC VIẾT TẮT Từ viết tắt AI AR A-WGAN D DL DLSR G GANs HVS I2I MIT ML PC PSNR SDK SSIM TF VOS VR Ý nghĩa Artificial Intelligence Augmented Reality Adaptives Wasserstein Generative Adversarial Networks Discriminator Deep Learning Digital Single-Lens Reflex Generator Generative Adversarial Networks Human Visual System Image To Image Translation Massachusetts Institute of Technology Machine Learning Personal Computer Peak Signal to Noise Ratio Software Development Kit Structural Similarity Index Tensorflow Vin Operating System Virtual Reality 9 DANH MỤC BẢNG BIỂU Bảng 7.1: Tổng hợp các biến thể của GAN theo nghiên cứu số [9]. ........................51 Bảng 7.2: So sánh các biến thể GAN đƣợc trích từ nghiên cứu số [1]. ....................51 Bảng 8.1: Chỉ số PSNR trung bình trên bộ thử nghiệm 500 ảnh. .............................70 Bảng 8.2: PSNR của 10 ảnh có PSNR cao nhất trên mô hình MIT-C. .....................70 Bảng 8.3: PSNR của 10 ảnh có PSNR cao nhất trên mô hình Flickr. ......................71 Bảng 8.4: PSNR của 10 ảnh có PSNR thấp nhất trên mô hình MIT-C và Flickr ...71 10 CHƢƠNG 1: GIỚI THIỆU ĐỀ TÀI 1.1 Đặt vấn đề Trƣớc đây, nếu nhƣ chỉ có những chiếc máy tính mới có thể giúp chúng ta chỉnh sửa hình ảnh nâng cao, nâng tông màu, chỉnh nền ảnh thì giờ đây những chiếc smartphone với nhiều cải tiến về mặt hiệu năng có thể giúp chúng ta chỉnh sửa hình ảnh ngay sau khi chụp qua các ứng dụng chỉnh sửa ảnh chuyên nghiệp. Trong đó, chụp ảnh với các smartphone và chia sẻ trên các mạng xã hội đã trở thành một trào lƣu ngày càng lớn mạnh. Nhằm đáp ứng xu thế đó, việc phát triển ứng dụng tích hợp trí tuệ nhân tạo nhằm nâng cao chất lƣợng ảnh dựa vào AI là một trong những phần mang lại giá trị cao các dòng smartphone hiện nay. Đó là lý do cơ bản để hình thành đề tài này. 1.2 Mục đích nghiên cứu Đề tài thực hiện các nhiệm vụ chính: 1. Nghiên cứu và khảo sát các phƣơng pháp học sâu liên quan đến nâng cao chất lƣợng hình ảnh. 2. Nghiên cứu giải pháp phát triển công nghệ lõi cho ứng dụng “AI-Camera” ban đầu là phát triển chức năng nâng cao chất lƣợng hình ảnh và chuyển đổi phong cách. 3. Nghiên cứu phƣơng pháp tối ƣu và tích hợp các “framework” trí tuệ nhân tạo lên smartphone. 4. Đánh giá kết quả thực hiện. 11 1.3 Đối tƣợng và phạm vi nghiên cứu Dữ liệu sử dụng chính trong luận văn đƣợc thu thập từ các nguồn dữ liệu mở trên Internet và các hình ảnh cá nhân khác, đƣợc chụp từ nhiều dòng điện thoại khác nhau. Về nội dung, luận văn chỉ nghiên cứu các phƣơng pháp ứng dụng mạng học sâu cho việc nâng cao chất lƣợng hình ảnh. Trong đó, tập trung vào các ứng dụng của mạng GAN và tích hợp các “framework” trí tuệ nhân tạo lên smatphone. 1.4 Phƣơng pháp nghiên cứu Về mức độ lý thuyết, luận văn nghiên cứu các tài liệu về: 1. Các phƣơng pháp đánh giá ảnh số. 2. Các mạng học sâu liên quan đến nâng cao chất lƣợng hình ảnh: GAN, CycleGAN, U-Net… Về mặt ứng dụng, luận văn nghiên cứu các phƣơng pháp: 1. Tối ƣu mô hình mạng học sâu nhằm thực thi đƣợc trên các thiết bị smartphone. 2. Tích hợp các framework trí tuệ nhân tạo nhƣ OpenCV, Tensorflow. 12 CHƢƠNG 2: TRÍ TUỆ NHÂN TẠO TRÊN SMARTPHONE 2.1 Giới thiệu trí tuệ nhân tạo trên smartphone AI hay trí tuệ nhân tạo là một dạng trí thông minh với mục đích biến mọi cỗ máy có thể tự hiểu và vận hành giống cách con ngƣời sử dụng chúng. Trí tuệ nhân tạo đem tới cơ hội học hỏi kiến thức mới cho máy móc. Từ đó, máy móc sẽ tự học tập, suy nghĩ và phục vụ con ngƣời. Đây là một trong những phát minh mang tính cách mạng trong giới công nghệ, giúp kéo theo hàng loạt các tiến bộ kỹ thuật khác, đồng thời mở ra một kỷ nguyên công nghệ mới cho nhiều ngành nghề, lĩnh vực. Hình 2.1: Ứng dụng trợ lý ảo trên smartphone. Cùng với sự phát triển không ngừng của trí tuệ nhân tạo trong thời gian trở lại đây, không chỉ có mặt trên robot hay máy tính, AI giờ đây còn đƣợc nhiều hãng sản xuất quan tâm đƣa lên cả smartphone. Trong đó, AI xuất hiện với các ứng dụng trợ lý ảo nhƣ Siri (iPhone) hay Google Now (Android) nhiều năm về trƣớc. 13 Ngƣời dùng có thể ra lệnh cho smartphone để phục vụ các nhu cầu của mình nhƣ báo thức, tìm kiếm địa điểm, nhân diện giọng nói,… Bên cạnh đó, công nghệ AI còn giúp cải thiện đáng kể khả năng chụp hình của điện thoại, xử lý hình ảnh, tiết kiệm điện năng, nâng cao bảo mật,… Hình 2.2: Ứng dụng mở khóa bằng khuôn mặt trên smartphone. Ngoài việc đƣợc tích hợp vào phần mềm, trí tuệ nhân tạo còn đƣợc tích hợp cả phần cứng trong smartphone, mà tiêu biểu là các vi xử lý. Thật vậy, hầu hết các vi xử lý hiện nay đều đƣợc tích hợp khả năng xử lý AI để có thể xử lý các thuật toán phức tạp, tăng cƣờng hiệu năng, khả năng chụp ảnh chất lƣợng cao, xử lý đồ họa cũng nhƣ mang lại nhiều tính năng độc đáo trên điện thoại, ví dụ nhận diện giọng nói, nhận dạng khuôn mặt ngƣời dùng, dịch ngôn ngữ hay tìm kiếm thông tin. Các con chip đƣợc trang bị khả năng xử lý AI phổ biến trên thị trƣờng hiện là bộ đôi A11 Bionic và A12 Bionic của Apple, Kirin 980 của Huawei, Snapdragon 845 và mới nhất là Snapdragon 855 của Qualcomm, tạo điều kiện cho ngƣời dùng đƣợc trải nghiệm các tính năng vô cùng mới lạ và hấp dẫn. 14 Đơn cử là chiếc iPhone X đƣợc trang bị chipset A11 Bionic có 2 lõi để xử lý các tác vụ AI. Trong khi đó, ngƣời anh em của A11 Bionic, A12 có tới 8 nhân phụ trách các tác vụ AI, có thể xử lý 5 nghìn tỷ phép tính mỗi giây, thay vì chỉ là 600 tỷ so với AI Engine trên A11. Hình 2.3: Chip Kirin được trang bị AI của Huawei Ngoài ra, Qualcomm cũng là một trong những nhà sản xuất chip chú trọng vào trí tuệ nhân tạo, với Snapdragon 855, hãng đã giới thiệu công cụ AI thế hệ 4, kết hợp với lõi đồ họa Adeno, Kyro và Hexagon để cung cấp năng lƣợng cho các tác vụ AI. Nhờ vậy mà hiệu năng AI sẽ tăng gấp 3 lần so với thế hệ tiền nhiệm. Bên cạnh đó, bộ xử lý Hexagon cho công cụ AI còn có thể cắt giảm tiếng ồn trong những cuộc gọi video bằng cách sử dụng thuật toán giảm tiếng ồn thời gian thực. Có thể thấy không chỉ các nhà sản xuất smartphone mà cả những hãng phần mềm và phần cứng đều rất quan tâm đến AI. Trí tuệ nhân tạo có thể đƣợc xem là một nhân tố sống còn cho sự thành bại của ngành công nghiệp di động. Đây sẽ tiếp tục là mục tiêu theo đuổi và cạnh tranh giữa các hãng smartphone trong tƣơng lai. 15 Hình 2.4: Rất nhiều tính năng AI mới được ra mắt gần đây. 2.2 Giới thiệu AI Camera Hình 2.5: Smartphone tích hợp AI-Camera của Bphone Cảm nhận rõ sự thay đổi AI nhất là trong ngành phát triển điện thoại di động. Các mẫu máy gần đây đã có những khả năng nhận dạng giọng nói, đọc chính tả, quét vân tay, nhận diện khuôn mặt, chỉnh sửa ảnh tự động, điều khiển từ xa...mới đây nhất là AI-Cam. Hiện này, hầu hết các mẫu smartphone đình đám đều tích hợp thêm AI-Cam để tăng hấp dẫn đối với ngƣời tiêu dùng. 16

- Xem thêm -

Tài liệu Ai camera application for image enhancement on smartphone vsmart products

Tài liệu liên quan

Tài liệu vừa đăng

Tài liệu xem nhiều nhất