Đăng ký Đăng nhập
Trang chủ Nhận diện chữ viết tay tiếng việt ...

Tài liệu Nhận diện chữ viết tay tiếng việt

.PDF
57
1
141

Mô tả:

ĈҤI HӐC QUӔC GIA THÀNH PHӔ HӖ CHÍ MINH 75ѬӠ1*ĈҤI HӐC BÁCH KHOA KHOA KHOA HӐC VÀ KӺ THUҰT MÁY TÍNH LUҰ19Ă17ӔT NGHIӊ3ĈҤI HӐC NHҰN DIӊN CHӲ VIӂT TAY TIӂNG VIӊT Ngành: Khoa hӑc máy tính HӝLÿӗng: Khoa hӑc máy tính 11 GVHD: PGS.TS. QuҧQ7KjQK7Kѫ *93%7K6/rĈuQK7KXұn ---o0o--697+&DRĈӭc Hùng (1710114) ĈҤI HӐC QUӔC GIA THÀNH PHӔ HӖ CHÍ MINH 75ѬӠ1*ĈҤI HӐC BÁCH KHOA KHOA KHOA HӐC VÀ KӺ THUҰT MÁY TÍNH LUҰ19Ă17ӔT NGHIӊ3ĈҤI HӐC NHҰN DIӊN CHӲ VIӂT TAY TIӂNG VIӊT Ngành: Khoa hӑc máy tính HӝLÿӗng: Khoa hӑc máy tính 11 GVHD: PGS.TS. QuҧQ7KjQK7Kѫ *93%7K6/rĈuQK7KXұn ---o0o--697+&DRĈӭc Hùng (1710114) ĐẠI HỌC QUỐC GIA TP.HCM ---------TRƯỜNG ĐẠI HỌC BÁCH KHOA KHOA:KH & KT Máy tính_____ BỘ MÔN: KHMT____________ CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM Độc lập - Tự do - Hạnh phúc NHIỆM VỤ LUẬN ÁN TỐT NGHIỆP Chú ý: Sinh viên phải dán tờ này vào trang nhất của bản thuyết trình HỌ VÀ TÊN: Cao Đức Hùng__________________________MSSV: 1710114________ NGÀNH: KHMT______________________________LỚP: MT17KHTN____________ 1. Đầu đề luận án: Phát triển hệ thống nhận dạng chữ viết tay tiếng Việt___________________________________ _____________________________________________________________________________ 2. Nhiệm vụ (yêu cầu về nội dung và số liệu ban đầu): _____________________________________________________________________________ _____________________________________________________________________________ _____________________________________________________________________________ _____________________________________________________________________________ _____________________________________________________________________________ _____________________________________________________________________________ 3. Ngày giao nhiệm vụ luận án: 03/09/2015 4. Ngày hoàn thành nhiệm vụ: 20/12/2015 5. Họ tên giảng viên hướng dẫn: Phần hướng dẫn: 1)____________________________________________________________________________ 2)____________________________________________________________________________ 3)____________________________________________________________________________ Nội dung và yêu cầu LVTN đã được thông qua Bộ môn. Ngày ........ tháng ......... năm .......... CHỦ NHIỆM BỘ MÔN GIẢNG VIÊN HƯỚNG DẪN CHÍNH (Ký và ghi rõ họ tên) (Ký và ghi rõ họ tên) PGS.TS. Quản Thành Thơ PHẦN DÀNH CHO KHOA, BỘ MÔN: Người duyệt (chấm sơ bộ):_________________________ Đơn vị:_________________________________________ Ngày bảo vệ:____________________________________ Điểm tổng kết:___________________________________ Nơi lưu trữ luận án:_______________________________ TRƯỜNG ĐẠI HỌC BÁCH KHOA KHOA KH & KT MÁY TÍNH CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM Độc lập - Tự do - Hạnh phúc ---------------------------Ngày tháng năm PHIẾU CHẤM BẢO VỆ LVTN (Dành cho người hướng dẫn/phản biện) 1. Họ và tên SV: Cao Đức Hùng MSSV: 1710114 Ngành (chuyên ngành): KHMT 2. Đề tài: Phát triển hệ thống nhận dạng chữ viết tay tiếng Việt 3. Họ tên người hướng dẫn/phản biện: PGS.TS. Quản Thành Thơ 4. Tổng quát về bản thuyết minh: Số trang: Số chương: Số bảng số liệu Số hình vẽ: Số tài liệu tham khảo: Phần mềm tính toán: Hiện vật (sản phẩm) 5. Tổng quát về các bản vẽ: - Số bản vẽ: Bản A1: Bản A2: Khổ khác: - Số bản vẽ vẽ tay Số bản vẽ trên máy tính: 6. Những ưu điểm chính của LVTN: - Đề tài giải quyết một bài toán có tính thực tế cao Sinh viên đã nghiên cứu nhiều kiến thức lý thuyết, các mô hình học sâu liên quan cùng một số kiến thức về xử lý ảnh. Sinh viên đã đưa ra một số hướng tiếp cận nhằm tinh chỉnh mô hình để có được kết quả tốt hơn so với mô hình gốc. 7. Những thiếu sót chính của LVTN: - Sinh viên cần nắm vững hơn nữa lý thuyết của các mô hình được sử dụng. 8. Đề nghị: Được bảo vệ □ Bổ sung thêm để bảo vệ □ Không được bảo vệ □ 9. 3 câu hỏi SV phải trả lời trước Hội đồng: 10. Đánh giá chung (bằng chữ: giỏi, khá, TB): Điểm : 8.6/10 Ký tên (ghi rõ họ tên) PGS.TS. Quản Thành Thơ TRƯỜNG ĐẠI HỌC BÁCH KHOA KHOA KH & KT MÁY TÍNH CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM Độc lập - Tự do - Hạnh phúc ---------------------------Ngày tháng năm PHIẾU CHẤM BẢO VỆ LVTN (Dành cho người hướng dẫn/phản biện) 1. Họ và tên SV: Cao Đức Hùng MSSV: 1710114 Ngành (chuyên ngành): KHMT 2. Đề tài: Phát triển hệ thống nhận dạng chữ viết tay tiếng Việt 3. Họ tên người hướng dẫn/phản biện: ThS. Lê Đình Thuận 4. Tổng quát về bản thuyết minh: Số trang: Số chương: Số bảng số liệu Số hình vẽ: Số tài liệu tham khảo: Phần mềm tính toán: Hiện vật (sản phẩm) 5. Tổng quát về các bản vẽ: - Số bản vẽ: Bản A1: Bản A2: Khổ khác: - Số bản vẽ vẽ tay Số bản vẽ trên máy tính: 6. Những ưu điểm chính của LVTN: - Đề tài xây dựng hệ thống nhận dạng chữ viết tay tiếng Việt bằng phương pháp học sâu. Sinh viên đã tổng hợp và làm giàu thêm các nguồn dataset; đề xuất 2 mô hình tiếp cận dựa trên hướng xử lý chữ có dấu và không dấu. Từ đó biện luận kết quả. Sinh viên xây dựng thành công chương trình để demo kết quả. 7. Những thiếu sót chính của LVTN: - Phần mô tả kiến trúc của các hướng tiếp cận trong báo cáo còn sơ sài. - Trình tự trình bày các nội dung trong báo cáo còn chưa tốt. Một số lỗi sai chính tả. - Nguồn tài liệu tham khảo chưa phù hợp. 8. Đề nghị: Được bảo vệ □ Bổ sung thêm để bảo vệ □ 9. 3 câu hỏi SV phải trả lời trước Hội đồng: 10. Đánh giá chung (bằng chữ: giỏi, khá, TB): Không được bảo vệ □ Điểm : 8.3/10 Ký tên (ghi rõ họ tên) ThS. Lê Đình Thuận Lời cam đoan Em xin cam đoan rằng, ngoại trừ các kết quả tham khảo từ các công trình có liên quan khác đã ghi rõ trong đề cương luận văn, các nội dung trình bày trong đề cương luận văn này là do chính em thực hiện và chưa có phần nội dung nào được nộp để lấy bằng cấp ở một trường khác. Lời cảm ơn Đầu tiên, em xin gửi lời cảm ơn chân thành nhất tới PGS. TS. Quản Thành Thơ, người đã hướng dẫn em thực hiện đề cương, đồng thời tạo điều kiện tham gia nhóm nghiên cứu khoa học trong một năm qua. Xin cảm ơn thầy đã hướng dẫn tận tình và truyền đạt kiến thức để em có thể hoàn thành tốt luận văn này. Xin gửi lời cảm ơn tới các thầy cô Trường Đại học Bách Khoa, đặc biệt là các thầy cô bộ môn trong khoa Khoa học và Kĩ thuật Máy tính đã truyền đạt những kiến thức quý báu trong những năm học qua. Cuối cùng, em xin cảm ơn gia đình, bạn bè và những người đã giúp đỡ và hỗ trợ em trong thời gian hoàn thành chương trình bậc Đại học. Tóm tắt Hiện nay, công nghệ ngày càng phát triển, các dữ liệu dần được số hóa và lưu trữ đám mây, giúp cho công việc được diễn ra nhanh chóng và thuận lợi hơn. Nhưng trên thực tế, văn bản chữ viết tay còn được sử dụng nhiều, và việc số hóa cũng tốn tài nguyên và thời gian. Vì vậy, đề tài sẽ đề xuất một mô hình có thể nhận diện chữ viết tay tiếng Việt, đồng thời đề xuất một luồng xử lý các văn bản viết tay để đọc thông tin từ văn bản một cách nhanh chóng. Ho Chi Minh University of Technology Faculty of Computer Science and Engineering Danh sách hình vẽ 2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 2.9 2.10 2.11 2.12 2.13 2.14 2.15 2.16 2.17 Hình ảnh minh họa cấu tạo của một neuron sinh học. . Hình ảnh minh họa cấu tạo của một perceptron. . . . . Hình ảnh mạng neuron đa tầng với 2 tầng ẩn. . . . . . . Cách thức lấy feature map bằng kernel . . . . . . . . . . Ví dụ lấy feature map với padding = 1 . . . . . . . . . . Max pooling với filter = 2x2 và stride = 2 . . . . . . . . Average pooling với filter = 2x2 và stride = 2 . . . . . . Cấu trúc của mạng neuron hồi quy . . . . . . . . . . . . Các kiểu hoạt động của mạng neuron hồi quy . . . . . . Bên trong một module RNN . . . . . . . . . . . . . . . . Bên trong một module LSTM . . . . . . . . . . . . . . . Cổng quyết định thông tin cần bỏ . . . . . . . . . . . . Cổng quyết định thông tin được thêm . . . . . . . . . . Cổng quyết định đầu ra . . . . . . . . . . . . . . . . . . Kiến trúc mô hình Sequence-to-sequence . . . . . . . . . Minh họa sử dụng Attention để lấy độ tương quan trong Kết quả khi sử dụng beam search trong seq2seq . . . . . 3.1 3.2 3.3 3.4 3.5 3.6 3.7 3.8 Mô hình dự đoán trong bài báo của Alex Graves . Kết quả của mô hình dự đoán nét chữ, sau khi đưa Mô hình CRNN của Quoc Pham . . . . . . . . . . Feature extracting . . . . . . . . . . . . . . . . . . Connectionist Temporal Classification loss . . . . . Character-level seq2seq . . . . . . . . . . . . . . . . Beam search . . . . . . . . . . . . . . . . . . . . . . Mô hình Image-to-markup generation . . . . . . . 4.1 4.2 4.3 4.4 4.5 4.6 4.7 Hình minh họa dữ liệu địa chỉ gốc . . . . . . . . . . . . . . . . . . Hình minh họa dữ liệu địa chỉ sau khi đưa qua bước tiền xử lý . . Ví dụ sử dụng elastic transform để làm méo bức ảnh . . . . . . . . Kết quả cuối cùng sau khi áp dụng các phương pháp biến đổi ảnh Kết quả của mô hình sinh chữ viết tay RNN . . . . . . . . . . . . Mô hình nhận diện chữ viết tay . . . . . . . . . . . . . . . . . . . . Nhãn được sử dụng trong huấn luyện . . . . . . . . . . . . . . . . . Luận văn tốt nghiệp . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . câu được dịch máy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 13 14 15 16 16 16 17 17 18 19 19 19 20 20 21 22 . . . . . . . . . . . . . . . . qua tầng phân phối độ dày . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 24 25 26 26 27 28 29 . . . . . . . . . . . . . . . . . . . . . 30 30 31 31 32 33 35 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Trang 4/47 Ho Chi Minh University of Technology Faculty of Computer Science and Engineering 5.1 5.2 5.3 Ví dụ về edit distance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Minh họa kết quả . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Kết quả tổng hợp . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36 37 38 6.1 6.2 6.3 6.4 6.5 Deployment diagram . . . . . . . . . . . . . . Activity diagram: Vẽ khung chứa chữ viết tay Activity diagram: Nhận diện chữ viết tay . . Mockup: Vẽ khung chữ viết tay . . . . . . . . Nhận diện chữ viết tay . . . . . . . . . . . . . 41 42 43 44 45 Luận văn tốt nghiệp . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Trang 5/47 Ho Chi Minh University of Technology Faculty of Computer Science and Engineering Danh sách bảng 5.1 5.2 Thông số huấn luyện . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Thời gian chạy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Luận văn tốt nghiệp 38 38 Trang 6/47 Ho Chi Minh University of Technology Faculty of Computer Science and Engineering Mục lục 1 Tổng quan 1.1 Giới thiệu đề tài . . . . . . 1.2 Mục tiêu và phạm vi đề tài 1.3 Đóng góp của đề tài . . . . 1.3.1 Về lý thuyết . . . . . 1.3.2 Về thực tế . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 10 10 11 11 11 2 Kiến thức nền tảng 2.1 Tổng quan về mạng neuron . . . . . . . . . . . . . . 2.1.1 Mạng neuron . . . . . . . . . . . . . . . . . . 2.1.2 Perceptron . . . . . . . . . . . . . . . . . . . 2.1.3 Mạng neuron đa tầng . . . . . . . . . . . . . 2.2 Mạng neuron tích chập . . . . . . . . . . . . . . . . . 2.2.1 Tổng quan . . . . . . . . . . . . . . . . . . . . 2.2.2 Convolutional Layer - Tầng tích chập . . . . 2.2.3 Stride và Padding . . . . . . . . . . . . . . . 2.2.4 Pooling . . . . . . . . . . . . . . . . . . . . . 2.3 Mạng neuron hồi quy . . . . . . . . . . . . . . . . . . 2.3.1 Tổng quan . . . . . . . . . . . . . . . . . . . . 2.3.2 Các kiểu hoạt động của mạng neuron hồi quy 2.3.3 Mạng bộ nhớ dài-ngắn - LSTM . . . . . . . . 2.3.4 Sequence to Sequence . . . . . . . . . . . . . 2.3.5 Attention . . . . . . . . . . . . . . . . . . . . 2.3.6 Beam search . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 12 12 13 14 15 15 15 16 16 17 17 17 18 20 21 22 3 Các công trình liên quan 3.1 Sinh chữ viết tay bằng RNN . . . . . . . . . 3.2 Mô hình CRNN . . . . . . . . . . . . . . . . 3.2.1 Giới thiệu . . . . . . . . . . . . . . . 3.2.2 Mô hình . . . . . . . . . . . . . . . . 3.2.2.1 Feature extracting . . . . . 3.2.2.2 Visual attention và LSTM 3.2.2.3 CTC loss . . . . . . . . . . 3.3 Tự động thêm dấu tiếng Việt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 23 25 25 25 26 26 26 27 Luận văn tốt nghiệp . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Trang 7/47 Ho Chi Minh University of Technology Faculty of Computer Science and Engineering 3.3.1 3.3.2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 27 27 28 29 29 29 4 Phương pháp thực hiện 4.1 Chuẩn bị tập dữ liệu . . . . . . . . . . . . . . . . . . . . . . . 4.1.1 Tập dữ liệu địa chỉ . . . . . . . . . . . . . . . . . . . . 4.1.2 Tập dữ liệu sinh thêm bằng phương pháp biến đổi ảnh 4.1.3 Tập dữ liệu sinh thêm bằng RNN . . . . . . . . . . . . 4.2 Mô hình sử dụng . . . . . . . . . . . . . . . . . . . . . . . . . 4.2.1 OpenNMT . . . . . . . . . . . . . . . . . . . . . . . . 4.2.2 Chi tiết mô hình . . . . . . . . . . . . . . . . . . . . . 4.3 Hướng tiếp cận . . . . . . . . . . . . . . . . . . . . . . . . . . 4.3.1 Phương pháp 1 . . . . . . . . . . . . . . . . . . . . . . 4.3.1.1 Thông số huấn luyện . . . . . . . . . . . . . 4.3.2 Phương pháp 2 . . . . . . . . . . . . . . . . . . . . . . 4.3.2.1 Thông số huấn luyện . . . . . . . . . . . . . 4.3.3 Môi trường huấn luyện . . . . . . . . . . . . . . . . . . 4.3.4 Dữ liệu . . . . . . . . . . . . . . . . . . . . . . . . . . 4.3.5 Nhãn huấn luyện . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 30 30 31 32 32 32 32 34 34 34 34 34 35 35 35 5 Đánh giá mô hình 5.1 Đánh giá . . . . . . . . . . . . 5.1.1 Tập dữ liệu . . . . . . . 5.1.2 Cách thức đo lường . . 5.1.3 Môi trường đánh giá . . 5.2 Kết quả . . . . . . . . . . . . . 5.2.1 Minh họa kết quả . . . . 5.2.2 Chi tiết số liệu . . . . . 5.2.2.1 Thông số huấn 5.2.2.2 Thời gian chạy 5.2.2.3 Độ chính xác . 5.3 Nhận xét . . . . . . . . . . . . 3.4 Giới thiệu . . . . . . . . Mô hình . . . . . . . . . 3.3.2.1 Character-level 3.3.2.2 Beam search . Image-to-markup Generation . 3.4.1 Giới thiệu . . . . . . . . 3.4.2 Mô hình . . . . . . . . . . . . . . . . . . . . . . . . . . . . . BiLSTM seq2seq . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36 36 36 36 37 37 37 38 38 38 38 39 6 Ứng dụng 6.1 Windows Presentation Foundation . . . . . 6.2 Tổng quan ứng dụng . . . . . . . . . . . . . 6.3 Mô tả ứng dụng . . . . . . . . . . . . . . . . 6.3.1 Deployment diagram . . . . . . . . . 6.3.2 Activity diagram . . . . . . . . . . . 6.3.2.1 Vẽ khung chứa chữ viết tay 6.3.2.2 Nhận diện chữ viết tay . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 40 40 41 41 42 42 43 Luận văn tốt nghiệp . . . . . . . . . . . . . . . . . . . . . . . . . . . . luyện . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Trang 8/47 Ho Chi Minh University of Technology Faculty of Computer Science and Engineering 6.4 Mockup . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.4.1 Vẽ khung chứa chữ viết tay . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.4.2 Nhận diện chữ viết tay . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 Tổng kết 7.1 Tổng quan luận văn . . . . . . . 7.1.1 Trong giai đoạn đề cương 7.1.2 Trong giai đoạn luận văn 7.2 Giới hạn và định hướng tương lai 7.2.1 Giới hạn . . . . . . . . . . 7.2.2 Định hướng tương lai . . Tài liệu tham khảo Luận văn tốt nghiệp . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44 44 45 46 46 46 46 46 46 46 47 Trang 9/47 Ho Chi Minh University of Technology Faculty of Computer Science and Engineering Chương 1 Tổng quan 1.1 Giới thiệu đề tài Hiện nay, với sự phát triển của công nghệ, tất cả các dữ liệu đang dần được số hóa và đưa lên lưu trữ đám mây. Điều này giúp cho việc truy cập hay tìm kiếm dữ liệu được tăng tốc đáng kể. Một ví dụ là hiện nay, nhà nước ta đã bắt đầu chuyển qua thẻ căn cước công dân có gắn chip, với mục đích sẽ nhận diện và truy cập dữ liệu nhanh chóng và tiện lợi hơn bao giờ hết. Các nước trên thế giới cũng đã sử dụng thông tin số hóa để tăng tốc và phát triển công việc. Tuy nhiên, trên phạm vi nước ta, văn bản viết tay vẫn được sử dụng nhiều. Các loại văn bản viết tay có thể kể đến là: hóa đơn, biểu mẫu, đơn viết tay,... Văn bản viết tay tại nước ta vẫn phổ biến do hạn chế về công nghệ ở một số vùng, đồng thời do nhiều người vẫn chưa có đủ kiến thức về công nghệ để sử dụng. Các văn bản viết tay dạng biểu mẫu hiện tại sẽ có thể được trích xuất nội dung để số hóa và đưa lên lưu trữ đám mây. Tuy nhiên, hiện không có cách nào để tự động hóa việc này, mà phải dùng sức người nhập lại từng thông tin lên máy tính. Do đó, em xin đề xuât một hệ thống có thể nhận diện chữ viết tay tiếng Việt. Đề tài sẽ chú trọng vào huấn luyện một mô hình học máy để nhận diện chữ viết tay tiếng Việt. Đồng thời, xây dựng một luồng xử lý các văn bản viết tay theo mẫu để có thể tự động nhận diện và tiền xử lý văn bản viết tay có mẫu, sau đó nhận diện được các chữ viết tay tiếng Việt trên đó. 1.2 Mục tiêu và phạm vi đề tài Mục tiêu của đề tài là có thể trích xuất chữ viết tay từ các văn bản tài liệu thực tế. Cụ thể, đề tài sẽ tập trung vào các điểm sau: • Huấn luyện một mô hình nhận diện chữ viết tay tiếng Việt, dựa trên các kỹ thuật học sâu. • Xây dựng luồng để xử lý các văn bản chứa chữ viết tay trên thực tế. Dựa trên mục đích chính của đề tài, phạm vi giới hạn của đề tài sẽ được khoanh vùng như sau: • Các chữ viết tay trên rõ ràng, không quá xấu hoặc quá nhiễu. • Các văn bản đưa vào hoặc là một form văn bản cố định, hoặc là ảnh scan của một câu tiếng Việt được viết thành hàng ngang. Luận văn tốt nghiệp Trang 10/47
- Xem thêm -

Tài liệu liên quan