Tài liệu Nghiên cứu giải pháp và xây dựng phần mềm thử nghiệm chuyển các dòng văn bản tiếng việt trong hình ảnh sang văn bản dạng text (2)

  • Số trang: 5 |
  • Loại file: PDF |
  • Lượt xem: 46 |
  • Lượt tải: 0
nhattuvisu

Đã đăng 27125 tài liệu

Mô tả:

MỤC LỤC Trang Chƣơng 1 - GIỚI THIỆU ĐỀ TÀI 1.1 1.2 1.3 1.4 Đặt vấn đề ........................................................................................................ 1 Mô hình giải quyết bài toán ............................................................................. 2 Mức độ phức tạp của bài toán.......................................................................... 3 Phạm vi luận văn ............................................................................................. 4 Chƣơng 2 – PHÂN ĐOẠN ẢNH VĂN BẢN Nhị phân hoa ảnh số ........................................................................................ 5 Thành phần liên thông ..................................................................................... 7 2.2.1 Khái niệm điểm lân cận ........................................................................ 7 2.2.2 Thành phần liên thông .......................................................................... 7 2.3 Phép chiếu và các profile ................................................................................. 8 2.4 Đồ thị kề khối ................................................................................................ 10 2.5 Lọc nhiễu ....................................................................................................... 16 2.6 Tách đoạn....................................................................................................... 18 2.6.1 Tách liên thông bằng kỹ thuật đệ quy................................................. 19 2.6.2 Giải thuật cải tiến ................................................................................ 20 2.7 Xử lý nghiên .................................................................................................. 21 2.8 Tách dòng ...................................................................................................... 13 2.8.1 Tách dòng dựa vào thành phần liên thông .......................................... 23 2.9 Tách từ ........................................................................................................... 24 2.10 Tách ký tự ...................................................................................................... 25 2.11 Chuần kích thước ........................................................................................... 26 2.11.1 Lắp khoảng trống ảnh bằng phép đóng morphology .......................... 26 2.1 2.2 Chƣơng 3 - TRÍCH CHỌN ĐẶC TRƢNG VÀ NHẬN DẠNG 3.1 3.2 Trích chọn đặc trưng ...................................................................................... 28 3.1.1 Trích chọn đặc trưng theo cấu trúc ..................................................... 28 3.1.2 Trích chọn đặc trưng theo hướng hình học......................................... 31 Tổng quan về xây dựng và huấn luyện mạng neural ..................................... 33 3.2.1 Mô hình của một neural nhân tạo ....................................................... 33 3.2.2 Các kiểu hoc với mạng neural ............................................................ 48 3.2.3 Tổng quan về các thuật toán học ........................................................ 37 Chƣơng 4 – XÂY DỰNG PHẦN MỀM 4.1 4.2 Sơ đồ xử lý của chương trình ........................................................................ 40 Xây dựng chương trình .................................................................................. 41 4.2.1 Môi trường phát triển .......................................................................... 41 4.2.2 Sơ đồ thiết kế ...................................................................................... 41 4.2.3 Các engine xử dụng trong chương trình ............................................. 42 4.2.4 Danh sách các class chính .................................................................. 42 Chƣơng 5 – THỬ NGHIỆM VÀ ĐÁNH GIÁ KẾT QUẢ 5.1 Thử nghiệm ...................................................................................................... 43 5.2 Đánh giá kết quả ............................................................................................ 46 KẾT LUẬN VÀ HƢỚNG PHÁT TRIỂN Kết luận..................................................................................................................... 47 Hướng phát triển ....................................................................................................... 47 Tài liệu tham khảo .................................................................................................... 48 DANH MỤC CÁC HÌNH VẺ, SƠ ĐỒ Hình 1.1 Sơ đồ hệ nhận dạng văn bản tiếng việt ........................................................ 2 Hình 1.2 Ảnh hưởng của chất lượng văn bản đến kết quả nhận dạng........................ 4 Hình 2.1 Ví dụ điểm ảnh ............................................................................................ 5 Hình 2.2 Ví dụ chuyển ảnh đa mức xám sang ảnh nhị phân ...................................... 5 Hình 2.3 Ví dụ về lân cận 4 và lân cận 8 .................................................................... 7 Hình 2.4 Ví dụ về thành phần liên thông 4 ................................................................ 8 Hình 2.5 Ví dụ về thành phần liên thông 8 ................................................................ 8 Hình 2.6 Profile phép chiếu ngang ............................................................................. 9 Hình 2.7 Các Profile chiếu ngang và dọc của một ảnh văn bản ............................... 10 Hình 2.8 Đồ thị BAG ................................................................................................ 11 Hình 2.9 Hình bao liên thông .................................................................................. 12 Hình 2.10 Quy trình tách văn bản đã được chuẩn hóa ............................................. 13 Hình 2.11 Khoảng cách theo chiều ngang và theo chiều dọc................................... 15 Hình 2.12 Một ảnh văn bản trước và sau khi được lọc nhiễu muối tiêu .................. 16 Hình 2.13Mô hình nhiễu cộng .................................................................................. 17 Hình 2.14 Phân tích top-down .................................................................................. 19 Hình 2.15Gán nhãn cho thành phần liên thông ........................................................ 21 Hình 2.16 Đường thẳng Hough trong tọa độ cực ..................................................... 22 Hình 2.17 Biến đổi Hough phát hiện góc ngiêng ..................................................... 23 Hình 2.18 Biểu đồ phân cách của ngưỡng................................................................ 24 Hình 2.19 Các vị trí chính xác, vị trí cắt nhập nhằng ............................................... 25 Hình 3.1 Ảnh ban đầu và ảnh sau khi được bao ....................................................... 32 Hình 3.2 Mặt na Sobel theo hai hướng X và Y ........................................................ 32 Hình 3.3 Mô hình neural sinh học ............................................................................ 35 Hình 4.1 Sơ đồ xử lý của chương trình .................................................................... 40 Hình 4.2 Sơ đồ thiết kế của chương trình ................................................................. 41 Hình 5.1 Ảnh văn bản đầu vào đơn cột, kiểu font: Arial, Cambria, Times New Roman, Tahoma, cỡ font: 16 cho kết quả nhận dạng chính xác 100% .................... 43 Hình 5.2 Chương trình cho phép lựa chọn vùng ảnh cần nhận dạng ....................... 44 Hình 5.3 Chương trình nhận dạng tốt đối với các ảnh văn bản có chèn hình .......... 44 DANH MỤC CÁC BẢNG Bảng 3.1 Các luật về đặc trưng cấu trúc ................................................................... 29 Bảng 4.1 Danh sách các class chính trong chương trình .......................................... 42 Bảng 5.1 Thử nghiệm chương trình với font Times New Roman ........................... 45 Bảng 5.2 Thử nghiệm chương trình với font Arial .................................................. 46 LỜI MỞ ĐẦU Những năm gần đây, nhu cầu số hóa tài liệu ngày càng bùng nổ. Hiện nay ở nước ta, tất cả các yêu cầu về lưu trữ tài liệu, dịch thuật tự động…đều có thể thực hiện tốt nếu có một phần mệm nhận dạng chữ in tiếng Việt hiệu quả, có độ chính xác cao và độ thực thi nhanh. Hiện tại trên thị trường đã có một số phần mềm nhận dạng chữ in tiếng Việt, tuy nhiên kết quả nhận được còn có nhiều hạn chế. Do đó việc nghiên cứu phương pháp để xây dựng một hệ nhận dạng văn bản tiếng Việt là vấn đề hết sức quan trọng và có ý nghĩa cao trong thực tiễn. Dó là lý do tôi chọn đề tài” Nghiên cứu giải pháp và xây dựng phần mềm thử nghiệm chuyển các dòng văn bản tiếng việt trong hình ảnh sang văn bản dạng text” để làm đề tài nghiên cứu khoa học, đề tài chia thành 5 chương với các nội dung sau: Chƣơng 1 – Giới thiệu đề tài: đặt vấn đề, giới thiệu những công trình liên quang, đưa ra mô hình đã giải quyết bài toán, và những khó khăn cần phải giải quyết, phạm vi của đề tài. Chuong 2 – Phân đoạn ảnh văn bản: trình bài các khái niệm cơ sở của ảnh văn bản. Nêu ra các bước tiến hành để lọc nhiểu, chình nghiên, tách lấy phần văn bản từ ảnh và phân thành các đoạn, các dòng, các ký tự. Chƣơng 3 – Trích chọn đặc trƣng và nhận dạng: trình bài thuật toán trích chọn lấy những phần tiêu biểu, đặc trưng trong một ký tự để làm đầu vào của một mô hình học máy. Trình vài cách thức dùng mạng Neural để huấn luyện nhận dạng các ký tự. Chƣơng 4 – Xây dựng phần mềm: trình bài sơ đồ xây dựng và quy trình xử lý của chương trình, liệt kê môt số class chính. Chƣơng 5 – Thử nghiệm và đánh giá kết quả: thử nghiệm chương trình trên nhiều dữ liệu khác nhau, có so sách với các chương trình khác. Luận văn đã tập trung nghiên cứu lý thuyết về bài toán nhận dạng chữ in tiếng việt và đã cài đặt chương trình với độ chính xác khá cao và tốc độ tương đối nhanh đối với các văn bản tiếng Việt trên nhiều kiểu font và cỡ font khác nhau. Trong tương lai, tôi sẽ cố gắng hoàn thiện và phát triển thêm các chức năng của chương trình để xây dựng một phiên bản có thể thực thi trên các nền tảng điện thoại di động.
- Xem thêm -