Tài liệu Nhận dạng chữ viết tay mô hình markov ẩn

  • Số trang: 36 |
  • Loại file: PDF |
  • Lượt xem: 85 |
  • Lượt tải: 0
quangtran

Đã đăng 3721 tài liệu

Mô tả:

LOGO NHẬN DẠNG CHỮ VIẾT TAY MÔ HÌNH MARKOV ẨN Học viên : NGUYỄN MINH TRIẾT Giáo viên hướng dẫn : TS. VŨ ĐỨC LUNG www.themegallery.com NỘI DUNG 1 GiỚI THIỆU ĐỀ TÀI 2 TIỀN XỬ LÝ VÀ TRÍCH CHỌN ĐẶC TRƢNG 3 MÔ HÌNH MARKOV ẨN 4 ỨNG DỤNG MÔ HÌNH MARKOV ẨN NHẬN DẠNG CHỮ VIẾT TAY 5 CHƢƠNG TRÌNH DEMO COMPANY LOGO www.themegallery.com GiỚI THIỆU ĐỀ TÀI - Các bài toán nhận dạng đang được ứng dụng trong thực tế, hiện nay tập trung vào nhận dạng mẫu, nhận dạng tiếng nói và nhận dạng chữ… -Nhận dạng chữ viết tay là bài toán được quan tâm rất nhiều và nhận dạng ký tự không dấu đã đạt được nhiều thành công lớn. -Nhận dạng chữ viết tay tiếng Việt vẫn còn là vấn đề thách thức lớn đối với các nhà nghiên cứu. - Bài toàn này chưa thể giải quyết trọn vẹn được vì nó hoàn toàn phụ thuộc vào người viết và sự biến đổi quá đa dạng trong cách viết và trạng thái sức khỏe, tinh thần của từng người viết. COMPANY LOGO www.themegallery.com GiỚI THIỆU ĐỀ TÀI - Hiện nay có một số đề tài nghiên cứu nhận dạng chữ viết tay tiếng Việt như mạng Nơron, máy Vector hổ trợ…., tuy nhiên kết quả nhận dạng lại không cao . Đó là lý do em chọn đề tài này với mong muốn nâng cao kết quả nhận dạng đặc biệt là tiếng Việt. Trong đề tài tập trung vào nghiên cứu nhận dạng các ký tự viết tay tiếng Việt đơn lẽ bằng mô hình Markov ẩn. COMPANY LOGO www.themegallery.com QUI TRÌNH THỰC HIỆN Qui trình nhận dạng chữ viết tay đƣợc thực hiện qua các bƣớc nhƣ sau : COMPANY LOGO www.themegallery.com TIỀN XỬ LÝ VÀ TRÍCH CHỌN ĐẶC TRƯNG 1. Chuyển xám - Mục đích : Chuyển ảnh màu về ảnh đa cấp xám. Ví dụ : Chuyển xám Trước khi chuyển xám Sau khi chuyển xám COMPANY LOGO www.themegallery.com TIỀN XỬ LÝ VÀ TRÍCH CHỌN ĐẶC TRƯNG -Thuật toán trung bình cộng : Ý tưởng của thuật toán như sau: Tính trung bình cộng giá trị của 1pixel, sau đó gán lại giá trị trung bình cộng đó cho RGB. Ví dụ:Quá trình chuyển xám như sau : TBC=(145+254+43)/3 = 147 Sau đó gán lại giá trị 147 cho R,G,B. Pixel mới được mô tả như sau Như vậy ảnh đã được chuyển về ảnh đa cấp xám COMPANY LOGO www.themegallery.com TIỀN XỬ LÝ VÀ TRÍCH CHỌN ĐẶC TRƯNG 2. Phân ngƣỡng - Mục đích: Chuyển ảnh đầu vào thành ảnh đen trắng (là ảnh có các pixel chỉ mang giá trị 0 hoặc 255) - Thuật toán trung bình cộng: Sau khi tính được giá trị TBC như phần 1 ta đem so sánh với ngưỡng . COMPANY LOGO www.themegallery.com TIỀN XỬ LÝ VÀ TRÍCH CHỌN ĐẶC TRƯNG Ngưỡng là một số nằm trong khoảng từ 0255. Trong bài này đang đặt ngưỡng là 128 Thuật toán này cụ thể như sau:  Nếu TBC < 0: Gán giá trị R,G,B = 0  Nếu TBC > 255: Gán giá trị R,G,B = 255  Nếu TBC < Ngưỡng: Gán giá trị RGB = 0  Nếu TBC >= Ngưỡng: Gán giá trị RGB=255 COMPANY LOGO www.themegallery.com TIỀN XỬ LÝ VÀ TRÍCH CHỌN ĐẶC TRƯNG 3. Lọc nhiễu  Áp dụng bộ lọc Median - Mục đích: Lọc nhiễu đốm, nhiễu muối tiêu sau khi đã phân ngưỡng ảnh. -Với những ảnh đầu vào là ảnh scan hoặc ảnh chụp từ điện thoại hoặc máy ảnh, sau khi phân ngưỡng hay có các điểm đen lốm đốm nằm rải rác trên toàn bộ vùng ảnh. - Các điểm này gọi là nhiễu, mục đích của bộ lọc median là loại bỏ các điểm nhiễu này. COMPANY LOGO Med  n 2 www.themegallery.com TIỀN XỬ LÝ VÀ TRÍCH CHỌN ĐẶC TRƯNG Kỹ thuật lọc trung vị Giả sử ta có ảnh I, điểm ảnh P, cửa sổ w(p) và ngưỡng Khi đó lọc trung vị gồm các bước sau : Bước 1 : Tính trung vị ᶲ {I (q) / q  W ( p)}   Med ( p) Bước 2 : Gán giá trị I ( p) Neu / I ( p)  Med ( p) /   I kq ( p)   Med ( p) Neu / I ( p)  Med ( p) /   COMPANY LOGO Med2n2 www.themegallery.com TIỀN XỬ LÝ VÀ TRÍCH CHỌN ĐẶC TRƯNG Ví dụ :Cho ảnh I, điểm ảnh W(3x3), ngưỡng   2    I     1 0 1 4 1 2   2 4 31 7 4 1  2 1 4 2 2 7   7 2 0 4 1 2  Med     I kq      n 4  2 2 2 1 0 1 4 1 2   2 4 4 4 4 1  2 1 4 2 2 2   4 2 0 4 1 2  COMPANY LOGO www.themegallery.com TIỀN XỬ LÝ VÀ TRÍCH CHỌN ĐẶC TRƯNG 4.Phát hiện biên và tách chữ Mục đích: Tách riêng phần ảnh chứa ký tự từ ảnh đầu vào, loại bỏ phần dư thừa. Ví dụ :1 ảnh đầu vào như sau: Trước khi phát hiện biên Sau khi phát hiện biên COMPANY LOGO  www.themegallery.com TIỀN XỬ LÝ VÀ TRÍCH CHỌN ĐẶC TRƯNG - Để làm được điều này ta phải đi tìm các điểm cận của ký tự bao gồm: + Cận trên (Top) + Cận dưới (Bottom) + Cận trái (Left) + Cận phải (Right) - Vì ảnh sau khi đã qua tiền xử lý là ảnh chỉ bao gồm 2 giá trị : + 0: Biểu diễn bởi màu đen + 255: Biểu diễn bởi màu trắng COMPANY LOGO www.themegallery.com TIỀN XỬ LÝ VÀ TRÍCH CHỌN ĐẶC TRƯNG Tìm cận trên (Top) Ý tưởng: Quét ảnh theo chiều ngang từ trên xuống dưới. Đến khi nào gặp điểm đen đầu tiên thì dừng lại đó là điểm cận trên. Tìm cận dƣới (Bottom) Ý tưởng: Quét ảnh theo chiều ngang từ dưới lên trên. Đến khi nào gặp điểm đen đầu tiên thì dừng lại đó là điểm cận dưới. COMPANY LOGO www.themegallery.com TIỀN XỬ LÝ VÀ TRÍCH CHỌN ĐẶC TRƯNG Tìm cận trái (Left) Ý tưởng: Quét ảnh theo chiều dọc từ trái sang phải. Đến khi nào gặp điểm đen đầu tiên thì dừng lại đó là điểm cận trái. Tìm cận phải (Right) Ý tưởng: Quét ảnh theo chiều dọc từ phải sang trái . Đến khi nào gặp điểm đen đầu tiên thì dừng lại đó là điểm cận phải. Sau khi tìm được 4 điểm cận. Ta cắt ảnh theo 4 tọa độ vừa tìm được thì sẽ thu được vùng chỉ chứa ký tự. COMPANY LOGO www.themegallery.com TIỀN XỬ LÝ VÀ TRÍCH CHỌN ĐẶC TRƯNG 5.Chỉnh nghiên : Áp dụng phương pháp tia quay (project profile) Ví dụ : Cách tính góc nghiêng như sau: - Xoay ảnh trong 1 khoảng từ góc a1a2 - Bước nhảy là 1 góc b - Ảnh đầu vào từ vị trí 1 xoay đến vị trí 4 và mỗi bước xoay 1 góc là b, sau mỗi lần xoay tính toán lại trọng số của ảnh . - Tính max của các trọng số. - Ở bước xoay nào trọng số đạt giá trị max thì đó là góc xoay cần tính của ảnh COMPANY LOGO www.themegallery.com TIỀN XỬ LÝ VÀ TRÍCH CHỌN ĐẶC TRƯNG 6. Trích chọn đặc trƣng •Mục đích: Trích ra các đặc trƣng của ảnh để quá trình nhận dạng chính xác. - Đồng nhất các ảnh về cùng kích thước (20*30) - Chia ảnh thành các vùng mang những đặc trưng của ảnh đó, ta chia chiều dọc thành 3 đoạn chiều ngang thành 3 đoạn : - Sau khi chia ký tự thành các đoạn ta tính lại pixel ảnh . Mỗi vùng sẽ mang các vector đặc trưng riêng COMPANY LOGO www.themegallery.com TIỀN XỬ LÝ VÀ TRÍCH CHỌN ĐẶC TRƯNG Marketing Diagram 7)Lƣợng tử hóa - Đọc toàn bộ pixel ảnh của ký tự. Tại những pixel mầu đen giá trị lượng tử là 1. - Tại những pixel mầu trắng giá trị lượng tử là 0. Lúc này dữ liệu ảnh sẽ chỉ còn là 0 và 1. - Trương trình sẽ tính toán và tiến hành nhận dạng trên giá trị nhị phân này. COMPANY LOGO •Ví dụ kết quả của ảnh sau khi lượng tử www.themegallery.com TIỀN XỬ LÝ VÀ TRÍCH CHỌN ĐẶC TRƯNG Ví dụ :Kết quả của ảnh sau khi lượng tử : COMPANY LOGO
- Xem thêm -