Vietnamese text recognition in scene images using deep learning

Huynh Van Huy; Nguyen Thi Thanh Tan; Ngo Quoc Tao

Các tác giả

Huỳnh Văn Huy Trường Đại học Lạc Hồng
Nguyen Thi Thanh Tan Trường Đại học Điện lực
Ngô Quốc Tạo Viện Công nghệ thông tin, Viện Hàn lâm Khoa học và Công nghệ Việt Nam

Từ khóa:

Tóm tắt

Bài báo này đề xuất một phương pháp hiệu quả để nhận dạng văn bản tiếng Việt trong ảnh ngoại cảnh. Phương pháp được đề xuất dựa trên ý tưởng kết hợp ba luồng xử lý đồng thời trong một công đoạn nhận dạng, bao gồm: (i) Nhận dạng (dự đoán) chuỗi ký tự từ hình ảnh; (ii) Xử lý ngữ cảnh; (iii) Hợp nhất và hiệu chỉnh lỗi. Hiệu quả của phương pháp được kiểm nghiệm trên hai tập dữ liệu ảnh ngoại cảnh được thu thập từ thực tế VinText và VnSceneText. Các kết quả thực nghiệm cho thấy phương pháp có khả năng phát hiện được các văn bản có hình dạng và kích thước bất kỳ với độ chính xác cao và ổn định. Cụ thể, phương pháp đạt độ chính xác mức từ (word accuracy), độ chính xác mức ký tự (character accuracy) là (81.87%, 93.02%) và (82.56%, 94.33%) lần lượt trên hai tập dữ liệu thử nghiệm.

Lượt tải

Chưa có dữ liệu tải xuống.

Nhận dạng văn bản tiếng Việt trong ảnh ngoại cảnh bằng học sâu

Các tác giả

Từ khóa:

Tóm tắt

Lượt tải

Đã Xuất bản

Số

Chuyên mục

Ngôn ngữ

Thông tin

Tạp chí Khoa học Việt Nam Trực tuyến - Vietnam Journals Online