Nhận dạng văn bản tiếng Việt trong ảnh ngoại cảnh bằng học sâu

Các tác giả

  • Huỳnh Văn Huy Trường Đại học Lạc Hồng image/svg+xml
  • Nguyen Thi Thanh Tan Trường Đại học Điện lực image/svg+xml
  • Ngô Quốc Tạo Viện Công nghệ thông tin, Viện Hàn lâm Khoa học và Công nghệ Việt Nam

Từ khóa:

Tóm tắt

Bài báo này đề xuất một phương pháp hiệu quả để nhận dạng văn bản tiếng Việt trong ảnh ngoại cảnh. Phương pháp được đề xuất dựa trên ý tưởng kết hợp ba luồng xử lý đồng thời trong một công đoạn nhận dạng, bao gồm: (i) Nhận dạng (dự đoán) chuỗi ký tự từ hình ảnh; (ii) Xử lý ngữ cảnh; (iii) Hợp nhất và hiệu chỉnh lỗi. Hiệu quả của phương pháp được kiểm nghiệm trên hai tập dữ liệu ảnh ngoại cảnh được thu thập từ thực tế VinText và VnSceneText. Các kết quả thực nghiệm cho thấy phương pháp có khả năng phát hiện được các văn bản có hình dạng và kích thước bất kỳ với độ chính xác cao và ổn định. Cụ thể, phương pháp đạt độ chính xác mức từ (word accuracy), độ chính xác mức ký tự (character accuracy) là (81.87%, 93.02%) và (82.56%, 94.33%) lần lượt trên hai tập dữ liệu thử nghiệm.

Lượt tải

Chưa có dữ liệu tải xuống.

Đã Xuất bản

2023-10-24

Số

Chuyên mục

Tổng quan