Xây dựng bộ dữ liệu tiếng Việt cho bài toán trả lời câu hỏi trực quan (Visual Question Answering)

Các tác giả

  • Vĩnh Anh Nghiêm Quân
  • Nguyễn Thị Lan Anh
  • Nguyễn Lê Trung Thành
  • Đinh Thị Diệu Minh

Từ khóa:

Tóm tắt

Tóm tắt: Bài toán trả lời câu hỏi trực quan (VQA) là bài toán kết hợp thị giác máy tính và xử lý ngôn ngữ tự nhiên. Trong bài báo này, chúng tôi trình bày các chiến lược xây dựng bộ dữ liệu VQA mới bằng tiếng Việt, Flickr8k-ViQA, bằng cách sinh tự động các cặp câu hỏi – câu trả lời từ những chú thích của bộ dữ liệu Flickr8k. Chúng tôi mô tả các công cụ đã sử dụng, phân tích những trở ngại gặp phải trong quá trình xây dựng và cách khắc phục, đồng thời đề xuất cách đánh giá các mô hình trên bộ dữ liệu này.

 

Lượt tải

Chưa có dữ liệu tải xuống.

Đã Xuất bản

2021-12-20