Quy trình hoàn thành yêu cầu ngôn ngữ tự nhiên dựa trên metric-semantic map
Từ khóa:
Tóm tắt
Trong lĩnh vực robotic và các hệ thống tự hành, một yêu cầu ngôn ngữ tự nhiên có thể được hoàn thành bằng cách chuyển đổi nó thành các nhiệm vụ bậc cao và bậc thấp. Vậy để hoàn thành yêu cầu này, cả hai loại nhiệm vụ này đều phải được thực hiện, và làm sao để kết nối chúng hiệu quả. Tuy nhiên, vấn đề này vẫn còn đang được mở. Công trình này giới thiệu một quy trình hai giai đoạn (hình 1) bao gồm Comprehension và Implementation, dựa trên metric-semantic map để giải quyết vấn đề này. Trong giai đoạn Comprehension, còn gọi là lập kế hoạch tự động, yêu cầu ngôn ngữ tự nhiên được chuyển đổi thành một chuỗi kế hoạch bằng cách sử dụng thông tin ngữ nghĩa (semantic) từ bản đồ. Các kế hoạch này sau đó được chuyển sang giai đoạn Implementation, nơi các nhiệm vụ như điều hướng (navigation) hoặc thao tác (manipulation) được thực hiện bằng cách tận dụng thông tin hình học (metric) từ bản đồ. Hơn nữa, chúng tôi cũng đã tiến hành thử nghiệm để minh họa cách một yêu cầu ngôn ngữ tự nhiên được thực hiện trên một metric-semantic map cụ thể, đó là 3D Scene Graph, với trình tự hoàn chỉnh sau: từ việc tạo 3D Scene Graph đến khi nhận được kết quả là đường đi khả thi. Ngoài ra, công trình này cũng chỉ ra các hạn chế cần được khắc phục trong tương lai để cải thiện quy trình đã đề xuất.