Điều khiển trượt dựa trên học tăng cường trong điều khiển bám quỹ đạo của máy bay không người lái dưới các nhiễu bất định
Từ khóa:
Tóm tắt
Bài báo đề xuất phương pháp điều khiển trượt (SMC) dựa trên học tăng cường (RL) để điều khiển bám quỹ đạo của quadrotor UAV (QUAV) dưới tác động của nhiễu bên ngoài. Đầu tiên, một bộ điều khiển trượt dựa trên học tăng cường actor-critic (actor-critic RL) được giới thiệu để giải quyết bài toán điều khiển tối ưu trong điều kiện không có nhiễu. Tiếp theo, mô phỏng trong môi trường có nhiễu được thực hiện nhằm chứng minh tính bền vững của bộ điều khiển được đề xuất. Phân tích lý thuyết cho thấy sai số vị trí và góc của UAV hội tụ về một miền đặt trước, trong khi sai số ước lượng của mạng actor-critic được giới hạn cuối cùng một cách thống nhất (uniformly ultimately bounded - UUB). Cuối cùng, một phân tích so sánh mô phỏng số giữa bộ điều khiển đề xuất, bộ điều khiển trượt truyền thống và bộ điều khiển trượt kết hợp kỹ thuật Backstepping (BSP) được thực hiện để làm rõ các ưu điểm và hiệu suất cải thiện của SMC dựa trên RL.