CẢI THIỆN HIỆU QUẢ CỦA PHÁT HIỆN NGƯỜI TRONG ĐÁM ĐÔNG BẤT THƯỜNG SỬ DỤNG CHẮT LỌC TRI THỨC CHO MẠNG YOLO

Các tác giả

  • Đoàn Thị Hương Giang
  • Hồ Anh Dũng
  • Nguyễn Ngọc Trung
  • Nguyễn Trung Hiếu

Từ khóa:

Mạng nơ ron tích chập, học sâu, chắt lọc kiến thức, mô hình giáo viên - sinh viên, học chuyển giao.

Tóm tắt

Mạng nơ ron học sâu ngày càng thể hiện rõ ưu điểm vượt trội trong nhiều lĩnh vực khác nhau, như bài toán phát hiện đối tượng trong ảnh với mô hình mạng YOLO.
Mạng YOLO ngày càng được cải tiến để nâng cao hiệu quả và khắc phục nhược điểm của các phiên bản trước đó. Tuy nhiên, một vấn đề đặt ra là để mạng có thể đạt kết
quả cao hơn thì cấu trúc mạng phức tạp hơn, số lượng tham số nhiều hơn và điều đó khiến thời gian đáp ứng lâu hơn. Khi đó, để triển khai các bài toán có cấu hình máy
đơn giản sẽ đối mặt với nhiều hạn chế về tốc độ và độ chính xác. Đặc biệt với bài toán phát hiện người trong đám đông bất thường sẽ có số lượng người trong khung hình
khá nhiều, dày đặc và tốc độ di chuyển nhanh nên hệ thống phát hiện người trong ngữ cảnh này sẽ có độ chính xác thấp. Để đạt độ chính xác cao đòi hỏi mô hình có kiến
trúc phức tạp lại dẫn tới tốc độ xử lý chậm và yêu cầu máy tính có cấu hình cao. Trong nghiên cứu này, mô hình học chuyển giao tri thức mới từ nhiều mô hình YOLO cấu
hình cao sang mô hình YOLO cấu hình đơn giản hơn sử dụng cơ chế học chuyển giao có chắt lọc tri thức để mạng có kiến trúc nhẹ có thể học được các kiến thức của mạng
có kiến trúc phức tạp. Giải pháp đề xuất được thử nghiệm trên hai cơ sở dữ liệu đám đông bất thường. Kết quả đạt được cho thấy hệ thống của chúng tôi đạt kết quả tốt
hơn với giao thức đánh giá trên từng cơ sở dữ liệu riêng biệt và giao thức đánh giá chéo giữa các cơ sở dữ liệu khác nhau. Độ chính xác thử nghiệm cao hơn từ 1% đến
6,8% trong khi thời gian đáp ứng nhanh hơn 9,16ms khi chạy trên GPU.

Lượt tải

Chưa có dữ liệu tải xuống.

Lượt tải xuống

Đã Xuất bản

2024-06-03

Số

Chuyên mục

KHOA HỌC-CÔNG NGHỆ