SỬ DỤNG DIFFSET ĐỂ KHAI THÁC TẬP ĐÓNG ĐƯỢC GÁN TRỌNG PHỔ BIẾN TRÊN CƠ SỞ DỮ LIỆU SỐ LƯỢNG

Các tác giả

  • Trần Như Ý
  • Nguyễn Văn Tùng
  • Ngô Dương Hà

Tóm tắt

Khai thác tập phổ biến đóng vai trò quan trọng trong khai thác luật kết hợp. Đối với cơ sở dữ liệu số lượng, khai thác tập đóng được gán trọng phổ biến (FWCIs) là một trong những phương pháp khai thác tập phổ biến đã được tác giả đề xuất. Tuy nhiên đối với cơ sở dữ liệu dày đặc, thời gian khai thác tập phổ biến (FWCIs) vẫn còn cao. Trong bài báo này, tác giả đề xuất thuật toán sử dụng diffset để khai thác tập đóng được gán trọng phổ biến (FWCIs-DIFF). Dựa trên cơ sở các định lý và tính chất, tác giả đề xuất thuật toán (FWCIs-DIFF). Kết quả thực nghiệm cho thấy, với cơ sở dữ liệu dày đặc thời gian khai thác của (FWCIs-DIFF) là nhanh hơn so với (FWCIs).
Từ khóa: khai thác tập phổ biến, khai thác tập đóng được gán trọng phổ biến, diffset

Lượt tải

Chưa có dữ liệu tải xuống.

Đã Xuất bản

2020-02-27

Số

Chuyên mục

Bài viết