Luận án Phát triển một số thuật toán hiệu quả khai thác tập mục trên cơ sở dữ liệu số lượng có sự phân cấp các mục
Các kết quả thử nghiệm cho thấy hiệu quả của IWS trên các CSDL thưa (RETAIL, MBS-POS) và các CSDL trung bình (các CSDL SALE-FACT), còn trên các CSDL dày (CONNECT, ACCIDENT) thì DIFFSET có hiệu quà rõ rệt, do với các CSDL dày thì tidset cùa các lập mục lớn, nên diffset sè nhỏ (do diffset lấy phần bù).
Đối với các CSDL thưa và trung bình, số lượng các mục xuất hiện trên các giao dịch không quá nhiều, do dó IWS cùa các lập mục sè loại bó được nhiều word có giá trị = 0 trong biêu diễn tidset cùa nó, nên IWS sè không quá lớn, đồng nghía với số lượng doạn của IWS là nhỏ. Do vậy, việc xác dịnh giao IWS của các tập mục là rất nhanh (do độ phức tạp thuật toán xác dịnh giao phụ thuộc vào số lượng các doạn của các IWS), dẫn đê thời gian khai thác khi sứ dụng IWS là nhỏ so với DBV hay DIFFSET.
Các file đính kèm theo tài liệu này:
- tv_phat_trien_mot_so_thuat_toan_hieu_qua_khai_thac_tap_muc_tren_co_so_du_lieu_so_luong_co_su_phan_ca.pdf