KHAI THÁC LUẬT THIẾT YẾU NHẤT
TỪ DÀN TẬP PHỔ BIẾN ĐÓNG
Lê Hoài Bắc, Võ Đình Bảy
Khoa Công nghệ Thông tin, Trường Đại học Khoa học Tự nhiên – ĐHQG Tp. HCM
lhbac@fit.hcnuns.vn,
vodinhbay@yahoo.com
Tóm tắt
Theo cách khai thác luật kết hợp truyền thống, việc tìm tất
cả các luật kết hợp từ CSDL thỏa minSup và minConf gặp nhiều bất lợi khi số tập
phổ biến lớn. Do đó cần có một phương pháp thích hợp để khai thác với số luật ít
hơn nhưng vẫn bảo đảm tích hợp đầy đủ tất cả các luật của phương pháp khai thác
truyền thống. Một trong những cách tiếp cận đó là khai thác luật thiết yếu nhất
(Essential rules): chỉ lưu lại các luật có vế trái tối tiểu và vế phải tối đại (theo
quan hệ cha – con). Bài báo trình bày thuật toán sinh luật thiết yếu nhất từ dàn
tập phổ biến đóng với mong muốn làm giảm thời gian khai thác luật.
Từ khoá: tập phổ biến đóng, Minimal generator, luật truyền
thống, luật thiết yếu nhất, dàn tập đóng.
MINING ESSENTIAL RULES USING FREQUENT CLOSED ITEMSET LATTICE
Le Hoai Bac, Vo Dinh Bay
Faculty of Information Technology, University of Science – VNU HCMC
lhbac@fit.hcnuns.vn,
vodinhbay@yahoo.com
Abstract
According to the traditional association rules mining,
finding all association rules satisfied minSup and minConf will face to many
disadvantages in case of the large frequent itemsets. Thus, there is necessary a
suitable method for mining in number of fewer rules but make sure fully
integrating rules of traditional methods. In this paper, we propose a method for
mining essential rules by using freauent closed itemset lattice. Its advantage
is time reduction comparing with other similar methods.
Key words: Frequent Closed Itemset, Minimal generator,
Traditional Association Rules, Essential Association Rules, Frequent Closed
Itemset Lattice.
|