KHAI THÁC LUẬT THIẾT YẾU NHẤT TỪ TẬP PHỔ BIẾN ĐÓNG Lê Hoài Bắc, Võ Đình Bảy Khoa Công nghệ Thông tin, Trường Đại học Khoa học Tự Nhiên Tóm tắt: Theo cách khai thác luật kết hợp truyền thống, việc tìm tất cả các luật kết hợp từ CSDL thỏa minSup và minConf gặp nhiều bất lợi khi số tập phổ biến lớn. Do đó cần có một phương pháp thích hợp để khai thác với số luật ít hơn nhưng vẫn bảo đảm tích hợp đầy đủ tất cả các luật của phương pháp khai thác truyền thống. Bài báo đề xuất thuật toán sinh luật thiết yếu nhất từ tập phổ biến đóng: chỉ lưu lại các luật có tiền kiện nhỏ nhất và hậu kiện lớn nhất theo quan hệ tập con. Thực nghiệm chứng tỏ tập luật kết quả khá nhỏ so với tập luật truyền thống, thời gian khai thác luật cũng nhanh hơn so với truyền thống bởi vì khai thác luật thiết yếu nhất dựa vào tập phổ biến đóng(FCI – Frequent Closed Itemsets) trong khi khai thác luật truyền thống dựa vào tập phổ biến (FI – Frequent Itemsets) mà |FCI| £ |FI|. MINING ESSENTIAL RULES USING FREQUENT CLOSED ITEMSETS. Le Hoai
Bac, Vo Đinh
Bay Faculty of Information
technology, Abstract According to the traditional association rules mining, finding all association rules satisfied minSup and minConf will face to many disadvantages in case of the large frequent itemsets. Thus, there is neccesary a suitable method for mining in number of fewer rules but make sure fully integrating rules of traditional methods. In this paper, we present an algorithm of generating essential rules from frequent closed itemsets: only stores rules having smallest antecedent and largest consequent based on parents-child relationship. Experimental shows that the resulted rule set is rarely as small as traditional set, the time for rule mining is also faster than the time for traditional because of mining essential rules based on frequent closed itemsets (FCI) whereas mining traditional rules based on frequent itemsets (FI) that satisfies |FCI| £ |FI|. |