KHAI THÁC LUẬT THIẾT YẾU NHẤT

KHAI THÁC LUẬT THIẾT YẾU NHẤT

TỪ TẬP PHỔ BIẾN ĐÓNG

 

Hoài Bắc,  Đình  Bảy

Khoa Công nghệ Thông tin, Trường Đại học Khoa học Tự Nhiên

 

Tóm tắt: 

 

           Theo cách khai thác luật kết hợp truyền thống, việc tìm tất cả các luật kết hợp từ CSDL thỏa minSup minConf gặp nhiều bất lợi khi số tập phổ biến lớn. Do đó cần một phương pháp thích hợp để khai thác với số luật ít hơn nhưng vẫn bảo đảm tích hợp đầy đủ tất cả các luật của phương pháp khai thác truyền thống. Bài báo đề xuất thuật toán sinh luật thiết yếu nhất từ tập phổ biến đóng: chỉ lưu lại các luật tiền kiện nhỏ nhất hậu kiện lớn nhất theo quan hệ tập con.  Thực nghiệm chứng tỏ tập luật kết quả khá nhỏ so với tập luật  truyền thống, thời gian khai thác luật cũng nhanh hơn so với truyền thống bởi khai thác luật thiết yếu nhất dựa vào tập phổ biến đóng(FCI – Frequent Closed Itemsets) trong khi khai thác luật truyền thống dựa vào tập phổ biến (FI – Frequent Itemsets) |FCI| £ |FI|.

 

 

 

 

 

 

 

 

MINING ESSENTIAL RULES

USING FREQUENT CLOSED ITEMSETS.

 

Le Hoai Bac, Vo Đinh Bay

Faculty of Information technology, University of Natural Sciences

 

Abstract

 

            According to the traditional association rules mining, finding all association rules satisfied minSup and minConf will face to many disadvantages in case of the large frequent itemsets. Thus, there is neccesary a suitable method for mining in number of fewer rules but make sure fully integrating rules of traditional  methods. In this paper, we present an algorithm of generating essential rules from frequent closed itemsets: only stores rules having smallest antecedent and largest consequent based on parents-child relationship. Experimental shows that the resulted rule set is rarely as small as traditional set, the time for rule mining is also faster than the time for traditional because of mining essential rules based on frequent closed itemsets (FCI) whereas mining traditional rules based on frequent itemsets (FI) that satisfies |FCI| £ |FI|.