KHAI THÁC ĐỒ THỊ CON PHỔ BIẾN

KHAI THÁC ĐỒ THỊ CON PHỔ BIẾN

TRÊN TẬP DỮ LIỆU ĐỒ THỊ

                 

Nguyễn Hoàng Tú Anh, Nguyễn Đình Hoàng Tân

                  Khoa Công nghệ Thông tin, Trường Đại học Khoa học Tự Nhiên

 

Tóm tắt

 

            Trong vài năm gần đây, bài toán khai thác đồ thị con phổ biến là bài toán được nhiều người quan tâm và nghiên cứu trong lĩnh vực khai thác dữ liệu. Bài toán này đặc biệt có ý nghĩa trong các ứng dụng sinh, hóa học, khai thác weblog, phân loại, phân tích mạng xã hội,… Bài báo này tập trung tìm hiểu các thuật toán khai thác đồ thị con phổ biến trên tập dữ liệu đồ thị. Chúng tôi tổng hợp, phân tích các thuật toán thuộc ba hướng tiếp cận khác nhau: dựa theo nguyên lý Apriori, dựa trên nguyên lý phát triển mẫu và kết hợp hai nguyên lý trên. Chúng tôi tiến hành cài đặt các thuật toán, thử nghiệm trên các tập dữ liệu khác nhau và đánh giá kết quả.

 

 

 

 

 

 

 

 

 

 

MINING FREQUENT SUBGRAPHS FROM GRAPH DATASETS

                 

Nguyen Hoang Tu Anh, Nguyen Đinh Hoang Tan

                  Faculty of Information technology, University of Natural Sciences

 

Abstract

 

          In recent years, frequent subgraph mining is an active research topic in the data mining community. Mining frequent subgraphs has wide-range application areas such as biology, chemistry, web log mining, document classification, social web… In this paper we investigate approach for frequent subgraph mining in graph datasets. Our research focuses on three approaches: Apriori-like level-wise principle, growth-pattern principle, and combining these principles. We implemented these algorithms, tested, and evaluated them in various datasets.