KHAI THÁC ĐỒ THỊ CON PHỔ
BIẾN TRÊN TẬP DỮ LIỆU ĐỒ
THỊ Nguyễn
Hoàng Tú Anh, Nguyễn Đình Hoàng Tân Khoa Công nghệ Thông tin, Trường Đại học Khoa học Tự Nhiên Tóm tắt Trong vài năm gần đây, bài toán khai thác đồ thị con phổ biến là bài toán được nhiều người quan tâm và nghiên cứu trong lĩnh vực khai thác dữ liệu. Bài toán này đặc biệt có ý nghĩa trong các ứng dụng sinh, hóa học, khai thác weblog, phân loại, phân tích mạng xã hội,… Bài báo này tập trung tìm hiểu các thuật toán khai thác đồ thị con phổ biến trên tập dữ liệu đồ thị. Chúng tôi tổng hợp, phân tích các thuật toán thuộc ba hướng tiếp cận khác nhau: dựa theo nguyên lý Apriori, dựa trên nguyên lý phát triển mẫu và kết hợp hai nguyên lý trên. Chúng tôi tiến hành cài đặt các thuật toán, thử nghiệm trên các tập dữ liệu khác nhau và đánh giá kết quả. MINING FREQUENT SUBGRAPHS FROM GRAPH DATASETS Nguyen
Hoang Tu Anh, Nguyen Đinh Hoang Tan Faculty of Information
technology, Abstract In recent years, frequent
subgraph mining is an active research topic in the data mining community.
Mining frequent subgraphs has wide-range application areas such as biology, chemistry, web log
mining, document classification, social web… In this paper we investigate
approach for frequent subgraph mining in graph datasets. Our research focuses
on three approaches: Apriori-like level-wise principle, growth-pattern
principle, and combining these principles. We implemented these algorithms,
tested, and evaluated them in various datasets. |