Luận văn ThS: Khai thác tập mục lợi ích cao

Luận văn Khai thác tập mục lợi ích cao nghiên cứu về khám phá tri thức và khai thác dữ liệu cho Cơ Sở Dữ Liệu lớn có lợi ích đi kèm; nghiên cứu và triển khai các thuật toán khai thác itemset lợi ích; lập trình kiểm thử và so sánh hai thuật toán HUI - Miner và FHM.

Luận văn ThS: Khai thác tập mục lợi ích cao

1. Nội dung

1.1 Giới thiệu tổng quan

Giới thiệu đề tài

Tổng quan về khai thác dữ liệu

Khám phá tri thức và khai thác dữ liệu

  • Quá trình khai phá dữ liệu
  • Các loại dữ liệu có thể khai thác
  • Các ứng dụng của khai thác dữ liệu

1.2 Khai thác tập mục lợi ích cao

Khai thác dữ liệu truyền thống

Lịch sử phát triển của khai thác tập lợi ích cao

Giới thiệu bài toán khai thác tập lợi ích cao

Các cách tiếp cận trong khai thác tập lợi ích cao

Các định nghĩa và quy ước trong khai thác tập mục lợi ích cao

  • Định nghĩa 1 (Cơ sở dữ liệu giao tác)
  • Định nghĩa 2 (lợi ích của itemset trong cơ sở dữ liệu)
  • Định nghĩa 3 (Lợi ích của 1 itemset trong cơ sở dữ liệu)
  • Định nghĩa 4 (Định nghĩa vấn đề)
  • Định nghĩa 5 (Lợi ích của giao tác)
  • Định nghĩa 6 (Lợi ích trọng số của giao dịch)
  • Định nghĩa 7 (Danh sách giá trị lợi ích UL)

Thuật toán Two-phase

  • Giới thiệu
  • Thuật toán Two-phase
  • Nhận xét

Thuật toán TWU-Mining

  • Giới thiệu
  • Thuật toán TWU-Mining

Thuật toán HUI-Miner

  • Giới thiệu thuật toán
  • Thuật toán HUI-Miner

Thuật toán FHM

1.3 Thực nghiệm - Đánh giá kết quả

Bộ dữ liệu

Kết quả thử nghiệm

  • Kết quả thực nghiệm trên bộ dữ liệu Retail

Biểu đồ so sánh

Đánh giá

  • Trên bộ dữ liệu Chess_utility
  • Trên bộ dữ liệu Retail

2. Kết luận

Luận văn đã nghiên cứu về các cách tiếp cận khác nhau trong bài toán tìm itemset tiện ích cao. Luận văn đã khái quát vấn đề về khai thác itemset lợi ích cao, trình bày những khái niệm cơ bản và các cách tiếp cận để khai thác itemset lợi ích cao. Đồng thời trình bày chi tiết hai thuật giải điển hình dựa trên tính chất TWDCP và cấu trúc EUCS: thuật toán HUI - Miner và FHM cũng như một số thuật toán khai thác theo mô hình hai giai đoạn. Các thuật toán được minh họa qua ví dụ cụ thể và có nhận xét vê tính hiệu quả. Phần thực nghiệm, luận văn đã xây dựng được chương trình đánh giá kết quả thực thi của hai thuật giải HUI - Miner và FHM. Nhìn chung thuật toán FHM có thời gian xử lý cải thiện khoảng 17% so với thuật toán trước đó là HUI - Miner

3. Tài liệu tham khảo

Agrawal, R., Srikant, R.: Fast algorithms for mining association rules in largedatabases. In: Proc. Int. Conf. Very Large Databases, pp. 487-499, (1994)

Ahmed, C. F., Tanbeer, S. K., Jeong, B.-S., Lee, Y.-K.: Effcient Tree Structures for High-utility Pattern Mining in Incremental Databases. In: IEEE Trans. Knowl.Data Eng. 21(12), pp. 1708-1721 (2009)

Fournier-Viger, P., Gomariz, A., Campos, M., Thomas, R.: Fast Vertical Sequential Pattern Mining Using Co-occurrence Information. In: Proc. 18th Pacific-AsiaConference on Knowledge Discovery and Data Mining, Springer, LNAI, (2014)

Fournier-Viger, P., Wu, C.-W., Gomariz, A., Tseng, V. S.: VMSP: Effient VerticalMining of Maximal Sequential Patterns. In: Proc. 27th Canadian Conference onArtificial Intelligence, Springer, LNAI, pp. 83-94 (2014).....

--- Nhấn nút TẢI VỀ hoặc XEM ONLINE để tham khảo đầy đủ nội dung Luận văn trên ---

Ngày:04/09/2020 Chia sẻ bởi:Ngoan

CÓ THỂ BẠN QUAN TÂM