Luận văn ThS: Khai thác tập mục lợi ích cao
Luận văn Khai thác tập mục lợi ích cao nghiên cứu về khám phá tri thức và khai thác dữ liệu cho Cơ Sở Dữ Liệu lớn có lợi ích đi kèm; nghiên cứu và triển khai các thuật toán khai thác itemset lợi ích; lập trình kiểm thử và so sánh hai thuật toán HUI - Miner và FHM.
Mục lục nội dung
1. Nội dung
1.1 Giới thiệu tổng quan
Giới thiệu đề tài
Tổng quan về khai thác dữ liệu
Khám phá tri thức và khai thác dữ liệu
- Quá trình khai phá dữ liệu
- Các loại dữ liệu có thể khai thác
- Các ứng dụng của khai thác dữ liệu
1.2 Khai thác tập mục lợi ích cao
Khai thác dữ liệu truyền thống
Lịch sử phát triển của khai thác tập lợi ích cao
Giới thiệu bài toán khai thác tập lợi ích cao
Các cách tiếp cận trong khai thác tập lợi ích cao
Các định nghĩa và quy ước trong khai thác tập mục lợi ích cao
- Định nghĩa 1 (Cơ sở dữ liệu giao tác)
- Định nghĩa 2 (lợi ích của itemset trong cơ sở dữ liệu)
- Định nghĩa 3 (Lợi ích của 1 itemset trong cơ sở dữ liệu)
- Định nghĩa 4 (Định nghĩa vấn đề)
- Định nghĩa 5 (Lợi ích của giao tác)
- Định nghĩa 6 (Lợi ích trọng số của giao dịch)
- Định nghĩa 7 (Danh sách giá trị lợi ích UL)
Thuật toán Two-phase
- Giới thiệu
- Thuật toán Two-phase
- Nhận xét
Thuật toán TWU-Mining
- Giới thiệu
- Thuật toán TWU-Mining
Thuật toán HUI-Miner
- Giới thiệu thuật toán
- Thuật toán HUI-Miner
Thuật toán FHM
1.3 Thực nghiệm - Đánh giá kết quả
Bộ dữ liệu
Kết quả thử nghiệm
- Kết quả thực nghiệm trên bộ dữ liệu Retail
Biểu đồ so sánh
Đánh giá
- Trên bộ dữ liệu Chess_utility
- Trên bộ dữ liệu Retail
2. Kết luận
Luận văn đã nghiên cứu về các cách tiếp cận khác nhau trong bài toán tìm itemset tiện ích cao. Luận văn đã khái quát vấn đề về khai thác itemset lợi ích cao, trình bày những khái niệm cơ bản và các cách tiếp cận để khai thác itemset lợi ích cao. Đồng thời trình bày chi tiết hai thuật giải điển hình dựa trên tính chất TWDCP và cấu trúc EUCS: thuật toán HUI - Miner và FHM cũng như một số thuật toán khai thác theo mô hình hai giai đoạn. Các thuật toán được minh họa qua ví dụ cụ thể và có nhận xét vê tính hiệu quả. Phần thực nghiệm, luận văn đã xây dựng được chương trình đánh giá kết quả thực thi của hai thuật giải HUI - Miner và FHM. Nhìn chung thuật toán FHM có thời gian xử lý cải thiện khoảng 17% so với thuật toán trước đó là HUI - Miner
3. Tài liệu tham khảo
Agrawal, R., Srikant, R.: Fast algorithms for mining association rules in largedatabases. In: Proc. Int. Conf. Very Large Databases, pp. 487-499, (1994)
Ahmed, C. F., Tanbeer, S. K., Jeong, B.-S., Lee, Y.-K.: Effcient Tree Structures for High-utility Pattern Mining in Incremental Databases. In: IEEE Trans. Knowl.Data Eng. 21(12), pp. 1708-1721 (2009)
Fournier-Viger, P., Gomariz, A., Campos, M., Thomas, R.: Fast Vertical Sequential Pattern Mining Using Co-occurrence Information. In: Proc. 18th Pacific-AsiaConference on Knowledge Discovery and Data Mining, Springer, LNAI, (2014)
Fournier-Viger, P., Wu, C.-W., Gomariz, A., Tseng, V. S.: VMSP: Effient VerticalMining of Maximal Sequential Patterns. In: Proc. 27th Canadian Conference onArtificial Intelligence, Springer, LNAI, pp. 83-94 (2014).....
--- Nhấn nút TẢI VỀ hoặc XEM ONLINE để tham khảo đầy đủ nội dung Luận văn trên ---
Tham khảo thêm
- pdf Luận văn ThS: Khai thác Top - rank k cho tập đánh trọng trên cơ sở dữ liệu có trọng số
- pdf Luận văn ThS: Theo dõi đối tượng chuyển động bằng phương pháp lọc tích hợp
- pdf Luận văn ThS: Xây dựng tính năng cảnh báo tấn công trên mã nguồn mở
- pdf Luận văn ThS: Phương pháp phân vùng phân cấp trong khai thác tập phổ biến
- pdf Luận văn ThS: Nhận biết chủ đề của tài liệu dựa trên Wikipedia
- pdf Luận văn ThS: Nén Fractal cho bài toán ẩn dữ liệu
- pdf Luận văn ThS: Khai thác mẫu tuần tự nén
- pdf Luận văn ThS: Sử dụng cây quyết định để phân loại dữ liệu nhiễu
- pdf Luận văn ThS: Kỹ thuật Matrix Factorization trong xây dựng hệ tư vấn
- pdf Luận văn ThS: Khảo sát ảnh hưởng của các độ đo lợi ích lên độ chính xác trong bài toán phân lớp dựa trên luật kết hợp
- pdf Luận văn ThS: Một số kỹ thuật kiểm thử an toàn hệ thống
- pdf Luận văn ThS: Khai thác quan điểm của các bình luận tiếng Anh trên mạng xã hội sử dụng phương pháp xử lý ngôn ngữ tự nhiên
- pdf Luận văn ThS: Phát hiện tự động một số lỗi phát âm tiếng Anh của người học
- pdf Luận văn ThS: Ứng dụng khai thác mẫu chuỗi để khai thác hành vi sử dụng web
- pdf Luận văn ThS: Khai thác mẫu phổ biến cực đại trong đồ thị đơn bằng phương pháp so sánh gần đúng
- pdf Luận văn ThS: Khai thác mẫu trọng số phổ biến tối đại trong cơ sở dữ liệu giao dịch
- pdf Luận văn ThS: Một phương pháp bảo toàn tính riêng tư trong khai thác luật kết hợp trên cơ sở dữ liệu phân tán ngang
- pdf Luận văn ThS: Một thuật toán cải tiến trong khai thác luật kết hợp bảo toàn tính riêng tư
- pdf Luận văn ThS: Phân tích dữ liệu tạo cảnh báo học tập bằng mô hình hồi quy Logistic
- pdf Luận văn ThS: Sử dụng hồi quy tuyến tính trong dự đoán mức lương công việc trên quảng cáo tuyển dụng
- pdf Luận văn ThS: Khai thác song song tập phổ biến dựa trên mảng Systolic
- pdf Luận văn ThS: Nghiên cứu phương án tỉa ứng viên trong khai thác tập hữu ích cao
- pdf Luận văn ThS: Phân đoạn đối tượng trong ảnh MRI