Luận văn ThS: Khai thác luật phân lớp kết hợp trên cơ sở dữ liệu bị sửa đổi

Luận văn Khai thác luật phân lớp kết hợp trên cơ sở dữ liệu bị sửa đổi giới thiệu tổng quan về khai thác dữ liệu, khai thác luật kết hợp, luật phân lớp; tìm hiểu phương pháp khai thác; trình bày kết quả thực nghiệm và đánh giá kết quả.

Luận văn ThS: Khai thác luật phân lớp kết hợp trên cơ sở dữ liệu bị sửa đổi

1. Mở đầu

1.1 Mục tiêu nghiên cứu

Tìm hiểu khái quát về khai thác dữ liệu trong đó đi sâu về luật kết hợp.

Tìm hiểu luật phân lớp kết hợp CAR - Miner.

Tìm hiểu luật phân lớp kết hợp trên cơ sở dữ liệu tăng trưởng.

Nghiên cứu xây dựng thuật toán luật phân lớp kết hợp trên cơ sở dữ liệu bị sửa đổi.

Cài đặt thuật toán khai thác luật phân lớp kết hợp trên cơ sở dữ liệu bị sửa đổi.

1.2 Đối tượng phạm vi nghiên cứu

Nghiên cứu bài toán khai thác luật phân lớp dựa vào luật kết hợp và thuật toán CAR - Miner.

Khai thác luật phân lớp kết hợp trên cở sở dữ liệu bị sửa đổi.

1.3 Phương pháp nghiên cứu

Tìm hiểu các tài liệu trong và ngoài nước về khai thác dữ liệu, luật kết hợp, luật phân lớp, luật phân lớp kết hợp.

Tìm hiểu thuật toán CAR - Miner trong bài toán phân lớp dựa vào luật kết hợp.

2. Nội dung

2.1 Tổng quan

Khai thác dữ liệu 

  • Khái niệm
  • Quá trình khai thác dữ liệu
  • Kiến trúc của một hệ thống khai thác dữ liệu
  • Một số phương pháp khai thác dữ liệu

Khai thác luật kết hợp

  • Giới thiệu
  • Một số hướng tiếp cận trong khai thác luật kết hợp

Khai thác luật phân lớp

  • Giới thiệu
  • Quá trình phân lớp
  • Một số phương pháp phân lớp

Khai thác luật phân lớp dựa vào luật kết hợp 

Khai thác luật phân lớp kết hợp CAR - Miner

  • Một số khái niệm
  • Cấu trúc cây MECR
  • Thuật toán khai thác hiệu quả cho CAR - Miner
  • Thuật toán CAR - Miner

2.2 Phương pháp khai thác

Thuật toán khai thác luật kết hợp trên cơ sở dữ liệu bị sửa đổi

  • Giới thiệu thuật toán
  • Cơ sở lý thuyết
  • Các bước thực hiện

Thuật toán luật phân lớp kết hợp trên cơ sở dữ liệu tăng trưởng 

Thuật toán luật phân lớp kết hợp trên cơ sở dữ liệu bị xoá

  • Thuật toán CAR - Miner cho cơ sở dữ liệu bị xoá
  • Ví dụ minh họa về xóa dữ liệu

Thuật toán khai thác luật phân lớp kết hợp cho dữ liệu bị sửa đổi

  • Thuật toán CAR - Miner cho cơ sở dữ liệu bị sửa đổi
  • Ví dụ minh họa về sửa dữ liệu

2.3 Kết quả thực nghiệm và đánh giá

Cơ sở dữ liệu thực nghiệm và môi trường xây dựng

  • Cơ sở dữ liệu thực nghiệm
  • Môi trường xây dựng thuật toán

Kết quả thực nghiệm

  • Kết quả thực nghiệm trên cơ sở dữ liệu Breast
  • Kết quả thực nghiệm trên cơ sở dữ liệu Lymph
  • Kết quả thực nghiệm trên cơ sở dữ liệu Iris
  • Khảo sát kết quả thực nghiệm

3. Kết luận

Luận văn này nghiên cứu bài toán khai thác luật kết hợp, luật phân lớp, luật phân lớp kết hợp trên cơ sở dữ liệu tĩnh. Để từ đó nghiên xuất và đề xuất bài toán khai thác luật phân lớp kết hợp trên cơ sở dữ liệu bị sửa đổi (thêm mới dữ liệu, sửa thông tin dữ liệu, xóa dữ liệu) sao cho khi sửa đổi cơ sở dữ liệu việc khai thác luật không phải duyệt lại toàn bộ cơ sở dữ liệu gốc nữa, tiết kiệm được thời gian và tài nguyên của máy tính. Dựa vào kết quả thực nghiệm cho thấy thời gian thực thi của thuật toán CAR - Modified nhanh hơn so với hai quá trình thực hiện tuần tự của các thuật toán CAR - Incre, CAR - Del hay thực hiện trên cơ sở dữ liệu tĩnh như CAR - Miner. Ngày nay các cơ sở dữ liệu liên tục tăng trưởng và thay đổi không ngừng, do đó thuật toán CAR - Miner không còn phù hợp để áp dụng vào thực tế nữa, nên thuật toán CAR - Modified đã giúp cho việc khai thác luật phân lớp kết hợp giảm được chi phí duyệt lại toàn bộ cơ sở dữ liệu từ đầu và hoàn toàn phù hợp với cơ sở dữ liệu thực tế hiện nay.

4. Tài liệu tham khảo

W.C. Chen, C.C. Hsu, J.N. Hsu (2012). “Adjusting and generalizing CBA algorithm to handling class imbalance”. Expert Systems with Applications, vol.39, no.5, pp. 5907-5919

Y.W.C. Chien and Y.L. Chen (2010): "Mining associative classification rules with stock trading data – A GA-based method”. Knowledge-Based Systems vol. 23, no 6, pp. 605-615

H.T.T. Giang (2010). “Nghiên cứu các luật kết hợp song song trong khai thác dữ liệu”.

T.P. Hong, C.Y. Wang (2010). “An efficient and effective association-rule maintenance algorithm for record modification”. Expert Systems with Applications, vol.37, no., pp. 618–626....

--- Nhấn nút TẢI VỀ hoặc XEM ONLINE để tham khảo đầy đủ nội dung Luận văn trên ---

Ngày:05/09/2020 Chia sẻ bởi:Thanh Nhàn

CÓ THỂ BẠN QUAN TÂM