Luận văn ThS: Một thuật toán cải tiến trong khai thác luật kết hợp bảo toàn tính riêng tư

Luận văn Một thuật toán cải tiến trong khai thác luật kết hợp bảo toàn tính riêng tư trình bày lí thuyết tổng quan; khai thác luật kết hợp bảo toàn tính riêng tư và thực nghiệm.

Luận văn ThS: Một thuật toán cải tiến trong khai thác luật kết hợp bảo toàn tính riêng tư

1. Mở đầu

Đến thời điểm hiện tại, số lượng dữ liệu trong thế giới của chúng ta đang ngày càng bùng nổ. Thu thập thông tin có giá trị từ vô vàng dữ liệu khổng lồ là một công việc vô cùng quan trọng. Khai thác dữ liệu là một công cụ phân tích dữ liệu vô cùng mạnh mẽ, bởi trong đó quy định mô hình và các kiến thức được trích xuất từ các tập dữ liệu lớn. Tuy nhiên, có một vấn đề phát sinh đó là sự riêng tư của người dùng và thông tin của họ không thể được bảo vệ một cách hiệu quả trong quá trình khai thác dữ liệu. Ví dụ, thông qua việc khai thác dữ liệu bệnh lý của bệnh nhân, các quy tắc liên quan đến các bệnh khác nhau, có thể được kết nối từ nhiều hồ sơ của nhiều bệnh nhân (một bệnh nhân mắc bệnh tiểu đường, tại cùng một thời điểm đó có thể mắc các bệnh liên quan đến tim mạch như huyết áp cao, tai biến mạch máu não,…). Trong quá trình khai thác dữ liệu bệnh lý bệnh nhân đó chắc chắn sẽ gây ra sự tiếp xúc của các dữ liệu, trường hợp này dẫn đến sự rò rỉ thông tin riêng tư của các bệnh nhân.

2. Nội dung

2.1 Lý thuyết tổng quan

Các khái niệm 

  • Khai thác dữ liệu
  • Tính riêng tư
  • Khai thác dữ liệu bảo toàn tính riêng tư

Phân loại các phương pháp PPDM

  • Phương pháp 1
  • Phương pháp 2
  • Phương pháp 3

Các phương pháp giấu dữ liệu nhạy cảm

  • Làm xáo trộn (Perturbation)
  • Ngăn chặn (Blocking)
  • Gom hoặc trộn (Aggregation/ Merging)
  • Đổi chổ (Swapping)
  • Lấy mẫu

Luật kết hợp

  • Định nghĩa
  • Định nghĩa “Độ hỗ trợ”
  • Định nghĩa “Độ tin cậy”
  • Định nghĩa “Tập hợp”

Thuật toán Apriori

  • Nguyên lý Apriori 
  • Thuật toán Apriori
  • Ví dụ minh họa thuật toán Apriori

2.2 Khai thác luật kết hợp bảo toàn tính riêng tư

Bài toán 

Các kỹ thuật khai thác luật kết hợp bảo toàn tính riêng tư

  • Kỹ thuật chỉnh sửa dữ liệu nhị phân
  • Kỹ thuật thay giá trị dữ liệu bằng giá trị unknown
  • Phương pháp tái tạo

Thuật toán MASK

  • Tình hình nghiên cứu
  • Thuật toán MASK
  • Một số biến thể của thuật toán MASK và hạn chế 

Lý thuyết giàn và ứng dụng trong thuật toán ẩn tập mục nhạy cảm 

  • Phát biểu bài toán
  • Lý thuyết giàn giao 
  • Các tính chất của tập mục thường xuyên
  • Thuật toán ẩn tập mục nhạy cảm

2.3 Thuật toán bảo toàn tính riêng tư

Giới thiệu

Thuật toán

  • Mô tả bài toán
  • Thuật toán
  • Mã giã thuật toán. 
  • Ví dụ
  • Chương trình minh hoạ cho thuật toán

3. Kết luận

Luận văn đã đạt được một số kết quả:

  • Giới thiệu tổng quan về Khai thác dữ liệu, qua đó giúp hiểu rõ hơn về các khái niệm cũng, tầm quan trọng của Khai thác dữ liệu trong thời đại bùng nỗ thông tin hiện nay.
  • Các phương pháp Khai thác dữ liệu, Khai thác dữ liệu bảo toàn tính riêng tư, từ đó nắm được các kỹ thuật khai thác dữ liệu, cũng như sự cần thiết đảm báo tính riêng tư trong quá trình khai thác dữ liệu.
  • Khái niệm về luật kết hợp, các thuật toán khai thác luật kết hợp. Nắm được vai trò của khai thác luật kết hợp trong khai thác dữ liệu, và tầm quan trọng của khai thác luật kết hợp bảo toàn tính riêng tư.
  • Nghiên cứu giới thiệu thuật toán nâng cao hiệu quả thực thi trong khai thác luật kết hợp bảo toàn tín riêng tư. Cụ thể thông qua việc mã hoá nhiễu loạn dữ liệu và giấu các luật nhậy cảm, tăng hiệu quả thực thi trong khai thác luật kết hợp bảo toàn tính riêng tư.
  • Xây dựng chương demo minh hoạ cho việc nâng hiệu quả thực thi trong khai thác luật kết hợp bảo toàn tín riêng tư.

4. Tài liệu tham khảo

Cao Tùng Anh (2014), Khai Thác Dữ Liệu Phân Tán Bảo Toàn Tính Riêng Tư, Luận Án Tiến Sĩ Toán Học, Viện Hàn Lâm Khoa Học Và Công Nghệ Việt Nam - Viện Công Nghệ Thông Tin

Nguyễn Xuân Huy, Lê Quốc Hải, Nguyễn Gia Như, Cao Tùng Anh, Bùi Đức Minh(2009), Lý thuyết giàn và ứng dụng trong thuật toán ẩn tập mục nhạy cảm, Báo cáo tại Hội thảo Quốc gia " Một số vấn đề chọn lọc của CNTT và truyền thông, Đồng Nai.

Nguyễn Thị Thuỳ (2014 ), Một số kỹ thuật khai thác luật kết hợp có đảm bảo tính riêng tư trong các tập giao dịch phân tán ngang, Luận văn Thạc sĩ, Trường Đại học Thái Nguyên – Trường Đại học CNTT và Truyền thông....

--- Nhấn nút TẢI VỀ hoặc XEM ONLINE để tham khảo đầy đủ nội dung Luận văn trên ---

Ngày:04/09/2020 Chia sẻ bởi:Tuyết

CÓ THỂ BẠN QUAN TÂM