Luận văn ThS: Một phương pháp bảo toàn tính riêng tư trong khai thác luật kết hợp trên cơ sở dữ liệu phân tán ngang
Luận văn Một phương pháp bảo toàn tính riêng tư trong khai thác luật kết hợp trên cơ sở dữ liệu phân tán ngang trình bày tổng quan về khai thác dữ liệu; trình bày một số thuật toán khai thác cơ sở dữ liệu phân tán ngang có bảo toàn tính riêng tư của các bên tham gia; mô hình mới đề xuất trong khai thác luật kết hợp trên cơ sở dữ liệu phân tán ngang bảo toàn tính riêng tư của các bên tham gia và chương trình thực nghiệm.
Mục lục nội dung
1. Mở đầu
1.1 Lí do chọn đề tài
Trong thời đại ngày nay, với sự phát triển vượt bậc của công nghệ thông tin và sự phổ biến của Internet. Lượng dữ liệu tại các hệ thống thông tin này ngày càng trở nên phong phú, đa dạng và thực sự khổng lồ. Trong tình hình đó, việc chắt lọc những thông tin quý giá từ những dữ liệu khổng lồ ngày càng có ý nghĩa hơn bao giờ hết, nó đóng vai trò chìa khóa thành công cho sự phát triển của các tổ chức, cá nhân. Các thông tin tìm được có thể được vận dụng để cải thiện hiệu quả hoạt động của hệ thống thông tin ban đầu, cải thiện thời gian tìm kiếm, hay đưa ra những dự đoán giúp cải thiện những quyết định trong tương lai,… Các kỹ thuật khai thác dữ liệu (data mining) ngày càng được quan tâm và ứng dụng rộng rãi trong nhiều lĩnh vực của cuộc sống như kinh tế, giáo dục, y tế, trong siêu thị,…
1.2 Mục tiêu nghiên cứu
Đề tài này tập trung vào việc nghiên cứu các thuật toán khai thác tập phổ biến, khai thác luật kết hợp và khai thác trên cơ sở dữ liệu phân tán ngang bảo toàn tính riêng tƣ của các bên tham gia khai thác. Theo đánh giá của các tác giả thì mô hình khai thác này đảm bảo tính riêng tư an toàn cho các bên tham gia khai thác và giảm được chi phí trong quá trình truyền và nhận dữ liệu giữa các bên. Từ mô hình luận văn cũng mạnh dạn đề xuất một thay đổi nhỏ trong bước khai thác tập phổ biến để làm giảm thời gian khai thác tại mỗi bên, Ngoài ra, luận văn cũng trình bày phần cài đặt chương trình thực nghiệm cho mô hình để kiểm tra tính đúng đắn của mô hình đã nghiên cứu.
1.3 Phương pháp nghiên cứu
Nghiên cứu tổng quan về khai thác dữ liệu, tiến hành thu thập và nghiên cứu các tài liệu có liên quan đến đề tài.
Tìm hiểu các thuật toán khai thác dữ liệu, khai thác dữ liệu trên cơ sở dữ liệu phân tán ngang có quan tâm đến việc bảo vệ tính riêng tư của các bên tham gia.
Xây dựng chương trình thực nghiệm cho mô hình thuật toán đã nghiên cứu
2. Nội dung
2.1 Tổng quan về cơ sở dữ liệu
Giới thiệu đề tài
Khai thác tập phổ biến và luật kết hợp
- Một số khái niệm
- Khai thác tập phổ biến và luật kết hợp
- Thuật toán khai thác luật kết hợp
2.2 Một số thuật toán bảo toàn tính riêng tư
Giải thuật khai thác tập phổ biến đảm bảo tính riêng tư và chống thông đồng trên cơ sở dữ liệu phân tán ngang
- Giao thức đảm bảo tính riêng tư trong tính độ phổ biến toàn cục
- Giải thuật khai thác tập phổ biến
- Đánh giá thuật toán
Giao thức khai thác cơ sở dữ liệu phân tán ngang bảo đảm tính riêng tư
- Đặt vấn đề
- Cơ sở lý thuyết
- Giao thức khai thác
- Đánh giá giao thức
2.3 Thuật toán bảo toàn tính riêng tư
Cơ sở nghiên cứu
Mô hình khai thác trên cơ sở dữ liệu phân tán ngang
- Mô hình đề xuất
- Về việc bảo toàn tính riêng tư trong mô hình đề xuất
Thực nghiệm mô hình
3. Kết luận
Luận văn đã trình bày được phần lý thuyết về một số thuật toán và phương pháp khai thác luật kết hợp (Apriori, IT-Tree), lý thuyết về bảo toàn tính riêng tư trong khai thác dữ liệu, các thuật toán khai thác tập phổ biến và luật kết hợp trên cơ sở dữ liệu phân tán ngang, bảo toàn tính riêng tư. Từ đó luận văn đề xuất thay đổi bước 2 khi các bên khai thác tại cơ sở dữ liệu cục bộ của mình để giảm thời gian khai thác, luận văn cũng đề xuất thay thuật toán từ Apriori thành phương pháp IT-Tree. Kết quả thực nghiệm trên mô hình khai thác trong cơ sở dữ liệu phân tán giữa các bên tham gia cũng cho thấy tính đúng đắn của mô hình khai thác trên cơ sở dữ liệu ngang bảo toàn tính riêng tư của các bên tham gia khai thác. Khi áp dụng trong mô hình thực tế với nhiều bên tham gia và khối lƣợng dữ liệu lớn thì việc thay đổi thuật toán trong các bước thực hiện khai thác tập phổ biến ở các bên sẽ giảm thời gian khai thác.
4. Tài liệu tham khảo
Trần Quốc Việt, Cao Tùng Anh, Lê Hoài Bắc (2012), "Đảm bảo tính riêng tư và chống thông đồng trong khai thác luật kết hợp trên dữ liệu phân tán ngang", Chuyên san các công trình nghiên cứu, phát triển và ứng dụng công nghệ thông tin và truyền thông, Tạp chí công nghệ thông tin và truyền thông, số 7, Hà Nội 05/2012, tr 60-70
Võ Đình Bảy, Lê Hoài Bắc (2010), “Chuỗi Bit Động: Cách tiếp cận mới để khai thác tập phổ biến”, ICTFIT‟ 2010, Hồ Chí Minh, Nhà xuất bản Khoa học & Kỹ thuật, tr 47-52
Cheung David Wai-Lok, Han Jiawei, Ng. Vincent, Fu Ada Wai-Chee, and Fu Yongjian (1996), “A fast distributed algorithm for mining association rules“,IEEE In Proceedings of the 1996 International Conference on Parallel and Distributed Information Systems (PDIS‟96), Miami Beach, Florida, USA, pp. 31-42.....
--- Nhấn nút TẢI VỀ hoặc XEM ONLINE để tham khảo đầy đủ nội dung Luận văn trên ---
Tham khảo thêm
- pdf Luận văn ThS: Khai thác Top - rank k cho tập đánh trọng trên cơ sở dữ liệu có trọng số
- pdf Luận văn ThS: Theo dõi đối tượng chuyển động bằng phương pháp lọc tích hợp
- pdf Luận văn ThS: Xây dựng tính năng cảnh báo tấn công trên mã nguồn mở
- pdf Luận văn ThS: Phương pháp phân vùng phân cấp trong khai thác tập phổ biến
- pdf Luận văn ThS: Nhận biết chủ đề của tài liệu dựa trên Wikipedia
- pdf Luận văn ThS: Nén Fractal cho bài toán ẩn dữ liệu
- pdf Luận văn ThS: Khai thác mẫu tuần tự nén
- pdf Luận văn ThS: Sử dụng cây quyết định để phân loại dữ liệu nhiễu
- pdf Luận văn ThS: Kỹ thuật Matrix Factorization trong xây dựng hệ tư vấn
- pdf Luận văn ThS: Khai thác tập mục lợi ích cao
- pdf Luận văn ThS: Khảo sát ảnh hưởng của các độ đo lợi ích lên độ chính xác trong bài toán phân lớp dựa trên luật kết hợp
- pdf Luận văn ThS: Một số kỹ thuật kiểm thử an toàn hệ thống
- pdf Luận văn ThS: Khai thác quan điểm của các bình luận tiếng Anh trên mạng xã hội sử dụng phương pháp xử lý ngôn ngữ tự nhiên
- pdf Luận văn ThS: Phát hiện tự động một số lỗi phát âm tiếng Anh của người học
- pdf Luận văn ThS: Ứng dụng khai thác mẫu chuỗi để khai thác hành vi sử dụng web
- pdf Luận văn ThS: Khai thác mẫu phổ biến cực đại trong đồ thị đơn bằng phương pháp so sánh gần đúng
- pdf Luận văn ThS: Khai thác mẫu trọng số phổ biến tối đại trong cơ sở dữ liệu giao dịch
- pdf Luận văn ThS: Một thuật toán cải tiến trong khai thác luật kết hợp bảo toàn tính riêng tư
- pdf Luận văn ThS: Phân tích dữ liệu tạo cảnh báo học tập bằng mô hình hồi quy Logistic
- pdf Luận văn ThS: Sử dụng hồi quy tuyến tính trong dự đoán mức lương công việc trên quảng cáo tuyển dụng
- pdf Luận văn ThS: Khai thác song song tập phổ biến dựa trên mảng Systolic
- pdf Luận văn ThS: Nghiên cứu phương án tỉa ứng viên trong khai thác tập hữu ích cao
- pdf Luận văn ThS: Phân đoạn đối tượng trong ảnh MRI