Luận văn ThS: Kỹ thuật Matrix Factorization trong xây dựng hệ tư vấn

Luận văn Kỹ thuật Matrix Factorization trong xây dựng hệ tư vấn giới thiệu tổng quan về các nghiên cứu liên quan; tìm hiểu cơ sở lí thuyết và đưa ra hệ thống.

Luận văn ThS: Kỹ thuật Matrix Factorization trong xây dựng hệ tư vấn

1. Mở đầu

1.1 Lí do chọn đề tài

Có thể nói rằng hiện nay có đủ mọi loại thông tin trên mạng internet; và với sự giúp sức của các công cụ tìm kiếm thông tin hiện hữu, người ta có thể dễ dàng tìm thấy những gì mà họ quan tâm. Mặt khác, do có quá nhiều thông tin, nên đã gây không ít khó khăn, lúng túng cho việc định hướng chọn lựa hoặc ra quyết định từ phía người sử dụng các thông tin trên. Các hệ tư vấn (recommendation systems) ra đời không nằm ngoài mục đích hỗ trợ cho người dùng trong các lựa chọn và/ hoặc ra quyết định. Có nhiều hướng tiếp cận để xây dựng một hệ tư vấn. Tùy thuộc vào nguồn thông tin có được, nhu cầu tư vấn thực tế, đặc thù riêng của dịch vụ tư vấn cần cung cấp, v.v… mà mỗi hệ tư vấn sẽ có phương pháp và thuật toán phù hợp cho riêng mình. Kỹ thuật phân rã ma trận (Matrix Factorization) là một trong số các kỹ thuật được sử dụng để xây dựng một hệ tư vấn dựa trên các dữ liệu đánh giá. Kỹ thuật này được đánh giá cao nhờ khả năng cải thiện độ chính xác của các thuật toán tư vấn khác, tính linh hoạt, thời gian thực thi thấp, v.v...

1.2 Mục tiêu nghiên cứu

Tìm hiểu các hệ tư vấn (recommendation systems).

Tìm hiểu các khái niệm, phương pháp xây dựng 1 hệ tư vấn.

Tìm hiểu kỹ thuật phân rã ma trận.

Áp dụng phương pháp phân rã ma trận để xây dựng 1 hệ tư vấn về phim

2. Nội dung

2.1 Các nghiên cứu liên quan

Tổng quan về hệ tư vấn

  • Giới thiệu hệ tư vấn

Kiến trúc cơ bản một hệ tư vấn

Mô tả bài toán tư vấn

Phân loại hệ tư vấn

  • Phương pháp dựa trên nội dung (content - based)
  • Phương pháp chọn lọc cộng tác (collaborative filtering)
  • Phương pháp dựa trên nhân khẩu học (demographicbased)
  • Phương pháp dựa trên tri thức (knowledge - based
  • Phương pháp dựa trên cộng đồng (community - based)
  • Phương pháp lai (hybrid)
  • Vấn đề ramp-up

2.2 Cơ sở lí thuyết

Mô hình phân rã ma trận

Các thuật toán học (learning algorithms)

  • Phương pháp giảm gradient ngẫu nhiên (stochastic gradient descent)
  • Phương pháp alternating least square (ASL)

Hệ số bias

Regularization

Phân rã ma trận không âm (NMF)

2.3 Hệ thống đề nghị

Mô hình hệ thống

Giải thuật chương trình

  • Đầu vào
  • Đầu ra
  • Lưu đồ thuật toán

2.4 Hiện thực và thí nghiệm

Hiện thực

Một số thử nghiệm và nhận xét về thuật toán

  • Tập dữ liệu: 10 Người dùng, 712 Hạng mục
  • Tập dữ liệu: 50 Người dùng, 1084 Hạng mục
  • Tập dữ liệu: 100 Người dùng, 1238 Hạng mục

3. Kết luận

Kỹ thuật phân rã ma trận đã đóng góp đáng kể về mặt phương pháp luận trong việc phát triển các hệ thống tư vấn CF. Các thử nghiệm của nhiều nghiên cứu đều đánh giá kỹ thuật phân rã ma trận cho độ chính xác cao hơn so với các phương pháp đã được áp dụng trước đó như kỹ thuật k-nearest neighbor, v.v… Kỹ thuật phân rã ma trận tương đối dễ cài đặt. Quá trình thử nghiệm trên chương trình kiểm thử cho thấy để kỹ thuật cho được kết quả tốt cần có các hệ số thích hợp. Dù đã cố gắng tìm tòi nhiều nhưng chắc hẳn luận văn này không tránh khỏi những khiếm khuyết. Qua thực hiện đề tài này, tác giả đã thu được những kết quả sau:

  • Tìm hiểu một cách cơ bản về các hệ tư vấn.
  • Kỹ thuật phân rã ma trận và các vấn đề liên quan.
  • Rút ra một số nhận xét cơ bản liên quan đến các hệ số trong kỹ thuật phân rã ma trận thông qua chạy thử nghiệm chương trình cài đặt.

4. Tài liệu tham khảo

Sebastian Riedel, Limin Yao, Andrew McCallum, Benjamin M Marlin . (2014), Relation extraction with matrix factorization and universal schemas [online], viewed 17 july 2015, from < https://people.cs.umass.edu/~lmyao/papers/univ-schema-tacl.pdf>

Nicolas Gillis, Stephen A Vavasis. (2014), Fast and robust recursive algorithmsfor separable nonnegative matrix factorization [online], viewed 4 July 2015, from < http://arxiv.org/pdf/1208.1237.pdf>

Hoàng Kiếm. (2012). Các hệ thống thông tin tri thức hỗ trợ sáng tạo. Đại Học Quốc Gia TP.HCM

F. Ricci. (2012). Content-Based Filtering and Hybrid Systems [online], viewed 3 February 2015, from ......

--- Nhấn nút TẢI VỀ hoặc XEM ONLINE để tham khảo đầy đủ nội dung Luận văn trên ---

Ngày:03/09/2020 Chia sẻ bởi:Phuong

CÓ THỂ BẠN QUAN TÂM