Luận văn ThS: Truy hồi chéo mô hình cho nhạc và lời bài hát

Luận văn Truy hồi chéo mô hình cho nhạc và lời bài hát trình bày dữ liệu đa phương thức, truy hồi thông tin nói chung và truy hồi chéo mô hình nói riêng; chỉ ra cách thực hiện các bước trong mô hình dựa trên cách tiếp cận của phương pháp đã đề xuất; mô tả kịch bản thực nghiệm, đưa ra kết quả và đánh giá mô hình đề xuất.

Luận văn ThS: Truy hồi chéo mô hình cho nhạc và lời bài hát

1. Mở đầu

Truy hồi chéo mô hình không chỉ là chủ đề quan tâm của cộng đồng nghiên cứu thế giới mà còn nhận sự quan tâm của công nghiệp. Các nghiên cứu và ứng dụng nhằm cải tiến và đáp ứng được nhu cầu truy vấn chéo thông tin giữa các dữ liệu đa phương thức của ngƣời dùng. Cùng góp phần vào trào lưu nghiên cứu thế giới, luận văn có tên đề tài truy hồi chéo mô hình cho nhạc và lời bài hát thực hiện để xây dựng mô hình cho phép truy hồi chéo khi sử dụng nhạc là truy vấn hoặc khi sử dụng lời bài hát là truy vấn. Xuất phát từ ứng dụng thực tế cần xây dựng hệ thống truy hồi chéo thông tin của các dữ liệu đa phương tiện cho phép truy vấn chéo giữa các kiểu dữ liệu khác nhau. Luận văn tập trung vào giải quyết bài toán cải tiến độ chính xác truy hồi chéo mô hình cho nhạc và lời bài hát. Phương pháp tiếp cận trong luận văn kết hợp học sâu và phân tích tương quan chính tắc để cải tiến độ chính xác cho mô hình. 

2. Nội dung

2.1 Giới thiệu truy hồi thông tin

Dữ liệu đa phương thức và truy hồi thông tin 

Phân loại truy hồi chéo mô hình 

Phát biểu bài toán

2.2 Các phương pháp truy hồi chéo mô hình

Phương pháp học không gian con 

  • Khái niệm cơ bản phân tích tương quan chính tắc
  • RCCA với tham số chuẩn hóa và co 

Phương pháp học sâu  

  • Phân tích tương quan chính tắc sâu (DCCA)
  • GAN

Một số phương pháp khác

2.3 Mô hình đề xuất

Trích chọn đặc trưng 

  • Trích chọn đặc trưng âm thanh
  • Trích chọn đặc trưng lời bài hát

Học sâu 

  • Ánh xạ đặc trưng
  • Phân lớp mô hình
  • Tối ưu học đối kháng

Phân tích tương quan chính tắc 

Truy hồi chéo mô hình

2.4 Thực nghiệm và đánh giá

Dữ liệu và trích xuất đặc trưng

Môi trường và các công cụ thực nghiệm

Kịch bản thực nghiệm 

Kết quả thực nghiệm và đánh giá

  • Kết quả thực nghiệm của phương pháp đề xuất
  • Kết quả thực nghiệm của RCCA
  • So sánh với các phương pháp khác

3. Kết luận

Truy hồi chéo mô hình không chỉ là chủ đề quan tâm của cộng đồng nghiên cứu thế giới mà còn nhận sự quan tâm của công nghiệp. Các nghiên cứu và ứng dụng nhằm cải tiến và đáp ứng được nhu cầu truy vấn chéo thông tin giữa các dữ liệu đa phương thức của người dùng. Cùng góp phần vào trào lưu nghiên cứu thế giới, luận văn có tên đề tài truy hồi chéo mô hình cho nhạc và lời bài hát thực hiện để xây dựng mô hình cho phép truy hồi chéo khi sử dụng nhạc là truy vấn hoặc khi sử dụng lời bài hát là truy vấn. Luận văn đề xuất ra phương pháp mới kết hợp bởi học sâu và phân tích tương quan chính tắc và sử dụng mô hình đề xuất để truy hồi chéo cho nhạc và lời bài hát. Đồng thời luận văn cũng đánh giá và so sánh hiệu quả của phương pháp đề xuất với các phương pháp  điển hình khác để chứng minh phương pháp đề xuất khả quan để ứng dụng vào thực tiễn. Kết quả phương pháp đề xuất cao hơn so với các phương pháp so sánh trên cùng một tập dữ liệu. Kết quả độ đo MRR, R@1, R@5 của phương pháp đề xuất trong luận văn khi sử dụng nhạc hay sử dụng lời bài hát truy vấn từ 30% đến 50% trên tập dữ liệu âm nhạc. Phương pháp đề xuất trong luận văn có thể được ứng dụng cho các hệ thống tìm kiếm chéo trên các trang âm nhạc nhằm đáp ứng nhu cầu truy vấn của người dùng.

4. Tài liệu tham khảo

Andrew, G., Arora, R., Bilmes, J., Livescu, K.: Deep canonical correlation analysis. In International Conference on Machine Learning. pp. 1247- 1255 (2013)

Boutell, M., Luo, J.: Photo classification by integrating image content and camera metadata. In Pattern Recognition, 2004. ICPR 2004. Proceedings of the 17  International Conference on. vol. 4, pp. 901-904. IEEE (2004)

Chaudhuri, K., Kakade, S.M., Livescu, K., Sridharan, K.: Multi-view clustering via canonical correlation analysis. In  Proceedings of the 26th annual international conference on machine learning. pp. 129-136. ACM (2009)

De Bie, T.,  De Moor, B.: On the regularization of canonical correlation analysis. Int. Sympos. ICA and BSS pp. 785-790 (2003)

Feng, F., Li, R., Wang, X.: Deep correspondence restricted boltzmann machine for  cross-modal retrieval. Neurocomputing 154, 50-60 (2015)...

--- Nhấn nút TẢI VỀ hoặc XEM ONLINE để tham khảo đầy đủ nội dung Luận văn Thạc sĩ trên ---

Ngày:19/08/2020 Chia sẻ bởi:Nguyễn Minh Duy

CÓ THỂ BẠN QUAN TÂM