Đồ án: Tìm hiểu về Maximum Entropy cho bài toán phân lớp quan điểm

Đồ án Tìm hiểu về Maximum Entropy cho bài toán phân lớp quan điểm trình bày bài toán phân lớp quan điểm, nhiệm vụ của bài toán phân lớp quan điểm; trình bày về mô hình và thuật toán Entropy cực đại cho bài toán phân lớp quan điểm; trình bày những kết quả đánh giá thử nghiệm của khóa luận áp dụng cho bài toán phân lớp quan điểm.

Đồ án: Tìm hiểu về Maximum Entropy cho bài toán phân lớp quan điểm

1. Mở đầu

Ngày nay, với sự phát triển mạnh mẽ của Internet, các hình thức kết nối và chia sẻ thông tin trong cộng đồng mạng ngày càng phát triển đã thu hút một lượng lớn người dùng tham gia. Thông qua đó họ trao đổi, chia sẻ thông tin, thảo luận các vấn đề và sở thích cùng quan tâm. Một sô smạng xã hội phổ biến trên thế giới như: Facebook, Twitter và ở việt Nam như: Zing, Go.vn có số lượng người tham gia ngày càng đông đảo. Một số các hình thức thể hiện khác cũng rất phát triển như các phản hồi trên các diễn đàn, các trang dịch vụ và các trang tin tức,... Các thông tin được chia sẻ và thảo luận thông qua mạng xã hội thuộc rất nhiều chủ đề trong các lĩnh vực kinh tế, chính trị, xã hội. Từ đó hình thành nên các luồng thông tin chủ đạo (thể hiện như xu hướng của quan điểm) của cộng đồng đối với việc đánh giá một vấn đề, hay một sản phẩm, dịch vụ nào đó. Các quan điểm, xu hướng này sẽ có tác động mạnh mẽ đến định hướng, quan điểm của người dùng khác.

2. Nội dung

2.1 Bài toán phân lớp quan điểm

Nhu cầu về thông tin quan điểm và nhận xét

Bài toán phân lớp quan điểm

Nhiệm vụ của bài toán phân lớp quan điểm

  • Trích các đặc trưng
  • Xây dựng mô hình phân lớp để phân loại tài liệu

2.2 Mô hình Entropy cực đại

Giới thiệu

Xây dựng mô hình

  • Tập dữ liệu huấn luyện
  • Những thống kê, đặc trưng và ràng buộc nguyên lý entropy cực đại
  • Dạng tham số
  • Mối quan hệ với cực đại Likelihood

Bài toán phân lớp quan điểm sử dụng phương pháp học máy maximum entropy cực đại

2.3 Thực nghiệm

Dữ liệu thử nghiệm

Công cụ sử dụng

  • Công cụ sinh SRIML 
  • Công cụ phân lớp dữ liệu Maxent
  • Kết quả thực nghiệm

3. Kết luận

Trong quá trình làm khóa luận, em đã tìm hiểu được mô hình Entropy cực đại, một số khía cạnh về phân lớp quan điểm và các vấn đề đặt ra với bài toán này. Đồ án tìm hiểu về tiếp cận phân lớp quan điểm sử dụng trích chọn đặc trưng n-gram và áp dụng phương pháp học máy Maximum Entropy. Chương trình thực nghiệm cũng đã thử nghiệm trên bộ dữ liệu với 700 câu tích cực và 700 câu tiêu cực và sử dụng phương pháp học máy có giám sát Maximum Entropy để phân lớp với cách chọn đặc trưng là sử dụng uni-gram và bi-gram.

4. Tài liệu tham khảo

Bo Pang and Lillian Lee và Shivakumar Vaithyanathan. Thumbs up Sentiment Classification using Machine Learning Techniques.

Sentiment Identification Using Maximum Entropy Analysis of Movie Reviews. Nipun Mehra and Shashikant Khandelwal and Priyank Patel.

Ths. Nguyễn Thị Xuân Hương và Ths. Lê Thụy về “phân tích quan điểm và một số hƣớng tiếp cận”. Hội nghị khoa học lần thứ nhất, 2012, trường ĐHDL Hải Phòng.

Nguyễn Thùy Linh về “Phân lớp tài liệu web độc lập ngôn ngữ”. Khóa luận tốt nghiệp đại học hệ chính quy, ngành công nghệ thông tin, trường Đại học Quốc gia Hà Nội...

--- Nhấn nút TẢI VỀ hoặc XEM ONLINE để tham khảo đầy đủ nội dung Đồ án trên ---

Ngày:08/09/2020 Chia sẻ bởi:Ngoan

CÓ THỂ BẠN QUAN TÂM