Đồ án: Tìm hiểu về Maximum Entropy cho bài toán phân lớp quan điểm
Đồ án Tìm hiểu về Maximum Entropy cho bài toán phân lớp quan điểm trình bày bài toán phân lớp quan điểm, nhiệm vụ của bài toán phân lớp quan điểm; trình bày về mô hình và thuật toán Entropy cực đại cho bài toán phân lớp quan điểm; trình bày những kết quả đánh giá thử nghiệm của khóa luận áp dụng cho bài toán phân lớp quan điểm.
Mục lục nội dung
1. Mở đầu
Ngày nay, với sự phát triển mạnh mẽ của Internet, các hình thức kết nối và chia sẻ thông tin trong cộng đồng mạng ngày càng phát triển đã thu hút một lượng lớn người dùng tham gia. Thông qua đó họ trao đổi, chia sẻ thông tin, thảo luận các vấn đề và sở thích cùng quan tâm. Một sô smạng xã hội phổ biến trên thế giới như: Facebook, Twitter và ở việt Nam như: Zing, Go.vn có số lượng người tham gia ngày càng đông đảo. Một số các hình thức thể hiện khác cũng rất phát triển như các phản hồi trên các diễn đàn, các trang dịch vụ và các trang tin tức,... Các thông tin được chia sẻ và thảo luận thông qua mạng xã hội thuộc rất nhiều chủ đề trong các lĩnh vực kinh tế, chính trị, xã hội. Từ đó hình thành nên các luồng thông tin chủ đạo (thể hiện như xu hướng của quan điểm) của cộng đồng đối với việc đánh giá một vấn đề, hay một sản phẩm, dịch vụ nào đó. Các quan điểm, xu hướng này sẽ có tác động mạnh mẽ đến định hướng, quan điểm của người dùng khác.
2. Nội dung
2.1 Bài toán phân lớp quan điểm
Nhu cầu về thông tin quan điểm và nhận xét
Bài toán phân lớp quan điểm
Nhiệm vụ của bài toán phân lớp quan điểm
- Trích các đặc trưng
- Xây dựng mô hình phân lớp để phân loại tài liệu
2.2 Mô hình Entropy cực đại
Giới thiệu
Xây dựng mô hình
- Tập dữ liệu huấn luyện
- Những thống kê, đặc trưng và ràng buộc nguyên lý entropy cực đại
- Dạng tham số
- Mối quan hệ với cực đại Likelihood
Bài toán phân lớp quan điểm sử dụng phương pháp học máy maximum entropy cực đại
2.3 Thực nghiệm
Dữ liệu thử nghiệm
Công cụ sử dụng
- Công cụ sinh SRIML
- Công cụ phân lớp dữ liệu Maxent
- Kết quả thực nghiệm
3. Kết luận
Trong quá trình làm khóa luận, em đã tìm hiểu được mô hình Entropy cực đại, một số khía cạnh về phân lớp quan điểm và các vấn đề đặt ra với bài toán này. Đồ án tìm hiểu về tiếp cận phân lớp quan điểm sử dụng trích chọn đặc trưng n-gram và áp dụng phương pháp học máy Maximum Entropy. Chương trình thực nghiệm cũng đã thử nghiệm trên bộ dữ liệu với 700 câu tích cực và 700 câu tiêu cực và sử dụng phương pháp học máy có giám sát Maximum Entropy để phân lớp với cách chọn đặc trưng là sử dụng uni-gram và bi-gram.
4. Tài liệu tham khảo
Bo Pang and Lillian Lee và Shivakumar Vaithyanathan. Thumbs up Sentiment Classification using Machine Learning Techniques.
Sentiment Identification Using Maximum Entropy Analysis of Movie Reviews. Nipun Mehra and Shashikant Khandelwal and Priyank Patel.
Ths. Nguyễn Thị Xuân Hương và Ths. Lê Thụy về “phân tích quan điểm và một số hƣớng tiếp cận”. Hội nghị khoa học lần thứ nhất, 2012, trường ĐHDL Hải Phòng.
Nguyễn Thùy Linh về “Phân lớp tài liệu web độc lập ngôn ngữ”. Khóa luận tốt nghiệp đại học hệ chính quy, ngành công nghệ thông tin, trường Đại học Quốc gia Hà Nội...
--- Nhấn nút TẢI VỀ hoặc XEM ONLINE để tham khảo đầy đủ nội dung Đồ án trên ---
Tham khảo thêm
- pdf Đồ án: Tìm hiểu phép toán hình thái và ứng dụng
- pdf Đồ án: Giao tiếp vi điều khiển và máy tính
- pdf Đồ án: Nghiên cứu, tìm hiểu chữ ký số và ứng dụng của nó để kiểm soát, xác thực và bảo vệ thông tin trong hộ chiếu điện tử
- pdf Đồ án: Tìm hiểu và cài đặt một số thuật toán phân cụm dữ liệu cơ bản
- pdf Đồ án: Kỹ thuật giấu tin trong ảnh dựa trên KBNS - Multiple base notational system
- pdf Đồ án: Tìm hiểu về một số thuật toán giấu tin và phát hiện ảnh có giấu tin
- pdf Đồ án: Hiệu chỉnh ánh sáng trong ảnh
- pdf Đồ án: Tìm hiểu phương pháp cực tiểu năng lượng dựa trên độ đồng nhất và độ không ổn định cho phân đoạn ảnh
- pdf Đồ án: Kỹ thuật giấu tin trong ảnh SES - Steganography Evading Statistical Analyses
- pdf Đồ án: Nghiên cứu một giải pháp giấu văn bản trong ảnh
- pdf Đồ án: Tìm hiểu một số kĩ thuật khảm ảnh
- pdf Đồ án: Tìm hiểu một số phương pháp trích chọn đặc trưng và ứng dụng cho tra cứu ảnh theo nội dung
- pdf Đồ án: Lập trình quản lý thư mục trong HDD bằng ngôn ngữ Assembly
- pdf Đồ án: Phương pháp tìm dạng phổ biến đóng 2 chiều, 3 chiều và ứng dụng
- pdf Đồ án: Tìm hiểu kỹ thuật thủy vân số thuận nghịch cho ảnh nhị phân
- pdf Đồ án: Tìm hiểu về phương pháp trích và sắp xếp các đặc trưng sản phẩm trong tài liệu chứa quan điểm
- pdf Đồ án: Tính toán phân tán và ứng dụng
- pdf Đồ án: Tìm hiểu kỹ thuật truyền File Multicast
- pdf Đồ án: Tìm hiểu kỹ thuật lập trình Network Service cho Window
- pdf Đồ án: Kỹ thuật giấu tin thuận nghịch trong ảnh bằng hiệu chỉnh hệ số Wavelet
- pdf Đồ án: Tìm hiểu phương pháp tra cứu ảnh y tế
- pdf Đồ án: Tìm hiểu bộ kiểm chứng mô hình spin
- pdf Đồ án: Tìm hiểu phương pháp phân đoạn tách các nét của chữ viết tay hạn chế