Đồ án: Tìm hiểu về Support Vector Machine cho bài toán phân lớp quan điểm
Đồ án Tìm hiểu về Support Vector Machine cho bài toán phân lớp quan điểm tìm hiểu về Support Vector Machine; bài toán phân lớp quan điểm và xây dựng chương trình thực nghiệm.
Mục lục nội dung
1. Mở đầu
1.1 Lí do chọn đề tài
Vấn đề phân lớp và dự đoán là khâu rất quan trọng trong học máy và trong khai phá dữ liệu, phát hiện trí thức. Kỹ thuật Support Vector Machines (SVM) được đánh giá là công cụ mạnh và tinh vi nhất hiện nay cho những bài toán phân lớp phi tuyến. Nhiều những ứng dụng đã và đang được xây dựng dựa trên kỹ thuật SVM rất hiệu quả.
1.2 Đối tượng phạm vi nghiên cứu
Trong khuôn khổ luận văn sẽ nghiên cứu phần bài toán phân lớp quan điểm, cơ sở lý thuyết của phương pháp SVM và các vấn đề liên quan. Phân tích những giải pháp cho phép mở rộng và cải tiến để nâng cao hiệu quả ứng dụng của SVM.
Đưa kỹ thuật mờ vào SVM cho phép phân chia không gian dữ liệu một cách tốt hơn, nhằm loại bỏ những vùng không được phân lớp bằng SVM thông thường.
Trình bày hướng áp dụng kỹ thuật SVM cũng như những cải tiến, mở rộng của nó vào giải quyết một số các bài toán ứng dụng trong thực tiễn.
Trình bày tổng quan về bài toán phân lớp quan điểm và cụ thể là bài toán phân lớp phân cực để phân chia các tài liệu chứa quan điểm là tích cực hay tiêu cực.
Tìm hiểu dữ liệu quan điểm và viết chương trình thử nghiệm phân lớp phân cực tài liệu sử dụng SVM
2. Nội dung
2.1 Tìm hiểu về Support Vector Machine
Phát biểu bài toán
- Trình bày tóm tắt về phân lớp dữ liệu
- Tại sao lại sử dụng thuật toán SVM trong phân lớp dữ liệu
Thuật toán SVM
- Giới thiệu
- Định nghĩa
- Ý tưởng của phương pháp
- Nội dung phương pháp
2.2 Bài toán phân lớp quan điểm
Sự kiện (Facts) và quan điểm (Opinions)
Nhu cầu về thông tin quan điểm và nhận xét
Máy tìm kiểm quan điểm / nhận xét
Lịch sử của phân tích quan điểm và khai thác quan điểm
Xu hướng nghiên cứu gần đây
- Xác định cụm từ, quan điểm
- Sử dụng tính từ và phó từ
- Sử dụng các động từ
- Xác định chiều hướng, cụm từ, quan điểm
Nhiệm vụ của phân tích quan điểm
Bài toán phân lớp quan điểm
- Phân cực quan điểm và mức độ phân cực
- Nhiệm vụ của bài toán phân lớp quan điểm
- Xây dựng mô hình phân lớp để phân loại tài liệu
2.3 Chương trình thực nghiệm
Dữ liệu thử nghiệm
Công cụ sử dụng
- Công cụ sinh SRIML
- Ngôn ngữ lập trình java
- Công cụ phân lớp dữ liệu SVMLight
Kết quả thực nghiệm
3. Kết luận
Luận văn hướng tới mục tiêu phân lớp dữ liệu đạt độ chính xác cao, tuy đã xem xét được tất cả các mục tiêu như trong phần giới thiệu nhưng do thời gian có hạn, nên một số vấn đề vẫn chưa hoàn chỉnh. Tuy nhiên, luận văn cũng đạt được một số kết quả: .
- Nghiên cứu và trình bày cơ sở của lý thuyết của phƣơng pháp học máy.
- Trình bày phương pháp SVM. Đây là một phương pháp phân lớp hiệu quả được nghiên cứu nhiều nhất trong thời gian qua.
- Phân tích những giải pháp cho phép mở rộng và cải tiến để nâng cao hiệu quả ứng dụng của SVM
4. Tài liệu tham khảo
Ths. Nguyễn Thị Xuân Hƣơng và Ths. Lê Thụy về “phân tích quan điểm và một số hướng tiếp cận” . Hội nghị khoa học lần thứ nhất, 2012, trường ĐHDL Hải Phòng
Nghiên cứu thuật toán phân lớp nhị phân và ứng dụng cho bào toán Protein Folding – Nguyễn Quang Phƣớc – Trường Đại học Khoa học tự nhiên TPHCM
Bo Pang and Lillian Lee và Shivakumar Vaithyanathan. Thumbs up Sentiment Classification using Machine Learning Techniques.
http://en.wikipedia.org/wiki/Support_vector_machine...
--- Nhấn nút TẢI VỀ hoặc XEM ONLINE để tham khảo đầy đủ nội dung Đồ án trên ---
Tham khảo thêm
- pdf Đồ án: Xây dựng, triển khai và quản lý mô hình mạng
- pdf Đồ án: Mạng riêng ảo
- pdf Luận văn: Nghiên cứu mô hình MVC trong lập trình NET để xây dựng website đăng ký mua giáo trình qua mạng
- pdf Luận văn: Nghiên cứu xây dựng giải pháp quản trị tập trung các phòng máy tính
- pdf Đồ án: Tìm hiểu phương pháp phân đoạn ảnh y học
- pdf Đồ án: Tìm hiểu mạng neural và ứng dụng của nó
- pdf Đồ án: Tìm hiểu phương pháp trích chọn dấu hiệu của ảnh dựa vào đặc trưng hình dạng
- pdf Đồ án: Tìm hiểu phương pháp DSE - Discrete Skeleton Evolution cho bài toán tìm xương của ảnh
- pdf Đồ án: Tìm hiểu chuẩn IEEE 802.15.4 và các ứng dụng
- pdf Đồ án: Tìm hiểu phương pháp phát hiện biên cho ảnh đa cấp xám và ảnh màu
- pdf Đồ án: Nghiên cứu bảo mật Web Service
- pdf Đồ án: Tìm hiểu bài toán khai phá dữ liệu văn bản
- pdf Đồ án: Tìm hiểu phương pháp BPR - Bending Potential Ratio cho bài toán tìm xương của ảnh
- pdf Đồ án: Khai phá dữ liệu với R