Đồ án: Tìm hiểu về Support Vector Machine cho bài toán phân lớp quan điểm

Đồ án Tìm hiểu về Support Vector Machine cho bài toán phân lớp quan điểm tìm hiểu về Support Vector Machine; bài toán phân lớp quan điểm và xây dựng chương trình thực nghiệm.

Đồ án: Tìm hiểu về Support Vector Machine cho bài toán phân lớp quan điểm

1. Mở đầu

1.1 Lí do chọn đề tài

Vấn đề phân lớp và dự đoán là khâu rất quan trọng trong học máy và trong khai phá dữ liệu, phát hiện trí thức. Kỹ thuật Support Vector Machines (SVM) được đánh giá là công cụ mạnh và tinh vi nhất hiện nay cho những bài toán phân lớp phi tuyến. Nhiều những ứng dụng đã và đang được xây dựng dựa trên kỹ thuật SVM rất hiệu quả.

1.2 Đối tượng phạm vi nghiên cứu

Trong khuôn khổ luận văn sẽ nghiên cứu phần bài toán phân lớp quan điểm, cơ sở lý thuyết của phương pháp SVM và các vấn đề liên quan. Phân tích những giải pháp cho phép mở rộng và cải tiến để nâng cao hiệu quả ứng dụng của SVM.

Đưa kỹ thuật mờ vào SVM cho phép phân chia không gian dữ liệu một cách tốt hơn, nhằm loại bỏ những vùng không được phân lớp bằng SVM thông thường.

Trình bày hướng áp dụng kỹ thuật SVM cũng như những cải tiến, mở rộng của nó vào giải quyết một số các bài toán ứng dụng trong thực tiễn.

Trình bày tổng quan về bài toán phân lớp quan điểm và cụ thể là bài toán phân lớp phân cực để phân chia các tài liệu chứa quan điểm là tích cực hay tiêu cực.

Tìm hiểu dữ liệu quan điểm và viết chương trình thử nghiệm phân lớp phân cực tài liệu sử dụng SVM

2. Nội dung

2.1 Tìm hiểu về Support Vector Machine

Phát biểu bài toán

  • Trình bày tóm tắt về phân lớp dữ liệu
  • Tại sao lại sử dụng thuật toán SVM trong phân lớp dữ liệu

Thuật toán SVM 

  • Giới thiệu
  • Định nghĩa
  • Ý tưởng của phương pháp
  • Nội dung phương pháp

2.2 Bài toán phân lớp quan điểm

Sự kiện (Facts) và quan điểm (Opinions)

Nhu cầu về thông tin quan điểm và nhận xét

Máy tìm kiểm quan điểm / nhận xét

Lịch sử của phân tích quan điểm và khai thác quan điểm

Xu hướng nghiên cứu gần đây

  • Xác định cụm từ, quan điểm
  • Sử dụng tính từ và phó từ
  • Sử dụng các động từ
  • Xác định chiều hướng, cụm từ, quan điểm

Nhiệm vụ của phân tích quan điểm

Bài toán phân lớp quan điểm

  • Phân cực quan điểm và mức độ phân cực
  • Nhiệm vụ của bài toán phân lớp quan điểm 
  • Xây dựng mô hình phân lớp để phân loại tài liệu

2.3 Chương trình thực nghiệm

Dữ liệu thử nghiệm

Công cụ sử dụng

  • Công cụ sinh SRIML
  • Ngôn ngữ lập trình java
  • Công cụ phân lớp dữ liệu SVMLight

Kết quả thực nghiệm

3. Kết luận

Luận văn hướng tới mục tiêu phân lớp dữ liệu đạt độ chính xác cao, tuy đã xem xét được tất cả các mục tiêu như trong phần giới thiệu nhưng do thời gian có hạn, nên một số vấn đề vẫn chưa hoàn chỉnh. Tuy nhiên, luận văn cũng đạt được một số kết quả: .

  • Nghiên cứu và trình bày cơ sở của lý thuyết của phƣơng pháp học máy.
  • Trình bày phương pháp SVM. Đây là một phương pháp phân lớp hiệu quả được nghiên cứu nhiều nhất trong thời gian qua.
  • Phân tích những giải pháp cho phép mở rộng và cải tiến để nâng cao hiệu quả ứng dụng của SVM

4. Tài liệu tham khảo

Ths. Nguyễn Thị Xuân Hƣơng và Ths. Lê Thụy về “phân tích quan điểm và một số hướng tiếp cận” . Hội nghị khoa học lần thứ nhất, 2012, trường ĐHDL Hải Phòng

Nghiên cứu thuật toán phân lớp nhị phân và ứng dụng cho bào toán Protein Folding – Nguyễn Quang Phƣớc – Trường Đại học Khoa học tự nhiên TPHCM

Bo Pang and Lillian Lee và Shivakumar Vaithyanathan. Thumbs up Sentiment Classification using Machine Learning Techniques.

http://en.wikipedia.org/wiki/Support_vector_machine...

--- Nhấn nút TẢI VỀ hoặc XEM ONLINE để tham khảo đầy đủ nội dung Đồ án trên ---

Ngày:10/09/2020 Chia sẻ bởi:Xuân Quỳnh

CÓ THỂ BẠN QUAN TÂM