Luận văn ThS: Ứng dụng gom cụm Fuzzy C - Means trong phân tích dữ liệu marketing

Luận văn Ứng dụng gom cụm Fuzzy C - Means trong phân tích dữ liệu marketing giới thiệu tổng quan về nghiên cứu marketing; khảo sát sơ lược tình hình nghiên cứu hiện nay; trình bày lý thuyết logic mờ, lý thuyết về gom cụm; phân tích đánh giá thuật toán K-Means và thuật toán Fuzzy C-Means.

Luận văn ThS: Ứng dụng gom cụm Fuzzy C - Means trong phân tích dữ liệu marketing

1. Mở đầu

1.1 Tính cấp thiết

Ở một nước đang phát triển như Việt Nam, số lượng doanh nghiệp liên tục tăng cao tạo nên sự cạnh tranh gây gắt. Các doanh nghiệp cần phải nhanh chóng đưa ra chiến lược, giải pháp kinh doanh. Để các người quản lý có thể đưa ra những quyết định khả thi, hiệu quả thì nguồn dữ liệu đóng vai trò khá quan trọng. Khi làm chủ được dữ liệu lớn thì họ sẽ có cơ hội thành công lớn hơn. Nhà quản trị không có nhiều thời gian cũng như điều kiện để nghiên cứu thông tin được thu thập, nên việc xây dựng ứng dụng hỗ trợ phân tích dữ liệu là cần thiết. Ví dụ: xác định các nhóm khách hàng (khách hàng tiềm năng, khách hàng giá trị, phân loại và dự đoán hành vi khách hàng,…). Bằng việc phân tích mối quan hệ giữa cụm và dữ liệu giúp tìm ra dữ liệu mà nhà quản trị mong muốn. Điều này có thể giúp công ty có chiến lược kinh doanh hiệu quả hơn. 

1.2 Mục tiêu nghiên cứu

Giúp người sử dụng phân loại theo đặc tính của dữ liệu, theo chức năng của dữ liệu, thấy trực quan vùng dữ liệu được thu thập. Việc phân loại dữ liệu sẽ đảm bảo đầy đủ thông tin, dễ thao tác với dữ liệu cho các dự án nghiên cứu được đặt ra.

2. Nội dung

2.1 Tổng quan

Nghiên cứu marketing

  • Thu thập dữ liệu
  • Phân loại dữ liệu

Tổng quan về gom cụm

  • Các khái niệm
  • Một số khái niệm khi tiếp cận phân cụm dữ liệu
  • Các ứng dụng của phân cụm

2.2 Cơ sở lí thuyết

Đề tài nghiên cứu thế giới

Thuật toán Fuzzy C-Means

  • Lý thuyết fuzzy logic
  • Lý thuyết gom cụm (Clustering)
  • Thuật toán K-Means
  • Thuật toán Fuzzy C-Means

2.3 Hệ thống phân tích dữ liệu dựa trên FCM

Sơ đồ tổng thể hệ thống

Mô hình không gian vector

Alpha-Cut sets

Crisp sets và Fuzzy sets

  • Tập rõ (Crisp sets)
  • Tập mờ (fuzzy sets)

Chương trình gom cụm Fuzzy C-Means

2.4 Thực nghiệm, đánh giá kết quả

Thực nghiệm

Đánh giá kết quả

3. Kết luận

Kết quả hiện thực của các thực nghiệm cho thấy bước đầu xây dựng thành công chương trình Fuzzy C-Means bao gồm các chức năng:

  • Ứng dụng Logic mờ để thu thập dữ liệu marketing.
  • Có khả năng làm việc với lượng dữ liệu lớn.
  • Có khả năng khám phá ra các cụm chưa được gán nhãn.
  • Xử lý được các tập dữ liệu chưa biết giá trị.
  • Phân loại dữ liệu, phần thành các cụm tương đồng.
  • Chương trình sẽ tính toán dựa vào dữ liệu đầu vào để đưa ra kết quả mong muốn.

Fuzzy C - Means phân cụm dữ liệu khá mềm dẻo khi xét đối tượng thuộc một cụm tuỳ theo độ thuộc của đối tượng đó vào cụm. Tuy nhiên Fuzzy C - Means lại xét tất cả các thuộc tính của đối tượng đều có vai trò như nhau. Trong thực tế, dữ liệu thường phức tạp và có những thuộc tính có ý nghĩa hơn hẳn các thuộc tính khác. Vì vậy việc đưa vector trọng số để điều chỉnh ý nghĩa của các thuộc tính là cần thiết.

4. Tài liệu tham khảo

Hesam Izakian, Ajith Abraham (2010). ”Fuzzy C-means and fuzzy swarm for fuzzy clustering problem”. Expert Systems with Applications Volume 38, Issue 3, March 2011, Pages 1835–1838

Jiawai Han and Micheline Kember (2011). Data Mining Concept and Techniques (Second Edition)

John Wiley and Sons (1999). “Fuzzy Cluster Analysis”. ISBN: 978-0-471- 98864-9

Krishna Kant Singh, M. J. Nigam, Kirat Pal, Akansha Mehrotra (2014). ” A Fuzzy Kohonen Local Information C-Means Clustering for Remote Sensing Imagery”. IETE Technical Review, Volume 31, Issue 1, 2014, pages 75-81....

--- Nhấn nút TẢI VỀ hoặc XEM ONLINE để tham khảo đầy đủ nội dung Luận văn trên ---

Ngày:04/09/2020 Chia sẻ bởi:Tuyết

CÓ THỂ BẠN QUAN TÂM