Luận văn thS: Xây dựng hệ thống tìm kiếm âm thanh theo nội dung dựa trên đặc trưng miền tần số
Luận văn Xây dựng hệ thống tìm kiếm âm thanh theo nội dung dựa trên đặc trưng miền tần số nghiên cứu giải thuật liên quan đến các kỹ thuật tìm kiếm âm thanh trong cơ sở dữ liệu âm thanh và giải pháp công nghệ cài đặt chương trình thử nghiệm.
Mục lục nội dung
1. Mở đầu
1.1 Lí do chọn đề tài
Xã hội ngày càng phát triển lượng thông tin lưu trữ ngày càng lớn dẫn tới việc tìm kiếm dữ liệu đa phương tiện càng trở nên khó khăn. Do đó cần có các hệ thống tìm kiếm thông tin hỗ trợ người sử dụng tìm kiếm một cách chính xác, nhanh chóng, hiệu quả và tiết kiệm thời gian. Hơn nữa, Công nghệ thông tin truyền thông, mạng máy tính và các giao thức truyền thông phát triển mạnh mẽ, kết hợp với khả năng mô tả, đồ họa phong phú của các trình duyệt đã mang lại sự đa dạng về các dữ liệu cho người dùng đầu cuối. Do đó, đòi hỏi làm thế nào để tổ chức và cơ cấu một lượng rất lớn các dữ liệu đa phương tiện để có thể dễ dàng nhận được thông tin cần thiết một cách nhanh chóng tại bất kỳ thời điểm nào.
1.2 Đối tượng phạm vi nghiên cứu
Các khái niệm cơ bản về cơ sở dữ liệu đa phương tiện.
Các khái niệm cơ bản về đặc trưng âm thanh.
Một số kỹ thuật ứng dụng phát triển cơ sở dữ liệu âm thanh.
1.3 Phương pháp nghiên cứu
Tổng hợp các tài liệu đã được công bố về dữ liệu âm thanh.
Thực nghiệm một số thuật toán biến đổi trong xử lý âm thanh
Nhận xét, đánh giá kết quả thử nghiệm.
2. Nội dung
2.1 Giới thiệu cơ sở dữ liệu đa phương tiện
Các dữ liệu đa phương tiện
Tổng quan cơ sở dữ liệu đa phương tiện
- Khái niệm
- Kiến trúc cơ sở dữ liệu đa phương tiện
- Đặc trưng của một cơ sở dữ liệu đa phương tiện
Khái quát cơ sở dữ liệu âm thanh
- Một số khái niệm
- Dữ liệu âm thanh
- Giới thiệu Cơ sở dữ liệu âm thanh
2.2 Trích chọn đặc trưng âm thanh
Khái quát về đặc trưng chính của âm thanh
Các đặc trưng âm thanh trong miền thời gian
- Năng lượng trung bình
- Zero crossing rate
- Silence ratio
Các đặc trưng âm thanh trong miền tần số
- Phổ âm thanh
- Bandwidth
- Phân bổ năng lƣợng
- Điều hòa (Harmonicity)
- Cao độ (Pitch)
- Ảnh phổ (Spectrogram)
- Các đặc trưng chủ quan
Đặc trưng âm thanh MFCC
- Các bước tính MFCC
- Đặc trưng âm thanh MFCC
- Phương pháp phân tích MFCC
Phân lớp âm thanh
- Giới thiệu về phân lớp âm thanh
- Đặc điểm chính của phân lớp âm thanh
- Kỹ Thuật phân lớp âm thanh
Một số kỹ thuật phân cụm
- Tổng quan về phân cụm
- Kỹ thuật phân cụm không phân cấp
- Phương pháp phân cụm K- means
- K- means đầy đủ
- Kỹ thuật phân lớp dùng thời gian động DTW
Mô hình hệ thống cở sở dữ liệu âm thanh
2.3 Xây dựng chương trình thử nghiệm
Giới thiệu bài toán thử nghiệm
Cài đặt thử nghiệm hệ thống tìm kiếm âm thanh
- Mô hình hệ thống
- Luồng dữ liệu trong chƣơng trình và các âm thanh số thực nghiệm
- Một số chức năng của chương trình
Kết quả thực nghiệm
3. Kết luận
Luận văn trên đây đã giới thiệu một số phương pháp tìm kiếm âm thanh theo nội dung, bao gồm tình hình nghiên cứu và hướng phát triển của việc tìm kiếm dữ liệu âm thanh hiện nay, các khái niệm cơ sở và chọn lọc một số phương pháp, giải thuật nghiên cứu đã được chứng minh là hiệu quả thông qua các thí nghiệm trong thời gian gần đây. Việc tìm kiếm âm thanh theo nội dung nói chung và nhận dạng giọng nói nói riêng là một vấn đề khó, đòi hỏi kết hợp nhiều phương pháp khác nhau, sử dụng nhiều bộ tham số đặc trưng khác nhau. Trong khuôn khổ luận văn mới chỉ cài đặt thử nghiệm hệ thống nhận dạng giọng nói sử dụng một đặc trưng MFCC, chưa kết hợp thêm các đặc trưng khác như tần số cơ bản, formant… Luận văn đã thực hiện được:
- Tìm hiểu các đặc trưng của âm thanh và tiếng nói.
- Tìm hiểu một số phương pháp trích chọn đặc trƣng sử dụng MFCC, tần số cơ bản F0 và Formant.
- Đề xuất một mô hình cho hệ thống nhận dạng tìm kiếm âm thanh. Cài đặt được phần mềm thử nghiệm trên nền Matlab.
4. Tài liệu tham khảo
Đặng Văn Chuyết, Ngô Minh Dũng “Khảo sát tính ổn định của một số đặc trưng ngữ âm trong nhận dạng người nói”
Đặng Văn Đức, cơ sở dữ liệu đa phương tiện, Bài giảng cho cao học, Đại học Công nghệ thông tin và truyền thông, Đại học Bách khoa - Hà Nội, Đại học Công nghệ 2005-2014
ETSI, “ES 202 050 V1.1.5 (2007-01)”, Chuẩn cho xử lý, truyền dẫn và nhận dạng tiếng nói của tổ chức tiêu chuẩn châu Âu ESTI.
Phạm Văn Sự, Trương Xuân Thành, “Giáo trình xử lý tiếng nói”, Học viện Công nghệ Bưu chính Viễn thông.
Dalibor Mitrovic et.al., Features for Content-Based Audio Retrieval , Vienna University of Technology, 2010.
DALIBOR MITROVI´ C et al, “Features for Content-Based Audio Retrieval”, Vienna University of Technology, dalibor.mitrovic@computer.org.....
5. Phụ lục
Phụ lục 1: Sơ lượng về MATLAB
Phụ lục 2: Một số mã nguồn
--- Nhấn nút TẢI VỀ hoặc XEM ONLINE để tham khảo đầy đủ nội dung Luận văn Thạc sĩ trên ---
Tham khảo thêm
- pdf Luận văn ThS: Nghiên cứu tìm hiểu thực trạng về an ninh mạng và biện pháp khắc phục
- pdf Luận văn ThS: Đánh giá dự án đầu tư và lập lịch quản lý dự án tự động
- pdf Luận văn ThS: Ứng dụng kho dữ liệu và webservice để tích hợp dữ liệu xây dựng hệ thống báo cáo thống kê tại trường Cao đẳng Nghề số 3 BQP
- pdf Luận văn ThS: Tra cứu ảnh dựa trên nội dung sử dụng nhiều đặc trưng và phản hồi liên quan
- pdf Luận văn ThS: Học bán giám sát trên đồ thị với ứng dụng tra cứu ảnh
- pdf Luận văn ThS: Chiến lược thiết kế lĩnh vực và ứng dụng phần mềm quản lý người dùng tập trung
- pdf Luận văn ThS: Công nghệ ảo hóa Docker và ứng dụng tại Đại học Dân lập Hải Phòng
- pdf Luận văn ThS: Xây dựng hệ thống quản lý dữ liệu video tại Đài phát thanh và truyền hình Hải Phòng bằng phương pháp hướng đối tượng, ứng dụng mẫu thiết kế
- pdf Luận văn ThS: Nghiên cứu đề xuất thuật toán mã hóa văn bản có độ bảo mật cao trên cơ sở mật mã truyền thống
- pdf Luận văn ThS: Nghiên cứu xử lý các đoạn video để trợ giúp phát triển tư duy học sinh
- pdf Luận văn ThS: Cải tiến công cụ SEO Panel
- pdf Luận văn ThS: Xây dựng hệ thống quản lý, hỗ trợ yêu cầu phần mềm
- pdf Luận văn ThS: Giải pháp backup dữ liệu, sử dụng cơ chế phân cụm động trong mạng ngang hàng có cấu trúc
- pdf Luận văn ThS: Nghiên cứu, ứng dụng công nghệ Blockchain trong thanh toán di động
- pdf Luận văn ThS: Dự đoán tương tác protein – protein sử dụng kỹ thuật khai phá dữ liệu
- pdf Luận văn ThS: Tích hợp nghiệp vụ dựa trên công nghệ ESB Middleware
- pdf Luận văn ThS: Nghiên cứu và xây dựng ứng dụng giám sát hành trình trên điện thoại di động
- pdf Luận văn ThS: Mật mã dòng trong mật mã nhẹ và triển vọng trong IoT
- pdf Luận văn thS: Các phương pháp dự đoán khả năng ức chế bệnh dựa trên các biểu diễn khác nhau của RNA và ứng dụng
- pdf Luận văn ThS: Nghiên cứu và đánh giá các phương pháp tổng hợp dữ liệu cho bài toán phân loại lớp phủ đô thị tại Việt Nam
- pdf Luận văn ThS: Nghiên cứu và đánh giá các phương pháp nội suy ảnh viễn thám cho bài toán phân loại lớp phủ đô thị tại việt Nam
- pdf Luận văn ThS: Mô hình 3D và tối ưu hóa mô hình trong thực tại ảo
- pdf Luận văn ThS: Phát hiện bất thường bằng phân tích Tensor để nhận biết xung động kinh trong dữ liệu điện não
- pdf Luận văn ThS: Nhận dạng thực thể định danh từ văn bản ngắn tiếng Việt và đánh giá thực nghiệm
- pdf Luận văn ThS: Truy hồi chéo mô hình cho nhạc và lời bài hát
- pdf Luận văn ThS: Nghiên cứu giải pháp tự động phát hiện sự có hệ thống dựa trên công nghệ ELK
- pdf Luận văn ThS: Phân tích đột biến trong kiểm thử phần mềm và áp dụng trong kiểm thử ứng dụng Android
- pdf Luận văn ThS: Nghiên cứu và ứng dụng học máy trong phân lớp lúa sử dụng ảnh viễn thám
- pdf Luận văn ThS: Nghiên cứu hệ thống trợ lý thông minh ảo
- pdf Luận văn ThS: Nghiên cứu và phát triển phương pháp phân lớp lúa ở đồng bằng sông Hồng sử dụng ảnh vệ tinh Landsat 8
- pdf Luận văn ThS: Nghiên cứu tính khả dụng của các hệ thống thông tin doanh nghiệp dựa trên dịch vụ web
- pdf Luận văn ThS: Nghiên cứu mô hình kiểm soát truy xuất cho dữ liệu lớn