Luận văn thS: Xây dựng hệ thống tìm kiếm âm thanh theo nội dung dựa trên đặc trưng miền tần số

Luận văn Xây dựng hệ thống tìm kiếm âm thanh theo nội dung dựa trên đặc trưng miền tần số nghiên cứu giải thuật liên quan đến các kỹ thuật tìm kiếm âm thanh trong cơ sở dữ liệu âm thanh và giải pháp công nghệ cài đặt chương trình thử nghiệm.

Mục lục nội dung

1. Mở đầu

1.1 Lí do chọn đề tài

1.2 Đối tượng phạm vi nghiên cứu

1.3 Phương pháp nghiên cứu

2. Nội dung

2.1 Giới thiệu cơ sở dữ liệu đa phương tiện

2.2 Trích chọn đặc trưng âm thanh

2.3 Xây dựng chương trình thử nghiệm

3. Kết luận

4. Tài liệu tham khảo

5. Phụ lục

1. Mở đầu

1.1 Lí do chọn đề tài

Xã hội ngày càng phát triển lượng thông tin lưu trữ ngày càng lớn dẫn tới việc tìm kiếm dữ liệu đa phương tiện càng trở nên khó khăn. Do đó cần có các hệ thống tìm kiếm thông tin hỗ trợ người sử dụng tìm kiếm một cách chính xác, nhanh chóng, hiệu quả và tiết kiệm thời gian. Hơn nữa, Công nghệ thông tin truyền thông, mạng máy tính và các giao thức truyền thông phát triển mạnh mẽ, kết hợp với khả năng mô tả, đồ họa phong phú của các trình duyệt đã mang lại sự đa dạng về các dữ liệu cho người dùng đầu cuối. Do đó, đòi hỏi làm thế nào để tổ chức và cơ cấu một lượng rất lớn các dữ liệu đa phương tiện để có thể dễ dàng nhận được thông tin cần thiết một cách nhanh chóng tại bất kỳ thời điểm nào.

1.2 Đối tượng phạm vi nghiên cứu

Các khái niệm cơ bản về cơ sở dữ liệu đa phương tiện.

Các khái niệm cơ bản về đặc trưng âm thanh.

Một số kỹ thuật ứng dụng phát triển cơ sở dữ liệu âm thanh.

1.3 Phương pháp nghiên cứu

Tổng hợp các tài liệu đã được công bố về dữ liệu âm thanh.

Thực nghiệm một số thuật toán biến đổi trong xử lý âm thanh

Nhận xét, đánh giá kết quả thử nghiệm.

2. Nội dung

2.1 Giới thiệu cơ sở dữ liệu đa phương tiện

Các dữ liệu đa phương tiện

Tổng quan cơ sở dữ liệu đa phương tiện

Khái niệm
Kiến trúc cơ sở dữ liệu đa phương tiện
Đặc trưng của một cơ sở dữ liệu đa phương tiện

Khái quát cơ sở dữ liệu âm thanh

Một số khái niệm
Dữ liệu âm thanh
Giới thiệu Cơ sở dữ liệu âm thanh

2.2 Trích chọn đặc trưng âm thanh

Khái quát về đặc trưng chính của âm thanh

Các đặc trưng âm thanh trong miền thời gian

Năng lượng trung bình
Zero crossing rate
Silence ratio

Các đặc trưng âm thanh trong miền tần số

Phổ âm thanh
Bandwidth
Phân bổ năng lƣợng
Điều hòa (Harmonicity)
Cao độ (Pitch)
Ảnh phổ (Spectrogram)
Các đặc trưng chủ quan

Đặc trưng âm thanh MFCC

Các bước tính MFCC
Đặc trưng âm thanh MFCC
Phương pháp phân tích MFCC

Phân lớp âm thanh

Giới thiệu về phân lớp âm thanh
Đặc điểm chính của phân lớp âm thanh
Kỹ Thuật phân lớp âm thanh

Một số kỹ thuật phân cụm

Tổng quan về phân cụm
Kỹ thuật phân cụm không phân cấp
Phương pháp phân cụm K- means
K- means đầy đủ
Kỹ thuật phân lớp dùng thời gian động DTW

Mô hình hệ thống cở sở dữ liệu âm thanh

2.3 Xây dựng chương trình thử nghiệm

Giới thiệu bài toán thử nghiệm

Cài đặt thử nghiệm hệ thống tìm kiếm âm thanh

Mô hình hệ thống
Luồng dữ liệu trong chƣơng trình và các âm thanh số thực nghiệm
Một số chức năng của chương trình

Kết quả thực nghiệm

3. Kết luận

Luận văn trên đây đã giới thiệu một số phương pháp tìm kiếm âm thanh theo nội dung, bao gồm tình hình nghiên cứu và hướng phát triển của việc tìm kiếm dữ liệu âm thanh hiện nay, các khái niệm cơ sở và chọn lọc một số phương pháp, giải thuật nghiên cứu đã được chứng minh là hiệu quả thông qua các thí nghiệm trong thời gian gần đây. Việc tìm kiếm âm thanh theo nội dung nói chung và nhận dạng giọng nói nói riêng là một vấn đề khó, đòi hỏi kết hợp nhiều phương pháp khác nhau, sử dụng nhiều bộ tham số đặc trưng khác nhau. Trong khuôn khổ luận văn mới chỉ cài đặt thử nghiệm hệ thống nhận dạng giọng nói sử dụng một đặc trưng MFCC, chưa kết hợp thêm các đặc trưng khác như tần số cơ bản, formant… Luận văn đã thực hiện được:

Tìm hiểu các đặc trưng của âm thanh và tiếng nói.
Tìm hiểu một số phương pháp trích chọn đặc trƣng sử dụng MFCC, tần số cơ bản F₀ và Formant.
Đề xuất một mô hình cho hệ thống nhận dạng tìm kiếm âm thanh. Cài đặt được phần mềm thử nghiệm trên nền Matlab.

4. Tài liệu tham khảo

Đặng Văn Chuyết, Ngô Minh Dũng “Khảo sát tính ổn định của một số đặc trưng ngữ âm trong nhận dạng người nói”

Đặng Văn Đức, cơ sở dữ liệu đa phương tiện, Bài giảng cho cao học, Đại học Công nghệ thông tin và truyền thông, Đại học Bách khoa - Hà Nội, Đại học Công nghệ 2005-2014

ETSI, “ES 202 050 V1.1.5 (2007-01)”, Chuẩn cho xử lý, truyền dẫn và nhận dạng tiếng nói của tổ chức tiêu chuẩn châu Âu ESTI.

Phạm Văn Sự, Trương Xuân Thành, “Giáo trình xử lý tiếng nói”, Học viện Công nghệ Bưu chính Viễn thông.

Dalibor Mitrovic et.al., Features for Content-Based Audio Retrieval , Vienna University of Technology, 2010.

DALIBOR MITROVI´ C et al, “Features for Content-Based Audio Retrieval”, Vienna University of Technology, dalibor.mitrovic@computer.org.....

5. Phụ lục

Phụ lục 1: Sơ lượng về MATLAB

Phụ lục 2: Một số mã nguồn

--- Nhấn nút TẢI VỀ hoặc XEM ONLINE để tham khảo đầy đủ nội dung Luận văn Thạc sĩ trên ---

Ngày:18/08/2020 Chia sẻ bởi:Ngoan

TẢI VỀ XEM ONLINE

Luận văn thS: Xây dựng hệ thống tìm kiếm âm thanh theo nội dung dựa trên đặc trưng miền tần số

Mục lục nội dung

1. Mở đầu

1.1 Lí do chọn đề tài

1.2 Đối tượng phạm vi nghiên cứu

1.3 Phương pháp nghiên cứu

2. Nội dung

2.1 Giới thiệu cơ sở dữ liệu đa phương tiện

2.2 Trích chọn đặc trưng âm thanh

2.3 Xây dựng chương trình thử nghiệm

3. Kết luận

4. Tài liệu tham khảo

5. Phụ lục

Tham khảo thêm

Hệ thống thông tin

Công nghệ tri thức

Kỹ thuật máy tính

Khoa học máy tính

Mạng và Hệ thống

Đồ hoạ - Ứng dụng

Công nghệ phần mềm

TRANG CHỦ

HỌC TẬP

TÀI LIỆU

BIỂU MẪU

VĂN BẢN LUẬT

HƯỚNG DẪN

THỦ THUẬT

Luận văn thS: Xây dựng hệ thống tìm kiếm âm thanh theo nội dung dựa trên đặc trưng miền tần số

Mục lục nội dung

1. Mở đầu

1.1 Lí do chọn đề tài

1.2 Đối tượng phạm vi nghiên cứu

1.3 Phương pháp nghiên cứu

2. Nội dung

2.1 Giới thiệu cơ sở dữ liệu đa phương tiện

2.2 Trích chọn đặc trưng âm thanh

2.3 Xây dựng chương trình thử nghiệm

3. Kết luận

4. Tài liệu tham khảo

5. Phụ lục

Tham khảo thêm

CÓ THỂ BẠN QUAN TÂM

Hệ thống thông tin

Công nghệ tri thức

Kỹ thuật máy tính

Khoa học máy tính

Mạng và Hệ thống

Đồ hoạ - Ứng dụng

Công nghệ phần mềm

TRANG CHỦ

HỌC TẬP

TÀI LIỆU

BIỂU MẪU

VĂN BẢN LUẬT

HƯỚNG DẪN

THỦ THUẬT