Luận văn ThS: Xây dựng hệ thống truy vấn video nông nghiệp hướng ngữ nghĩa có sử dụng Ontology

Luận văn Xây dựng hệ thống truy vấn video nông nghiệp hướng ngữ nghĩa có sử dụng Ontology trình bày các cơ sở lý thuyết được sử dụng trong đề tài; mô tả chi tiết các thành phần của hệ thống truy vấn video hướng ngữ nghĩa có sử dụng Ontology và đặc tả phần mềm demo của hệ thống; thực nghiệm đánh giá độ chính xác của mô hình nhận dạng tiếng nói. Trình bày kết quả xây dựng Ontology chăn nuôi, phương pháp đánh giá và chương trình demo.

Luận văn ThS: Xây dựng hệ thống truy vấn video nông nghiệp hướng ngữ nghĩa có sử dụng Ontology

1. Mở đầu

1.1 Bối cảnh

Truy vấn thông tin (Information Retrieval - IR) là việc tìm kiếm thông tin (thường là các tài liệu) ở một dạng không có cấu trúc (thông thường là văn bản) để thỏa mãn nhu cầu thông tin từ những nguồn thông tin khổng lồ được lưu trữ trên các máy tính. Truy vấn thông tin là lĩnh vực nghiên cứu nhằm tìm ra giải pháp để có được các thông tin cần thiết trong một khối lượng lớn dữ liệu. Một hệ thống tìm kiếm thông tin có hai chức năng chính: lập chỉ mục (indexing) và truy vấn (interrogation). Trong đó, lập chỉ mục là giai đoạn phân tích tài liệu (document) để xác định các chỉ mục (term/ index term) biểu diễn nội dung của tài liệu, truy vấn là giai đoạn tìm các tài liệu phù hợp với từ khóa (keyword) đã được đưa vào trước đó.

1.2 Mục tiêu nghiên cứu

Mục tiêu nghiên cứu chính của luận văn là xây dựng một hệ thống truy vấn video hướng ngữ nghĩa cho thông tin chăn nuôi trong nông nghiệp với sự hỗ trợ của hệ thống mở rộng câu truy vấn tự động từ một Ontology. Khác biệt của nghiên cứu này so với các nghiên cứu hiện nay là chủ đề tìm kiếm chăn nuôi trong nông nghiệp và làm việc trên tiếng Việt, không giống như đại đa số các nghiên cứu trên tiếng Anh.

2. Nội dung

2.1 Cơ sở lí thuyết

Hệ thống tìm kiếm thông tin 

  • Giới thiệu chung về hệ thống tìm kiếm thông tin
  • Hệ thống tìm kiếm dựa trên từ khóa
  • Hệ thống tìm kiếm dựa trên khái niệm (hướng ngữ nghĩa)

Nhận dạng tiếng nói

  • Dẫn nhập
  • Trích chọn đặc trưng
  • Mô hình ngữ âm (Acoustic Model) 
  • Mô hình ngôn ngữ (LM)
  • Phép tìm kiếm
  • Tổ chức đồ thị tìm kiếm kết quả nhận dạng
  • Đồ thị tìm kiếm với ngữ cảnh một âm vị (monophone), ngữ cảnh có xét âm vị trái phải chỉ trong từ (triphone within-word) và ngữ cảnh có xét âm vị trái phải trong câu nói (triphones cross-word)

Ontology

  • Khái niệm
  • Mục đích xây dựng Ontology
  • Yêu cầu khi xây dựng Ontology
  • Các thành phần của Ontology
  • Phương pháp xây dựng Ontology

2.2 Hệ thống truy vấn video nông nghiệp

Kiến trúc tổng quan của hệ thống

Các thành phần của hệ thống

  • Bộ nhận dạng tiếng nói tiếng Việt
  • Ứng dụng truy vấn video

Đặc tả phần mềm

  • Môi trường phát triển
  • Thiết kế kiến trúc

2.3 Thực nghiệm

Cấu hình máy thử nghiệm

Thực nghiệm

  • Thực nghiệm đánh giá độ chính xác của mô hình nhận dạng tiếng nói
  • Kết quả xây dựng Ontology chăn nuôi, phương pháp đánh giá và thực nghiệm truy vấn của hệ thống
  • Demo ứng dụng

3. Kết luận

Luận văn trình bày hệ thống truy vấn thông tin video nông nghiệp hướng ngữ nghĩa. Tính ngữ nghĩa của hệ thống được thể hiện qua việc sử dụng từ, cụm từ nhận dạng được từ kênh âm thanh của video để lập chỉ mục tìm kiếm cho các đoạn video đó. Áp dụng Ontology vào hệ thống truy vấn thông tin video giúp mở rộng câu truy vấn của người dùng từ đó mở rộng và nâng cao chất lượng tìm kiếm, bên cạnh đó một số lợi ích mà bộ Ontology mang lại như tính dễ mở rộng, tính tái sử dụng. Những đóng góp của đề tài:

  • Phát triển bộ nhận dạng tiếng nói cho lĩnh vực chăn nuôi trong nông nghiệp Việt Nam.
  • Xây dựng một Ontology cho lĩnh vực chăn nuôi.
  • Tích hợp được một hệ thống truy vấn video về chăn nuôi trong nông nghiệp Việt Nam hướng ngữ nghĩa có sử dụng Ontology.
  • Đóng góp bộ dữ liệu huấn luyện cho mô-đun nhận dạng tiếng nói tiếng Việt trong lĩnh vực chăn nuôi với tổng thời gian 4 giờ 34 phút 47 giây gồm 950 file của 44297 từ.

4. Tài liệu tham khảo

Arisoy, E., Can, D., Parlak, S., Sak, H., & Saraçlar, M (2009), Turkish broadcast news transcription and retrieval. Audio, Speech, and Language Processing, IEEE Transactions on, 17(5), 874-883.

Chelba, C., Hazen, T. J., & Saraçlar, M (2008), Retrieval and browsing of spoken content. Signal Processing Magazine, IEEE, 25(3), 39-49.

Van Thong, J. M., Moreno, P. J., Logan, B., Fidler, B., Maffey, K., & Moores, M (2002), Speechbot: an experimental speech-based search engine for multimedia content on the web. Multimedia, IEEE Transactions on, 4(1), 88-96.

Carpineto, Claudio, Giovanni, Romano (2012), A Survey of Automatic Query Expansion in Information Retrieval. ACM Comput. Surv. (CSUR) 44(1)...

--- Nhấn nút TẢI VỀ hoặc XEM ONLINE để tham khảo đầy đủ nội dung Luận văn Thạc sĩ trên ---

Ngày:31/08/2020 Chia sẻ bởi:Nhi

CÓ THỂ BẠN QUAN TÂM