Luận văn ThS: Nghiên cứu về dịch máy thống kê dựa vào cụm từ và ứng dụng dịch từ tiếng Việt sang tiếng Anh
Luận văn Nghiên cứu về dịch máy thống kê dựa vào cụm từ và ứng dụng dịch từ tiếng Việt sang tiếng Anh nghiên cứu, tìm hiểu, phân tích về dịch máy thống kê trên cơ sở cụm từ; cài đặt thử nghiệm tối ưu hóa cụm từ bằng hệ dịch máy thống kế Moses.
Mục lục nội dung
1. Mở đầu
1.1 Lí do chọn đề tài
Vào những năm gần đây, dịch máy nói chung, dịch máy thống kê nói riêng được phát triển mạnh và ứng dụng rộng rãi. Kết quả thực tế của hệ thống dịch này rất tốt. Ngôn ngữ của máy dịch ngày càng gần với ngôn ngữ của người. Ngoài ra cùng với hệ thống dịch máy thống kê, các sản phẩm ứng dụng ngày càng nhiều giúp con người trao đổi thông tin dễ dàng hơn, tốc độ nhanh hơn và cùng với nhiều ngôn ngữ hơn. Hiện nay, phương pháp dịch thống kê dựa trên cụm từ là phương pháp cho kết quả dịch tốt nhất hiện nay. Điều này được thể hiện của qua các hệ dịch máy của Google, Vietgle. Hơn nữa việc dịch giữa tiếng Việt sang tiếng Anh là rất cần thiết khi khối lượng văn bản tiếng Anh ngày càng lớn trong thời kỳ Việt Nam hội nhập sâu rộng với quốc tế.
1.2 Đối tượng phạm vi nghiên cứu
Đối tượng nghiên cứu:
- Nghiên cứu về các phương pháp, mô hình dịch máy thống kê
- Thử nghiệm và đánh giá kết quả dịch từ tiếng Việt sang tiếng Anh
Phạm vi nghiên cứu: Đề tài tập trung vào nghiên cứu phương pháp dịch thống kê dựa vào cụm từ và ứng dụng dịch tài liệu, văn bản tiếng Việt, tiếng Anh.
1.3 Phương pháp nghiên cứu
Tìm hiểu các hệ dịch tự động đã có để tìm ra các phương pháp dịch máy mà các hệ dịch đang sử dụng.
Nghiên cứu và đánh giá các phương pháp dịch máy, những ưu điểm và hạn chế, sau đó tìm ra phương pháp có hiệu quả và đề xuất áp dụng cho bài toán đề tài đặt ra.
Nghiên cứu các phương pháp đánh giá chất lượng dịch máy để đánh giá hiệu quả dịch cho hệ thống đề tài đã xây dựng.
2. Nội dung
2.1 Tổng quan về dịch máy
Khái niệm về hệ dịch máy
- Định nghĩa
- Vai trò của dịch máy
- Sơ đồ tổng quan của một hệ dịch máy
Dịch máy thống kê là gì?
- Tổng quan về dịch thống kê
- Mô hình kênh nguồn
- Cách tiếp cận Maximum và mô hình gióng hàng
- Nhiệm vụ trong dịch thống kê
- Ưu điểm của phương pháp dịch thống kê
Phân loại dịch máy thống kê
- Dịch máy thống kê dựa vào từ (word-based)
- Dịch máy thống kê dựa trên cụm từ (phrase-based)
- Dịch máy thông kê dựa trên cú pháp
- Một số công cụ và các nhóm nghiên cứu trên Internet về SMT
2.2 Áp dụng cho ngôn ngữ Việt - Anh
Giới thiệu mô hình dịch máy dựa trên cụm từ
Kiến trúc của mô hình dịch dựa trên cụm từ
- Mô hình log-linenear
- Mô hình dịch
- Mô hình ngôn ngữ
Giải mã
- Đặt vấn đề
- Mô tả thuật toán
Đánh giá chất lượng dịch
Phần mềm mã nguồn mở Moses
Quá trình giải mã
Áp dụng với cặp ngôn ngữ Việt – Anh
- Xây dựng ngữ liệu (corpus)
- Phân đoạn từ trong corpus tiếng Việt (Segmentation)
- Đánh giá theo dữ liệu huấn luyện
- Đánh giá theo mô hình gióng hàng từ trong văn bản
2.3 Thử nghiệm và đánh giá
Công cụ tiền xử lý cho hệ dịch
- Môi trường triển khai
- Chuẩn bị dữ liệu đầu vào cho hệ dịch
- Huấn luyện mô hình dịch
Kết quả thực nghiệm
- Dữ liệu đầu vào
- Quá trình chuẩn bị dữ liệu và huấn luyện
3. Kết luận
Luận văn đã đưa ra phương pháp dịch máy thống kê dựa trên cụm từ là một trong những phương pháp dịch đang được áp dụng rộng rãi trên thế giới. ví dụ như Google, Vietgle, Systran...vvv . nó đã khắc phục được các nhược điểm của dịch máy dựa vào từ và dựa vào luật.Từ mô hình đó tôi đã nghiên cứu và ứng dụng vào dịch ngôn ngữ Việt _ Anh. Mặc dù chất lượng dịch chưa cao, nhưng khi chúng ta cải tiến mô hình dịch đồng thời đưa nhiều dữ liệu nguồn hơn nữa, chất lượng dịch sẽ được nâng lên. Các công việc đạt được của luận văn:
- Trình bày được tổng quan về hệ dịch máy đặc biệt là dịch máy thống kê dựa vào cụm từ
- Giải thích được bộ công cụ mã nguồn mở Moses
- Thử nghiệm mô hình dịch máy và cho kết quả tương đối khả quan
4. Tài liệu tham khảo
Nguyễn Văn Vinh (2005). “Xây dựng chương trình dịch tự động Anh-Việt bằng phương pháp dịch thống kê”. Luận văn Thạc sĩ, Đại học Công nghệ, ĐHQGHN
Đào Ngọc Tú (2012). “ Nghiên cứu về dịch máy thống kê dựa vào cụm từ và thừ nghiệm với cặp ngôn ngữ Anh _ Việt”. Luận văn Thạc sĩ Học viện công nghệ bưu chính viễn thông
W. Weaver (1955). Translation (1949). In: Machine Translation of Languages, MIT Press, Cambridge, MA.
F. Och and H. Ney. (2003). A Systematic Comparison of Various Statistical Alignment Models. Computational Linguistics, pp 29(1):19-51...
--- Nhấn nút TẢI VỀ hoặc XEM ONLINE để tham khảo đầy đủ nội dung Luận văn Thạc sĩ trên ---
Tham khảo thêm
- pdf Luận văn ThS: Bài toán xác định vị trí của một điểm so với đa giác và ứng dụng trong bản đồ số
- pdf Luận văn ThS: Dự báo chuỗi thời gian mờ dựa trên đại số gia tử với mô hình ngữ nghĩa định lượng tối ưu và ứng dụng
- pdf Luận văn ThS: Nghiên cứu nhận dạng biển số xe ô tô Cộng hòa dân chủ nhân dân Lào
- pdf Luận văn ThS: Nghiên cứu một số kỹ thuật tạo chuyển động theo điểm điều khiển trong thực tại ảo
- pdf Luận văn ThS: Nghiên cứu mô hình người sử dụng mở trong các hệ thống gợi ý thông tin theo nhu cầu
- pdf Luận văn ThS: Phương pháp xây dựng cây quyết định dựa trên tập phụ thuộc hàm xấp xỉ
- pdf Luận văn ThS: Xác định vùng tìm kiếm trên hình ảnh địa hình và ứng dụng
- pdf Luận văn ThS: Hiển thị ảnh DICOM trong y tế theo thành phần
- pdf Luận văn ThS: Điều khiển dựa trên đại số gia tử với phép ngữ nghĩa hóa và giải nghĩa mở rộng
- pdf Luận văn ThS: Sử dụng công nghệ GIS để phân tích dữ liệu và dự báo sản lượng chè của tỉnh Thái Nguyên
- pdf Luận văn ThS: Nghiên cứu một số phương pháp bảo đảm an toàn thông tin trong mạng máy tính
- pdf Luận văn ThS: Tích hợp và dung hòa các ý kiến trong hệ trợ giúp quyết định đa tiêu chuẩn ngôn ngữ với thông tin trọng số không đầy đủ
- pdf Luận văn ThS: Nghiên cứu kỹ thuật Rainbow- Crack thám khóa mã RC4 và ứng dụng
- pdf Luận văn ThS: Cụm dữ liệu và ứng dụng trong phân tích lương của cán bộ trường Cao đẳng Nghề Hà Nam
- pdf Luận văn ThS: Kỹ thuật Datamining để khuyến nghị khách hàng trong hệ thống BI - Business Intelligence
- pdf Luận văn ThS: Tích hợp cơ sở dữ liệu quan hệ XML
- pdf Luận văn ThS: Kỹ thuật phân cụm dữ liệu trong phát hiện xâm nhập trái phép
- pdf Luận văn ThS: Phương pháp tối ưu đàn kiến dóng hàng hai đồ thị
- pdf Luận văn ThS: Nghiên cứu một số phương pháp cơ bản về nhận dạng mặt người trong ảnh và ứng dụng
- pdf Luận văn ThS: Xây dựng vùng đệm trong hệ thống thông tin địa lý sử dụng logic mờ
- pdf Luận văn ThS: Nghiên cứu sự ảnh hưởng của bộ tâm nội suy đến độ chính xác của xấp xỉ đạo hàm dựa trên nội suy hàm cơ sở bán kính
- pdf Luận văn ThS: Bảo vệ bản quyền ảnh màu kỹ thuật số bằng lược đồ thủy vân dựa vào phép biến đổi DFT kết hợp với phép biến đổi SIFT
- pdf Luận văn ThS: Nghiên cứu các phương pháp trích chọn thông tin và ứng dụng trích chọn thông tin du lịch trong văn bản tiếng Việt
- pdf Luận văn ThS: Phát hiện lỗi sản phẩm trên dây chuyền đóng chai nước bằng xử lý ảnh
- pdf Luận văn ThS: Khôi phục ảnh bằng tối ưu độ tương tự cục bộ
- pdf Luận văn ThS: Tối ưu bảng cụm từ để cải tiến dịch máy thống kê
- pdf Luận văn ThS: Giấu tin trong file âm thanh bằng các phép biến đổi rời rạc
- pdf Luận văn ThS: Một số thuật toán chọn lọc và ứng dụng trong tin học phổ thông
- pdf Luận văn ThS: Một số thuật toán tìm core và ứng dụng trong phân tích mạng xã hội
- pdf Luận văn ThS: Nội suy ảnh trong hỗ trợ chẩn đoán hình ảnh
- pdf Luận văn ThS: Tối ưu hóa phân bổ và định giá đất đai theo thuật toan di truyền định hướng không gian
- pdf Luận văn ThS: Đề tài nhận dạng khuôn mặt trong hỗ trợ công tác quản lý tiếp dân
- pdf Luận văn ThS: Tìm hiểu khả năng an toàn của hệ mật mã RSA
- pdf Luận văn ThS: Tạo lập hệ luật mờ sử dụng phân cụm trừ mờ dữ liệu
- pdf Luận văn ThS: Giải pháp kết hợp công nghệ tính toán mềm với phương pháp lập luận mờ dựa trên đại số gia tử có tham số hiệu chỉnh
- pdf Luận văn ThS: Mạng Noron Wavelet và ứng dụng cho dự báo chứng khoán
- pdf Luận văn ThS: Phân đoạn từ tiếng Việt
- pdf Luận văn ThS: Xây dựng hệ thống truy vấn video nông nghiệp hướng ngữ nghĩa có sử dụng Ontology
- pdf Luận văn ThS: Tối ưu hoá truy vấn trong hệ cơ sở dữ liệu phân tán
- pdf Luận văn ThS: Xây dựng mô hình các chủ đề và công cụ tìm kiếm ngữ nghĩa
- pdf Luận văn ThS: Rút trích tri thức ngữ nghĩa từ tên thể loại Wikipedia
- pdf Luận văn ThS: Nghiên cứu mạng nơron nhân tạo và ứng dụng vào trao đổi khóa bí mật
- pdf Luận văn ThS: Xây dựng Ontology từ kho ngữ liệu dạng văn bản
- pdf Luận văn ThS: Ứng dụng GIS phục vụ công tác quản lý cầu tại TP Hồ Chí Minh
- pdf Luận văn ThS: Ứng dụng đồ thị euler tối ưu hóa bài toán tìm đường đi ngắn nhất
- pdf Luận văn ThS: Nghiên cứu về chuyển đổi lược đồ cơ sở dữ liệu quan hệ sang cơ sở dữ liệu NoSQL
- pdf Luận văn ThS: Trích chọn đặc trưng kết cấu màu cục bộ cho bài toán nhận dạng ảnh màu mặt người
- pdf Luận văn ThS: Thuật toán hiệu quả cho khai thác tăng trưởng các mô hình duyệt web
- pdf Luận văn ThS: Khai thác luật phân lớp kết hợp trên cơ sở dữ liệu bị sửa đổi