Luận văn ThS: Phát hiện tự động một số lỗi phát âm tiếng Anh của người học
Luận văn Phát hiện tự động một số lỗi phát âm tiếng Anh của người học giới thiệu tổng quan về đề tài; trình bày cơ sở lí thuyết; tiến hành thí nghiệm và đánh giá kết quả.
Mục lục nội dung
1. Mở đầu
1.1 Tính cấp thiết
Việc phát âm đúng tiếng Anh sẽ giúp người học giao tiếp hiệu quả và tự tin hơn. Tuy nhiên, do bị ảnh hưởng bởi ngôn ngữ mẹ đẻ và các thói quen hình thành khi phát âm tiếng Việt, chúng ta thường có khuynh hướng rơi vào một số lỗi chung khiphát âm tiếng Anh. Chẳng hạn bỏ sót âm vị cuối (ví dụ bỏ âm vị /t/ trong từ ‘mount’), phát âm sai âm vị /r/ trong từ ‘right’ (vì tiếng Việt không có âm vị này), v.v…Để có thể khắc phục các lỗi này, cần phải có người phát âm đúng thường xuyên chỉ ra các lỗi phát âm sai của người học, từ đó người học có thể rèn luyện và bỏ các thói quen dẫn đến phát âm sai. Việc này đòi hỏi nhiều thời gian, đặc biệt là khi người học không có điều kiện để giao tiếp với người phát âm đúng và không sống trong môi trường nói tiếng Anh. Đặc biệt, đối với những người tự học, không có điều kiện để nhận được sự chỉ dẫn từ giáo viên, việc khắc phục các lỗi phát âm sẽ trở nên khó khăn hơn rất nhiều.
1.2 Mục tiêu nghiên cứu
Mục tiêu tổng quát của đề tài là thực nghiệm để khảo sát việc tự động phát hiện các lỗi phát âm tiếng Anh thường gặp của người học trên các kho dữ liệu Buckeye và TIMIT.
Mục tiêu cụ thể của đề tài gồm:
- Tìm hiểu các kiến thức nền tảng về ngữ âm học, âm vị học, và các kỹ
- thuật xử lý tiếng nói.
- Tìm hiểu mô hình xử lý âm thanh phù hợp để có thể phát hiện được các lỗi trong phạm vi nghiên cứu.
- Tiến hành thử nghiệm mô hình xử lý trên các tập dữ liệu lớn đáng tin cậy.
1.3 Đối tượng phạm vi nghiên cứu
Nghiên cứu sẽ được tiến hành trên một tập xác định các lỗi phát âm tiếng Anh của người học, xét trên trường hợp cụ thể là người Việt và người Tây Ban Nha học tiếng Anh. Cụ thể là lỗi phát âm khi phát âm các âm vị:[ae], [p], [aa], [sh], [iy] trong tiếng Anh.
2. Nội dung
2.1 Tổng quan
Các nghiên cứu liên quan
- Phát hiện lỗi dựa trên xác suất (likelihood-based scoring)
- Phương pháp độc lập ngôn ngữ thứ nhất (L1-independent)
- Phương pháp phụ thuộc ngôn ngữ thứ nhất (L1-dependency)
- Phát hiện lỗi dựa trên bộ phân loại (classifier-based scoring)
- Mô hình tiếng nói do người nước ngoài phát âm (non-native acoustic modeling)
- Phát hiện lỗi phát âm độc lập với văn bản(text independence)
- Phát hiện và phản hồi lỗi về nhịp điệu phát âm(prosodic pronunciation error)
- Thiết kế hệ thống CAPT có tính tương tác (Interactive CAPT system design)
Các vấn đề còn tồn tại
Phương hướng giải quyết của nghiên cứu này
2.2 Cơ sở lí thuyết
Cơ bản về ngữ âm học và âm vị học
- Ngữ âm học và âm vị học
- Âm vị (phoneme) và âm tố (phone hay speech sound)
- Phụ âm (consonant) và nguyên âm (vowel)
- Ví trí phát âm (place of articulation)
- Cách thức phát âm (manner of articulation)
- Hình thang nguyên âm
- Âm hữu thanh (voice) và âm vô thanh (voiceless)
- Tha âm vị (allophone)
- Hệ thống âm vị tiếng Việt
- Hệ thống âm vị tiếng Anh
Xác định một số lỗi sai thường gặp của người Việt học tiếng Anh
Cơ bản về xử lý tiếng nói
- Spectrogram
- Formant
- Đặc trưng ngữ âm (Acoustic feature)
Support Vector Machine
- Các khái niệm cơ bản
- Cực đại hóa bộ phân loại hậu nghiệm (classifier posterior)
- Cực tiểu hóa rủi ro về mặt cấu trúc
2.3 Thí nghiệm và đánh giá
Mô tả các kho dữ liệu được sử dụng trong thí nghiệm
- Kho dữ liệu TIMIT
- Mô tả bộ dữ liệu mẫu của TIMIT
- Kho dữ liệu Buckeye
Các thư viện và công cụ dùng trong thí nghiệm
- Thư viện HTK và công cụ HCopy
- Thư viện SVM
- Praat
Huấn luyện các SVM
3. Kết luận
Trong luận văn này, tác giả đã thực hiện các công việc sau:
- Tổng hợp và hệ thống hoá các kiến thức nền tảng làm cơ sở cho việc phát hiện tự động các lỗi phát âm tiếng Anh của người học.
- Tìm hiểu các nghiên cứu liên quan đến lĩnh vực này để có cơ sở chọn được phương pháp xử lý phù hợp áp dụng cho mục đích của luận văn.
- Chọn lựa phương pháp xử lý, tiến hành thử nghiệm phương pháp đã chọn trên hai tập dữ liệu Buckeye và TIMIT, đánh giá kết quả.
- Để minh hoạ cho phương pháp này tác giả đã áp dụng để phát hiện một số lỗi phát âm thường gặp của người Việt. Các lỗi phát âm này được tác giả chọn lựa dựa trên giả thuyết rằng thói quen phát âm mẹ đẻ của các âm vị gần giống các âm vị tương ứng trong tiếng Anh (nhưng không tồn tại trong tiếng Anh) sẽ gây ra các lỗi phát âm.
4. Tài liệu tham khảo
Âm vị và các hệ thống âm vị tiếng Việt [online] . Available from:<http://ngonngu.net?p=64>.[Accessed 5 Jun 2015]
Boersma, P. and Weenink, D., 2010. Praat: doing phonetics by computer. [online]. Available from: http://www.citeulike.org/group/14233/article/8146799 [Accessed 5 Jun 2015].
Burges, C. J., 1998. A tutorial on support vector machines for pattern recognition. Data mining and knowledge discovery, 2 (2), 121–167
Chang, C.-C. and Lin, C.-J., 2011. LIBSVM: a library for support vector machines. ACM Transactions on Intelligent Systems and Technology (TIST), 2 (3), 27.....
--- Nhấn nút TẢI VỀ hoặc XEM ONLINE để tham khảo đầy đủ nội dung Luận văn trên ---
Tham khảo thêm
- pdf Luận văn ThS: Khai thác Top - rank k cho tập đánh trọng trên cơ sở dữ liệu có trọng số
- pdf Luận văn ThS: Theo dõi đối tượng chuyển động bằng phương pháp lọc tích hợp
- pdf Luận văn ThS: Xây dựng tính năng cảnh báo tấn công trên mã nguồn mở
- pdf Luận văn ThS: Phương pháp phân vùng phân cấp trong khai thác tập phổ biến
- pdf Luận văn ThS: Nhận biết chủ đề của tài liệu dựa trên Wikipedia
- pdf Luận văn ThS: Nén Fractal cho bài toán ẩn dữ liệu
- pdf Luận văn ThS: Khai thác mẫu tuần tự nén
- pdf Luận văn ThS: Sử dụng cây quyết định để phân loại dữ liệu nhiễu
- pdf Luận văn ThS: Kỹ thuật Matrix Factorization trong xây dựng hệ tư vấn
- pdf Luận văn ThS: Khai thác tập mục lợi ích cao
- pdf Luận văn ThS: Khảo sát ảnh hưởng của các độ đo lợi ích lên độ chính xác trong bài toán phân lớp dựa trên luật kết hợp
- pdf Luận văn ThS: Một số kỹ thuật kiểm thử an toàn hệ thống
- pdf Luận văn ThS: Khai thác quan điểm của các bình luận tiếng Anh trên mạng xã hội sử dụng phương pháp xử lý ngôn ngữ tự nhiên
- pdf Luận văn ThS: Ứng dụng khai thác mẫu chuỗi để khai thác hành vi sử dụng web
- pdf Luận văn ThS: Khai thác mẫu phổ biến cực đại trong đồ thị đơn bằng phương pháp so sánh gần đúng
- pdf Luận văn ThS: Khai thác mẫu trọng số phổ biến tối đại trong cơ sở dữ liệu giao dịch
- pdf Luận văn ThS: Một phương pháp bảo toàn tính riêng tư trong khai thác luật kết hợp trên cơ sở dữ liệu phân tán ngang
- pdf Luận văn ThS: Một thuật toán cải tiến trong khai thác luật kết hợp bảo toàn tính riêng tư
- pdf Luận văn ThS: Phân tích dữ liệu tạo cảnh báo học tập bằng mô hình hồi quy Logistic
- pdf Luận văn ThS: Sử dụng hồi quy tuyến tính trong dự đoán mức lương công việc trên quảng cáo tuyển dụng
- pdf Luận văn ThS: Khai thác song song tập phổ biến dựa trên mảng Systolic
- pdf Luận văn ThS: Nghiên cứu phương án tỉa ứng viên trong khai thác tập hữu ích cao
- pdf Luận văn ThS: Phân đoạn đối tượng trong ảnh MRI