Chia sẻ đồ án, luận văn ngành công nghệ thông tin miễn phí
Nội quy chuyên mục: - Hiện nay có khá nhiều trang chia sẻ Tài liệu nhưng mất phí, đó là lý do ket-noi mở ra chuyên mục Tài liệu miễn phí.

- Ai có tài liệu gì hay, hãy đăng lên đây để chia sẻ với mọi người nhé! Bạn chia sẻ hôm nay, ngày mai mọi người sẽ chia sẻ với bạn!
Cách chia sẻ, Upload tài liệu trên ket-noi

- Những bạn nào tích cực chia sẻ tài liệu, sẽ được ưu tiên cung cấp tài liệu khi có yêu cầu.
Nhận download tài liệu miễn phí
By nh0cken_kute
#970792 Link tải luận văn miễn phí cho ae Kết nối
Tổng quan về dịch máy, giới thiệu những đặc điểm trong quá trình dịch máy và tình hình dịch máy trong và ngoài nước. Giới thiệu sơ bộ về mô hình dịch máy thống kê. Đi sâu nghiên cứu mô hình dịch máy thống kê có tích hợp các thông tin ngôn ngữ như: mô hình dịch thống kê dựa trên đơn vị từ, cụm từ, dựa trên cú pháp. Nêu lên các thành phần sử dụng trong hệ dịch thống kê có tích hợp các thông tin ngôn ngữ. Nghiên cứu và xây dựng tổ hợp các yếu tố ngôn ngữ ở mức từ vựng phù hợp cho hệ dịch thống kê Anh-Việt. Trình bày các mô hình thực nghiệm và kết quả thực nghiệm, hướng phát triển trong tương lai của mô hình dịch máy Anh-Việt dựa trên phương pháp thống kê tích hợp với thông tin ngôn ngữ
Những năm gần đây, dịch máy đóng một vai trò quan trọng trong việc hỗ trợ con
người cập nhật thông tin từ nhiều nguồn ngôn ngữ khác nhau một cách nhanh
chóng. Trong sự phát triển của dịch máy, có 3 cách tiếp cận chủ yếu là dịch
chuyển đổi, dịch liên ngữ và dịch dựa vào dữ liệu. Trong đó, dịch máy thống kê,
một trong những phương pháp theo cách tiếp cận dựa vào dữ liệu, hiện đang là
một hướng phát triển đầy tiềm năng, thu hút được sự quan tâm của các nhà
nghiên cứu.
Trên thế giới, có khá nhiều hệ dịch dựa trên thống kê đã được thương mại hóa và
có chất lương dịch khá cao như CANDIDE của IBM, hệ dịch Trung - Anh của đại
học Johns Hopkins, ... Ưu điểm vượt trội của phương pháp này là thay vì xây
dựng các từ điển, các quy luật chuyển đổi bằng tay, hệ dịch tự động thiết lập các
từ điển, các quy luật dựa trên kết quả thống kê có được từ các kho ngữ liệu.
Chính vì vậy, dịch máy dựa vào thống kê có tính khả chuyển cao áp dụng được
cho bất kỳ cặp ngôn ngữ nào.
Dịch máy thống kê hiện nay đi theo 3 hướng tiếp cận chính, đó là dịch máy thống
kê dựa trên đơn vị từ; dựa trên đơn vị cụm từ và dựa trên cú pháp. Trong đó dịch
máy thống kê dựa trên đơn vị cụm từ hiện đang là cách tiếp cận thu hút được
nhiều sự quan tâm nhất của giới nghiên cứu dịch máy.
Tuy nhiên, cách tiếp cận thống kê nói chung vẫn phải đối mặt với những hạn chế
do sự thiếu hụt về thông tin ngôn ngữ. Mô hình dịch thống kê vẫn chưa giải
quyết được một số vấn đề cơ bản của dịch máy như trật tự từ, khả năng lựa chọn
cụm từ phù hợp, và vấn đề về dữ liệu thưa. Các cải tiến làm tăng chất lượng dịch
bằng cách tích hợp các thông tin ngôn ngữ vào các bước tiền xử lý, hậu xử lý hay
tích hợp trực tiếp vào mô hình dịch đã được đề xuất.
Gần đây, với sự xuất hiện của phương pháp dịch máy thống kê tích hợp thêm các
thông tin ngôn ngữ, những hạn chế trên đã được cải thiện một cách đáng kể.
Phương pháp này không những duy trì được những ưu điểm của phương pháp
dịch máy thống kê dựa trên đơn vị cụm từ mà còn có thêm thế mạnh từ tri thức
ngôn ngữ được kết hợp một cách linh hoạt vào mô hình dịch dưới dạng các yếu
tố tương ứng với từ. Đây là một cách tiếp cận mới đã đạt được kết quả tốt với
nhiều cặp ngôn ngữ như Anh-Czech, Anh-Đức,...
Tuy nhiên, các thực nghiệm đã cho thấy càng nhiều các yếu tố ngôn ngữ được
thêm vào không hẳn đã làm tăng chất lượng của hệ thống. Mỗi cặp ngôn ngữ sẽ
có một cấu hình kết hợp các yếu tố ngôn ngữ phù hợp cho mình. Theo những
quan sát và đánh giá đó, luận văn hướng đến việc nghiên cứu và xây dựng tổ hợp
các yếu tố ngôn ngữ ở mức từ vựng phù hợp cho hệ dịch thống kê Anh-Việt. Một
cấu hình phù hợp với đặc trưng ngôn ngữ trong lĩnh vực kinh tế và hội thoại đã
cho thấy tiềm năng ứng dụng của phương pháp này đối với cặp ngôn ngữ Anh
Việt.
Luận văn có bố cục gồm 5 chương chính:
Chương I là tổng quan về dịch máy, giới thiệu những đặc điểm trong quá trình
dịch máy và tình hình dịch máy trong và ngoài nước.
Chương II giới thiệu về mô hình dịch máy thống kê, các phương pháp dịch máy
thống kê.
Chương III đi sâu vào mô hình dịch máy thống kê có tích hợp với các thông tin
ngôn ngữ.
Chương IV nêu lên các thành phần sử dụng trong hệ dịch thống kê có tích hợp
với các thông tin ngôn ngữ.
Chương V là các mô hình thực nghiệm và kết quả thực nghiệm.
Cuối cùng là một số kết luận cũng như hướng phát triển trong tương lai.

Link Download bản DOC
Password giải nén nếu cần: ket-noi.com | Bấm trực tiếp vào Link tải, không dùng IDM để tải:

Bấm vào đây để đăng nhập và xem link!
Hình đại diện của thành viên
By sangbui2010
Hình đại diện của thành viên
By daigai
#1010675 Link mới update, mời bạn xem lại bài đầu để tải
Kết nối đề xuất:
Tìm tài liệu
Advertisement