Tài liệu chuyên ngành xây dựng, khoa học kỹ thuât, máy móc...
Nội quy chuyên mục: - Hiện nay có khá nhiều trang chia sẻ Tài liệu nhưng mất phí, đó là lý do ket-noi mở ra chuyên mục Tài liệu miễn phí.

- Ai có tài liệu gì hay, hãy đăng lên đây để chia sẻ với mọi người nhé! Bạn chia sẻ hôm nay, ngày mai mọi người sẽ chia sẻ với bạn!
Cách chia sẻ, Upload tài liệu trên ket-noi

- Những bạn nào tích cực chia sẻ tài liệu, sẽ được ưu tiên cung cấp tài liệu khi có yêu cầu.
Nhận download tài liệu miễn phí
Hình đại diện của thành viên
By tctuvan
#741716 Tải miễn phí
Xử lý tiếng nói là sự nghiên cứu tiếng nói của con người dưới dạng tín hiệu, và các phương pháp xử lý những tín hiệu này. Xử lý tiếng nói có nhiều lĩnh vực nghiên cứu: nhận dạng tiếng nói, nhận dạng người nói, mã hóa tiếng nói, tổng hợp tiếng nói, phân tích giọng nói,
Nhận dạng người nói là một lĩnh vực nghiên cứu của xử lý tiếng nói. Mục đích của nhận dạng người nói là để nhận ra người nói là ai hay là xác minh liệu người đang nói có đúng là người mà máy tính đã được biết trước hay không (tính xác thật của giọng nói). Nhận dạng người nói có nhiều ứng dụng: thanh toán thẻ tín dụng qua điện thoại; đăng nhập vào các hệ thống an ninh, máy tính bằng tiếng nói; giám định tư pháp tiếng nói Chính vì vậy hiện nay trên thế giới lĩnh vực nhận dạng người nói nhận được rất nhiều sự quan tâm, nghiên cứu. Tuy nhiên hiện nay ở Việt Nam mới có rất ít công trình nghiên cứu về vấn đề này.
Luận văn này tập trung nghiên cứu bài toán xác thực người nói không phụ thuộc vào từ khóa – một bài toán trong lĩnh vực nhận dạng người nói. Mục đích của bài toán xác thực người nói không phụ thuộc vào từ khóa là xác minh liệu người đang nói có đúng là người mà máy tính đã được biết trước hay không (tính xác thật của giọng nói) nhưng không phụ thuộc vào nội dung người nói.
Cấu trúc của luận văn gồm: phần mở đầu; chương 1, 2, 3, 4; phần kết luận và kiến nghị; tài liệu tham khảo; phụ lục.
Nội dung chính của luận văn:Chương 1
TỔNG QUAN VỀ NHẬN DẠNG NGƯỜI NÓI
1.1. Các lĩnh vực của xử lý tiếng nói 4
1.2. Nhận dạng người nói 5
1.2.1. Cơ sở lý thuyết của nhận dạng người nói 5
1.2.2. Phân loại bài toán nhận dạng người nói 6
1.2.3. Các ứng dụng của bài toán nhận dạng người nói 9
1.3. Xác thực người nói không phụ thuộc vào từ khóa 11
1.3.1. Giới thiệu chung 11
1.3.2. Các thành phần của một hệ thống xác thực người nói không phụ vào từ khóa 11
1.3.3. Các giai đoạn xử lý của một hệ thống xác thực người nói không phụ thuộc vào từ khóa 12
Chương 2
TRÍCH CHỌN ĐẶC TRƯNG NGƯỜI NÓI
2.1. Đặc điểm vật lý, âm học của tiếng nói 14
2.1.1. Đặc điểm vật lý của tiếng nói 14
2.1.2. Đặc điểm âm học của tiếng nói 17
2.2. Tiền xử lý tín hiệu tiếng nói. 22
2.2.1. Chuyển từ tín hiệu tương tự sang tín hiệu số 22
2.2.2. Chuẩn hóa biên độ 25
2.2.3. Biến đổi Fourier 26
2.2.4. Lọc nhiễu 27
2.2.5. Làm rõ tín hiệu 27
2.3. Trích chọn đặc trưng người nói. 28
2.3.1. Mục đích của trích chọn đặc trưng 28
2.3.2. Phân loại đặc trưng 29
2.3.3. Trích chọn đặc trưng MFCC 30
Chương 3
CÁC MÔ HÌNH ỨNG DỤNG XÁC THỰC NGƯỜI NÓI KHÔNG PHỤ THUỘC VÀO TỪ KHÓA
3.1. Phân loại các mô hình 39
3.1.1. Mô hình mẫu (Template Modeling) 39
3.1.2. Mô hình thống kê (Statistical Modeling) 39
3.2. Mô hình lượng tử hóa vector (Vector Quantization- VQ) 40
3.2.1. Khái niệm phép lượng tử hóa 40
3.2.2. Độ biến dạng 42
3.2.3. Tính chất 42
3.2.4. Thiết kế codebook theo phương pháp LBG (Linde, Buzo, and Gray) 43
3.3. Mô hình hỗn hợp Gauss 46
3.3.1. Bài toán ước lượng mật độ 46
3.3.2. Thuật toán EM (Expectation Maximization) 48
3.4. Xây dựng mô hình người nói 49
3.4.1. Giới thiệu chung 49
3.4.2. Sử dụng mô hình VQ 49
3.4.3. Sử dụng GMM 51
3.5. So khớp 51
3.5.1. Giới thiệu chung 51
3.5.2. Phương pháp VQ 52
3.5.3. Phương pháp GMM 53
3.6. Tạo quyết định 53
Chương 4
CẤU HÌNH HỆ THỐNG VÀ KẾT QUẢ THỬ NGHỆM
4.1. Cấu trúc tổng quát của hệ thống 56
4.1.1. Module trích chọn đặc trưng MFCC 56
4.1.2. Module huấn luyện 57
4.1.3. Module xác thực 57
4.2. Dữ liệu tiếng nói 57
4.3. Tỷ lệ lỗi (Error rate) 58
4.4. Kết quả thực nghiệm 58
4.4.1. Số các hệ số MFCC 58
4.4.2. Mô hình VQ và GMM 59
4.4.3. Thời gian huấn luyện 59
4.4.4. Số các cụm của mô hình VQ 60
4.4.5. Số cụm của mô hình GMM 60
Kết luận và kiến nghị………………………………………………………...61
Tài liệu tham khảo…………………………………………………………...63


Link download cho ae ketnooi:
Bấm vào đây để đăng nhập và xem link!

PHƯƠNG PHÁP NHẬN DẠNG TIẾNG NÓI VÀ XÂY DỰNG HỆ NHẬN DẠNG TIẾNG NÓI TRÊN MATLAB
Tìm hiểu về phương pháp LPC trong xử lý tiếng nói
Kỹ thuật trích chọn đặc trưng mfcc trong nhận dạng tiếng nói
Hình đại diện của thành viên
By chanqua3ma
Hình đại diện của thành viên
By tctuvan
#931696 Link mới đó bạn tải đi
Hình đại diện của thành viên
By tctuvan
#931750
chanqua3ma đã viết:mình tải k được, k biết server bị sao ấy, bạn gửi qua mail cho mình nha [email protected]
Thank bạn nhiều lắm


bạn dùng mạng viettel hay gì?
Up lại cho bạn link khác đây
Bấm vào đây để đăng nhập và xem link!
Kết nối đề xuất:
Learn Synonym
Advertisement