khocvianh_mm

New Member
Download Luận văn Định danh người nói độc lập văn bản bằng mô hình thống kê

Download miễn phí Luận văn Định danh người nói độc lập văn bản bằng mô hình thống kê





MỤC LỤC
Trang
MỤC LỤC . i
DANH MỤC CÁC TỪVIẾT TẮT VÀ THUẬT NGỮ. v
DANH MỤC BẢNG . viii
DANH MỤC HÌNH ẢNH . ix
TÓM TẮT LUẬN VĂN . xi
Chương 1 – GIỚI THIỆU . 1
1.1. Dẫn nhập . 1
1.2. Sinh trắc học . 2
1.2.1. Khái quát . 2
1.2.2. Kiến trúc cơbản của một hệthống sinh trắc . 3
1.3. Bài toán nhận dạng người nói . 4
1.4. Các hướng tiếp cận . 7
1.4.1. Nhóm phụthuộc văn bản . 7
1.4.2. Nhóm độc lập văn bản . 8
1.5. Tiếp cận của đềtài . 8
Chương 2 – HỆTHỐNG ĐỊNH DANH NGƯỜI NÓI . 11
2.1. Mô hình tổng quát . 11
2.2. Lấy mẫu tiếng nói . 12
2.3. Rút trích đặc trưng . 12
2.3.1. Chia frame . 14
2.3.2. Biến đổi Fourier rời rạc . 16
2.3.3. Mel filter bank . 18
2.3.4. Biến đổi Cosine rời rạc . 20
2.4. Dò tìm năng lượng . 21
2.5. Chuẩn hóa đặc trưng . 21
2.6. Xây dựng mô hình người nói . 21
2.7. Nhận dạng . 22
2.7.1. Identification . 23
2.7.2. Verification . 24
2.8. Score normalization . 25
2.8.1. World Model Normalization . 25
2.8.2. Cohort Normalization . 26
2.8.3. Unconstraint Cohort Normalization . 26
2.9. Một sốhệthống định danh người nói . 27
2.9.1. Hệthống Vector Quantization . 27
2.9.2. Hệthống GMM . 28
2.9.3. Các hệthống khác . 29
Chương 3 – MÔ HÌNH MARKOV ẨN HỢP GAUSS . 30
3.1. Gaussian Mixture Model . 30
3.1.1. Đặc tảmô hình . 30
3.1.2. Ước lượng tham số. 33
3.2. Hidden Markov Model . 34
3.2.1. Mô hình Markov . 34
3.2.2. Mô hình Markov ẩn . 36
3.2.3. Ba bài toán cơbản của HMM . 39
3.2.3.1. Bài toán 1 – evaluation problem . 40
3.2.3.2. Bài toán 2 – decoding problem . 42
3.2.3.3. Bài toán 3 – learning problem . 44
3.3. Mixture of Gaussians Hidden Markov Model . 46
3.3.1. Đặc tảmô hình . 46
3.3.2. Huấn luyện tham số. 48
3.3.3. Khởi tạo tham số. 51
3.3.3.1. Thuật toán k-means . 51
3.3.3.2. Khởi tạo mô hình MGHMM . 52
3.4. MGHMM và bài toán định danh người nói . 53
3.4.1. Xây dựng mô hình . 53
3.4.2. Identification . 54
3.4.3. Verification . 55
Chương 4 – THỰC NGHIỆM . 57
4.1. Dữliệu thực nghiệm . 57
4.2. Các độ đo đánh giá . 59
4.3. Tham sốmô hình . 61
4.3.1. Sốvòng lặp huấn luyện . 62
4.3.2. Kích thước nhóm K của phương pháp UCN . 63
4.3.3. Cấu hình MGHMM . 64
4.4. Hiệu suất hệthống . 65
Chương 5 – KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN . 66
5.1. Kết luận . 66
5.2. Hướng phát triển . 66
TÀI LIỆU THAM KHẢO . 67



Để tải bản DOC Đầy Đủ xin Trả lời bài viết này, Mods sẽ gửi Link download cho bạn sớm nhất qua hòm tin nhắn.
Ai cần download tài liệu gì mà không tìm thấy ở đây, thì đăng yêu cầu down tại đây nhé:
Nhận download tài liệu miễn phí

Tóm tắt nội dung:

1
Chương 1: GIỚI THIỆU
1.1 Dẫn nhập
Đề tài nghiên cứu của luận văn này xoay quanh bài toán định danh người nói – một
bài toán con trong lĩnh vực nhận dạng người nói, vốn là một nhánh của sinh trắc học
(biometrics).
Nhận dạng người nói tự động (Automatic Speaker Recognition – ASR) là tiến trình
nhận dạng tự động một người dựa trên tiếng nói của người đó. Một hệ thống ASR
gồm hai giai đoạn chính là đăng ký (enrollment) và nhận dạng (test):
- Trong giai đoạn đăng ký, dữ liệu tiếng nói của mỗi người sẽ được thu nhận
và rút trích đặc trưng trước khi đưa vào huấn luyện/xây dựng mô hình. Bước
rút trích đặc trưng thực hiện thu gọn và biến đổi dữ liệu tiếng nói thành các
vector đặc trưng mang thông tin phân biệt giữa những người nói khác nhau.
Sau đó, các vector đặc trưng sẽ được đưa vào xây dựng mô hình tùy theo
phương pháp cụ thể của hướng tiếp cận giải quyết bài toán.
- Trong giai đoạn nhận dạng, vector đặc trưng của mẫu test sẽ được đánh giá
qua các mô hình đã xây dựng ở bước đăng ký và rút ra kết luận.
Về mặt ý nghĩa khoa học và thực tiễn, các hệ thống ASR có nhiều ứng dụng trong
các tác vụ liên quan đến bảo mật. Ví dụ như nó có thể giúp cho việc xác thực các
giao dịch từ xa thông qua điện thoại, hay kiểm soát truy cập các hệ thống mạng và
máy tính. Ngoài ra, hệ thống ASR còn giúp hỗ trợ công tác điều tra tội phạm, hay
phối hợp với các lĩnh vực khác như: truy tìm thông tin (information retrieval), nhận
dạng lời thoại (speech recognition).
Các mục còn lại của chương này sẽ trình bày chi tiết hơn về bài toán nhận dạng
người nói mà cụ thể là định danh người nói – đối tượng nghiên cứu của đề tài –
cùng với các lĩnh vực liên quan.
2
1.2. Sinh trắc học
1.2.1. Khái quát
Sinh trắc học (biometrics) là lĩnh vực nghiên cứu các phương pháp toán học và
thống kê áp dụng trên các bài toán phân tích dữ liệu sinh học. Cụm từ “biometrics”
xuất phát từ chữ “bio” (life) và “metrics” (measure) trong tiếng Hy Lạp.
Sinh trắc học gồm các phương pháp nhận diện một người dựa trên các đặc điểm
sinh lý học (physiological) hay các đặc điểm hành vi (behavioral) của người đó. Các
hệ thống sinh trắc đã và đang được phát triển trong các ứng dụng thực tế như hệ
thống bảo mật giao tác, quản lý truy xuất, các hệ thống điều phối.
Sinh trắc học đem lại một số ưu điểm so với các phương pháp bảo mật truyền thống
(card, password…) như: không thể hay rất khó giả mạo, không bị đánh cắp hay bị
mất... Tuy nhiên, kết quả của các công trình nghiên cứu trên lĩnh vực này vẫn chưa
đủ hoàn thiện để có thể thay thế hẳn các phương pháp truyền thống. Hiện nay, kỹ
thuật sinh trắc thường được sử dụng kết hợp với password hay card để tăng cường
khả năng bảo mật cũng như tính an toàn của dữ liệu.
Về phân loại, sinh trắc học có thể được chia thành hai nhóm chính là sinh trắc thể
(physiological) và sinh trắc hành vi (behavioral):
- Physiological: bao gồm các đặc điểm sinh học trên cơ thể như khuôn mặt
(face), DNA, vân tay (fingerprint), tròng mắt (iris), giọng nói (voice)…
Trong đó, vân tay là đặc điểm được nghiên cứu và sử dụng từ khá lâu.
- Behavioral: các đặc điểm về hành vi của con người như thói quen gõ phím
(keystroke), chữ ký (signature), giọng nói (voice)…
Nếu xét theo độ cao thấp (pitch), giọng nói có thể được phân loại vào nhóm đặc
điểm sinh trắc thể. Tuy nhiên, giọng nói còn được xem là một đặc điểm hành vi nếu
ta xét về cách nói.
3
Hình 1.1: Phân loại sinh trắc học.
Sinh trắc học được sử dụng theo hai thể thức chính là định danh (identification) và
xác minh (verification):
- Identification: xác định cụ thể mẫu sinh trắc thuộc về ai. Cơ chế định danh
thông qua việc tìm một bộ khớp nhất trong database so với mẫu test. Phương
pháp này đòi hỏi rất nhiều chi phí tính toán nếu kích thước database lớn.
- Verification: xác định xem mẫu sinh trắc có phải thuộc về một chủ thể cho
trước hay không. Cơ chế xác minh thông qua việc so khớp giữa mẫu test với
các mẫu thuộc chủ thể đó trong database. Do vậy, phương pháp này đòi hỏi
ít năng lực xử lý và thời gian tính toán hơn phương pháp định danh.
1.2.2. Kiến trúc cơ bản của một hệ thống sinh trắc
Các thành phần chính của một hệ thống sinh trắc (biometric system):
- Bộ cảm biến (sensor): thường là các đầu đọc hay thiết bị scan. Bộ phận này
đảm nhận vai trò thu nhận các thông tin sinh trắc từ người trong thế giới thực.
- Bộ số hóa (digitalizing module): thực hiện việc chuyển đổi thông tin thu
được từ bộ cảm biến sang tín hiệu số và phân tích, rút trích đặc trưng từ tín
hiệu đó. Đầu ra của bộ phận này sẽ được truyền sang bộ so khớp (matcher) ở
bước nhận dạng (test) hay lưu vào database ở bước đăng ký (enrollment).
Sinh trắc học
Đặc điểm Cơ thể Đặc điểm Hành vi
Khuôn
mặt DNA
Tròng
mắt
Vân
tay
Giọng
nói Chữ ký
Thói quen
Gõ phím
4
Hình 1.2: Các thành phần chính của một hệ thống sinh trắc.
- Bộ lưu trữ (database): lưu trữ các thông tin sinh trắc của người dùng.
- Bộ so khớp (matcher): thực hiện đối sánh giữa mẫu test với các mẫu đã được
đăng ký (enrolled) trong database. Kết quả đối sánh sẽ được truyền đến bộ
ứng dụng.
- Bộ ứng dụng (application device): bộ phận ứng dụng của hệ thống sinh trắc.
Tùy từng ứng công cụ thể mà thành phần này sẽ thực hiện các chức năng
tương ứng với quyết định của bộ so khớp.
1.3. Bài toán nhận dạng người nói
Trong các đặc tính sinh học trên cơ thể người, tiếng nói là một đặc điểm mang tính
phổ thông, dễ phát sinh và không cần đến các thiết bị thu phức tạp. Nhiều công trình
đã được nghiên cứu trên tiếng nói nhằm khai thác các thông tin từ tiếng nói. Hình
1.3 minh họa các lĩnh vực nghiên cứu trên tiếng nói, tập trung vào bài toán nhận
dạng tiếng nói.
Nhận dạng tiếng nói (voice recognition) bao gồm: nhận dạng lời thoại (speech
recognition), nhận dạng người nói (speaker recognition), nhận dạng ngôn ngữ nói
(language recognition), nhận dạng phương ngữ nói (dialect recognition)… Trong đó,
bài toán nhận dạng người nói lại bao gồm 2 loại là nhận dạng độc lập văn bản (text-
đăng ký
test
testBộ cảm biến Bộ số hóa
Database
Bộ so khớp
Bộ
ứng dụng
5
independent) và nhận dạng phụ thuộc văn bản (text-dependent). Theo thể thức nhận
dạng thì nhận dạng người nói gồm dạng xác minh (verification) và dạng định danh
(identification).
Hình 1.3: Các lĩnh vực về nhận dạng tiếng nói.
Trong bài toán xác minh người nói tự động (Automatic Speaker Verification –
ASV), máy tính chỉ việc xác định xem một mẫu tiếng nói có phải thuộc về một
người nói cho trước hay không mà thôi (so sánh 1:1). Còn đối với bài toán định
danh người nói tự động (Automatic Speaker Identification – ASI), máy tính sẽ phải
Tiếng nói
Nhận dạng
Lời thoại
Nhận dạng
Người nói
Nhận dạng
Ngôn ngữ
N.N. Phụ thuộc Văn bản
(theo thể thức lời thoại)
N.N. Độc lập Văn bản
(theo thể thức lời thoại)
Xác minh Người nói
(theo thể thức nhận dạn...
 
Các chủ đề có liên quan khác
Tạo bởi Tiêu đề Blog Lượt trả lời Ngày
I Hoàn thiện quy định của Bộ luật Hình sự năm 1999 về các tội xâm phạm nhân phẩm, danh dự của con người Tài liệu chưa phân loại 2
D Định danh và phân loại một số loài cá nước ngọt phổ biến ở đồng bằng sông Cửu Long dựa trên đặc điểm hình thái và di truyền Nông Lâm Thủy sản 0
D Thẩm định giá trị danh sách khách hàng Công ty TNHH DKSH Việt Nam chi nhánh thành phố Vũng Tàu Luận văn Kinh tế 0
A Bài 50: Ancol (chương trình lớp 11 THPT) - Tiết 1: Định nghĩa, phân loại, đồng phân, danh pháp tính Luận văn Sư phạm 0
T Xây dựng danh mục và xác định thời hạn bảo quản hồ sơ, tài liệu hình thành phổ biến ở Sở Nội vụ Văn hóa, Xã hội 0
T ĐỊNH DANH NẤM THỦY MI (ACHLYA BISEXUALIS) VÀ KHẢO SÁT HÓA CHẤT KHÁNG VI NẤM Nông Lâm Thủy sản 0
B Đặc điểm định danh và ngữ nghĩa của hai tổ hợp ghép chính phụ "cười + x" và "nói + x" trong tiếng Vi Văn hóa, Xã hội 0
T Khảo sát các định nghĩa của từ loại danh từ, vị từ trong từ điển tiếng Việt của Hoàng Phê - 2000 Văn hóa, Xã hội 1
Z Nghiên cứu thành phần định ngữ của đoản ngữ danh từ tiếng Hán hiện đại (Trong sự so sánh với thành p Văn hóa, Xã hội 0
H Phân cụm dữ liệu định danh với số chiều cao Công nghệ thông tin 2

Các chủ đề có liên quan khác

Top