rock_with_boa

New Member

Download miễn phí Tách âm dùng phương pháp phân tích thành phần độc lập





Chúng tôi thực hiện nhiều mô phỏng với nhiều loại nguồn âm khác nhau. Sau đây chỉnêu một sốtiêu biểu
Thựcnghiệm1: (Hình 4)
Phân tách tiếng nói người, ba nguồn pháts gồm một giọng nam và hai giọng nữ được
trộn đểtạo ba hỗn hợpx. Kết quảtách (ước lượng) ythu được (đánh giá trên các dạng sóng và
nghe qua loa) rất tốt.
Thựcnghiệm2: (Hình 5)
Trên tập dữliệu lai trộn từhai nguồn phát là tiếng hát của hai ca sĩ, mỗi nguồn phát 17
giây. Kết quảtách âm rất tốt.
Thựcnghiệm3: (Hình 6)
Lặp lại thực nghiệm trên tuy nhiên với hai nhạc phẩm không lời, thời gian phát 10
giây, tần sốlấy mẫu 22.5 KHz, mã hóa PCM 16 bit. Kết quảrất tốt.
Thựcnghiệm4:
Lai ghép từtập nhiều loại tín hiệu : tiếng người, tiếng hát, nhạc, tiếng kèn, nhiễu Gauss ; tất cả10 nguồn. Tín hiệu tách thu được từhỗn hợp nghe trong và không cảm giác thấy lai
trộn. Do chỉcó một nguồn Gauss, nên chấp nhận được trong ICA. Kết quảrất tốt. Vì lý do hạn
chếkhông gian nên không kèm theo hình



Để tải bản Đầy Đủ của tài liệu, xin Trả lời bài viết này, Mods sẽ gửi Link download cho bạn sớm nhất qua hòm tin nhắn.
Ai cần download tài liệu gì mà không tìm thấy ở đây, thì đăng yêu cầu down tại đây nhé:
Nhận download tài liệu miễn phí

Tóm tắt nội dung tài liệu:

TẠP CHÍ PHÁT TRIỂN KH&CN, TẬP 9, SỐ 2 -2006
Trang 33
TÁCH ÂM DÙNG PHƯƠNG PHÁP
PHÂN TÍCH THÀNH PHẦN ĐỘC LẬP
Trương Tấn Quang, Nguyễn Hữu Phương
Trường Đại học Khoa học Tự nhiên, ĐHQG-HCM
(Bài nhận ngày 01 tháng 12 năm 2005, hoàn chỉnh sửa chữa ngày 23 tháng 02 năm 2006)
TÓM TẮT: Tai ta thường đồng thời tiếp nhận nhiều nguồn âm (tiếng nói, âm nhạc,
nhiễu…) khác nhau nhưng ta vẫn có thể lắng nghe nguồn âm chủ định. Một hệ thống xử lý
tiếng hay nhận dạng tiếng cần đạt đến khả năng thông minh như vậy. Bài toán là từ nhiều tín
hiệu đã trộn lẫn ta muốn khôi phục các tín hiệu nguồn riêng rẽ.
Trong hơn chục năm qua người ta đã phát triển một phương pháp mới giúp giải bài
toán tách nguồn mù (Blind Source Separation – BSS) nêu trên rất hiệu quả, đó là phân tích
thành phần độc lập (Independent Component Analysis – ICA). Bài báo trình bày tổng quan
tóm lược về ICA và ứng dụng của chúng tui vào việc tách âm. Kết quả rất tốt. Từ đây chúng
tui có thể tiếp tục phân tích các bài toán tách âm phức tạp hơn dùng ICA.
1.GIỚI THIỆU
Khi có nhiều tín hiệu ở các khoảng tần số khác nhau được trộn (tổng hợp) lại, ta có thể
lọc ra từng tín hiệu riêng biệt như lúc ban đầu. Còn nếu các tín hiệu nằm trong cùng khoảng
tần số (ví dụ nhiều người cùng nói, tiếng hát trên nền nhạc, nhiều bản nhạc cùng chơi…), ta
không thể dùng phương pháp lọc hay phân tích phổ thông thường. Lúc bấy giờ phải dựa vào
các phương pháp thống kê trong đó có phương pháp phân tích thành phần độc lập
(Independent Component Analysis - ICA) [1] . . . [5]. ICA có nhiều ứng dụng, bài báo này chỉ
đề cập đến ứng dụng tách âm (tiếng nói và âm nhạc) [6] [7]. Do chưa thấy công trình trên các
tập san, tạp chí trong nước liên quan đến ICA nên chúng tui có phần tổng quan hơi là chi tiết
(mục 1, 2, 3 và 4).
Ở hình 1 tiếng nói của hai người được thu bởi hai micro:
(1)
trong đó aij , với i, j = 1,2 ,là các hệ số trộn phụ thuộc vào nhiều yếu tố như hướng đặt micro,
khoảng cách, phản âm của phòng …. Trong mô hình ICA các tín hiệu xi(t) và các tín hiệu
nguồn si(t) được xem như là các biến ngẫu nhiên, thay vì là các tín hiệu thời gian thực sự, nên
trong cách viết chỉ số thời gian t được bỏ đi.
Hình 1 Hai tín hiệu nguồn (không quan sát trực tiếp được tức các tín hiệu ẩn) là s1(t), s2(t); hai
tín hiệu trộn (quan sát được) là x1(t), x2(t)
Người
Nói
1
Người
nói
2
s1(t)
s2(t)
a11
a22
a21
a12
Micro 1
Micro 2
x1(t)
x2(t)
Science & Technology Development, Vol 9, No.2 - 2006
Trang 34
1.1 Mô hình ICA cơ bản
Xem trường hợp có n tín hiệu trộn xi được tổng hợp từ n tín hiệu nguồn si thì
niniii sasasax +++= ...2211 , i = 1, …, n (2)
với aij, i, j = 1,2,…,n là các hệ số trộn được giả sử có trị số thực. Để ý là ta đã giả sử số lượng
tín hiệu nguồn và tín hiệu trộn bằng nhau để được đơn giản. Bài toán ICA là ước lượng (phân
ly, tách ra) các tín hiệu nguồn sj từ các tín hiệu trộn quan sát được xi trong lúc các hệ số aij
không biết (nếu biết các hệ số trộn aij ta có thể giải hệ phương trình (2) để tìm các tín hiệu si ).
Đây là bài toán “coctail party” (ý nói rằng tại buổi tiệc có nhiều người nói nhưng ta có thể tập
trung nghe một hai người nào đó theo chủ định).
Thường ký hiệu vectơ – ma trận được dùng. Gọi x là vectơ ngẫu nhiên biểu diễn các
phần tử trộn xi : x = [ x1, x2 …, xn]T, s là vectơ ngẫu nhiên của các phần tử nguồn si :
s = [s1, s2 …, sn]T, và A là ma trận trộn chứa các hệ số trộn aij : A = [aij]. Các vectơ x, s được
hiểu là các vectơ cột. Để ý là khi số lượng tín hiệu trộn và tín hiệu nguồn bằng nhau như đã
giả sử thì A là một ma trận vuông. Mô hình ICA trở thành:
x = A s (3)
Phương tình (3) là mô hình ICA tuyến cơ bản (còn gọi ICA chuẩn). Khi cần sử dụng biểu diễn
dạng cột của ma trận A ta gọi các cột là ai và viết

=
=
n
i
ii s
1
ax (4)
Từ (3) có thể giải ra s = A-1x nếu biết được A và nếu A là nghịch đảo được, nhưng thực tế
không biết A. Đây cũng là bài toán tách nguồn (hay tín hiệu) mù (Blind Source/ Signal
Separation - BSS) [6]. Các tín hiệu nguồn là các thành phần độc lập (lý do sẽ thấy ở sau).
1.2 Các điểm không xác định trong ICA
Mô hình ICA cơ bản (3) và (4) có một số bất định tóm lược như sau:
1. Không thể xác định các phương sai (năng lượng) của các thành phần độc lập. Người ta giả
sử mỗi biến có phương sai đơn vị: E{ 2is } = 1. Tuy nhiên hãy còn bất định về dấu vì khi ta
nhân một thành phần độc lập với -1 thì mô hình ICA không thay đổi. Trong hầu hết các
ứng dụng yếu tố dấu không có ý nghĩa.
2. Không thể xác định thứ tự của các thành phần độc lập khi phân ly vì cả s và A đều không
biết nên ta có thể thay đổi thứ tự các số hạng trong (4) nên bất cứ thành phần nào cũng có
thể là thành phần đầu tiên. Nói rõ hơn thì xác định thứ tự là công việc khó khăn.
2. SỰ ĐỘC LẬP THỐNG KÊ
2.1 Bất tương quan
Các phân bố xác suất đều giả sử có trị trung bình bằng không. Nếu không phải như vậy
thì ta trừ phân bố với trị trung bình của nó, đây là sự qui tâm (centering). Để ý là hiệp phương
sai (covariance) chính là tương quan (correlation) khi trị trung bình bằng không. Đối với một
vectơ ngẫu nhiên x ma trận hiệp phương sai là
Cxx = E ⎨(x – mx)E(x – mx)T⎬ (5)
trong đó E ⎨.⎬ là toán tử lấy trung bình, mx là vectơ trung bình. Hiệp phương sai của hai
vectơ ngẫu nhiên x1, x2 (có trị trung bình bằng không) là:
Cx1x2 = E ⎨x1x2T⎬ (6)
Khi Cx1x2 = 0 hai vectơ bất tương quan (uncorrelated). Đối với vectơ ngẫu nhiên x khi các
thành phần xi của nó bất tương quan hỗ tương thì:
Cxx = D (7)
trong đó D là ma trận chéo n×n, với các phương sai của các thành phần nằm trên đường chéo.
TẠP CHÍ PHÁT TRIỂN KH&CN, TẬP 9, SỐ 2 -2006
Trang 35
2.2 Độc lập thống kê
Tính bất tương quan nêu trên chưa đủ để phân ly ICA. Ta cần một đặc tính mạnh hơn,
đó là sự độc lập thống kê, nghĩa là khi biết một thành phần nào đó ta không thể suy ra các
thành phần còn lại. Xem hai vectơ ngẫu nhiên x1 và x2 với hàm mật độ xác suất riêng biệt
p(x1), p(x2) và hàm mật độ xác suất liên kết p(x1 x2) là độc lập thống kê nếu và chỉ nếu khi
thỏa
p(x1.x2) = p(x1) p(x2) (8)
Khi có nhiều vectơ thì sự thừa số hóa cũng tương tự.
Định nghĩa kỹ thuật ở trên dẫn đến một đặc tính sau của các biến ngẫu nhiên. Xem
f(x1) và f(x2) là biến đổi phi tuyến nào đó trên hai vectơ ngẫu nhiên x1 và x2 có hàm phân bố
đã nói ở trên, thì có thể chứng minh được [1]:
E{f1(x1)f2(x2)} = E{f1(x1)}E{f2(x2)} (9)
Như vậy sự độc lập là có thể thừa số hóa tương quan phi tuyến. Đây là đặc tính quan trọng vì
nó giải thích và nhấn mạnh vai trò các phi tuyến trong ICA. Khi đặt f(x1) = x1 và f(x2) = x2 ta
thấy là sự độc lập bao gồm luôn sự bất tương quan (nhưng bất tương quan không đương nhiên
là độc lập). Cụ thể là ta giả sử s ở phương trình (3) là độc lập thống kê nên các tín hiệu nguồn
si là các thành phần độc lập. Chính nhờ sự độc lập thống kê mà ta có thể phân ly ra s từ (3).
2.3 Phi Gauss là độc lập
Mô ...
 
Các chủ đề có liên quan khác
Tạo bởi Tiêu đề Blog Lượt trả lời Ngày
L Việt hoá Pazera Free Audio Extractor 2.1 - Công cụ tách âm thanh Giới thiệu phần mềm hay theo yêu cầu 1
D Nghiên cứu quy trình chiết tách tinh dầu quế Luận văn Sư phạm 0
D Nghiên cứu tổng hợp pholthua lưỡng kim cấu trúc nano xốp làm chất xúc tác cho quá trình tách nước điện hóa tổng thể Khoa học Tự nhiên 0
D Thiết kế hệ thống chưng luyện liên tục loại tháp đĩa lỗ có ống chảy chuyền để phân tách hỗn hợp Khoa học Tự nhiên 0
D Nghiên cứu vai trò của Allicin tách từ tỏi Việt Nam trong quá trình điều hoà đáp ứng viêm thông qua thụ thể Dectin 1 Y dược 0
D Nghiên cứu đặc tính quang của bộ tách kênh ghép tín hiệu sử dụng ống dẫn sóng silicon Khoa học kỹ thuật 0
D Nghiên cứu chiết tách, xác định cấu trúc các hoạt chất từ cây Bách bộ (Stemona pierrei Gagn) ở Lào Khoa học Tự nhiên 0
D Nghiên cứu alkaloid và quy trình tách chiết một số chất có bản chất là alkaloid Khoa học kỹ thuật 0
D Tìm hiểu quy trình làm giàu và tách quặng Monazite từ sa khoáng ở Thừa Thiên Huế và tách tổng oxit đất hiếm từ quặng Monazite Khoa học Tự nhiên 0
D Chiết tách, xác định thành phần hóa học trong một số dịch chiết của lá và hạt cây chùm ngây Nông Lâm Thủy sản 0

Các chủ đề có liên quan khác

Top