Využití RPS pro potlačování šumu v řečových signálech

Podobné dokumenty
Numerické metody a programování

1. Vlastnosti diskretních a číslicových metod zpracování signálů... 15

11 Analýza hlavních komponet

Klasifikace a rozpoznávání. Extrakce příznaků

Numerické metody a programování. Lekce 4

13 Barvy a úpravy rastrového

Algoritmy a struktury neuropočítačů ASN P9 SVM Support vector machines Support vector networks (Algoritmus podpůrných vektorů)

Základy matematiky pro FEK

II. Úlohy na vložené cykly a podprogramy

NPGR032 CVIČENÍ III. Šum a jeho odstranění teorie&praxe. Adam Novozámský (novozamsky@utia.cas.cz)

Regresní analýza 1. Regresní analýza

0.1 Úvod do lineární algebry

2.6. VLASTNÍ ČÍSLA A VEKTORY MATIC

ADA Semestrální práce. Harmonické modelování signálů

Zvýrazňování řeči pomocí vícekanálového zpracování

Využití neuronové sítě pro identifikaci realného systému

Rozpoznávání izolovaných slov (malý slovník, např. číslovky, povely).

POZNÁMKY K PŘEDMĚTU PROJEKT

Čtvercové matice. Čtvercová matice je taková matice, jejíž počet řádků je roven počtu jejích sloupců

Matematika (CŽV Kadaň) aneb Úvod do lineární algebry Matice a soustavy rovnic

3 METODY PRO POTLAČENÍ ŠUMU U ŘE- ČOVÉHO SIGNÁLU

Předmluva 9 Obsah knihy 9 Typografické konvence 10 Informace o autorovi 10 Poděkování 10

INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ. Příklady použití tenkých vrstev Jaromír Křepelka

Nelineární analýza a predikce síťového provozu

11MAMY LS 2017/2018. Úvod do Matlabu. 21. února Skupina 01. reseni2.m a tak dále + M souborem zadané funkce z příkladu 3 + souborem skupina.

Robust 2014, ledna 2014, Jetřichovice

VYUŽITÍ MATLABU PRO PODPORU VÝUKY A PŘI ŘEŠENÍ VÝZKUMNÝCH ÚKOLŮ NA KATEDŘE KOMUNIKAČNÍCH A INFORMAČNÍCH SYSTÉMŮ

SVD rozklad a pseudoinverse

Hisab al-džebr val-muqabala ( Věda o redukci a vzájemném rušení ) Muhammada ibn Músá al-chvárizmího (790? - 850?, Chiva, Bagdád),

Transformace obrazu Josef Pelikán KSVI MFF UK Praha

Matematika B101MA1, B101MA2

Úloha - rozpoznávání číslic

Úvodem Dříve les než stromy 3 Operace s maticemi

Fakulta chemicko-technologická Katedra analytické chemie. 3.2 Metody s latentními proměnnými a klasifikační metody

Úlohy k přednášce NMAG 101 a 120: Lineární algebra a geometrie 1 a 2,

Algoritmy pro shlukování prostorových dat

Jasové transformace. Karel Horák. Rozvrh přednášky:

UNIVERZITA PARDUBICE. 4.4 Aproximace křivek a vyhlazování křivek

Matice. Modifikace matic eliminační metodou. α A = α a 2,1, α a 2,2,..., α a 2,n α a m,1, α a m,2,..., α a m,n

Příklad. Řešte v : takže rovnice v zadání má v tomto případě jedno řešení. Pro má rovnice tvar

U Úvod do modelování a simulace systémů

vzorek vzorek

Globální matice konstrukce

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ FAKULTA STROJNÍHO INŽENÝRSTVÍ

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1

1 Řešení soustav lineárních rovnic

1 Jasové transformace

DETEKCE HRAN V BIOMEDICÍNSKÝCH OBRAZECH

ROZ1 CVIČENÍ VI. Geometrická registrace (matching) obrazů

Návrh frekvenčního filtru

ROZ1 - Cv. 3 - Šum a jeho odstranění ÚTIA - ZOI

Laboratorní úloha č. 8: Elektroencefalogram

0.1 Úvod do lineární algebry

Operace s maticemi. 19. února 2018

KTE/TEVS - Rychlá Fourierova transformace. Pavel Karban. Katedra teoretické elektrotechniky Fakulta elektrotechnická Západočeská univerzita v Plzni

HODNOST A DETERMINANT MATICE, INVERZNÍ MATICE

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

HODNOST A DETERMINANT MATICE, INVERZNÍ MATICE

Matice. Předpokládejme, že A = (a ij ) je matice typu m n: diagonálou jsou rovny nule.

a počtem sloupců druhé matice. Spočítejme součin A.B. Označme matici A.B = M, pro její prvky platí:

Singulární rozklad aplikace v image deblurring

Hledání optimální polohy stanic a zastávek na tratích regionálního významu

Čas (s) Model časového průběhu sorpce vyplývá z 2. Fickova zákona a je popsán následující rovnicí

Lineární algebra - I. část (vektory, matice a jejich využití)

Stručný obsah. K2118.indd :15:27

Linearní algebra příklady

Ekonometrie. Jiří Neubauer

3.4 Určení vnitřní struktury analýzou vícerozměrných dat

3. Kmitočtové charakteristiky

Učební texty k státní bakalářské zkoušce Matematika Vlastní čísla a vlastní hodnoty. študenti MFF 15. augusta 2008

Konstrukční varianty systému pro nekoherentní korelační zobrazení

Robustní statistické metody

Slovo ALGEBRA pochází z arabského al-jabr, což znamená nahrazení. Toto slovo se objevilo v názvu knihy

Ing. Václav Eksler Ústav telekomunikací FEKT VUT v Brně

1 Zobrazení 1 ZOBRAZENÍ 1. Zobrazení a algebraické struktury. (a) Ukažte, že zobrazení f : x

Vektory a matice. Obsah. Aplikovaná matematika I. Carl Friedrich Gauss. Základní pojmy a operace

základní vlastnosti, používané struktury návrhové prostředky MATLAB problém kvantování koeficientů

AVDAT Klasický lineární model, metoda nejmenších

Semestrální projekt. Vyhodnocení přesnosti sebelokalizace VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ. Fakulta elektrotechniky a komunikačních technologií

Cykly a pole

Obsah. Předmluva 13. O autorovi 15. Poděkování 16. O odborných korektorech 17. Úvod 19

8 Matice a determinanty

1 Úvod do celočíselné lineární optimalizace

Nelineární systémy a teorie chaosu

Odhad stavu matematického modelu křižovatek

13. cvičení z PSI ledna 2017

Determinanty. Obsah. Aplikovaná matematika I. Pierre Simon de Laplace. Definice determinantu. Laplaceův rozvoj Vlastnosti determinantu.

Číslicová filtrace. FIR filtry IIR filtry. ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE Fakulta elektrotechnická

INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ. Modernizace studijního programu Matematika na PřF Univerzity Palackého v Olomouci CZ.1.07/2.2.00/28.

Matematika pro geometrickou morfometrii

Aplikace multifraktální geometrie na finančních trzích

Cvičná bakalářská zkouška, 1. varianta

Robustní odhady statistických parametrů

Náhodný vektor a jeho charakteristiky

1 Linearní prostory nad komplexními čísly

Ilustrační příklad odhadu LRM v SW Gretl

scale n_width width center scale left center range right center range value weight_sum left right weight value weight value weight_sum weight pixel

Signál v čase a jeho spektrum

Vyhodnocení 2D rychlostního pole metodou PIV programem Matlab (zpracoval Jan Kolínský, dle programu ing. Jana Novotného)

Algoritmy a struktury neuropočítačů ASN P3

Transkript:

Využití RPS pro potlačování šumu v řečových signálech Ing. Radek Zezula, Ph.D., Ing. Ivan Koula, Prof. Ing. Zdeněk Smékal, CSc. Ústav telekomunikací Vysoké učení technické v Brně Fakulta elektrotechniky a komunikačních technologií e-mail: zezular@feec.vutbr.cz, koulis80@hotmail.com, smekal@feec.vutbr.cz V tomto článku jsou použity koncepty z oblasti nelineárních dynamických systémů pro popis řečového signálu. Modelování řečového signálu je provedeno jeho přepisem na vícedimensionální atraktory, vložením řečového signálu do rekonstruovaného stavového prostoru (Reconstructed Phase Space). V něm se aproximují lokální geometrické struktury atraktoru pomocí adaptivního algoritmu využívajícího singulární dekompozici matice popisující prostor RPS za účelem redukce šumu v řečovém signálu. Obsah 1. Úvod 2. Popis metody 2.1. Určení vhodného zpoždění pomocí nelineární korelace 2.2. FNN 3. Testování metody 4. Závěr Poděkování Literatura 1. Úvod Tradiční metody potlačování šumu v řečových signálech se snaží co nejlépe odhadnout spektrální charakteristiky řečového signálu a šumu za účelem jejich vzájemné separace a filtrace. Alternativou k těmto tradičním metodám zvýrazňování řečového signálu je pohled na řečový signál jako na nelineární dynamický systém. Filtrování signálů z nelineárních systémů však vyžaduje užití speciálních metod, neboť obvyklé spektrální nebo lineární filtry mohou nepříznivě působit na nelineární strukturu signálu. Iregulární signály z nelineárních zdrojů působí v širokém pásmu spektra a proto je složité identifikovat jejich komponenty ve spektru a přitom je nezaměnit za složky šumu. Nelineární metody potlačení šumu se proto nespoléhají na informace o spektrálním rozložení signálu a šumu, ale využívají jiných technik. Například z teorie chaosu je známo, že pro získání znalostí chování určitých nelineárních dynamických systémů se někdy více hodí popis těchto systémů ve vícedimensionální stavovém prostoru RPS nežli v oblasti časové nebo frekvenční. Informace lokálního charakteru u takového systému lze pak snáze získat ze sousedských vztahů časových řad zkoumaného signálu. A právě na tomto principu staví metoda popisovaná v tomto článku. 2-1

2. Popis metody Zkoumáním časových řad jednostavové proměnné dynamického systému může být docíleno toho, že nově vytvořený stavový prostor systému bude topologicky ekvivalentní k popisu původního systému. Vytvoření takového prostoru může být provedeno zavedením časového zpoždění signálu. To může být chápáno jako vícedimensionální zobrazení signálu s opožděnými verzemi sebe sama [1]. Do jednotlivých vektorů rekonstruovaného stavového prostoru jsou transformovány časové posloupnosti signálu pomocí výrazu (1): kde n je časový index, d značí dimensi vhodného stavového prostru a τ je časové zpoždění zkoumaného signálu x. Kompletní popis rekonstruovaného stavového prostoru signálu je dán maticí atraktoru (2): (1) (2) Matice atraktoru se skládá z řádkových vektorů, které jsou vytvořeny podle rovnice (1). Pokud je k dispozici N hodnot v rámci signálu, pak počet vektorů (řádků matice atraktoru) je roven N-(d-1)τ. Podmínkou pro vytvoření topologicky ekvivalentního RPS k originálnímu signálu je, aby hodnota d byla dostatečně velká [2]. Ta se určí metodou FNN (false nearest neighbor) až po stanovení vhodného zpoždění pomocí MI (mutual information). 2.1. Určení vhodného zpoždění pomocí nelineární korelace Pro analýzu skrytých vlastností zkoumaných posloupností signálu se často používá korelační funkce. Ke stejným účelům lze však také využít i nelineární korelaci. Vztah pro nelineární korelaci, jenž je uváděn v literatuře [5] pro stanovení vzájemných závislostí dvou vektorů jsme modifikovali na tvar (3): (3) kde h(nx,ny) je dvojdimenzionální frekvenční histogram dvou vektorů x a y, hx je vektor součtů hodnot ve sloupcích matice h, hy je vektor součtů hodnot na řádcích matice h, N je délka vektorů x a y, NX a NY jsou rozměry matice h. Hodnota získaná z výrazu (3) udává vhodné zpoždění pro určení hodnoty d pomocí algoritmu FFN (false nearest neighbor), která je zapotřebí pro vytvoření optimálního RPS. Při stanovení časového zpoždění τ je důležité, aby jeho hodnota byla zvolená vhodně. Pokud by totiž bylo toto zpoždění příliš malé, pak N t bude velmi podobné N t+x a při vykreslení grafu atraktoru zůstanou křivky blízko sebe a budou tvořit téměř čáru X t ~ X t+x - viz. obr. 1. 2-2

obr. 1 Lorenzův atractor t=0,02 - malé zpoždění obr. 2 Lorenzův atractor t=0,16 - optimální zpoždění obr. 3 Lorenzův atractor t=0,4 - velké zpoždění obr. 4 obr. 4 Lorenzův atractor t=0,74 - velké zpoždění Naopak, když zpoždění je příliš velké, pak uspořádání atraktoru je téměř nezávislé a tak nelze ze získaného zobrazení získat požadovanou informaci - viz. obr. 3 nebo obr. 4. 2.2. FNN Metoda FNN (False Nearest Neighbors), navržena Kennelem [6], slouží k určení minimální, avšak dostatečné dimense d, jenž je zapotřebí pro vytvoření ekvivalentního prostoru a pro správné zobrazení atraktoru signálu. Princip této metody je jednoduchý. Pro každý bod časové posloupnosti signálu se hledá jeho nejbližší soused v d dimensionálním prostoru. Pak se spočítá jejich vzájemná vzdálenost pomocí (4): 2-3

(4) Následně se iterují oba body a vypočte se hodnota podle (5): (5) Pokud Ri překročí daný heuristický práh Rt (hodnota blízká nule), pak je tento bod označen za bod mající "falešného nejbližšího souseda". Pokud procento výskytu "falešných nejbližších sousedů" je malé, hodnota d, při které byl test proveden, je považována za dostatečnou dimenzi prostoru RPS. Využitím získaných parametrů lze vypočíst matici popisující rekonstruovaný stavový prostor, jenž je topologicky ekvivalentní k popisu původního signálu. Z této matice se vyberou pouze ty řádky, které mají nejmenší euklidovskou vzdálenost k referenčnímu bodu (v prvním kroku je referenční bod definován prvním řádkem matice RPS) - hledají se tedy jeho nejbližší sousedé ve stavovém prostoru signálu. Počet vybraných řádků je roven hodnotě. Využitím těchto vybraných řádků se sestaví čtvercová matice, jejíž hodnoty v jednotlivých sloupcích jsou sníženy o hodnotu aritmetického průměru z původních hodnot daného sloupce čtvercové matice. Získaná čtvercová matice je dále rozložena pomocí singulární dekompozice (singular value decomposition) k získání diagonální matice S s nezápornými sestupně seřazenými hodnotami a dvěmi unitárními maticemi U a V. Matice S je dále využita k adaptivnímu výběru hodnot z V matice pro modifikaci hodnot popisující původní referenční bod. Tento algoritmus se opakuje pro všechny řádky matice rekonstruovaného stavového prostoru RPS původního signálu. Poté následuje rekonstrukce časového rámce signálu z modifikované matice RPS. 3. Testování metody Pro testování vlastností této metody potlačování šumu v řečových signálech jsme zvolily pět promluv z databáze TIMIT, které jsme modifikovali přidáním Gaussova šumu v rozmezí od -10dB do +10dB. Na tyto zašumělé promluvy jsme aplikovali popisovaný algoritmus potlačení šumu a výsledné signály jsme porovnali z originálními nahrávkami pomocí SNR a NC. (6) kde x(n) je originální řečový signál z TIMIT databáze a šumu, jenž byl k originálnímu signálu nejdříve přidán. je řečový signál po potlačení 2-4

(7) kde jednotlivé proměnné jsou významově totožné jako u předešlého výrazu. Průměrné hodnoty získané z výsledků jednotlivých testovaných promluv jsou vidět na následujících grafech. obr. 5 Výsledky SNR pro aditivní Gaussův bílý šum obr. 6 Výsledky NC pro aditivní Gaussův bílý šum 2-5

4. Závěr V tomto článku je popisovaná nelineární metoda potlačování šumu v řečových signálech využívající koncepty z oblasti nelineárních dynamických systémů. Principem metody je přepis řečového signálu do RPS prostoru, v kterém se geometrické struktury atraktoru modifikují pomocí algoritmu využívající singulární dekompozici matice atraktoru. Výhodou této metody je ta skutečnost, že nevyžaduje pro svoji funkčnost explicitní modely řečového signálu a šumu a přesto dosahuje kvalit klasických metod zvýrazňování řeči ze zašumělých řečových signálů. Větší účinnost této metody se projevuje především u nižších hodnot SNR. Poděkování Tento článek vznikl za podpory projektu Grantové Agentury České republiky č. 102/04/1097. Použitá literatura [1] N. H. Packard, J. P. Crutchfield, J. D. Farmer, and R. S. Shaw, "Geometry from a time series," Physical Review Letters, vol. 45, pp. 712-716, 1980. [2] T. Sauer, J. A. Yorke, and M. Casdagli, "Embedology", Journal of Statistical Physics, vol. 65, pp. 579-616, 1991. [3] H. Kantz and T. Schreiber, Nonlinear Time Series Analysis. Cambridge, Cambridge University Press, ISBN 0521653878, 1999. [4] H. D. I. Abarbanel, M. E. Gilpin, M. Rotenberg, Analysis of observed chaotic data. New York, Springer, ISBN 0387983724, 2005. [5] A. M. Fraser and H. L. Swinney, Independent coordinates for strange attractors from mutual information, Phys. Rev. A 33, 1134 (1986). [6] M. B. Kennel, R. Brown, and H. D. I. Abarbanel, Determining embedding dimension for phase-space reconstruction using a geometrical construction, Phys. Rev. A 45, 3403 (1992). 2-6