FAKULTA ELEKTROTECHNIKY A KOMUNIKAČNÍCH TECHNOLOGIÍ ÚSTAV TELEKOMUNIKACÍ
|
|
- Ján Bednář
- před 6 lety
- Počet zobrazení:
Transkript
1 VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY FAKULTA ELEKTROTECHNIKY A KOMUNIKAČNÍCH TECHNOLOGIÍ ÚSTAV TELEKOMUNIKACÍ FACULTY OF ELECTRICAL ENGINEERING AND COMMUNICATION DEPARTMENT OF TELECOMMUNICATIONS POROVNÁNÍ ÚSPĚŠNOSTI VÍCEKANÁLOVÝCH METOD SEPARACE ŘEČOVÝCH SIGNÁLŮ DIPLOMOVÁ PRÁCE MASTER S THESIS AUTOR PRÁCE AUTHOR BC. PETR PŘIKRYL BRNO 2008
2 VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY FAKULTA ELEKTROTECHNIKY A KOMUNIKAČNÍCH TECHNOLOGIÍ ÚSTAV TELEKOMUNIKACÍ FACULTY OF ELECTRICAL ENGINEERING AND COMMUNICATION DEPARTMENT OF TELECOMMUNICATIONS POROVNÁNÍ ÚSPĚŠNOSTI VÍCEKANÁLOVÝCH METOD SEPARACE ŘEČOVÝCH SIGNÁLŮ COMPARISON OF SUCCESS RATE OF MULTI-CHANNEL METHODS OF SPEECH SIGNAL SEPARATION DIPLOMOVÁ PRÁCE MASTER S THESIS AUTOR PRÁCE AUTHOR VEDOUCÍ PRÁCE SUPERVISOR BC. PETR PŘIKRYL ING. IVAN MÍČA BRNO 2008
3 ZDE VLOŽIT LIST ZADÁNÍ Z důvodu správného číslování stránek
4 ZDE VLOŽIT PRVNÍ LIST LICENČNÍ SMOUVY Z důvodu správného číslování stránek
5 ZDE VLOŽIT DRUHÝ LIST LICENČNÍ SMOUVY Z důvodu správného číslování stránek
6 ABSTRAKT Separace nezávislých zdrojů signálů ze směsí zaznamenaných signálů je základní problém v mnoha praktických situacích. Typický příklad je záznam řeči v prostředí za přítomnosti šumu či jiného mluvčího na pozadí. Touto problematikou se zabývá skupina metod nazvaných separace zdrojů naslepo. Slepá separace je založena na odhadu N neznámých zdrojů z P měření, které jsou směsmi těchto neznámých zdrojů a neznámého prostředí. Představeny a v Matlabu implementovány jsou některá známá řešení okamžitých směsí, tj. analýza nezávislých komponent a časově-kmitočtová analýza. V reálném prostředí však akustické signály nejsou okamžité směsi, ale směsi konvoluční. Pro tento případ je představen a v Matlabu implementován algoritmus pro separaci konvolučních směsí v kmitočtové oblasti. Tato diplomová práce zkoumá porovnání a použitelnost těchto separačních algoritmů. KLÍČOVÁ SLOVA Analýza nezávislých komponent, Separace signálů naslepo, Časově-kmitočtová analýza, Krátkodobá Fourierova transformace, Dekonvoluce signálů naslepo ABSTRACT The separation of independent sources from mixed observed data is a fundamental problem in many practical situations. A typical example is speech recordings made in an acoustic environment in the presence of background noise or other speakers. Problems of signal separation are explored by a group of methods called Blind Source Separation. Blind Source Separation (BSS) consists of estimating a set of N unknown sources from P observations resulting from the mixture of these sources and unknown background. Some existing solutions for instantaneous mixtures are reviewed and in Matlab implemented, i.e Independent Componnent Analysis (ICA) and Time-Frequency Analysis (TF). The acoustic signals recorded in real environment are not instantaneous, but convolutive mixtures. In this case, an ICA algorithm for separation of convolutive mixtures in frequency domain is introduced and in Matlab implemented. This diploma thesis examines the useability and comparisn of proposed separation algorithms. KEYWORDS Independent Component Analysis, Blind Source Separation, Time-Frequency Analysis, Short Time Fourier Transform, Blind Source Deconvolution
7 PROHLÁŠENÍ Prohlašuji, že svou diplomovou práci na téma Porovnání úspěšnosti vícekanálových metod separace řečových signálů jsem vypracoval samostatně pod vedením vedoucího diplomové práce a s použitím odborné literatury a dalších informačních zdrojů, které jsou všechny citovány v práci a uvedeny v seznamu literatury na konci práce. Jako autor uvedené diplomové práce dále prohlašuji, že v souvislosti s vytvořením této diplomové práce jsem neporušil autorská práva třetích osob, zejména jsem nezasáhl nedovoleným způsobem do cizích autorských práv osobnostních a jsem si plně vědom následků porušení ustanovení 11 a následujících autorského zákona č. 121/2000 Sb., včetně možných trestněprávních důsledků vyplývajících z ustanovení 152 trestního zákona č. 140/1961 Sb. V Brně dne (podpis autora)
8 Děkuji vedoucímu diplomové práce ing. Ivanovi Míčovi za jeho odbornou pomoc při zpracovávání diplomové práce.
9 OBSAH Úvod 11 1 Problematika slepé separace Úvod do BSS Základní model BSS Analýza nezávislých komponent Základní model Předpoklady pro zpracování metodou ICA Adaptační algoritmus ICA Časově-kmitočtová analýza Představení metody Princip algoritmu TIFROM Problematika slepé dekonvoluce Úvod do BSD Základní model BSD Řešení zkbsd v časové oblasti Bussgangova metoda Metoda přirozeného gradientu Řešení BSD v kmitočtové oblasti Algoritmus výpočtu komplexní ICA Algoritmus FDICA Permutační problém v kmitočtové oblasti a jeho řešení Beamforming a jeho použití Přehled dosažených výsledků Algoritmy okamžitých směsí Algoritmus fastica pro směs dvou řečových signálů Algoritmus fastica pro směs řečového signálu a šumu Algoritmus TIFROM pro směs dvou řečových signálů Algoritmus TIFROM pro směs řečového signálů a šumu Algoritmy konvolučních směsí Algoritmus komplexní ICA Algoritmus FDICA Závěr 44 Literatura 45
10 Seznam symbolů, veličin a zkratek 46 A Seznam příloh 48
11 SEZNAM OBRÁZKŮ 1.1 Základní model BSS Schéma agoritmu TIFROM Proces generování TFSS Algoritmus FDICA Paralelogramy procesu bělení, smíšení a separace Příklad směrových diagramů Ukázka separace řečových signálů algoritmem fastica. Zobrazeny jsou po řadě dva zdrojové signály s i (k), dva senzorové signály x i (k) a nakonec dva separované signály y i (k) Ukázka separace řečových signálu a bílého šumu algoritmem fastica. Zobrazeny jsou po řadě dva zdrojové signály s i (k), dva senzorové signály x i (k) a nakonec separovaný řečový signál y 1 (k) Ukázka separace řečových signálů algoritmem TIFROM. Zobrazeny jsou po řadě dva zdrojové signály s i (k), dva senzorové signály x i (k) a nakonec dva separované signály y i (k) Ukázka separace řečových signálu a bílého šumu algoritmem TIF- ROM. Zobrazeny jsou po řadě dva zdrojové signály s i (k), dva senzorové signály x i (k) a nakonec separovaný řečový signál y 1 (k) Ukázka separace řečových signálu komplexním ICA algoritmem. Zobrazeny jsou po řadě dva zdrojové signály s i (k), dva senzorové signály x i (k) a nakonec dva separované signály y i (k) Ukázka spektrogramu separace řečových signálu komplexním ICA algoritmem. Zobrazeny jsou po řadě dva zdrojové signály S i (f), dva senzorové signály X i (f) a nakonec dva separované signály Y i (f) Ukázka permutovaných a upravených DP a DP vypočtených metodou beamforming Ukázka separace řečových signálů algoritmem FDICA. Zobrazeny jsou po řadě dva zdrojové signály s i (k), dva senzorové signály x i (k) a nakonec dva separované signály y i (k) Ukázka separace řečového a hudebního signálu algoritmem FDICA. Zobrazeny jsou po řadě dva zdrojové signály s i (k), dva senzorové signály x i (k) a nakonec dva separované signály y i (k) Ukázka spektrogramu separace řečového a hudebního signálu algoritmem FDICA. Zobrazeny jsou po řadě dva zdrojové signály S i (f), dva senzorové signály X i (f) a nakonec dva separované signály Y i (f)... 43
12 ÚVOD Tato práce se zabývá metodami separace užitečných signálů, které byly pořízeny v prostředí, kde současně působí různé hluky, šumy a parazitní signály. Užitečné signály mohou být signály řečové, hudební nebo např. biomedicínské. V této práci jsou především z hlediska separace zkoumány signály řečové. V současné době se stále více rozvíjí komunikační systémy a proto je nutné potlačit nežádoucí signály a šumy, které zkreslují původní užitečný signál při vzniku i při průchodu signálu neznámým prostředím nebo systémem. Cílem je tedy obnovit pozorovaný signál tak, aby se co nejvíce podobal signálu původnímu. Ve většině případů mají nežádoucí signály chrakter širokopásmového šumu a nelze je tedy separovat klasickými metodami číslicové filtrace. Na začátku práce bude rozebrán úvod do problematiky BSS (separace signálů naslepo - Blind Source Separation), která se zabývá separací směsí signálů, přičemž nemáme žádné informace ani o separovaných signálech ani o zkreslujícím prostředí. Budou rozebrány základní metody pro separaci okamžitých směsí signálů jako je metoda ICA (analýza nezávislých komponent - Independent Component Analysis) pro statisticky nezávislé signály a metoda TIFROM (časově-frekvenčí poměr směsí - Time-Frequency Ratio Of Mixtures), která dokáže separovat i signály vzájemně závislé. Pro obě metody budou vytvořeny skripty v programu Matlab, které budou demonstrovat úspěšnost těchto separačních technik. Tyto separační techniky pro okamžité směsi zdrojových signálů jsou však pro praxi málo použitelné. V reálném prostředí jsou senzorové signály směsi zpožděných a zeslabených zdrojových signálů, které jsou způsobeny mnohonásobnými odrazy od stěn místnosti a vícecestným šířením. Takto degradované signály nelze separovat metodami pro okamžité směsi, jednotlivé prvky separačních matic musí být proto nahrazeny celými číslicovými filtry. Metodami pro separaci konvolučních směsí ze zabývá BSD (vícekanálová dekonvoluce naslepo - Blind Source Deconvolution). V této práci bude rozebráno řešení v kmitočtové oblasti, konkrétně algoritmus FDICA (analýza nezávislých komponent v kmitočtové oblasti - Frequency Domain Independent Component Analysis). V Matlabu bude implementován skript, který realizuje tuto metodu včetně řešení permutačního problému, který při zpracování v kmitočtové oblasti vzniká. Dále bude rozebrána metoda beamforming a její použití s algoritmem FDICA. V závěru práce budou posouzeny jednotlivé techniky z hlediska použitelnosti, budou porovnány kvality signálů separovaných jednotlivými metodami. 11
13 1 PROBLEMATIKA SLEPÉ SEPARACE 1.1 Úvod do BSS BSS se zabývá skupinou metod, jejichž cílem je obnovit zdrojové signály z jejich směsí se šumy či jinými užitečnými signály za předpokladu, že nejsou poskytnuty žádné informace o zdrojových signálech ani o směšujícím systému. Ve většině případů jde o metody vícekanálové tj. snímání směsí signálů je prováděno více mikrofony, většinou jde o mikrofonová pole. V této kapitole bude uveden základní směšující model BSS a možnosti jeho řešení. Mezi základní metody řešení BSS patří: ICA pro separaci vzájemně statisticky nezávislých signálů TIFROM pro separaci vzájemně statisticky nezávislých i závislých signálů Základní model BSS Celý systém lze popsat následovně. Máme M signálů směsí daných jako x(k) = [x 1 (k), x 2 (k),..., x M (k)] T, které jsou linearní kombinací N zdrojových signálů znehodnocených šumem s(k) = [s 1 (k), s 2 (k),..., s N (k)] T, k označuje index časové posloupnosti. Platí, že k = 1,2,...K, kde K je délka zpracovávané části signálu. Situaci lze shrnout do jednoho vzorce N x i (k) = a ij s j (k) + v i (k) (1.1) j=1 nebo maticově x(k) = As(k) + v(k) (1.2) kde x(k) a s(k) jsou sloupcové vektory zdrojových a senzorových signálů a index k je index časové posloupnosti. Matice A je tzv. směšující matice (mixing matrix) rozměru M N. Vektor šumu v(k) nebudeme dále v práci uvažovat. Vektory zdrojových, senzorových a separovaných signálů budeme nadále značit následovně x = [x(1), x(2),..., x(k)] (1.3) kde x(k) označuje vzorky všech senzorových signálů v čase k nebo také x 1 (1) x 1 (2)... x 1 (K) x x = 2 (1) x 2 (2)... x 2 (K) x M (1) x M (2)... x M (K) (1.4) 12
14 kde jednotlivé řádky matice znamenají jednotlivé vektory senzorových signálů délky K. Většinou platí, že počet zdrojových signálů M je větší nebo roven počtu senzorových signálů N. Cílem je nalézt separační matici H rozměru N M takovou, pro kterou platí y(k) = Hx(k) (1.5) kde y(k) značí výstupní separované signály. Pro y(k) platí y(k) = [y 1 (k), y 2 (k),..., y N (k)] T (1.6) Obr. 1.1: Základní model BSS. Nalezení korektní separační matice je základním problémem BSS viz obr Analýza nezávislých komponent Základní model ICA je technika DSP (digitální zpracování signálů - Digital Signal Processing), jejímž cílem je vyjádřit soustavu náhodných proměnných jako lineární kombinaci statisticky nezávislých proměnných. Tato metoda bývá často ztotožňována s BSS, ale ICA je pouze metodou řešení BSS. V zásadě ale obecný model BSS odpovídá i modelu ICA. Máme opět transformaci x(k) = As(k) + v(k) (1.7) 13
15 kde A představuje směšující matici. Cílem je najít matici separační, tj. matici H o rozměru N M, pro kterou platí H = H 1 A. Mezi dvě základní omezení této metody patří Nelze obnovit energie zdrojových signálů Nelze dodržet pořadí zdrojových signálů Tato omezení se v podstatě kompenzují tak, že se výsledná separační matice H vynásobí dvěma maticemi. Matice P je permutační matice, která upraví pořadí separovaných komponent a matice D je diagonální matice, která upraví energie separovaných signálů. Souhrnně tedy platí H = A 1 DP (1.8) Předpoklady pro zpracování metodou ICA Algoritmus ICA se dá rozdělit do dvou kategorií, viz [2]. První kategorie je založena na sadě výpočtů, které minimalizují, nebo maximalizují kriteriální funkci. Druhá kategorie obsahuje adaptační algoritmus, často založený na stochastické gradientní metodě, která souvisí s implementacemi adaptačního algoritmu v neuronových sítích. Statistické vlastnosti závisí na výběru účelové funkce, konvergenční vlastnosti jsou především spjaty s adaptačním algoritmem. Právě z důvodu konvergence a zjednodušení algoritmu by měly být splněny dvě základní podmínky 1. Centrování vstupních dat 2. Bělení vstupních dat ad 1.) Centrování má za úkol odstranit stejnosměrnou složku z upravovaného signálů. Platí tedy x c (k) = x(k) 1 K K x(k) (1.9) k=1 Po zpracování můžeme provést inverzní proces za pomocí separační matice H a odhadů y(k) y c (k) = y(k) + H 1 K K x(k) (1.10) k=1 ad 2.) Bělení je takový proces předzpracování, po jehož aplikaci jsou vstupní data nekorelovaná a mají jednotkový rozptyl. Jsou-li tedy senzorové signály x(k) vyběleny, pak je jejich korelační matice rovna matici jednotkové: E{xx T } = I. Tato transformace je vždy možná a může být provedena klasickou PCA (analýza hlavních 14
16 komponent - Principal Component Analysis), která navíc dokáže redukovat nadbytečnou dimenzi na dimenzi odpovídající nezávislým komponentám. To je také efekt potlačení šumu. Transformace se dá napsat jako x B (k) = Bx(k) (1.11) kde x B (k) označuje vybělený vektor a B představuje tzv. bělící matici rozměru N M, pro kterou platí BB T = I. Pro výpočet bělící matice lze použít metodu SVD (Singular Value Decomposition) a pomocí vlastních vektorů a vlastních čísel korelační matice vektorů směsí navrhnout bělící matici Adaptační algoritmus ICA Nejčastější řešení používá statistiky 4. řádu. Špičatost definovaná pro náhodnou centrovanou proměnnou v je kurt(v) = E{v 4 } 3(E{v 2 }) 2 (1.12) Pro gaussovsé náhodné proměnné je špičatost rovna nule. Pro dvě nezávislé náhodné proměnné v 1, v 2 a pro skalární hodnotu c platí kurt(v 1 + v 2 ) = kurt(v 1 ) + kurt(v 2 ) a kurt(cv 1 ) = c 4 kurt(v 1 ). Pokud zkusíme najít lineární kombinaci bělených dat x, tedy w T x a její maximální nebo minimální špičatost a pokud položíme w = 1, tak při použití ortogonální směšující matice A a definici z = A T w dostáváme n kurt(w T x) = kurt(w T As) = kurt(z T s) = zi 4 kurt(s i ) (1.13) i=1 pod podmínkou že w = z = 1, funkce (1.13) má řadu lokálních minim a maxim. Pro zjednodušení předpokládejme, že směs obsahuje nanejvýš jednu kompnentu s pozitivní špičatostí a jednu s negativní špičatostí. Potom extrémy v rovnici(1.13) tvoří vektory, jejichž componenty jsou nulové kromě jedné komponenty rovné ±1. Odpovídající váhové vektory jsou w = Az = Ae j = a j, tj. sloupce ortogonální směšující matice A. Tedy minimalizací nebo maximalizací špičatosti v rovnici (1.13) pod daným omezením jsou sloupce směšující matice jako řešení pro w a samotná lineární kombinace bude řešení k nalezení jedné z nezávislých komponent:w T x = a T i x = s i. Ke skutečné minimalizaci nebo maximalizaci funkce (1.13) může být použit gradientní algoritmus založený na neuronové síti. Potom w je interpretován jako váhový vektor neuronu se vstupním vektorem x. Objektivní funkce může být zjednodušená, protože platí, že vstupní data jsou běleny. Platí tedy kurt(w T x) = E{(w T x) 4 } 3[E{(w T x) 2 }] 2 = E{(w T x) 4 } 3 w 4 (1.14) úpravou vztahu je finální objektivní funkce J(w) = E{(w T x) 4 } 3 w 4 +F (3 w 2 ) (1.15) 15
17 Označíme-li x(k) jako pozorovací data, µ(k) jako učební rychlostní sekvenci a f derivaci F/2, potom online učební algoritmus má formu w(k+1) = w(k)±[x(k)(w T (k)x(k)) 3 3 w(k) 2 w(k)+f( w(k) 2 )w(k)](1.16) Konvergence algoritmu závisí na dobré volbě učební rychlostní sekvence µ(k). Při špatné volbě nemusí algoritmus vůbec konvergovat. Proto byly hledány algoritmy, které by učení radikálně zrychlily. Jako vhodná alternativa se ukázal být algoritmus fastica (Fast Fixed-Point Algorithm), pro který platí E{(w T x) 3 } 3 w 2 w + f( w 2 )w = 0 (1.17) Pokud napíšeme vztah (1.17) ve formě w = scalar (E{(w T x) 3 } 3 w 2 w) (1.18) získáme velmi rychlý iterační algoritmus. Pokud máme tedy bělený vektor w, který je podle schématu BSS směsí nezávislých zdrojových signálů, pak derivací vztahu (1.18) získáme následující fastica Fixed-Point Algoritmus pro odhad jedné nezávislé komponenty 1. Zvolíme náhodný inicializační vektor w(0) normy Položíme w(k) = E{x(w T (k 1)x) 3 } 3w(k 1). Délka vektorů w i musí být dostatečná (alespoň 1000 bodů). 3. Podělíme w(k) jeho normou. 4. Pokud se výraz w T (k) w(k 1) neblíží k jedné, tak k = k + 1, v opačném případě je výstupem w(k) Získaný vektor w(k) separuje jeden negaussovský zdrojový signál y(k) = w T (k)x(k). Pro odhad n nezávislých komponent opakujeme tento algoritmus n krát. Abychom zajistili, že odhadujeme pokaždé jinou nezávislou komponentu, zavedeme do smyčky jednoduchou ortogonální projekci w(k) = w(k) A p A T p w(k) (1.19) což bude výchozí hodnota w(k) pro výpočet jednotlivých komponent. Matice A p je matice, jejíž sloupce byly odhadnuty v předchozím cyklu. 16
18 1.3 Časově-kmitočtová analýza Představení metody Tato metoda představuje úplně jiný přístup k problematice BSS než Analýza nezávislých komponent, protože dokáže narozdíl od klasické ICA separovat i závislé signály. Podmínkou této metody je, že musí existovat nějaká místa v kmitočtovém spektru, kde působí pouze jeden zdroj, což je často splněno u řečových či hudebních signálů. Daný algoritmus TIFROM (časově-frekvenčí poměr směsí - Time-Frequency Ratio Of Mixtures) byl představen v [5] a přímo odhaduje separační matici z časověkmitočtových reprezentací směsí. Algoritmus dosahuje velmi dobrých výsledků a může být použit např. tam, kde klasické metody ICA selhávají. Základní model odpovídá opět modelu BSS. Máme M signálů směsí x(k) = [x 1 (k), x 2 (k),..., x M (k)] T, které jsou lineární kombinací N zdrojových signálů s(k) = [s 1 (k), s 2 (k),..., s N (k)] T. Matice A představuje směšující matici. Prozatím uvažujeme pouze lineární okamžité směsi, takže matice A je skalární matice. Platí tedy x(k) = As(k) (1.20) Princip algoritmu TIFROM Pokud pro matici A a její prvky, které jsou nenulové, platí A = a 11 a 12 a 21 a 22 (1.21) pak pro dvě lineární přímé směsi x 1 (k), x 2 (k) a dvou zdrojových signálů s 1 (k), s 2 (k) platí x 1 (k) = a 11 s 1 (k) + a 12 s 2 (k) x 2 (k) = a 21 s 1 (k) + a 22 s 2 (k) (1.22) Hledáme tedy inverzní matici k směšující matici A. Pro jednoduchost neuvažujeme permutační a diagonální matici. Pomocí výrazů c 1 = a 11 a 21 c 2 = a 12 a 22 (1.23) můžeme inverzní matici k matici separační vyjádřit následovně A 1 = c 1 1 c 2 pro separované signály y 1 (k), y 2 (k) pak platí (1.24) y 1 (k) = x 1 (k) c 1 x 2 (k) y 2 (k) = x 1 (k) c 2 x 2 (k) (1.25) 17
19 Algoritmus TIFROM je založen na jednoduchém a účinném způsobu odhadu c 1 a c 2 z časově-frekvenční oblasti získaných směsí signálu. Nejprve určíme STFT (krátkodobá Fourierova transformace - Short Time Fourier Transform) pro směsi získaných signálů a označíme je jako X i (n, ω). Musí být splněny následující podmínky 1. Prvky směšující matice musí být různé do nuly. 2. Pro každý zdroj s i existuje takové TF (časově-kmitočtové) okno (n j, ω k ), kde působí pouze jeden zdroj a proto S l (n j, ω k ) S i (n j, ω k ) pro každé l j Jádrem algoritmu TIFROM je následující komplexní poměr α(n j, ω k ) = X 1(n j, ω k ) X 2 (n j, ω k ) (1.26) který se počítá pro každé časově-frekvenční okno. Linearita STFT vede k následujícímu vztahu α(n j, ω k ) = a 11S 1 (n j, ω k ) + a 12 S 2 (n j, ω k ) a 21 S 1 (n j, ω k ) + a 22 S 2 (n j, ω k ) (1.27) Proto pokud se v určitém časově-kmitočtovém okně (n j, ω k ) vyskytuje pouze jeden zdroj, tak je ze vztahu (1.27) jasné, že komplexní poměr α(n j, ω k ) představuje reálné číslo odpovídající koeficientu c 1 nebo c 2. Ve skutečnosti existuje vždy malé množství šumu místo chybějícího zdroje, proto X 2 (n j, ω k ) je různé od nuly a komplexní poměr α(n j, ω k ) je vždy definován, pro každé j a k. V opačné případě, pokud několik různých zdrojů okupuje určitou sadu časověkmitočtových oken, tak rozptyl komplexního poměru α(n j, ω k ) nejsou stejné hodnoty v těchto oknech. Proto je žádoucí sledovat pro každou frekvenci ω k vzorek rozptylu komplexního poměru pro sadu T q vzorků a pro příslušný počet krátkých časových oken, označme W, s překryvem 50 %. Pro definici rozptylu můžeme uvést var[α](t q, ω k ) = 1 W W α(n j, ω k ) α(t q, ω k ) 2 (1.28) j=1 kde střední hodnota rozptylu v okně je definována jako α(t q, ω k ) = 1 W W α(n j, ω k ) (1.29) j=1 Pokud tedy například S 2 (n j, ω k ) = 0 pro těchto W oken, potom α(n j, ω k ) je konstanta a rozptyl var[α](t q, ω k ) je roven nule. A naopak pokud je S 2 (n j, ω k ) a S 2 (n j, ω k ) různo od nuly, pak také rozptyl var[α](t q, ω k ) není roven nule. V praktických situacích rozptyl nulový nikdy nebude, snažíme se proto najít co nejmenší hodnotu rozptylu ze všech sérií oken (T q, ω k ). Pak můžeme přesně určit časově-frekvenční 18
20 oblast, kde působí pouze jeden zdroj. Odpovídající hodnota koeficientu c i je dána střední hodnotou α(t q, ω k ). Pro hledání dalších hodnot koeficientů c i hledáme další nejmenší hodnotu rozptylu α(t q, ω k ) a z ní analogicky určíme druhý koeficient. Pokud se separační koeficienty liší o určitou minimální hodnotu, je možno určit obě komponenty zároveň. Určíme, pro jakou minimální hodnotu rozptylu α(t q, ω k ) má být zaznamenáván komplexní poměr a po projítí celého algoritmu máme v proměnné komplexního poměru uložené hodnoty. Ty například pro dva separované signály by měly oscilovat okolo koeficientů c 1 a c 2. Právě tímto způsobem byly hledány koeficienty v této práci. V následujícím obrázku je ukázán princip celého algoritmu. Obr. 1.2: Schéma agoritmu TIFROM. 19
21 2 PROBLEMATIKA SLEPÉ DEKONVOLUCE 2.1 Úvod do BSD BSD (vícekanálová dekonvoluce naslepo - Blind Source Deconvolution) je definována obdobně jako BSS, rozdílný je však směšující model. Opět máme neznámé prostředí, jímž se šíří neznámé zdrojové signály, jejichž směsi jsou snímány více mikrofony. Směšující prostředí je však mnohem nepříznivější, než tomu bylo u okamžitých směsí. Zvukové vlny dopadající na senzory jsou v tomto případě zpožděné a zeslabené odrazem od stěn či podlahy místnosti. Ve skutečnosti každý mikrofon přijme filtrované verze různých signálů, proto je tenhle model nazýván konvoluční. S touto problematikou souvisí pojem cocktail-party problém. Je to názorný příklad konvolučních směsí, kdy se při oslavě v jedné místnosti baví více lidí a za zvuku mobilních telefonů a hudby jsou polem mikrofonů zaznamenány skutečné konvoluční směsi. Úkolem BSD je proto provést inverzní filtraci odezvy místnosti na jednotkový impuls původního zdrojového signálu, který však není znám. Řešení tohoto problému je poměrně náročné, ale je nutné pro použití v reálném prostředí, kde algoritmy okamžité ICA selhávají Základní model BSD V problému slepé dekonvoluce je získaný senzorový signál x(k) generován ze zdrojového signálu s(k) tímto konvolučním modelem x(k) = p= a k s(k p) (2.1) Zdrojový signál s(k) i konvoluční koeficienty a k jsou neznámé. Získáme pouze x(k) a pro nalezení s(k) potřebujeme znát dekonvoluční filtr h k takový, aby platilo y(k) = p= h k x(k p) (2.2) Blokové schéma BSD naslepo je úplně stejné jako blokové schéma BSS na obr.1.1 s tím rozdílem, že prvky směšující i separační matice rozměru N M nepředstavují teď reálná čísla, ale filtry délky P. V praxi se používají filtry konečné délky a to konkrétně filtry typu FIR s konečnou impulsní odezvou. Pokud budeme tedy brát v potaz filtry typu FIR, můžeme směšující model BSD vyjádřit rovnicemi následovně x i (k) = N P 1 j=1 p=0 a ijk s j (k p) (2.3) 20
22 Každý FIR filtr pro pevné indexy i, j je definován koeficienty a ijk. Iverzní problém je ze získaných konvolučních směsí x i (k) určit separační FIR filtry w ijk tak, aby platilo y i (k) = N P 1 j=1 p=0 w ijk x j (k p) (2.4) Výstupní signály y i (k) jsou odhady zdrojových signálů s i (k). Délka filtrů P se volí obvykle stovky až tisíce. Základní metody řešení BSD lze rozdělit nejjednodušeji na dvě skupiny: BSD v časové oblasti BSD v kmitočtové oblasti Do těchto základních oblastí jsou metody rozděleny podle toho, jakým způsobem se získavájí separační matice. Buď jsou iterační algoritmy pro výpočet separační matce počítány v časové nebo kmitočtové oblasti. V časové oblasti je ICA přímo aplikována na konvoluční směšující model. Řešení není však jednoduché jak u okamžitých směsí, je mnohem výpočtově náročnější, protože používá dlouhé FIR filtry a obsahuje operace konvoluce. V kmitočtové oblasti se operace konvoluce změní na násobení, jde tak už jen o klasický problém okamžité ICA. Je však nutno použít pro výpočet modifikovaný algoritmus ICA, kde se počítá komlexními čísly. Algoritmus je však mnohem jednodušší než v časové oblasti, počítá se komplexní ICA v každém kmitočtovém pásmu odděleně. Největším problémem této metody jsou permutace a jejich řešení je často složitější než samotná komplexní ICA. V této diplomové práci budou především rozebrány možnosti řešení v kmitočtové oblasti, z metod v časové oblasti budou stručně uvedeny ty nejzákladnější. 2.2 Řešení zkbsd v časové oblasti Bussgangova metoda Tato metoda je jedna z nejstarších, je ale stále velmi používaná. Odhaduje separační matici pomocí algoritmu LMS. V této metodě je používána nekausální struktura FIR filtru délky 2P+1 L y(t) = w k (t)x(t k) (2.5) k= L Znak * značí komplexní konjugaci. Váhy w k (t) filtru závisí na čase t a jsou adaptovány použitím LMS algoritmu následujícím iteračním vzorcem w k (t + 1) = w k (t) + µx(t k)e (t), k = L,..., L (2.6) 21
23 kde kde chybový signál je definován jako e(t) = g(y(t)) y(t) (2.7) V těchto rovnicích µ představuje učící parametr, g(.) je vhodná nonlinearita, která je aplikována separátně na reálnou a imaginární část y(t). Podrobnější popis tohoto algoritmu lze nalázt například v [3] Metoda přirozeného gradientu Tato metoda vznikla rozšířením gradientní metody pro separaci okamžitých směsí. Může být implementována jako on-line použitím dopředných FIR filtrů v časové oblasti. Separační filtry jsou reprezentovány jako sekvence koeficientů matice W k (t) v diskrétním čase t a zpoždění k. Separovaný výstup má pod tímto označení tvar L y(t) = W k (t)x(t k) (2.8) k=0 kde s(t k) je n-rozměrný vektor, obsahující n směsí a y(t) je výstupní vektor odhadů zdrojových signálů. Tenhle maticový zápis umožnuje derivaci separačního algoritmu použitím metody přirozeného gradientu. Výsledná iterační rovnice pro úpravu vah separační matice má pak následující tvar W k (t + 1) = W k (t) g(y(t L))v H (t k), k = 0,..., L (2.9) Každá komponenta vektoru g aplikuje nelinearitu g i (.) příslušnému argumentu. Optimální nelinearita g i (.) je funkce g i = p i /p i distribuce p i zdroje s i. V iterační rovnici představuje v(t) převrácenně filtrovaný výstup, vypočítaný použitím posledních L vzorků nazpět od aktuálního vzorku L v(t) = WL q(t)y(t H q) (2.10) q=0 Vektor v musí být uložen pro posledních L vzorků, aby bylo možné spočítat updatované váhy separační matice W k (t). Algoritmus má velké požadavky na výpočrtní náročnost a na obsah paměti. Více informací lze nalézt například v [3]. 2.3 Řešení BSD v kmitočtové oblasti Jak bylo zmíněno výše, v kmitočtové oblasti je problém konvolučních směsí převeden na problém okamžitých směsí v každém rozdílném subpásmu. Tohle zjednodušení má 22
24 velký význam v reálných aplikacích, kde řešení v časové oblasti není možné použít pro příliš vysokou výpočetní náročnost a tím i výpočetní čas. Pokud aplikujeme Fourierovu transformaci na vztah (2.4), dostaneme následující rovnici N X i (ω) = X ij (ω)s i (ω), i = 1,..., N (2.11) j=1 kde X i (ω), S i (ω), a A ij (ω) jsou Fourierovy transformace x i (t), s i (t) a a ij (t). Pro převod do kmitočtové oblasti se používá STFT (krátkodobá Fourierova transformace - Short Time Fourier Transform). Znamená to, že signály jsou před transformací vynásobeny s vhodným oknem stejné délky jako je délka FFT. Jednotlivé segmenty (rámce) se ještě navíc překrývají. Poté je na každý segment aplikována FFT. Samotná komplexní ICA je pak prováděna pro různé kmitočty zvlášť. Hlavním problémem zpracování v kmitočtové oblasti je permutační problém. Dochází k němu na úrovni separační matice, ve které permutují řádky pro separaci jednotlivých složek. Jelikož se tak děje pro každé kmitočtové pásmo, tak výsledná separační matice pro celé spektrum je permutovaná a výsledkem separace je další směs signálů Algoritmus výpočtu komplexní ICA Při řešení BSD v kmitočtové oblasti se pracuje obecně s komplexními čísly. Nedá se tedy použít fastica algoritmus jako u okamžitých směsí. Existuje však jeho modifikace pro komplexní proměnné. Jeho kompletní odvození je možno nalézt v [6]. Algoritmus pracuje obdobně jako jeho verze pro okamžité směsi. Samozřejmé je opět předzpracování vstupních signálů bělením a centrováním. Základním principem tohoto algoritmu je hledání extrémů rozdílové funkce, která je dána jako J G (w) = E{G w H x 2 } (2.12) kde w je n-rozměrný komplexní vektor, pro který platí E{ w H x 2 } = 1. G je použitá příslušná nelineární funkce. V následujících rovnicích jsou uvedeny příklady funkcí pro komplexní signály. G vždy značí funkci a g její příslušnou první derivaci. Konstanty a 1, a 2 jsou obvykle voleny jako 0.1 popř G 1 (y) = a 1 + y, g 1 (y) = 1 2 a 1 + y G 2 (y) = log a 2 + y, g 2 (y) = 1 a 2 + y (2.13) (2.14) 23
25 G 3 (y) = y2 2, g 3(y) = y (2.15) Rozdílová funkce může mít M lokálních nebo globálních optimálních řešení w i (ω), i = 1, 2,..., M pro každý zdroj. Učení každého w pod podmínkou E{ w H x 2 } = 1 se nazývá maximalizace rozdílové funkce. Maxima funkce J G (w) mohou být nalezeny řešením Lagrangeovy funkce pro hledání extrémů L(w, w H, λ). Po dosazení tedy L(w, w H, λ) = E{G w H x 2 } + λ{e{w H x} 1} (2.16) kde λ je Lagrangeův multiplikátor. K nalezení maxima rozdílové funkce musejí být splněny následující rovnice L w = 0, L w H = 0, které získáme z rovnice (2.12) následovně L λ = 0 (2.17) L w = E{g( wh x 2 )w H } + λw H = 0 (2.18) L w H = E{g( wh x 2 )x H w} + λw = 0 (2.19) L λ = w 2 1 = 0 (2.20) Výsledný iterační vztah používající Newtonovu iterační metodu je potom w new = w(e{g( w H x 2 )+( w H x 2 )g ( w H x 2 )}) E{g( w H x 2 )(x H w)x}(2.21) Kritérium pro zastavení iterační smyčky je definováno jako δ = ( w nove w ) 2. Jde o velmi malé číslo a jeho nastavením vlastně regulujeme počet iteračních kroků. Po každé itaraci také provedeme normování w new = w new w new (2.22) Tímhle způsobem odhadujeme složku po složce jednotlivé řádky separační matice. Aby se zabránilo konvergování rozdílných neuronů ke stejnému maximu, je třeba provést vždy po každé iteraci dekorelaci. Dejme tomu, že máme vypočítáno p separačních vektorů a právě počítáme separační vektor w p+1. Potom je nutné po každém iteračním kroku w p+1 provést dekorelaci a normalizaci následujícím způsobem p w p+1 = w p+1 w j wj H w p+1 (2.23) j=1 w p+1 = w p+1 w p+1 (2.24) 24
26 2.3.2 Algoritmus FDICA Algoritmus FDICA (analýza nezávislých komponent v kmitočtové oblasti - Frequency Domain Independent Component Analysis) je založen na TFSS ( časově-kmitočtové rámce řeči - Time-Frequency Series of Speech) senzorových signálů, generovaných pomocí STFT. Princip je následující. Nejprve se celý usek zpracovávaného signálu x(n) rozdělí na segmenty (rámce) s určitým definovaným překryvem. Na jednotlivé rámce se pak aplikuje okénková funkce h(n) a následně se podrobí FFT. Poté jsou složky o stejných kmitočtech v jednotlivých spektrech překrývajících se rámců poskládány do jednoho časově-kmitočtového rámce neboli TFSS. Na takto vytvořené rámce je pak aplikován komplexní ICA algoritmus. Každý rámec obsahuje tedy pouze složky o stejných kmitočtech, odhad výstupních signálů je tedy také pouze pro určité kmitočty. Celý algoritmus naznačuje obr Obr. 2.1: Proces generování TFSS. 25
27 Takto připravené vstupní signály mohou být podrobeny algoritmu FDICA. Jeho princip je představen na obrázku.2.2. Časově-kmitočtové segmenty jsou nejprve běleny pomocí metod PCA, viz 2.3. Následně je počítána komplexní ICA a jsou odstraněny permutace a problém s měřítkem. Vstupní signál je filtrován v kmitočtové oblasti a výsledné separované signály jsou vytvořeny metodou overlap-add. Použití komplexního ICA algoritmu zajištuje rychlou konvergenci, rychlejší jako je např. metoda Přirozeného gradientu a to se stejnou separační kvalitou. Obr. 2.2: Algoritmus FDICA Permutační problém v kmitočtové oblasti a jeho řešení Jak již bylo naznačeno dříve, řešení v kmitočtové oblasti je zatíženo permutačním problémem. Pokud budeme předpokládat dvoukanálový model separace, kde jsou počty zdrojů a senzorů rovny M = K = 2, můžeme proces separace vyjádřit následující maticí S 1(f, t) S 2 (f, t) = W 11(f) W 21 (f) W 12 (f) W 22 (f) X 1(f, t) X 2 (f, t) (2.25) kde S 1 (f, t) a S 2 (f, t) představují TFSS separovaných signálů. Jednotlivé řádky separační matice W(f) tak separují jednotlivé nezávislé komponenty. Permutační problém představuje prohození těchto řádků separační matice na určitých kmitočtech. Takovouto sparací získáme tedy opět pouze směsi signálů. Abychom vyřešili tento problém, musíme zajistit, aby na každém kmitočtu bylo pořadí řádků separační matice stejné a odpovídalo konkrétním nezávislým komponentám. Dalším, ale už méně podstatným problémem spojeným s řešením v kmitočtové oblasti, je problém měřítka. Je to obdoba problému u okamžitých směsí, kdy nebylo možné 26
28 Obr. 2.3: Paralelogramy procesu bělení, smíšení a separace. separovat signály s původní energií. Řešením těchto dovu problémů se zabýva řada metod, z nichž nejznámější je metoda DP ( směrové diagramy - Directivity Pattern). Hlavní myšlenkou této metody je analýza DP pomocí DOA (směr příchodu signálů - Direction of Arrival ). Jelikož jde o slepou dekonvoluci, nemáme tedy žádné informace o prostředí, tedy ani o směru příchodů jednotlivých signálů. Směrové diagramy linearního pole mikrofonů můžou být však určeny pomocí separační matice W(f) následovně M F R (f, θ) = W Rk (f) exp(j2πd k sin(θ)/c) (2.26) k=1 kde R je pořadí separované komponenty, c je rychlost šíření zvuku a d k jsou vzdálenosti senzorů. Jsou-li vypočítány tyto směrové diagramy, dále pokračujeme následovně (pro názornost uvažujeme M = K = 2) 27
29 1. Vypočítáme absolutní hodnoty směrových diagramů na všech frekvencích a zobrazíme je do grafu. Na obrázkuo 2.4 jsou zobrazeny směrové diagramy pro frekvence f 1 a f V zobrazených grafech jsou vidět lokální minima a maxima, odpovídající směru příchodu jednotlivých zdrojů. Tyto se můžo vyskytovat pouze ve dvou partikulárních řešeních. Vypočítáme statisticky směr příchodů jednotlivých zdrojů pro všechny frekvence ˆθ R = 2 L L/2 p=1 θ R (f p ) (2.27) kde L je délka FFT a θ R (f p ) předstvuje směr příchodu R-tého zdroje na p-té frekvenci. 3. V návaznosti na vypočítané směry příchodu zdrojů pro všechny frekvence přehazujeme řádky separační matice. 4. Po vyřešení permutací je ještě potřeba přizpůsobit měřítko pro každou frekvenci. Zesílení ve směru příchodu R-tého zdroje na p-té frekvenci je rovno β R (f p ) = 1 F R (f p, ˆθ R ) (2.28) kde ˆθ R je odhadovaný směr příchodu R-tého zdroje. Matice ve správném měřítku má potom tvar W(f p ) = β 1(f p ) 0 0 β 2 (f p ) W 11(f p ) W 12 (f p ) W 21 (f p ) W 22 (f p ) (2.29) Beamforming a jeho použití Pro určení DOA se používá řada metod, z nichž nejpoužívanější jsou beamformery (z ang. beamforming - tvarování paprsku). Jsou založeny na principu filtrace v prostoru, tj. vybírají signály přicházející na senzorové pole z určitých směrů. Jde v podstatě o směrovou detekci, která se provádí formováním diskrétního počtu paprsků obvykle rovnému počtu elementů v poli senzorů. Cílem metod tvarování příjmací charakterisiky je měnit váhy w i i = 1, 2,..., M jednotlivých senzorů pro dosažení co nejlepší směrové charakterisitky v daném směru. Zároveň by měly být potlačeny paprsky z nežádoucích směrů. Mezi základní tvarovače (beamformery) patří tvarovač delay-and-sum. Jedná se o základní strukturu, ze které jsou odvozeny další složitější 28
30 Obr. 2.4: Příklad směrových diagramů. struktury, například adaptivní verze. Pro základní beamformer delay-and-sum platí následující rovnice M y(k) = w i x i (k) (2.30) i=1 kde x i (k) je vstupní signál příslušného kanálu a w i jsou váhy na vstupu beamformeru. Tento tvarovač se chová jako filtr s konečnou délkou impulsní odezvy se vzorkovací frekvencí závislou na úhlu dopadu testovaného signálu. Jeho vlastnosti plynou z jeho jednoduché struktury. Přednost spočívá v nezávislosti jeho parametrů na pracovních podmínkách a především na typu vstupního signálu. Nevýhodou je malé zvýraznění vstupního signálu závislé na počtu mikrofonů. Vzdálenost mikrofonů hraje v tomto případě důležitou roli. Ovlivňuje frekvenční rozsah zpracovávaného signálu, tvar směrové charakteristiky a její frekvenční závislost. Při velké vzdálenosti hrozí vznik prostorového aliasingu. Pole mikrofonů lze považovat za systém, který prostorově vzorkuje příchozí signál. Existuje určitý vzorkovací teorém, který musí být dodržen, situace je analogická ke vzorkování frekvenčnímu. Musí tedy platit D ij < λ min 2 (2.31) kde D ij představuje vzdálenost mezi dvěma mikrofony a λ je vlnová delka zpracovávaného signálu. Maximální frekvence, kterou je možno zpracovat systémem, 29
31 je tedy rovna f max = 1/λ min a je určena vzdáleností mezi mikrofony. Pokud není dodržen vzorkovací teorém, dochází k aliasingu, při němž systém přestává vybírat paprsky z daných směrů a chová se všesměrově. Kmitočtová charakteristika pak obsahuje další laloky na vyšších frekvencích. Možnosti použití beamformingu v kombinaci s algoritmem FDICA jsou následující. Lze vypočítat alternativní separační matici pro každý kmitočet algoritmu FDICA a použít ji v případech, kdy stávající separační matice vypočtená algoritmem FDICA nám nějakým způsobem nevyhovuje. Většinou jde o případ, kdy na daném kmitočtu nejsme schopni vyřešit permutační problém pomocí DP. Dají se ale použít stávající informace DOA z frekvencí, kde permutace vyřešeny byly. Máme li tedy odhady směru příchodu ˆθ 1 a ˆθ 2, lze vypočíst jeden řádek separační matice korespondující k jednomu zdroji splněním těchto rovnic (ˆθ 1 je směr signálu a ˆθ 2 je směr nul) F 1 (f, ˆθ 2 1 ) = W 1k (f) exp(j2πfd k sin(ˆθ 1 )/c) = 1 (2.32) k=1 F 1 (f, ˆθ 2 2 ) = W 1k (f) exp(j2πfd k sin(ˆθ 2 )/c) = 0 (2.33) k=1 Řešení splňují následující vztahy pro jeden řádek separační matice W 1k (f). V následujících rovnicích budou označeny pomocné proměnné jako E 1 až E 6 E 1 = exp( j2πfd 1 sin(ˆθ 2 )/c) (2.34) E 2 = exp(j2πfd 1 sin(ˆθ 1 ˆθ 2 )/c) (2.35) E 3 = exp(j2πfd 2 sin(ˆθ 1 ˆθ 2 )/c) (2.36) W 11 (f) = E 1 (E 2 + E 3 ) 1 (2.37) E 4 = exp( j2πfd 2 sin(ˆθ 2 )/c) (2.38) E 5 = exp(j2πfd 1 sin(ˆθ 1 ˆθ 2 )/c) (2.39) E 6 = exp(j2πfd 2 sin(ˆθ 1 ˆθ 2 )/c) (2.40) W 12 (f) = E 4 (E 5 + E 6 ) 1 (2.41) Analogicky můžeme vypočítat druhý řádek separační matice korespondující k dalšímu zdroji splněním těchto rovnic (ˆθ 1 je směr nul a ˆθ 2 je směr signálu) F 2 (f, ˆθ 2 2 ) = W 2k (f) exp(j2πfd k sin(ˆθ 2 )/c) = 1 (2.42) k=1 30
32 F 2 (f, ˆθ 2 1 ) = W 2k (f) exp(j2πfd k sin(ˆθ 1 )/c) = 0 (2.43) k=1 Řešení splňují následující vztahy pro jeden řádek separační matice W 2k (f). V následujících rovnicích budou označeny pomocné proměnné jako E 7 až E 12 E 7 = exp( j2πfd 1 sin(ˆθ 1 )/c) (2.44) E 8 = exp(j2πfd 1 sin(ˆθ 2 ˆθ 1 )/c) (2.45) E 9 = exp(j2πfd 2 sin(ˆθ 2 ˆθ 1 )/c) (2.46) W 21 (f) = E 7 (E 8 E 9 ) 1 (2.47) E 10 = exp( j2πfd 2 sin(ˆθ 1 )/c) (2.48) E 11 = exp(j2πfd 1 sin(ˆθ 2 ˆθ 1 )/c) (2.49) E 12 = exp(j2πfd 2 sin(ˆθ 2 ˆθ 1 )/c) (2.50) W 22 (f) = E 10 (E 11 E 12 ) 1 (2.51) Výsledná separační matice na daném kmitočtu má tedy tvar W(f) = W 11(f) W 12 (f) W 21 (f) W 22 (f) (2.52) 31
33 3 PŘEHLED DOSAŽENÝCH VÝSLEDKŮ 3.1 Algoritmy okamžitých směsí Algoritmus fastica pro směs dvou řečových signálů Algoritmus fastica (Fast Fixed-Point Algorithm) byl naimplementován v Matlabu a testován pro dva řečové signály stejného mluvčího. Řečové signály byl pořízeny s vzorkovací frekvencí f vz = 8000 Hz. Délka obou signálů byla okolo 1,3 sekundy, tj vzorků. Použitá směšující matice byla ve tvaru A = (3.1) Počet iteračních kroků byl 6 a lze jej ovlivinit např. volbou počáteční matice. Získané signály byly pro korektní zobrazení upraveny z hlediska pořadí a měřítka. Ve skutečnosti mají po separaci různou energii a pořadí, což je základní vlastnost fastica algoritmu (permutační a diagonální matice). Výsledné signály je vidět na obr.3.1. Uvedené zdrojové, senzorové i separované signály jsou uvedeny v příloze spolu se skriptem algoritmu Algoritmus fastica pro směs řečového signálu a šumu Algoritmus byl testován i pro směs signálu a bílého šumu pro velmi nepříznivý případ SNR = 5 db. Počáteční směšující matice byla stejná jako v předchozím případě. Výsledkem byl separovaný řečový signál, který je na obr. 3.2 s odstupem signálu od šumu SNR = 32 db pro 5 iteračních kroků. Výsledný separovaný řečový signál byl opět závislý na počtu iteračních kroků a na volbě počáteční matice Algoritmus TIFROM pro směs dvou řečových signálů Algoritmus byl testován v Matlabu opět pro dva řečové signály, tentokrát pro mužský a ženský hlas. Řečové signály byl pořízeny s vzorkovací frekvencí f vz = 8000 Hz. Počet vzorků obou signálů byl , což odpovídá délce při daném vzorkovacím kmitočtu 2,56 sekund. Použitá směšující matice byla ve tvaru A = (3.2) Pro krátkodobou Fourierovu transformaci bylo použito Hannovo okno, překryv vzorků byl 50 %. Délka FFT byla volena 256 vzorků. V následující tabulce jsou uvedeny teoretické hodnoty koeficientů c 1 a c 2 a hodnoty vypočtené algoritmem. 32
34 Obr. 3.1: Ukázka separace řečových signálů algoritmem fastica. Zobrazeny jsou po řadě dva zdrojové signály s i (k), dva senzorové signály x i (k) a nakonec dva separované signály y i (k). 33
35 Obr. 3.2: Ukázka separace řečových signálu a bílého šumu algoritmem fastica. Zobrazeny jsou po řadě dva zdrojové signály s i (k), dva senzorové signály x i (k) a nakonec separovaný řečový signál y 1 (k). hodnoty c 1 c 2 teoretické 1,25 0,9 vypočtené 1,
36 Tab.3.1: Porovnání teoretických a vypočtených koeficientů Výsledky celé separace jsou zobrazeny na obr Algoritmus TIFROM pro směs řečového signálů a šumu I pomocí tohoto algoritmu jsem se pokusil separovat řečový signál ve směsi s bílým šumem. I když podstata algoritmu neodpovídá tomuto problému, jelikož bílý šum má rovné výkonové spektrum a neobsahuje taková časově-kmitočtová pásma, kde by nepůsobil, řečový signál toto splňuje a proto bylo možno tento algoritmus použít. Řečový signál byl použit z předchozího algoritmu se všemi jeho parametry. Ze směsi signálu a šumu se SNR = 10 db se podařilo vyseparovat řečový signál se SNR okolo 60 db, což je velmi solidní výsledek. Situace je zobrazena na obr.3.4. Uvedené zdrojové, senzorové i separované signály a skripty algoritmů z programu Matlab pro všechny metody se šumem i bez šumu jsou uvedeny v příloze tohoto dokumentu. 3.2 Algoritmy konvolučních směsí Algoritmus komplexní ICA Pro ověření funkčnosti tohoto algoritmu byly použity řečové signály promluvy muže a ženy vzorkované frekvencí f vz = 8000 Hz. Jde tedy opět o případ M = N = 2. Délka obou signálů byla okolo 1,3 sekundy, tj vzorků. Separační matice je v tomto případě komplexního charakteru. Bylo proto nutné upravit předcházející algoritmus pro okamžité směsi a rozšířit ho i na signály komplexní. Princip komplexního algoritmu byl vysvětlen v kap Jako směšující matice byla vygenerována následující náhodná matice (po zaokrouhlení na dvě místa). A = i i (3.3) i i Pro zobrazení byly vybrány signály z několika realizací. Tento algoritmus je inicializován náhodnými vektory, proto se počet iterací i pro stejnou směšující matici může měnit. Tento počet se pohyboval v rozmezí iterací při hodnotě konstanty a 2 = 0.1. Na obrázku 3.5 jsou vidět výsledné separované signály. Pro názornost byly ponechány přesně tak, jaký byl výstup algoritmu. Je z nich patrné, že stejně jak u reálných směsí, i tady nelze určit pořadí a zesílení jednotlivých separovaných signálů. V tomto případě to však ani moc nevadí. Horší situace nastane u algoritmu FDICA, 35
37 Obr. 3.3: Ukázka separace řečových signálů algoritmem TIFROM. Zobrazeny jsou po řadě dva zdrojové signály s i (k), dva senzorové signály x i (k) a nakonec dva separované signály y i (k). 36
38 Obr. 3.4: Ukázka separace řečových signálu a bílého šumu algoritmem TIFROM. Zobrazeny jsou po řadě dva zdrojové signály s i (k), dva senzorové signály x i (k) a nakonec separovaný řečový signál y 1 (k). kde jsou přehozeny separované signály, ale na různých kmitočtech. Tento problém bude řešen v následující kapitole. Byly také vypočítány spektrogramy všech signálů v algoritmu pomocí klouzavého spektra a délky FFT 256 vzorků. Spektrogramy jsou zobrazeny na obr Z časové i z časově-kmitičtové oblasti je zřejmé, že separace byla velmi úspěšná. 37
39 Obr. 3.5: Ukázka separace řečových signálu komplexním ICA algoritmem. Zobrazeny jsou po řadě dva zdrojové signály s i (k), dva senzorové signály x i (k) a nakonec dva separované signály y i (k). 38
40 Obr. 3.6: Ukázka spektrogramu separace řečových signálu komplexním ICA algoritmem. Zobrazeny jsou po řadě dva zdrojové signály S i (f), dva senzorové signály X i (f) a nakonec dva separované signály Y i (f) Algoritmus FDICA Algoritmus byl testován pro dva typy různých směsí a pro M = N = 2. Směsi dvou mužských promluv a směsi hudebního signálu a mužské promluvy byly pořízeny v bezodrazové komoře pří vzdálenosti senzorů 4 cm. Byl tak dodržen vzorkovací teorém prostorového aliasingu. Nahrávky byly vzorkovány frekvencí f vz = 8000 Hz a jejich délka byla 4 sekundy. Byl použit poloviční překryv rámců s délkou stejnou, jako je délka FFT, tedy 512 vzorků. Rámce byly vynásobeny Hammingovým oknem. Na obrázku 3.7 jsou zobrazeny příklady DP a jejich permutací. Jsou také zobrazeny pro ilustraci DP vypočtené pomocí beamformingu. Výsledky v časové oblasti pro dvě mužské promluvy (obr. 3.8) a pro mužskou promluvu a hudební signál (obr. 3.9) vykazují značné zlepšení od původních směsí, ve srovnání s předchozími metodami však toto zlepšení není tak velké. Je to způsobeno predevším řešením permutačního problému, kdy na nižších frekvencích nejsme 39
41 Obr. 3.7: Ukázka permutovaných a upravených DP a DP vypočtených metodou beamforming schopni odhadnout, zda došlo k permutacím či nikoli. Na těchto frekvencích jsou proto použity uměle vytvořené separační matice metodou beamforming, DOA je zde odhadnutá statisticky. Při odhadu se používají DP na kmitočtech, kde lze odhadnout směr zdrojů. Spektrogram separace hudebního a řečového signálu je uveden na obr
42 Obr. 3.8: Ukázka separace řečových signálů algoritmem FDICA. Zobrazeny jsou po řadě dva zdrojové signály s i (k), dva senzorové signály x i (k) a nakonec dva separované signály y i (k). 41
43 Obr. 3.9: Ukázka separace řečového a hudebního signálu algoritmem FDICA. Zobrazeny jsou po řadě dva zdrojové signály s i (k), dva senzorové signály x i (k) a nakonec dva separované signály y i (k). 42
44 Obr. 3.10: Ukázka spektrogramu separace řečového a hudebního signálu algoritmem FDICA. Zobrazeny jsou po řadě dva zdrojové signály S i (f), dva senzorové signály X i (f) a nakonec dva separované signály Y i (f). 43
45 4 ZÁVĚR V této diplomové práci byla rozebrána problematika separace zdrojů naslepo, tedy problému, jehož cílem je obnovit neznámé signály směsí z neznámého směšujícího prostředí. Ze základních metod okamžitých směsí byly vybrány ICA a metoda TIFROM. Byly uvedeny obecné teoretické poznatky o těchto metodách a byly uvedeny podmínky a omezení, za kterých lze tyto algoritmy použít. Pro obě metody byly vytvořeny skripty v programu Matlab.Tyto metody byly testovány nejprve pro dva řečové signály a také pro směs řečového signálu se šumem. Jako výhodnější se jeví metoda TIFROM, která dokázala separovat téměř dokonale oba případy. Tato metoda také dokázala vyseparovat signál zkreslený šumem se SNR = 10 db na výsledných 60 db, což je velmi dobrý výsledek. Také princip a implementace této metody byl poměrně srozumitelnější a jednodušší. Výsledné zvukové ukázky i implementační skripty z programu Matlab jsou uvedeny v příloze této práce. V případě okamžitých směsí je směšující matice tvořena reálnými čísly a je jednoduše vynásobena s čistými signály. Pro takto uměle vytvořené směsi představují podmínky pro separaci téměř ideální případ, který však v reálném prostředí málokdy nastane. Tato práce se proto také zaměřila na separací konvolučních směsí, který vznikly zpožděním a odrazy zdrojových signálů. Byl rozšířen algoritmus okamžité ICA tak, aby byl schopen separovat i komplexní signály. Algoritmus komplexní ICA byl testován pro uměle vytvořené směsi komplexních signálů a dosahoval velmi uspokojivých výsledků. Tento algoritmus byl pak základem pro řešení BSD v kmitočtové oblasti, konkrétně algoritmu FDICA. Algoritmus byl testován pro reálné nahrávky z prostředí bezodrazové komory. Řešen byl případ se dvěma zdroji a se dvěma výstupními separovanými signály. Účinnost algoritmu byla limitována permutačním problémem, který byl řešen metodami DOA s kombinací beamformingu. Jednotlivé nahrávky po separaci vykazovaly stále zkreslení druhým nežádoucím signálem, avšak v mnohem menší míře než před separací. Pro posouzení kvality separace byly u obou algoritmů zobrazeny časové reprezentace zdrojových, smíšených i separovaných signálů a jejich spektrogramy. V příloze diplomové práce jsou uloženy také veškeré zvukové ukázky daných signálů. Zlepšení výsledků separace by mohlo být dosaženo použitím dalších metod pro řešení permutačního problému, například metody interfrekvenčních korelací, která využívá k řešení permutačního problému podobnost obálek spekter na blízkých kmitočtech. Vhodné by také bylo se dále zaměřit na prostředí degradované šumy a reverberacemi. 44
Ing. Václav Eksler Ústav telekomunikací FEKT VUT v Brně
1 z 10 5.10.2010 9:16 Elektrorevue 2005/29-17.5.2005 Obsah Ing. Václav Eksler eksler@feec.vutbr.cz Ústav telekomunikací FEKT VUT v Brně Problematikou separace zdrojů naslepo nebo také separace signálů
Úvod do zpracování signálů
1 / 25 Úvod do zpracování signálů Karel Horák Rozvrh přednášky: 1. Spojitý a diskrétní signál. 2. Spektrum signálu. 3. Vzorkovací věta. 4. Konvoluce signálů. 5. Korelace signálů. 2 / 25 Úvod do zpracování
3 METODY PRO POTLAČENÍ ŠUMU U ŘE- ČOVÉHO SIGNÁLU
3 METODY PRO POTLAČENÍ ŠUMU U ŘE- ČOVÉHO SIGNÁLU V současné době se pro potlačení šumu u řečového signálu používá mnoho různých metod. Jedná se například o metody spektrálního odečítání, Wienerovy filtrace,
SEPARACE PŘÍMÝCH SMĚSÍ AUDIO SIGNÁLŮ ZALOŽENÁ NA ČASOVĚ-FREKVENČNÍ ANALÝZE
SEPARACE PŘÍMÝCH SMĚSÍ AUDIO SIGNÁLŮ ZALOŽENÁ NA ČASOVĚ-FREKVENČNÍ ANALÝZE Abstrakt Separation of Linear Instantaneous Mixtures of Audio Signals Based on Time-Frequency Analysis + Václav Eksler * Problematikou
SIGNÁLY A SOUSTAVY, SIGNÁLY A SYSTÉMY
SIGNÁLY A SOUSTAVY, SIGNÁLY A SYSTÉMY TEMATICKÉ OKRUHY Signály se spojitým časem Základní signály se spojitým časem (základní spojité signály) Jednotkový skok σ (t), jednotkový impuls (Diracův impuls)
KTE/TEVS - Rychlá Fourierova transformace. Pavel Karban. Katedra teoretické elektrotechniky Fakulta elektrotechnická Západočeská univerzita v Plzni
KTE/TEVS - Rychlá Fourierova transformace Pavel Karban Katedra teoretické elektrotechniky Fakulta elektrotechnická Západočeská univerzita v Plzni 10.11.011 Outline 1 Motivace FT Fourierova transformace
1. Vlastnosti diskretních a číslicových metod zpracování signálů... 15
Úvodní poznámky... 11 1. Vlastnosti diskretních a číslicových metod zpracování signálů... 15 1.1 Základní pojmy... 15 1.2 Aplikační oblasti a etapy zpracování signálů... 17 1.3 Klasifikace diskretních
ADA Semestrální práce. Harmonické modelování signálů
České vysoké učení technické v Praze ADA Semestrální práce Harmonické modelování signálů Jiří Kořínek 31.12.2005 1. Zadání Proveďte rozklad signálu do harmonických komponent (řeč, hudba). Syntetizujte
Přednáška 13 Redukce dimenzionality
Vytěžování Dat Přednáška 13 Redukce dimenzionality Miroslav Čepek Fakulta Elektrotechnická, ČVUT Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti ČVUT (FEL) Redukce dimenzionality 1 /
Zvýrazňování řeči pomocí vícekanálového zpracování
Zvýrazňování řeči pomocí vícekanálového zpracování Václav Bolom, Pavel Sovka Katedra teorie obvodů Fakulta elektrotechnická České vysoké učení technické v Praze Technická 2, 66 27 Praha 6 Abstrakt Problém
VYBRANÉ PARTIE Z NUMERICKÉ MATEMATIKY
VYBRANÉ PARTIE Z NUMERICKÉ MATEMATIKY Jan Krejčí 31. srpna 2006 jkrejci@physics.ujep.cz http://physics.ujep.cz/~jkrejci Obsah 1 Přímé metody řešení soustav lineárních rovnic 3 1.1 Gaussova eliminace...............................
Faculty of Nuclear Sciences and Physical Engineering Czech Technical University in Prague
1 / 40 regula Faculty of Nuclear Sciences and Physical Engineering Czech Technical University in Prague regula 1 2 3 4 5 regula 6 7 8 2 / 40 2 / 40 regula Iterační pro nelineární e Bud f reálná funkce
DETEKCE HRAN V BIOMEDICÍNSKÝCH OBRAZECH
DETEKCE HRAN V BIOMEDICÍNSKÝCH OBRAZECH Viktor Haškovec, Martina Mudrová Vysoká škola chemicko-technologická v Praze, Ústav počítačové a řídicí techniky Abstrakt Příspěvek je věnován zpracování biomedicínských
Quantization of acoustic low level signals. David Bursík, Miroslav Lukeš
KVANTOVÁNÍ ZVUKOVÝCH SIGNÁLŮ NÍZKÉ ÚROVNĚ Abstrakt Quantization of acoustic low level signals David Bursík, Miroslav Lukeš Při testování kvality A/D převodníků se používají nejrůznější testovací signály.
1 Projekce a projektory
Cvičení 3 - zadání a řešení úloh Základy numerické matematiky - NMNM20 Verze z 5. října 208 Projekce a projektory Opakování ortogonální projekce Definice (Ortogonální projekce). Uvažujme V vektorový prostor
5. Lokální, vázané a globální extrémy
5 Lokální, vázané a globální extrémy Studijní text Lokální extrémy 5 Lokální, vázané a globální extrémy Definice 51 Řekneme, že f : R n R má v bodě a Df: 1 lokální maximum, když Ka, δ Df tak, že x Ka,
1 0 0 u 22 u 23 l 31. l u11
LU dekompozice Jedná se o rozklad matice A na dvě trojúhelníkové matice L a U, A=LU. Matice L je dolní trojúhelníková s jedničkami na diagonále a matice U je horní trojúhelníková. a a2 a3 a 2 a 22 a 23
Lineární a adaptivní zpracování dat. 2. SYSTÉMY a jejich popis v časové doméně a frekvenční doméně
Lineární a adaptivní zpracování dat 2. SYSTÉMY a jejich popis v časové doméně a frekvenční doméně Daniel Schwarz Investice do rozvoje vzdělávání Osnova Opakování: signály a systémy Vlastnosti systémů Systémy
Stavový model a Kalmanův filtr
Stavový model a Kalmanův filtr 2 prosince 23 Stav je veličina, kterou neznáme, ale chtěli bychom znát Dozvídáme se o ní zprostředkovaně prostřednictvím výstupů Příkladem může býapř nějaký zašuměný signál,
Lineární a adpativní zpracování dat. 3. Lineární filtrace I: Z-transformace, stabilita
Lineární a adpativní zpracování dat 3. Lineární filtrace I: Z-transformace, stabilita Daniel Schwarz Investice do rozvoje vzdělávání Osnova Opakování: signály, systémy, jejich vlastnosti a popis v časové
Matematika (CŽV Kadaň) aneb Úvod do lineární algebry Matice a soustavy rovnic
Přednáška třetí (a pravděpodobně i čtvrtá) aneb Úvod do lineární algebry Matice a soustavy rovnic Lineární rovnice o 2 neznámých Lineární rovnice o 2 neznámých Lineární rovnice o dvou neznámých x, y je
základní vlastnosti, používané struktury návrhové prostředky MATLAB problém kvantování koeficientů
A0M38SPP - Signálové procesory v praxi - přednáška 4 2 Číslicové filtry typu FIR a IIR definice operace filtrace základní rozdělení FIR, IIR základní vlastnosti, používané struktury filtrů návrhové prostředky
2D transformací. červen Odvození transformačního klíče vybraných 2D transformací Metody vyrovnání... 2
Výpočet transformačních koeficinetů vybraných 2D transformací Jan Ježek červen 2008 Obsah Odvození transformačního klíče vybraných 2D transformací 2 Meto vyrovnání 2 2 Obecné vyjádření lineárních 2D transformací
11MAMY LS 2017/2018. Úvod do Matlabu. 21. února Skupina 01. reseni2.m a tak dále + M souborem zadané funkce z příkladu 3 + souborem skupina.
11MAMY LS 2017/2018 Cvičení č. 2: 21. 2. 2018 Úvod do Matlabu. Jan Přikryl 21. února 2018 Po skupinách, na které jste se doufám rozdělili samostatně včera, vyřešte tak, jak nejlépe svedete, níže uvedená
REGRESNÍ ANALÝZA V PROSTŘEDÍ MATLAB
62 REGRESNÍ ANALÝZA V PROSTŘEDÍ MATLAB BEZOUŠKA VLADISLAV Abstrakt: Text se zabývá jednoduchým řešením metody nejmenších čtverců v prostředí Matlab pro obecné víceparametrové aproximační funkce. Celý postup
Lineární a adaptivní zpracování dat. 3. SYSTÉMY a jejich popis ve frekvenční oblasti
Lineární a adaptivní zpracování dat 3. SYSTÉMY a jejich popis ve frekvenční oblasti Daniel Schwarz Osnova Opakování: systémy a jejich popis v časové oblasti Fourierovy řady Frekvenční charakteristika systémů
Čebyševovy aproximace
Čebyševovy aproximace Čebyševova aproximace je tzv hledání nejlepší stejnoměrné aproximace funkce v daném intervalu Hledáme funkci h x, která v intervalu a,b minimalizuje maximální absolutní hodnotu rozdílu
MĚŘENÍ A ANALÝZA ELEKTROAKUSTICKÝCH SOUSTAV NA MODELECH. Petr Kopecký ČVUT, Fakulta elektrotechnická, Katedra Radioelektroniky
MĚŘENÍ A ANALÝZA ELEKTROAKUSTICKÝCH SOUSTAV NA MODELECH Petr Kopecký ČVUT, Fakulta elektrotechnická, Katedra Radioelektroniky Při návrhu elektroakustických soustav, ale i jiných systémů, je vhodné nejprve
Vlastnosti a modelování aditivního
Vlastnosti a modelování aditivního bílého šumu s normálním rozdělením kacmarp@fel.cvut.cz verze: 0090913 1 Bílý šum s normálním rozdělením V této kapitole se budeme zabývat reálným gaussovským šumem n(t),
Časové řady, typy trendových funkcí a odhady trendů
Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel 973 442029 email:jirineubauer@unobcz Stochastický proces Posloupnost náhodných veličin {Y t, t = 0, ±1, ±2 } se nazývá stochastický proces
Lineární a adaptivní zpracování dat. 2. SYSTÉMY a jejich popis v časové doméně a frekvenční doméně
Lineární a adaptivní zpracování dat 2. SYSTÉMY a jejich popis v časové doméně a frekvenční doméně Daniel Schwarz Investice do rozvoje vzdělávání Osnova Opakování: signály a systémy Vlastnosti systémů Systémy
4.2.3 ŠÍŘE FREKVENČNÍHO PÁSMA CHOROVÉHO ELEMENTU A DISTRIBUČNÍ FUNKCE VLNOVÝCH NORMÁL
4.2.3 ŠÍŘE FREKVENČNÍHO PÁSMA CHOROVÉHO ELEMENTU A DISTRIBUČNÍ FUNKCE VLNOVÝCH NORMÁL V předchozích dvou podkapitolách jsme ukázali, že chorové emise se mohou v řadě případů šířit nevedeným způsobem. Připomeňme
Aplikovaná numerická matematika - ANM
Aplikovaná numerická matematika - ANM 3 Řešení soustav lineárních rovnic iterační metody doc Ing Róbert Lórencz, CSc České vysoké učení technické v Praze Fakulta informačních technologií Katedra počítačových
Klasifikace a rozpoznávání. Extrakce příznaků
Klasifikace a rozpoznávání Extrakce příznaků Extrakce příznaků - parametrizace Poté co jsme ze snímače obdržely data která jsou relevantní pro naši klasifikační úlohu, je potřeba je přizpůsobit potřebám
Časové řady, typy trendových funkcí a odhady trendů
Časové řady, typy trendových funkcí a odhady trendů Jiří Neubauer Katedra ekonometrie FVL UO Brno kancelář 69a, tel 973 442029 email:jirineubauer@unobcz Jiří Neubauer (Katedra ekonometrie UO Brno) Časové
STANOVENÍ CHARAKTERU SEGMENTU ŘEČI S VYUŽITÍM REÁLNÉHO KEPSTRA
STANOVENÍ CHARAKTERU SEGMENTU ŘEČI S VYUŽITÍM REÁLNÉHO KEPSTRA Oldřich Horák Univerzita Pardubice, Fakulta ekonomicko-správní, Ústav systémového inženýrství a informatiky Abstract: The extraction of the
Iterační metody řešení soustav lineárních rovnic. 27. prosince 2011
Iterační metody řešení soustav lineárních rovnic Michal Čihák 27. prosince 2011 Přímé metody řešení soustav lineárních rovnic V přednáškách z lineární algebry jste se seznámili s několika metodami řešení
Číslicové zpracování signálů a Fourierova analýza.
Číslicové zpracování signálů a Fourierova analýza www.kme.zcu.cz/kmet/exm 1 Obsah prezentace 1. Úvod a motivace 2. Data v časové a frekvenční oblasti 3. Fourierova analýza teoreticky 4. Fourierova analýza
1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.
Prostá regresní a korelační analýza 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Problematika závislosti V podstatě lze rozlišovat mezi závislostí nepodstatnou, čili náhodnou
Měření dat Filtrace dat, Kalmanův filtr
Měření dat Filtrace dat, Matematické metody pro ITS (11MAMY) Jan Přikryl Ústav aplikované matematiky ČVUT v Praze, Fakulta dopravní 3. přednáška 11MAMY čtvrtek 28. února 2018 verze: 2018-02-28 12:20 Obsah
UŽITÍ KOHERENČNÍ FUNKCE PRO DISTRIBUOVANOU
UŽITÍ KOHERENČNÍ FUNKCE PRO DISTRIBUOVANOU ANALÝZU VÍCEKANÁLOVÝCH SIGNÁLŮ Robert Háva, Aleš Procházka Vysoká škola chemicko-technologická, Abstrakt Ústav počítačové a řídicí techniky Analýza vícekanálových
Asociativní sítě (paměti) Asociace známého vstupního vzoru s daným výstupním vzorem. Typická funkce 1 / 44
Asociativní paměti Asociativní sítě (paměti) Cíl učení Asociace známého vstupního vzoru s daným výstupním vzorem Okoĺı známého vstupního vzoru x by se mělo také zobrazit na výstup y odpovídající x správný
11 Analýza hlavních komponet
11 Analýza hlavních komponet Tato úloha provádí transformaci měřených dat na menší počet tzv. fiktivních dat tak, aby většina informace obsažená v původních datech zůstala zachována. Jedná se tedy o úlohu
0.1 Úvod do lineární algebry
Matematika KMI/PMATE 1 01 Úvod do lineární algebry 011 Lineární rovnice o 2 neznámých Definice 011 Lineární rovnice o dvou neznámých x, y je rovnice, která může být vyjádřena ve tvaru ax + by = c, kde
Vyhodnocení 2D rychlostního pole metodou PIV programem Matlab (zpracoval Jan Kolínský, dle programu ing. Jana Novotného)
Vyhodnocení 2D rychlostního pole metodou PIV programem Matlab (zpracoval Jan Kolínský, dle programu ing. Jana Novotného) 1 Obecný popis metody Particle Image Velocimetry, nebo-li zkráceně PIV, je měřící
4EK213 LINEÁRNÍ MODELY
4EK213 LINEÁRNÍ MODELY Úterý 11:00 12:30 hod. učebna SB 324 3. přednáška SIMPLEXOVÁ METODA I. OSNOVA PŘEDNÁŠKY Standardní tvar MM Základní věta LP Princip simplexové metody Výchozí řešení SM Zlepšení řešení
Dnešní látka Opakování: normy vektorů a matic, podmíněnost matic Jacobiova iterační metoda Gaussova-Seidelova iterační metoda
Předmět: MA 4 Dnešní látka Opakování: normy vektorů a matic, podmíněnost matic Jacobiova iterační metoda Gaussova-Seidelova iterační metoda Četba: Text o lineární algebře v Příručce přežití na webových
Matice. Modifikace matic eliminační metodou. α A = α a 2,1, α a 2,2,..., α a 2,n α a m,1, α a m,2,..., α a m,n
[1] Základní pojmy [2] Matice mezi sebou sčítáme a násobíme konstantou (lineární prostor) měníme je na jiné matice eliminační metodou násobíme je mezi sebou... Matice je tabulka čísel s konečným počtem
Lineární a adaptivní zpracování dat. 1. ÚVOD: SIGNÁLY a SYSTÉMY
Lineární a adaptivní zpracování dat 1. ÚVOD: SIGNÁLY a SYSTÉMY Daniel Schwarz Investice do rozvoje vzdělávání Osnova Úvodní informace o předmětu Signály, časové řady klasifikace, příklady, vlastnosti Vzorkovací
Měření dat Filtrace dat, Kalmanův filtr
Měření dat Filtrace dat, Matematické metody pro ITS (11MAMY) Jan Přikryl Ústav aplikované matematiky ČVUT v Praze, Fakulta dopravní 3. přednáška 11MAMY čtvrtek 28. února 2018 verze: 2018-03-21 16:45 Obsah
PRAVDĚPODOBNOST A STATISTIKA
PRAVDĚPODOBNOS A SAISIKA Regresní analýza - motivace Základní úlohou regresní analýzy je nalezení vhodného modelu studované závislosti. Je nutné věnovat velkou pozornost tomu aby byla modelována REÁLNÁ
Učební texty k státní bakalářské zkoušce Matematika Skalární součin. študenti MFF 15. augusta 2008
Učební texty k státní bakalářské zkoušce Matematika Skalární součin študenti MFF 15. augusta 2008 1 10 Skalární součin Požadavky Vlastnosti v reálném i komplexním případě Norma Cauchy-Schwarzova nerovnost
VÍCEKANÁLOVÉ METODY ZVÝRAZŇOVÁNÍ ŘEČI
VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY FAKULTA ELEKTROTECHNIKY A KOMUNIKAČNÍCH TECHNOLOGIÍ ÚSTAV TELEKOMUNIKACÍ FACULTY OF ELECTRICAL ENGINEERING AND COMMUNICATION DEPARTMENT OF TELECOMMUNICATIONS
Numerické metody a programování. Lekce 4
Numerické metody a programování Lekce 4 Linarní algebra soustava lineárních algebraických rovnic a 11 a 12 x 2 a 1, N x N = b 1 a 21 a 22 x 2 a 2, N x N = b 2 a M,1 a M,2 x 2 a M,N x N = b M zkráceně A
Interpolace Uvažujme třídu funkcí jedné proměnné ψ(x; a 0,..., a n ), kde a 0,..., a n jsou parametry, které popisují jednotlivé funkce této třídy. Mějme dány body x 0, x 1,..., x n, x i x k, i, k = 0,
Kombinatorická minimalizace
Kombinatorická minimalizace Cílem je nalézt globální minimum ve velké diskrétní množině, kde může být mnoho lokálních minim. Úloha obchodního cestujícího Cílem je najít nejkratší cestu, která spojuje všechny
0.1 Úvod do lineární algebry
Matematika KMI/PMATE 1 01 Úvod do lineární algebry 011 Vektory Definice 011 Vektorem aritmetického prostorur n budeme rozumět uspořádanou n-tici reálných čísel x 1, x 2,, x n Definice 012 Definice sčítání
Zpracování digitalizovaného obrazu (ZDO) - Popisy III
Zpracování digitalizovaného obrazu (ZDO) - Popisy III Statistické popisy tvaru a vzhledu Ing. Zdeněk Krňoul, Ph.D. Katedra Kybernetiky Fakulta aplikovaných věd Západočeská univerzita v Plzni Zpracování
Při návrhu FIR filtru řešíme obvykle následující problémy:
Návrh FIR filtrů Při návrhu FIR filtru řešíme obvykle následující problémy: volba frekvenční odezvy požadovaného filtru; nejčastěji volíme ideální charakteristiku normovanou k Nyquistově frekvenci, popř.
CVIČENÍ 4 Doc.Ing.Kateřina Hyniová, CSc. Katedra číslicového návrhu Fakulta informačních technologií České vysoké učení technické v Praze 4.
CVIČENÍ POZNÁMKY. CVIČENÍ. Vazby mezi systémy. Bloková schémata.vazby mezi systémy a) paralelní vazba b) sériová vazba c) zpětná (antiparalelní) vazba. Vnější popis složitých systémů a) metoda postupného
Motivace příklad použití lokace radarového echa Význam korelace Popis náhodných signálů číselné charakteristiky
A0M38SPP - Signálové procesory v praxi - přednáška 7 2 Motivace příklad použití lokace radarového echa Význam korelace Popis náhodných signálů číselné charakteristiky (momenty) Matematická definice korelační
Numerická matematika 1
Numerická matematika 1 Obsah 1 Řešení nelineárních rovnic 3 1.1 Metoda půlení intervalu....................... 3 1.2 Metoda jednoduché iterace..................... 4 1.3 Newtonova metoda..........................
Při návrhu FIR filtru řešíme obvykle následující problémy:
Návrh FIR filtrů Při návrhu FIR filtru řešíme obvykle následující problémy: volba frekvenční odezvy požadovaného filtru; nejčastěji volíme ideální charakteristiku normovanou k Nyquistově frekvenci, popř.
Lineární zobrazení. 1. A(x y) = A(x) A(y) (vlastnost aditivity) 2. A(α x) = α A(x) (vlastnost homogenity)
4 Lineární zobrazení Definice: Nechť V a W jsou vektorové prostory Zobrazení A : V W (zobrazení z V do W nazýváme lineárním zobrazením, pokud pro všechna x V, y V a α R platí 1 A(x y = A(x A(y (vlastnost
Maticí typu (m, n), kde m, n jsou přirozená čísla, se rozumí soubor mn veličin a jk zapsaných do m řádků a n sloupců tvaru:
3 Maticový počet 3.1 Zavedení pojmu matice Maticí typu (m, n, kde m, n jsou přirozená čísla, se rozumí soubor mn veličin a jk zapsaných do m řádků a n sloupců tvaru: a 11 a 12... a 1k... a 1n a 21 a 22...
Flexibilita jednoduché naprogramování a přeprogramování řídícího systému
Téma 40 Jiří Cigler Zadání Číslicové řízení. Digitalizace a tvarování. Diskrétní systémy a jejich vlastnosti. Řízení diskrétních systémů. Diskrétní popis spojité soustavy. Návrh emulací. Nelineární řízení.
Hledání extrémů funkcí
Hledání extrémů funkcí Budeme se zabývat téměř výhradně hledáním minima. Přes nost nalezeného extrému Obecně není hledání extrému tak přesné jako řešení rovnic. Demonstrovat to můžeme na příkladu hledání
a počtem sloupců druhé matice. Spočítejme součin A.B. Označme matici A.B = M, pro její prvky platí:
Řešené příklady z lineární algebry - část 1 Typové příklady s řešením Příklady jsou určeny především k zopakování látky před zkouškou, jsou proto řešeny se znalostmi učiva celého semestru. Tento fakt se
Globální matice konstrukce
Globální matice konstrukce Z matic tuhosti a hmotnosti jednotlivých prvků lze sestavit globální matici tuhosti a globální matici hmotnosti konstrukce, které se využijí v řešení základní rovnice MKP: [m]{
ANALÝZA A KLASIFIKACE DAT
ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc. INVESTICE Institut DO biostatistiky ROZVOJE VZDĚLÁVÁNÍ a analýz IV. LINEÁRNÍ KLASIFIKACE PRINCIPY KLASIFIKACE pomocí diskriminačních funkcí funkcí,
cv3.tex. Vzorec pro úplnou pravděpodobnost
3 cvičení - pravděpodobnost 2102018 18cv3tex n i=1 Vzorec pro úplnou pravděpodobnost Systém náhodných jevů nazýváme úplným, jestliže pro něj platí: B i = 1 a pro i k je B i B k = 0 Jestliže je (Ω, A, P
2 Zpracování naměřených dat. 2.1 Gaussův zákon chyb. 2.2 Náhodná veličina a její rozdělení
2 Zpracování naměřených dat Důležitou součástí každé experimentální práce je statistické zpracování naměřených dat. V této krátké kapitole se budeme věnovat určení intervalů spolehlivosti získaných výsledků
VYUŽITÍ PRAVDĚPODOBNOSTNÍ METODY MONTE CARLO V SOUDNÍM INŽENÝRSTVÍ
VYUŽITÍ PRAVDĚPODOBNOSTNÍ METODY MONTE CARLO V SOUDNÍM INŽENÝRSTVÍ Michal Kořenář 1 Abstrakt Rozvoj výpočetní techniky v poslední době umožnil také rozvoj výpočetních metod, které nejsou založeny na bázi
8.3). S ohledem na jednoduchost a názornost je výhodné seznámit se s touto Základní pojmy a vztahy. Definice
9. Lineární diferenciální rovnice 2. řádu Cíle Diferenciální rovnice, v nichž hledaná funkce vystupuje ve druhé či vyšší derivaci, nazýváme diferenciálními rovnicemi druhého a vyššího řádu. Analogicky
1 Mnohočleny a algebraické rovnice
1 Mnohočleny a algebraické rovnice 1.1 Pojem mnohočlenu (polynomu) Připomeňme, že výrazům typu a 2 x 2 + a 1 x + a 0 říkáme kvadratický trojčlen, když a 2 0. Číslům a 0, a 1, a 2 říkáme koeficienty a písmenem
Regresní analýza 1. Regresní analýza
Regresní analýza 1 1 Regresní funkce Regresní analýza Důležitou statistickou úlohou je hledání a zkoumání závislostí proměnných, jejichž hodnoty získáme při realizaci experimentů Vzhledem k jejich náhodnému
Tento dokument obsahuje zadání pro semestrální programy z PAA. Vypracování. vypracovanou úlohu podle níže uvedených zadání. To mimo jiné znamená, že
Kapitola Zadání Tento dokument obsahuje zadání pro semestrální programy z PAA. Vypracování alespoň jedné úlohy je nutnou podmínkou pro úspěšné složení zkoušky resp. získaní (klasifikovaného) zápočtu (viz.
Komplexní obálka pásmového signálu
České vysoké učení technické v Praze, Fakulta elektrotechnická X37SGS Signály a systémy Komplexní obálka pásmového signálu Daniel Tureček 8.11.8 1 Úkol měření Nalezněte vzorky komplexní obálky pásmového
Soustavy se spínanými kapacitory - SC. 1. Základní princip:
Obvody S - popis 1 Soustavy se spínanými kapacitory - S 1. Základní princip: Simulace rezistoru přepínaným kapacitorem viz známý obrázek! (a rovnice) Modifikace základního spínaného obvodu: Obr. 2.1: Zapojení
ANALÝZA POTLAČOVÁNÍ AKUSTICKÉHO ECHA A DTD DETEKCE V CHYTRÝCH TELEFONECH
ANALÝZA POTLAČOVÁNÍ AKUSTICKÉHO ECHA A DTD DETEKCE V CHYTRÝCH TELEFONECH Jan Klapuch, Petr Pollák České vysoké učení technické v Praze, Fakulta elektrotechnická, K13131 klapujan@fel.cvut.cz, pollak@fel.cvut.cz
Úlohy nejmenších čtverců
Úlohy nejmenších čtverců Petr Tichý 7. listopadu 2012 1 Problémy nejmenších čtverců Ax b Řešení Ax = b nemusí existovat, a pokud existuje, nemusí být jednoznačné. Často má smysl hledat x tak, že Ax b.
Faster Gradient Descent Methods
Faster Gradient Descent Methods Rychlejší gradientní spádové metody Ing. Lukáš Pospíšil, Ing. Martin Menšík Katedra aplikované matematiky, VŠB - Technická univerzita Ostrava 24.1.2012 Ing. Lukáš Pospíšil,
Necht tedy máme přirozená čísla n, k pod pojmem systém lineárních rovnic rozumíme rovnice ve tvaru
2. Systémy lineárních rovnic V této kapitole se budeme zabývat soustavami lineárních rovnic s koeficienty z pole reálných případně komplexních čísel. Uvádíme podmínku pro existenci řešení systému lineárních
Analýza a zpracování digitálního obrazu
Analýza a zpracování digitálního obrazu Úlohy strojového vidění lze přibližně rozdělit do sekvence čtyř funkčních bloků: Předzpracování veškerých obrazových dat pomocí filtrací (tj. transformací obrazové
FOURIEROVA ANAL YZA 2D TER ENN ICH DAT Karel Segeth
FOURIEROVA ANALÝZA 2D TERÉNNÍCH DAT Karel Segeth Motto: The faster the computer, the more important the speed of algorithms. přírodní jev fyzikální model matematický model numerický model řešení numerického
Aplikovaná numerická matematika
Aplikovaná numerická matematika 6. Metoda nejmenších čtverců doc. Ing. Róbert Lórencz, CSc. České vysoké učení technické v Praze Fakulta informačních technologií Katedra počítačových systémů Příprava studijních
Transformace obrazu Josef Pelikán KSVI MFF UK Praha
Transformace obrazu 99725 Josef Pelikán KSVI MFF UK Praha email: Josef.Pelikan@mff.cuni.cz WWW: http://cgg.ms.mff.cuni.cz/~pepca/ Transformace 2D obrazu dekorelace dat potlačení závislosti jednotlivých
VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY. MRBT Robotika
VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY FAKULTA ELEKTROTECHNIKY A KOMUNIKAČNÍCH TECHNOLOGIÍ ÚSTAV AUTOMATIZACE A MĚŘÍCÍ TECHNIKY FACULTY OF ELECTRICAL ENGINEERING AND COMMUNICATION
Automatická detekce anomálií při geofyzikálním průzkumu. Lenka Kosková Třísková NTI TUL Doktorandský seminář, 8. 6. 2011
Automatická detekce anomálií při geofyzikálním průzkumu Lenka Kosková Třísková NTI TUL Doktorandský seminář, 8. 6. 2011 Cíle doktorandské práce Seminář 10. 11. 2010 Najít, implementovat, ověřit a do praxe
6 Ordinální informace o kritériích
6 Ordinální informace o kritériích Ordinální informací o kritériích se rozumí jejich uspořádání podle důležitosti. Předpokládejme dále standardní značení jako v předchozích cvičeních. Existují tři základní
stránkách přednášejícího.
Předmět: MA 4 Dnešní látka Iterační metoda Jacobiova iterační metoda Gaussova-Seidelova iterační metoda Superrelaxační metoda (metoda SOR) Metoda sdružených gradientů Četba: Text o lineární algebře v Příručce
FP - SEMINÁŘ Z NUMERICKÉ MATEMATIKY. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci
FP - SEMINÁŘ Z NUMERICKÉ MATEMATIKY Dana Černá http://www.fp.tul.cz/kmd/ Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci OBSAH A CÍLE SEMINÁŘE: Opakování a procvičení vybraných
TSO NEBO A INVARIANTNÍ ROZPOZNÁVACÍ SYSTÉMY
TSO NEBO A INVARIANTNÍ ROZPOZNÁVACÍ SYSTÉMY V PROSTŘEDÍ MATLAB K. Nováková, J. Kukal FJFI, ČVUT v Praze ÚPŘT, VŠCHT Praha Abstrakt Při rozpoznávání D binárních objektů z jejich diskrétní realizace se využívají
AVDAT Klasický lineární model, metoda nejmenších
AVDAT Klasický lineární model, metoda nejmenších čtverců Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Lineární model y i = β 0 + β 1 x i1 + + β k x ik + ε i (1) kde y i
A/D převodníky - parametry
A/D převodníky - parametry lineární kvantování -(kritériem je jednoduchost kvantovacího obvodu), parametry ADC : statické odstup signálu od kvantizačního šumu SQNR, efektivní počet bitů n ef, dynamický
Shodnostní Helmertova transformace
Shodnostní Helmertova transformace Toto pojednání ukazuje, jak lze určit transformační koeficienty Helmertovy transformace za požadavku, aby představovaly shodnostní transformaci. Pro jednoduchost budeme
příkladů do cvičení. V textu se objeví i pár detailů, které jsem nestihl (na které jsem zapomněl) a(b u) = (ab) u, u + ( u) = 0 = ( u) + u.
Několik řešených příkladů do Matematiky Vektory V tomto textu je spočteno několik ukázkových příkladů které vám snad pomohou při řešení příkladů do cvičení. V textu se objeví i pár detailů které jsem nestihl
13. cvičení z PSI ledna 2017
cvičení z PSI - 7 ledna 07 Asymptotické pravděpodobnosti stavů Najděte asymptotické pravděpodobnosti stavů Markovova řetězce s maticí přechodu / / / 0 P / / 0 / 0 0 0 0 0 0 jestliže počáteční stav je Řešení:
PSK1-9. Číslicové zpracování signálů. Číslicový signál
Název školy: Autor: Anotace: PSK1-9 Vyšší odborná škola a Střední průmyslová škola, Božetěchova 3 Ing. Marek Nožka Princip funkce číslicové filtrace signálu Vzdělávací oblast: Informační a komunikační
EXPERIMENTÁLNÍ METODY I 10. Měření hluku
FSI VUT v Brně, Energetický ústav Odbor termomechaniky a techniky prostředí prof. Ing. Milan Pavelek, CSc. EXPERIMENTÁLNÍ METODY I 10. Měření hluku OSNOVA 10. KAPITOLY Úvod do měření hluku Teoretické základy