České vysoké učení technické v Praze
|
|
- Jakub Štěpánek
- před 6 lety
- Počet zobrazení:
Transkript
1 České vysoké učení technické v Praze Fakulta elektrotechnická katedra radioelektroniky Hodnocení kvality analogového záznamu zvuku s využitím modelu slyšení Analog Audio Record Quality Assessment Using a Model of Auditory Perception diplomová práce Studijní program: Studijní obor: Vedoucí práce: Komunikace, multimédia a elektronika Multimediální technika Ing. František Rund, Ph.D. Martin Zalabák
2 České vysoké učení technické v Praze Fakulta elektrotechnická katedra radioelektroniky ZADÁNÍ DIPLOMOVÉ PRÁCE Student: Martin Zalabák Studijní program: Komunikace, multimédia a elektronika Obor: Multimediální technika Název tématu: Hodnocení kvality analogového záznamu zvuku s využitím modelu slyšení Pokyny pro vypracování: Seznamte se s metodami objektivního hodnocení kvality zvukového signálu. Implementujte vybranou metodu využívající model slyšení a ověřte její použitelnost pro hodnocení kvality analogových záznamů zvuku. Zaměřte se na artefakty typické pro analogový záznam, studujte a ověřte možnosti úpravy implementované metody pro hodnocení záznamů u kterých není dostupná reference. Seznam odborné literatury: [1] HARLANDER, N., HUBER, R., AND EWERT, S. D. Sound quality assessment using auditory models. J. Audio Eng. Soc 62, 5 (214), [2] GODSILL, S., RAYNER, P., AND CAPPE, O. Digital audio restoration. Springer, 22. Vedoucí: Ing. František Rund, Ph.D. Platnost zadání: do konce zimního semestru 216/217 L.S. doc. Mgr. Petr Páta, Ph.D. vedoucí katedry prof. Ing. Pavel Ripka, CSc. děkan V Praze dne
3 Poděkování Rád bych poděkoval své rodině, přátelům a blízkým za trpělivost a podporu při psaní této práce. Podpořeno grantem Studentské grantové soutěže ČVUT č. SGS14/24/OHK3/3T/13. Prohlášení Prohlašuji, že jsem předloženou práci vypracoval samostatně a že jsem uvedl veškeré použité informační zdroje v souladu s Metodickým pokynem o dodržování etických principů při přípravě vysokoškolských závěrečných prací. V Praze dne podpis studenta
4 Abstrakt Tato diplomová práce se zabývá objektivním modelem hodnocení kvality PEMO-Q založeným na modelu sluchové cesty a možnostmi jeho použití pro hodnocení analogových záznamů. Kromě analýzy vlivu artefaktů typických pro takové záznamy je otestován princip hodnocení bez přítomnosti reference na bázi vytvoření umělé referece potlačením artefaktů za pomocí Wienerovy fitrace šumu. Jako součást této práce byl model PEMO-Q, včetně alternativního modelu sluchové cesty CASP, implementován v prostředí MATLAB. Klíčová slova: PEMO-Q, CASP, audio, MATLAB, odstranění šumu
5 Abstract This diploma thesis deals with PEMO-Q objective audio quality assessment model based on auditory model and it s potential for assessment of analog recordings. The influence of artifacts typical for such recordings is analyzed. Also, the possibility of non-reference assessment using artificial reference made by suppression of artifacts is tested with the help of Wiener noise filtering. As a part of this thesis, a complete PEMO-Q, also with substitute auditory model CASP, is implemented in MATLAB. Keywords: PEMO-Q, CASP, audio, MATLAB, noise removal
6 Obsah Obsah Seznam použitých symbolů a zkratek 7 Seznam příloh 8 1 Úvod 11 2 Teoretická část Metody objektivního hodnocení Model objektivního hodnocení PEMO-Q Model sluchové cesty CASP a jeho možné modifikace Artefakty v analogových záznamech Metody potlačení šumu Principy potlačení impulzních artefaktů Implementace modelů a testů PEMO-Q Modifikovaný CASP Modelované artefakty Odstranění šumu Výsledky Testy modelovaných artefaktů Modelový bezreferenční test Výsledky reálných vzorků Závěr 35 6 Zdroje
7 Seznam použitých symbolů a zkratek Seznam použitých symbolů a zkratek ERB Equivalent Rectangular Bandwith - ekvivalentní obdélníková šířka pásma [2] PSM Perceptual Similiarity Measure - hodnota vnímané podobnosti [8] SDG Subjective Difference Grade - hodnocení subjektivního rozdílu [8] ODG Objective Difference Grade - hodnocení objektivního rozdílu [8] FIR Finite Impulse Response - konečná impulzní odezva [25] IIR Infinite Impulse Response - nekonečná impulzní odezva [25] PEMO-Q Perception Model - Quality - model vnímání, kvalita [8] CASP Computational Auditory Signal-processing and Perception Model - výpočetní model sluchového zpracování signálu a vnímání [15] DRNL Dual Resonance Non-Linear filter - dvojný rezonanční nelineární filtr [19] RMS Root Mean Square - Odmocnina z průměru kvadrátů FFT Fast Fourier Transform - implementace diskrétní Fourierovy trasformace - 7 -
8 Seznam příloh Seznam příloh Přiloha 1: Výstupní závislosti modelů Příloha 2: CD s MATLAB kódy a výsledky testů s analogovými záznamy - 8 -
9 1 ÚVOD 1 Úvod Problematika hodnocení kvality zvuku je vzhledem ke komplexitě lidského slyšení a jeho popisu záležitostí primárně subjektivních testů. Příprava a realizace takových testů je vzhledem k nutnosti provedení napříč dostatečně velkým vzorkem posluchačů za pomocí vhodné poslechové techniky nákladná na čas i hmotné prostředky [14]. Výhradně subjektivní hodnocení má také negativní aspekt ve skutečnosti, že nelze zaručit konzistentnost a reprodukovatelnost zjištěných výsledků. Tyto skutečnosti jsou motivacemi ke vzniku objektivních metod hodnocení, kde kvalitativní hodnocení je provedeno zpracováním zvukového signálu. To minimalizuje náklady na prostředky spojené s vyhodnocením počítačového algoritmu a může potenciálně umožnit i konzistentnost a reprodukovatelnost zjištěných hodnot. Negativní aspekt tohoto přístupu je obtížnost ověření jestli a do jaké míry daná metoda odpovídá lidskému vnímání zvukové kvality. Úkolem této práce je seznámit se s metodami objektivního hodnocení kvality zvukového signálu a implementovat vhodnou metodu využívající model slyšení. Dále bude ověřena použitelnost pro hodnocení kvality analogových záznamů vzhledem k artefaktům přítomných v takových záznamech. Pro záznamy, kde není přítomna reference, budou řešeny možnosti přizpůsobení implementovaných metod. Je testován princip vytvoření reference skrze minimalizaci artefaktů na potlačení šumu pomocí Wienerova filtru. Motivací k prozkoumání použitelnosti těchto modelů v této aplikaci je především skutečnost, že i přes jejich možné obecné použití pro vyhodnocení kvality se současná literatura zaměřuje výhradně na aplikaci v oblasti kompresních a přenosových kodeků či digitálního přenosu a nikoliv na hodnocení digitalizovaných analogových nahrávek [6] [21]. V kapitole 2 jsou z teoretického pohledu rozebrány metody objektivního hodnocení kvality a artefakty přítomné v analogových signálech. V následující kapitole bude popsán implementovaný model PEMO-Q a jeho úpravy a také realizované testy. Výsledky těchto testů budou představeny v kapitole
10 2 TEORETICKÁ ČÁST 2 Teoretická část 2.1 Metody objektivního hodnocení Jak bylo naznačeno v úvodu, za nejlepší metodu hodnocení kvality zvuku jsou stále považovány subjektivní testy [21]. Doporučení ITU-R BS.1116 [9] specifikuje systém hodnocený založený na pěti úrovních (znázorněný v tabulce 1), kde hodnota 5 vyjadřuje neslyšitelné zkreslení zvuku a 1 velmi rušivé zkreslení. Při komparativních testech lze použít rozdíl testované a referenční hodnoty (tudíž hodnota vyjadřuje identitu a -4 velmi rušivé zhoršení) též známý jako hodnota SDG [8]. Specifikuje rovněž, že vhodný test vyžaduje nejen dostatečně velký počet posluchačů, ale též musí být posluchači vhodně vyškolení pro hodnocení. Dále jsou popsány minimální požadavky pro poslechové zařízení zahrnující mimo jiné například parametry reproduktorů a akustické vlastnosti poslechové místnosti. Realizace takových testů tedy vyžaduje značné finanční a časové investice. Tyto obtíže byly motivací pro analýzu vlastností zvuku, které rozhodují o subjektivním měřítku kvality, pro možnost tyto prostředky ušetřit a nahradit hodnocení kvality algoritmem signálového zpracování. Vzhledem k řadě různých perspektiv, jak kvalitu zvuku pojmout, vznikla řada metod pro kvalitativní hodnocení. Ty lze rozdělit do dvou skupin. Jedna skupina jsou metody relativní, intruzivní, které porovnávají testovaný signál vůči referenčnímu dokonale kvalitnímu signálu, a metody absolutní, neintruzivní, které hodnotí jen na základě testovaného signálu. Tato klasifikace má analogii v subjektivních testech, kde dochází rovněž k hodnocení na základě porovnání s referencí či hodnocení zvuku samotného. Dostupné metody neintruzivního hodnocení se zaměřují primárně na řečové zvuky skrze modelování vlastností řeči, pro obecnější hodnocení je tedy na místě využít metody intruzivní [6]. Pro co největší přiblížení se lidskému vnímání kvality využívá řada intruzivních metod modelu sluchové cesty. První takovou standardizovanou metodou je Perceptual Evaluation of Audio Quality neboli PEAQ doporučený v ITU-R BS.1387 [1]. Tato metoda vyhodnocuje testovaný zvuk v modulaci, specifické hlasitosti, pomalých variací zesílení a excitačním vzoru [21]. Samotné kvalitativní hodnocení Subjektivní zkreslení Známka Neslyšitelné 5. Slyšitelné, ale nerušivé 4. Lehce rušivé 3. Rušivé 2. Velmi rušivé 1. Tabulka 1: Systém hodnocení subjektivního zkreslení zvuku
11 2 TEORETICKÁ ČÁST výstupu modelové sluchové cesty vykonává umělá neuronová síť. Mezi ITU doporučeními lze dále nalézt modely Perceptual Speech Quality Measure (PSQM) [11], kde je místo neuronové sítě použito lineární kombinace různých průměrovaných rozdílů, a navazující Perceptual Evaluation of Speech Quality (PESQ) [12] s mimo jiné vylepšeným psychoakustickým modelem. Tento model je navzdory svému řečovému zaměření běžně používán i pro jiné signály [6]. Posledním ITU standardem v této oblasti je Perceptual Objective Listening Quality Analysis (POLQA) z doporučení ITU-T P.863 přizpůsobený řečovým signálům o delší šířce pásma a obohacený o predikci kvality řečových signálů akusticky nahraných s použitím umělé hlavy [13] Model objektivního hodnocení PEMO-Q Metoda využitá v rámci této práce je model PEMO-Q, který sestavili Huber a Kollmeier a představili ve svém článku v roce 26 [8]. Tato metoda dle svých tvůrců vychází z modelu PEAQ, avšak se snaží adresovat obecné artefakty a typy zkreslení zvuku a nezaměřovat se jen na hodnocení zvuků kódovaných na nízké bitové toky. Dále se snaží poskytnout stálé měřítko, které netrpí na proměnné jevy svázané s adaptací modelu (např. spojené s umělou neuronovou sítí). Model PEMO-Q je intruzivní, tedy kvalitu vyhodnocuje skrze porovnání s dokonale kvalitním referenčním signálem. Před samotnou analýzou je nutné zajistit, aby referenční i testovaný signál byly úrovní a časově vyrovnané. Navrhovanou metodou vyrovnání úrovně je vynásobení testovaného signálu skalární hodnotou pro dosažení stejného RMS výkonu. Časovou odchylku lze vyrovnat posunutím jednoho ze signálů. Při neznalosti časové odchylky je vhodné ji odhadnout s využitím vzájemné korelace signálů. V případě, že se tyto odchylky v čase mění, je nezbytné tyto korekce provádět blok po bloku. Pro převod zvukového signálu na hodnoty odhadovaných nervových stimulů je využito modelu sluchové cesty, znázorněného na obrázku 1. Prvním krokem tohoto modelu je modelování bazilární membrány bankou 35 gammatónových filtrů čtvrtého řádu o středních kmitočtech od 235 do 145 Hz. Odstupy jednotlivých středních kmitočtů a šířky pásem odpovídají hodnotě 1 ERB [2]. Tím je dosaženo napodobení schopnosti frekvenčního rozlišení lidského sluchu. Výstup každého filtru je dále zpracováván nezávisle. Signál na výstupu gammatónového filtru je půlvlnně usměrněn (tedy bez zachování záporné půlvlny) a filtrován dolní propustí s mezním kmitočtem 1 khz. Tento proces zachovává obálku signálu nad tímto kmitočtem a pro nižší kmitočty uchovává informaci o amplitudě a fázi. Tyto dva kroky modelují převod z mechanických kmitů na nervové impulzy. Dále je zvuk limitován úrovňovou dolní mezí závislou na ma
12 2 TEORETICKÁ ČÁST Obrázek 1: Blokové schéma modelu sluchové cesty v PEMO-Q [8] ximální úrovni vstupního signálu (při amplitudě 1 odpovídající úrovni 1 5 [6]) a přiveden na vstup bloku adaptivní filtrace. Tento blok se skládá z pěti zpětnovazebných smyček zapojených do kaskády s dolní propustí ve zpětné vazbě (na obrázku 1 ilustrované pomocí RC článku). Tyto dolní propusti jsou definovány pomocí rozsahu časových koeficientů, konkrétně od 5 do 5 ms. Výstupem zpětné vazby je vstupní signál vydělen. Tato kaskáda má účinek takový, že stacionární signály jsou sníženy přibližně na úroveň 32. odmocniny, což napodobuje logaritmickou kompresi lidského slyšení. Na velké změny však tento proces reaguje přibližně lineárně. Posledním krokem modelu sluchové cesty je modulační banka filtrů modelující schopnost rozpoznání amplitudové modulace [8] [1]. Filtr s nejnižším kmitočtem je dolní propust druhého řádu nastavená na kmitočet 2.5 Hz. Následují dva filtry s konstantním pásmem 5 Hz a středními kmitočty 5, resp. 1 Hz. Zbytek banky tvoří pět filtrů s konstantní Q hodnotou 2 a překryvy na -3 db. S takto definovanými parametry odpovídá nejvyšší střední kmitočet hodnotě 129 Hz. Vzhledem k relativně malým kmitočtům a kmitočtovým pásmům oproti vstupním zvukovým signálům a velkým datovým tokům v tomto bodě zpracování (každý vzorek vstupního signálu
13 2 TEORETICKÁ ČÁST je v tomto bodě reprezentován 35 8 = 28 vzorky) je počítána Hilbertovská obálka výstupních signálů, a ta je podvzorkována na nejméně šestinásobek středního resp. mezního kmitočtu filtrů. Z Hilbertovské obálky je brána jen reálná část signálu. Po průchodu zvukového signálu modelem sluchové cesty (referenční i testovaný zvuk jsou modelem vyhodnoceny nezávisle) a před samotným vyhodnocením je provedena asimilace vnitřní reprezentace testovaného signálu výpočtem y tfm +x tfm y 2 tfm < x tfm ŷ tfm = y tfm, y tfm x tfm. (2.1) Proměnná x představuje hodnotu vnitřní reprezentace referenčního signálu a y hodnotu zkresleného. Indexy t, f a m představují proměnné v čase, frekvenčním kanálu a modulačním kanálu vnitřní reprezentace. Motivací k tomuto kroku je předpoklad, že chybějící či potlačené rysy ve zvuku jsou méně subjektivně invazivní než přidané či zesílené, tudíž je vhodné částečně potlačit rozdíl menších vjemů, než je v referenčním zvuku. Vyhodnocení objektivní kvality testovaného zvuku je provedeno dvěma metodami. První metoda počítá vzájemnou korelaci přes celou délku signálu a pro všechna frekvenční pásma avšak nezávisle přes všechna pásma modulační banky vztahem r = (x tf x)(y tf ȳ) t,f (x tf x). (2.2) 2 (y tf ȳ) 2 t,f t,f Hodnoty x a ȳ představují průměrné hodnoty reprezentací přes čas a frekvenční pásma. Tato hodnota je dále násobena koeficientem w m spočteným skrze podíl součtu kvadrátů všech hodnot reprezentace zkresleného signálu daného modulačního pásma a součtu kvadrátů hodnot všech modulačních pásem této reprezentace. Výstupem součtu těchto váhovaných vzájemných korelací je finální hodnota P SM. Zjištěná hodnota se má dle tvůrců [8] pohybovat v rozmezí od do 1, kde P SM = 1 vyjadřuje identitu, byť teoreticky je prý možné dosáhnout hodnoty až -1. w m = ytfm 2 t,f ytfm 2 t,f,m (2.3) P SM = m w m r m (2.4) Druhou výstupní hodnotou modelu je P SM t, která oproti předcházející hodnotě přidává časovou závislost. Toho je dosaženo počítáním vzájemné korelace (iden
14 2 TEORETICKÁ ČÁST Obrázek 2: Blokové schéma kompletního modelu PEMO-Q ticky použitím příslušného vztahu (2.2)) pro 1 ms rámce vnitřních reprezentací. Výsledné hodnoty těchto korelací, jak je nastíněno v obrázku 2, jsou váhovány pohyblivým průměrem časového průběhu vnitřní reprezentace zkresleného signálu ve snaze popsat okamžitou aktivitu ve zvuku. Z takto váhovaných krátkodobých korelací je zvolen 5%-ní kvantil jako výsledná hodnota. Pro snadné porovnání s SDG hodnotami je na výstupu PEMO-Q navíc hodnota P SM t, která je považována za přesnější odhad [8], mapována na srovnatelnou ODG funkcí a max{ 4, ODG(x) = + c}, x < x x b (2.5) d x d, x x. Tímto přepočtem je dosaženo hodnoty pro identitu a 4 pro velmi rušivé zkreslení. Konstanty použité při přepočtu jsou a =.22, b =.98, c = 4.13, d = 16.4 a x =
15 2 TEORETICKÁ ČÁST Model sluchové cesty CASP a jeho možné modifikace Model sluchové cesty zahrnutý v modelu PEMO-Q je možné nahradit modelem CASP představeném v článku vydaném v roce 28 [15]. Tento model vychází ze staršího modelu, který definoval Dau et al. v roce 1996 [1] a který je v PEMO-Q zahrnut [8], ale v několika jeho částech ho rozšiřuje. Vzhledem k přidanému nelineárnímu bloku v části bazilární membrány je vhodným prvním krokem zesílit či ztlumit vstupní signál na vhodnou hlasitost. Zvolené hodnoty odpovídají digitálnímu signálu o amplitudě 1 hlasitosti 1 db. Samotným prvním krokem analýzy je však zahrnutý blok vnějšího a středního ucha přidaný na základě úplné absence ošetření této části slyšení v předchozím modelu. První filtr je definován přenosovou funkcí získanou měřením přenosu mezi sluchátky a bubínkem [2]. Filtr středního ucha byl dále odvozen z dat získaných měřením na zemřelém člověku. [5]. Výstupem těchto filtrů je rychlost třmínku. Frekvenční závislosti těchto filtrů jsou zobrazeny na obrázku 3. Laboratoř výzkumu slyšení na Univerzitě v Essexu tvrdí, že tento postup a naměřené hodnoty neodpovídají skutečnosti a pro svůj model MAP sestavila alternativu využívající hodnoty přizpůsobené datům živých lidí a počítající výchylku třmínku místo jeho rychlosti [17]. Tím bylo také dosaženo frekvenční nezávislosti v kroku bazilární membrány. Průchod zvuku do středního ucha počítá tento model dvěma rezonančními filtry prvního řádu se zisky 1 a 25 db, přičemž první filtr má definované pásmo od 1 do 4 khz a druhý od 2.5 do 7 khz. Samotná transformace na výchylku třmínku je provedena Butterworthovým filtrem prvního řádu nastaveném na 5 Hz, útlumem pomocí násobné hodnoty 45e 9 a Butterworthovou horní propustí s mezním kmitočtem 1 khz. Model bazilární membrány byl změněn na DRNL banku [19]. Ta se skládá z lineární a nelineární větve, které se na výstupu sčítají. V lineární části je vstupní signál lineárně zesílen (konstantním koeficientem g) a filtrován kaskádou identických gammatónových filtrů prvního řádu (střední kmitočet f clin, šířka pásma BW lin odpovídající 1 ERB [2]) a dále navíc kaskádou identických dolních propustí s mezním kmitočtem rovným střednímu kmitočtu předcházejících gammatónových filtrů. Hodnota koeficientu g je závislá na použitém pásmu pro daný DRNL filtr banky, což odpovídá frekvenční závislosti bazilární membrány. Počet filtrů a jejich přesné pozice jsou nechány na volbě implementaci. Nelineární část se skládá z kaskády gammatónových filtrů (střední kmitočet f cnlin, šířka pásma BW nlin odpovídající rovněž 1 ERB), kompresního prvku, opětovné kaskádové gammatónové filtrace a kaskády dolních propustí. Obě kaskády gammatónových filtrů jsou identické a jsou podobně jako v lineární větvi řádu 1,
16 2 TEORETICKÁ ČÁST avšak jejich střední kmitočet je od té odlišný. Mezní kmitočet dolních propustí též odpovídá f cnlin. Kompresní prvek má charakter zlomené tyče a je definován třemi parametry: lineárním ziskem a, ziskem b a exponentem c. Pro nízké úrovně je přenos definován lineární funkcí y[t] = a x[t], (2.6) kde x[t] je vstupní a y[t] výstupní vzorek v čase t. Na vyšších úrovních je signál zpracován nelineárně skrze y[t] = b x[t] c sign(x[t]). (2.7) Výstupní hodnota je vždy menší výsledek z těchto dvou. Lze tedy oba vztahy spojit do jednoho výpočtu: y[t] = sign(x[t]) min(a x[t], b x[t] c ). (2.8) Hodnoty jsou rovněž závislé na frekvenčním pásmu. Typické hodnoty banky uvádí Lopez-Poveda et al. ve svém textu [18] z roku 21 a příklad je uveden na obrázku 4. Obrázek 3: Charakteristiky filtrů vnějšího a středního ucha použité v CASP [15]
17 2 TEORETICKÁ ČÁST Obrázek 4: Hodnoty vybraných pásem DRNL banky modelující subjekt YO z měření, které provedli Lopez-Poveda et al. [18] Model MAP definici konstant pro DRNL banku zjednodušuje skrze výše uvedené využití výchylky třmínku místo jeho rychlosti. Zisk lineární větve je pro všechna pásma g = 5 a parametry kompresního prvku jsou a = 5 1 3, b takové, aby komprese začala na vstupní hodnotě /2 (tedy 25 db nad prahem slyšení definovaným úrovní výchylky 1 µm) a c =.2. Mezi středními resp. mezními kmitočty lineární a nelineární větve platí závislost f clin = p + q f cnlin, (2.9) kde p = 266 a q =.621. Další odlišnosti oproti PEMO-Q tvoří v zesílení před krokem adaptivní kaskády následované druhou mocninou signálu. Zesílení je vyřešené jednoduchým přepočtem se ziskem 5 db, ačkoliv Harlander et al. uvádí, že vhodnější je zisk 38 db [6]. Dále, vzhledem k nižším hodnotám na úrovni adaptivní smyčky, je vhodné použít nižší dolní mez. Poslední úpravou je přidání dolní propusti prvního řádu před vstupem do modulační banky, což má napodobit nižší citlivost slyšení na rychlé modulace
18 2 TEORETICKÁ ČÁST 2.2 Artefakty v analogových záznamech Pro průzkum možnosti použití metod objektivního hodnocení kvality na analogových záznamech je vhodné prozkoumat, jaké artefakty se v takových záznamech vyskytují. Godsill et al. [3] uvádí několik artefaktů s rozdělením do dvou skupin, a to lokalizované artefakty, které se projevují v signálu na určitých vzorcích (např. škrábance), a artefakty globální, které ovlivňují celý signál. Do skupiny lokalizovaných patří tyto artefakty: Krátké poruchy šumového charakteru nahodilé v čase a amplitudě, způsobené např. drobnými škrábanci na vinylových deskách. Přechodný nízkofrekvenční impulz: Větší poruchy v médiu, které způsobí nízkofrekvenční resonanci ve snímačovém zařízení na poslech připomínající zvuk úderu. Artefakty mající globální charakter lze v analogových nahrávkách nalézt tyto: Širokopásmový šum: běžně přítomný artefakt projevující se stálým syčivým zvukem. Obvykle se jedná o stacionární šum, avšak ne pravidlem zejména co se týče starších nahrávek. Frekvenční charakteristika šumu může mít mnoho podob. Wow a flutter: změny výšky způsobené nestandartním chováním přehrávající mechaniky jako například kolísání rychlosti motoru. Efekt moduluje všechny frekvenční složky. Subjektivní dopad tohoto efektu je velmi závislý na charakteru původního zvuku a parametry tohoto efektu mají mnoho stupňů volnosti (frekvence, frekvenční hloubka, časová závislost) a proto není v rámci této práce z důvodu složitosti analyzován. Zkreslení: Obecné nelineární změny jako například ovlivnění amplitudy usměrňovacím jevem či tvrdým limitováním. Pro analytické důvody je vhodné tyto artefakty modelovat. V témže díle lze zjistit, že krátké poruchy je možné modelovat dvěma způsoby. Prvním je aditivní model, kdy je do signálu na patřičné místo přičten krátký (o délce méně 4 ms) šumový impulz. Druhá metoda je metoda nahrazení, údajně vhodnější pro delší poruchy. V případě delších poruch se v analogových médiích běžně vyskytují resonance, tudíž je v takových situacích přesnější model přechodného nízkofrekvenčního impulzu. Jak bylo uvedeno výše, nízkofrekvenční impulzy souvisí obvykle s resonancí ve snímačovém zařízení, tedy se bude jednat o kmitání na konkrétním resonančním - 2 -
19 2 TEORETICKÁ ČÁST Obrázek 5: Příklad přechodného nízkofrekvenčního impulzu z gramofonové nahrávky [4] kmitočtu (15 až 3 Hz [3]). Vzhledem k přechodnému charakteru a ostrému nástupu lze rovněž předpokládat charakter klesající exponenciály. Tomu odpovídá příklad takového impulzu uvedený ve článku od Godsilla et al. na obrázku 5 [4]. Ze samotného příkladu lze odvodit délka řádově jednotek period. Vhodná metoda pro modelování je tedy použít harmonickou funkci začínající v maximu resp. minimu o kmitočtu 15 až 3 Hz s exponenciální obálkou o uvedené délce. Širokopásmový šum je možné modelovat aditivním bílým šumem. Specifičtější frekvenční charakteristiku lze získat vhodnou filtrací bílého šumu, jako např. váhováním vzorků diskrétní Fourierovy transformace. Různé formy nelineárního zkreslení lze realizovat aplikací vhodné funkce na vstupní signál. Tvrdý limiter, jako příklad, je možné aplikovat funkcí y[t] = sign(x[t]) min(abs(x[t]), a), (2.1) kde a je lineární úroveň, kterou má být signál limitován. [25] Metody potlačení šumu Pro odstranění šumu ze zvukového záznamu se nabízí řada metod. Mezi ty nejrozšířenější však patří metody založené na zpracování krátkých bloků ve spektrální doméně [3]. Pro tyto metody je nezbytné znát výkonové spektrum šumu (dále známo
20 2 TEORETICKÁ ČÁST jako S n ), které však, za užití předpokladu stacionarity šumu, lze získat z tichých částí signálu. Zpracování probíhá na krátkých blocích zvukového signálu (pro efektivní výpočet FFT o délce 124 či 248 vzorků). Aby nedošlo k frekvenčnímu přetékání a vzniku nespojitostí, je doporučen překryv bloků (např. o 5%) a použití funkce okna (např. Hammingovy nebo Hannovy). První zde uvedenou metodou je Wienerův filtr [24] definovaný pomocí přenosu tímto vztahem: H(ω) = S x (ω) S x (ω) + S n (ω), (2.11) kde S x (ω) je výkonové spektrum bloku signálu bez šumu, tedy požadovaný výstup. Při diskretizaci lze filtr definovat jako funkci f(y (m)) = S x (m) Y (m) (2.12) S x (m) + S n (m) s Y (m) jako výstupním spektrem. Při vyjádření výkonového spektra výstupu jako rozdílu výkonového spektra vstupu a šumu a zajištění, že v případě nepřesného odhadu šumu nepůjde hodnota výkonu do záporných čísel (což odporuje definičnímu oboru výkonu) Y (m) 2 S n (m), Y (m) 2 > S n (m) S x (m) =, Y (m) 2 <= S n (m) (2.13) vychází finální funkce Y (m) 2 S n(m) Y (m), Y (m) 2 > S Y (m) f(y (m)) = 2 n (m), Y (m) 2 <= S n (m). (2.14) Další metoda je spektrální odečítání, které oproti Wienerovu filtru pracuje s amplitudovými spektry. Ekvivalentně lze spektrální odečítání vyjádřit vztahem Y (m) S n(m) 1 / 2 Y (m), Y (m) 2 > S Y (m) n (m) f(y (m)) =, Y (m) 2 <= S n (m). (2.15) Poslední zmíněnou metodou je výkonové odečítání, kde je výstupní výkon nastaven na výkon vstupu mínus očekávaný šumový výkon: ( Y (m) 2 S )1 / 2 n(m) Y (m) Y (m), Y (m) 2 > S f(y (m)) = 2 n (m), Y (m) 2 <= S n (m). (2.16)
21 2 TEORETICKÁ ČÁST Vzhledem k nepřesnostem v aproximaci šumové hodnoty a krátkodobé nestacionaritě šumu dojde u všech tří metod ke snížení amplitudy. K zesílení efektu potlačení šumu je možné zesílit odhad výkonového spektra šumu, např. vynásobením koeficientem větším 1. Se zvyšováním odhadu spektra však dojde ke zvětšování míry nežádoucího zkreslení redukcí nešumových frekvenčních složek signálu Principy potlačení impulzních artefaktů Pro úplnost jsou zde uvedeny principy možných metod minimalizace dalších představených artefaktů [3]. K odstranění krátkých impulzních poruch je možné použít autoregresní modely. Vzhledem ke skutečnosti, že poruchy samotné mají obvykle výrazně odlišný charakter oproti okolnímu zvuku, lze k detekci těchto poruch použít chybový signál autoregresní syntézy, že jeho úroveň při poruše obvykle prudce vzroste. Po detekci je možné rovněž využít syntézu autoregresním modelem pro interpolaci signálu v místě poruchy. Literatura uvádí, že je vhodné k aproximaci hodnot AR modelu použít metodu nejmenších čtverců. Je dále uvedeno, že využitím ARMA modelu lze údajně dosáhnout lepších výsledků, avšak se zanedbatelným rozdílem. V případě krátkodobých nízkofrekvenčních impulzů lze dle článku od stejného autora [4] využít stejné metody k detekci i interpolaci, avšak pro lepší výsledky je vhodnější k interpolaci využít Kalmanův filtr
22 3 IMPLEMENTACE MODELŮ A TESTŮ 3 Implementace modelů a testů V rámci této práce byl v prostředí MATLAB R212a (s využitím Signal Processing Toolbox) implementován model pro objektivní hodnocení kvality PEMO-Q dle popisu z kapitoly Dále byl implementován alternativní model sluchové cesty CASP s modifikacemi z modelu MAP a se zohledněním nových poznatků dle popisu z kapitoly Dále byly vytvořeny modely artefaktů přítomných v analogových nahrávkách a otestována závislost výstupních hodnot PEMO-Q a PEMO-Q s modelem sluchové cesty CASP na míře ovlivnění zvuku artefakty. Vzhledem k rušivosti těchto artefaktů by měly výstupní hodnoty PEMO-Q s rostoucí mírou ovlivnění signálu artefakty klesající tendenci. Pro využití PEMO-Q bez přítomnosti reference byl vyzkoušen princip vytvoření umělé reference algoritmem potlačení šumu na principu Wienerovy filtrace popsané v kapitole To bylo provedeno porovnáním hodnot uměle zašuměného signálu využívající originální reference bez šumu a reference vytvořené potlačením šumu. Možnost aplikace této metody byla vyzkoušena na skutečných digitalizovaných záznamech. 3.1 PEMO-Q Model PEMO-Q popsaný v kapitole je implementován skrze několik funkcí, konkrétně skrze funkci pemoq_am realizující model sluchové cesty pro vložený signál, a funkci objquality realizující samotné vyhodnocení hodnot P SM, P SM t a ODG z dat modelované sluchové cesty. Před využitím modelu sluchové cesty je nezbytné získat strukturu s definicemi hodnot koeficientů filtrů pro daný vzorkovací kmitočet pomocí funkce pemoq_am_prepare. Tato separace byla provedena z důvodu zrychlení, že při stálém vzorkovacím kmitočtu je opakovaný výpočet těchto hodnot redundantní. Pro přehlednost je zde implementace popsána přes jednotlivé kroky modelu napříč soubory. Implementace předpokládá vhodně nastavené úrovně referenčního i testovaného signálu a časovou synchronizaci. Pro asistenci s vhodným nastavením úrovně je k dispozici funkce preproc_norm. Výstupem této funkce je násobící koeficient pro testovaný signál vypočtený z poměru mediánů RMS výkonů krátkých rámců signálů (o zvolené délce N). Tyto mediány byly zvoleny vzhledem k charakterům možných artefaktů. Přechodné časové impulzy a šum mohou celkový RMS výkon navýšit. Je však vytvořen předpoklad, že tyto artefakty se při vyhodnocení s krátkými rámci výrazně projeví jen ve statisticky okrajových hodnotách (hlasité impulzy na horním okraji, šum na dolním okraji), tudíž by vliv na mediánovou hodnotu mohl
23 3 IMPLEMENTACE MODELŮ A TESTŮ být minimální. Prvním krokem modelu sluchové cesty je blok bazilární membrány, tedy banka gammatónových filtrů 4. řádu. Implementace těchto IIR filtrů je převzata z kódu, který napsal Malcolm Slaney [22]. Jediné funkční úpravy tohoto kódu jsou v substituci maximálního středního kmitočtu f s /2 na hodnotu 14.5 khz a fixním počtu 35 kanálů pro splnění parametrů PEMO-Q. Tyto definice IIR filtrů jsou k nalezení v pomocné funkci mod_gammafilt a v příslušných částech pemoq_am_prepare. Vzhledem k faktu, že na nízkých kmitočtových pásmech se jeví Slaneyho implementace filtru nestabilně a resonuje v maximu, je na kmitočtech f c < f s /4 pracováno se signálem podvzorkovaným na polovinu funkcí decimate. Signál je po filtraci pro uniformitu zpětně interpolován funkcí interp. Model vlásečnic je realizován operací usměrnění a low-pass filtrem prvního řádu. K usměrnění je využito vlastnosti interpretu MATLAB, kdy je logická hodnota podmínky x je větší než využita jako násobící koeficient: bma=bm.*(bm>); Pro filtraci je využit IIR filtr prvního řádu spočtený skrze [25] K = tan πf c f s (3.1) b = b 1 = K K + 1 a 1 = K 1 K + 1 (3.2) (3.3) pro f c = 1kHz. Krok adaptivní filtrace, včetně aplikace minimální hodnoty byl realizován již hotovou open-source implementací CASP [16] využívající kompilovaný mex soubor. Motivací k tomu byla nutnost pracovat vzorek po vzorku pro celý signál skrze 35 pásem a pět filtrů v kaskádě. Tento postup je interpretem MATLAB vyhodnocován velmi neefektivně, a to vedlo autory implementace CASP k vytvoření kompilované mex funkce v jazyce C. První filtr modulační banky byl sestaven pomocí funkce butter jako Butterworthův filtr druhého řádu s mezním kmitočtem 2.5 Hz. Vyšší filtry, popsané v kapitole jsou definovány s příslušnými kmitočty f c následujícími vztahy: [7] w = 2πf c f s (3.4) ( e = exp w ) Q / (3.5)
24 3 IMPLEMENTACE MODELŮ A TESTŮ b = 1 e (3.6) a 1 = e e jw (3.7) Filtrace sama je provedena pro velký objem dat (8 pásem modulační banky krát 35 pásem frekvenční banky) zvláštní funkcí mod_packfilter, která po filtraci signály decimuje na kmitočet f s = fs, kde n je dolů zaokrouhlený podíl originálního n vzorkovacího kmitočtu a desetinásobku středního, v případě dolní propusti mezního kmitočtu filtru modulační banky (s pro každé pásmo banky jinou hodnotou n). Decimační prvek využívá funkci decimate s FIR filtrací, že implicitní IIR filtr jeví při tomto použití nestabilitu a mnoho výstupních hodnot roste nad všechny meze. Výstup této banky tvoří cílovou vnitřní reprezentaci. Po získání hodnot reprezentace je další krok asimilace hodnot testovaného signálu skrze pomocnou funkci back_assim. Ta sama (v jednom vyhodnocení pro všechny hodnoty jednoho modulačního pásma) provede operaci odpovídající vztahu 2.1 tímto výpočtem: out=y+(+(y<x).*((x-y)./2)); Pro časově nezávislý i závislý výpočet vzájemné korelace je využita pomocná funkce back_xcorrm se vstupními daty xtf (reference) a ytf (testovaný zvuk), které mohou být jak krátké rámce, tak celé signály. Vztah 2.2 je realizován následujícím kódem: coeff1=xtf-mean(xtf(:)); coeff2=ytf-mean(ytf(:)); buf1=coeff1.*coeff2; buf2=coeff1.^2; buf3=coeff2.^2; rm=sum(buf1(:))/sqrt(sum(buf2(:))*sum(buf3(:))); Koeficienty pro výpočet P SM ze vztahu 2.3 jsou realizovány sumou kvadrátů jednotlivých modulačních pásem (pro vyhodnocení přes funkci cellfun delegovanou na funkci back_sqsum). Vyhodnocení koeficientů a následné vynásobení a sumace (pro efektivitu realizované maticovým násobením) je realizováno následujícími dvěma řádky: wm=yssum./sum(yssum); outvalues.psm=cell2mat(rm)*wm ; K výpočtu P SM t ) je získána okamžitá aktivita skrze průměry 1 ms dlouhých rámců pomocí funkce back_iact. Dále jsou využity funkce vykonávající vzá
25 3 IMPLEMENTACE MODELŮ A TESTŮ jemnou korelaci (back_iaq) a sumu kvadrátů (back_sqsumst) s totožnými rámci pro zjištění okamžité kvality. Váhování a získání 5% kvantilu je provedeno seřazením hodnot krátkodobé kvality (buf_iaq) s přiřazenými hodnotami aktivity stejných rámců (buf_iact). Index, u kterého postupná integrace hodnot aktivity přesáhne 5% sumy aktivit, je výsledná hodnota. fivepercent=sum(buf_iact)*.5; buf=sortrows([buf_iaq buf_iact ]); integr=; index=1; while (integr<(fivepercent)) index=index+1; integr=integr+buf(index,2); end outvalues.psmt=buf(index,1); Poslední krok je zjištění ODG realizované následujícím přepočtem: ODGa=-.22;ODGb=.98;ODGc=-4.13;ODGd=16.4;ODGx=.864; if (outvalues.psmt<odgx) outvalues.odg=max(-4,(odga/(outvalues.psmt-odgb))+odgc); else outvalues.odg=odgd*outvalues.psmt - ODGd; end 3.2 Modifikovaný CASP V rámci této práce byl rovněž implementován alternativní model sluchové cesty vycházející z modelu CASP zahrnující několik úprav převážně z modelu MAP. Pro prvky identické s modelem sluchové cesty obsaženým v PEMO-Q byl využit identický kód, avšak byl přepsán blok bazilární membrány, přidán blok vnějšího a středního ucha a provedeny další úpravy popsané v kapitole Blok vnějšího ucha byl vytvořen po vzoru modelu MAP, tedy za pomocí dvou rezonančních filtrů. Koeficienty pro filtry jsou vypočteny pomocnou funkcí mod_res_filter následujícím kódem, kde fc je střední kmitočet, bw šířka pásma a fs vzorkovací kmitočet: dt=1/fs; q=pi*dt*bw;
26 3 IMPLEMENTACE MODELŮ A TESTŮ tq=tan(q); J=1/(1+cot(q)); K=(2*cos(2*pi*dt*fc))/((1+tq)*cos(q)); L=(tq-1)/(tq+1); rfcoeffs.b=[j -J]; rfcoeffs.a=[1 -K -L]; Koeficienty pro transformační filtry byly získány funkcí butter zahrnutou mezi funkcemi interpretu MATLAB. DRNL banka modelující bazilární membránu byla rovněž implementována po vzoru modelu MAP. Kmitočty a šířky pásma pro nelineární část byly využity identické jako u modelu sluchové cesty PEMO-Q. Z těch bylo možné vztahem 2.9 vypočíst kmitočty, a při zachování pravidla 1 ERB i šířky pásma, pro lineární část. Řády gammatónových filtrů jsou ve všech případech 1, dolní propusti jsou Butterworthovy filtry (sestavené funkcí butter) a v kaskádách jsou vždy 3 identické filtry. K vyhodnocení kompresního prvku je ještě nezbytné odvodit parametr b. Při znalosti mezní vstupní hodnoty x = /2, parametru a = a c =.2 lze nalezením řešení rovnice a x = b x c (3.8) zjistit hodnotu b =.32. Zisk lineární části je definován skalárním číslem 5. Před stupněm adaptivní kaskády byl v porovnání s PEMO-Q přidán expanzní člen, který spočívá v zisku 38 db a kvadrátu. Minimální hodnota pro adaptivní kaskádu byla snížena na a přidaná dolní propust o kmitočtu 15 Hz před modulační bankou byla realizována butterworthovým filtrem prvního řádu navrženou funkcí butter. 3.3 Modelované artefakty Pro analýzu vlivu artefaktů přítomných v analogových záznamech popsaných v kapitole 2.2 na výstupní hodnoty PEMO-Q byly tyto artefakty modelovány pomocí zvláštních funkcí, které do vstupního signálu zanesou zvolenou míru modelovaného artefaktu. Pro modelování krátkých impulzních poruch je k dispozici funkce preproc_imp, která do vstupního signálu aditivně vloží impulzy bílého šumu o zvolené délce a amplitudě odpovídající amplitudě původního signálu. Impulzy jsou rovnoměrně rozložené po signálu z důvodu reprodukovatelnosti a jejich počet je definován na vstupu zvoleným počtem impulzů na sekundu zvuku
27 3 IMPLEMENTACE MODELŮ A TESTŮ 1.5 A [-] t [s] Obrázek 6: Použitý nízkofrekvenční impulz Krátké nízkofrekvenční impulzy jsou ve funkci preproc_trans modelovány harmonickou funkcí o kmitočtu 3 Hz s exponenciální obálku o celkové délce 2 ms za pomocí těchto dvou řádků kódu (s vzorkovacím kmitočtem fs): t=:1/fs:.2-(1/fs); imp=exp(-4.*t).*cos(6*pi*t); Impulzy jsou rovněž rovnoměrně rozložené a parametr míry je celkový počet vložených impulzů. Impulz získaný uvedeným vztahem je zobrazen na obrázku 6. Šum je modelován funkcí preproc_noise a přičítá k původnímu zvuku růžový šum. Ten byl zvolen pro charakter blízký lidskému vnímání hlasitostí. Šum je vytvořen pomocí filtrace bílého šumu váhováním ve frekvenční oblasti. Váha je 1/ m, kde m je index vzorku ve frekvenční oblasti. Váhy jsou vypočteny jen pro unikátní body spektra, body v druhé polovině diskrétního spektra odpovídají zrcadlené verzi první poloviny pro zachování reálného charakteru signálu v časové oblasti. Kromě samotného signálu je dalším vstupním parametrem funkce amplituda šumu v db. Poslední modelovaný artefakt je nelineární zkreslení v podobě tvrdého limiteru za pomocí funkce preproc_limit. Limitace samotná je realizována tímto řádkem: y=sign(x).*min(abs(x),threshold); Vstupním parametrem je úroveň limitace v db relativně k úrovni signálu. Přepočtem do lineární míry je zjištěna mez použitá v uvedeném kódu. Vliv míry uvedených artefaktů na výstupní hodnoty modelu PEMO-Q byl otestován modelováním artefaktů pomocí výše uvedených funkcí na třech referenč
28 3 IMPLEMENTACE MODELŮ A TESTŮ ních signálech. Prvním je přes celé slyšitelné spektrum logaritmicky rozmítaný sinusový signál o délce pěti vteřin generovaný funkcí chirp. Druhým je mužská promluva v anglickém jazyce (vzorek č. 5 z testovací kompilace SQAM [23]) a třetím je orchestr (prvních 15 vteřin SQAM vzorku 68). Čistý referenční vzorek a testovací vzorek s modelovaným artefaktem (s normovaným mediánem výkonů prostřednictvím funkce preproc_norm) jsou samostatně vyhodnoceny oběma modely sluchové cesty a jsou vyhodnoceny hodnoty P SM, P SM t a ODG. Závislosti míry ovlivnění zvuku artefaktem jsou vyneseny do grafů přítomných v příloze 1 a rozebraných v kapitole 4.1. Pro modelování šumu byly zvoleny úrovně amplitudy šumu od 1 do 5 db s krokem 1 db. Krátké šumové poruchy mají stanovenou délku 1 ms a jejich četnost je od do 1 poruch na vteřinu s krokem.5 poruch za vteřinu. Limitace probíhá po krocích 5 db od žádné limitace až po úroveň -9 db. Krátkých přechodných impulzů je do signálu zaneseno od do 1. Tento test je k nalezení ve skriptu arttest.m. 3.4 Odstranění šumu K otestování myšlenky vytvoření umělé reference potlačením šumu byla definována funkce nremove implementující všechny tři metody uvedené v kapitole Signál je v této funkci separován na rámce o velikosti 124 vzorků s překryvem 5%. Z těchto rámců je zjištěna hodnota RMS, přičemž zvolený počet rámců s nejnižší hodnotou je využit k odhadu výkonového spektra šumu. Tento postup vychází z předpokladu, že šum je stacionární aditivní prvek, tudíž v částech signálu s nejnižším výkonem je nejpravděpodobnější výskyt šumu samotného. Pro potlačení minim způsobených nestacionárním charakterem takto krátkých rámců je výkonové spektrum odhadnuto přes více rámců. Každý frekvenční vzorek výsledného výkonového spektra je vždy ten největší daného indexu mezi vybranými rámci. Počet zohledněných rámců je vhodné zvolit dle množství tichých částí ve zvuku: příliš malý počet může nedostatečně zohlednit krátkodobou nestacionaritu a příliš velký může do odhadu zahrnout i nešumové složky a zvětšit nežádoucí zkreslení zvuku. Před výpočtem výkonových spekter rámců vybraných pro odhad je aplikováno Hannovo okno pro minimalizaci přetékání. Identické okno je aplikováno též na rámce vstupního signálu při aplikaci samotné filtrace rovněž pro potlačení přetékání a navíc pro odstranění nespojitostí k rekonstrukci typu overlap-add po filtraci. Vytvoření reference je vyzkoušeno dvěma metodami. První, představená ve - 3 -
29 3 IMPLEMENTACE MODELŮ A TESTŮ skriptu noreftest.m, je modelová a využívá uměle zašuměné signály řeči a hudby popsané v předchozí kapitole (harmonický signál je vynechán pro nemožnost použití uvedené metody získání profilu šumu). Výstupní hodnoty PEMO-Q s využitím umělé reference jsou porovnány s těmi získanými se skutečnou referencí. Druhá metoda je bezreferenční analýza reálných digitalizovaných analogových záznamů poskytnutých vedoucím práce a je vyhodnocena funkcí subjtest_func přijímající seznam souborů k analýze v textovém souboru s každým jménem souboru na zvláštním řádku. Odhad spektra šumu není zesílen a počty rámců pro odhad jsou 4 u modelových testů, 5 u analogových záznamů s hudebním obsahem a 4 u záznamů s obsahem jiným
30 4 VÝSLEDKY 4 Výsledky 4.1 Testy modelovaných artefaktů Vyhodnocením uvedených testů byly získány závislosti uvedené v příloze 1 s ukázkou uvedenou na obrázku 7. Zobrazeny jsou jen průběhy hodnot P SM a ODG vzhledem ke skutečnosti, že P SM t je nosičem identické informace jako ODG. Pro model PEMO-Q byly ve všech případech dosaženy předpokládané výsledky v podobě klesajícího výstupu. V případě krátkých nízkofrekvenčních impulzů se projevila lokální maxima, což však lze přisoudit spojitostí mezi rušivostí impulzu a charakterem zvuku, ve kterém se impulz nachází. Tuto domněnku podporuje fakt, že v rozmítaném harmonickém signálu se žádný takový lokální extrém nevyskytuje. S využitím substitučního modelu sluchové cesty CASP byly splněny předpoklady jen u limitace a při zohlednění výrazně nižší citlivosti i u šumu. Všechny ostatní testy projevily výrazné lokální extrémy. Možné interpretace těchto výsledků jsou špatná citlivost modelu CASP na artefakty krátkého impulzního charakteru, nevhodné parametry modelu pro tyto artefakty či chybná implementace modelu. 4.2 Modelový bezreferenční test Výsledky testu popsaného v kapitole 3.4 jsou zobrazeny na obrázku 8. Z těchto dat plyne, že korelace hodnot samotného PEMO-Q mezi výsledky získanými s použitím skutečné reference je relativně malá a že bezreferenční metoda podává ve většině případů výsledky lepší, než jaké jsou. Jediná výjimka je časově závislá hodnota PEMO-Q PEMO-Q + CASP Chirp PSM Chirp ODG Promluva PSM Promluva ODG Orchestr PSM Orchestr ODG Chirp PSM Chirp ODG Promluva PSM Promluva ODG Orchestr PSM Orchestr ODG PSM [-].5-2 ODG [-] PSM [-].5-2 ODG [-] Pocet [impulzy] Pocet [impulzy] Obrázek 7: Výstupní závislosti hodnot PEMO-Q na počtu n.f. impulzů
31 4 VÝSLEDKY PEMO-Q PEMO-Q + CASP Promluva PSM bez ref. Promluva ODG bez ref. Orchestr PSM bez ref. Orchestr ODG bez ref. Promluva PSM Promluva ODG Orchestr PSM Orchestr ODG Promluva PSM bez ref. Promluva ODG bez ref. Orchestr PSM bez ref. Orchestr ODG bez ref. Promluva PSM Promluva ODG Orchestr PSM Orchestr ODG PSM [-].5-2 ODG [-] PSM [-].5-2 ODG [-] Uroven sumu [db] Uroven sumu [db] Obrázek 8: Výstupní závislosti hodnot PEMO-Q na úrovni šumu s využitím skutečné i umělé reference u vzorku orchestru, kdy už při velmi nízkých hodnotách šumu je signál vyhodnocen jako velmi rušivě zkreslený. Pravděpodobné vysvětlení tohoto výsledku je špatný odhad šumu způsobený skutečností, že hudební signál obsahuje velmi málo tichých míst. Poměrně nevýrazné a nejednoznačné výsledky bezreferenčního testu lze vysvětlit možným nedostatečným či nesprávným potlačením šumu Wienerovým filtrem. Vzhledem ke skutečnosti, že profil šumu byl jen hrubě odhadnut, je nejasné do jaké míry jsou tyto výsledky ovlivněny zkreslením signálu filtrací. Hodnoty získané využitím modelu CASP začínají, opět s výjimkou časové závislé hodnoty u vzorku orchestru, jevit pokles až při velmi vysokých hodnotách šumu. Poté však začínají jevit hodnoty srovnatelné či nižší oproti samotnému PEMO-Q. Hodnoty však v nezanedbatelné míře kolísají, tudíž je nelze považovat za spolehlivý zdroj informací o kvalitě. 4.3 Výsledky reálných vzorků Získané výsledky pokusné bezrefenční analýzy mají v naprosté většině případů velmi polarizovaný charakter, že mnoho vzorků je hodnoceno jako buď velmi kvalitní s artefakty výrazně pod hranicí slyšitelnosti, anebo velmi rušivě zkreslené. Vzhledem ke skutečnosti, že mnoho negativních výsledků pochází z hudebních vzorků, lze usuzovat, že se často nepodařilo získat vhodný profil šumu. Tyto fakta, spolu s poměrně nejednoznačnými výsledky předchozího testu, znehodnocují možnost použití bezreferenčního testu v aktuální podobě. Mezi vý
32 4 VÝSLEDKY sledky hodnoty P SM pro samotné PEMO-Q se rovněž objevila řada hodnot nota-number. Pravděpodobné vysvětlení je v nestabilitě adaptivní kaskády, která není ošetřena jako např. hrubým popisem kontroly, který zmínil Harlanderet al. [6]. Hodnoty jdoucí nad všechny meze vyhodnocené jako nekonečně velké mohou totiž v bloku vzájemné korelace mít uvedený výstup. Data tohoto testu jsou k dispozici k nahlédnutí v souboru analog_vysledky.csv umístěném v příloze
33 5 ZÁVĚR 5 Závěr Z výsledků získaných v kapitole 4.1 lze vyvodit, že implementovaný model objektivního hodnocení PEMO-Q má potenciál pro kvalitativní zhodnocení analogových nahrávek za přítomnosti dostatečně kvalitní reference. Jestli je však vyhodnocená míra rušivosti těchto artefaktů blízká lidskému vnímání není možné určit bez vyhodnocení subjektivních testů se stejnými vzorky. Substituční model sluchové cesty CASP ve většině případů nepodal žádné přesvědčivé údaje. Je však otázkou, jestli by nebylo možné nalézt pro tyto účely vhodnou úpravu, že parametry tohoto modelu mají mnoho stupňů volnosti a některé jeho bloky mají několik alternativních verzí. V aktuální verzi v příloze této práce však jeho použití k analýze nelze doporučit, kromě výsledků také z důvodu větší složitosti a výpočetní náročnosti v porovnání s modelem sluchové cesty zahrnutým v PEMO-Q. Co se modifikací přiložených modelů týče, je určitě vhodné dále upravit adaptivní kaskádu modelu PEMO-Q pro zajištění stability, aby výstup modelu nemohl potenciálně obsahovat hodnotu not-a-number. Vzhledem k nepřesným odhadům spektrálních výkonů šumu a neznámému vlivu zkreslení Wienerovým filtrem na výstupy hodnotících modelů i při relativně dobrém odhadu šumového spektra nelze doporučit ani navrženou bezreferenční metodu. Kvůli skutečnosti, že metody rekonstrukce se dají považovat za formu zkreslení snažící se aproximovat neznámý výsledek, je otázkou, jestli metody na tomto principu mají vůbec potenciál být užitečným způsobem bezreferenčního hodnocení kvality
34 6 ZDROJE 6 Zdroje [1] Torsten Dau. Modeling auditory processing of amplitude modulation. BIS Verlag, [2] Brian R Glasberg and Brian CJ Moore. Derivation of auditory filter shapes from notched-noise data. Hearing research, 47(1):13 138, 199. [3] Simon Godsill, Peter Rayner, and Olivier Cappé. Digital audio restoration. Springer, 22. [4] SJ Godsill and CH Tan. Removal of low frequency transient noise from old recordings using model-based signal separation techniques. Applications of Signal Processing to Audio and Acoustics, IEEE ASSP Workshop on, pages 4 pp, [5] Richard L Goode, Mead Killion, Koshiro Nakamura, and Shinsei Nishihara. New knowledge about the function of the human middle ear: development of an improved analog model. Otology & Neurotology, 15(2): , [6] Niklas Harlander, Rainer Huber, and Stephan D. Ewert. Sound quality assessment using auditory models. J. Audio Eng. Soc, 62(5): , 214. [7] E. Hogenauer. An economical class of digital filters for decimation and interpolation. Acoustics, Speech and Signal Processing, IEEE Transactions on, 29(2): , Apr [8] Rainer Huber and Birger Kollmeier. PEMO-Q - a new method for objective audio quality assessment using a model of auditory perception. IEEE Transactions on Audio, Speech & Language Processing, 14(6): , 26. [9] ITU. ITU-R Recommendation BS : Methods for the Subjective Assessment of Small Impairments in Audio Systems Including Multichannel Sound Systems, [1] ITU. ITU-R Recommendation BS.1387-: Method for Objective Measurements of Perceived Audio Quality, [11] ITU. ITU-T Recommendation P.861: Methods for Objective and Subjective Assessment of Quality: Objective Quality Measurement of Telephone-band (3-34 Hz) Speech Codecs, [12] ITU. ITU-T Recommendation P.862: Perceptual Evaluation of Speech Quality (PESQ): An Objective Method for End-to-end Speech Quality Assessment of Narrow-band Telephone Networks and Speech Codecs,
IMPLEMENTACE OBJEKTIVNÍHO MODELU HODNOCENÍ KVALITY ZVUKU PEMO-Q V PROSTŘEDÍ MATLAB SE ZAHRNUTÝM MODELEM SLUCHOVÉ CESTY A MODELEM CASP
IMPLEMENTACE OBJEKTIVNÍHO MODELU HODNOCENÍ KVALITY ZVUKU PEMO-Q V PROSTŘEDÍ MATLAB SE ZAHRNUTÝM MODELEM SLUCHOVÉ CESTY A MODELEM CASP M. Zalabák Katedra radioelektroniky, ČVUT FEL v Praze Abstrakt Cílem
3 METODY PRO POTLAČENÍ ŠUMU U ŘE- ČOVÉHO SIGNÁLU
3 METODY PRO POTLAČENÍ ŠUMU U ŘE- ČOVÉHO SIGNÁLU V současné době se pro potlačení šumu u řečového signálu používá mnoho různých metod. Jedná se například o metody spektrálního odečítání, Wienerovy filtrace,
1. Vlastnosti diskretních a číslicových metod zpracování signálů... 15
Úvodní poznámky... 11 1. Vlastnosti diskretních a číslicových metod zpracování signálů... 15 1.1 Základní pojmy... 15 1.2 Aplikační oblasti a etapy zpracování signálů... 17 1.3 Klasifikace diskretních
ADA Semestrální práce. Harmonické modelování signálů
České vysoké učení technické v Praze ADA Semestrální práce Harmonické modelování signálů Jiří Kořínek 31.12.2005 1. Zadání Proveďte rozklad signálu do harmonických komponent (řeč, hudba). Syntetizujte
MĚŘENÍ A ANALÝZA ELEKTROAKUSTICKÝCH SOUSTAV NA MODELECH. Petr Kopecký ČVUT, Fakulta elektrotechnická, Katedra Radioelektroniky
MĚŘENÍ A ANALÝZA ELEKTROAKUSTICKÝCH SOUSTAV NA MODELECH Petr Kopecký ČVUT, Fakulta elektrotechnická, Katedra Radioelektroniky Při návrhu elektroakustických soustav, ale i jiných systémů, je vhodné nejprve
základní vlastnosti, používané struktury návrhové prostředky MATLAB problém kvantování koeficientů
A0M38SPP - Signálové procesory v praxi - přednáška 4 2 Číslicové filtry typu FIR a IIR definice operace filtrace základní rozdělení FIR, IIR základní vlastnosti, používané struktury filtrů návrhové prostředky
Akustika. 3.1 Teorie - spektrum
Akustika 3.1 Teorie - spektrum Rozklad kmitů do nejjednodušších harmonických Spektrum Spektrum Jedna harmonická vlna = 1 frekvence Dvě vlny = 2 frekvence Spektrum 3 vlny = 3 frekvence Spektrum Další vlny
Úvod do zpracování signálů
1 / 25 Úvod do zpracování signálů Karel Horák Rozvrh přednášky: 1. Spojitý a diskrétní signál. 2. Spektrum signálu. 3. Vzorkovací věta. 4. Konvoluce signálů. 5. Korelace signálů. 2 / 25 Úvod do zpracování
Signál v čase a jeho spektrum
Signál v čase a jeho spektrum Signály v časovém průběhu (tak jak je vidíme na osciloskopu) můžeme dělit na periodické a neperiodické. V obou případech je lze popsat spektrálně určit jaké kmitočty v sobě
Číslicové zpracování signálů a Fourierova analýza.
Číslicové zpracování signálů a Fourierova analýza www.kme.zcu.cz/kmet/exm 1 Obsah prezentace 1. Úvod a motivace 2. Data v časové a frekvenční oblasti 3. Fourierova analýza teoreticky 4. Fourierova analýza
Zpráva k semestrální práci z B2M31SYN Syntéza audio signálů
Zpráva k semestrální práci z B2M31SYN Syntéza audio signálů Část 1 - Syntéza orchestrálních nástrojů pro symfonickou báseň B.Smetany "Vltava" Cílem této části práce je syntetizovat symfonickou báseň B.Smetany
Lineární a adaptivní zpracování dat. 1. ÚVOD: SIGNÁLY a SYSTÉMY
Lineární a adaptivní zpracování dat 1. ÚVOD: SIGNÁLY a SYSTÉMY Daniel Schwarz Investice do rozvoje vzdělávání Osnova Úvodní informace o předmětu Signály, časové řady klasifikace, příklady, vlastnosti Vzorkovací
Číslicová filtrace. FIR filtry IIR filtry. ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE Fakulta elektrotechnická
ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE Fakulta elektrotechnická Ing. Radek Sedláček, Ph.D., katedra měření K13138 Číslicová filtrace FIR filtry IIR filtry Tyto materiály vznikly za podpory Fondu rozvoje
Moderní multimediální elektronika (U3V)
Moderní multimediální elektronika (U3V) Prezentace č. 13 Moderní kompresní formáty pro přenosné digitální audio Ing. Tomáš Kratochvíl, Ph.D. Ústav radioelektroniky, FEKT VUT v Brně Program prezentace Princip
Komprese dat Obsah. Komprese videa. Radim Farana. Podklady pro výuku. Komprese videa a zvuku. Komprese MPEG. Komprese MP3.
Komprese dat Radim Farana Podklady pro výuku Obsah Komprese videa a zvuku. Komprese MPEG. Komprese MP3. Komprese videa Velký objem přenášených dat Typický televizní signál - běžná evropská norma pracuje
31ZZS 9. PŘEDNÁŠKA 24. listopadu 2014
3ZZS 9. PŘEDNÁŠKA 24. listopadu 24 SPEKTRÁLNÍ ANALÝZA Fourierovy řady Diskrétní Fourierovy řady Fourierova transformace Diskrétní Fourierova transformace Spektrální analýza Zobrazení signálu ve frekvenční
Návrh frekvenčního filtru
Návrh frekvenčního filtru Vypracoval: Martin Dlouhý, Petr Salajka 25. 9 2010 1 1 Zadání 1. Navrhněte co nejjednodušší přenosovou funkci frekvenčního pásmového filtru Dolní propusti typu Bessel, která bude
Direct Digital Synthesis (DDS)
ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE Fakulta elektrotechnická Ing. Radek Sedláček, Ph.D., katedra měření K13138 Direct Digital Synthesis (DDS) Přímá číslicová syntéza Tyto materiály vznikly za podpory
Quantization of acoustic low level signals. David Bursík, Miroslav Lukeš
KVANTOVÁNÍ ZVUKOVÝCH SIGNÁLŮ NÍZKÉ ÚROVNĚ Abstrakt Quantization of acoustic low level signals David Bursík, Miroslav Lukeš Při testování kvality A/D převodníků se používají nejrůznější testovací signály.
filtry FIR zpracování signálů FIR & IIR Tomáš Novák
filtry FIR 1) Maximální překývnutí amplitudové frekvenční charakteristiky dolní propusti FIR řádu 100 je podle obr. 1 na frekvenci f=50hz o velikosti 0,15 tedy 1,1dB; přechodové pásmo je v rozsahu frekvencí
Zpráva k semestrální práci z předmětu Syntéza audio signálů. Vypracoval: Jakub Krista Zimní semestr 2016/2017 Datum odevzdání:
Zpráva k semestrální práci z předmětu Syntéza audio signálů Vypracoval: Jakub Krista Zimní semestr 2016/2017 Datum odevzdání: 31.12.2016 Obsah 1. Úvod... 2 2. Použité druhy syntéz... 3 2.1 Aditivní syntéza...
Vlastnosti a modelování aditivního
Vlastnosti a modelování aditivního bílého šumu s normálním rozdělením kacmarp@fel.cvut.cz verze: 0090913 1 Bílý šum s normálním rozdělením V této kapitole se budeme zabývat reálným gaussovským šumem n(t),
B2M31SYN SYNTÉZA AUDIO SIGNÁLŮ
B2M31SYN SYNTÉZA AUDIO SIGNÁLŮ zima 2016-2017 Roman Čmejla cmejla@fel.cvut.cz B2, místn.525 tel. 224 3522 36 http://sami.fel.cvut.cz/sms/ A2B31SMS - SYNTÉZA MULTIMEDIÁLNÍCH SIGNÁLŮ zima 2015-2016 http://sami.fel.cvut.cz/sms/
doc. Dr. Ing. Elias TOMEH Elias Tomeh / Snímek 1
doc. Dr. Ing. Elias TOMEH e-mail: elias.tomeh@tul.cz Elias Tomeh / Snímek 1 Frekvenční spektrum Dělení frekvenčního pásma (počet čar) Průměrování Časovou váhovou funkci Elias Tomeh / Snímek 2 Vzorkovací
VOLBA ČASOVÝCH OKEN A PŘEKRYTÍ PRO VÝPOČET SPEKTER ŠIROKOPÁSMOVÝCH SIGNÁLŮ
VOLBA ČASOVÝCH OKEN A PŘEKRYTÍ PRO VÝPOČET SPEKTER ŠIROKOPÁSOVÝCH SIGNÁLŮ Jiří TŮA, VŠB Technická univerzita Ostrava Petr Czyž, Halla Visteon Autopal Services, sro Nový Jičín 2 Anotace: Referát se zabývá
A7B31ZZS 10. PŘEDNÁŠKA Návrh filtrů 1. prosince 2014
A7B3ZZS. PŘEDNÁŠKA Návrh filtrů. prosince 24 Návrhy jednoduchých filtrů Návrhy složitějších filtrů Porovnání FIR a IIR Nástroje pro návrh FIR filtrů v MATLABu Nástroje pro návrh IIR filtrů v MATLABu Kvantování
Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze
Dobývání znalostí Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze Dobývání znalostí Pravděpodobnost a učení Doc. RNDr. Iveta Mrázová,
Akustika pro posluchače HF JAMU
Akustika pro posluchače HF JAMU Zvukové vlny a kmity (1) 2 Vnímání zvuku (3) 2 Akustika hudebního nástroje (2) 2 Akustika při interpretaci (2) 3 Záznam hry na hudební nástroje (2) 4 Seminární a samostatné
Číslicové filtry. Honza Černocký, ÚPGM
Číslicové filtry Honza Černocký, ÚPGM Aliasy Digitální filtry Diskrétní systémy Systémy s diskrétním časem atd. 2 Na co? Úprava signálů Zdůraznění Potlačení Detekce 3 Zdůraznění basy 4 Zdůraznění výšky
Fyziologická akustika. fyziologická akustika: jak to funguje psychologická akustika: jak to na nás působí
Fyziologická akustika anatomie: jak to vypadá fyziologická akustika: jak to funguje psychologická akustika: jak to na nás působí hudební akustika: jak dosáhnout libých počitků Anatomie lidského ucha Vnější
0.0001 0.001 0.01 0.1 1 10 100 1000 10000. Čas (s) Model časového průběhu sorpce vyplývá z 2. Fickova zákona a je popsán následující rovnicí
Program Sorpce1.m psaný v prostředí Matlabu slouží k vyhlazování naměřených sorpčních křivek a výpočtu difuzních koeficientů. Kromě standardního Matlabu vyžaduje ještě Matlab Signal Processing Toolbox
Jasové transformace. Karel Horák. Rozvrh přednášky:
1 / 23 Jasové transformace Karel Horák Rozvrh přednášky: 1. Úvod. 2. Histogram obrazu. 3. Globální jasová transformace. 4. Lokální jasová transformace. 5. Bodová jasová transformace. 2 / 23 Jasové transformace
Zvýrazňování řeči pomocí vícekanálového zpracování
Zvýrazňování řeči pomocí vícekanálového zpracování Václav Bolom, Pavel Sovka Katedra teorie obvodů Fakulta elektrotechnická České vysoké učení technické v Praze Technická 2, 66 27 Praha 6 Abstrakt Problém
Základní metody číslicového zpracování signálu část I.
A4M38AVS Aplikace vestavěných systémů Základní metody číslicového zpracování signálu část I. Radek Sedláček, katedra měření, ČVUT v Praze FEL, 2015 Obsah přednášky Úvod, motivace do problematiky číslicového
MATLAB. F. Rund, A. Novák Katedra radioelektroniky, FEL ČVUT v Praze. Abstrakt
PROBLÉM ŠPATNÉ SYNCHRONIZACE VZORKOVACÍCH KMITOČTŮ U MLS SIGNÁLŮ: MODEL V PROSTŘEDÍ MATLAB F. Rund, A. Novák Katedra radioelektroniky, FEL ČVUT v Praze Abstrakt Chceme-li hodnotit kvalitativní stránku
1 Zpracování a analýza tlakové vlny
1 Zpracování a analýza tlakové vlny 1.1 Cíl úlohy Prostřednictvím této úlohy se naučíte a zopakujete: analýzu biologických signálů v časové oblasti, analýzu biologických signálů ve frekvenční oblasti,
Lineární a adaptivní zpracování dat. 1. ÚVOD: SIGNÁLY, ČASOVÉ ŘADY a SYSTÉMY
Lineární a adaptivní zpracování dat 1. ÚVOD: SIGNÁLY, ČASOVÉ ŘADY a SYSTÉMY Daniel Schwarz Investice do rozvoje vzdělávání Osnova Úvodní informace o předmětu Signály, časové řady klasifikace, příklady,
UŽITÍ KOHERENČNÍ FUNKCE PRO DISTRIBUOVANOU
UŽITÍ KOHERENČNÍ FUNKCE PRO DISTRIBUOVANOU ANALÝZU VÍCEKANÁLOVÝCH SIGNÁLŮ Robert Háva, Aleš Procházka Vysoká škola chemicko-technologická, Abstrakt Ústav počítačové a řídicí techniky Analýza vícekanálových
Lineární a adaptivní zpracování dat. 3. SYSTÉMY a jejich popis ve frekvenční oblasti
Lineární a adaptivní zpracování dat 3. SYSTÉMY a jejich popis ve frekvenční oblasti Daniel Schwarz Osnova Opakování: systémy a jejich popis v časové oblasti Fourierovy řady Frekvenční charakteristika systémů
31SCS Speciální číslicové systémy Antialiasing
ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE 2006/2007 31SCS Speciální číslicové systémy Antialiasing Vypracoval: Ivo Vágner Email: Vagnei1@seznam.cz 1/7 Převod analogového signálu na digitální Složité operace,
VY_32_INOVACE_ENI_2.MA_05_Modulace a Modulátory
Číslo projektu Číslo materiálu CZ.1.07/1.5.00/34.0581 VY_32_INOVACE_ENI_2.MA_05_Modulace a Modulátory Název školy Střední odborná škola a Střední odborné učiliště, Dubno Autor Ing. Miroslav Krýdl Tematická
Abychom se vyhnuli užití diferenčních sumátorů, je vhodné soustavu rovnic(5.77) upravit následujícím způsobem
Abychom se vyhnuli užití diferenčních sumátorů, je vhodné soustavu rovnic(5.77) upravit následujícím způsobem I 1 = 1 + pl 1 (U 1 +( )), = 1 pc 2 ( I 1+( I 3 )), I 3 = pl 3 (U 3 +( )), 1 U 3 = (pc 4 +1/
Automatická detekce anomálií při geofyzikálním průzkumu. Lenka Kosková Třísková NTI TUL Doktorandský seminář, 8. 6. 2011
Automatická detekce anomálií při geofyzikálním průzkumu Lenka Kosková Třísková NTI TUL Doktorandský seminář, 8. 6. 2011 Cíle doktorandské práce Seminář 10. 11. 2010 Najít, implementovat, ověřit a do praxe
Zpráva k semestrální práci
ČVUT FEL Zpráva k semestrální práci A2B31SMS Jan Vimr 2017/2018 1. Postup Zadáním semestrální práce byla syntéza libovolného hudebního nástroje pro skladbu: Let čmeláka Nikolaj Rimskij Korsakov, dále odevzdat
Analýza a zpracování digitálního obrazu
Analýza a zpracování digitálního obrazu Úlohy strojového vidění lze přibližně rozdělit do sekvence čtyř funkčních bloků: Předzpracování veškerých obrazových dat pomocí filtrací (tj. transformací obrazové
Lineární a adaptivní zpracování dat. 2. SYSTÉMY a jejich popis v časové doméně a frekvenční doméně
Lineární a adaptivní zpracování dat 2. SYSTÉMY a jejich popis v časové doméně a frekvenční doméně Daniel Schwarz Investice do rozvoje vzdělávání Osnova Opakování: signály a systémy Vlastnosti systémů Systémy
1. Základy teorie přenosu informací
1. Základy teorie přenosu informací Úvodem citát o pojmu informace Informace je název pro obsah toho, co se vymění s vnějším světem, když se mu přizpůsobujeme a působíme na něj svým přizpůsobováním. N.
Lineární a adaptivní zpracování dat. 1. ÚVOD: SIGNÁLY, ČASOVÉ ŘADY a SYSTÉMY
Lineární a adaptivní zpracování dat 1. ÚVOD: SIGNÁLY, ČASOVÉ ŘADY a SYSTÉMY Daniel Schwarz Investice do rozvoje vzdělávání Osnova Úvodní informace o předmětu Signály, časové řady klasifikace, příklady,
KTE/TEVS - Rychlá Fourierova transformace. Pavel Karban. Katedra teoretické elektrotechniky Fakulta elektrotechnická Západočeská univerzita v Plzni
KTE/TEVS - Rychlá Fourierova transformace Pavel Karban Katedra teoretické elektrotechniky Fakulta elektrotechnická Západočeská univerzita v Plzni 10.11.011 Outline 1 Motivace FT Fourierova transformace
Laboratorní úloha č. 8: Elektroencefalogram
Laboratorní úloha č. 8: Elektroencefalogram Cíle úlohy: Rozložení elektrod při snímání EEG signálu Filtrace EEG v časové oblasti o Potlačení nf a vf rušení o Alfa aktivita o Artefakty Spektrální a korelační
Teoretický úvod: [%] (1)
Vyšší odborná škola a Střední průmyslová škola elektrotechnická Božetěchova 3, Olomouc Laboratoře elektrotechnických měření Název úlohy Číslo úlohy ZESILOVAČ OSCILÁTOR 101-4R Zadání 1. Podle přípravku
Flexibilita jednoduché naprogramování a přeprogramování řídícího systému
Téma 40 Jiří Cigler Zadání Číslicové řízení. Digitalizace a tvarování. Diskrétní systémy a jejich vlastnosti. Řízení diskrétních systémů. Diskrétní popis spojité soustavy. Návrh emulací. Nelineární řízení.
A7B31ZZS 4. PŘEDNÁŠKA 13. října 2014
A7B31ZZS 4. PŘEDNÁŠKA 13. října 214 A-D převod Vzorkování aliasing vzorkovací teorém Kvantování Analýza reálných signálů v časové oblasti řečové signály biologické signály ---> x[n] Analogově-číslicový
Lineární a adaptivní zpracování dat. 2. SYSTÉMY a jejich popis v časové doméně a frekvenční doméně
Lineární a adaptivní zpracování dat 2. SYSTÉMY a jejich popis v časové doméně a frekvenční doméně Daniel Schwarz Investice do rozvoje vzdělávání Osnova Opakování: signály a systémy Vlastnosti systémů Systémy
Vyhodnocení 2D rychlostního pole metodou PIV programem Matlab (zpracoval Jan Kolínský, dle programu ing. Jana Novotného)
Vyhodnocení 2D rychlostního pole metodou PIV programem Matlab (zpracoval Jan Kolínský, dle programu ing. Jana Novotného) 1 Obecný popis metody Particle Image Velocimetry, nebo-li zkráceně PIV, je měřící
P9 Provozní tvary kmitů
P9 Provozní tvary kmitů (měření a vyhodnocení) Pozn. Matematické základy pro tuto přednášku byly uvedeny v přednáškách Metody spektrální analýzy mechanických systémů Co jsou provozní tvary kmitů? Provozní
Lineární a adpativní zpracování dat. 3. Lineární filtrace I: Z-transformace, stabilita
Lineární a adpativní zpracování dat 3. Lineární filtrace I: Z-transformace, stabilita Daniel Schwarz Investice do rozvoje vzdělávání Osnova Opakování: signály, systémy, jejich vlastnosti a popis v časové
SIGNÁLY A SOUSTAVY, SIGNÁLY A SYSTÉMY
SIGNÁLY A SOUSTAVY, SIGNÁLY A SYSTÉMY TEMATICKÉ OKRUHY Signály se spojitým časem Základní signály se spojitým časem (základní spojité signály) Jednotkový skok σ (t), jednotkový impuls (Diracův impuls)
Úkol 1 Zpráva k semestrální práci k předmětu B2M31SYN Syntéza audio signálů Lukáš Krauz krauzluk@fel.cvut.cz Hlavním cílem této úlohy bylo vytvořit za pomoci MIDI souboru, obsahující noty a stopy k jednotlivým
SIGNÁLY A LINEÁRNÍ SYSTÉMY
SIGNÁLY A LINEÁRNÍ SYSTÉMY prof. Ing. Jiří Holčík, CSc. holcik@iba.muni.cziba.muni.cz II. SIGNÁLY ZÁKLADNÍ POJMY SIGNÁL - DEFINICE SIGNÁL - DEFINICE Signál je jev fyzikální, chemické, biologické, ekonomické
Akustika pro posluchače HF JAMU
Akustika pro posluchače HF JAMU Zvukové vlny a kmity (1)! 2 Vnímání zvuku (3)! 2 Akustika hudebního nástroje (2)! 2 Akustika při interpretaci (2)! 3 Záznam hry na hudební nástroje (2)! 4 Seminární a samostatné
Multimediální systémy
Multimediální systémy Jan Outrata KATEDRA INFORMATIKY UNIVERZITA PALACKÉHO V OLOMOUCI přednášky Získání obsahu Jan Outrata (Univerzita Palackého v Olomouci) Multimediální systémy Olomouc, září prosinec
Virtuální elektrody v kochleárních implantátech Nucleus 24
Virtuální elektrody v kochleárních implantátech Nucleus 24 Martin Vondrášek České vysoké učení v Praze, Fakulta elektrotechnická vondram3@fel.cvut.cz Abstrakt: Kochleární implantát je elektronické zařízení,
Měření na nízkofrekvenčním zesilovači. Schéma zapojení:
Číslo úlohy: Název úlohy: Jméno a příjmení: Třída/Skupina: / Měřeno dne: Měření na nízkofrekvenčním zesilovači Spolupracovali ve skupině Zadání úlohy: Na zadaném Nf zesilovači proveďte následující měření
vzorek1 0.0033390 0.0047277 0.0062653 0.0077811 0.0090141... vzorek 30 0.0056775 0.0058778 0.0066916 0.0076192 0.0087291
Vzorová úloha 4.16 Postup vícerozměrné kalibrace Postup vícerozměrné kalibrace ukážeme na úloze C4.10 Vícerozměrný kalibrační model kvality bezolovnatého benzinu. Dle následujících kroků na základě naměřených
DSY-4. Analogové a číslicové modulace. Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti
DSY-4 Analogové a číslicové modulace Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti DSY-4 analogové modulace základní číslicové modulace vícestavové modulace modulace s rozprostřeným
SIGNÁLY A LINEÁRNÍ SYSTÉMY
SIGNÁLY A LINEÁRNÍ SYSTÉMY prof. Ing. Jiří Holčík, CSc. holcik@iba.muni.cz II. SIGNÁLY ZÁKLADNÍ POJMY SIGNÁL - DEFINICE SIGNÁL - DEFINICE Signál je jev fyzikální, chemické, biologické, ekonomické či jiné
Operační zesilovač, jeho vlastnosti a využití:
Truhlář Michal 6.. 5 Laboratorní práce č.4 Úloha č. VII Operační zesilovač, jeho vlastnosti a využití: Úkol: Zapojte operační zesilovač a nastavte jeho zesílení na hodnotu přibližně. Potvrďte platnost
NOVÉ METODY HODNOCENÍ OBRAZOVÉ KVALITY
NOVÉ METODY HODNOCENÍ OBRAZOVÉ KVALITY Stanislav Vítek, Petr Páta, Jiří Hozman Katedra radioelektroniky, ČVUT FEL Praha, Technická 2, 166 27 Praha 6 E-mail: svitek@feld.cvut.cz, pata@feld.cvut.cz, hozman@feld.cvut.cz
Komplexní obálka pásmového signálu
České vysoké učení technické v Praze, Fakulta elektrotechnická X37SGS Signály a systémy Komplexní obálka pásmového signálu Daniel Tureček 8.11.8 1 Úkol měření Nalezněte vzorky komplexní obálky pásmového
DETEKCE HRAN V BIOMEDICÍNSKÝCH OBRAZECH
DETEKCE HRAN V BIOMEDICÍNSKÝCH OBRAZECH Viktor Haškovec, Martina Mudrová Vysoká škola chemicko-technologická v Praze, Ústav počítačové a řídicí techniky Abstrakt Příspěvek je věnován zpracování biomedicínských
Vold-Kalmanova řádová filtrace. JiříTůma
Vold-Kalmanova řádová filtrace JiříTůma Obsah Základy Kalmanovy filtrace Základy Vold-Kalmanovy filtrace algoritmus Globální řešení Příklady užití Vold-Kalmanovy řádové filtrace Kalmanův filtr ( n ) Process
Karel Mikuláštík Katedra radioelektroniky, ČVUT-FEL Radiokomunikace 2016, Pardubice
Karel Mikuláštík Katedra radioelektroniky, ČVUT-FEL Radiokomunikace 2016, Pardubice 18.10.2016 Úvod Zabezpečení signálu/pokrytí datová kapacita Větší počet stanic v MUXu => nižší kapacita/stanici Zvuková
Kompresní metody první generace
Kompresní metody první generace 998-20 Josef Pelikán CGG MFF UK Praha pepca@cgg.mff.cuni.cz http://cgg.mff.cuni.cz/~pepca/ Stillg 20 Josef Pelikán, http://cgg.mff.cuni.cz/~pepca / 32 Základní pojmy komprese
A/D převodníky - parametry
A/D převodníky - parametry lineární kvantování -(kritériem je jednoduchost kvantovacího obvodu), parametry ADC : statické odstup signálu od kvantizačního šumu SQNR, efektivní počet bitů n ef, dynamický
KONVERZE VZORKOVACÍHO KMITOČTU
VOLUME: 8 NUMBER: 00 BŘEZEN KONVERZE VZORKOVACÍHO KMITOČTU Jan VITÁSEK Katedra telekomunikační techniky, Fakulta elektrotechniky a informatiky, VŠB-TU Ostrava, 7. Listopadu 5, 708 33 Ostrava-Poruba, Česká
teorie elektronických obvodů Jiří Petržela analýza šumu v elektronických obvodech
Jiří Petržela co je to šum? je to náhodný signál narušující zpracování a přenos užitečného signálu je to signál náhodné okamžité amplitudy s časově neměnnými statistickými vlastnostmi kde se vyskytuje?
Klasifikace hudebních stylů
Klasifikace hudebních stylů Martin Šimonovský (mys7@seznam.cz) Rozpoznávání hudby úloha z oblasti DSP klasifikace dle hudebních stylů
Příloha č. 1. amplitudová charakteristika filtru fázová charakteristika filtru / frekvence / Hz. 1. Určení proudové hustoty
Příloha č. 1 Při hodnocení expozice nízkofrekvenčnímu elektromagnetickému poli (0 Hz 10 MHz) je určující veličinou modifikovaná proudová hustota J mod indukovaná v tělesné tkáni. Jak je uvedeno v nařízení
SYNTÉZA AUDIO SIGNÁLŮ
SYNTÉZA AUDIO SIGNÁLŮ R. Čmejla Fakulta elektrotechnická, ČVUT v Praze Abstrakt Příspěvek pojednává o technikách číslicové audio syntézy vyučovaných v předmětu Syntéza multimediálních signálů na Elektrotechnické
Analogové modulace. Podpora kvality výuky informačních a telekomunikačních technologií ITTEL CZ.2.17/3.1.00/36206
EVROPSKÝ SOCIÁLNÍ FOND Analogové modulace PRAHA & EU INVESTUJEME DO VAŠÍ BUDOUCNOSTI Podpora kvality výuky informačních a telekomunikačních technologií ITTEL CZ.2.17/3.1.00/36206 Modulace Co je to modulace?
P7: Základy zpracování signálu
P7: Základy zpracování signálu Úvodem - Signál (lat. signum) bychom mohli definovat jako záměrný fyzikální jev, nesoucí informaci o nějaké události. - Signálem je rovněž funkce, která převádí nezávislou
1. Úvod Jednou z! "# $ posledn % & $$' ( )(( (*+ % ( (* $ $%, (* ( (* obvodech pro elektronickou regulaci.*' (( $ /
Praze 1. Úvod Jednou z! "# $ posledn % & $$' ( )(( (*+ % ( (* $ $%, (* ( (* obvodech pro elektronickou regulaci ' (% tramvajích a trolejbusech s tyristorovou výstrojí nebo v pohonech '$ (-- %.*' (( $ /
ANALÝZA POTLAČOVÁNÍ AKUSTICKÉHO ECHA A DTD DETEKCE V CHYTRÝCH TELEFONECH
ANALÝZA POTLAČOVÁNÍ AKUSTICKÉHO ECHA A DTD DETEKCE V CHYTRÝCH TELEFONECH Jan Klapuch, Petr Pollák České vysoké učení technické v Praze, Fakulta elektrotechnická, K13131 klapujan@fel.cvut.cz, pollak@fel.cvut.cz
Syntéza audio signálů Aditivní syntéza symfonického orchestru a akordeonu
Syntéza audio signálů Aditivní syntéza symfonického orchestru a akordeonu Bedřich Smetana - Vltava 3 oktávy durové stupnice Johann C. F. Fischer - Preludium a fuga G dur Bedřich Smetana - Jiřinková polka
PŘEDMLUVA 11 FORMÁLNÍ UJEDNÁNÍ 13
OBSAH PŘEDMLUVA 11 FORMÁLNÍ UJEDNÁNÍ 13 1 ÚVOD, Z. Raida 15 1.1 Mikrovlnné kmitočtové pásmo 15 1.2 Diferenciální formulace Maxwellových rovnic 16 1.3 Integrální formulace Maxwellových rovnic 18 1.4 Obecný
Modulace a šum signálu
Modulace a šum signálu PATRIK KANIA a ŠTĚPÁN URBAN Nejlepší laboratoř molekulové spektroskopie vysokého rozlišení Ústav analytické chemie, VŠCHT Praha kaniap@vscht.cz a urbans@vscht.cz http://www.vscht.cz/anl/lmsvr
" Furierova transformace"
UNIVERZITA JANA EVANGELISTY PURKYNĚ V ÚSTÍ NAD LABEM FAKULTA ŽIVOTNÍHO PROSTŘEDÍ " Furierova transformace" Seminární práce z předmětu Dálkový průzkum Země Marcela Bartošová, Veronika Bláhová OŽP, 3.ročník
PŘELAĎOVÁNÍ AKTIVNÍCH FILTRŮ POMOCÍ NAPĚŤOVĚ ŘÍZENÝCH ZESILOVAČŮ
PŘELAĎOVÁNÍ AKTIVNÍCH FILTRŮ POMOCÍ NAPĚŤOVĚ ŘÍZENÝCH ZESILOVAČŮ Tuning Active Filters by Voltage Controlled Amplifiers Vladimír Axman *, Petr Macura ** Abstrakt Ve speciálních případech potřebujeme laditelné
9. PRINCIPY VÍCENÁSOBNÉHO VYUŽITÍ PŘENOSOVÝCH CEST
9. PRINCIPY VÍCENÁSOBNÉHO VYUŽITÍ PŘENOSOVÝCH CEST Modulace tvoří základ bezdrátového přenosu informací na velkou vzdálenost. V minulosti se ji využívalo v telekomunikacích při vícenásobném využití přenosových
r Odvoď te přenosovou funkci obvodů na obr.2.16, je-li vstupem napě tí u 1 a výstupem napě tí u 2. Uvaž ujte R = 1Ω, L = 1H a C = 1F.
Systé my, procesy a signály I - sbírka příkladů NEŘ EŠENÉPŘ ÍKADY r 223 Odvoď te přenosovou funkci obvodů na obr26, je-li vstupem napě tí u a výstupem napě tí Uvaž ujte Ω, H a F u u u a) b) c) u u u d)
Binární data. Číslicový systém. Binární data. Klávesnice Snímače polohy, dotykové displeje, myš Digitalizovaná data odvozená z analogového signálu
5. Obvody pro číslicové zpracování signálů 1 Číslicový systém počítač v reálném prostředí Klávesnice Snímače polohy, dotykové displeje, myš Digitalizovaná data odvozená z analogového signálu Binární data
2. Číslicová filtrace
Żpracování signálů a obrazů 2. Číslicová filtrace.......... Petr Česák Zimní semestr 2002/2003 . 2. Číslicová filtrace FIR+IIR ZADÁNÍ Účelem cvičení je seznámit se s průběhem frekvenčních charakteristik
A2B31SMS 11. PŘEDNÁŠKA 4. prosince 2014
A2B31SMS 11. PŘEDNÁŠKA 4. prosince 214 Číslicové audio efekty Hřebenové filtry Fázovací filtry Dozvuky Konvoluční reverb Schroederův algoritmus modelování dozvuku Číslicové audio efekty Filtrace - DP,
Měření vlastností datového kanálu
ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE Fakulta elektrotechnická ÚLOHA E Měření vlastností datového kanálu Vypracoval: V rámci předmětu: Jan HLÍDEK Základy datové komunikace (X32ZDK) Měřeno: 14. 4. 2008 Cvičení:
Semestrální práce z předmětu Syntéza audio signálů
Semestrální práce z předmětu Syntéza audio signálů Téma: Syntéza orchestrálních nástojů ve skladbě Vltava od Bedřicha Smetany a syntéza zvuku mouchy Dominik Šmíd zimní semestr 2016/17 Obsah: 1. Úvod 2.
RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.
Analýza dat pro Neurovědy RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Jaro 2014 Institut biostatistiky Janoušová, a analýz Dušek: Analýza dat pro neurovědy Blok 7 Jak hodnotit vztah spojitých proměnných
MĚŘENÍ ÚHLOVÝCH KMITŮ ZA ROTACE
26. mezinárodní konference DIAGO 27 TECHNICKÁ DIAGNOSTIKA STROJŮ A VÝROBNÍCH ZAŘÍZENÍ MĚŘENÍ ÚHLOVÝCH KMITŮ ZA ROTACE Jiří TŮMA VŠB Technická Univerzita Ostrava Osnova Motivace Kalibrace měření Princip
Semestrální projekt. Vyhodnocení přesnosti sebelokalizace VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ. Fakulta elektrotechniky a komunikačních technologií
VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ Fakulta elektrotechniky a komunikačních technologií Semestrální projekt Vyhodnocení přesnosti sebelokalizace Vedoucí práce: Ing. Tomáš Jílek Vypracovali: Michaela Homzová,
Základy a aplikace digitálních. Katedra radioelektroniky (13137), blok B2, místnost 722
Základy a aplikace digitálních modulací Josef Dobeš Katedra radioelektroniky (13137), blok B2, místnost 722 dobes@fel.cvut.cz 6. října 2014 České vysoké učení technické v Praze, Fakulta elektrotechnická