GEEROVÁÍ VÍCEKÁLOVÉHO DITHERU Z. ureš, F. Kdlec ČVUT v Prze, Fkult elektrotechnická, ktedr rdioelektroniky bstrkt Při kvntizci zvukových signálů dochází ke vzniku chybového signálu, který ovlivňuje kvlitu zprcovávného zvuku. Z účelem zlepšení perceptuálních vlstností kvntizčního šumu je využíván ditivní šum, tzv. dither. V následujícím článku je uveden metod efektivního generování ditheru pro víceknálový udio signál. Úvod Číslicové zprcování zvukových signálů (DSP) s sebou přináší jevy, které mjí vliv n vnímnou kvlitu zvuku. Chybový signál vznikjící při kvntizci signálu, tzv. kvntizční šum, se negtivně projevuje zejmén u signálů nízké úrovně. Zde ztrácí chrkter šumu zčne se projevovt vznikem hrmonických složek []. Podsttným spektem kvntizčního šumu je závislost jeho vlstností n vstupním kvntovném signálu. Ukzuje se, že pro zlepšení vnímné jkosti zvuku je nutné tuto závislost potlčit, nebo lespoň zčásti odstrnit. Z tímto účelem je využíván ditivní šum, tzv. dither. Dither je pseudonáhodný signál přičítný ke vstupnímu signálu, jehož vlstnosti, zejmén rozdělení hustoty prvděpodobnosti (PDF), determinují prmetry výsledného chybového signálu. Pomocí nesubtrktivního ditheringu lze zručit nezávislost pouze zákldních sttistických momentů chybového signálu n vstupním signálu []. Z hledisk vnímné kvlity se jko perceptuálně význmné jeví první dv sttistické momenty ditheru, tedy střední hodnot rozptyl. Jejich nezávislost n vstupním signálu je zjištěn použitím pseudonáhodného signálu s lespoň trojúhelníkovým rozdělením hustoty prvděpodobnosti. Použitím ditheringu docílíme potlčení nežádoucích složek vznikjících v průběhu DSP zvukových signálů. čkoliv přidáním ditheru dochází ke snížení celkové úrovně odstupu signálu od šumu, vnímání tkto uprvených zvukových signálů je příznivější. Víceknálový zvuk implikuje potřebu generovt součsně více relizcí ditheru. Pro optimální prostorový vjem chybového signálu je vhodné, by n kždý zvukový knál byl plikován nezávislá relizce ditheru. Při použití jedné relizce pseudonáhodného signálu ve více knálech by mohlo docházet ke korelci šumu mezi knály, s negtivním dopdem n vjem kvlity. Generování nezávislé relizce ditheru pro kždý knál smosttně může všk být výpočetně neúnosné. Vhodný víceknálový dither lze efektivně generovt pomocí speciálně nvržených mtic. Zákldní definice Při zprcování zvukových signálů budeme předpokládt /D převodník, který provádí v podsttě oříznutí či zokrouhlení vstupního signálu x. Dither ν je náhodný signál, přidný ke vstupnímu signálu před kvntizcí, z účelem dosžení nezávislosti zákldních sttistických momentů celkového chybového signálu ε n vstupu, kde ε y x ν () Oznčíme-li q mplitudu odpovídjící nejméně význmnému bitu (LS), můžeme definovt náhodný proces s rovnoměrnou hustotou rozložení prvděpodobnosti (RPDF) jko p ( x) q q q pro - < x () jink
Sečteme-li n náhodných RPDF procesů, budeme výsledný náhodný proces oznčovt jko nrpdf. Důležitý je výsledek, který říká, že nesubstrktivní dither, generovný sumcí n sttisticky nezávislých RPDF procesů, dává n prvních sttistických momentů celkové chyby nezávislých n vstupu systému, pro n způsobuje celkový chybový výkon rovný ( n + ) q / []. Pro zprcování zvukových signálů stčí obvykle použít dither typu RPDF, tedy s trojúhelníkovou hustotou prvděpodobnosti, neboť pouze první dv sttistické momenty (střední hodnot rozptyl) se jeví jko perceptuálně význmné. Pokud jsou nvíc jednotlivé vzorky ditheru vzájemně nezávislé, pk má chybový signál chrkter bílého šumu je vhodný tké pro systémy s tvrováním šumu. 3 Generování pseudonáhodných signálů Pro generování ditheru používném při zprcování zvukových signálů postčují jednoduché kongruenční generátory, jsou-li vhodně nvrženy. Lineární kongruenční generátor tvoří periodické posloupnosti kldných celých čísel I n tk, že I ( JI ) mod M n n + +, n,, 3,, M (3) kde J je zvolená konstnt, počáteční člen I lze volit libovolně. Period posloupnosti je zřejmě menší nebo rovn M. Period je přímo rovn M, pokud J 4 K + L M (4) kde K L jsou celá čísl tk, že M > J. L lze chápt jko délku slov v bitech. Pro zprcování stereofonního zvukového signálu při vzorkovcí frekvenci 44, khz je třeb zvolit L >. Vhodné je npříkld volit J ( ) 4 + I 9 3 M (5) áhodný signál typu RPDF lze vytvořit sečtením párů vzorků ze dvou RPDF sekvencí. Tkový dither pk může být pomocí D/ převodníku s vysokým rozlišením veden n nlogový vstup systému jko nlogový dither. 4 Víceknálový dither Jk bylo řečeno, dither typu nrpdf lze vytvořit generováním n nezávislých náhodných procesů s rovnoměrným rozložením hustoty prvděpodobnosti jejich součtem. Pro víceknálový systém je všk tento způsob znčně neefektivní může být výpočetně příliš náročný. Proto je snh využít náhodných čísel vícekrát. příkld při zprcování stereofonního signálu lze generovt dvě RPDF posloupnosti η η, pro jeden knál vzorky sčítt pro druhý odečítt [3]: ν + ν (6) η η η η Tkto jednoduše vzniklé posloupnosti RPDF nejsou ovšem nvzájem sttisticky nezávislé, je tedy třeb prokázt, že jejich použití nepovede ke vzájemné korelci chybových signálů mezi knály. Výše popsný způsob lze zobecnit pro více knálů s tím, že vyloučíme vzájemné korelce chybových signálů mezi knály. Výstup generátoru ditheru budeme uvžovt jko sloupcový vektor
T ( ν,..., ν ν ) rovněž vektorem, kde je počet zvukových knálů. Jednotlivé vnitřní RPDF procesy lze oznčit η T ( η,..., ) η M, obecně M. Pk pltí ν η (7) kde ( ) (8) ij je konstntní mtice M. Lze dokázt [], že není možné generovt více než nekorelovných náhodných procesů kombincemi náhodných procesů, tedy M. Pro výše uvedené schém je npříkld (9) Pro vyloučení vzájemné korelce chybového signálu mezi knály je nutné, by řádky mtice byly vzájemně ortogonální. by bylo vektorů délky M ortogonálních, je třeb, by M, tudíž nelze generovt více ortogonálních náhodných procesů, než kolik dodáme dílčích. Ztímco mtice splňující podmínku ortogonlity řádkových vektorů jsou čsté, poždvek, by výstupní dithery byly řádu nrpdf situci podsttně komplikuje. Pk totiž kždý řádek mtice musí obshovt právě n prvků, rovných buď nebo, zbytek nuly. η j ν i 5 Optimální generování víceknálového ditheru Víceknálový generátor ditheru povžujeme z optimální, pokud poskytuje nekorelovné hodnoty ditheru v jednotlivých knálech vyžduje generování pouze jedné nové náhodné hodnoty n knál vzorek. Tto situce nstne tehdy, je-li mtice čtvercová. Tková schémt budeme nzývt (,n)-optimální, kde je počet knálů n je řád výsledného ditheru. Čtvercová mtice je (,n)-optimální, pokud [] ij,,, ),. { } ( i j. kždý řádek mtice obshuje právě n prvků bsolutní hodnoty, 3. řádky mtice jsou vzájemně ortogonální. ásledující příkldy demonstrují zákldní (,n)-optimální mtice (,n) (,), () (,n) (4,3), ()
(,n) (6,5), () Pro tvorbu dlších optimálních schémt pltí následující prvidl []: prohození dvou řádků či sloupců v (,n)-optimální mtici dává opět (,n)-optimální mtici, násobení řádku či sloupce (,n)-optimální mtice konstntou dává opět (,n)-optimální mtici, je-li (,n)-optimální mtice, je (,n)-optimální mtice O je nulová mtice, pk (3) T je ( +, n)-optimální mtice, je-li ( ) ij (,n )-optimální mtice je (,n )-optimální mtice, pk (4) L M M M L L je (, n n )-optimální mtice. příkld kombincí dvou zákldních (,)-optimálních mtic podle rovnice () můžeme dostt (4,)-optimální mtici, pomocí které lze optimálně vygenerovt dither pro čtyři knály, přičemž kždý z nich je RPDF (trojúhelníkové rozdělení hustoty prvděpodobnosti) (5) Pro (4,4)-optimální mtici podobně pltí (6)
Pro libovolný počet knálů řád ditheru n optimální mtice obecně neexistují. příkld neexistují optimální schémt pro (, n) { (3,), (3,3), (5,), (5,3), (5,4), (5,5)}. V tkovém přípdě je možné použít nejbližší větší optimální schém některé hodnoty vypustit. Poněkud to ovšem snižuje efektivitu výpočtu. 6 Implementovný generátor Tvorb ditheru pro víceknálovou zvukovou soustvu s poždovným rozdělením PDF je uskutečnitelná generováním nezávislých relizcí RPDF šumu s následným násobením optimálně nvrženou mticí. Výsledkem je pk soubor ditherů s definovnou PDF, použitelných pro víceknálový systém. lokové schém víceknálového zprcování zvukových signálů s nesubtrktivním ditherem je n obr.. Generátor ditheru η η Trnsformce signálu [] η M ν ν ν x Σ D y x Σ D y x Σ D y Obr.. lokové schém víceknálového kvntizéru s nesubtrktivním ditherem. Generátor víceknálového ditheru je implementován v prostředí MTL. Umožňuje volit typ poždovného rozdělení (rovnoměrné, trojúhelníkové Gussovo), délku ditheru (počet vzorků), mplitudu v počtu kvntovcích úrovní (minimum mximum) konečně počet knálů ( ž 6). Po zdání vstupních prmetrů ditheru se vytvoří poždovný signál. Lze vykreslit spektrum histogrm všech knálů vygenerovného ditheru. Vygenerovný signál se ukládá do specifikovného souboru typu.mt jko proměnná MTLu s názvem Dt. Proměnná Dt je ve tvru mtice, která má počet řádků roven počtu knálů počet sloupců roven délce signálu. Vzhled uživtelského rozhrní generátoru je n obr. v příloze. Pro generování signálu s rovnoměrným PDF je pouze použit funkce rnd, přičemž je uprven rozsh hodnot podle poždovné mplitudy. V přípdě generování signálu s Gussovým rozdělením PDF je situce obdobná, pouze je použit vestvěná funkce nrnd. Tto funkce generuje náhodné hodnoty s dným rozdělením o jednotkové střední hodnotě rozptylu. Vzhledem k nenulové prvděpodobnosti výskytu hodnot větších v bsolutní hodnotě než jedn, jsou hodnoty nejprve normlizovány tk, by extrémní hodnot byl rovn ±. Poté je uprven mplitud. Pro generování trojúhelníkového ditheru je využito výše popsné metody. Jsou nvrženy tři (,n)-optimální mtice: (,), (4,) (6,) pro tvorbu dvou, čtyř, resp. šesti knálů ditheru typu RPDF. V přípdě lichého počtu knálů je použit mtice s nejbližším vyšším počtem knálů, z nichž jeden je ignorován. Tím je porušen výpočetní optimlit, le pro generování běžných signálů není výpočet příliš náročný. obrázcích v příloze jsou uvedeny příkldy spekter histogrmů vygenerovných ditherů s rovnoměrným rozdělením, trojúhelníkovým konečně Gussovým PDF. U všech byl nstven vzorkovcí frekvence 44 Hz, délk s, mplitud <-,>. 7 Závěr zákldě uvedené nlýzy byl v progrmovém prostředí MTL implementován optimální generátor víceknálového ditheru, umožňující tvorbu ditivního šumu ž pro šest zvukových knálů. Vygenerovný dither je nekorelovný jeho vlstnosti lze měnit v několik stupních volnosti. Generátor bude využíván při zprcování zvukových signálů v souvislosti s psychokustickými testy.
Práce byl podpořen grntem GČR č. /5/54 Kvlittivní spekty zprcování udiovizuální informce v multimediálních systémech výzkumným záměrem MSM č. 684774 Výzkum perspektivních informčních komunikčních technologií. Litertur [] F. KDLEC. Zprcování kustických signálů. Skript, nkldtelství ČVUT, [] R.. WMKER. Efficient Genertion of Multichnnel Dither Signls. J. udio Eng. Soc., Vol. 5, o. 6, 4 June [3] M.. GERZO, P.G. CRVE, J.R. STURT, R.J. WILSO. Psychocoustic oise-shped Improvements In CD nd Other Liner Digitl Medi. J. udio Eng. Soc. (bstrcts), Vol. 4, str. 394, 993 December, preprint 35 [4] ROERT. WMKER. Subtrctive nd onsubtrctive Dithering - Mthemticl Comprison. J. udio Eng. Soc., Vol. 5, o., 4 December Ing. Zbyněk ureš, Doc. Ing. Frntišek Kdlec, CSc. Fkult elektrotechnická, ČVUT v Prze Ktedr rdioelektroniky Technická 66 7 Prh 6 tel.: 435 8, 435 5 e-mil: buresz@fel.cvut.cz, kdlec@fel.cvut.cz Příloh Obr.. Uživtelské rozhrní implementovného generátoru
Obr.3. Dither s rovnoměrným rozdělením PDF, kmitočtové spektrum histogrm. Symbol k oznčuje četnost výskytu, symbol x hodnotu vzorku Obr. 4: Dither s trojúhelníkovým rozdělením PDF, kmitočtové spektrum histogrm. Symbol k oznčuje četnost výskytu, symbol x hodnotu vzorku
Obr. 5: Dither s Gussovým rozdělením PDF, kmitočtové spektrum histogrm. Symbol k oznčuje četnost výskytu, symbol x hodnotu vzorku