ČÍSLICOVÉ ZPRACOVÁNÍ ZVUKOVÝCH SIGNÁLŮ Z HLEDISKA PSYCHOAKUSTIKY Fratišek Kadlec ČVUT, fakulta elektrotechická, katedra radioelektroiky, Techická 2, 66 27 Praha 6 Úvod Při číslicovém zpracováí zvukových sigálů (DSP), zvláště pak v oblasti ízkých úroví sigálů se projevují vedlejší účiky DSP, které způsobují jejich zkresleí Číslicovým geerováím a zázamem sigálů obdržíme sigály včetě zkreslujících složek vziklých v průběhu zpracováí Použijeme-li takovéto sigály, apř pro testováí elektroakustických soustav, může dojít ke zkresleí výsledků poslechových testů Působeí zdroje sigálu, který již sám o sobě obsahuje chybový sigál a vliv vlastí odezvy soustavy se projeví společě, bez možosti rozlišeí jedotlivých kompoet V příspěvku je uvede příklad úpravy sigálů pro poslechové testy, který sižuje epřízivý vliv DSP zvukových sigálů z psychoakustického hlediska Úprava sigálu spočívá ve změě rozložeí eergie šumu v kmitočtové oblasti 2 Hz 2kHz Při modelováí DSP zvukových sigálů a jejich aalýze používáme programové vybaveí MATLAB 2 Číslicové zpracováí zvukových sigálů ízké úrově Při kvatováí harmoických sigálů ízké úrově, kdy předpokládáme úroveň sigálu o velikosti řádově ěkolika jedotek ebo desítek kvatovacích úroví A/D převodíku, vyjdeme při kmitočtové aalýze kvatovaého sigálu z průběhu kvatizačí chyby Sigál a výstupu kvatizačího procesu můžeme apsat ve tvaru () t Q{ ( t )} ( t ) e{ ( t )}, = = () kde Q {} je operátor pro vyjádřeí kvatizačího procesu a ( t) je vstupí kvatovaý sigál Průběh kvatizačí chyby e { ( t )} lze vyjádřit pomocí tzv pilové fukce S { ( t )} Jedá se o periodickou fukci s periodou rovou kvatizačímu kroku a s maimálí úroví ± 2 [] Použitím vztahů platých pro Fourierovy řady lze odvodit aalytický výraz pro aalýzu fukce S{ () t } S ( ) = ( π = ) si (2) Kvatovaý sigál ( t ) vyjádřeý rovicí () pak bude mít tvar ( t) = ( t) S{ ( t) }, ( t) = ( t ) π = ( ) 2 π si ( t ) (3) Dále vezmeme v úvahu sigál ( t ), který vstupuje do kvatizačího procesu a obsahuje A pouze jedu harmoickou složku si( ω ), kde A je amplituda t
Dosazeím sigálu ( t ) do rovice (3) obdržíme výraz pro kvatovaý sigál ( ) A si ( ω t ) ( t ) = A si ( t ) si π = ω (4) Kvatovaý sigál ( t ) obsahuje jedak původí harmoickou složku vstupího sigálu A ( t ) si ω a další ové kmitočtové kompoety Rovici (4) lze upravit pomocí Besselových fukcí a výsledý tvar = m= 2 ( ) A ( t ) = A si ( ω t) J si ( m t ), pro m liché m ω π (5) m kde J ( ) je Besselova fukce prvího druhu a řádu m Sigál vyjádřeý rovicí (5), A obsahuje základí harmoickou složku si( ω ) a liché chybové harmoické složky, které vzikly v průběhu kvatováí t Dosud jsme hovořili pouze o kvatováí sigálu Vlivem diskretizace kvatovaého sigálu ( t ) dochází k aliasigu Kvatovaý a diskretizovaý sigál lze v časové oblasti apsat ve tvaru ( ) ( ) ( ), t = t t t d = δ (6) kde t je vzorkovací krok Ve spektrálí oblasti pak platí X ( ) =, X ω k d t k = t ω (7) kde X ( ω ) je Fourierův obraz ( t ) Diskretizovaý a kvatovaý sigál ízké úrově bude obsahovat základí harmoickou složku, liché chybové harmoické složky a diskrétí zkreslující kompoety, které vzikou vlivem aliasigu Při modelováí sigálů jsme vycházeli z předpokladu, že jako zdroj sigálů bude použit CD Z toho vyplývá použitý vzorkovací kmitočet f v = 44 Hz Při uvažováí rozsahu amplitudy sigálu ± V a použití 6-bitového A/D převodíku, obdržíme velikost kvatizačího kroku 6 = 2 2 V Úroveň sigálu V korespoduje s hladiou db Sigály ízké úrově jsme avrhovali tak, aby je bylo možé použít jak pro testováí elektroakustických soustav měřeím, tak i pro poslechové testy Vzhledem k tomu, že se jedá o sigály ízké úrově, zaměřili jsme se a kmitočty z oblasti f = 4 khz, tedy a pásmo maimálí citlivosti lidského ucha Z hlediska aalýzy sigálů byl kmitočet geerovaých sigálů staove tak, aby počet vzorků jedé periody byl celistvé číslo
3 Tvarováí šumových spekter sigálů Vímáí zkreslujících kompoet sigálu lze omezit ěkolika způsoby [2,3,4] Jede z možých způsobů spočívá v možosti přesuout zkreslující složky sigálu z oblasti středích kmitočtů jak do oblasti ízkých tak i vysokých kmitočtů, tedy do oblastí s ižší citlivostí sluchu Blokové schéma obvodu pro tvarováí šumu je a obr Pro tvarováí šumu se zde používá psychoakustických filtrů, při jejichž ávrhu se vychází z křivek kostatích hladi hlasitosti [5] Vygeerovaé křivky kostatích hladi hlasitosti jsou zázorěy a obr 2 e() y = ε [ ] ( ) ( ) () Σ v() A /D _ u() v() _ Σ Filter H(z ) s() ε ( ) ( ) Fig Blokové schéma číslicového zpracováí sigálu při použití psychoakustických filtrů Číslicové zpracováí sigálu pomocí soustavy zázorěé a obr lze odvodit rozborem v Z oblasti Pro sigál a výstupu soustavy lze apsat = (8) Y ( z ) V ( z ) E( z ) kde E ( z ) je chybový sigál Při zpracováí lze též použít i dither Dalším řešeím přeosu soustavy obdržíme pro celkový chybový sigál a jejím výstupu = ε ( z ) [ H ( z )] E( z ) (9) kde H ( z ) je přeosová fukce psychoakustického filtru Koečý výraz pro sigál a výstupu soustavy y [ ] můžeme pomocí rovic (8) a (9) apsat ve tvaru = ε = () Y ( z ) X ( z ) ( z ) X ( z ) [ H ( z )] E( z ) Vztah () vyjadřuje souvislost mezi vstupím sigálem ( t ), celkovým chybovým sigálem ε ( ) a výstupu soustavy a chybovým sigálem e ( ), který vziká vlivem kvatizace sigálu v ( ) Z uvedeých vztahů vyplývá, že celkový chybový sigál je tvarová fukcí [ H ( z )] Kmitočtový průběh filtru H ( z ) by měl mít takový průběh, aby chybový sigál ε ( z ) a výstupu soustavy byl vímá co ejméě V prai to zameá, že úroveň vímáí rušivého sigálu bude miimálí, pokud se jeho vjem bude blížit vímáí rovoměrě rozložeého šumu v závislosti a kmitočtu Měřicí sigály jsou umericky geerováy a počítači pomocí programového vybaveí MATLAB [6] Takto vygeerovaé diskrétí sigály můžeme z hlediska přesosti považovat za ekvatovaé sigály ( ), které ám přicházejí do další fáze číslicového zpracováí
pomocí soustav pro oise shapig [3] Na výstupu soustav dostáváme upraveé digitálí sigály y [ ], které jsou již vhodé pro číslicový zázam apř a CD hladia hlasitosti [Ph] 4 p [db] 2 3 2 a) W(f) [db] 2 b) 9 8 8 7 6 6 5 4 4 3 2 2 - -2 2 3 4-2 5 5 2 25 3 35 4 45 f [khz] Obr 2 a) Stadardí křivky průběhů kostatích hladi hlasitosti v závislosti a kmitočtu; b) Normovaý průběh H ( ω ) pro hladiu hlasitosti 5 Ph Aalýzu vlivu diskretizace a kvatováí sigálů si ukážeme a kmitočtu f = 764 Hz (25 vzorků a periodu) Detailí průběh kmitočtového spektra diskretizovaého a kvatovaého sigálu o amplitudě ± 3 můžeme vidět a obr 3a Aalýza sigálu o shodém kmitočtu, který byl zpracová obvodem pro tvarováí šumu a obr, je zázorěa a obr 3b Na obr 3a je základí harmoický kmitočet spolu s dalšími harmoickými i eharmoickými složkami jejichž původ spočívá v aliasigu Nově vziklé kompoety sigálu působí rušivě a sluchový vjem Číslicovým zpracováím sigálu s trasformací kvatizačího šumu získáme sigál ve kterém se již ově vziklé diskrétí kmitočty evyskytují, ale a druhou strau obdržíme ve spektru kvatizačí šum, který je tvarová psychoakustickým filtrem H ( ω ) Upraveý kvatizačí šum je vímá méě rušivě ež diskrétí harmoické složky V [db] -8-9 V [db] -8 a) -9 b) - - - - -2-2 -3-3 -4-4 -5-5 -6 3 4-6 3 4 Obr 3 a) Aalýza číslicově geerovaého harmoického sigálu upraveý z psychoakustického hlediska f = 764 Hz ; b) Sigál
4 Závěr V příspěvku je ukázá jede z možých způsobů úpravy zvukových sigálů z hlediska jejich optimálího vímáí, tedy s potlačeím ežádoucích efektů které vzikají v průběhu DSP Pomocí programového vybaveí MATLAB byly vytvořey základí algoritmy pro geerováí a zázam číslicově zpracovaých zvukových sigálů Numericky vygeerovaé sigály jsou ejprve upravey z hlediska jejich optimálího vímáí a takto zpracovaé sigály jsou převedey do souborů typu *wav Soubory typu *wav již lze použít k reprodukci testovacích sigálů Většiou jsou však upraveé sigály zazameáy a CD a teprve tyto osiče ám slouží jako zdroje zvukových sigálů Testovací sigály ízké úrově upraveé z hlediska psychoakustiky jsou při reprodukci vímáy jako čistší oproti sigálům bez úprav Projekt byl podporová Gratovou ageturou České republiky, grat č 2/2/56 Literatura [] Maher, R C: O the Nature of Graulatio Noise i Uiform Quatizatio Systems Joural of Audio Egieerig Society, Vol 4, 992, No /2, p2-2 [2] Waamaker, R A: Psychoacoustically Optimal Noise Shapig 4, J Audio Eg Soc, 992, p 6 62 [3] Gerzo, M Crave, P Stuart, R Wilso, R: Psychoacoustic Noise Shaped Improvemets i CD ad Other Liear Digital Media The 94 th Audio Eg Soc Covetio, Berli, Preprit 35, 993 [4] Matsuya, Y, Uchimura, K, Iwata, A, Kobayashi, T, Ishikawa, M, Yoshitome, T: A 6-bit Oversamplig A-to-D Coversio Techology Usig Triple-Itegratio Noise Shapig IEEE Joural of Solid-State Circuits, 22, 987,u p 92-929 [5] Zwicker, E Fastl, H: Psychoacoustics, Facts ad Models Spriger-Verlag Berli Heildelberg, 99 [6] Kadlec, F: Desig, Geeratio ad Aalysis of Digital Test Sigals The th Audio Eg Soc Covetio, New York, Preprit 35, 2 E-mail: kadlec@felcvutcz