B2M31SYN SYNTÉZA AUDIO SIGNÁLŮ zima 2016-2017 Roman Čmejla cmejla@fel.cvut.cz B2, místn.525 tel. 224 3522 36 http://sami.fel.cvut.cz/sms/
A2B31SMS - SYNTÉZA MULTIMEDIÁLNÍCH SIGNÁLŮ zima 2015-2016 http://sami.fel.cvut.cz/sms/ B2M31SYN - SYNTÉZA AUDIO SIGNÁLŮ zima 2016-2017 http://sami.fel.cvut.cz/sms/
Základy akustiky a číslicového zpracování audio signálů Zvuk je mechanické vlnění v látkovém prostředí, které je schopno vyvolat sluchový vjem.
Základy akustiky a číslicového zpracování audio signálů Techniky audio syntézy (typologie nezávislá na technické realizaci): 1. syntéza audio signálu (signal-based modeling) vzorkovací a spojovací s. tabulková, granulační, konkatenační součtové (aditivní) s. rozdílové (filtrační, subtrakční) s. formantová, LPC modulační s., kruhová modulace amplitudová modulace frekvenční modulace tvarové s. nelineární tvarování
Základy akustiky a číslicového zpracování audio signálů Techniky audio syntézy (typologie nezávislá na technické realizaci): 1. syntéza audio signálu (signal-based modeling) 2. syntéza zdroje zvuku (acoustic modeling) fyzikální modelování
Základy akustiky a číslicového zpracování audio signálů Techniky audio syntézy (typologie nezávislá na technické realizaci): 1. syntéza audio signálu (signal-based modeling) 2. syntéza zdroje zvuku (acoustic modeling) 3. audio efekty změny dynamiky, frekvence a času (tremolo, komprese, limiter, vibrato, ekvalizer, flanger, phaser, chorus, delay, echo, reverb, vokodér,...)
Základy akustiky a číslicového zpracování audio signálů Zvukové vlny od zdroje se zvuk šíří (nejčastěji) vzduchem jako postupné podélné vlnění charakteristika: amplituda perioda T = 1 / f [s] frekvence f = 1 / T [Hz]
Základy akustiky a číslicového zpracování audio signálů Zvukové vlny od zdroje se zvuk šíří (nejčastěji) vzduchem jako postupné podélné vlnění charakteristika: amplituda perioda T = 1 / f [s] frekvence f = 1 / T [Hz] délka vlny l = v. T = v / f [m] rychlost v = l / T = l. f [m/s]
Základy akustiky a číslicového Vlastnosti zvuku: zpracování audio signálů Rychlost šíření zvuku ve vzduchu (0 C): 332 m/s ve vzduchu (20 C): 340 m/s ve vodě: 1480 m/s v oceli: 5000 m/s ve sklu: 5200 m/s ve vakuu se zvukové vlny šířit nemohou Frekvenční rozsah sluchu lidé: 20-20000 Hz psi: 20-45000 Hz velryba beluga: 1000-123000 Hz
Základy akustiky a číslicového Vlastnosti zvuku: zpracování audio signálů Amplitudový rozsah lidského sluchu práh sluchu: 0.00002 N/m práh bolesti: 200 N/m Nejdelší perioda slyšitelných frekvencí 1/20 Hz = 0.05 s Nejkratší perioda slyšitelných frekvencí 1/20000 Hz = 0.05 ms Nejdelší slyšitelná vlna 340/20 = 1 7 m Nejkratší slyšitelná vlna 340/20000 = 1.7 cm
Základy akustiky a číslicového zpracování audio signálů Intenzita I [W/m2] Intenzita zvuku je energie zvukového vlnění, která projde za dobu 1 s plochou 1m2 orientovanou kolmo na směr šíření zvuku. Intenzita odpovídající prahu slyšitelnosti je I0 = 10^-12 W/m2. Hladina akustické intenzity L [db] Decibel je logaritmická hodnota, která je běžně používaná k vyjádření poměru dvou úrovni - měřené a referenční. Hladina akustické intenzity L = 10 log I/I0 [db], kde I0 = 10^-12 [W/m2] je referenční hodnota intenzity vnímaného zvuku při frekvenci 1000 Hz.
Základy akustiky a číslicového zpracování audio signálů Příklady hladiny akustické intenzity: práh sluchu 0 db šepot 20 db tiše hrající rádio 40 db konverzační řeč 60 db hlasitá řeč 80 db křik 100 db rockový koncert 120 db pneumatické kladivo 140 db práh bolesti 140 db
Základy akustiky a číslicového zpracování audio signálů Příklady hladiny akustické intenzity: (měřeno ve vzdálenosti 10 m od zdroje) housle (co nejtišší) 34,8 db klarinet 76,0 db trubka 83,9 db činely 98,8 db basový buben (co nejhlasitější) 103 db
Základy akustiky a číslicového zpracování audio signálů Rostoucí vzdálenost od zdroje Pokud bodový zdroj zvuku vyzařuje rovnoměrně ve všech směrech do volného prostoru, pak intenzita ubývá s druhou mocninou vzdálenosti (1/r2) od centra šíření vlny, neboť vlnoplocha zvětšuje svůj povrch (koule = (4pi r^2)) s druhou mocninou poloměru. V praxi však bude symetrie vyzařování narušena odrazy od dalších objektů.
Základy akustiky a číslicového zpracování audio signálů Rostoucí vzdálenost od zdroje Pokud bodový zdroj zvuku vyzařuje rovnoměrně ve všech směrech do volného prostoru, pak intenzita ubývá s druhou mocninou vzdálenosti (1/r2) od centra šíření vlny, neboť vlnoplocha zvětšuje svůj povrch (koule = (4pi r^2)) s druhou mocninou poloměru. V praxi však bude symetrie vyzařování narušena odrazy od dalších objektů. Akustický výkon = akustická intenzita x vlnoplocha (koule) stále stejný výkon se s rostoucí vzdáleností rozprostírá --> P1 = P2 I1. r1^2 = I2. r2^2
Základy akustiky a číslicového zpracování audio signálů Příklad 1.1 Akustická intenzita byla u elektrofonické kytary zesílena z hodnoty I1 = 10e-10 W/m2 na hodnotu I2 = 10e-4 W/m2. Kolik db představuje toto zesílení? Příklad 1.2 Co to znamená, když hladina intenity se změní o +10 db?, o + 6dB?, o +3dB?, o -10 db? Příklad 1.3 Jaký je poměr akustických intenzit dvou zvukových vln I2/I1, jejichž hladiny L1 a L2 se liší o 5 db?
Základy akustiky a číslicového zpracování audio signálů Příklad 1.4 Uvnitř letištní haly je hladina intenzity L1 = 85 db, na letištní ploše je L2 = 115 db. Jaký je poměr akustických intenzit? Příklad 1.5 Kolik klarinetů vytvoří stejnou hladinu akustické intenzity jako jeden pár činelů? Příklad 1.6 Ve vzdálenosti 1 m od stroje je hladina akustické intenzity 92 db. Jak daleko se musíme vzdálit, aby hladina klesla na 80 db?
---> x[n] Analogově-číslicový převod 1 0.8 0.6 0.4 T=1/f 0.2 0-0.2-0.4 Ts=1/fs -0.6-0.8-1 0 2 4 6 8 10 12 14 16 18 20 ---> n
Analogově-číslicový převod Volba vzorkovací frekvence vzorkovací teorém: fs > 2 fmax běžné analýzy řeči: f s = 8 khz náročnější analýzy: f s > 20 khz CD: f s = 44,1 khz aliasing
Frequency Chirp signál chirp = cvrlikat, švitořit (také sweep = rozmést, vlnit se) frekvenčně rozmítaný signál Chirp signal 0.5 0-0.5-1 4000 100 200 300 400 500 600 700 800 900 1000 1100 1200 cas 3000 2000 1000 0 0 0.02 0.04 0.06 0.08 0.1 0.12 0.14 Time
Vzorkovací teorém Vzorkovací frekvence musí být alespoň dvojnásobkem nejvyšší frekvence obsažené v signálu Harry Nyquist (americký inženýr - Bell laboratories 1889-1976) Claude Shannon (americký inženýr - Bell laboratories 1916-2001) Vladimir Kotelnikov (ruský profesor 1908-2005)
Aliasing I (alias = jinak zvaný), překrývání, překládání f f S 2
Aliasing II f f S 2 vlivem pomalého vzorkování bude mít číslicový signál jinou (alias) frekvenci
Aliasing III F_out F_in
Aliasing IV Signály o frekvencích f jsou vzorkovány frekvencí fs = 1280 Hz. Určete alias frekvence: f [Hz] alias f [Hz] 300? 1300? 700? 1280?
Aliasing IV Signály o frekvencích f jsou vzorkovány frekvencí fs = 1280 Hz. Určete alias frekvence: f [Hz] alias f [Hz] 300 300 1300? 700? 1280?
Aliasing IV Signály o frekvencích f jsou vzorkovány frekvencí fs = 1280 Hz. Určete alias frekvence: f [Hz] alias f [Hz] 300 300 1300 20 700? 1280?
Aliasing IV Signály o frekvencích f jsou vzorkovány frekvencí fs = 1280 Hz. Určete alias frekvence: f [Hz] alias f [Hz] 300 300 1300 20 700 580 1280?
Aliasing IV Signály o frekvencích f jsou vzorkovány frekvencí fs = 1280 Hz. Určete alias frekvence: f [Hz] alias f [Hz] 300 300 1300 20 700 580 1280 0
f [Hz] f [Hz] f [Hz] f [Hz] Aliasing V f1 [Hz] f2 [Hz] 200 2000 4000 2000 fs = 8000 Hz 200 4000 200 8000 200 16000 0 0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 4000 2000 0 0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 4000 2000 0 0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 4000 2000 0 0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8
Analogově-číslicový převod Volba počtu bitů SNR 6 b 7,2 [db] řeč 60 db => 12 bitů
Časové obálky ADSR obálka 1 Harmonicky signal s exponencialni obalkou 0.8 exponenciální obálka - časová konstanta POSUN F0 0.6 0.4 0.2 0-0.2-0.4-0.6-0.8-1 0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 0.45 0.5 ---> cas [s]
Časové obálky 1 Casova obalka typu ADSR -1 ADSR obálka 0 1000 2000 3000 4000 5000 6000 7000 8000 0 1 0 ---> cas [s] -1 0 1000 2000 3000 4000 5000 6000 7000 8000 1 ---> cas [s] 0-1 0 1000 2000 3000 4000 5000 6000 7000 8000 1 ---> cas [s] 0-1 0 1000 2000 3000 4000 5000 6000 7000 8000 1 ---> cas [s] 0-1 0 1000 2000 3000 4000 5000 6000 7000 8000 1 ---> cas [s] 0-1 0 1000 2000 3000 4000 5000 6000 7000 8000 1 ---> cas [s] 0 A D S R -1 0 1000 2000 3000 4000 5000 6000 7000 8000 ---> cas [s]
Příklady časových obálek ZVON BICÍ ŽESTĚ KLARINET FAGOT
Implementace časových obálek v MATLABu X=[0.02.2 2.2]; Y=[0 1.5 0]; o=interp1(x,y,t); x=o.*x;