Zpráva k semestrální práci z předmětu Syntéza audio signálů. Vypracoval: Jakub Krista Zimní semestr 2016/2017 Datum odevzdání:

Podobné dokumenty
Zpráva k semestrální práci z B2M31SYN Syntéza audio signálů


Syntéza audio signálů Aditivní syntéza symfonického orchestru a akordeonu

Syntéza zvuků a hudebních nástrojů v programovém prostředí MATLAB

Semestrální práce z předmětu Syntéza audio signálů

Synth challange 2016

Zpráva k semestrální práci

filtry FIR zpracování signálů FIR & IIR Tomáš Novák

Akustika. 3.1 Teorie - spektrum

A7B31ZZS 10. PŘEDNÁŠKA Návrh filtrů 1. prosince 2014

Při návrhu FIR filtru řešíme obvykle následující problémy:

Signál v čase a jeho spektrum

ADA Semestrální práce. Harmonické modelování signálů

A2B31SMS 11. PŘEDNÁŠKA 4. prosince 2014

SYNTÉZA AUDIO SIGNÁLŮ

VY_32_INOVACE_ENI_2.MA_05_Modulace a Modulátory

PSK1-5. Frekvenční modulace. Úvod. Vyšší odborná škola a Střední průmyslová škola, Božetěchova 3 Ing. Marek Nožka. Název školy: Vzdělávací oblast:

3 METODY PRO POTLAČENÍ ŠUMU U ŘE- ČOVÉHO SIGNÁLU

Analogové modulace. Podpora kvality výuky informačních a telekomunikačních technologií ITTEL CZ.2.17/3.1.00/36206

Komplexní obálka pásmového signálu

Modulační syntéza 8. prosince 2014

Vlastnosti a modelování aditivního

Amplitudová a frekvenční modulace

B2M31SYN SYNTÉZA AUDIO SIGNÁLŮ

SIGNÁLY A SOUSTAVY, SIGNÁLY A SYSTÉMY

ochranným obvodem, který chrání útlumové články před vnějším náhodným přetížením.

Úvod do zpracování signálů

Direct Digital Synthesis (DDS)

9. PRINCIPY VÍCENÁSOBNÉHO VYUŽITÍ PŘENOSOVÝCH CEST

Osnova. Idea ASK/FSK/PSK ASK Amplitudové... Strana 1 z 16. Celá obrazovka. Konec Základy radiotechniky

doc. Dr. Ing. Elias TOMEH Elias Tomeh / Snímek 1

Rádiové funkční bloky X37RFB Krystalové filtry

mel jednotka subjektivní výšky tónu. Výška tónu o frekvenci 1000 Hz a hladině akustického tlaku 40 db se rovná 1000 melům.

Při návrhu FIR filtru řešíme obvykle následující problémy:

r Odvoď te přenosovou funkci obvodů na obr.2.16, je-li vstupem napě tí u 1 a výstupem napě tí u 2. Uvaž ujte R = 1Ω, L = 1H a C = 1F.

Návrh frekvenčního filtru

KTE/TEVS - Rychlá Fourierova transformace. Pavel Karban. Katedra teoretické elektrotechniky Fakulta elektrotechnická Západočeská univerzita v Plzni

B2M31SYN 3. PŘEDNÁŠKA 17. října 2018

Otázka 22(42) Přístroje pro měření signálů, metody pro měření v časové a frekvenční doméně. Přístroje

VY_32_INOVACE_E 15 03

X31ZZS 3. PŘEDNÁŠKA 6. října Periodické průběhy Fourierovy řady Spektrum Barva zvuku Aplikace

Rozprostřené spektrum. Multiplex a mnohonásobný přístup

Vlastnosti Fourierovy transformace

Teorie elektronických obvodů (MTEO)

Úloha D - Signál a šum v RFID

ZPRACOVÁNÍ SIGNÁLŮ Z MECHANICKÝCH. Jiří Tůma

31ZZS 9. PŘEDNÁŠKA 24. listopadu 2014

2. GENERÁTORY MĚŘICÍCH SIGNÁLŮ II

DSY-4. Analogové a číslicové modulace. Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti

MULTIMEDIÁLNÍ A HYPERMEDIÁLNÍ SYSTÉMY. 4) Upravujeme nahraný zvuk

Lineární a adaptivní zpracování dat. 3. SYSTÉMY a jejich popis ve frekvenční oblasti

Hlavní parametry rádiových přijímačů

Zvuková karta. Zvuk a zvuková zařízení. Vývoj, typy, vlastnosti

PSK1-9. Číslicové zpracování signálů. Číslicový signál

A2B31SMS 3. PŘEDNÁŠKA 15. října 2015

Lineární a adpativní zpracování dat. 3. Lineární filtrace I: Z-transformace, stabilita

elektrické filtry Jiří Petržela filtry založené na jiných fyzikálních principech

3 Tvorba zvuku elektronickou cestou

Nástroje s rotačními elektrooptickými generátory

Zvuk. 1. základní kmitání. 2. šíření zvuku

Nízkofrekvenční (do 1 MHz) Vysokofrekvenční (stovky MHz až jednotky GHz) Generátory cm vln (až desítky GHz)

Kmitočtová analýza (AC Analysis) = analýza kmitočtových závislostí obvodových veličin v harmonickém ustáleném stavu (HUS) při první iteraci ano

A2B31SMS 2. PŘEDNÁŠKA 9. října 2017 Číslicové signály

Rekurentní filtry. Matlab

B2M31SYN 9. PŘEDNÁŠKA 7. prosince Granulační syntéza Konkatenační syntéza Nelineární funkce Tvarovací syntéza

Lineární a adaptivní zpracování dat. 1. ÚVOD: SIGNÁLY a SYSTÉMY

Experiment s FM přijímačem TDA7000

Filtrace obrazu ve frekvenční oblasti

AKUSTIKA. Barva tónu

Základy a aplikace digitálních. Katedra radioelektroniky (13137), blok B2, místnost 722

VOLBA ČASOVÝCH OKEN A PŘEKRYTÍ PRO VÝPOČET SPEKTER ŠIROKOPÁSMOVÝCH SIGNÁLŮ

1 Zpracování a analýza tlakové vlny

Kepstrální analýza řečového signálu

FILTRACE VE FOURIEROVSKÉM SPEKTRU

MĚŘENÍ ÚHLOVÝCH KMITŮ ZA ROTACE

Tel-30 Nabíjení kapacitoru konstantním proudem [V(C1), I(C1)] Start: Transient Tranzientní analýza ukazuje, jaké napětí vytvoří proud 5mA za 4ms na ka

Lineární a adaptivní zpracování dat. 2. SYSTÉMY a jejich popis v časové doméně a frekvenční doméně

Lineární a adaptivní zpracování dat. 2. SYSTÉMY a jejich popis v časové doméně a frekvenční doméně

A/D převodníky - parametry

4.2. Modulátory a směšovače

Oscilátory. Oscilátory s pevným kmitočtem Oscilátory s proměnným kmitočtem (laditelné)

Akustika pro posluchače HF JAMU

Číslicové filtry. Honza Černocký, ÚPGM

Měření vlastností datového kanálu

PCM30U-ROK 2 048/256 kbit/s rozhlasový kodek stručný přehled

31SCS Speciální číslicové systémy Antialiasing

1. Vlastnosti diskretních a číslicových metod zpracování signálů... 15

Přenosová technika 1

Flexibilita jednoduché naprogramování a přeprogramování řídícího systému

Jméno a příjmení. Ročník. Měřeno dne Příprava Opravy Učitel Hodnocení. Charakteristiky optoelektronických součástek

Spektrální analyzátory

teorie elektronických obvodů Jiří Petržela analýza šumu v elektronických obvodech

Hudební nástroje se dělí do několika skupin podle způsobu tvoření tónu.

Zesilovače. Ing. M. Bešta

Akustika pro posluchače HF JAMU

MĚŘENÍ A ANALÝZA ELEKTROAKUSTICKÝCH SOUSTAV NA MODELECH. Petr Kopecký ČVUT, Fakulta elektrotechnická, Katedra Radioelektroniky

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY

teorie elektronických obvodů Jiří Petržela obvodové funkce

Moderní multimediální elektronika (U3V)

Měřící přístroje a měření veličin

Transkript:

Zpráva k semestrální práci z předmětu Syntéza audio signálů Vypracoval: Jakub Krista Zimní semestr 2016/2017 Datum odevzdání: 31.12.2016

Obsah 1. Úvod... 2 2. Použité druhy syntéz... 3 2.1 Aditivní syntéza... 3 2.2 Rozdílová syntéza... 3 2.3 Modulační syntéza... 3 2.3.1 Amplitudová modulace... 3 2.3.2 Frekvenční modulace... 3 2.3 Karplus-Strongův algoritmus... 4 3. Nástroje... 4 3.1 Obecně... 4 3.2 Aditivně syntetizované nástroje... 4 3.3 Karplus-strongův algoritmus... 4 3.3.1 Drnkané nástroje... 4 3.3.2 Smyčcové nástroje... 5 3.4 Perkusní nástroje... 5 4. Reverb... 5 5. Vlastní syntéza... 6 6. Zdroje... 7 1

1. Úvod Úkolem semestrální práce bylo vytvořit nástroje, které se vloží do přichystaného midi toolboxu, který ve výsledku syntetizuje skladbu Bedřicha Smetany Vltava. Tedy vytvořit všechny nástroje, které zdrojový midi soubor Vltavy obsahuje. Dalším bodem vygenerování tří oktáv stupnice DUR, kde se vystřídají vytvořené nástroje. A posledním bodem vytvoření vlastní syntézy. 2

2. Použité druhy syntéz 2.1 Aditivní syntéza Je založená na Fourierově teorii, že každý signál lze rozložit na součet sinusových a kosinusových průběhů. Ze signálu, který chceme syntetizovat zjistíme velikosti jednotlivých harmonických, pro přesnější napodobení lze tyto jednotlivé harmonické rozdělit pomocí banky filtrů na parciály a zkoumat závislosti amplitud na čase. Při syntéze pak stačí aproximovat závislosti a vytvořit obálky pro parciály, případně jen obálku pro výstup a naváhování spektrálních složek. Tato syntéza vyžaduje pro každou harmonickou složku vlastní generátor harmonického průběhu. Výhoda spočívá v jednoduchosti modelování spektra. Nevýhoda je velké množství potřebných dat pro přesné syntetizování. 2.2 Rozdílová syntéza Přesný opak aditivní syntézy, namísto součtu úzkopásmových signálů se generuje signál širokopásmový, který se poté filtruje. Výsledný zvuk určují typy filtrů (HP, DP, PP, PZ) a jejich parametry, případně řazení více filtrů paralelně, nebo kaskádně a vytváření formantů formantová syntéza. Výhodou syntézy je jednoduchý model a jeho snadná úprava, nevýhodou je malé věrnost zvuku. Některé zvuky může být složité naprogramovat. 2.3 Modulační syntéza 2.3.1 Amplitudová modulace Moduluje amplitudu nosného signálu modulovaným signálem. Pro dva sinusové signály je výstupní signál dán předpisem: y = (1 + m sin(ω m t)) sin(ω c t) Písmeno m značí hloubku modulace a ovlivňuje, jak moc se bude amplituda měnit. V hudbě se uplatňuje pro napodobení techniky hry tremolo, kdy se mění amplituda výstupního signálu. 2.3.2 Frekvenční modulace Okamžitá frekvence nosné vlny je měněna modulačním signálem. Pro sinusové signály je předpis: y = sin(ω c t + I sin (ω m t)) Písmeno I značí modulační index a určuje, jak moc se bude frekvence nosné měnit. Modulaci lze použít pro efekt vibrato, kdy se periodicky mění základní frekvence nástroje. Pomocí frekvenční modulace lze vytvářet i hudební nástroje, a to změnou jednotlivých parametrů zejména pak modulačním indexem a kmitočtem modulovaného signálu, kterými se ovlivňuje spektrum. Syntéza vyžaduje pouze málo vstupních parametrů. Není vhodná pro všechny nástroje, ale například pro zvony je vhodná. 3

2.3 Karplus-Strongův algoritmus Spadá do sekce syntéz založených na fyzikálním modelování a lze dosáhnout velmi věrných zvuků, ale pro přesné fyzikální modelování je nutné znát prakticky všechny parametry nástroje a techniky hráče. I pomocí značně zjednodušeného algoritmu lze dosáhnout dobrých výsledků. Nástroje se modelují pomocí smyčky tvořené ze zpožďovacích linek a filtrů, kde se signál postupně recipročně upravuje. 3. Nástroje 3.1 Obecně Každý nástroj je před výstupem je normován tak, aby neobsahoval stejnosměrnou složku, to je zajištěno jejím odečtením. Zároveň je srovnán amplitudově na maximální hodnotu 1. Následně je vynásoben hlasitostí, kterou poskytuje midi toolbox. Veškeré nástroje, které mají exponenciální charakter útlumu mají konstantní dobu trvání, to kvůli tomu, aby se v případě nedostatečného utlumení (když je doba trvání poskytovaná toolboxem příliš krátká) nevznikaly lupnutí a jiné pazvuky. 3.2 Aditivně syntetizované nástroje Pomocí aditivní syntézy jsem vytvořil veškeré dechové nástroje a tympány. Jednotlivé nástroje se liší váhováním spektrálních složek, které určují barvu nástroje a dále se liší obálkou. V případě tympánů a trumpety jsem použil obálky pro jednotlivé parciály. V případě trumpety jsou obálky různé pro každou parciálu a u tympánů se liší obálky pouze velikostí (váhou). V algoritmu se pak jednotlivé generované harmonické rovnou násobí obálkou a všechny harmonické se nakonec sečtou. U ostatních aditivně syntetizovaných nástrojů (tuba, lesní roh, hoboj, fagot, klarinet, flétna) je algoritmus jednodušší generují sinusové průběhy, které se vynásobí hodnotami, pro danou velikost harmonické, poté se všechny sečtou, a nakonec se aplikuje obálka. 3.3 Karplus-strongův algoritmus 3.3.1 Drnkané nástroje Generování signálů pomocí tohoto algoritmu v mé databázi nástrojů lze rozdělit na dvě kategorie, a to na nástroje hrané smyčcem a na drnkané. Pro drnkané je použit algoritmus, který samovolně upravuje vstupní signál, kterým je krátký úsek šumu. Základní princip je zpoždění a zopakování tohoto úseku, tím se docílí definování frekvence tónu, zároveň je signál filtrován. Pro upravení barvy tónu a její nezávislosti na vzorkovacím kmitočtu, je vstupní šum frekvenčně omezen. V případě harfy je omezen pásmovou propustí s centrálním kmitočtem rovným frekvenci základního tónu a šířkou pásma rovnou čtyřnásobku tónu. Výstup z KS je dále vynásoben exponenciální obálkou, která má za úkol zkrátit doznívání. U pizzicato, kvůli snaze napodobení zvuků různých strunných nástrojů, na které se hraje i smyčcem jsem filtrování rozdělil na frekvence pod 200 Hz a na vyšší. Filtrace se liší v nastavení filtrů. Dále je šum filtrován 2x nejprve na frekvenci 500 Hz (1000 Hz) filtrem typu Butterworth stupně 1. To způsobí mírné potlačení rezonancí, pak na frekvenci 2000 Hz (4000 4

Hz) je další filtr typu Butterworth, který má ale strmější průběh, protože je stupně 4 a zajistí odfiltrovaní vysokých harmonických. Takto upravený šum už vstupuje do KS. 3.3.2 Smyčcové nástroje Vzhledem k odlišné obálce smyčcem hraných nástrojů a drnkaných bylo nutné upravit algoritmus tak, aby se výstup KS neutlumoval a mohl se použít odpovídající typ obálky. To jsem zajistil odstraněním jednoho členu ze jmenovatele přenosu filtru. Pro omezení vysokých harmonických jsem zavedl stejný postup jako v pro pizzicato, a to dvojí filtrovaní filtrem s Butterworthovou aproximací. Rozdíl mezi strunným souborem 1 a 2 je v obálce, pro strunný soubor 1 je fixní rychlý nástup a útlum nástroje. Strunný soubor 2 má pomalý nástup ještě navíc závislý na době trvání tónu, tedy čím déle má tón znít tím delší je nástup. 3.4 Perkusní nástroje V perkusním kanále 10 je pouze jedna stopa a to nástroj 49. Ten se dělí na tři podsekce, a to na zvonek, crash činel a velký buben. Toto rozdělení je na základě frekvence, kterou vrací midi toolbox pro zvonek 880 Hz, činel 220 Hz a velký buben blízko 65 Hz. Zvonek jsem realizoval pomocí frekvenční modulace. Základní frekvence je stejná, jakou vrací toolbox a to 880 Hz. Modulovaný kmitočet je 2.5násobek 880. Tím se vytvoří spektrálně bohatý signál. Modulační index je roven 3 a je časově závislý, exponenciálně se snižuje, tím se spektrum v čase mění. Velký buben je generovaný filtrační syntézou Gaussovský šum je filtrován Butterworthovou pásmovou propustí stupně 2 s propustným pásmem 30 Hz 120 Hz, takto filtrovaný signál je upraven exponenciální obálkou. Činel je kombinací obou hlavní šumová část je provedená pomocí filtrační syntézy pásmovou propustí s Čebyševovou aproximací třetího stupně a propustným pásmem 1 khz 10 khz, díky zvlnění v propustném pásmu získává zajímavější zvuk. Výsledek filtrace je vynásoben exponenciální obálkou. Při poslechu činelů je rovněž slyšet kovové zvonění kovu, to jsem vytvořil filtrační syntézou podobně jako v případě zvonku, liší se v obálce, která je natažená tak, aby zvonění bylo zřetelné až do konce znění činelu. Tyto dva signály jsou sečteny s různými vahami, zatímco šum má váhu 1, tak zvonění 0.01. Na tento součet je aplikováno velmi pomalé tremolo s malou hloubkou modulace, které způsobí lehké zhoupnutí hlasitosti. 4. Reverb Pro lepší výsledný zvuk je na vygenerovanou zvukovou stopu aplikován reverb. Jedná se o konvoluci stopy s impulzní odezvou reálného prostoru. To vytváří dojem, že skladba byla nahrána v koncertní síni. Konvoluce je prováděna násobením ve spektru, tedy signál i impulzní odezva se pomocí FFT převedou do spektrální oblasti, kde se vynásobí a pomocí IFFT převede zpět do časové oblasti. To zajišťuje funkce konv_reverb(h,x,fs,fsh), kde h je impulzní odezva, x audiostopa, Fs vzorkovací frekvence audio stopy a Fsh vzorkovací frekvence impulzní odezvy. Tato funkce kromě zajištění konvoluce upravuje vzorkovací kmitočet impulsní odezvy na shodný s audio stopou. Při měření doby konvoluce pomocí tic toc, zabrala konvoluce ve spektru 10 s a konvoluce lineární 200 s, na mém PC, tedy 20x rychlejší. Nevýhodou je vyšší využití paměti RAM (více proměnných v paměti). 5

5. Vlastní syntéza Jako syntézu vlastního nápadu jsem vytvořil syntézu otevřeného krbu k tomuto se po čase přidá letící vrtulové letadlo, které spustí bombu, a nakonec je slyšet její výbuch. Syntéza ohně se skládá ze dvou částí první řeší typické hučení ohně a druhá praskání. V první části je jako základní signál použit Gaussovský šum, který je prochází rezonátorem s rezonančním kmitočtem na 70 Hz a šířkou pásma 30 Hz. Druhá část řeší praskání dřeva v ohni zde opět slouží jako základní signál bílý šum upravený tak, aby dosahoval hodnot ±1. Šum je pak tvarován exponenciální obálkou a násoben náhodným číslem z generátoru bílého šumu, aby každá amplituda prasknutí byla jiná. Mezi prasknutími jsou mezery, které, aby signál nezněl monotónně, se zvětšují na základě čísla vygenerovaném v generátoru bílého šumu toto číslo je pak přepočteno na vyhovující počet vzorků posunutí. Dále je zde přidána podmínka, která proběhne jen když generátor Gaussovského šumu vygeneruje číslo, které je v absolutní hodnotě větší než jedna. Když se tak stane, tak se vygenerují dvě prasknutí po sobě s krátkým rozestupem, který je opět měněn na základě výstupu generátoru bílého šumu. Takový signál nebude pokaždé stejně dlouhý, proto je oříznut a je na něj aplikována obálka, aby se zabránilo lupnutí. Nakonec jsou signály sečteny a normovány. Další částí je letadlo, které nejprve snižuje otáčky motoru a potom zase zvyšuje. To je vytvořeno pomocí jednoduché obálky vytvořené lineární interpolací, aby změny kmitočtu nebyly ostré je obálka vyhlazena pomocí filtru typu dolní propust, při filtraci je nutné zadat počáteční podmínku, aby nebyla na začátku skoková změna. Vytvořený vektor změny frekvencí je pak vložen do generátoru pily, který má náhodnou fázi generovanou Gaussovským šumem. Vygenerovaný průběh obsahuje příliš vysokých harmonický, proto je dále filtrová filtrem typu dolní propust 1. stupně s Butterworthovou aproximací. Nakonec je signál vynásoben obálkou, aby je jevilo, že je letadlo přibližuje a oddaluje. Poslední částí je bomba, nejprve pískot, který způsobuje a potom výbuch. Pískot je generován signálem s lichými harmonickými, které jsou velmi potlačeny, předpis je: y = 1 i 3 sin (i ω t ) i Signál obsahuje jen 4 harmonické. Frekvence je v tomto případě frekvenčně závislá jako funkce pro změnu frekvence posoužil vybraný úsek exponenciály. Na takto vytvořené pískání je nakonec aplikováno tremolo. Poslední část je exploze bomby, ta se skládá ze tří částí. První částí je nízkofrekvenční pozadí výbuchu. Na tuto část jsem použil přelaďovaný rezonátor, jehož rezonanční kmitočet se postupně zvyšuje, opět je vektor kmitočtů tvořen nejprve lineární interpolací a poté je vyhlazen pomocí dolní propusti. Stejným způsobem je vytvořena amplitudová obálka. Další částí je exploze šumu, jedná se krátký usek Gaussovského šumu, který je filtrován pásmovou propustí 20 500 Hz a poté je vynásoben exponenciální obálkou, tato část slouží pro zvýraznění začátku. Tyto dvě části jsou po znormováni sečteny a následně nelineárně zkresleny pomocí funkce arkustangens, to dodá výbuchu lepší barvu. Poslední částí je šumové pozadí. Je to jen širokopásmový Gaussovský šum, který je vynásoben pomalou exponenciální obálkou. K předchozím dvěma signálů je přičten s menší vahou. Ve výsledku dodává jakési pozadí exploze. 6

6. Zdroje http://sami.fel.cvut.cz/sms/ 7