Syntéza audio signálů Aditivní syntéza symfonického orchestru a akordeonu

Podobné dokumenty
Zpráva k semestrální práci z B2M31SYN Syntéza audio signálů


Semestrální práce z předmětu Syntéza audio signálů

Synth challange 2016

Zpráva k semestrální práci

Zpráva k semestrální práci z předmětu Syntéza audio signálů. Vypracoval: Jakub Krista Zimní semestr 2016/2017 Datum odevzdání:

Syntéza zvuků a hudebních nástrojů v programovém prostředí MATLAB

Akustika. 3.1 Teorie - spektrum

Signál v čase a jeho spektrum

ADA Semestrální práce. Harmonické modelování signálů

Úvod do zpracování signálů

filtry FIR zpracování signálů FIR & IIR Tomáš Novák

Flexibilita jednoduché naprogramování a přeprogramování řídícího systému

A2B31SMS 11. PŘEDNÁŠKA 4. prosince 2014

MĚŘENÍ A ANALÝZA ELEKTROAKUSTICKÝCH SOUSTAV NA MODELECH. Petr Kopecký ČVUT, Fakulta elektrotechnická, Katedra Radioelektroniky

AKUSTIKA. Barva tónu

Lineární a adaptivní zpracování dat. 3. SYSTÉMY a jejich popis ve frekvenční oblasti

Při návrhu FIR filtru řešíme obvykle následující problémy:

Komplexní obálka pásmového signálu

Úloha D - Signál a šum v RFID

B2M31SYN SYNTÉZA AUDIO SIGNÁLŮ

Lineární a adaptivní zpracování dat. 2. SYSTÉMY a jejich popis v časové doméně a frekvenční doméně

Quantization of acoustic low level signals. David Bursík, Miroslav Lukeš

Lineární a adaptivní zpracování dat. 2. SYSTÉMY a jejich popis v časové doméně a frekvenční doméně

SIGNÁLY A SOUSTAVY, SIGNÁLY A SYSTÉMY

mel jednotka subjektivní výšky tónu. Výška tónu o frekvenci 1000 Hz a hladině akustického tlaku 40 db se rovná 1000 melům.

3 METODY PRO POTLAČENÍ ŠUMU U ŘE- ČOVÉHO SIGNÁLU

doc. Dr. Ing. Elias TOMEH Elias Tomeh / Snímek 1

Lineární a adpativní zpracování dat. 3. Lineární filtrace I: Z-transformace, stabilita

Osnova. Idea ASK/FSK/PSK ASK Amplitudové... Strana 1 z 16. Celá obrazovka. Konec Základy radiotechniky

VYUŽITÍ MATLABU PRO PODPORU VÝUKY A PŘI ŘEŠENÍ VÝZKUMNÝCH ÚKOLŮ NA KATEDŘE KOMUNIKAČNÍCH A INFORMAČNÍCH SYSTÉMŮ

B2M31SYN 3. PŘEDNÁŠKA 17. října 2018

Návrh frekvenčního filtru

A2B31SMS 2. PŘEDNÁŠKA 9. října 2017 Číslicové signály

Rekurentní filtry. Matlab

Úvod do MIDI 15. listopadu Co je to MIDI General MIDI MIDI v MATLABu MIDI freeware

Direct Digital Synthesis (DDS)

A2B31SMS 3. PŘEDNÁŠKA 15. října 2015

Zvuková karta. Zvuk a zvuková zařízení. Vývoj, typy, vlastnosti

A7B31ZZS 10. PŘEDNÁŠKA Návrh filtrů 1. prosince 2014

Klasifikace hudebních stylů

Číslicové filtry. Honza Černocký, ÚPGM

Zvuk. 1. základní kmitání. 2. šíření zvuku

Při návrhu FIR filtru řešíme obvykle následující problémy:

ROZPOZNÁNÍ TITULU GRAMOFONOVÉ DESKY PODLE KRÁTKÉ UKÁZKY

Fourierova transformace

31ZZS 9. PŘEDNÁŠKA 24. listopadu 2014

Akustika pro posluchače HF JAMU

SYNTÉZA AUDIO SIGNÁLŮ

PSK1-9. Číslicové zpracování signálů. Číslicový signál

1. Navrhněte a prakticky realizujte pomocí odporových a kapacitních dekáda derivační obvod se zadanou časovou konstantu: τ 2 = 320µs

PSK1-5. Frekvenční modulace. Úvod. Vyšší odborná škola a Střední průmyslová škola, Božetěchova 3 Ing. Marek Nožka. Název školy: Vzdělávací oblast:

31SCS Speciální číslicové systémy Antialiasing

ANALÝZA LIDSKÉHO HLASU

MULTIMEDIÁLNÍ A HYPERMEDIÁLNÍ SYSTÉMY. 4) Upravujeme nahraný zvuk

Akustika pro posluchače HF JAMU

Fyzikální podstata zvuku

r Odvoď te přenosovou funkci obvodů na obr.2.16, je-li vstupem napě tí u 1 a výstupem napě tí u 2. Uvaž ujte R = 1Ω, L = 1H a C = 1F.

Spektrální analýza a diskrétní Fourierova transformace. Honza Černocký, ÚPGM

Komprese dat Obsah. Komprese videa. Radim Farana. Podklady pro výuku. Komprese videa a zvuku. Komprese MPEG. Komprese MP3.

Circular Harmonics. Tomáš Zámečník

KTE/TEVS - Rychlá Fourierova transformace. Pavel Karban. Katedra teoretické elektrotechniky Fakulta elektrotechnická Západočeská univerzita v Plzni

Hlavní parametry rádiových přijímačů

Základy Hudební Akustiky. 1. Úvod

VOLBA ČASOVÝCH OKEN A PŘEKRYTÍ PRO VÝPOČET SPEKTER ŠIROKOPÁSMOVÝCH SIGNÁLŮ

2 Teoretický úvod Základní princip harmonické analýzy Podmínky harmonické analýzy signálů Obdelník Trojúhelník...

Vlastnosti a modelování aditivního

X31ZZS 3. PŘEDNÁŠKA 6. října Periodické průběhy Fourierovy řady Spektrum Barva zvuku Aplikace

Zvukové rozhraní. Základní pojmy

Iterační výpočty. Dokumentace k projektu č. 2 do IZP. 24. listopadu 2004

Teorie elektronických obvodů (MTEO)

magnetizace M(t) potom, co těsně po rychlé změně získal vzorek magnetizaci M 0. T 1, (2)

Lineární a adaptivní zpracování dat. 1. ÚVOD: SIGNÁLY a SYSTÉMY

25.z-6.tr ZS 2015/2016

Akustika. Hudební nástroje. 7. Přednáška

CW01 - Teorie měření a regulace

Měření na nízkofrekvenčním zesilovači. Schéma zapojení:

Fyziologická akustika. fyziologická akustika: jak to funguje psychologická akustika: jak to na nás působí

Mechanické kmitání a vlnění

Střední průmyslová škola elektrotechnická a informačních technologií Brno

A7B31ZZS 4. PŘEDNÁŠKA 13. října 2014

Modulační syntéza 8. prosince 2014

Praktické výpočty s komplexními čísly (především absolutní hodnota a fázový úhel) viz např. vstupní test ve skriptech.

VY_32_INOVACE_ENI_2.MA_05_Modulace a Modulátory

Vstupní signál protne zvolenou úroveň. Na základě získaných údajů se dá spočítat perioda signálu a kmitočet. Obrázek č.2

Příloha č. 1. amplitudová charakteristika filtru fázová charakteristika filtru / frekvence / Hz. 1. Určení proudové hustoty

14 - Moderní frekvenční metody

NOTY A POMLKY - OPAKOVÁNÍ

Zpracování obrazů. Honza Černocký, ÚPGM

KATEDRA ELEKTRICKÝCH MĚŘENÍ

MATLAB PRO PODPORU VÝUKY KOMUNIKAČNÍCH SYSTÉMŮ

P7: Základy zpracování signálu

CW01 - Teorie měření a regulace

SIGNÁLY A LINEÁRNÍ SYSTÉMY

Analýza a zpracování digitálního obrazu

Semestrální projekt. Vyhodnocení přesnosti sebelokalizace VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ. Fakulta elektrotechniky a komunikačních technologií

SIGNÁLY A LINEÁRNÍ SYSTÉMY

ANALÝZA PNUS, EFEKTIVNÍ HODNOTA, ČINITEL ZKRESLENÍ, VÝKON NEHARMONICKÉHO PROUDU

ZÁPADOČESKÁ UNIVERZITA V PLZNI FAKULTA ELEKTROTECHNICKÁ KATEDRA APLIKOVANÉ ELEKTRONIKY A TELEKOMUNIKACÍ DIPLOMOVÁ PRÁCE

X31EO2 - Elektrické obvody 2. Kmitočtové charakteristiky

Transkript:

Syntéza audio signálů Aditivní syntéza symfonického orchestru a akordeonu Bedřich Smetana - Vltava 3 oktávy durové stupnice Johann C. F. Fischer - Preludium a fuga G dur Bedřich Smetana - Jiřinková polka Václav Král 2016

Teoretická část 2 Midi toolbox 2 Aditivní syntéza 2 Stereofonní zvuk 2 Praktická část 3 Odečtení amplitud harmonických frekvencí 3 Tvorba obálky 4 Syntéza audio signálu 7 Reference 9 1

Teoretická část Midi toolbox Midi je standard elektronické komunikace mezi hudebními nástroji a počítačem. Přenos je sériový. Informace o hraném tónu jsou přenášeny jako koeficienty - např. číslo nástroje, frekvence, délka tónu, síla zvuku, zda jde o legato, atd. Midi také umožňuje uložení notového zápisu a následnou syntézu. V tomto projektu je použit upravený Midi toolbox pro Matlab (autor Ken Schutt). Tento toolbox umí mimo jiné načíst notový zápis ve formátu midi a syntetizovat z něj hudební nahrávku. Toto dovolí soustředit se v tomto projektu čistě na syntézu zvuku jednotlivých hudebních nástrojů, aniž by bylo třeba zabývat se vytvářením notových zápisů. Aditivní syntéza Při aditivní syntéze vezmeme zvuk nástroje a převedeme ho do spektrální oblasti. Takto můžeme získat rozložení harmonických složek a jejich velikosti. Budeme-li uvažovat harmonický signál, můžeme převádět signály z časové oblasti do spektrální a zpět beze ztrát. Použitím dat získaných ze spektra původního signálu můžeme vytvořit nový signál tak, že sečteme jednotlivé vážené násobky požadované frekvence. Získáme tak zvukový signál se stejnou barvou, jakou by měl originální zvuk. Vjem zvuku ovlivňuje i tvar obálky signálu, kterým je také potřeba se zabývat. Stereofonní zvuk Mezi hlavní způsoby určení pozice zdroje zvuku patří meziušní rozdíly v hlasitosti (ILD) a čase příjmu (ITD). Pokud máme monofonní zvuk, můžeme se znalostí polohy posluchače a nástroje simulovat stereofonní zvuk. Časové zpoždění příjmu signálu na jednotlivých uších se dá vypočítat přes Pythagorovu větu, zatímco rozdíly v hlasitosti lze odhadnout. 2

Praktická část Odečtení amplitud harmonických frekvencí Použil jsem zvukové nahrávky různých nástrojů volně dostupné na stránkách freesound.org pro získání barvy zvuku jednotlivých nástrojů symfonického orchestru a nahrávku vlastního akordeonu. Po načtení do Matlabu ve skriptu analyza_main byl signál oříznut na několik period, kde je předpokládaný rozvoj všech harmonických, a předán funkci analyza. Tato funkce provede rychlou Fourierovu transformaci signálu do spektra s oříznutím. Skript poté pokračuje grafickým vybráním velikostí jednotlivých harmonických z grafu. Pro každý nástroj je třeba zvolit jiný počet harmonických. Po vybrání všech hodnot se velikosti harmonických ampl uloží do souboru označeného číslem nástroje ve složce data. 3

Tvorba obálky Pro napodobení zvuku je důležitá i jeho obálka. Obálka perkusních signálů se dá popsat exponencielou, u neperkusních signálů se používá obálka typu ADSR. U obálky typu ADSR je potřeba zvolit významné body v obálce, kterými se zajistí tvar obálky podobný původnímu signálu. Poté je lineární interpolací dopočten obálkový signál, kterým se vynásobí signál generovaný pro získání správné barvy zvuku. Délka A, D a R se typicky nemění v závislosti na délce signálu (popisují náběh zvuku, resp. doznívání), zatímco délka S (držení) přímo odpovídá délce tónu. Z toho také vyplývá, že není možné signál nekonečně zkracovat. Proto jsou všechny skripty pro generování tónů opatřeny minimální délkou tónu pro daný hudební nástroj. 4

U neperkusních hudebních nástrojů je časté, že jednotlivé harmonické nezačínají hrát současně, ale čím vyšší je harmonická, tím déle začne znít a tím dříve skončí znít. Pro tyto nástroje byla nejdříve odečtena obálka původního signálu, resp. základní harmonické, z časové reprezentace signálu. Poté je ze spektrogramu odhadnuto zpoždění nástupu dalších harmonických, resp. jejich poklesu. Pro jednoduchost se používá násobení hodnot náběhu první harmonické konstantou závislou na čísle harmonické. Doba náběhu a doznívání se zkracuje do té doby, dokud se jejich součet nerovná délce signálu, poté mají zbývající vyšší harmonické všechny stejnou obálku. 5

Pro perkusní nástroje je využita kombinace ADSR a exponenciální obálky. Pro náběch signálu je použita obálka typu ADSR s konstantní délkou jako pro neperkusní signály. Exponenciální obálka je použita pro pokles, resp. doznění. Jsou použity 2 exponenciály, aby bylo možné modelovat rychlejší spád obálky pro pokles signálu a zároveň docílit určité doby doznívání. Parametry τ jsou voleny tak, aby obálka co nejvěrněji napodobovala tvar původního signálu. Stejně jako u obálky typu ADSR je třeba i zvuků perkusních nástrojů dodržet určitou délku trvání signálu, aby mohl i např. krátký požadovaný signál správně doznít (např. harfa doznívá velmi dlouhou dobu). 6

Syntéza audio signálu Ke generování zvuku je použit jak v aditivní syntéze typický sinusový signál, tak i signál obdélníkový a pilový. Tyto signály jsou generovány funkcí rect.m, resp. saw.m. Z matematických popisů tvorby těchto signálů (nekonečná suma sinů s rostoucí frekvencí) je vytvořen skript, který zajistí omezení aliasingu. Obdélníkové signály zajistí zajímavější zvuk pro dechové nástroje, zatímco pilovitý signál lépe popisuje smyčcové nástroje. Protože takto generované zvuky obsahují harmonické až do poloviny vzorkovacího kmitočtu, jsou omezeny filtrem typu dolní propust na 15 khz. Nejedná se navíc o přesné signály typu obdélník/pila, protože amplitudy vyšších harmonických jsou slabší než podle předpisu. Toto zajistí bohatší barvu zvuku, aniž by byl zvuk moc agresivní. Podívejme se nyní na syntézu obecného nástroje. Ve skriptu synth.m je pro každý nástroj nejdříve vyhodnocena délka signálu a případně zajištěna minimální délka pro správný zvuk. Pokud je splněna podmínka pro frekvenční rozsah daného nástroje, pokračuje se syntézou zvuku, jinak je výstupem prázdný signál. Následuje cyklus s výpočtem signálu pro harmonické složky. Je vypočteno případné tremolo (intenzita závisí na harmonické, frekvence podle zdrojového zvuku). Následně je vypočtena obálka pro danou harmonickou. Pokračuje se generováním harmonické sinem, popřípadě pilou nebo obdélníkovým signálem. Takto generovaný signál je vynásoben obálkou a tremolem. Dále je třeba zajistit nulovou střední složku, normalizaci signálu a vynásobení chtěnou amplitudou. Každá jedna syntetizovaná nota se předá nadřazené funkci, kde je přičtena k výstupnímu signálu. Před uložením se výstupní signál omezí pozvolnou dolní propustí na 15 khz pro omezení rušivých složek způsobených použitím pilových a obdélníkových signálů. Pro syntézu houslí a čela je využit pilovitý průběh zajištěný funkcí saw.m. Navíc je použito vibrato, jehož intenzita je závislá na čísle harmonické. Při syntéze dechových nástrojů se 7

využívá sinusový nebo obdélníkový průběh tak, aby zněl daný nástroj přirozeně. Žesťový soubor obsahuje trubku, tubu a lesní roh, kde každý nástroj má omezený frekvenční rozsah podle svých fyzikálních možností. U tympánů je základní zvuk generovaný aditivní syntézou (jako u zbytku), navíc je použita i subtraktivní syntéza pro lepší napodobení barvy zvuku. Jelikož se jedná o perkusní nástroj, je použita ADSR+exponenciální obálka. Zvuk harfy a drnknutí do houslí je syntetizován pomocí funkce saw_piz.m, resp. saw_harp.m, které zajišťují pilovitý průběh a zároveň vylepšenou obálku ADSR+exponenciela. Funkce synth.m umožňuje i tvorbu stereofonní nahrávky. Aby se nemusely upravovat vnitřní funkce midi toolboxu, stereofonní zvuk se syntetizuje manuálně, kdy ve funkci synth.m lze zvolit syntézu mono/levý kanál/pravý kanál. Při volbě mono proběhne základní syntéza, kdy amplituda daného tónu je řízena pouze amplitudou předepsanou v notovém zápisu. Pokud zvolíme syntézu levého nebo pravého kanálu, je situace složitější. Byla zvolena pozice posluchače 10 metrů před orchestrem a velikost orchestru je půlkruh o poloměru také 10 metrů. Ve funkci itd_stereo.m je pro jednotlivé nástroje vypočteno ITD, které je následně ve funkci synth.m přepočteno na počet vzorků zpoždění. Následně je kanál pro stranu, kde je nástroj blíže, opatřen nulami na konci signálu a druhý kanál nulami na začátku signálu. Počet nul odpovídá zpoždění ITD. Následně je normalizovaný signál pro každý kanál přenásobený amplitudou určenou v notovém zápisu a odhadnutou amplitudou pro ILD. Nakonec se jednotlivě vypočtené nahrávky spojí do stereofonní nahrávky. Navíc je možné do nahrávky přidat konvoluční reverb. Pro orchestr přinesla nejlepší výsledek impulsní odezva Vídeňského sálu Musikverein, pro menší počet nástrojů je tento prostor ovšem moc veliký, ostatní skladby jsou tedy opatřeny reverbem velké dobře tlumené místnosti. Jako poslední úprava je přičten šum s odstupem 70 db, který by měl simulovat přítomnost posluchačů v sálu. 8

Hudební stupnice je syntetizována ve skriptu stupnice.m. Je zde vytvořen vektor frekvencí a vektor hudebních nástrojů. Následně je volána přímo funkce synth.m a jednotlivé zvuky jsou spojeny do nahrávky stupnice_stereo.wav. Na stejném principu funguje skript fuga.m, kde je syntetizována nahrávka fuga.wav. Použil jsem notový zápis z mé loňské semestrální práce, ale syntéza akordeonu je implementována nově, a to stejným způsobem jako ostatní nástroje v této práci. Pro využití midi tollboxu pro syntézu akordeonu byla navíc syntetizována skladba Jiřinková polka od Bedřicha Smetany, kterou jsem také na akordeon hrál v ZUŠ. Reference http://sami.feld.cvut.cz/syn/%c3%9avod.pdf (Midi) http://kenschutte.com/midi (Midi toolbox) https://freesound.org (volně dostupné nahrávky hudebních nástrojů) http://www.phy.mtu.edu/~suits/notefreqs.html (frekvenční rozsah hudebních nástrojů) http://legacy.spa.aalto.fi/projects/poririrs/ (impulsní odezva finské koncertní síně) http://www.voxengo.com/impulses/ (balíček odezev různých prostorů) 9