Současné formáty pro záznam zvuku

Rozměr: px
Začít zobrazení ze stránky:

Download "Současné formáty pro záznam zvuku"

Transkript

1 Bankovní institut vysoká škola, a.s. Katedra matematiky, statistiky a informačních technologií Současné formáty pro záznam zvuku Bakalářská práce Autor: Viktor Čapek Informační technologie, MPIS Vedoucí práce: Ing. Bohuslav Růžička, CSc. Praha Leden, 2012

2 Prohlášení: Prohlašuji, že jsem bakalářskou zpracoval samostatně a v seznamu uvedl veškerou použitou literaturu. Svým podpisem stvrzuji, že odevzdaná elektronická podoba práce je identická s její tištěnou verzí, a jsem seznámen se skutečností, že se práce bude archivovat v knihovně BIVŠ a dále bude zpřístupněna třetím osobám prostřednictvím interní databáze elektronických vysokoškolských prací. V Bavorově dne Viktor Čapek

3 Poděkování: Chtěl bych poděkovat vedoucímu práce panu Ing. Bohuslavu Růžičkovi, CSc. za jeho pomoc a trpělivost při zpracování této bakalářské práce.

4 Anotace: Cílem této práce je seznámit čtenáře se základními principy převodu z analogového na digitální signál a základními principy ztrátových i bezeztrátových kompresních algoritmů. Součástí práce je uvedení nejpoužívanějších zvukových formátů a jejich srovnání. Annotation: The aim of this paper is to acquaint the reader with the basic principles of converting from analog to digital signal and the basic principles of the loss and lossless compression algorithms. The work putting the most used audio formats and their comparison.

5 Obsah Úvod Zvuk a jeho vlastnosti Lidské ucho a zvuk Binaurální slyšení Číslicová modulace Modulace PCM Vzorkování Kvantování Kódování DPCM DSD Datová sběrnice I 2 S DVD Audio SACD Komprese zvukových souborů Bitrate Ztrátová komprese Sub-Band Coding Spectral Band Replication Psychoakustický model Křivka slyšitelnosti Frekvenční maskování Časové maskování Bezeztrátová komprese Zvukové formáty Ztrátové formáty zvuku MPEG-1 Layer WMA

6 AAC OGG Vorbis ATRAC Dolby Digital Shrnutí Bezeztrátové formáty zvuku FLAC Apple Lossless Monkey`s audio WavPack MLP Shrnutí Závěr

7 Úvod Jak již vyplývá z názvu práce, cílem je seznámit čtenáře se současnými formáty zvuku a jejich použitím, protože v dnešním digitálním světě je potřeba zvuk zaznamenávat, upravovat a reprodukovat. V kapitole 1 jsem se zaměřil na popis zvuku, jeho charakteristiky a šíření a také na vlastnosti lidského ucha a jeho možnosti slyšení a lokalizace zvuku. V kapitole 2 popisuji základní principy převodu analogového zvuku na zvuk digitální. V této kapitole jsem se zmínil hlavně o nejpoužívanější PCM modulaci. V kapitole 3 se snažím popsat principy komprese digitálního zvuku, zaměřuji se zde hlavně na ztrátové komprese, popisuji zde principy psychoakustického modelu a podpásmového kódování, jenž jsou jedny z nejdůležitějších prvků této komprese. V kapitole 4 již zmiňuji nejpoužívanější ztrátové a bezeztrátové formáty zvuku a jejich parametry a vlastnosti. V této kapitole jsem také provedl měření účinnosti komprese bezeztrátových kodeků. V závěru práce uvádím celkové shrnutí této práce. Tato práce by měla čtenářům pomoci ujasnit si základní pojmy a metody v oblasti zpracování zvuku. 3

8 1. Zvuk a jeho vlastnosti Zvuk je mechanické vlnění v látkovém prostředí. Rozsah frekvencí tohoto vlnění, které je člověk schopen vnímat, leží v intervalu přibližně od 16 Hz do Hz. Někdy literatura uvádí rozsah jen do Hz. Je to závislé na kvalitě sluchu a stáří každého jedince. I když je mechanické vlnění mimo slyšitelný frekvenční rozsah, označuje se také jako zvuk (infrazvuk, ultrazvuk). [4] Zvuk s frekvencí nižší než 16 Hz nazýváme infrazvuk a zvuk s frekvencí vyšší než 20 khz nazýváme ultrazvuk. Děje spojené se vznikem zvuku jeho šířením a vnímáním se nazývají akustika. Zdrojem zvuku může být každé pohybující se těleso. Prostředí, ve kterém se zvuk šíří, nazýváme vodič, může být plynné, kapalné i pevné. Vakuum neboli vzduchoprázdno, je zase dokonalá zvuková izolace. V kapalinách a plynech se šíří jako postupné vlnění podélné, v pevných látkách jako postupné vlnění podélné a příčné. Vlnové délky slyšitelného zvuku jsou v rozmezí od 21 m do 21 mm (21 m = 16 Hz, 21 mm = 16 khz). Šíření rychlosti zvuku je také závislé na druhu a hustotě prostředí, na teplotě t a vlhkosti vzduchu. Rychlost šíření zvuku ve vzduchu se v běžných podmínkách spočítá podle vzorce: c = 331,8 m/s + 0,6.T [m/s] kde T = teplota vzduchu ve stupních Celsia. Standardizovaná hodnota 340 m/s pak odpovídá teplotě vzduchu 13,6 C. [2] Při dopadu zvuku na pevnou překážku dochází k částečné absorpci zvukové energie a částečnému odrazu, který závisí na druhu obou prostředí. Intenzita odraženého vlnění I je vždy menší než intenzita na stěnu dopadajícího vlnění I 0. a = I 0 -I / I 0 Podíl se nazývá koeficient absorpce zvuku při odrazu [ a ] a je závislý především na materiálu odrazové plochy a na frekvenci zvuku, kdy při nižších tónech je koeficient absorpce tónu menší a pro vyšší tóny naopak větší. [3] 4

9 Dopadne-li zvuková vlna na velkou překážku (plochu), nastane odraz zvuku. Zde platí pravidlo o shodné velikosti úhlu dopadu a odrazu, které můžeme vidět na obrázku (Obr. 1). Dostatečně veliká překážka má rozměry přesahující vlnovou délku zvukového vlnění. Pokud je plocha rovná a dostatečně velká, pak se zvuková vlna od překážky odrazí pod dopadovým Obr. 1 Odraz zvuku 1 úhlem a zachová si svůj charakter, fázi i amplitudu (toto tvrzení platí pro tuhou překážku). Pokud není překážka rovná, nastává pak rozptyl nebo soustředění zvuku podle toho, jestli je odrazová plocha vydutá nebo vypouklá. Lidské ucho dokáže rozlišit krátké zvuky následující po sobě tehdy, je-li mezi nimi časový interval alespoň 0,1 s, proto dostaneli se zvukové vlnění od zdroje k překážce a zpět za 0,1 s nebo za dobu delší, vzniká ozvěna (Obr. 2). Pro rychlosti zvuku ve vzduchu (340 m/s) musí být překážka od posluchače vzdálena minimálně 17 m. Pokud je překážka blíže ke zdroji zvuku než 17 m, vzniká dozvuk (prodloužení zvuku původního). V malých místnostech slouží Obr. 2 Ozvěna 2 k zesílení sluchového vjemu, neboť následuje po původním zvuku tak rychle, že s ním splývá. Jestliže má zvuková vlna v cestě překážku nepřesahující svými rozměry vlnovou délku dopadajícího zvuku, pak se vlnění ohýbá kolem této překážky a zvuk můžeme slyšet i za touto překážkou. To neplatí při překážce větší než je vlnová délka, kde se vlnění kolem ní již neohýbá a za překážkou nastává tzv. akustický stín a zvuk není slyšet. Mohli bychom slyšet pouze zvuk, který se k nám dostal odrazem od jiné překážky nebo se částečně dostal skrz překážku.[3] [cit ] 2 [cit ] 5

10 1.1. Lidské ucho a zvuk Jak již bylo řečeno v předchozí kapitole, lidské ucho dokáže rozpoznat frekvence 16 Hz 16 khz, někdy se také uvádí 16 Hz 20 khz (toto závisí na osobní dispozici a také na věku). Lidské ucho je nejcitlivější v oblasti 1 khz 3 khz, což je oblast frekvence lidského hlasu. Lidské ucho nevnímá hlasitost zvukového signálu lineárně, ale logaritmicky. Vnímá změny tlaku p na bubínek a je také schopné bez trvalého poškození sluchu zpracovávat signály v rozsahu db (při více jak 140 db dochází k trvalému poškození sluchu). Lidské ucho vnímá hlasitost zvuku jako subjektivní veličinu, která je závislá na akustickém tlaku p. Proto byla stanovena měřitelná veličina Lp (hladina akustického tlaku). Za hodnot 0 db je považována hodnota tlaku p = 20 μpa, což je rovno prahu slyšitelnosti tónu o frekvenci 2 khz. Jedná se o logaritmickou jednotku narozdíl od další jednotky son, která je lineární a vyjadřuje subjektivně vnímanou hlasitost zvuku. V tabulce (Tab. 1) je uvedena hlasitost a zvuková hladina pro různé zdroje zvuku.[4] Tab. 1 Hlasitost zvuku pro různé zdroje 3 Situace a zdroj zvuku Akustický tlak p (Pascal) Zvuková hladina Lp Hlasitost (SON) Hranice bolesti 100 Pa 134 db ~ 676 son Poškození sluchu při krátkodobém působení 20 Pa od 120 db ~ 250 son Proudové letadlo (vzdálené 100 m) 6,3 200 Pa db ~ son Sbíječka (1 m) / diskotéka 2 Pa ~ 100 db ~ 60 son Poškození sluchu při dlouhodobém působení 0,63 Pa od 90 db ~ 32 son Silnice se silným provozem (10 m) 0,2 0,63 Pa db ~ son Osobní auto (10 m) 0,02 0,2 Pa db ~ 4 32 son Televizor (1 m) - pokojová hlasitost 0,02 Pa cca 60 db ~ 4 son Nevzrušený rozhovor (1 m) , Pa db ~ 1 4 son Velmi tichá místnost , Pa db ~ 0,15 0,4 son Šum listů ve větru, klidný dech 6, Pa 10 db ~ 0,02 son Hranice slyšitelnosti při 2 khz Pa 0 db 0 son Vnímání zvuku každého jedince je naprosto subjektivní a nelze jednoduše popsat, jak na člověka bude určitý zvuk působit. Nelze tedy jednoduše určit hranici, co již považovat za hluk 3 [cit ] 6

11 a co ještě za normální zvuk. Pokud na lidské ucho bude působit hluk, může dojít ke sluchové únavě, jež může vymizet do několika hodin. Pokud ale bude hluk déletrvající, dochází k trvalému posunu prahu slyšitelnosti a při hluku s úrovní přesahující 130 db může dojít k mechanickému poranění orgánů ucha, tzv. akustickému traumatu Binaurální slyšení V této kapitole bych rád popsal základní princip binaurálního slyšení. Zjednodušeně řečeno se jedná o vnímání zvuku z prostoru oběma ušima. Zvuk z prostoru dorazí do obou uší s různou intenzitou a fázovým zpožděním a na základě rozdílu těchto hodnot je mozek schopen rozlišit vzdálenost a směr zvukového zdroje (jedná se o tzv. lokalizaci zvuku). V centrální nervové soustavě pak dochází ke spojení signálů z obou uší a dochází k binaurální sumaci, kde vnímaná hladina zvuku je o 3 db vyšší než při monourálním poslechu. Jelikož jsou uši na hlavě od sebe vzdáleny a každé je na jiné straně, zvukový signál, který k nim dorazí, je v každém uchu odlišný, a vzniká tak rozdíl intenzivní, časový a fázový. Intenzitní rozdíl: při umístnění zdroje ve střední rovině dopadne zvuková energie na obě uši se stejnou intenzitou. Pokud zvukový zdroj budeme přesouvat do strany, začne být intenzita rozdílná a lokalizujeme zvuk směrem k větší intenzitě. Tento rozdíl se uplatňuje hlavně u zdrojů, které se nachází blíže k nám a je dán tím, že jedno ucho je ke zdroji zvuku blíže než druhé. Intenzitní rozdíl se uplatňuje u vysokých tónů více než u tónů nižších. Větší význam má však rozdíl intenzity způsobený akustickým stínem hlavy, a uplatňuje se u tónů vysokých, pro něž je hlava dostatečnou překážkou zvukových vln, neboť vlnová délka se blíží rozměrům hlavy. Hluboké tóny, které mají velkou délku vlny, hlavu obejdou a intenzita zvuku je v obou uších stejná. Bylo zjištěno, že hluboké tóny, asi do 200 Hz, přicházejí do obou uší se stejnou intenzitou. Od 500 do 3000 Hz činí rozdíl asi 7 8 db, pak se rozdíl rychle zvětšuje, až dosáhne u 5000 Hz 25 db a po zpětném poklesu znovu u Hz 30 db [cit ] 7

12 Časový rozdíl: dopadu zvukových vln stejných fází nám také pomáhá lokalizovat směr zvukového zdroje a vzniká tím, že vzdálený zvuk dorazí do jednoho ucha s časovým zpožděním než do ucha druhého.[5] Trimble určoval tento časový rozdíl pomocí impulsů a zjistil, že lze rozeznat časový posun o 0,1 ms. Hornbostel a Wertheimer dokonce zjistili, že k časovému rozlišení stačí již rozdíl 0,03 ms (30 mikrosekund). Zvětšuje-li se tento časový rozdíl podle Trimbla na více než 2 ms, vnímají se dva rozdílné zvuky, každý v jiném uchu. Maximální časový rozdíl, který vyplývá ze vzdáleností obou uší u člověka, činí 0,6 ms. 5 Fázový rozdíl: se uplatňuje v situacích, při kterém dorazí zvuková vlna v odlišném úhlu od 0 a od 180 stupňů. Vznik fázového rozdílu a změny jsou závislé na vlnové délce a zvukový signál dorazí do vzdálenějšího ucha v odlišné fázi než do ucha bližšího. Také čisté tóny kolem frekvence 3 khz se dají obtížně lokalizovat, neboť časový rozdíl se již neuplatní a intenzitní rozdíl je malý. V běžném životě se setkáváme především se zvukem složeným jak z nízkých, tak z vysokých tónů, kde je lokalizace přesnější vlivem kombinace intenzitního a časového rozdílu. [5] V této kapitole bych chtěl také zmínit pojem zdánlivý zvuk. Zvuk tehdy slyšíme z místa, kde zdroj signálu vůbec není. Uvedl bych příklad poslechu stereo nahrávky na dvou reprosoustavách umístěných stejně daleko od osy (reprosoustavy a posluchač tvoří rovnostranný trojúhelník) a z každé jde zvuk o stejné intenzitě a fázi. Sluchový orgán vyhodnotí pak zdroj zvuku přímo před námi. Co prostorově lokalizujeme lépe: vyšší zvuk než nižší (proto také stačí jeden sub-basový reproduktor v audio sestavě) složené tóny než tón o jedné frekvenci pohybující se zdroj zvuku 5 [cit ] 8

13 2. Číslicová modulace V této kapitole bych chtěl popsat nejpoužívanější metody převodu analogového zvuku na zvuk digitální. Někdy mluvíme o analogu jako o spojitém signálu a o digitálním signálu jako nespojitém či diskrétním. V digitální reprezentaci se hodnoty vyjadřují čísly, kde jejich počet je konečný. Princip převodu spojitého signálu na nespojitý signál probíhá pomocí A/D (analog/digitál) převodníků v několika krocích, které budou popsány v následujících kapitolách. Existuje řada typů převodníků, kde každý používá jiné metody. Komparační metoda Paralelní A/D převodník: Jedná se o nejrychlejší A/D převodník, protože převod probíhá v jednom časovém okamžiku. Kvantování vstupního signálu probíhá v komparátorech, které nám porovnávají vstupní napětí s odstupňovaným referenčním napětím. Referenční napětí vytvoříme z odporové sítě. Převodník s rozlišitelností n-bitů obsahuje 2 n -1 komparátorů. S postupnou komparací: Jde o zjednodušení paralelního převodníku při zachování krátké doby převodu. Výhodou je zachování vysoké rychlosti převodu při menším počtu komparátorů. Kompenzační: Porovnává se vstupní napětí s hodnotou zpětnovazebního napětí, které je získané pomocí D/A převodníku. Kompenzační převodníky patří k nejpoužívanějším kvůli jednoduché konstrukci a relativní rychlosti. Integrační: Základem těchto převodníků je integrátor, kde výstupem z převodníku je číslo odpovídající průměrné hodnotě vstupního napětí za určitou dobu. Vliv průměrování vyžaduje zapojit na vstup vzorkovací obvod. Použití integrátoru také potlačuje šumová napětí vyšších kmitočtů. Podle funkce rozlišujeme integrační A/D převodníky s mezipřevodem na kmitočet a s mezipřevodem na časový interval. Sigma-delta: Tyto převodníky dosahují vysoké linearity převodu při vysokém rozlišení až 24 bitů, ale s nižší rychlostí převodu. Lze používat v aplikacích s frekvenčním pásmem do desítek khz. Převodník se skládá ze sigma-delta modulátoru a číslicového filtru. [6] 9

14 2.1. Modulace PCM Zkratka PCM vyjadřuje pulzně kódovou modulaci a je stále nejpoužívanějším typem modulace v digitální audiotechnice. Byla vytvořena roku 1937 Britem Alecem Reevsem. Pulzně kódovou modulaci právě využívá dnes nejrozšířenější audio formát CD-Audio a jeho vylepšená verze DVD-Audio. PCM je také využívána pro svou jednoduchost převodu, úpravy vzorků v časové oblasti a celkovou odolnost proti chybám přenosu, protože jeden chybný vzorek neovlivní následující vzorky. Nevýhodou je relativně velká šířka potřebného kmitočtového pásma. Tvorba pulzně kódovaného signálu se děje ve třech krocích: vzorkování, kvantování, kódování Vzorkování Analogový signál nabývá nekonečného množství hodnot, které nemůže žádný A/D převodník zaznamenat, a proto každý vzorek vstupního signálu se při vzorkování omezí na nezbytný počet, se kterými A/D převodník dále pracuje. 6 Obr. 3 Vzorkování spojitého signálu 6 Vzorkování se provádí rozdělením časové osy signálu (vodorovná) na stejně dlouhé úseky, kde z každého úseku odebereme jeden vzorek (na obrázku č. 3 jsou tyto vzorky 6 [cit ] 10

15 znázorněny červenými body). 7 Takto získaná skupina diskrétních vzorků nám nemůže popsat původní analogový signál, a proto ztrácíme část detailů analogové křivky. Čím budou kratší úseky, tím bude lepší popis původního signálu. [6] Aliasing nebo také chyba při vzorkování nastane, pokud se v původním spojitém signálu objeví frekvence vyšší než polovina vzorkovací frekvence, kterou také nazýváme Nyquistova frekvence. Shannon-Kotělníkův teorém praví, že poté dojde k úplnému a nenávratnému zkreslení signálu díky jevu nazývajícímu se aliasing. Tomu můžeme zabránit použitím filtru dolní propusti (tzv. antialiasing filtr) umístněného před A/D převodník. Ten vyšší frekvence než je Nyquistova odfiltruje. Při vzorkování se nejčastěji používají frekvence 44,1 khz, 48 khz, 88,2 khz, 96 khz a 192 khz. Čím vyšší vzorkovací frekvence, tím je kvalitnější záznam (především vysokých kmitočtů). Shannon-Kotělnikův teorém f v je vzorkovací frekvence f v 2f max f max je frekvence nejvyšší obsažené přenášené harmonické Například u CD-Audio záznamu je použito vzorkovací frekvence 44,1 khz, takže na CD mohou být zaznamenány frekvence do 22 khz. [6] Kvantování Osa vstupního signálu z obrázku (Obr. 4) je rozdělena na jednotlivé hladiny, které označujeme jako kvantizační úrovně. Při kvantování se na základě rozhodovací úrovně jednotlivým vzorkům získaných při vzorkování přidělí jednotlivé kvantizační úrovně. Aby bylo Obr. 4 Kvantovací úrovně [cit ] 11

16 možné určit, které hodnoty má po kvantování nabývat určitý vzorek, je rozdělen prostor kolem jednotlivých úrovní na toleranční pásy. Na obrázku (Obr. 4) je naznačen kolem hodnoty 0. Každému vzorku zařazeného do daného tolerančního pásu je při kvantování přiřazena daná hodnota. Vzniká tak kvantizační chyba, což je vlastně rozdíl mezi skutečnou a "zaokrouhlenou" hodnotou po kvantizaci signálu. Kvantizační chyby způsobují vznik kvantizačního šumu. Čím budeme mít více kvantizačních úrovní, tím bude zkreslení menší. Zkreslení lze pozorovat na obrázku č. 4, kde červené body jsou vzorky a zelené body kvantované hodnoty. Signál zpětně převedený z digitální podoby do analogové nemůže přesně odpovídat původnímu signálu. Černá čára na obrázku (Obr. 5) znázorňuje zrekonstruovaný analogový signál zpětným D/A převodem, zatímco modrá čára je původní analogový signál, ze kterého byl A/D převodníkem získán signál digitální (zelené body). [6] Obr. 5 Zrekonstruovaný spojitý signál 8 Dithering Při kvantování dochází k určitému kvantizačnímu zkreslení, které je dáno rozdílem mezi skutečnou hodnotou vzorku a použité kvantizační úrovně. Dithering je metoda, která pomáhá kvantizační zkreslení potlačit pomocí přidání vhodného šumu do signálu [cit ] 12

17 Kódování Přiřazením jednotlivým vzorkům odpovídající kvantizačním hladinám n-bitové číselné hodnoty získáme zakódování do binární číselné soustavy. Protože se diskrétní signál většinou zpracovává v binární číselné soustavě, počet kvantizačních úrovní je roven n-té mocnině čísla 2. Např. u 16 bitového kódování je počet kvantizačních úrovní roven počtu hodnot, u 24 bitového kódování je to dokonce hodnot. Čím vyšší je bitová hloubka, tím je také lepší zaznamenaná dynamika audiosignálu. U 16bitového CD audiozáznamu je dynamika signálu 96 db a u 24 bitového kódování dokonce 144 db. Výpočet dynamického rozsahu N = počet bitů DR ADC = 20*log(2 N ) = 20*log(2) * N = 6.02 * N 9 Na obrázku (Obr. 6) je znázorněno zakódování pomocí 3 bitů, tzn. 8 kvantizačních hladin. Obr. 6 Zakódování kvantizačních hladin [cit ] 13

18 2.2. DPCM Differential Pulse Code Modulation Diferenční pulsně kódová modulace kóduje pomocí PCM rozdíl mezi skutečnou a predikovanou (předpokládanou) velikostí z předchozích vzorků. Princip byl publikován v roce Někdy se nazývá také Diferenciální PCM. Rozdíl mezi skutečným vzorkem a jeho predikovanou hodnotou bude menší než celý vzorek, což vede ke snížení datového toku. PCM. Modulace DPCM se příliš nepoužívá, protože lepší výsledky dosahuje její adaptivní varianta ADPCM.[7] t Obr. 7 Predikovaná hladina t Obr. 8 Rozdílové vzorky ADPCM Tento způsob kódování vychází z DPCM. Rozdílové vzorky jsou vytvářeny jako u DPCM, ale systém přizpůsobuje kvantování zejména velkým změnám hlasitosti kódovaného signálu, což vede k ještě větší úspoře bitů k zakódování vzorku.[7] 2.3. DSD DSD je anglická zkratka slov Direct Stream Digital a jedná se o způsob záznamu dat na nosiči SACD. Jde o jednobitový datový tok vzorkovaný frekvencí 2,8224 MHz (64 násobek hodnoty 44.1 khz) vytvořený modulátorem vyššího řádu delta-sigma. Proces vytvoření DSD signálu je tedy shodné s 1bit delta-sigma A/D převodem, ale je odstraněn decimátor, který konvertuje datový tok do PCM. Modulace DSD je jednodušší než PCM. Mezi nevýhody DSD formátu patří nemožnost jakéhokoliv dalšího zpracování. Pro úpravy nebo postprocessing je nutné DSD nejdříve převést na PCM a po úpravách převést zpět. V praxi není DSD formát moc rozšířen, stále se nejvíce používá PCM kódování. Na obrázku (Obr. 9) můžeme vidět 14

19 ukázku zakódování signálu, kde si můžeme zjednodušeně představit, že nejvyšší amplituda je interpretována sledem samých jedniček, naopak nejnižší posloupností nul.[8] 10 Obr. 9 DSD bitstream Datová sběrnice I 2 S Datová sběrnice I 2 S slouží k internímu přenosu PCM modulovaného signálu mezi jednotlivými zařízeními zpracovávající digitální audio data, např. mezi CD transportem a DAC převodníkem v CD přehrávači. Jde o standardizovanou tří vodičovou sběrnici vyvinutou formou PHILIPS. Celý anglický název je Inter-IC Sound a je založen na odděleném zpracování hodinového a datového signálu. Jak bylo řečeno, sběrnice se skládá ze tří samostatných linek. První linka s označením SD (serial data), je multiplexovaná datová linka Druhá linka s označením WS (word select), slouží k výběru aktuálního slova Třetí linka s označením SCK (serial clock), obsahuje hodinový signál Sběrnice je řízena jedním hlavním zařízením (MASTER), které generuje hodinový signál a hodinové signály ostatních podřízených zařízení (SLAVE) jsou od tohoto signálu odvozena (frekvence hodinového signálu 32k Hz, 44,1 khz, 48 khz nebo jejich násobky) [cit ] 15

20 Hlavní zařízení master může být jak přijímač, tak vysílač. Synchronizace dat je pak prováděna buď na vzestupnou nebo sestupnou hranu hodinového signálu podle prvního bitu master zařízení (MSB nebo LSB). Maximální délka použitého slova je 28 bitů. Na obrázku (Obr. 10) je znázorněna komunikace na sběrnici. [9] 11 Obr. 10 I 2 S přenos dat [cit ] 16

21 2.5. DVD Audio U vytvoření formátu DVD-Audio byl požadavek na ještě kvalitnější nahrávky, pro které již CD-DA nemohlo stačit a také využít možností, které DVD nabízí pro video. K velkému používání však nedošlo, možná s příchodem konkurenta Super Audio CD, který je s kvalitou také na vysoké úrovni, ale je hlavně zpětně kompatibilní s klasickými CD přehrávači. Poprvé se DVD-Audio objevilo na konferenci AES (Audio Engineering Society) v září Finální verze formátu 1.0 platí od března Za tímto formátem stojí především koncern Matsushita (obchodní značky koncernu jsou Panasonic a Technics) na rozdíl od konkurenta Super Audio CD, které podporují společnosti Sony a Philips. DVD-Audio nabízí oproti CD-Audio řadu nových vlastností včetně vyšší kvality, surround zvuku a delší doby přehrávání. Kapacita jednovrstvého DVD-Audio disku je 74 minut v plné kvalitě. Zvuk může být nahrán i v Dolby Digital, MPEG-1 stereo, MPEG-2 multikanál nebo DTS či SDDS atd. DVD-Audio dovoluje použít datový tok až 9,6 Mbps a může být využita i bezztrátová komprese MLP (Meridian Lossless Packing). Vzorky se kódují lineárně (LPCM) až od 16 bit, 20 bit nebo 24 bit a to představuje dynamický rozsah až 144 db. Vzorkovací frekvence mohou být použity: 44,1 khz, 48 khz, 96 khz, 176,4 khz, 192 khz. Kombinace kódování 24bit a vzorkovací frekvence 192 khz přináší frekvenční rozsah až do 96 khz (u sterea), což je téměř stejné jako u SACD a u 5.1 záznamu je použita vzorkovací frekvence max. 96 khz a bitová hloubka 20 bit. To přináší frekvenční rozsah až 40 khz. V tabulce (Tab. 2) je srovnání všech tří formátů. [10] 12 Tab. 2 Přehled jednotlivých formátů 12 TYP CD-DA DVD-Audio SACD Kanálů 2 2/5.1/8 2/5.1/6 Vzorkovací frekvence na jeden kanál 44,1 khz 96 khz* 2,822 MHz Šíře slova 16 bitů (PCM) 12/16/20/24 bitů 1 bit Frekvenční rozsah Hz Hz* Hz Dynamický rozsah 96 db až 144 db 120 db Délka záznamu 74 min min. 74 min min. 74 min * vzorkovací frekvence 96 khz na jeden kanál (doporučená pro vícekanálový záznam 5.1) 12 [cit ] 17

22 Stereo záznam může podporovat až 192 khz/24 bit. Vícekanálový zvuk pak může podporovat nižší variantu, nejběžněji 96 khz/24 bit pro hlavní kanály a 48 khz/20 bit pro efektové kanály. Jak již bylo řečeno, kódování dat na disk je bezeztrátové. Pro kompatibilitu s běžnými DVD-video přehrávači bývá na DVD-Audio vrstvě ještě ztrátový stereo záznam kódovaný v MPEG 2/4. [10] 2.6. SACD Z důvodu nemožnosti již zlepšovat CD-Audio formát bylo představeno v roce 1999 firmou SONY a PHILIPS Super Audio CD (SACD). Cílem byl formát, kde byl zvýšen dynamický a kmitočtový rozsah signálu a zároveň byl zpětně kompatibilní s CD. Tak vzniklo SACD, kde namísto LPCM modulace je použito jedno-bitové modulace označované DSD. 13 CD vrstva SBM Direct CD (16/44,1) High density vrstva Extra data Text Grafika Video Šestikanálový mix Dva kanály stereo Obr. 11 Složení vrstev SACD nosiče 13 Aby byla zachována kompatibilita s CD-Audio, je médium vícevrstvé. Vrstva pro kompatibilitu je vytvořena degradací původního DSD signálu pomocí technologie Super Bit Mapping Direct. [8] Pro přehrání záznamu z HD vrstvy je zapotřebí SACD přehrávač. Tato vysokokapacitní záznamová (High Density) vrstva obsahuje dvoukanálový DSD zvuk, na které je zakódován signál s frekvenčním rozsahem až do 100 khz a s dynamickým rozsahem více jak 120 db [cit ] 18

23 Odborníky je zvuk hodnocen jako uvolněnější, detailnější, s větším prostorem pro jednotlivé nástroje. Na SACD vrstvě může být uloženo až šest kanálů se stejným frekvenčním i dynamickým rozsahem pro každý kanál. Jak je vidět na obrázku (Obr. 11), na HD vrstvě mohou být obsaženy kromě audio stop také textové (včetně informací o skladbě, interpretovi albu atd.) a grafické informace. Na obrázku (Obr. 12) můžeme vidět způsob snímání jednotlivých vrstev SACD nosiče. I přes zvukové kvality a kompatibilitu s CD-Audio není SACD formát bohužel příliš rozšířen. Na obchodních pultech je omezený počet interpretů, Obr. 12 Složení vrstev SACD nosiče 14 jejichž nahrávky jsou v tomto formátu nahrané a cena je také vyšší než u CD-Audio nosiče. Samozřejmostí této technologie je také ochrana proti kopírování. [8] [cit ] 19

24 3. Komprese zvukových souborů Komprese dat nebo také komprimace dat je určena ke zmenšení datového toku a následně ke zmenšení velikosti datových souborů. Komprimace dat je tedy vhodná třeba k archivaci nebo při přenosu přes síť s omezenou rychlostí, což vede ke snížení doby nutné pro přenos. Při kompresi zvoleným kompresním algoritmem dochází ke kódování dat, kterým se odstraňují z dat redundantní informace. Aplikováním kompresních algoritmů se může objevit charakteristický zvukový projev znehodnocující výsledek. pre-echo (slabá kopie zvuku, který teprve zazní) reverb (kovově znějící ozvěna) Kompresi dat lze rozdělit do dvou základních kategorií: Ztrátová komprese při tomto typu komprese jsou některé informace z dat nenávratně odstraněny a nelze je zpět rekonstruovat. Tento typ komprese použijeme v případě, že je možné ztrátu některých informací tolerovat (v případě audio nebudeme kódovat frekvence, které stejně lidské ucho neslyší). Používá se pro kompresi zvuku i obrazu, kde si člověk díky nedokonalosti lidského sluchu a zraku chybějících informací nepostřehne nebo je degradace zvukové a obrazové kvality přijatelná. Bezeztrátová komprese na rozdíl od ztrátové komprese není tento typ tak účinný, ale velkou výhodou je, že komprimovaná data můžeme vrátit do původní podoby. Kompresní poměr Kompresní poměr nám udává podíl velikosti původních dat k velikosti komprimovaných dat. Pokud bychom měli datový soubor o velikosti 100 MB a po zkomprimování by dosahoval velikosti 10 MB, tak poměr velikosti souboru je 100/10 MB, což je kompresní poměr 1:10 (jedna ku deseti). Kompresní poměr je dán typem komprimovaných dat a volbou kompresního algoritmu. Například skladba na záznamu CD-Audio má datový tok přibližně 1,4 Mbps, zatímco komprimované zvukové soubory dosahují standardně od 128 Kbps do 320 Kbps. Kompresní poměr je tedy asi 1:11 až 1:4. Pro bezeztrátovou kompresi jsou standardní poměry do 2:1. 20

25 NCDQ Tento termín označuje kvalitu blížící se k CD (near CD quality). Takto jsou označovány komprimované formáty zvuku určitého datového toku bitrate, který je těžko rozpoznatelný od CD-Audio nahrávky. Kodek Kodek je algoritmus, který převádí datový tok do zakódované formy. Pomocí kodeku lze tedy datový tok zakódovat a při následném přehrávání dekódovat zpět do původní podoby. Někdy je také označován jako Encoder. Často bývá právě kodek zaměňován se zvukovým souborem, příkladem může být třeba MP3, MP3 není kodek, je to audio formát (kodek pro MP3 může být třeba nejznámější LAME) Bitrate Bitrate, nebo také přenosová rychlost datového toku se uvádí se v kilobitech za sekundu (kbps nebo kb/s). Hodnota bitrate nám ukazuje, kolik kbit se musí zpracovat při kódování, dekódování během jedné sekundy. Čím větší je bitrate (datový tok), tím bývá lepší kvalita výsledného zvuku, ale také velikost výsledného souboru. U nekomprimovaných formátů CD nebo WAV je bitrate až 1,4 Mbps, naopak u komprimovaného formátu se bitrate pohybuje v rozmezí od 32 kbps do 320 kbps. Přenosovou rychlost vypočítáme vynásobením vzorkovací frekvence velikostí bitové hloubky vzorků. Dostaneme datový tok (bitrate) k zaznamenání jedné sekundy audio záznamu jednoho kanálu. Tuto hodnotu pak vynásobíme počtem kanálů a výsledkem je datový tok v bitech za sekundu. Tento výpočet platí pro konstantní bitrate (CBR), ale ještě se používá variabilní bitrate (VBR) a průměrný bitrate (ABR). CBR Constant bitrate, neboli stálý datový tok. Datový tok je konstantní po celou dobu kódování nebo dekódování souboru. CBR je jednodušší na kompresi, ale s daty je stále pracováno stejnou rychlostí, a to i v místě u audiosignálu, kde to není nutné (tiché pasáže ve skladbě nebo hraje pouze jeden nástroj) a mohlo by se kódovat s nižším datovým tokem. Výsledkem 21

26 je pak větší velikost souboru. Tento typ se používá převážně u starších kompresních algoritmů. Výhodou je předvídatelná velikost výsledného audio nahrávky. [23] VBR Variable bitrate neboli variabilní datový tok. Uživatel si vybere požadovanou úroveň kvality, nebo rozsah datového toku. Variabilní bitrate tedy umožňuje vyšší datový tok na místech, kde jsou kódovány složitější pasáže skladby, zatímco menší datový tok se použije na jednodušší pasáže ve skladbě. Při kódování s VBR lze na stejný datový prostor zakódovat více dat než u CBR bez viditelné nebo slyšitelné ztrátě kvalitě obrazu nebo zvuku. Většina moderních ztrátových a bezeztrátových kodeků podporuje VBR. [23] ABR Average bitrate, neboli průměrný datový tok. Kodek přizpůsobuje datový tok jako u VBR náročnosti pasáže, ale zároveň dodržuje nastavené hodnoty pro průměrný datový tok. Výhodou je, že výsledná velikost souboru je odhadnutelná, ale bez znalosti výsledné kvality zakódovaného signálu. Při zadání nízké hodnoty při kódování může dojít k velkému poklesu výsledné kvality audio nahrávky. [23] 3.2. Ztrátová komprese Jelikož se jedná o kompresi ztrátovou, nelze tedy již zpětně zrekonstruovat původní zvukový záznam. Ztrácíme nenávratně určitá data, která lidské ucho nevnímá nebo je vnímá málo. Komprimační algoritmus ztrátové komprese je hlavně založen na tzv. psychoakustickém modelu, který bude vysvětlen v následující kapitole. Na základě tohoto modelu můžeme z původního digitalizovaného záznamu vypustit zbytečná data. Přestože nelze obnovit přesný původní signál, je ztrátová komprese velmi výhodná hlavně na audio / video ukládání dat, kde je vyvážen poměr kvalita / velikost výsledného souboru. Mírnou ztrátou detailů můžeme tak ušetřit až 90 % z původní velikosti záznamu. Způsob enkódování do bitstreamu není přesně definován, proto různé kodeky pro stejné formáty mají odlišnou kvalitu výstupu. Například různé kodeky mohou na základě různých nastavení odstranit některé části signálu, které naopak jiný kodek může ještě zakódovat do datového toku. [23] 22

27 3.3. Sub-Band Coding SBC je jedním ze základních principů vícepásmového kódování. Základem tohoto kódování je rozdělit vstupní PCM signál na více pásem, tzv. podpásem. K tomu využijeme pásmové propusti. Každé podpásmo, které se získalo rozdělením, se zpracuje zvlášť a pro každé dané podpásmo bude využita různá strategie pro použití psychoakustického modelu na redukci dat. Aby mohla být použita tato strategie, je třeba signál v každém podpásmu převést z časové oblasti do frekvenční oblasti. Někdy se také uvádí domény. Použije se k tomu diskrétní kosinové transformace DCT (Obr. 13). Poté ve zvoleném časovém úseku neboli okně dostaneme seznam obsažených frekvencí a jejich amplitudu místo průběhu signálu ve vzorcích. 15 Analýza zvuku charakteristická pro každé pásmo Jak bylo již psáno, každé podpásmo se zakóduje zvlášť podle informací z psychoakustického modelu, který určí limity maskování. Pomocí hodnot z maskovacích prahů jsou podpásmové vzorky kvantovány a kódovány tak, aby kvantizační šum byl pod maskovacím prahem. Posledním krokem je poskládání kódovaných vzorků do rámu. Dekódování je jednodušší, není zapotřebí psychoakustického modelu. Při dekódování dochází k rozbalování rámů a dekódování podpásmových vzorků a frekvenčně-časové mapování převede vzorky zpět do jednoho výstupního audio signálu. Téměř všechny dnes používané kodéry používají tuto metodu v různých modifikovaných podobách, může se lišit třeba počtem podpásem na jaké rozděluje vstupní signál. [11] Audio signál je rozdělen na pásma. Poté je signál z každého pásma transformován z časové do frekvenční oblasti (domény) Obr. 13 Transformace signálu z časové do frekvenční oblasti [cit ] 23

28 PCM Časové/Frekvenční Mapování Kvantizace a Kódování Skládaní Rámů (frames) Bitsream Psychoakustický Model Obr. 14 Kódování pomocí SBC 16 Bitstream Rozbalení Rámů (frames) Rekonstrukce Frekvenční/Časové Mapování PCM Obr. 15 Dekódování pomocí SBC Spectral Band Replication SBR algoritmus, který vyvinula firma Coding Technologies, je zatím nejnovější technologií s použitím nízkého bitrate při kódování PCM signálu. Používá se již u kodeků MPEG-2/-4 (Advanced Audio Coding AAC), nebo u kodeku MPEG-1/-2 Layer-3 (MP3), kde s touto technologií lze zvýšit účinnost až o 50 %. Při velmi vysokých kompresích (20:1) již kvalita výsledného zvuku není uspokojivá. Kvantizační šum již není pod maskovacím prahem psychoakustického modelu a pro posluchače je takovýto signál rušivý. Jedním způsobem může být omezení frekvenčního pásma nebo využití technologie SBR. Základním principem je myšlenka, že existuje korelace mezi vysokofrekvenčním rozsahem (Highband) a nízkofrekvenčním rozsahem (Lowband) téhož signálu. [12] 16 Obnova původního vysokofrekvenčního pásma může být provedena transpozicí z pásma nízkofrekvenčního. Kromě transpozice se provádí formování spektrální obálky. Vstupní signál je při kódování analyzován, spektrální obálka vysokofrekvenčního pásma a její charakteristika k nízkofrekvenčnímu pásmu je zakódována a výsledná data jsou 16 [cit ] Pozn. Vlastní úprava 24

29 multiplexována s bitstreamem. Na straně dekodéru se nejdříve bitstream demultiplexuje. Poté jádro dekodéru dekóduje nízkofrekvenční pásmo a dekodér SBR, jako postprocesor, použije SBR data k replikačnímu procesu. Výstup je získaný signál v celém kmitočtovém pásmu. [12] 17 Energie Energie Transpozice Rekonstrukce pomocí SBR Frekvence Obr. 16 Vytvoření vysokých kmitočtů pomocí transpozice 17 Frekvence Obr. 17 Zarovnání obálky vysokého pásma 17 SBR data PCM SBR Enkóder Filtrovaná audio data Signálový Enkóder Multiplex Bitstream Bitstream Demultiplexace Signálový Dekodér Pásmově limit. audio data SBR Dekodér PCM SBR data Obr. 18 Blokové schéma kódování a dekódování s SBR [cit ] Pozn. Vlastní úprava 25

30 Multiplexace Současné formáty pro záznam zvuku MPEG-1 Audio Layer3 komprese I když v dnešní době nepatří MP3 mezi formáty s nejúčinnější kompresí, stále se jedná o nejrozšířenější formát. Proto bych chtěl stručně na tomto formátu popsat princip komprese od PCM signálu až po MP3 bitstream. Na obrázku (Obr. 19) můžete vidět blokové schéma, kde si jednotlivé bloky nyní stručně popíšeme. PCM Banka Filtrů 32 podpásem 32 -MDCT -Adaptivní segmentace - Bitová Alokace -Kvantizace -Huffmanovo Kódování Data Bitstream FFT Psychoakustický model SMR Kódovaná stranová informace Obr. 19 Blokové schéma MPEG-1 Layer3 kódování 18 Banka filtrů Pomocí banky filtrů rozdělujeme vstupní PCM signál na 32 podpásem. Tento proces probíhá pomocí sady pásmových filtrů pokrývající celé zvukové spektrum, kde jednotlivé pásma mají stejnou velikost. Jedná se tak o tzv. lineární banku filtrů. FFT Fast Fourier Transform Model MPEG-1 Layer3 obsahující 1024 bodovou transformaci sloužící k spektrálnímu rozlišení audiosignálu. Ten potřebujeme rozlišit ke správnému určení maskovacích prahů v daných časových okamžicích, neboli časových oknech. V našem modelu FFT transformace probíhá paralelně s bankou filtrů. MDCT Modifikovaná diskrétní kosinová transformace. Tento algoritmus nám zpracovává 32 jednotlivých podpásem z banky filtrů. Podle dat z psychoakustického modelu určí velikost časového okna pro každé pásmo (okno je několik ms, po kterou se signál zpracovává). Při maximálních 1152 vzorcích na rámec a 32 pásem nám vychází 36 vzorků na podpásmo. [1] Literatura - zdroj [1] [cit ] Pozn. Vlastní úprava 26

31 Bitová alokace Z informací MDCT a psychoakustického modelu se získá pro každé podpásmo hodnota SMR Signal to mask ratio. Tato hodnota nám v každém podpásmu určí, o kolik je signál silnější než hranice slyšitelnosti. Po té se rozhoduje, kolik bude danému pásmu přiděleno bitů na zakódování vzorku. [1] Huffmanovo kódování Tato metoda je pojmenována podle svého objevitele D. A. Huffmana. Jedná se o bezeztrátový kompresní algoritmus. Princip je založen na pravděpodobnosti výskytu jednotlivých znaků, kde nejčastěji se vyskytujícím znakům je přiřazen krátký kód a znakům vyskytujícím se nejméně přidělen delší kód. Kódování je založeno na vytvoření binárního stromu, kde koncové body značí původní znaky zprávy. Body na stromu značí pravděpodobnost výskytu jednotlivých znaků a hrany mezi body jsou označeny symboly 0, 1. Pravděpodobnost počátečního bodu se Obr. 20 Příklad Huffmanova kódování 19 rovná součtu pravděpodobností pokračujících bodů a ty jsou řazeny podle pravděpodobnosti výskytu. Od kořene stromu dostaneme kódy jednotlivých znaků (0 při kroku vlevo a 1 při kroku vpravo). Na obrázku (Obr. 20) můžeme vidět jednoduchý příklad Huffmanovo stromu a zakódování textu ABRAKADABRA.[12] 19 Datový tok Posledním krokem je vytvoření datového toku, tzv. bitstream. Datový tok se skládá z jednotlivých rámců. Jednotlivé rámce mají svojí hlavičku (obsahuje způsob kódování, bitrate, vzorkovací frekvenci) a poté audio data [cit ] 27

32 Akustický tlak SPL [db] Současné formáty pro záznam zvuku 3.5. Psychoakustický model Psychoakustický model vychází ze způsobu, jakým lidský sluch vnímá jednotlivé zvuky. Tento model vlastně využívá nedokonalosti lidského ucha a využitím tohoto modelu můžeme odstranit při kompresi frekvence, které lidské ucho nemůže zaznamenat. To vede k úspoře datového toku bez znatelné, nebo přijatelné ztráty kvality. Veškeré významné kompresní formáty současnosti využívají výše uvedené principy ke zmenšení datového toku. Samotnou podstatou psychoakustického modelu je maskovací efekt. Maskování je jev, kdy některá část v signálu sluchově překryje jinou, která je potom pro lidské ucho neslyšitelná. Tento princip je založený na základech frekvenčního a časového maskování. Frekvenční maskování využívá nelinearity citlivosti lidského ucha a časové maskování využívá setrvačnosti lidského ucha. Část signálu, která způsobí překrytí jiné části, nazýváme maskující a překrytá část signálu se nazývá maskovaná. Frekvenční maskování se také nazývá souběžné, protože se maskující a maskovaný prvek v audio signálu vyskytne ve stejný okamžik. Naopak pokud maskující prvek předchází nebo následuje za maskovaným prvkem, jedná se o časové maskování. Oba jevy si popíšeme podrobněji Křivka slyšitelnosti Sluchový vjem lidského ucha nezávisí pouze na úrovni akustického tlaku, ale také na frekvenci zvuku. To znamená, že je velký rozdíl mezi změřeným akustickým tlakem SPL a subjektivně vnímanou hlasitostí zvuku v závislosti na jeho frekvenci. 20 Můžeme tedy vynést křivku, která pro každou frekvenci prochází hodnotou akustického tlaku SPL, které je lidské ucho schopno již vnímat. Taková křivka se nazývá práh slyšitelnosti a je Obr. 21 Křivka slyšitelnosti 20 Frekvence [Hz] 20 Literatura - zdroj [1] [cit ] 28

33 znázorněna na obrázku Obr. 21. Tato křivka je také důležitou součástí psychoakustického modelu, protože veškeré frekvence, které se nacházejí pod křivkou, jsou neslyšitelné a je možné je ze signálu odebrat. [4] Frekvenční maskování Frekvenční maskování je jev, kdy ve stejném okamžiku překryje silnější složka v signálu složku slabší a ta přestane být v signále slyšitelná. Zjednodušeně řečeno, je to neschopnost lidského ucha slyšet oba tóny současně. Pokud se v signále objeví intenzivní tón M 0 o frekvenci 1 khz, vytvoří se kolem tohoto tónu maskovací práh (oblast ohraničená křivkou). Při dostatečné intenzitě tónu pak zamaskuje všechny méně intenzivní tóny (M1, M2) v jeho blízkosti a tóny pod úrovní křivky jsou pro lidské ucho již neslyšitelné, proto je není nutné přenášet. Takový signál se nazývá maskovací signál. Signál označený M P je již nad maskovacím prahem, ale vnímána je jen jeho část (M PU ). Z tohoto tónu tedy přeneseme jen tu část, co je nad maskovacím prahem. Maximální Obr. 22 Frekvenční maskování úroveň maskovaného signálu je 22 závislá na frekvenční vzdálenosti a úrovni maskujícího signálu. Maskovací schopnost je též závislá na frekvenci maskujícího tónu. Vnímání tónů s blízkými frekvencemi je ovlivněno šířkou kritického pásma. To má na nejnižších kmitočtech velikost kolem 100 Hz, zatímco na nejvyšších kmitočtech dosahuje až 4 khz. Je-li pak ve frekvenčním spektru přítomno více silných maskovacích signálů, vytvoří si každý z nich svou maskovací křivku, z níž je následně sestavena jedna globální [13] [cit ] 22 [cit ] 29

34 Časové maskování Principem časového maskování je neschopnost lidského ucha vnímání slabších tónů při zaznění silnějších tónů nejen v kmitočtovém spektru, ale i v závislosti na čase. Pokud zazní silný tón, je naše vnímání dalších tónů omezeno na několik desítek až stovek milisekund i po jeho ukončení a slabší tóny opět neslyšíme. Pre-masking maskovaný signál v čase předchází maskujícímu signálu (dopředné maskování). Post-masking vyskytne-li se maskující signál v čase dříve než maskovaný signál (zpětné maskování). Pre-masking je dán tím, že ucho potřebuje čas na rozkmitání bubínku. Obr. 23 Časové maskování 24 Vnímání tónu není okamžité, ale je zpožděné. Pre-masking trvá, oproti post-maskingu, mnohem kratší dobu. Post-masking zase spočívá v neschopnosti ucha rozeznat rychle po sobě znějící tóny. Doba maskovacího efektu je závislá na čase, po kterou tón zněl. Čím kratší čas zněl, tím bude delší maskovací efekt.[13] [cit ] 30

35 3.6. Bezeztrátová komprese Obvykle není tak účinná jako ztrátová komprese dat, ale velkou výhodou je, že komprimovaný soubor lze zrekonstruovat (obnovit) do původní podoby. Na rozdíl od ztrátových kodeků jsou bezeztrátové více náročné na výpočetní výkon a skladovací kapacitu. Jednou z možností pro kompresi audio dat je možné použít běžné pakovače dat, jako ZIP nebo RAR, ale ty nejsou pro audio soubory příliš vhodné, protože mají malou účinnost (redukce dat 5 10 %). Novější verze mají RAR dosahují pro multimediální soubory účinnosti vyšší (redukce dat %). Bezeztrátový audio kodeky dosahují běžně ještě vyšší účinnost (redukce dat kolem 50 %). Jejich účinnost je také závislá na druhu kompresovaného audio signálu. Více nástrojů obsažených v signálu vede ke snížení účinnosti redukce dat. Dnešní bezeztrátové kompresory pracují v podstatě stejně, jsou rozdílné jen v použitém algoritmu. Jejich schéma je ale vždy následující: Paketizace Signál je rozdělen na kratší časové úseky pakety (frames). Tyto pakety obsahují vzorky a pomocná data. Jednotlivé pakety jsou na sobě nezávislé. Ke každému paketu je pak přidána hlavička, ve které jsou uloženy základní informace o komprimaci. Tyto informace využívá dekodér, protože způsoby komprimace mohou být mezi jednotlivými pakety rozdílná. Každý paket pak obsahuje většinou CRC kód pro zjištění chyby při přenosu. Pro kompresi je ideální kratší délka paketu, tím se ale zároveň zvyšuje počet hlaviček na celkových datech. Proto je vhodné najít kompromis délky paketu. Dekorelace Při dekorelaci hledá kodek v datech opakující se signály a redundance. Nejčastěji se používá metoda lineární predikce. U této metody se signál rozdělí na vzorky, kde algoritmus popisuje vzorek X(n) podle předchozích vzorků X(n-1), X(n-2) 25. Používají se například FIR nebo IIR prediktory. Dochází ke zmenšení kvantizace a tím také ke zmenšení datové náročnosti. U vícekanálového zvuku dochází často k odstranění mezikanálové redundance tím, že například u stereo signálu se vytvoří mono signál a jeho rozdíl (L+P) / 2 a (L-P) / 2. [14] 25 [cit ] 31

36 Kódování entropie Při kódování entropie se používají stejné postupy jako u běžných komprimačních programů. a) Huffmanovo kódování Princip kódování byl vysvětlen již v předcházející kapitole. Zjednodušeně řečeno se všechny znaky v datech přetransformují pomocí algoritmu na jiné. Nejčastěji se vyskytujícím znakům se přiřadí nejkratší kód a nejméně vyskytujícím znakům se přiřadí nejdelší kód. b) RLE Run Length Encoding Kódují se stejné hodnoty jdoucí po sobě a jejich počet. Příkladem třeba řetězec ffffbbb převede na dvojici typu délka posloupnost a hodnota 4f3b c) Riceovo kódování Jde o nejrozšířenější typ kódování u bezeztrátových formátů zvuku. Tento typ kódování je nejúčinnější v případech, kdy je výskyt nižší hodnoty znaku pravděpodobnější než výskyt vyšší hodnoty znaku. Rozdělením vstupního signálu volitelným parametrem x získáme dvě hodnoty. Jedna hodnota je výsledek po dělení parametrem x a druhá hodnota je zbytek. Tyto dvě hodnoty jsou pak kódovány samostatně za sebou. Tento princip vychází z Golombova kódování. Bezeztrátové kodeky používají kombinace těchto metod a jedná se o enkódování s variabilním datovým tokem (VBR). [14] 32

37 4. Zvukové formáty V této kapitole bych se chtěl zmínit o nejpoužívanějších audio formátech, které využívají ztrátové i bezeztrátové komprese dat a zjednodušeně popsat jejich parametry a princip funkčnosti Ztrátové formáty zvuku MPEG-1 Layer3 MP3, plným názvem MPEG-1 Audio Layer III, je pouze jedním z řady MPEG (Motion Picture Experts Group) formátů. MPEG se dělí se do několika vrstev. Všechny vrstvy pracují se ztrátovou kompresí. Původně byl formát MPEG vyvinut pro vysokou kompresi videa, ale také je používán k vysoké kompresi zvuku. MP3 je kompresní ztrátový formát, který ve verzi Layer III dokáže snížit datový objem až o desetinu bez znatelnější ztráty kvality. Takhle velkou kompresi dokáže hlavně díky tzv. psychoakustickému modelu. Jedná se o vypuštění frekvencí z datového toku na základě nedokonalosti lidského sluchu. Tento model byl již popsán kapitole Psychoakustický model. Kompresní algoritmy Layer 1, 2 a 3 Pro kompresi audio signálů ve standardech MPEG se využívají 3 různé komprimační algoritmy označované jako Layer Vrstva. Layer 1 je z celé trojice nejjednodušší. Dosahuje nejmenšího kompresního poměru. Dnes se prakticky nepoužívá. Layer 2 byl standardizován v roce 1990 na návrh firmy Philips, algoritmus se nazýval MUSICAM. Formát byl navržen na kódování zvuku datovým tokem 128 kbps/kanál. Výhody jsou nízká výpočetní náročnost a odolnost proti přenosovým chybám. Kontejner používá příponu MP2. Je používaný v digitálním televizním a radiovém vysílání (DAB, DVB). Layer 3 obsahuje nejvýkonnější algoritmus a tím dosahuje nejvyššího kompresního poměru v porovnání s předchozími vrstvami. Vrstva Layer 3 je zpětně kompaktibilní s vrstvou 1 a 2. Kontejner používá příponu MP3. [16] V roce 1987 se ve Fraunhofer Institut IntegrierteSchaltungen zrodila myšlenka na vytvoření ztrátového kompresního algoritmu pro zvuková data. 33

38 Nejefektivnější vrstva (Layer 3) byla v roce 1992 přijata jako ISO standard. Na této vrstvě se podílel Fraunhofer Institut spolu s firmou Thomson. Do MPEG-1 jsou zahrnuty 4 módy standardu: mono dualchanel komprimace dvou nesouvisejících mono kanálů, bitrate je rovnoměrně rozložen mezi oba kanály. stereo komprimace dvou souvisejících kanálů, možnost přidělit některému kanálu větší bitrate než druhému, např. hlasitějšímu kanálu je použito více bitů pro kódování. joint stereo tento mód využívá ke komprimaci vlastnosti lidského sluchu při vnímání prostorové lokalizace zdroje signálu (viz kapitola binaurální slyšení). Jedná se o velmi nízké a velmi vysoké kmitočty, které lidské ucho není možné lokalizovat a tyto frekvence je pak možné zakódovat jako monofonní signál. Tato metoda vede k úspoře řádově v rozmezí 5 až 10 %. Formát podporuje několik vzorkovacích frekvencí: 32 khz, 44,1 khz a 48 khz. Nejpoužívanější je 44,1 khz, vychází z audio CD. Datový tok se pohybuje od 32 do 320 kbps. Kódování datového toku domp3 souboru můžeme pomocí více kodeků: LAME encoder FhG MP3 encoder Gogo-no-coda AudioactiveEncoder Xing MP3 Encoder Na internetové stránce je zajímavý článek, kde porovnávají kvalitu těchto enkóderů při bitrate 128 kbps a jako vítěz vyšel z testu enkóder LAME. MP3PRO V roce 2001 uvedli Fraunhofer IIS a Thomson rozšíření verze MP3. Účinnost by měla být dvakrát vyšší. Pro CD kvalitu by měl postačit bitrate 64 kbps namísto 128 kbps pro klasickou MP3. MP3PRO je zpětně kompatibilní. Nejdůležitějším technickým nástrojem je tzv. SBR. Spectral Band Replication Tato technologie dokáže částečně dopočítat vyšší kmitočtové 34

39 spektrum na základě nižšího kmitočtového spektra. Tato technologie byla popsána v předchozí kapitole. MP3HD Společnost Thomson stála u zrodu dalšího formátu z populární rodiny MPEG-1 Layer III, tentokrát s formátem MP3HD, který nabízí bezeztrátovou kompresi a zpětnou kompatibilitu s běžnými MP3 přehrávači. Formát MP3HD nabízí bezeztrátovou kompresi srovnatelnou s ostatními bezeztrátovými kodeky, jako je například již zmíněný FLAC. MP3HD dosahuje v průměru datového toku od 500 kbps do 900 kbps, což je zhruba polovina oproti nekomprimovanému stavu. [16] WMA Jde o formát vyvinutý firmou Microsoft, který ale používá podobné metody jako MP3, psychoakustický model, MDCT a Huffmanovo kódování. WMA soubory jsou téměř výlučně v kontejneru Advanced Systems Format ASF a mají příponu.asf nebo.wma. V dnešní době je velká softwarová i hardwarová podpora ve většině přehrávačů na trhu. Původní formát podporoval vzorkovací frekvence 44,1 khz a 48 khz a 16 bitové rozlišení. Datový tok se pohyboval od 64 kbps do 192 kbps. První verze WMA 7 byla zveřejněna v roce Od té doby bylo uveřejněno ještě několik verzí a dnes se používá WMA ve verzi 9.1. WMA 9.1 je zpětně kompatibilní s předchozími WMA formáty, lze je tedy přehrát ve starších Windows media playerech a spotřební elektronice. WMA PRO Nabízí nejširší škálu možností Windows Media Audio Codec. Tento formát je založen na zcela jiném kompresním algoritmu, proto není kompaktibilní s WMA. Kvalita komprese je dobrá i při velmi nízkých datových tocích. Podporuje až vzorkovací frekvenci až 96 khz, a bitovou hloubku až 24 bit a podporu multikanálového zvuku 7.1. Formát navíc podporuje kontrolu dynamického rozsahu dynamic range control. Funkce vhodná hlavně pro tichý poslech. Možnosti kódování: Low-bit-rate kódování stereo signálu začínajících na 24 Kbps, pro omezení místa při skladování. Medium-bit-rate kvalitní stereo a multi-kanálové kódování při rychlostech 64 až 128 kbps pro stereo a 128 kbps a vyšší pro 5.1 signály. 35

40 High-bit rate velmi kvalitní stereo a vícekanálové kódování. Datový tok se může pohybovat až do 1536 kbps. WMA 9 Lossless Tento kodek je vhodný pro archivaci CD. Jedná se o bezeztrátový formát. Formát také obsahuje kontrolu dynamického rozsahu. DRM Digital Rights Management WMA soubory mohou být chráněny pomocí DRM (správa digitálních práv). To je aplikované na soubory stažené z online služby na základě předplatného. Cílem ochrany je zajistit užívání obsahu v souladu s autorskými právy. [16] AAC Advanced Audio Coding byl standardizován v roce 1997 dle normy ISO jako součást MPEG-2 a MPEG-4 specifikace. Autorem AAC je několik výzkumných firem, ale největší podíl na vývoji měla firma Dolby Laboratories. Formát umožňuje použít vzorkovací frekvenci od 8 khz do 96 khz a počet kanálů od 1 do 48 kanálů a 15 LFE kanálů (nízkofrekvenčních). Bitová hloubka se používá v rozsahu 8, 16 a 24 bitů. Maximální datový tok je 256 kbps/kanál. NCDQ je uváděno na toku 96 kbps a u 5.1 kanálů je to 320 kbps. AAC používá MDCT, ale délka okna může být až 2048 vzorků, ale lze okno zmenšit na 256 vzorků (pro náročné pasáže v hudbě). Pro přenosové chyby je zavedena detekce a korekce chyb. Formát AAC byl zvolen jako hlavní formát pro prodej hudby přes itunes. Existují čtyři varianty profilů: LowComplexity (LC) nejjednodušší a nejrozšířenější varianta Main Profile (Main) používá navíc zpětně adaptivní predikci pro kódování jako bezeztrátové formáty. Je náročnější na výpočetní výkon a není moc rozšířen. Scalable Sample Rate (AAC-SSR) rozdělí frekvenční pásmo do čtyř menších pásem, které se zakódují zvlášť, to umožňuje zvolit velikost MDCT pro každé pásmo zvlášť a také kódovat jednotlivá pásma zvlášť. V praxi se nepoužívá. Long Term Prediction (LTP) přidává k profilu LC dopřednou adaptivní predikci. Formát AAC se ukládá do kontejneru definovaného jako součást MPEG-4. Přípona souboru je.mp4. Soubory používané službou itunes mají příponu.m4a nebo.m4p (klasické 36

41 audio soubory, chráněné DRM). Soubor uložený podle specifikace MPEG-2 používá příponu.aac, je bez podpory DRM. Další technologií využitou v AAC je PNS Perceptual Noise Substitution. Tato technologie má za úkol detekovat v signálu šumové složky a ty nekódovat klasickou technikou. V AAC je také obsažena další technologie TNS Temporal Noise Shapin. Jde o zpětnou adaptivní predikci spektrální charakteristiky záznamu v časovém průběhu, která se přizpůsobuje signálu redukuje tak problém s předozvěnou. 26 Existuje několik kodeků, nejznámější je od firmy APPLE itunes AAC, další jsou třeba Nero Nero AAC a mezi bezplatné lze zařadit FAAC. AAC Plus Jedná se o vylepšení již existujícího AAC kódování. Označuje se někdy jako High Efficiency AAC (HE-AAC) a je určen hlavně pro nízké datové toky (bitrate). Hlavním zlepšením je zavedení SBR Spectral Band Replication. Udává se, že díky této technologii je NCDQ na 64 kbps. Zatím ale tento formát není příliš rozšířen. [16] OGG Vorbis Formát, u kterého jeho obliba stále stoupá, protože se jedná o plně otevřený formát. Pochází z dílny instituce Xiph.org Foundation. Kontejner má příponu.ogg. Ogg Vorbis je flexibilní formát určený od nízkých po vysoké datové toky. Enkóder může zakódovat od 1 do 255 samostatných kanálů se vzorkovací frekvencí 8 khz až 192 khz. Datový tok pro jednotlivé kanály se pohybuje od 16 do 128 kbps. Jednotlivé kanály je možné sdružovat do podmap (submaps) a na každou podmapu volit způsob kódování. Podporovaná bitová hloubka je 16 nebo 24 bitů. OggVorbis používá rámce velikosti od 64 do 8192 vzorků. Kodek používá MDCT kódování. Frekvenční charakteristika se ve výstupním toku dat přenese nejprve jako hrubý odhad (floor), který je možné kódovat systémem LSP (kódování lineární predikcí), nebo zadáním po částech lineární křivky vyjadřují intenzitu frekvenčních složek zvuku. Všechny současné kodéry používají druhou možnost. Floor je jakási spektrální obálka určující rozsah (a tedy i kvantovací krok) jednotlivých frekvenčních složek. K datům se 26 [cit ] 37

42 následně přidává přesnější odhad (residue), který se kóduje vícepřechodovým vektorovým kvantováním. Skutečná amplituda pro danou frekvenci je potom součinem příslušných hodnot floor a residue. 27 Samotný zvukový formát Vorbis nenabízí žádnou synchronizaci nebo ochranu proti chybám při přenosu. Audio data se na vstupu rozdělí do jednotlivých paketů. Jednotlivé pakety mohou být různě dlouhé. Dekodér pak přijímá tyto pakety, dekóduje je a sestavuje z nich rámce původního zvukového toku. OggVorbis používá tři různé hlavičky datového toku: identifikační (počet kanálů, vzorkovací frekvence atd.), komentářová a konfigurační (obsahuje nastavení pro dekodér). Díky otevřenému formátu existuje mnoho kodeků, nejznámější je tzv. AoTuV kodek. [16] ATRAC ATRAC Adaptive Transform Acoustic Coding je formát vyvinutým firmou Sony pro přepisovatelný systém MiniDisc a uveden v roce 1992 pod názvem ATRAC-1. Kombinuje Sub-pásmové kódování a kodér používá dva kvadraturní zrcadlové filtry, které dělí signál vzorkovaný frekvencí f na tři subpásma s dělící frekvencí f/8.0 5,5 khz, 5,5 11 khz, khz. Na každé sub-pásmo se aplikuje MDCT. Velikost okna je 512 vzorků. Standardní datový tok pro stereofonický záznam je 146 kbps/kanál. Druhá verze byla uveřejněna v roce 1999 a měla označení ATRAC-3. Enkoder obsahuje navíc další kvadraturní filtr, signál se tedy dělí do čtyř podpásem, které jsou opět pomocí MDCT převedeny z časové oblasti do frekvenční oblasti. V módu LP2 je datový tok 66 kbps/kanál. V módu LP4 je datový tok 33 kbps/kanál. Navíc se ořezávají frekvence nad 13,5 khz. Vylepšenou další verzí je ATRAC-3plus, která vyšla v roce 2002, kde hlavní změna přišla v rozšíření počtu podpásem a to až na 16. MDCT se aplikuje na každé pásmo zvlášť. Tato verze není kompatibilní s předchozí verzí. [16] 27 [cit ] 38

43 QMF Banka 1 QMF Banka 2 Současné formáty pro záznam zvuku Bit. alokace MDCT 32/128 Kvantizace MDCT 32/128 MDCT 32/256 Bit. alokace Kvantizace Bit. alokace Výběr okna Kvantizace Obr. 24 Blokové schéma ATRAC koderu 28 V roce 2006 vyšla zatím poslední verze ATRAC Advanced Lossless. Jedná se o hybridní bezeztrátový formát. Výsledný datový tok je ztrátový (ATRAC-3 nebo ATRAC-3 Plus), ale obsahuje navíc informace pro výpočet bezeztrátového datového toku. ATRAC používá kontejner s příponou.omg (Open Magic Gate) nebo.oma. K dispozici je jediný dostupný kodek pro formát ATRAC od firmy Sony s názvem SonicStage. Formát ATRAC není rozšířen, používá ho převážně jen firma sony ve svých přehrávačích. [16] Dolby Digital Dolby Digital nebo také někdy označován jako AC-3 byl uveden v roce 1992 a je to zvukový formát navržen pro 5.1 kanálový zvuk. Systém 5.1 (tedy 6 kanálů) je navržen pro prostorový zvuk, kde rozmístění reproduktorů je následující: - Hlavní přední reproduktory (levý a pravý) - Centrální reproduktor (umístěn uprostřed mezi hlavními repro) - Efektové repro (umístnění za posluchačem levý a pravý) - Subwoofer (pro velmi nízké kmitočty nezáleží na umístění) 28 Literatura - zdroj [1] [cit ] Pozn. Vlastní úprava 39

44 Formát se používá jako součást videosouborů (AVI, MPEG, MKV), ale největší uplatnění získal na nosiči DVD-Video. Zvukové soubory formátu Dolby Digital mají příponu.ac3. Formát pochází z dílny Dolby Laboratories. Formát podporuje módy MONO, STEREO, DOLBY Surround, ale nejčastěji se vyskytuje v módu 5.1 kanálů. Obsahuje 5 hlavních kanálů v rozsahu 20Hz 20kHz a jeden LFE (Subbasový) kanál s rozsahem do 120 Hz. Hlavní rysy AC 3 algoritmu jsou následující. Vzorkovací frekvence: 32, 44,1 a 48 khz Datový tok 32kbps 640 kbps Vysoce kvalitní výstup při 64 kbps/kanál Bitové rozlišení vzorku do 24 bitů Parametrická bitová alokace MDCT banka filtrů Blokové schéma kódovacího procesu je na obrázku (Obr. 25). Pomocí MDCT je signál převeden z časové do frekvenční domény. Velikost okna pro MDCT je 512 vzorků, popř. 2 x 256 vzorků (v závislost na vstupu). Jednotlivé koeficienty z MDCT se kódují jako reálná čísla se zadáním exponentu a mantisy. Koeficienty prvního bloku se kódují přímo, ostatní bloky jsou zakódované diferencí z předešlého bloku. Spektrální obálka a kvantizované mantisy jsou formátovány do jednoho rámce AC 3, který se skládá ze šesti bloků po 256 vzorků. Celkem tedy rámec obsahuje 1536 vzorků. 29 [16] [1] Dolby Digital Plus Byl vyvinut pro rozšíření AC-3 standardu. Při zachování zpětné kompaktibility poskytuje několik vylepšení. Možnost kódovat až 13.1 kanálů a také došlo ke zvýšení datového toku až na 6,144 Mbps [cit ] 40

45 Multiplex Současné formáty pro záznam zvuku Transient detektor Spektrální obálka Kódování exponentu Psychoak. model MDCT 256/512 Kvantizace mantisa Bitová alokace Obr. 25 Blokové schéma AC-3 kodéru 30 Dolby Digital EX Rozšíření formátu Dolby Digital o zadní střední kanál, který je maticově zakódovaný v zadním levém a v zadním pravém kanálu. Byl vytvořen v roce 1998 ve spolupráci se společností Lucasfilm THX Shrnutí Výsledná kvalita zvuku ve skladbě je nejen závislá na použitém formátu komprese ale také na zvoleném datovém toku. Pokud budeme chtít uchovat komprimovanou hudbu ve větší kvalitě, budeme volit minimální datový tok 128kbps. V následujících dvou grafech bych chtěl zobrazit, jak jednotlivé kodeky omezují frekvenční charakteristiku. Grafy jsou pro nízký datový tok, 48 a 128 kbps. Z grafů 1 a 2 je patrné, že při nízkém datovém toku 48 kbps si nejhůře vede formát MP3, zato jeho vylepšená verze MP3PRO s technologií SBR je na tom podstatně lépe. Nejlépe si vede formát AACPLUS. 30 Literatura Zdroj [1] [cit ] Pozn. Vlastní úprava 41

46 Při datovém toku 128 kbps nejsou rozdíly tak patrné jako při datovém toku 48 kbps. Omezování frekvenční charakteristiky začíná pro většinu formátů mezi khz. 32 Graf 1. Frekvenční analýza komprimačních algoritmů při 48 kbps 32 Graf 2. Frekvenční analýza komprimačních algoritmů při 128 kbps [cit ] 42

Moderní multimediální elektronika (U3V)

Moderní multimediální elektronika (U3V) Moderní multimediální elektronika (U3V) Prezentace č. 13 Moderní kompresní formáty pro přenosné digitální audio Ing. Tomáš Kratochvíl, Ph.D. Ústav radioelektroniky, FEKT VUT v Brně Program prezentace Princip

Více

OSNOVA. 1. Definice zvuku a popis jeho šíření. 2. Rozdělení zvukových záznamů (komprese) 3. Vlastnosti jednotlivých formátů

OSNOVA. 1. Definice zvuku a popis jeho šíření. 2. Rozdělení zvukových záznamů (komprese) 3. Vlastnosti jednotlivých formátů 1 OSNOVA 1. Definice zvuku a popis jeho šíření 2. Rozdělení zvukových záznamů (komprese) 3. Vlastnosti jednotlivých formátů 4. Výhody, nevýhody a použití (streaming apod.) 2 DEFINICE ZVUKU Zvuk mechanické

Více

Charakteristiky zvuk. záznamů

Charakteristiky zvuk. záznamů Charakteristiky zvuk. záznamů Your Name Jan Kvasnička Your Title 2010 Roman Brückner Your Organization (Line #1) Your Organization (Line #2) Obsah prezentace Digitalizace zvuku Audio formáty Digitální

Více

Multimediální systémy. 08 Zvuk

Multimediální systémy. 08 Zvuk Multimediální systémy 08 Zvuk Michal Kačmařík Institut geoinformatiky, VŠB-TUO Osnova přednášky Zvuk fyzikální podstata a vlastnosti Digitální zvuk Komprese, kodeky, formáty Zvuk v MMS Přítomnost zvuku

Více

Komprese dat Obsah. Komprese videa. Radim Farana. Podklady pro výuku. Komprese videa a zvuku. Komprese MPEG. Komprese MP3.

Komprese dat Obsah. Komprese videa. Radim Farana. Podklady pro výuku. Komprese videa a zvuku. Komprese MPEG. Komprese MP3. Komprese dat Radim Farana Podklady pro výuku Obsah Komprese videa a zvuku. Komprese MPEG. Komprese MP3. Komprese videa Velký objem přenášených dat Typický televizní signál - běžná evropská norma pracuje

Více

9. PRINCIPY VÍCENÁSOBNÉHO VYUŽITÍ PŘENOSOVÝCH CEST

9. PRINCIPY VÍCENÁSOBNÉHO VYUŽITÍ PŘENOSOVÝCH CEST 9. PRINCIPY VÍCENÁSOBNÉHO VYUŽITÍ PŘENOSOVÝCH CEST Modulace tvoří základ bezdrátového přenosu informací na velkou vzdálenost. V minulosti se ji využívalo v telekomunikacích při vícenásobném využití přenosových

Více

Akustika. Teorie - slyšení. 5. Přednáška

Akustika. Teorie - slyšení. 5. Přednáška Akustika Teorie - slyšení 5. Přednáška http://data.audified.com/downlpublic/edu/zha_pdf.zip http://data.audified.com/downlpublic/edu/akustikaotazky03.pdf http://data.audified.com/downlpublic/edu/jamusimulatorspro103mac.dmg.zip

Více

Akustika. Teorie - slyšení. 5. Přednáška

Akustika. Teorie - slyšení. 5. Přednáška Akustika Teorie - slyšení 5. Přednáška Sluchové ústrojí Vnitřní a vnější slyšení Zpěv, vlastní hlas Dechové nástroje Vibrace a chvění Ucho Ucho je složeno z ucha vnějšího, středního a vnitřního. K vnějšímu

Více

Základní principy přeměny analogového signálu na digitální

Základní principy přeměny analogového signálu na digitální Základní y přeměny analogového signálu na digitální Pro přenos analogového signálu digitálním systémem, je potřeba analogový signál digitalizovat. Digitalizace je uskutečňována pomocí A/D převodníků. V

Více

25. DIGITÁLNÍ TELEVIZNÍ SIGNÁL A KABELOVÁ TELEVIZE

25. DIGITÁLNÍ TELEVIZNÍ SIGNÁL A KABELOVÁ TELEVIZE 25. DIGITÁLNÍ TELEVIZNÍ SIGNÁL A KABELOVÁ TELEVIZE Digitalizace obrazu a komprese dat. Uveďte bitovou rychlost nekomprimovaného číslicového TV signálu a jakou šířku vysílacího pásma by s dolním částečně

Více

Zpracování zvuku v prezentacích

Zpracování zvuku v prezentacích Zpracování zvuku v prezentacích CENTRUM MEDIÁLNÍHO VZDĚLÁVÁNÍ Akreditované středisko dalšího vzdělávání pedagogických pracovníků Zvuk Zvuk je mechanické vlnění v látkovém prostředí (plyny, kapaliny, pevné

Více

Zvukové rozhraní. Základní pojmy

Zvukové rozhraní. Základní pojmy Zvukové rozhraní Zvukové rozhraní (zvukový adaptér) je rozšiřující rozhraní počítače, které slouží k počítačovému zpracování zvuku (vstup, výstup). Pro vstup zvuku do počítače je potřeba jeho konverze

Více

Komprese zvuku. Ing. Jan Přichystal, Ph.D. 14. března 2011. PEF MZLU v Brně

Komprese zvuku. Ing. Jan Přichystal, Ph.D. 14. března 2011. PEF MZLU v Brně PEF MZLU v Brně 14. března 2011 Úvod Komprimace umožňuje efektivní digitální reprezentaci zdrojového signálu jako je text, obraz, zvuk nebo video, použitím redukovaného počtu prvků digitální informace,

Více

31SCS Speciální číslicové systémy Antialiasing

31SCS Speciální číslicové systémy Antialiasing ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE 2006/2007 31SCS Speciální číslicové systémy Antialiasing Vypracoval: Ivo Vágner Email: Vagnei1@seznam.cz 1/7 Převod analogového signálu na digitální Složité operace,

Více

Karel Mikuláštík Katedra radioelektroniky, ČVUT-FEL Radiokomunikace 2016, Pardubice

Karel Mikuláštík Katedra radioelektroniky, ČVUT-FEL Radiokomunikace 2016, Pardubice Karel Mikuláštík Katedra radioelektroniky, ČVUT-FEL Radiokomunikace 2016, Pardubice 18.10.2016 Úvod Zabezpečení signálu/pokrytí datová kapacita Větší počet stanic v MUXu => nižší kapacita/stanici Zvuková

Více

VY_32_INOVACE_E 15 03

VY_32_INOVACE_E 15 03 Název a adresa školy: Střední škola průmyslová a umělecká, Opava, příspěvková organizace, Praskova 399/8, Opava, 746 01 Název operačního programu: OP Vzdělávání pro konkurenceschopnost, oblast podpory

Více

U zvuku (mechanického vlnění) nás zajímají nejvíce dvě veličiny frekvence a intenzita (hlasitost).

U zvuku (mechanického vlnění) nás zajímají nejvíce dvě veličiny frekvence a intenzita (hlasitost). 1 Zvuk a video 1.1 Zvuk Zvuk je každé podélné mechanické vlnění v látkovém prostředí, které je schopno vyvolat v lidském uchu sluchový vjem. Zdrojem zvuku může být libovolné chvějící se těleso. Zvukovým

Více

4.2. Modulátory a směšovače

4.2. Modulátory a směšovače Projekt: Inovace oboru Mechatronik pro Zlínský kraj Registrační číslo: CZ.1.07/1.1.08/03.0009 4.2. Modulátory a směšovače 4.2.1 Modulace V přenosové technice potřebujeme přenést signály na velké vzdálenosti

Více

nutné zachovat schopnost reprodukovat zvukovou vlnu

nutné zachovat schopnost reprodukovat zvukovou vlnu KÓDOVÁNÍ ZVUKU Digitalizace zvuku Digitalizace nutné zachovat schopnost reprodukovat zvukovou vlnu Bitová hloubka (bit depth) ovlivňuje dynamický rozsah a šum, 16 bitů dává 65 536 stupňů hlasitosti neovlivňuje

Více

VLASTNOSTI ZVUKU A ZVUKOVÝCH ZÁZNAMŮ

VLASTNOSTI ZVUKU A ZVUKOVÝCH ZÁZNAMŮ VLASTNOSTI ZVUKU A ZVUKOVÝCH ZÁZNAMŮ Hana Hoffmanová, David Krejbich OBSAH PREZENTACE Definice a šíření zvuku Zdroje zvuku Vlastnosti zvuku Dělení zvukových záznamů Zajímavosti DEFINICE ZVUKU Zvuk = mechanické

Více

VY_32_INOVACE_ENI_2.MA_05_Modulace a Modulátory

VY_32_INOVACE_ENI_2.MA_05_Modulace a Modulátory Číslo projektu Číslo materiálu CZ.1.07/1.5.00/34.0581 VY_32_INOVACE_ENI_2.MA_05_Modulace a Modulátory Název školy Střední odborná škola a Střední odborné učiliště, Dubno Autor Ing. Miroslav Krýdl Tematická

Více

Zvuk včetně komprese. Digitálně = lépe! Je to ale pravda? X36PZA Periferní zařízení

Zvuk včetně komprese. Digitálně = lépe! Je to ale pravda? X36PZA Periferní zařízení Zvuk včetně komprese Digitálně = lépe! Je to ale pravda? Obsah přednášky Digitalizace spojitého signálu. Aliasing, kvantizační chyba. Praktická realizace digitálního zvukového řetězce. Komprese zvuku.

Více

Akustika pro posluchače HF JAMU

Akustika pro posluchače HF JAMU Akustika pro posluchače HF JAMU Zvukové vlny a kmity (1) 2 Vnímání zvuku (3) 2 Akustika hudebního nástroje (2) 2 Akustika při interpretaci (2) 3 Záznam hry na hudební nástroje (2) 4 Seminární a samostatné

Více

Signál v čase a jeho spektrum

Signál v čase a jeho spektrum Signál v čase a jeho spektrum Signály v časovém průběhu (tak jak je vidíme na osciloskopu) můžeme dělit na periodické a neperiodické. V obou případech je lze popsat spektrálně určit jaké kmitočty v sobě

Více

DUM č. 15 v sadě. 31. Inf-7 Technické vybavení počítačů

DUM č. 15 v sadě. 31. Inf-7 Technické vybavení počítačů projekt GML Brno Docens DUM č. 15 v sadě 31. Inf-7 Technické vybavení počítačů Autor: Roman Hrdlička Datum: 24.02.2014 Ročník: 1A, 1B, 1C Anotace DUMu: zvukové karty: zapojení zařízení, vzorkování a kvantování

Více

Základní komunikační řetězec

Základní komunikační řetězec STŘEDNÍ PRŮMYSLOVÁ ŠKOLA NA PROSEKU EVROPSKÝ SOCIÁLNÍ FOND Základní komunikační řetězec PRAHA & EU INVESTUJEME DO VAŠÍ BUDOUCNOSTI Podpora kvality výuky informačních a telekomunikačních technologií ITTEL

Více

- DAC - Úvod A/D převodník převádějí analogové (spojité) veličiny na digitální (nespojitou) informaci. Základní zapojení převodníku ukazuje obr.

- DAC - Úvod A/D převodník převádějí analogové (spojité) veličiny na digitální (nespojitou) informaci. Základní zapojení převodníku ukazuje obr. - DAC - Úvod A/D převodník převádějí analogové (spojité) veličiny na digitální (nespojitou) informaci. Základní zapojení převodníku ukazuje obr. Řada zdrojů informace vytváří signál v analogové formě,

Více

Princip digitalizace vstupních multimediálních dat Klasifikace Zpracování Využití

Princip digitalizace vstupních multimediálních dat Klasifikace Zpracování Využití Multimédia a data - 6 Informatika 2 Přednáší: doc. Ing. Jan Skrbek, Dr. - KIN Přednášky: středa 14 20 15 55 Spojení: e-mail: jan.skrbek@tul.cz 16 10 17 45 tel.: 48 535 2442 Obsah: Princip digitalizace

Více

Digitální magnetický záznam obrazového signálu

Digitální magnetický záznam obrazového signálu Digitální magnetický záznam obrazového signálu Ing. Tomáš Kratochvíl Současná televizní technika a videotechnika kurz U3V Program semináře a cvičení Digitální videosignál úvod a specifikace. Komprese obrazu

Více

Fyziologická akustika. fyziologická akustika: jak to funguje psychologická akustika: jak to na nás působí

Fyziologická akustika. fyziologická akustika: jak to funguje psychologická akustika: jak to na nás působí Fyziologická akustika anatomie: jak to vypadá fyziologická akustika: jak to funguje psychologická akustika: jak to na nás působí hudební akustika: jak dosáhnout libých počitků Anatomie lidského ucha Vnější

Více

Zvuková karta. Základní pojmy. Vzorkování zvuku

Zvuková karta. Základní pojmy. Vzorkování zvuku Zvuková karta Zvuková karta (zvukový adaptér, zvukové rozhraní) je rozšiřující rozhraní počítače, které slouží k počítačovému zpracování zvuku (vstup, výstup). Pro řízení činnosti zvukové karty operačním

Více

A/D převodníky - parametry

A/D převodníky - parametry A/D převodníky - parametry lineární kvantování -(kritériem je jednoduchost kvantovacího obvodu), parametry ADC : statické odstup signálu od kvantizačního šumu SQNR, efektivní počet bitů n ef, dynamický

Více

Digitalizace signálu (obraz, zvuk)

Digitalizace signálu (obraz, zvuk) Digitalizace signálu (obraz, zvuk) Základem pro digitalizaci obrazu je převod světla na elektrické veličiny. K převodu světla na elektrické veličiny slouží např. čip CCD. Zkratka CCD znamená Charged Coupled

Více

Katedra radioelektroniky K13137, FEL ČVUT Praha. zakódování dané informace. Tento trend postihl i oblast záznamu a přenosu širokopásmových

Katedra radioelektroniky K13137, FEL ČVUT Praha. zakódování dané informace. Tento trend postihl i oblast záznamu a přenosu širokopásmových EXPERIMENTÁLNÍ ZVUKOVÝ KODÉR F. Rund, J. Nováček Katedra radioelektroniky K13137, FEL ČVUT Praha Abstrakt Všechny dnes široce rozšířené systémy pro kompresi zvuku vycházejí ze stejných psychoakustických

Více

Snímání biologických signálů. A6M31LET Lékařská technika Zdeněk Horčík Katedra teorie obvodů

Snímání biologických signálů. A6M31LET Lékařská technika Zdeněk Horčík Katedra teorie obvodů Snímání biologických signálů A6M31LET Lékařská technika Zdeněk Horčík Katedra teorie obvodů horcik@fel.cvut.cz Snímání biologických signálů problém: převést co nejvěrněji spojitý signál do číslicové podoby

Více

1. Základy teorie přenosu informací

1. Základy teorie přenosu informací 1. Základy teorie přenosu informací Úvodem citát o pojmu informace Informace je název pro obsah toho, co se vymění s vnějším světem, když se mu přizpůsobujeme a působíme na něj svým přizpůsobováním. N.

Více

Akustika. Teorie - slyšení

Akustika. Teorie - slyšení Akustika Teorie - slyšení Sluchové ústrojí Sluchové ústrojí elektrický 10 ;,eden'i '(.. vz;ucrerrf f a vedení tekutinou Ucho Ucho je složeno z ucha vnějšího, středního a vnitřního. K vnějšímu uchu patří

Více

Vlastnosti zvuku. O dřej Pavlas, To áš Karhut

Vlastnosti zvuku. O dřej Pavlas, To áš Karhut Vlastnosti zvuku O dřej Pavlas, To áš Karhut Zvuk Zvuk = mechanické vlnění v látkovém prostředí, vyvolávající zvukový vjem Slyšitelnost obvykle v rozsahu 16 Hz až 20 000 Hz < 16 Hz = infrazvuk > 20 khz

Více

Princip digitalizace vstupních multimediálních dat Klasifikace Zpracování Využití

Princip digitalizace vstupních multimediálních dat Klasifikace Zpracování Využití Multimédia a data - 6 Informatika 2 Přednáší: doc. Ing. Jan Skrbek, Dr. - KIN Přednášky: středa 14 20 15 55 Spojení: e-mail: jan.skrbek@tul.cz 16 10 17 45 tel.: 48 535 2442 Obsah: Princip digitalizace

Více

Identifikátor materiálu: ICT-1-19

Identifikátor materiálu: ICT-1-19 Identifikátor materiálu: ICT-1-19 Předmět Informační a komunikační technologie Téma materiálu Komprimace, archivace dat Autor Ing. Bohuslav Nepovím Anotace Student si procvičí / osvojí komprimaci, archivaci

Více

Akustika pro posluchače HF JAMU

Akustika pro posluchače HF JAMU Akustika pro posluchače HF JAMU Zvukové vlny a kmity (1)! 2 Vnímání zvuku (3)! 2 Akustika hudebního nástroje (2)! 2 Akustika při interpretaci (2)! 3 Záznam hry na hudební nástroje (2)! 4 Seminární a samostatné

Více

íta ové sít baseband narrowband broadband

íta ové sít baseband narrowband broadband Každý signál (diskrétní i analogový) vyžaduje pro přenos určitou šířku pásma: základní pásmo baseband pro přenos signálu s jednou frekvencí (není transponován do jiné frekvence) typicky LAN úzké pásmo

Více

Analogově číslicové převodníky

Analogově číslicové převodníky Verze 1 Analogově číslicové převodníky Doplněná inovovaná přednáška Zpracoval: Vladimír Michna Pracoviště: Katedra textilních a jednoúčelových strojů TUL Tento materiál vznikl jako součást projektu In-TECH

Více

Základy a aplikace digitálních. Katedra radioelektroniky (13137), blok B2, místnost 722

Základy a aplikace digitálních. Katedra radioelektroniky (13137), blok B2, místnost 722 Základy a aplikace digitálních modulací Josef Dobeš Katedra radioelektroniky (13137), blok B2, místnost 722 dobes@fel.cvut.cz 6. října 2014 České vysoké učení technické v Praze, Fakulta elektrotechnická

Více

PCM30U-ROK 2 048/256 kbit/s rozhlasový kodek stručný přehled

PCM30U-ROK 2 048/256 kbit/s rozhlasový kodek stručný přehled 2 048/256 kbit/s rozhlasový kodek stručný přehled TELEKOMUNIKACE, s.r.o. Třebohostická 5, 100 43 Praha 10 tel: (+420) 23405 2429, 2386 e-mail: pcm30u@ttc.cz web: http://www.ttc.cz, http://sweb.cz/rok-ttc

Více

MULTIMEDIÁLNÍ A HYPERMEDIÁLNÍ SYSTÉMY

MULTIMEDIÁLNÍ A HYPERMEDIÁLNÍ SYSTÉMY MULTIMEDIÁLNÍ A HYPERMEDIÁLNÍ SYSTÉMY 6) Digitální zvuk Petr Lobaz, 22. 3. 2006 ULOŽENÍ ZVUKU ANALOGOVÉ mechanický záznam gramofon magnetický záznam magnetofon optický záznam zvuková stopa filmu rozhlas

Více

DSY-4. Analogové a číslicové modulace. Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti

DSY-4. Analogové a číslicové modulace. Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti DSY-4 Analogové a číslicové modulace Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti DSY-4 analogové modulace základní číslicové modulace vícestavové modulace modulace s rozprostřeným

Více

Akustika. 3.1 Teorie - spektrum

Akustika. 3.1 Teorie - spektrum Akustika 3.1 Teorie - spektrum Rozklad kmitů do nejjednodušších harmonických Spektrum Spektrum Jedna harmonická vlna = 1 frekvence Dvě vlny = 2 frekvence Spektrum 3 vlny = 3 frekvence Spektrum Další vlny

Více

ednáška a metody digitalizace telefonního signálu Ing. Bc. Ivan Pravda

ednáška a metody digitalizace telefonního signálu Ing. Bc. Ivan Pravda 2.předn ednáška Telefonní kanál a metody digitalizace telefonního signálu Ing. Bc. Ivan Pravda Telekomunikační signály a kanály - Při přenosu všech druhů telekomunikačních signálů je nutné řešit vztah

Více

KOMPRESE OBRAZŮ. Václav Hlaváč, Jan Kybic. Fakulta elektrotechnická ČVUT v Praze katedra kybernetiky, Centrum strojového vnímání.

KOMPRESE OBRAZŮ. Václav Hlaváč, Jan Kybic. Fakulta elektrotechnická ČVUT v Praze katedra kybernetiky, Centrum strojového vnímání. 1/25 KOMPRESE OBRAZŮ Václav Hlaváč, Jan Kybic Fakulta elektrotechnická ČVUT v Praze katedra kybernetiky, Centrum strojového vnímání hlavac@fel.cvut.cz http://cmp.felk.cvut.cz/ hlavac KOMPRESE OBRAZŮ, ÚVOD

Více

KOMPRIMACE. aneb Aby to zabralo méně místa

KOMPRIMACE. aneb Aby to zabralo méně místa KOMPRIMACE aneb Aby to zabralo méně místa Komprimace nebo také komprese je jednoduše řečeno sbalení či spakování dat na mnohem menší velikost. Ve skutečnosti se jedná o vypuštění nadbytečné informace takovým

Více

Multimediální systémy

Multimediální systémy Multimediální systémy Jan Outrata KATEDRA INFORMATIKY UNIVERZITA PALACKÉHO V OLOMOUCI přednášky Získání obsahu Jan Outrata (Univerzita Palackého v Olomouci) Multimediální systémy Olomouc, září prosinec

Více

Hlavní parametry rádiových přijímačů

Hlavní parametry rádiových přijímačů Hlavní parametry rádiových přijímačů Zpracoval: Ing. Jiří Sehnal Pro posouzení základních vlastností rádiových přijímačů jsou zavedena normalizovaná kritéria parametry, podle kterých se rádiové přijímače

Více

Kosinová transformace 36ACS

Kosinová transformace 36ACS Kosinová transformace 36ACS 10. listopadu 2006 Martin BruXy Bruchanov bruxy@regnet.cz Uplatnění diskrétní kosinové transformace Úkolem transformačního kódování je převést hodnoty vzájemně závislých vzorků

Více

B2M31SYN SYNTÉZA AUDIO SIGNÁLŮ

B2M31SYN SYNTÉZA AUDIO SIGNÁLŮ B2M31SYN SYNTÉZA AUDIO SIGNÁLŮ zima 2016-2017 Roman Čmejla cmejla@fel.cvut.cz B2, místn.525 tel. 224 3522 36 http://sami.fel.cvut.cz/sms/ A2B31SMS - SYNTÉZA MULTIMEDIÁLNÍCH SIGNÁLŮ zima 2015-2016 http://sami.fel.cvut.cz/sms/

Více

Zvuková karta. Zvuk a zvuková zařízení. Vývoj, typy, vlastnosti

Zvuková karta. Zvuk a zvuková zařízení. Vývoj, typy, vlastnosti Zvuk a zvuková zařízení. Vývoj, typy, vlastnosti Zvuková karta Počítač řady PC je ve své standardní konfiguraci vybaven malým reproduktorem označovaným jako PC speaker. Tento reproduktor je součástí skříně

Více

KOMPRESE OBRAZŮ. Václav Hlaváč. Fakulta elektrotechnická ČVUT v Praze katedra kybernetiky, Centrum strojového vnímání. hlavac@fel.cvut.

KOMPRESE OBRAZŮ. Václav Hlaváč. Fakulta elektrotechnická ČVUT v Praze katedra kybernetiky, Centrum strojového vnímání. hlavac@fel.cvut. 1/24 KOMPRESE OBRAZŮ Václav Hlaváč Fakulta elektrotechnická ČVUT v Praze katedra kybernetiky, Centrum strojového vnímání hlavac@fel.cvut.cz http://cmp.felk.cvut.cz/ hlavac KOMPRESE OBRAZŮ, ÚVOD 2/24 Cíl:

Více

A/D převodníky, D/A převodníky, modulace

A/D převodníky, D/A převodníky, modulace A/D převodníky, D/A převodníky, modulace A/D převodníky převádí analogový (spojitý) signál na signál diskrétní z důvodu umožnění zpracování analogového signálu na číslicových počítačích - z důvodu konečné

Více

Akustika. Cesta zvuku od hudebního nástroje přes nahrávací a reprodukční řetězec k posluchači

Akustika. Cesta zvuku od hudebního nástroje přes nahrávací a reprodukční řetězec k posluchači Akustika Cesta zvuku od hudebního nástroje přes nahrávací a reprodukční řetězec k posluchači Vzdělávání v rámci projektu Rozvoj výzkumného potenciálu JAMU Princip zvukařiny x s c T R Q O L M Poslech nebo

Více

Základní pojmy. Multimédia. Multimédia a interaktivita

Základní pojmy. Multimédia. Multimédia a interaktivita Základní pojmy Multimédia Jedná se o sloučení pohyblivého obrazu, přinejmenším v televizní kvalitě, s vysokou kvalitou zvuku a počítačem, jako řídícím systémem. Jako multimediální systém se označuje souhrn

Více

24. Audio formáty moderního videa (DTS, Dolby Digital)

24. Audio formáty moderního videa (DTS, Dolby Digital) 24. Audio formáty moderního videa (DTS, Dolby Digital) Kodek (složenina z počátečních slabik slov kodér a dekodér, respektive komprese a dekomprese; převzato z anglického codec analogického původu) je

Více

Zvuky můžeme také dělit na: ustálené (syčení): periodické; nepravidelné (hluky) neustálené = přechodné (tlesknutí)

Zvuky můžeme také dělit na: ustálené (syčení): periodické; nepravidelné (hluky) neustálené = přechodné (tlesknutí) Vlastnosti zvuku a zvukových záznamů DEFINICE ZVUKU Zvuk je mechanické vlnění 1 v látkovém prostředí, vyvolávající zvukový vjem v lidském uchu. Akustika je věda zabývající se ději spojenými se vznikem,

Více

VIDEO DATOVÉ FORMÁTY, JEJICH SPECIFIKACE A MOŽNOSTI VYUŽITÍ SMOLOVÁ BÁRA

VIDEO DATOVÉ FORMÁTY, JEJICH SPECIFIKACE A MOŽNOSTI VYUŽITÍ SMOLOVÁ BÁRA VIDEO DATOVÉ FORMÁTY, JEJICH SPECIFIKACE A MOŽNOSTI VYUŽITÍ SMOLOVÁ BÁRA 18.12.2017 OBSAH VLASTNOSTI VIDEA Snímková frekvence Rozlišení Prokládání Poměr stran Komprese Datový tok ANALOGOVÉ FORMÁTY KONTEJNERY

Více

Digitální audio zde se vysvětluje princip digitalizace zvukového záznamu, způsoby komprese uložení ztrátové a bezztrátové, obvyklé formáty atd.

Digitální audio zde se vysvětluje princip digitalizace zvukového záznamu, způsoby komprese uložení ztrátové a bezztrátové, obvyklé formáty atd. Monitorovací indikátor: 06.43.10 Počet nově vytvořených/inovovaných produktů Akce: Přednáška, KA 5 Číslo přednášky: 33 Téma: DIGITÁLNÍ OBSAH A DIGITALIZACE Lektor: Ing. Michal Beránek Třída/y: 2ME Datum

Více

Pulzní (diskrétní) modulace

Pulzní (diskrétní) modulace EVROPSKÝ SOCIÁLNÍ FOND Pulzní (diskrétní) modulace PRAHA & EU INVESTUJEME DO VAŠÍ BUDOUCNOSTI Podpora kvality výuky informačních a telekomunikačních technologií ITTEL CZ.2.17/3.1.00/36206 Pulzní modulace

Více

Digitální optický záznamový standard DVD

Digitální optický záznamový standard DVD Digitální optický záznamový standard DVD Ing. Tomáš Kratochvíl Současná televizní technika a videotechnika kurz U3V Program semináře a cvičení DVD přehled vlastností standardu. Obrazové a zvukové formáty

Více

Digitální optický záznamový standard DVD

Digitální optický záznamový standard DVD Digitální optický záznamový standard DVD Ing. Tomáš Kratochvíl Současná televizní technika a videotechnika kurz U3V Program semináře a cvičení DVD přehled vlastností standardu. Obrazové a zvukové formáty

Více

MULTIMEDIÁLNÍ A HYPERMEDIÁLNÍ SYSTÉMY

MULTIMEDIÁLNÍ A HYPERMEDIÁLNÍ SYSTÉMY MULTIMEDIÁLNÍ A HYPERMEDIÁLNÍ SYSTÉMY 6) Digitální zvuk ULOŽENÍ ZVUKU ANALOGOVÉ mechanický záznam gramofon magnetický záznam magnetofon optický záznam zvuková stopa filmu rozhlas DIGITÁLNÍ příznakové noty

Více

ZÁKLADY DATOVÝCH KOMUNIKACÍ

ZÁKLADY DATOVÝCH KOMUNIKACÍ ZÁKLADY DATOVÝCH KOMUNIKACÍ Komunikační kanál (přenosová cesta) vždy negativně ovlivňuje přenášený signál (elektrický, světelný, rádiový). Nejčastěji způsobuje: útlum zeslabení, tedy zmenšení amplitudy

Více

filtry FIR zpracování signálů FIR & IIR Tomáš Novák

filtry FIR zpracování signálů FIR & IIR Tomáš Novák filtry FIR 1) Maximální překývnutí amplitudové frekvenční charakteristiky dolní propusti FIR řádu 100 je podle obr. 1 na frekvenci f=50hz o velikosti 0,15 tedy 1,1dB; přechodové pásmo je v rozsahu frekvencí

Více

BPC2E_C09 Model komunikačního systému v Matlabu

BPC2E_C09 Model komunikačního systému v Matlabu BPCE_C9 Model komunikačního systému v Matlabu Cílem cvičení je vyzkoušet si sestavit skripty v Matlabu pro model jednoduchého komunikačního systému pro přenos obrázků. Úloha A. Sestavte model komunikačního

Více

Zvuk. 1. základní kmitání. 2. šíření zvuku

Zvuk. 1. základní kmitání. 2. šíření zvuku Zvuk 1. základní kmitání - vzduchem se šíří tlakové vzruchy (vzruchová vlna), zvuk je systémem zhuštěnin a zředěnin - podstatou zvuku je kmitání zdroje zvuku a tím způsobené podélné vlnění elastického

Více

MULTIMEDIÁLNÍ A HYPERMEDIÁLNÍ SYSTÉMY

MULTIMEDIÁLNÍ A HYPERMEDIÁLNÍ SYSTÉMY MULTIMEDIÁLNÍ A HYPERMEDIÁLNÍ SYSTÉMY 5) Uložení a komprese zvuku Petr Lobaz, 17. 3. 2009 ULOŽENÍ ZVUKU ANALOGOVÉ mechanický záznam gramofon magnetický záznam magnetofon optický záznam zvuková stopa filmu

Více

Komprese multimédií. Ing. Jan Přichystal, Ph.D. 7. října 2010. PEF MZLU v Brně

Komprese multimédií. Ing. Jan Přichystal, Ph.D. 7. října 2010. PEF MZLU v Brně PEF MZLU v Brně 7. října 2010 Úvod Komprimace umožňuje efektivní digitální reprezentaci zdrojového signálu jako je text, obraz, zvuk nebo video, použitím redukovaného počtu prvků digitální informace, než

Více

Videosekvence. vznik, úpravy, konverze formátů, zachytávání videa...

Videosekvence. vznik, úpravy, konverze formátů, zachytávání videa... Videosekvence vznik, úpravy, konverze formátů, zachytávání videa... VIDEOSEKVENCE (VIDEO) Sekvence obrázků rychle po sobě jdoucích (např. 60 snímků za sekundu) tak, že vznikne pro diváka iluze pohybu.

Více

Analogové modulace. Podpora kvality výuky informačních a telekomunikačních technologií ITTEL CZ.2.17/3.1.00/36206

Analogové modulace. Podpora kvality výuky informačních a telekomunikačních technologií ITTEL CZ.2.17/3.1.00/36206 EVROPSKÝ SOCIÁLNÍ FOND Analogové modulace PRAHA & EU INVESTUJEME DO VAŠÍ BUDOUCNOSTI Podpora kvality výuky informačních a telekomunikačních technologií ITTEL CZ.2.17/3.1.00/36206 Modulace Co je to modulace?

Více

Kompresní metody první generace

Kompresní metody první generace Kompresní metody první generace 998-20 Josef Pelikán CGG MFF UK Praha pepca@cgg.mff.cuni.cz http://cgg.mff.cuni.cz/~pepca/ Stillg 20 Josef Pelikán, http://cgg.mff.cuni.cz/~pepca / 32 Základní pojmy komprese

Více

Binární data. Číslicový systém. Binární data. Klávesnice Snímače polohy, dotykové displeje, myš Digitalizovaná data odvozená z analogového signálu

Binární data. Číslicový systém. Binární data. Klávesnice Snímače polohy, dotykové displeje, myš Digitalizovaná data odvozená z analogového signálu 5. Obvody pro číslicové zpracování signálů 1 Číslicový systém počítač v reálném prostředí Klávesnice Snímače polohy, dotykové displeje, myš Digitalizovaná data odvozená z analogového signálu Binární data

Více

Práce s obrazovým materiálem CENTRUM MEDIÁLNÍHO VZDĚLÁVÁNÍ. Akreditované středisko dalšího vzdělávání pedagogických pracovníků

Práce s obrazovým materiálem CENTRUM MEDIÁLNÍHO VZDĚLÁVÁNÍ. Akreditované středisko dalšího vzdělávání pedagogických pracovníků Práce s obrazovým materiálem CENTRUM MEDIÁLNÍHO VZDĚLÁVÁNÍ Akreditované středisko dalšího vzdělávání pedagogických pracovníků Obrazový materiál příjemná součást prezentace lépe zapamatovatelný často nahrazení

Více

Seznam témat z předmětu ELEKTRONICKÁ ZAŘÍZENÍ. povinná zkouška pro obor: L/01 Mechanik elektrotechnik. školní rok 2018/2019

Seznam témat z předmětu ELEKTRONICKÁ ZAŘÍZENÍ. povinná zkouška pro obor: L/01 Mechanik elektrotechnik. školní rok 2018/2019 Seznam témat z předmětu ELEKTRONICKÁ ZAŘÍZENÍ povinná zkouška pro obor: 26-41-L/01 Mechanik elektrotechnik školní rok 2018/2019 1. Základy zvukové techniky a) Fyzikální podstata zvuku, šíření zvuku (Definice

Více

Digitální telefonní signály

Digitální telefonní signály EVROPSKÝ SOCIÁLNÍ FOND Digitální telefonní signály PRAHA & EU INVESTUJEME DO VAŠÍ BUDOUCNOSTI Podpora kvality výuky informačních a telekomunikačních technologií ITTEL CZ.2.17/3.1.00/36206 Digitální telefonní

Více

Komprese videa Praha 2010 Účel komprese Snížení zátěže přenosového média Zmenšení objemu dat pro uložení Metody komprese obrazu Redundance Irelevance Redundantní složka část informace, po jejíž odstranění

Více

Quantization of acoustic low level signals. David Bursík, Miroslav Lukeš

Quantization of acoustic low level signals. David Bursík, Miroslav Lukeš KVANTOVÁNÍ ZVUKOVÝCH SIGNÁLŮ NÍZKÉ ÚROVNĚ Abstrakt Quantization of acoustic low level signals David Bursík, Miroslav Lukeš Při testování kvality A/D převodníků se používají nejrůznější testovací signály.

Více

Moderní multimediální elektronika (U3V)

Moderní multimediální elektronika (U3V) Moderní multimediální elektronika (U3V) Prezentace č. 12 Digitální audio přehrávače a rekordéry Ing. Tomáš Kratochvíl, Ph.D. Ústav radioelektroniky, FEKT VUT v Brně Program prezentace CD-DA (Compact Disc

Více

1. KŠPA Kladno, s. r. o., Holandská 2531, Kladno, FYZIKA. Kapitola 8.: Kmitání Vlnění Akustika. Mgr. Lenka Hejduková Ph.D.

1. KŠPA Kladno, s. r. o., Holandská 2531, Kladno,   FYZIKA. Kapitola 8.: Kmitání Vlnění Akustika. Mgr. Lenka Hejduková Ph.D. 1. KŠPA Kladno, s. r. o., Holandská 2531, 272 01 Kladno, www.1kspa.cz FYZIKA Kapitola 8.: Kmitání Vlnění Akustika Mgr. Lenka Hejduková Ph.D. 1 Kmitání periodický pohyb: pohyb který se pravidelně opakuje

Více

Kompresní algoritmy grafiky. Jan Janoušek F11125

Kompresní algoritmy grafiky. Jan Janoušek F11125 Kompresní algoritmy grafiky Jan Janoušek F11125 K čemu je komprese dobrá? Pokud je třeba skladovat datově náročné soubory. Např. pro záznam obrazu, hudby a hlavně videa je třeba skladovat překvapivě mnoho

Více

Vlnění. vlnění kmitavý pohyb částic se šíří prostředím. přenos energie bez přenosu látky. druhy vlnění: 1. a. mechanické vlnění (v hmotném prostředí)

Vlnění. vlnění kmitavý pohyb částic se šíří prostředím. přenos energie bez přenosu látky. druhy vlnění: 1. a. mechanické vlnění (v hmotném prostředí) Vlnění vlnění kmitavý pohyb částic se šíří prostředím přenos energie bez přenosu látky Vázané oscilátory druhy vlnění: Druhy vlnění podélné a příčné 1. a. mechanické vlnění (v hmotném prostředí) b. elektromagnetické

Více

Převody datových formátů

Převody datových formátů Převody datových formátů Cíl kapitoly: Žák popíše data používaná v informatice, jejich rozdělení, používané formáty souborů a jejich přípony, vysvětlí převody formátů. Klíčové pojmy: Data Typ souboru (formát

Více

CW01 - Teorie měření a regulace

CW01 - Teorie měření a regulace Ústav technologie, mechanizace a řízení staveb CW01 - Teorie měření a regulace ZS 2014/2015 tm-ch-spec. 1.p 2014 - Ing. Václav Rada, CSc. Ústav technologie, mechanizace a řízení staveb Teorie měření a

Více

Title: IX 6 11:27 (1 of 6)

Title: IX 6 11:27 (1 of 6) PŘEVODNÍKY ANALOGOVÝCH A ČÍSLICOVÝCH SIGNÁLŮ Převodníky umožňující transformaci číslicově vyjádřené informace na analogové napětí a naopak zaujímají v řídícím systému klíčové postavení. Značná část měřených

Více

1. Přednáška: Obecné Inf. + Signály a jejich reprezentace

1. Přednáška: Obecné Inf. + Signály a jejich reprezentace 1. Přednáška: Obecné Inf. + Signály a jejich reprezentace 1 Obecné informace Změna rozvrhů Docházka na cvičení 2 Literatura a podklady Základní učební texty : Prchal J., Šimák B.: Digitální zpracování

Více

Druh učebního materiálu Anotace (metodický pokyn, časová náročnost, další pomůcky )

Druh učebního materiálu Anotace (metodický pokyn, časová náročnost, další pomůcky ) Číslo šablony III/2 Číslo materiálu VY_32_INOVACE_F.6.18 Autor Stanislav Mokrý Vytvořeno 8.12.2013 Předmět, ročník Fyzika, 2. ročník Tematický celek Fyzika 2. - Mechanické kmitání a vlnění Téma Zvuk a

Více

Moderní technologie linek. Zvyšování přenosové kapacity Zvyšování přenosové spolehlivosti xdsl Technologie TDMA Technologie FDMA

Moderní technologie linek. Zvyšování přenosové kapacity Zvyšování přenosové spolehlivosti xdsl Technologie TDMA Technologie FDMA Moderní technologie linek Zvyšování přenosové kapacity Zvyšování přenosové spolehlivosti xdsl Technologie TDMA Technologie FDMA Zvyšování přenosové kapacity Cílem je dosáhnout maximum fyzikálních možností

Více

18A - PRINCIPY ČÍSLICOVÝCH MĚŘICÍCH PŘÍSTROJŮ Voltmetry, A/D převodníky - principy, vlastnosti, Kmitoměry, čítače, fázoměry, Q- metry

18A - PRINCIPY ČÍSLICOVÝCH MĚŘICÍCH PŘÍSTROJŮ Voltmetry, A/D převodníky - principy, vlastnosti, Kmitoměry, čítače, fázoměry, Q- metry 18A - PRINCIPY ČÍSLICOVÝCH MĚŘICÍCH PŘÍSTROJŮ Voltmetry, A/D převodníky - principy, vlastnosti, Kmitoměry, čítače, fázoměry, Q- metry Digitální voltmetry Základním obvodem digitálních voltmetrů je A/D

Více

ZÁKLADY DATOVÝCH KOMUNIKACÍ

ZÁKLADY DATOVÝCH KOMUNIKACÍ ZÁKLADY DATOVÝCH KOMUNIKACÍ Komunikační kanál (přenosová cesta) vždy negativně ovlivňuje přenášený signál (elektrický, světelný, rádiový). Nejčastěji způsobuje: útlum zeslabení, tedy zmenšení amplitudy

Více

ZÁPADOČESKÁ UNIVERZITA V PLZNI

ZÁPADOČESKÁ UNIVERZITA V PLZNI ZÁPADOČESKÁ UNIVERZITA V PLZNI FAKULTA PEDAGOGICKÁ KATEDRA VÝPOČETNÍ A DIDAKTICKÉ TECHNIKY KOMPONENTY PRO VÝUKOVÝ ELEKTRONICKÝ MATERIÁL - KOMPRESE V OBLASTI POČÍTAČŮ BAKALÁŘSKÁ PRÁCE Lukáš Smutný Přírodovědná

Více

P7: Základy zpracování signálu

P7: Základy zpracování signálu P7: Základy zpracování signálu Úvodem - Signál (lat. signum) bychom mohli definovat jako záměrný fyzikální jev, nesoucí informaci o nějaké události. - Signálem je rovněž funkce, která převádí nezávislou

Více

Informační systémy ve zdravotnictví

Informační systémy ve zdravotnictví Informační systémy ve zdravotnictví ZS 2008/2009 Zoltán Szabó Tel.: (+420) 312 608 207 E-mail: szabo@fbmi.cvut.cz č.dv.: 504, 5.p Dnešní přednáška Kódování, komprese 2 1 Komprese dat Cíl komprese: redukovat

Více

DNP-F109 (10 490 Kč ) Síťový přehrávač s Ethernetovým a WiFi připojením

DNP-F109 (10 490 Kč ) Síťový přehrávač s Ethernetovým a WiFi připojením DENON F-109 Úspěšný minisystém F-107 složený ze samostatných komponentů má nyní svého nástupce řadu F-109. Novinkou je využití takzvaného plně digitálního konceptu, kdy jsou D/A převodníky umístěny v receiveru.

Více

Grafika na počítači. Bc. Veronika Tomsová

Grafika na počítači. Bc. Veronika Tomsová Grafika na počítači Bc. Veronika Tomsová Proces zpracování obrazu Proces zpracování obrazu 1. Snímání obrazu 2. Digitalizace obrazu převod spojitého signálu na matici čísel reprezentující obraz 3. Předzpracování

Více