Bankovní institut vysoká škola Praha



Podobné dokumenty
Zvukové rozhraní. Základní pojmy

Architektura počítačů. Zvukové karty

Zvuková karta. Základní pojmy. Vzorkování zvuku

Zvuková karta. Zvuk a zvuková zařízení. Vývoj, typy, vlastnosti

DUM č. 15 v sadě. 31. Inf-7 Technické vybavení počítačů

VY_32_INOVACE_E 15 03

18A - PRINCIPY ČÍSLICOVÝCH MĚŘICÍCH PŘÍSTROJŮ Voltmetry, A/D převodníky - principy, vlastnosti, Kmitoměry, čítače, fázoměry, Q- metry

Analogově číslicové převodníky

9. PRINCIPY VÍCENÁSOBNÉHO VYUŽITÍ PŘENOSOVÝCH CEST

VY_32_INOVACE_ENI_2.MA_05_Modulace a Modulátory

Binární data. Číslicový systém. Binární data. Klávesnice Snímače polohy, dotykové displeje, myš Digitalizovaná data odvozená z analogového signálu

A/D převodníky, D/A převodníky, modulace

Multimediální systémy. 08 Zvuk

íta ové sít baseband narrowband broadband

Střední průmyslová škola Zlín

4.2. Modulátory a směšovače

OSNOVA. 1. Definice zvuku a popis jeho šíření. 2. Rozdělení zvukových záznamů (komprese) 3. Vlastnosti jednotlivých formátů

1. Základy teorie přenosu informací

Základní komunikační řetězec

Obsah. 1. Popis produktu. 2. Nejdůležitější vlastnosti produktu a obsah balení Nejdůležitější vlastnosti produktu Specifikace Obsah balení

Pulzní (diskrétní) modulace

Komprese dat Obsah. Komprese videa. Radim Farana. Podklady pro výuku. Komprese videa a zvuku. Komprese MPEG. Komprese MP3.

Sbě b r ě n r i n ce

Akustika pro posluchače HF JAMU

- DAC - Úvod A/D převodník převádějí analogové (spojité) veličiny na digitální (nespojitou) informaci. Základní zapojení převodníku ukazuje obr.

Title: IX 6 11:27 (1 of 6)

Hardware pro multimedia. Zvukové karty, A/D a D/A převodníky (od historie k dnešku)

ASYNCHRONNÍ ČÍTAČE Použité zdroje:

Charakteristiky zvuk. záznamů

Zpracování zvuku v prezentacích

I. Současná analogová technika

2.8 Procesory. Střední průmyslová škola strojnická Vsetín. Ing. Martin Baričák. Název šablony Název DUMu. Předmět Druh učebního materiálu

Snímání biologických signálů. A6M31LET Lékařská technika Zdeněk Horčík Katedra teorie obvodů

31SCS Speciální číslicové systémy Antialiasing

Notebook Qosmio: Uslyšíte rozdíl

Mikrokontroléry. Doplňující text pro POS K. D. 2001

FVZ K13138-TACR-V004-G-TRIGGER_BOX

Hlavní parametry rádiových přijímačů

Akustika pro posluchače HF JAMU

Tel-30 Nabíjení kapacitoru konstantním proudem [V(C1), I(C1)] Start: Transient Tranzientní analýza ukazuje, jaké napětí vytvoří proud 5mA za 4ms na ka

Druhy sdělovacích kabelů: kroucené metalické páry, koaxiální, světlovodné

Počítačové sítě. Lekce 5: Základy datových komunikací

3. D/A a A/D převodníky

Direct Digital Synthesis (DDS)

Vzorkovací zesilovač základní princip všech digitálních osciloskopů, záznamníků, převodníků,

5. A/Č převodník s postupnou aproximací

SEKVENČNÍ LOGICKÉ OBVODY

Princip digitalizace vstupních multimediálních dat Klasifikace Zpracování Využití

25. DIGITÁLNÍ TELEVIZNÍ SIGNÁL A KABELOVÁ TELEVIZE

Profilová část maturitní zkoušky 2015/2016

Analogově-číslicové převodníky ( A/D )

ochranným obvodem, který chrání útlumové články před vnějším náhodným přetížením.

Zvuk a jeho vlastnosti

Základy a aplikace digitálních. Katedra radioelektroniky (13137), blok B2, místnost 722

Příloha č. 3 TECHNICKÉ PARAMETRY PRO DODÁVKU TECHNOLOGIE: UNIVERZÁLNÍ MĚŘICÍ ÚSTŘEDNA

Mechanické kmitání a vlnění

Profilová část maturitní zkoušky 2014/2015

PCM30U-ROK 2 048/256 kbit/s rozhlasový kodek stručný přehled

ZDROJE MĚŘÍCÍHO SIGNÁLU MĚŘÍCÍ GENERÁTORY

Vrstvy periferních rozhraní

DUM č. 6 v sadě. 31. Inf-7 Technické vybavení počítačů

JBL 4818 "W - bin" (Stage Accompany 4518)

Metody připojování periferií BI-MPP Přednáška 1

Inovace výuky prostřednictvím ICT v SPŠ Zlín, CZ.1.07/1.5.00/ Vzdělávání v informačních a komunikačních technologií

Architektura počítačů

Měření kmitočtu a tvaru signálů pomocí osciloskopu

Témata profilové maturitní zkoušky

I N V E S T I C E D O R O Z V O J E V Z D Ě L Á V Á N Í. výstup

Digitální magnetický záznam obrazového signálu

Zobrazovací a zvuková soustava počítače

Základní principy přeměny analogového signálu na digitální

ELEKTRONIKA. Maturitní témata 2018/ L/01 POČÍTAČOVÉ A ZABEZPEČOVACÍ SYSTÉMY

Operační zesilovač (dále OZ)

KAPITOLA 1 - ZÁKLADNÍ POJMY INFORMAČNÍCH A KOMUNIKAČNÍCH TECHNOLOGIÍ

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ FAKULTA ELEKTROTECHNIKY A KOMUNIKAČNÍCH TECHNOLOGIÍ ÚSTAV RADIOELEKTRONIKY. OPTICKÝ SPOJ LR-830/1550 Technický popis

popsat princip činnosti základních zapojení čidel napětí a proudu samostatně změřit zadanou úlohu

2. GENERÁTORY MĚŘICÍCH SIGNÁLŮ II

Identifikátor materiálu: ICT-1-08

Gymnázium Vysoké Mýto nám. Vaňorného 163, Vysoké Mýto

G R A F I C K É K A R T Y

Měřicí technika pro automobilový průmysl

Mechanické kmitání (oscilace)

Sběrnice. Parametry sběrnic: a. Přenosová rychlost - určuje max. počet bitů přenesených za 1 sekundu [b/s]

Paměti Josef Horálek

1 SENZORY V MECHATRONICKÝCH SOUSTAVÁCH

Číslicové multimetry. základním blokem je stejnosměrný číslicový voltmetr

elektrické filtry Jiří Petržela filtry založené na jiných fyzikálních principech

Osnova. Idea ASK/FSK/PSK ASK Amplitudové... Strana 1 z 16. Celá obrazovka. Konec Základy radiotechniky

evodníky Univerzita Tomáše Bati ve Zlíně Ústav elektrotechniky a měření Přednáška č. 14 Milan Adámek adamek@fai.utb.cz U5 A

Princip digitalizace vstupních multimediálních dat Klasifikace Zpracování Využití

ZÁKLADY DATOVÝCH KOMUNIKACÍ

11. Logické analyzátory. 12. Metodika měření s logickým analyzátorem

VM-3000 Série INTEGROVANÝ NOUZOVÝ VAROVNÝ SYSTÉM

Číslicové obvody základní pojmy

Uživatelský manuál Revize RS

Příklady kmitavých pohybů. Mechanické kmitání (oscilace)

Konektory a Kabely. Aneb zařízení integrovaná do základní desky a konektory a kabeláž pro připojení externích zařízení

ZÁKLADY DATOVÝCH KOMUNIKACÍ

25 - Základy sdělovací techniky

VY_32_INOVACE_FY.18 ZVUKOVÉ JEVY

Transkript:

Bankovní institut vysoká škola Praha Katedra informačních technologií Vstupní a výstupní zvuková zařízení u osobních počítačů Bakalářská práce Autor: Martin Havel Informační technologie Vedoucí práce: Ing. Vít Fábera, Ph.D. Praha Březen 2009

Prohlášení: Prohlašuji, že jsem tuto bakalářskou práci zpracoval samostatně a s použitím uvedené literatury. V Praze dne 20. března 2009 Martin Havel

Poděkování: Děkuji vedoucímu bakalářské práce Ing. Vítovi Fáberovi Ph.D. za jeho čas, úsilí a konzultace poskytnuté k vypracování bakalářské práce.

Anotace Předložená práce je zaměřena na vývoj zvukových možností osobních počítačů a shrnuje směry, kterými se doposud vyvíjely. Zároveň se snaží nastínit budoucí vývoj a seznámit čtenáře s moderními trendy reprodukce zvuku u počítačů. Práce je rozdělena do čtyř částí. První část práce se zabývá zvukovými kartami a jejich vývojem. Představuje jednotlivé zvukové karty, které přinesly nové technologie ovlivňující následující vývoj zvukové reprodukce. Druhá část práce se věnuje zvukovému signálu a jeho zpracování v PC. Seznámí s principy digitálního signálu. Třetí část práce ukáže na dnešní možnosti reprodukce zvuku. Seznámí se strukturou reproduktorů a mikrofonů. Čtvrtá část práce přináší závěry a zamyšlení nad vizí budoucího směřování vývoje zvukových zařízení u PC. Annotation The following thesis is focused on the development of sound possibilities of personal computers and summarizes ways that have evolved so far. At the same time it endeavours to outline the future development and acquaints the readers with modern trends in computer sound reproduction. The thesis is divided into four parts. The first part of the thesis deals with sound cards and their development. It represents a single sound card, which brought a new technologies affecting the following evolution of sound reproduction. The second part of the thesis attends to a sound signal and its processing in the PC. Familiars with the principles of digital signal. The third part of the thesis is dedicated to a today's possibilities of the sound reproduction. Familiars with the structure of speaker and microphone. The fourth part of the thesis brings the conclusions and the muse about the vision of the future direction of the development of PC audio equipment.

Obsah 1 ÚVOD 6 2 HISTORIE VZNIKU ZVUKOVÝCH ZAŘÍZENÍ U PC 7 2.1 Pohled do historie 7 2.2 První zvukové karty 9 2.3 Integrované zvukové čipy 16 3 PRINCIPY A MOŽNOSTI ZPRACOVÁNÍ ZVUKOVÉHO SIGNÁLU 18 3.1 Zvuk 18 3.2 Zvuková karta 19 3.3 Digitální část 22 3.4 Zvukové zdroje 29 3.5 Rozhraní MIDI 30 4 PRINCIPY A METODY REPRODUKCE ZVUKU 33 4.1 Reproduktory 33 4.2 Sluchátka 35 4.3 Mikrofony 36 4.4 Komprese zvuku 40 4.5 Zvukové formáty 45 5 ZÁVĚR 47 5.1 Použité zdroje 49 5.2 Použité obrázky 51 5.3 Použité tabulky 52

1 Úvod Snad každý z nás ve chvilce odpočinku či při práci, a to bez ohledu na své hudební vyznání, si s oblibou rád poslechne svou oblíbenou hudbu. Dnes již není poslech kvalitní hudby jen otázkou živého orchestru v dokonale akusticky přizpůsobeném sále. Není také pouze výsadou kvalitních a drahých hifi soustav, nýbrž je i součástí většiny osobních počítačů dneška. Díky dynamicky se rozvíjejícím IT technologiím se setkáváme s celou řadou nových zvukových formátů, standardů a možností reprodukce zvuku. Jak dlouhá a trnitá byla cesta vývoje zvuku u osobních počítačů? Rád bych za pomoci mé bakalářské práce ukázal, proč vlastně PC nezůstaly jen němými počítacími stroji a v čem vlastně spočívá princip jejich hlasu. Důvod mého rozhodnutí napsat tuto práci, byl nejprve zájem o koupi zvukové karty. Rozhodl jsem se pro studii materiálů dostupných zvukových karet. Studium mě velice zaujalo, byl jsem překvapen rozsahem zvukové problematiky. Toužil jsem o porozumění principů zpracovávání zvukového signálu a možnostech jeho reprodukce. Zároveň jsem chtěl poznat historii zvukových karet. Vytvořit si lepší představu, směru a tempa budoucího vývoje. Cíl práce Tato práce se zabývá vývojem zvukových karet a jejich využitím u osobních počítačů. Popsáním principů a metod zpracování zvukového signálu a jeho reprodukce. Pohledem na současné zvukové karty a jejich budoucí vývoj. 6

2 Historie vzniku zvukových zařízení u PC Od vzniku prvních zvukových karet uplynulo již téměř třicet let. Za tuto dobu prošel jejich vývoj neuvěřitelnými změnami. Za ně vděčí převážně dynamicky se zvyšujícím technickým možnostem výpočetní techniky a neméně tak i konkurenčnímu boji vývojových firem. 2.1 Pohled do historie Dnešní moderní společnost si již těžko představí své osobní počítače, které by neuměly reprodukovat zvuk. Rád bych zde vzpomenul na několik významných událostí, které udávaly tempo a směr vývoje zvuku u osobních počítačů. První PC od firmy IBM roku 1981 byly vybavovány pouze malým reproduktorkem nazývaným PC Speaker. Jeho úkolem bylo přehrávání lehčích tónů převážně výstražných signálů. Dovedl reprodukovat pouze jeden tón v jeden okamžik a jeho pípání se stalo velmi brzy nedostatečné. Až později v roce 1988 firma Access Software vyvinula metodu, při které se tóny akordu nehrají současně, ale rychle za sebou, jako například na harfě. Metoda byla nazvána Arpeggio a způsobovala rychlé vypínání a zapínání PC Speakeru. Při troše fantazie si zde posluchač mohl představit i hudbu. Avšak k reprodukci skutečné hudby měl tento pokus ještě velmi daleko. Obrázek č. 1: PC Speaker 1 V roce 1982 vyvinula firma Commodore počítač s typovým označením 64. Pro své na tu dobu nadprůměrné schopnosti a cenové dostupnosti si velmi brzy získal patřičnou přízeň uživatelů. Obsahoval integrovaný zvukový čip SID 6581 Sound Interface Device. Tento čip 1 Zdroj: http://www.fi.muni.cz/usr/jkucera/pv109/2002/xbabice1.html 2.11.2008 7

jako první umožňoval vytvářet kvalitnější hudební doprovod pro počítačové hry a ostatní aplikace. Čip využíval tří syntetických hlasů, které mohly spojením vytvářet složitější zvuky, mohly být použity i nezávisle na sobě. Jeho předností byla možnost nastavení frekvence, barvy a hlasitosti hraných tónů. Roku 1983 firma IBM představila osobní počítač PCjr nazývaný Junior. Jednalo se o relativně levný domácí počítač, který byl vylepšením předchozího modelu IBM PC. Obsahoval již nový zvukový čip Texas SN76496, pracující také se třemi hlasy a schopností nastavit hlasitost v šestnácti úrovních a to pro každý hlas. Z důvodu vysoké ceny a kvalitní konkurence se mu nepodařilo na trhu prosadit a brzy se přestal vyrábět. Vzhledem k tomu, že další PC od IBM s názvem Tandy 1000 nabízelo stejné zvukové možnosti, dopadlo stejným způsobem. Tehdejší neúspěch IBM nahrával konkurenčním firmám. Obrázek č.2: Commodore 64 2 V roce 1985 přišel na trh nástupce úspěšného C64 a názvem Comodore Amiga. Jako první se mohl pochlubit 8-bitovým 4-kanálovým digitálním stereo zvukem. Amiga v úspěšnosti následovala svého předchůdce. Díky ní vznikl později první originální typ modulového souboru, jednalo se o hudební formát nazývaný MOD (Tracker Music Module). Byl to první originální typ modulového souboru, umožňující uskladnění hudby. V roce 1986 se objevila záchrana pro IBM PC. Firma Covox vyvinula externí zařízení, které využívalo možnosti připojení přes paralelní port jímž byly tehdejší PC vybaveny. Jednalo se o zařízení, která pomocí jednoduchého obvodu dokázala reprodukovat 8-bitový monofonií digitalizovaný zvuk. Až později se objevila verze schopna reprodukci stereofonního zvuku. 3 2 Zdroj: http://commodore-64.navajo.cz/ 11.11.2008 3 Zdroj: http://www.fi.muni.cz/usr/jkucera/pv109/2002/xbabice1.html 11.11.2008 8

2.2 První zvukové karty Do roku 1986 tedy ještě neznalo PC interní zvukovou kartu jakou známe dnes. Byla to firma Adlib, která ji jako první uvedla na trh. Tato karta nastartovala skutečnou revoluci vývoje zvuku a stala se tak i hardwarovým standardem. AdLib V roce 1987 se objevila karta AdLib. Tato karta byla prvním zástupcem interních zvukových karet využívající 8-bitového rozhraní ISA slotů. Byla vybavena jediným monofoním výstupem s otočným regulátorem hlasitosti a možností reprodukce hudby pomocí frekvenční modulace (FM syntézy). Použit zde byl čip od výrobce Yamaha (YM3812) s označením OPL-2. Jednalo se o monofoní čip s možností dvou režimů, které bylo možné mezi sebou libovolně přepínat. V prvním režimu byl schopen pracovat s devíti melodickými hlasy syntézy. V dalším speciálním režimu šumu měl k dispozici šest melodických hlasů a pět kanálů šumu. Ty byly využívány k napodobení bicích nástrojů. Obrázek č.3: AdLib Music Synthesizer Card MOD-900808 4 Music Feature Card Ve stejném roce vydala firma IBM, Music Feature Card. Byla vybavena také čipem od společnosti Yamaha (OLP-2). Zvuk její FM syntézy byl však kvalitnější než u karty AdLib a disponovala již čtyřmi možnými režimy. K dispozici měla pouze osm melodických hlasů, zato disponovala rozsáhlou knihovnou tří stovek kvalitních elektronických nástrojů. Její předností byla možnost použití dvou těchto karet zapojených do ISA slotů, tím bylo dosaženo 4 Zdroj: http://www.svethardware.cz/art_doc-bc77a7a4115424a5c125725d005327de.html 11.11.2008 9

dvojnásobného počtu hlasů. S příchodem těchto karet začínal vývoj nabírat ještě větších obrátek. Výrobci si začali uvědomovat nepříliš věrohodnou reprodukci FM syntézy. Obrázek č. 4: Music Feature Card 5 Game Blaster V roce 1988 spatřila světlo světa první zvuková karta od firmy Creative Music Systems s názvem Game Blaster. Později firma změnila název na Creative Labs. Karta obsahovala dvanáct FM kanálů se šestnácti stupni hlasitosti. Byla vybavena stereofonním výstupem a třemi kanály šumu pro reprodukci bicích nástrojů. Kvalita zvuku nebyla příliš kvalitní, tak se firma Creative Labs pustila do vývoje dnes známé legendy mezi zvukovými kartami, nazvanou Sound Blaster. Obrázek č. 5: Game Blaster 6 Sound Blaster V listopadu roku 1989 představila firma Creative Labs novinku, kartu Sound Blaster za cenu 299$. Velkou výhodou karty Sound Blaster byl nový čip OPL-2, což mu zaručovalo kompatibilitu s doposud velmi rozšířenou kartou Adlib. Byla schopna poskytnout 8-bitový monofonní zvuk ve 22 khz kvalitě pro přehrávání. Záznam zvuku byl možný s kvalitou až 15 khz. Hlavní novinku, kterou přinášela tato karta, byl D/A (digitálně analogový) a A/D 5 Zdroj: http://www.svethardware.cz/art_doc-bc77a7a4115424a5c125725d005327de.html 23.11.2008 6 Zdroj: http://www.svethardware.cz/art_doc-bc77a7a4115424a5c125725d005327de.html 24.11:2008 10

(analogově digitální) převodník, který již umožňoval reprodukovat a zaznamenávat digitalizované zvuky. Vybavena byla také vestavěným rozhraním MIDI (Musical Instrument Digital Interface) pro zpracování digitálního signálu od připojených externích zařízení. MIDI se stalo později standardem a definovalo sadu 128 hudebních nástrojů a 47 bicích. Svým vybavením a pozdějším snížením ceny až o jednu třetinu byl Sound Blaster nejprodávanější zvukovou kartou na trhu. Svou kvalitou si získal oblibu i většiny softwarových společností, které vyvíjely své aplikace právě s podporou karty Sound Blaster. Stal se tak i standardem pro většinu konkurenčních firem, které se pokoušely držet s firmou Crative Labs krok, ne však s velkým úspěchem. Obrázek č. 6: Sound Blaster 7 Roland LAPC-1 Ve stejném roce se představila karta Roland LAPC-1. Karta se vyznačovala v porovnání s kartou Sound Blaster kvalitnějším přednesem zvuku, za který vděčila především novince nazvané Wavetable syntéza (digitální prezentace skutečných hudebních nástrojů uložených v operační paměti). Využívala ji v kombinaci s FM syntézou. Samozřejmostí již bylo rozhraní MIDI se sadou 128 hudebních nástrojů, 30 bicích a navíc obsahovalo 33 zvukových efektů. Její slabinou byla nekompatibilita s populární kartou Sound Blaster a proto se nestala příliš oblíbenou mezi běžnými uživateli a byla spíše využívána k profesionálnímu užití. Sound blaster Pro a 16 V roce 1991 přišla na trh novinka firmy Creative Labs nazvaná Sound Blaster Pro. Obsahovala již dva čipy syntézy FM (OPL 2), což umožňovalo reprodukci zvuku ve 7 Zdroj: http://www.svethardware.cz/art_doc-3043bc46cbb32c89c125725d00541183.html 3.12.2008 11

stereofonním formátu. Vylepšena byla i schopnost záznamu zvuku se vzorkovací frekvencí 22,05kHz, její reprodukce se zvýšila na 45kHz. O rok později se objevila verze Sound Blaster 16. Jednalo se o vylepšení předchozího modelu. Novinkou zde byl čip Yamaha OLP-3, jako první z řady obsahovala 16-bitové zpracování digitálního zvuku. Karta byla vybavena slotem, který umožňoval připojení přídavné karty s názvem Wave Blaster, zajišťující Wavetable syntézu. Obrázek č. 7: Sound Blaster 16 8 Gravis Ultrasound Plug'n'Play Rok 1995 přinesl novinku od firmy Gravis Ultrasound. Karta obsahovala nový čip od firmy Advanced Micro Devices (AMD) s označením InterWave AM 78C201. Vybaven byl 32 hlasy Wavetable syntézy a pracoval s pamětí 16MB. V paměti ROM bylo uloženo 195 nástrojů a reprodukce pracovala na 48kHz. Umožňovala také emulaci FM syntézy. Sound Blaster AWE32 a AWE64 Roku 1997 se představila přepracovaná zvuková karta Sound Blaster s názvem AWE32. Jednalo se o první kartu firmy Creative Labs vybavenou Wavetable syntézou s 32 hlasy. Obrázek č. 8: Sound Blaster AWE64 9 8 Zdroj: http://www.svethardware.cz/art_doc-3043bc46cbb32c89c125725d00541183.html 3.12.2008 9 Zdroj: http://www.svethardware.cz/art_doc-3043bc46cbb32c89c125725d00541183.html 3.12.2008 12

Následně přišla verze AWE64, kde na první pohled patrnou změnou byla velikost karty.ta byla o poznání menší a svým vzhledem se již podobala dnešním kartám. Nejvýraznější změnou byl přechod na 64 hlasovou Wavetable syntézu, o kterou se staral čip EMU8000. Byla vybavena 1 MB paměti ROM a 512 KB paměti RAM, která se dala rozšířit speciálním paměťovým čipem o maximální kapacitě 8 MB. Přehrávání i záznam zvuku zvládala karta stereo s frekvencí 44,1 MHz. Navíc byla karta plně duplexní a umožňovala tak současně zvuk reprodukovat i nahrávat. A3d Jedná se o první systém tvorby prostorového zvuku s použitím nového zvukového čipu Vortex. Technologie A3D vyvinutá firmou Aureal Semiconductor využívala principu nepatrného zpožďování zvuků jednotlivých reproduktorů. Systém umožnil použití až čtyř reproduktorů z nichž dva byly umístěné v předu a dva v zadu za posluchačem. Již druhá verze s názvem A3D 2.0, byla schopna vytvářet efekty v podobě ozvěn, dozvuků a pracovala i s možností rozdílného typu okolního prostředí. Nabízela také digitální zvuk 5.1. dnes i 7.1. Později firma Creative Labs vyvinula obdobu toho systému s názvem EAX Obrázek č. 9: Čip Vortex 2 10 Firma Aurel ukončila svou činnost roku 1999 z důvodů soudních sporů s Creative Labs, která následně firmu odkoupila a tím prosadila svou technologii EAX. Dnes nabízí verzi s označením EAX 5.1. Diamond Sonic Impact S70 Rok 1998 byl ve znamení nové technologie 3D akcelerátorů. Jedním z prvních zástupců zvukových karet se systémem 3D byla Sonic Impact S70 uvedená firmou Diamond. 10 Zdroj: http://www.svethardware.cz/art_doc-c85fa7328b2413a6c125726c00434cf8.html 3.12.2008 13

Využívala čip Vortex s označením AU8820, který se mohl pochlubit výkonem 300Mhz. Karta byla vybavena sběrnicí PCI a zajišťovala kompatibilitu s operačním systémem Microsoft PC 98. Dále nabízela 32 hlasnou polyfonii Wavetable syntézy. Jako druhý zástupce firmy Diamond byla později představena zvuková karta Monster Sound MX 300. Vyznačovala se stejnými vlastnostmi jako její předchůdce, prodělal však několik vylepšení. Za ně vděčila nové verzi čipu Vortex 2. Ten přinášel vylepšení 3D zvuku s množstvím hudebních nástrojů pro simulaci zvuku v různých typech prostředí. Sound Blaster Live! Rokem 1998 začala nová éra úspěšných zvukových karet s názvem Sound Blaster Live! Příchodem této karty si Creative Labs upevnil svou pozici jedničky na trhu. Jednalo se opět o revoluční kartu, která posunula budoucí vývoj zvukových karet až k možnostem používaným dnes. Karta již začala využívat technologie 3D v podobě zvukového syntetizátoru A3D. Nový čip vyvinutý firmou Creative Labs s názvem EMU10K1, který obsahoval 2,44 miliónů tranzistorů a umožňoval provést 1000 miliónů instrukcí za sekundu. Obrázek č. 10: Sound Blaster Live! Platinum s Live! Drive 11 Nabízel podporu Wavetable MIDI a vylepšení syntetizátoru A3D firemní technologií EAX 1.0 a 2.0, DirectSound3D obsahoval 64 hlasů pro syntetizátor. Wavetable syntéza umožňovala 64 hlasů a 1024 notovou polyfonii. Další jeho předností byla zpětná kompatibilita s již méně využívaným operačním systémem DOS. Karta byla osazena čtveřicí reproduktorových výstupů a zvládala již 16-bitovou stero reprodukci o 48kHz frekvence. Karta dále využívala druhý 32bitový čip FX8010 pro zpracování digitálních efektů, s jehož pomocí bylo možné nastavit různá audio prostředí dle vlastní potřeby. 11 Zdroj: http://www.svethardware.cz/art_doc-44edd7c607b45f4ec125726c00436863.html 3.12.2008 14

Těchto schopností bylo využito k vytvoření nové technologie EAX Environmental Audio extension. Obsahovala knihovnu 26 předvoleb různých prostředí, které si mohl uživatel libovolně upravovat. Karta používala nové rozhraní PCI, které umožnilo rychlejší digitální přenosy audio signálu a kvalita zvuku se tím ještě zlepšila. Později byla karta vylepšena o dekodér Dolby Digital 5.1 určený pro přehrání DVD disků. Sound Blaster Audigy a Audigy 2 2001 - Sound Blaster Audigy byla dalším zástupcem Craetive Labs. Obsahovala nový procesor EMU10K2. Wavetable syntéza umožňovala až 64 hlasů a 1024-notovou polyfonii, možnost reprodukce zvuku až v 24bitové kvalitě o frekvenci až 96 khz. První verze dokázaly pro svůj 5.1 výstup simultánně počítat čtyři vylepšené EAX 3.0 efekty najednou. Pozdější verze Audigy 2, byla nabízena možnost 24bitů / 192 khz při reprodukci 24bitů/96 khz při záznamu. Výstupy se rozšířily na 6.1 pro Dolby Digital, také zde byla možnost dokoupit externí box, který obsahoval porty MIDI, S/PDIF, FireWire a další analogové a optické konektory. Obrázek č. 11: Sound Blaster Audigy 2 12 Sound Blaster X-FI Roku 2005 Creative Labs představila novou řadu zvukových karet a jejím prvním zástupcem byla karta Sound Blaster X-FI. Přinášela zbrusu nový čip Creative X-FI Xtreme Fidelity, pracující na frekvenci 400MHz o kvalitě zvuku 24bitů a vzorkovací frekvencí 96kHz. Byl vyroben z více než 51 milionů tranzistorů a je schopen vykonávat 10000 MIPS. Záznam zvuku umožňoval od 44,1kHz do 96 khz. Výsadou této karty bylo EAX verze 4.0 se 128 hlasy, prostorový zvuk X-Fi CMSS-3D a nové Dolby Digital 6.1EX. Další roky přinesly několik vylepšení a dnes se můžeme setkat s verzí Sound Baster X-fi Elite Pro 64MB 12 Zdroj: http://www.tvfreak.cz/art_doc-015f60e2bc54bec1c125727c00598a16.html 3.12.2008 15

X-RAM. Můžeme ji dnes pořídit za necelých 7000Kč. A jaké novinky přináší? Je postavena na nové sběrnicí PCI-Express s jejíž pomocí se ještě více urychlí přenos dat. Umožňuje maximální vzorkovací frekvenci až 192kHz. Dalším vylepšením je optický vstupní a výstupní port SPDIF. Přibylo také dekódování formátů DTS, prostorový zvuk pro sluchátka X-Fi CMSS-3D, Dolby Digital 7.1, EAX 5.0 a certifikát zvukového standardu THX. Samozřejmostí je dnes plná podpora OS Windows XP a Vista. 13 Přes veškeré úsilí kvalitních konkurenčních firem se po velmi dlouhou dobu nepodařilo vyvinout zvukovou kartu, která by překonala populární kartu Sound Blaster. Pokud se taková karta objevila, Creative Labs vytáhl do boje s ještě kvalitnější kartou. Tak konkurenčním firmám stále nezbývá nic jiného, než držet kompatibilitu a krok se Sound Blastery, jelikož stále zůstávají v oblibě nejen u uživatelů, ale stejně tak i u většiny serverových firem. Zvukové karty Sound Blaster si stále drží první příčky v prodejnosti na světovém trhu. 2.3 Integrované zvukové čipy Další možné řešení zpracování zvuku na PC je použití integrovaných zvukových kodeků. Jako první přišla s integrovaným řešením zvuku firma Intel v roce 1997. Začala své základní desky osazovat zvukovými čipy a stanovila tím standart AC 97 (Audio Codec 97). Kodek je integrován přímo na základní desce počítače a je závislý na výkonu procesoru PC, který pro svou funkci využívá. Obrázek č. 12:Základní schéma AC'97 14 13 Zdroj: http://www.fi.muni.cz/usr/jkucera/pv109/2002/xbabice1.html 16.12.2008 14 Zdroj: http:// http://www.svethardware.cz/art_doc-f2cf5608d8c3645bc12572740060e2c4.html 22.12.2008 16

Obsahuje převodníky ADC a DAC pro převod analogového signálu na digitální a naopak. Verze AC 97 2.2 nabízela 16-bitový stereo zvuk, 20-bitové převodníky, vzorkování 48kHz. Využívala analogové stereo vstupy pro audio a mikrofon. Výstupy pro sluchátka nebo reproduktory umožňující čtyřkanálový zvuk. Standard AC 97 se velmi rychle prosadil i mezi ostatní výrobce a stal se tak velmi populárním. Integrované řešení zvukové kary nedosahovalo zdaleka kvality slotových karet. Ne však každý uživatel PC je zarytý hudební fanoušek, nebo hráč počítačových her a právě pro běžného uživatele se stal zvukový kodek dostatečným řešením. Dnes jsou zvukové kodeky na velmi dobré úrovni. Staly se tak základním vybavením většiny základních desek. Ty nejlepší se mohou pochlubit 192kHz vzorkovací frekvencí, reprodukcí ve kvalitě až 32bitů a dekódováním Dolby Digital až 7.1. Avšak kvality zvuku kvalitních slotových karet zatím ještě nedosahují. 15 15 Zdroj: http://www.svethardware.cz/art_docbc77a7a4115424a5c125725d005327de.html 22.12.2008 17

3 Principy a možnosti zpracování zvukového signálu V této kapitole se zaměřím na vlastnosti zvukových signálů a pokusím se popsat principy jejich přeměny zvukovými kartami. 3.1 Zvuk Zvuk je mechanické vlnění v látkovém prostředí, které je schopno v lidském uchu vyvolat zvukový vjem. 16 Vzniká rozechvěním molekul vzduchu na určitou frekvenci nějakým zdrojem. Zdrojem zvuku může být látka jakéhokoli skupenství, ve které vznikne mechanické kmitání. Přenos zvuku je realizován pomocí vodiče, tím bývá nejčastěji vzduch a přechází od zdroje (např. lidské hlasivky) k příjemci (lidské ucho). Při tomto ději se kmitáním v látkovém prostředí šíří energie. Příčinou vzniklého vlnění jsou vazby mezi molekulami a atomy daného prostředí, kde se kmitání jedné částice přenáší na částici druhou. Kmitání, které v tomto případě vzniká je harmonické a jeho zvukové vlny se v prostoru šíří formou postupného podélného vlnění. Ve vzduchu se zvuk šíří všemi směry rychlostí přibližně 340 m/s a jeho intenzita klesá kvadraticky se vzrůstající vzdáleností. Rychlost zvuku je závislá na typu látkového skupenství. Ve vodě dosahuje rychlosti 1500 m/s, v ledu 3250 m/s a nejvyšší rychlosti dosahuje v kovech až 6000 m/s. 17 Obrázek č. 13: Zvukový signál 18 16 Zdroj: http://www.fi.muni.cz/usr/pelikan/archit/texty/zvuk.html 2.1.2009 17 Zdroj: http://www.tvfreak.cz 2.1.2009 18 Zdroj: http://home.vsb.cz/petr.bernat 2.1.2009 18

3.2 Zvuková karta Zvuková karta je vstupní a výstupní zvukové zařízení, které mění analogový signál na signál digitální a naopak. Je vybavena vstupními a výstupními porty pro připojení příslušného zařízení. Dnešní karty nabízejí různé možnosti připojení, představíme si je na novince firmy Crative Labs, X-Fi Titanium 7.1: Analogový mikrofonní vstup Analogový výstup pro přední reproduktory nebo sluchátka stero signál Analogový výstup pro střední reproduktory Analogový výstup pro zadní reproduktory Analogový výstup pro subwoofer Digitální optický vstup pro MiniDisc, Game Console (herní konsolu) Digitální optický výstup pro AV Receiver/Decoder Obrázek č. 14: Crative Labs X-Fi Titanium 7.1 19 Karta se zasouvá do příslušného slotu sběrnice na základní desce počítače. Dříve byly používány sběrnice typu ISA, dnes jsou používány převážně sběrnice PCI a PCI-Express x1. Zvukové karty můžeme rozdělit podle technických parametrů: 19 Zdroj: http://www.czechcomputer.cz/user_prod_images.jsp?unid=e7b02c88f50f71edc12574c70063bbf4&artno=59698 2.1.2009 19

Typ sběrnice - ISA, PCI, PCI Expres x1 Počet bitů A/D a D/A převodníků 8, 16, 24 bit Maximální vzorkovací frekvence: 11-192 KHz Odstup signál/šum: 100 120 db Základní princip zvukové karty Hlavním úkolem zvukové karty je zpracovávat analogový signál a převést jej do digitální formy (na posloupnost čísel popisujících úroveň signálu). Principem převodu spojitého analogového signálu na digitální je rozdělení na sérii diskrétních impulzů. Digitalizace signálu je provázena časovou diskretizaci (vzorkováním), amplitudovou diskretizaci (kvantováním) a převodem kvantovaného signálu na číslicový signál (kódování). Obrázek č. 15: Blokové schéma zpracování signálu 20 Vzorkování Je základní operací, jejíž pomocí se provádí přeměna spojitého analogového signálu na signál digitální nespojitý. Vzorkováním je získávána řada impulsů (vzorků), jejichž výška je rovna okamžité hodnotě původního analogového signálu. Pro měření rychlosti vzorkování používáme hodnoty udávané v Hz. Lidské ucho je schopno zaznamenat rozsah zvukového spektra 20 Hz do 20 khz. Dnes běžně používané kvalitní kmitočty vzorkování jsou 44.1 khz a 48kHz, což je dvakrát více, než je lidské sluchové ústrojí schopno zaznamenat. Vzorkovací frekvence je definovaná Shannonůvým teorémem, který říká, že přesná rekonstrukce ze vzorků spojitého frekvenčně omezeného signálu je možná, pokud byl vzorkován alespoň dvakrát vyšší frekvencí než je frekvence původního signálu.v praxi to znamená, že pro věrnost rekonstrukce signálu je zapotřebí minimálně dvojnásobně vyšší frekvence. 20 Zdroj: Vlastní 7.1.2009 20

V opačném případě dochází ke ztrátě věrohodnosti původního signálu a signál se tak stává zkresleným. Například použijeme-li vzorkovacího kmitočtu 44,1 khz (44.100 vzorků za sekundu) můžeme vzorkovat pouze signály, v jejichž spektru je nejvyšší kmitočet 22,05 khz (při vzorkování vyšších kmitočtů by došlo ke slyšitelnému zkreslení ve výškách). Při vzorkování hrozí nebezpečí ztráty informace v důsledku možného překrytí dvou sousedních period. Vzorkováním kmitočtově omezeného akustického signálu vzniká v kmitočtové oblasti soubor překrývajících se spekter (aliasing). Proto je nutné analogový signál na vstupu kmitočtově omezit dolní propustí se zlomovým kmitočtem rovným polovině vzorkovacího kmitočtu (antialiasingový filtr). V tomto případě jsou odstraněny všechny frekvence vyšší než 22,05 khz. Část spektra původního signálu se vlivem překrytí posunutých spekter ocitne ve slyšitelné oblasti kmitočtů a tím může způsobit vznik nových složek signálu spolu se změnou jeho barvy. Obrázek č. 16: Vzorkování 21 Kvantování Vzorky jsou v čase nespojité, ale v amplitudě mohou dosahovat některých hodnot z původního signálu. Kvantováním dochází k přeměně signálu spojitého na signál diskrétní (nespojitý). Při kvantování vzorků jsou stanoveny horní a dolní rozdělovací úrovně.ty určují zda hodnota vzorku je nad nebo pod touto úrovní (hodnota vzorku se nesmí rozdělovací úrovni rovnat). Vytvoří se omezený počet kvantizačních stupňů, počet bitů, jimiž se bude kódovat a každému vzorku je přiřazen jemu nejbližší kvantizační stupeň. Každá funkční hodnota signálu se nachází právě v kvantizačním intervalu a je reprezentovaná jeho jistou úrovní. Při kvantování dochází k většímu nebo menšímu kvantizačnímu zkreslení a tím vzniká u kvantovaného signálu kvantizační chyba (dochází ke ztrátě informace). Její velikost 21 Zdroj: http://cs.wikipedia.org/wiki/soubor:vzorkovani2.svg 7.1.2009 21

závisí na typu zobrazení pohyblivé nebo pevné řádové čárky, na typu použité aproximace (zaokrouhlení) a způsobu zobrazení záporných čísel. Signál sestavený z těchto chyb nazýváme kvantizační šum. Obrázek č. 17: Kvantování 22 Kódování Jedná se o převod kvantovaného signálu na číslicový signál. Kódováním se přiřadí každému kvantizačnímu stupni číselná kódová kombinace a kvantovaný vzorek se do ní zakóduje. 23 Základní části zvukové karty Zvukovou kartu můžeme rozdělit na tři základní části digitální, zvukové zdroje a MIDI rozhraní 3.3 Digitální část Její hlavní částí jsou A/D a D/A převodníky. Pro převod analogového a digitálního signálu. A/D převodníky Analogově digitální převodníky zajišťují převod analogové veličiny například naměřených hodnot proudu nebo napětí do číslicové podoby. Výstupem je datové slovo se stanoveným počtem bytů. Základem převodu signálu je snímání napěťových hodnot analogového signálu 22 Zdroj: http://cs.wikipedia.org/wiki/soubor:kvantovani.svg 8.1.2009 23 Zdroj: http://maturita-ztd4.kvalitne.cz/sdt/16.doc 8.1.2009 22

v krátkých časových okamžicích (vzorkování). V dalším kroku jsou amplitudy jednotlivých signálů převáděny na číslicový tvar (kvantování). Analogově digitálních převodníků existuje mnoho typů a každý z nich má své specifické vlastnosti, kterými se více či méně hodí pro dané účely. Z pravidla je můžeme rozdělit na tři skupiny dle způsobu převodu na kompenzační, komparační, integrační. Obrázek č. 18: A/D převodník umístěný na zvukové kartě 24 Rozdělení A/D převodníků Podle zpětné vazby: bez zpětné vazby - porovnávají vstupní analogové napětí a napětí referenční, výsledkem je vstupní slovo. se zpětnou vazbou - porovnávají vstupní analogové napětí s analogovým napětím odvozeným z postupně generovaného výstupního slova. Převod je ukončen v okamžiku rovnosti obou napětí. Podle způsobu synchronizace: synchronní k převodu vstupního napětí dochází v pravidelných synchronizovaných okamžicích (krocích). asynchronní načasování převodu vstupního napětí je závislé pouze na zpoždění jednotlivých obvodu (může probíhat ve více krocích). Podle způsobu převodu: přímé převádějí přímo vstupní napětí na výstupní datové slovo. nepřímé převádějí vstupní napětí na jinou analogovou veličinu, kterou následně převede na výstupní datové slovo. 24 Zdroj: http://cs.wikipedia.org/wiki/a/d_p%c5%99evodn%c3%adk 8.1.2009 23

Komparační A/D převodníky Převod využívá principu porovnávání měřeného napětí s kvantovaným referenčním napětím (postupně nebo najednou). Kvantované referenční napětí je vytvářeno sítí shodných odporů. Počet kvant referenčního napětí udává hodnotu číslicového signálu. K převodu zde dochází paralelně, a její rychlost je určena reakční dobou komparátorů. Komparační převod patří mezi nejrychlejších principy převodu A/D převodníků, mezi nejznámější patří paralelní A/D převodník. Kompenzační převodníky Převod je založen na kompenzaci měřeného vstupního napětí s napětím vytvořeným D/A převodníkem řízeným logickým obvodem. Převod je ukončen v okamžiku, kdy rozdíl mezi oběma napětími je menší než nejmenší hodnota referenčního napětí. To odpovídá bitu číslicového signálu s nejmenší vahou. Podle způsobu změn kompenzačního napětí dělíme převodníky s konstantním a odstupňovaným přírůstkem. Převodníky s kompenzačním přírůstkem generují kompenzační napětí v podobě skoků s přírůstky shodné velikosti, určující kvantem referenčního napětí o nejmenší velikosti. Ukončení převodu nastane, překročí-li kompenzační napětí hodnotu vstupního napětí. Převodníky s odstupňovaným přírůstkem umožňují zkrátit dobu převodu generací kompenzačního proudu s přírůstky odstupňovanými podle vah jednotlivých bitů. Nejprve se generují přírůstky o největší hodnotě a následně o nejmenší hodnotě. (postupná aproximace). A/D převodníky s postupnou aproximací Využívají principu postupného půlení intervalu a následného ověření ve které polovině intervalu se měřené napětí nachází. Následuje další rozdělení získané poloviny intervalu a opět se provede zjištění jeho umístění. Skončením každého dělení se určí hodnota dalšího bitu. Postup se opakuje do té doby, než není zjištěno napětí, které nejvíce odpovídá měřenému. Součástí je číslicově analogový převodník zpětně převádějící výstupní slovo na analogové srovnávací napětí, které se mění v průběhu každého kroku. Následně je 24

porovnáváno se vstupním napětím v napěťovém komparátoru. A/D převodníky s postupnou aproximací se vyznačují vysokou rychlostí převodu a velmi dobrou rozlišovací schopností. Obrázek č. 19: Schéma A/D převodníku s postupnou aproximací 25 Paralelní A/D převodník (flash convertor) Je principielně nejjednodušším a současně také nejrychlejším typem A/D převodníku. Analogové vstupní napětí je převáděno na vstupy napěťových komparátorů, kde se porovná s referenčním napětím daného komparátoru (rozdílným pro každý komparátor, určený odporovým děličem). Pokud hodnota vstupního analogového slova překročí referenční napětí konkrétního komparátoru, dojde k jeho překlopení z logické úrovně 0 na hodnotu 1. Všechny výstupy jednotlivých komparátorů jsou převedeny do kódovacího obvodu převádějícího jejich úrovně, nejčastěji do dvojkového kódu. Obrázek č. 20: Tříbitový paralelní A/D převodník 26 25 Zdroje: http://maturita.andweb.cz/from%20koulis/29prevodniky.pdf 10.1.2009 26 Zdroj: http://maturita.andweb.cz/from%20koulis/29prevodniky.pdf 10.1.2009 25

Integrační A/D převodníky Integrační převod je založen na integraci měřeného vstupního napětí a převodu doby integrace na šířku impulsu, nebo na kmitočet. Následně jsou získané číslicové veličiny převáděny na číslicový údaj. Integrace je volena jako násobek periody rušivého signálu. Nejběžnějším typem integračního převodníku je Integrační A/D převodník s dvojí integrací pracující ve dvou fázích. V první fázi probíhá integrace vstupního napětí po dobu naplnění čítače. Ve druhé fázi dojde k naplnění čítače a tím k přepnutí klopného obvodu. Uzavře se vstup a čítač ukončí čítat impulsy z generátoru signálu Další varianty integračních převodníků jsou, se sledováním referenčního signálu a s mezipřevodem na frekvenci. Obrázek č. 21: Integrační A/D převodník s dvojí integrací 27 D/A Převodníky Slouží k převodu vstupního datového slova (digitálního čísla) do výstupní analogové veličiny (napětí určité hodnoty). Převodník se skládá ze zdroje referenčního napětí, sady spínačů ovládaných digitálními vstupy převodníku a odpory. Můžeme je rozdělit na přímé a nepřímé. Obrázek č. 22: D/A převodník umístěný na zvukové kartě 28 27 Zdroj: http://maturita.andweb.cz/from%20koulis/29prevodniky.pdf 10.1.2009 26

Přímé převodníky převádějí vstupní datové slovo přímo na výstupní napětí. Nejčastěji jsou řešeny příčkovou nebo váhovou strukturou odporové sítě. Základní princip nepřímých D/A převodníků spočívá v rozdělení převodu na dvě části. První část využívá mezipřevodu, kdy je vstupní číslicová kombinace převedena na jiný diskrétní signál určující šířku impulsu, nebo počet impulsů za jednotku času. Ve druhé části převodníku je převeden na výstupní analogový signál. D/A převodník s váhovou strukturou odporové sítě D/A převodník s váhovou strukturou odporové sítě je zástupcem převodníku s přímím převodem. Používá datového slova jako řídící veličiny předávaného prostřednictvím datové sběrnice. Vstupní hodnoty mají váhu ovládání jednotlivých elektrických přepínačů 20, 21, 22,, 2n bitů. Hodnota jejich sériových odporů je vždy dvojnásobkem hodnoty předcházející. Na obrázku 24 je 3-bitový D/A převodník s odpory R, 2R, 4R, kde se mění celkový přenos výstupního zesilovače spínáním jednotlivých přepínačů. Zde platí: Obrázek č. 23:Vztah pro přenos zesilovače 29 B I zde nabývá hodnot 0 nebo 1 podle stavu příslušného spínače, n určuje počet bitů datového slova. Tento typ převodníků ve vyznačuje vysokou rychlostí převodu. Jeho slabinou je nízká přesnost způsobená velmi rozdílnými hodnotami odporů a jejich přesnosti v jednotlivých bytech datového slova. Obrázek č. 24: Tříbitový D/A převodník s váhovou strukturou odporové sítě 30 28 Zdroj: http://cs.wikipedia.org/wiki/d/a_převodník 12.1.2009 29 Zdroj: http://maturita.andweb.cz/from%20koulis/29prevodniky.pdf 18.1.2009 30 Zdroj: http://maturita.andweb.cz/from%20koulis/29prevodniky.pdf 18.1.2009 27

D/A převodník s příčkovou strukturou odporové sítě Zde je struktura odporové sítě tvořena třemi odpory R, R, a 2R se stejnou popřípadě srovnatelnou hodnotou. Vstupní proud se dělí v každém uzlu a odpovídá dvojkové váze, proto odpory mají srovnatelnou hodnotu. Odporová síť je uspořádána tak, aby příspěvek každého následujícího bitu (nalevo) odpovídal odporu R. Pak příspěvek následujícího bytu k výstupnímu analogovému napětí se vždy zmenší o násobek 0,5. Obrázek č. 25:Tříbitový D/A převodník s příčkovou strukturou odporové sítě 31 Převodníky s pulzně šířkovou modulací D/A převodníky s PWM (Pulse Width Modulation) jsou zástupci nepřímých D/A převodníků. Jako předvolba pro zpětný datový čítač taktovaný generátorem hodinových impulzů slouží vstupní datové slovo. Pokud prochází datovým čítačem nula, obvod RS se překlopí do nulového stavu a dojde k zastavení odečítání zpětného čítače. Po ukončení převodu se klopný obvod RS překlopí do jednotkového stavu a převod se opakuje. Následně se impulzy za pomoci filtru převádějí na výstupní analogový signál (stejnosměrné napětí odpovídající střední hodnotě impulsu). Obrázek č. 26: Princip převodníku DAC s mezipřevodem na šířku impulsu 32 31 Zdroj: http://maturita.andweb.cz/from%20koulis/29prevodniky.pdf 18.1.2009 32 Zdroj: Dostupné z: http://home.tiscali.cz:8080/ftpspace/mikroprocesory.pdf 18.1.2009 28

3.4 Zvukové zdroje Zvuková karta je také schopna sama vytvářet tóny a zvuky pomocí syntetizátoru. Jedná se o syntézu tónu ve zvolených parametrech (výšce, hloubce, délce, nástroji). Zvuky jednotlivých hudebních nástrojů jsou tvořeny cykly skládající se ze čtyř částí: Nástup Pokles Trvání Doznívání Každý hudební nástroj je specifikován rozdílnou charakteristikou hodnot v průběhu jednotlivých fází cyklu. Pro kvalitní reprodukci musí zvuková karta tyto hodnoty dodržovat co nepřesněji. FM syntéza (frekvenční modulace) Zvuková karta je vybavena nejméně dvojicí oscilátorů (operátorů) z nich jeden pracuje jako generátor nosného signálu (nosič) a druhý jako generátor modulačního signálu (modulátor), určující okamžitý kmitočet modulovaného signálu. Zapojení operátorů může být paralelní (jeden operátor řídí hlasitost modulátoru druhého operátoru), nebo sériové (jeden operátor řídí kmitočet modulátoru druhého operátoru). Principem je závislost okamžitého kmitočtu nosné vlny na změnách amplitudy modulačního signálu. Tato metoda se u zvukových karet již téměř nevyužívá, nedosahovala potřebné přesnosti reálných nástrojů. Obrázek č.27: Ukázka časového průběhu frekvenčně modulovaného signálu. 33 33 Zdroj: Dostupné z: http://panwiki.panska.cz/images/9/94/fmcz.png 18.1.2009 29

Wavetable syntéza Metoda využívá již připravené navzorkované signály skutečných hudebních nástrojů. Vzorky jsou umístěné v paměti ROM zvukové karty, nebo přímo v paměti počítače RAM. Touto metodou je docíleno téměř přesné reprodukce zvuku. Není možné, aby v paměti byly uloženy všechny výšky tónů všech nástrojů a proto je v paměti uložen vždy jeden tón od každého nástroje. Různé výšky tónu se pak dosahuje různou rychlostí přehrávání daného vzorku. Syntéza fyzickým modelováním Jede o dosud nejdokonalejší metodu synteze, zatím však velice málo rozšířená. Hlavním důvodem jsou vysoké nároky na výkon procesoru. Metoda za pomoci softwarové analogie využívá principu analýzy zvukového ruchu a na jeho základě eliminuje zvuk vibrujícího systému. 3.5 Rozhraní MIDI Jedná se o vstupní standardizované rozhraní MIDI (Musical Instrument Digital Interface), kterým je možné připojit externí zdroj signálu např. elektronické varhany, (bylo také využíváno pro připojení joystic - game port). Při záznamu se pracuje s digitálním signálem, nedochází zde již ke vzorkování, ale přímo k záznamu jednotlivých bitů poskytovaných MIDI zařízením. Jednotlivé záznamy obsahují informace pro potřebnou identifikaci hudebního nástroje a jeho dynamice. Specifikace MIDI je rozdělena na dvě základní části. První část se zabývá způsobem připojení jednotlivých zařízení jak na linkové, tak i fyzické vrstvě a přenosem dat na nejnižší úrovni (asynchronním přenosem jednotlivých bitů). Druhá část popisuje specifikaci přenosového protokolu (přenos bajtů a MIDI zpráv). Přenos dat probíhá přes proudovou smyčkou a asynchronní sériový port. Pro přenos logické nuly protéká smyčkou od pinu na vysílacím zařízení s napětím 5V, proud o velikosti 5 ma. Jednotlivé informace jsou rozděleny na bajty (osm bitů) a každému z nich je přidělená dvojice bitů nazývaných start a stop bit. Start byt je reprezentován logickou 0 a stop byt logickou 1. Přenosem bajtů o různé délce rovné počtu jednotlivých bajtů (jeden, dva, tři), jsou tvořeny MIDI zprávy. První bajt zprávy (stavový bajt) je specifický svým prvním bitem, jehož logická hodnota je 1. Následující zprávy mají tento byt o logické hodnotě 0. Při ztrátě 30

synchronizace přenášených dat, je MIDI zařízení schopno jednoznačně identifikovat začátek další zprávy. Obrázek č.28: Přenos MIDI zprávy o délce tří bajtů 34 Start byt je reprezentován logickou 0 a stop byt logickou 1. Přenosem bajtů o různé délce rovné počtu jednotlivých bajtů (jeden, dva, tři), jsou tvořeny MIDI zprávy. První bajt zprávy (stavový bajt) je specifický svým prvním bitem, jehož logická hodnota je 1. Následující zprávy mají tento byt o logické hodnotě 0. Při ztrátě synchronizace přenášených dat, je MIDI zařízení schopno jednoznačně identifikovat začátek další zprávy. Obsahem stavového bajtu je číslo přenosového kanálu a kód příkazu. Následujícími bajty jsou přenášeny potřebné informace o frekvenci a rychlosti tónu o hodnotách 0-128. Tabulka č.1: Skupina nástrojů definovaných specifikací General MIDI 35 34 Zdroj: http://www.root.cz/clanky/rozhrani-midi-na-osobnich-pocitacich/ 3.2.2009 35 Zdroj: http://www.root.cz/clanky/rozhrani-midi-na-osobnich-pocitacich/ 3.2.2009 31

General MIDI se stal v roce 1991 standardem. Specifikace určuje 128 zvukových nástrojů a 47 bicích. Definuje tak nástroje a zvukové parametry. Výsledná kvalita přehrávaných tónu je závislá na kvalitě příslušného MIDI zařízení. HDMI High-Definition Multi-media Interface je standardizované vstupně výstupní rozhraní, určené pro přenos nekomprimovaného zvukového a obrazového signálu ve vysokém rozlišení. První verze HDMI 1.0 byla uvedena na trh roku 2002. Pro přenos dat byl použit jediný kabel obsahující devatenáct signálových vodičů, s maximální propustností 4.9 Gbit/s a frekvencí 165 MHz. Audio přenos byl přizpůsoben pro 8-kanálový digitální zvuk s frekvencí 192 khz/24-bit. Rok 2006 přinesl verzi HDMI 1.3. Nová verze umožňuje přenosovou rychlost 10.2 Gbit/s a frekvence byla zvýšena na 340 MHz. Maximální datová frekvence vzrostla na 768 khz/48-bit. Díky navýšení datové frekvence umožní přenos i všech známých komprimovaných formátů jako např. AC3 a DTS. 36 Tabulka č.2: HDMI konektor popis pinů 37 36 Zdroj: http://www.tvfreak.cz/art_doc-20a51a0d33014930c125727c0058fab9.html 23.3.2009 37 Zdroj: http://cs.wikipedia.org/wiki/hdmi 23.3.2009 32

4 Principy a metody reprodukce zvuku Doby, kdy nám první zvukové karty umožňovaly pouze poslech monofonního zvuku pomocí jednoho reproduktoru, jsou už nenávratně pryč. Dnešní možnosti reprodukce zvuku jsou přinejmenším obdivuhodné. Nebudu se zde zabývat jejím vývojem, ale rád bych objasnil principy a metody zvukové reprodukce, které si dnes může dopřát každý uživatel PC. 4.1 Reproduktory Reproduktor je elektroakustický měnič, který mění elektrický signál na mechanický pohyb membrány. Je umístěn v ozvučnici (skříni), která zabraňuje akustickému zkratu a optimalizuje reprodukci především nízkých kmitočtů. Membrána svým chvěním rozkmitá okolní vzduch a vzniklou tlakovou vlnou se do okolního prostředí šíří zvuk. Vzniká akustický signál. Pokud bychom hledaly reproduktor schopný obsáhnout celý slyšitelný rozsah (20 Hz do 20 khz), budeme ho hledat zbytečně. Velikost frekvenčního rozsahu je závislá na velikosti membrány reproduktoru, její výchylky a možnosti rychlosti jejího kmitání. Z tohoto důvodu můžeme rozdělit reproduktory podle frekvenčních charakteristik: výškové 2000-20000Hz středové 80-1200Hz basové 20-1500Hz Pro obsáhnutí celého spektra slyšitelného frekvenčního rozsahu je nutná konstrukce dvou, tří a více reproduktorů o rozlišné charakteristice frekvence. Sestavením několika reproduktorů do jedné ozvučnice nám vzniká reproduktorová soustava. O rozdělení a vyrovnanost signálů mezi jednotlivé reproduktory uvnitř soustavy se starají vyhybky. Základní části reproduktoru Závěs membrány slouží k pružnému uchycení ke koši reproduktoru. Nejčastěji je vyroben z gumy nebo polyuretanu. Musí se vyznačovat odpovídající pružností, tepelnou a časovou stálostí. Na materiál membrány se nejčastěji používá polypropylen, a můžeme se setkat i s grafitovým papírem. U výškových reproduktoru se používají hliníkové a titanové 33

membrány, které se vyznačují potřebnou tuhostí a lehkostí. Střed membrány je přichycen k válcovitému nosiči kmitací cívky. Středící membrána je vyráběna z lehkého prodyšného materiálu. Její úloha spočívá v přidržování nosiče kmitací cívky s membránou, v přesné ose okolo magnetu a tím zabraňuje možnému tření o jeho povrch. Jako materiál magnetu se používá ferit, který plní funkci permanentního magnetu. Magnetické pole musí být po celé jeho délce co nejvyrovnanější, v opačném případě by docházelo ke zvukovému zkreslení. Pro odvod tepla je magnet vybaven chladícím středovým otvorem. Další částí je zkratovací prstenec sloužící ke snižování magnetického pole vzniklého vlivem kmitací cívky. A. - závěs membrány B. - membrána C. - středící membrána D. - zkratovací prstenec E. - připojovací terminál F. - magnet G. - chladící otvor magnetu H. - kmitací cívka O brázek č. 29: Části reproduktoru 38 Charakteristiky reproduktorů U reproduktorů rozeznáváme několik parametrů, které nám určují jejich vlastnosti a tím i možnosti jejich využití. Můžeme měřit následující hodnoty: Jmenovitá impedance - je výrobcem udávaná hodnota odporu cívky, kterou zatěžuje reproduktor zesilovač. Hodnoty jsou udávány v ohm 2,4,6,8,16. Charakteristická citlivost - je průměrná velikost akustického tlaku vyvolaná reproduktorem a to při příkonu 1W ve vzdálenosti 1 m od reproduktoru. Hodnoty se udávají v db/w/m. Rezonanční kmitočet - je nejnižší kmitočet, při němž vykazuje impedance reproduktoru maximální hodnotu a je jím dán dolní mezní kmitočet reproduktoru. Hodnoty jsou udávány v Hz. 38 Zdroj: http://eshop.dexon.cz/hifi_domaci_kino.htm 20.2.2009 34

Zatížitelnost reproduktoru je hodnota dlouhodobého příkonu reproduktoru udávaná výrobcem, označená jako RMS nebo AES. Hodnoty jsou udávány dle velikosti reproduktoru v palcích na počet Wattů. Maximální akustický tlak je nejvyšší akustický tlak, který je schopný vyprodukovat reproduktor při maximálním příkonu. Hodnota se udává v db. Ekvivalentní objem je objem vzduchu, který je zapotřebí pro ozvučnici reproduktoru. Hodnota se udává v litrech. Směrová charakteristika reproduktoru - je závislost akustického tlaku před reproduktorem na úhlu, svíraného osou reproduktoru a spojnicí reproduktoru a měřicího mikrofonu nebo posluchače. Kmitočtová charakteristika - je závislost hladiny akustického tlaku v určitém bodě před reproduktorem na kmitočtu při konstantním napětí. Hodnoty se udávají Hz. 39 4.2 Sluchátka Další možností reprodukce zvuku u PC jsou sluchátka využívající stejný výstup zvukové karty jako reproduktory. Jde o malé reproduktory přizpůsobené k nasazení na uši posluchače. Můžeme se setkat s variantami do uší, za uši a náhlavní. Často využívanou variantou jsou zařízení kombinující sluchátka a mikrofon. Princip sluchátkových reproduktorů je shodný s běžnými reproduktory. Zvuk je založen na pohybu membrány vytvářející zvukové vlny, rozkmitané magnetickými poli vytvořenými cívkou a magnetem. Výhodou kvalitních náhlavních sluchátek oproti reprosoustavám je převáženě v eliminaci okolního hluku. Odpadá zde problém se správností prostorového umístění reproduktorů. Charakteristické vlastnosti sluchátek I v tomto případě jde o stejné vlastnosti jako u běžných reproduktorů, je zde však kladen požadavek na specifické nároky, vzhledem k velikosti a vzdálenosti reproduktorů od posluchače. 39 Zdroj: http://eshop.dexon.cz/hifi_domaci_kino.htm 20.1.2009 35

Jmenovitá impedance - výrazně ovlivňuje charakteristiku sluchátek. Zde se doporučuje pro kvalitní poslech impedance od 60 ohmů. Charakteristická citlivost - vyjadřuje poslechovou hlasitost reproduktorů a u sluchátek by měla být kolem 95-100 db. Rezonanční kmitočet - zde jsou nároky kladené na hodnoty slyšitelnosti lidského ucha, tedy 20Hz-20kHz. Kvalitní sluchátka by měla splňovat tento rozsah. Harmonické zkreslení - samozřejmostí je, že jakékoli zkreslení zvuku je pro reprodukci zvuku nežádoucí, proto platí, čím je nižší hodnota zkreslení, tím budou sluchátka kvalitnější. Obrázek č. 30: KOSS PRO/4AAT 40 4.3 Mikrofony Mikrofony převádějí analogový akustický signál na elektrickou energii. Při pořizování záznamu mají mikrofony podstatný vliv na jeho kvalitu. Jedná se o první přeměnu signálu před jeho dalším zpracováním. Princip a funkce mikrofonů Tlak vzniklý akustickým signálem mechanicky rozkmitá citlivou membránu jejíž pohyb je snímán elektromechanickým měničem. V případě kdy je rozkmitána pouze jedna strana membrány, jedná se o tlakový všesměrový mikrofon s kruhovou charakteristikou. Pohyb membrány je přímo závislý na velikosti akustického tlaku. 40 Zdroj: http://www.sluchatka-koss.cz/index.php?akc=rs&id=4 22.2.2009 36

V případě že akustický tlak působí i na zadní stranu membrány, je pohyb membrány závislý na rozdílu tlaku před a za membránou,takové mikrofony se nazývají tlakové. Dělíme je na: Mikrofony prvního řádu výchylka membrány a velikost vstupního napětí je přímo úměrná první derivaci akustického tlaku dle směru šíření. Mikrofony druhého řádu výchylka membrány a velikost vstupního napětí je přímo úměrná druhé derivaci akustického tlaku dle směru šíření. Velikost výstupního signálu, je přímo závislá na velkosti amplitudy vstupního signálu a na jeho vzdálenosti. Pokud je zdroj signálu příliš vzdálený od měřícího mikrofonu, zakřivení amplitudy je téměř rovinné a výstupní signál je nulový. Nejčastější využití tlakových mikrofonů je v nahrávacích studiích. Parametry mikrofonů Představíme si základní charakteristiky určující vlastnosti mikrofonů. Kmitočtová charakteristika závislost výstupního napětí mikrofonu na kmitočtu signálu. Nejčastěji udávaná v rozmezí 16Hz až 16kHz. Směrová charakteristika schopnost citlivosti mikrofonu na svíraném úhlu akustické osy s osou zdroje mikrofonu. Elektrická impedance - udává se pro kmitočet 1kHz a její hodnota je zapotřebí pro optimalizované nastavení impedance zesilovače. Citlivost je frekvenčně závislá a udává poměr vstupního akustického tlaku na výstupní napětí mikrofonu. Udává se v mv/pa. Šum Jde o poměr výstupního napětí při akustickém tlaku 94 db k napětí výstupního šumu. 41 Rozdělení mikrofonů Mikrofony můžeme rozdělit na základě jejich charakteristických vlastností či druhu mechanického systému elektromagnetického měniče. Dále je můžeme rozdělit podle dopadu akustického signálu na membránu mikrofonu, na tlakové a gradientní. 41 Zdroj: http://hellweb.loose.cz/index.php?page=school&subpage=elm&id=21 24.2.2209 37

Tlakové mikrofony jde o dopad akustické vlny na jednu stranu membrány. Zbývající část je uzavřena. Elektrický signál je zde úměrný intenzitě zvukové vlny a mikrofony mají směrovou charakteristiku. Využívány bývají nejčastěji ke studiovým účelům. Gradientní mikrofony zde je akustický signál přiveden na vnější i vnitřní stranu membrány. Výstupní signál je úměrný velikosti přírůstku intenzity a to v závislosti na vzdálenosti mikrofonu od zdroje zvuku. Využití bývá nejčastěji tam, kde potřebujeme eliminovat okolní hluk a předcházet zpětným vazbám. Elektrodynamické mikrofony Vyznačují se masivní konstrukcí. Jejich vlastnosti nabízejí malé zkreslení, nízký šum široké rozpětí kmitočtového pásma. Využívají se dva typy konstrukcí s membránou a příčně zvlněnou hliníkovou fólií (páskový mikrofon). U membránových konstrukcí je kmitací cívka spojena s membránou, která se pohybuje s přímou závislostí na akustickém tlaku v magnetickém poli permanentního magnetu. U páskového typu mikrofonů je použita hliníková fólie ve tvaru pásku a přímo v něm se změnami akustického tlaku indikuje nízkofrekvenční elektrický signál. Elektromagnetické mikrofony Pracují na velmi podobném principu jako elektrodynamické mikrofony. S tím rozdílem, že kmitací cívka spojená s membránou je zde nahrazena pevnou nepohyblivou cívkou. Zde indikuje nízkofrekvenční signál přímo membrána, která mění magnetický tok pevnou cívkou. Díky svým malým rozměrům a příznivé ceně se často využívají převážně k přenosu řeči. Elektrostatické mikrofony Elektrostatické mikrofony se skládají ze dvou od sebe navzájem izolovaných elektrod (princip kondenzátoru). První z nich tvoří pevná elektroda do níž je přiváděno stejnosměrné napětí. Druhou část tvoří membrána tvořena z kovové fólie. Ta je umístěna ve velice malé vzdálenosti od pevné elektrody. Při změně akustického tlaku se rozechvívá membrána a tím i vzdálenost od pevné elektrody, zároveň dochází ke změně kapacity 38

kondenzátoru. Aby se náboj při změně kapacity kondenzátoru nemohl rychle vyrovnat, pak se při zmenšení kapacity musí zvětšit napětí kondenzátoru. Požadavek pomalého vyrovnání náboje při změně kapacity je zajištěn rezistorem, který zvýší vnitřní odpor zdroje polarizačního napětí. Tyto mikrofony se vyznačují malým zkreslením, vyrovnanou frekvenční charakteristikou a malým zkreslením. Jsou využívány pro studiové účely či jako měřící zařízení. Elektretové mikrofony Membrána je zde vodivá a její pohyb, na rozdíl od předchozích typů, vzniká v elektrickém poli, ne v magnetickém. Pomocí izolantů si membrána udržuje stálou elektrickou pozici. Dále obsahují tranzistor, který zesiluje elektrický signál. Mikrofony jsou velmi malé a můžeme se s nimi setkat u PC, notebooků a v mobilních telefonech. Obrázek č 31: Schéma elektronového mikrofonu 42 Piezoelektrické mikrofon Principem je využití piezoelektrického jevu s využitím krystalických látek. Ty při deformaci, či ohybu,vytvářejí elektrický náboj, který je dále snímán elektrodami. Mohou být bez membrány, kde je přenášen zvukový signál přímo na krystaly nebo s membránou, kdy je pohyb membrány přenášen na krystaly. Tento typ mikrofonů se již téměř nevyužívá pro jeho nevěrohodnost reprodukce. 42 Zdroj: http://www.haaf.cz/view.php?cisloclanku=2007060305 25.2.2009 39

Uhlíkové mikrofoy Jedná se o první použitelné mikrofony. Principem jsou dvě elektrody. První je pevná a druhá pohyblivá (součástí membrány), mezi nimi se nachází uhlíkový prach. Se změnou tlaku se mění odpor prášku. Tím způsobuje kolísání napájecího proudu a jeho střídavá složka vytváří modulační proud. Nejčastější využití našli v telefonii. 43 4.4 Komprese zvuku Jde o metodu, pro transport a ukládání dat za pomoci jejich komprese. Ta je v určitém kompresním poměru původních dat ke komprimovaným datům. Kompresi dat provádíme proto, abychom zmenšily nároky datového toku a tím urychlili přenos dat. Díky kompresi se nám snižují nároky na množství kapacity při jejich archivaci. Komprese se skládá ze dvou základních částí. V první částí (encoder) převede audio data do komprimované formy (bitstream). V druhé části (decoder) umožní přehrání komprimovaných souborů. Metoda je využívána hlavě tam, kde jsou omezené možnosti datové propustnosti. Můžeme ji rozdělit do dvou kategorií: Komprese ztrátová dochází zde ke ztrátě části dat a není možná jejich zpětná rekonstrukce. Je použita tehdy, pokud nejsou kladeny vysoké nároky na přesnost přenášených dat ( známé formáty jako Mp3 ). Komprese bezeztrátová nedochází ke ztrátě dat a je zde možnost kompletní zpětné rekonstrukce původního souboru. Není však schopna dosáhnout stejné účinnosti jako ztrátová komprese. Je použita pro přenos souboru, kde není přípustná ztráta jediného datového souboru (textové soubory). 44 PCM (Pulse Code Modulation) Pulsně kódová modulace PCM, využívá proces analogově digitální konverze (A/D). Nejprve převede vstupní spojitý signál na posloupnost hodnot (vzorkováním). Hodnota amplitudy je omezena určitým počtem bitů (8 nebo 16 bitů), proto je nutné v dalším kroku nahradit spojitě se měnící hodnoty redukovaným počtem diskrétních úrovní (kvantizací). 43 Zdroj: http://www.haaf.cz/view.php?cisloclanku=2007060305 26.2.2009 44 Zdroj: Dostupné z :http://www.haaf.cz/view.php?cisloclanku=2007060305 26.2.2009 40

Při kvantizaci vzniká chyba způsobující vysokofrekvenční šum zhoršující kvalitu reprodukovaného signálu. Nejčastější využití nachází PCM v telefonii pro přenos telefonických hovorů. DPCM (Differential Pulse Code Modulation) DPCM je rozdílovou metodou PCM. V typickém průběhu řečového signálu dochází pouze k relativně malým změnám, které je možné efektivně reprezentovat pomocí rozdílů po sobě jdoucích hodnot PCM, místo hodnot samotných. Pro dosažení větší komprese se výpočet změn provádí až po provedení kvantizace. Pro eliminaci kvantizační chyby je použit rozptyl (dithering) nebo rámcování (framing). Rozptyl kvantizační chyba se postupně přidává k hodnotě, která reprezentujte daný vzorek a následně se kvantuje. Rámcování kvantizační chyba se snižuje rozdělením na malý počet kroků, uvnitř jednoho rámce. Diference a vzorkované hodnoty se ukládají do jednotlivých rámců pevné délky. První vzorek rámce se zakóduje přímo a zbylé vzorky se zakódují pomocí diferencí. ADPCM (Adaptive Differential Pulse Code Modulation) Je adaptabilní variantou metody DPCM, využívající nižší počet kvantizátorů (nejčastěji 4). Z nichž je zvolen kvantizátor, nejblíže odpovídající dynamickému rozsahu vzorků jednoho rámce, který se do něj zakóduje. V dalším kroku dochází k zakódování prvního vzorku v plném rozlišení a následně i indexů do kvantizační tabulky zvoleného kvantizátoru. Výsledně dochází ke zlepšení kompresního poměru. MPEG (Motion Picture Experts Group) Jedná se o skupinu mezinárodně uznávaných standardů ISO/IEC (International Standards Organization / International Elektro-Technical Commission) pro kódování informací, nejčastěji používaných pro kompresi zvuk a obrazu. MPEG standardy se skládají z několika částí. Každá z částí se týká určitého aspektu celé specifikace. Normy stanovují profily (definují sadu nástrojů), úrovně (vymezují rozsah příslušné hodnoty vlastností). Využívají omezení frekvenčního rozsahu pásma na slyšitelnost lidského ucha 41

(20 Hz 20 khz) a rozdělení dynamického rozsahu s rozdílem hlasitosti 96 db Standardy se dělí na čtyři skupiny. MPEG-1 je určený pro kompresi audia a videa s datovým tokem od 0.9Mbit/s do 1.5Mbit/s. Jeho neznámější využití je u formátů MP3, DCC (Digital Compact Casete), DBA (Digital Audio Broadcast). MPEG-2 je používán pro kódování datových toků od 1,5 Mbit/s do 15 Mbit/s. Formát je kompatibilní s MPEG-1, obsahuje nové vzorkovací frekvence a umožní kódovaní surround 5.1. Bývá použit k distribuci TV audio a video signálů. MPEG-3 standard původně určený pro HDTV, později sloučen s MPEG-2. MPEG-4 standart určený pro komplexní popis multimediálních objektů. Zahrnuje standardy podporující interakci s internetem např. AAC,VQF. MPEG-I Obsahuje tři vrstvy popisující schémata kódování. Každá skupina obsahuje části popisující kódování audia, videa, synchronizací dat a formátů. První vrstva Layer I obsahuje nejjednodušší schémata komprese a disponuje tak vysokou rychlostí. Definuje 384kbit/s pro CD kvalitu a umožní kompresy 1:4. Druhá vrstva Layer II nabízí kompromis, mezi kompresním poměrem a rychlostí. Disponuje 256-192kbit/s při kompresy 1:6 až 1:8. Třetí vrstva Layer III je určena pro nízké kmitočty a vyznačuje se nejlepším kódování 128-112kbit/s a kompresí 1:12. Jedním z nejrozšířenějších formátů skupiny MPEG je MP3. Zahrnutý ve specifikaci MPEG-1, MPEG-2, využívajícího standardu Layer III. MP3 Umožní kompresi datového toku s výslednou velikostí souboru v poměru 1:12 při zachování kvality srovnatelné s CD (44.1Mhz/16bit). Principem komprese je odstranění redundance a neslyšitelných frekvencí. MP3 využívá metody časového(tempoval masking) a frekvenčního maskování. (Frequency masking) Dochází k odstranění překrývajících tónů o méně intenzivní frekvenci. Principem maskování je snížená schopnost lidského sluchu vnímat zvuk při přítomnosti zvuku dalšího. Frekvenční maskování využívá schopnost odlišit od sebe dva frekvenčně blízké tóny znějící současně. 42

V takovém případě může docházet k potlačení slyšitelnosti nižšího tónu. Schopnost maskování je ovlivněno šířkou pásma o nejnižším kmitočtu 100Hz a nejvyšším až 4 khz. Časové maskování využívá dvou metod potlačení signálu. Premasking, jestliže po hlasitém tónu následuje stejný tón s nižší hlasitostí, nižší tón je potlačen. Postmasking, tišší tón je maskován ještě před zahráním hlasitějšího tónu. Obrázek č 32: Frekvenční maskování 45 Obrázek č: 33: Časové maskování 46 Kódování zvuku MP3 Kódování zvukových dat nejprve prochází přes soustavu filtrů. Dochází k rozdělení zvukového signálu v kmitočtové oblasti do 32 stejně širokých subpásem. Zároveň dochází za pomoci psychoakustického modelu k přesnému určení typu bloku a výpočtu odstupu signálu od maskovacího prahu v každém subpásmu SMR (Signal to Mask Ratio). Signály nacházející se pod maskovacím prahem subpásma nejsou kvantovány a tím dochází k úspoře datového toku. Modul MDCT umožní v každém subpásmu zvolit optimální počet bitů na jeden vzorek a zlepšit tak frekvenční rozlišení (bezztrátový algoritmus). Alokace šumu vzniklého při kvantizaci je prováděna ve dvou iteračních cyklech. V prvním cyklu (Inner loop) se kvantují hodnoty z MDCT a následně se kódují. Pokud je výsledný počet bitů vyšší než zvolený bitrate (datový tok), je zvolen jiný kvantizační krok a proces se opakuje. Bitrate určuje průměrný datový tok, počet bitů potřebných na jednu sekundu zvukových dat. Pro audio signál CD kvality je určený bitrate 1,4 Mbps. Ve druhém cyklu (Outer loop) dochází ke kódování a kontrole pásma vypočítaného psychokustickým modelem. Kontrola zjistí, zda je jeho zkreslení menší, než je povolené. V případě většího zkreslení se pásmo zesílí a proces se opakuje. Tím je šum vzniklí při kvantování maskován a nedochází tak ke slyšitelnému snížení kvality zvuku (enkodér). Pro účinné kódování, bez 45 Zdroj: http://home.zcu.cz/~mtoman/mp3.htm 24.1.2009 46 Zdroj: http://home.zcu.cz/~mtoman/mp3.htm 24.1.2009 43