nutné zachovat schopnost reprodukovat zvukovou vlnu



Podobné dokumenty
OSNOVA. 1. Definice zvuku a popis jeho šíření. 2. Rozdělení zvukových záznamů (komprese) 3. Vlastnosti jednotlivých formátů

Charakteristiky zvuk. záznamů

Multimediální systémy. 08 Zvuk

Moderní multimediální elektronika (U3V)

Zpracování zvuku v prezentacích

Komprese zvuku. Ing. Jan Přichystal, Ph.D. 14. března PEF MZLU v Brně

Základní principy přeměny analogového signálu na digitální

MULTIMEDIÁLNÍ A HYPERMEDIÁLNÍ SYSTÉMY

Komprese dat Obsah. Komprese videa. Radim Farana. Podklady pro výuku. Komprese videa a zvuku. Komprese MPEG. Komprese MP3.

Multimediální formáty

MULTIMEDIÁLNÍ A HYPERMEDIÁLNÍ SYSTÉMY

VIDEO DATOVÉ FORMÁTY, JEJICH SPECIFIKACE A MOŽNOSTI VYUŽITÍ SMOLOVÁ BÁRA

MULTIMEDIÁLNÍ A HYPERMEDIÁLNÍ SYSTÉMY

Práce s obrazovým materiálem CENTRUM MEDIÁLNÍHO VZDĚLÁVÁNÍ. Akreditované středisko dalšího vzdělávání pedagogických pracovníků

Moderní multimediální elektronika (U3V)

24. Audio formáty moderního videa (DTS, Dolby Digital)

Datové formáty videa a jejich využití. Tomáš Kvapil, Filip Le Manažerská informatika Multimédia

DSY-4. Analogové a číslicové modulace. Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti

Karel Mikuláštík Katedra radioelektroniky, ČVUT-FEL Radiokomunikace 2016, Pardubice

Převody datových formátů

DUM č. 15 v sadě. 31. Inf-7 Technické vybavení počítačů

Vlastnosti zvuku. O dřej Pavlas, To áš Karhut

Princip digitalizace vstupních multimediálních dat Klasifikace Zpracování Využití

PCM30U-ROK 2 048/256 kbit/s rozhlasový kodek stručný přehled

9. PRINCIPY VÍCENÁSOBNÉHO VYUŽITÍ PŘENOSOVÝCH CEST

Digitální optický záznamový standard DVD

Digitální optický záznamový standard DVD

Zvukové rozhraní. Základní pojmy

U zvuku (mechanického vlnění) nás zajímají nejvíce dvě veličiny frekvence a intenzita (hlasitost).

Pulzní (diskrétní) modulace

Ceník platný: od

Základní pojmy. Multimédia. Multimédia a interaktivita

Princip digitalizace vstupních multimediálních dat Klasifikace Zpracování Využití

IIS Media Services. David Gešvindr MSP MCT MCITP

Digitální magnetický záznam obrazového signálu

VLASTNOSTI ZVUKU A ZVUKOVÝCH ZÁZNAMŮ

Registrační číslo projektu: CZ.1.07/1.5.00/ Elektronická podpora zkvalitnění výuky CZ.1.07 Vzděláním pro konkurenceschopnost

transmitter Tx - vysílač receiver Rx přijímač (superheterodyn) duplexer umožní použití jedné antény pro Tx i Rx

25. DIGITÁLNÍ TELEVIZNÍ SIGNÁL A KABELOVÁ TELEVIZE

Kódování s proměnnou bitovou rychlostí ve standardu MPEG-1 Audio

Identifikátor materiálu: ICT-1-19

Počítačové sítě. Lekce 5: Základy datových komunikací

Zvuková karta. Zvuk a zvuková zařízení. Vývoj, typy, vlastnosti

DIGITÁLNÍ VIDEO. pokus o poodhalení jeho neskutečné obludnosti (bez jednosměrné jízdenky do blázince)

DNP-F109 ( Kč ) Síťový přehrávač s Ethernetovým a WiFi připojením

Moderní multimediální elektronika (U3V)

íta ové sít baseband narrowband broadband

Počítačová gramotnost II Mgr. Jiří Rozsypal aktualizace

Videosekvence. vznik, úpravy, konverze formátů, zachytávání videa...

Výukový materiál KA č.4 Spolupráce se ZŠ

Zvuková karta. Základní pojmy. Vzorkování zvuku

ednáška a metody digitalizace telefonního signálu Ing. Bc. Ivan Pravda

Digitální audio zde se vysvětluje princip digitalizace zvukového záznamu, způsoby komprese uložení ztrátové a bezztrátové, obvyklé formáty atd.

Datové formáty videa, jejich specifikace a možnost využití. Petr Halama

Osnova. Idea ASK/FSK/PSK ASK Amplitudové... Strana 1 z 16. Celá obrazovka. Konec Základy radiotechniky

Inovace výuky prostřednictvím šablon pro SŠ

Zvuky můžeme také dělit na: ustálené (syčení): periodické; nepravidelné (hluky) neustálené = přechodné (tlesknutí)

Současné formáty pro záznam zvuku

VY_32_INOVACE_E 15 03

Komprese multimédií. Ing. Jan Přichystal, Ph.D. 7. října PEF MZLU v Brně

Zpracování video a zvukových souborů na počítači

Kosinová transformace 36ACS

Registrační číslo projektu: CZ.1.07/1.5.00/ Elektronická podpora zkvalitnění výuky CZ.1.07 Vzděláním pro konkurenceschopnost

Zvuk včetně komprese. Digitálně = lépe! Je to ale pravda? X36PZA Periferní zařízení

Kompresní metody první generace

I. historie a motivace formátu. II. technické informace. III. DVD-Video, DVD-Audio, DVD Data. IV. HD budoucnost Blu-ray, HD DVD

Zásady prezentace CENTRUM MEDIÁLNÍHO VZDĚLÁVÁNÍ. Akreditované středisko dalšího vzdělávání pedagogických pracovníků

čtvrtek, 18. března 2010 Digitální zpracování zvuku a videa 1

, Brno Připravil: Ing. Jaromír Landa. Postprocessing videa

Architektura počítačů. Zvukové karty

Počítačová gramotnost II Mgr. Jiří Rozsypal aktualizace

EFEKTIVNÍ METODY KÓDOVÁNÍ ZVUKOVÝCH SIGNÁLŮ

Moderní multimediální elektronika (U3V)

Doporučení pro pořizování datových souborů při digitalizaci analogových originálů

Registrační číslo projektu: CZ.1.07/1.5.00/ Elektronická podpora zkvalitnění výuky CZ.1.07 Vzděláním pro konkurenceschopnost

Základy a aplikace digitálních. Katedra radioelektroniky (13137), blok B2, místnost 722

1. Přednáška: Obecné Inf. + Signály a jejich reprezentace

Základy informatiky část 10

Počítačová grafika a vizualizace I

Registrační číslo projektu: CZ.1.07/1.5.00/ Elektronická podpora zkvalitnění výuky CZ.1.07 Vzděláním pro konkurenceschopnost

Připojení k rozlehlých sítím

PRÁCE S VIDEEM. Název šablony: III/2-1, Výuka IVT na 2. stupni práce s videem

1. GRAFIKA. grafika vektorová - křivky grafika bitmapová (rastrová, bodová) pixely VLASTNOSTI BITMAPOVÉ GRAFIKY (FOTOGRAFIE)

Modulační metody, datové měniče telefonní modemy


Rádiové rozhraní GSM fáze 1

TESTY K ODBORNÉ PŘIJÍMACÍ ZKOUŠCE MN - KIS

Z V U K 1 ANALOGOVÝ ZÁZNAM ZVUKU

Grafické formáty. Grafika

Videoformáty na internetu Ing. Jakub Vaněk KIT digital Czech a.s. Situation: Q4 09 and 2010 Budget

Video. Co je to video. Vlastnosti videa. Frame rate. Prokládání

ZÁKLADY DATOVÝCH KOMUNIKACÍ

HTT-102 DVB-T HD modulátor

Formáty a dlouhodobé uložení: Identifikace, extrakce a validace

Multimediální systémy. 10 Komprese videa, formáty

Testování UHDTV v DVB-T2

ednáš áška

STŘEDNÍ ŠKOLA, HAVÍŘOV-ŠUMBARK, SÝKOROVA 1/613, příspěvková organizace ZPRACOVÁNÍ ZVUKU A OBRAZU TEORETICKÁ ČÁST. Ing.

MULTIMEDIÁLNÍ A HYPERMEDIÁLNÍ SYSTÉMY. 5) Uložení a komprese zvuku

AV Receiver RX-V kanálový AV receiver kompatibilní s funkcí Bluetooth, s plně diskrétní konfigurací a s převodníky DAC vysoké kvality.

Transkript:

KÓDOVÁNÍ ZVUKU

Digitalizace zvuku Digitalizace nutné zachovat schopnost reprodukovat zvukovou vlnu Bitová hloubka (bit depth) ovlivňuje dynamický rozsah a šum, 16 bitů dává 65 536 stupňů hlasitosti neovlivňuje frekvenční rozsah (dán vzorkováním) Dynamický rozsah rozdíl mezi nejtišším a nejhlasitějším zvukem rozlišit frekvence tónů se u každého člověka liší a je frekvenčně závislá populární hudba 6 10 db, obecně 1 15 db Vzorkovací frekvence ucho slyší asi od 20 Hz do 20 khz, vhodný vzorkovací kmitočet okolo 40kHz Přenosová rychlost (bit rate) jaký objem informace se přenese za jednotku času Bit rate = (bit depth) (sampling rate) (number of channels) př. CD: 1 411 200 = 16 44 100 2 [b/s]

Digitalizace zvuku Dynamický rozsah a velikost šumu odstup signálu od šumu Signal to Noise Ratio (SNR) výkonový poměr signálu a kvantizačního šumu D = 10 log(s 2 /š 2 ) [db] kvantizační chyba rovna šířce kvantizační úrovně odstup závisí na velikosti užitečného signálu maximální počet kvantizačních úrovní daného převodníku N D = 20 log(2 N ) 6,02 N [db] s každým přidáním bitu se zvětšuje hodnota o 6 db Příklady maximálního dynamického rozsahu 16 bitové kvantování u hudby na CD 16 6,02 = 96 db 24 bitové digital audio 24 6,02 = 144 db některé způsoby kódování vyjadřují jinak

Frekvenční maskování Snížená schopnost vnímání zvuku z důvodu přítomnosti jiného zvuku stav, kdy zvuk o určité frekvenci není slyšitelný kvůli intenzivnějšímu zvuku o jiné frekvenci Frekvence pod maskovací úrovní jsou maskovány a mohou být odstraněny http://home.zcu.cz/~mtoman/zvuk.htm

Časové maskování Lidské ucho bezprostředně před silným zvukem a po něm nevnímá slabší tóny po silném zvuku postmasking před zvukem premasking http://home.zcu.cz/~mtoman/zvuk.htm

Psychoakustický model Rozdělení zvukového signálu v kmitočtové oblasti do několika subpásem (32) využití psychoakustického maskovacího jevu lidského sluchu v každém subpásmu Silnější zvukové signály potlačují vnímání slabších spektrálních složek v dané oblasti kmitočtů není nutno kódovat V každém subpásmu lze zvolit optimální bitovou hloubku, při které je kvantovací šum ještě maskován a nedochází ke slyšitelnému snížení kvality http://www.digitalnitelevize.cz/magazin/dvb-t/dvb-t-technologie/technicke_minimum_mpeg2.html

Modifikovaná DCT a alokace šumu Modul MDCT dále dělí pásma a výrazně zlepší frekvenční rozlišení i bezztrátový algoritmus Modul alokace šumu zjišťuje množství kvantizačního šumu dva iterační cykly inner a outer loop Inner loop kvantuje spektrální hodnoty které byly vypočteny v MDCT zakóduje hodnoty pomocí Huffmanova kódování je-li výsledný počet bitů větší než předpokládaná bitrate zvolí se nový kvantovací krok a celý proces se provede znovu Outer loop zkontroluje, zda každé pásmo má menší zkreslení než povolené pokud je zkreslení větší, potom je pásmo zesíleno a je opakován inner loop

úroveň vstupního signálu (db) Úpravy dynamického rozsahu Komprese dynamiky zvukového signálu zmenšení dynamického rozsahu signálu redukce zisku, zvýšení celkové hlasitosti zvedne se úroveň nižších signálů Kompresor řízený nelineární zesilovač zmenšuje dynamický rozsah signálu slabé signály zesiluje více a silné méně Limitér speciální druh kompresoru omezuje pouze nejsilnější dynamické špičky Křivka řízení dynamiky možné provádět kompresní a limitační nastavení omezovat nežádoucí zvuky (pod určitým prahem hlasitosti) úroveň výstupního signálu (db) úroveň výstupního signálu (db) úroveň vstupního signálu (db) redukce zisku

Úpravy dynamického rozsahu Parametry kompresorů dynamiky THRESHOLD nastavený práh RATIO nastavený poměr snížení úrovně signálu ATTACK rychlost (čas) reakce na překročení prahu RELEASE rychlost (čas) uvolnění komprese po poklesu vstupního signálu pod práh INPUT, OUTPUT vstupní a výstupní úrovně KNEE způsob řízení komprese úroveň výstupního signálu (db) úroveň vstupního signálu (db)

Úpravy dynamického rozsahu

Úpravy dynamického rozsahu původní nahrávka clipping (ořez) distortion (deformace) limiting (omezovač)

Zvýšení účinnosti kódování Kompanze nejčastěji logaritmická; předchází uniformní kvantizaci více zesílí malé hodnoty okamžitých výchylek signálu velké hodnoty výchylek signálu jsou zesíleny jen nepatrně Expanze při obnovování signálu (expanzér za dekódérem) obnoví původní rozsah signálu, vrátí vzorkům správný poměr velikostí Kompresní charakteristika převodní amplitudová charakteristika kompandéru Expanzní charakteristika převodní amplitudová charakteristika expandéru má inverzní průběh ke kompresní charakteristice Používané kompresní charakteristiky -law (sev.amerika, Japonsko) A-law (Evropa)

Pulzně kódová modulace (PCM) Modulační metoda převodu analogového zvukového signálu na signál digitální PCM (Pulse-code modulation) pravidelné odečítání hodnoty signálu pomocí A/D převodníku její zaznamenání v binární podobě

Pulzně kódová modulace Určující parametry vzorkovací frekvence 8 khz u dig. tel. linek ISDN 44,1 khz u zvukového CD vyšší hodnoty u profesionálních zařízení kvantování jemnost rozlišení hodnot 8 nebo 16 bitů 256 nebo 65 536 hodnot kvantizační šum úroveň s rostoucím rozlišením klesá

Pulzně kódová modulace PCM v telekomunikacích vzorkovací frekvence 8 khz rozlišení 8 bitů dává datový tok 64 kbit/s základní kapacita hovorového kanálu v digitální síti ISDN někdy označováno jako DS0. Kódování hovorového kanálu DS0 logaritmická komprese 12- či 13-bitový signál převáděn na osmibitový signál severní Amerika a Japonsko vyšší komprese v telefonních sítích pouze 7 bitů pro přenos hlasu osmý bit na signalizaci (typ CAS) Evropa pro přenos hlasu všech 8 bitů signalizace je přenášena samostatným kanálem. (Například pomocí signalizace č.7, či jinou CCS signalizací.)

Pulzně šířková modulace (PWM) PWM diskrétní modulace pro přenos analogového signálu pomocí 2 hodnot Střída poměr časů, ve kterých je signál v jednotlivých úrovních Nosný signál konstantní amplituda a frekvence (vyšší než modulační) pilový nebo trojúhelníkový průběh Srovnávání okamžité hodnoty modulačního a nosného signálu pokud menší, PWM 1, jinak 0

Direct Stream Digital (DSD) Direct Stream Digital (DSD) technologie masteringu Sony, Philips typ pulzně hustotní modulace (PDM) vyjadřuje informaci počtem pulsů v nějakém časovém intervalu, přičemž na poloze pulsů v daném intervalu nezáleží 0101101111111111111101101010010000000000000100010011011101111 111111111011010100100000000000000100101 jedničky (modré) nuly (bílé) střídání jedniček a nul (1111) odpovídají maximu (0000) minimu (1010) nule

Audio CD Audio CD (Compact Disc Digital Audio, CDDA) použití PCM dva kanály vzorkovací frekvence 44,1 khz a rozlišení 16 bitů frekvenční rozpětí do 20 khz přenosová rychlost 44 100 16 2 = 1 411 200 b/s jedna minuta záznamu zabere 44 100 16 2 60 : 8 = 10 584 000 B/min

Super Audio Compact Disc Super Audio Compact Disc (SACD) až 6 kanálů (5.1), 1999 Direct Stream Digital (DSD) technologie masteringu 1 bit, vzorkovací frekvence 2,8224 MHz frekvenční rozpětí do 20 khz vícevrstvé kvůli zpětné kompatibilitě jedna vrstva klasické CD další vrstva High Density DSD CD SACD Format 16 bit PCM 1 bit DSD Sampling freq. 44.1 khz 2822.4 khz Dynamic range 96 db 120 db Frequency range 20 Hz 20 khz 20 Hz 50 khz Disc capacity 700 MB 7.95 GB Stereo Yes Yes Discrete surround No Yes

DVD-Audio DVD-Audio kapacita 74 min, plná surround kvalita, 2000 vzorkovací frekvence 5.1 až 96 khz stereo až 192 khz až 24 bitová hloubka 16-, 20- or 24-bit depth 44.1 khz 48 khz 88.2 khz 96 khz 176.4 khz 192 khz Mono (1.0) Yes Yes Yes Yes Yes Yes Stereo (2.0) Yes Yes Yes Yes Yes Yes Stereo (2.1) Yes Yes Yes Yes No No Stereo + mono surround (3.0 or 3.1) Yes Yes Yes Yes No No Quad (4.0 or 4.1) Yes Yes Yes Yes No No 3-stereo (3.0 or 3.1) Yes Yes Yes Yes No No 3-stereo + mono surround (4.0 or 4.1) Yes Yes Yes Yes No No Full surround (5.0 or 5.1) Yes Yes Yes Yes No No

Datový tok Velikost datového objemu CBR - constant bitrate datový tok je konstantní za každých okolností (typický případ u PCM) VBR - variable bitrate datový tok se mění a není přesně definovaný ABR - average bitrate Vzorkovací frekvence Bitová hloubka Počet kanálů Velikost za minutu Velikost za hodinu [Hz] b [MB] 44 100 16 2 10 605 MB 48 000 16 2 11 659 MB 96 000 16 2 22 1,29 GB 192 000 16 2 44 2,57 GB 48 000 16 5.I 33 1,93 GB 48 000 16 7.I 44 2.57 GB průměrný datový tok v určitém časovém okně je konstantní v průběhu okna se ale může měnit

Audioformáty Nekomprimované PCM, WAV Bezztrátové FLAC (Free Lossless Audio Codec) Ztrátové DTS (Digital Theater System) AC3 Dolby Digital (DVD) MP3 WMA AAC (Advanced Audio Coding)

Nekomprimované audioformáty WAV AIFF přípona.wav (Windows) většinou nekomprimovaný zvuk PCM stejně jako CD snadný převod velikost WAV souboru omezena na 4 GB odpovídá asi 6.6 hodinám záznamu v CD kvalitě možnost komprimace součást formátu RIFF (používá jeho strukturu) WAV (Windows audio) AVI (Windows audiovisual) RMI (Windows "RIFF MIDIfile") CDR (CorelDRAW vector graphics file) ANI (Animated Windows cursors) standardní audioformát Apple, obdoba wav pro Mac

Bezztrátové audioformáty RAW AU podpora komprimace libovolným kodekem, nejčastěji PCM audio zřídka používán standardní formát audia, Sun Microsystems PCM nebo kodeky μ-law, a-μlaw nebo G729 užívaný Sun, Unix a Java FLAC (Free Lossless Audio Codec) bezztrátový kodek, podobný jako zip; špatný kompresní poměr vhodný k archivaci PCM souborů s důrazem na kvalitu MPEG-4 ALS (Audio Lossless Coding ) Monkey s Audio o něco lepší než FLAC, freeware,.ape, metadata.ap1 Dolby TrueHD a DTS-HD Master Audio

Audioformáty Dolby Digital (AC-3) digitální ztrátová komprese zvuku, 1991 standard pro filmy v kinech, digitální televizi a DVD možná součást videosouborů AVI, OGM, nebo MKV maximální datový tok 640 kb/s DVD video max. 448 kbit/s, nejčastěji: 192 nebo 224 kb/s pro konfiguraci 2.0 a 2.0 Surround 384 nebo 448 kb/s pro konfigurace 5.0 a 5.1 448 kb/s pro konfigurace 5.1 EX digitální televizní vysílání max. 448 kb/s (ATSC 384 kb/s) Digital Theater Systém (DTS) digitální formát prostorového ozvučení se ztrátovou kompresí především pro ozvučení filmů v kinech a DVD Video maximální datový tok 1536 kb/s DVD 768 kb/s

Audioformáty MP2 MP3 MPEG-1 Layer-2, někdy nesprávně Musicam standard pro vysílání DAB (Digital Audio Broadcasting) srovnatelný se špičkovými kodeky jako Dolby Digital AC-3 MPEG-1 Layer-3 licencovaný nejpopulárnější formát pro stahování a ukládání hudby komprimováno na zhruba desetinu velikosti PCM při zachování dobré kvality u hlasu horší poměr zkráceny pauzy snaha odstranit redundanci zvukového signálu na základě psychoakustického modelu ze vstupního signálu se odeberou informace, jež člověk neslyší, nebo si je neuvědomuje využívá se principů časového a frekvenčního maskování zahrnuje 3 vrstvy, jež se liší kvalitou a obtížností implementace

Audioformáty AAC (Advanced Audio Coding) pův. MPEG-2 Part 7, MPEG-4 Part 3; známý i jako MPEG-4 AAC špičkový, nástupce MP3, lepší zvuk pří stejném bitrate optimální hifi kvalita při 256 kb/s, nejčastěji 128 kb/s založen na modifikované diskrétní kosinové transformaci použití psychoakustického modelu vyvinut pův. Apple (itunes) bez licence, licence nutná pouze pro vývoj AAC kodeků WMA (Windows Media Audio) Microsoft, pův. jako náhrada MP3 licencovaný podpora Digital Rights Management (DRM) do verze 9 nezajímavý, dnes špičkový téměř výhradně kontejner ASF (.asf,.wma)

Audioformáty OGG Vorbis součást Ogg open source kontejneru podporujícího množství kodeků hlavní zvuková data ve střední až vysoké úrovni VBR ~16 500 kbit/s/kanál kvalitní komprese podobá MP3 méně rozšířen (podporuje i Matroska) MPC, Musepack pův. MPEGplus, MPEG+ or MP+ open source ztrátový audiokodek, vyvinut na základě MP2 optimalizován pro transparentní kompresi sterea při bitratech 160 180 kbt/s spolu s Ogg Vorbis nejvhodnější vysoce kvalitní ztrátová komprese ještě méně používán

Audioformáty pro záznam řeči GSM kodeky DCT VOX formát pro telefonickou kvalitu, v Evropě dobrý kompromis mezi velikostí a kvalitou kodekem GSM možno kódovat i soubory wav variabilní formát určený k záznamu řeči (diktafony) možnost kódování přenos řeči při nízké vzorkovací frekvenci nejčastěji používá kodek Dialogic ADPCM (Adaptive Differential PCM) diferenční (delta) hodnoty kóduje jako rozdíl oproti předpovězené adaptivní rozdílný kvantizační krok komprimuje do 4 bitů neobsahuje informace o vzorkovací frekvenci a počtu kanálů musí být specifikováno předem Speex svobodný zvukový kodek ke kompresi řeči, součást projektu ogg hlasová data v nízkém bitratu (~8, 16, 32 kb/s/kanál)