Kódování s proměnnou bitovou rychlostí ve standardu MPEG-1 Audio

Podobné dokumenty
Moderní multimediální elektronika (U3V)

Katedra radioelektroniky K13137, FEL ČVUT Praha. zakódování dané informace. Tento trend postihl i oblast záznamu a přenosu širokopásmových

PCM30U-ROK 2 048/256 kbit/s rozhlasový kodek stručný přehled

Komprese dat Obsah. Komprese videa. Radim Farana. Podklady pro výuku. Komprese videa a zvuku. Komprese MPEG. Komprese MP3.

Karel Mikuláštík Katedra radioelektroniky, ČVUT-FEL Radiokomunikace 2016, Pardubice

Digitální magnetický záznam obrazového signálu

OSNOVA. 1. Definice zvuku a popis jeho šíření. 2. Rozdělení zvukových záznamů (komprese) 3. Vlastnosti jednotlivých formátů

25. DIGITÁLNÍ TELEVIZNÍ SIGNÁL A KABELOVÁ TELEVIZE

Základní principy přeměny analogového signálu na digitální

Quantization of acoustic low level signals. David Bursík, Miroslav Lukeš

Charakteristiky zvuk. záznamů

Kompresní metody první generace

3.cvičen. ení. Ing. Bc. Ivan Pravda

Práce s obrazovým materiálem CENTRUM MEDIÁLNÍHO VZDĚLÁVÁNÍ. Akreditované středisko dalšího vzdělávání pedagogických pracovníků

DUM č. 15 v sadě. 31. Inf-7 Technické vybavení počítačů

Identifikátor materiálu: ICT-1-19

nutné zachovat schopnost reprodukovat zvukovou vlnu

Zpracování zvuku v prezentacích

Multimediální systémy. 08 Zvuk

Princip digitalizace vstupních multimediálních dat Klasifikace Zpracování Využití

EFEKTIVNÍ METODY KÓDOVÁNÍ ZVUKOVÝCH SIGNÁLŮ

MĚŘENÍ A ANALÝZA ELEKTROAKUSTICKÝCH SOUSTAV NA MODELECH. Petr Kopecký ČVUT, Fakulta elektrotechnická, Katedra Radioelektroniky

Zvuková karta. Zvuk a zvuková zařízení. Vývoj, typy, vlastnosti


CW01 - Teorie měření a regulace

Direct Digital Synthesis (DDS)

1. Přednáška: Obecné Inf. + Signály a jejich reprezentace

DIGITÁLNÍ VIDEO. pokus o poodhalení jeho neskutečné obludnosti (bez jednosměrné jízdenky do blázince)

Komprese zvuku. Ing. Jan Přichystal, Ph.D. 14. března PEF MZLU v Brně

24. Audio formáty moderního videa (DTS, Dolby Digital)

Multimediální systémy

Měření závislosti přenosové rychlosti na vložném útlumu

Kvalita zvuku a obrazu v elektronických komunikacích aneb Ještě chceme HiFi?

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ PERCEPČNÍ KÓDOVÁNÍ ZVUKOVÝCH SIGNÁLŮ PERCEPTUAL AUDIO CODING

Zvukové rozhraní. Základní pojmy

ADA Semestrální práce. Harmonické modelování signálů

Zvuk včetně komprese. Digitálně = lépe! Je to ale pravda? X36PZA Periferní zařízení

Porovnání kodeků standardu MPEG 4

Optické paměti. CD-ROM Technology CD-ROM je obdobou technologie používané v technice CD.

Modulační parametry. Obr.1

Multimediální systémy

Návrh frekvenčního filtru

ZÁKLADY DATOVÝCH KOMUNIKACÍ

VY_32_INOVACE_E 15 03

Videosekvence. vznik, úpravy, konverze formátů, zachytávání videa...

Počítačové sítě. Lekce 5: Základy datových komunikací

ZÁKLADY DATOVÝCH KOMUNIKACÍ

PŘÍLOHA č. 1 TECHNICKÁ PŘÍLOHA

Princip digitalizace vstupních multimediálních dat Klasifikace Zpracování Využití

MATLAB. F. Rund, A. Novák Katedra radioelektroniky, FEL ČVUT v Praze. Abstrakt

Digitální optický záznamový standard DVD

Digitální optický záznamový standard DVD

MULTIMEDIÁLNÍ A HYPERMEDIÁLNÍ SYSTÉMY

Techniky sériové komunikace > Synchronní přenos

Grafika na počítači. Bc. Veronika Tomsová

Škola: Gymnázium, Brno, Slovanské náměstí 7 III/2 Inovace a zkvalitnění výuky prostřednictvím ICT Název projektu: Inovace výuky na GSN

Akustika. 3.1 Teorie - spektrum

Analýza chování algoritmu MSAF při zpracování řeči v bojových prostředcích

ČSN ISO/IEC OPRAVA 1

NOVÉ METODY HODNOCENÍ OBRAZOVÉ KVALITY

Signál v čase a jeho spektrum

Snímání biologických signálů. A6M31LET Lékařská technika Zdeněk Horčík Katedra teorie obvodů

5. Umělé neuronové sítě. Neuronové sítě

Kosinová transformace 36ACS

Videoformáty na internetu Ing. Jakub Vaněk KIT digital Czech a.s. Situation: Q4 09 and 2010 Budget

I. Současná analogová technika

Inovace a zkvalitnění výuky směřující k rozvoji odborných kompetencí žáků středních škol

Video. Co je to video. Vlastnosti videa. Frame rate. Prokládání

Konverze grafických rastrových formátů

MULTIMEDIÁLNÍ A HYPERMEDIÁLNÍ SYSTÉMY

Převody datových formátů

Základy rádiové digitální komunikace. Doc. Dr. Ing. Pavel Kovář Katedra radioelektroniky K13137

Kompresní algoritmy grafiky. Jan Janoušek F11125

Klasifikace hudebních stylů

KOMPRESE OBRAZŮ. Václav Hlaváč, Jan Kybic. Fakulta elektrotechnická ČVUT v Praze katedra kybernetiky, Centrum strojového vnímání.

Jan Kaiser ČVUT, Fakulta elektrotechnická, katedra Radioelektroniky Technická 2, Praha 6

BPC2E_C09 Model komunikačního systému v Matlabu

Zásady prezentace CENTRUM MEDIÁLNÍHO VZDĚLÁVÁNÍ. Akreditované středisko dalšího vzdělávání pedagogických pracovníků

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ FAKULTA ELEKTROTECHNIKY A KOMUNIKAČNÍCH TECHNOLOGIÍ ÚSTAV RADIOELEKTRONIKY. OPTICKÝ SPOJ LR-830/1550 Technický popis

Měření dat Filtrace dat, Kalmanův filtr

VY_32_INOVACE_ENI_2.MA_05_Modulace a Modulátory

Harmonizace metod vyhodnocení naměřených dat při zkratových zkouškách

Moderní multimediální elektronika (U3V)

ZÁPADOČESKÁ UNIVERZITA V PLZNI

Zvuková karta. Základní pojmy. Vzorkování zvuku

Abychom se vyhnuli užití diferenčních sumátorů, je vhodné soustavu rovnic(5.77) upravit následujícím způsobem

do magisterské etapy programu ELEKTRONIKA A KOMUNIKACE

Digitální audio zde se vysvětluje princip digitalizace zvukového záznamu, způsoby komprese uložení ztrátové a bezztrátové, obvyklé formáty atd.

Systémy digitálního vodotisku. Digital Watermarking Systems

ednáška a metody digitalizace telefonního signálu Ing. Bc. Ivan Pravda

KOMPRESE OBRAZŮ. Václav Hlaváč. Fakulta elektrotechnická ČVUT v Praze katedra kybernetiky, Centrum strojového vnímání. hlavac@fel.cvut.

37MK Mobilní komunikace. Video v mobilních sítích

Zvýrazňování řeči pomocí vícekanálového zpracování

Téma cvičení Firma. Mikroekonomie. Produkční analýza. V krátkém období. V dlouhém období. Produkční funkce. Rozlišení produkční funkce.

POPIS STANDARDU CEN TC278/WG4. Oblast: TTI. Zkrácený název: Zprávy přes CN 3. Norma číslo:

ZÁKLADY AUTOMATICKÉHO ŘÍZENÍ

Konfigurace sítě SDH propojení a ochrany

Numerické řešení proudění stupněm experimentální vzduchové turbíny a budících sil na lopatky

SYSTÉM SCREENS SYSTEM SCREENS

Číslicové filtry. Honza Černocký, ÚPGM

Transkript:

Kódování s proměnnou bitovou rychlostí ve standardu MPEG-1 Audio Variable bit-rate coding in MPEG-1 Audio standard Antonín Majíř * Abstract The variable bit rate coding (VBR) means that the bit rate is not constant at the output of a coder like in MPEG-1 Audio standard but it alters according to input information content of the compressed signal and maximum allowed distortion. This paper deals with the VBR algorithm proposal and with possibility of implementation in MPEG-1 Audio standard, especially in layer 1. Úvod Kódování s proměnnou bitovou rychlostí znamená, že výstupní bitový tok kodéru nemá na svém výstupu konstantní bitovou rychlost, jako je to například běžné u standardu MPEG-1 [1], ale výsledná bitová rychlost se mění podle vlastností vstupního časového signálu. Čím více informace obsahuje vstupní signál, tím větší je i výstupní bitová rychlost a naopak. Výhodou takovéhoto uspořádání je, že můžeme dosáhnout většího kompresního poměru, než u kodéru s pevnou bitovou rychlostí. Jeho výstupní bitová rychlost totiž musí být nastavena podle maximální možné míry informace ve vstupním signálu, pokud nechceme, aby docházelo k vnímatelnému zkreslení. V praxi se výstupní bitová rychlost takového kodéru ovšem často nastavuje na poněkud nižší hodnotu, neboť se vychází z toho, že vstupní signál dosahuje maximálního informačního toku pouze po krátkou dobu a vzniklé zkreslení nebude působit příliš rušivě. Podmínkou použití VBR (variable bit rate - proměnná bitová rychlost) kodéru je přenosová cesta umožňující přenos proměnnou bitovou rychlostí, což moderní sítě založené např. na ATM splňují. Rovněž v případě uchovávání informací na různých záznamových médiích (CD, DVD) je proměnná bitová rychlost obvykle podporována. * Ing. Antonín Majíř, Katedra telekomunikační techniky, ČVUT FEL Praha, Technická, 160 00 Praha 6 tel.: 0/7117 1381 fax.: 0/7117 1911 E-mail: majir@feld.cvut.cz

Možnost implementace ve standardu MPEG-1 Ačkoliv standard MPEG-1 umožňuje volbu libovolná bitová rychlost, nemusí být tento formát dekodérem podporován a navíc je požadováno aby tato rychlost byla konstantní. Dekodér rovněž nemusí podporovat bitové rychlosti vyšší než 448, 384, 30 kbit/s ve vrstvách 1, a 3. Proměnná bitová rychlost není ve vrstvě 1 a podporována vůbec a vrstva 3 by měla umožnit změnu bitové rychlosti přepínáním bitové rychlosti jednotlivých rámců [1][]. Protože je vrstva 3 realizačně příliš složitá, rozhodl jsem se pokusit se implementovat kódování s proměnnou bitovou rychlostí ve vrstvě 1a to pouze pro monofonní signál. Vzhledem k obdobnému postupu komprese u všech tří vrstev mohou být poznatky získané studiem vlastností takového kodéru později aplikovány i na ostatní vrstvy standardu MPEG-1 a případně i do jiných kompresních algoritmů. Nejdůležitější pro práci VBR kodéru je nalezení algoritmu, jež bude nastavovat počet kvantizačních úrovní v jednotlivých subpásmech a tím i výstupní bitovou rychlost podle množství informace obsažené ve vstupních časových vzorcích. Podobný algoritmus je pravděpodobně popsán v [3]. Algoritmy bohužel nebylo možno z důvodu nedosažitelnosti této literatury porovnat. V původní algoritmu MPEG [1] je v iterační smyčce zvětšováním počtu bitů přidělených subpásmu, maximalizována hodnota MNR (odstup maskování od šumu mask to noise ratio) tak, aby bylo dosaženo požadované výstupní rychlosti, přičemž řídícím parametrem je výstupní bitová rychlost a není uvažováno k jakému zkreslení signálu dojde. Je potom na uživateli, aby zvolil přenosovou rychlost dostatečnou k tomu aby zkreslení nebylo lidským sluchem postřehnutelné. Formáty výstupního bitového toku Mnou navržený algoritmus naopak vychází z požadovaného zkreslení a tomu přizpůsobuje výstupní bitovou rychlost. Vzhledem k tomu že proměnná bitová rychlost nemusí být dekodéry podporována, byly navrženy 3 možné způsoby tvorby rámce, které nabízejí různý stupeň využití výhody VBR při různém stupni slučitelnosti s normou MPEG-1. A) je tvořen vždy jen z takového množství bitů, které je potřebné k přenesení požadované informace. Jedná se o rámce v módu libovolné bitové rychlosti, která se

mění. V principu je pak dekódování možné na základě synchronizačních slov a známé délky rámce, kterou je možno určit ze záhlaví rámce a počtu bitů přiřazených jednotlivým subpásmům. Průběh bitové rychlosti pak odpovídá podle obsahu zpracovávaného souboru např. obr. 1. Ačkoliv má toto řešení výhodu v nejlepším využití možností VBR, obvykle používané dekodéry nejsou schopny takovýto bitový tok dekódovat. Toto řešení bylo proto vyhodnoceno v současné fázi zkoumání dané problematiky jako nevyhovující. B) Ze vstupního signálu je určen potřebný počet bitů na jeho přenesení a bitová rychlost pro daný rámec je pak nastavena na stejnou nebo nejbližší vyšší odpovídající standardu MPEG-1. Průběh bitové rychlosti poté odpovídá podle obsahu zpracovávaného souboru např. obr.. Alokace počtu bitu v rámci je pak provedena standardním postupem pomocí iterační smyčky. Jedná se tedy o VBR kodér s proměnnou rychlostí s přepínáním rychlosti rámců. Takovýto bitový tok lze běžnými dekodéry obvykle bez problémů zpracovat. Určitou nevýhodou takovéhoto způsobu implementace VBR je že v rámci dovolených rychlostí dochází k zaokrouhlování k nejbližší vyšší hodnotě, což se nepříznivě odráží na kompresním poměru. C) Postup je zpočátku obdobný jako v případě B, tj. ze vstupního signálu je určen potřebný počet bitů na jeho přenesení a bitová rychlost pro daný rámec je pak nastavena na stejnou nebo nejbližší vyšší odpovídající standardu MPEG-1. V rámci je však alokován jen potřebný počet bitů vyplývající z množství informace ve vstupním signálu a zbytek do normalizované délky rámce je doplněn nulami. Toto na první pohled ne zcela výhodné řešení přináší ale několik předností: - velká výpočetní rychlost určení přidělení počtu bitů jednotlivým subpásmům bity jsou subpásmu přiděleny v jednom kroku a není třeba iterační smyčky, tento postup je rychlejší než řešení popisované v [4] - místo nul může být do bitového tuku přidána libovolná uživatelem volená informace - velice často je při přenosu např. modemem používána další dodatečná bezeztrátová komprese, která takto vložené nuly při vlastním přenosu prakticky vyloučí a výsledná bitová rychlost pak v podstatě odpovídá případu ad. A, což je patrné z tabulky 1, kde je pro možnost porovnání uveden ještě kompresní koeficient P k, který představuje kompresní poměr, jestliže byl výsledný bitový

tok dále komprimován bezeztrátovou metodou (zde je požit program Winzip v. 6.3) - na tomto případu lze nejlépe studovat (odhlédneme-li od A) vlastnosti VBR kodérů, protože do velikosti výsledného bitového toku nezasahuje další (iterační) algoritmus Algoritmus určující počet bitů Při určení množství informace obsažené ve vstupním signálu se vychází z údajů, které poskytuje psychoakustický model. Množství informace je bráno s ohledem na posluchače, tj. je uvažováno pouze množství informace, které je posluchač schopen přijmout. Při daném kompresním algoritmu (MPEG-1) dochází k přenosu optimálního počtu bitů právě tehdy, jestli že posluchač již neslyší kvantizační šum, který představuje chybu, které se dopouštíme, když snižujeme množství informace, kterou budeme přenášet. To nastává tehdy, jestliže MNR=0, tj. jestliže je kvantizační šum právě maskován přenášeným signálem. V tomto směru však použitý psychoakustický model není zcela přesný, neboť nahrazuje spojitou maskovací křivku diskrétním počtem hodnot. Vylepšený model lze nalézt v [5]. Psychoakustický model zároveň zajišťuje, že informace, kterou ze vstupního toku odebereme, nebude na konci zpracování, tj. po dekódování chybět, neboť tento úbytek nebude posluchačem postřehnutelný. Vyjdeme-li tedy z původního algoritmu MPEG tak velikost přípustného kvantizačního šumu můžeme určit jako: SNRp = SMR + MNR (1) kde: SNR je požadovaná velikost odstupu signál šum (signal to noise ratio) SMR odstup signálu od maskování (signal to mask ratio) Hodnoty SNRp jsou reálná čísla. Velikost SNR je závislá na počtu přidělených bitů (danému subpásmu) a nabývají pouze několika konkrétních hodnot, které jsou uvedeny v normě [1]. Aby nebyl slyšet kvantizační šum, je nutné aby: SNR SNRp () kde: SNR je skutečná velikost odstupu signál šum (signal to noise ratio)

Bylo by rovněž možné navrhnout kodér, který by prováděl přidělení necelého počtu bitů na vzorek v kvantizéru, jehož počet kvantizačních úrovní je celé kladné číslo a tomu odpovídá i odstup signál šum. Tím by se zmenšil odstup mezi sousedními hodnotami SMR a zvětšil možný kompresní poměr. To by ale vyžadovalo složitější kódování a dekódování, nebylo by již možné dodržet slučitelnost se standardem MPEG- 1 a vývoj zcela nového standardu značně přesahuje možný rozsah této práce. Na podobném principu pracují např. kodéry využívající vektorovou kvantizaci (VQ) [6]. Protože psychoakustický model není dokonalý a je navíc navržen pro statisticky průměrného posluchače, je možno hodnotu MNR měnit a tak nastavovat různý odstup maskování od šumu. To se pak projeví na velikosti zkreslení - kvalitě výsledného přenosu a výstupní bitové rychlosti. Při poslechových testech pak lze určit hodnotu MNR tak, aby kvantizační šum nebyl skutečně slyšet. Dosažené výsledky Vlastnosti navržených VBR kodérů jsou patrny z tab. 1 a obr. 1. až 6. Pro zjišťování velikosti kompresního poměru byly zvoleny dva zvukové soubory, které jsou záznamem jednokanálového zvuku při vzorkovací frekvenci f v =44.1 khz s rozlišením 16 bitů na vzorek ve formátu WAV. M (Madonna-pop), který má velký obsah vyšších spektrálních složek tvořených převážně elektronickou cestou a S (klavír), který je záznamem hry jediného nástroje s přirozeným spektrem. To se na první pohled projevuje vyššími dosahovanými kompresními poměry pro soubor S. Pro kodér s výstupním bitovým tokem C a MNR=0 db je kompresní poměr pro S 1.67 krát vyšší než pro M. To mimo jiné ukazuje na správnou funkci VBR kodéru neboť lze předpokládat, že informace obsažená v ukázce s jedním nástrojem je menší než u skupiny nástrojů se zpěvákem. Kvalita výsledného zvuku po kódování a dekódování byla určena subjektivním hodnocením poslechovými testy. Požitá stupnice přibližně odpovídá doporučení ITU [8], kde stupeň 5 znamená nejlepší kvalitu, která je nerozeznatelná od originálu a stupeň 1 pak představuje silně rušivé zkreslení.

Řádek Vstupní Typ MNR Průměrná Pk Pk Subjektivní tabulky soubor rámce výstupná bitová rychlost hodnocení 1 M - - - - 1,1 - M A 0 111 6,36 7, - 3 6 138 5,13 5,64-4 M B -6 94,3 7,49 8,7 3 5-3 108 6,5 7,38 4 6 0 14 5,68 6,3 4.7 7 3 140 5,06 5,50 5 8 6 153 4,60 4,96 5 9 M C -1 63,6 11,11 18,38 1.5 10-6 94,3 7,49 10,4.5 11-3 108 6,5 8,43 3 1 0 14 5,68 7,1 4 13 3 140 5,06 6,0 4.5 14 6 153 4,60 5,55 5 15 1 177 3,98 4,6 5 16 M-0 C 0 111 6,36 8,36-17 M-40 0 83,8 8,43 1,48-18 M-60 0 46,1 15,3 40,44-19 S - - - - 1,3-0 S C -1 61,9 11,40 6,39 1-6 64,8 10,90 18,9 3.5-3 69,7 10,13 16,18 4 3 0 74,6 9,46 14,13 4.5 4 3 83,1 8,50 1,38 4.7 5 6 96,5 7,3 10,78 5 6 1 110 6,39 8,09 5 Tab. 1: Přehled vlastností VBR kodérů

Vztah kompresního poměru k dynamickému rozsahu signálu Standardní MPEG algoritmus nebere v úvahu obsah vstupního signálu a i např. soubor s nulovými vzorky je zakódován plnou rychlostí [7]. Proto byly podobně jako v [7] vytvořeny testovací soubory s uměle sníženým dynamickým rozsahem a zjišťovala se velikost kompresního poměru. Soubory s názvy M-0, M-40 a M-60 byly vytvořeny ze základního souboru M jeho zeslabením 10, 100 a 1000 krát (tj. o 0, 40 a 60 db). V tab. 1 je pak jasně vidět, že navržený VBR kodér se zmenšující se dynamikou signálu zvětšuje kompresní poměr. Průběhy vypočtené bitové rychlosti pro různé útlumy jsou zobrazeny na obr. 6. Je vidět že se vzrůstající dynamikou signálu v db roste do určité meze přenosová rychlost zhruba lineárně. Pro velkou úroveň signálu (velkou dynamiku signálu) se ale začínají ve zvýšené míře uplatňovat maskovací jevy a bitová rychlost roste pomaleji. Zde je nutné podotknout, že vypočtená bitová rychlost je určena na základě výstupních hodnot z psychoakustického modelu, kde je v některých rovnících [1] prováděno normování. Na základě výsledků simulací funkce VBR kodéru se domnívám že toto normování je prováděno s ohledem na vstupní formát signálu 16 bitů na vzorek, což je v současné době nejobvyklejší formát zvukových dat. Vzhledem k tomu že standart MPEG ale nabízí dynamický rozsah přes 10 db bylo by nutné v případě vstupních dat kódovaných např. 4 bity na vzorek přehodnotit způsob výpočtu alokace bitů podle údajů psychoakustického modelu (změnit normování), neboť by mohlo dojít k tomu, že i dobře slyšitelný zvuk pohybující se na hranici dolních 8 bitů 4 bitového slova nebude přenesen. Ve standardním iteračním algoritmu se tento problém s normováním buď nemusí projevit vůbec a nebo se projeví pouze mírně zhoršenou funkcí psychoakustického modelu, který pro tyto zvuky ač dobře slyšitelné bude považovat za maskovací křivku práh slyšení. Vztah MNR, kompresního poměru a kvality výsledného zvuku V předchozím textu bylo uvedeno že nulová hodnota MNR je hranící, kdy by zkreslení způsobené kompresí mělo být přestávat slyšet. Tento předpoklad byl poslechovými testy potvrzen. Na obr. 4. je vidět závislost výstupní bitové rychlosti na MNR. Se vzrůstajícím MNR roste bitová rychlost i kvalita výsledného signálu. Pro hodnoty MNR>=3 db (viz. tab. 1) je prakticky nemožné rozlišit originál od komprimovaného záznamu.

Závěr Kódování s proměnnou bitovou rychlostí představuje určitou nadstavbu k stávajícímu standardu a má v současné době velkou perspektivu díky nasazování moderních telekomunikačních sítí podporujících proměnnou bitovou rychlost. Těžištěm práce bylo především nalezení algoritmu pro bitovou alokaci podle charakteru signálu. Neméně důležité následné poslechové testy potvrdily správnost navrženého algoritmu. Pro praktické využití by však bylo vhodné algoritmus implementovat ve vrstvě 3 MPEG-1 Audio a s podporou stereofonního signálu, nebo ještě lépe ve standardu MPEG-. To může být námětem pro další práci. Literatura [1] EN ISO/IEC 1117-3 Information technology - Coding of moving pictures and associated audio for digital storage media at up to about 1,5 Mbit/s - Part 3: Audio, 150s. [] Noll, P.: MPEG Digital Audio Coding. IEEE Signal Processing Magazine, September 1997, str.59-81 [3] Brandenburg, K.: Variable data-rate recording on a PC using MPEG-Audio Layer III. 95 th Audio Engineering Society Convention, New York, 1993 [4] Serantes, C. - Pena, A. - Prelcic, N.: A Fast Noise-Scaling Algorithm for Uniform Quantization in Audio Coding Schemes. IEEE Proceedings, 1997, str. 339-34 [5] Wei, X. - Shaw, M. - Varley, M.: Optimum Allocation and Decomposition for High Quality Audio Coding. IEEE Proceedings, 1997, str. 315-318 [6] Chan, W.Y. - Gersho, A.: High Fidelity Audio Coding with Generalized Product Code VQ. Speech and Audio Coding For Wireless and Network Application, Kluwer Academic Publishers, 1998, str.153-159 [7] Majíř, A.: Sound Recording Quality in MP3 Standard, konference Poster 98, 1998 [8] ITU-R BS.1116, "Methods for the Subjective Assessment of Small Impairments in Audio Systems Including Multichannel Sound Systems, " Geneva, Switzerland (1994)

Obrázky 16 x 104 Bitová rychlost 14 1 10 8 6 4 0 0 00 400 600 800 1000 100 1400 Obr. 1: Vypočtená bitová rychlost pro soubor M, MNR=0 db 16 x 104 Bitová rychlost 14 1 10 8 6 4 0 00 400 600 800 1000 100 1400 Obr. : Rámcová bitová rychlost pro soubor M, MNR=0 db 16 x 104 Bitová rychlost 14 1 10 8 6 4 0 0 0 40 60 80 100 Obr. 3: Vypočtená a rámcová (tečkovaně) bitová rychlost pro soubor M, MNR=0 db, detail pro prvních 100 rámců

.5 x 105 Bitová rychlost MNR=+1 1.5 1 0.5 0 0 0 40 60 80 100 Obr. 4: Vypočtené bitové rychlosti pro soubor M, MNR=-1, -6, -3, 0, 3, 6, 1 db, detail pro prvních 100 rámců MNR=-1.5 x 105 Bitová rychlost MNR=+1 1.5 1 0.5 MNR=-1 0 0 0 40 60 80 100 Obr. 5: Rámcové bitové rychlosti pro soubor M, MNR=-1, -3, 3, 1 db, detail pro prvních 100 rámců

14 x 104 Bitová rychlost 1 M 10 8 6 4 M-60 0 0 0 40 60 80 100 Obr. 6: Vypočtená bitová rychlost pro soubor M, M-0, M-40, M-60, MNR=0 db