Kosinová transformace 36ACS

Podobné dokumenty
Kompresní algoritmy grafiky. Jan Janoušek F11125

Počítačová grafika a vizualizace I

Konverze grafických rastrových formátů

III/ 2 Inovace a zkvalitnění výuky prostřednictvím ICT

Rastrový obraz, grafické formáty

Obraz jako data. Biofyzikální ústav Lékařské fakulty Masarykovy univerzity Brno. prezentace je součástí projektu FRVŠ č.2487/2011

Počítačová grafika a vizualizace volné 3D modelování. Maxon CINEMA 4D. Mgr. David Frýbert, 2012

Multimediální systémy. 03 Počítačová 2d grafika

Datové formáty videa a jejich využití. Tomáš Kvapil, Filip Le Manažerská informatika Multimédia

Semestrální práce z předmětu KIV/MHS. Komprese statického obrazu pomocí MDCT

Komprese dat Obsah. Komprese videa. Radim Farana. Podklady pro výuku. Komprese videa a zvuku. Komprese MPEG. Komprese MP3.

Formáty obrazu. David Bařina. 22. března David Bařina Formáty obrazu 22. března / 49

Grafika na počítači. Bc. Veronika Tomsová


Reprodukce obrazových předloh

ZÁPADOČESKÁ UNIVERZITA V PLZNI

DIGITÁLNÍ VIDEO. pokus o poodhalení jeho neskutečné obludnosti (bez jednosměrné jízdenky do blázince)

Grafické formáty. Grafické formáty. Komprese rastrového obrazu. Proč je tolik formátů pro uložení obrázků?

1. ZÁKLADNÍ POJMY POČÍTAČOVÉ GRAFIKY

aneb jak se to tam všechno vejde?

VYUŽITÍ POČÍTAČOVÉ GRAFIKY

Jak funguje JPEG - princip pod lupou

Práce s obrazovým materiálem CENTRUM MEDIÁLNÍHO VZDĚLÁVÁNÍ. Akreditované středisko dalšího vzdělávání pedagogických pracovníků

GRAFICKÉ FORMÁTY V BITMAPOVÉ GRAFICE

MULTIMEDIÁLNÍ A HYPERMEDIÁLNÍ SYSTÉMY. 8. Uložení a komprese statického bitmapového obrazu

Moderní multimediální elektronika (U3V)

Grafické formáty. poznámky k 5. přednášce Zpracování obrazů. Martina Mudrová 2004

Škola: Gymnázium, Brno, Slovanské náměstí 7 III/2 Inovace a zkvalitnění výuky prostřednictvím ICT Název projektu: Inovace výuky na GSN

Vodoznačení video obsahu

KOMPRESE OBRAZŮ. Václav Hlaváč, Jan Kybic. Fakulta elektrotechnická ČVUT v Praze katedra kybernetiky, Centrum strojového vnímání.

Rastrové grafické formáty. Václav Krajíček KSVI MFF UK, 2007

Maturitní téma: Počítačová grafika (rastrová a vektorová grafika, grafické programy, formáty)

Algoritmizace prostorových úloh

Komprese obrazu. Michal Bujalka, Ondrej Kováč. Gymnázium Botičská. Botičská 1, Praha 2

Webové stránky. 6. Grafické formáty pro web. Datum vytvoření: str ánk y. Vytvořil: Petr Lerch.

Využití ICT techniky především v uměleckém vzdělávání. Akademie - VOŠ, Gymn. a SOŠUP Světlá nad Sázavou

1. Formáty grafických dat

1 Komprese obrazových signálů

Analýza a zpracování digitálního obrazu

STRUKTURA RASTROVÝCH DAT

Rastrový obraz Barevný prostor a paleta Zmenšení barevného prostoru Základní rastrové formáty

VIDEO DATOVÉ FORMÁTY, JEJICH SPECIFIKACE A MOŽNOSTI VYUŽITÍ SMOLOVÁ BÁRA

Digitální magnetický záznam obrazového signálu

Zpracování obrazů. Honza Černocký, ÚPGM

Kompresní metody první generace

Webové stránky. 16. Obrázky na webových stránkách, optimalizace GIF. Datum vytvoření: str ánk y. Vytvořil: Petr Lerch.

Informační systémy ve zdravotnictví

Rastrová grafika. Grafický objekt je zaznamenán jednotlivými souřadnicemi bodů v mřížce. pixel ( picture element ) s definovanou barvou

Transformace obrazu Josef Pelikán KSVI MFF UK Praha

Druhy grafických formátů a jejich komprese

POČÍTAČOVÁ GRAFIKA. Počítačová grafika 1

DIGITÁLNÍ FOTOGRAFIE

JPEG Formát pro archivaci a zpřístupnění.

Diskrétní 2D konvoluce

Funkce grafiky na webu. Primární grafická informace Fotografie Schémata Diagramy Loga Bannery

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY

Počítačová grafika SZŠ A VOŠZ MERHAUTOVA 15, BRNO

Rastrová grafika. body uspořádané do pravidelné matice

Multimediální systémy. 08 Zvuk

Osnova. Idea ASK/FSK/PSK ASK Amplitudové... Strana 1 z 16. Celá obrazovka. Konec Základy radiotechniky

Převody datových formátů

UNIVERZITA JANA EVANGELISTY PURKYNĚ V ÚSTÍ NAD LABEM FAKULTA ŽIVOTNÍHO PROSTŘEDÍ. Katedra informatiky a geoinformatiky

13 Barvy a úpravy rastrového

SIGNÁLY A SOUSTAVY, SIGNÁLY A SYSTÉMY

ZPRACOVÁNÍ OBRAZU přednáška 4

Kurz digitální fotografie. blok 1 data/úpravy fotografií

Adobe Photoshop 18. Ukládání dokumentu formáty

Zásady prezentace CENTRUM MEDIÁLNÍHO VZDĚLÁVÁNÍ. Akreditované středisko dalšího vzdělávání pedagogických pracovníků

Cvičení 1. Úpravy obrázků programem IrfanView. Zpracoval: Ing. Vladimír Solnický SPŠ stavební, Opava, příspěvková organizace

KOMPRIMACE. aneb Aby to zabralo méně místa

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY

OSNOVA. 1. Definice zvuku a popis jeho šíření. 2. Rozdělení zvukových záznamů (komprese) 3. Vlastnosti jednotlivých formátů

Barvy a barevné systémy Formáty obrázků pro WWW

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY ZTRÁTOVÁ KOMPRESE VIDEOSIGNÁLŮ - KVANTOVÁNÍ LOSSY VIDEO SIGNAL COMPRESSION - QUANTISATION

Algoritmy komprese dat

DATOVÉ FORMÁTY GRAFIKY, JEJICH SPECIFIKA A MOŽNOSTI VYUŽITÍ

Multimediální systémy

DIPLOMOVÁ PRÁCE. Jan Ondruš Bezztrátová komprese JPEG grafiky

BPC2E_C09 Model komunikačního systému v Matlabu

Počítačová grafika. OBSAH Grafické formy: Vektorová grafika Bitmapová (rastrová grafika) Barevné modely

Téma: Barevné modely, formáty souborů

Grafika na webu. Lukáš Bařinka

Barvy a barevné systémy Formáty obrázků pro WWW

IVT. Rastrová grafika. 8. ročník

Zpracování multimediálních dat pro integrovanou výuku VUT a VŠB-TUO

Digitální audio zde se vysvětluje princip digitalizace zvukového záznamu, způsoby komprese uložení ztrátové a bezztrátové, obvyklé formáty atd.

Komprese multimédií. Ing. Jan Přichystal, Ph.D. 7. října PEF MZLU v Brně

1.0 Lekce 1: Seznámení s prostøedím. 2.0 Lekce 2: Základní opravy fotografie

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY VYLEPŠENÍ FORMÁTU JPEG IMPROVEMENTS OF JPEG FORMAT

KTE/TEVS - Rychlá Fourierova transformace. Pavel Karban. Katedra teoretické elektrotechniky Fakulta elektrotechnická Západočeská univerzita v Plzni

Identifikátor materiálu: ICT-1-19

Co je počítačová grafika

KOMPRESE OBRAZŮ. Václav Hlaváč. Fakulta elektrotechnická ČVUT v Praze katedra kybernetiky, Centrum strojového vnímání. hlavac@fel.cvut.

Reprezentace bodu, zobrazení

Komprese obrazu. Úvod. Rozdělení metod komprese obrazů. Verze: 1.5, ze dne: 1. června Václav Hlaváč a Tomáš Svoboda

Charakteristiky zvuk. záznamů

Komprese obrazu. Verze: 1.5, ze dne: 1. června Václav Hlaváč a Tomáš Svoboda

POČÍTAČOVÁ GRAFIKA. Lenka Bednaříková

Digitální grafika. Digitální obraz je reprezentace dvojrozměrného obrazu, který používá binární soustavu (jedničky a nuly).

Elektromagnetické záření. Zdroj:

Transkript:

Kosinová transformace 36ACS 10. listopadu 2006 Martin BruXy Bruchanov bruxy@regnet.cz

Uplatnění diskrétní kosinové transformace Úkolem transformačního kódování je převést hodnoty vzájemně závislých vzorků (podle toho jakou tvoří prostorovou mozaiku) na jiné vzorky v sousedství na sebe nezávislé, jejichž hodnoty by byly soustředěny do menší rozlohy matice, než u netransformovaných vzorků. Ukládání obrazu pomocí JPEG Motion-JPEG Animace ve formátu MPEG a variantách MPEG-2, MPEG-4 Modifikovaná DCT v zvukových formátech MP3, AC-3, Ogg Vorbis a AAC Využití MPEG-2 pro DVB-T a MPEG-4 pro DVB-S

Definice Diskrétní kosinová transformace (DCT) je lineární funkce F : R N R N, kde R jsou reálná čísla a N rozměry matice N N. Reálná čísla x 0... x N 1 jsou transformována na reálná čísla X 0... X N 1 pomocí následujících funkcí: DCT-I: X k = 1 N 2 2 (x 0 + ( 1) k x N 1 ) + DCT-II: (nejčastěji používaná) X k = N 1 n=0 n=1 [ x n cos [ ( π x n cos n + 1 ) ] k N 2 π N 1 nk DCT-III: (inverzní DCT) X k = 1 N 1 2 x [ ( π 0 + x n cos N n k + 1 )] 2 n=1 ]

Formát JPEG pro ukládání obrazu velice rozšířený formát Joint Photographic Experts Group; standard ISO a ITU, uvedený v roce 1992 (později vylepšený v 1997); používá ztrátovou kompresi za pomocí DCT; snížení kvality na 75 % je většinou ještě; nepozorovatelné a přitom kompresní poměr může být 20 : 1 až 25 : 1; je vhodný pro ukládání fotografií a přírodních obrazů, pro počítačovou grafiku se nehodí;

Velikost souboru v závislosti na stupni JPEG komprese Originál snímku v rozlišení 256 192. Bez komprese 147 456 B

Velikost souboru v závislosti na stupni JPEG komprese Kvalita 75% 15 970 B

Velikost souboru v závislosti na stupni JPEG komprese Kvalita 40% 9 564 B

Velikost souboru v závislosti na stupni JPEG komprese Kvalita 10% 4 277 B

Velikost souboru v závislosti na stupni JPEG komprese Kvalita 3% 2 474 B

Kdy se JPEGu vyhnout velkým obloukem I. JPEG je vhodný pro ukládání fotografií a přírodních obrazů, pro počítačovou grafiku (grafy, schémata,... ) se nehodí. Příklad: 16 barev, rozlišení 256 192 Bez komprese, 24 654 B

Kdy se JPEGu vyhnout velkým obloukem II. Kvalita 75 % 7 300 B

Kdy se JPEGu vyhnout velkým obloukem II. lupa Už při kvalitě 75 % je na ostrých barevných přechodech patrné zkreslení.

Kdy se JPEGu vyhnout velkým obloukem III. Kvalita 50 % 5 298 B

Kdy se JPEGu vyhnout velkým obloukem IV. Kvalita 25 % 3 766 B

Kdy se JPEGu vyhnout velkým obloukem V. Kvalita 1 % 1 378 B

Lépe použít formáty s bezztrátovou kompresí Formát Kvalita Soubor Windows Bitmap 100 % 24 654 B JPEG 100 % 17 740 B JPEG 75 % 7 300 B JPEG 50 % 5 298 B TIFF, komprese PackBits 100 % 4 352 B Windows Bitmap RLE 100 % 3 984 B TIFF, komprese LZW 100 % 3 850 B JPEG 25 % 3 766 B GIF 100 % 1 569 B JPEG 1 % 1 378 B Portable Network Graphics 100 % 1 111 B Příznivé velikosti souboru možno dosáhnout vhodným kompromisem mezi rozlišením a počtem barev.

Postup kódování JPEG souboru lidské oko vnímá jas a barvy s různou citlivostí; neukládá obrazová data v barevném kódování RGB, ale používá YCrCb a poměr jednotlivých složek 4 : 2 : 0; rozdělí na čtvercové bloky o rozměrech 8 8 pixelů; těchto 64 bodů je pak převedeno z prostorové oblasti (x, y) na frekvenční oblast (i, j) za pomocí DCT; výslednou kvalitu a vnímání obrazu nejvíce ovlivní kvantizace jednotlivých členů pomocí kvantizační tabulky; výsledná matice je linearizována na posloupnost, která obsahuje velké množství nul; posloupnost se rozdělí do kategorií a nadbytečnost nul se omezí RLE kódováním; nakonec se vše zakóduje pomocí Huffmanovy transformace.

Převod RGB YCrCb a dekompozice na bloky Makroblok Dekompozice Y Y Cr Y Y Cb Y = 0,30R + 0,59G + 0,11B Cr = 0,17R 0,33G 0,5B Cb = +0,5R 0,42G 0,08B

Koeficienty pro náš makroblok Osmibitové hodnoty 0 255 vyjadřující jas pixelu jsou před provedením DCT převedeny na rozsah 128 127. 107 103 98 84 45 8 4 1 109 93 114 97 90 66 11 3 118 90 110 96 93 89 72 33 106 97 99 100 96 97 92 79 98 108 106 97 93 106 94 94 103 103 98 105 98 106 87 109 99 107 109 98 103 93 98 97 84 80 89 103 100 105 92 81

Definice dvourozměrné DCT v JPEGu DCT(i, j) = 1 7 7 [ (2x + 1)iπ 4 C(i) C(j) p(x, y) cos 16 x=0 y=0 ] cos [ (2y + 1)jπ 16 ], kde C(a) = { 2 1 pro a = 0; 1 v ostatních případech. Na první pozici i = 0, j = 0 se pak ukládá tzv. DC člen, ten představuje stejnosměrnou složku harmonického rozkladu a obsahuje průměr všech 64 hodnot z bloku. Na ostatních pozicích jsou pak AC členy neboli střídavá složka a jejich hodnotu ovlivňuje odchylka jednotlivých bodů od DC členu. Zjednodušeně řečeno, DCT se snaží blok 8 8 napasovat jako lineární kombinaci obrazců daných předchozím vzorcem.

Obrazový blok je lineární kombinací obrazců DCT

Výpočet jednorozměrné DCT I. i = 1 i = 2 i = 3 i = 4 1,0 1,0 1,0 1,0 0,5 0,5 0,5 0,5 0,0 0,0 0,0 0,0 0,5 0,5 0,5 0,5 1,0 0 1 2 3 4 5 6 7 x[n] 1,0 1,0 0 1 2 3 4 5 6 7 0 1 2 3 4 5 6 7 x[n] x[n] [ ] (2x + 1)iπ cos 16 1,0 0 1 2 3 4 5 6 7 x[n]

Výpočet jednorozměrné DCT II. i = 5 i = 6 i = 7 1,0 1,0 1,0 0,5 0,5 0,5 0,0 0,0 0,0 0,5 0,5 0,5 1,0 1,0 1,0 0 1 2 3 4 5 6 7 0 1 2 3 4 5 6 7 0 1 2 3 4 5 6 7 x[n] x[n] x[n] [ ] (2x + 1)iπ cos 16

Výpočet dvourozměrné DCT j = 1 i = 1 = j = 2 i = 1 = j = 1 i = 7 = j = 4 i = 4 = j = 7 i = 7 = 1 7 4 C(i) C(j) x=0 y=0 7 [ (2x + 1)iπ p(x, y) cos 16 ] cos [ ] (2y + 1)jπ 16

Výsledek DCT pro náš blok I. DCT Y = 705 109 41 8 1 7 14 1 94 118 23 1 3 9 6 9 70 52 17 11 10 1 4 3 12 16 24 29 7 16 5 10 18 11 13 11 1 4 11 7 3 2 23 12 2 6 14 7 5 8 10 3 4 9 1 5 2 5 7 3 12 4 4 8

Výsledek DCT pro náš blok II.

Obrazový blok je lineární kombinací obrazců DCT II. Obrázek uložený s kvalitou 3%, rozdělení do bloků a stupeň ztrátové komprese originál značně znehodnotily.

Proč použít DCT a ne třeba FFT 8 16 24 32 40 48 56 64 vstupní data FFT DCT 36 10 10 6 6 4 4 4 100 52 0 5 0 2 0 0,4 ořez ořez 36 10 10 6 0 0 0 0 100 52 0 5 0 0 0 0 IFFT IDCT 24 12 20 32 40 51 59 48 8 15 24 32 40 48 57 63 DCT je podobná FFT, ale umí mnohem lépe aproximovat lineární signály za pomocí méně koeficientů.

Kvantizační tabulka pro luminační složku Y Q = 16 11 10 16 24 40 51 61 12 12 14 19 26 58 60 55 14 13 16 24 40 57 69 56 14 17 22 29 51 87 80 62 18 22 37 56 68 109 103 77 24 35 55 64 81 104 113 92 49 64 78 87 103 121 120 101 72 92 95 98 112 100 103 99 Koeficienty kvantizační tabulky, zde pro kvalitu 50 %, mohou být násobeny konstantou α, která určuje míru ztrátovosti. Kvantizační matice navržena na základě psychologických výzkumů dr. Loeschellera. Kvalita Q: 1 Q 50, α = 50 Q, 51 Q 100, α = 2 Q 50

Kvantizační tabulka pro chrominační složku C Q = 17 18 24 47 99 99 99 99 18 21 26 66 99 99 99 99 24 26 56 99 99 99 99 99 47 66 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 Kvantizační tabulka C Q je vůči barvám mnohem agresivnější. V případě potřeby formát JPEG umožňuje definovat vlastní tabulky, které mohou být vůči danému typu obrazu šetrnější.

DCT informace po kvantizaci s 50 % kvalitou 705 109 41 8... 94 118 23 1... 70 52 17 11... 12 16 24 29... 18 11 13 11...... DCT Y./Q = DCT Y./Y Q =...../ 16 11 10 16... 12 12 14 19... 14 13 16 24... 14 17 22 29... 18 22 37 56... 44 10 4 1 0 0 0 0 8 10 2 0 0 0 0 0 5 4 1 0 0 0 0 0 1 1 1 1 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0.......

Proč se při DCT zkreslí ostré barevné přechody Ostré barevné přechody, hrany a šum zastupují v obraze vysokofrekvenční složku. Pozvolné barevné přechody zastupují nízkofrekvenční složku. Oko a mozek si nízkofrekvenční informaci doplní bez problému, s vysokofrekvenční má problém. Kvantizační matice potlačují vysokofrekvenční složky!

FFT spektrum obrázku papouška 14 12 10 8 6 4

FFT spektrum obrázku usměvavého ksichtíku 16 14 12 10 8 6 4

Převedení matice na posloupnost 44 10 4 1 0 0 0 0 8 10 2 0 0 0 0 0 5 4 1 0 0 0 0 0 1 1 1 1 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 Díky cik-cak přečtení se nenulové členy dostanou na první pozice a zbytek vyplní nepotřebné nuly: 44, 10, 8, 5, 10, 4, 1, 2, 4, 1, 1, 1, 1, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 1, 0, 0,...

Rozdělení posloupnosti do kategorií Posloupnost je potom rozčleněna do kategorií: (počet předchozích nul / kategorie / vlastní hodnota). Pro jasové AC členy, je potom 0 kategorie 0, pro ostatní celočíselné hodnoty číslo kategorie odpovídá bitové délce hodnoty. Pro nejčastěji zastoupené AC hodnoty { 1, +1} je to 1, vyjádřeno 0 nebo 1, pro { 3, 2, +2, +3} délka 2, což je vyjádřeno jako {00, 01, 10, 11}, pro { 7,..., 4, +4,..., +7} délka 3, atd. velký počet nul omezí RLE kódování od určitého místa, kde jsou zastoupeny samé nuly se vloží EOB (end of block). DC členy, jasové i chrominační členy mají každý své kódování.

Výsledek rozdělení do kategorií 44, 10, 8, 5, 10, 4, 1, 2, 4, 1, 1, 1, 1, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 1, 0, 0,... 44; (0/4/10), (0/4/ 8), (0/3/ 5), (0/4/10), (0/3/ 4), (0/1/1), (0/2/ 2), (0/3/4), (0/1/ 1), (0/1/ 1), (0/1/1), (0/1/ 1), (5/1/1), (5/1/ 1), EOB

Komprese pomocí Huffmanova kódování úvod Elementům souboru, které se opakují nejčastěji přiřazeny krátká kódová slova, ty které méně často delší. JELEN JETELEM LETĚL (v 8 bitovém ASCII 136 bitů) E L J T M N Ě 6 4 2 2 1 1 1 0 0 2 1 0 1 0 4 1 0 7 3 1 1 10 1 0 17 Znak Kód E 00 L 01 J 100 T 101 M 110 N 1110 Ě 1111 1000001001110 0100101111101 10000101000100110

Komprese pomocí Huffmanova kódování výsledek (0/4/10), (0/4/ 8), (0/3/ 5), (0/4/10), (0/3/ 4), (0/1/1), (0/2/ 2), (0/3/4), (0/1/ 1), (0/1/ 1), (0/1/1), (0/1/ 1), (5/1/1), (5/1/ 1), EOB Výsledný kód závisí na počtu předcházejících nul a bitové délce. Př. 0/1 (žádná nula/délka 1) má 00, 0/2 01, 0/3 100, 1/1 (1 nula/délka 1) 100, 5/1 1111010, atd. Výsledek: 1011 1100 1011 0111 100 010 1011 1100 100 011 00 1 01 01 100 100 00 0 00 0 00 1 00 0 1111010 1 1111010 0 1010 Původní blok 64 Bytů zmenšen na 9 Bytů.

Reference http://wikipedia.org/ heslo Discrete cosine transform Vít, Vladimír Ing.: Televizní technika barevné přenosové soustavy. BEN technická literatura, 1997. Norma ITU T.81 JPEG compression, ITU 1992 http://www.w3.org/graphics/jpeg/itu-t81.pdf Smith, Steven W.: The Scientists and Engineer s Guide to Digital Signal Processing. California Technical Publishing, 1999. www.dspguide.com