Komprese obrazu. Multimedia Technology Group, K13137, FEE CTU 0

Podobné dokumenty
KOMPRESE OBRAZŮ. Václav Hlaváč, Jan Kybic. Fakulta elektrotechnická ČVUT v Praze katedra kybernetiky, Centrum strojového vnímání.

Kompresní metody první generace


KOMPRESE OBRAZŮ. Václav Hlaváč. Fakulta elektrotechnická ČVUT v Praze katedra kybernetiky, Centrum strojového vnímání. hlavac@fel.cvut.

Informační systémy ve zdravotnictví

Kosinová transformace 36ACS

Kompresní techniky. David Bařina. 15. února David Bařina Kompresní techniky 15. února / 37

ZÁPADOČESKÁ UNIVERZITA V PLZNI

Komprese dat Obsah. Komprese videa. Radim Farana. Podklady pro výuku. Komprese videa a zvuku. Komprese MPEG. Komprese MP3.

Komprese obrazu. Verze: 1.5, ze dne: 1. června Václav Hlaváč a Tomáš Svoboda

Multimediální systémy

Komprese obrazu. Úvod. Rozdělení metod komprese obrazů. Verze: 1.5, ze dne: 1. června Václav Hlaváč a Tomáš Svoboda

Moderní multimediální elektronika (U3V)

VIDEO VQ-KODÉR IMPLEMENTACE V MATLABU

Digitální magnetický záznam obrazového signálu

Komprese dat. Jan Outrata KATEDRA INFORMATIKY UNIVERZITA PALACKÉHO V OLOMOUCI. přednášky

MULTIMEDIÁLNÍ A HYPERMEDIÁLNÍ SYSTÉMY. 8. Uložení a komprese statického bitmapového obrazu

ztrátová odstraňuje zbytečné informace z obrazu. Různé druhy ztrátových kompresních metod se liší podle druhu odstraněných zbytečných informací.

Komprese obrazů. Václav Hlaváč. České vysoké učení technické v Praze

Kódování obrazu podle standardu MPEG 2

1 Komprese obrazových signálů

EFEKTIVNÍ METODY KÓDOVÁNÍ ZVUKOVÝCH SIGNÁLŮ

Kompresní algoritmy grafiky. Jan Janoušek F11125

Multimediální systémy

Základní principy přeměny analogového signálu na digitální

Transformace obrazu Josef Pelikán KSVI MFF UK Praha

Integrální transformace obrazu

Multimediální systémy

Multimediální systémy. 08 Zvuk

Komprese dat. Jan Outrata KATEDRA INFORMATIKY UNIVERZITA PALACKÉHO V OLOMOUCI. přednášky

Multimediální systémy. 10 Komprese videa, formáty

Komprese zvuku. Ing. Jan Přichystal, Ph.D. 14. března PEF MZLU v Brně

Počítačová grafika a vizualizace I

25. DIGITÁLNÍ TELEVIZNÍ SIGNÁL A KABELOVÁ TELEVIZE

Abstrakt. Klíčová slova

Komprese dat (Komprimace dat)

Počítačová grafika a vizualizace volné 3D modelování. Maxon CINEMA 4D. Mgr. David Frýbert, 2012

FAKULTA INFORMAČNÍCH TECHNOLOGIÍ

Algoritmy komprese dat

Datové formáty videa a jejich využití. Tomáš Kvapil, Filip Le Manažerská informatika Multimédia

NOVÉ METODY HODNOCENÍ OBRAZOVÉ KVALITY

Charakteristiky zvuk. záznamů

VIDEO DATOVÉ FORMÁTY, JEJICH SPECIFIKACE A MOŽNOSTI VYUŽITÍ SMOLOVÁ BÁRA

1. Vlastnosti diskretních a číslicových metod zpracování signálů... 15

Srovnání metod pro ztrátovou kompresi obrazu

SIGNÁLY A SOUSTAVY, SIGNÁLY A SYSTÉMY

íta ové sít baseband narrowband broadband

Komprese dat s použitím wavelet transformace

TECHNIKY PRO DETEKCI A PREDIKCI POHYBU VE VIDEO SEKVENCÍCH

OBJEKTIVNÍ HODNOCENÍ KVALITY VIDEA V PROSTŘEDÍ MATLAB

Komprese multimédií. Ing. Jan Přichystal, Ph.D. 7. října PEF MZLU v Brně

Grafické formáty. Grafické formáty. Komprese rastrového obrazu. Proč je tolik formátů pro uložení obrázků?

Vodoznačení video obsahu

Waveletová transformace a její použití při zpracování signálů

Technická kybernetika. Obsah. Principy zobrazení, sběru a uchování dat. Měřicí řetězec. Principy zobrazení, sběru a uchování dat

Komprese dat. Jan Outrata KATEDRA INFORMATIKY UNIVERZITA PALACKÉHO V OLOMOUCI. přednášky

Rastrové grafické formáty. Václav Krajíček KSVI MFF UK, 2007

Katedra radioelektroniky K13137, FEL ČVUT Praha. zakódování dané informace. Tento trend postihl i oblast záznamu a přenosu širokopásmových

VYUŽITÍ VLNKOVÉ TRANSFORMACE PŘI KOMPRESI VIDEOSIGNÁLU

Kvalita zvuku a obrazu v elektronických komunikacích aneb Ještě chceme HiFi?

Datové formáty videa, jejich specifikace a možnost využití. Petr Halama

Algoritmy komprese dat

Vlnková transformace a její aplikace ve zpracování obrazu

Multimediální systémy

Obraz matematický objekt. Spojitý obraz f c : (Ω c R 2 ) R

Algoritmy komprese dat

MULTIMEDIÁLNÍ A HYPERMEDIÁLNÍ SYSTÉMY

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY SROVNÁNÍ FORMÁTŮ PRO ZTRÁTOVOU KOMPRESI OBRAZU

III/ 2 Inovace a zkvalitnění výuky prostřednictvím ICT

PCM30U-ROK 2 048/256 kbit/s rozhlasový kodek stručný přehled

Základy rádiové digitální komunikace. Doc. Dr. Ing. Pavel Kovář Katedra radioelektroniky K13137

Vliv šumu na kompresi videa

Formáty videa. David Bařina. 5. dubna David Bařina Formáty videa 5. dubna / 46

Jan Kaiser ČVUT, Fakulta elektrotechnická, katedra Radioelektroniky Technická 2, Praha 6

STRUKTURA RASTROVÝCH DAT

DIGITÁLNÍ VIDEO. pokus o poodhalení jeho neskutečné obludnosti (bez jednosměrné jízdenky do blázince)

Jasové transformace. Karel Horák. Rozvrh přednášky:

A/D převodníky - parametry

Semestrální práce z předmětu KIV/MHS. Komprese statického obrazu pomocí MDCT

SIMULACE OBRAZOVÉHO KODÉRU NA BÁZI 3D KLT

Popis objektů. Karel Horák. Rozvrh přednášky:

Grafické formáty. poznámky k 5. přednášce Zpracování obrazů. Martina Mudrová 2004

Multimediální systémy

Práce s obrazovým materiálem CENTRUM MEDIÁLNÍHO VZDĚLÁVÁNÍ. Akreditované středisko dalšího vzdělávání pedagogických pracovníků

Komprese dat. Jan Outrata KATEDRA INFORMATIKY UNIVERZITA PALACKÉHO V OLOMOUCI. přednášky

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY

Formáty obrazu. David Bařina. 22. března David Bařina Formáty obrazu 22. března / 49

aneb jak se to tam všechno vejde?

Princip digitalizace vstupních multimediálních dat Klasifikace Zpracování Využití

FOURIEROVA TRANSFORMACE FOURIEROVA VĚTA

Zvuk včetně komprese. Digitálně = lépe! Je to ale pravda? X36PZA Periferní zařízení

Rastrový obraz, grafické formáty

MULTIMEDIÁLNÍ A HYPERMEDIÁLNÍ SYSTÉMY

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY

Oblasti zájmu v kompresi znakového mluvčího! Region of interest of sign language speaker compression!

Animace a geoprostor. První etapa: Animace 4. přednáško-cvičení. Jaromír Landa. jaromir.landa@mendelu.cz Ústav informatiky PEF MENDELU v Brně

Grafika na počítači. Bc. Veronika Tomsová

MULTIMEDIÁLNÍ A HYPERMEDIÁLNÍ SYSTÉMY

nutné zachovat schopnost reprodukovat zvukovou vlnu

FOURIEROVA TRANSFORMACE

Transkript:

Komprese obrazu Multimedia Technology Group, K337, FEE CTU 0

Komprese obrazu Kódování : zdrojové vlastnosti obrazu kanálové vlastnosti přenosového kanálu kodek komprese a dekomprese still picture (statický obraz) 00x600 obraz.bodů, RGB 4 b, cca 5.8 MB 36 snímků cca 00 MB /3 CD,,5 hod. GSM, min. ISDN, 46 sek. ADSL, 5 sek. pomalý IntraNet video 57x70 bodů, YUV, 6 b, 830 kb/snímek hod. 75 GB Multimedia Technology Group, K337, FEE CTU

Formáty SDTV 70x576, 4:3 HDV 70 řádků HDTV 080, 6:9 UHDTV 7680 x 430 (3 mil.), 6:9, + 6 x HDTV, 4 Gb/s, 80 600 Mb/s Digital Cinema K/4K Multimedia Technology Group, K337, FEE CTU

Komprese obrazu - úvod Systémové parametry: CD audio 44, khz, 6 b/vz., 700 kb/s (mono),,4 Mb/s (stereo) MP3 audio - CR, BR,5 b/vz., 8 b/s GSM řeč 8 khz, 8 b/vz., 64 kb/s JPEG 5,8 MB na 600 kb, CR 9,5, BR 0,43 b/vz MPEG- 66 Mb/s(0 MB/s) na 4,5 MB/s, CR 36,8, BR 0,43 b/vz b/vz bpp (bits per pixel), CR (Compression Rate), BR (Bit Rate) Multimedia Technology Group, K337, FEE CTU 3

Komprese obrazu - úvod Kvalita obrazu - připomenutí: subjektivní - pozorovatel objektivní míry MSE, PSNR M = ( ) ( ) MSE xˆ i x i PSNR = 0log M i= MSE n Just Noticeable Difference JND metrika prostoru vjemu (percepce) Multimedia Technology Group, K337, FEE CTU 4

KOMPRESE OBRAZU - METODY irrelevantní a redundantní informace zkreslení a artefakty - ztrátová komprese Zdrojově kódovací řetěz T Q C transformace (vratná) kvantizace (nevratná) kodér (přenos) Multimedia Technology Group, K337, FEE CTU 5

KOMPRESE OBRAZU bezeztrátová ztrátová min H { R} = H ( χ ) = i + ε p i log p i Shannon 948 (DMS zdroj) H - entropie zdroje ε - kladné číslo libovolně blízké 0 Multimedia Technology Group, K337, FEE CTU 6

Kompresní metody I. generace Kompresní metody 7 Multimedia Technology Group, K337, FEE CTU 7

KOMPRESE OBRAZU - METODY Kompresní metody I. generace - JPEG, MPEG-, zdroj - DPCM, DCT, detekce a predikce pohybu přenos - entropické kódování (Huffman, aritmetické k., RLE) Kompresní metody II. generace - JPEG 000, MPEG- 4 VO - visuální objekty, vektorová kvantizace, waveletová transformace, modely, fraktály Multimedia Technology Group, K337, FEE CTU 8

DPCM - diferenciální PCM predikční model přenos odchylky s, ( n, n ) = s( n, n ) + e( n n ) s ( n, n ) s -původní obraz ( n, n ) - rekonstruovaný obraz ( ) ( n,n ) s e n, n - predikovaný obraz - chyba (odchylka) LMMSE prediktor - vektor c y ( n, n ) = c s( n, n ) + c s( n, n ) + c 3 s( n, n + ) + c 4 s( n, n ) Multimedia Technology Group, K337, FEE CTU 9

DPCM - diferenciální PCM vstup kvantizér entropický kodér výstup prediktor vstup entropický kodér výstup prediktor Multimedia Technology Group, K337, FEE CTU 0

DPCM - diferenciální PCM Adaptivní DPCM konstantní úroveň textura pozvolná hrana ostrá hrana σ = 0,5 σ =,0 σ =,75 σ =,5 Multimedia Technology Group, K337, FEE CTU

Kódování délky běhu RLE/RLC Run Length (En)Coding vhodná zejména pro binární signály skupiny 0 a - hodnota + počet opakování maximální počet opakování - 8, 6 atd. D RLC Multimedia Technology Group, K337, FEE CTU

INTEGRÁLNÍ TRANSFORMACE rozdělení na bloky N x N ortogonální D transformace redukce redundance transformace Fourierova, Walsh-Hadamarova, Karhunen-Loeveho atd. kosinová t. DCT S ( k, k ) = C( k ) C( k ) s( n, n ) 4 N N k, k, n, n = 0,,...N- C(k) = / pro k = 0 a C(k) = jinde. n ( n ) π ( n ) N π + + cos cos n N N Multimedia Technology Group, K337, FEE CTU 3

Multimedia Technology Group, K337, FEE CTU 4

D spektrum - obecné vlastnosti koncentrace energie kolem počátku menší počet nenulových prvků maximální pásmo ve směru x a y ω y ω ymax ω xmax ω xmax 0 ω x ω ymax Kompresní metody Multimedia Technology Group, K337, FEE CTU 5

kvantizační matice S ) ( k, k ) DCT = S NINT T ( k ) ( ), k k, k podle podmínek snímání, zejména úrovně šumu alokace bitů b i = B M M log σ i log M i= σ i B - celkový počet bitů M - počet koeficientů s - variance koeficientů Multimedia Technology Group, K337, FEE CTU 6

DCT Kvantizační tabulka - příklad Multimedia Technology Group, K337, FEE CTU 7

DCT vstup N x N bloků DCT kvantizér entropický kodér výstup vstup entropický dekodér IDCT spojení N x N bloků výstup Čtení zig-zag Nevýhody: bloková struktura - MDCT omezení vf složek zrnitost - kvantizace Multimedia Technology Group, K337, FEE CTU 8

Entropické kódování Kódování s proměnnou délkou slova VLC různá pravděpodobnost výskytu symbolů Huffmanova metoda Symbol: a b c d Pravděpodobnost: 0,50 0,5 0,5 0,5 bit bity 3 bity 3 bity Kód: 0 0 0 střední délka kódového slova R=0,5.+0,5.+0,5.3+0,5.3=,75 b/symbol Multimedia Technology Group, K337, FEE CTU 9

LZW kód (Lempel Ziv Welch) slovníková metoda substituční komprese inicializace všechny symboly abecedy zdroje a řetězce délky postup:. najdi nejdelší řetězec ve slovníku shodný s komprimovanou posloupností. pošli číslo její pozice ve slovníku 3. pošli znak následující za komprimovanou posloupností 4. vlož do slovníku právě komprimovanou posloupnost rozšířenou o poslední vyslaný symbol 5. posuň ukazatel na poslední vyslaný symbol 6. zpět na. Multimedia Technology Group, K337, FEE CTU 0

Detekce a predikce pohybu Intraframe x interframe kódování potlačení časové redundance - 3D DCT, 3D DPCM, predikce pohybu Blokové metody detekce pohybu - block matching posunutý blok vyhledávací okénko blok i-tý snímek vektor pohybu i+ snímek Kompresní metody Multimedia Technology Group, K337, FEE CTU

Multimedia Technology Group, K337, FEE CTU Detekce a predikce pohybu kritéria shody ( ) ( ) ( ) [ ] ( ) ( ) ( ) [ ] ( ) ( ) ( ) ( ) ( ) ( ) jinde 0,,, T,,,, pro,,, kde T,,,, MPC d Count Maximum Pixel,,,,, MAD d Mean Absolute Difference,,,,, d MSE Mean Square Error = + + + = = + + + = + + + = d n d n t k d n d n s k n n s d n d n d n d n T N N d k d n d n s k n n s N N d k d n d n s k n n s N N d - složky vektoru posunutí,d d koordináty bodu,n n

Detekce a predikce pohybu 0 3 3 3 3 3 33 3 vyhledávání ve třech krocích 3 0 3 5 4 5 křížové vyhledávání 4 5 Multimedia Technology Group, K337, FEE CTU 3

Kompresní metody obrazu II.generace Multimedia Technology Group, K337, FEE CTU 4

Subband coding SBC kódování dílčích pásem rozdělení (decomposition) spektra do dílčích pásem inverzní FT sada dílčích obrazů (pásmové propusti) každý obraz - podvzorkován (downsampling) a individuálně kódován upsampling a vhodná filtrace y l ( n) yˆ l ( n) s(n) h(n) : : h (n) + ŝ( n) g(n) : : g (n) y h ( n) yˆ h ( n) Multimedia Technology Group, K337, FEE CTU 5

Kmitočtové transformace při SBC Multimedia Technology Group, K337, FEE CTU 6

Kvadraturní zrcadlo QMF g n+ ( n) = ( ). h( L n) ( ω ) + G( ω ) =, lib. ω H h g ( n) = h( L n) ( n) = g( L n) h(n) g(n) fs/4 fs/ Multimedia Technology Group, K337, FEE CTU 7

Waveletová transformace WT Morlet 98, Grossman, Mayer, Mallat Daubechies 988 ortonormální báze Spojitá waveletová transformace + x b W ( a, b) = f ( x) ψ dx, a a kdeψ základní( mother) wavelet a,b měřítko resp. posunutí Výpočet: - výběr waveletu - posun podél signálu a průběžný výpočet koeficientu -změna měřítka a opakování předešlého kroku Multimedia Technology Group, K337, FEE CTU 8

Typy waveletů Daubechies Coiflet Symlet Multimedia Technology Group, K337, FEE CTU 9

Diskrétní waveletová transformace DWT Mallat dvoupásmová filtrace LP a HP a = j, k Z, ψ φ s jk jk j, b = k. a ( ) ( j x = x k) ψ j j ( ) ( j x = x k) φ J ( x) C. ψ ( x) S. φ ( x) = + jk jk j= k k φ funkce měřítka Jk Jk C jk, S Jk - waveletové koeficienty Multimedia Technology Group, K337, FEE CTU 30

D DWT g Multimedia Technology Group, K337, FEE CTU 3

D DWT Příklad 4stupňový Daubechies h(n) = {/3,9/3,5/3,-3/3} g(n) = {3/3,5/3,-9/3,/3} h (n) = h(3-n) g (n) = g(3-n) Multimedia Technology Group, K337, FEE CTU 3

Subband coding SBC kódování dílčích pásem dekompozice LL LH HL HH LV LD HV HD multiscale - multiresolution LL LH LV LD H VL VH DL DH VV VD DV DD V D,00,7,7 3,88 3,0 3,0 9,58 kvantizace - příklad Multimedia Technology Group, K337, FEE CTU 33

Multimedia Technology Group, K337, FEE CTU 34

Multimedia Technology Group, K337, FEE CTU 35

Multimedia Technology Group, K337, FEE CTU 36

Multimedia Technology Group, K337, FEE CTU 37

WT v JPEG 000 Multimedia Technology Group, K337, FEE CTU 38

Vektorová kvantizace obrazové body jako složky vektoru kvantizace v k-dimenzionálním prostoru využívá statistických vazeb mezi body použití přirozené signály obraz, řeč, hudba, biomedicína multimédia Y, R-Y, B-Y varianty intraframe (x,y) i interframe (x,y,t) Multimedia Technology Group, K337, FEE CTU 39

Vektorová kvantizace VQ y j x i+ x i Vektor - skupina vzorků, k -dimensionální prostor clustery - shluky Voronoiho oblasti - reprezentativní (kódové) vektory euklidovská vzdálenost d k ( x, yi ) = ( x j yij ) x j jtá složka vektoru, y ij jtá složka itého kódového vektoru Multimedia Technology Group, K337, FEE CTU 40 j=

Vektorový kvantizér r kódový vektor y kódová trénovací kniha C množina i VQ [ y,... y ] r { y,... y } i r L ik minimum vzdálenosti LUT kódová kniha kódová kniha kodér dekodér Multimedia Technology Group, K337, FEE CTU 4

VQ Návrh kódové knihy - LBG (Linde, Buzo, Gray) algoritmus:. Počáteční odhad kódové knihy C r = r j { y,... y }, 0 L =. Určení oblastí R i podle minima vzdálenosti 3. Stanovení integrální odchylky D podle zvoleného kriteria ( j ) ( j ) D ( ) ε j D 4. Inkrementace j a výpočet centroidů (těžišť) D m - počet vektorů v jedné oblasti 5. Návrat do bodu. y = m i x ij m j= Multimedia Technology Group, K337, FEE CTU 4

VQ Kódová kniha 688 prvků Multimedia Technology Group, K337, FEE CTU 43

Příklad aplikace VQ Multimedia Technology Group, K337, FEE CTU 44

Příklady užití VQ rozklad 8 x 8, 8 vektorů, PSNR 7,5 db, CR 3,35 rozklad 8 x 8, 3 vektorů, PSNR 0,95 db, CR 0,98 rozklad 4 x 4, 8 vektorů, PSNR 9,5 db, CR 6,5 rozklad 4 x 4, 64 vektorů, PSNR 4,96 db, CR,7 00 x 80 bodů Multimedia Technology Group, K337, FEE CTU 45

Příklady užití VQ rozklad 4 x 4, 8 vektorů, PSNR 34,0 db, CR,34 rozklad 4 x 4, 64 vektorů, PSNR > 60 db, CR 5, rozklad 8 x 8, 8 vektorů, PSNR 33,99 db, CR,34 rozklad 8 x 8, 3 vektorů, PSNR > 60 db, CR 3,67 Multimedia Technology Group, K337, FEE CTU 46

Fraktály Dr. Mandelbrot (IBM) 977, The Fractal Geometry of Nature charakteristika křivky - invariantní vůči změně měřítka např. kapradí, pobřeží fraktální dimenze D = kde N d lim d 0 ( ) ( d ) ln N ln d minimální počet koulí o průměru d, který vyplní danou množinu Multimedia Technology Group, K337, FEE CTU 47

Fraktály Pro dostatečně malé d N ( d ) = K d D D - míra hrubosti množiny, větší D - hrubší fraktální křivka - zvětšení libovolné části nemění hrubost Kochova křivka D ln 4 ln 3 n = n = ln 4 ln 3 =,6 Multimedia Technology Group, K337, FEE CTU 48

Fraktály Komprese obrazu: ztrátová IFS Iterated Function System 98 Hutchinson forma vektorové kvantizace virtuální kódová kniha Barnsley Fractals Everywhere komprese obrazu přímo IFS obraz, inverzní problém obtížný 988 Barnsley, Sloan komprese :0000 PIFS Partitioned IFS algoritmizace inverzního problému komprese :8 až :50 99 Jacquin praktická komprese 993 Barnsley, Lyman - Fractal Image Compression Multimedia Technology Group, K337, FEE CTU 49

Fraktály Základní body: vytvoření IFS zmenšení, posun a otočení atraktor latentní obraz, limita iteračního postupu Sierpinskiho trojúhelník Multimedia Technology Group, K337, FEE CTU 50

Fraktály Multimedia Technology Group, K337, FEE CTU 5

Fraktály Multimedia Technology Group, K337, FEE CTU 5

Fraktály Multimedia Technology Group, K337, FEE CTU 53

Fraktály podobnost s VQ VQ: vektor malý čtvercový blok, kódová kniha sada vektorů kódový vektor (domain blok) označen indexem obraz je rozdělen do bloků -vektorů (range bloky) VQ domain i range bloky jsou stejné VQ kopíruje domain bloky přímo VQ kódová kniha uložena, IFS transformace (virtuální kódová kniha) Multimedia Technology Group, K337, FEE CTU 54

Kódování pomocí modelu souvislost s virtuální realitou VRML různé typy modelu mesh, kinematický atd. scéna typu head and shoulders (hlasatel) animační parametry bitový tok řádu jednotek až desítek kb/s Multimedia Technology Group, K337, FEE CTU 55

Kódování obrazu založené na modelu Příklad - scéna typu head and shoulders model typu wireframe Multimedia Technology Group, K337, FEE CTU 56

Kódování obrazu založené na modelu dříve - statistické vlastnosti obrazu nyní - obrysy, oblasti, struktury analýza syntéza model model segmentace, pohyb - objekty Multimedia Technology Group, K337, FEE CTU 57

Multimedia Technology Group, K337, FEE CTU 58

Multimedia Technology Group, K337, FEE CTU 59