Osnova přednášky. Formáty uložení dat. Vyjádření hodnot datového typu. Vyjádření hodnot datového typu. Datové formáty. Výpočetní technika I



Podobné dokumenty
Formáty uložení dat. Výpočetní technika I. Ing. Pavel Haluza ústav informatiky PEF MENDELU v Brně

Formáty uložení dat Výpočetní technika I

Počítačová grafika a vizualizace I

Registrační číslo projektu: CZ.1.07/1.5.00/ Elektronická podpora zkvalitnění výuky CZ.1.07 Vzděláním pro konkurenceschopnost

Převody datových formátů

Rastrový obraz, grafické formáty

BMOF011 Aplikace MS Office (jaro 2013) Microsoft Word 2007

FAKULTA STAVEBNÍ OBOR GEODÉZIE A KARTOGRAFIE KATEDRA MAPOVÁNÍ A KARTOGRAFIE

Microsoft Word 2007 Pokročilí

Název práce: Komprimace dat prezentace

INFORMAČNĚ TECHNOLOGICKÝ ZÁKLAD

INFORMAČNÍ A KOMUNIKAČNÍ TECHNOLOGIE

Změňte styly nadpisů takto: Nadpis úvodní styl: Nadpis1 Nadpisy kurzivou Nadpis2 Podtržené nadpisy Nadpis3. Do dokumentu vložte č. stránek.

CAD II přednáška č. 5. Grafické formáty PCX GIF TIFF BMP

Číslo a název šablony III/2 Inovace a zkvalitnění výuky prostřednictvím ICT. Popis výukového materiálu Soubory, typy souborů, komprimace

Inovace výuky prostřednictvím ICT v SPŠ Zlín, CZ.1.07/1.5.00/ Vzdělávání v informačních a komunikačních technologií

Zabezpečení dat. Literatura: Pavel Roubal: Informatika a výpočetní technika pro střední školy str

PŘIJÍMANÉ FORMÁTY DIGITÁLNÍCH DAT:

Rastrové grafické formáty. Václav Krajíček KSVI MFF UK, 2007

III/ 2 Inovace a zkvalitnění výuky prostřednictvím ICT

Multimediální systémy. 03 Počítačová 2d grafika

DUM: VY_32_INOVACE_594

RYCHLOST KVALITA PŘÍZNIVÉ CENY INDIVIDUÁLNÍ PŘÍSTUP MNOŽSTEVNÍ SLEVY

Výukový materiál pro projekt Perspektiva zip komprimujeme zdarma a efektivně

Aplikace. Operační systém. Fyzické vybavení (hardware)

Škola: Gymnázium, Brno, Slovanské náměstí 7 III/2 Inovace a zkvalitnění výuky prostřednictvím ICT Název projektu: Inovace výuky na GSN

CZ.1.07/1.5.00/

1. Formáty grafických dat

Upravovat, podepisovat a faxovat dokumenty

Počítačová grafika a vizualizace volné 3D modelování. Maxon CINEMA 4D. Mgr. David Frýbert, 2012

Komprimace grafických dat, formáty počítačové grafiky

KOMPRIMACE. aneb Aby to zabralo méně místa

Uživatelský manuál. A3600 DL ( Data Download)

Informační a komunikační technologie Inovace výuky prostřednictvím šablon pro SŠ

Univerzita Jana Evangelisty Purkyně v Ústí nad Labem. Jak na PDF

Seznam atributů pro indexaci pro fulltextové vyhledávání

Pro označení disku se používají písmena velké abecedy, za nimiž následuje dvojtečka.

Internet 2 css, skriptování, dynamické prvky

aneb jak se to tam všechno vejde?

Informace o provozu podatelny a o podmínkách přijímání dokumentů na Krajském úřadu Ústeckého kraje

Srovnání programů pro editaci 2D grafiky

Grafické formáty. Grafické formáty. Komprese rastrového obrazu. Proč je tolik formátů pro uložení obrázků?

Projekt CDArcha: kooperativní zpracování datových CD disků. Zdeněk Hruška, Petr Žabička Moravská zemská knihovna v Brně AKM 2018

INFORMATIKA. Charakteristika vyučovacího předmětu: Obsahové, časové a organizační vymezení: Předmětem prolínají průřezová témata:

Elektronická podatelna

1. HDR. 2. Test Práce ve Windows. 3. Tilt-shift efekt. 4. Excel tisk a tvorba grafů. Informatika Ditta Kukaňová

Základy informatiky. 10 Počítačová grafika

Sada 1 CAD Rastrová grafika

SMLOUVA O NÁJMU MULTIFUNKČNÍCH SÍŤOVÝCH TISKÁREN

Formáty WWW zdrojů. Mgr. Filip Vojtášek.

Evidence hrobových míst v GIS Kompas 3.2

VY_32_INOVACE_INF3_18. Textové formáty PDF, TXT, RTF, HTML, ODT

Bezpečnost ve světě ICT - 10

Pravidla inzerce. Ceník inzerce bez DPH. 1/1 190 mm x 265 mm Kč. 1/2 190 mm x 131,8 mm Kč. 1/3 190 mm x 87,5 mm Kč

Výukový materiál zpracován v rámci projektu EU peníze školám

Grafické formáty. poznámky k 5. přednášce Zpracování obrazů. Martina Mudrová 2004

Informatika základní pojmy

Cvičení 6 Rozpoznávání souborových formátů

INFORMATIKA Charakteristika volitelného předmětu

Microsoft, Windows, Plocha, Průzkumník, Adresář,

Adobe Photoshop 18. Ukládání dokumentu formáty

Tvorba posterů v PowerPointu a InDesignu

PRACOVIŠTĚ PRO DLOUHODOBÉ UCHOVÁVÁNÍ A ZPŘÍSTUPŇOVÁNÍ DOKUMENTŮ V DIGITÁLNÍ PODOBĚ NÁRODNÍ DIGITÁLNÍ ARCHIV

Organizace a zpracování dat I (NDBI007) RNDr. Michal Žemlička, Ph.D.

Konverze grafických rastrových formátů

Základní příkazy UNIXu (Linuxu)

DUM 20 téma: Formátování rozsáhlého dokumentu

Vektorová a bitmapová grafika

Název školy: Základní škola a Mateřská škola Žalany. Číslo projektu: CZ. 1.07/1.4.00/ Téma sady: Informatika pro pátý až šestý ročník

2.17 Archivace a komprimace dat

Konverze textových formátů

- doplnění dotazu před provedením výmazu dlaždice nebo všech dlaždic

RYCHLOST KVALITA PŘÍZNIVÉ CENY INDIVIDUÁLNÍ PŘÍSTUP MNOŽSTEVNÍ SLEVY

Číslo DUM: VY_32_INOVACE_04_01 Autor: Mgr. Ivana Matyášková Datum vytvoření: březen 2013 Ročník: prima Vzdělávací obor: informační technologie

Rozdělení operačních systémů

Tvorba posterů prakticky

Registrační číslo projektu: CZ.1.07/1.5.00/ Elektronická podpora zkvalitnění výuky CZ.1.07 Vzděláním pro konkurenceschopnost

Rastrová grafika. Grafický objekt je zaznamenán jednotlivými souřadnicemi bodů v mřížce. pixel ( picture element ) s definovanou barvou

Nástroj Project Loader TXV Šesté vydání Září 2013 změny vyhrazeny

Computer Press Brno 2003

Gymnázium Jana Pivečky a Střední odborná škola Slavičín. III/2 - Inovace a zkvalitnění výuky prostřednictvím ICT

Gymnázium Jana Pivečky a Střední odborná škola Slavičín. III/2 - Inovace a zkvalitnění výuky prostřednictvím ICT

Registrační číslo projektu: CZ.1.07/1.5.00/ Elektronická podpora zkvalitnění výuky CZ.1.07 Vzděláním pro konkurenceschopnost

Postup při zasílání dokumentů smluvních partnerů České pojišťovny prostřednictvím aplikace externí upload

Analýza dat na PC I.

RYCHLOST KVALITA PŘÍZNIVÉ CENY INDIVIDUÁLNÍ PŘÍSTUP MNOŽSTEVNÍ SLEVY

Funkce grafiky na webu. Primární grafická informace Fotografie Schémata Diagramy Loga Bannery

. Seznámení se systémem TEX. Zpracování textů na počítači. Ing. Pavel Haluza, Ph.D. ústav informatiky PEF MENDELU v Brně haluza@mendelu.

základem rastr pixelů s informací o jejich barvě problémy při změně velikosti (zvětšování):

Digitální učební materiály ve škole, registrační číslo projektu CZ.1.07/1.5.00/

Formáty pro rastrovou grafiku

Souborový systém (File System FS) Souborové systémy. Souborová fragmentace. Disková fragmentace. Organizace dat na pevném disku

Software FluidDraw přehled dodávek

Stejná stránka se v různých prohlížečích může zobrazit odlišně.

VYHLÁŠKA ze dne 23. června 2009 o stanovení podrobností užívání a provozování informačního systému datových schránek

Přesměrování vstupu a výstupu. Posloupnost příkazů. Příkazy pro informaci o uživatelích

DigiDepot: JPEG 2000 jako ukládací formát

III/2 Inovace a zkvalitnění výuky prostřednictvím ICT EU-OVK-VZ-III/2-ZÁ-217. Komprimace dat

POČÍTAČOVÁ GRAFIKA. Počítačová grafika 1

Transkript:

Osnova přednášky 2/36 Formáty uložení dat Ing Pavel Haluza ústav informatiky PEF MENDELU v Brně haluza@mendelucz vyjádření hodnot datového typu formátová specifikace textový a binární formát otevřený a uzavřený formát rozpoznávání formátu asociace a konverze komprimační metody archivace a zálohování metody a postupy archivace 3/36 4/36 Datový formát způsob uložení dat v jakékoli paměti počítače Příklad 1: věk osoby 26 let a) převod čísla do dvojkové soustavy Příklad 2: příjmení osoby Cimrman a) s určením délky 7 'C' 'i' 'm' 'r' 'm' 'a' 'n' 11010 00011010 1a 07 43 69 6d 72 6d 61 6e b) zápis čísla pomocí znaků (znakový kód) 43 69 6d 72 6d 61 6e 00 110010 110110 00110010 00110110 32 36 b) s oddělovači 'C' 'i' 'm' 'r' 'm' 'a' 'n' ' ' ' ' ' ' 43 69 6d 72 6d 61 6e 20 20 20 43 69 6d 72 6d 61 6e 0d 0a

Formátová specifikace Porovnání způsobů uložení 5/36 Formátová specifikace 6/36 Tvar použitý v operační paměti 43 69 6d 72 6d 61 6e 00 1a Tvar použitý pro vstup nebo výstup 43 69 6d 72 6d 61 6e 20 20 20 32 36 'C' 'i' 'm' 'r' 'm' 'a' 'n' ' ' ' ' ' ' '2' '6' V operační paměti jsou obvykle data ve tvaru vhodném pro zpracování (výpočty, řazení, ) Viditelný tvar (tiskárna, displej, klávesnice, ) musí být složen výhradně z čitelných (zobrazitelných) znaků Formátová specifikace popis formátu, tj přesný význam jednotlivých bitů (bytů) dat Příklad formátové specifikace: délka příjmení L jeden byte příjmení řetězec, ISO 8859-2, L bytů věk binárně, jeden byte 07 43 69 6d 72 6d 61 6e 1b Druh formátu 7/36 Definice formátu 8/36 Textový formát data jsou připravena pro zobrazení a přímé čtení člověkem Netextový (binární) formát data jsou připravena pro aritmetické a logické operace v paměti počítače Intuitivní definice textový formát: všechny prvky formátu jsou složeny výhradně ze zobrazitelných znaků binární formát: alespoň některé prvky formátu jsou řešeny jiným způsobem (řídicími znaky) Problémy kolik řádků může mít soubor, je-li v textovém formátu? jak poznáte konec souboru? Upravená definice textový formát: všechny prvky formátu jsou složeny ze zobrazitelných znaků, mezi nimiž jsou použity jako oddělovače konce řádků a na konci dat nejvýše jeden znak konce souboru

Konec řádku a konec souboru 9/36 Textový formát vlastnosti 10/36 V různých operačních systémech jsou řídicí znaky různé Vedlejší efekt: podle tvaru konce řádku lze zjistit operační systém, ve kterém byl soubor vytvořen Dnešní kvalitní textové editory dokážou řídicí znak změnit Operační Konec Název Konec Název systém řádku znaku souboru znaku Unix 0a LF 04 EOT Mac 0d CR 04 EOT MS 0d 0a CR LF 1a ESC Data jsou přímo čitelná člověkem Pro zpracování je obvykle nutná změna vyjádření Zpracovatelný celou škálou obecných programů a služeb každého operačního systému, což zvyšuje přenositelnost Odolnost vůči porušení (ztrátě) informací Nenapadnutelné virem Většinou nižší úspornost zobrazení Binární formát vlastnosti 11/36 Souborový formát 12/36 Data nejsou přímo čitelná člověkem Pojem odvozený z pojmu datový formát Vhodný pro přímé zpracování Nízká přenositelnost, závisí na určitém programu, který zná přesnou a detailní strukturu dat Snadná ztráta všech informací při porušení Napadnutelné virem, lze ukrýt mnoho informací Někdy maximálně úsporný (ale i naopak) Specifikace tvaru dat uložených v souboru Místo podrobného popisu dat používáme jména formátů Dokument soubor obsahující vlastní text formátovací značky Dělení souborů podle tvaru značek textové HTML, XML, RTF, PostScript, TEX, CSV binární DOC, DOCX, SAM, INDD, PDF, Text602 Datové soubory programů určitého zaměření mohou být v obojím formátu mají rozdílné vlastnosti a možnosti použití

Otevřený a uzavřený formát Otevřený a uzavřený formát Otevřený a uzavřený formát 13/36 Přehled základních souborových formátů 14/36 Otevřený formát specifikace formátu je volně dostupná prostředek pro výměnu informací, efektivní využití a zpracování uložených dat příklady: JPG, PNG, PDF, všechny textové Uzavřený formát specifikace formátu je utajována umožňuje získat monopol pro jeho zpracování a zároveň silně omezuje možnosti využití uložených dat příklad: CDR, dříve MS Office (DOC, XLS, PPT) Textové formáty webové aplikace: HTML, XHTML, XML, MHT, CSS zdrojové kódy: JS, PAS, JAVA, PL, PHP, ASP dokumenty: RTF, PS, CSV, TEX, TXT grafika: SVG Binární formáty historie: SAM, INDD, T602 dokumenty: DOC(X), XLS(X), PPT(X), ODF, PDF grafika: BMP, JPG, PNG, GIF, TIFF, CDR, EPS Otevřený a uzavřený formát Rozpoznávání formátu Přenositelnost formátu 15/36 Rozpoznávání formátu 16/36 Lze pracovně definovat jako množství programů schopných zpracovat tento formát Důležitým faktorem je podpora zpracování formátu v různých operačních systémech Přenositelnost je také úzce svázána s otevřeností formátu, ale závisí také na majiteli formátu (DOC PDF) Přenositelnost textových formátů je obecně daleko větší Binární otevřené formáty rovněž přenositelné První krok roztřídění na textové a binární formáty využití běžných programů (type, more) Druhý krok rozšířené textové formáty rozpoznání kódování národních znaků a operační systém, v němž soubor pravděpodobně vznikl binární formáty použití rozpoznávacích programů Unix: file, enca, od Windows: není nástroj (zkusmo?)

Asociace a konverze Asociace a konverze Asociace formátů a aplikací 17/36 Problémové případy 18/36 Udává, která aplikace bude pracovat se souborem dané přípony Laikům usnadňuje zpracování dat v operačním systému Princip tabulka s řádky formát aplikace (Tento počítač; Nástroje/Možnosti složky) Spouštění aplikace v případě aktivace souboru příslušného formátu (stažení přes prohlížeč, dvojklik v manažeru, výběr v dokumentech apod) Orientace jen podle rozšíření (přípony) jména souboru může vést ke zmatkům Ideální stav: 1 formát 1 aplikace platí pro speciální případy, např CDR CorelDraw! Více formátů 1 aplikace časté, ale neproblematické 1 formát více aplikací problém nejednoznačnosti, nepříjemné řešení aktivuje se buď posledně instalovaná aplikace, nebo podle výběru z nabídky 1 formát žádná aplikace chybové hlášení s nabídkou instalovaných aplikací, z nichž uživatel může vybrat (prakticky nikdy nevede k úspěchu) Windows XP: rozšíření nabídky programů z Internetu Žádný formát 1 aplikace buď aplikace žádné formáty nepotřebuje, nebo se jedná o aplikaci DOS, nebo o chybnou instalaci Asociace a konverze Konverze formátů 19/36 Potřebnost komprimace 20/36 Změna souborového formátu bez změny informačního obsahu V praxi vzácné ideální případy Často vede ke ztrátě, ale i k nabytí informací Provedení konverze speciálním konverzním programem služby Open a Save (As) běžných programů Příklady konverze čísel mezi textovou a binární podobou konverze obrazových formátů (Unix: convert) konverze kódování národních znaků (cstocs) konverze dokumentních formátů (DOC RTF) Redundance v datech nutná pro zpracování dat Vznik redundance nedokonalým kódováním dat nutností rychlého přístupu k datům přidáním zabezpečovacích zařízení Odstranění (snížení) redundance použitím komprimace

Základní pojmy 21/36 22/36 Hrubá data data před komprimací Čistá (komprimovaná) data data po komprimaci Komprimační poměr poměr délek hrubých a komprimovaných dat, vyjadřuje se různým způsobem h/k udává násobek hrubých dat k/h 100 udává, na kolik procent se data zmenšují (1 k/h) 100 udává, o kolik procent se data zmenšují Záporná komprimace data se komprimací zvětšují Ztrátová komprimace některá data se vynechávají Adaptivní komprimace komprimační metoda pracuje v závislosti na hrubých datech Symetrická komprimace čas komprimace a dekomprimace je stejný Logická komprimace jiný (kratší) způsob vyjádření stejných informací je nutné znát detailně sémantiku (význam) dat příklady zkracování slov (těsnopis), čb fotografie vyjádřená v odstínech šedi Fyzická komprimace hledání lepšího (kratšího) kódu nezávisí na sémantice dat Metoda RLE 23/36 Metoda LZW 24/36 Běh posloupnost stejných hodnot Run Length Encoding kódování délkou běhu Základní princip opakovač, hodnota hrubá data 65 65 65 65 78 78 78 32 32 32 32 32 výsledek 4 65 3 78 5 32 Problém střídavá data; může dojít k záporné kompresi, řeší se speciálním tvarem opakovače Bitová / bytová / pixelová úroveň Lempel, Ziv, Welch (1977, vylepšeno 1984) algoritmus a jeho implementace Princip hledání optimálního kódu pro zadaná hrubá data prvkem hrubých dat, který se kóduje, jsou posloupnosti Postup data se analyzují, zjišťují se posloupnosti a jejich četnost na základě analýzy a vzniklého slovníku se hledá optimální kód LZMA Lempel, Ziv, Markov-Chain Algorithm, pomalejší, ale s lepším komprimačním poměrem

Metoda CCITT 25/36 Vlastnosti komprimačních metod 26/36 Princip stejný jako u LZW používá se však pevný slovník Implementace CCITT Group 4 pro monochromatická obrazová data (formáty BMP, TIFF, PCX) Metoda RLE jednoduchá závislá na bězích v hrubých datech nízký komprimační poměr Metoda LZW nejsložitější adaptivní, nezávislá na datech vysoký komprimační poměr univerzální použití, kvalitu lze ovlivnit hloubkou analýzy Metoda CCITT jednoduchá závislá na prvcích odpovídajících slovníku nízký komprimační poměr Implementace 27/36 Archivy 28/36 Komprimátory programy schopné komprimovat, ale také archivovat, pracovat se soubory a adresáři, šifrovat obsah, vkládat poznámky apod Komprimace pod OS třídy Unix gzip, zip/unzip Komprimace pod OS Windows pkzip/pkunzip, WinZIP, WinRAR, arj, 7zip apod Různé komprimátory různé formáty archivů, různé ovládání, ale prakticky vždy metoda LZW (LZMA) s mírnými modifikacemi Soubor vytvořený komprimátorem, obsahuje čistá data a režijní informace Procento režijní informace závisí na velikosti a počtu komprimovaných souborů Formát archivu je pro každý komprimátor jiný Moderní komprimátory jsou schopny číst a někdy i vytvářet archivy různých typů

Vnitřní fragmentace 29/36 On-line komprimace 30/36 Každý disk je složen z alokačních bloků určité délky Uložený soubor zabírá vždy určitý celočíselný počet alokačních bloků Poslední alokační blok souboru není zcela využit vnitřní fragmentace Velikost souboru velikost na disku Shrnutí více souborů do jednoho archivu znamená eliminaci vnitřní fragmentace (i bez komprimace jde o zmenšení prostoru na disku) Implementace uvnitř jiného programu služby Otevřít (Open) a Uložit (Save, Save As) Při běžné práci se skrytě komprimuje a dekomprimuje Používáno u programů pracujících s vnitřně komprimovanými daty, například obrazové editory, zpracování hudebních dat a videodat Použita symetrická komprimace čas otevření a uložení je podobný, menší nároky na kvalitu komprimace, často i ztrátová komprimace Archivace a zálohování Archivace a zálohování Archivace a zálohování 31/36 Způsoby zálohování 32/36 Archivace uchování dat pro budoucí použití nutnost uchování dokladů o provedených pracích Zálohování ochrana před poškozením nebo ztrátou dat (viry, požár, povodeň, chyby uživatelů) Vzdálenost archivu příruční na stejném disku odkládací na stejném počítači, ale jiném disku bezpečnostní mimo počítač, archivní média podle vzdálenosti roste i bezpečnost uchování Záloha dat, záloha programů Zálohují se soubory, adresářové podstromy, disky, systémové soubory a oblasti Výchozí záloha kopie původního systému, provádí se po první instalaci Úplná záloha všechna data, která byla k dispozici v okamžiku jejího vytvoření Rozdílová (diferenciální) záloha pouze data, která byla změněna od úplné zálohy Přírůstková (inkrementální) záloha pouze data, která byla změněna od vytvoření poslední plné nebo přírůstkové zálohy Plán záloh

33/36 Archivace v Unixu 34/36 Vytváření archivních souborů většinou vhodným komprimátorem nebo specializovanými programy Četnost archivace podle vzdálenosti archivu, po každé modifikaci dat, jednou denně, jednou týdně, jednou měsíčně, Média pro zálohy a archivy pevné disky v počítači (oblast téhož disku, jiný disk, mirror) zálohy přenosná média (CD, DVD, magnetické pásky, flash disky) zálohy i archivy NAS (Network Attached Storage) síťově dostupné úložiště zálohování Program tar (tape archive) a jeho kombinace s bezztrátovou komprimací gzip soubory tar, tgz Vytvoření skriptu (uživatelské dávky) pro archivaci vybraných souborů a adresářů Nastavení času a periodicity archivace cron Automatizované posílání archivů případně na jiný stroj (připojení disku jiného stroje do souborového systému) Archivace ve Windows 35/36 Osnova příští přednášky 36/36 Program backup varianta v příkazovém řádku nebo interaktivní (i s průvodcem) Možnosti zálohy systémových záznamů a jejich obnova v případě havárie Zálohování souborů výběr zdrojů a umístění archivů Plánovač úloh možnost volby času zálohování a periodicity Úvod do teorie informace základní pojmy měření množství informace ve zprávě přenos a kódování dat Ochrana dat parita kontrolní součet samoopravný kód