ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE FAKULTA STAVEBNÍ OBOR GEODÉZIE A KARTOGRAFIE KATEDRA MAPOVÁNÍ A KARTOGRAFIE Datové formáty v kartografické polygrafii semestrální práce Marketa Havlíčková Miroslav Hořejší editor - Zuzana Ženíšková V Praze dne 26. 4. 2011 Kartografická polygrafie a reprografie
Úvod Nejprve jsme si nedokázali moc představit, jaké formáty se pod tímto názvem mohou skrývat. Po pár hodinách brouzdání na internetu jsme zjistili, že o některých formátech, lze sehnat jen velmi málo informací, proto jsme se rozhodli popsat datové formáty jako celek a teprve posléze určit, které z nich jsou vhodné pro tisk. Na úvod bychom chtěli definovat rozdělení datových obrazových formátů na rastrové a vektorové. 1 Základní rozdělení datových rastrových formátů 1.1 Rastrové formáty Kresba se skládá z elementárních tvarů - pixelů. O každém tomto pixlu se uchovává jeho barva. Soubor popisující barvu a další vlastnosti pixlu lze pak různým způsobem uspořádat a data v něm obsažená případně komprimovat tak, aby se zmenšila velikost dat nutných pro získání potřebné grafické informace. 1.2 Vektorové formáty Vektorové formáty pracuji s pojmem entita. Takovou entitou může být libovolný geometrický objekt, např. úsečka, kružnice, obdélník, nebo úsek textu. Každý typ entity má v daném formátu své metody, kterými je možné ho popsat, a na základě kterých je možné geometrický objekt zrekonstruovat. Takovou metodou může byt např. znalost souřadnic dvou krajních bodů úsečky. Obecně se dá říci, že vektorové formáty obsahují více informací, než formáty rastrové. Kromě vzhledu entity při daném způsobu zobrazení, daném měřítku atd. totiž obsahují informace, na základě kterých je možné odvodit i vzhled a další vlastnosti entit v případě změny zobrazení. Proto také převod kresby z vektorového formátu do formátu rastrového (rastrace) je řádově jednodušší úlohou než převod z formátu rastrového do formátu vektorového (vektorizace). S rastrovými formáty se snáze pracuje tehdy, požaduje-li se jejich zobrazení na výstupním zařízení počítače, nebo naopak vstup dat ze vstupního zařízeni. Většina periferii dnešních počítačů (obrazovka, tiskárna, skener) totiž pracuje s daty v rastrové podobě 2 Rastrové formáty 2.1 GIF GIF je zkratka od Graphic Interhange Format, což je v překladu formát na výměnu grafických údajů. Byl vytvořený v roce 1987 (v roce 1989 inovovaný jako GIF ver. 98) pro potřeby sítě CompuServe. Umožňuje ukládat obrázky s maximálním rozměrem 16000x16000 bodů obrazu a s maximálním počtem barev 256 z palety 224 t.j. 16.7 mil. barev. Pro údaje je použitá komprese LZW s dobrým komprimačním poměrem. GIF je vzhledem k malé náročnosti na barvy vhodný k čárové grafice. Je také využitelný na malé animace a filmové klipy v minimálním rozlišení. 1
2.2 PNG PNG (Portable Network Graphics anglicky přenosná sít ová grafika; oficiální výslovnost zkratky je ping ) je grafický formát určený pro bezeztrátovou kompresi rastrové grafiky. Byl vyvinut jako zdokonalení a náhrada formátu GIF, který byl patentově chráněný (LZW84 algoritmus), dnes jsou patenty prošlé. PNG nabízí podporu 24 bitové barevné hloubky, nemá tedy jako GIF omezení na maximální počet 256 barev současně. PNG tedy do jisté míry nahrazuje GIF, nabízí více barev a lepší kompresi (algoritmus Deflate + filtry). Navíc obsahuje osmibitovou průhlednost (tzv. alfa kanál), to znamená, že obrázek může být v různých částech různě průhledný. Nevýhodou PNG oproti GIF je praktická nedostupnost jednoduché animace.formát PNG nepodporuje systém kladení barev CMYK. 2.3 BMP BMP je formát, který se používá v MS Windows. BMP je zkratka od Bit Mapped Picture, což je (volně přeloženo) obrázek s popisem každého obrazového bodu, anebo se mu také říká bitová mapa. Tento formát hojně používají aplikace MS-Windows, kde je přímo podporovaný, a tak se stává stále používanějším a standardnějším. Obsahuje informace např. o rozměrech obrázku, počtu použitých barev apod. 2.4 TIFF TIF je zkrácením TIFF, což znamená Tag Image File Format, což ve volném překladu znamená obrázkový formát s popisem. Tento formát definovala firma Aldus ve svém programu PageMaker a dopracování definice udělala s firmou Microsoft. TIFF umožňuje jako jeden z mála grafických formátů vícestránkové soubory a proto se často používá například pro ukládání přijatých faxů přijatých pomocí počítače a ISDN karty či faxmodemové karty. Jsou dva typy a to pro procesory INTEL a Motorola (kvůli zařazení bitů ve slově) a také umožňuje používat nekomprimovaný způsob uložení údajů, resp. několik typů komprimací, např. LZW (s mutací pro faxování) či JPEG. 2.5 JPG JPG je formát, který se ujal v poslední době, např. na přenos obrazových informací v síti Internet. Rastrový obrázek je komprimovaný metodou JPEG (zkr. Joint Photographics Expert Group). Jedná se v principu o ztrátovou komprimaci, jejíž komprimační poměr je někdy až 100:1. Do komprimačního poměru cca 20:1 není jasně viditelné zkreslení, a pokud ano, tak jen na ostřejších hranách. JPEG je nejčastější formát používaný pro přenášení a ukládání fotografií na World Wide Webu. Není však vhodný pro perokresbu, zobrazení textu nebo ikonky, protože kompresní metoda JPEG vytváří v takovém obrazu viditelné a rušivé artefakty. Pro takové účely se většinou používají soubory PNG a GIF. 3 Vektorové formáty 3.1 OCD Specifickým datovým formátem speciálně pro kartografickou polygrafii je formát OCD, který používá program OCAD, jde o křivkový formát, který se liší podle verze programu, 2
přičemž logicky ho lze otevřít vždy v novější verzi, pro starší verze se musí speciálně uložit. 3.2 DGN Formát DGN je podporován v produktech firmy Bentley Systems tvůrce programu Microstation. Tento formát existuje ve dvou verzích: DGN V7 a DGN V8, který je novější a byla u něj odstraněna omezení z formátu DGN V7. Příkladem změny je např. maximální velikost výkresového souboru ze 32MB ve verzi DGN V7 na 4GB ve verzi DGN V8. 3.3 DWG DWG je primárním formátem programu AutoCAD, firmy Autodesk. Umožňuje ukládat 2D i 3D data. Výměnnou variantou je textový formát DXF. Existují i některé další programy, které umožňují čtení a zápis do DGN, protože je to ale uzavřený formát výhradně firmy Autodesk, není kompatibilita takovýchto soubor zaručena. Existuje také formát OpenDWG, což je otevřený formát Open Design Alliance, vytvářený metodou zpětného inženýrství z DWG, OpenDWG ale zatím není zcela kompatibilní z originálním DWG. 3.4 CDR CDR je zkratka od Corel DRaw file. Jedná se v principu o vektorový formát, může však obsahovat i bitmapu. Používá ho, jak už zkratka napovídá, kanadská firma Corel na ukládání obrázků ze svého světoznámého programu Corel Draw! I když se jedná o poměrně rozšířený program, tento formát podporuje velmi málo jiných programů. 3.5 PS PostScript patří mezi tzv. jazyky pro popis stránky, které dokáží popsat vzhled a umístění nejrůznějších typů grafických objektů (text, čáry, křivky, bitmapy apod.) v rámci dvourozměrného zobrazení. Tento popis se pak využívá k vykreslení stránek na různých typech výstupních zařízení, zejména tiskárnách. Hlavními vlastnostmi, které vedly k všeobecnému rozšíření PostScriptu coby základního standardu předtiskové přípravy, jsou především výborné vyjadřovací schopnosti a dále jeho nezávislost na zařízení i výrobci. Od doby svého uvedení až do dnešních dnů prošel PostScript několika modifikacemi. Základní podobu, označenou jako PostScript Level 1, postupně nahradil PostScript Level 2, přinášející nárůst výkonnosti a značné vylepšení zejména při správě barev a tvorbě separací. (PostScipt používá vlastní, výrobci softwaru nepříliš podporovaný systém správy barev, lišící se od obvyklých technologií, postavených na ICC profilech.) Další zajímavá rozšíření obsahuje PostScript 3 (bez přívlastku Level), v jehož propracování Adobe stále pokračuje. Dále musíme v souvislosti s různými podobami PostScriptu zmínit jeho zapouzdřenou variantu pro reprezentaci počítačové grafiky EPS (Encapsulated PostScript) a především Portable Document Format, neboli PDF, což je specificky modifikovaná verze PostScriptu, vyvinutá Adobe primárně pro reprezentaci dokumentů nezávisle na platformě, jež nyní začíná PostScriptu významně konkurovat i v pre-pressu. 3
3.6 EPS Encapsulated (zapouzdřený) PostScript byl navržen za účelem reprezentace a přenosu postscriptových dat, zejména grafických, mezi aplikacemi a platformami. I když lze ke stejnému účelu využít i další formáty, je EPS k uvedenému účelu hojně nasazován na prakticky každém pre-pressovém pracovišti. EPS je specifickou formou jazyka PostScript, uzpůsobených pro import a export dat - především obrázků. Povinnou součástí EPS souboru je BoundingBox, který udává pozici a rozměry obrázku prostřednictvím souřadnic levého horního a pravého dolního rohu. Dále může obsahovat další informace o obrázku autorovi apod. EPS se nejčastěji vytváří pomocí exportní funkce dané aplikace. Software pro export do EPS: GIMP, Adobe Photoshop, Corel Draw 3.7 PDF PDF (zkratka anglického názvu Portable Document Format Přenosný formát dokumentů) je souborový formát vyvinutý firmou Adobe pro ukládání dokumentů nezávisle na softwaru i hardwaru, na kterém byly pořízeny. Soubor typu PDF může obsahovat text i obrázky, přičemž tento formát zajišt uje, že se libovolný dokument na všech zařízeních zobrazí stejně. Pro tento formát existují volně dostupné prohlížeče pro mnoho platforem, nejznámějším je oficiální prohlížeč mateřské firmy Adobe Adobe Reader. Formát PDF je založen na jazyce PostScript, některé prvky tohoto jazyka jsou však ve formátu PDF implementovány mírně odlišně, jiné nejsou použity vůbec, přidána pak je schopnost vkládat do dokumentu použité fonty tak, aby byly k dispozici na libovolném jiném zařízení. Formát PDF také obsahuje systém pro uložení různých částí dokumentu do jediného souboru s použitím komprese, text komprimuje algoritmem LZW84. Software pro prohlížení: Adobe Reader, Foxit Reader open source prohlížeč Xpdf, Ghostscript Nástroje: PDF Creator pro vytváření PDF pod Windows, PDFTOHTML konverze soborů mezi PDF a HTML. 3.8 PLT PLT je formát podporovaný většinou kreslících a CAD systémů (Corel Draw, Aldus Freehand, AutoCAD a pod.,). Jde vlastně o vektorový formát, který je definovaný jazykem HPGL (Hewlett Packard Graphics Language) vyvinutý firmou Hewlett Packard. Obsahuje informace pro kreslení hlavně na plotrech a některých tiskárnách. 4
Závěr Jak již bylo řečeno v úvodu, většina domácích tiskáren raději pracuje s vektorovou grafikou, nicméně pro tisk map v tiskárnách jsou pravděpodobně nejvhodnější tyto formáty: OCD, PDF, PS, EPS a PLT. Literatura [1] WWW stránky, [online], [cit. 2008-05-22], URL: <http://www.grafika.cz> [2] WWW stránky, [online], [cit. 2008-05-22], URL: <http://wikipedia.cz> 5