Příloha č. 2 Projekt srovnání knižních skenerů na základě kalibračních obrazců Ivo Miláček Národní knihovna přejímá na své datové úložiště obrazové soubory z jiných zdrojů (externí firmy, jiné knihovny). Proto vznikla potřeba srovnat obrazovou kvalitu těchto dat s obrazovými soubory vytvořenými na profesionálním knižním skeneru v NK. Vzhledem ke zlevňování a zkvalitňování digitálních fotoaparátů a skenerů totiž mnozí chtějí digitalizovat na těchto levných zařízeních. Uvedený postup je samozřejmě možný, ale takto vzniklá data se určitě nehodí pro archivaci a NK je nemůže a nechce uchovávat ve svém digitálním archivu. Jako první krok jsme museli nějakým způsobem popsat požadovanou kvalitu obrazových dat, které NK dosahuje na svém knižním skeneru, abychom mohli my i ostatní subjekty jednoznačně určit, které data jsou vyhovující a které ne. Toto se ale ukázalo jako poměrně obtížný krok, protože srovnat data vizuálně je mnohem jednodušší, než popsat všechny problémy, které mohou při skenování vzniknout. Přesto se nám podařilo identifikovat tři základní oblasti, ve kterých nejčastěji dochází ke snížení kvality obrazových dat. Rozlišení obrazu požadujeme rozlišení minimálně 300 DPI. Tohoto rozlišení musí skenovací zařízení dosahovat hardwarově, tedy ne žádná převzorkování, jako to dělají domácí skenery třeba i na hodnoty 9600 DPI. Rozdíl mezi skenem, který vznikl na profesionálním skeneru na 300 DPI, a skenem vytvořeným na domácím skeneru s 600 DPI totiž bude ve velikosti obrazu (zdánlivě bude obsahovat sken s 600 DPI více informace). Ve skutečnosti, pokud obraz s 300 DPI převzorkujeme ve Photoshopu na 600 DPI, dostaneme stejný výsledek. Hranice 300 DPI (jedná se o hodnotu rozměrovou, vyjadřující, kolik obrazových bodů se vejde do jednoho palce), kterých může skener dosáhnout, není jediným ani určujícím parametrem. Programy, které převádí obrazové dokumenty na text (OCR systémy), požadují minimálně hodnotu 300 DPI, která poskytne dobrou čitelnost každého dokumentu. Nicméně 300 DPI je minimum pro skenování archivního dokumentu. Pokud však máme skener, který umí pracovat i s vyšším fyzickým rozlišením je dobře ho využít naplno. Typický skener dokáže například dokument velikosti A1 naskenovat na 300 DPI. Avšak dokument A4 nejenže umí naskenovat na 400 DPI, ale bude schopen u tohoto menšího dokumentu dosáhnout téměř stejné rychlosti. Pro kontrolu, zda skener je schopen dosáhnout požadovaného DPI, budou použity kontrolní obrazce. Jedná se o obrazce pro vizuální vyhodnocení rozlišení skeneru FSR1R, případně FSR2R (www.danes-picta.com). Geometrie obrazu obraz nesmí být pokřiven, typicky u snímání digitálním fotoaparátem může trpět soudkovitostí. Pro jednoduchou kontrolu stačí nasnímat pravítka, čtvercové objekty a následně zkontrolovat (třeba Photoshopem), zda sedí rozměry pravítka a protilehlé body na čtverci jsou od sebe vzdáleny stejně daleko. Ideální je předloha se čtvercovou mřížkou, protože často je největší zkreslení v rozích dokumentu. Kontrole těchto typů chyb by mohl pomoci program Imatest (www.imatest.com). Správnost barevného podání rozlišujeme několik typů problémů, barvy by měly být maximálně věrné originálu, obraz nesmí být rozostřený, musí se minimalizovat šum a chromatická aberace (někdy bývají barvy posunuté, takže se správně nesloží a pixely základních barev RGB jsou vedle sebe, což v náhledu nemusí být vidět, ale při maximálním
zvětšení vidím rozklad barev), nesmí se vyskytovat moaré efekt (moaré vzniká tehdy, když pravidelný obrazec pole buněk snímače fotoaparátu interferuje s nějakým pravidelným vzorem na ploše zobrazení). Pro kontrolu, zda skener dosahuje požadovaného barevného podání, budou použity kontrolní obrazce. Jedná se o obrazce IT8.7/2 reflektivní předlohy 5"x 7", GretagMacbeth ColorChecker (BST11 nebo BST4) a DCR3 (ISO 12233) (www.danes-picta.com). Kontrole těchto typů chyb by mohl pomoci program Imatest (www.imatest.com). Pro použití kalibračních obrazců IT8.7/2 a GretagMacbeth ColorChecker BST11, (BST4) se musí provést přepočet barev souřadnicového systému (měl by být dodán v souboru s obrazci) na systém RGB. Kontrola by potom měla probíhat jednoduše tak, že si operátor skeneru naskenuje daný kalibrační obrazec a ve Photoshopu si změří, jaké hodnoty RGB mají jednotlivá políčka. Tyto změřené hodnoty RGB by měly být v ideálním případě stejné jako hodnoty udané pro daný obrazec. Toto je ale v praxi ztěžka dosažitelné, proto budou určeny možné odchylky, které budou tolerované pro uložení obrázku do digitálního archivu. Alternativní metoda zjištení správného podání barev: Pokud by si nějaké pracoviště se skenerem chtělo skutečně důkladně ověřovat, že barvy digitalizovaného obrázku odpovídají přesně barvám původního dokumentu (což asi není u dokumentů typu periodik nutné) mohlo by namísto kalibračních obrazců použít přímo ruční spektrokolorimetr, kterým by se změřila barva na dokumentu a ve Photoshopu barva na digitální kopii takové zařízení se dá pořídit za cca. 10.000 Kč. Jak srovnávat dokumenty digitalizované z mikrofilmu: U mikrofilmu je celý problém složitější o to, že se jedná o nepřímou digitalizaci, tudíž rozdíl mezi neskenovanou předlohou a originálem knihy může ovlivnit nasnímání předlohy na mikrofilm. Naopak výrazné zjednodušení je to, že se fotí na černobílý film a tudíž se nemusíme zabývat barevnou informací a pracujeme jen se šedou škálou. Problém tedy je nastavení při focení dokumentů. Zde se uplatňují dvě možné cesty, jak postupovat: 1. Nastavit mikrofilm podle kalibračního obrazce použít se mohou obrazce ST13 a ST14 (www.danes-picta.com). 2. Nastavit mikrofilm podle knihy. V prvním případě budou sice digitalizované výsledky blízké originálu (knize), budou však už bez informace o barvě (snímá se šedá škála). Na druhou stranu bude hůře čitelný mikrofilm, jak pro uživatele pracujícího se čtecím zařízením pro mikrofilmy, tak i pro mikrofilmový skener. Pro operátora skeneru by to znamenalo postupovat stejně jako při kalibrování obrazu na knižním skeneru s tím, že se nemusíme zabývat barevnou informací (vystačíme si s kalibračním obrazcem šedoškálovým). Druhou možností je nastavit denzitu filmu podle snímané předlohy. V takovém případě operátor skeneru nemá možnost, jak přesně změřit informaci o barvě (šedé škále), kalibrační obrazec může sloužit jen pro vizuální kontrolu a především musí nastavit sken tak, aby byl dobře čitelný. Posuzovat lze jen rozlišení, geometrii obrazu a rozostření a to obdobným způsobem jako u kalibrace na knižním skeneru. Všechny potřebné kalibrační obrazce: Rozlišení - FSR1R
Barevné podání - IT8.7/2, GretagMacbeth ColorChecker BST11 (nebo BST4) a DCR3 (ISO 12233) Mikrofilm - ST13, ST14 Obrazová příloha Kalibrační obrazce Pro rozlišení FSR1R Geometrie obrazu DC3R Barevné podání IT8.7/2
Barevné podání BST11 Šedá škála ST13 Šedá škála ST14
Dokument s možnými chybami 1. 2. 3. 4. 1. originální obrázek 2. rozostření 3. aberace 4. šum
Tyto typy chyb se dají kontrolovat pouhým okem, pro přesnější kontrolu může být použit program Imatest. Kontrola správných barev na kalibračním obrazci 1. 2. Na obrázku 1 je kontrolováno černé pole(rgb=0,0,0) a vychází naprosto správně hodnoty RGB na 0,0,0. U druhého obrázku je kontrolováno bílé pole (RGB=255,255,255) a hodnoty RGB vychází na 251,255,255. Červená složka je tedy o něco posunuta a bude se muset stanovit, zda tato chyba může být ještě tolerována. Stejně se bude postupovat i u ostatních barev. Pro každou barvu totiž známe hodnotu RGB a budeme posuzovat odchylku od této hodnoty.