Nejznámější Semestrální práce z předmětu Kartografická polygrafie a reprografie Autor: Editor: Věra Peterová Praha, květen 2010 Katedra mapování a kartografie Fakulta stavební ČVUT v Praze
Nejznámější Úvod Obsah prezentace 1 2 3 Princip metody Schéma činností Skenování, lokalizace, segmentace Klasifikace 4 Nejznámější
Nejznámější OCR OCR = Optical Character Recognition (optické rozpoznávání textu) převod tištěné předlohy do digitální formy automatická identifikace znaků výhody - snadná editace textu a možnost prezentace v digitálním prostředí
Nejznámější Počátky 1929 - Němec Gustav Tauschek - první mechanický stroj využívající překrytu šablony a obrazu 1954 - Reader s Digest - zařízení pro převod ručně psaného textu na děrné štítky První generace 1960 1965, komerční systémy objevují se stroje s vícefontovou znalostí
Nejznámější Druhá generace počátek 70. let rozpoznání již i ručně psaného písma první automatický třídič dopisů dle PSČ standardy OCR-A a OCR-B Třetí generace polovina 70. let rozpoznávání předloh nižší kvality
Nejznámější OCR dnes do roku 1986 prodáno pouze pár tisíc systémů poté rapidní snižování cen široké rozšíření OCR systémů masové využívání mnohafontové rozpoznávání
Nejznámější Princip metody Schéma činností Skenování, lokalizace, segmentace Klasifikace Princip metody naučit systém základním případům, které mohou nastat dodat systému sadu příkladů znaků vytvoření prototypů poté porovnávání znaku s prototypy ve většině systémů tréninkový proces předem uskutečněn
Sled činností systému Úvod Nejznámější Princip metody Schéma činností Skenování, lokalizace, segmentace Klasifikace Obrázek: Schéma činností OCR
Nejznámější Princip metody Schéma činností Skenování, lokalizace, segmentace Klasifikace Sled činností systému Skenování nejobvyklejší převod předlohy do digitální podoby min. 300 DPI, většinou postačí v 1-bitové hloubce další úpravy pro odstranění šumu - filtry Lokalizace a segmentace identifikace textu na stránce oddělení těchto oblastí od obrázků apod.
Nejznámější Princip metody Schéma činností Skenování, lokalizace, segmentace Klasifikace Sled činností systému slouží k získání základních rysů každého symbolu je třeba dbát na šum, pokřivení, posunutí, rotaci a variaci stylu znaku nejčastější techniky: rozčlenění bodů transformace a sériová expanze strukturální analýza
Sled činností systému Úvod Nejznámější Princip metody Schéma činností Skenování, lokalizace, segmentace Klasifikace Obrázek: Rozčlenění bodů Obrázek: Transformace a sériová expanze
Sled činností systému Úvod Nejznámější Princip metody Schéma činností Skenování, lokalizace, segmentace Klasifikace Obrázek: Strukturální analýza
Sled činností systému Úvod Nejznámější Princip metody Schéma činností Skenování, lokalizace, segmentace Klasifikace Klasifikace identifikace konkrétního znaku pomocí extrahovaných rysů druhy klasifikace: matching - porovnává podobnost rysů statistická klasifikace - vybere znak s minimální pravděpodobností toho, že byl špatně klasifikován neuronová síť - každý neuron má prahovou hodnotu, na níž reaguje na vstupu; umí se učit, neustále ve vývoji
Nejznámější Nejznámější Název Licence Operační Poznámka systém OnlineOCR.net Freeware Online Online aplikace, převod i komerční do formátů pdf, word, excel, html. ExperVision Komerční Windows, Jeden z nejuznávanějších TypeReader RTK Mac OS, systémů, velmi rychlý Unix, Linux (až 700 stran/min). ABBYY Komerční Windows, Nejpoužívanější FineReader OCR Mac OS software
Nejznámější Shrnutí jsou dnes na velmi vysoké úrovni ručně psaný text, většina známých fontů úspěšnost rozpoznání znaků 99% poměrně levné
Nejznámější Shrnutí jsou dnes na velmi vysoké úrovni ručně psaný text, většina známých fontů úspěšnost rozpoznání znaků 99% poměrně levné
Nejznámější Shrnutí jsou dnes na velmi vysoké úrovni ručně psaný text, většina známých fontů úspěšnost rozpoznání znaků 99% poměrně levné
Nejznámější Shrnutí jsou dnes na velmi vysoké úrovni ručně psaný text, většina známých fontů úspěšnost rozpoznání znaků 99% poměrně levné
Nejznámější Použité zdroje Wikipedie [online]. 2009 [cit. 2009-04-09]. URL: <http: //en.wikipedia.org/wiki/optical_character_recognition>. SUCHÝ, Václav. Rozpoznávání textu v obraze. [s.l.], 2007. 32 s. Bakalářská práce. URL: <http://www.fit.vutbr.cz/study/dp/rpfile.php?id=5737>. http://docs.cirkva.net [online]. 2004 [cit. 2009-04-09]. URL: <http://docs.cirkva.net/cvut/fsv/pogr/>.
Nejznámější Semestrální práce z předmětu Kartografická polygrafie a reprografie Děkuji za pozornost Autor: Editor: Věra Peterová Praha, květen 2010 Katedra mapování a kartografie, Fakulta stavební ČVUT v Praze