Dnešní téma Zpracování informací Metadata VOŠIS UIM 12 1
Životní cyklus informace VOŠIS UIM 12 2
Rekapitulace Základní typy operací prováděné s informacemi 1) komunikace 2) transformace uchování: zaznamenání a shromažďování na nosiči konverze: změna média (nosiče) informace přenos: přeprava na jiné místo zpracování evidence organizace (pořádání, třídění, kategorizace) výběr (vyhledávání) transformace (agregace, odvozování nových informací) VOŠIS UIM 12 3
Zpracování informací (information processing) Realizace určitého procesu (procedury) na prvcích určité množiny informací s cílem odvodit novou množinu informačních objektů Cíl: pořádek místo chaosu organizace, uspořádání (za účelem vyhledávání) VOŠIS UIM 12 4
Zpracovatelské procesy řeší problémy a) s množstvím informací popis Reprezentace datových objektů do nových datových objektů. Data se mění nebo alespoň kopírují. zmenšení objemu dat (surogáty záznamy zastupující původní dokument) zvětšení objemu dat (komentáře...) b) s organizací informací přístupové body Členění (třídění, rozdělení, označování) datových objektů podle kritérií vyjádřených v dotazu. Data se spíše reorganizují než mění. VOŠIS UIM 12 5
Klíčová metoda zpracování analýza a syntéza VOŠIS UIM 12 6
K čemu slouží zpracování informací Identifikace 1 atribut (identifikátor), který informaci odlišuje od všech ostatních Popis maximální (úplná) množina atributů, které informaci reprezentují (zastupují) doplňují Vyhledávání atributy, podle kterých lze informaci vyhledat VOŠIS UIM 12 7
Další funkce zpracování informací indikační (informace o existenci objektu) výběrová (selekční) lokační zjišťovací hodnotící administrativní sjednocující dokumentační regulace přístupu ochrana autorských a vlastnických práv a další VOŠIS UIM 12 8
Výsledek (produkty) zpracování informací organizovaný soubor dokumentů (fond, sbírka, kolekce, web site) primární informace metadata / organizovaný soubor metadat (katalog, index) sekundární informace pomůcky pro tvorbu metadat (standardy, pravidla, řízené slovníky) VOŠIS UIM 12 9
Zpracování informací a metadata Dokument metadata (údaje o obsahu a struktuře) obsah (data) sémantická struktura (obsah) syntaktická struktura (forma styl, vzhled) VOŠIS UIM 12 10
metainformace / metadata informace o informacích informace popisující informace, data popisující data, sekundární informace data nahrazující znalost existence nebo charakteristiky původního objektu 1) Informace = odraz (model, reprezentace) reality 2) Informace je také realita 3) Informace odrážející informaci = metainformace VOŠIS UIM 12 11
Příklad metadat MS Word VOŠIS UIM 12 12
Metadata v databázi VOŠIS UIM 12 13
Metadata v HTML http://info.sks.cz/users/bl/data/prezent.htm VOŠIS UIM 12 14
Timothy Berners-Lee (8. 6. 1955) tvůrce koncepce sítě WWW autor specifikací URI, HTTP, tvůrce jazyka HTML ředitel W3C tvůrce konceptu sémantického webu: metadata v Internetu = počítači srozumitelná informace o objektech v síti VOŠIS UIM 12 15
Data a metadata jsou relativní pojmy data událost metadata novinová zpráva VOŠIS UIM 12 16
Data a metadata jsou relativní pojmy data událost novinová zpráva metadata novinová zpráva bibliografická citace zprávy VOŠIS UIM 12 17
Data a metadata jsou relativní pojmy data událost novinová zpráva bibliografická citace zprávy metadata novinová zpráva bibliografická citace zprávy jméno databáze, v níž je citace obsažena VOŠIS UIM 12 18
Data a metadata jsou relativní pojmy data událost novinová zpráva bibliografická citace zprávy bibliografická databáze metadata novinová zpráva bibliografická citace zprávy jméno databáze, v níž je citace obsažena seznam databází VOŠIS UIM 12 19
Data a metadata jsou relativní pojmy METADATA informace o informaci o informaci o informaci informace o informaci o informaci informace o informaci terciární sekundární zpráva o informaci (odraz, reprezentace informace) DATA informace primární zpráva o realitě (odraz, reprezentace reality) realita VOŠIS UIM 12 20
Data a metadata jsou relativní pojmy autor název KOSEK, Jiří. PHP a XML. Praha: Grada, 2009. 368 s. ISBN 978-80-247-1116-4 rok vydání VOŠIS UIM 12 21
K jednomu objektu může existovat více objektů s metadaty ISBN obsah tiráž resumé anotace recenze RFID tag VOŠIS UIM 12 cenovka signatura ex libris rejstřík bibliografická citace katalogizační záznam 22
ERA diagram = metadata Peter Chen James Martin: Information Engineering (IE) Merise VOŠIS UIM 12 23
Soubory metadat a) tradiční katalogy bibliografie b) elektronické dokumentografické (bibliografické) databáze fulltextové databáze (resp. jejich indexy) search engines (resp. jejich databáze indexy) VOŠIS UIM 12
Metadata prakticky KDE je hledat KDO je dělá KDO je využívá VOŠIS UIM 12 25
Umístění metadat uvnitř zdroje (tiráž v knize, CIP, HTML tagy) mimo vlastní zdroj v samostatném dokumentu (XML dokument, katalogizační lístek) v databázi (např. katalog knihovny) metadata propojená se zdrojem ve složeném dokumentu (OOP) VOŠIS UIM 12 26
Umístění metadat uvnitř zdroje mimo vlastní zdroj výhody současně se zdrojem jsou k dispozici i metadata možnost vícenásobného využití nevýhody dostupné pouze v rámci daného zdroje potřeba propojení se zdrojem VOŠIS UIM 12 27
Tvůrci metadat autoři dokumentů (autorské resumé, META tag, TEI header...) jiné subjekty (zprostředkovatelé) správci souborů (katalogizátoři) ostatní (specializované instituce) čtenáři, (koncoví) uživatelé počítačové programy VOŠIS UIM 12 28
tvůrci metadat výhody nevýhody autoři dokumentů čtenáři /uživatelé zprostředkovatelé počítačové programy rychlost nezvyšují se náklady nezvyšují se náklady objektivita jednotnost rychlost objektivita jednotnost subjektivita nejednotnost časový odstup od publikování subjektivita nejednotnost časový odstup od publikování vyšší náklady obtížnost algoritmizace tvorby metadat VOŠIS UIM 12 29
Uživatelé metadat koncový uživatel zprostředkovatel (agent) člověk počítačový program VOŠIS UIM 12 30
label / tag popisné nebo identifikační slovo nebo fráze label = značka VNĚ objektu (zpravidla 1) tag = značka UVNITŘ objektu (zpravidla více) ale neplatí to vždy VOŠIS UIM 12 31
Struktura metadat dvojice atribut hodnota např. autor Čapek řešené problémy: které atributy vybrat jakými hodnotami je naplnit jak metadata uspořádat VOŠIS UIM 12 32
Příklady různých atributů používaných pro identifikaci / popis / vyhledávání informací Příklad: informace o osobě jméno výška fotografie rodné číslo datum narození záznam v rejstříku trestů hmotnost životopis adresa barva očí zaměstnanecké číslo stav bankovního konta VOŠIS UIM 12 33
Příklady nejednotného obsahu (hodnot) atributů používaných pro identifikaci / popis / vyhledávání informací Příklad: jméno osoby Muhammad Ali Cassius Clay Eduard Schmidt Eduard Bass Bill Gates William H. Gates III. Paul Hewson Bono Vox Bono Johanna Rottová Johanna Mužáková Karolína Světlá Josef Ratzinger Benedikt XVI VOŠIS UIM 12 34
Aleksandr Sergejevič Puškin Pushkin, Aleksandr Sergeevich Poesjkin, Alexander Pouchkine, Aleksandr Sergueevitch Pouchkine, Alexandre Poushkin, Alexander Puchkin, Alejandro Puchkin, Alejandro Serguievich Puschkin, Aleksandr Sergejewitsch Puschkin, Alexander S. Pushkin, Alejandro S. Pushkin, Aleksander Sergaits' Pushkin, Aleksandr Sergeevich Pusjkin, Aleksander Pusjkin, Aleksandr Pusjkin, Alexander Pusjkin, Alexandr Puskin, Alêchxandro Puskin, Alegsandar Puskin, Aleksandar Puskin, Aleksandar S. Puskin, Aleksander S. Puskin, Aleksandir Puskin, Aleksandr Sergeevic Puskin, Aleksandr Sergejevic Puskin, Aleksandr Sergejewic Puskin, Alessandro Puskin, Alexander S. Puskin, Alexantr Sernkegiebits Puskin, Oleksandr Serhiiovych Puskini, Alek`sandre Puskyn, VOŠIS UIM 12 35
Příklady nejednotného uspořádání atributů používaných pro identifikaci / popis / vyhledávání informací Příklad: autor a název hudební skladby Kreutzerova sonáta od Ludwiga van Beethovena Beethovenova Kreutzerova sonáta Ludwig van Beethoven: Sonáta A dur pro housle a klavír, Kreutzerova Beethoven, Ludwig van: Sonáta pro housle a klavír op. 47 L. van Beethoven: Kreutzerova sonáta VOŠIS UIM 12 36