Taxonomické databáze

Podobné dokumenty
Národní autority v prostředí muzeí a galerií

Národní autority a. jejich úloha v současném (nejen)knihovnickém světě. National Authority Files/ Names. Konference Rodiny. Rody.

Katalogizační pravidla a jejich použití v praxi. Lenka Maixnerová, Michal Záviška Národní lékařská knihovna

Standardy publikace a katalogizace otevřených dat

Digitalizace a projekty CITeM

ZPŘÍSTUPNĚNÍ A ARCHIVACE PLNÝCH

Internet zdroj informací

Seminář pro vedoucí knihoven a SVI ústavů AV ČR. Aleph

Česká terminologická databáze knihovnictví a informační vědy. Bc. Jaroslava Citová, DiS. Národní knihovna ČR Knihovnický institut

Národní autority v prostředí muzeí a galerií interoperabilita s NK ČR

e-pv_kalkulace nákladů pro NK - osobní náklady

Výzvy využívání otevřených dat v ČR

Příloha č. 3. Charta projektu plné znění (pro jiné OSS než MŠMT)

12. konference Archivy, knihovny, muzea v digitálním světě

Národní portál pro prezentaci digitalizovaných sbírkových objektů muzeí a galerií. Marie Vítková

Jak budeme řešit otevřená data ve veřejné správě? Michal Rada Ministerstvo vnitra ČR

Metody tvorby ontologií a sémantický web. Martin Malčík, Rostislav Miarka

Jaká data veřejné správy ČR jsou otevřená?

Vyhledávání na portálu Knihovny.cz

Česká národní strategie otevřeného přístupu k vědeckým informacím

Stav projektu Digitální mapa veřejné správy na krajích ke dni

Jednání pracovní skupiny pro věcné zpracování. Prosinec 2013

Popis a zpřístupnění záznamů performativního umění - výzvy a možná řešení. Bohuš Získal, CESNET / NFA

Správa VF XML DTM DMVS Datový model a ontologický popis

OTEVŘENÁ DATA v České republice a v zahraničí Michal Kubáň Národní koordinátor otevřených dat Odbor hlavního architekta egovernmentu (MV ČR)

Windows Server 2003 Active Directory

Co jsou otevřená data?

Open Bibliography Data. ( Matouš Jobánek

INFORMAČNÍ ZPRAVODAJ Jednotné informační brány

Evropská digitální knihovna a autorské právo

Otevřená data. Shrnutí. Když stavím nový IS nebo upravuji existující, co musím udělat, abych byl Open Data Ready? Prosinec 2018

Projekt INTERPI. Jana Šubová Cosmotron Bohemia, s.r.o. Marie Balíková Národní knihovna ČR

Soubory národních jmenných autorit

Elektronické inf. zdroje

Linked Heritage. Koordinace standardů a technologií za účelem obohacení Europeany. Alena Součková

LINKOVACÍ SYSTÉMY, JEJICH VYUŽITÍ V PRAXI A PROPOJENÍ S GOOGLE SCHOLAR

Požadavky na systém pro automatizaci muzejní knihovny

2. FOTO, AUDIO A VIDEO SOUBORY

Témata k závěrečným bakalářským zkouškám 2019

Excelence versus (?) expertíza: regionální aktivity univerzit v mezinárodním pohledu

local content in a Europeana cloud

2014 Dostupný z Licence Creative Commons Uveďte autora-zachovejte licenci 4.0 Mezinárodní

Příloha č. 2. Charta projektu plné znění (pro MŠMT/ČŠI a příspěvkové organizace zřízené MŠMT)

1. Integrační koncept

Charta projektu úplné znění pro MŠMT a jeho příspěvkové organizace a Českou školní inspekci

PERSONÁLNÍ AUTORITY UŽITEČNÁ POMŮCKA NEJEN PRO KNIHOVNÍKY David Piňos, Lenka Maixnerová, Michal Záviška

Projekt INTERPI. Archivy, knihovny, muzea v digitálním světě Your contact information

Primo Central. Martin Vojnar MULTIDATA Praha s.r.o.

Metodika budování sbírky Webarchivu

TECHNICKÁ SPECIFIKACE VEŘEJNÉ ZAKÁZKY

Jak na opendata ve veřejné správě. Michal Rada Ministerstvo vnitra

2008 Dostupný z Licence Creative Commons Uveďte autora-zachovejte licenci 3.0 Česko

Vážení členové komise Evropského společenství.

Zpracování fondů.

Jak dál v hodnocení a financování vědy: doporučení mezinárodního auditu

Výměnný formát XML DTM DMVS PK

Seminář pro vedoucí knihoven asviústavů AV ČR ASEP

Nástroje pro správu bibliografických citací

Novinky v e-zdrojích NLK. Adéla Jarolímková, NLK

- Návštěvnost informačních zdrojů Transformace a rozvoj Oficiálního informačního systému Český Krumlov

STATUT. Úvodní ustanovení 11. Základní ustanovení. Ill. Předmět činnosti

Otevřená data ve veřejné správě ČR Tomáš Kroupa, Ministerstvo vnitra - Odbor Hlavního architekta egovernmentu

Informační média a služby

Tovek Tools. Tovek Tools jsou standardně dodávány ve dvou variantách: Tovek Tools Search Pack Tovek Tools Analyst Pack. Připojené informační zdroje

Standard výměnného formátu XML Digitální technické mapy

local content in a Europeana cloud

Informace o aktuálním dění v oblasti otevřených dat v České republice

Strategie budování sbírky Webarchiv u

MANAGEMENT I TEORIE ORGANIZOVÁNÍ ING. EVA ŠTĚPÁNKOVÁ

Návrh zajištění participace při přípravě aktualizace Strategického rámce udržitelného rozvoje

Dokumentační služba projektu MediGrid

PRODUKTY. Tovek Tools

Pracovní skupina pro věcné zpracování

Seznámení s přípravou platformy pro zajištění služeb dodávaní dokumentů včetně MVS: ZÍSKEJ

Jak mohou specializované informační zdroje pomáhat vědě, výzkumu a inovacím

Otevřená data nejen ve vzdělávání

Aplikace s odvozováním nad ontologiemi

Osobní archivy publikovaných odborných prací v medicíně jako součást Digitální knihovny NLK

Priorita IV. - Udržení transparentního systému financování sociálních služeb z rozpočtu MB a udržení metody KPSS

Seznámení s přípravou platformy pro zajištění služeb dodávaní dokumentů včetně MVS: ZÍSKEJ

Příloha: Dodatečné informace, včetně přesného znění žádosti dodavatele o dodatečné informace

PROJEKT INTERPI INFORUM Marie Balíková, Miroslav Kunt, Jana Šubová, Nadežda Andrejčíková

Otevřená data ve veřejné správě , Mikulov. Tomáš Kroupa, Ministerstvo vnitra - Odbor hlavního architekta egovernmentu

GIS Libereckého kraje

Logický datový model VF XML DTM DMVS

Výukový materiál zpracovaný v rámci projektu Výuka moderně Registrační číslo projektu: CZ.1.07/1.5.00/

Učíme se maturitní otázku Organizování z výkladové prezentace. Zpracoval Ing. Jan Weiser

Úvod do projektu. Standardizace provozních funkcí ÚSC. Součást projektu Korporátní styl řízení ve veřejné správě

Inovace výuky prostřednictvím ICT v SPŠ Zlín, CZ.1.07/1.5.00/ Vzdělávání v informačních a komunikačních technologií

Otevřený přístup (Open Access) v Akademii věd ČR

Spolupráce Bibliografie dějin Českých zemí s portálem Národní autority ČR (se zaměřením na jmenné autority)

Aktuální hlediska a trendy v přístupu k vědeckým informacím a datům. David Novák Archeologický ústav AV ČR, Praha, v. v. i.

METODIKA K PROJEKTU NG V PRAZE Modernizace bezpečnostních systémů v prostředí muzea/galerie

XERXES Portál informačních zdrojů. Ing. Lukáš Budínský PhDr. Ondřej Fabián

Kritéria pro zařazování vysokoškolsky vzdělaných pracovnic/pracovníků výzkumu a vývoje do kvalifikačních stupňů a do tarifních tříd

Ochrana práv duševního vlastnictví v Operačních programech MŠMT

Výroční zpráva o opatřeních přijatých k provádění Programu rovného zacházení provozovatele distribuční soustavy za rok JMP Net, s.r.o.

ZPRÁVA O ČINNOSTI NÁRODNÍ KNIHOVNY V PROJEKTU INTERPI ZA ROK 2013

Informační predátoři a jiná řešení. PhDr. Jindra Planková, Ph.D. Ústav informatiky, FPF Slezská univerzita v Opavě

Znalostní báze pro obor organizace informací a znalostí

Transkript:

Projekt DC07P02OUK002 Národní autority v prostředí muzeí a galerií - interoperabilita s NK ČR Taxonomické databáze Pracovní materiál Mgr. David Cigánek, 8.3.2010

taxonomie Vytváří a studuje systém Zabývá se různými formami příbuznosti a následnosti taxonomických jednotek nomenklatura Zabývá se jmény taxonů, Vytváří pravidla pro definici a užívání jmen, Jména pouze používá, ale nevytváří Taxonomická pravidla jsou zcela formální a musejí se vždy za každých okolností dodržet Kdyby se prokázalo, že smrk patří mezi papoušky, tak tam bude zařazen! Systém řeší jen do té míry, pokud ovlivňuje tvorbu jmen, Nomenklatorická pravidla jsou formalizovaná, platná jen pro danou skupinu organizmů a poskytují určitou volnost pro arbitrární rozhodování nomenklatorických komisí

http://en.wikipedia.org/wiki/phylogenetic_nomenclature#comparison_to_rank-based_nomenclature taxonomická jednotka člověk skupina definovaná podřízenou jednotkou kterou obsahuje (ovšem podle ICBN je to vždy rod!) formální definice skupiny nestanovuje které další rody do ní patří/nepatří skutečný obsah skupiny (příslušnost těch či oněch rodů do ní) je na rozhodnutí konkrétního taxonoma, resp. jeho vědeckého názoru Australopithecus šimpanz gorila orangutan Hominidae sensu stricto > > > > sensu lato gibon

Tyrannosaurus vs. Manospondylus V roce 1905 byl popsán rod Tyrannosaurus (na základě druhu Tyrannosaurus rex). Podle dalších výzkumů se ukázalo, že rod Tyrannosaurus (Osborn, 1905) je totožný s už dříve popsaným rodem Manospondylus (Cope, 1892) a současně popsaným rodem Dynamosaurus (Osborn, 1905). Platným rodovým jménem by měl být Manospondylus - z důvodu časové priority. Jméno Tyrannosaurus se ale postupem času stalo vžitým a populárním. dosavadní jméno musí být zachováno pokud "starší synonymum nebo homonymum nebylo po roce 1899 užíváno jako validní jméno" Tyrannosaurus, Osborn 1905 (nomen protectum) Syn: Manospondylus, Cope 1892 (nomen oblitum); Dynamosaurus, Osborn 1905;?Nanotyrannus, Bakker, Williams & Currie 1988; Stygivenator, Olshevsky 1995; Dinotyrannus, Olshevsky 1995 a zároveň "mladší synonymum nebo homonymum bylo pro některý taxon užíváno jako domnělé validní jméno v alespoň 25 pracích publikovaných nejméně 10 autory v předchozích 50 letech... IV. vydání ICZN, 2000

Autority Nejpodstatnější částí jsou jména a dále vazby vysvětlující synonymii ( viz, viz též ), šíři termínu a jeho příslušnost do různých pojmových systémů. Skupiny jsou pojmenovány a dále se s nimi nakládá víceméně jako se jmény. Taxonomie Systém tvoří skupiny (taxony), jména identifikující tyto skupiny a vazby, které definují: vztahy mezi jmény (platná jména, synonyma) vztahy mezi skupinami (nadřízenost / podřízenost, inkluzivitu / exkluzivitu) Každá skupina, jméno nebo vazba jsou vždy přiřazeny k jedné nebo více taxonomiím, což se udává autorskou citací. (atribut? funkční podmínka? omezení?) Biological classification (sometimes known as "Linnaean taxonomy") is still generally the best known form of taxonomy. (http://en.wikipedia.org/wiki/taxonomy) Autority Taxonomie Ontologie jména jména instance, objekty vazby skupiny (taxony) třídy vazby (vertikální, horizontální) vazby, vztahy atributy funkční podmínky omezení pravidla axiomy události

Taxonomie se zdá být obecnější obdobou autoritního systému jak jej známe z knihovního prostředí. Zcela univerzální pak je ontologické schéma, pomocí něhož lze popsat jakýkoli obecný znalostní systém. Možné strategie vytváření taxonomického systému v projektu Národní autority... CITeM: A)obohatit stávající autoritní systém NK ČR tak, aby byl schopen pracovat i se skupinami, vazbami a alternativními taxonomiemi, B)s využitím specializovaných nástrojů pro počítačové zpracování dat v taxonomii vytvořit prostředí umožňující využívat volně dostupných mezinárodně spravovaných taxonomií, C)formou namapování na CIDOC CRM navrhnout obecný spojovací prvek mezi instancemi jmen taxonomického systému a objekty v paměťových institucích. Autority Taxonomie Ontologie jména jména instance, objekty vazby skupiny (taxony) třídy vazby (vertikální, horizontální) vazby, vztahy atributy funkční podmínky omezení pravidla axiomy události

A) obohatit stávající autoritní systém NK ČR tak, aby byl schopen pracovat i se skupinami, vazbami a alternativními taxonomiemi zřejmý výchozí stav, dosažitelný výsledek i bez rozsáhlého výzkumu, maximální využití stávajícího schématu NA, ještě pevnější přimknutí ke 40. let starým standardům skupiny MARC, nutnost řešit řadu problémů nestandardními nouzovými postupy, relativně nepatrná využitelnost současných trendů (sémantický web, ontologie, CIDOC CRM...) > obstarožně vyhlížející projekt, který nebude chtít nikdo podporovat CITeM navrhne způsob jak do s použitím standardních autoritních formátů realizovat taxonomickou autoritu a připraví pravidla pro práci s ní. Implementace se ujme Cosmotron nebo jiný dodavatel v návazném projektu. Autority Taxonomie Ontologie jména jména instance, objekty vazby skupiny (taxony) třídy vazby (vertikální, horizontální) vazby, vztahy atributy funkční podmínky omezení pravidla axiomy události

B) s využitím volně dostupných taxonomických nástrojů vytvořit prostředí pro využívání dostupných mezinárodně spravovaných taxonomií - bez nutnosti vytvářet a především spravovat používané taxonomie široká mezinárodní kompatibilita ověřené a vědecky podložené postupy v zahraničí mnoho alternativních přístupů, žádný všeobecně přijímaný omezená možnost redakčně ovlivňovat vytvářené taxonomie CITeM vyhledá mezinárodně spravované taxonomie a k jedné nebo části z nich navrhne konektory pro využívání v CMS. Vlastní realizace je otázkou návazného projektu řešeného nejlépe ve spolupráci s NK ČR. Naplňování i redakce systému zůstane nadále v kompetenci správce příslušné služby, která se bude pouze vzdáleně využívat. Autority Taxonomie Ontologie jména jména instance, objekty vazby skupiny (taxony) třídy vazby (vertikální, horizontální) vazby, vztahy atributy funkční podmínky omezení pravidla axiomy události

C) formou namapování na CIDOC CRM navrhnout obecný spojovací prvek mezi instancemi jmen taxonomického systému a objekty v paměťových institucích - dostatečně obecný základ pro solidní řešení široká mezinárodní kompatibilita potenciál pro velký mezinárodní projekt potenciál pro velký mezinárodní průser mimořádná metodická a organizační náročnost nerealizovatelné bez úzké spolupráce s autory CIDOC CRM a dalšími experty bezpodmínečně nutný důraz na vyváženost projektu po teoretické a praktické stránce CITeM se transformuje v progresivní metodickou instituci evropského významu, najme specialisty a navrhne teoretické řešení. Pro jeho implementaci se bude muset počkat na speciálně pro tento účel vytvořený dotační titul z Bruselu, nebo lépe na novou EU. Autority Taxonomie Ontologie jména jména instance, objekty vazby skupiny (taxony) třídy vazby (vertikální, horizontální) vazby, vztahy atributy funkční podmínky omezení pravidla axiomy události

B) s využitím volně dostupných taxonomických nástrojů vytvořit prostředí pro využívání dostupných mezinárodně spravovaných taxonomií CITeM vyhledá mezinárodně spravované taxonomie...

Seznam jmen cévnatých rostlin květeny ČR Vzniká postupně od 90. let, aktuální verze (2007) zahrnuje všechna jména použitá v Klíči ke květeně České republiky (Kubát et al. 2002) navíc přidáno několik jmen v r. Taraxacum a Rubus, opraveny chyby. Rozsah: 4,8k jmen (jen cévnaté rostliny) Licence:? http://www.ibot.cas.cz/index.php?p=seznam&site=default kompletní květena ČR důvěryhodný zdroj včetně autorských citací, synonym, zařazení do čeledí obsahuje i oficiální česká jména podoba (zazipované XLS, DBF, MDB soubory) nelze využívat online omezené aktualizace málo použitelné pro exotické taxony

Wikispecies Za podpory Nadace Wikimedia začíná v srpnu 2004. Na základě linnéovské taxonomie je postupně vytvářena ve wiki-formátu a linkována k článkům o jednotlivých taxonech na Wikipedii. Rozsah: 210k druhů (všechny formy života) Licence: Creative Commons Wikispecies is free, because life is in the public domain! http://species.wikimedia.org návaznost na další wiki-projekty svobodná licence, nulová cena obecná popularita značný rozsah, růstový potenciál včetně cizojazyčných jmen taxonů - neřeší alternativní taxonomie volně splývá s Wikipedií místy mezernatý systém výrazně nadšenecký projekt

Encyclopedia of Life Stránka byla s prvními 30k záznamy spuštěna 26. 2. 2008 a brzy se stala velmi populární. Hodnota projektu se odhaduje na 110M dolarů. Cílem je katalogizace všech vědě známých druhů 1.8M. Informace kompiluje z několika vědeckých databází, v dozorčí radě projektu zasedají renomovaní vědci světového formátu. Rozsah: 1,5M druhů (všechny formy života) Licence: Creative Commons http://www.eol.org výrazně odborný charakter rozsáhlé informace k taxonům vyčerpávající rozsah webové služby v beta-verzi zatím slabá podpora pro používání alternativních taxonomií

Global Names Index Syntetický zdroj více než 30 velkých databází vědeckých jmen. Společná iniciativa GBIF a EOL. Parser umožňuje stahování informací k hledaným jménům (až 5k najednou!) ve 4 různých formátech vč. XML. Rozsah: 18,4M jmen (všechny formy života) Licence: MIT, obsah jako public domain http://www.globalnames.org výrazně odborný charakter vyčerpávající rozsah syntetický charakter parser, API - nejasná kvalita deduplikace parser v době testu nefunkční neumožňuje alternativní taxonomie

Global Biodiversity Information Facility Syntetický zdroj zprostředkovávající přístup k mnoha oborovým a národním databázím od více než 300 poskytovatelů. Checklist Bank (taxonomický thesaurus) měl být podle informací na webu připraven k recenzi ve III. Čtvrtletí loňského roku. Rozsah: 196,5M záznamů o výskytů druhů, Licence: zachovává práva poskytovatelů dat http://www.gbif.org výrazně odborný charakter rozsah - pouze informace o výskytu druhů neumožňuje alternativní taxonomie

Catalogue of Life Společná iniciativa Species 2000 a ITIS zahájená v červnu 2001. Cílem je sestavení katalogu všech druhů organismů do roku 2011. Práce probíhají kompilací 66 taxonomických databází ve spolupráci více než třemi tisíci specialisty z celého světa. Vydává se roční checklist a dynamický checklist (vydávaný častěji, méně rozsáhlý, obohacen o mezinárodní checklisty). Rozsah: 1 160 711 (aktuální Annual Checklist 2009) Licence: zdarma pro nekomerční využití, vždy nutná citace zdroje http://www.catalogueoflife.org výrazně odborný charakter expertní řízení zřejmě velmi kvalitní deduplikace - API? neumožňuje alternativní taxonomie

BioLib Původní český projekt, nyní mezinárodního charakteru. Jako zdroj dat využíván i některými většími sysntetickými projekty. Zaměřen jak na odbornou, tak i laickou veřejnost. Spolupracuje (především na mapovacích projektech) s orgány ochrany přírody, Národním muzeem a vědeckou komunitou. Deklarován jako nekomerční. Provozovatelem je Český Podnikatelský Servis s.r.o. Rozsah: 713k taxonů, 991k vědeckých názvů, 257k národních názvů, 110k obrázků Licence: nositelem autorských práv jsou autoři textů a fotografií http://www.biolib.cz soukromý nadšenecký projekt s odborným přesahem wiki-like řízení vstupu dat národní názvy taxonů - API? udržitelnost projektu? neumožňuje alternativní taxonomie kolísající aktivita webu

NCBI Taxonomy Zdroj zaměřený na využití pro studie v genetice, molekulární biologii, biotechnologii a medicíně. Spravuje National Center for Biotechnology Information. Rozsah: 160k (jen druhy s dostupnými DNA daty) Licence:? http://www.ncbi.nlm.nih.gov/taxonomy profesionální projekt vládní (U.S.) financování taxonomie mimo primární zájem neumožňuje alternativní taxonomie jako autoritní zdroj zjevně nepoužitelné

Tree of Life Web Project Edukativně laděný projekt Arizonské univerzity. Obsah rozdělený na samostatné stránky věnované konkrétním taxonům, zejména z vyšších hierarchických úrovní. Od roku 2007 spolupracuje s EOL. S možností vytváření alternativních taxonomií se počítá teprve do budoucna. Rozsah: >10k stránek (~ neznámý počet taxonů) Licence: zachovává se copyright autorů obsahu, XML data poskytována pod licencí Creative Commons http://tolweb.org/tree/ grafika, ilustrativnost XML formát, webové služby - omezený rozsah primárně edukativní web neumožňuje alternativní taxonomie

Integrated Taxonomic Information System Jeden z největších a nejrychleji rostoucích taxonomických informačních zdrojů. Partner GBIF, Species 2000 a vládních agentur v USA, Kanadě a Mexiku (ITIS-North America). Společně se Species 2000 (Catalogue of Life) zajištují taxonomickou základnu mamutímu projektu Encyclopedia of Life (EOL). Rozsah: necelých 500k jmen Licence:public domain http://www.itis.gov profesionální projekt vládní podpora (USA, Kanada...) rychlý růst zjevně kvalitní deduplikace podrobně dokumentované webové služby, možnost stažení celé databáze zaměření především na severoamerické druhy (u rostlin výlučně) neumožňuje alternativní taxonomie

International Plant Names Index Databáze jmen a bibliografie pro semenné rostliny a kapraďorosty. Kompilováno na základě Index Kewensis a několika dalších digitálních/digitalizovaných zdrojů. Poskytuje pouze jmenný index, bez značení platnosti jména. Rozsah:? (z nepřímých zdrojů lze usuzovat na cca 1,3M) Licence: free (copyright The Royal Botanic Gardens, The Harvard University Herbaria, The Australian National Herbarium) http://www.ipni.org profesionální projekt udržitelnost, dlouhodobá podpora kvalita dat srovnatelná s autoritami URN identifikátory ke jménům - zcela bez taxonomického systému chybějí starší supragenerická jména

ubio The ubio Taxonomic Name Server acts as a name thesaurus. Rozsah: NameBank - 11,1M jmen, 532k nomenklatorických skupin, ClassificationBank 90 klasifikací, 9,6M konceptů, 5,9M synonym Licence:? http://www.ubio.org/ vysoká míra konformity s autoritními systémy profesionální projekt řada webových služeb variantní taxonomie -?

Srovnání jednotlivých služeb Wsp. EoL GNI GBIF CoL BioLib NCBI ToL ITIS IPNI ubio Profi služba Profi vstup & deduplikace Variantní taxonomie Webové služby, API Dlouhodobá udržitelnost Národní názvy taxonů Významný růstový potenciál Dostatečné geografické pokrytí Dostatečné taxonomické pokrytí? 1,4 18,4 5,4 2,1 0,1? 0,1 0,5 1,3 10,0 Rozsah (mil. jmen, podle http://www.globalnames.org/data_sources)

Návrh dalšího postupu v oblasti taxonomických autorit vybrat jeden až tři vhodné mezinárodní systémy, zvážit potřebnost samostatné autoritní mezivrstvy pro taxonomické autority (oproti přímé komunikaci s uživateli), navrhnout způsob propojení s NA ČR ve spolupráci s NK ČR připravit návazný projekt pro taxonomické autority (řešení návaznosti na NA, zapojení mimoknihovních uživatelů)