Rešeršní a studijně rozborová činnost

Podobné dokumenty
Studijní informační zdroje

Workshop k terminologickým otázkám organizace znalostí Motivace a hypotézy projektu. Cíl projektu NAKI DF13P01OVV013

Internet. Osnova. II. Vyhledávací nástroje. Proč je vyhledávání na Internetu tolik komplikované? Jak se stát úspěšným hledačem pokladů na Internetu

Číslo a název šablony III / 2 = Inovace a zkvalitnění výuky prostřednictvím ICT

Metadata, sémantika a sémantický web. Ing. Vilém Sklenák, CSc.


Web 2.0 vs. sémantický web

Metody tvorby ontologií a sémantický web. Martin Malčík, Rostislav Miarka

Sémantický web 10 let poté

Rešeršní a studijně rozborová činnost

Vývoj moderních technologií při vyhledávání. Patrik Plachý SEFIRA spol. s.r.o.

InternetovéTechnologie

Quo vadis, vyhledávání (na webu)?

Vyhledávání na Internetu

Kurz pro studenty oboru Informační studia a knihovnictví 5. Informační architektura

Ontologie. Otakar Trunda

Elektronické informační zdroje (VIKBA25)

InternetovéTechnologie

Kde hledat odborné články?

InternetovéTechnologie

Linked Heritage. Koordinace standardů a technologií za účelem obohacení Europeany. Alena Součková

D R U P A L V O J T Ě C H K U S W O J T H A

manuscriptorium Manuscriptorium v Evropě Manuscriptorium.com

WWW jako dynamická knihovna

Elektronické informační zdroje (VIKBA25)

INFORMAČNÍ ZDROJE NEMEDICÍNSKÉHO PŮVODU RELEVANTNÍ PRO ŘEŠENÍ MEDICÍNSKÝCH INFORMAČNÍCH POTŘEB Richard Papík, Martin Souček

Databázové systémy BIK-DBS

Využití informačních technologií v cestovním ruchu P1

Témata k závěrečným bakalářským zkouškám 2019

SCOPUS a WEB OF SCIENCE

Databázové systémy úvod

Uživatelská podpora v prostředí WWW

Od relačních databází k technologiím sémantickému webu

UDS for ELO. Univerzální datové rozhraní. >> UDS - Universal Data Source

Databázové systémy úvod

Seminář pro vedoucí knihoven a SVI ústavů AV ČR. Aleph

Použití databází na Webu

OpenGrey. Petra Pejšová, NTK, ČR Christiane Stock, INIST-CNRS, Francie. Digitálná knižnica 2012, dubna 2012 Jasná pod Chopkom

Máte to? Summon jako základní vyhledávací nástroj NTK

Technologie. Osnovy kurzu: Školení správců systému. 1. den, dopolední blok

Zpětná vazba od čtenářů 11 Dotazy 11 Zdrojové kódy ke knize 11 Errata 11 Typografické konvence použité v knize 12

Vysokoškolské kvalifikační práce na AMU:

Databázové systémy. Doc.Ing.Miloš Koch,CSc.

Vybraná zajímavá Lotus Notes řešení použitelná i ve vašich aplikacích. David Marko TCL DigiTrade

Strategie a metody rešerší, které mohou vést k přidané hodnotě

Tovek Server. Tovek Server nabízí následující základní a servisní funkce: Bezpečnost Statistiky Locale

Využití WWW jako efektivního informačního zdroje

Znalostní systém nad ontologií ve formátu Topic Maps

Vyhledávání v souborných katalozích

Elektronické zdroje Národní technické knihovny

Okruhy ke SZZK nmgr. studium knihovnické zaměření

Digitální knihovny: principy a problémy Jaroslav Pokorný MFF UK Katedra softwarového inženýrství Praha

OpenGrey. Petra Pejšová, NTK, ČR Christiane Stock, INIST-CNRS, Francie

Elektronické inf. zdroje

Stručný obsah. K2118.indd :15:27

Archivace relačních databází

C# - Databáze úvod, ADO.NET. Centrum pro virtuální a moderní metody a formy vzdělávání na Obchodní akademii T.G. Masaryka, Kostelec nad Orlicí

České internetové medicínské zdroje v Národní lékařské knihovně

Sémantická interoperabilita v rámci iniciativ EU

RDF a RDF Query. Jakub Nerad 1. prosince Nerad () RDF a RDF Query 1. prosince / 16

14,819 (5.84 Stránky/Návštěva) Čvn Kvě Čvc Srp 2014

7. SEO Nástroje pro analýzu úspěšnosti. Web pro kodéry (Petr Kosnar, ČVUT, FJFI, KFE, PINF 2008)

Virtuáln. lní knihovny přístup k dokumentům a službám kdykoliv a odkudkoliv

Výměnný formát XML DTM DMVS PK

Michal Krátký, Miroslav Beneš

Otázky k BZK pro studující od akademického roku 2010/2011 Povinný předmět - Informační věda

Mgr. Vlastislav Kučera Struktura stránky, hlavička,

Petr Nevrlý

PRODUKTY Tovek Server 6

10. SEO Obsah meta, konkrétní elementy v html kódu. Web pro kodéry (Petr Kosnar, ČVUT, FJFI, KFE, PINF 2008)

Ukládání a vyhledávání XML dat

23. Splnitelnost a platnost výrokových formulí, dedukce ve výrokové logice

Databáze na webu Národní knihovny v Praze

Databázové a informační systémy

WWW dotazovací služby pro prostorová data URM. Jiří Čtyroký Útvar rozvoje hl. m. Prahy

Mgr. Petr Šmejkal.

MASARYKOVA UNIVERZITA FILOZOFICKÁ FAKULTA STUDIJNÍ PROGRAM. Kabinet knihovnictví obor informační studia a knihovnictví

C3 Vyhledávání na Internetu

Identifikátor evropské judikatury ECLI Nejvyšší soud Úsek místopředsedy Nejvyššího soudu Oddělení dokumentace a analytiky judikatury ČR (ODAJ)

Pracovní skupina pro věcné zpracování

Open Bibliography Data. ( Matouš Jobánek

předměty: ukončení: Zápočet + Zkouška / 5kb např. jméno, název, destinace, město např. student Jan Novák, narozen

Tvorba informačních systémů

BrightStor ARCserve Backup r Michal Opatřil - Consultant - michal.opatril@ca.com

Lenka Maixnerová, Alena Šímová, Helena Bouzková, Filip Kříž, Ondřej Horsák, Marie Votípková. Národní lékařská knihovna, Praha, Česká republika

PROJEKT INTERPI V ROCE 2015

materiál č. šablony/č. sady/č. materiálu: Autor: Karel Dvořák Vzdělávací oblast předmět: Informatika Ročník, cílová skupina: 7.

Informační zabezpečení studia na Zahradnické fakultě MENDELU. Elektronické informační zdroje

Anotace. Klíčová slova. 1. Úvod

Nové geovědní informační služby:

Informační vzdělávání PdF


Co je (staro)nového v DSpace

Dobývání znalostí z webu web mining

Geografické informační systémy p. 1


Internet zdroj informací

Název projektu: Zvýšení adaptability zaměstnanců organizací působících v sekci kultura Název kurzu: Seminář pro knihovníky a informační pracovníky

Komunikace člověk počítač v přirozeném jazyce

Digitální konkordance a Registr digitalizace v Manuscriptoriu,

Transkript:

VIKMA06 Rešeršní a studijně rozborová činnost 3. 5. 2013: Přednáška P11: Vyhledávání netextových informací, vyhledávání a internet, tvorba rejstříků a bibliografií FF MU, jaro 2013 Mgr. Josef Schwarz 126172@mail.muni.cz

Netextové informace obraz, zvuk, kombinace textová složka je marginální internet velký objem netextových informací omezené možnosti vyhledávání vyhledávače (podle popisku příklad 1, 2, 3) způsoby přístupu prohlížení (příklad 1, 2) vyhledávání (příklad 1)

Indexace netextových inf. podstatně složitější než indexace textových inf. hlediska indexace/vyhledávání hlediska 1 věcnost (ofness) tvrdá indexace výrazovost (aboutness) měkká indexace hlediska 2 základní vlastnosti (barva, tvar) logické vlastnosti (vztah mezi objekty) abstraktní vlastnosti (metaforický význam)

Vyhledávání netextových inf. content-based image retrieval (CBIR) vyhledávání podle obsahu automatické zpracování obrazu (image processing) description-based image retrieval (context-based, concept-based) vyhledávání podle popisu (kontextu, pojmového vyjádření) (image indexing)

CBIR vyhledávání na úrovni pixelů QBIC - Query by Image Content (IBM) příklad 1 2 objektové vyhledávání extrahování obrazových objektů image mining (dolování obrazových informací) extrakce podobných znaků z celé db CIRES extrakce všech vlastností bez prvotní znalosti

Vyhledávání podle popisu výhoda: sémantický obsah obrazu nevýhoda: subjektivitainkonzistence indexace způsob indexace závisí na typu kolekce a požadavcích uživatelů indexace biografických vlastností předmětových vlastností fyzických vlastností vztahových vlastností

Řízené slovníky pro popis netextových dokumentů ICONCLASS příklad ATT (Art & Architecture Thesaurus) Thesaurus for Graphic Materials

Aplikační oblasti průmyslové vlastnictví (ochranné známky) lékařství umění a architektura astronomie kriminologie atd.

Vyhledávání a internet Vyhledávače Skrytý web Sémantický web

Vyhledávače Google Yahoo! Bing Ask.com Exalead Metavyhledávače Metacrawler TurboScout Vizualizace TouchGraph Quintura Obrázky Picsearch Zvuk FindSounds

Neviditelný web

Typy neviditelnosti Nepřehledný web (Opaque web) Soukromý web (Private web) Vlastnický web (Proprietary web) Skutečně neviditelný web (Truly invisible web)

Nepřehledný web Obsahuje soubory, které mohou být, ale z určitých příčin nejsou vyhledávači indexované. Důvody: hloubka indexování (depth of crawling) frekvence indexování (zprávy, inzerce, ceny akcií) maximální počet viditelných výsledků odpojené stránky

Soukromý web Obsahuje stránky, které by robot dokázal zaindexovat, ale správce webu to znemožňuje. stránky chráněné heslem soubor robots.txt metatagy noindex, nofollow

Vlastnický web Část webu, ke které je přístup pouze po splnění určitých podmínek. stránky vyžadující souhlas s podmínkami pro vstup stránky dostupné po zaplacení poplatku

Skutečně neviditelný web Stránky, které roboty neindexují kvůli svým technickým omezením. dynamicky generované stránky relační databáze (Oracle, MS SQL Server, IBM DB2)

Přednosti hlubokého webu specializovaný obsah komplexnější informace sofistikovanější uživatelské rozhraní větší důvěryhodnost oborovost

Přístup k hlubokému webu metavyhledávače specializované vyhledávače, katalogy, adresáře oborové (předmětové) vyhledávače, katalogy, adresáře referenční zdroje weby knihoven digitální a virtuální knihovny oborové databáze weby organizací knihy (archivy, e-books) blogy

Výběr vyhledávačů hlubokého webu Complete Planet adresář více než 70 000 databází a specializovaných vyhledávačů BUBL LINK polytematický (DDC) katalog vybraných internetových zdrojů ResourceShelf blog s informacemi a novinkami o informačních zdrojích (připravovaný informačními profesionály)

Sémantický web

klasický x sémantický web Tvořen tak, aby jeho obsahu porozuměl pouze člověk Citlivý na použitou terminologii Nalezených dokumentů je obvykle příliš mnoho nebo naopak příliš málo (případně žádné) Výsledkem vyhledávání je pouze jedna stránka Rozšíření klasického webu Obsah ve strojově přístupné formě Vyhledávání podle klíčových slov nahrazeno zodpovídáním dotazů Dotaz je možno zodpovědět na základě extrakce informací z více stránek

Klasická podoba webu <h1>agilitas Physiotherapy Centre</h1> Welcome to the home page of the Agilitas Physiotherapy Centre. Do you feel pain? Have you had an injury? Let our staff Lisa Davenport, Kelly Townsend (our lovely secretary) and Steve Matthews take care of your body and soul. <h2>consultation hours</h2> Mon 11am - 7pm<br> Tue 11am - 7pm<br> Wed 3pm - 7pm<br> Thu 11am - 7pm<br> Fri 11am - 3pm<p> But note that we do not offer consultation during the weeks of the <a href="...">state Of Origin</a> games.

Web s explicitními metadaty XML + XML schéma RDF + RDF schéma <company> <treatmentoffered>physiotherapy</treatmentoffered> <companyname>agilitas Physiotherapy Centre</companyName> <staff> <therapist>lisa Davenport</therapist> <therapist>steve Matthews</therapist> <secretary>kelly Townsend</secretary> </staff> </company>

Sémantický web Základní složky (předpoklady) SW strukturace dokumentů vyjádření sémantiky - ontologie vyhledávací nástroje - agenti standardy syntaktická složka URI strukturální složka XML sémantická složka RDF + RDFS (schéma RDF) OWL, OIL

Vrstvy sémantického webu

Sémantický web příklady řešení W3C příklad aplikace RDF energetika Výzkum The Open University London, Knowledge Media Institut Magpie Stanford Knowledge Systems Laboratory DAML (agenti) EU, 5. rámcový program On-to-knowledge

Tvorba rejstříků a bibliografií Účel a použití Typologie Metody tvorby