Indexování a vyhledávání matematických formulí
|
|
- Daniel Bárta
- před 6 lety
- Počet zobrazení:
Transkript
1 Indexování a vyhledávání matematických formulí Vlastimil KREJČÍŘ Ústav výpočetní techniky, Masarykova univerzita, Brno krejcir@ics.muni.cz INFORUM 2018: 24. ročník konference o profesionálních informačních zdrojích Praha, Abstrakt Vyhledávání v digitálních textových dokumentech je dnes poměrně dobře zvládnutou disciplínou a běžnou součástí mnoha informačních systémů. Existuje však řada speciálních aplikací, kde běžné známé metody indexace a plnotextového vyhledávání selhávají. Článek se populární formou věnuje problému indexace a vyhledávání matematických vzorců, které jsou důležitou součástí odborných dokumentů. Na řadě příkladů je uvedena celá problematika a způsob, jakým ji lze řešit. Indexace a vyhledávání v textech je dnes v digitálním světě dobře zvládnutou technologií a součástí mnoha informačních systémů. Uživatelé považují možnost vyhledávat v plných textech mít ono univerzální okénko pro vložení dotazu jako je tomu ve vyhledávači Google za naprostou samozřejmost. Stále se však pohybujeme v oblasti hledání běžné textové informace, kdy dotaz snadno napíšeme na klávesnici počítače. Existuje však řada speciálních aplikací, kde známé metody indexace a plnotextového hledání selhávají. Typickým příkladem jsou obory, které pracují s matematickými formulemi: samotná matematika, fyzika, architektura, strojírenství, Potřebujeme však vyhledávat v matematických formulích? Je to pro vědce skutečně přínosné? Motivací lze najít více primární je však zájem odborné komunity, který vyvstal v minulých letech, kdy docházelo k rozvoji digitálních knihoven specializovaných na matematickou odbornou literaturu. Primárně byly tyto knihovny budovány na národní úrovni, později vznikl celoevropský projekt EuDML, který zapojil a agregoval obsah národních matematických digitálních knihoven a umožnil je prohledávat všechny z jednoho místa. Vznik matematických knihoven často iniciovali sami matematici a na jejich tvorbě se podíleli. Možnost speciálního prohledávání odborných textů obsažených v těchto knihovnách se i jim jevila a jeví jako zajímavé a přínosné rozšíření, citujme: Q: What functionality and incentives would made a working mathematician to login and use a modern DML as EuDML? A: Math formulae search. Prof. James Davenport, CEIC member, MKM 2011 PC chair, on panel at DML 2011 workshop in Bertinoro as a reply. V České republice je možné pracovat s Českou digitální matematickou knihovnou (DML-CZ) 1, shromažďující odbornou matematickou literaturu, která kdy vyšla na historickém území českých zemí. V současné době ji provozuje Matematický ústav Akademie věd ČR. Na jejím vývoji spolupracovala řada partnerů v ČR, mj. i vědci z Fakulty informatiky Masarykovy univerzity, kteří 1 Česká digitální matematická knihovna (DML-CZ), dostupná na
2 se pod vedením doc. Petra Sojky začali zabývat problémem indexování a vyhledávání matematických formulí. Cílem bylo nalézt řešení, které by bylo možné uvést do praxe přesné a pro koncové uživatele dostatečně komfortní vyhledávání matematických formulí. Tedy umožnit uživatelům pomocí speciálního formuláře ve webovém prohlížeči zadat matematickou formuli (například a 2 + b 2 = c 2 ) a jako výsledek vrátit odkazy na články, ve kterých je tato formule použita. Řešení tohoto úkolu iniciovalo vznik výzkumné skupina MIR (Maths Information Retrieval), která se problému intenzivně věnovala a stále věnuje. Jak na vyhledávání z pohledu počítače Abychom lépe pochopili, jaké těžkosti s sebou práce s matematickými formulemi z pohledu počítače nese, nastíníme si zjednodušeně, jak pracuje počítač při hledání v běžném textu. Pro lepší představu použijeme příklad s vyhledávačem Google. Hledáme-li například informace o konferenci Inforum 2018, pak do vyhledávače Google zadáme prostý dotaz Inforum 2018 a Google nám okamžitě vrací výsledky seřazené dle relevance (tak jak ji určil dle svých pravidel on sám). Z pohledu počítačového je dotaz Inforum 2018 pouze zakódovaným řetězcem znaků, tedy I, n, f, Po odeslání dotazu do vyhledávače Google je tento řetězec na tyto jednotlivé znaky rozložen, a jednotlivě znak po znaku (tedy I hledané = I v indexu, n = n, ) porovnáván s obsahem indexu (databáze obsahu webu, kterou si Google průběžně buduje a aktualizuje), ve které má tento řetězec Google indexován spolu s informací, na které webové stránce tento řetězec při indexaci nalezl. Odkaz na nalezenou stránku pak dá jako výsledek hledání. Tedy hledaný výraz Inforum 2018 souhlasí s indexovaným Inforum 2018 a výsledek hledání je jednoznačný. Uvažujeme-li matematické formule, výše uvedený jednoduchý způsob porovnávání nemůže správně fungovat. Důvodem je syntaktická (nikoli sémantická!) nejednoznačnost zápisu v matematice. Vezměme příklad Pythagorovy věty, obvyklý zápis je z matematického hlediska totéž co a 2 + b 2 = c 2 x 2 + y 2 = z 2 Pokud by uživatel zadal do vyhledávače první variantu Pythagorovy věty a vyhledávač měl klasickým způsobem indexovanou druhou variantu, pak výsledek bude, že daná formule nebyla nalezena. Vyhledávač totiž tyto formule neztotožní začne je porovnávat znak po znaku a shodu vyloučí hned u znaku prvního, protože a je jiný znak než x. Proto je třeba k matematickému vyhledávání a indexování přistupovat zcela jiným způsobem. Dále v článku se podrobněji podíváme, jak se s podobnými problémy, spojenými s počítačovým zpracováním matematiky, vypořádat. Klíčové otázky, které při důkladnějším rozboru celé problematiky vyplynou, jsou následující: Jak zakódovat matematické formule, aby byly strojově zpracovatelné? Jak matematické formule extrahovat z textů (např. historických skenovaných)? Jak získané matematické formule indexovat a následně porovnávat? Jakým způsobem napsat vyhledávací dotaz? Jak třídit a vážit výsledky vyhledávání?
3 Jak zakódovat matematické formule? Odpovědí na otázku je jazyk MathML (Mathematical Markup Language), standard konsorcia W3C, které je dnes zodpovědné na standardizaci v oblasti webu (hlavně jazyka HTML). MathML je v podstatě specializovaná varianta jazyka XML a slouží pro zápis matematických formulí. Například kód <math> <mfrac> <mn>1</mn> <msup> <mi mathvariant="bold">x</mi> <mn>2</mn> </msup> </mfrac> </math> se bude vykreslovat (renderovat) na zlomek 1 x 2 Jazyk MathML je dnes součástí všech běžně rozšířených prohlížečů. To znamená, že pokud výše uvedený kód vložíte do kódu HTML, pak jej prohlížeče rozpoznají a zobrazí daný matematický výraz. MathML se již v praxi hojně používá, viz například výklad Pythagorovy věty na Wikipedii 2. Jak získat matematické formule v MathML? Abychom mohli matematické formule indexovat, potřebujeme je mít zakódované v MathML. Jejich získání je velmi nesnadný úkol, ať již uvažujeme odborné texty dostupné pouze v tištěné podobě, nebo i v podobě digitální. U historických tištěných textů je nutné provést specializovanou formu OCR 3, schopnou na naskenované stránce rozeznat matematickou formuli, v ní jednotlivé znaky a vše převést do MathML. V současné době tento problém není dostatečně vyřešen existuje varianta programu Infty Reader, která OCR matematických formulí umí, výsledky jsou bohužel velmi neuspokojivé a pro praktické nasazení špatně použitelné. Varianta, kdy již máme odborný text v digitální podobě, je zajímavější. Matematická komunita s oblibou používá pro sazbu matematických textů systém TeX (a jeho varianty LaTeX, AmsTeX apod.). Bohužel systém TeX dává autorům poměrně dosti volnosti v podobě tvorby vlastních maker a to strojový převod do MathML velmi komplikuje. I přesto se jedná o perspektivní způsob, jakým MathML získat, a proto pro konverzi ze systému TeX do MathML existuje řada programů (LaTeXML). K dispozici jsou také programy pro matematickou komunitu, které s jazykem MathML přímo pracují a jejichž výstupem mohou formule v MathML být. Jmenujme alespoň rozšířený software pro matematické výpočty MATLAB. 2 Pythagorova věta na české Wikipedii: 3 OCR Optical Charecter Recognition: metoda digitalizace skonovaných textů, viz
4 Jakým způsobem zadávat dotazy? Z hlediska zpracování počítačem by optimální bylo, kdyby uživatelé zadávali dotazy na matematické formule přímo v jazyce MathML. Ten je ale uživatelsky málo přívětivý. Matematická odborná komunita je uvyklá použití notace systému TeX. Proto existuje software, který umožňuje přímo v prohlížeči formuli zapsanou v notaci TeXu vykreslovat (renderovat) za běhu (on-the-fly). To zároveň slouží zadavateli i jako zpětná kontrola, píše-li formuli správně. Jak matematické formule indexovat? Jedná se v celém procesu práce s matematickými formulemi o klíčovou otázku. Problémy spojené s indexací matematických formulí jsme již mírně nastínili v předešlém textu, podívejme se proto na ně nyní podrobněji. Kromě již uvedené záměny proměnných (tedy že z matematického hlediska je a 2 + b 2 = c 2 totéž co x 2 + y 2 = z 2 ), lze objevit i řadu dalších pro počítačové zpracování problémových míst. Například když ve vzorci Pythagorovy věty ponecháme proměnné a, b a c, ale prohodíme jejich pořadí b 2 + a 2 = c 2 To je opět Pythagorova věta, pouze jsme využili toho, že při sčítání nezáleží na pořadí sčítanců. Můžeme i uvažovat vzorec a n + b n = c n jedná se o Velkou Fermatovu větu 4, jež je zobecněním věty Pythagorovy. Ale lze nalézt i mnohem triviálnější problémy, které komplikují strojové porovnávání formulí. Bude nám stačit jedno číslo, číslo reprezentující jednu polovinu. Platí následující rovnost: 1 2 = 0,5 = 2 1 Z hlediska počítačového porovnávání dle znaků jde o zcela různé řetězce znaků. Komplikovanější příklad z oblasti úpravy odmocnin: 8 = 2 2 Tým MIR z Fakulty informatiky navrhl a implementoval postupy, jak se s výše uvedenými problémy vypořádat. Jsou založeny na principu rozložení a zobecnění matematické formule. Celý postup při indexaci lze shrnout do několika kroků: 4 Velká Fermatova věta říká, že neexistuje žádné přirozené číslo n větší než 2, pro které by rovnice a n + b n = c n měla řešení. Geniální matematik Pierre de Fermat si v 17. století k této rovnici poznačil na okraj jedné z knih, že zná jednoduchý důkaz výše uvedené věty, ale okraj na stránce dané publikace je příliš malý, aby jej tam mohl celý vepsat. Z Fermatovy strany se jednalo pravděpodobně pouze o žert, protože důkaz Velké Fermatovy věty provedl až v roce 1994 americký matematik Andrew Wiles s pomocí prostředků, které Fermat nemohl ve své době znát. Wilesův důkaz patří k jedněm z nejsložitější důkazů v historii matematiky.
5 Canonicalization: úprava vstupního MathML. Ordering: seřazení proměnných (například u komutativních operací typu sčítání a násobení). Tokenization: rozložení formule na části, což následně umožní hledat i podformule, tedy se například dotázat jen a 2 + b 2 a systém jako výsledek nabídne články s celou Pythagorovou větou. Unification: nahrazení proměnných a čísel (konstant) zástupnými symboly. Když uživatel zadá jako dotaz matematickou formuli, pak s touto formulí proběhne stejný proces, a výsledný kód se porovnává s obsahem indexu. Protože jsou jak indexovaná, tak hledaná formule dostatečně zobecněny, může systém najít shodu i v případě, že se syntakticky dané formule neshodují: systém tak vyhodnotí a 2 + b 2 = c 2 a x 2 + y = z 2 jako formule totožné. Po zobecnění totiž obě vypadají přibližně takto: var1 const1 + var2 const1 = var3 const1. Přesnější schéma celého procesu uvádíme v následujícím schématu: Matematiky znalý čtenář si jistě dokáže představit i mnohem komplikovanější situace, které mohou nastat. Absolutně přesný systém indexace a vyhledávání by musel s matematickými formulemi sémanticky pracovat mnohem hlouběji. Jak třídit a vážit výsledky vyhledávání? Při hledání shody v indexu je často nalezena shoda méně přesná, nebo jen shoda s částí formule apod. Zároveň například přirozeně očekáváme, že pokud se hledaná formule shoduje i v názvech a pořadí proměnných a hodnotách konstant, pak bychom takový výsledek chtěli vidět na předních místech. Naopak, čím více se formule syntakticky liší, tím je shoda méně přesná a výsledek hledání by měl být řazen níže. Opět si vezměme příklad Pythagorovy věty a dotaz a 2 + b 2 = c 2.
6 Přirozeně očekáváme, že články, ve kterých se věta vyskytuje právě v tomto tvaru, by měly být řazeny ve výsledcích dříve než články, ve kterých se formule vyskytuje ve tvaru s proměnnými x, y a z. Výsledky vyhledávání je tedy třeba velmi pečlivě vážit a třídit a opět se jedná o nesnadnou úlohu. Systém MIaS Tým MIR výše uvedené postupy implementovat do funkčního software, který je nazván MIaS (Mathematical Indexer and Searcher). Jedná o open-source knihovnu v jazyce Java, kterou může kdokoli volně použít. Systém MIaS provede příslušné transformace matematické formule a výsledkem těchto transformací je tzv. M-term, matematická formule zakódovaná do obyčejného textového řetězce znaků, který je dále možné indexovat běžnými metodami užívanými pro text. Pro představu uveďme příklad M-termu: F(N(1)J(I[V=B](1)N(2))). V praxi byl systém testován nad daty z repozitáře Arxiv.org a nasazen v Evropské digitální matematické knihovně EuDML, kde si jej může zájemce snadno vyzkoušet. Další možností, jak si hledání formulí vyzkoušet, je webové rozhraní systému MIaS zvané WebMIaS 5. Testování systému je komplikované v reálném provozu je třeba, aby uživatelé, kterými jsou v tomto případě odborníci-matematici, sami řekli, je-li vyhledávání dostatečně přesné a funkční. V současnosti se jako největší problém jeví extrakce matematických formulí z článků a jejich konverze do formátu MathML. Samotné algoritmy systému MIaS fungují poměrně dobře a dostatečně přesně, jejich nasazení brání nekvalitní data pro indexaci. Na Ústavu výpočetní techniky MU jsme provedli integraci systému MIaS do systému Dspace, který slouží jako platforma pro provoz České digitální matematické knihovny DML-CZ. Problém nedostatečně kvalitních vstupních dat (extrakce a převod matematických formulí z článků v DML-CZ) však dosud brání zpřístupnění této funkcionality pro koncové uživatele. Závěr Popsali jsme motivaci pro matematické vyhledávání, způsoby, jak jej řešit, i praktickou implementaci. V dané oblasti je ještě řada otevřených problémů a celý systém indexace a vyhledávání matematických formulí je možné dále zkoumat a vylepšovat. Závěrem ještě jmenujme členy MIR týmu Fakulty informatiky Masarykovy univerzity, kteří systém MIaS budují: doc. RNDr. Petr Sojka, Csc. RNDr. Martin Líška RNDr. Michal Růžička, Ph.D. Zájemci o podrobnější informace mohou navštívit domovskou stránku týmu MIR na adrese na které naleznou především odkazy na odborné články, které celou problematiku přesně a do hloubky popisují. 5 WebMIaS, webové rozhraní pro testování systému MIaS:
Indexování a vyhledávání matematických formulí
Indexování a vyhledávání matematických formulí Vlastimil Krejčíř, krejcir@ics.muni.cz Inforum 2018, 29. 30. května 2018, Praha V. Krejčíř Indexování a vyhledávání matematických formulí Inforum 2018 1 /
Vývoj moderních technologií při vyhledávání. Patrik Plachý SEFIRA spol. s.r.o. plachy@sefira.cz
Vývoj moderních technologií při vyhledávání Patrik Plachý SEFIRA spol. s.r.o. plachy@sefira.cz INFORUM 2007: 13. konference o profesionálních informačních zdrojích Praha, 22. - 24.5. 2007 Abstrakt Vzhledem
Vyhledávání. doc. Mgr. Jiří Dvorský, Ph.D. Katedra informatiky Fakulta elektrotechniky a informatiky VŠB TU Ostrava. Prezentace ke dni 21.
Vyhledávání doc. Mgr. Jiří Dvorský, Ph.D. Katedra informatiky Fakulta elektrotechniky a informatiky VŠB TU Ostrava Prezentace ke dni 21. září 2018 Jiří Dvorský (VŠB TUO) Vyhledávání 242 / 433 Osnova přednášky
Systémy pro tvorbu digitálních knihoven
Systémy pro tvorbu digitálních knihoven Vlastimil Krejčíř, krejcir@ics.muni.cz Ústav výpočetní techniky, Masarykova univerzita, Brno INFORUM 2006, Praha Obsah přednášky Úvod Fedora DSpace EPrints CDSware
materiál č. šablony/č. sady/č. materiálu: Autor: Karel Dvořák Vzdělávací oblast předmět: Informatika Ročník, cílová skupina: 7.
Masarykova základní škola Klatovy, tř. Národních mučedníků 185, 339 01 Klatovy; 376312154, fax 376326089 E-mail: skola@maszskt.investtel.cz; Internet: www.maszskt.investtel.cz Kód přílohy vzdělávací VY_32_INOVACE_IN7DV_05_01_20
Microsoft Office. Excel vyhledávací funkce
Microsoft Office Excel vyhledávací funkce Karel Dvořák 2011 Vyhledávání v tabulkách Vzhledem ke skutečnosti, že Excel je na mnoha pracovištích používán i jako nástroj pro správu jednoduchých databází,
þÿ O k t á v o d i g i t á l n í k n i h o v n a F F
DSpace VSB-TUO http://www.dspace.vsb.cz þÿ PY í s p v k y z e s e t k á n í e s k ý c h u~ i v a t e lo s y s þÿ t épy m u í sd p S vp ka y c e 5./ sc eo tnk fá en rí e nec se k ýp ca h p eu~ r s i vf
Internetové vyhledávače
Internetové vyhledávače Co je internetový vyhledávač služba, která umožňuje na Internetu najít webové stránky, které obsahují požadované informace uživatel zadává do rozhraní vyhledávače klíčová slova,
Elektronické publikování. doc. RNDr. Petr Šaloun, Ph.D. katedra informatiky FEI VŠB TU Ostrava
Elektronické publikování doc. RNDr. Petr Šaloun, Ph.D. katedra informatiky FEI VŠB TU Ostrava www.cs.vsb.cz/saloun Základní pojmy Zpracování textu myšlenka, typografický návrh, realizace, znovupoužití.
Vyhledávání. doc. Mgr. Jiří Dvorský, Ph.D. Katedra informatiky Fakulta elektrotechniky a informatiky VŠB TU Ostrava. Prezentace ke dni 12.
Vyhledávání doc. Mgr. Jiří Dvorský, Ph.D. Katedra informatiky Fakulta elektrotechniky a informatiky VŠB TU Ostrava Prezentace ke dni 12. září 2016 Jiří Dvorský (VŠB TUO) Vyhledávání 201 / 344 Osnova přednášky
Vyhledávání nebo nalezení informací
Vyhledávání nebo nalezení informací Vilém Sklenák sklenak@vse.cz Vysoká škola ekonomická, fakulta informatiky a statistiky, katedra informačního a znalostního inženýrství Inforum2012, 23. 5. 2012 Vilém
SCOPUS a WEB OF SCIENCE
SCOPUS a WEB OF SCIENCE 7. února 2012 Osnova 1. Typy ve vyhledávání v databázi SCOPUS 2. Typy ve vyhledávání v databázi Web of Science 3. Nástroje pro vyhledávání v jednom vyhledávacím prostředí: Metavyhledávače
Experimentální systém pro WEB IR
Experimentální systém pro WEB IR Jiří Vraný Školitel: Doc. RNDr. Pavel Satrapa PhD. Problematika disertační práce velmi stručný úvod WEB IR information retrieval from WWW, vyhledávání na webu Vzhledem
Datové struktury 2: Rozptylovací tabulky
Datové struktury 2: Rozptylovací tabulky prof. Ing. Pavel Tvrdík CSc. Katedra počítačových systémů Fakulta informačních technologií České vysoké učení technické v Praze c Pavel Tvrdík, 2010 Efektivní algoritmy
Tabulkový procesor. Základní rysy
Tabulkový procesor Tabulkový procesor je počítačový program zpracovávající data uložená v buňkách tabulky. Program umožňuje použití vzorců pro práci s daty a zobrazuje výsledné hodnoty podle vstupních
Začínáme s Tovek Tools
NAJÍT POCHOPIT VYUŽÍT Úvodní seznámení s produktem Tovek Tools JAK SI TOVEK TOOLS NAINSTALUJI?... 2 JAK SI PŘIPOJÍM INFORMAČNÍ ZDROJE, VE KTERÝCH CHCI VYHLEDÁVAT?... 2 JAK MOHU VYHLEDÁVAT V INFORMAČNÍCH
Máte to? Summon jako základní vyhledávací nástroj NTK
Máte to? Summon jako základní vyhledávací nástroj NTK Milan Janíček milan.janicek at techlib.cz odd. rozvoje elektronických služeb Národní technická knihovna Praha Obsah 1) Proč další systém? 2) Metavyhledávač
Maturitní témata pro 1.KŠPA Kladno, s.r.o. Výpočetní technika
Maturitní témata pro 1.KŠPA Kladno, s.r.o. Předmět Typ zkoušky Obor Forma Zkoušející Období Výpočetní technika Profilová ústní Ekonomika a podnikání zaměření Podnikání Denní / Distanční Ing. Horová / K.
- otevřený přístup k výsledkům vědy. Mgr. Zdeňka Firstová a Mgr. Anna Vyčítalová Univerzitní knihovna ZČU v Plzni
- otevřený přístup k výsledkům vědy Mgr. Zdeňka Firstová a Mgr. Anna Vyčítalová Univerzitní knihovna ZČU v Plzni Open Access otevřený přístup Seznámení s Open Access Zlatá a zelená cesta Výhody Open Access
Střední průmyslová škola strojnická Olomouc, tř.17. listopadu 49
Střední průmyslová škola strojnická Olomouc, tř.17. listopadu 49 Výukový materiál zpracovaný v rámci projektu Výuka moderně Registrační číslo projektu: CZ.1.07/1.5.00/34.0205 Šablona: III/2 Informační
Obohacování bibliografických záznamů o věcné selekční prvky postup NKČR
Obohacování bibliografických záznamů o věcné selekční prvky postup NKČR Bod programu: Věcné zpracování (možnosti obohacování dříve dodaných záznamů) Marie.Balikova@nkp.cz Pracovní skupina pro SK, 7.3.
Tovek Server. Tovek Server nabízí následující základní a servisní funkce: Bezpečnost Statistiky Locale
je serverová aplikace určená pro efektivní zpracování velkého objemu sdílených nestrukturovaných dat. Umožňuje automaticky indexovat data z různých informačních zdrojů, intuitivně vyhledávat informace,
NTK Discovery. Od katalogu k centralizovanému vyhledávání
NTK Discovery Od katalogu k centralizovanému vyhledávání Strategie NTK v oblasti zpřístupňování fondů Strategická priorita 3.4.2: Optimalizace uživatelské přívětivosti všech knihovních služeb NTK Implementace
FUNKCE A VYHLEDÁVÁNÍ NA PORTÁLE KNIHOVNY.CZ PhDr. Iva Zadražilová, Moravská zemská knihovna
FUNKCE A VYHLEDÁVÁNÍ NA PORTÁLE KNIHOVNY.CZ PhDr. Iva Zadražilová, Moravská zemská knihovna ZÁKLADNÍ MYŠLENKA Umožnit přístup ke službám, fondům a informacím o českých knihovnách z jednoho místa KOMUKOLIV
Zpráva o zhotoveném plnění
Zpráva o zhotoveném plnění Aplikace byla vytvořena v souladu se Smlouvou a na základě průběžných konzultací s pověřenými pracovníky referátu Manuscriptorium. Toto je zpráva o zhotoveném plnění. Autor:
Oborová brána TECH tech.jib.cz
Oborová brána TECH tech.jib.cz Seminář Okna oborů dokořán! Proč a jak využívat oborové brány & jak dál v CPK? Praha, NTK 2.12.2014 PhDr. Lenka Hvězdová Příběh oborové brány TECH, tech.jib.cz - * 2008,
7. Enterprise Search Pokročilé funkce vyhledávání v rámci firemních datových zdrojů
7. Enterprise Search Pokročilé funkce vyhledávání v rámci firemních datových zdrojů Verze dokumentu: 1.0 Autor: Jan Lávička, Microsoft Časová náročnost: 30 40 minut 1 Cvičení 1: Vyhledávání informací v
Jak se dělá digitální matematická knihovna
Jak se dělá digitální matematická knihovna Miroslav Bartošek * bartosek@ics.muni.cz Vlastimil Krejčíř * krejcir@ics.muni.cz Abstrakt: Článek přibližuje postupy a řešení projektu České digitální matematické
KAPITOLA 9 - POKROČILÁ PRÁCE S TABULKOVÝM PROCESOREM
KAPITOLA 9 - POKROČILÁ PRÁCE S TABULKOVÝM PROCESOREM CÍLE KAPITOLY Využívat pokročilé možnosti formátování, jako je podmíněné formátování, používat vlastní formát čísel a umět pracovat s listy. Používat
Střední průmyslová škola strojnická Olomouc, tř.17. listopadu 49
Střední průmyslová škola strojnická Olomouc, tř.17. listopadu 49 Výukový materiál zpracovaný v rámci projektu Výuka moderně Registrační číslo projektu: CZ.1.07/1.5.00/34.0205 Šablona: III/2 Informační
Jak vyhledávat. Vyhledávače KAPITOLA 3
KAPITOLA 3 Jak vyhledávat Už víme, jak zacházet s programem Microsoft Internet Explorer, a můžeme se pustit do surfování. Ostatně, stejně jsme to při seznamování s funkcemi programu chtíce nechtíce dělali.
Dozvíte se mimo jiné, jak přinutit internetový vyhledávač, aby našel přesně to, co potřebujete.
Rychlokurz vyhledávání na internetu aneb Jak co nejrychleji napsat domácí úkol Přednáška na Celostátním setkání mládeže v Táboře 14.8.2007 Vypracovat domácí úkol, esej či seminární práci, najít odpovědi
Knihovny.cz: spuštění se blíží
Knihovny.cz: spuštění se blíží Petr ŽABIČKA, Petra ŽABIČKOVÁ, Martin KRAVEC Moravská zemská knihovna v Brně petr.zabicka@mzk.cz, petra.zabickova@mzk.cz, martin.kravec@mzk.cz INFORUM 2016: 22. ročník konference
Formy komunikace s knihovnami
Formy komunikace s knihovnami Současné moderní prostředky Jiří Šilha a Jiří Tobiáš, Tritius Solutions a.s., Brno Osnova Základní požadavky na komunikaci s knihovnami Historie komunikace s knihovnami Confluence
Vyhledávání v citační databázi Web of Science (WOS)
Vyhledávání v citační databázi Web of Science (WOS) Petr Boldiš Stanislava Kohoutová Česká zemědělská univerzita v Praze Studijní a informační centrum 2004 Tento materiál byl vytvořen v rámci grantu FRVŠ
Economists Online: nový portál pro ekonomické vědy
Economists Online: nový portál pro ekonomické vědy Hana Pessrová, Tomáš Pavela, Eliška Reitspiesová, Lucie Vasiljevová INFORUM 2009 Praha, 27. - 29. 5. 2009 Univerzita Karlova v Praze, CERGE hana.pessrova@cerge-ei.cz
Inovace výuky prostřednictvím šablon pro SŠ
Název projektu Číslo projektu Název školy Autor Název šablony Název DUMu Stupeň a typ vzdělávání Vzdělávací oblast Vzdělávací obor Tematický okruh Inovace výuky prostřednictvím šablon pro SŠ CZ.1.07/1.5.00/34.0748
UMÍ POČÍTAČE POČÍTAT?
UMÍ POČÍTAČE POČÍTAT? O ÚSKALÍCH POČÍTAČOVÉ ARITMETIKY RNDr. Iveta Hnětynková, PhD. Katedra numerické matematiky VÝPOČTY A SIMULACE Aplikace: chemie, fyzika, lekařství, statistika, ekonomie, stojírenství,...
VÝPOČETNÍ TECHNIKA OBOR: EKONOMIKA A PODNIKÁNÍ ZAMĚŘENÍ: PODNIKÁNÍ FORMA: DENNÍ STUDIUM
VÝPOČETNÍ TECHNIKA OBOR: EKONOMIKA A PODNIKÁNÍ ZAMĚŘENÍ: PODNIKÁNÍ FORMA: DENNÍ STUDIUM 1. Historie a vývoj VT. Dnešní parametry PC. Von Neumannovo schéma. a. historie a vznik počítačů b. využití počítačů
Studijní informační zdroje
Studijní informační zdroje (a jak se k nim dostat) Informační blok k předmětu Jazykový projev (2012/13) http://knihovna.jabok.cz/doc/jp/informace.ppt http://knihovna.jabok.cz/doc/jp/informace.odp Důležité
Reranking založený na metadatech
České vysoké učení technické v Praze Fakulta informačních technologií Katedra softwarového inženýrství Reranking založený na metadatech MI-VMW Projekt IV - 1 Pavel Homolka Ladislav Kubeš 6. 12. 2011 1
Odborný článek. Petr Klán, VŠE v Praze, IMRAD Introduction, Material and Method, Results, Discussion
Odborný článek Petr Klán, VŠE v Praze, petr.klan@vse.cz Části odborného článku IMRAD Introduction, Material and Method, Results, Discussion NADPIS Do 10 slov Autor (autoři) Jméno, adresa, e-mail Abstrakt
Elektronické inf. zdroje
Elektronické inf. zdroje Internet, tj. samostatné stránky, články atd. Předmětové katalogy Plnotextové báze, digitální knihovny Katalogy knihoven Internet Vyhledávače najdou jen dokumenty, které předtím
Vyhledávání na portálu Knihovny.cz
Inforum 2017 Vyhledávání na portálu Knihovny.cz Petr Žabička, Václav Rosecký, Petra Žabičková Moravská zemská knihovna v Brně Obsah Co indexuje portál Knihovny.cz Rozšíření o centrální index Hledání v
ANOTACE vytvořených/inovovaných materiálů
ANOTACE vytvořených/inovovaných materiálů Číslo projektu Číslo a název šablony klíčové aktivity Tematická oblast Formát Druh učebního materiálu Druh interaktivity CZ.1.07/1.5.00/34.0722 III/2 Inovace a
NÁVOD PRO VYHLEDÁVÁNÍ V DATABÁZI C.E.E.O.L. (CENTRAL AND EASTERN EUROPEAN ONLINE LIBRARY) / www.ceeol.com /
NÁVOD PRO VYHLEDÁVÁNÍ V DATABÁZI C.E.E.O.L. (CENTRAL AND EASTERN EUROPEAN ONLINE LIBRARY) / www.ceeol.com / OBECNÉ INFORMACE C.E.E.O.L. je elektronickým archivem zpřístupňujícím fulltext 390 humanitních
Automatická detekce anomálií při geofyzikálním průzkumu. Lenka Kosková Třísková NTI TUL Doktorandský seminář, 8. 6. 2011
Automatická detekce anomálií při geofyzikálním průzkumu Lenka Kosková Třísková NTI TUL Doktorandský seminář, 8. 6. 2011 Cíle doktorandské práce Seminář 10. 11. 2010 Najít, implementovat, ověřit a do praxe
aplikační software pro práci s informacemi
INFORMATIKA aplikační software pro práci s informacemi MATEMATICKÝ TEXT Pracovní list pro žáky Gymnázium K. V. Raise, Hlinsko, Adámkova 55 Vytvořila: RNDr. Ivanka Dvořáčková 013 Matematický text sazba
Digitální knihovny v České republice
Digitální knihovny v České republice PhDr. Martina Machátová Moravská zemská knihovna v Brně Tel.: 541 646 170 E-mail: machat@mzk.cz Aktualizace: 19. května 2019 Digitální knihovna Definice 1,,Integrovaný
Fakulta elektrotechnická
České vysoké učení technické v Praze Fakulta elektrotechnická DIPLOMOVÁ PRÁCE Název diplomové práce Praha, 2002 Autor: Jirka Roubal Prohlášení Prohlašuji, že jsem svou diplomovou (bakalářskou) práci vypracoval
Algoritmizace a programování
Algoritmizace a programování Výrazy Operátory Výrazy Verze pro akademický rok 2012/2013 1 Operace, operátory Unární jeden operand, operátor se zapisuje ve většině případů před operand, v některých případech
Co je nového v aplikaci PaperPort 12?
Vítejte! Aplikace PaperPort společnosti Nuance je softwarový balíček pro správu dokumentů pracovní plochy, který vám usnadní skenování, uspořádání, sdílení, správu a přístup k papírovým a digitálním dokumentům
MBI - technologická realizace modelu
MBI - technologická realizace modelu 22.1.2015 MBI, Management byznys informatiky Snímek 1 Agenda Technická realizace portálu MBI. Cíle a principy technického řešení. 1.Obsah portálu - objekty v hierarchiích,
Inovace výuky prostřednictvím ICT v SPŠ Zlín, CZ.1.07/1.5.00/34.0333 Vzdělávání v informačních a komunikačních technologií
VY_32_INOVACE_33_05 Škola Střední průmyslová škola Zlín Název projektu, reg. č. Inovace výuky prostřednictvím ICT v SPŠ Zlín, CZ.1.07/1.5.00/34.0333 Vzdělávací oblast Vzdělávání v informačních a komunikačních
Modely vyhledávání informací 4 podle technologie. 1) Booleovský model. George Boole 1815 1864. Aplikace booleovské logiky
Modely vyhledávání informací 4 podle technologie 1) Booleovský model 1) booleovský 2) vektorový 3) strukturní 4) pravděpodobnostní a další 1 dokumenty a dotazy jsou reprezentovány množinou indexových termů
VYHLEDÁVÁNÍ V NOVÉM PROSTŘEDÍ MEDVIK : ZÁKLADNÍ HLEDÁNÍ. Adéla Jarolímková Národní lékařská knihovna, referát metodiky a vzdělávání
VYHLEDÁVÁNÍ V NOVÉM PROSTŘEDÍ MEDVIK : ZÁKLADNÍ HLEDÁNÍ Adéla Jarolímková Národní lékařská knihovna, referát metodiky a vzdělávání Proč nové rozhraní? Integrace zdrojů katalogy, BMČ, autority, MeSH Přizpůsobení
NOVÉ ONLINE SLUŽBY NÁRODNÍ LÉKAŘSKÉ KNIHOVNY Filip Kříž, Lenka Maixnerová, Ondřej Horsák
Anotace Národní lékařská knihovna dokončila počátkem roku 2011 vývoj nové verze portálu Medvik (www.medvik.cz). Portál nově umožňuje plnotextové prohledávání všech databází provozovaných v systému Medvik
Co je (staro)nového v DSpace
Ústav výpočetní techniky, Masarykova univerzita, Brno CZDSUG 2011, Ostrava Obsah přednášky I Delegování práv. Autentizace přes IP adresy. Omezení viditelnosti, skrytí metadat. Export (CSV). Rozšířená konfigurace
OptimiDoc dokáže takové dokumenty zpracovat a distribuovat napříč firmou.
Automatizujte zpracování a distribuci dokumentů do vašich firemních procesů! Nemáte kontrolu nad stovkami papírových dokumentů, které přichází do vaší firmy? OptimiDoc dokáže takové dokumenty zpracovat
KNIHOVNY ČR - LÉKAŘSKÉ KNIHOVNY Seminář IPVZ Co umí knihovna 2.září 2010 CO UMÍ KNIHOVNA místa zpřístupňování tištěných dokumentů 16.století - staletý vývoj v polovině 90. let minulého století první online
Vybraná zajímavá Lotus Notes řešení použitelná i ve vašich aplikacích. David Marko TCL DigiTrade - 29.5.2014
Vybraná zajímavá Lotus Notes řešení použitelná i ve vašich aplikacích David Marko TCL DigiTrade - 29.5.2014 Xpages a napojení na SQL data Přístup na SQL tabulky a nebo uložené procedury (stored procedures
Nápověda 360 Search. Co je 360 Search? Tipy pro vyhledávání
1 z 5 Nápověda 360 Search Co je 360 Search? 360 Search je metavyhledávač, který slouží k paralelnímu prohledávání všech dostupných informačních zdrojů prostřednictvím jednotného rozhraní. Nástroj 360 Search
RNDr. Pavel PEŠAT, Ph.D.
Dotyková zařízení ve výuce CZ.1.07/1.3.00/51.0017 Aktivita B3 INFORMAČNÍ A KOMUNIKAČNÍ TECHNOLOGIE VE VÝUCE NA PRVNÍM STUPNI ZÁKLADNÍ ŠKOLY RNDr. Pavel PEŠAT, Ph.D. pavel.pesat@gmail.com. Naplnění cílů
Gymnázium Jiřího Ortena, Kutná Hora
Předmět: Náplň: Třída: Počet hodin: Pomůcky: Informatika a výpočetní technika (IVT) Úvod do předmětu, základní pojmy IVT, operační systém MS Windows, Internet, netiketa, číselné soustavy a uložení dat
Google Site Search Webové vyhledávání Google pro vaši organizaci
Google Site Search Datový list Google Site Search Webové vyhledávání Google pro vaši organizaci Google Site Search Další informace najdete zde: http://www.google.com/enterprise/search/ Co získáte Relevance
Vyhledávání na Internetu
Tento materiál byl napsán za využití učebních materiálů ke Kurzu práce s informacemi (KPI11) vyučovaném v roce 2007 na Masarykově univerzitě. Autory kurzu jsou: PhDr. Petr Škyřík, Mgr. Petra Šedinová,
2014 Dostupný z Licence Creative Commons Uveďte autora-zachovejte licenci 4.0 Mezinárodní
Tento dokument byl stažen z Národního úložiště šedé literatury (NUŠL). Datum stažení: 29.01.2017 Zpřístupňování informačních zdrojů včetně šedé literatury v Zeměměřičské knihovně Drozda, Jiří; Synková,
Gymnázium Jiřího Ortena, Kutná Hora
Předmět: Náplň: Třída: Počet hodin: Pomůcky: Informatika a výpočetní technika (IVT) Úvod do předmětu, základní pojmy IVT, operační systém MS Windows, Internet, e-mail, číselné soustavy a uložení dat v
CODEWEEK 2014 Rozvoj algoritmického myšlení nejen pomocí programu MS Excel. Michaela Ševečková
CODEWEEK 2014 Rozvoj algoritmického myšlení nejen pomocí programu MS Excel Michaela Ševečková Rozvoj technického myšlení nejmenších dětí práce s předměty charakteristika, diferenciace (hledání rozdílů),
Vyhněte se katastrofám pomocí výpočetní matematiky
Vyhněte se katastrofám pomocí výpočetní matematiky Stefan Ratschan Ústav informatiky Akademie věd ČR Stefan Ratschan Vyhněte se katastrofám 1 / 29 x. x 2 = 2 Kvíz x. x 2 = 2 x. x 2 7 p q x. x 2 + px +
DESET LET S THESES.CZ Ing. Jitka Brandejsová
DESET LET S THESES.CZ Ing. Jitka Brandejsová OBECNÉ KONCEPTY Plagiát vs. software pro detekci podobností Cílem je kvalitnější vzdělání Schopnost práce s textem. Schopnost práce s citacemi. Akademická čest
Otevřená data veřejné správy
Seminář Digitální výzvy 2012 8.11.2012 Otevřená data veřejné správy Dušan Chlapek 1, Jan Kučera 1, Martin Nečaský 2 1 Fakulta informatiky a statistiky, Vysoká škola ekonomická v Praze 2 Matematicko-fyzikální
ProArc. open source řešení pro produkci a archivaci digitálních dokumentů. Martina NEZBEDOVÁ Knihovna AV ČR, v. v. i., Praha nezbedova@knav.
ProArc open source řešení pro produkci a archivaci digitálních dokumentů Martina NEZBEDOVÁ Knihovna AV ČR, v. v. i., Praha nezbedova@knav.cz INFORUM 2015: 21. ročník konference o profesionálních informačních
Základy informatiky. Elektronické publikování. Daniela Szturcová Část převzata z přednášky P. Děrgela
Základy informatiky Elektronické publikování Daniela Szturcová Část převzata z přednášky P. Děrgela Obsah přednášky Základní pojmy Historické souvislosti Nástroje určené pro elektronické publikování Porovnání
Moderní systémy pro získávání znalostí z informací a dat
Moderní systémy pro získávání znalostí z informací a dat Jan Žižka IBA Institut biostatistiky a analýz PřF & LF, Masarykova universita Kamenice 126/3, 625 00 Brno Email: zizka@iba.muni.cz Bioinformatika:
Tvar dat a nástroj přeskupování
StatSoft Tvar dat a nástroj přeskupování Chtěli jste někdy použít data v jistém tvaru a STATISTICA Vám to nedovolila? Jistě se najde někdo, kdo se v této situaci již ocitl. Není ale potřeba propadat panice,
Vilém Sklenák Inforum2009,
Sémantické vyhledávání je blíže? Vilém Sklenák sklenak@vse.cz Vysoká škola ekonomická, fakulta informatiky a statistiky, katedra informačního a znalostního inženýrství Inforum2009, 27. 5. 2009 Vilém Sklenák
Nástroj pro monitorování a analýzu českého internetu a sociálních médií
Nástroj pro monitorování a analýzu českého internetu a sociálních médií SOCIAL INSIDER VLASTNOSTI Zachycuje data z Facebooku, Twitteru, Youtube, Google+, stejně jako z tisíců českých a slovenských blogů
INFORMAČNÍ A KOMUNIKAČNÍ TECHNOLOGIE
INFORMAČNÍ A KOMUNIKAČNÍ TECHNOLOGIE Vzdělávací oblast Informační a komunikační technologie umožňuje všem žákům dosáhnout základní úrovně informační a počítačové gramotnosti - získat elementární dovednosti
Identifikátor evropské judikatury ECLI Nejvyšší soud Úsek místopředsedy Nejvyššího soudu Oddělení dokumentace a analytiky judikatury ČR (ODAJ)
Identifikátor evropské judikatury ECLI Nejvyšší soud Úsek místopředsedy Nejvyššího soudu Oddělení dokumentace a analytiky judikatury ČR (ODAJ) Konference České právo a informační technologie 2015 Právnická
INFOS 2013. Objevte discovery!
INFOS 2013 Objevte discovery! Ing. Vladimír Karen Albertina icome Praha s.r.o. Obsah Proč discovery služby? Jak discovery služby vypadají? Další možnosti discovery služeb Jaké jsou objektivní přínosy?
Projekt OPVK - CZ.1.07/1.1.00/ Matematika pro všechny. Univerzita Palackého v Olomouci
Projekt OPVK - CZ.1.07/1.1.00/26.0047 Matematika pro všechny Univerzita Palackého v Olomouci Tematický okruh: Závislosti a funkční vztahy Gradovaný řetězec úloh Téma: geometrická posloupnost, geometrická
PRODUKTY. Tovek Tools
jsou desktopovou aplikací určenou k vyhledávání informací, tvorbě různých typů analýz a vytváření přehledů a rešerší. Jsou vhodné pro práci i s velkým objemem textových dat z různorodých informačních zdrojů.
ROZHRANÍ PRO ZPŘÍSTUPNĚNÍ A PREZENTACI ZNALOSTNÍ DATABÁZE INTERPI UŽIVATELSKÁ PŘÍRUČKA
ROZHRANÍ PRO ZPŘÍSTUPNĚNÍ A PREZENTACI ZNALOSTNÍ DATABÁZE INTERPI UŽIVATELSKÁ PŘÍRUČKA INTERPI Interoperabilita v paměťových institucích Program aplikovaného výzkumu a vývoje národní kulturní identity
Úvod do programování 7. hodina
Úvod do programování 7. hodina RNDr. Jan Lánský, Ph.D. Katedra informatiky a matematiky Fakulta ekonomických studií Vysoká škola finanční a správní 2015 Umíme z minulé hodiny Syntax Znaky Vlastní implementace
České internetové medicínské zdroje v Národní lékařské knihovně
České internetové medicínské zdroje v Národní lékařské knihovně Kateřina Štěchovská Národní lékařská knihovna, Praha stechovs@nlk.cz INFORUM 2005: 11. konference o profesionálních informačních zdrojích
Seminář pro vedoucí knihoven a SVI ústavů AV ČR. Aleph
Seminář pro vedoucí knihoven a SVI ústavů AV ČR Aleph 9.5.2012 Program Co je nového v Alephu Změny v bázi autorit Elektronické knihy a Vufind Aleph a Google Přechod na vyšší verzi Alephu Aleph základní
1 Mnohočleny a algebraické rovnice
1 Mnohočleny a algebraické rovnice 1.1 Pojem mnohočlenu (polynomu) Připomeňme, že výrazům typu a 2 x 2 + a 1 x + a 0 říkáme kvadratický trojčlen, když a 2 0. Číslům a 0, a 1, a 2 říkáme koeficienty a písmenem
PRODUKTY Tovek Server 6
Tovek Server je serverová aplikace určená pro efektivní zpracování velkého objemu sdílených strukturovaných i nestrukturovaných dat. Umožňuje automaticky indexovat data z různých informačních zdrojů, intuitivně
Registrace Vyhledávání Výsledky vyhledávání
Česká digitální knihovna umožňuje vyhledávání v digitálních knihovnách zapojených knihoven v České republice. Cílem je zajištění přístupu k digitálním dokumentům v knihovnách z jednoho místa. Registrace
Ukládání a vyhledávání XML dat
XML teorie a praxe značkovacích jazyků (4IZ238) Jirka Kosek Poslední modifikace: $Date: 2014/12/04 19:41:24 $ Obsah Ukládání XML dokumentů... 3 Ukládání XML do souborů... 4 Nativní XML databáze... 5 Ukládání
Klíčová slova: dynamické internetové stránky, HTML, CSS, PHP, SQL, MySQL,
Anotace sady: Dynamické internetové stránky, VY_32_INOVACE_PRG_PHP_01 Klíčová slova: dynamické internetové stránky, HTML, CSS, PHP, SQL, MySQL, Stupeň a typ vzdělávání: gymnaziální vzdělávání, 4. ročník
Databáze MS-Access. Obsah. Co je to databáze? Doc. Ing. Radim Farana, CSc. Ing. Jolana Škutová
Databáze MS-Access Doc. Ing. Radim Farana, CSc. Ing. Jolana Škutová Obsah Principy a možnosti databází. Uložení dat v databázi, formáty dat, pole, záznamy, tabulky, vazby mezi záznamy. Objekty databáze
PROGRAM MAXIMA. KORDEK, David, (CZ) PROGRAM MAXIMA
PROGRAM MAXIMA KORDEK, David, (CZ) Abstrakt. Co je to Open Source Software? Příklady některých nejpoužívanějších software tohoto typu. Výhody a nevýhody Open Source Software. Jak získat program Maxima.
Bakalářské a diplomové práce. katedra matematiky
Bakalářské a diplomové práce katedra matematiky 31.10.2011 Závěrečné práce obecné informace databáze VŠKP výběr a zadání témat -kdy -jak zpracování práce odevzdání a obhajoba práce -kdy -jak okruhy témat
VYHLEDÁVÁNÍ NA INTERNETU. Přednášející: Ondřej Douša
VYHLEDÁVÁNÍ NA INTERNETU Přednášející: Ondřej Douša OBSAH PŘEDNÁŠKY Informace Minulost vyhledávání Placené versus neplacené zdroje Běžné vyhledávání: Seznam / Google / Bing Pokročilé vyhledávání Kategorizované
Univerzální vyhledávací portál jako integrační řešení pro digitální knihovny
Univerzální vyhledávací portál jako integrační řešení pro digitální knihovny Nabídka a know-how společnosti SEFIRA Iva Celbová konzultant knihovní systémy celbova@sefira.cz Nabídka SEFIRA na řešení projektu
Paralelní vyhledávač MetaLib verze 3. Martin Ledínský Univerzita Karlova v Praze Ústav výpočetní techniky
Paralelní vyhledávač MetaLib verze 3 Martin Ledínský Univerzita Karlova v Praze Ústav výpočetní techniky OBSAH Krátké představení MetaLibu Současné problémy s informačními zdroji Jak problémy řešit MetaLib