Volba vlastností s využitím Linked Data
|
|
- Natálie Bartošová
- před 6 lety
- Počet zobrazení:
Transkript
1 Martin DOSTAL 1, Karel JEŢEK 2 1 Katedra informatiky a výpočetní techniky, FAV ZČU v Plzni Univerzitní 22, Plzeň madostal@kiv.zcu.cz 2 Katedra informatiky a výpočetní techniky, FAV ZČU v Plzni Univerzitní 22, Plzeň Jezek_ka@kiv.zcu.cz Abstrakt. V tomto článku bychom chtěli představit metodu pro automatickou volbu vlastností s vyuţitím Linked Data. Pojmem Linked Data jsou označovány techniky umoţňující prezentování a publikování dat ve strojově čitelné podobě. My jsme těchto technik vyuţili pro automatickou volbu vlastností, kterou lze pouţít např. pro shlukování. Tento přístup budeme demonstrovat na mnoţině článků z oblasti IT, ke kterým byly automaticky přiřazeny štítky v podobě uzlů z Linked Data. Klíčová slova: volba vlastností, shlukování, Linked Data. 1 Úvod Problematika volby vlastností pro rozlišení skupin dokumentů je velmi aktuální téma a mezi jeho nejběţnější vyuţití patří různé shlukovací metody. V současné době se shlukování vyuţívá zejména v oblasti vyhledávání a prohlíţení webu, kdy se můţe vyuţívat buď pouze pro interní zpracování dokumentů, nebo ještě lépe pro prezentaci nalezených výsledků uţivateli. Mezi hlavní průkopníky sémantického vyhledávání s vyuţitím shlukování patří vyhledávače Yippy [12] a Dogpile [10]. V prvním případě je jiţ v praxi nasazeno velmi kvalitní vícejazyčné shlukování pro automatické zpracování výsledků z vyhledávacích portálů Google, Yahoo! a Bing. Tento způsob je velmi komfortní, neboť uţivatel není nucen procházet stovky výsledků vyhledávání, ale pouze si omezí výsledky vyhledávání na shluk, který ho zaujal. Pojem Linked Data zavedl Tim Berners Lee jako pojmenování technik publikace dat ve strojově čitelné podobě. Technicky je moţné přidávat sémantické informace do existujících webových stránek s vyuţitím formátu RDFa, nebo můţeme tyto informace zapisovat ve formě čistých RDF dokumentů. Nejvýznamnějším principem Linked Data je fakt, ţe kaţdý pojem má jednoznačně přiřazené identifikační URL, díky kterému není třeba řešit desambiguaci pojmů. Kaţdý pojem dále odkazuje na různé ontologie, na nadřazený pojem, na související pojmy a navíc i na pojmy podřízené. Díky tomu nám vzniká rozsáhlá stromová struktura, která čeká na naše vyuţití. Cílem tohoto článku je představení metody umoţňující automatickou volbu vlastností s vyuţitím Linked Data. V kapitole 2 si představíme základní principy Linked Data a existující metody zápisu hieratické struktury uzlů. Abychom mohli kvalitu volby vlastností vyhodnotit, aplikujeme jí na nejjednodušší a nejznámější shlukovací metodu K-průměrů. Základní principy a problémy shlukování si přiblíţíme v kapitole 3. J. Genči, P. Šaloun (eds.), DATAKON 2012, Mikulov, , pp
2 Techniku volby vlastností s vyuţitím Linked Data a její další moţnosti rozšíření popíšeme v kapitole 4, kde se zaměříme zejména na problematiku analýzy štítků, se kterými budeme dále pracovat. Štítky jsou, v běţném smyslu, krátké textové řetězce neboli klíčová slova, pouţívaná na Webu zejména k vyhledávání a třídění článků. Klasické členění článků do kategorií se v současné době jeví jako nepouţitelné a tak stále více webových stránek přistupuje k vyuţití štítkování jako velmi efektivní metodě sdruţování článků dle obsaţených témat. V kapitole 5 se zaměříme na problematiku vyhodnocení této metody. Vyhodnocení technik volby vlastností lze provádět buď přímo s vyuţitím porovnání automatického seznamu vlastností s ručně stanoveným seznamem, nebo dle vlivu volby vlastností na nějaký algoritmus. V našem případě budeme vyhodnocení techniky volby vlastností provádět s vyuţitím shlukovacího algoritmu K-průměrů. V kapitole 6 si představíme cíl dalšího výzkumu zejména v oblasti vytvoření algoritmu pro shlukování přímo s vyuţitím Linked Data a další moţnosti pro vyhodnocení výsledků shlukování. 2 Linked Data Nyní si stručně vysvětlíme, co to jsou Linked Data a jejich základní principy. Nejdříve bychom však měli začít pojmem Sémantický Web. Tim-Berners Lee definuje Sémantický Web [3] jako přístup umoţňující vyjádření informací ve strojově čitelné podobě. Jeho hlavní myšlenka je provázání dat s vyuţitím odkazů, coţ umoţní lidem i strojům procházet související informace (Linked Data). T. B. Lee formálně definoval 4 základní pravidla Linked Data: 1. Pouţívat URI jako identifikátory objektů. 2. Pouţívat http URI, aby si lidé mohli tyto objekty prohlédnout. 3. Pokud se někdo podívá na URI, je třeba poskytnout uţitečné informace s vyuţitím standardů (RDF*, SPARQL). 4. Pouţívat odkazy na další URI, coţ umoţní vyhledávat související objekty. První a druhé pravidlo vyţaduje pouţívání URI jako identifikátorů. Jinak řečeno se jedná o jednoznačná jména, nikoliv adresy, jak by mohlo být mylně interpretováno. Třetí pravidlo vyţaduje popis objektu s vyuţitím standardů v případě přístupu na toto URI. Člověk i stroj by měl získat základní informace o objektu, jeho formálním popisu a navíc i odkazy na další objekty, coţ je základní myšlenkou Linked Data. Prakticky lze Linked Data získat např. z DBpedie [7], která obsahuje strojově čitelná data nashromáţděná většinou z anglické Wikipedie. Tato data lze relativně jednoduše stáhnout a uloţit do jedné z relačních databází. Záleţí pouze na typech informací, které je třeba automaticky zpracovávat. Odkazy na další uzly jsou realizovány s vyuţitím ontologií, které určují typ vazby. V našem případě nás nejvíce zajímají tyto typy relací: vztah potomek rodič v Linked Data existuje odkaz většinou oběma směry. Lze vyuţít relací: dbpprop:genre of určující rodiče viz obr.1, skos:broader a dcterms:subject stanovující obecnější pojem. Moţných relací je velmi mnoho a je tedy třeba pouţívat ty, které máme k dispozici. synonyma nejvhodnější je relace owl:sameas určující skutečná synonyma, případně však lze vyuţít i relaci skos:related označující související pojmy.
3 Vybraný příspěvek Obr. 1. Schéma hierarchické vazby mezi uzly v Linked Data [8] 3 Shlukování Cílem algoritmu shlukování je automatické rozdělení mnoţiny dokumentů na menší mnoţiny podobných dokumentů. Mnoţiny podobných dokumentů nazýváme shluky. V případě všech shlukovacích algoritmů lze definovat následující vstup a výstup: Vstup - Počet poţadovaných shluků K a mnoţina dokumentů s jednoznačným označením. Jednoznačná identifikace dokumentu můţe být realizována s vyuţitím ID, nebo prostým číslem dokumentu. Kaţdý dokument se skládá z mnoţiny slov ze slovníku W. Výstup - Výstupem algoritmu je mnoţina dokumentů přiřazených do shluků. Kaţdý shluk je definován výčtem identifikátorů dokumentů, které do něj náleţí. V případě shlukování je moţné zvolit jeden ze dvou základních přístupů: Tvrdé shlukování kaţdý dokument je přiřazen právě do jednoho shluku. Měkké shlukování kaţdý dokument můţe být přiřazen do více shluků. Zatímco většina shlukovacích algoritmů vyuţívá raději měkké shlukování neţ tvrdé, v našem případě se zaměříme právě na tvrdé shlukování, kde je moţné provést jednodušší měření přesnosti a úplnosti dané metody. Dle úrovně zařazení můţeme shlukování dále dělit na: Jednoúrovňové shlukování všechny shluky jsou na stejné úrovni, součástí vstupu je většinou poţadované mnoţství shluků. Hierarchické shlukování shluky se dále spojují a vytváří hierarchickou strukturu zcela automaticky, nebo dle vstupního poţadavku na počet shluků, do kterých je třeba dokumenty rozdělit. Ve většině případů však není nutné zadávat poţadované mnoţství shluků, neboť algoritmy jsou schopné zvolit počet shluků samostatně. V našem případě se opět z důvodu rychlejšího vyhodnocení budeme věnovat jednoúrovňovému shlukování jako nejjednoduššímu zástupci shlukování, které lze snáze vyhodnotit. V případě vyhodnocení hierarchického shlukování nastává zásadní problém v podobě rozhodnutí, kdy je shlukování povaţováno za správné a kdy uţ nikoliv. Zejména v případě umístění do velmi podobného shluku je třeba rozhodovat nikoliv o situaci určující
4 správné, nebo špatné zařazení, ale o míře správného zařazení. Tento fakt je však často zanedbáván, neboť neexistuje jeho efektivní a jednoznačné řešení [4]. Principem všech shlukovacích metod je tzv. shlukovací hypotéza, která tvrdí, ţe všechny dokumenty v rámci shluku se chovají podobně a mají podobné vlastnosti s ohledem na poţadovanou informaci. Touto definicí je řečeno, ţe obsahují největší mnoţství shodných termů nebo témat. 4 Volba vlastností s využitím Linked Data V současné době existuje mnoţství různých metod umoţňující volbu vlastností [6]. Často se vyuţívá korelačních koeficientů [6], vzájemné informace [1] nebo SVM [2]. Nyní si představíme techniku volby vlastností s vyuţitím Linked Data. Algoritmus lze neformálně popsat následovně: 1. Vstup - Mějme mnoţinu článků D očíslovaných 1,, N a mnoţinu uzlů L z Linked Data, identifikovaných s vyuţitím URI, tematicky pokrývající články. Jako alternativu je samozřejmě moţné pouţít všechny uzly z Linked Data např. z DBPedie pokrývající většinu oblastí zájmu. Pro oblast IT se v současné době jedná řádově o uzlů. 2. Přiřazení štítků - Článkům automaticky přiřadíme uzly z Linked Data a nazveme je štítky. Přiřazení štítků lze realizovat s vyuţitím fulltextového vyhledávání názvů uzlů v kombinaci s obecně známými metodami jako je tokenizace, lemmatizace, odstranění stop-slov apod. Štítek je článku přiřazen v případě, kdy je tento pojem v textu článku nalezen aspoň 1x. Kaţdý štítek můţe obsahovat i údaj určující jeho váhu vůči danému dokumentu. V nejjednodušším případě jí lze určit jako počet výskytů pojmu v textu článku. Cílem tohoto kroku je hrubé určení témat obsaţených v rámci článků. 3. Analýza štítků Štítky (uzly z Linked Data) obsahují mnoţství zajímavých informací, kterých je moţné vyuţít k další analýze témat obsaţených v článku. Cílem této analýzy je určení optimálních vlastností pro shlukování, kdy štítky budeme přímo povaţovat za jednotlivé vlastnosti. Tuto analýzu je třeba provádět na dvou různých úrovních: Lokální analýza v tomto případě budeme analyzovat mnoţinu štítků u jednoho článku bez ohledu na štítky přiřazené k ostatním článkům. Globální analýza manipulace se štítky dle jejich rozšířenosti mezi články. 4. Výstup Výsledkem je mnoţina všech štítků obsaţených ve všech článcích, které nejlépe definují články s ohledem na ostatní. Tyto štítky jsou přímo pouţitelné jako vlastnosti pro shlukování. Dále si vysvětlíme hlavní principy analýzy štítků z lokálního i globálního hlediska. V případě lokální analýzy štítků zkoumáme štítky přiřazené ke článku bez ohledu na jejich četnost v rámci všech analyzovaných článků. Řešíme tedy pouze optimální volbu štítků, které by nejlépe popsaly témata ve článku obsaţená. Základní techniky jsou následující: záměna štítku jeho rodičem v tomto případě je příliš specifický štítek nahrazen obecnějším pojmem. Tato záměna je vhodná zejména v případě, kdy je ke článku přiřazeno více štítků se stejným rodičem. Touto záměnou dochází k výrazné redukci počtu přiřazených štítků. Místo několika méně významných štítků je tak přiřazen nový štítek s velkým významem pro daný článek.
5 Vybraný příspěvek V případě globální analýzy zkoumáme všechny štítky přiřazené ke všem článkům. V průběhu analýzy je samozřejmě moţné pouţít základní techniky z lokální analýzy, avšak je třeba být opatrný, abychom vlastnosti příliš nezobecnili. Ve většině případů je vhodné vyuţít váţených vlastností, které určí významnost zejména nově přiřazených štítků. Nyní si stručně představíme jednotlivé moţnosti a upozorníme na nejvýznamnější problémy: náhrada synonym v případě synonym lze zvolit verzi, která se v rámci článků nejčastěji vyskytuje a všechna ostatní synonyma touto verzí nahradit. záměna štítku jeho rodičem a naopak v tomto případě je vhodné zjistit, zda by některé štítky nebylo vhodné sloučit, nebo naopak rozdělit, abychom dosáhli rozumné úrovně popisu. V první fázi je vhodné provést záměnu za rodiče a určit, zda výsledná mnoţina článků sdílející tuto vlastnost nevytvoří shluk blíţící se očekávané velikosti. Pokud ne, je vhodné pokusit se provést záměnu za potomka a otestovat, zda dojde k vytvoření shluku v případě kombinace několika štítků. V tomto případě však musíme dát pozor, aby se potomek, nebo některý z jeho následovníků v textu skutečně vyskytoval a nebyl tak přiřazen nesouvisející štítek. odstranění jedinečných štítků velmi často dochází k přiřazení štítků, které se u daného článku vyskytují unikátně, a u ţádného jiného článku je jiţ nenajdeme. Pokud se nepodařilo aplikovat ţádnou jinou metodu, je vhodné tyto štítky odstranit, neboť pro shlukování nemají ţádný význam. Prakticky se můţe jednat o různá vzdálená témata, kterými se článek zabývá, ale které jiţ všechny ostatní články ignorují, nebo nejsou dostatečně popsána v rámci Linked Data. 5 Vyhodnocení shlukování V předchozí kapitole jsme představili techniku volby vlastností a nyní se podíváme na problematiku jejího vyhodnocení. Existují dvě základní metody vyhodnocení volby vlastností: Přímé porovnání dvou sad vlastností - porovnání sady automaticky zvolených vlastností s ručně zvolenými vlastnostmi. Jinak řečeno se snaţíme automaticky zvolit stejné štítky charakterizující články, které by zvolil člověk. Porovnání výsledků algoritmu porovnáme výstupy shlukovacího algoritmu, jehoţ vstupem budou jednou automaticky zvolené vlastnosti a podruhé ručně zvolené vlastnosti. V případě přímého porovnání dvou sad vlastností nelze toto vyhodnocení povaţovat za správné a věrohodné, coţ je způsobeno zejména subjektivním výběrem štítků v případě manuálního výběru. Člověk můţe některé významné štítky vynechat a naopak jiné přidat. Samotné porovnání těchto dvou mnoţin je sice velmi jednoduché, ale zároveň velmi nepřesné. Lze testovat pouze výskyt vs. absenci daného pojmu a nikoliv jiţ blízkost automaticky a manuálně zvolené vlastnosti. V případě porovnání výsledků algoritmu dojde k aplikaci dané sady vlastností a lze zkoumat její vliv na výsledná data. Nezáleţí nám tak na konkrétních vlastnostech, ale spíše na tom, jaký mají vliv na stejný algoritmus realizující např. shlukování. My jsme si zvolili druhou moţnost, neboť ukazuje, ţe manuální volba vlastností nemusí být vţdy vhodná a nemusí dosahovat nejlepších moţných výsledků. Kromě toho je ruční volba vlastností zatíţena subjektivním přístupem, který má v případě shlukování výrazně menší vliv a výsledek je tak lépe porovnatelný.
6 Jako základní shlukovací metodu jsme pouţili algoritmus K-průměrů umoţňující rozdělení dokumentů do zadaného počtu shluků. Budeme vyuţívat 3 základní techniky volby vlastností: 1. Manuální volba vlastností vlastnosti jsou zvoleny ručně takovým způsobem, aby maximálně odlišily jednotlivé vzorové mnoţiny dokumentů. Volbu vlastností provádí ručně uţivatel na základně znalosti obsahu článků a znalosti názvů manuálních shluků, dle kterých budeme shlukování vyhodnocovat. Uţivatel je dostatečně seznámen s problematikou shlukování. 2. Volba vlastností s využitím statistické metody vyuţíváme nejjednodušší statistický přístup v podobě TFIDF. V tomto případě chceme demonstrovat, ţe pouţití statistické metody je závislé na počtu dokumentů, na kterých se provede natrénování TFIDF skóre. V případě menšího mnoţství dokumentů vrácených jako výsledky vyhledávání se ukazuje tato metoda jako nevhodná a navíc značně výpočetně náročná. Abychom mohli tuto techniku pouţít museli jsme zvýšit počet trénovacích dokumentů na 500. V případě trénování nad 25 dokumenty bylo TFIDF zcela nepouţitelné. 3. Volba vlastností s využitím Linked Data naše metoda volby vlastností s vyuţitím štítků získaných z Linked Data. Jako testovací sadu jsme pouţili 10 x 25 ručně anotovaných článků, které měl shlukovací algoritmus správně rozdělit do pěti různých shluků. Vyhodnocení shlukování bylo prováděno na základě porovnání s ručním rozdělením dokumentů do daných shluků. Z důvodu věrohodnosti bylo spuštění shlukovacího algoritmu provedeno desetkrát, neboť v rámci inicializace centroidů metody K-means je vyuţita náhodná sloţka pro prvotní nastavení centroidů, která má vliv na kvalitu výsledného shlukování. V následující tabulce č. 1 jsou znázorněny výsledky shlukování s vyuţitím manuálně zvolených vlastností. Význam sloupců je následující: Přesnost standardní výpočet přesnosti. Úplnost standardní výpočet úplnosti. Shoda počet článků, kdy došlo ke shodě při porovnání s ručně stanovenými shluky. Navíc kolik článků obsahují automatické shluky navíc a které do stanovených shluků nepatří. Chybí počet článků, které nebyly v rámci automatických shluků nalezeny, avšak patřit tam dle manuálních shluků měly. Tab. 1. Shlukování s využitím manuálních vlastností iterace přesnost úplnost shoda navíc chybí
7 Vybraný příspěvek celkem: V následující tabulce č. 2 jsou znázorněny výsledky shlukování s vyuţitím statisticky zvolených vlastností. Význam sloupců je shodný s předchozí tabulkou č. 1. Tab. 2. Shlukování s využitím vlastností dle TFIDF iterace přesnost úplnost shoda navíc chybí celkem: V následující tabulce č. 3 jsou znázorněny výsledky shlukování s vyuţitím vlastností získanými na základě našeho algoritmu vyuţívající informace z Linked Data. Význam sloupců je shodný s předchozími tabulkami. Tab. 3. Shlukování s vlastnostmi získanými z Linked Data iterace přesnost úplnost shoda navíc chybí
8 celkem: Nyní si porovnáme celkově dosaţené výsledky u všech třech typů shlukování. Z následující tabulky vyplývá, ţe nejvhodnější volba vlastností je samozřejmě ruční, coţ se však dalo předpokládat. Naše metoda volby vlastností je však jen o 8% horší, v případě porovnání F-míry. Statistická volba vlastností s vyuţitím TFIDF dosáhla také velmi dobrých výsledků, avšak pouze díky pouţití dvou významných modifikací: TFIDF bylo trénováno na 20x větší mnoţině článků, neboť v případě trénování na stejně velké mnoţině článků se tato technika projevila jako nepouţitelná. Výsledné štítky zvolené dle TFIDF byly upraveny tím způsobem, ţe bylo vynecháno 5% štítků s nejvyšším TFIDF skóre, neboť byly příliš unikátní a v rámci shlukování neměly význam. Dále byl počet vlastností získaných s vyuţitím TFIDF omezen na nejlepších 30% a zároveň na maximální počet vlastností ve výši 40 kusů. Tab. 4. Porovnání výsledků shlukování volba vlastností: manuální tfidf Linked Data přesnost: 0,516 0,471 0,465 úplnost: 0,592 0,488 0,552 F-míra: 0,551 0,479 0,505 6 Budoucí práce Cílem další práce bude zejména vyhodnocení této techniky volby vlastností s vyuţitím shlukování na větší kolekci dokumentů. K tomuto účelu je však třeba pouţít kolekci dokumentů nejlépe z oblasti IT obsahující informace o zařazení článků do shluků, kterou jsme doposud neměli k dispozici. Na základě inspirace článkem [2] bychom chtěli tuto techniku ověřit na projektu Open Directory [11], který obsahuje hierarchickou strukturu kategorií včetně zařazených článků. Dle [2] je navíc moţné ze sluţby Delicious [9] získat k těmto článkům štítky v podobě krátkých textových řetězců, coţ by mohla být další zajímavá a vyuţitelná informace. Z důvodu porovnatelnosti s [2] bychom chtěli pouţít stejnou transformaci hierarchické struktury kategorií z ODP do plošných a tvrdých kategorií. Naše další práce se bude zabývat i metodami shlukování přímo s vyuţitím struktury Linked Data. Nebudeme tak jiţ pouţívat ţádné vlastnosti vstupující do existujícího algoritmu, ale pokusíme se navrhnout vlastní algoritmus, který přímo na základě informací z Linked Data navrhne optimální počet shluků a články rozdělí do skupin dle souvislostí mezi tématy. Prakticky nám tak do algoritmu vstoupí problematika analýzy velmi rozsáhlého grafu s výpočtem, nebo odhadem délky cesty mezi uzly. Naše technika volby vlastností s vyuţitím Linked Data bude dále pouţívána a testována na vlastní kolekci obsahující článků z oblasti IT typu Call for papers, které však nebylo moţné v současné době vyuţít z důvodu chybějících anotací. Tyto pozvánky
9 Vybraný příspěvek k účasti na konferenci byly nashromáţděny z veřejně dostupných zdrojů, jako jsou např. y, diskusní fóra nebo přímo webové stránky konferencí. 7 Závěr V tomto článku jsme představili techniku umoţňující automatickou volbu vlastností s vyuţitím strojově čitelných informací z Linked Data. Popsali jsme si vlastní algoritmus výběru vlastností a přiblíţili hlavní problémy vyhodnocení volby vlastností. Jako vhodný přístup k vyhodnocení volby vlastností se jeví algoritmus shlukování, který tyto vlastnosti vyuţívá. Nehodnotíme tak tedy přímo získané vlastnosti, ale jejich význam pro další zpracování, coţ je mnohem více vypovídající hodnotou. Tato technika volby vlastností s vyuţitím Linked Data dosáhla v tomto případě jen o 8% horších výsledků při porovnání F-míry vzhledem k manuální volbě vlastností. Poděkování Tato práce byla částečně podpořena z projektů: CZ.1.05/1.1.00/ NTIS a GAČR P103/11/1489 Metody pro tvorbu a ověřování komponentových systémů ze specifikací v přirozeném jazyce. Literatura 1. Blum, A., Langley, P.: Selection of relevant features and examples in machine learning. In: Proceedings of Artificial Intelligence, Bradley, P. S., Mangasarian, O.L.: Feature selection via concave minimization and support vector machines. In: Proceedings of ICML, Lee, T. B. Linked Data Design Issues, W3C Fischer, B., Buhmann, J. H.: Data Resampling for Path Based Clustering. In: Pattern Recognition, Springer Berlin/Heidelberg, 2002, Ramage, D., Heymann, P., Manning, D. Ch, Garcia-Molina, H.: Clustering the Tagged Web. In: Proceedings of the Second ACM International Conference on Web Search and Data Mining, R.E. Miller and J.W. Thatcher (Eds.), ACM New York, NY, USA (2012), Wolf, L., Shashua, A.: Feature Selection for Unsupervised and Supervised Inference: the Emergence of Sparsity in a Weighted-Based Approach. In: Proceedings of Ninth IEEE International Conference on Computer Vision, 2003, vol DBpedia DBpedia Relational database management system Delicious Dogpile search engine Open Directory Project Yippy search engine.
10 Annotation: Feature selection with Linked Data application In this paper we would like to present our approach to feature selection with application of Linked Data. Linked Data can be defined as a set of rules and techniques for connections between Semantic Web resources. The importance of Linked Data is in links, so that a person or machine can explore the web of data. We used these techniques and resources for automatic feature selection and applied it for clustering method. We will demonstrate this approach with data collection related to IT area. These articles were automatically expanded by tags defined as resources from Linked Data. We will explain the transformation of these tags into features that can be used for clustering.
Sémantický web 10 let poté
Sémantický web 10 let poté Vilém Sklenák sklenak@vse.cz Vysoká škola ekonomická, fakulta informatiky a statistiky, katedra informačního a znalostního inženýrství Inforum2011, 26. 5. 2011 Vilém Sklenák
Metody tvorby ontologií a sémantický web. Martin Malčík, Rostislav Miarka
Metody tvorby ontologií a sémantický web Martin Malčík, Rostislav Miarka Obsah Reprezentace znalostí Ontologie a sémantický web Tvorba ontologií Hierarchie znalostí (D.R.Tobin) Data jakékoliv znakové řetězce
Martin Dostal Analýza nestrukturovaných dat s využitím Linked Data
Martin Dostal Analýza nestrukturovaných dat s využitím Linked Data Katedra informatiky a výpočetní techniky Fakulta aplikovaných věd Západočeská univerzita v Plzni 1) Linked Data Obsah Problém s různou
Algoritmy a struktury neuropočítačů ASN P9 SVM Support vector machines Support vector networks (Algoritmus podpůrných vektorů)
Algoritmy a struktury neuropočítačů ASN P9 SVM Support vector machines Support vector networks (Algoritmus podpůrných vektorů) Autor: Vladimir Vapnik Vapnik, V. The Nature of Statistical Learning Theory.
Profilování vzorků heroinu s využitím vícerozměrné statistické analýzy
Profilování vzorků heroinu s využitím vícerozměrné statistické analýzy Autor práce : RNDr. Ivo Beroun,CSc. Vedoucí práce: prof. RNDr. Milan Meloun, DrSc. PROFILOVÁNÍ Profilování = klasifikace a rozlišování
Získávání dat z bibliografických databází
Dalibor Fiala Katedra informatiky a výpočetní techniky Západočeská univerzita v Plzni Univerzitní 8, 306 14 Plzeň dalfia@kiv.zcu.cz Abstrakt. Známé bibliografické databáze splňují několik funkcí a mohou
PRŮZKUMNÍK ISDP NÁVOD K OBSLUZE INFORMAČNÍHO SYSTÉMU O DATOVÝCH PRVCÍCH (ISDP)
PRŮZKUMNÍK ISDP NÁVOD K OBSLUZE INFORMAČNÍHO SYSTÉMU O DATOVÝCH PRVCÍCH (ISDP) Obsah Úvod...2 Co je ISDP...2 Jaké jsou funkce ISDP...2 Slovník pojmů...2 Dílčí DP...2 DS...2 ISDP...2 JeDP...2 OS...2 SlDP...2
Strojové učení Marta Vomlelová
Strojové učení Marta Vomlelová marta@ktiml.mff.cuni.cz KTIML, S303 Literatura 1.T. Hastie, R. Tishirani, and J. Friedman. The Elements of Statistical Learning, Data Mining, Inference and Prediction. Springer
Návrh a implementace algoritmů pro adaptivní řízení průmyslových robotů
Návrh a implementace algoritmů pro adaptivní řízení průmyslových robotů Design and implementation of algorithms for adaptive control of stationary robots Marcel Vytečka 1, Karel Zídek 2 Abstrakt Článek
Tento příklad popíše asi nejzákladnější promoci. Kdyţ si zákazník koupí 3 kusy, dva kusy zaplatí a jeden dostane zdarma.
3.5.11 PŘÍKLADY PROMOCÍ Tato kapitola neslouţí k popisu nějaké zvláštní agendy nebo funkce, ale měla by slouţit k objasnění a ukázaní práce s promocemi. Promoce jsou poměrně logicky sloţitá záleţitost,
Sémantický web a extrakce
Sémantický web a extrakce informací Martin Kavalec kavalec@vse.cz Katedra informačního a znalostního inženýrství FIS VŠE Seminář KEG, 11. 11. 2004 p.1 Přehled témat Vize sémantického webu Extrakce informací
Modely a sémantika. Petr Šaloun VŠB-Technická univerzita Ostrava FEI, katedra informatiky
Modely a sémantika Petr Šaloun VŠB-Technická univerzita Ostrava FEI, katedra informatiky Úvod Existující problémy Prudký nárůst množství informací na webu Kognitivní přetížení Ztráta v informačním prostoru
Správa VF XML DTM DMVS Datový model a ontologický popis
Správa VF XML DTM DMVS Datový model a ontologický popis Verze 1.0 Standard VF XML DTM DMVS Objednatel Plzeňský kraj Institut plánování a rozvoje hlavního města Prahy Zlínský kraj Kraj Vysočina Liberecký
Usuzování za neurčitosti
Usuzování za neurčitosti 25.11.2014 8-1 Usuzování za neurčitosti Hypotetické usuzování a zpětná indukce Míry postačitelnosti a nezbytnosti Kombinace důkazů Šíření pravděpodobnosti v inferenčních sítích
Z HISTORIE SPOLEČNOSTI
FENOMÉN GOOGLE Z HISTORIE SPOLEČNOSTI Vyhledávač navrhli Sergey Brin a Larry Page v rámci svého výzkumu na Stanfordově univerzitě v Kalifornii, 1995 Jejich záměrem bylo najít lepší způsob, jak se orientovat
Pracovní celky 3.2, 3.3 a 3.4 Sémantická harmonizace - Srovnání a přiřazení datových modelů
Pracovní celky 3.2, 3.3 a 3.4 Sémantická harmonizace - Srovnání a datových modelů Obsah Seznam tabulek... 1 Seznam obrázků... 1 1 Úvod... 2 2 Metody sémantické harmonizace... 2 3 Dvojjazyčné katalogy objektů
Pokyny pro zpracování závěrečné práce
Pokyny pro zpracování závěrečné práce SOUTĚŢE VODA A ŢIVOTNÍ PROSTŘEDÍ MORAVSKOSLEZSKÉHO KRAJE V rámci projektu MOST - TECH CZ.1.07/1.1.07/02.0100 Motivace studentů ke studiu technických oborů OSTRAVA
VYHODNOCOVÁNÍ KVANTITATIVNÍCH DAT (ÚVOD DO PROBLEMATIKY) Metodologie pro ISK
VYHODNOCOVÁNÍ KVANTITATIVNÍCH DAT (ÚVOD DO PROBLEMATIKY) Metodologie pro ISK 14. 11. 2014 NENÍ STATISTIKA JAKO STATISTIKA Deskriptivní statistika Výzkumné otázky, ne hypotézy (případně deskriptivní hypotézy)
Web 2.0 vs. sémantický web
Web 2.0 vs. sémantický web Vilém Sklenák sklenak@vse.cz Vysoká škola ekonomická, fakulta informatiky a statistiky, katedra informačního a znalostního inženýrství Inforum2007, 24. 5. 2007 Vilém Sklenák
Modely vyhledávání informací 4 podle technologie. 1) Booleovský model. George Boole 1815 1864. Aplikace booleovské logiky
Modely vyhledávání informací 4 podle technologie 1) Booleovský model 1) booleovský 2) vektorový 3) strukturní 4) pravděpodobnostní a další 1 dokumenty a dotazy jsou reprezentovány množinou indexových termů
Výměnný formát XML DTM DMVS PK
Výměnný formát XML DTM DMVS PK Představení partnerským krajům Praha 8. 2. 2016 Krajský úřad Plzeňského kraje Odbor informatiky Koncept etapizace tvorby výměnného formátu XML aktualizačních zakázek Digitální
Algoritmy pro shlukování prostorových dat
Algoritmy pro shlukování prostorových dat Marta Žambochová Katedra matematiky a informatiky Fakulta sociálně ekonomická Univerzita J. E. Purkyně v Ústí nad Labem ROBUST 21. 26. leden 2018 Rybník - Hostouň
Vícerozměrné statistické metody
Vícerozměrné statistické metody Shluková analýza Jiří Jarkovský, Simona Littnerová FSTA: Pokročilé statistické metody Typy shlukových analýz Shluková analýza: cíle a postupy Shluková analýza se snaží o
Management projektů. Programová podpora auditu sytému managementu kvality HOT 4IT. Plán projektu
Management projektů Programová podpora auditu sytému managementu kvality HOT 4IT Plán projektu Historie Verze Datum Status Kdo Poznámka 0.1 8. 4. 2010 Špaček Petr Vytvoření 0.2 11. 4. 2010 Špaček Petr
Automatické vyhledávání informace a znalosti v elektronických textových datech
Automatické vyhledávání informace a znalosti v elektronických textových datech Jan Žižka Ústav informatiky & SoNet RC PEF, Mendelova universita Brno (Text Mining) Data, informace, znalost Elektronická
Automatická oprava textu v různých jazycích
Automatická oprava textu v různých jazycích Bc. Petr Semrád, doc. Ing. František Dařena Ph.D., Ústav informatiky, Provozně ekonomická fakulta, Mendelova univerzita v Brně, xsemrad@mendelu.cz, frantisek.darena@mendelu.cz
Průzkumník IS DP. Návod k obsluze informačního systému o datových prvcích (IS DP) vypracovala společnost ASD Software, s. r. o.
Průzkumník IS DP Návod k obsluze informačního systému o datových prvcích (IS DP) vypracovala společnost ASD Software, s. r. o. dokument ze dne 13. 09. 2018, verze 1.00 Průzkumník IS DP Návod k obsluze
Internetové vyhledávače
Internetové vyhledávače Co je internetový vyhledávač služba, která umožňuje na Internetu najít webové stránky, které obsahují požadované informace uživatel zadává do rozhraní vyhledávače klíčová slova,
Relační DB struktury sloužící k optimalizaci dotazů - indexy, clustery, indexem organizované tabulky
Otázka 20 A7B36DBS Zadání... 1 Slovníček pojmů... 1 Relační DB struktury sloužící k optimalizaci dotazů - indexy, clustery, indexem organizované tabulky... 1 Zadání Relační DB struktury sloužící k optimalizaci
Větná polarita v češtině. Kateřina Veselovská Žďárek Hořovice,
Větná polarita v češtině Kateřina Veselovská Žďárek Hořovice, 27. 11. 2009 1 Polarita - úvod do problematiky Větná polarita: a) Cíl a motivace b) Charakteristika c) Možnosti výzkumu Větná polarita a vyhledávání
Automatizovatelná aktualizace Wikidata z veřejných databází. Jakub Klímek
Automatizovatelná aktualizace Wikidata z veřejných databází Jakub Klímek Veřejné databáze, Otevřená data https://data.gov.cz 2 Veřejné databáze, Otevřená data - zajímavé zdroje Český úřad zeměměřický a
S databázemi se v běžném životě setkáváme velmi často. Uvádíme běžné použití databází velkého rozsahu:
Úvod do databází Základní pojmy Databáze je množina záznamů, kterou shromažďujeme za nějakým konkrétním účelem. Databáze používáme zejména pro ukládání obsáhlých informací. Databázové systémy jsou k dispozici
Vilém Sklenák Inforum2009,
Sémantické vyhledávání je blíže? Vilém Sklenák sklenak@vse.cz Vysoká škola ekonomická, fakulta informatiky a statistiky, katedra informačního a znalostního inženýrství Inforum2009, 27. 5. 2009 Vilém Sklenák
ROZDÍLY V NÁVRZÍCH RELAČNÍCH A OBJEKTOVÝCH DATABÁZÍ A JEJICH DŮSLEDKY PRO TRANSFORMACI MODELŮ
ROZDÍLY V NÁVRZÍCH RELAČNÍCH A OBJEKTOVÝCH DATABÁZÍ A JEJICH DŮSLEDKY PRO TRANSFORMACI MODELŮ RELATIONAL AND OBJECT DATABASES DESIGN DIFFERENCES AND IT S IMPLICATIONS TO MODEL TRANSFORMATION Vít Holub
UŽIVATELSKÁ PŘÍRUČKA K INTERNETOVÉ VERZI REGISTRU SČÍTACÍCH OBVODŮ A BUDOV (irso 4.x) VERZE 1.0
UŽIVATELSKÁ PŘÍRUČKA K INTERNETOVÉ VERZI REGISTRU SČÍTACÍCH OBVODŮ A BUDOV (irso 4.x) VERZE 1.0 OBSAH 1 ÚVOD... 3 1.1 HOME STRÁNKA... 3 1.2 INFORMACE O GENEROVANÉ STRÁNCE... 4 2 VYHLEDÁVÁNÍ V ÚZEMÍ...
Moderní systémy pro získávání znalostí z informací a dat
Moderní systémy pro získávání znalostí z informací a dat Jan Žižka IBA Institut biostatistiky a analýz PřF & LF, Masarykova universita Kamenice 126/3, 625 00 Brno Email: zizka@iba.muni.cz Bioinformatika:
Otevřená data veřejné správy
Seminář Digitální výzvy 2012 8.11.2012 Otevřená data veřejné správy Dušan Chlapek 1, Jan Kučera 1, Martin Nečaský 2 1 Fakulta informatiky a statistiky, Vysoká škola ekonomická v Praze 2 Matematicko-fyzikální
Hromadná korespondence
Kapitola dvanáctá Hromadná korespondence Učební text Mgr. Radek Hoszowski Hromadná korespondence Hromadná korespondence Představíme si jednoduchý nástroj, který nám může ušetřit velké množství práce. Je
AVDAT Mnohorozměrné metody, metody klasifikace Shluková analýza
AVDAT Mnohorozměrné metody, metody klasifikace Shluková analýza Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Shluková analýza Cílem shlukové analýzy je nalézt v datech podmnožiny
Unstructured data pre-processing using Snowball language
Unstructured data pre-processing using Snowball language Předzpracování nestrukturovaných dat pomocí jazyka Snowball Bc. Pavel Řezníček, doc. Ing. František Dařena, PhD., Ústav informatiky, Provozně ekonomická
Informatika a výpočetní technika 1. Ing. Ladislav Nagy Technická univerzita v Liberci FT / KOD / 2011
Informatika a výpočetní technika 1 Ing. Ladislav Nagy Technická univerzita v Liberci FT / KOD / 2011 Úvod Základní informace Podmínky zápočtu, docházka Pravidla chovaní v PC učebně Náplň cvičení EXCEL
Uživatelská podpora v prostředí WWW
Uživatelská podpora v prostředí WWW Jiří Jelínek Katedra managementu informací Fakulta managementu Jindřichův Hradec Vysoká škola ekonomická Praha Úvod WWW obsáhlost obsahová i formátová pestrost dokumenty,
Operační výzkum. Síťová analýza. Metoda CPM.
Operační výzkum Síťová analýza. Metoda CPM. Operační program Vzdělávání pro konkurenceschopnost Název projektu: Inovace magisterského studijního programu Fakulty ekonomiky a managementu Registrační číslo
Využití nástrojů společnosti Wolfram Research, Inc. ve výuce chemie
Využití nástrojů společnosti Wolfram Research, Inc. ve výuce chemie PhDr. Martin Adamec, RNDr. Antonín Jančařík, Ph.D. Univerzita Karlova v Praze, Pedagogická fakulta Úvod Společnost Wolfram Research,
Znalostní nástroje pro analýzu a prohledávání Webu
Západočeská univerzita v Plzni Katedra informatiky a výpočetní techniky Univerzitní 8 306 14 Plzeň Znalostní nástroje pro analýzu a prohledávání Webu Odborná práce ke státní doktorské zkoušce Martin Dostal
MODULÁRNÍ REDAKČNÍ SYSTÉM (CMS), SE ZAMĚŘENÍM PRO FIREMNÍ
MODULÁRNÍ REDAKČNÍ SYSTÉM (CMS), SE ZAMĚŘENÍM PRO FIREMNÍ PREZENTACI Petr Minařík 2.2.2010 ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE ZADÁNÍ PRÁCE Seznámení se s současnými redakčními systémy vyuţívanými pro
Ontologie. Otakar Trunda
Ontologie Otakar Trunda Definice Mnoho různých definic: Formální specifikace sdílené konceptualizace Hierarchicky strukturovaná množina termínů popisujících určitou věcnou oblast Strukturovaná slovní zásoba
Tovek Tools. Tovek Tools jsou standardně dodávány ve dvou variantách: Tovek Tools Search Pack Tovek Tools Analyst Pack. Připojené informační zdroje
jsou souborem klientských desktopových aplikací určených k indexování dat, vyhledávání informací, tvorbě různých typů analýz a vytváření přehledů a rešerší. Jsou vhodné pro práci s velkým objemem textových
VOLBA SAMOSTATNÉHO CENTRÁLNÍHO ÚTVARU LOGISTIKY VE VÝROBNÍM PODNIKU
VOLBA SAMOSTATNÉHO CENTRÁLNÍHO ÚTVARU LOGISTIKY VE VÝROBNÍM PODNIKU THE CHOICE OF AN INDEPENDENT CENTRAL LOGISTICS DEPARTMENT IN A MANUFACTURING COMPANY Stanislav Koutný 1 Anotace: V rámci příprav na širší
Analýza dat pomocí systému Weka, Rapid miner a Enterprise miner
Vysoká škola ekonomická v Praze Analýza dat pomocí systému Weka, Rapid miner a Enterprise miner Dobývání znalostí z databází 4IZ450 XXXXXXXXXXX Přidělená data a jejich popis Data určená pro zpracování
Informační systémy 2006/2007
13 Vysoká škola báňská Technická univerzita Ostrava Fakulta strojní, Katedra automatizační techniky a řízení Informační systémy 2006/2007 Ivan Kedroň 1 Obsah Analytické nástroje SQL serveru. OLAP analýza
Text Mining: SAS Enterprise Miner versus Teragram. Petr Berka, Tomáš Kliegr VŠE Praha
Text Mining: SAS Enterprise Miner versus Teragram Petr Berka, Tomáš Kliegr VŠE Praha Text mining vs. data mining Text mining = data mining na nestrukturovaných textových dokumentech otázka vhodné reprezentace
Modely datové. Další úrovní je logická úroveň Databázové modely Relační, Síťový, Hierarchický. Na fyzické úrovni se jedná o množinu souborů.
Modely datové Existují různé úrovně pohledu na data. Nejvyšší úroveň je úroveň, která zachycuje pouze vztahy a struktury dat samotných. Konceptuální model - E-R model. Další úrovní je logická úroveň Databázové
Identifikace. Jiří Jelínek. Katedra managementu informací Fakulta managementu J. Hradec Vysoká škola ekonomická Praha
Identifikace tématických sociálních sítí Katedra managementu informací Fakulta managementu J. Hradec Vysoká škola ekonomická Praha 2 Obsah prezentace Cíl Fáze řešení a navržené postupy Prototyp a výsledky
WAMS - zdroj kvalitní ch dat pro analý zý stavu sí tí a pro nové éxpértní sýsté mý
WAMS - zdroj kvalitní ch dat pro analý zý stavu sí tí a pro nové éxpértní sýsté mý Daniel Juřík, Antonín Popelka, Petr Marvan AIS spol. s r.o. Brno Wide Area Monitoring Systémy (WAMS) umožňují realizovat
Logický datový model VF XML DTM DMVS
Logický datový model VF XML DTM DMVS Verze 1.1 VF XML DTM DMVS Objednatel Plzeňský kraj Institut plánování a rozvoje hlavního města Prahy Zlínský kraj Kraj Vysočina Liberecký kraj Karlovarský kraj Statutární
Jihočeská univerzita v Českých Budějovicích Pedagogická fakulta Katedra informatiky Akademický rok: 2008-09
Jihočeská univerzita v Českých Budějovicích Pedagogická fakulta Katedra informatiky Akademický rok: 2008-09 Studijní obor: Výpočetní technika a informatika Technologie SVG aktuální standard webové vektorové
ZÍSKÁVÁNÍ ZNALOSTÍ Z DATABÁZÍ
metodický list č. 1 Dobývání znalostí z databází Cílem tohoto tematického celku je vysvětlení základních pojmů z oblasti dobývání znalostí z databází i východisek dobývání znalostí z databází inspirovaných
Uživatelská příručka
PŘÍLOHA B Uživatelská příručka Před prvním spuštění aplikace je nezbytné ujasnit si některé pojmy: web URL webových stránek, pro které se budou zjišťovat pozice. klíčové slovo - Slovní spojení nebo samostatné
InformatikaaVT(1) Cílem předmětu je: Žáci:
InformatikaaVT(1) Cílem předmětu je: seznámení žáků se základními pojmy informatiky a VT poskytnutí teoretických znalostí a praktických dovedností nezbytných při práci s informacemi azařízeními VT Žáci:
Příloha č. 10 Obecná pravidla (rámcová metodika) pro vykazování skutečných nepřímých nákladů v projektech OP VaVpI
Příloha č. 10 Obecná pravidla (rámcová metodika) pro vykazování skutečných nepřímých nákladů v projektech OP VaVpI 1 Úvod Tato metodika se zabývá dílčí problematikou vykazování skutečných způsobilých nákladů
Vložení identifikátorů DOI, UT WOS, UT SCOPUS a PubMed ID do záznamu
Vložení identifikátorů DOI, UT WOS, UT SCOPUS a PubMed ID do záznamu 6. 10. 2016 K publikačním výsledkům lze vkládat tzv. identifikátory dokumentů. Ty jednoznačně určují dokument v dané databázi. V ASEP
AKADEMICKÁ KNIHOVNA JIHOČESKÉ UNIVERZITY
AKADEMICKÁ KNIHOVNA JIHOČESKÉ UNIVERZITY V ROCE 2010 (INFORMACE O ŘEŠENÍ RP) Helena Landová 18.1. 2010 ZAHÁJEN PROVOZ AK JU 18.1. 2010 ZAHÁJEN PROVOZ AK JU ZÁKLADNÍ INFORMACE O RP Název projektu: Zásadní
Obsah přednášky Jaká asi bude chyba modelu na nových datech?
Obsah přednášky Jaká asi bude chyba modelu na nových datech? Chyba modelu Bootstrap Cross Validation Vapnik-Chervonenkisova dimenze 2 Chyba skutečná a trénovací Máme 30 záznamů, rozhodli jsme se na jejich
GIS Geografické informační systémy
GIS Geografické informační systémy Obsah přednášky Prostorové vektorové modely Špagetový model Topologický model Převody geometrií Vektorový model Reprezentuje reálný svět po jednotlivých složkách popisu
Formální konceptuální analýza
moderní metoda analýzy dat 14. října 2011 Osnova Informatika 1 Informatika 2 3 4 Co je to informatika? Co je to informatika? Computer science is no more about computers than astronomy is about telescopes.
Grafy. doc. Mgr. Jiří Dvorský, Ph.D. Katedra informatiky Fakulta elektrotechniky a informatiky VŠB TU Ostrava. Prezentace ke dni 13.
Grafy doc. Mgr. Jiří Dvorský, Ph.D. Katedra informatiky Fakulta elektrotechniky a informatiky VŠB TU Ostrava Prezentace ke dni 13. března 2017 Jiří Dvorský (VŠB TUO) Grafy 104 / 309 Osnova přednášky Grafy
Vyhledávání informací
Vyhledávání informací Informace na internetu můžeme získat nejen z webových stránek, ale ze spousty dalších míst. Přestože ze statických webových stránek lze získat jen zlomek veškerých dostupných informací,
ČVUT FEL X36PAA - Problémy a algoritmy. 4. úloha - Experimentální hodnocení algoritmů pro řešení problému batohu
ČVUT FEL X36PAA - Problémy a algoritmy 4. úloha - Experimentální hodnocení algoritmů pro řešení problému batohu Jméno: Marek Handl Datum: 3. 2. 29 Cvičení: Pondělí 9: Zadání Prozkoumejte citlivost metod
Kdy se narodil... Vypracovali: Mrkývka Vojtěch, Mrázek Ondřej, Novotná Marie. Předmět: PLIN08 Projekty II. Semestr: Jaro 2015
Kdy se narodil... Vypracovali: Mrkývka Vojtěch, Mrázek Ondřej, Novotná Marie Předmět: PLIN08 Projekty II Semestr: Jaro 2015 Vedoucí projektu: Mgr. Marek Grác, Ph.D. Úkolem tohoto projektu bylo vytvořit
Informační centrum školy jako nezastupitelná podpora výuky. Jana Nejezchlebová Moravská zemská knihovna
Informační centrum školy jako nezastupitelná podpora výuky Jana Nejezchlebová Moravská zemská knihovna Obsah prezentace Úvod Rámcové vzdělávací programy Vzdělávací oblasti a jejich výstupy Role knihovníka
Obsah Úvod Kapitola 1 Než začneme Kapitola 2 Práce s hromadnými daty před analýzou
Úvod.................................................................. 11 Kapitola 1 Než začneme.................................................................. 17 1.1 Logika kvantitativního výzkumu...........................................
dbpedia Václav Zeman December 2015 KIZI - VŠE
dbpedia Václav Zeman December 2015 KIZI - VŠE co je dbpedia? 2 co je dbpedia? DBpedia je komunita lidí zaměřující se na získávání informací a znalostí z Wikipedie. DBpedia je sada nástrojů, které extrahují
Automatic Alignment of Tectogrammatical Trees from Czech-English Parallel Corpus
Automatic Alignment of Tectogrammatical Trees from Czech-English Parallel Corpus David Mareček obhajoba diplomové práce 8. 9. 2008 Motivace Na t-rovině jsou si jazyky podobnější alignment by zde měl být
Od relačních databází k technologiím sémantickému webu
www.mondis.cz Od relačních databází k technologiím sémantickému webu Petr Křemen petr.kremen@fel.cvut.cz Data v informačních systémech Data Informace Stoupající úroveň abstrakce Znalost www.mondis.cz (C)
Nadpis článku: Zavedení speciálního nástroje SYPOKUB do praxe
Oborový portál BOZPinfo.cz - http://www.bozpinfo.cz Tisknete stránku: http://www.bozpinfo.cz/josra/josra-03-04-2013/zavedeni-sypokub.html Články jsou aktuální k datumu jejich vydání. Stránka byla vytvořena/aktualizována:
Lokační referenční metody a jejich interpretace ve standardech
Lokační referenční metody a jejich interpretace ve standardech Jiří Plíhal Tento příspěvek by rád na konkrétním příkladu standardu přiblížil referenční metody stanovení polohy a zejména jejich dynamickou
Roční periodická zpráva projektu
WAK-1F44C-2005-2 WAK System Název projektu: Automatizovaná výměna dat mezi informačními systémy krizového řízení v dopravě s jednotným univerzálním a implementovaným rozhraním založeným na standardu webových
Příklad 2: Obsah PCB v játrech zemřelých lidí. Zadání: Data: Program:
Příklad 2: Obsah PCB v játrech zemřelých lidí Zadání: V rámci Monitoringu zdraví byly měřeny koncentrace polychlorovaných bifenylů vjátrech lidí zemřelých náhodnou smrtí ve věku 40 let a více. Sedm vybraných
Metadata, sémantika a sémantický web. Ing. Vilém Sklenák, CSc.
Metadata, sémantika a sémantický web Ing. Vilém Sklenák, CSc. Inforum 2004, Praha, 27. 5. 2004 2/21 There are things we know that we know. There are known unknowns that is to say, there are things that
Rozdělování dat do trénovacích a testovacích množin
Rozdělování dat do trénovacích a testovacích množin Marcel Jiřina Rozpoznávání je důležitou metodou při zpracování reálných úloh. Rozpoznávání je definováno dvěma kroky a to pořízením dat o reálném rozpoznávaném
Extrakce informací z ů typu Call for papers
Extrakce informací z emailů typu Call for papers Martin Dostal, Lubomír Krčmář, Karel Ježek Katedra informatiky a výpočetní techniky, Fakulta aplikovaných věd Západočeská univerzita v Plzni Univerzitní
Dolování v objektových datech. Ivana Rudolfová
Dolování v objektových datech Ivana Rudolfová Relační databáze - nevýhody První normální forma neumožňuje vyjádřit vztahy A je podtypem B nebo vytvořit struktury typu pole nebo množiny SQL omezení omezený
9. SEO Struktura stránek, uspořádání webu, navigace. Web pro kodéry (Petr Kosnar, ČVUT, FJFI, KFE, PINF 2008)
9. SEO Struktura stránek, uspořádání webu, navigace Web pro kodéry (Petr Kosnar, ČVUT, Obsah Struktura stránek Taxonomie Uspořádání webu Váha stránek Navigace Další prostředky navigace Uspořádání obsahu
A1 Marketingové minimum pro posílení výchovy k podnikavosti (8h)
A1 Marketingové minimum pro posílení výchovy k podnikavosti (8h) 2.1 Základy marketingové strategie (2,5h) Učitelé se seznámí se základní marketingovou terminologií a s možnými cestami rozvoje firmy. V
Quo vadis, vyhledávání (na webu)?
Quo vadis, vyhledávání (na webu)? Vilém Sklenák sklenak@vse.cz Vysoká škola ekonomická, fakulta informatiky a statistiky, katedra informačního a znalostního inženýrství Inforum 2017, 31. 5. 2017 1/23 Obsah
Praktické aspekty ABC
Praktické aspekty ABC Metoda maticového propočtu 1. Zjednodušený procesní model 2. Produktový přístup k nákladům 3. Analýza vnitřních produktů 4. Sestavení ABC rozpočtů 5. Maticový propočet Tomáš Nekvapil
Komponenta ICT. Hodinová dotace: 40 h. Téma: Tabulkový procesor (Microsoft Excel)
Komponenta ICT Hodinová dotace: 40 h. Téma: Tabulkový procesor (Microsoft Excel) Tato komponenta vychází RVP studijních oborů a lze jí zařadit ŠVP vrámci jedno nebo i více ročníků. Ţáci získají odpovídající
ANALÝZA VAZEB STRATEGIE MĚSTA PRACHATICE VŮČI STRATEGICKÉMU RÁMCI UDRŢITELNÉHO ROZVOJE ČR
ANALÝZA VAZEB STRATEGIE MĚSTA PRACHATICE VŮČI STRATEGICKÉMU RÁMCI UDRŢITELNÉHO ROZVOJE ČR Analýza byla vypracována týmem Národní sítě Zdravých měst ČR v rámci projektu Analýza vazeb rozvojových strategií
Metody inventarizace a hodnocení biodiverzity stromové složky
ČESKÁ ZEMĚDĚLSKÁ UNIVERZITA V PRAZE Fakulta lesnická a dřevařská Metody inventarizace a hodnocení biodiverzity stromové složky Methods for inventory and biodiversity evaluation of tree layer SBORNÍK ZE
Digitální učební materiál
Digitální učební materiál Číslo projektu: CZ.1.07/1.5.00/34.0548 Název školy: Gymnázium, Trutnov, Jiráskovo náměstí 325 Název materiálu: VY_32_INOVACE_143_IVT Autor: Ing. Pavel Bezděk Tematický okruh:
Modifikace algoritmu FEKM
Modifikace algoritmu FEKM Marta Žambochová Katedra matematiky a informatiky Fakulta sociálně ekonomická Univerzita J. E. Purkyně v Ústí nad Labem ROBUST 9. 14. září 2012 Němčičky Motivace Potřeba metod
Manuál k programu RIZIKA
Manuál k programu RIZIKA nástroj k efektivnímu vyhledávání a řízení pracovních rizik Program RIZIKA Program RIZIKA jsou víceuživatelskou aplikací s možností nastavení uživatelských práv pro jednotlivé
xrays optimalizační nástroj
xrays optimalizační nástroj Optimalizační nástroj xoptimizer je součástí webového spedičního systému a využívá mnoho z jeho stavebních bloků. xoptimizer lze nicméně provozovat i samostatně. Cílem tohoto
Dolování z textu. Martin Vítek
Dolování z textu Martin Vítek Proč dolovat z textu Obrovské množství materiálu v nestrukturované textové podobě knihy časopisy vědeckéčlánky sborníky konferencí internetové diskuse Proč dolovat z textu
MINISTERSTVO PRO MÍSTNÍ ROZVOJ Č.j. 7022/ R O Z H O D N U T Í č. 19/2016. ministryně pro místní rozvoj. ze dne
MINISTERSTVO PRO MÍSTNÍ ROZVOJ Č.j. 7022/2016-56 R O Z H O D N U T Í č. 19/2016 ministryně pro místní rozvoj ze dne 18. 2. 2016 o Pravidlech správy otevřených dat Ministerstva pro místní rozvoj S účinností
2. blok část B Základní syntaxe příkazů SELECT, INSERT, UPDATE, DELETE
2. blok část B Základní syntaxe příkazů SELECT, INSERT, UPDATE, DELETE Studijní cíl Tento blok je věnován základní syntaxi příkazu SELECT, pojmům projekce a restrikce. Stručně zde budou představeny příkazy
FONDY PRO SESTAVY HOSPODAŘENÍ...
EVIDENCE FONDŮ Fondy jsou určeny pro sledování stavů tvorby a čerpání částek ( výnosů a nákladů ) za poţadovanou sluţbu. Ve Windomech je však moţnost nastavit fond universálně pro různou moţnost pouţití.
Inženýrská statistika pak představuje soubor postupů a aplikací teoretických principů v oblasti inženýrské činnosti.
Přednáška č. 1 Úvod do statistiky a počtu pravděpodobnosti Statistika Statistika je věda a postup jak rozvíjet lidské znalosti použitím empirických dat. Je založena na matematické statistice, která je
Níže uvedená tabulka obsahuje technické údaje a omezení aplikace Excel (viz také článek Technické údaje a omezení aplikace Excel (2007).
Níže uvedená tabulka obsahuje technické údaje a omezení aplikace - (viz také článek Technické údaje a omezení aplikace Excel (). otevřených sešitů a systémovými prostředky a systémovými prostředky a systémovými