Vizualizace v Information Retrieval

Podobné dokumenty
Vizualizace v Information Retrieval

Strategie a metody rešerší, které mohou vést k přidané hodnotě

Profilová část maturitní zkoušky 2013/2014

MBI - technologická realizace modelu

Dobývání znalostí z textů text mining

Profilová část maturitní zkoušky 2017/2018

Wichterlovo gymnázium, Ostrava-Poruba, příspěvková organizace. Maturitní otázky z předmětu INFORMATIKA A VÝPOČETNÍ TECHNIKA


Modely vyhledávání informací 4 podle technologie. 1) Booleovský model. George Boole Aplikace booleovské logiky

Uživatelská podpora v prostředí WWW

Vzdělávací obsah vyučovacího předmětu

1.1 Seznámení s programy Office

PRODUKTY. Tovek Tools

GRR. získávání znalostí v geografických datech Autoři. Knowledge Discovery Group Faculty of Informatics Masaryk Univerzity Brno, Czech Republic

materiál č. šablony/č. sady/č. materiálu: Autor: Karel Dvořák Vzdělávací oblast předmět: Informatika Ročník, cílová skupina: 7.

Zobrazte si svazy a uspořádané množiny! Jan Outrata

Samoučící se neuronová síť - SOM, Kohonenovy mapy

Úvod do problematiky. Význam počítačové grafiky. Trochu z historie. Využití počítačové grafiky

ZÍSKÁVÁNÍ ZNALOSTÍ Z DATABÁZÍ

ECM. Enterprise Content Management. čt 9:15 Petr Bouška (xboup00) Zbyněk Hostaš Lukáš Maršíček Martin Nikl (xnikm00)

POČÍTAČOVÉ PRAKTIKUM ročník Charakteristika vyučovacího předmětu. Obsahové, časové a organizační vymezení

Dolování z textu. Martin Vítek

Tovek Tools. Tovek Tools jsou standardně dodávány ve dvou variantách: Tovek Tools Search Pack Tovek Tools Analyst Pack. Připojené informační zdroje

Hlavní rysy produktu MapInfo Professional

Státnice odborné č. 20

Experimentální systém pro WEB IR

5.15 INFORMATIKA A VÝPOČETNÍ TECHNIKA

Využití ICT techniky především v uměleckém vzdělávání. Akademie - VOŠ, Gymn. a SOŠUP Světlá nad Sázavou

Informatika

Maturitní otázky z předmětu PROGRAMOVÁNÍ

Seminář z informatiky

Moderní systémy pro získávání znalostí z informací a dat

Úvod do problematiky. Význam počítačové grafiky. Trochu z historie. Využití počítačové grafiky

Katedra kybernetiky laboratoř Inteligentní Datové Analýzy (IDA) Katedra počítačů, Computational Intelligence Group

Binární vyhledávací stromy II

Informatika. tercie. Mgr. Kateřina Macová 1

CZ.1.07/1.5.00/

Stručný obsah. K2118.indd :15:27

AMPHORA - NÁSTROJ PRO INDEXOVÁNÍ WEBOVÝCH STRÁNEK.

PRODUKTY. Tovek Tools

Praktické využití Mathematica CalcCenter. Ing. Petr Kubín, Ph.D. Katedra elektroenergetiky, ČVUT v Praze, FEL

V.3. Informační a komunikační technologie

CASE nástroje. Jaroslav Žáček

Informační a komunikační technologie

Z znam workshopu k projektu QJ Program workshopu: 4. Diskuse. s metodice. H

Obsah. Kapitola 1. Kapitola 2. Kapitola 3. Úvod 9

Dobývání znalostí z webu web mining

Tabulkový procesor. Základní rysy

Ing. Mgr. Jiří Svoboda Kurzy

Obsah. Předmluva 13. O autorovi 15. Poděkování 16. O odborných korektorech 17. Úvod 19

1. IT_0F1 Základní obsluha MS Office 2010 MS Word, MS Excel, MS PowerPoint, MS Windows

Seznámení s prostředím dot.net Framework

PRODUKTY Tovek Server 6

Využití metod strojového učení v bioinformatice David Hoksza

Měření teploty, tlaku a vlhkosti vzduchu s přenosem dat přes internet a zobrazování na WEB stránce

Získávání dat z bibliografických databází

Modely datové. Další úrovní je logická úroveň Databázové modely Relační, Síťový, Hierarchický. Na fyzické úrovni se jedná o množinu souborů.

Využití nástrojů společnosti Wolfram Research, Inc. ve výuce chemie

Tabulace učebního plánu

Hospodářská informatika

Dobývání a vizualizace znalostí

IBM SPSS Decision Trees

Umělá inteligence a rozpoznávání

Střední průmyslová škola elektrotechnická Praha 10, V Úžlabině 320

Základní informace. Operační systém (OS)

Testování neuronových sítí pro prostorovou interpolaci v softwaru GRASS GIS

GEOGRAFICKÉ INFORMAČNÍ SYSTÉMY 6

3. Software Bakaláři Kompletní školení

Informační a komunikační technologie. Informační a komunikační technologie

Sémantický web 10 let poté

Tematická oblast: Informační a komunikační technologie (VY_32_INOVACE_09_1_IT) Autor: Ing. Jan Roubíček. Vytvořeno: červen až listopad 2013.

Metadata, sémantika a sémantický web. Ing. Vilém Sklenák, CSc.

ZÍSKÁVÁNÍ ZNALOSTÍ Z DATABÁZÍ

Zřízení studijního oboru HPC (High performance computing)

Reálné gymnázium a základní škola města Prostějova Školní vzdělávací program pro ZV Ruku v ruce

Základní škola a Mateřská škola Třemešná Třemešná 341 tel: IČ:

ŠKOLNÍ VZDĚLÁVACÍ PROGRAM pro základní vzdělávání. ( zpracovaný podle RVP ZV) ŠKOLA PRO KAŽDÉHO

1. Úvod do Ajaxu 11. Jak Ajax funguje? 13

Myšlenkové mapy v Linuxu

Softwarové komponenty a Internet

Zpráva o zhotoveném plnění

VZDĚLÁVACÍ OBLAST INFORMAČNÍ A KOMUNIKAČNÍ TECHNOLOGIE VYUČOVACÍ PŘEDMĚT: INFORMAČNÍ A KOMUNIKAČNÍ TECHNOLOGIE. Charakteristika vyučovacího předmětu:

Střední průmyslová škola elektrotechnická Praha 10, V Úžlabině 320 M A T U R I T N Í T É M A T A P Ř E D M Ě T U

Vybraná zajímavá Lotus Notes řešení použitelná i ve vašich aplikacích. David Marko TCL DigiTrade

VYUŽITÍ MODERNÍCH TECHNOLOGIÍ VE VÝUCE českého jazyka a literatury

1 Webový server, instalace PHP a MySQL 13

Přípravný kurz ECDL. Popis jednotlivých lekcí (modulů) je uveden v samostatných tabulkách níže. Rozsah kurzu

1.2 Operační systémy, aplikace

Databázové a informační systémy

Text Mining: SAS Enterprise Miner versus Teragram. Petr Berka, Tomáš Kliegr VŠE Praha

Excel pro začátečníky

Web 2.0 vs. sémantický web

FAKULTA INFORMAČNÍCH TECHNOLOGIÍ SPOLEČNOST DECADIC PROJEKT FRAMETRIX

6.16 Informatika a výpočetní technika

GEOGRAFICKÉ INFORMAČNÍ SYSTÉMY 12

Informace k e-learningu

Služby Internetu. Ing. Luděk Richter

Trocha obrázků na začátek..

CASE. Jaroslav Žáček

1. Webový server, instalace PHP a MySQL 13

Transkript:

Vizualizace v Information Retrieval Petr Kopka VŠB-TU Ostrava Fakulta elektrotechniky a informatiky Katedra informatiky

Obsah Co je Information Retrieval, vizualizace, proces přístupu k informacím Způsoby vizualizace Aplikace GraphAnalysis Závěr Literatura a zdroje 2

Co je Information Retrieval Lidstvo vytváří obrovské množství informačních pramenů, člověk sám není schopen v takovém množství efektivně hledat Problém částečně přenesen na výpočetní techniku - automatický popis dokumentů nahrazuje práci člověka Problémy automatického popisu dokumentů 1. jak informaci extrahovat (na základě popisu dokumentu) 2. jak informaci použít k vyhodnocení relevance (stanovení relevance dokumentu na daný dotaz je stále na člověku) Přenos procesu stanovení relevance na počítač vyžaduje model umožňující snadno měřit relevanci 3

Co je Information Retrieval Model získávání dat DOTAZY ODEZVA VSTUP PROCESOR VÝSTUP DOKUMENTY Problém jak reprezentovat data a dotazy 4

Vizualizace v IR Proces vyhledávání dat vyžaduje poskytnutí rozhraní mezi uživatelem a systémem Systém postupně zobrazuje výsledky hledání Problém návrhu rozhraní člověk uvažuje mnohem komplexněji než počítač Zásady návrhu UI Zpětná vazba Nízké zatížení paměti Různé UI z hlediska odbornosti uživatele 5

Proces přístupu k informacím Model přístupu k informacím 1. Poptávka po informaci 2. Výběr vyhledávacího systému 3. Formulování dotazu 4. Odeslání dotazu do systému 5. Obdržení výsledků v podobě jednotlivých položek 6. Vyhodnocení výsledků 7. Konec. Nebo 8. Přeformulování dotazu a opakování od kroku 4. 6

Způsoby vizualizace v IR Textová Grafická Animovaná Výhody grafické vizualizace Stručná reprezentace (množství dat rozdílných typů) Přibližnost (shluky, zachycení poměrů) Důraz na souvislosti (důležitý rys v souvislostech) Schopnost změny perspektivy Stimulace myšlení správným směrem 7

Způsoby vizualizace v IR Overture Jednoduchý graf pojmů (graf asociací pojmů) 4 Google 6 Yahoo 37 36 11 17 29 Microsoft MSN 24 Sun 7 21 Convera 32 11 6 Autonomy IBM 7 Verity 9 Lycos 3 Findwhat 8

Způsoby vizualizace v IR Histogramy Spojnicový graf 9

Způsoby vizualizace v IR Kruhový graf 10

Způsoby vizualizace v IR SOM WEBSOM 11

Způsoby vizualizace v IR Hyperbolické stromy Bifokální stromy 12

Způsoby vizualizace v IR Třídimenzionální metody Hybridní nástroje 13

The Netron Project Hlavní aktivita vývoj software nástrojů umožňujících demostrovat schopnost grafů a diagramů vizualizovat data Kompletní kód volně k dispozici Možnost vyvíjet vlastní aplikace založené na knihovnách TNP 14

The Netron Project - balík GraphAnalysis GraphApplications Graph Analysis 15

Graph Analysis - následující vývoj Následující vývoj projektu velikost uzlů gradientní hrany 3D uzly Další vlastnosti 3D zobrazení vybrání rozsahu dat a závislostí zachování zobrazení ostatních dat 16

GraphAnalysis vstupní í data Symetrická matice Binární strom popsaný pomocí XML 0 5 1 1 3 0 5 0 0 0 0 0 1 0 0 0 0 0 1 0 0 0 12 0 3 0 0 12 0 0 0 0 0 0 0 0 17

GraphAnalysis třídní diagram 18

GraphAnalysis omezení zobrazení Vizualizace symetrické matice čítající sto objektů (bez omezení) 19

GraphAnalysis omezení zobrazení Volba omezení zobrazovaných uzlů a hran (8 92) 20

GraphAnalysis omezení zobrazení Volba omezení zobrazovaných uzlů a hran (90 100) 21

Závěr Popis vizualizačních metod Vizualizace testována na matici podobnosti s 1000 objekty Možnosti dalšího rozšíření Přiřazení textových hodnot uzlům Možnost manipulace s uzly Rastrové a vektorové výstupní formáty 22

Literatura a zdroje Ricardo Baeza-Yates and Berthier Ribeiro-Neto: Modern Information Retrieval C. J. van Rijsbergen: Information Retrieval (second ed.) http://www.dcs.gla.ac.uk/keith/preface.html Shneiderman, B. Designing the User Interface: Strategies for Effective Human- Computer Interaction (3 ed.) Teuvo Kohonen: Self-Organizing Maps Ronen Feldman, James Sanger: The Text Mining Handbook Katy Börner, Chaomei Chen, Kevin Boyack: Visualizing Knowledge Domains Jörg Ontrup, Helge Ritter: Hyperbolic Self-Organizing Maps for Semantic Navigation. Ricardo A. Cava, Paulo R. G. Luzzardi, Carla M. D. S. Freitas: The Bifocal Tree: a Technique for the Visualization of Hierarchical Information Structures Ivo Vondrák: Umělá inteligence a neuronové sítě Jan Martinovič: Information Retrieval a shlukování metodou WEBSOM Pokorný J., Snášel V., Húsek D.: Dokumentografické informacní systémy Dalibor Kačmář: Programujeme.NET aplikace ve Visual Studiu.NET Chris Sells: C# a WinForms programování formulářů Windows 23