Uživatelská podpora v prostředí WWW



Podobné dokumenty
Dobývání znalostí z webu web mining

MBI - technologická realizace modelu

Metadata, sémantika a sémantický web. Ing. Vilém Sklenák, CSc.

ZÍSKÁVÁNÍ ZNALOSTÍ Z DATABÁZÍ

Modely a sémantika. Petr Šaloun VŠB-Technická univerzita Ostrava FEI, katedra informatiky

Modely vyhledávání informací 4 podle technologie. 1) Booleovský model. George Boole Aplikace booleovské logiky

Identifikace. Jiří Jelínek. Katedra managementu informací Fakulta managementu J. Hradec Vysoká škola ekonomická Praha

Využití WWW jako efektivního informačního zdroje

Ing. Petr Hájek, Ph.D. Podpora přednášky kurzu Aplikace umělé inteligence

Databázové a informační systémy

Experimentální systém pro WEB IR

Ing. Jaroslav Kačmařík, Ing. Břetislav Nesvadba Využití GIS v oblasti železniční infrastruktury

POKROČILÉ POUŽITÍ DATABÁZÍ

WEBFILTR KernunClearWeb

Zpráva o zhotoveném plnění

PRODUKTY Tovek Server 6

REGISTR CITES VE STÁTNÍ SPRÁVĚ. Duben 2009

CSS. SEO Search Engine Optimization (optimalizace pro vyhledávače)

Měření teploty, tlaku a vlhkosti vzduchu s přenosem dat přes internet a zobrazování na WEB stránce

Kurz je rozdělen do čtyř bloků, které je možné absolvovat i samostatně. Podmínkou pro vstup do kurzu je znalost problematiky kurzů předešlých.

Po ukončení tohoto kurzu budete schopni:

Tovek Tools. Tovek Tools jsou standardně dodávány ve dvou variantách: Tovek Tools Search Pack Tovek Tools Analyst Pack. Připojené informační zdroje

Obsah. Kapitola 1. Kapitola 2. Kapitola 3. Úvod 9

Logický datový model VF XML DTM DMVS

Web 2.0 vs. sémantický web

Informační systém pro vedení živnostenského rejstříku IS RŽP

KERNUN CLEAR WEB. Má smysl český webový filtr? Radek Nebeský, TNS / Kernun Security Notes / Praha 11. října

Manuscriptorium jako základ pro virtuální badatelské prostředí

Sémantický web 10 let poté

DATABÁZOVÉ SYSTÉMY. Metodický list č. 1

Výměnný formát XML DTM DMVS PK

SA Služby IS DMVS LK

Osobní údaje: jméno, adresa, telefonní číslo, ová adresa, údaje založené na umístění, ID zařízení. Citlivé (finanční) informace

WEB KNIHOVNY JAKO NÁSTROJ K PROPAGACI SLUŽEB A INFORMACÍ ING. PAVEL CIMBÁLNÍK

Vilém Sklenák Inforum2009,

UŽIVATELSKÁ PŘÍRUČKA K INTERNETOVÉ VERZI REGISTRU SČÍTACÍCH OBVODŮ A BUDOV (irso 4.x) VERZE 1.0

Prohlašuji, že diplomovou práci na téma. jsem vypracoval samostatně. Použitou literaturu a podkladové materiály

WEBFILTR. Kernun Clear Web. Český nebo zahraniční filtr? Radek Nebeský, TNS / Seminář WEBFILTR Kernun / Praha 6. února

Úvod do tvorby internetových aplikací

Ontologie. Otakar Trunda

manuscriptorium Manuscriptorium v Evropě Manuscriptorium.com

1 Webový server, instalace PHP a MySQL 13

Získávání znalostí z databází. Alois Kužela

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY

SADA VY_32_INOVACE_PP1

Znalostní systém nad ontologií ve formátu Topic Maps

Mapový server Marushka. Technický profil

Vzdělávací obsah vyučovacího předmětu

MANAŽER ČASOPISU. Obr. 1 Hlavní stránka manažera časopisu

Historie Internetu instalace prvního uzlu společností ARPA

Informace k e-learningu

/ 1 rok zobrazení. Personální agentury.cz Staňte se součástí nejnavštěvovanějšího katalogu personálních agentur na českém internetu.

Využití metod strojového učení v bioinformatice David Hoksza

Web 2.0, Search 2.0 jak se to rýmuje?

Vedoucí práce: Ing. Petr Soukup, Ph.D. Fakulta stavební Katedra mapování a kartografie Obor Geoinformatika

DELTA - STŘEDNÍ ŠKOLA INFORMATIKY A EKONOMIE, s.r.o. Obor informační technologie AJAX ESHOP. Maturitní projekt. Třída:

Databázové systémy. Doc.Ing.Miloš Koch,CSc.

Kč / 1 rok zobrazení. Personální agentury.cz Staňte se součástí nejnavštěvovanějšího katalogu personálních agentur na českém internetu.

1. Úvod do Ajaxu 11. Jak Ajax funguje? 13

Metadata. MI-DSP 2013/14 RNDr. Ondřej Zýka,

Maturitní otázky z předmětu PROGRAMOVÁNÍ

Zabezpečení proti SQL injection

Nabídka internetového obchodu

ROZVOJ E-LEARNINGU NA 1. LF UK PRAHA

DOBÝVÁNÍ ZNALOSTÍ Z DATABÁZÍ

InternetovéTechnologie

Metody tvorby ontologií a sémantický web. Martin Malčík, Rostislav Miarka

Sázková kancelář Z pekla štěstí

Moderní systémy pro získávání znalostí z informací a dat

BA_EM Electronic Marketing. Pavel

WEBFILTR živě. přímo na svém počítači. Vyzkoušejte KERNUN CLEAR WEB. Připojte se přes veřejně dostupnou WiFi síť KERNUN.

Publikování map na webu - WMS

KAPITOLA 2 - ZÁKLADNÍ POJMY INFORMAČNÍCH A KOMUNIKAČNÍCH TECHNOLOGIÍ

Vizualizace v Information Retrieval

Webové stránky. 1. Publikování na internetu. Datum vytvoření: str ánk y. Vytvořil: Petr Lerch.

Evidence městského mobiliáře v GIS Kompas 3.2

Snadný vývoj webových aplikací s Nette. Lukáš Jelínek

InternetovéTechnologie

MATURITNÍ OTÁZKY ELEKTROTECHNIKA - POČÍTAČOVÉ SYSTÉMY 2003/2004 PROGRAMOVÉ VYBAVENÍ POČÍTAČŮ

Část IV - Bezpečnost 21. Kapitola 19 Bezpečnostní model ASP.NET 23

Vektorové dlaždice. a jejich využití pro vizualizaci dat katastru nemovitostí. Filip Zavadil, Cleerio s.r.o

Poskytování údajů ČÚZK. Jiří Poláček

IS RŽP. informační systém pro vedení živnostenského rejstříku a jeho propojení na registry veřejné správy. Ministerstvo průmyslu a obchodu

Reálné gymnázium a základní škola města Prostějova Školní vzdělávací program pro ZV Ruku v ruce

Aplikace je program určený pro uživatele. Aplikaci je možné rozdělit na části:

Nové přístupy tvorby web site. Doc. Ing. Zdeněk Havlíček, CSc. KIT PEF CZU - 13/11/2001

Komplexní informační systém AMOS IS

Současný svět Projekt č. CZ.2.17/3.1.00/32038, podpořený Evropským sociálním fondem v rámci Operačního programu Praha adaptabilita

Dolování z textu. Martin Vítek

předměty: ukončení: Zápočet + Zkouška / 5kb např. jméno, název, destinace, město např. student Jan Novák, narozen

The bridge to knowledge 28/05/09

PRODUKTY. Tovek Tools

Tovek Server. Tovek Server nabízí následující základní a servisní funkce: Bezpečnost Statistiky Locale

Úvod do aplikací internetu a přehled možností při tvorbě webu

Manuscriptorium v roce 2013

Databáze MS-Access. Obsah. Co je to databáze? Doc. Ing. Radim Farana, CSc. Ing. Jolana Škutová

Lotus Symposium Jak zvládat velké množství dat v Lotus Notes? Jiří Balcar VUMS LEGEND, spol. s r.o IBM Corporation

Business Intelligence

Microsoft SharePoint Portal Server Zvýšená týmová produktivita a úspora času při správě dokumentů ve společnosti Makro Cash & Carry ČR

Transkript:

Uživatelská podpora v prostředí WWW Jiří Jelínek Katedra managementu informací Fakulta managementu Jindřichův Hradec Vysoká škola ekonomická Praha

Úvod WWW obsáhlost obsahová i formátová pestrost dokumenty, data, obrázky, video, atd. dynamika malá strukturovanost absence sémantického popisu dostupnost hlavní cíl pomoci uživatelům WWW najít užitečné, zajímavé, relevantní informace základem profil uživatele a jeho trvalá aktualizace

Systém podpory uživatele cíl uložení URL model WWW shluková analýza nabídka WWW stránek k tématu detekce sezení generalizace profil uživatele požadavky analýza obsahu URL detekce vazeb jednoduché WWW rozhraní meta popis stránky profil stránky rychlá odezva detekce te rmů využití co nejširšího spektra metod a jejich kombinací ontologický popis vyhledávání uživatelské ro z hra ní svobodné rozhodnutí uživatele o užití systému proxy ontologie Google

Web Mining data mining netriviální extrakce implicitních, předtím neznámých a potenciálně užitečných znalostí z dat ve velkých datových skladech shromažďování a zpracování dat dostupných na WWW nebo dat generovaných v průběhu užívání webu užití predikce chování a zájmů uživatele založená na předběžně naučených pravidlech a uživatelských profilech

Zdroje dat pro WM data o chování uživatele automaticky ukládaná data v logovacích souborech: server více uživatelů, jedna prezentace klient obvykle nutná úprava prohlížeče proxy více uživatelů, více prezentací aplikační záznamy generované záměrně na vyšší programové úrovni obsahy WWW stránek zobrazovaný obsah meta popis stránky WWW odkazy URL a jeho struktura

Metody Web Miningu The Web is an Experimental Laboratory Web Content Mining Ron Kohavi, Mining E-commerce Data, KDD 01 zpracování obsahu WWW stránek Web Structure Mining získávání informací ze struktury WWW prostoru Web Usage Mining analýza chování uživatele (clickstream analýza)

Web Content Mining analýza textové složky (obsah a meta popis) stránek detekce sémanticky významných termů a jejich další užití v dané množině stránek se často objevují termy e-commerce a web mining často založeno na vektorovém modelu dokumentu orientace na klíčová slova, ne sémantický obsah stránek

práce s vnitřní strukturou stránek ontologický přístup užití sémantických sítí a ontologií problémem dostupnost ontologií a nedostatečný sémantický popis stránek aplikace: rozšíření vyhledávacích dotazů vivace (202, 11, 18) - allegro (1202, 25, 48) - (201, 1152, 10) vivace (202, 11, 18) - midi (2552, 137, 18) - (201, 2214, 10) vivace (202, 11, 18) - molto (213, 12, 17) - (201, 207, 10) vivace (202, 11, 18) - adagio (297, 9, 33) - (192, 293, 8) vivace (202, 11, 18) - allegretto (158, 7, 22) - (182, 158, 7) vivace (202, 11, 18) - menuetto (136, 5, 27) - (155, 136, 5)

Web Structure Mining analýza vzájemného propojení WWW stránek transformace WWW prostoru do orientovaného grafu techniky pro práci s grafy (např. nejkratší cesta) co-citation analysis sémantický obsah stránky je v úzké vazbě k obsahu hypertextově svázaných stránek aplikace: detekce významných stránek (pagerank)

analýza struktury WWW prostoru pomocí dekompozice URL generalizované hierarchické stromy užití při porovnávání uživatelů a jejich shlukování celek ( 11-100.00-100.00).com ( 2-18.18-18.18).mysql ( 1-9.09-50.00).www ( 1-9.09-100.00) / ( 1-9.09-100.00).xnef ( 1-9.09-50.00) /xnef ( 1-9.09-100.00) /report ( 1-9.09-100.00).cz ( 8-72.73-72.73).idnes ( 4-36.36-50.00).zpravy ( 4-36.36-100.00) / ( 1-9.09-25.00) /foto.asp ( 3-27.27-75.00).msmt ( 1-9.09-12.50).www ( 1-9.09-100.00) / ( 1-9.09-100.00).seznam ( 1-9.09-12.50).www ( 1-9.09-100.00) / ( 1-9.09-100.00).vse ( 2-18.18-25.00).fm ( 1-9.09-50.00).www ( 1-9.09-100.00).www ( 1-9.09-50.00) / ( 1-9.09-100.00).org ( 1-9.09-9.09).w3c ( 1-9.09-100.00).www ( 1-9.09-100.00) / ( 1-9.09-100.00)

Web Usage Mining detekce vzorů v datech generovaných v průběhu spojení mezi klientem a serverem WWW asociační pravidla a statistické metody odkrývání závislostí mezi užitím WWW stránek 60% uživatelů, kteří navštívili URL-A, také navštívilo URL-B 75% uživatelů stahujících soubory z URL-A tak činilo mezi 19:00 a 23:00 během víkendů techniky shlukování seskupování uživatelů s podobnými vzory chování seskupování stránek navštěvovaných stejnou skupinou

detekce sekvenčních vzorů (FGS) objevování častých sekvencí URL charakteristických pro uživatele či sezení možnost predikce chování uživatele 0 - http://www.php.net/ 1 - http://www.php.net/search.php ------------------------------------------------ 0 - http://zpravy.idnes.cz/ 1 - http://www.php.net/ ------------------------------------------------ 0 - http://www.google.com/advanced_search?hl=cs 1 - * 2 - http://146.102.250.208/homes ------------------------------------------------ 0 - http://cz.php.net/search.php 1 - * 2 - http://cz.php.net/search.php ------------------------------------------------ 0 - http://www.sweb.cz/root/index 1 - http://www.google.com/advanced_search?hl=cs 2 - * 3 - http://www.php.net/ 4 - * 5 - http://opravy..idnes.cz/

Problémy užití WM vstupní data logovací soubory původně vytvářeny pro účely ladění obsahují velké množství neužitečných informací absence některých dat (použití cache) další zdroje, pokud jsou k dispozici detekce sezení, uživatele nebo významné události uložení URL stránek, nikoliv sémantický popis problémy s dynamickými stránkami absence dat z webových formulářů ochrana soukromí uživatelů náročnost výpočtů

Diskuse Jiří Jelínek, Inforum 2004, Praha, 26.5.2004