KAM SMĚŘUJE VYHLEDÁVÁNÍ. Pavel Kocourek SEARCH TECHNOLOGIES, formerly INCAD INFORUM

Podobné dokumenty
UAI/612 - Cloudová Řešení. Technologie

SEARCH & BIG DATA [ & ANALYTICS] INFORUM 2015, Pavel Kocourek

Co je (staro)nového v DSpace

SAP a SUSE - dokonalá symbióza s open source. Martin Zikmund Technical Account Manager

Vybraná zajímavá Lotus Notes řešení použitelná i ve vašich aplikacích. David Marko TCL DigiTrade

BIG DATA. Nové úlohy pro nástroje v oblasti BI. 27. listopadu 2012

BIG DATA je oveľa viac ako Hadoop. Martin Pavlík

Domino 10 nové komponenty a související témata (node.js, ES )

Systémy pro tvorbu digitálních knihoven

Hadoop a HDFS. Bc. Milan Nikl

Srovnání SQL serverů. Škálovatelnost a výkon. Express Workgroup Standard Enterprise Poznámky. Počet CPU bez limitu Obsahuje podporu

rychlý vývoj webových aplikací nezávislých na platformě Jiří Kosek

Indexování a vyhledávání matematických formulí


ABBYY Automatizované zpracování dokumentů

Inteligentní řízení strojů s portfoliem u-mation Řešení pro automatizaci a digitalizaci Let s connect. Automatizace a digitalizace

Geografické informační systémy ArcGIS Pavel Juška (jus011) 4. března 2010, Ostrava

Vzdálená správa v cloudu až pro 250 počítačů

Víme, co se děje aneb Log Management v praxi. Petr Dvořák, GAPP System

Vyhledávání na portálu Knihovny.cz

PRODUKTY. Tovek Tools

Web 2.0 vs. sémantický web

Sísyfos Systém evidence činností

MBI - technologická realizace modelu

Internet věcí & Cloud Systémy v Energetice Miroslav HLADÍK Toshiba Corp. Energy Systems & Solutions Company

Quo vadis, vyhledávání (na webu)?

Úvod do programovacího jazyka Python

Zpracování IoT dat Jiří Batěk

Pomáháme vám využívat vaše informace VYHLEDÁVACÍ TECHNOLOGIE PRO ON-LINE INFORMAČNÍ ZDROJE SEARCH DRIVEN INNOVATION

Matematika v programovacích

Optimalizaci aplikací. Ing. Martin Pavlica

Vysvětlení zadávací dokumentace č. 3

Průmysl 4.0 jako příležitost pro budování chytré továrny Dr. Filová, Plánování značky

Ing. Jan Buriánek. Katedra softwarového inženýrství Fakulta informačních technologií České vysoké učení technické v Praze Jan Buriánek, 2010

Vývoj moderních technologií při vyhledávání. Patrik Plachý SEFIRA spol. s.r.o.

Relační nebo NoSQL databáze? Nebo obojí? Jan Musil CEE IBM Analytics Platform Technical Sales IBM Corporation

IBM Enterprise Marketing Management Představení

Knihovny.cz: spuštění se blíží

ŠKOLENÍ PROGRAMOVACÍHO JAZYKA JAVA JAVA - ZÁKLADY

NCR PRAGUE CENTER OF EXCELLENCE. Představení společnosti a vývojového centra v Praze.

Olga Rudikova 2. ročník APIN

Masarykova univerzita Fakulta informatiky. Kramerius PV070. Jan Holman

Portfolio úložišť WD pro datová centra Kapacitní úložiště prošlo vývojem

Backup Srovnání licencí. Přehled

Simplify I.T. ve veřejném sektoru. Josef Švenda Country Leader, Oracle Czech

Vývoj informačních systémů. Přehled témat a úkolů

ArcGIS for Server. V oblasti správy, vizualizace a zpracování prostorových dat nabízí ArcGIS for Server tyto možnosti:

Znalostní systém nad ontologií ve formátu Topic Maps

Obsah přednášky. Představení webu ASP.NET frameworky Relační databáze Objektově-relační mapování Entity framework

Tabulka základních vlastností nástroje C++Builder dle edice

PostgreSQL jako platforma pro datové sklady

P2P nebo PON? Jaké služby budou nabízené prostřednictvím sítě? Klíčová otázka na kterou si musí odpovědět každý FTTx poskytovatel

<Insert Picture Here> Na co se můžete s Oracle BI těšit

Sémantický web 10 let poté

Big Data od velkých očekávání k praktickému využití. DSW, Praha,

Tomáš Kantůrek. IT Evangelist, Microsoft

Úvod do programovacího jazyka Python

Vyhledávání nebo nalezení informací

Pomáháme vám využívat vaše informace VÝVOJ ICT A VYHLEDÁVACÍCH TECHNOLOGIÍ A PŘEDPOKLÁDANÝ DOPAD NA ÚČASTNÍKY INFORA

TIA na dosah MindSphere

Představují discovery řešení soumrak online katalogů? Filip Kříž Lenka Maixnerová Ondřej Horsák Národní lékařská knihovna, ČR

Backup Srovnání edicí. Základní přehled

Federativní autentizace v portálu Knihovny.cz, mojeid, IdP sociálních služeb, požadované atributy u Knihovny.cz

SOA a Cloud Computing

Web 2.0, Search 2.0 jak se to rýmuje?

Data Protection Delivery Center, s. r. o. JEDNODUCHOST, SPOLEHLIVOST a VÝKONNOST. DPDC Protection. zálohování dat

úvod Historie operačních systémů

Webové portály pro Hlavní město SR a Dopravní podnik Bratislava

Drupal konference sobota,

Commvault + Azure = Data Management budoucnosti. Antonín Moravec, Territory Manager CZ/SK Miroslav Dvořák, Systems Engineer CZ/SK

Metadata, sémantika a sémantický web. Ing. Vilém Sklenák, CSc.

EIZ ve společenských. enských vědách

Unified Communications. Customer Contact. Cisco Unified Contact Center Enterprise. Hlavní výhody. Způsoby nasazení

GRR. získávání znalostí v geografických datech Autoři. Knowledge Discovery Group Faculty of Informatics Masaryk Univerzity Brno, Czech Republic

Tvorba počítačových clusterů pomocí Linuxu. Vedoucí práce: Mgr. Jiří Pech, Ph.D. Katedra informatiky

Integrované řešení pro správu informací - Microsoft

Strategie a metody rešerší, které mohou vést k přidané hodnotě

ArcGIS Server 10. Řešení pro sdílení geodat

SAP Business One Analytics powered by SAP HANA: Analytic Content and Enterprise Search

w w w. u l t i m u m t e c h n o l o g i e s. c z Infrastructure-as-a-Service na platformě OpenStack

SMB a Enterprise řešení

ECM. Enterprise Content Management. čt 9:15 Petr Bouška (xboup00) Zbyněk Hostaš Lukáš Maršíček Martin Nikl (xnikm00)

O autorech 13 O odborném korektorovi 13. Poděkování 15 Úvod 17. Cílová skupina této knihy 17 Témata této knihy 17

Datasys ELISA. Log management řízený Zabbixem. Lukáš Malý, DiS. IT konzultant bezpečnost a monitoring.

Cloud v praxi DMS. Cloud Computing 2014

Google Site Search Webové vyhledávání Google pro vaši organizaci

Vývoj informačních systémů. Přehled témat a úkolů

ešení pro správu klientských počítač a mobilní tisk Číslo dokumentu:

Linux on Azure. Miroslav Sevelda

Základy business intelligence. Jaroslav Šmarda

MICROSOFT OFFICE. Městská knihovna Ostrov, p. o. Douša Ondřej

Diagnostika webových aplikací v Azure

Současný svět Projekt č. CZ.2.17/3.1.00/32038, podpořený Evropským sociálním fondem v rámci Operačního programu Praha adaptabilita

Platforma ArcGIS. Platforma ArcGIS se skládá ze čtyř komponent: dat, zdrojů, portálu a aplikací.

Konference GIS v plánování měst a regionů GIS v rámci informačního systému pro operační řízení HZS ČR

Tovek Server. Tovek Server nabízí následující základní a servisní funkce: Bezpečnost Statistiky Locale

Jakub Šesták. ESEJ DO PŘEDMĚTU DIGITÁLNÍ KNIHOVNY

Mycroft Mind. Sdružení průmyslových partnerů FI MU

Digitalizace a oběh dokumentů VUMS LEGEND, spol. s.r.o.

Michal Verner, DAQUAS

Transkript:

KAM SMĚŘUJE VYHLEDÁVÁNÍ Pavel Kocourek SEARCH TECHNOLOGIES, formerly INCAD INFORUM 2017 31. 5. 2017 1

20 MINUT Tradiční Enterprise Search a OpenSource Lucene / SOLR vs Elastic Nová generace vyhledávání? Kam se rozbíhá další vývoj? 2

TRADIČNÍ VYHLEDÁVÁNÍ 3

MALÉ OHLÉDNUTÍ ZA ES Už je to 10 let FAST > Microsoft Endeca > Oracle Verity > Autonomy > HP Vivisimo > IBM Exalead > Dassault Systemes 4

Open source nástroje, v podstatě převzaly tradiční vyhledávání. Komerční dodavatelé směřují k nové generaci vyhledávačů 5

OPEN SOURCE - SOLR NEBO ELASTIC? 6

SOLR vs ELASTIC Který je lepší SOLR nebo ELASTIC? Který je rychlejší? Které řešení je lépe škálovatelné? Který umí A, B, a C? Který je jednodušší na správu? Který máme nasadit? Proč a co doporučujete? 7

OPEN SOURCE Apache Lucene TM je vysoce výkonná, plnohodnotná knihovna vyhledávacího systému napsaná v jazyce Java. Technologie je využitelná pro téměř libovolnou aplikaci, která vyžaduje fulltextové vyhledávání, bez závislosti na platformě. 1999 Doug Cutting > 2010 Lucene/SOLR > 2017 r 6.5.1 Solr je vysoce spolehlivý, škálovatelný a odolný vyhledávací systém. Poskytuje distribuovanou indexaci, replikace, rozložení výkonu dotazování, fail-over a recovery, centralizovanou konfiguraci a další funkce. 2004 Yonik Seeley > 2010 SOLR/Lucene > 2017 r 6.5.1 Elasticsearch je distribuovaný vyhledávací a analytický nástroj s RESTful rozhraním. Systém je použitelný na širokou řadu úloh společně s nástroji z Elastic Stack. 2010 Shay Banon > 2017 r 5.4.0 8

SOLR Díky své vyspělosti, širokému nasazení a aktivní komunitě je vyhledávací systém Lucene/SOLR upřednostňován zkušenými vývojáři a administrátory SOLR poskytuje velmi detailní funkční prostředí, včetně detailní dokumentace K dispozici je široká řada plug-inů Lucene/SOLR má rozsáhlou komunitu vývojářů 9

ELASTIC Mladší, ale již velmi rozšířený vyhledávací nástroj vyvíjený s větším zaměřením na získávání informací z dat obecně, nikoliv pouze na vyhledávání. Součást "ELK stack" (Elasticsearch, Logstash, Kibana) Elasticsearch umožňuje snadněji realizovat velká vyhledávací řešení RESTfull search, umožňuje schema-free nasazení a je orientovaný na dokument Navržen s ohledem na využití v cloud prostředí Společnost tvrdí, že od 2014 má více než milion stažení měsíčně 10

OPEN SOURCE - popularita https://trends.google.com/trends/explore?q=%2fm%2f02l7pz,solr,elasticsearch 11

OPEN SOURCE popularita CZ https://trends.google.com/trends/explore?q=%2fm%2f02l7pz,solr,elasticsearch 12

OPEN SOURCE https://logz.io/blog/solr-vs-elasticsearch/ 13

DETAILY? NA WEBU http://solr-vs-elasticsearch.com/ 14

NOVÁ GENERACE 15

ENTERPRISE SEARCH 2017 Machine Learning transformuje ES do Intelligent Search Pokrok v oblasti Cyber Security přinese nové možnosti zejména kvůli cloud technologií Real-Time Informace budou mnohem dostupnější S ohledem na machine learning Doporučování bude chytřejší : Proactive search Vyhledávání změní digitální pracovní prostor 16

INSIGHT ENGINES 2017 Pracující s přirozeným jazykem o poskytují přirozenější přístup k informacím postupy, které podnikové vyhledávání nemělo Komplexní Proaktivní o aplikuji metody hodnocení relevance pro popis, dobjevování a organizování a analýzu dat. 17

BUSINESS INTELLIGENCE AND ANALYTICS PLATFORMS 2017 Search a Analytics - konvergence Cloud a opensource - mainstream NLP a hlasové vyhledávání IoT https://www.searchtechnologies.com/blog/gartner-bi-analytics-magic-quadrant-2017 18

ZA ČÍM JE VYHLEDÁVÁNÍ SCHOVANÉ 19

20

INTELIGENTNÍ DIGITÁLNÍ ASISTENTI/KY http://technet.idnes.cz/test-digitalni-asistentky-amazon-echo-alexa-google-home-pjy- /tec_technika.aspx?c=a170410_074844_tec_technika_pka 21

INTELIGENTNÍ DIGITÁLNÍ ASISTENTI/KY Amazon Alexa Apple Siri Microsoft Cortana Google assistant nepojmenovaný Počítačový program, který pracuje jako intelligent personal assistant případně knowledge navigator. Využívá NLP pro zodpovězení dotazu, doporučování a provedení akcí delegováním požadavků na webové služby. 22

QA IBM Watson Výpočetní systém pro zodpovídání dotazů (QA) vytvořený IBM pro aplikaci Zpracování přirozeného jazyka NLP, vyhledávání informací, reprezentaci znalostí, automatické zdůvodňování a učicí se technologie v otevřené doméně. 23

JAK TOHLE. KNIHOVNY? http://time.com/4742543/robots-jobs-machines-work/ http://www.bbc.com/news/technology-34066941 24

DO MRAKŮ MOBILNĚ LOKÁLNĚ PERSONALIZOVANĚ 25

CO PŘIJDE? Co přinesou technologie zhruba víme Nejtěžší je odhadnout, jak technologie změní lidské chování 26

Find better Answers www.searchtechnologies.com/cz 27