ANALÝZA KVALITY VYHLEDÁVÁNÍ Zvýšení přesnosti pomocí Hodnocení vyhledávače a Prediktivní analýzy

Podobné dokumenty
Jak zavést systém managementu kvality

Sylabus modulu: B - Strategické řízení organizace

Vedení projektů, Odhadování, historie. Jiří Mach

IT Security a Cloud. Zbyněk Juřena Managing Director ALTRON Business Solutions, a.s. září 2014

Sylabus modulu: E Finance a finanční nástroje

Sylabus modulu: B - Strategické řízení organizace

Projektový manuál: SME Instrument Brno

SEARCH & BIG DATA [ & ANALYTICS] INFORUM 2015, Pavel Kocourek

Možnosti připojení WMS služby do Klienta v Marushka Designu

Bohužel nejste jediní. Jak se v této džungli orientovat a jaké jsou možnosti při prodeji nemovitosti se dozvíte na následujících stránkách.

Strategické rámce správy a rozvoje klasifikace DRG v roce 2013

Vnitřní předpis města Náchoda pro zadávání veřejných zakázek malého rozsahu (mimo režim zákona č. 137/2006 Sb., o veřejných zakázkách)

VŠB Technická univerzita, Fakulta ekonomická. Katedra regionální a environmentální ekonomiky REGIONÁLNÍ ANALÝZA A PROGRAMOVÁNÍ.

Odhady, nabídky, měření a historie

Ministerstvo vnitra České republiky vyhlašuje Výzvu k předkládání žádostí o finanční podporu v rámci Integrovaného operačního programu

Výsledky sledování indikátoru ECI/TIMUR A.3: Mobilita a místní přeprava cestujících V Praze - Libuši

NÁVODNÁ STRUKTURA MÍSTNÍHO AKČNÍHO PLÁNU VZDĚLÁVÁNÍ

16. Kategorizace SW chyb, kritéria korektnosti a použitelnosti, spolehlivost SW

Metodická pomůcka. Využívání záruk ČMZRB k zajišťování bankovních úvěrů

Naxos MULTIMEDIÁLNÍ ARCHIV

Integrace dat Profinit. All rights reserved.

Metoda klíčových ukazatelů pro činnosti zahrnující zvedání, držení, nošení

Prováděcí předpisy pro soutěžní lezení pro rok 2014

Poznámky na úvod. Prezentace z auly byla v několika směrech rozpracována, aby byla srozumitelnější a přesnější; výsledkem je následující text.

EXTRAKT z mezinárodní normy

Želešice - vodovodní řád pro zónu k podnikání

Cena Ministerstva vnitra za inovaci ve veřejné správě Ročník 2008 ZÁVĚREČNÁ ZPRÁVA Z ŘEŠENÍ

Pracovní seminář Koncesní řízení na provozování Vak dobrá praxe

- Aplikace je napsána v C#.NET, je instalována na webovém serveru - Data jsou ukládána v databázi MS-SQL 2005 a vyšší

A0M33PIS - Průmyslové informační systémy

Information and Data Management Profinit. All rights reserved.

SYLABUS KURZU HODNOCENÍ VÝSLEDKŮ VAV

Metodická příručka Omezování tranzitní nákladní dopravy

SPARTAN DAIRY 3.0. Uživatelský manuál. Vytvořeno s podporou Interní vzdělávací agentury projekt č. 2017FVHE/2220/47 VFU BRNO

Sylabus modulu: D Útvarové a procesní řízení, plánování, IT podpora projektového řízení

Tvorba elektronického herbáře

Datová kvalita Profinit. All rights reserved.

Instalace a technické informace

ZŠ ÚnO, Bratří Čapků 1332

SMĚRNICE č. 5 ŠKOLENÍ ZAMĚSTNANCŮ, ŽÁKŮ A DALŠÍCH OSOB O BEZPEČNOSTI A OCHRANĚ ZDRAVÍ PŘI PRÁCI (BOZP)

GLOBÁLNÍ ARCHITEKTURA ROB

DOBRÁ ŠKOLA Ústeckého kraje 2013/2014

Role metodika v procesu zavádění a ověřování standardů kvality v praxi

ÚŘAD PRO OCHRANU HOSPODÁŘSKÉ SOUTĚŽE PŘÍKAZ

Veřejná zakázka SUSEN generální dodávka staveb v areálu Řež. Dodatečná informace č. 1 k zadávacím podmínkám

JAK SE LÉPE ORIENTOVAT VE VÝSLEDCÍCH KLINICKÝCH STUDIÍ

Tabulka 1. d [mm] 10,04 10,06 10,01 9,98 10,01 10,03 9,99 10,01 9,99 10,03

Řízení kvality, kontroling, rizika. Branislav Lacko Martina Polčáková. Kateřina Hrazdilová Bočková - konzultantka

Výzva k podání nabídek

Případy užití RSSystems

Optimalizace Profinit. All rights reserved.

Případové studie využití HTA v diplomových pracích FBMI. Ing. Veronika Burianová

DODATEČNÉ INFORMACE K ZADÁVACÍM PODMÍNKÁM Č. III ZE DNE

Tento projekt je spolufinancován. a státním rozpočtem

ZNALECKÝ POSUDEK. č

A3RIP Řízení projektů. 13. seminář

TURBIDIMETRY ŘADY TU5. Nový standard ve vývoji měření turbidity

Informačně expertní systém včasného varování a vyrozumění v důsledku stanovení rizik skalního řícení

Výzva K PODÁNÍ NABÍDKY A K PROKÁZÁNÍ KVALIFIKACE VE ZJEDNODUŠENÉM PODLIMITNÍM ŘÍZENÍ DLE UST. 53 ZÁKONA Č. 134/2016 SB., O ZADÁVÁNÍ VEŘEJNÝCH ZAKÁZEK

Studijní předmět: Základy teorie pravděpodobnosti a matematická statistika Ročník:

MS Word pro administrátory projektů Základy

Témata v MarushkaDesignu

METODIKA ZPŮSOBILÝCH VÝDAJŮ OPERAČNÍHO PROGRAMU LIDSKÉ ZDROJE A ZAMĚSTNANOST

METODIKA ZPŮSOBILÝCH VÝDAJŮ OPERAČNÍHO PROGRAMU LIDSKÉ ZDROJE A ZAMĚSTNANOST

INFORMACE O NOVÉ VERZI POSKI REAL

Case study Nové Internetové bankovnictví. František Řezáč

A0M33PIS - Průmyslové informační systémy

9:45 10:20 Úvodní slovo Mgr. Miloslav Kvapil, ředitel společnosti DYNATECH s.r.o.

Generování Homepage ze serveru AReality.sk

Zadávací dokumentace Stránka 1 z 8

Charakteristika vyučovacího předmětu RUSKÝ JAZYK

Konzultační materiál č. 1/2015 Přiměřený zisk PŘIMĚŘENÝ ZISK OHROŽUJE POSKYTOVATELE HRANICE PRO PŘIMĚŘENÝ ZISK?

Záměr první fáze redesignu webu Fakulty aplikovaných věd

Vizualizace TIN (trojúhelníková nepravidelná síť) v Marushka Designu

Výzva K PODÁNÍ NABÍDKY A K PROKÁZÁNÍ KVALIFIKACE VE ZJEDNODUŠENÉM PODLIMITNÍM ŘÍZENÍ DLE UST. 53 ZÁKONA Č. 134/2016 SB., O ZADÁVÁNÍ VEŘEJNÝCH ZAKÁZEK

1 ÚVOD 3 2 OBECNÁ ČÁST 5 3 POJIŠTĚNCI 11

Plán odpadového hospodářství

VIS ČAK - Uživatelský manuál - OnLine semináře

Prof. MUDr. V. Mihál, CSc, Dětská klinika LF UP a FN Olomouc MUDr. B. Ludíková, Dětská klinika LF UP a FN Olomouc

Manuál pro lektory. v e r w w w. w e b c a s t t o l e a r n. c o m. Partneři

Dotazník tvoří celkem 25 otázek. Jejich zpracování stanovujeme do Garantujeme důvěrnost veškerých získaných informácí.

Zápis z diskusního fóra pracovní skupiny č. 16

USNESENÍ. Č. j.: ÚOHS-S339/2012/VZ-21769/2012/523/Krk Brno 20. prosince 2012

Sběr níže uvedených dat, je určen k empirickému šetřemí, výzkumu doktorandské práce s názvem Ekonomizace personálního managementu ve stavebnictví.

Výzva č. 3/2017 Dotační program na podporu projektů prevence kriminality v roce 2017

Informace o stavu čerpání a plnění usnesení vlády ČR č. 144/2014

Tile systém v Marushka Designu

Příloha č. 2 Popis podporovaných aktivit

MAS VÝCHODNÍ SLOVÁCKO

Zákon o zdravotních pojišťovnách

JUDr. Michal Štekl. advokát. Právní stanovisko MK Bakaláře, II. etapa. I. Úvod, předané podklady

Technický produktový list Top heating. Rozdělovací stanice IQ Energy Comfort Box. Rozdělovací stanice NEREZ

Změna Sazebníku KB pro podniky a municipality v obsluze Korporátních a Obchodních divizí k nové znění měněných bodů

Maturitní prací student osvědčuje svou schopnost samostatně pracovat na projektech a aktivně využívat nabyté zkušenosti

Přeložit spolupráce s externím serverem Jazyk možnost nastavení jazykové kontroly a výběr jazyka

Vyzýváme Vás k podání cenové nabídky k veřejné zakázce malého rozsahu nazvané

ŽÁKOVSKÁ E-PORTFOLIA. Jak zvýšit zájem žáků o jejich učení? Miroslava ČERNOCHOVÁ Viktor FUGLÍK

DODATEČNÉ INFORMACE K ZADÁVACÍM PODMÍNKÁM

Výběrová kritéria pro hodnocení žádostí o podporu projektů v rámci ROP NUTS II Jihozápad pro období

Transkript:

ANALÝZA KVALITY VYHLEDÁVÁNÍ Zvýšení přesnsti pmcí Hdncení vyhledávače a Prediktivní analýzy Pavel Kcurek SEARCH TECHNOLOGIES, frmerly INCAD INFORUM 2016 26. 5. 2016 1

Cincinnati Lndn, UK Frankfurt, DE Prague, CZ San Dieg San Jse, CR Washingn (HQ) 180+ knzultantů Hlubké znalsti vyhledávání 800+ zákazníků Knzistentní růst Search engines & Big Data Nezávislst na technlgii 2 2

SQA analýza kvality vyhledávání 3

TYPICKÁ KONVERZACE SE ZÁKAZNÍKEM Hmm Na stupnici Jak mc špatné? d 1 d 10? Jak špatné? Naše sučasné dst mžná pčkejte n vyhledávání řekněme sm pravdu až devět devět 9,23 špatné a půl je špatné 4

Na draka? ale t je t c si uživatel pravdu myslí. Chybí kvantifikace Způsb měření Srvnání Hdncení Zákazník pravděpdbně nereprezentuje uživatele 5

SOUČASNÉ METODY JSOU NEDOSTATEČNÉ C se pužívá? Vybrané dtazy Glden Query Set - a klíčvé dkumenty Analýza Tp 100 / Tp 1000 dtazů Dtazy bez výsledků Zer result queries Míra puštění stránky Dtazy s kliknutím Knverzní pměr A dbré statistiky (pr tent účel) je časvě nárčné připravit 6

ČEHO CHCEME DOSÁHNOUT? Splehlivé metriky pr hdncení vyhledávání Prvedení ff-line analýzy (bez nasazení na prdukci!) Mžnst přesnéh srvnání dvu vyhledávačů (stejný, verze, rzdílné) Rychlst = agilitu= kvalita Zvládnutí rzdílných uživatelů / mžnst persnalizace Pskytnut data pr další analýzy - trendy Data pr rzhdnutí, jak nejlépe vylepšit systém 7 7

VYUŽITÍ LOGŮ PRO HODNOCENÍ Lgy - dtazy Lgy - kliknutí Big Data Framewrk Search Hdncený Search Engine vyhledávací Search Engine Under Engine Under Evaluatin systém Under Evaluatin Evaluatin Hdncení vyhledávače Ostatní matice & histgramy DB hdncení 8 8

OD DOTAZU K UŽIVATELI Kncentrace na uživatele Změna zaměření Slučení aktivit pdle relace a/nebi uživatele Set aktivity Slučení dat relací a uživatelů Využití Big Dat pr analýzu VŠECH uživatelů Neexistují špatné dtazy ani hlupí uživatelé Celkvý výkn zalžený na zkušensti uživatelů Dtazy Ostatní aktivita Uživatel Kliknutí Slučvání dat 9 9

HODNOCENÍ VYHLEDÁVAČE Slučení aktivit (Queries & Clicks) Určení relevantních dkumentů C si uživatel zbrazil? Vlžil d kšíku/schránky? Objednal? Vrátil vyhledávač, t c uživatel naknec chtěl? Určení skóre pr dtaz, zalžené na phledu uživatele Σ pwer(factor, psitin)*isrelevant[user, searchresult[psitin].dcid] (případně řada dalších algritmů, MRR, MAP, DCG, etc.) Průměr hdncení pr všechny dtazy uživatelů = user scre Průměr hdncení napříč uživateli = engine scre 1 10

FAKTOR K 11

OFF-LINE ANALÝZA Σ pwer(factor, psitin)*isrelevant[user, searchresult[psitin].dcid] Je mžné spčítat tut hdntu pr všechny dtazy? Lgy dtazů Offline Re-Query Search Engine Nvé Výsledky Big Data Array mžnst zahrnut vyhledávač pr interakci 12

CYKLUS PRŮBĚŽNÉ OPTIMALIZACE Mdifikace vyhledávače Prvedení dtazů Výpčet hdncení vyhledávače Evaluace výsledků Vyhledávací systém Search Lgy Hdncení jedntlivé verze 1 13

PRŮBĚH 14

Prediktivní analýza 15

PRAVDA O HODNOCENÍ RELEVANCE Vesměs nemá u vyhledávačů příliš vědecký základ Náhdné ad-hc algritmy Chybí statistické neb matematické základy TF / IDF A další typy předsudků Předsudek veliksti dkumenty (malý / velký) Předsudek vzácných slvech (překlepy? archaismy?) Nelze škálvat (různá hdncení v různých index shards) Stejné d 70-tých let 16

POUŽITÍ BIG DATA PRO PREDIKCI RELEVANCE DATOVÉ ZDROJE SEARCH ENGINE Prject Dcs Cnnectrs Cntent Index INDEX Prcessing SEARCH Search Op Web Site Pages Supprt Pages Kpie bsahu Query Lgs Click Lgs Relevancy Mdel Query Lgs Search Click Lgs Landing Pages Financial Data Business Data BIG DATA CLUSTER 17

PRAVDĚPODOBNOSTNÍ HODNOCENÍ Predikuje pravděpdbnst relevance Hdnta je v rzmezí 0 1 C nepužít (threshld prcessing) Všechny dkumenty nedstatečné? Zkuste něc jinéh! Kmbinvání výsledky z různých zdrjů Identifikuje pdstatné Machine learning ptimalizuje parametry - Identifikuje dpady a každéh z parametrů Pkud parametr nemá vliv na zlepšení relevance ODSTRAŇTE HO Hdncení se stává bjektivním A VĚDECKY ZALOŽENÝM Umžňuje experimentvání s parametry 18

SOUHRN 19

ZKUŠENOSTI Z PRAXE Naše prjekty s e-cmmerce a nline vydavatelstvími vykazují následující výsledky: Kvalitu vyhledávání lze psunut 20% až 55% s dtazy vracejících nejlepší mžné výsledky Lze zlepšit spkjenst uživatelů s výsledky na stránkách Lze zlepšit kmunikaci a sulad mezi bchdním záměrem a vývjem Výrazný nárůst knverzníh pměru a bratu 20

SOUHRN SQA přístup vám umžní zlepšit výsledky vyhledávání a uživatelský kmfrt. Pmůže vašim uživatelům nalézat t, c hledají prstřednictvím ptimalizace dtazů a ptimalizace zpracvání bsahu. Pr implementaci metd je třeba: rzumět vašim datům pchpit záměry uživatele/zákazníka rzumět vyhledávací technlgií 21

Find better Answers www.searchtechnlgies.cm/cz 22