Datamining v praxi. Vratislav Beneš OptiSolutions s.r.o.



Podobné dokumenty
O2 extraliga - Návštěvnost - Základní část - celková

Česko-slovenská hokejová liga

DTS U /2019 Výsledky a Tabulky

Liga mladších žáků 2000 skupina C

den datum čas kolo č.utk. pozn. domácí hosté út : ČT4 Sport LIBEREC TŘINEC 3:2pp st : PLZEŇ SPARTA út

EKONOMICKÝ A LOGISTICKÝ SOFTWARE. Luhačovice

SEZNAM PŘÍLOH. Příloha č. 1 Tisková zpráva agentury STEM/MARK. Příloha č. 2 Podrobné statistiky návštěvnosti a sledovanosti Tipsport ELH 2012/2013

Liga mladších žáků skupina C

Profitabilita klienta v kontextu Performance management

Práce s daty pro větší úspěšnost prodeje a kvalitnější péči

M A R K T I N G O V Ý M A N A G E M E N T 1. Akad.rok 2015/2016, ZS Marketingový management - VŽ 1

Ontologie CRM Lead management

Nejnovější trendy v B2B online reklamě Automatizace Marketingu. Ivo Vrána, Pavel Marek, /

2009/2010 O2 Extraliga (ELH)

ELSD II. část - skupina A

INFORMAČNÍ SYSTÉMY , Ing. Jiří Mráz

Ing. Petr Kalčev, Ph.D.

MARKETING 4 Segmentace, marketingový mix, marketingový plán.

Moderní metody automatizace a hodnocení marketingových kampaní

2011/2012 Tipsport Extraliga (ELH)

Management informačních systémů. Název Information systems management Způsob ukončení * přednášek týdně

Instore propagace v drogeriích TETA

MARKETING 1 Úvod do předmětu, základní pojmy, Ing.Miloslav Šašek

Leady & MERK Integrace Microsoft Dynamics CRM s aplikacemi Leady a MERK

Přístupy k efektivnímu využití modelu MBI

Řízení podniku a elektronické obchodování

Vysoká škola finanční a správní, o.p.s. KMK ML Základy marketingu

blízko, rychle, pohodlně

Datová věda (Data Science) akademický navazující magisterský program

Marketingový výzkum. Ing. Martina Ortová, Ph.D. Technická univerzita v Liberci. Projekt TU v Liberci

Řešení pro správu prodeje leasingových produktů pro S Slovensko. Jak jsme pomocí CRM systému zefektivnili řízení obchodních procesů

OBSAH ČÁST 1. MARKETING V DNEŠNÍM SVĚTĚ. 1. Marketing v dnešním světě Úvod... 37

PostgreSQL jako platforma pro datové sklady

Adam Svoboda. František Kaberle. Ondřej Kratěna. Radek Duda. Pavel Mrňa. brankář levá HC Eaton Pardubice. obránce levá. útočník levá HC Sparta Praha

ŘÍZENÍ VZTAHU SE ZÁKAZNÍKY 2 CRM úvodní informace, podstata CRM konkurenční výhoda a zdroje


Úvod... VII. 1. Podstata marketingu Shrnutí... 8 Klíčová slova... 9 Otázky... 9 Literatura Strategické marketingové řízení...

Vysoká škola finanční a správní, o.p.s. KMK ML Základy marketingu

EXTRALIGA LEDNÍHO HOKEJE 2019 / 2020

Nejproduktivnější hráči základní části. Nejproduktivnější hráči play-out

Aplikace IS, outsourcing, systémová integrace. Jaroslav Žáček

Vytváření důvěry manažerů byznysu a IT

Trendy: Růst významu analytického reportingu. Tomáš Pospíšil, Oracle Czech Olomouc,

FOXCONN - PŘÍPADOVÁ STUDIE Mgr. Radka Svobodová, MBA Vojtěch Babka

Nejproduktivnější hráči základní části. Nejproduktivnější hráči play-out

Aplikace IS, outsourcing, systémová integrace. Jaroslav Žáček

Data nejsou odpad, data jsou zlato!

Přes 450 Facebook aplikací za 3,5 roku existence Spravováno USD ve Facebookové reklamě Cca uživatelů v našich aplikacích 2 870

Prezentace společnosti. KAUMY GROUP Kaumy s.r.o. dovoz & distribuce Heinz Food a.s. vývoj & výroba

ANALÝZA NÁKUPNÍHO KOŠÍKU SEMINÁŘ

Katedra managementu ŘÍZENÍ OBCHODU. Ing. Miloš Krejčí

Význam inovací pro firmy v současném. Jan Heřman 26. říjen 2012

ELSD II. část - skupina B

Aplikace IS, outsourcing, systémová integrace. Jaroslav Žáček

Zhodnocení architektury podniku. Jiří Mach

Integrace Microsoft Dynamics 365 s aplikacemi Leady a MERK

Marketing nejsou jen y. Boris Bělousov

PODNIKATELSKÝ PLÁN. Ing. Marcela Tomášová 14. října 2008

Česká asociace pro arbitráž

Obsah. Marketing a marketingové řízení 3. Úvod: marketing pro každého? kapitola 5 Podstata marketingu kapitola 17 Marketingové řízení 17

PIRATSKÝ PŘEDVÁNOČNÍ TURNAJ CHOMUTOV 2015

Rozhodovací procesy 3

Řízení a podpora prodejních sí0 mobile tech 2014

Oracle Sales Cloud. moderní řízení obchodu

Řízení vztahů se zákazníky

Řízení správy rolí v rozsáhlých organizacích. Michal Opatřil Corinex Group

ROZPIS SOUTĚŽÍ. NOEN extraliga juniorů

1. Jak často zjišťujete ve Vaší společnosti spokojenost zákazníka? 2. Jakým způsobem běžně zjišťujete ve Vaší společnosti spokojenost zákazníků?

Určeno studentům středního vzdělávání s maturitní zkouškou, předmět: Marketing a management, téma: Marketingový výzkum

INOVATIVNÍ MANAŽER MARKETINGU: INOVATIVNÍ BUSINESS INTELLIGENCE

BIG DATA. Nové úlohy pro nástroje v oblasti BI. 27. listopadu 2012

ELEKTRONICKÝ MARKETING. Pavel Kotyza, B_EM 2. října 2014

Nabízíme řešení. v oblastech: integrací zdrojů dat:

14 Úvod do plánování projektu Řízení projektu

Podnikové informační systémy Jan Smolík

Elektronické dokumenty - jak efektivně na jejich správu a bezpečnost?

WebWalker

Role BI v e-business řešeních pohled do budoucnosti

Využití marketingu v podnikové knihovně

PragueBest

HODNOCENÍ VÝKONNOSTI PODNIKU VE SPOJITOSTI SE STRATEGICKÝMI CÍLY

2010/2011 Tipsport Extraliga (ELH)

INFORMAČNÍ SYSTÉMY (IS) Ing. Pavel Náplava Katedra počítačů K336, ČVUT FEL Praha 2004/2005

TRH A CÍLENÝ MARKETING

MARKETING ZUZANA KUPKOVÁ

2006/2007 O2 Extraliga (ELH)

14 Úvod do plánování projektu Řízení projektu

FINANCOVÁNÍ VÝCHOVY MLÁDEŽE V KLUBECH

Nové typy informací pro marketing a obchod

Vysoká škola technická a ekonomická v Českých Budějovicích. Institute of Technology And Business In České Budějovice

Jak si udržet zákazníky a nabídnout jim co nejvíce?

aktivita A0705 Metodická a faktografická příprava řešení regionálních disparit ve fyzické dostupnosti bydlení v ČR

Customer Intelligence, aneb Jak může neoblíbená analýza dat usnadnit práci marketingu

1. KAPITOLA 3. KAPITOLA

GIS jako důležitá součást BI. Jan Broulík, Petr Panec ARCDATA PRAHA, s.r.o.

Ing. Pavel Rosenlacher

BA_EM Electronic Marketing. Pavel

Setkání interních auditorů z finanční oblasti. Nové výzvy pro interní audit Big Data a socialní sítě

PRODUKTY. Tovek Tools

HCSPARTAPRAHA VIP VSTUPENKY 2012/2013

Transkript:

Datamining v praxi Vratislav Beneš OptiSolutions s.r.o.

Agenda 1. Naši zákazníci a jejich problémy Kdo jsou naši zákazníci Jaká mají data a proč analyzují data Co jim DM přinese 2. Co předchází analýze Pochopení problematiky Příprava dat Výběr vhodných 3. Co s výsledky analýzy aneb jak je předat zákazníkovi Pochopení výsledků Konverze matematických formulí do řeči manažerů 4. Nestrukturovaná data Text mining Propojení se strukturovanými daty Ukázka na hokejových datech 5. Závěrečné shrnutí

Agenda 1. Naši zákazníci a jejich problémy Kdo jsou naši zákazníci Jaká mají data a proč analyzují data Co jim DM přinese 2. Co předchází analýze Pochopení problematiky Příprava dat Výběr vhodných 3. Co s výsledky analýzy aneb jak je předat zákazníkovi Pochopení výsledků Konverze matematických formulí do řeči manažerů 4. Nestrukturovaná data Text mining Propojení se strukturovanými daty Ukázka na hokejových datech 5. Závěrečné shrnutí

Kdo jsou naši zákazníci Výrobní firmy Prodejní firmy Jejich cílem je: Získávat a udržet si perspektivní zákazníky Znát příčiny, které ovlivňují jejich prodeje Identifikovat potenciálně nespolehlivé obchodní partnery Zajistit bezproblémový chod výrobních linek a předcházet jejim výpadkům

Jaká mají data a proč analyzují data CRM data Interní systémy Analýza chování zákazníků Indetifikace potenciálních zákazníků Prodejní data Agentury na výzkum trhu a interní data Informace o dění na trhu vlastních i konkurenčních značek Analýza chování celého trhu ERP systémy (SAP, MS Dynamics apd.) Výrobní data Logistická data

Co je CRM CRM (Customer Relationship Management) - představuje aktivní tvorbu, sledování a udržování vztahů se zákazníky. Zahrnuje různé kroky od identifikace příležitostí, přes navázání vztahu, jeho rozvoj až po jeho případné ukončení. Pod CRM rozumíme souhrn nástrojů jako databáze, call centra, automatizace prodeje apod. 1 Proces řízení vztahu od jeho vzniku po zánik definuje 6 kroků Identifikace příležitostí 2 Navázání vztahu 3 Rozvoj vztahu 4 Udržování (konsolidace) vztahu 5 Úpadek vztahu 6 Ukončení vztahu

Životní cyklus obchodního procesu Lead potencionální příležitost, o které víme pouze to, že existuje Př: Bude se stavět 10 domů na okraji Horní Dolní Opportunity příležitost, kterou již dokážeme ohodnotit a přiřadit ji míru pravděpodobnosti, s kterou nastane Př: Domy bude stavět 1. stavební a.s. a po předběžné (80%) dohodě s pane Jeřábkem dodáme 10 Universal. Zákazník výsledek našeho snažení Firma 1. stavební se stala našim Zákazníkem a obebrala 8 Universal a 2 Star

Proč dataminingové analýzy nad CRM Zjistit zákaznický model Na něj aplikovat tzv. Business Rules Stanovení bonity nových zákazníků Vyhodnotit nové příležitosti ihned po jejich vložení do CRM Pomoc při nových příležitostech Jaké pobídky působí v daném regionu? Jaké skupiny zákazníků oslovit s výrobkem typu X? Fraud management Identifikace potenciálně nespolehlivých zákazníků Identifikace potenciálně nespolehlivých obch. partnerů Získat pohled na funkčnost marketingových kampaní

Prodejní data Prodejní data Informace o promo aktivitách: letáky, sekundární umístění, cenové akce Prodeje jednotlivých značek a jejich balení Data podle: Formátů obchodů (supermarket, hypermarket apd) Řetězeců (Tesco, Ahold apd) Ostatní data Ostatní promoakce (promo týmy, ochutnávky...) Demografická data (skladba obyvatel, velikost města) Geografická data (blízkost konkurenta, umístěná prodejny) Nezaměstnanost regionu (ČSÚ) Průměrná teplota a vlhkost za týden (ČHÚ) Kupní síla regionu (Incoma/GfK, vypočtená podle ekonomických ukazatelů) apd

Proč dataminingové analýzy nad prodejními daty Otázka: Existuje spojitost mezi růstem prodejů výrobku X, letákovou podporou a druhotným umístěním na prodejnách různých typů? Odpověď: (informace jsou smyšlené) Jestliže je v aktuálním týdnu pouze leták, pak prodeje vzrostou o více jak 123%. Jestliže je i sekundární umístění, pak prodeje vzrostou o více jak 456%. Na obchodech typu Supermarket ve městech do 15.000 obyvatel zároveň platí: je li sekundární umístění podpořeno in-store aktivitou, pak prodeje vzrostou o další 789%.

Efektivní využití těchto znalostí Možnost efektivního rozhodování se o promo akcích Lepší porozumění promo akcí u jednotlivých značek, regionů a typu obchodů Odhad předpokládaných prodejů Simulace vlivu promo aktivit Simulace dopadu akce konkurenta Simulace dopadu změny ceny Testování rozdílných scénářů One to one marketing

Agenda 1. Naši zákazníci a jejich problémy Kdo jsou naši zákazníci Jaká mají data a proč analyzují data Co jim DM přinese 2. Co předchází analýze Pochopení problematiky Příprava dat Výběr vhodných metod 3. Co s výsledky analýzy aneb jak je předat zákazníkovi Pochopení výsledků Konverze matematických formulí do řeči manažerů 4. Nestrukturovaná data Text mining Propojení se strukturovanými daty Ukázka na hokejových datech 5. Závěrečné shrnutí

Co předchází analýze Pochopení problematiky Perfektně porozumět zadání Co nejvíce se seznámit s analyzovaným světem Hledat nové, zajímavé znalosti, ne obecné a již notoricky známé Znát motivaci zákazníka pro danou analýzu CRM Co je příležitost a stav příležitosti? Je vztah mezi produktem a službou? Co je důležité pro obchodníka a co pro management firmy Prodejní data Význam jednotlivých ukazatelů (Sales Value, Sales Volume, Sales Units...) Soustruhy se neprodávají v supermarketu Zákazník hypermarketu reaguje jinak než zákazník e-shopu

Příprava dat Data jsou všude Vhodná data nenajdete na ulici Některá data musíte dohledat Každý zdroj znamená jiný formát Musíte je dát do jedné matice Vhodná znalost DB systémů a základy SQL Příklad: Analýza hokejových zápasů s cílem vybrat vhodné atributy pro model predikující výsledky budoicích zápasů. Zdroj: Internet kolo domaci host e vysledek 1.t ret ina 2.t ret ina 3.t ret ina pp st rely na branu vylouceni 2 HC ČSOB Pojišťovna Pardubice Bílí Tygři Liberec 5:2 2:0 2:2 1:0 40:23 5:8 3 HC Energie Karlovy Vary HC ČSOB Pojišťovna Pardubice 3:7 0:3 1:3 2:1 29:34 7:5 4 HC ČSOB Pojišťovna Pardubice HC Sparta Praha 2:6 1:4 1:2 0:0 32:35 4:10 5 PSG Zlín HC ČSOB Pojišťovna Pardubice 2:1 0:0 0:1 2:0 28:30 2:3 6 HC ČSOB Pojišťovna Pardubice HC MOUNTFIELD 2:1 0:1 0:0 1:0 1:0 27:29 4:4 7 HC Kometa Brno HC ČSOB Pojišťovna Pardubice 1:4 0:1 0:1 1:2 33:26 9:9 8 HC ČSOB Pojišťovna Pardubice BK Mladá Boleslav 2:3 2:2 0:0 0:1 33:23 4:5 9 HC Slavia Praha HC ČSOB Pojišťovna Pardubice 1:2 0:1 1:1 0:0 26:26 6:3

Příprava atributů Příprava metrik Vhodný model kódování Příklad: Převodem výskytu letáku ve 4 po sobě jdoucích týdnech do jednoho ukazatele. Atribut letáků je kódovaný 4 bitovým číslem podle výskytu v čase. První bit znamená výskyt v aktuálním týdnu, druhý v předchzím, třetí v předminulé a čtvrtý v předpřed minulém týdnu. týden leták leták t ransf 1 0 0000 2 1 1000 3 0 0100 4 1 1010 5 0 1101 6 1 1010

Příprava atributů LISp miner - intervaly Vývoj prodejů v % Je rozdíl mezi 31.2% a 31.4%? 0.2 pb Zanedbatelný Vytvořit intervaly o délce 10 25.00% 20.00% 15.00% 10.00% 5.00% 0.00% <-40 <-40;-30) <-30;-20) <-20;-10) <-10;0) <0;10) <10;20) <20;30) <30;40) <40;50) <50;60) <60;70) <70;80) <80;100) <100;125) <125;150) <150;200) <200;300) >300 Freq %

Příprava dat LISp miner - řezy Pravé, levé řezy Délka řezu Příklad: Zajímají nás pouze ty případy, kdy byl výskyt minimálně jedné celé palety.

Agenda 1. Naši zákazníci a jejich problémy Kdo jsou naši zákazníci Jaká mají data a proč analyzují data Co jim DM přinese 2. Co předchází analýze Pochopení problematiky Příprava dat Výběr vhodných 3. Co s výsledky analýzy aneb jak je předat zákazníkovi Pochopení výsledků Konverze matematických formulí do řeči manažerů 4. Nestrukturovaná data Text mining Propojení se strukturovanými daty Ukázka na hokejových datech 5. Závěrečné shrnutí

Co s výsledky analýzy aneb jak je předat zákazníkovi Výsledky většinou poslouchají manažeři V drtivé většině případů to nejsou matematici Mluvit jejich řečí Neznají technické pojmy z DM Pečlivě volit, které technické argumenty použijete Všechny důkladně a srozumitelně vysvětlit Příklad: typ obchodu(supermarket ) velikost mesta(0,15000) secss(0 ; ) instore(true) sales(789, ) Na obchodech typu Supermarket ve městech do 15.000 obyvatel zároveň platí: je li sekundární umístění podpořeno in-store aktivitou, pak prodeje vzrostou o další 789%.

Agenda 1. Naši zákazníci a jejich problémy Kdo jsou naši zákazníci Jaká mají data a proč analyzují data Co jim DM přinese 2. Co předchází analýze Pochopení problematiky Příprava dat Výběr vhodných 3. Co s výsledky analýzy aneb jak je předat zákazníkovi Pochopení výsledků Konverze matematických formulí do řeči manažerů 4. Nestrukturovaná data Text mining Propojení se strukturovanými daty Ukázka na hokejových datech 5. Závěrečné shrnutí

Nestrukturovaná data Velké množství informací není strukturováno e-maily, dokumenty, články na webu IBM Watson Jeopardy! zdravotní pojišťovna WellPoint Obrovská výzva Příklad: Vážený pane Vomáčka, nabízíme vám vámi poptávaný výrobek A za 20.000Kč. S pozdravem, Karel Jedlička Zákazník má bonitu 1 a obchod se realizuje. Jelínku, nabízíme vám vámi poptávaný výrobek A za 19.000Kč. Pepa Vohnátko Zákazník má bonitu 1 a obchod se nerealizuje.

Nestrukturovaná data kolo domaci host e vysledek 1.t ret ina 2.t ret ina 3.t ret ina pp st rely na branu vylouceni 2 HC ČSOB Pojišťovna Pardubice Bílí Tygři Liberec 5:2 2:0 2:2 1:0 40:23 5:8 3 HC Energie Karlovy Vary HC ČSOB Pojišťovna Pardubice 3:7 0:3 1:3 2:1 29:34 7:5 4 HC ČSOB Pojišťovna Pardubice HC Sparta Praha 2:6 1:4 1:2 0:0 32:35 4:10 5 PSG Zlín HC ČSOB Pojišťovna Pardubice 2:1 0:0 0:1 2:0 28:30 2:3 6 HC ČSOB Pojišťovna Pardubice HC MOUNTFIELD 2:1 0:1 0:0 1:0 1:0 27:29 4:4 7 HC Kometa Brno HC ČSOB Pojišťovna Pardubice 1:4 0:1 0:1 1:2 33:26 9:9 8 HC ČSOB Pojišťovna Pardubice BK Mladá Boleslav 2:3 2:2 0:0 0:1 33:23 4:5 9 HC Slavia Praha HC ČSOB Pojišťovna Pardubice 1:2 0:1 1:1 0:0 26:26 6:3 Jak identifikovat klíčová slova? Jak extrahovat jejich význam? Jak získaný význam strukturovat? Jak data provázat se strukturovanými?

Otázky