České Success Stories 2014 Reálný přínos analytiky na praktických příkladech v českém prostředí. SAS CI Roadshow 2014 24. 9. 2014 Praha Pavel Šiška
Kdo jsme Center of Excellence pro střední a východní Evropu Podstatná část - Customer Analytics (analýza klientských dat) Finanční sektor Retail Banking Growth Engine Technologie vlastní laboratoř (HW, Storage), spolupráce se SASem Projekty v ČR i v zahraničí SOFTWARE! 2014 Deloitte Česká republika 2
Obsah Digitální marketing Analýza nestrukturovaných dat 2014 Deloitte Česká republika 3
Digitální marketing 2014 Deloitte Czech Republic 4
Analýza nestrukturovaných dat Proof of Concept Zákazník: Finanční sektor Cíl: Využití dat o chování klienta na webu pro identifikaci nabídky zajímavé pro klienta i pro banku Obohacení stávajících modelů založených na transakčních datech. Fokus na internetové bankovnictví. Identifikace cca 3000 sekvencí kroků v rámci internetového bankovnictví... 2014 Deloitte Czech Republic 5
Výsledky Identifikovali jsme a napočítali 31 spouštěcích událostí (triggers), 294 prediktorů a 2962 sekvencí kroků v rámci internetového bankovnictví. Kombinace modelů přinesla výrazně lepší výsledky, než jakých by dosáhnul každý model zvlášť. Jenom během pilotní kampaně vydělala banka o cca X mil CZK* víc, než pokud by kampaň vedla sama na celém portfoliu (vyjádřeno v Lifetime Value). 8,00% 7,00% 6,90% Konečné výsledky - Conversion Rate 6,00% 5,00% 4,00% 3,00% 2,00% 1,00% 0,00% 3,60% 3,17% 2,81% 2,18% 2,13% 1,55% 1,34% Osobní půjčka Konsolidace Kontokorent Kreditní karta Champion Challenger * Částka je vypočítaná jako skutečný zisk, tedy zisk z kontraktů, které byly uzavřeny navíc oproti situaci, kdy by celou kampaň vedla banka sama. 2014 Deloitte Czech Republic 6
Náš přístup Deloitte obohatil existující propenzitní modely o analýzu typických sekvencí kroků v internetovém bankovnictví, které vedou k nákupu nového produktu. Pilotní kampaň se uskutečnila na čtyřech vybraných produktech, které byly nabídnuty klientům prostřednictvím zprávy v internetovém bankovnictví. Kampaň proběhla jako tzv. Champion/Challenger Deloitte a banka si rozdělili portfolio v poměru 20:80. Typické sekvence kroků ebanking login Účty a transakce Spoření Karty Půjčky Hypotéky Investování Přehled karet Nezaúčtované transakce Přehled transakcí Doplňkové služby Zablokování karty Propenzitní modely Hledali jsme typické sekvence kroků v rámci internetového bankovnictví, které vedou k nákupu produktu. Událostně řízené kampaně ANALYTICKÁ PRAVIDLA Client information database OBCHODNÍ PRAVIDLA Propenzitní modely kalkulují s jakou pravděpodobností si klient koupí produkt, který mu banka aktivně nabízí. Výkonnost modelu byla zvýšena vstupy z ostatních dvou modelů. Trigery jsou předem definované události, které když nastanou, nárazově zvyšují pravděpodobnost, že si klient koupí nějaký produkt. 2014 Deloitte Czech Republic 7
Digitálni marketing shrnutí Vybrané poznatky Vyžití dat z internetu vylepšuje výkon stávajících modelů Nutnost mít čerstvá data. Neaktuální výrazně snižují sílu prediktivních modelů. Nutno exekuovat kampaně hned PtB rychle klesá už během dní (zvláště sekvence stránek zastarává u konkrétního klienta velmi rychle) Potenciál pro další rozvoj a zlepšení Implemetace real-time analytiky a nabídek (nebo aspoň near-real time) infrastrukturální projekt (pořízení dat, scoring, exekuce kampaně) Data z dalších kanálů jako je například mobilní bankovnictví Sledování aktivity klienta přes cookies i neidentifikovaného na webu banky (na jiných webech je právní problém, ale je to možné). 2014 Deloitte Czech Republic 8
Analýza nestrukturovaných dat 2014 Deloitte Czech Republic 9
Analýza nestrukturovaných dat Proof of Concept Zákazník: Finanční sektor Cíl: Prokázat reálnou využitelnost nestrukturovaných dat především v oblasti - propenzitního modelování a - retence Analyzovaly se poznamly v CRM 2014 Deloitte Czech Republic 10
Výsledky Propensity to Buy Očekávaný zisk X mil. EUR (lifetime value) Churn Náklady obětované příležitosti cca X mil. EUR Gini: 0,764 Prediktivní síla modelu: PTB Target Gini Hodnocení modelu Overall 0,29 0 0,30 Financing 0,46 0,45 0,60 Investments 0,61 0,60 1,00 CZK m 80 70 60 50 40 30 Opportunity costs Campaign costs Everyday banking 0,53 0,45 0,60 Technical products 0,46 0,45 0,60 Other 0,32 0,30 0,45 20 10 0 1 2 3 4 5 6 7 8 9 10 Decily 2014 Deloitte Česká republika 11
Výsledky Předmět konverzace Životní styl Téma konverzace Stížnost Finanční plán Žádost klienta Bankovní nabídka Bez tématu 2% 18% 22% 31% 27% Téma Diskutované produkty Kreditní karta Hypotéka Spoření a investice Debetní karty Spotřebitelské půjčky Pojištění Účty a balíčky Jiné 2% 3% 7% 7% 7% 18% 53% 3% Kategorie produktu Affluent 12,7% Entrepreneur 11,1% Risk averse 8,9% Loyal 7,1% Conservative 2,3% Prestige 1,7% Influential 1,2% Interacting 0,6% Cost sensitive 0,4% Married 14,3% Single 6,3% Has grown up kid 5,6% We 4,2% Has small kid 1,1% Girlfriend 0,9% Has a newborn baby 0,8% Renting a flat 6,3% Dissatisfied 3,8% Undecided 1,8% Behavioral Has car 1,2% On welfare 0,9% Family Building a house 0,3% Situational 2014 Deloitte Česká republika 12
Náš přístup Příprava dat Analýza Tokenizace Vyloučení výplňových slov Lematizace Term Document Matrix Klasifikace Tokenizace Vyloučení výplňových slov Lematizace Všechna slova byla porovnána s českým slovníkem a ta, která nebyla nalezena, byla klasifikována. Zaznamenání speciálních symbolů jako:!!!,???, :-), :-( Zaznamenání ostatních anomálií: VŠECHNA VELKÁ PÍSMENA Překlad zkratek (zaznamenali jsme více než 1000 zkratek) Výplňová slova jsou slova s omezeným významem Tyto slova jsou vyloučena z analýzy, protože nemají význam pro účel analýzy. Výplňová slova jsou většinou funkční slova jako spojky, předložky atd., například: ta, kdo, což, tedy, Vám, na. V další fázi jsou slova převedena na základní gramatický tvar (lemma). V rámci tohoto procesu jsou také tvary v množném čísle převedeny do jednoduchého a všechna slova jsou přepsána do prvního pádu. 2014 Deloitte Česká republika 13
Náš přístup Příprava dat Analýza Tokenizace Vyloučení výplňových slov Lematizace Term Document Matrix Klasifikace Term Document Matrix Frekvence každého slova v každé poznámce je spočítána a uložena do Term Document Matrix. Term Document Matrix je matice, kde jednou dimenzí jsou různé poznámky a druhou různá lemmata (slova), která se v poznámkách vyskytují. Tyto data slouží k trénování klasifikačních modelů. Klasifikace Klasifikace nestrukturovaného textu představuje big data problém. Term Document Matrix byla proto zredukována na 1300 nejčastěji se vyskytujících lemmat (slov). I tak matice o rozměrech 2,7 mil. x 1300 zabrala cca 28 GB RAM. Klasifikační modely byly původně fitovány v R a LIBSVM, ale později kvůli lepšímu výkonu v SASu. 2014 Deloitte Česká republika 14
Analýza nestrukturovaných dat shrnutí Vybrané poznatky Nestrukturovaná data vylepšují existující analytické modely a pomáhají odhalit další důležité skutečnosti Vytěžení nestrukturovaných dat není extrémně náročná úloha (finančně, časově, technologicky) Více než technologie rozhoduje schopnost stavět modely pro danou industrii a konkrétní úkol Potenciál pro další rozvoj a zlepšení Hledání dalších oblastí například ochota klientů sdělovat informace o konkurenci a produktech, které využívají jinde Využití pro analýzu cenové elasticity jaká sleva je třeba (nebo není sleva potřeba) Vyžít data i z dalších datových zdrojů Jít do většího detailu například u uvěrových produktů 2014 Deloitte Česká republika 15
Děkuji za pozornost! 2014 Deloitte Česká republika 16
Kontakty PAVEL ŠIŠKA Partner Consulting Deloitte Advisory s.r.o. Nile House, Karolinská 654/2, 186 00, Praha 8, Czech Republic Tel/Direct: +420 246 042 300 Mobile: +420 737 264 273 psiska@deloittece.com www.deloitte.cz FLAVIO PALACI Partner Applied Analytics Deloitte Advisory s.r.o. Nile House, Karolinská 654/2, 186 00, Praha 8, Czech Republic Tel/Direct: +420 246 042 543 Mobile: +420 730 595 648 fpalaci@deloittece.com www.deloitte.cz FILIP TROJAN Manager Applied Analytics Deloitte Advisory s.r.o. Nile House, Karolinská 654/2, 186 00, Praha 8, Czech Republic Tel/Direct: +420 246 042 797 Mobile: +420 733 598 521 ftrojan@deloittece.com www.deloitte.cz 2014 Deloitte Česká republika 17
Deloitte označuje jednu či více společností Deloitte Touche Tohmatsu Limited, britské privátní společnosti s ručením omezeným zárukou ( DTTL ), jejích členských firem a jejich spřízněných subjektů. Společnost DTTL a každá z jejích členských firem představuje samostatný a nezávislý právní subjekt. Společnost DTTL (rovněž označovaná jako Deloitte Global ) služby klientům neposkytuje. Podrobný popis právní struktury společnosti Deloitte Touche Tohmatsu Limited a jejích členských firem je uveden na adrese www.deloitte.com/cz/onas. Společnost Deloitte poskytuje služby v oblasti auditu, daní, poradenství a finančního a právního poradenství klientům v celé řadě odvětví veřejného a soukromého sektoru. Díky globálně propojené síti členských firem ve více než 150 zemích a teritoriích má společnost Deloitte světové možnosti a poskytuje svým klientům vysoce kvalitní služby v oblastech, ve kterých klienti řeší své nejkomplexnější podnikatelské výzvy. Přibližně 200 000 odborníků usiluje o to, aby se společnost Deloitte stala standardem nejvyšší kvality. Společnost Deloitte ve střední Evropě je regionální organizací subjektů sdružených ve společnosti Deloitte Central Europe Holdings Limited, která je členskou firmou sdružení Deloitte Touche Tohmatsu Limited ve střední Evropě. Odborné služby poskytují dceřiné a přidružené podniky společnosti Deloitte Central Europe Holdings Limited, které jsou samostatnými a nezávislými právními subjekty. Dceřiné a přidružené podniky společnosti Deloitte Central Europe Holdings Limited patří ve středoevropském regionu k předním firmám poskytujícím služby prostřednictvím více než 3 900 zaměstnanců ze 34 pracovišť v 17 zemích. 2014 Deloitte Česká republika