Big Data Science Petr Paščenko
|
|
- Vlastimil Kraus
- před 6 lety
- Počet zobrazení:
Transkript
1 Big Data Science Petr Paščenko
2 Osnova 1. Co je Data Science 2. Statistika 3. Strojové učení 4. Vizualizace dat 5. Data Science úlohy 6. Metodika Data Science Projektu 7. Role Big Dat v Data Science 8. Podobnosti a vztahy 9. Detekce podvodů v Internetovém bankovnictví 2
3 Co je Data Science? Data Science je spojení 4 disciplín Statistika Informatika Strojové učení Vizualizace 3
4 Statistika Základní otázka: Je za tím něco víc, nebo je to jen náhoda? Práce s nahodilostí klasifikace, kvantifikace, simulace, predikce Jiný pohled: entropie Kolik informace je v datech? Jaký je podíl signálu a šumu? Příklady statistických úloh Kolik osob můžu pustit do loďky / výtahu / letadla? Jsou muži chytřejší než ženy? Kdo by vyhrál volby, kdyby se konaly dnes? Má rodinné zázemí vliv na schopnost klienta splatit půjčku? Měl bych skočit z mostu po pozitivním HIV testu? Klasická (frekventistická) statistika potřebuje velké soubory dat Bayesianisté jsou s více daty přesnější 4
5 Strojové učení Základní cíl: Napodobit lidský mozek v rutinních činnostech Práce s nestrukturovanou informací Obrázky, zvuky, videa, volné texty, sítě Co je pozitivní? Víme, že to jde. Hledáme pouze cestu. Příklady ML úloh Strojový překlad mezi jazyky Rozpoznávání obrázků (MNIST) Porozumění mluvenému slovu Autonomní robotika (auta, drony) Analýza sociálních sítí Nutnou podmínkou pro strojové učení jsou obrovské datové sady Modely jsou v porovnání se statistikou podstatně komplexnější 5
6 Vizualizace Základní úkol: Zprostředkovat komplexní multi-dimenzionální informaci člověku 6
7 Typologie DS úloh Klasifikace Zařazení objektu do specifické diskrétní třídy Je na obrázku pes či kočka? Udělit nebo zamítnout hypotéku? Mám HIV? Regrese Odhad konkrétní hodnoty (nebo intervalu) cílové proměnné Váha na základě výšky. Kolik km ještě ujedu? Jak daleko je objekt? Klastrování / Segmentace Shlukování objektů a hledání typických zástupců jednotlivých skupin Zákaznické segmentace, sociální skupiny, funkční skupiny slov, atd. Detekce odlehlých pozorování Rozpoznání netypických objektů a kvantifikace jejich odlehlosti Diagnostika výrobků, bezpečnost a detekce fraudu 7
8 Metodika pro Data Science CRISP-DM Cross Industry Standard Process for Data Mining 8
9 Metodika pro Data Science CRISP-DM Cross Industry Standard Process for Data Mining 1. Business Understanding Co zákazník potřebuje? Jaká k tomu má data? Jak se pozná úspěch? 2. Data Understanding Posbírání dat, exploratorní analýza, kvalita dat, první testy hypotéz. 3. Data Preparation Konstrukce datové sady pro modelování. Sestavení, transformace a výběr příznaků, redukce dimenzionality, atd. 4. Modeling Aplikace modelovacích technik, výběr modelu, kalibrace parametrů, testování výkonnosti modelu. 5. Evaluation Vyhodnocení úspěšnosti modelu vzhledem k věcným kritériím. 6. Deployment Produkční nasazení modelu v datovém workflow zákzaníka. Vyřešení administrace, údržby, zaškolení, rekalibrace 9
10 Role Big Data technologií v Data Science Více dat Větší modelovací sada více objektů, od výběru k celé populaci Širší modelovací sadu více příznaků, podrobnější příznaky (vteřinová měření atd.) Delší historii data za více předchozích let v plné granularitě Větší výpočetní výkon Pokročilé modely možnost učit komplikované nelineární modely (konvoluční neuronové sítě) Komplexnější příznaky multimédia, sekvence, texty, atd. Od příznaků k podobnostem Dáme mu úvěr, protože: a) hodně vydělává, b) podobní lidé úvěry platí Od podobností ke vztahům A se zná s B, protože spolu chodí na oběd 10
11 Podobnosti a vztahy
12 Analýza Finančních Transakcí pomocí BD Vytváříme vyladěné modely pro retailové banky Vstup finanční transakce Výstup využitelné informace o klientovi, příznaky, události, Cílem je obohatit stávající obchodní proces o novou znalost Převod mezi lidmi Platba kartou Příjem Výběr z bankomatu Ostatní platby Nákup na internetu Platby za služby 12
13 Salary detector Vstup Finanční transakce typu firma - klient Výstup: Identifikované vztahy zaměstnavatel zaměstnanec Obchodní využití Rizikové skóre, detekce událostí, podobnosti (c2c/b2b), Principy Detekce transakčních vzorců, text mining, pokročilá statistika Vysoká přesnost i pro Krátké úvazky délka nepřesahující 3 měsíce Nestandardní úvazky (částečné úvazky, práce na živnost, atd.) Firmy s malým počtem zaměstnanců 13
14 Detekce domácnosti Banka/Telco Vstup Klientské transakce banka (c2c, karetní operace, ) Informace ze sítě telco (cdr, lokace, billing) Základní demografie (věk, pohlaví, adresa, příjmení, ) Výstup Identifikace členů domácnosti a rodinných vztahů Obchodní využití Rodinný marketing, robustní rizikové skóre, Principy Detekce transakčních vzorců, analýza interakcí, text mining 14
15 Detekce Fraudu v Intenetovém bankovnictví
16 Shrnutí úlohy Detekce přístupu pod falešnou identitou s cílem vykrást účet Scenář: podvodník překonal 2FA Vstup Běhová data z online bankovnictví (sekvence akcí v klientském sezení). Výstup Identifikovaná fraudulentní sezení Principy Velmi složitý problém, podíl fraudů cca 1: Vyžaduje vícero zřetězených sít Pokročilé statistické modely (detekce lokálních odlehlostí) Nastavitelná přesnost (TP/FP), např.: TP: 50% for FP: 0.3% BANKA 16
17 Klasifikační úloha ID SESSION ID DATETIME ACTION AMOUNT RESULT Vstupní data Akce klientů vs3t dgpf :03: vs3t dgpf :03: vs3t dgpf :04: vs3t dgpf :04: vs3t dgpf :07: vs3t dgpf :07: vs3t dgpf :09: Příznakový vektor Statistiky session Délka, čas na akci, Model Klasifikátor PŘÍZNAKOVÝ VEKTOR FRAUD? ANO ALERT Výsledek Ano / Ne NE PROVÉST PLATBU 17
18 Intenetové bankovnictví Uvažujme banku s milionovou klientskou bází Každý klient provede denně v průměru jednu návštěvu v IB Denně průměrně session Z toho zhruba 12% session s platbou session s platbou Denně v průměru 1 fraud To není moc ;-) 18
19 1:
20 Co nefunguje Klasifikátory učené z dat Nevyvážené třídy NE s úspěšností 99,999% Popíšeme typický útok Neexistuje typický útok Příprava na minulou válku PŘÍZNAKOVÝ VEKTOR FRAUD? ANO ALERT NE PROVÉST PLATBU 20
21 Detekce anomalit Podvodník se chová jinak než klient Nevíme jak, ale jinak Jak poznáte, že někdo nebo něco je divný? Lidé nejsou šroubky VS 21
22 Detekce lokálních anomalit Jak si subjekt stojí vůči svému okolí 22
23 Shrnutí postupu Pro každou session spočteme příznakový vektor Příznaky identifikovány na základě datové analýzy Porovnání session s ostatními session daného klienta Identifikace podezřelých session k prověření Jak hodnotíme výsledek True positive kolik najdeme fraudů False positive kolik musíme prověřit session Podstatnější je false positive Limitovaná lidská kapacita Zřetězení více sít Jednoduché heuristiky IP adresy, protiúčty Detekce lokálních odlehlostí Paralelizace 23
24 Implementační realita Pro každou session spočteme příznakový vektor 100 session za sekundu Porovnání session s ostatními session daného klienta až 1000 předchozích session to znamená načíst z databáze 100k řádků za sekundu to znamená přenést po síti cca 20 MB za sekundu to znamená spočítat 100M porovnání za sekundu Překračuje kapacity konvenčního řešení Úloha je naštěstí snadno paralelizovatelná potřebujeme jen předchozí session daného klienta distribuce záznamů podle klientského čísla distribuované vyhodnocení vrací se jen výsledek DWH HADOOP + SPARK 24
25 Výsledky Pro nalezení 50% podvodů je třeba prošetřit cca 300 transakcí denně Při session s platbou denně 25
26 Dotazy 26
Detekce zneužití online kanálů. 2014 Profinit. All rights
Detekce zneužití online kanálů Petr Paščenko 2. 10. 2015 Základní údaje 10 Mezi TOP 10 IT společností v regionu střední a východní Evropy (Gartner 2012) 5 pr 250 g15 400 nfg Mezi TOP 5 firmami v oblasti
Segmentace bankovních zákazníků algoritmem k- means
Segmentace bankovních zákazníků algoritmem k- means LS 2014/2015 Michal Heřmanský xherm22 Obsah 1 Úvod... 3 1.1 CRISP- DM... 3 2 Porozumění problematice a datům... 4 3 Příprava dat... 5 4 Modelování...
ZÍSKÁVÁNÍ ZNALOSTÍ Z DATABÁZÍ
Metodický list č. 1 Dobývání znalostí z databází Cílem tohoto tematického celku je vysvětlení základních pojmů z oblasti dobývání znalostí z databází i východisek dobývání znalostí z databází inspirovaných
Katedra kybernetiky laboratoř Inteligentní Datové Analýzy (IDA) Katedra počítačů, Computational Intelligence Group
Vytěžování dat Miroslav Čepek, Filip Železný Katedra kybernetiky laboratoř Inteligentní Datové Analýzy (IDA) Katedra počítačů, Computational Intelligence Group Evropský sociální fond Praha & EU: Investujeme
MODERNÍ METODY SEGMENTACE ZÁKAZNÍKŮ Ing. Miloš Uldrich ZÁKAZNICKÁ LOAJALITA A AKVIZICE VE FINANČNÍCH SLUŽBÁCH. StatSoft CR
Váš pomocník pro analýzu dat MODERNÍ METODY SEGMENTACE ZÁKAZNÍKŮ Ing. Miloš Uldrich StatSoft CR StatSoft StatSoft CR Dodavatel komplexních analytických řešení Výhradní dodavatel softwaru STATISTICA pro
Získávání dat z databází 1 DMINA 2010
Získávání dat z databází 1 DMINA 2010 Získávání dat z databází Motto Kde je moudrost? Ztracena ve znalostech. Kde jsou znalosti? Ztraceny v informacích. Kde jsou informace? Ztraceny v datech. Kde jsou
Obsah. Předmluva 13. O autorovi 15. Poděkování 16. O odborných korektorech 17. Úvod 19
Předmluva 13 O autorovi 15 Poděkování 16 O odborných korektorech 17 Úvod 19 Co kniha popisuje 19 Co budete potřebovat 20 Komu je kniha určena 20 Styly 21 Zpětná vazba od čtenářů 22 Errata 22 KAPITOLA 1
ZÍSKÁVÁNÍ ZNALOSTÍ Z DATABÁZÍ
metodický list č. 1 Dobývání znalostí z databází Cílem tohoto tematického celku je vysvětlení základních pojmů z oblasti dobývání znalostí z databází i východisek dobývání znalostí z databází inspirovaných
METODY DOLOVÁNÍ V DATECH DATOVÉ SKLADY TEREZA HYNČICOVÁ H2IGE1
METODY DOLOVÁNÍ V DATECH DATOVÉ SKLADY TEREZA HYNČICOVÁ H2IGE1 DOLOVÁNÍ V DATECH (DATA MINING) OBJEVUJE SE JIŽ OD 60. LET 20. ST. S ROZVOJEM POČÍTAČOVÉ TECHNIKY DEFINICE PROCES VÝBĚRU, PROHLEDÁVÁNÍ A MODELOVÁNÍ
Úvodem Dříve les než stromy 3 Operace s maticemi
Obsah 1 Úvodem 13 2 Dříve les než stromy 17 2.1 Nejednoznačnost terminologie 17 2.2 Volba metody analýzy dat 23 2.3 Přehled vybraných vícerozměrných metod 25 2.3.1 Metoda hlavních komponent 26 2.3.2 Faktorová
Proč studovat matematické programy na ÚMS PřF MU aneb co pak budu dělat
Proč studovat matematické programy na ÚMS PřF MU aneb co pak budu dělat Martin Řezáč 22.1.2011 Co budu po VŠ dělat? Co se dá dělat s matematikou??? Ukázka aktuálních pracovních nabídek: Analytik řízení
BIG DATA. Nové úlohy pro nástroje v oblasti BI. 27. listopadu 2012
BIG DATA Nové úlohy pro nástroje v oblasti BI 27. listopadu 2012 AGENDA 1. Úvod 2. Jaké jsou potřeby? 3. Možné řešení 2 Jaké jsou potřeby? Dopady Analýza dat potřeba nového přístupu Jak na nestrukturovaná
PowerOPTI Řízení účinnosti tepelného cyklu
PowerOPTI Řízení účinnosti tepelného cyklu VIZE Zvýšit konkurenceschopnost provozovatelů elektráren a tepláren. Základní funkce: Spolehlivé hodnocení a řízení účinnosti tepelného cyklu, včasná diagnostika
Využití metod strojového učení v bioinformatice David Hoksza
Využití metod strojového učení v bioinformatice David Hoksza SIRET Research Group Katedra softwarového inženýrství, Matematicko-fyzikální fakulta Karlova Univerzita v Praze Bioinformatika Biologické inspirace
ANALÝZA A KLASIFIKACE DAT
ANALÝZA A KLASIFIKACE DAT RNDr. Eva Janoušová INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ HODNOCENÍ ÚSPĚŠNOSTI KLASIFIKACE A SROVNÁNÍ KLASIFIKÁTORŮ ÚVOD Vstupní data Subjekt Objem hipokampu Objem komor Skutečnost
Dobývání a vizualizace znalostí
Dobývání a vizualizace znalostí Olga Štěpánková et al. 1 Osnova předmětu 1. Dobývání znalostí - popis a metodika procesu a objasnění základních pojmů 2. Nástroje pro modelování klasifikovaných dat a jejich
StatSoft Úvod do data miningu
StatSoft Úvod do data miningu Tento článek je úvodním povídáním o data miningu, jeho vzniku, účelu a využití. Historie data miningu Rozvoj počítačů, výpočetní techniky a zavedení elektronického sběru dat
Dobývání a vizualizace znalostí. Olga Štěpánková et al.
Dobývání a vizualizace znalostí Olga Štěpánková et al. 1 Osnova předmětu Dobývání znalostí - popis a metodika procesu CRISP a objasnění základních pojmů Nástroje pro modelování klasifikovaných dat a jejich
Učící se klasifikátory obrazu v průmyslu
Učící se klasifikátory obrazu v průmyslu FCC průmyslové systémy s.r.o. FCC průmyslové systémy je technicko obchodní společností, působící v oblasti průmyslové automatizace. Tvoří ji dvě základní divize:
Moderní systémy pro získávání znalostí z informací a dat
Moderní systémy pro získávání znalostí z informací a dat Jan Žižka IBA Institut biostatistiky a analýz PřF & LF, Masarykova universita Kamenice 126/3, 625 00 Brno Email: zizka@iba.muni.cz Bioinformatika:
ZÁKLADY PROGRAMOVÁNÍ. Mgr. Vladislav BEDNÁŘ 2014 7.4 13/14
ZÁKLADY PROGRAMOVÁNÍ Mgr. Vladislav BEDNÁŘ 2014 7.4 13/14 Co je vhodné vědět, než si vybereme programovací jazyk a začneme programovat roboty. 1 / 13 0:40 Implementace Umělá inteligence (UI) Umělá inteligence
Využití strojového učení k identifikaci protein-ligand aktivních míst
Využití strojového učení k identifikaci protein-ligand aktivních míst David Hoksza, Radoslav Krivák SIRET Research Group Katedra softwarového inženýrství, Matematicko-fyzikální fakulta Karlova Univerzita
Dobývání a vizualizace znalostí
Dobývání a vizualizace znalostí Olga Štěpánková et al. 1 Osnova předmětu 1. Dobývání znalostí - popis a metodika procesu a objasnění základních pojmů 2. Nástroje pro modelování klasifikovaných dat a jejich
Algoritmy a struktury neuropočítačů ASN - P10. Aplikace UNS v biomedicíně
Aplikace UNS v biomedicíně aplikace v medicíně postup při zpracování úloh Aplikace UNS v medicíně Důvod: nalezení exaktnějších, levnějších a snadnějších metod určování diagnóz pro lékaře nalezení šetrnějších
Algoritmy a struktury neuropočítačů ASN - P11
Aplikace UNS při rozpoznání obrazů Základní úloha segmentace obrazu rozdělení obrazu do několika významných oblastí klasifikační úloha, clusterová analýza target Metody Kohonenova metoda KSOM Kohonenova
Profilování vzorků heroinu s využitím vícerozměrné statistické analýzy
Profilování vzorků heroinu s využitím vícerozměrné statistické analýzy Autor práce : RNDr. Ivo Beroun,CSc. Vedoucí práce: prof. RNDr. Milan Meloun, DrSc. PROFILOVÁNÍ Profilování = klasifikace a rozlišování
Marketingová komunikace. 3. soustředění. Mgr. Pavel Vávra 9103@mail.vsfs.cz. Kombinované studium Skupina N9KMK3PH (vm3bph)
Marketingová komunikace Kombinované studium Skupina N9KMK3PH (vm3bph) 3. soustředění Mgr. Pavel Vávra 9103@mail.vsfs.cz http://vavra.webzdarma.cz/home/index.htm Zdroje Studijní materiály Heleny Palovské
1. Vlastnosti diskretních a číslicových metod zpracování signálů... 15
Úvodní poznámky... 11 1. Vlastnosti diskretních a číslicových metod zpracování signálů... 15 1.1 Základní pojmy... 15 1.2 Aplikační oblasti a etapy zpracování signálů... 17 1.3 Klasifikace diskretních
Vícerozměrné metody. PSY117/454 Statistická analýza dat v psychologii Přednáška 12. Schematický úvod
PSY117/454 Statistická analýza dat v psychologii Přednáška 12 Vícerozměrné metody Schematický úvod Co je na slově statistika tak divného, že jeho vyslovení tak často způsobuje napjaté ticho? William Kruskal
ANALÝZA NÁKUPNÍHO KOŠÍKU SEMINÁŘ
ANALÝZA NÁKUPNÍHO KOŠÍKU SEMINÁŘ 18.11.2012 Radim Tvardek, Petr Bulava, Daniel Mašek U&SLUNO a.s. I Sadová 28 I 702 00 Ostrava I Czech Republic PŘEDPOKLADY PRO ANALÝZU NÁKUPNÍHO KOŠÍKU 18.11.2012 Daniel
Obsah. Kapitola 1 Hardware, procesory a vlákna Prohlídka útrob počítače...20 Motivace pro vícejádrové procesory...21
Stručný obsah 1. Hardware, procesory a vlákna... 19 2. Programování s ohledemna výkon... 45 3. Identifikování příležitostí pro paralelizmus... 93 4. Synchronizace a sdílení dat... 123 5. Vlákna v rozhraní
Schvalovací proces žádostí o úvěr
Schvalovací proces žádostí o úvěr Milan Roupec Embedit (Home Credit International) Martin Řezáč ÚMS PřF MU K čemu schvalovací proces? Posouzení žádosti o úvěr Odhalení pokusů o podvod Falešné údaje na
Statistické metody v ekonomii. Ing. Michael Rost, Ph.D.
Statistické metody v ekonomii Ing. Michael Rost, Ph.D. Jihočeská univerzita v Českých Budějovicích Cíle kurzu: seznámit posluchače s vybranými statistickými metodami, které jsou aplikovatelné v ekonomických
Dobývání a vizualizace znalostí
Dobývání a vizualizace znalostí Olga Štěpánková, Lenka Vysloužilová, et al. https://cw.fel.cvut.cz/wiki/courses/a6m33dvz/start 1 Osnova přednášky Úvod: data, objem, reprezentace a základní terminologie
Surfujte v business analýze jako profík. Naučíme Vás podpořit klíčová rozhodnutí firmy.
Surfujte v business analýze jako profík Naučíme Vás podpořit klíčová rozhodnutí firmy. Intuice nestačí. S čím Vám pomůžeme? Firmy čelí narůstající záplavě dat, posilují své analytické schopnosti a hledají
Panelová diskuse Technologie pro byznys
Panelová diskuse Technologie pro byznys Konference Inteligentní specializace regionu Plzeň, 29. 5. 2019 Cíl a scénář panelové diskuse Hledáme další možnosti spolupráce výzkumné a podnikové sféry v Plzeňském
Inovační vouchery s Univerzitou Hradec Králové. doc. Ing. Mgr. Petra Marešová, Ph.D. Ing. Richard Cimler
Inovační vouchery s Univerzitou Hradec Králové doc. Ing. Mgr. Petra Marešová, Ph.D. Ing. Richard Cimler Úvod Hlavní směry výzkumu: = Informační technologie = Bioinformatika = Ekonomika a management = Vzdělávání
Podvody v bankovní praxi
Podvody v bankovní praxi Pavel Gernt Credit Fraud Manager Raiffeisenbank Obsah Hlavní rizika používání platebních karet Na co si dát pozor v transakčních podvodech Specifika úvěrových podvodů v segmentu
DOBÝVÁNÍ ZNALOSTÍ Z DATABÁZÍ
DOBÝVÁNÍ ZNALOSTÍ Z DATABÁZÍ Úvod a oblasti aplikací Martin Plchút plchut@e-globals.net DEFINICE A POJMY Netriviální extrakce implicitních, ch, dříve d neznámých a potenciáln lně užitečných informací z
Přednáška 13 Redukce dimenzionality
Vytěžování Dat Přednáška 13 Redukce dimenzionality Miroslav Čepek Fakulta Elektrotechnická, ČVUT Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti ČVUT (FEL) Redukce dimenzionality 1 /
Cíle supervizovaného učení Ondřej Háva
Cíle supervizovaného učení Ondřej Háva ACREA CR Využíváme více než 40 let zkušeností IBM s hlavním cílem: řízení rozhodovacích procesů Akvizice SPSS společností IBM v říjnu 2009 Přejmenování SPSS CR na
ABBYY Automatizované zpracování dokumentů
ABBYY Automatizované zpracování dokumentů tradiční řešení OCR versus Cloud Jiří Dvořák ECM konzultant Světový leader v produktech pro zpracování dokumentů Individulání uživatelé Malé a střední společnosti
Profitabilita klienta v kontextu Performance management
IBM Technical specialist team Pre Sale 26/10/2010 Profitabilita klienta v kontextu Performance management Co všechno řadíme do PM? Automatická data Běžný reporting Pokročilé statistické modely Včera What
Automatická detekce anomálií při geofyzikálním průzkumu. Lenka Kosková Třísková NTI TUL Doktorandský seminář, 8. 6. 2011
Automatická detekce anomálií při geofyzikálním průzkumu Lenka Kosková Třísková NTI TUL Doktorandský seminář, 8. 6. 2011 Cíle doktorandské práce Seminář 10. 11. 2010 Najít, implementovat, ověřit a do praxe
Aplikace moderních analytických a optimalizačních metod na data získaná z technologií Smart Metering
Aplikace moderních analytických a optimalizačních metod na data získaná z technologií Smart Metering Ing. Michal Osladil, Ph.D., IBM Global Business Services CZ, SK & HU Datová exploze Každým dnem je generováno
Strojové učení a dolování dat. Vybrané partie dolování dat 2016/17 Jan Šimbera
Strojové učení a dolování dat vgeografii Vybrané partie dolování dat 2016/17 Jan Šimbera simberaj@natur.cuni.cz Kde v geografii? Získávání prostorově podrobných dat Prostorová dezagregace Analýza dat dálkového
Moderní metody automatizace a hodnocení marketingových kampaní
Moderní metody automatizace a hodnocení marketingových kampaní SAS CI Roadshow 2014 24/09/2014 Vít Stinka Agenda Představení společnosti Unicorn Systems Aliance Unicorn Systems a SAS Celkový koncept Customer
Bezpečnost internetového bankovnictví, bankomaty
, bankomaty Filip Marada, filipmarada@gmail.com KM FJFI 15. května 2014 15. května 2014 1 / 18 Obsah prezentace 1 Bezpečnost internetového bankovnictví Možná rizika 2 Bankomaty Výběr z bankomatu Možná
BA_EM Electronic Marketing. Pavel
BA_EM Electronic Marketing Pavel Kotyza @VŠFS Agenda Efektivní data mining jako zdroj relevantních dat o potřebách zákazníků Co je data mining? Je absolutní Je předem neznámý Je užitečný Co jsou data?
Mýty v řízení rizik podvodu. Tomáš Kafka Partner Forenzní služby
Mýty v řízení rizik podvodu Tomáš Kafka Partner Forenzní služby 1 Hodnocením rizik podvodu odhalíme podvody. Strana2 Hodnocení rizik podvodu není analýza rizikovosti projektu Hodnocení rizik podvodu Systémové
TISKOVÁ KONFERENCE. Volksbank CZ, a.s. 16. dubna 2008, Tančící dům, Praha. Marketing
TISKOVÁ KONFERENCE Marketing 16. dubna 2008, Tančící dům, Praha Volksbank CZ, a.s. Obsah 2 Hospodářské výsledky Volksbank CZ v roce 2007 prezentuje: Johann Lurf, předseda představenstva 15 let Volksbank
Získávání znalostí z databází. Alois Kužela
Získávání znalostí z databází Alois Kužela Obsah související pojmy datové sklady, získávání znalostí asocianí pravidla 2/37 Úvod získávání znalostí z dat, dolování (z) dat, data mining proces netriviálního
Datová věda (Data Science) akademický navazující magisterský program
Datová věda () akademický navazující magisterský program Reaguje na potřebu, kterou vyvolala rychle rostoucí produkce komplexních, obvykle rozsáhlých dat ve vědě, v průmyslu a obecně v hospodářských činnostech.
Sázková kancelář Z pekla štěstí
Sázková kancelář Z pekla štěstí Řešitelský tým Michal Pfeifer, Martin Halamíček, Jan Blaško, Zdeněk Křepela, Jan Popelka, Jan Mach Úvod Sázková kancelář Z pekla štěstí je malá společnost s několika malými
ANALÝZA A KLASIFIKACE DAT
ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc. INVESTICE Institut DO biostatistiky ROZVOJE VZDĚLÁVÁNÍ a analýz LITERATURA Holčík, J.: přednáškové prezentace Holčík, J.: Analýza a klasifikace signálů.
DATA MINING KLASIFIKACE DMINA LS 2009/2010
DATA MINING KLASIFIKACE DMINA LS 2009/2010 Osnova co je to klasifikace typy klasifikátoru typy výstupu jednoduchý klasifikátor (1R) rozhodovací stromy Klasifikace (ohodnocení) zařazuje data do předdefinovaných
Signpads GE Money Bank Hana Čuboková. 17.Března 2014
Signpads GE Money Bank Hana Čuboková 17.Března 2014 Agenda Agenda Proč Signpads Rozdíl mezi dynamickým biometrickým a klasickým podpisem Zavedení Signpads do pobočkové sítě GE Money Bank Signpads z pohledu
Automatizační a měřicí technika (B-AMT)
Ústav automatizace a měřicí techniky Bakalářský studijní program Automatizační a měřicí technika () Specializace oboru Řídicí technika Měřicí technika Průmyslová automatizace Robotika a umělá inteligence
Pokročilé operace s obrazem
Získávání a analýza obrazové informace Pokročilé operace s obrazem Biofyzikální ústav Lékařské fakulty Masarykovy univerzity Brno prezentace je součástí projektu FRVŠ č.2487/2011 (BFÚ LF MU) Získávání
Big Data a oficiální statistika. Unicorn College Open 24. dubna 2015 Doc. Ing. Marie Bohatá, CSc.
Big Data a oficiální statistika Unicorn College Open 24. dubna 2015 Doc. Ing. Marie Bohatá, CSc. Obsah příspěvku Charakteristiky Big Data Výzvy a úskalí z perspektivy statistiky Výzvy z perspektivy computing
Metody analýzy modelů. Radek Pelánek
Metody analýzy modelů Radek Pelánek Fáze modelování 1 Formulace problému 2 Základní návrh modelu 3 Budování modelu 4 Verifikace a validace 5 Simulace a analýza 6 Sumarizace výsledků Simulace a analýza
4EK201 Matematické modelování. 11. Ekonometrie
4EK201 Matematické modelování 11. Ekonometrie 11. Ekonometrie Ekonometrie Interdisciplinární vědní disciplína Zkoumá vztahy mezi ekonomickými veličinami Mikroekonomickými i makroekonomickými Ekonomie ekonomické
Chatboti Virtuální pomocníci pro váš byznys. Watson Solution Market. 14. září 2017 ParkHotel Praha
Chatboti Virtuální pomocníci pro váš byznys Watson Solution Market 14. září 2017 ParkHotel Praha Jan Macek Watson Prague R&D Lab Barbora Kopecká Watson ilab 1 Definice chatbota Počítačový program, který
DATABÁZOVÉ SYSTÉMY. Metodický list č. 1
Metodický list č. 1 Cíl: Cílem předmětu je získat přehled o možnostech a principech databázového zpracování, získat v tomto směru znalosti potřebné pro informačního manažera. Databázové systémy, databázové
Silná autentizace a detekce fraudu (nejen) ve finančním sektoru jak to udělat správně
Silná autentizace a detekce fraudu (nejen) ve finančním sektoru jak to udělat správně David Matějů Senior Security Consultant CA Expo 2018 Vývoj autentizace uživatelů (nejen) v bankovnictví CÍL ZPŮSOB
Instance based learning
Učení založené na instancích Instance based learning Charakteristika IBL (nejbližších sousedů) Tyto metody nepředpokládají určitý model nejsou strukturované a typicky nejsou příliš užitečné pro porozumění
Základy business intelligence. Jaroslav Šmarda
Základy business intelligence Jaroslav Šmarda Základy business intelligence Business intelligence Datový sklad On-line Analytical Processing (OLAP) Kontingenční tabulky v MS Excelu jako příklad OLAP Dolování
Analytické procedury v systému LISp-Miner
Dobývání znalostí z databází MI-KDD ZS 2011 Přednáška 8 Analytické procedury v systému LISp-Miner Část II. (c) 2011 Ing. M. Šimůnek, Ph.D. KIZI, Fakulta informatiky a statistiky, VŠE Praha Evropský sociální
Úvod do optimalizace, metody hladké optimalizace
Evropský sociální fond Investujeme do vaší budoucnosti Úvod do optimalizace, metody hladké optimalizace Matematika pro informatiky, FIT ČVUT Martin Holeňa, 13. týden LS 2010/2011 O čem to bude? Příklady
K možnostem krátkodobé předpovědi úrovně znečištění ovzduší statistickými metodami. Josef Keder
K možnostem krátkodobé předpovědi úrovně znečištění ovzduší statistickými metodami Josef Keder Motivace Předpověď budoucí úrovně znečištění ovzduší s předstihem v řádu alespoň několika hodin má význam
Specifika bankovního prostředí při monitoringu a analýze bezpečnostních incidentů. RNDr. Ondřej Zýka Profinit
Specifika bankovního prostředí při monitoringu a analýze bezpečnostních incidentů RNDr. Ondřej Zýka Profinit Obsah Popis situace Architektura systému Specifika bankovního sektoru Praktický příklad Přínosy
Predikce a řízení incidentů, událostí a poruchových stavů v reálném čase
Predikce a řízení incidentů, událostí a poruchových stavů v reálném čase Martin Bajer 1.11.2017 Postupná změna bezpečnostních hrozeb Narušení objektu DDoS útok Hackeři Přelezení plotu Vyřazení rozvodny
2. Modelovací jazyk UML 2.1 Struktura UML 2.1.1 Diagram tříd 2.1.1.1 Asociace 2.1.2 OCL. 3. Smalltalk 3.1 Jazyk 3.1.1 Pojmenování
1. Teoretické základy modelování na počítačích 1.1 Lambda-kalkul 1.1.1 Formální zápis, beta-redukce, alfa-konverze 1.1.2 Lambda-výraz jako data 1.1.3 Příklad alfa-konverze 1.1.4 Eta-redukce 1.2 Základy
Ústav automatizace a měřicí techniky.
www.feec.vutbr.cz Specializace studijního oboru Automatizační a Měřicí Technika: Řídicí technika Moderní algoritmy řízení, teorie řízení Modelování a identifikace parametrů řízených systémů Pokročilé metody
Získávání znalostí z dat
Získávání znalostí z dat Informační a komunikační technologie ve zdravotnictví Získávání znalostí z dat Definice: proces netriviálního získávání implicitní, dříve neznámé a potencionálně užitečné informace
Strojové učení se zaměřením na vliv vstupních dat
Strojové učení se zaměřením na vliv vstupních dat Irina Perfilieva, Petr Hurtík, Marek Vajgl Centre of excellence IT4Innovations Division of the University of Ostrava Institute for Research and Applications
OPTIMÁLNÍ SEGMENTACE DAT
ROBUST 2004 c JČMF 2004 OPTIMÁLNÍ SEGMENTACE DAT Petr Novotný Klíčová slova: Výpočetní statistika, po částech spojitá regrese. Abstrakt: Snížení paměťové náročnosti při výpočtu po částech spojitého regresního
Data Science projekty v telekomunikační společnosti
Data Science projekty v telekomunikační společnosti Jan Romportl Chief Data Scientist, O2 Czech Republic Data, mapa a teritorium Data Science Mezioborová technicky orientovaná oblast, která se zabývá inovativním
TERMINOLOGIE ... NAMĚŘENÁ DATA. Radek Mareček PŘEDZPRACOVÁNÍ DAT. funkční skeny
PŘEDZPRACOVÁNÍ DAT Radek Mareček TERMINOLOGIE Session soubor skenů nasnímaných během jednoho běhu stimulačního paradigmatu (řádově desítky až stovky skenů) Sken jeden nasnímaný objem... Voxel elementární
Spark SQL, Spark Streaming. Jan Hučín
Spark SQL, Spark Streaming Jan Hučín 22. listopadu 2017 Osnova 1. Spark SQL 2. Další rozšíření Sparku Spark streaming GraphX Spark ML 2 Spark SQL Spark SQL a DataFrames (DataSets) Rozšíření k tradičnímu
1. Data mining. Strojové učení. Základní úlohy.
1... Základní úlohy. Učení s učitelem a bez učitele. Petr Pošík Katedra kybernetiky ČVUT FEL P. Pošík c 2010 Aplikace umělé inteligence 1 / 36 Obsah P. Pošík c 2010 Aplikace umělé inteligence 2 / 36 Co
Surfujte v business analýze jako profík. Naučíme Vás podpořit klíčová rozhodnutí firmy.
Surfujte v business analýze jako profík Naučíme Vás podpořit klíčová rozhodnutí firmy. Intuice nestačí S čím Vám pomůžeme? Firmy čelí narůstající záplavě dat, posilují své analytické schopnosti a hledají
BIG DATA je oveľa viac ako Hadoop. Martin Pavlík
BIG DATA je oveľa viac ako Hadoop Martin Pavlík Analýza všech dostupných dat? Big data =? = Buzzword? = Hadoop? Hadoop Jen ke zpracování nestrukturovaných dat? Mentální posun něco za něco 2 Big data =
Strojové učení Marta Vomlelová
Strojové učení Marta Vomlelová marta@ktiml.mff.cuni.cz KTIML, S303 Literatura 1.T. Hastie, R. Tishirani, and J. Friedman. The Elements of Statistical Learning, Data Mining, Inference and Prediction. Springer
Spark SQL, Spark Streaming. Jan Hučín
Spark SQL, Spark Streaming Jan Hučín 21. listopadu 2018 Osnova 1. Spark SQL 2. Další rozšíření Sparku Spark streaming GraphX Spark ML 2 Spark SQL Spark SQL a DataFrames (DataSets) Rozšíření k tradičnímu
Příprava dat v softwaru Statistica
Příprava dat v softwaru Statistica Software Statistica obsahuje pokročilé nástroje pro přípravu dat a tvorbu nových proměnných. Tyto funkcionality přinášejí značnou úsporu času při přípravě datového souboru,
Otevřená data ČSSZ: Přehledné informace dostupné všem, snadno a zdarma. Ing. Jiří Šunka Ing. Michaela Hendrychová. ISSS Hradec Králové, 5. 4.
Otevřená data ČSSZ: Přehledné informace dostupné všem, snadno a zdarma ISSS Hradec Králové, 5. 4. 2016 Ing. Jiří Šunka Ing. Michaela Hendrychová Obsah 1. Představení ČSSZ 2. Proces publikace otevřených
ANALÝZA DAT V R 9. VÝPOČET VELIKOSTI SOUBORU. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.
ANALÝZA DAT V R 9. VÝPOČET VELIKOSTI SOUBORU Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK www.biostatisticka.cz DATA, VÝZKUM, ANALÝZY ve výzkumu se střídají fáze prozkoumávací
Stanovení manganu a míry přesnosti kalibrace ( Lineární kalibrace )
Příklad č. 1 Stanovení manganu a míry přesnosti kalibrace ( Lineární kalibrace ) Zadání : Stanovení manganu ve vodách se provádí oxidací jodistanem v kyselém prostředí až na manganistan. (1) Sestrojte
Lineární a adaptivní zpracování dat. 2. SYSTÉMY a jejich popis v časové doméně
Lineární a adaptivní zpracování dat 2. SYSTÉMY a jejich popis v časové doméně Daniel Schwarz Investice do rozvoje vzdělávání Osnova Opakování: signály Systémy: definice, několik příkladů Vlastnosti systémů
Obohacení dat o statistické výsledky a potenciál jejich využití 2.2.2011
Obohacení dat o statistické výsledky a potenciál jejich využití 2.2.2011 Společnost SPSS CR nyní výhradní partner IBM pro prodej software IBM SPSS v ČR a SR od roku 1998 franchise SPSS Inc. SPSS Inc. vývoj
Dolování dat z multimediálních databází. Ing. Igor Szöke Speech group ÚPGM, FIT, VUT
Dolování dat z multimediálních databází Ing. Igor Szöke Speech group ÚPGM, FIT, VUT Obsah prezentace Co jsou multimediální databáze Možnosti dolování dat v multimediálních databázích Vyhledávání fotografií
Diagnostika regrese pomocí grafu 7krát jinak
StatSoft Diagnostika regrese pomocí grafu 7krát jinak V tomto článečku si uděláme exkurzi do teorie regresní analýzy a detailně se podíváme na jeden jediný diagnostický graf. Jedná se o graf Předpovědi
Unifikovaný modelovací jazyk UML
Unifikovaný modelovací jazyk UML Karel Richta katedra počíta tačů FEL ČVUT Praha richta@fel fel.cvut.czcz Motto: Komunikačním m prostředkem informační komunity se postupem času stala angličtina. Chcete-li
Zpracování dat v AVG backendech. Antonín Karásek Jarek Jarcec Čecho
Zpracování dat v AVG backendech Antonín Karásek Jarek Jarcec Čecho Backend systémy Co je od nás vyžadováno zpracování uživatelských dat vytváření reportů
Vojtěch Franc Centrum strojového vnímání, Katedra kybernetiky, FEL ČVUT v Praze Eyedea Recognition s.r.o MLMU 29.4.2015
Příklady použití metod strojového učení v rozpoznávání tváří Vojtěch Franc Centrum strojového vnímání, Katedra kybernetiky, FEL ČVUT v Praze Eyedea Recognition s.r.o MLMU 29.4.2015 Stavební bloky systému
NÁVRH EFEKTIVNÍ STRATEGIE MOBILNÍHO BANKOVNICTVÍ: NALEZENÍ SPRÁVNÉHO OBCHODNÍHO MODELU Mobile tech 2014
NÁVRH EFEKTIVNÍ STRATEGIE MOBILNÍHO BANKOVNICTVÍ: NALEZENÍ SPRÁVNÉHO OBCHODNÍHO MODELU Mobile tech 2014 Mojmír Prokop, Head of Direct Channels, Komerční banka, a.s. Praha 27.března 2012 Kdo jsme : Silná
4IT218 Databáze. 4IT218 Databáze
4IT218 Databáze Osmá přednáška Dušan Chlapek (katedra informačních technologií, VŠE Praha) 4IT218 Databáze Osmá přednáška Normalizace dat - dokončení Transakce v databázovém zpracování Program přednášek
Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze
Dobývání znalostí Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze Dobývání znalostí Úvod do problematiky Doc. RNDr. Iveta Mrázová,