9. Dobývání znalostí v praxi

Rozměr: px
Začít zobrazení ze stránky:

Download "9. Dobývání znalostí v praxi"

Transkript

1 9. Dobývání znalostí v praxi 9.1 Příklad úlohy Na závěr knihy se opět vraťme k příkladu zmíněném v první kapitole. Vodítkem při dobývání znalostí nám bude metodologie CRISP-DM Porozumění problematice Banka XY je zaměřena na drobné klienty kterým vede účty, poskytuje půjčky apod. 1 Pod rostoucím tlakem konkurence chce tato banka zlepšit své služby. Management banky má jen velmi vágní představu, co je možno od metod dobývání znalostí očekávat. Doufá ale, že mu tyto nové metody umožní lépe pochopit klienty a tak například cíleněji nabízet své produkty (tedy úloha deskripce), nebo rozlišovat mezi různými skupinami klientů (tedy úloha klasifikace) Porozumění datům Obr. 1 Data o klientech banky XY Data sledovaná bankou XY mají podobu několika navzájem propojených tabulek (Obr. 1). Základní tabulkou je tabulka Account (účty). S každým účtem může disponovat nějaký klient (tabulka Client). K jednomu účtu může mít přístup více klientů, jeden klient může mít zřízeno více účtů; tato skutečnost 1 Banka XY je fiktivní banka. Jakákoliv podobnost s reálnou bankou je čistě náhodná. Uvedená data byla použita v rámci workshopů Discovery Challenge na konferencích PKDD 99 a PKDD

2 je zachycena v tabulce Disposition, která přiřazuje klienty k účtům. Klientovi, který disponuje nějakým účtem, může být k tomuto účtu vydána kreditní karta (tabulka Credit Card). Nejdůležitější údaje o účtech jsou údaje o prováděných operacích, to je zachyceno v tabulce Transactions (transakce). Na některých účtech mohou být zřízeny trvalé platební příkazy (tabulka Permanent order), na základě některých účtů banka poskytuje úvěr (tabulka Loan). Tabulka Demograph obsahuje demografické údaje o 77 okresech, lze z nich tedy vyčíst další informace o prostředí ve kterém klient žije. account_id identifikace záznamu district_id okres pobočky date datum založení účtu Ve tvaru YYMMDD frequency četnost výpisů "MESICNE" " TYDNE" "PO OBRATU" Tab. 1 Tabulka účty client_id identifikace záznamu rodné číslo datum narození a pohlaví ve tvaru YYMMDD pro muže, YYMM+50DD pro ženy, district_id okres bydliště Tab. 2 Tabulka klienti disp_id identifikace záznamu client_id identifikace klienta account_id identifikace účtu type typ dispozičního práva (owner/user) Pouze "owner" může dávat trvalé příkazy a žádat o úvěr Tab. 3 Tabulka dispoziční práva order_id identifikace záznamu account_id číslo účtu bank_to banka příjemce dvouznakový kód account_to účet příjemce amount uhrazená částka k_symbol charakteristika platby "POJISTNE" "SIPO" "LEASING" "UVER" Tab. 4 Tabulka trvalé příkazy 2

3 trans_id identifikace záznamu account_id číslo účtu kterého se transakce týká date datum transakce ve tvaru YYMMDD type typ transakce "PRIJEM" "VYDAJ" operation způsob provedení transakce "VYBER KARTOU" "VKLAD" (v hotovosti) "PREVOD Z UCTU" "VYBER" (v hotovosti) "PREVOD NA UCET" amount částka balance zůstatek po provedení operace k_symbol charakteristika transakce "POJISTNE" "SLUZBY" "UROK" "SANKC. UROK" "SIPO" "DUCHOD" "UVER" bank banka partnera dvouznakový kód account učet partnera Tab. 5 Tabulka transakce loan_id identifikace záznamu account_id identifikace účtu date datum poskytnutí úvěru ve tvaru YYMMDD purpose účel úvěru ammount částka duration doba splácení payments měsíční splátky status status splácení úvěru 'A' úvěr ukončen bez problémů, 'B' úvěr ukončen s problémy, 'C' běžící úvěr, bez problémů, 'D' běžící úvěr, s problémy Tab. 6 Tabulka úvěry card_id identifikace záznamu disp_id dispoziční právo k účtu type typ kreditní karty možné hodnoty jsou "junior", "classic", "gold" issued datum vydání ve tvaru YYMMDD Tab. 7 Tabulka kreditní karty A1= kód okresu 3

4 district_id A2 jméno okresu A3 region A4 počet obyvatel A5 počet obcí s počtem obyvatel < 499 A6 počet obcí s počtem obyvatel A7 počet obcí s počtem obyvatel A8 počet obcí s počtem obyvatel > A9 počet měst A10 podíl městského obyvatelstva A11 průměrný plat A12 míra nezaměstnanosti '95 A13 míra nezaměstnanosti '96 A14 počet soukromých podnikatelů na 1000 obyvatel A15 zjištěné trestné činy '95 A16 zjištěné trestné činy '96 Tab. 8 Tabulka demografická data Banka poskytla pro analýzu jen určitý (relativně malý) vzorek těchto dat: 4500 účtů, 5369 klientů, 6471 trvalých příkazů, 682 záznamů o úvěrech, 892 záznamů o kreditních kartách. Z tohoto počtu se vymyká pouze tabulka transakce obsahující záznamů údajů o pohybu na účtech až za 5 let. První představu o podobě dat bylo (vzhledem k rozsahu dat) možno získat relativně jednoduchými nástroji (Access, Excel). Tak lze například zjistit, jaký je podíl bezproblémových úvěrů a úvěrů s problémy (Tab. 9) nebo jaké je zastoupení držitelů kreditních karet podle typu karty (Tab. 10). Bylo rovněž konstatováno, že některé údaje v tabulce transakce (např. konstantní symbol) mají mnoho chybějících hodnot. Dále bylo zjištěno, že daných datech se nevyskytoval klient, který mohl manipulovat s více účty a že s jedním účtem mohli manipulovat maximálně dva klienti. Status úvěru absolutní počet relativně vůči všem úvěrům relativně vůči všem účtům žádný úvěr % A % 4.51% B % 0.69% C % 8.95% D % 1% Tab. 9 Klasifikace úvěrů typ karty absolutní počet relativně vůči všem kartám relativně vůči všem účtům žádná % junior % 3.22% classic % 13.98% gold % 1.96% Tab. 10 Klasifikace kreditních karet 4

5 9.1.3 Příprava dat Předzpracování dat je nejpracnější částí celé analýzy. Vzhledem k tomu, že zamýšlíme použít algoritmy pracující s jedinou tabulkou (tedy používající reprezentaci objektů pomocí hodnot atributů) musíme především vytvořit agregované hodnoty pro řadu charakteristik. Za centrální tabulku zvolíme údaje o účtech (tabulku account). K této tabulce pak budeme přiřazovat údaje z tabulek s ní spojených: V tabulce client můžeme z rodného čísla určit věk a pohlaví klienta. V případě tabulek client a dispsition určíme počet klientů, kteří mají právo nakládat s účtem 2, vzhledem k tomu, že v datech se nevyskytuje klient který má právo manipulovat s více účty, nemusíme provádět spojování tabulek opačným směrem. V případě tabulky permanent order určíme počet a trvalých příkazů, celkovou částku a to, zda se vyskytuje příkaz pro určitý typ platby. V případě tabulky transactions vyjdeme z toho, že lze předpokládat měsíční periodicitu řady transakcí. Budeme tedy počítat průměrný zůstatek, průměrný příjem, průměrný výdej (souhrnně i podle typu transakcí) a průměrný počet transakcí za jeden měsíc. Průměrný zůstatek přitom spočítáme jako vážený průměr zůstatku po provedené transakci, kde vahou bude počet dnů, po které byl tento zůstatek na účtu [Coufal a kol, 1999]: prům_zůst = 1 30 i zůstatek(i) počet_dnů(i). Smysl má rovněž určit měsíční minimum a maximum ze zůstatku, příjmu a výdaje. Z tabulky loan přiřadíme příslušné údaje účtům ke kterým je splácen úvěr. Z tabulky credit card zjistíme, kolik karet a jakého typu je vydáno k účtům. Z tabulky demograph přiřadíme účtům (majitelům účtů) demografické charakteristiky Protože některé algoritmy (např. asociační pravidla) pracují pouze s kategoriálními daty, je nutno předem diskretizovat numerické atributy. Zkusíme obě varianty slepé diskretizace, ekvidistantní i ekvifrekvenční intervaly Modelování Ukažme si na několika vybraných úlohách způsob použití některých analytických procedur pro krok modelování. V případě prvních dvou relativně jednoduchých úloh vystačíme s jednou metodou, Další dvě úlohy vyžadují postupné použití několika algoritmů. 2 Z věku a pohlaví můžeme zkusit usoudit na vzájemný vztah těchto klientů (partneři, rodiče a děti) tyto naše dedukce jsou ale neprůkazné. 5

6 Jednoduchá deskripce Při této úloze nás bude zajímat souvislost typu úvěru a dalších charakteristik účtu. Znalosti získané touto analýzou by měly popisovat rizikovou skupinu klientů, v ideálním případě na základě charakteristik, které se dají zjistit ještě před poskytnutím úvěru. Jako analytický nástroj nejprve použijeme metodu GUHA [Coufal a kol, 1999].. Vzhledem k tomu že metoda pracuje pouze s kategoriálními daty, budeme pracovat s diskretizovanými podobami numerických atributů. Spojíme rovněž hodnoty A a C atributu loan.status do nové hodnoty good a hodnoty B a D téhož atributu do nové hodnoty bad. Metodou GUHA pak budeme hledat asociační pravidla (hypotézy) typu A ~ loan.status, kde A bude nejvýše dvoučlenná konjunkce. Pro ~ použijeme Fisherův kvantifikátor na hladině významnosti α=0.05, požadujeme přitom hypotézy s podporu (support) alespoň 15 objektů. Tab. 11 ukazuje některé nalezené asociace [Coufal a kol, 1999]. Jednotlivé sloupce tabulky zachycují číslo hypotézy, předpoklad A, závěr, hodnotu Fisherova kvantifikátoru, podporu (support), a spolehlivost (confidence) pravidla A loan.status 3. # předpoklad loan.status Fisher podpora spolehlivost 1 prům_sankční_úrok(ne) good e prům_sankční_úrok(ano) bad e trvalý_příkaz_sipo(ano) good e trvalý_příkaz_sipo(ne) bad e trvalý_příkaz_sipo(ano) jiný_trvalý_příkaz(ne) good e další_disponent(ano) good e další_disponent(ne) bad e rok_poskytnutí_uvěru(98) good e kreditní_karta(ano) good e výše_splátky(<2000) good e rok_založení_účtu(97) good e Tab. 11 Asociační pravidla pro typ úvěru Pro hledání vztahu mezi údaji o transakcích a typech úvěru můžeme rovněž použít vizualizační možnosti, které nabízí i tak běžný nástroj jako je Excel [Mikšovský a kol, 1999]. Pro účty patřící z hlediska typu úvěru do téže třídy spočítáme průměrné, maximální a minimální měsíční hodnoty příjmu, výdaje a zůstatku. Vyneseme-li pak do grafu průběhy těchto hodnot za šestiměsíční období, které předcházelo poskytnutí půjčky, můžeme pozorovat vzájemné rozdíly mezi účty různých tříd (Obr. 2). 3 Podpora je hodnota a ze čtyřpolní tabulky, spolehlivost je pak podíl a/(a+b) hodnot ze čtyřpolní tabulky. 6

7 Obr. 2 Vývoj průměrného zůstatku a minimálního zůstatku pro různé typy úvěrů Jednoduchá klasifikace Úlohou bude klasifikace úvěrů do tříd bezproblémové nebo rizikové. Za bezproblémové budeme považovat úvěry typu A a C (Tab. 6), za problémové pak úvěry B a D. Bezproblémových úvěrů je tedy 606 a problémových je 76. Naší snahou bude nalézt znalosti, které by umožňovaly rozpoznat potenciálně problémový úvěr ještě dříve, než je poskytnut. Budeme vycházet z toho, že pro banku je horší chybou 4 považovat potenciálně problémový úvěr za bezproblémový, než naopak. Vzhledem k tomto předpokladu i vzhledem k tomu, že četnost jednotlivých tříd je značně nevyvážená, budeme brát do úvahy různé ceny za chybu klasifikace. Pro vytvoření klasifikačních znalostí použijeme algoritmus C5.0 pro tvorbu rozhodovacích stromů a pravidel. Trénovací data budou tvořena informacemi o všech 682 účtech ke kterým je přiřazen úvěr; kromě údajů z tabulek účet, klient, dispozice a úvěr nás opět budou zajímat údaje o transakcích (o průměrných měsíčních částkách). Budeme tedy pracovat s celkem 69 atributy. Nejprve byl vytvořen rozhodovací strom, který umožnil získat představu o důležitosti jednotlivých atributů (důležitost atributu odpovídá vzdálenosti tohoto atributu od kořene stromu). To umožnilo provést novou analýzu, pouze s použitím vybraných atributů. Při tomto použití algoritmu C5.0 byl zvolen výstup v podobě rozhodovacích pravidel. Výsledkem analýzy na redukované (co do počtu atributů) trénovací množině bylo 24 pravidel. Počet chyb, kterých se báze pravidel dopustila při klasifikaci byl 52 (z 606) pro bezproblémové úvěry a 0 pro úvěry problémové. Celková úspěšnost klasifikace tedy byla 92.4%; všechny problémové úvěry přitom byly klasifikovány správně [Mikšovský a kol, 1999] Podpora zavádění kreditních karet Při této úloze jde o to zjistit kteří klienti z těch, co přicházejí do úvahy, ještě nemají kreditní karty a tyto karty jim nabídnout [Putten, 1999]. Z pohledu banky se jedná o to nabídnout další svůj produkt již existujícím klientům. Přitom, čím více produktů banky bude klient využívat, tím klesá nebezpečí, že přejde k jiné bance. Navíc banka inkasuje poplatky za použití karty. Při podrobnějším pohledu do dat se ukáže, že přestože jak počet tak používání kreditních karet roste, ke konci roku 1998 mělo kartu jen 18% klientů. Zdá se tedy, že dobrý nástroj pro stanovení potenciálních držitelů kreditní karty může bance přinést nezanedbatelné zisky. 4 Statistici by řekli, že jde o chybu prvního druhu. 7

8 Cílem úlohy dobývání znalostí bylo nalezení charakteristik klientů majících kreditní kartu i vzájemné odlišení mezi klienty držiteli zlaté karty a karty klasik, resp. mezi klienty držiteli karty junior a karty klasik. Skrytým výchozím předpokladem zde je, že data jsou dostatečně dobře reprezentují databázi všech klientů. Vzhledem k tomu, že jak počet klientů tak počet karet, které jsou v databázi je velice malý, nebudou dostupná data pravděpodobně odpovídat tomuto předpokladu. Ve fázi předzpracování byla z databáze vytvořena jedna datová matice podle klientů. Sledovanými charakteristikami byly jak statické údaje (o klientovi, o bydlišti), tak údaje o transakcích (minima, maxima, průměry zůstatků, příjmů, výběrů). Zajímavým novým atributem byla tzv. hodnota karty spočítaná jako průměrná částka vybraná kartou násobená počtem výběrů kartou. Cílovými atributy (pro různé dílčí podúlohy) pak byly typy karet. Pro úlohu nalezení charakteristik klientů majících kreditní kartu (deskriptivní úloha) byla použita metoda detekce odchylek. Pro numerický atribut se průměrná hodnota v rámci třídy vydělí průměrnou hodnotou v celých datech, pro nominální atributy se místo průměrů dělí četnosti. Tímto postupem získáme jakýsi index, který ukazuje jak moc je atribut relevantní pro zařazení objektů do dané třídy. Tímto postupem bylo např. zjištěno, že držitelé karet provádějí větší výběry v hotovosti, že mají větší zůstatky na účtech, nebo že lépe splácejí úvěry. V případě rozlišování mezi držiteli různých typů karet bylo např. zjištěno, že držitelé zlaté karty mají (ve srovnání s kartou klasik) vyšší hodnotu karty danou většími výběry i počtem transakcí. Pro predikci toho, zda je klient držitelem karty (klasifikační úloha) byl použit algoritmus k-nejbližšch sousedů. Výhodou této metody je, že výsledkem není pouze kategorické rozhodnutí ano/ne, ale že predikce je doplněna o jakési skóre vyjadřující zájem potenciálního klienta o kreditní kartu. Právě takovéto skóre (nebo váha klasifikace) je neocenitelné v marketingových aplikacích (viz křivka zdvihu v kapitole o evaluaci). Pro experimenty byla data rozdělena na část trénovací (75%) a testovací (25%). V první úloze bylo cílem predikovat, zda klient vlastní kartu. Ve skupině prvních 20% zájemců seřazených podle skóre bylo 52.2% držitelů kreditní karty. Pro druhou úlohu byla jako závislá veličina zvoleno to do jaké míry klient vlastní kartu. Tato míra je dána tím, jak moc kartu využívá, tedy hodnotou karty. V této druhé úloze bylo dosaženo jisté zlepšení; ve skupině prvních 20% zájemců seřazených podle skóre bylo 61.4% takto definovaných držitelů kreditní karty. Připomeňme na závěr popisu této úlohy, že náhodný výběr klientů bude obsahovat pouze 17% držitelů kreditní karty Vytvoření profilů skupin klientů Cílem této úlohy bylo nalézt skupiny klientů s podobným chováním a tyto skupiny následně charakterizovat. Jde tedy o to nalézt a popsat různé segmenty trhu. Základem pro analýzu se staly údaje o transakcích [Hotho, Meadche, 2000]. Podobně jako v předcházejících úlohách využívajících transakce velkou část práce představovalo předzpracování dat. Tentokrát se vyšlo z možných kombinací hodnot trans.k_symbol, trans.type, trans.operation. Ze 7*2*5=70 možných kombinací bylo v datech nalezeno 16. Těchto 16 atributů (dimenzí) bylo použito jako výchozí bod pro určování profilů klientů; každý klient byl charakterizován průměrnou částkou (danou počtem transakcí a celkovou částkou) pro každý atribut. Důležitost jednotlivých atributů v takto vzniklé databázi profilů byla posuzována statistickou metodou hlavních komponent. Jako nejvýznamnější se ukázaly atributy vklad v hotovosti a výběr v hotovosti. Pro hledání skupin klientů byla použita Kohonenova mapa (SOM) - tedy neuronová síť umožňující provádět shlukování objektů. Tímto algoritmem bylo nalezeno 5 shluků. Jeden se shluků vykazoval dobrou shodu s průměrným profilem všech klientů, jiný shluk měl vysoké hodnoty pro atribut ATTR13 = trans.k_symbol(důchod) trans.type(příjem) trans.operation(převod_z_účtu) (Obr. 3). 8

9 Obr. 3 Nalezené profily klientů Výsledek tvorby profilů byl použit jako zdroj dat pro tvorbu rozhodovacího stromu následně převedeného do podoby rozhodovacích pravidel. Cílem bylo nalézt charakteristiky jednotlivých skupin klientů. Tak např. shluk č. 3 odpovídá důchodcům kteří převádí vyšší částky do jiných bank (ATTR5 = trans.type(výdej) trans.operation(převod_na_účet) ): Rule #1 for Cluster 3 IF prum_castka_attr5(> 9945) prum_castka_attr13(> 0) THEN Cluster(3) (115, 0.983) Vyhodnocení výsledků Jednoduchá deskripce V případě jednoduché deskripce byla nalezená pravidla posuzována expertem. Ne vše, co bylo systémem nalezeno (a tedy co bylo významné ze statistického hlediska) považoval expert za zajímavé: Mezi zřejmé znalosti expert zařadil např. hypotézy 1 a 2 (viz Tab. 11), které říkají pouze to, že klient, který měl záporný zůstatek na účtu (platil sankční úrok), měl rovněž problémy se splácením úvěru. Poněkud zajímavější jsou dvojce hypotéz 3-4 a 6-7, a hypotéza 5. Tyto hypotézy lze interpretovat tak, že účty domácností (SIPO, více dispozičních práv) jsou spíše bezproblémové. Z pohledu použitého kvantifikátoru si můžeme všimnout, že např. dvojce hypotéz 3 a 4 vykazuje stejnou (významnou) vazbu ve smyslu Fisherova kvantifikátoru, ale z pohledu spolehlivosti implikace je podstatně významnější hypotéza 3. Nelze tedy skutečnost, že z účtu se neplatí SIPO považovat za indikaci toho, že úvěr nebude splácen (hypotéza 4). Hypotéza 10 nabízí jako kritérium spolehlivosti výši měsíčních splátek; menší úvěry (měsíční splátky do 2000) se zdají být bezproblémové. 9

10 Hypotéza 9 je při bližším zkoumání snadno vysvětlitelná, aby získal klient kreditní kartu, musí mít po určité období dostatečný zůstatek na účtu. To zdá se dává záruky i splácení úvěru. Hypotézy 8 a 11, ač poměrně silné, nedávají expertovi valný smysl. Mohou být dány způsobem přípravy vzorku dat poskytnutým pro analýzy. Výsledkem této analýzy tedy bude doporučení bedlivěji sledovat účty, které nesouvisí s domácností klienta a lépe prověřovat žádosti o úvěry s vyšší měsíční splátkou. Při použití vizualizačních nástrojů pro odhalování vztahů (zde mezi transakcemi a typem úvěru) je interpretace výsledků značně subjektivní. Pohledem na grafy se ale zdá, že bezproblémové úvěry se vztahují k účtům, u kterých je průměrný zůstatek vyšší než 40000, nebo u kterých minimální zůstatek neklesne pod nulu. Druhé uvedené zjištění odpovídá hypotézám 1 a 2 zjištěným metodou GUHA. Znalost odvozená v prvním případě se zdá být zajímavější Podpora zavádění kreditních karet Podobně jako v případě jednoduché deskripce nepovažoval expert všechny nalezené znalosti za stejně zajímavé. Např. to, že klienti se zlatou kartou měli vyšší výběry souvisí i s různými limity výběru pro různé typy karet Vytvoření profilů skupin klientů Transakční data obvykle nesou podstatně více informací než data socio-demografická. I v tomto případě segmentace byly nalezeny zajímavé (a interpretovatelné) skupiny klientů na základě transakcí a nikoliv na základě socio-demografických charakteristik. Problémem je však značný objem transakčních dat a s tím související problémy se zpracováním (a předzpracováním). Investované úsilí se ale vyplatí Využití výsledků V případě podpory zavádění kreditních karet bylo navrženo použít klasifikační skóre pro direct mail. Práh skóre lze pak volit tak aby se optimalizovaly náklady na poštovné. V případě návštěvy nějakého klienta s vysokým skóre mu může banka nabídnout příslušný typ karty. Zajímavé by jistě bylo i zpřístupnění klasifikačního modelu na webu tak, aby potenciální klient sám mohl ověřit zda splňuje podmínky pro získání karty. Ke zlepšení vytvořených modelů bylo navrženo vzít do úvahy i používané předpisy pro přidělování karet. Segmentace klientů provedená pomocí Kohonenovy mapy je rovněž užitečná pro marketing. Propagace jednotlivých typů produktů může být prováděna podstatně cíleněji a tím i efektivněji. 10

11 9.2 Obecné zkušenosti Zkušenosti z reálných komerčních aplikací patří k žárlivě střeženým tajemstvím příslušných firem. Aby měli i odborníci zabývající se vývojem celého oboru KDD možnost nakouknout pod pokličku reálným úlohám, bývají zpřístupňována (reálná nebo simulovaná) data z řady aplikačních oblastí pro provádění analýz na nekomerční bázi. V posledních letech se analýzy takovýchto dat prezentují na řadě mezinárodních konferencí věnovaných dobývání znalostí z databází. Uveďme zde např. tzv. KDD Cup pořádaný v rámci (amerických) konferencí KDD, nebo různé Discovery Challenge konané v rámci konferencí evropských 5 (PKDD) nebo asijských (PAKDD). Společně řešené úlohy a následné diskuze ukazují, jaké jsou klíčové předpoklady úspěchu použití metod dobývání znalostí z databází v praxi [Berka, 2001]: metodologie pro standardizaci procesu dobývání znalostí Metodologie učiní proces KDD srozumitelným a reprodukovatelným. Umožní rovněž přenesení úspěšných postupů a řešení z jedné aplikační oblasti do jiné, i sdílení zkušeností mezi odborníky zabývajícími se touto problematikou. Příkladem může být metodologie CRISP-DM. spolupráce s experty z dané aplikační oblasti Podobně jako v případě expertních systémů, i při dobývání znalostí hraje expert z dané aplikační oblasti (a expert na data) důležitou roli. Jeho spolupráce je klíčová jak v úvodních krocích (porozumění dané problematice a porozumění datům), tak pro evaluaci a využití znalostí. dokonalejší metody předzpracování Algoritmy pro předzpracování a transformace dat (diskretizace a seskupování hodnot, ošetření chybějících hodnot, vytváření nových atributů) obvykle pracují nezávisle na aplikační oblasti. Zdá se, že využití doménových znalostí může výrazně zvýšit efektivnost těchto metod. algoritmy schopné zpracovávat složitější data Většina algoritmů používaných pro modelování, pracuje s jedinou datovou tabulkou tvořenou záznamy s pevnou strukturou. V reálných aplikacích se ale setkáváme s podstatně složitějšími typy dat: vzájemně provázané relace, časová data, prostorová data, texty, strukturovaná data. Řada činností v kroku předzpracování jde tedy na vrub nedokonalým nástrojům pro modelování. Přestože tato oblast je předmětem intenzivního výzkumu (viz např. metody ILP), do běžně používaných systémů pro dobývání znalostí se dosažené výsledky zatím příliš nepromítly. Interpretace výsledků srozumitelná expertovi Rozhodujícím kritériem pro úspěch nějaké reálné aplikace KDD je akceptování výsledků experty a potenciálními uživateli. To nejlepší řešení je bezcenné, pokud nebude používáno. Experti nejsou ochotni probírat se stovkami a stovkami pravidel, ani je nezajímají tabulky ukazující zlepšení jednoho klasifikátoru vůči jinému o 1.13%. Co je zajímá, je vhled do nalezených znalostí, nebo silná a slabá místa naučeného klasifikátoru. Jako důležité se tedy jeví následné zpracování výsledků a jejich vizualizace. 5 Výše analyzovaná data z bankovní oblasti pocházejí právě z Discovery Challenge na PKDD 99 a PKDD

12 Literatura: [Berka, 2001] Berka,P. Data Mining Contests in Europe. IPSJ Magazine Vol 42 No 5, 2001, [Berka, 1999] Berka,P. (editor): Workshop Notes on Discovery Challenge. University of Economics, Prague, 1999 [Coufal a kol, 1999]: Coufal,D. Holeňa,M. Sochorová,A.: Coping with disovery challenge by GUHA. In [Berka, 1999]. [Hotho, Meadche, 2000] Hotho,A. Meadche,A.: Efficient Discovery of Client Profiles from a Financial Database. In [Siebes, Berka, 2000]. [Mikšovský a kol, 1999] Mikšovský,P. Železný,F. Štěpánková,O. Pěchouček,M.: Financial data challenge. In [Berka, 1999]. [Putten, 1999] Putten P.van der: Promoting Credit Card Usage by Mining Transaction Data. In [Berka, 1999]. [Siebes, Berka, 2000] Siebes,A. Berka,P. (editors): Discovery Challenge. University Lyon,

Ing. Petr Hájek, Ph.D. Podpora přednášky kurzu Aplikace umělé inteligence

Ing. Petr Hájek, Ph.D. Podpora přednášky kurzu Aplikace umělé inteligence APLIKACE UMĚLÉ INTELIGENCE Ing. Petr Hájek, Ph.D. Podpora přednášky kurzu Aplikace umělé inteligence Aplikace umělé inteligence - seminář ING. PETR HÁJEK, PH.D. ÚSTAV SYSTÉMOVÉHO INŽENÝRSTVÍ A INFORMATIKY

Více

Segmentace bankovních zákazníků algoritmem k- means

Segmentace bankovních zákazníků algoritmem k- means Segmentace bankovních zákazníků algoritmem k- means LS 2014/2015 Michal Heřmanský xherm22 Obsah 1 Úvod... 3 1.1 CRISP- DM... 3 2 Porozumění problematice a datům... 4 3 Příprava dat... 5 4 Modelování...

Více

ZÍSKÁVÁNÍ ZNALOSTÍ Z DATABÁZÍ

ZÍSKÁVÁNÍ ZNALOSTÍ Z DATABÁZÍ metodický list č. 1 Dobývání znalostí z databází Cílem tohoto tematického celku je vysvětlení základních pojmů z oblasti dobývání znalostí z databází i východisek dobývání znalostí z databází inspirovaných

Více

Úvod do dobývání. znalostí z databází

Úvod do dobývání. znalostí z databází POROZUMĚNÍ 4iz260 Úvod do DZD Úvod do dobývání DOMÉNOVÉ OBLASTI znalostí z databází VYUŽITÍ VÝSLEDKŮ POROZUMĚNÍ DATŮM DATA VYHODNO- CENÍ VÝSLEDKŮ MODELOVÁNÍ (ANALYTICKÉ PROCEDURY) PŘÍPRAVA DAT Ukázka slidů

Více

ZÍSKÁVÁNÍ ZNALOSTÍ Z DATABÁZÍ

ZÍSKÁVÁNÍ ZNALOSTÍ Z DATABÁZÍ Metodický list č. 1 Dobývání znalostí z databází Cílem tohoto tematického celku je vysvětlení základních pojmů z oblasti dobývání znalostí z databází i východisek dobývání znalostí z databází inspirovaných

Více

znalostí z databází- mnohostranná interpretace dat

znalostí z databází- mnohostranná interpretace dat Dobývání znalostí z databází- mnohostranná interpretace dat Petr Berka VŠE Praha berka@vse vse.cz Dobývání znalostí z databází Non-trivial process of identifying valid, novel, potentially useful and ultimately

Více

Analytické procedury v systému LISp-Miner

Analytické procedury v systému LISp-Miner Dobývání znalostí z databází MI-KDD ZS 2011 Přednáška 8 Analytické procedury v systému LISp-Miner Část II. (c) 2011 Ing. M. Šimůnek, Ph.D. KIZI, Fakulta informatiky a statistiky, VŠE Praha Evropský sociální

Více

Obsah. Seznam obrázků. Seznam tabulek. Petr Berka, 2011

Obsah. Seznam obrázků. Seznam tabulek. Petr Berka, 2011 Petr Berka, 2011 Obsah... 1... 1 1 Obsah 1... 1 Dobývání znalostí z databází 1 Dobývání znalostí z databází O dobývání znalostí z databází (Knowledge Discovery in Databases, KDD) se začíná ve vědeckých

Více

Získávání dat z databází 1 DMINA 2010

Získávání dat z databází 1 DMINA 2010 Získávání dat z databází 1 DMINA 2010 Získávání dat z databází Motto Kde je moudrost? Ztracena ve znalostech. Kde jsou znalosti? Ztraceny v informacích. Kde jsou informace? Ztraceny v datech. Kde jsou

Více

Katedra kybernetiky laboratoř Inteligentní Datové Analýzy (IDA) Katedra počítačů, Computational Intelligence Group

Katedra kybernetiky laboratoř Inteligentní Datové Analýzy (IDA) Katedra počítačů, Computational Intelligence Group Vytěžování dat Miroslav Čepek, Filip Železný Katedra kybernetiky laboratoř Inteligentní Datové Analýzy (IDA) Katedra počítačů, Computational Intelligence Group Evropský sociální fond Praha & EU: Investujeme

Více

Získávání znalostí z dat

Získávání znalostí z dat Získávání znalostí z dat Informační a komunikační technologie ve zdravotnictví Získávání znalostí z dat Definice: proces netriviálního získávání implicitní, dříve neznámé a potencionálně užitečné informace

Více

Jana Vránová, 3. lékařská fakulta UK

Jana Vránová, 3. lékařská fakulta UK Jana Vránová, 3. lékařská fakulta UK Vznikají při zkoumání vztahů kvalitativních resp. diskrétních znaků Jedná se o analogii s korelační analýzou spojitých znaků Přitom předpokládáme, že každý prvek populace

Více

1. Dobývání znalostí z databází

1. Dobývání znalostí z databází 1. Dobývání znalostí z databází O dobývání znalostí z databází (Knowledge Discovery in Databases, KDD) se začíná ve vědeckých kruzích mluvit počátkem 90. let. První impuls přišel z Ameriky, kde se na konferencích

Více

DOBÝVÁNÍ ZNALOSTÍ Z DATABÁZÍ

DOBÝVÁNÍ ZNALOSTÍ Z DATABÁZÍ DOBÝVÁNÍ ZNALOSTÍ Z DATABÁZÍ Úvod a oblasti aplikací Martin Plchút plchut@e-globals.net DEFINICE A POJMY Netriviální extrakce implicitních, ch, dříve d neznámých a potenciáln lně užitečných informací z

Více

Sazebník bankovních poplatků mbank

Sazebník bankovních poplatků mbank Sazebník bankovních poplatků mbank - již nenabízené produkty Platný od 1. 9. 2016 mbank.cz 222 111 999 Obsah 1. Kreditní karty... 2 2. Kreditní karty... 2 3. Povolené přečerpání... 3 4. Hotovostní úvěr

Více

Firemní program Domino

Firemní program Domino Firemní program Domino pro zaměstnance společnosti SPŠ Mladá Boleslav Prezentace FP Domino BĚŽNÝ ÚČET V KČ Srovnání nabídky kont Perfekt Konto Extra Konto Premium Konto Měsíční kreditní obrat > 10 000

Více

Sazebník bankovních poplatků

Sazebník bankovních poplatků Sazebník bankovních poplatků PLATNÝ OD 15. 3. 2012 www.mbank.cz I. Osobní účet mkonto 1. Zřízení, vedení a zrušení účtu a) Zřízení osobního účtu mkonto b) Vedení osobního účtu mkonto c) Zrušení osobního

Více

METODY DOLOVÁNÍ V DATECH DATOVÉ SKLADY TEREZA HYNČICOVÁ H2IGE1

METODY DOLOVÁNÍ V DATECH DATOVÉ SKLADY TEREZA HYNČICOVÁ H2IGE1 METODY DOLOVÁNÍ V DATECH DATOVÉ SKLADY TEREZA HYNČICOVÁ H2IGE1 DOLOVÁNÍ V DATECH (DATA MINING) OBJEVUJE SE JIŽ OD 60. LET 20. ST. S ROZVOJEM POČÍTAČOVÉ TECHNIKY DEFINICE PROCES VÝBĚRU, PROHLEDÁVÁNÍ A MODELOVÁNÍ

Více

Profilování vzorků heroinu s využitím vícerozměrné statistické analýzy

Profilování vzorků heroinu s využitím vícerozměrné statistické analýzy Profilování vzorků heroinu s využitím vícerozměrné statistické analýzy Autor práce : RNDr. Ivo Beroun,CSc. Vedoucí práce: prof. RNDr. Milan Meloun, DrSc. PROFILOVÁNÍ Profilování = klasifikace a rozlišování

Více

aktivita A0705 Metodická a faktografická příprava řešení regionálních disparit ve fyzické dostupnosti bydlení v ČR

aktivita A0705 Metodická a faktografická příprava řešení regionálních disparit ve fyzické dostupnosti bydlení v ČR aktivita A0705 Metodická a faktografická příprava řešení regionálních disparit ve fyzické dostupnosti bydlení v ČR 1 aktivita A0705 Metodická a faktografická příprava řešení regionálních disparit ve fyzické

Více

Dolování z textu. Martin Vítek

Dolování z textu. Martin Vítek Dolování z textu Martin Vítek Proč dolovat z textu Obrovské množství materiálu v nestrukturované textové podobě knihy časopisy vědeckéčlánky sborníky konferencí internetové diskuse Proč dolovat z textu

Více

Předzpracování dat. Lenka Vysloužilová

Předzpracování dat. Lenka Vysloužilová Předzpracování dat Lenka Vysloužilová 1 Metodika CRISP-DM (www.crisp-dm.org) Příprava dat Data Preparation příprava dat pro modelování selekce příznaků výběr relevantních příznaků čištění dat získávání

Více

Credit scoring. Libor Vajbar Analytik řízení rizik. 18. dubna 2013. Brno

Credit scoring. Libor Vajbar Analytik řízení rizik. 18. dubna 2013. Brno Credit scoring Libor Vajbar Analytik řízení rizik 18. dubna 2013 Brno 1 PROFIL SPOLEČNOSTI Home Credit a.s. přední poskytovatel spotřebitelského financování Úvěrové produkty nákup na splátky u obchodních

Více

Pravděpodobně skoro správné. PAC učení 1

Pravděpodobně skoro správné. PAC učení 1 Pravděpodobně skoro správné (PAC) učení PAC učení 1 Výpočetní teorie strojového učení Věta o ošklivém kačátku. Nechť E je klasifikovaná trénovací množina pro koncept K, který tvoří podmnožinu konečného

Více

Sazebník. bankovních poplatků mbank. Platný od 1. 11. 2012.

Sazebník. bankovních poplatků mbank. Platný od 1. 11. 2012. Sazebník bankovních poplatků mbank Platný od 1. 11. 2012. Obsah I. Osobní účet mkonto 2 II. Spořicí účet emax / emax plus 2 III. Termínovaný vkladový účet mvklad 3 IV. Platební karty 3 V. Kreditní karty

Více

Dobývání a vizualizace znalostí

Dobývání a vizualizace znalostí Dobývání a vizualizace znalostí Olga Štěpánková et al. 1 Osnova předmětu 1. Dobývání znalostí - popis a metodika procesu a objasnění základních pojmů 2. Nástroje pro modelování klasifikovaných dat a jejich

Více

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze Dobývání znalostí Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze Dobývání znalostí Bayesovské modely Doc. RNDr. Iveta Mrázová, CSc.

Více

Pro zvládnutí této kapitoly budete potřebovat 4-5 hodin studia.

Pro zvládnutí této kapitoly budete potřebovat 4-5 hodin studia. Úvod (Proč se zabývat statistikou?) Statistika je metoda analýzy dat, která nachází široké uplatnění v celé řadě ekonomických, technických, přírodovědných a humanitních disciplín. Její význam v poslední

Více

ANALÝZA NÁKUPNÍHO KOŠÍKU SEMINÁŘ

ANALÝZA NÁKUPNÍHO KOŠÍKU SEMINÁŘ ANALÝZA NÁKUPNÍHO KOŠÍKU SEMINÁŘ 18.11.2012 Radim Tvardek, Petr Bulava, Daniel Mašek U&SLUNO a.s. I Sadová 28 I 702 00 Ostrava I Czech Republic PŘEDPOKLADY PRO ANALÝZU NÁKUPNÍHO KOŠÍKU 18.11.2012 Daniel

Více

Systém elektronického bankovnictví GEMINI 5. Napojení na účetní systémy popis exportních / importních souborů. Verze 1.1

Systém elektronického bankovnictví GEMINI 5. Napojení na účetní systémy popis exportních / importních souborů. Verze 1.1 Systém elektronického bankovnictví GEMINI 5 Napojení na účetní systémy popis exportních / importních souborů Verze 1.1 1. Obecné Systém elektronického bankovnictví Gemini obsahuje funkce pro předávání

Více

Obsah Úvod Kapitola 1 Než začneme Kapitola 2 Práce s hromadnými daty před analýzou

Obsah Úvod Kapitola 1 Než začneme Kapitola 2 Práce s hromadnými daty před analýzou Úvod.................................................................. 11 Kapitola 1 Než začneme.................................................................. 17 1.1 Logika kvantitativního výzkumu...........................................

Více

Moderní systémy pro získávání znalostí z informací a dat

Moderní systémy pro získávání znalostí z informací a dat Moderní systémy pro získávání znalostí z informací a dat Jan Žižka IBA Institut biostatistiky a analýz PřF & LF, Masarykova universita Kamenice 126/3, 625 00 Brno Email: zizka@iba.muni.cz Bioinformatika:

Více

Ceník České spořitelny, a.s., pro bankovní obchody (dále jen Ceník)

Ceník České spořitelny, a.s., pro bankovní obchody (dále jen Ceník) Ceník České spořitelny, a.s., pro bankovní obchody (dále jen Ceník) Část Obsah: 1. Chytrá karta České spořitelny, Penzijní karta České spořitelny**) 2. Další typy karet 3. Volitelné pojištění k mezinárodním

Více

Pracovní celky 3.2, 3.3 a 3.4 Sémantická harmonizace - Srovnání a přiřazení datových modelů

Pracovní celky 3.2, 3.3 a 3.4 Sémantická harmonizace - Srovnání a přiřazení datových modelů Pracovní celky 3.2, 3.3 a 3.4 Sémantická harmonizace - Srovnání a datových modelů Obsah Seznam tabulek... 1 Seznam obrázků... 1 1 Úvod... 2 2 Metody sémantické harmonizace... 2 3 Dvojjazyčné katalogy objektů

Více

MODERNÍ METODY SEGMENTACE ZÁKAZNÍKŮ Ing. Miloš Uldrich ZÁKAZNICKÁ LOAJALITA A AKVIZICE VE FINANČNÍCH SLUŽBÁCH. StatSoft CR

MODERNÍ METODY SEGMENTACE ZÁKAZNÍKŮ Ing. Miloš Uldrich ZÁKAZNICKÁ LOAJALITA A AKVIZICE VE FINANČNÍCH SLUŽBÁCH. StatSoft CR Váš pomocník pro analýzu dat MODERNÍ METODY SEGMENTACE ZÁKAZNÍKŮ Ing. Miloš Uldrich StatSoft CR StatSoft StatSoft CR Dodavatel komplexních analytických řešení Výhradní dodavatel softwaru STATISTICA pro

Více

Ceník České spořitelny, a.s., pro bankovní obchody (dále jen Ceník)

Ceník České spořitelny, a.s., pro bankovní obchody (dále jen Ceník) Ceník, a.s., pro bankovní obchody (dále jen Ceník) Část Obsah: 1. Kreditní karty 2. Další typy karet 3. Volitelné pojištění k mezinárodním kartám 4. Ostatní služby ke kartám 1. Kreditní karty 1.1. Sjednání,

Více

Manuál pro majitele Korporátní karty. Manuál pro majitele Korporátní karty

Manuál pro majitele Korporátní karty. Manuál pro majitele Korporátní karty Manuál pro majitele Korporátní karty Obsah příručky 1 MojeBanka Business...3 1.1 Přihlášení do aplikace MojeBanka Business...3 1.2 Elektronické výpisy v sekci evýpisy...3 1.3 Výpisy v sekci Výpisy transakcí...4

Více

Profitabilita klienta v kontextu Performance management

Profitabilita klienta v kontextu Performance management IBM Technical specialist team Pre Sale 26/10/2010 Profitabilita klienta v kontextu Performance management Co všechno řadíme do PM? Automatická data Běžný reporting Pokročilé statistické modely Včera What

Více

PSY117/454 Statistická analýza dat v psychologii přednáška 8. Statistické usuzování, odhady

PSY117/454 Statistická analýza dat v psychologii přednáška 8. Statistické usuzování, odhady PSY117/454 Statistická analýza dat v psychologii přednáška 8 Statistické usuzování, odhady Výběr od deskripce k indukci Deskripce dat, odhad parametrů Usuzování = inference = indukce Počítá se s náhodným

Více

Sazebník. bankovních poplatků mbank. Platný od

Sazebník. bankovních poplatků mbank. Platný od Sazebník bankovních poplatků mbank Platný od 15. 12. 2012. Obsah I. Osobní účet mkonto... 2 II. Spořicí účet emax / emax plus... 3 III. Terminovaný vkladový účet mvklad... 4 IV. Platební karty... 5 V.

Více

Sazebník bankovních poplatků pro podnikatele

Sazebník bankovních poplatků pro podnikatele Sazebník bankovních poplatků pro podnikatele PLATNÝ OD 15. 3. 2012 www.mbank.cz I. Podnikatelský účet mbusiness Konto 1. Zřízení, vedení a zrušení účtu a) Zřízení účtu mbusiness Konto b) Vedení účtu mbusiness

Více

ZMĚNY V SAZEBNÍKU ČSOB

ZMĚNY V SAZEBNÍKU ČSOB ZMĚNY V SAZEBNÍKU ČSOB S ÚČINNOSTÍ OD 1. 4. 2015 Vážená klientko, vážený kliente, od 1. dubna budeme mít nový Sazebník pro fyzické osoby - občany, a proto bychom vás chtěli seznámit se všemi chystanými

Více

Úvodem Dříve les než stromy 3 Operace s maticemi

Úvodem Dříve les než stromy 3 Operace s maticemi Obsah 1 Úvodem 13 2 Dříve les než stromy 17 2.1 Nejednoznačnost terminologie 17 2.2 Volba metody analýzy dat 23 2.3 Přehled vybraných vícerozměrných metod 25 2.3.1 Metoda hlavních komponent 26 2.3.2 Faktorová

Více

Big Data a oficiální statistika. Unicorn College Open 24. dubna 2015 Doc. Ing. Marie Bohatá, CSc.

Big Data a oficiální statistika. Unicorn College Open 24. dubna 2015 Doc. Ing. Marie Bohatá, CSc. Big Data a oficiální statistika Unicorn College Open 24. dubna 2015 Doc. Ing. Marie Bohatá, CSc. Obsah příspěvku Charakteristiky Big Data Výzvy a úskalí z perspektivy statistiky Výzvy z perspektivy computing

Více

Ceník pro úsek Privátní bankovnictví Fyzické osoby občané

Ceník pro úsek Privátní bankovnictví Fyzické osoby občané Ceník pro úsek Privátní bankovnictví Fyzické osoby občané platný od 15. 5. 2019 1. SAZEBNÍK POPLATKŮ Korunový běžný účet Modré konto Modré konto je poskytováno pro fyzické osoby a fyzické osoby podnikatele.

Více

Informační systémy 2006/2007

Informační systémy 2006/2007 13 Vysoká škola báňská Technická univerzita Ostrava Fakulta strojní, Katedra automatizační techniky a řízení Informační systémy 2006/2007 Ivan Kedroň 1 Obsah Analytické nástroje SQL serveru. OLAP analýza

Více

Sazebník České spořitelny, a.s., pro bankovní obchody (dále jen Sazebník) část: IV. Kartové služby

Sazebník České spořitelny, a.s., pro bankovní obchody (dále jen Sazebník) část: IV. Kartové služby Sazebník České spořitelny, a.s., pro bankovní obchody (dále jen Sazebník) část: 1. Vydání/používání karty 2. Úvěry poskytované prostřednictvím kreditních a charge karet 3. Vyrobení náhradní karty 4. Omezení

Více

Ceník pro Podnikatelské konto České spořitelny

Ceník pro Podnikatelské konto České spořitelny Ceník pro Podnikatelské konto České spořitelny 1. Služby k Podnikatelskému kontu Basic České spořitelny 2. Úrokové sazby 3. Výpisy 4. Obecné položky 5. Zřízení a zrušení Podnikatelského konta Klasik České

Více

Ceník České spořitelny, a.s., pro bankovní obchody (dále jen Ceník)

Ceník České spořitelny, a.s., pro bankovní obchody (dále jen Ceník) Ceník České spořitelny, a.s., pro bankovní obchody (dále jen Ceník) Část Obsah: 1. Chytrá karta České spořitelny 2. Další typy karet 3. Volitelné pojištění k mezinárodním kartám 4. Ostatní služby ke kartám

Více

Sazebník. bankovních poplatků mbank

Sazebník. bankovních poplatků mbank Sazebník bankovních poplatků mbank Platný od 01. 07. 2013 Obsah I. Osobní účet mkonto... 2 II. Spořicí účet emax... 3 III. Spořicí účet emax Plus... 3 IV. Termínovaný vkladový účet mvklad... 3 V. Podnikatelský

Více

Ceník pro Podnikatelské konto České spořitelny

Ceník pro Podnikatelské konto České spořitelny Ceník pro Podnikatelské konto České spořitelny 1. Služby k Podnikatelskému kontu Basic České spořitelny 2. Úrokové sazby 3. Výpisy 4. Obecné položky 5. Zřízení a zrušení Podnikatelského konta Klasik České

Více

Ceník České spořitelny, a.s., pro bankovní obchody (dále jen Ceník)

Ceník České spořitelny, a.s., pro bankovní obchody (dále jen Ceník) Ceník České spořitelny, a.s., pro bankovní obchody (dále jen Ceník) Část Obsah: 1. Kreditní karty České spořitelny 2. Debetní karty 3. Předplacené karty 4. Ceny za transakce 5. Ostatní služby ke kartám

Více

Vysoká škola báňská technická univerzita Ostrava. Fakulta elektrotechniky a informatiky

Vysoká škola báňská technická univerzita Ostrava. Fakulta elektrotechniky a informatiky Vysoká škola báňská technická univerzita Ostrava Fakulta elektrotechniky a informatiky Bankovní účty (semestrální projekt statistika) Tomáš Hejret (hej124) 18.5.2013 Úvod Cílem tohoto projektu, zadaného

Více

InsideBusiness Payments CEE

InsideBusiness Payments CEE InsideBusiness Payments CEE Referenční příručka k novému vzhledu Přístupová cesta do střední a východní Evropy InsideBusiness Payments CEE Potřebujete pohodlný a bezproblémový přístup k úplné nabídce služeb

Více

podnikatelských koncepcí, objasnit přístupy sektoru finančních služeb k trhu a

podnikatelských koncepcí, objasnit přístupy sektoru finančních služeb k trhu a Metodický list pro první soustředění kombinovaného studia ------------------------------------------------------------------------------------- Název tematického celku: MARKETINGOVÉ ŘÍZENÍ. KLIENT. Cíl:

Více

mlinka: Sazebník bankovních poplatků maximum výhod a pohodlí

mlinka: Sazebník bankovních poplatků maximum výhod a pohodlí www.mbank.cz : 844 777 000 Sazebník bankovních poplatků maximum výhod a pohodlí Sazebník bankovních poplatků mbank platný od 15. 9. 2008 I. Osobní účet mkonto 1. Zřízení, vedení a zrušení účtu a) zřízení

Více

Tabulka 1 Rizikové online zážitky v závislosti na místě přístupu k internetu N M SD Min Max. Přístup ve vlastním pokoji 10804 1,61 1,61 0,00 5,00

Tabulka 1 Rizikové online zážitky v závislosti na místě přístupu k internetu N M SD Min Max. Přístup ve vlastním pokoji 10804 1,61 1,61 0,00 5,00 Seminární úkol č. 4 Autoři: Klára Čapková (406803), Markéta Peschková (414906) Zdroj dat: EU Kids Online Survey Popis dat Analyzovaná data pocházejí z výzkumu online chování dětí z 25 evropských zemí.

Více

Vkladové služby bank. Bc. Alena Kozubová

Vkladové služby bank. Bc. Alena Kozubová Vkladové služby bank Bc. Alena Kozubová Vkladové služby Banky získávájí peněžní prostředky od vkladatelů tj. fyzických nebo právnických osob. Banky s těmito peněžními prostředky dále podnikají. Klient

Více

Tabulka 1. Výběr z datové tabulky

Tabulka 1. Výběr z datové tabulky 1. Zadání domácího úkolu Vyberte si datový soubor obsahující alespoň jednu kvalitativní a jednu kvantitativní proměnnou s alespoň 30 statistickými jednotkami (alespoň 30 jednotlivých údajů). Zdroje dat

Více

Kapitola 2: Entitně-vztahový model (Entity-Relationship model) Množiny entit (entitní množiny) Atributy

Kapitola 2: Entitně-vztahový model (Entity-Relationship model) Množiny entit (entitní množiny) Atributy - 2.1 - Kapitola 2: Entitně-vztahový model (Entity-Relationship model) Množiny entit Množiny vztahů Otázky návrhu Plánování mezí Klíče E-R diagram Rozšířené E-R rysy Návrh E-R databázového schématu Redukce

Více

Výukový materiál zpracován v rámci projektu EU peníze školám

Výukový materiál zpracován v rámci projektu EU peníze školám Výukový materiál zpracován v rámci projektu EU peníze školám Registrační číslo projektu CZ. 1.07/1.5.00/34.0996 Číslo materiálu Název školy Jméno autora Tématická oblast Předmět Ročník VY_32_INOVACE_EKO149

Více

Zaujalo nás. Říjen 07. Otevírací doba obchodních míst

Zaujalo nás. Říjen 07. Otevírací doba obchodních míst Informační bulletin společnosti Scott & Rose Říjen 07 Bulletin je předmětem autorských práv. Bez předchozího písemného souhlasu společnosti Scott & Rose je zakázána jakákoli další publikace, přetisk nebo

Více

Ceník pro úsek Privátní bankovnictví - depozitní produkty a služby Právnické osoby

Ceník pro úsek Privátní bankovnictví - depozitní produkty a služby Právnické osoby Ceník pro úsek Privátní bankovnictví - depozitní produkty a služby Právnické osoby platný od 1. 1. 2019 1. SAZEBNÍK POPLATKŮ KORUNOVÝ BĚŽNÝ ÚČET MODRÉ KONTO Modré konto je poskytováno pro fyzické osoby

Více

Ceník České spořitelny, a.s., pro bankovní obchody (dále jen Ceník)

Ceník České spořitelny, a.s., pro bankovní obchody (dále jen Ceník) Ceník, a.s., pro bankovní obchody (dále jen Ceník) Část Obsah: 1. Kreditní karty 2. Další typy karet 3. Volitelné pojištění k mezinárodním kartám 4. Ostatní služby ke kartám 1. Kreditní karty 1.1. Sjednání,

Více

Sazebník poplatků. Aktivně nenabízené produkty a služby. PODNIKATELÉ A MALÉ FIRMY s obratem do 25 mil. Kč

Sazebník poplatků. Aktivně nenabízené produkty a služby. PODNIKATELÉ A MALÉ FIRMY s obratem do 25 mil. Kč Sazebník poplatků Aktivně nenabízené produkty a služby PODNIKATELÉ A MALÉ FIRMY s obratem do 25 mil. Kč Platný od 1. 12. 2018 Obsah 1. Každodenní bankovnictví 02 1.1 Běžné účty 02 1.2 Speciální účty 04

Více

PODNIKATELÉ A MALÉ FIRMY

PODNIKATELÉ A MALÉ FIRMY Sazebník poplatků Aktivně nenabízené produkty a služby PODNIKATELÉ A MALÉ FIRMY s obratem do 25 mil. Kč Účinný od 5. 2. 2015 Obsah 1. Každodenní bankovnictví 02 1.1 Běžné účty 02 1.2 Speciální účty 04

Více

Sjednání/změna úvěrového limitu ke kreditní kartě VISA Infinite. Vedení a používání 1. karty VISA Infinite měsíčně zdarma

Sjednání/změna úvěrového limitu ke kreditní kartě VISA Infinite. Vedení a používání 1. karty VISA Infinite měsíčně zdarma CENÍK ERSTE PREMIER infolinka 956 777 569 www.erstepremier.cz Strana 1/4 Karta Visa Infinite 1. Vydání a používání karty 2. Služby ke kartě Visa Infinite 3. Ceny za transakce 4. Úroková sazba pro Visa

Více

Dobývání a vizualizace znalostí. Olga Štěpánková et al.

Dobývání a vizualizace znalostí. Olga Štěpánková et al. Dobývání a vizualizace znalostí Olga Štěpánková et al. 1 Osnova předmětu Dobývání znalostí - popis a metodika procesu CRISP a objasnění základních pojmů Nástroje pro modelování klasifikovaných dat a jejich

Více

Ceník pro úsek Privátní bankovnictví - depozitní produkty a služby Právnické osoby

Ceník pro úsek Privátní bankovnictví - depozitní produkty a služby Právnické osoby Ceník pro úsek Privátní bankovnictví - depozitní produkty a služby Právnické osoby platný od 16. 1. 2019 1. SAZEBNÍK POPLATKŮ KORUNOVÝ BĚŽNÝ ÚČET MODRÉ KONTO Modré konto je poskytováno pro fyzické osoby

Více

Ceník pro úsek Privátní bankovnictví. - depozitní produkty a služby. Právnické osoby

Ceník pro úsek Privátní bankovnictví. - depozitní produkty a služby. Právnické osoby Ceník pro úsek Privátní bankovnictví - depozitní produkty a služby Právnické osoby platný od 20. 2. 2019 1. SAZEBNÍK POPLATKŮ Korunový běžný účet Modré konto Modré konto je poskytováno klientům úseku Privátní

Více

Avíza ve formátu MT942

Avíza ve formátu MT942 Avíza ve formátu MT942 Člen skupiny KBC Účelem dokumentu je popsat strukturu a použití formátu MT942 pro avíza o pohybech na účtu dostupná ve službě ČSOB CEB. Formát je odvozen od SWIFT formátu pro tzv.

Více

2 Zpracování naměřených dat. 2.1 Gaussův zákon chyb. 2.2 Náhodná veličina a její rozdělení

2 Zpracování naměřených dat. 2.1 Gaussův zákon chyb. 2.2 Náhodná veličina a její rozdělení 2 Zpracování naměřených dat Důležitou součástí každé experimentální práce je statistické zpracování naměřených dat. V této krátké kapitole se budeme věnovat určení intervalů spolehlivosti získaných výsledků

Více

Zápočtová práce STATISTIKA I

Zápočtová práce STATISTIKA I Zápočtová práce STATISTIKA I Obsah: - úvodní stránka - charakteristika dat (původ dat, důvod zpracování,...) - výpis naměřených hodnot (v tabulce) - zpracování dat (buď bodové nebo intervalové, podle charakteru

Více

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica JEDNOVÝBĚROVÉ TESTY Komentované řešení pomocí programu Statistica Vstupní data Data umístěná v excelovském souboru překopírujeme do tabulky ve Statistice a pojmenujeme proměnné, viz prezentace k tématu

Více

Algoritmy a struktury neuropočítačů ASN - P10. Aplikace UNS v biomedicíně

Algoritmy a struktury neuropočítačů ASN - P10. Aplikace UNS v biomedicíně Aplikace UNS v biomedicíně aplikace v medicíně postup při zpracování úloh Aplikace UNS v medicíně Důvod: nalezení exaktnějších, levnějších a snadnějších metod určování diagnóz pro lékaře nalezení šetrnějších

Více

analýza kategoriáln lních dat Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat Epidemiologické ukazatele

analýza kategoriáln lních dat Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat Epidemiologické ukazatele Testování statistických hypotéz z a analýza kategoriáln lních dat Prof. RNDr. Jana Zvárová, DrSc. 1 Záznam epidemiologických dat Rizikový faktor Populace Přítomen Nepřítomen Celkem Nemocní a b a+b Kontroly

Více

Hodnocení efektivnosti programů podpory malého a středního podnikání na základě realizace projektů podpořených

Hodnocení efektivnosti programů podpory malého a středního podnikání na základě realizace projektů podpořených Příloha č. 2 Hodnocení efektivnosti programů podpory malého a středního podnikání na základě realizace projektů podpořených Českomoravskou záruční a rozvojovou bankou Skutečné efekty podpor z roku 2003

Více

Hotovostní a bezhotovostní platby

Hotovostní a bezhotovostní platby Hotovostní a bezhotovostní platby Hotovostní platby Platební styk = soustava různých forem a způsobů placení, které zprostředkují pohyb peněz v národním hospodářství Platby z ruky do ruky - například v

Více

Příprava dat v softwaru Statistica

Příprava dat v softwaru Statistica Příprava dat v softwaru Statistica Software Statistica obsahuje pokročilé nástroje pro přípravu dat a tvorbu nových proměnných. Tyto funkcionality přinášejí značnou úsporu času při přípravě datového souboru,

Více

veličin, deskriptivní statistika Ing. Michael Rost, Ph.D.

veličin, deskriptivní statistika Ing. Michael Rost, Ph.D. Vybraná rozdělení spojitých náhodných veličin, deskriptivní statistika Ing. Michael Rost, Ph.D. Třídění Základním zpracováním dat je jejich třídění. Jde o uspořádání získaných dat, kde volba třídícího

Více

Ceník pro úsek Korporátní bankovnictví. - depozitní produkty a služby. Právnické osoby

Ceník pro úsek Korporátní bankovnictví. - depozitní produkty a služby. Právnické osoby Ceník pro úsek Korporátní bankovnictví - depozitní produkty a služby Právnické osoby platný od 15. 5. 2019 1. SAZEBNÍK POPLATKŮ 1.1. BĚŽNÉ A VKLADOVÉ ÚČTY Zřízení účtu Vedení účtu v CZK Vedení účtu v EUR,

Více

Cíle supervizovaného učení Ondřej Háva

Cíle supervizovaného učení Ondřej Háva Cíle supervizovaného učení Ondřej Háva ACREA CR Využíváme více než 40 let zkušeností IBM s hlavním cílem: řízení rozhodovacích procesů Akvizice SPSS společností IBM v říjnu 2009 Přejmenování SPSS CR na

Více

NÁHODNÁ ČÍSLA. F(x) = 1 pro x 1. Náhodná čísla lze generovat některým z následujících generátorů náhodných čísel:

NÁHODNÁ ČÍSLA. F(x) = 1 pro x 1. Náhodná čísla lze generovat některým z následujících generátorů náhodných čísel: NÁHODNÁ ČÍSLA TYPY GENERÁTORŮ, LINEÁRNÍ KONGRUENČNÍ GENERÁTORY, TESTY NÁHODNOSTI, VYUŽITÍ HODNOT NÁHODNÝCH VELIČIN V SIMULACI CO JE TO NÁHODNÉ ČÍSLO? Náhodné číslo definujeme jako nezávislé hodnoty z rovnoměrného

Více

Základní cena měsíčně 100 Kč. Cena pro klienty, kterým chodí na Účet starobní důchod měsíčně 50 Kč. Odměna za využívání Účtu měsíčně 50 Kč

Základní cena měsíčně 100 Kč. Cena pro klienty, kterým chodí na Účet starobní důchod měsíčně 50 Kč. Odměna za využívání Účtu měsíčně 50 Kč Služba Moje zdravé finance infolinka 800 207 207 www.csas.cz Strana 1/5 Ceník pro službu Moje zdravé finance 1. Služba Moje zdravé finance Základní cena měsíčně Cena pro klienty, kterým chodí na Účet starobní

Více

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1 Logistická regrese Menu: QCExpert Regrese Logistická Modul Logistická regrese umožňuje analýzu dat, kdy odezva je binární, nebo frekvenční veličina vyjádřená hodnotami 0 nebo 1, případně poměry v intervalu

Více

mlinka: Sazebník bankovních poplatků maximum výhod a pohodlí

mlinka: Sazebník bankovních poplatků maximum výhod a pohodlí www.mbank.cz : 844 777 000 Sazebník bankovních poplatků maximum výhod a pohodlí Sazebník bankovních poplatků mbank platný od 14. 7. 2008 I. Osobní účet mkonto 1. Zřízení, vedení a zrušení účtu a) zřízení

Více

bankovních produktů produktů: Nemateriální (nehmotný) charakter Dualismus Vzájemná propojenost a podmíněnost cross selling

bankovních produktů produktů: Nemateriální (nehmotný) charakter Dualismus Vzájemná propojenost a podmíněnost cross selling Charakteristika a členění bankovních produktů Obecná charakteristika bankovních produktů: Nemateriální (nehmotný) charakter Dualismus Vzájemná propojenost a podmíněnost cross selling 1 Členění produktů

Více

Problémové domény a jejich charakteristiky

Problémové domény a jejich charakteristiky Milan Mišovič (ČVUT FIT) Pokročilé informační systémy MI-PIS, 2011, Přednáška 02 1/16 Problémové domény a jejich charakteristiky Prof. RNDr. Milan Mišovič, CSc. Katedra softwarového inženýrství Fakulta

Více

Dolování asociačních pravidel

Dolování asociačních pravidel Dolování asociačních pravidel Miloš Trávníček UIFS FIT VUT v Brně Obsah přednášky 1. Proces získávání znalostí 2. Asociační pravidla 3. Dolování asociačních pravidel 4. Algoritmy pro dolování asociačních

Více

Sazebník - účty Pro občany, platný od

Sazebník - účty Pro občany, platný od Sazebník - účty Pro občany, platný od 13.12.2014 Běžný účet CZK/EUR/USD Měsíční vedení účtu v CZK při aktivním využívání služeb Equa bank při neaktivním využívání služeb Equa bank Měsíční vedení účtu v

Více

Statistická analýza dat v psychologii. Věci, které můžeme přímo pozorovat, jsou téměř vždy pouze vzorky. Alfred North Whitehead

Statistická analýza dat v psychologii. Věci, které můžeme přímo pozorovat, jsou téměř vždy pouze vzorky. Alfred North Whitehead PSY117/454 Statistická analýza dat v psychologii Přednáška 8 Statistické usuzování, odhady Věci, které můžeme přímo pozorovat, jsou téměř vždy pouze vzorky. Alfred North Whitehead Barevná srdíčka kolegyně

Více

Chudoba v ČR: kritika ukazatelů a evropský kontext. Martina Mysíková, Jiří Večerník KONFERENCE ČSS PRAHA

Chudoba v ČR: kritika ukazatelů a evropský kontext. Martina Mysíková, Jiří Večerník KONFERENCE ČSS PRAHA Chudoba v ČR: kritika ukazatelů a evropský kontext Martina Mysíková, Jiří Večerník KONFERENCE ČSS PRAHA 1.-3.2.2017 2 Data EU-SILC (European Union-Statistics on Income and Living Conditions) V ČR ho provádí

Více

Epidemiologické ukazatele. lních dat. analýza kategoriáln. Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat. a I E

Epidemiologické ukazatele. lních dat. analýza kategoriáln. Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat. a I E Testování statistických hypotéz z a analýza kategoriáln lních dat Prof. RNDr. Jana Zvárová, DrSc. Epidemiologické ukazatele Rizikový faktor Populace Přítomen Nepřítomen Celkem Nemocní a b a+b Kontroly

Více

Podnikatelské ekonto KOMPLET

Podnikatelské ekonto KOMPLET Dodatek k Ceníku produktů a služeb pro fyzické osoby podnikatele a právnické osoby Od 1. 11. 2012 banka nabízí nový cenový program pro fyzické osoby podnikatele a právnické osoby. V důsledku zavedení nového

Více

Sazebník bankovních poplatků mbank

Sazebník bankovních poplatků mbank Sazebník bankovních poplatků mbank platný od 11. 11. 2007 I Osobní účet mkonto 1. Zřízení, vedení a zrušení účtu a) zřízení osobního účtu mkonto b) vedení osobního účtu mkonto / měsíc c) zrušení osobního

Více

Získávání znalostí z databází. Alois Kužela

Získávání znalostí z databází. Alois Kužela Získávání znalostí z databází Alois Kužela Obsah související pojmy datové sklady, získávání znalostí asocianí pravidla 2/37 Úvod získávání znalostí z dat, dolování (z) dat, data mining proces netriviálního

Více

POPIS FORMÁTU VÝPISU MT940

POPIS FORMÁTU VÝPISU MT940 Multiash 3.2 MULTIASH 3.2 PPIS FRMÁTU VÝPISU MT940 Podpora služby Multiash Web: http://www.csas.cz/multicash Multiash 3.2 bsah pro Multicash...2 1.1. becné podmínky... 2 1.2. Záhlaví souboru... 2 1.3.

Více

OBCHODNÍ PODMÍNKY PRO RICHEE PRODUKTY JUNIOR

OBCHODNÍ PODMÍNKY PRO RICHEE PRODUKTY JUNIOR OBCHODNÍ PODMÍNKY PRO RICHEE PRODUKTY JUNIOR OBCHODNÍ PODMÍNKY BANKY CREDITAS a.s. PRO RICHEE PRODUKTY JUNIOR ÚČINNÉ OD 14. 9. 2019 OBSAH 1 ÚVODNÍ USTANOVENÍ 2 1.1 Úvod 2 1.2 Vymezení pojmů a výkladová

Více

Ceník České spořitelny, a.s., pro bankovní obchody (dále jen Ceník)

Ceník České spořitelny, a.s., pro bankovní obchody (dále jen Ceník) Ceník České spořitelny, a.s., pro bankovní obchody (dále jen Ceník) Část Obsah: 1. Chytrá karta České spořitelny 2. Další typy karet 3. Volitelné pojištění k mezinárodním kartám 4. Ostatní služby ke kartám

Více