hledání zajímavých asociací i korelací ve velkém množství dat původně pro transakční data obchodní transakce analýza nákupního košíku

Rozměr: px
Začít zobrazení ze stránky:

Download "hledání zajímavých asociací i korelací ve velkém množství dat původně pro transakční data obchodní transakce analýza nákupního košíku"

Transkript

1 Asociační pravidla

2 Asociační pravidla hledání zajímavých asociací i korelací ve velkém množství dat původně pro transakční data obchodní transakce analýza nákupního košíku podpora rozhodování

3 Analýza nákupního košíku MBA: Market Basket Analysis Analýza prodeje: Které položky jsou v košíku pohromadě? Výsledky: vyjádřené formou pravidel lze bezprostředně použít Použití: Plánování a rozvržení obchodu nabídka kupónu,omezení slev balení produktu

4 Asociační pravidla Jak spolu jednotlivé produkty navzájem souvisejí? asociační pravidla by měla být snadno pochopitelná je-li nějaký vztah nalezen, lze ho snadno ověřit použitelná obsahují užitečné informace, které mohou vést k dalším intervencím asociační pravidla by neměla být: triviální výsledky už stejně každý zná nevysvětlitelná neexistuje k nim žádné vysvětlení a nevedou k žádné akci

5 MBA jak se to dělá? Položka produkt nebo nabídka služeb Transakce obsahuje jednu nebo více položek Tabulka četností udává počet výskytu libovolných dvou položek v některé z provedených transakcí (tj. kolikrát byly tyto dva produkty zakoupeny najednou) hodnoty na diagonále odpovídají počtu transakcí obsahujících příslušnou položku

6 Příklad MBA Nákupní transakce Id Položky 1 pečivo, káva, minerálka 2 pečivo, sýr, minerálka 3 pečivo, sýr, máslo, káva 4 pečivo, máslo, sýr 5 pečivo, máslo, káva 6 pečivo, máslo, mléko 7 pečivo, káva, sušenky 8 káva, minerálka Tabulka četností pečivo minerálsýr máslo káva mléko suš. pečivo minerál sýr máslo káva mléko sušen pečivo, mléko 10 káva, minerálka, sušenky pečivo se kupuje často s máslem, sýrem a kávou káva se kupuje často s minerálkou a pečivem

7 MBA asociační pravidla Pravidlo IF Podmínka THEN Výsledek. Pravidlo_r IF Položka_i THEN Položka_j. Otázky Jak dobrá jsou nalezená asociační pravidla? podpora spolehlivost zlepšení Jak hledat asociační pravidla automaticky?

8 Podpora a spolehlivost Podpora jak často lze pravidlo použít Podpora ( Pravidlo_r ) Pocet transakcí obsahující Pocet všech transakcí ch i a j *100 % Spolehlivost jak moc se můžeme na výsledky pravidla spolehnout? Spolehlivo st ( Pravidlo_r ) Pocet transakcí Pocet transakcí obsahující ch i a obsahující ch i j *100 %

9 Zlepšení pravidla Zlepšení nakolik je lepší pravidlo při predikci použít než výsledek prostě předpokládat Zlepšení ( Pravidlo_r ) p( i _ a _ p( i) * p( j) j) je-li Zlepšení < 1 pravidlo při predikci je horší než náhodná volba negace výsledku může vést k lepšímu pravidlu IF podmínka THEN NOT výsledek

10 Hlavní kroky MBA zvolit odpovídající položky na adekvátní úrovni vytvořit pravidla na základe údajů z tabulky četností spočítat (podmíněné) pravděpodobnosti výskytu položek a jejich kombinací v transakcích omezit prohledávání prahovou hodnotou pro podporu určit nejlepší pravidla analýzou vypočtených pravděpodobností překonat omezení daná počtem položek a jejich kombinací v zajímavých transakcích

11 MBA analýza jasné a srozumitelné výsledky IF-THEN pravidla s bezprostředním použitím dobývání znalostí (bez požad. výstupu) důležité při zpracovávání velkého množství dat bez dalších apriorních znalostí zpracování dat s variabilní délkou snadné a srozumitelné výpočty Výpočetní nároky rostou exponenciálně s počtem položek!

12 Analýza log záznamu server prezentace studentů MFF (Ševčíková, Zoulek)

13 Asociační pravidla podobná klasifikačním pravidlům v důsledku pravidla muže být predikce jakéhokoliv atributu (i kombinace predikcí pro více atributu) Příklady: if teplota = chladno then vlhkost = normální if pohlaví = žena then tv_žánr = romantika if pohlaví = muž then tv_žánr = sport if mouka then máslo and vajíčka if kolo then helma if brusle then helma and chrániče klasifikační pravidla implikace znamená společný výskyt, nikoliv příčinu a důsledek!!!

14 Využití asociačních pravidel analýza nákupního košíku podpora marketingu, inzerování produktu umístění zboží regálech detekce chyb v telekomunikačních sítích analýza bankovních služeb kombinace nabízených produktů analýza služeb mobilních operátorů

15 Asociační pravidla Velké množství asociačních pravidel X => Y Bereme v úvahu ty, které pokrývají dostatečné množství instancí podpora (support) jsou dostatečně přesné - spolehlivost (confidence) Podpora - podíl těch instancí, které vyhovují pravidlu X Y oproti všem instancím (n) Spolehlivost - podíl těch instancí, které vyhovují pravidlu X Y oproti těm, na které se dá pravidlo aplikovat (X)

16 Příklad volitelné předměty Studentský výběr předmětů id Kombinace S1 ANK, ESV, LIS S2 ANK, SPJ, DEG S3 ANK, ESV, DEG S4 ANK, LIS S5 ANK, IVT S6 ANK, IVT, MAS S7 ANK, MAS,MPC S8 ANK, MAS, PRA S9 PRA, LIS, NEK S10 ANK, IVT,MPC Možné skupiny položek Skupiny Podpora ANK 90 % IVT 30 % ANK, DEG 20 % ANK, ESV 20 % ANK, MPC 10 % ANK, PRA 10 % ANK, SPJ 20 % ANK, LIS 20 % ANK, MAS 30 % ANK, IVT, MPC 10 % ANK, MAS, MPC 10 %

17 Triviální algoritmus Je dána množina transakcí, máme najít všechna relevantní pravidla tj. taková, že Hrubá síla: podpora prahová hodnota s p spolehlivost prahová hodnota c p 1. Nakombinujeme všechny dvojice, trojice, položek a zjistíme seznam všech možných pravidel 2. Určíme podporu a spolehlivost pro každé pravidlo 3. Vyloučíme irelevantní pravidla

18 Triviální algoritmus Transakční tabulka s booleovskými daty A B C D E t t t t t t t t t transakcí, 5 druhů zboží [1] B C => A (s=0.22 ; c= 0.5) [2] A B => E (s=0.22 ; c= 0.5) [3] B => E (s = 0.55 ; c = 0.71) [4] C => D (s = 0.67 ; c = 1) Pro prahové hodnoty: s p = 0.2 ; c p = 0.75 jsou zjištěná pravidla 1-3 irelevantní, 4 je relevantní

19 Možné kombinace pro 5 položek null 5 1 A B C D E 5 2 AB AC AD AE BC BD BE CD CE DE 5 3 ABC ABD ABE ACD ACE ADE BCD BCE BDE CDE 5 4 ABCD ABCE ABDE ACDE BCDE 5 5 ABCDE

20 Příklad s 5 položkami celkem 2 5 = 32 kombinací celkem 180 pravidel Počet pravidel R 3 d d k 1 1 j 1 2 d k d 1 1 d k d j k Výpočetně složité!!!

21 TID Položky 1 Chleba, Mléko 2 Chleba, Plenky, Pivo, Vejce 3 Mléko, Plenky, Pivo, Cola 4 Chleba, Mléko, Plenky, Pivo 5 Chleba, Mléko, Plenky, Cola Pozorování Dolování asociační pravidel Příklady pravidel {Mléko, Plenky} {Pivo} (s=0.4, c=0.67) {Mléko, Pivo} {Mléko} (s=0.4, c=1.0) {Plenky, Pivo} {Mléko} (s=0.4, c=0.67) {Pivo} {Mléko, Plenky} (s=0.4, c=0.67) {Plenky} {Mléko, Pivo} (s=0.4, c=0.5) {Mléko} {Plenky, Pivo} (s=0.4, c=0.5) položky všech uvedených pravidel jsou prvky téže množiny FIS: {Mléko, Plenky, Pivo} pravidla vycházející ze stejné množiny mají stejnou podporu, ale různou spolehlivost lze tedy oddělit požadavky na podporu a spolehlivost 21

22 Dolování asociačních pravidel vytvoření klasifikačního pravidla pro každý možný důsledek pravidla není efektivní dvoufázový postup: 1. hledání frekventovaných množin položek (frequent itemsets) 2. generování pravidel z frekventovaných množin položek

23 Frekventované množiny položek Frekventované množiny položek (frequent (large) itemsets) množiny položek, které mají větší podporu než prahová hodnota s p Dolování asociačních pravidel (upřesnění): 1. hledání frekventovaných množin položek 2. generování pravidel z frekventovaných množin položek

24 Frekventované množiny položek pro každé asociační pravidlo X => Y, musí platit, že X Y je frekventovaná množina položek platí: podmnožina každé frekventované množiny je frekventovaná množina nalézání frekventovaných množin položek jednoduché, časově náročné!!! pro m položek: 2 m-1 kandidátu Příklad: pro m = 30 počet kandidátu je

25 Faktory ovlivňující složitost Stanovení prahové podpory nižší hodnota vede k většímu počtu FIS vyšší počet kandidátů a větší množiny frek. položek Dimenze (počet položek) množiny dat nutnost většího prostoru pro ukládání výsledků delší výpočet a IO operace Velikost databáze Průměrná šířka (velikost) transakce transakční šířka se zvyšuje s vyšší hustotou datových množin to může zvýšit max. délku FIS a průchod hash stromem

26 Strategie generování FIS Redukce počtu kandidátů (M) úplné vyhledávání: M=2 d redukce M s použitím prořezávacích technik Redukce počtu transakcí (N) redukce velikosti N, pokud narůstá velikost množin položek použití DHP a vertikálně-založených dolovacích algoritmů Redukce počtu porovnání (NM) použití efektivních dat. struktur pro uložení kandidátů či transakcí není nutné porovnávat každého kandidáta vůči každé transakci

27 Redukce počtu kandidátů Apriori princip je-li množina položek frekventovaná množina položek (FIS), pak i její podmnožiny jsou FIS Apriori princip platí díky následující vlastnosti podpory X, Y : ( X Y ) s( X ) s( Y ) podpora množiny položek nikdy nepřekročí podporu jejích podmnožin tzv. antimonotónní vlastnost podpory

28 Příklad Apriori principu Jednoprvkové množiny Položka Počet Chleba 4 Cola 2 Mléko 4 Pivo 3 Plenky 4 Vejce 1 Minimální podpora FIS je 3 Dvojice Množina položek Počet Chleba, Mléko 3 Chleba, Pivo 2 Chleba, Plenky 3 Mléko, Pivo 3 Mléko, Plenky 2 Pivo, Plenky 3 Trojice Uvažujeme-li všechny kombinace, C 1 (6) + C 2 (6) + C 3 (6) = 41 Vynecháním 2 položek (redukce), = 11 Množina položek Počet Chleba, Mléko, Pivo 2

29 Apriori algoritmus nechť k=1 generuj množiny frekventovaných položek délky 1 opakuj, dokud už nelze určit žádnou FIS z množin frekventovaných položek obsahující k položek generuj množiny o velikosti (k+1) položek (kandidátní množiny na FIS) prořež kandidátní množiny položek obsahující podmnožiny velikosti k, které nejsou frekventované spočti podporu pro každou kandidátní množinu eliminuj kandidáty, které nepatří k často se vyskytujícím

30 Problémy Problémy získávání FIS Opakované procházení (prohledávání) transakční databáze Obrovský počet kandidátů Otravný výpočet podpory pro kandidáty Vylepšení Apriori: základní myšlenky Redukovat počet průchodů databází Zmenšit počet kandidátů Ulehčit výpočet podpory pro kandidáty

31 Kompaktní reprezentace FIS některé množiny položek jsou redundantní, neboť mají stejnou podporu jako jejich nadmnožiny TID A1 A2 A3 A4 A5 A6 A7 A8 A9 A10 B1 B2 B3 B4 B5 B6 B7 B8 B9 B10 C1 C2 C3 C4 C5 C6 C7 C8 C9 C Počet FIS Potřeba kompaktní reprezentace 3 10 k 1 10 k

32 Maximalní FIS Množina položek je maximální množina frekventovaných položek, pokud žádná její přímá nadmnožina není FIS null Maximální množina FIS A B C D E AB AC AD AE BC BD BE CD CE DE ABC ABD ABE ACD ACE ADE BCD BCE BDE CDE Množiny nefrekv. položek ABCD ABCE ABDE ACDE BCDE ABCD E Hranice

33 Uzavřená množina položek Množina položek je uzavřená, pokud žádná její přímá nadmnožina nemá stejnou podporu TID Položky 1 {A,B} 2 {B,C,D} 3 {A,B,C,D} 4 {A,B,D} 5 {A,B,C,D} MnožinyP Podpora {A} 4 {B} 5 {C} 3 {D} 4 {A,B} 4 {A,C} 2 {A,D} 3 {B,C} 3 {B,D} 4 {C,D} 3 MnožinyP Podpora {A,B,C} 2 {A,B,D} 3 {A,C,D} 2 {B,C,D} 3 {A,B,C,D} 2

34 Maximální versus uzavřené množiny položek null Transakční Ids TID Položky 1 ABC 2 ABCD 3 BCE 4 ACDE 5 DE A B C D E AB AC AD AE BC BD BE CD CE DE ABC ABD ABE ACD ACE ADE BCD BCE BDE CDE 2 4 ABCD ABCE ABDE ACDE BCDE Ne podporováno žádnou transakcí ABCDE

35 Maximální versus uzavřené FIS Minimální podpora = 2 null Uzavřené, ale ne maximální A B C D E Uzavřené a zároveň maximální AB AC AD AE BC BD BE CD CE DE ABC ABD ABE ACD ACE ADE BCD BCE BDE CDE 2 4 ABCD ABCE ABDE ACDE BCDE # Uzavřené = 9 # Maximální = 4 ABCDE

36 Maximální versus uzavřené FIS Frequent Itemsets Closed Frequent Itemsets Maximal Frequent Itemsets

37 Alternativní metoda pro generování FIS Reprezentace databáze Horizontal Data Layout TID Items 1 A,B,E 2 B,C,D 3 C,E 4 A,C,D 5 A,B,C,D 6 A,E 7 A,B 8 A,B,C 9 A,C,D 10 B horizontální versus vertikální data layout Vertical Data Layout A B C D E

38 ECLAT Uložení seznamu transakcí pro každou položku Horizontal Data Layout TID Items 1 A,B,E 2 B,C,D 3 C,E 4 A,C,D 5 A,B,C,D 6 A,E 7 A,B 8 A,B,C 9 A,C,D 10 B Vertical Data Layout A B C D E

39 ECLAT Určit podporu pro každou k-množinu položek průnikem seznamů TID dvou (k-1) podmnožin A B AB

40 FP-growth algoritmus využití zhuštěné reprezentace databáze využitím FP-stromů zkonstruuje se FP-strom a rekurzivně metodou rozděl-panuj se dolují FIS

41 FP-strom konstrukce Po přečtení TID=1: null TID Items 1 {A,B} 2 {B,C,D} 3 {A,C,D,E} 4 {A,D,E} 5 {A,B,C} 6 {A,B,C,D} 7 {B,C} 8 {A,B,C} 9 {A,B,D} 10 {B,C,E} Po přečtení TID=2: A:1 B:1 B:1 null A:1 B:1 C:1 D:1

42 FP-Tree konstrukce TID Items 1 {A,B} 2 {B,C,D} 3 {A,C,D,E} 4 {A,D,E} 5 {A,B,C} 6 {A,B,C,D} 7 {B,C} 8 {A,B,C} 9 {A,B,D} 10 {B,C,E} Transakční databáze B:5 A:7 C:1 null D:1 B:3 C:3 Header table Item A B C D E Pointer C:3 D:1 D:1 D:1 E:1 E:1 D:1 E:1

43 FP-growth D:1 C:3 B:5 A:7 D:1 null C:1 D:1 D:1 B:1 C:1 D:1 Podmíněný základ pro D: P = {(A:1,B:1,C:1), (A:1,B:1), (A:1,C:1), (A:1), (B:1,C:1)} Rekurzivně aplikuj FP-growth na P Nalezeny množiny FIS (podpora > 1): AD, BD, CD, ACD, BCD

44 Generování pravidel Nechť L je FIS. Najdi všechny neprázdné podmnožiny f L takové, že f => L f splňuje minimální požadavky spolehlivosti je-li {A,B,C,D} množina FIS, kandidátní pravidla jsou: ABC => D, ABD => C, ACD => B, BCD => A, A => BCD, B => ACD, C => ABD, D => ABC AB => CD, AC => BD, AD => BC, BC => AD, BD => AC, CD => AB, Pokud L = k, pak existuje 2 k 2 kandidátních asociačních pravidel (ignorujme L and L)

45 Generování pravidel Jak efektivně generovat pravidla z množin FIS? obecně, podpora nemusí mít antimonotónní vlastnost c(abc D) může být větší či menší než c(ab D) ale spolehlivost pravidle generovaných z téže množiny položek musí mít antimonotónní vlastnost tj. L = {A,B,C,D}: c(abc => D) c(ab => CD) c(a => BCD)

46 Generování pravidel Apriori algoritmem Low Confide nce Rule ABCD=>{ } BCD=>A ACD=>B ABD=>C ABC=>D CD=>AB BD=>AC BC=>AD AD=>BC AC=>BD AB=>CD Prořezávání pravidel D=>ABC C=>ABD B=>ACD A=>BCD

47 Generování pravidel Apriori algoritmem Kandidátní pravidla jsou generována sloučením dvou pravidel, které sdílení stejný prefix v důsledku pravidla spojení (CD=>AB,BD=>AC) vytvoří kandidátní pravidlo D => ABC CD=>AB BD=>AC prořež pravidlo D=>ABC pokud jeho podmnožina AD=>BC nemá vysokou spolehlivost D=>ABC

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze Dobývání znalostí Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze Dobývání znalostí Asociační pravidla Doc. RNDr. Iveta Mrázová, CSc.

Více

Dolování asociačních pravidel

Dolování asociačních pravidel Dolování asociačních pravidel Miloš Trávníček UIFS FIT VUT v Brně Obsah přednášky 1. Proces získávání znalostí 2. Asociační pravidla 3. Dolování asociačních pravidel 4. Algoritmy pro dolování asociačních

Více

Základy vytěžování dat

Základy vytěžování dat Základy vytěžování dat předmět A7Bb36vyd Vytěžování dat Filip Železný, Miroslav Čepek, Radomír Černoch, Jan Hrdlička katedra kybernetiky a katedra počítačů ČVUT v Praze, FEL Evropský sociální fond Praha

Více

Tvorba asociačních pravidel a hledání. položek

Tvorba asociačních pravidel a hledání. položek Tvorba asociačních pravidel a hledání častých skupin položek 1 Osnova Asociace Transakce Časté skupiny položek Apriori vlastnost podmnožin Asociační pravidla Aplikace 2 Asociace Nechť I je množina položek.

Více

Katedra kybernetiky skupina Inteligentní Datové Analýzy (IDA) 9. dubna 2009. Filip Železný (ČVUT) Vytěžování dat 9.

Katedra kybernetiky skupina Inteligentní Datové Analýzy (IDA) 9. dubna 2009. Filip Železný (ČVUT) Vytěžování dat 9. Vytěžování dat Filip Železný Katedra kybernetiky skupina Inteligentní Datové Analýzy (IDA) 9. dubna 2009 Filip Železný (ČVUT) Vytěžování dat 9. dubna 2009 1 / 22 Rozhodovací pravidla Strom lze převést

Více

Získávání znalostí z databází. Alois Kužela

Získávání znalostí z databází. Alois Kužela Získávání znalostí z databází Alois Kužela Obsah související pojmy datové sklady, získávání znalostí asocianí pravidla 2/37 Úvod získávání znalostí z dat, dolování (z) dat, data mining proces netriviálního

Více

Radim Navrátil. Robust 24. ledna 2018

Radim Navrátil. Robust 24. ledna 2018 Analýza nákupního košíku - historie a současnost Radim Navrátil Ústav matematiky a statistiky Přírodovědecká fakulta MU, Brno Robust 24. ledna 2018 Radim Navrátil (ÚMS Brno) Analýza nákupního košíku Robust

Více

Asociační i jiná. Pravidla. (Ch )

Asociační i jiná. Pravidla. (Ch ) Asociační i jiná Pravidla (Ch. 14 +...) Učení bez učitele Nemáme cílovou třídu Y, G; máme N pozorování což jsou p-dimenzionální vektory se sdruženou pravděpodobností chceme odvozovat vlastnosti. Pro málo

Více

Asociační pravidla. Informační a komunikační technologie ve zdravotnictví. Biomedical Data Processing G r o u p

Asociační pravidla. Informační a komunikační technologie ve zdravotnictví. Biomedical Data Processing G r o u p Asociační pravidla Informační a komunikační technologie ve zdravotnictví Definice pojmů Stavový prostor S je množina uzlů(stavů), kde cílem je najít stav splňující danou podmínku g. Formálně je problém

Více

Databázové systémy Tomáš Skopal

Databázové systémy Tomáš Skopal Databázové systémy Tomáš Skopal - relační model * funkční závislosti, odvozování * normální formy Osnova přednášky Armstrongova pravidla atributové a funkční uzávěry normální formy relačních schémat Armstrongova

Více

Ing. Petr Hájek, Ph.D. Podpora přednášky kurzu Aplikace umělé inteligence

Ing. Petr Hájek, Ph.D. Podpora přednášky kurzu Aplikace umělé inteligence APLIKACE UMĚLÉ INTELIGENCE Ing. Petr Hájek, Ph.D. Podpora přednášky kurzu Aplikace umělé inteligence Aplikace umělé inteligence - seminář ING. PETR HÁJEK, PH.D. ÚSTAV SYSTÉMOVÉHO INŽENÝRSTVÍ A INFORMATIKY

Více

Informační systémy pro podporu rozhodování

Informační systémy pro podporu rozhodování Informační systémy pro rozhodování Informační systémy pro podporu rozhodování 5 Jan Žižka, Naděžda Chalupová Ústav informatiky PEF Mendelova universita v Brně Asociační pravidla Asociační pravidla (sdružovací

Více

Národní informační středisko pro podporu jakosti

Národní informační středisko pro podporu jakosti Národní informační středisko pro podporu jakosti 1 Dílčí 2 k faktoriální návrhy RNDr. Jiří Michálek, CSc. 2 Poloviční 2 k faktoriální návrh 3 Obsahuje 2 k-1 pokusů (runů) Často je také nazýván 2 k-1 dílčí

Více

Kapitola 7: Návrh relačních databází. Nástrahy relačního návrhu. Příklad. Rozklad (dekompozice)

Kapitola 7: Návrh relačních databází. Nástrahy relačního návrhu. Příklad. Rozklad (dekompozice) - 7.1 - Kapitola 7: Návrh relačních databází Nástrahy návrhu relačních databází Dekompozice (rozklad) Normalizace použitím funkčních závislostí Nástrahy relačního návrhu Návrh relačních databází vyžaduje

Více

Kontingenční tabulky. (Analýza kategoriálních dat)

Kontingenční tabulky. (Analýza kategoriálních dat) Kontingenční tabulky (Analýza kategoriálních dat) Agenda Standardní analýzy dat v kontingenčních tabulkách úvod, KT, míry diverzity nominálních veličin, některá rozdělení chí kvadrát testy, analýza reziduí,

Více

ZÍSKÁVÁNÍ ZNALOSTÍ Z DATABÁZÍ

ZÍSKÁVÁNÍ ZNALOSTÍ Z DATABÁZÍ metodický list č. 1 Dobývání znalostí z databází Cílem tohoto tematického celku je vysvětlení základních pojmů z oblasti dobývání znalostí z databází i východisek dobývání znalostí z databází inspirovaných

Více

ANALÝZA NÁKUPNÍHO KOŠÍKU SEMINÁŘ

ANALÝZA NÁKUPNÍHO KOŠÍKU SEMINÁŘ ANALÝZA NÁKUPNÍHO KOŠÍKU SEMINÁŘ 18.11.2012 Radim Tvardek, Petr Bulava, Daniel Mašek U&SLUNO a.s. I Sadová 28 I 702 00 Ostrava I Czech Republic PŘEDPOKLADY PRO ANALÝZU NÁKUPNÍHO KOŠÍKU 18.11.2012 Daniel

Více

NORMALIZACE Část 2 1

NORMALIZACE Část 2 1 NORMALIZACE Část 2 1 Úprava relačního schématu databáze NORMALIZACE Eliminaci aktualizačních anomálií zajišťujeme převedením relačního schématu do 3NF, resp. BCNF. (Normalizovat lze pomocí) DEKOMPOZICE

Více

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze Dobývání znalostí Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze Dobývání znalostí Pravděpodobnost a učení Doc. RNDr. Iveta Mrázová,

Více

Moderní systémy pro získávání znalostí z informací a dat

Moderní systémy pro získávání znalostí z informací a dat Moderní systémy pro získávání znalostí z informací a dat Jan Žižka IBA Institut biostatistiky a analýz PřF & LF, Masarykova universita Kamenice 126/3, 625 00 Brno Email: zizka@iba.muni.cz Bioinformatika:

Více

Upozornění : barevné odstíny zobrazené na této stránce se mohou z důvodu možného zkreslení Vašeho monitoru lišit od fyzické dodávky.

Upozornění : barevné odstíny zobrazené na této stránce se mohou z důvodu možného zkreslení Vašeho monitoru lišit od fyzické dodávky. Upozornění : barevné odstíny zobrazené na této stránce se mohou z důvodu možného zkreslení Vašeho monitoru lišit od fyzické dodávky. ODSTÍN SKUPINA CENOVÁ SKUPINA ODRÁŽIVOST A10-A BRIGHT A 1 81 A10-B BRIGHT

Více

Vytěžování znalostí z dat

Vytěžování znalostí z dat Pavel Kordík, Jan Motl (ČVUT FIT) Vytěžování znalostí z dat BI-VZD, 2012, Přednáška 13 1/14 Vytěžování znalostí z dat Pavel Kordík, Jan Motl Department of Computer Systems Faculty of Information Technology

Více

Vyhledávání. doc. Mgr. Jiří Dvorský, Ph.D. Katedra informatiky Fakulta elektrotechniky a informatiky VŠB TU Ostrava. Prezentace ke dni 21.

Vyhledávání. doc. Mgr. Jiří Dvorský, Ph.D. Katedra informatiky Fakulta elektrotechniky a informatiky VŠB TU Ostrava. Prezentace ke dni 21. Vyhledávání doc. Mgr. Jiří Dvorský, Ph.D. Katedra informatiky Fakulta elektrotechniky a informatiky VŠB TU Ostrava Prezentace ke dni 21. září 2018 Jiří Dvorský (VŠB TUO) Vyhledávání 242 / 433 Osnova přednášky

Více

Projekt OPVK - CZ.1.07/1.1.00/26.0047 Matematika pro všechny. Univerzita Palackého v Olomouci

Projekt OPVK - CZ.1.07/1.1.00/26.0047 Matematika pro všechny. Univerzita Palackého v Olomouci Projekt OPVK - CZ.1.07/1.1.00/26.0047 Matematika pro všechny Univerzita Palackého v Olomouci Tematický okruh: Geometire Gradovaný řetězec úloh Téma: obsahy a obvody mnohoúhelníků, grafy funkcí s absolutní

Více

Katedra kybernetiky laboratoř Inteligentní Datové Analýzy (IDA) Katedra počítačů, Computational Intelligence Group

Katedra kybernetiky laboratoř Inteligentní Datové Analýzy (IDA) Katedra počítačů, Computational Intelligence Group Vytěžování dat Miroslav Čepek, Filip Železný Katedra kybernetiky laboratoř Inteligentní Datové Analýzy (IDA) Katedra počítačů, Computational Intelligence Group Evropský sociální fond Praha & EU: Investujeme

Více

Algoritmus pro hledání nejkratší cesty orientovaným grafem

Algoritmus pro hledání nejkratší cesty orientovaným grafem 1.1 Úvod Algoritmus pro hledání nejkratší cesty orientovaným grafem Naprogramoval jsem v Matlabu funkci, která dokáže určit nejkratší cestu v orientovaném grafu mezi libovolnými dvěma vrcholy. Nastudoval

Více

Kombinatorický předpis

Kombinatorický předpis Gravitace : Kombinatorický předpis Petr Neudek 1 Kombinatorický předpis Kombinatorický předpis je rozšířením Teorie pravděpodobnosti kapitola Kombinatorický strom. Její praktický význam je zřejmý právě

Více

Vyhledávání. doc. Mgr. Jiří Dvorský, Ph.D. Katedra informatiky Fakulta elektrotechniky a informatiky VŠB TU Ostrava. Prezentace ke dni 12.

Vyhledávání. doc. Mgr. Jiří Dvorský, Ph.D. Katedra informatiky Fakulta elektrotechniky a informatiky VŠB TU Ostrava. Prezentace ke dni 12. Vyhledávání doc. Mgr. Jiří Dvorský, Ph.D. Katedra informatiky Fakulta elektrotechniky a informatiky VŠB TU Ostrava Prezentace ke dni 12. září 2016 Jiří Dvorský (VŠB TUO) Vyhledávání 201 / 344 Osnova přednášky

Více

Úlohy domácí části I. kola kategorie C

Úlohy domácí části I. kola kategorie C 68. ročník Matematické olympiády Úlohy domácí části I. kola kategorie C 1. Neznámé číslo je dělitelné právě čtyřmi čísly z množiny {6, 15, 20, 21, 70}. Určete, kterými. (Michal Rolínek) Řešení. Pokud by

Více

IDS optimalizátor. Ing. Jan Musil, IBM ČR Community of Practice for

IDS optimalizátor. Ing. Jan Musil, IBM ČR Community of Practice for IDS optimalizátor Ing. Jan Musil, IBM ČR Community of Practice for CEEMEA Agenda Optimalizační plán dotazu Typy přístupových plánů Metody pro spojení tabulek Určení optimalizačního plánu Vyhodnocení přístupových

Více

Michal Burda. 27. ledna Abstrakt

Michal Burda. 27. ledna Abstrakt Získávání znalostí z databází - Asociační pravidla Michal Burda 27. ledna 2004 Abstrakt Získávání asociačních pravidel z dat je jedním z významných oborů Data Miningu. Hledají se pomocí něj zajímavé vztahy

Více

Kombinatorika, výpočty

Kombinatorika, výpočty Kombinatorika, výpočty Radek Pelánek IV122 Styl jednoduché výpočty s čísly vesměs spíše opakování + pár dílčích zajímavostí užitečný trénink programování Kombinace, permutace, variace Daná množina M s

Více

oddělení Inteligentní Datové Analýzy (IDA)

oddělení Inteligentní Datové Analýzy (IDA) Vytěžování dat Filip Železný Katedra počítačů oddělení Inteligentní Datové Analýzy (IDA) 22. září 2014 Filip Železný (ČVUT) Vytěžování dat 22. září 2014 1 / 25 Odhad rozdělení Úloha: Vstup: data D = {

Více

Základy umělé inteligence

Základy umělé inteligence Základy umělé inteligence Automatické řešení úloh Základy umělé inteligence - prohledávání. Vlasta Radová, ZČU, katedra kybernetiky 1 Formalizace úlohy UI chápe řešení úloh jako proces hledání řešení v

Více

ZÍSKÁVÁNÍ ZNALOSTÍ Z DATABÁZÍ

ZÍSKÁVÁNÍ ZNALOSTÍ Z DATABÁZÍ Metodický list č. 1 Dobývání znalostí z databází Cílem tohoto tematického celku je vysvětlení základních pojmů z oblasti dobývání znalostí z databází i východisek dobývání znalostí z databází inspirovaných

Více

METODY DOLOVÁNÍ V DATECH DATOVÉ SKLADY TEREZA HYNČICOVÁ H2IGE1

METODY DOLOVÁNÍ V DATECH DATOVÉ SKLADY TEREZA HYNČICOVÁ H2IGE1 METODY DOLOVÁNÍ V DATECH DATOVÉ SKLADY TEREZA HYNČICOVÁ H2IGE1 DOLOVÁNÍ V DATECH (DATA MINING) OBJEVUJE SE JIŽ OD 60. LET 20. ST. S ROZVOJEM POČÍTAČOVÉ TECHNIKY DEFINICE PROCES VÝBĚRU, PROHLEDÁVÁNÍ A MODELOVÁNÍ

Více

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze Dobývání znalostí Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze Dobývání znalostí Rozhodovací stromy Doc. RNDr. Iveta Mrázová, CSc.

Více

Zadání druhého zápočtového projektu Základy algoritmizace, 2005

Zadání druhého zápočtového projektu Základy algoritmizace, 2005 Zadání druhého zápočtového projektu Základy algoritmizace, 2005 Jiří Dvorský 2 května 2006 Obecné pokyny Celkem je k dispozici 8 zadání příkladů Každý student obdrží jedno zadání Vzhledem k tomu, že odpadly

Více

UDBS Cvičení 10 Funkční závislosti

UDBS Cvičení 10 Funkční závislosti UDBS Cvičení 10 Funkční závislosti Ing. Miroslav Valečko Zimní semestr 2014/2015 25. 11. 2014 Návrh schématu databáze Existuje mnoho způsobů, jak navrhnout schéma databáze Některá jsou lepší, jiná zase

Více

Algoritmy a datové struktury

Algoritmy a datové struktury Algoritmy a datové struktury Stromy 1 / 32 Obsah přednášky Pole a seznamy Stromy Procházení stromů Binární stromy Procházení BS Binární vyhledávací stromy 2 / 32 Pole Hledání v poli metodou půlení intervalu

Více

1. Převeďte dané číslo do dvojkové, osmičkové a šestnáctkové soustavy: a) 759 10 b) 2578 10

1. Převeďte dané číslo do dvojkové, osmičkové a šestnáctkové soustavy: a) 759 10 b) 2578 10 Úlohy- 2.cvičení 1. Převeďte dané číslo do dvojkové, osmičkové a šestnáctkové soustavy: a) 759 10 b) 2578 10 2. Převeďte dané desetinné číslo do dvojkové soustavy (DEC -> BIN): a) 0,8125 10 b) 0,35 10

Více

Datové struktury 2: Rozptylovací tabulky

Datové struktury 2: Rozptylovací tabulky Datové struktury 2: Rozptylovací tabulky prof. Ing. Pavel Tvrdík CSc. Katedra počítačových systémů Fakulta informačních technologií České vysoké učení technické v Praze c Pavel Tvrdík, 2010 Efektivní algoritmy

Více

Konstrukce relace. Postupně konstruujeme na množině všech stavů Q relace i,

Konstrukce relace. Postupně konstruujeme na množině všech stavů Q relace i, [161014-1204 ] 11 2.1.35 Konstrukce relace. Postupně konstruujeme na množině všech stavů Q relace i, kde i = 0, 1,..., takto: p 0 q právě tehdy, když bud p, q F nebo p, q F. Dokud i+1 i konstruujeme p

Více

Algoritmizace Dynamické programování. Jiří Vyskočil, Marko Genyg-Berezovskyj 2010

Algoritmizace Dynamické programování. Jiří Vyskočil, Marko Genyg-Berezovskyj 2010 Dynamické programování Jiří Vyskočil, Marko Genyg-Berezovskyj 2010 Rozděl a panuj (divide-and-conquer) Rozděl (Divide): Rozděl problém na několik podproblémů tak, aby tyto podproblémy odpovídaly původnímu

Více

Tvorba asociačních pravidel a hledání častých skupin položek

Tvorba asociačních pravidel a hledání častých skupin položek Tvorba asociačních pravidel a hledání častých skupin položek 1 Osnova Asociace a transakce Časté skupiny položek Apriori vlastnost podmnožin Asociační pravidla Aplikace 2 Příklad transakcí TID Products

Více

Stromy. Strom: souvislý graf bez kružnic využití: počítačová grafika seznam objektů efektivní vyhledávání výpočetní stromy rozhodovací stromy

Stromy. Strom: souvislý graf bez kružnic využití: počítačová grafika seznam objektů efektivní vyhledávání výpočetní stromy rozhodovací stromy Stromy úvod Stromy Strom: souvislý graf bez kružnic využití: počítačová grafika seznam objektů efektivní vyhledávání výpočetní stromy rozhodovací stromy Neorientovaný strom Orientovaný strom Kořenový orientovaný

Více

Algoritmy pro shlukování prostorových dat

Algoritmy pro shlukování prostorových dat Algoritmy pro shlukování prostorových dat Marta Žambochová Katedra matematiky a informatiky Fakulta sociálně ekonomická Univerzita J. E. Purkyně v Ústí nad Labem ROBUST 21. 26. leden 2018 Rybník - Hostouň

Více

Prolog PROgramming in LOGic část predikátové logiky prvního řádu rozvoj začíná po roce 1970 Robert Kowalski teoretické základy Alain Colmerauer, David

Prolog PROgramming in LOGic část predikátové logiky prvního řádu rozvoj začíná po roce 1970 Robert Kowalski teoretické základy Alain Colmerauer, David Úvod do Prologu Prolog PROgramming in LOGic část predikátové logiky prvního řádu rozvoj začíná po roce 1970 Robert Kowalski teoretické základy Alain Colmerauer, David Warren (Warren Abstract Machine) implementace

Více

12. Globální metody MI-PAA

12. Globální metody MI-PAA Jan Schmidt 2011 Katedra číslicového návrhu Fakulta informačních technologií České vysoké učení technické v Praze Zimní semestr 2011/12 MI-PAA EVROPSKÝ SOCIÁLNÍ FOND PRAHA & EU: INVESTUJENE DO VAŠÍ BUDOUCNOSTI

Více

Úvod do dobývání. znalostí z databází

Úvod do dobývání. znalostí z databází POROZUMĚNÍ 4iz260 Úvod do DZD Úvod do dobývání DOMÉNOVÉ OBLASTI znalostí z databází VYUŽITÍ VÝSLEDKŮ POROZUMĚNÍ DATŮM DATA VYHODNO- CENÍ VÝSLEDKŮ MODELOVÁNÍ (ANALYTICKÉ PROCEDURY) PŘÍPRAVA DAT Ukázka slidů

Více

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY DOLOVÁNÍ ASOCIAČNÍCH PRAVIDEL ASSOCIATION RULES MINING

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY DOLOVÁNÍ ASOCIAČNÍCH PRAVIDEL ASSOCIATION RULES MINING VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY FAKULTA INFORMAČNÍCH TECHNOLOGIÍ ÚSTAV INFORMAČNÍCH SYSTÉMŮ FACULTY OF INFORMATION TECHNOLOGY DEPARTMENT OF INFORMATION SYSTEMS DOLOVÁNÍ ASOCIAČNÍCH

Více

Dolování v objektových datech. Ivana Rudolfová

Dolování v objektových datech. Ivana Rudolfová Dolování v objektových datech Ivana Rudolfová Relační databáze - nevýhody První normální forma neumožňuje vyjádřit vztahy A je podtypem B nebo vytvořit struktury typu pole nebo množiny SQL omezení omezený

Více

Úloha ve stavovém prostoru SP je <s 0, C>, kde s 0 je počáteční stav C je množina požadovaných cílových stavů

Úloha ve stavovém prostoru SP je <s 0, C>, kde s 0 je počáteční stav C je množina požadovaných cílových stavů Stavový prostor a jeho prohledávání SP = formalismus k obecnějšímu uchopení a vymezení problému, který spočívá v nalezení posloupnosti akcí vedoucích od počátečního stavu úlohy (zadání) k požadovanému

Více

Řešení: PŘENESVĚŽ (N, A, B, C) = přenes N disků z A na B pomocí C

Řešení: PŘENESVĚŽ (N, A, B, C) = přenes N disků z A na B pomocí C Hanojské věže - 3 kolíky A, B, C - na A je N disků různé velikosti, seřazené od největšího (dole) k nejmenšímu (nahoře) - kolíky B a C jsou prázdné - úkol: přenést všechny disky z A na B, mohou se odkládat

Více

SII - Informatika. 1. Atribut relace, jehož hodnota jednoznačně určuje prvek v jiné relaci, se nazývá:

SII - Informatika. 1. Atribut relace, jehož hodnota jednoznačně určuje prvek v jiné relaci, se nazývá: SII - Informatika Způsob vyhodnocení: Při vyhodnocení budou za nesprávné odpovědi strhnuty body. 1. Atribut relace, jehož hodnota jednoznačně určuje prvek v jiné relaci, se nazývá: a) sekundární klíč b)

Více

Algoritmy výpočetní geometrie

Algoritmy výpočetní geometrie Algoritmy výpočetní geometrie prof. Ing. Pavel Tvrdík CSc. Katedra počítačových systémů Fakulta informačních technologií České vysoké učení technické v Praze c Pavel Tvrdík, 2010 Efektivní algoritmy (BI-EFA)

Více

Národní informační středisko pro podporu jakosti

Národní informační středisko pro podporu jakosti Národní informační středisko pro podporu jakosti 1 ANALÝZA ROZPTYLU a její využití při vyhodnocování experimentálních dat Eva Jarošová, VŠE Praha 2 Obsah Podstata metody, jednofaktorová ANOVA F-test Mnohonásobná

Více

DATA MINING KLASIFIKACE DMINA LS 2009/2010

DATA MINING KLASIFIKACE DMINA LS 2009/2010 DATA MINING KLASIFIKACE DMINA LS 2009/2010 Osnova co je to klasifikace typy klasifikátoru typy výstupu jednoduchý klasifikátor (1R) rozhodovací stromy Klasifikace (ohodnocení) zařazuje data do předdefinovaných

Více

1. Implementace funkce počet vrcholů. Předmět: Algoritmizace praktické aplikace (3ALGA)

1. Implementace funkce počet vrcholů. Předmět: Algoritmizace praktické aplikace (3ALGA) Předmět: Algoritmizace praktické aplikace (3ALGA) Vytvořil: Jan Brzeska Zadání: Vytvoření funkcí na stromech (reprezentace stromu směrníky). Zadané funkce: 1. Počet vrcholů 2. Počet listů 3. Součet 4.

Více

Automatická detekce anomálií při geofyzikálním průzkumu. Lenka Kosková Třísková NTI TUL Doktorandský seminář, 8. 6. 2011

Automatická detekce anomálií při geofyzikálním průzkumu. Lenka Kosková Třísková NTI TUL Doktorandský seminář, 8. 6. 2011 Automatická detekce anomálií při geofyzikálním průzkumu Lenka Kosková Třísková NTI TUL Doktorandský seminář, 8. 6. 2011 Cíle doktorandské práce Seminář 10. 11. 2010 Najít, implementovat, ověřit a do praxe

Více

Jednoznačné a nejednoznačné gramatiky

Jednoznačné a nejednoznačné gramatiky BI-AAG (2011/2012) J. Holub: 11. Bezkontextové gramatiky p. 2/36 Jednoznačné a nejednoznačné gramatiky BI-AAG (2011/2012) J. Holub: 11. Bezkontextové gramatiky p. 4/36 Automaty a gramatiky(bi-aag) 11.

Více

Analýza dat z otevřených zdrojů

Analýza dat z otevřených zdrojů Analýza dat z otevřených zdrojů Iveta Mrázová katedra teoretické informatiky a matematické logiky matematicko-fyzikální fakulta Univerzita Karlova v Praze Data z otevřených zdrojů -motivace Obrovské množství

Více

Relační datový model. Integritní omezení. Normální formy Návrh IS. funkční závislosti multizávislosti inkluzní závislosti

Relační datový model. Integritní omezení. Normální formy Návrh IS. funkční závislosti multizávislosti inkluzní závislosti Relační datový model Integritní omezení funkční závislosti multizávislosti inkluzní závislosti Normální formy Návrh IS Funkční závislosti funkční závislost elementární redundantní redukovaná částečná pokrytí

Více

Matematická olympiáda ročník (1998/1999) Komentáře k úlohám druhého kola pro kategorie Z5 až Z7. Zadání úloh Z5 II 1

Matematická olympiáda ročník (1998/1999) Komentáře k úlohám druhého kola pro kategorie Z5 až Z7. Zadání úloh Z5 II 1 1 of 9 20. 1. 2014 12:05 Matematická olympiáda - 48. ročník (1998/1999) Komentáře k úlohám druhého kola pro kategorie Z5 až Z7 Zadání úloh Z5 II 1 Do prostředního kroužku je možné zapsat pouze čísla 8

Více

Grafové algoritmy. Programovací techniky

Grafové algoritmy. Programovací techniky Grafové algoritmy Programovací techniky Grafy Úvod - Terminologie Graf je datová struktura, skládá se z množiny vrcholů V a množiny hran mezi vrcholy E Počet vrcholů a hran musí být konečný a nesmí být

Více

Dynamické programování

Dynamické programování Dynamické programování prof. Ing. Pavel Tvrdík CSc. Katedra počítačových systémů Fakulta informačních technologií České vysoké učení technické v Praze c Pavel Tvrdík, 2010 Efektivní algoritmy (BI-EFA)

Více

Vyhodnocování dotazů slajdy k přednášce NDBI001. Jaroslav Pokorný MFF UK, Praha

Vyhodnocování dotazů slajdy k přednášce NDBI001. Jaroslav Pokorný MFF UK, Praha Vyhodnocování dotazů slajdy k přednášce NDBI001 Jaroslav Pokorný MFF UK, Praha pokorny@ksi.mff.cuni.cz Časová a prostorová složitost Jako dlouho trvá dotaz? CPU (cena je malá; snižuje se; těžko odhadnutelná)

Více

Návody k domácí části I. kola kategorie C

Návody k domácí části I. kola kategorie C Návody k domácí části I. kola kategorie C 1. Dokažte, že pro libovolné reálné číslo a platí nerovnost Určete, kdy nastane rovnost. a 2 + 1 a 2 a + 1 a + 1. 1. Dokažte, že pro libovolná reálná čísla x,

Více

Evoluční algoritmy. Podmínka zastavení počet iterací kvalita nejlepšího jedince v populaci změna kvality nejlepšího jedince mezi iteracemi

Evoluční algoritmy. Podmínka zastavení počet iterací kvalita nejlepšího jedince v populaci změna kvality nejlepšího jedince mezi iteracemi Evoluční algoritmy Použítí evoluční principů, založených na metodách optimalizace funkcí a umělé inteligenci, pro hledání řešení nějaké úlohy. Populace množina jedinců, potenciálních řešení Fitness function

Více

Rozhodování v podnikatelství za podpory fuzzy logiky a neuronových sítí

Rozhodování v podnikatelství za podpory fuzzy logiky a neuronových sítí Rozhodování v podnikatelství za podpory fuzzy logiky a neuronových sítí Dostál Petr Vysoké učení technické v Brně Mezinárodní letní škola SoftProcessing SoftCop reg. č. CZ.1.07/2.3.00/20.0072 Fuzzy logika

Více

Pravidlové systémy. Klasifikační pravidla. Asociační pravidla.

Pravidlové systémy. Klasifikační pravidla. Asociační pravidla. Pravidlové systémy. Klasifikační pravidla. Asociační pravidla. Petr Pošík Czech Technical University in Prague Faculty of Electrical Engineering Dept. of Cybernetics Klasifikační pravidla 2 Agenda............................................................................................................

Více

Časté podsekvence, epizodální pravidla. Katedra kybernetiky, FEL, ČVUT v Praze.

Časté podsekvence, epizodální pravidla. Katedra kybernetiky, FEL, ČVUT v Praze. Časté podsekvence, epizodální pravidla Jiří Kléma Katedra kybernetiky, FEL, ČVUT v Praze http://ida.felk.cvut.cz pstruktura přednášky Motivace pro hledání častých podsekvencí praktické příklady, variabilita

Více

MIDTERM D. Příjmení a jméno:

MIDTERM D. Příjmení a jméno: MIDTERM D Příjmení a jméno: 1 2 3 4 5 6 7 8 9 10 11 12 1 Doplňte místo otazníku ten ze symbolů, aby platil vztah (log n) / (log n 2 ) =?(1/ n): A) o B) O (a současně nelze použít ani o ani Θ) C) Θ D) Ω

Více

STEREOMETRIE ZÁKLADNÍ POJMY, METRICKÉ VLASTNOSTI, ODCHYLKY, VZDÁLENOSTI. STEREOMETRIE geometrie v prostoru

STEREOMETRIE ZÁKLADNÍ POJMY, METRICKÉ VLASTNOSTI, ODCHYLKY, VZDÁLENOSTI. STEREOMETRIE geometrie v prostoru Předmět: Ročník: Vytvořil: Datum: MATEMATIKA DRUHÝ Mgr. Tomáš MAŇÁK 4. května 2014 Název zpracovaného celku: STEREOMETRIE ZÁKLADNÍ POJMY, METRICKÉ VLASTNOSTI, ODCHYLKY, VZDÁLENOSTI STEREOMETRIE geometrie

Více

Asociační pravidla (metoda GUHA)

Asociační pravidla (metoda GUHA) Vysoká škola báňská Technická univerzita Ostrava Fakulta elektrotechniky a informatiky Katedra informatiky Asociační pravidla (metoda GUHA) Ing. Michal Burda () Získávání znalostí z dat Brno, 27. ledna

Více

BA_EM Electronic Marketing. Pavel

BA_EM Electronic Marketing. Pavel BA_EM Electronic Marketing Pavel Kotyza @VŠFS Agenda Efektivní data mining jako zdroj relevantních dat o potřebách zákazníků Co je data mining? Je absolutní Je předem neznámý Je užitečný Co jsou data?

Více

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze Dobývání znalostí Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze Dobývání znalostí Bayesovské modely Doc. RNDr. Iveta Mrázová, CSc.

Více

Markov Chain Monte Carlo. Jan Kracík.

Markov Chain Monte Carlo. Jan Kracík. Markov Chain Monte Carlo Jan Kracík jan.kracik@vsb.cz Princip Monte Carlo integrace Cílem je (přibližný) výpočet integrálu I(g) = E f [g(x)] = g(x)f (x)dx. (1) Umíme-li generovat nezávislé vzorky x (1),

Více

Doplňování chybějících hodnot v kategoriálních datech 2.00

Doplňování chybějících hodnot v kategoriálních datech 2.00 Doplňování chybějících hodnot v kategoriálních datech 2.00 1. Cíle programu Účelem programu je umožnit uživateli doplnění chybějících hodnot v kategoriálních datech. Pro doplnění chybějících hodnot je

Více

Analytické procedury v systému LISp-Miner

Analytické procedury v systému LISp-Miner Dobývání znalostí z databází MI-KDD ZS 2011 Přednáška 8 Analytické procedury v systému LISp-Miner Část II. (c) 2011 Ing. M. Šimůnek, Ph.D. KIZI, Fakulta informatiky a statistiky, VŠE Praha Evropský sociální

Více

Zadání semestrálního projektu Algoritmy II. letní semestr 2017/2018

Zadání semestrálního projektu Algoritmy II. letní semestr 2017/2018 Zadání semestrálního projektu Algoritmy II. letní semestr 2017/2018 doc. Mgr. Jiří Dvorský, Ph.D. Verze zadání 6. dubna 2018 První verze Obecné pokyny 1. Celkem jsou k dispozici tři zadání příkladů. 2.

Více

Kapitola 6: Omezení integrity. Omezení domény

Kapitola 6: Omezení integrity. Omezení domény - 6.1 - Omezení domény Referenční integrita Aserce Spouštěče (Triggers) Funkční závislosti Kapitola 6: Omezení integrity Omezení domény Omezení integrity zabraňují poškození databáze; zajišťují, že autorizované

Více

63. ročník matematické olympiády Řešení úloh krajského kola kategorie B. 1. Odečtením druhé rovnice od první a třetí od druhé dostaneme dvě rovnice

63. ročník matematické olympiády Řešení úloh krajského kola kategorie B. 1. Odečtením druhé rovnice od první a třetí od druhé dostaneme dvě rovnice 63. ročník matematické olympiády Řešení úloh krajského kola kategorie B 1. Odečtením druhé rovnice od první a třetí od druhé dostaneme dvě rovnice (x y)(x + y 6) = 0, (y z)(y + z 6) = 0, které spolu s

Více

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY FAKULTA INFORMAČNÍCH TECHNOLOGIÍ ÚSTAV INFORMAČNÍCH SYSTÉMŮ FACULTY OF INFORMATION TECHNOLOGY DEPARTMENT OF INFORMATION SYSTEMS DOLOVÁNÍ SEKVENČNÍCH

Více

Prohledávání do šířky = algoritmus vlny

Prohledávání do šířky = algoritmus vlny Prohledávání do šířky = algoritmus vlny - souběžně zkoušet všechny možné varianty pokračování výpočtu, dokud nenajdeme řešení úlohy průchod stromem všech možných cest výpočtu do šířky, po vrstvách (v každé

Více

PŘEDNÁŠKA 7 Kongruence svazů

PŘEDNÁŠKA 7 Kongruence svazů PŘEDNÁŠKA 7 Kongruence svazů PAVEL RŮŽIČKA Abstrakt. Definujeme svazové kongruence a ukážeme jak pro vhodné binární relace svazu ověřit, že se jedná o svazové kongruence. Popíšeme svaz Con(A) kongruencí

Více

Grafové algoritmy. Programovací techniky

Grafové algoritmy. Programovací techniky Grafové algoritmy Programovací techniky Grafy Úvod - Terminologie Graf je datová struktura, skládá se z množiny vrcholů V a množiny hran mezi vrcholy E Počet vrcholů a hran musí být konečný a nesmí být

Více

STEREOMETRIE. Odchylky přímek. Mgr. Jakub Němec. VY_32_INOVACE_M3r0114

STEREOMETRIE. Odchylky přímek. Mgr. Jakub Němec. VY_32_INOVACE_M3r0114 STEREOMETRIE Odchylky přímek Mgr. Jakub Němec VY_32_INOVACE_M3r0114 ODCHYLKA DVOU PŘÍMEK V PROSTORU Další typy příkladů, v nichž budeme počítat vzdálenost dvou objektů, by bylo velmi složité počítat bez

Více

vhodná pro strojové dokazování (Prolog) metoda založená na vyvracení: dokazuje se nesplnitelnost formulí

vhodná pro strojové dokazování (Prolog) metoda založená na vyvracení: dokazuje se nesplnitelnost formulí Rezoluce: další formální systém vhodná pro strojové dokazování (Prolog) metoda založená na vyvracení: dokazuje se nesplnitelnost formulí pracujeme s formulemi v nkf (též klauzulárním tvaru), ale používáme

Více

2. Která z trojice úseček může a která nemůže být stranami trojúhelníku. a) b)

2. Která z trojice úseček může a která nemůže být stranami trojúhelníku. a) b) Konstrukce trojúhelníku z daných stran 1. Trojúhelníková nerovnost 1. Porovnejte grafický součet každých dvou stran narýsovaných trojúhelníků se stranou třetí. Strany trojúhelníků můžete obtáhnout barevně.

Více

Obsah přednášky Jaká asi bude chyba modelu na nových datech?

Obsah přednášky Jaká asi bude chyba modelu na nových datech? Obsah přednášky Jaká asi bude chyba modelu na nových datech? Chyba modelu Bootstrap Cross Validation Vapnik-Chervonenkisova dimenze 2 Chyba skutečná a trénovací Máme 30 záznamů, rozhodli jsme se na jejich

Více

Primární klíč (Primary Key - PK) Je právě jedna množina atributů patřící jednomu z kandidátů primárního klíče.

Primární klíč (Primary Key - PK) Je právě jedna množina atributů patřící jednomu z kandidátů primárního klíče. Primární a cizí klíč Kandidát primárního klíče (KPK) Je taková množina atributů, která splňuje podmínky: Unikátnosti Minimálnosti (neredukovatelnosti) Primární klíč (Primary Key - PK) Je právě jedna množina

Více

Zobrazte si svazy a uspořádané množiny! Jan Outrata

Zobrazte si svazy a uspořádané množiny! Jan Outrata LatVis Zobrazte si svazy a uspořádané množiny! Jan Outrata Motivace potřeba visualizovat matematické (algebraické) struktury rychle, přehledně a automaticky počítačovými prostředky ruční kreslení je zdlouhavé

Více

Úlohy krajského kola kategorie C

Úlohy krajského kola kategorie C 6. ročník matematické olympiády Úlohy krajského kola kategorie C. Pro libovolná reálná čísla x, y, z taková, že x < y < z, dokažte nerovnost x 2 y 2 + z 2 > (x y + z) 2. 2. Honza má tři kartičky, na každé

Více

Cílem této kapitoly je uvedení pojmu matice a jejich speciálních typů. Čtenář se seznámí se základními vlastnostmi matic a s operacemi s maticemi

Cílem této kapitoly je uvedení pojmu matice a jejich speciálních typů. Čtenář se seznámí se základními vlastnostmi matic a s operacemi s maticemi 2.2. Cíle Cílem této kapitoly je uvedení pojmu matice a jejich speciálních typů. Čtenář se seznámí se základními vlastnostmi matic a s operacemi s maticemi Předpokládané znalosti Předpokladem zvládnutí

Více

1. jarní série Termín odeslání: 4. února 2019

1. jarní série Termín odeslání: 4. února 2019 Váhy 1. jarní série Termín odeslání: 4. února 2019 Vážením na rovnoramenných vahách zjistíme, která strana je těžší, resp. že jsou obě stejně těžké. Na misky vah můžeme dávat i více než jeden předmět.

Více

Negativní informace. Petr Štěpánek. S použitím materiálu M.Gelfonda a V. Lifschitze. Logické programování 15 1

Negativní informace. Petr Štěpánek. S použitím materiálu M.Gelfonda a V. Lifschitze. Logické programování 15 1 Negativní informace Petr Štěpánek S použitím materiálu M.Gelfonda a V. Lifschitze 2009 Logické programování 15 1 Negace jako neúspěch Motivace: Tvrzení p (atomická formule) neplatí, jestliže nelze odvodit

Více

3.2.3 Podobnost trojúhelníků I

3.2.3 Podobnost trojúhelníků I .. Podobnost trojúhelníků I Předpoklady: 01 Shodné útvary je možné je přemístěním ztotožnit, lidově řečeno jsou stejné Co splňují útvary, které jsou podobné? Mají stejný tvar, ale různou velikost. Kdybychom

Více

Disková pole (RAID) 1

Disková pole (RAID) 1 Disková pole (RAID) 1 Architektury RAID Základní myšlenka: snaha o zpracování dat paralelně. Pozice diskové paměti v klasickém personálním počítači vyhovuje pro aplikace s jedním uživatelem. Řešení: data

Více

3.2.3 Podobnost trojúhelníků I

3.2.3 Podobnost trojúhelníků I .. Podobnost trojúhelníků I Předpoklady: 01 Shodné útvary je možné je přemístěním ztotožnit, lidově řečeno jsou stejné Co splňují útvary, které jsou podobné? Mají stejný tvar, ale různou velikost. Kdybychom

Více