Asociační pravidla (metoda GUHA)

Podobné dokumenty
Michal Burda. 27. ledna Abstrakt

Jana Vránová, 3. lékařská fakulta UK

Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, TESTY DOBRÉ SHODY (angl. goodness-of-fit tests)

12. cvičení z PST. 20. prosince 2017

Příklad 1. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 11

MÍRY ZÁVISLOSTI (KORELACE A REGRESE)

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Základní pojmy matematické logiky

Logika a logické programování

Úvod do dobývání. znalostí z databází

Matematická logika. Rostislav Horčík. horcik

Náhodné veličiny jsou nekorelované, neexistuje mezi nimi korelační vztah. Když jsou X; Y nekorelované, nemusí být nezávislé.

Místo pojmu výroková formule budeme používat zkráceně jen formule. Při jejich zápisu

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze

Predikátová logika. prvního řádu

Ing. Michael Rost, Ph.D.

Každé formuli výrokového počtu přiřadíme hodnotu 0, půjde-li o formuli nepravdivou, a hodnotu 1, půjde-li. α neplatí. β je nutná podmínka pro α

Negativní informace. Petr Štěpánek. S použitím materiálu M.Gelfonda a V. Lifschitze. Logické programování 15 1

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu

Testování statistických hypotéz

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B

platné nejsou Sokrates je smrtelný. (r) 1/??

teorie logických spojek chápaných jako pravdivostní funkce

7.1. Podstata testu statistické hypotézy

Zpracování náhodného vektoru. Ing. Michal Dorda, Ph.D.

Mann-Whitney U-test. Znaménkový test. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

= = 2368

Statistické metody v ekonomii. Ing. Michael Rost, Ph.D.

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

LOGIKA VÝROKOVÁ LOGIKA

Jednofaktorová analýza rozptylu

Booleovská algebra. Booleovské binární a unární funkce. Základní zákony.

Úvod do predikátové logiky. (FLÚ AV ČR) Logika: CZ.1.07/2.2.00/ / 1

5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY

Matematická indukce, sumy a produkty, matematická logika

Přednáška XI. Asociace ve čtyřpolní tabulce a základy korelační analýzy

1 Výroková logika 1. 2 Predikátová logika 3. 3 Důkazy matematických vět 4. 4 Doporučená literatura 7

11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.

Testování hypotéz. testujeme (většinou) tvrzení o parametru populace. tvrzení je nutno předem zformulovat

Kontingenční tabulky, korelační koeficienty

PRAVDĚPODOBNOST A STATISTIKA

Testování hypotéz. 4. přednáška

Sémantika predikátové logiky

Unární je také spojka negace. pro je operace binární - příkladem může být funkce se signaturou. Binární je velká většina logických spojek

Analytické procedury v systému LISp-Miner

Ilustrační příklad odhadu LRM v SW Gretl

Logika. 2. Výroková logika. RNDr. Luděk Cienciala, Ph. D.

4.2 Syntaxe predikátové logiky

1 Pravdivost formulí v interpretaci a daném ohodnocení

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

TECHNICKÁ UNIVERZITA V LIBERCI. Statistický rozbor dat z dotazníkového šetření

4ST201 STATISTIKA CVIČENÍ Č. 7

Výroková logika. Teoretická informatika Tomáš Foltýnek

Statistika. Testování hypotéz statistická indukce Úvod do problému. Roman Biskup

0. ÚVOD - matematické symboly, značení,

Fuzzy logika a reálný svět, aneb jsou všechny hromady skutečně malé?

Okruh č.3: Sémantický výklad predikátové logiky

Přednáška X. Testování hypotéz o kvantitativních proměnných

KGG/STG Statistika pro geografy

15. T e s t o v á n í h y p o t é z

M - Výroková logika VARIACE

ZÁKLADY LOGIKY A METODOLOGIE

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D.

Úvod do logiky (VL): 5. Odvození výrokových spojek z jiných

Fisherův exaktní test

Kontingenční tabulky, korelační koeficienty

Regresní a korelační analýza

Analýza rozptylu. Ekonometrie. Jiří Neubauer. Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel

Statistika, Biostatistika pro kombinované studium. Jan Kracík

Výroková a predikátová logika - II

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Ranní úvahy o statistice

Statistické testování hypotéz II

Jednofaktorová analýza rozptylu

Matematická logika. Miroslav Kolařík

Statistika. Testování hypotéz statistická indukce Neparametrické testy. Roman Biskup

VYBRANÉ DVOUVÝBĚROVÉ TESTY. Martina Litschmannová

PSY117/454 Statistická analýza dat v psychologii seminář 9. Statistické testování hypotéz

Statistické metody - nástroj poznání a rozhodování anebo zdroj omylů a lží

Regresní a korelační analýza

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

Dva případy chybného rozhodnutí při testování: a) Testační statistika padne mimo obor přijetí nulové H hypotézy O, tj.

Neparametrické metody

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Predikátová logika. Teoretická informatika Tomáš Foltýnek

Úvod do logiky (presentace 2) Naivní teorie množin, relace a funkce

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.

Formální systém výrokové logiky

Úvod do TI - logika Predikátová logika 1.řádu (4.přednáška) Marie Duží marie.duzi@vsb.cz

Poznámky k předmětu Aplikovaná statistika, 11. téma

Matematika pro informatiky KMA/MATA

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Regresní a korelační analýza

Výroková a predikátová logika - II

Matematika B101MA1, B101MA2

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

Pearsonůvχ 2 test dobré shody. Ing. Michal Dorda, Ph.D.

Transkript:

Vysoká škola báňská Technická univerzita Ostrava Fakulta elektrotechniky a informatiky Katedra informatiky Asociační pravidla (metoda GUHA) Ing. Michal Burda () Získávání znalostí z dat Brno, 27. ledna 2004

Asociační pravidla (metoda GUHA) 2 Úvod metoda GUHA (General Unary Hypothesis Automaton) automat na obecné unární hypotézy původní česká metoda (Hájek, Havránek, Chytil, 80. léta 20. stol.) systematické vytváření hypotéz na základě empirických dat multidimenzionální asociační pravidla asociační, implikační a korelační kvantifikátory umí pracovat s neúplnou informací

Asociační pravidla (metoda GUHA) 3 Příklad Vstupní data: Věk Plat... Auto 18 25 10 tis.... Škoda 120 41 60 40 tis.... BMW.... Získané pravidlo: věk(1 17) plat(40 tis.) 0,1;0,8 Auto(BMW)

Asociační pravidla (metoda GUHA) 4 Pojmy věk(1 17) plat(40 tis.) 0,1;0,8 Auto(BMW) predikát symbolické jméno veličiny formule predikáty složené pomocí logických spojek (,, ) kvantifikátor symbol určující druh a intenzitu souvislosti antecedent formule na levé straně kvantifikátoru (předpoklad) sukcedent formule na pravé straně kvantifikátoru (závěr) formální sentence pravidlo pravdivá sentence (hypotéza) sentence, jejíž pravdivovst je potvrzena vyhodnocením kvantifikátoru v datech

Asociační pravidla (metoda GUHA) 5 Pojmy věk(1 17) plat(40 tis.) 0,1;0,8 Auto(BMW) predikát symbolické jméno veličiny formule predikáty složené pomocí logických spojek (,, ) kvantifikátor symbol určující druh a intenzitu souvislosti antecedent formule na levé straně kvantifikátoru (předpoklad) sukcedent formule na pravé straně kvantifikátoru (závěr) formální sentence pravidlo pravdivá sentence (hypotéza) sentence, jejíž pravdivovst je potvrzena vyhodnocením kvantifikátoru v datech

Asociační pravidla (metoda GUHA) 6 Pojmy věk(1 17) plat(40 tis.) 0,1;0,8 Auto(BMW) predikát symbolické jméno veličiny formule predikáty složené pomocí logických spojek (,, ) kvantifikátor symbol určující druh a intenzitu souvislosti antecedent formule na levé straně kvantifikátoru (předpoklad) sukcedent formule na pravé straně kvantifikátoru (závěr) formální sentence pravidlo pravdivá sentence (hypotéza) sentence, jejíž pravdivovst je potvrzena vyhodnocením kvantifikátoru v datech

Asociační pravidla (metoda GUHA) 7 Pojmy věk(1 17) plat(40 tis.) 0,1;0,8 Auto(BMW) predikát symbolické jméno veličiny formule predikáty složené pomocí logických spojek (,, ) kvantifikátor symbol určující druh a intenzitu souvislosti antecedent formule na levé straně kvantifikátoru (předpoklad) sukcedent formule na pravé straně kvantifikátoru (závěr) formální sentence pravidlo pravdivá sentence (hypotéza) sentence, jejíž pravdivovst je potvrzena vyhodnocením kvantifikátoru v datech

Asociační pravidla (metoda GUHA) 8 Pojmy věk(1 17) plat(40 tis.) 0,1;0,8 Auto(BMW) predikát symbolické jméno veličiny formule predikáty složené pomocí logických spojek (,, ) kvantifikátor symbol určující druh a intenzitu souvislosti antecedent formule na levé straně kvantifikátoru (předpoklad) sukcedent formule na pravé straně kvantifikátoru (závěr) formální sentence pravidlo pravdivá sentence (hypotéza) sentence, jejíž pravdivovst je potvrzena vyhodnocením kvantifikátoru v datech

Asociační pravidla (metoda GUHA) 9 Pojmy věk(1 17) plat(40 tis.) 0,1;0,8 Auto(BMW) predikát symbolické jméno veličiny formule predikáty složené pomocí logických spojek (,, ) kvantifikátor symbol určující druh a intenzitu souvislosti antecedent formule na levé straně kvantifikátoru (předpoklad) sukcedent formule na pravé straně kvantifikátoru (závěr) formální sentence pravidlo pravdivá sentence (hypotéza) sentence, jejíž pravdivovst je potvrzena vyhodnocením kvantifikátoru v datech

Asociační pravidla (metoda GUHA) 10 Pojmy věk(1 17) plat(40 tis.) 0,1;0,8 Auto(BMW) predikát symbolické jméno veličiny formule predikáty složené pomocí logických spojek (,, ) kvantifikátor symbol určující druh a intenzitu souvislosti antecedent formule na levé straně kvantifikátoru (předpoklad) sukcedent formule na pravé straně kvantifikátoru (závěr) formální sentence pravidlo pravdivá sentence (hypotéza) sentence, jejíž pravdivovst je potvrzena vyhodnocením kvantifikátoru v datech

Asociační pravidla (metoda GUHA) 11 Kvantifikátory (1) Důležité je dávat na výstup pouze sentence, které jsou nějak zajímavé, které podporují nějakou hypotézu. Kvantifikátory popisují druh a intenzitu takové hypotézy. Postihují tedy druh a sílu vazby mezi antecedentem a sukcedentem. Druhy kvantifikátorů: implikační A (asi, většinou) je příčinou B (A B) asociační A (asi, většinou) souvisí s B (A B) korelační za podmínky F spolu hodnoty A a B (asi, většinou) korelují (A corr B/F )

Asociační pravidla (metoda GUHA) 12 Čtyřpolní tabulky Síla vztahu určeného daným kvantifikátorem se nestanovuje z jednotlivých hodnot datové tabulky, ale z vhodných charakteristik dat. GUHA jako charakteristiky používá frekvence. Frekvenční (čtyřpolní) tabulka: antecedent antecedent sukcedent a b r sukcedent c d s k l m (kde r = a + b, s = c + d, k = a + c, l = b + d a m = a + b + c + d)

Asociační pravidla (metoda GUHA) 13 Příklad výpočtu čtyřpolní tabulky tequila citróny 0 0 1 1 0 1 1 1 0 0 1 1 0 1 0 1 1 1 0 0 1 0 0 0 Sentence: tequila citróny tequila tequila citróny 4 3 7 citróny 1 4 5 5 7 12

Asociační pravidla (metoda GUHA) 14 Příklad výpočtu čtyřpolní tabulky tequila citróny 0 0 1 1 0 1 1 1 0 0 1 1 0 1 0 1 1 1 0 0 1 0 0 0 Sentence: tequila citróny tequila tequila citróny 4 3 7 citróny 1 4 5 5 7 12

Asociační pravidla (metoda GUHA) 15 Příklad výpočtu čtyřpolní tabulky tequila citróny 0 0 1 1 0 1 1 1 0 0 1 1 0 1 0 1 1 1 0 0 1 0 0 0 Sentence: tequila citróny tequila tequila citróny 4 3 7 citróny 1 4 5 5 7 12

Asociační pravidla (metoda GUHA) 16 Příklad výpočtu čtyřpolní tabulky tequila citróny 0 0 1 1 0 1 1 1 0 0 1 1 0 1 0 1 1 1 0 0 1 0 0 0 Sentence: tequila citróny tequila tequila citróny 4 3 7 citróny 1 4 5 5 7 12

Asociační pravidla (metoda GUHA) 17 Kvantifikátory (2) Každý kvantifikátor je definován jako funkce frekvencí a, b, c, d. Pokud je výsledkem zobrazení hodnota 1, zkoumaná sentence je přijata jako pravdivá.

Asociační pravidla (metoda GUHA) 18 Implikační kvantifikátory (1) A (asi, většinou) je příčinou B (A B)... 1. s,p fundovaná implikace (pro s (0; 1 a p > 0): s,p (a, b, c, d) = 1, je-li a p a a s(a + b) Představuje požadavek na dosažení minimální podpory (p) a spolehlivosti (s) v datech. 2.! s,p,α dolní kritická implikace (pro s (0; 1, p > 0 a α 0; 0, 5 ): r ( )! r s,p,α (a, b, c, d) = 1, je-li s i (1 s) r i α i Je založena na statistickém testu nulové hypotézy, že podmíněná pravděpodobnost sukcedentu za podmínky antecedentu je menší nebo rovna s, proti alternativní hypotéze, že je větší než s. Jde o test na hladině významnosti α. Hodnota 1 indikuje přijetí alternativní hypotézy. i=a

Asociační pravidla (metoda GUHA) 19 Implikační kvantifikátory (2) 3.? s,p,α horní kritická implikace (pro s (0; 1, p > 0 a α 0; 0, 5 ): a ( )? r s,p,α (a, b, c, d) = 1, je-li s i (1 s) r i > α i Je založena na testu nulové hypotézy, že podmíněná pravděpodobnost sukcedentu za podmínky antecedentu je větší nebo rovna s, proti alternativní hypotéze, že je menší než s. Jde o test na hladině významnosti α. Hodnota 1 indikuje nezamítnutí nulové hypotézy. Dolní a horní kritická implikace se liší pouze v tom, kterou statistickou chybu omezují hodnotou α. Nechť R M ( ) je množina všech pravdivých sentencí s implikačním kvantifikátorem v datech M; pak platí: i=0 R M (! s,p,α) R M ( s,p ) R M (? s,p,α)

Asociační pravidla (metoda GUHA) 20 Asociační kvantifikátory (1) A (asi, většinou) souvisí s B (A B)... 1. δ prosté vychýlení (pro lib. δ 0) δ (a, b, c, d) = 1, je-li ad > e δ bc (speciálně pro δ = 0 dostáváme ad > bc). 2. 1 α Fisherův kvantifikátor (pro lib. α 0; 0, 5 ): 1 α (a, b, c, d) = 1, je-li ad > bc a min(r,k) i=a ( ki )( m k ) ( r i mr ) α Je založen na statistickém testu hypotézy o nezávislosti veličin proti alternativě o jejich kladné závislosti na hladině významnosti α. Hodnota 1 indikuje přijetí alternativní hypotézy.

Asociační pravidla (metoda GUHA) 21 Asociační kvantifikátory (2) 3. 2 α χ 2 -kvantifikátor (pro α (0; 0, 5 ): 2 α (a, b, c, d) = 1, je-li ad > bc a (ad bc) 2 m χ 2 α rkls kde χ 2 α je (1 2α)-kvantil χ 2 -rozložení s jedním stupněm volnosti. Tento kvantifikátor má stejné statistické pozadí jako Fisherův. (Heuristická) pravidla pro použití jednotlivých kvantifikátorů (lh je součet největších délek antecedentu a sukcedentu, m počet záznamů): Pro χ 2 -kvantifikátor by mělo platit: 5 2 lh m Pro Fisherův kvantifikátor by mělo platit: 2 lh m χ 2 -test má větší sílu než Fisherova statistika. Proto platí-li nerovnost min{5 2 lh, 250} m, používáme raději kvantifikátor χ 2 místo Fisherova.

Asociační pravidla (metoda GUHA) 22 Korelační kvantifikátory (1) Za podmínky F hodnoty A a B (asi, většinou) korelují (A corr B / F)... Všechny korelační kvantifikátory původní metody GUHA jsou založeny na pojmu pořadí. Předpokládejme, že máme data vzniklá pozorováním dvou reálněhodnotových veličin, t 1 a t 2. R(i) definujme jako počet objektů, pro něž hodnota veličiny t 1 je menší než hodnota t 1 pro i-tý objekt. Podobně definujme i Q(i) (vzhledem k veličině t 2 ). 1. s-corr α Spearmanův kvantifikátor (pro α (0; 0, 5 ): m s-corr α ( t 1, t 2 ) = 1, je-li R(i)Q(i) k α kde k α je vhodná konstanta. Za jistých dodatečných předpokladů jde o statistický test nulové hypotézy nezávislosti proti alternativní hypotéze o kladné závislosti. Hodnota 1 indikuje kladnou závislost na hladině α. i=1

Asociační pravidla (metoda GUHA) 23 Korelační kvantifikátory (2) 2. k-corr α Kendallův kvantifikátor (pro α (0; 0, 5 ): je-li k-corr α ( t 1, t 2 ) = 1, ( ( ) ( sign R(i) R(j) sign Q(i) Q(j)) ) k α i j kde k α je vhodná konstanta. Statistická interpretace je stejná jako výše. sign(x) znamená funkci signum (kladného čísla je 1, záporného 1). 3. e-corr pořadově ekvivalenční kvantifikátor: e-corr( t 1, t 2 ) = 1, je-li R(i) = Q(i) pro i = 1,..., m

Asociační pravidla (metoda GUHA) 24 GUHA procedury Původní metoda GUHA se skládá z řady procedur, z nichž některé patří spíše do metod předzpracování. V dalším se zaměříme na: ASSOC vyhledávání sentencí s asociačními kvantifikátory IMPL vyhledávání implikací CORREL vyhledávání vysokých podmíněných korelací

Asociační pravidla (metoda GUHA) 25 Metoda ASSOC (1) Vyhledávání sentencí s asociačními kvantifikátory. (Hledání těch dvojic antecedent/sukcedent, u kterých shody převažují nad neshodami.) p 1 p 2 p 3 p 4 p 5 p 6 Vstupy (tvar zkoumaných sentencí): maximální povolená délka antecedentu a sukcedentu které predikáty a s jakým znamením se mohou vyskytovat v antecedentu a které v sukcedentu druh kvantifikátoru Výstupy sentence, které splňují: jsou pravdivé v datech a vyhovují tvaru zadanému na vstupu antecedent i sukcedent jsou elementární konjunkce

Asociační pravidla (metoda GUHA) 26 Metoda ASSOC (2) Nástin algoritmu: 1. Začíná se od sentencí tvořených jedním predikátem v antecedentu a jedním v sukcedentu. Postupně se testuje pravdivost všech přípustných kombinací počítáním čtyřpolních tabulek a vyhodnocováním funkce kvantifikátoru. 2. Následuje prodlužování antecedentu i sukcedentu. Obě formule jsou tvořeny jako elementární konjunkce. Opět se testuje pravdivost všech přípustných kombinací. 3. Délka sentence se zvětšuje až do maximální stanovené velikosti.

Asociační pravidla (metoda GUHA) 27 Metoda IMPL Hledání pravdivých sentencí ve tvaru implikace. (Vyhledávání vysokých podmíněných pravděpodobností ve dvouhodnotových datech.) p 1 p 2 p 3 p 4 p 5 p 6 Vstupy (tvar zkoumaných sentencí): stejné jako u metody ASSOC (povolené predikáty, kvanitifikátor a max. délka antecedentu a sukcedentu) Výstupy sentence, které splňují: jsou pravdivé v datech a vyhovují tvaru zadanému na vstupu antecedent je tvaru elementární konjunkce a sukcedent je tvaru elementární disjunkce Algoritmus podobný jako u ASSOC

Asociační pravidla (metoda GUHA) 28 Dedukční pravidla Při hledání pravdivých sentencí metodami ASSOC a IMPL se dá využít různých dedukčních pravidel a tím urychlit celý proces, protože nemusíme testovat sentence, které lze odvodit z ostatních: 1. Pravidlo záměny ekvivalentních formulí. 2. Pravidlo úprav elementární implikace. 3. Pravidlo symetrie. 4. Pravidlo konzervativního zlepšování. 5. Pravidlo ostrého zlepšování pro konjunktivní asociace.

Asociační pravidla (metoda GUHA) 29 Neúplná informace Místo s dvouhodnotovými daty se pracuje s trojhodnotovými (0, X a 1, kde X znamená nevyplňeno ). Vyhodnocování formulí a funkcí kvantifikátorů se potom provádí tak, že se vždy bere v úvahu nejhorší možný způsob doplnění skutečných hodnot za X. Máme tak jistotu, že získaná pravidla by skutečně platila i v datech bez neúplné informace.

Asociační pravidla (metoda GUHA) 30 Procedura CORREL (1) Hledání elementárních konjunkcí, pro které je podmíněná korelace dvou vybraných reálných veličin v datech vysoká. (p 1 corr p 2 )/f Vstupy: reálněhodnotové veličiny p 1 a p 2, které chceme zkoumat užitý korelační kvantifikátor které predikáty a s jakým znamením se mohou vyskytovat v podmínce maximální povolená délka podmínky

Asociační pravidla (metoda GUHA) 31 Procedura CORREL (2) Výstupy sentence, které splňují: jsou pravdivé v datech p 1, p 2 a korelační kvantifikátor corr jsou neměnné podmínka f je elementární konjunkce a vyhovuje tvaru zadanému na vstupu Algoritmus hledání pravdivých sentencí spočívá v postupném generování podmínek povoleného tvaru, v jejich prodlužování až do zadané maximální velikosti a testováním pravdivosti vzniklých sentencí.

Asociační pravidla (metoda GUHA) 32 Statistický pohled (1) GUHA často používá pro rozhodnutí o pravdivosti sentence statistické testy. Statistika pracuje s pravděpodobností vždy určitá pravděpodobnost, že je vyvozený závěr neplatný. Simultánní statistická inference pravděpodobnost chyby v rozhodnutí o pravdivosti každé sentence je α i. Celková pravděpodobnost chyby v alespoň jedné sentenci s M je tedy nutně M α i. pravděpodobnost, že mezi získanými asociačními pravidly je alespoň jedno nepravdivé, se blíží k jistotě.

Asociační pravidla (metoda GUHA) 33 Statistický pohled (2) Má tedy získávání asociačních pravidel vůbec smysl? Samozřejmě ano. Na vytěžené znalosti ovšem nemůžeme pohlížet jako na jisté pravdy. Nelze je prohlásit za zákony zkoumané oblasti. Asociační pravidla nám pouze dávají přehled o charakteru dat. Ukazují, které hypotézy jsou daty podporovány, jaké vztahy jsou možná pravdivé a které směry dalšího bádání v datech jsou nadějné.

Asociační pravidla (metoda GUHA) 34 Konec. Čas na Vaše dotazy... Typeset by L A TEX & TEXPower.