Vysoká škola ekonomická. Katedra informačního a znalostního inženýrství. Fakulta informatiky a statistiky. Systém LISp-Miner

Rozměr: px
Začít zobrazení ze stránky:

Download "Vysoká škola ekonomická. Katedra informačního a znalostního inženýrství. Fakulta informatiky a statistiky. Systém LISp-Miner"

Transkript

1 Vysoká škola ekonomická Katedra informačního a znalostního inženýrství Fakulta informatiky a statistiky Systém LISp-Miner Stručný popis určený pro posluchače kurzů Metod zpracování informací verse 20. listopadu 2005 Vypracoval: Jan Rauch

2 Obsah 1 Úvod 5 2 Přehledný popis 7 3 Procedura 4ft-Miner Booleovské atributy Asociační pravidla Vstup procedury 4ft-Miner Výstup procedury 4ft-Miner Asociační pravidla a nákupní košík 21 3

3 4

4 Kapitola 1 Úvod LISp-Miner je akademický softwarový systém určený pro podporu výuky a výzkumu v oblasti dobývání znalostí z databází, viz Systém je vyvíjen skupinou pedagogů a studentů převážně z Fakulty informatiky a statistiky VŠE. Toto jsou provizorní skripta obsahující základní informace o systému. Jsou určena zejména pro posluchače předmětů IZI240 - Metody zpracování informací a IZI212 - Metody zpracování informací - praktika vyučované na VŠE. Předpokádá se, že budou postupně rozšířena na skripta, která se budou systému věnovat podrobně a v širších souvislostech. Systém LISp-Miner se v současné době skládá ze šesti analytických procedur, z procedury KEX pro strojové učení, ze dvou procedur pro vstupní transformace dat a z několika modulů, které různým způsobem doplňují analytické procedury. Stručný přehledný popis systému je v kapitole 2. Z pohledu výuky v letním semestru 2004/2005 je nejdůležitější analytická procedura 4ft-Miner které je věnována kapitola 3. Procedura 4ft-Miner je určena pro získávání asociačních pravidel. Jedná se však o značně obecnější vztahy než jsou klasická asociační pravidla definovaná v souvislosti s analýzou nákupních košíků. Asociační pravidla definovaná pro nákupní košíky a jejich vztah k proceduře 4ft-Miner jsou popsány v kapitole 4 Stručný popis dalších procedur a modulů je prozatím k dispozici pouze na Významným úkolem systému LISp-Miner je podpora výzkumných aktivit v oblasti dobývání znalostí z databází s důrazem na aktivity studentské. Přehled výzkumných aktivit souvisejících se systémem LISp-Miner je v současné době k dispozici na Studentské aktivity mají často formu vypracování diplomové práce. Připadají v úvahu i práce bakalářské např. formou pilotních analýz pomocí procedur jiných než 4ft-Miner nebo formou aplikací modulu AR2NL (viz html a ) na další oblasti. 5

5 Je třeba zdůraznit, že systém LISp-Miner je výsledkem činnosti týmu pedagogů a studentů a že autor této první verse provizorních skript popisuje výsledky práce celého týmu. Dále je uvedena stručná historie vývoje systému. Další podrobnosti o autorech systému jsou uvedeny na vse.cz/people.html a u popisu jednotlivých procedur a modulů na http: //lispminer.vse.cz/procedures/. Vývoj systému LISp-Miner byl zahájen v roce 1996 kdy byla implementována první verse procedury 4ft-Miner. Autorem projektu byl J. Rauch a procedura byla implementována Milanem Šimůnkem. Nová koncepce procedury 4ft-Miner byla v roce 1999 vytvořena J. Rauchem a M. Šimůnkem. V této souvislosti byla M. Šimůnkem implementována matabáze a také procedura LMDataSource. Petr Berka vypracoval projekt procedury KEX pro strojové učení, projekt byl implementován M. Šimůnkem. Při implementaci byly použity softwarové nástroje pro práci s bitovými řetězci vytvořené při implementaci procedury 4ft- Miner. Ucelený systém podprogramů a pravidel pro další vývoj systému LISp-Miner byl připraven M. Šimůnkem. Tento systém jeho autor využil při implementaci nových analytických procedur KL-Miner, CF-Miner, SD4ft-Miner, SDKL- Miner a SDCF-Miner navržených J. Rauchem. Na vývoji těchto nových procedur a na vývoji různých dalších modulů se podíleli další autoři, viz též popis jednotlivých procedur a modulů na http: //lispminer.vse.cz/procedures/. 6

6 Kapitola 2 Přehledný popis Systém LISp-Miner se v současné době skládá ze šesti analytických procedur 4ft-Miner KL-Miner CF-Miner SD4ft-Miner SDKL-Miner SDCF-Miner, z procedury KEX pro strojové učení, ze dvou procedur pro vstupní transformace dat LMDataSource TimeTransf a z několika modulů (např. AR2NL nebo COLLAPS), které různým způsobem doplňují analytické procedury. Každá z analytických procedur i procedura KEX je realizována pomocí dvou modulů. Pro proceduru 4ft-Miner to jsou moduly - programy 4ftTask.exe a 4ftResult.exe. Modul 4ftTask.exe zajišťuje dialog s uživatelem, jehož výsledkem je zadání vstupních parametrů které se uloží do metabáze. Dále modul 4ftTask.exe vyřeší úlohu s takto zadanými parametry a výsledky uloží také do metabáze. Modul 4ftResult.exe umožňuje prohlížení výsledků. Analogicky pro ostatní z těchto procedur. Procedura LMDataSource je realizována pomocí 7

7 Obrázek 2.1: Metabáze a moduly systému LISp-Miner modulu LMDataSource.exe, procedura TimeTransf modulem TimeTransf.exe. Schematicky je celá situace znázorněna na obr Jedním z úkolů metabáze je oddělit analyzovaná data od provozních dat systému LISp-Miner. Analyzovaná data musí být přístupná pomocí ODBC, příkladem takto přístupných dat jsou data uchovávaná pomocí databázového systému Microsoft ACCESS. Informace o ODBC zdroji ve kterém jsou analyzovaná data je uložena také v metabázi. Tím je zajištěno propojení metabáze s analyzovanými daty. Uložení provádí modul LMAdmin.exe. Architektura systému LISp-Miner daná vztahy analyzovaných dat, metabáze a jednotlivých modulů je znázorněna v obr Poznamenejme, že v této kapitole jsou uvedeny skutečně jen základní informace, které je třeba doplnit o další informace z přednášek a cvičení. Rozhodně se zde nejedná o ucelený popis architektury systému LISp-Miner. Další podrobnosti jsou uvedeny v dokumentu LISp-Miner project č. 8 - Metabase Structure který je volně přístupný na adrese php. 8

8 Obrázek 2.2: Arhitektura systému LISp-Miner Dále zde nejsou uvedeny podrobnosti o práci se systémem. Omezujeme se na konstatování, že před zahájením práce s analytickými procedurami je třeba připravit analyzovanou matici pomocí modulu LMDataSource. 9

9 10

10 Kapitola 3 Procedura 4ft-Miner Procedura 4ft-Miner je určena pro získávání asociačních pravidel z matic dat. Zároveň se jedná o implementaci metody GUHA automatické tvorby hypotéz. Cílem metody GUHA je nabízet vše zajímavé co lze k danému problému odvodit z analyzovaných dat. Jedná se o původní českou metodu explorační analýzy dat, viz např. [4, 7]. Metoda GUHA je realizována pomocí GUHA procedur. GUHA procedura je program, jehož vstupem je jednoduché zadání rozsáhlé množiny potenciálně zajímavých vztahů a analyzovaná data. GUHA procedura generuje všechny zadané vztahy a verifikuje každý z nich. Výstupem jsou všechny vztahy ze zadané množiny, které jsou pravdivé v analyzovaných datech. Zároveň jsou do výstupu uváděny pouze takové vztahy, které nevyplývají z jiných, jednušších a ve výstupu již uvedených vztahů. Nejvíce používanou GUHA procedurou je procedura ASSOC. Procedura AS- SOC hledá vztahy, které jsou zobecněním asociačních pravidel tak jak byla definována např. v [1], viz též [3]. Procedura 4ft-Miner je nejnovější implementací procedury ASSOC. Má zároveň některé nové rysy ve srovnání s dřívějšími implementacemi [7, 8, 9]. Schema činnosti GUHA procedury 4ft-Miner je v obr Procedura 4ft-Miner pracuje s booleovskými atributy odvozenými ze sloupců analyzované matice dat, viz odstavec 3.1. Asociační pravidla jsou definována v odstavci 3.2. Zadávání množiny relevantních asociačních pravidel pro proceduru 4ft-Miner je popsáno v odstavci 3.3. Stručný komentář k výstupu procedury 4ft- Miner je v odstavci Booleovské atributy Procedura 4ft-Miner pracuje s booleovskými atributy odvozenými ze sloupců analyzované matice dat. Analyzovaná matice dat vznikne z databázové tabulky 11

11 Obrázek 3.1: Schéma činnosti GUHA procedury 4ft-Miner pomocí procedury LMDataSource. To znamená, že každý řádek matice odpovídá jednomu řádku databázové relace (tabulky) který popisuje jeden pozorovaný objekt. Podstatné je, že každý atribut - sloupec matice může nabývat konečně mnoha hodnot. Tyto hodnoty nazýváme kategoriemi. Ze sloupců matice dat se vytvářejí základní booleovské atributy. Základní booleovský atribut je výraz A(α), kde α je vlastní neprázdná podmnožina množiny všech kategorií atributu A. Základní booleovský atribut A(α) je pravdivý v řádku matice právě když a α kde a je hodnota atributu A v tomto řádku. Booleovské atributy jsou obvyklým způsobem odvozeny ze základních booleovských atributů pomocí logických spojek, and. Příklad matice dat M s atributy A 1,... A K je v obr. 3.2 kde jsou uvedeny i základní booleovské atributy A 1 (1) a A 2 (1, 4, 5) a odvozené booleovské atributy A 1 (1) A 2 (1, 4, 5) a A K (6) (zde A 2 (1, 4, 5) je zkráceným zápisem formálně korektního A 2 ({1, 4, 5, 7}) atd. ). řádek sloupce M příklady booleovských atributů matice (atributy) základní odvozené M A 1 A 2... A K A 1(1) A 2(1, 4, 5) A 1(1) A 2(1, 4, 5) A K(6) o o o o n Obrázek 3.2: Data matrix M and examples of Boolean attributes 12

12 3.2 Asociační pravidla Asociační pravidlo je výraz ϕ ψ kde ϕ a ψ jsou Booleovské atributy. Symbol se nazývá 4ft-kvantifikátor. Asociační pravidlo ϕ ψ se týká analyzované matice dat M. Každému 4ft-kvantifikátoru odpovídá nějaká podmínka týkající se čtyřpolních tabulek. Čtyřpolní tabulkou rozumíme čtveřici a, b, c, d celých nezáporných čísel takových, že a + b + c + d > 0. Pomocí 4ft-kvantifikátorů lze vyjádřit různé typy vzájmných závislostí booloevských atributů ϕ a ψ včetně závislostí odpovídajících statistickým testům hypotéz. Asociační pravidlo ϕ ψ je pravdivé v matici dat M jestliže podmínka odpovídající 4ft-kvantifikátoru je splněna pro kontingenční tabulku booleovských atributů ϕ a ψ v matici dat M. V opačném případě je asociační pravidlo ϕ ψ nepravdivé v matici dat M. Kontingenční tabulka booleovských atributů ϕ a ψ v matici dat M je čtveřice čísel a, b, c, d definovaných tak, že a je počet řádků matice M splňujících jak ϕ tak i ψ b je počet řádků matice M splňujících ϕ a nesplňujících ψ c je počet řádků matice M nesplňujících ϕ ale splňujících ψ d je počet řádků matice M nesplňujících ani ϕ ani ψ. Kontingenční tabulku booleovských atributů ϕ a ψ v matici dat M nazýváme 4ft tabulkou ϕ a ψ v M a značíme ji 4ft(ϕ, ψ, M). Krom frekvencí a, b, c, d používáme někdy ještě obvyklé značení pro dílčí součty těchto frekvencí r = a+b, s = c + d, k = a + c, l = b + d a n = a + b + c + d, viz Tab M ψ ψ ϕ a b r ϕ c d s k l n Tabulka 3.1: 4ft tabulka ϕ a ψ v M Hodnotu V al(ϕ ψ, M) asociačního pravidla ϕ ψ v matici dat M definujeme jako V al(ϕ ψ, M) = 1 je-li ϕ ψ pravdivé v M a jako V al(ϕ ψ, M) = 0 je-li ϕ ψ ne pravdivé v M Uvádíme důležité příklady 4ft-kvantifikátorů: 13

13 4ft-kvantifikátor p,base fundované implikace je pro 0 < p 1 a Base > 0 definován v [4] podmínkou a a + b p a Base. To znamená, že nejméně 100p procent objektů splňujících ϕ splňuje také ψ a že nejméně Base objektů (řádků) matice M splňuje ϕ i ψ. 4ft-kvantifikátor p,base fundované dvojité implikace je pro 0 < p 1 a Base > 0 definován v [7] podmínkou a a + b + c p a Base. To znamená, že nejméně 100p procent objektů splňujících ϕ nebo ψ splňuje také jak ϕ tak i ψ a že zároveň nejméně Base objektů splňuje ϕ i ψ. 4ft-kvantifikátor p,base fundované ekvivalence je pro 0 < p 1 a Base > 0 definován v [7] podmínkou a + d a + b + c + d p a Base. To znamená, že ϕ a ψ mají stejnou hodnotu (true nebo false) pro nejméně 100p procent objektů matice M a že nejméně Base objektů splňuje ϕ i ψ. 4ft-kvantifikátor p,base kladné odchylky od průměru je pro 0 < p a Base > 0 definován podmínkou a a + b a + c (1 + p) a + b + c + d a Base. To znamená, že relativní četnost objektů splňujících ψ mezi objekty spňujícími ϕ je alespoň o 100p procent vyšší, než relativní četnost objektů splňujících ψ v celé matici a že zároveň nejméně Base objektů splňuje ϕ i ψ. 4ft-kvantifikátor p,base se nazývá také AA-kvantifikátor (z anglického Above Average ). Řada dalších 4ft-kvantifikátorů je definována např. v [4], [7] a [10] včetně kvantifikátorů inspirovaných statistickými testy hypotéz a kvantifikátoru odpovídajícího klasickému asociačnímu pravidlu. Procedura 4ft-Miner pracuje i s podmíněnými asociačními pravidly. Podmíněné asosiační pravidlo je výraz ϕ ψ/χ kde ϕ, ψ and χ jsou booleovské atributy. Asociační pravidlo ϕ ψ/χ říká, že ϕ a ψ jsou v relaci dané 4ftkvanifikátorem pokud je splněna podmínka daná booleovským atributem χ. Podmíněné asociační pravidlo ϕ ψ/χ je pravdivé v matici dat M jestliže existuje řádek matice M splňující χ a jestliže asociační pravidlo ϕ ψ je pravdivé v matici dat M/χ. Jinak je ϕ ψ/χ nepravdivé v matici dat M. 14

14 Matice dat M/χ vznikne z matice dat M vynecháním všech řádků nesplňujících χ. Hodnotu V al(ϕ ψ/χ, M) podmíněného asociačního pravidla ϕ ψ/χ v matici dat M definujeme jako V al(ϕ ψ/χ, M) = 1 je-li ϕ ψ/χ pravdivé v M a jako s V al(ϕ ψ/χ, M) = 0 je-li ϕ ψ/χ nepravdivé v M. 3.3 Vstup procedury 4ft-Miner Procedura 4ft-Miner hledá asociační pravidla tvaru ϕ ψ a podmíněná asociační pravidla tvaru ϕ ψ/χ. Booleovský atribut ϕ se nazývá antecedent, ψ se nazývá sukcedent [4] a χ je podmínka. Asociační pravidla i podmíněná asociační pravidla nazýváme souhrnně asociačními pravidly. Antecedent, sukcedent a podmínka se souhrnně nazývají cedenty. Vstup procedury 4ft-Miner je dán: maticí dat zadáním množiny asociačních pravidel která mají být automaticky generována a verifikována zadáním práce s neúplnou informací zadáním způsobu výstupu pro implikace. Asociační pravidla která mají být generována a verifikována se v souvislosti s metodou GUHA nazývají relevantní otázky. Množina asociačních pravidel která mají být automaticky generována a verifikována se nazývá množina relevantních otázek. Množina relevantních otázek je dána zadáním množiny relevantních antecedentů zadáním množiny relevantních sukcedentů zadáním množiny relevantních podmínek zadáním 4ft-kvantifikátoru. Antecedent, sukcedent i podmínka jsou konjunkce literálů. Literál je základní booleovský atribut A(α) nebo negace A(α) základního booleovského atributu. Příklady literálů jsou: A 1 (1), A K (6), A 7 (3, 5, 9), A 9 (4, 1). Literál A(α) nazýváme pozitivním literálem, literál A(α) nazýváme negativním literálem. Množinu α v literálu A(α) a A(α) nazýváme koeficient. Připomeňme, že α je množina kategorií (tj. přípustných hodnot) atributu A. 15

15 Relevantní antecedent je definován jako konjunkce ϕ = ϕ 1 ϕ 2... ϕ k kde ϕ 1, ϕ 2,..., ϕ k jsou dílčí antecedenty. Každý dílčí anteceent ϕ i patří do jedné množiny relevantních dílčích antecedentů To mimo jiné znamená, že každý dílčí antecedent je konjunkce literálů, stejně jako celý antecedent. Délka dílčího antecedentu je počet literálů v dílčím antecedentu. Zadání množiny relevantních antecedentů je dáno zadáním alespoň jedné množiny relevantních dílčích antecedentů. Množina relevantních dílčích antecedentů je zadána: minimální a maximální délkou dílčího antecedentu seznamem atributů z nichž budou generovány literály některé atributy mohou být označeny jako basic, platí že relevantní dílčí antecedent musí obsahovat alespoň jeden basic atribut jednoduchou definicí množiny literálů, které mají být automaticky generovány pro každý atribut navíc je možno definovat nekolik tříd ekvivalence, každý atribut může patřit nejvýše do jedné třídy ekvivalence; relevantní dílčí antecedent potom nesmí obsahovat dva nebo více atributů z jedné třídy ekvivalence. Poznamenejme, že minimální délka dílčího antecedentu může být 0, což vede ke konjunkcím délky 0 a že konjunkce délky 0 je podle definice vždy pravdivá. Délkou literálu A(α) nebo A(α) rozumíme počet kategorií v koeficientu α. Množina literálů, které mají být automaticky generovány je pro každý atribut dána: jedním ze sedmi možných typů koeficientu: subsets (podmnožiny), intervals (intervaly), cyclic intervals (cyklické intervaly), left cuts (levé řezy), right cuts (pravé řezy), cuts (řezy), one particular category (jednotlivá kategorie) minimální a maximální délkou literálu jednou z možností: generovat pouze pozitivní literály generovat pouze negativní literály generovat pozitivní i negativní literály Použijeme atribut A s kategoriemi {1, 2, 3, 4, 5} abychom na příkladech ukázali jednotlivé typy literálů: 16

16 subsets: použití podmnožin s délkou 2-3 definuje literály A(1,2), A(1,3), A(1,4), A(1,5), A(2,3),..., A(4,5), A(1,2,3), A(1,2,4), A(1,2,5), A(2,3,4),..., A(3,4,5) intervals: použití intervalů s délkou 2-3 definuje literály A(1,2), A(2,3), A(3,4), A(4,5), A(1,2,3), A(2,3,4) a A(3,4,5) cyclic intervals: použití cyklických intervalů s délkou 2-3 definuje literály A(1,2), A(2,3), A(3,4), A(4,5), A(5,1) A(1,2,3), A(2,3,4), A(3,4,5), A(4,5,1) a A(5,1,2) left cuts: použití levých řezů s maximální délkou 3 (minimální délka je v tomto případě vždy 1) definuje literály A(1), A(1,2) a A(1,2,3) right cuts: použití pravých řezů s maximální délkou 4 (minimální délka je v tomto případě vždy 1) definuje literály A(5), A(5,4), A(5,4,3) a A(5,4,3,2) cuts: toto zadání znamená, že jsou generovány levé i pravé řezy zadané délky one particular value znamená že bude použit literál s jednou zadanou kategorií, např A(2). Zadání množiny relevantních sukcedentů a zadání množiny relevantních podmínek jsou analogická k definici množiny relevantních antecedentů. Jeden atribut se může vyskytovat i ve dvou nebo ve všech třech definicích. Procedura 4ft-Miner však negeneruje taková asociační pravidla, která obsahují dva nebo více literálů odvozených z jednoho atributu. Zadání 4ft-kvantifikátoru je dáno seznamem základních 4ft-kvantifikátorů. Je k dispozici celkem 18 základních 4ft-kvantifikátorů. Víme již, že ke každému 4ft-kvantifikátoru je přiřazena podmínka týkající se čtyřpolních tabulek, viz odstavec 3.2. Taková podmínka je také přiřazena každému ze základních 4ft-kvantifikátorů. Ke 4ft-kvantifikátoru, který je dán seznamem základních 4ft-kvantifikátorů, je přiřazena podmínka která je konjunkcí podmínek přiřazených jednotlivých základním 4ft-kvantifikátorům použitým v seznamu. Dále uvedeme podmínky přiřazené některým základním 4ft-kvantifikátorům. Jedná se zejména o ty základní kvantifikátory, ze kterých je možno sestavit 4ftkvantifikátory uvedené v odstavci 3.2. Požíváme značení frekvencí z tabulky 3.1. Základní 4ft-kvantifikátor BASE Base s parametrem Base je pro Base 0 definován podmínkou a Base. Volitelně je Base možno zadat v procentech (z intervalu 0, 100 ) z celkového počtu řádků analyzované matice. Je-li Base zadáno v procentech, pak podmínka je 100 a n Base. 17

17 Základní 4ft-kvantifikátor CEILING Ceiling s parametrem Ceiling je pro Ceiling 0 definován podmínkou a Ceiling. Volitelně je Ceiling možno zadat v procentech (z intervalu 0, 100 ) z celkového počtu řádků analyzované matice. Je-li Ceiling zadáno v procentech, pak podmínka je 100 a n Ceiling. Základní 4ft-kvantifikátor p fundované implikace je pro 0 < p 1 definován podmínkou a a + b p. Základní 4ft-kvantifikátor p fundované dvojité implikace je pro 0 < p 1 definován podmínkou a a + b + c p. Základní 4ft-kvantifikátor p fundované ekvivalence je pro 0 < p 1 definován podmínkou a + d a + b + c + d p. Základní 4ft-kvantifikátor p kladné odchylky od průměru je pro 0 < p a definován podmínkou a a + b a + c (1 + p) a + b + c + d. Platí tedy například, že 4ft-kvantifikátor p,base fundované implikace je možno nahradit seznamem obsahující dva základní 4ft-kvantifikátory: základní 4ft-kvantifikátor BASE Base a základní 4ft-kvantifikátor p fundované implikace. Podobně pro ostatní 4ft-kvantifikátory. Zadání práce s neúplnou informací a zadání způsobu výstupu pro implikace bude podrobněji vysvětleno v některé z příštích versí těchto skript. Doporučujeme použít volby dle obr Výstup procedury 4ft-Miner Výstupem procedury 4ft-Miner jsou všechna prostá asociační pravidla. Asociační pravidlo je prosté, pokud je pravdivé a zřejmým způsobem neplyne z jiného, ve výstupu již uvedeného pravidla. Například platí, že je-li pravdivé asociační pravidlo A 1 (1) p,base A 2 (1), pak je pravdivé i asociační pravidlo A 1 (1) p,base A 2 (1, 2). 18

18 Obrázek 3.3: Zadání dalších parametrů pro proceduru 4ft-Miner Podrobnější výklad k prostým asociačním pravidlům bude podán v některé z příštích versí těchto skript. Poznamenejme ještě, že je-li výstup tvořen všemi prostými asociačními pravidly, pak z těchto pravidel plynou všechna pravdivá asociační pravidla. 19

19 20

20 Kapitola 4 Asociační pravidla a nákupní košík Pojem asociační pravidlo byl zaveden Agravalem, viz např. [1] v souvislosti s analýzou nákupního košíku. V souvislosti s metodou GUHA nebyl pojem asociačního pravidla používán, místo něho se používal pojem hypotéza viz např. [7]. Byl však používán pojem asociační kvantifikátor, viz např. [4, 7, 12, 11]. Cílem tohoto odstavce je poukázat na souvislosti asociačních pravidel zavedených Agravalem a asociačních pravidel používaných v souvisosti s metodou GUHA. Abychom je rozlišili, budeme pro asociační pravidla zavedená Agravalem používat v této kapitole pojem klasické asociační pravidlo. Klasickým asociačním pravidlem se obvykle rozumí výraz X Y kde X a Y jsou množiny prvků. Tento výraz říká, že transakce obsahující množinu prvků X mají tendenci obsahovat i množinu prvků Y. Příkladem transakcí jsou nákupy reprezentované nákupními košíky. Každý z nákupních košíků b 1,..., b n obsahuje některé z položek P 1, P 2,..., P K, viz obr nákupní košík položky b 1 P 1, P 2, P 3, P 4, P 5 b 2 P 2, P 3, P 4, P 5, P K b 3 P 1, P 3, P 12 b 4 P 1, P 3.. b n 1 P 2, P 4, P 7, P 9, P 107 b n P 2, P 4, P K Obrázek 4.1: Příklad množiny transakcí - nákupních košíků b 1,..., b n 21

21 Výraz {P 2, P 5 } {P 1, P 3 } je příklad asociačního pravidla které říká, že nákupní košíky obsahující položky P 2 a P 5 často obsahují i položky P 1 a P 3. Používají se dvě míry intenzity asociačního pravidla - podpora (support) a konfidence (confidence). Podpora asociačního pravidla X Y je podíl počtu transakcí obsahujících jak X tak i Y ku počtu všech transakcí. Konfidence je podíl počtu transakcí obsahujících jak X tak Y ku počtu transakcí obsahujících X. Pro formální definici těchto měr intenzity se zavádí výraz M(X) který označuje množinu všech nákupních košíků obsahujících množinu položek X. Podobně pro M(Y ), výraz M(X Y ) označuje množinu všech nákupních košíků obsahujících sjednocení X Y, tedy jak množinu položek X tak i množinu položek Y. Počet prvků v množině Ω se značí Ω, výraz M(X) tedy značí počet košíků obsahujících množimu položek X, analogicky pro M(Y ) a M(X Y ). Konfidence asociačního pravidla X Y se značí conf(x Y ) podpora asociačního pravidla X Y se značí sup(x Y ). Formální definice konfidence a podpory tedy je conf(x Y ) = M(X Y ) M(X) kde n je počet košíků v celé databázi. a sup(x Y ) = M(X Y ) n Asociační pravidlo X Y je v dané databázi pravdivé na úrovni konfidence C a podpory S jestliže platí conf(x Y ) C a zároveň sup(x Y ) S. Na příkladu ukážeme, že takto definované klasické asociační pravidlo můžeme vyjádřit pomocí čtyřpolní tabulky. Použijeme transakční databázi z obr Tuto transakční databázi můžeme reprezentovat jako booleovskou matici dat KOSIKY. Její řádky odpovídají jednotlivým košíkům a sloupce jsou booleovské atributy odpovídající jednotlivým položkám. Ve sloupci, který odpovídá položce P 1, je v řádku b 1 uvedeno 1 protože košík b 1 obsahuje položku P 1. V tomtéž sloupci je v řádku b 2 uvedeno 0, protože košík b 2 položku P 1 neobsahuje. Analogicky pro ostatní sloupce a řádky, viz obr Budeme se zabývat výše uvedeným asociačním pravidlem {P 2, P 5 } {P 1, P 3 }. V matici dat M KOSIKY jsou ještě dva přidané sloupce. V prvním přidaném sloupci je booleovský atribut P 2 P 5 který je v řádku pravdivý právě když nákupní košík odpovídající tomuto řádku obsahuje obě položky P 2 a P 5. Analogicky, ve druhém přidaném sloupci je booleovský atribut P 1 P 3, který je v řádku pravdivý právě když nákupní košík odpovídající tomuto řádku obsahuje obě položky P 1 a P 3. 22

22 nákupní košík P 1 P 2 P 3 P 4 P 5... P K P 2 P 5 P 1 P 3 b b b b b n b n Obrázek 4.2: Matice dat KOSIKY Ukážeme, že podmínku pravdivosti asociačního pravidla X Y na úrovni konfidence C a podpory S v transakční databázi z obr. 4.1 je možno vyjádřit pomocí vhodné čtyřpolní tabulky na matici dat M KOSIKY. Připomeňme, že podpora asociačního pravidla X Y je podíl počtu transakcí obsahujících jak X tak i Y ku počtu všech transakcí a že konfidence asociačního pravidla X Y je podíl počtu transakcí obsahujících jak X tak Y ku počtu transakcí obsahujících X. a V případě asociačního pravidla {P 2, P 5 } {P 1, P 3 } tedy platí conf({p 2, P 5} {P 1, P 3}) = počet košíků obsahujících jak P2 a P5 tak i P1 a P3 počet košíků obsahujících P 2 a P 5 sup({p 2, P 5} {P 1, P 3}) = počet košíků obsahujících jak P2 a P5 tak i P1 a P3 n. Pro vyjádření conf({p 2, P 5 } {P 1, P 3 }) a sup({p 2, P 5 } {P 1, P 3 }) můžeme použít kontingenční tabulku booleovských atributů P 2 P 5 a P 1 P 3 v matici dat KOSIKY, viz Tab KOSIKY P 1 P 3 (P 1 P 3 ) P 2 P 5 a b r (P 2 P 5 ) c d s k l n Tabulka 4.1: 4ft tabulka P 2 P 5 a P 1 P 3 v matici KOSIKY Z definice atributů P 2 P 5 a P 1 P 3 plyne, že počet košíků obsahujících jak P 2 a P 5 tak i P 1 a P 3 = a a počet košíků obsahujících P 2 a P 5 = a + b. 23

23 Platí tedy conf({p 2, P 5 } {P 1, P 3 }) = a a + b a sup({p 2, P 5 } {P 1, P 3 }) = a n. Poznamenejme, že konfidence je definována stejně jako základní 4ft-kvantifikátor p fundované implikace a že suport je definován stejně jako základní 4ftkvantifikátor BASE Base pokud použijeme zadání Base v procentech, viz odstavec 3.3. Podrobnější výklad bude podán v další versi těchto provizorních skript. Je třeba vzít v úvahu i základní 4ft-kvantifikátor SUPP p, který je definován podmínkou a a+b+c+d p, pro podmíněná asociační pravidla se však pro výpočet čtyřpolní tabulky berou v úvahu pouze objekty splňující podmínku. 24

24 Literatura [1] Agraval R et al (1996) Fast Discovery of Association Rules. In: Fayyad UM et al (eds) Advances in Knowledge Discovery and Data Mining. AAAI Press, Menlo Park (CA) [2] Berka P, Ivánek J (1994) Automated knowledge acquisition for PROSPECTOR-like expert systems. In: Bergadano F, de Raedt L (eds) Proceedings of ECML 94. Springer, Berlin Heidelberg New York [3] Berka P: (2003) Dobývání znalostí z databází. ACADEMIA, Praha [4] Hájek P, Havránek T (1978) Mechanising Hypothesis Formation - Mathematical Foundations for a General Theory. Springer, Berlin Heidelberg New York [5] Hájek P (guest editor) (1978) International Journal of Man-Machine Studies, special issue on GUHA, 10 [6] Hájek P (guest editor) (1981) International Journal of Man-Machine Studies, second special issue on GUHA, 15 [7] Hájek P, Havránek T, Chytil M (1983) GUHA Method. Academia, Praha [8] Hájek P, Sochorová A, Zvárová J (1995) GUHA for personal computers. Computational Statistics & Data Analysis 19: [9] Rauch J (1978) Some Remarks on Computer Realisations of GUHA Procedures. International Journal of Man-Machine Studies 10: [10] Rauch J (1998) Classes of Four-Fold Table Quantifiers. In: Zytkow J, Quafafou M (eds) Principles of Data Mining and Knowledge Discovery. Springer, Berlin Heidelberg New York [11] Rauch, J (2005) Logic of Association Rules. Applied Intelligence, č. 22, s [12] Rauch, J (2004) Asociační pravidla a matematická logika. In: SNÁŠEL, Václav (ed.). Znalosti Ostrava : VŠB TU Ostrava, s

25 [13] Šimůnek M (2003) Academic KDD Project LISp-Miner. In Abraham A et al (eds) Advances in Soft Computing - Intelligent Systems Design and Applications, Springer, Berlin Heidelberg New York %bibitemscr:04 Strossa P, Černý Z, Rauch J (2004) 26

DOBÝVÁNÍ ZNALOSTÍ Z DATABÁZÍ PŘÍKLADY APLIKACÍ V KARDIOLOGICKÝCH DATECH Jan Rauch

DOBÝVÁNÍ ZNALOSTÍ Z DATABÁZÍ PŘÍKLADY APLIKACÍ V KARDIOLOGICKÝCH DATECH Jan Rauch DOBÝVÁNÍ ZNALOSTÍ Z DATABÁZÍ PŘÍKLADY APLIKACÍ V KARDIOLOGICKÝCH DATECH Jan Rauch Anotace: Příspěvek obsahuje základní informace o dobývání znalostí jakožto důležité disciplíně informatiky a ukazuje příklady

Více

Analytické procedury v systému LISp-Miner

Analytické procedury v systému LISp-Miner Dobývání znalostí z databází MI-KDD ZS 2011 Přednáška 8 Analytické procedury v systému LISp-Miner Část II. (c) 2011 Ing. M. Šimůnek, Ph.D. KIZI, Fakulta informatiky a statistiky, VŠE Praha Evropský sociální

Více

Úvod do dobývání. znalostí z databází

Úvod do dobývání. znalostí z databází POROZUMĚNÍ 4iz260 Úvod do DZD Úvod do dobývání DOMÉNOVÉ OBLASTI znalostí z databází VYUŽITÍ VÝSLEDKŮ POROZUMĚNÍ DATŮM DATA VYHODNO- CENÍ VÝSLEDKŮ MODELOVÁNÍ (ANALYTICKÉ PROCEDURY) PŘÍPRAVA DAT Ukázka slidů

Více

Dobývání znalostí z databází (MI-KDD) Přednáška číslo 4 Asociační pravidla

Dobývání znalostí z databází (MI-KDD) Přednáška číslo 4 Asociační pravidla Dobývání znlostí z dtbází (MI-KDD) Přednášk číslo 4 Asociční prvidl (c) prof. RNDr. Jn Ruch, CSc. KIZI, Fkult informtiky sttistiky VŠE zimní semestr 2011/2012 Evropský sociální fond Prh & EU: Investujeme

Více

LISp-Miner: systém pro získávání znalostí z dat 1

LISp-Miner: systém pro získávání znalostí z dat 1 LISp-Miner: systém pro získávání znalostí z dat 1 Petr Berka, Jan Rauch, Milan Šimůnek VŠE Praha Nám. W. Churchilla 4, Praha 3 e-mail: {berka,rauch,simunek}@vse.cz Abstrakt. Systém LISp-Miner je otevřený

Více

Dobývání znalostí z databází (MI-KDD) Přednáška číslo 5 Zajímavé dvojice podmnožin objektů, procedura SD4ft-Miner

Dobývání znalostí z databází (MI-KDD) Přednáška číslo 5 Zajímavé dvojice podmnožin objektů, procedura SD4ft-Miner Dobývání znalostí z databází (MI-KDD) Přednáška číslo 5 Zajímavé dvojice podmnožin objektů, procedura SD4ft-Miner (c) prof. RNDr. Jan Rauch, CSc. KIZI, Fakulta informatiky a statistiky VŠE zimní semestr

Více

Asociační pravidla (metoda GUHA)

Asociační pravidla (metoda GUHA) Vysoká škola báňská Technická univerzita Ostrava Fakulta elektrotechniky a informatiky Katedra informatiky Asociační pravidla (metoda GUHA) Ing. Michal Burda () Získávání znalostí z dat Brno, 27. ledna

Více

Dolování asociačních pravidel

Dolování asociačních pravidel Dolování asociačních pravidel Miloš Trávníček UIFS FIT VUT v Brně Obsah přednášky 1. Proces získávání znalostí 2. Asociační pravidla 3. Dolování asociačních pravidel 4. Algoritmy pro dolování asociačních

Více

Dobývání znalostí z databází MI-KDD ZS 2011 Přednáška 2. Projekt LISp-Miner.

Dobývání znalostí z databází MI-KDD ZS 2011 Přednáška 2. Projekt LISp-Miner. Dobývání znalostí z databází MI-KDD ZS 2011 Přednáška 2 Projekt LISp-Miner http://lispminer.vse.cz (c) 2011 Ing. M. Šimůnek, Ph.D. KIZI, Fakulta informatiky a statistiky, VŠE Praha Evropský sociální fond

Více

Základní pojmy matematické logiky

Základní pojmy matematické logiky KAPITOLA 1 Základní pojmy matematické logiky Matematická logika se zabývá studiem výroků, jejich vytváření a jejich pravdivostí. Základním kamenem výrokové logiky jsou výroky. 1. Výroková logika Co je

Více

Formální systém výrokové logiky

Formální systém výrokové logiky Formální systém výrokové logiky 1.Jazyk výrokové logiky Nechť P = {p,q,r, } je neprázdná množina symbolů, které nazýváme prvotní formule. Symboly jazyka L P výrokové logiky jsou : a) prvky množiny P, b)

Více

Místo pojmu výroková formule budeme používat zkráceně jen formule. Při jejich zápisu

Místo pojmu výroková formule budeme používat zkráceně jen formule. Při jejich zápisu VÝROKOVÁ LOGIKA Matematická logika se zabývá studiem výroků, jejich vytváření a jejich pravdivostí. Základním kamenem výrokové logiky jsou výroky. Co je výrok nedefinujejme, pouze si řekneme, co si pod

Více

Bakalářská matematika I

Bakalářská matematika I do předmětu Mgr. Jaroslav Drobek, Ph. D. Katedra matematiky a deskriptivní geometrie Bakalářská matematika I Podmínky absolvování předmětu Zápočet Zkouška 1 účast na přednáškách alespoň v minimálním rozsahu,

Více

Dobývání znalostí z databází (MI-KDD) Přednáška číslo 9 Využití doménových znalostí

Dobývání znalostí z databází (MI-KDD) Přednáška číslo 9 Využití doménových znalostí Dobývání znalostí z databází (MI-KDD) Přednáška číslo 9 Využití doménových znalostí (c) prof. RNDr. Jan Rauch, CSc. KIZI, Fakulta informatiky a statistiky VŠE zimní semestr 2011/2012 Evropský sociální

Více

Nová GUHA-procedura ETree-Miner v systému LISp-Miner

Nová GUHA-procedura ETree-Miner v systému LISp-Miner Nová GUHA-procedura ETree-Miner v systému LISp-Miner Milan Šimůnek Laboratoř pro inteligentní systémy Praha Fakulta informatiky a statistiky, VŠE Praha nám. W. Churchilla 4, 130 67 Praha 3 simunek@vse.cz

Více

4ft-Miner pro začátečníky Získávání znalostí z databází

4ft-Miner pro začátečníky Získávání znalostí z databází 4ft-Miner pro začátečníky Získávání znalostí z databází Dobývání znalostí z databází (DZD) Knowledge Discovery in (from) Databases (KDD) Data Mining (DM) Materiál pro posluchače kurzů IZI211 Metody zpracování

Více

Projekt LISp-Miner. M. Šimůnek

Projekt LISp-Miner.   M. Šimůnek Projekt LISp-Miner http://lispminer.vse.cz M. Šimůnek Obsah Systém LISp-Miner Vývoj systému v dlouhém období ETree-Miner Project LISp-Miner 2 Systém LISp-Miner Metoda GUHA (od roku 1966) předchozí implementace

Více

EXPERIMENTÁLNÍ GUHA PROCEDURY

EXPERIMENTÁLNÍ GUHA PROCEDURY Univerzita Karlova v Praze Matematicko-fyzikální fakulta DIPLOMOVÁ PRÁCE Tomáš Kuchař EXPERIMENTÁLNÍ GUHA PROCEDURY Katedra softwarového inženýrství Vedoucí diplomové práce: Doc. RNDr. Jan Rauch, CSc.

Více

Matematická analýza 1

Matematická analýza 1 Matematická analýza 1 ZS 2019-20 Miroslav Zelený 1. Logika, množiny a základní číselné obory 2. Limita posloupnosti 3. Limita a spojitost funkce 4. Elementární funkce 5. Derivace 6. Taylorův polynom Návod

Více

Úvod do informatiky. Miroslav Kolařík

Úvod do informatiky. Miroslav Kolařík Úvod do informatiky přednáška první Miroslav Kolařík Zpracováno dle učebního textu prof. Bělohlávka: Úvod do informatiky, KMI UPOL, Olomouc 2008. Obsah 1 Co a k čemu je logika? 2 Výroky a logické spojky

Více

Negativní informace. Petr Štěpánek. S použitím materiálu M.Gelfonda a V. Lifschitze. Logické programování 15 1

Negativní informace. Petr Štěpánek. S použitím materiálu M.Gelfonda a V. Lifschitze. Logické programování 15 1 Negativní informace Petr Štěpánek S použitím materiálu M.Gelfonda a V. Lifschitze 2009 Logické programování 15 1 Negace jako neúspěch Motivace: Tvrzení p (atomická formule) neplatí, jestliže nelze odvodit

Více

teorie logických spojek chápaných jako pravdivostní funkce

teorie logických spojek chápaných jako pravdivostní funkce Výroková logika teorie logických spojek chápaných jako pravdivostní funkce zabývá se způsoby tvoření výroků pomocí spojek a vztahy mezi pravdivostí různých výroků používá specifický jazyk složený z výrokových

Více

Univerzita Karlova v Praze Matematicko-fyzikální fakulta DIPLOMOVÁ PRÁCE

Univerzita Karlova v Praze Matematicko-fyzikální fakulta DIPLOMOVÁ PRÁCE Univerzita Karlova v Praze Matematicko-fyzikální fakulta DIPLOMOVÁ PRÁCE Miron Tegze Procedura SDKL-Miner pro dobývání znalostí z databází Katedra softwarového inženýrství Vedoucí diplomové práce: doc.

Více

Matematika B101MA1, B101MA2

Matematika B101MA1, B101MA2 Matematika B101MA1, B101MA2 Zařazení předmětu: povinný předmět 1.ročníku bc studia 2 semestry Rozsah předmětu: prezenční studium 2 + 2 kombinované studium 16 + 0 / semestr Zakončení předmětu: ZS zápočet

Více

LOGIKA VÝROKOVÁ LOGIKA

LOGIKA VÝROKOVÁ LOGIKA LOGIKA Popisuje pravidla odvozování jedněch tvrzení z druhých. Je to myšlenková cesta ke správným závěrům. Vznikla jako součást filosofie. Zakladatelem byl Aristoteles. VÝROKOVÁ LOGIKA Obsahuje syntaktická,

Více

0. ÚVOD - matematické symboly, značení,

0. ÚVOD - matematické symboly, značení, 0. ÚVOD - matematické symboly, značení, číselné množiny Výroky Výrok je každé sdělení, u kterého lze jednoznačně rozhodnout, zda je či není pravdivé. Každému výroku lze proto přiřadit jedinou pravdivostní

Více

1 Výroková logika 1. 2 Predikátová logika 3. 3 Důkazy matematických vět 4. 4 Doporučená literatura 7

1 Výroková logika 1. 2 Predikátová logika 3. 3 Důkazy matematických vět 4. 4 Doporučená literatura 7 1 Výroková logika 1 Výroková logika 1 2 Predikátová logika 3 3 Důkazy matematických vět 4 4 Doporučená literatura 7 Definice 1.1 Výrokem rozumíme každé sdělení, o kterém má smysl uvažovat, zda je, či není

Více

V předchozí kapitole jsme podstatným způsobem rozšířili naši představu o tom, co je to číslo. Nadále jsou pro nás důležité především vlastnosti

V předchozí kapitole jsme podstatným způsobem rozšířili naši představu o tom, co je to číslo. Nadále jsou pro nás důležité především vlastnosti Kapitola 5 Vektorové prostory V předchozí kapitole jsme podstatným způsobem rozšířili naši představu o tom, co je to číslo. Nadále jsou pro nás důležité především vlastnosti operací sčítání a násobení

Více

Kapitola 1. Úvod. 1.1 Značení. 1.2 Výroky - opakování. N... přirozená čísla (1, 2, 3,...). Q... racionální čísla ( p, kde p Z a q N) R...

Kapitola 1. Úvod. 1.1 Značení. 1.2 Výroky - opakování. N... přirozená čísla (1, 2, 3,...). Q... racionální čísla ( p, kde p Z a q N) R... Kapitola 1 Úvod 1.1 Značení N... přirozená čísla (1, 2, 3,...). Z... celá čísla ( 3, 2, 1, 0, 1, 2,...). Q... racionální čísla ( p, kde p Z a q N) q R... reálná čísla C... komplexní čísla 1.2 Výroky -

Více

Matematická logika. Miroslav Kolařík

Matematická logika. Miroslav Kolařík Matematická logika přednáška třetí Miroslav Kolařík Zpracováno dle textu R. Bělohlávka: Matematická logika poznámky k přednáškám, 2004. a dle učebního textu R. Bělohlávka a V. Vychodila: Diskrétní matematika

Více

Základy vytěžování dat

Základy vytěžování dat Základy vytěžování dat předmět A7Bb36vyd Vytěžování dat Filip Železný, Miroslav Čepek, Radomír Černoch, Jan Hrdlička katedra kybernetiky a katedra počítačů ČVUT v Praze, FEL Evropský sociální fond Praha

Více

Booleovská algebra. Booleovské binární a unární funkce. Základní zákony.

Booleovská algebra. Booleovské binární a unární funkce. Základní zákony. Booleovská algebra. Booleovské binární a unární funkce. Základní zákony. Tomáš Bayer bayertom@natur.cuni.cz Katedra aplikované geoinformatiky a kartografie, Přírodovědecká fakulta UK. Tomáš Bayer bayertom@natur.cuni.cz

Více

Každé formuli výrokového počtu přiřadíme hodnotu 0, půjde-li o formuli nepravdivou, a hodnotu 1, půjde-li. α neplatí. β je nutná podmínka pro α

Každé formuli výrokového počtu přiřadíme hodnotu 0, půjde-li o formuli nepravdivou, a hodnotu 1, půjde-li. α neplatí. β je nutná podmínka pro α 1. JAZYK ATEATIKY 1.1 nožiny nožina je souhrn objektů určitých vlastností, které chápeme jako celek. ZNAČENÍ. x A x A θ A = { { a, b a A = B A B 0, 1 2 a, a,..., a n x patří do množiny A x nepatří do množiny

Více

Vybrané přístupy řešení neurčitosti

Vybrané přístupy řešení neurčitosti Vybrané přístupy řešení neurčitosti Úvod do znalostního inženýrství, ZS 2015/16 8-1 Faktory jistoty Jedná se o přístup založený na ad hoc modelech Hlavním důvodem vzniku tohoto přístupu je omezení slabin

Více

1 Báze a dimenze vektorového prostoru 1

1 Báze a dimenze vektorového prostoru 1 1 Báze a dimenze vektorového prostoru 1 Báze a dimenze vektorového prostoru 1 2 Aritmetické vektorové prostory 7 3 Eukleidovské vektorové prostory 9 Levá vnější operace Definice 5.1 Necht A B. Levou vnější

Více

Aplikace asociačních pravidel ve společnosti Zinest s.r.o.

Aplikace asociačních pravidel ve společnosti Zinest s.r.o. Aplikace asociačních pravidel ve společnosti Zinest sro Daniel Rydzi Zinest sro rydzi@zinestcz Jan Rauch Katedra informačního a znalostního inženýrství VŠE rauch@vsecz Abstrakt Tento článek si klade za

Více

INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ. Modernizace studijního programu Matematika na PřF Univerzity Palackého v Olomouci CZ.1.07/2.2.00/28.

INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ. Modernizace studijního programu Matematika na PřF Univerzity Palackého v Olomouci CZ.1.07/2.2.00/28. INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ Modernizace studijního programu Matematika na PřF Univerzity Palackého v Olomouci CZ.1.07/2.2.00/28.0141 Báze vektorových prostorů, transformace souřadnic Michal Botur Přednáška

Více

RELATIONAL DATA ANALYSIS

RELATIONAL DATA ANALYSIS KATEDRA INFORMATIKY PŘÍRODOVĚDECKÁ FAKULTA UNIVERZITA PALACKÉHO RELATIONAL DATA ANALYSIS RADIM BELOHLAVEK, JAN OUTRATA VÝVOJ TOHOTO UČEBNÍHO TEXTU JE SPOLUFINANCOVÁN EVROPSKÝM SOCIÁLNÍM FONDEM A STÁTNÍM

Více

Příprava dat v softwaru Statistica

Příprava dat v softwaru Statistica Příprava dat v softwaru Statistica Software Statistica obsahuje pokročilé nástroje pro přípravu dat a tvorbu nových proměnných. Tyto funkcionality přinášejí značnou úsporu času při přípravě datového souboru,

Více

Matematická logika. Miroslav Kolařík

Matematická logika. Miroslav Kolařík Matematická logika přednáška šestá Miroslav Kolařík Zpracováno dle textu R. Bělohlávka: Matematická logika poznámky k přednáškám, 2004. a dle učebního textu R. Bělohlávka a V. Vychodila: Diskrétní matematika

Více

4.2 Syntaxe predikátové logiky

4.2 Syntaxe predikátové logiky 36 [070507-1501 ] 4.2 Syntaxe predikátové logiky V tomto oddíle zavedeme syntaxi predikátové logiky, tj. uvedeme pravidla, podle nichž se tvoří syntakticky správné formule predikátové logiky. Význam a

Více

DEFINICE Z LINEÁRNÍ ALGEBRY

DEFINICE Z LINEÁRNÍ ALGEBRY DEFINICE Z LINEÁRNÍ ALGEBRY Skripta Matematické metody pro statistiku a operační výzkum (Nešetřilová, H., Šařecová, P., 2009). 1. definice Vektorovým prostorem rozumíme neprázdnou množinu prvků V, na které

Více

Výroková a predikátová logika - V

Výroková a predikátová logika - V Výroková a predikátová logika - V Petr Gregor KTIML MFF UK ZS 2015/2016 Petr Gregor (KTIML MFF UK) Výroková a predikátová logika - V ZS 2015/2016 1 / 21 Dokazovací systémy VL Hilbertovský kalkul Hilbertovský

Více

Vědecký tutoriál, část I. A Tutorial. Vilém Vychodil (Univerzita Palackého v Olomouci)

Vědecký tutoriál, část I. A Tutorial. Vilém Vychodil (Univerzita Palackého v Olomouci) ..! POSSIBILISTIC Laboratoř pro analýzu INFORMATION: a modelování dat Vědecký tutoriál, část I A Tutorial Vilém Vychodil (Univerzita Palackého v Olomouci) George J. Klir State University of New York (SUNY)

Více

Základní pojmy teorie množin Vektorové prostory

Základní pojmy teorie množin Vektorové prostory Základní pojmy teorie množin Přednáška MATEMATIKA č. 1 Katedra ekonometrie FEM UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz 7. 10. 2010 Základní pojmy teorie množin Základní pojmy

Více

Predikátová logika. Teoretická informatika Tomáš Foltýnek

Predikátová logika. Teoretická informatika Tomáš Foltýnek Predikátová logika Teoretická informatika Tomáš Foltýnek foltynek@pef.mendelu.cz strana 2 Opakování z minulé přednášky Z čeho se skládá jazyk výrokové logiky? Jaká jsou schémata pro axiomy VL? Formulujte

Více

INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ. Modernizace studijního programu Matematika na PřF Univerzity Palackého v Olomouci CZ.1.07/2.2.00/28.

INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ. Modernizace studijního programu Matematika na PřF Univerzity Palackého v Olomouci CZ.1.07/2.2.00/28. INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ Modernizace studijního programu Matematika na PřF Univerzity Palackého v Olomouci CZ.1.07/2.2.00/28.0141 Relace, zobrazení, algebraické struktury Michal Botur Přednáška

Více

Matematika I. Přednášky: Mgr. Radek Výrut, Zkouška:

Matematika I. Přednášky: Mgr. Radek Výrut, Zkouška: Přednášky: Mgr. Radek Výrut, Matematika I katedra matematiky, UL-605, rvyrut@kma.zcu.cz tel.: 377 63 2658 Zkouška: Písemná část zkoušky - příklady v rozsahu zápočtových prací Ústní část zkoušky - základní

Více

METODOLOGIE I - METODOLOGIE KVANTITATIVNÍHO VÝZKUMU

METODOLOGIE I - METODOLOGIE KVANTITATIVNÍHO VÝZKUMU METODOLOGIE I - METODOLOGIE KVANTITATIVNÍHO VÝZKUMU vyučující doc. RNDr. Jiří Zháněl, Dr. M I 4 Metodologie I 7. ANALÝZA DAT (KVANTITATIVNÍ VÝZKUM) (MATEMATICKÁ) STATISTIKA DESKRIPTIVNÍ (popisná) ANALYTICKÁ

Více

M - Výroková logika VARIACE

M - Výroková logika VARIACE M - Výroková logika Autor: Mgr. Jaromír Juřek Kopírování a další šíření povoleno pouze s uvedením odkazu na www.jarjurek.cz. VARIACE 1 Tento dokument byl kompletně vytvořen, sestaven a vytištěn v programu

Více

Základy logiky a teorie množin

Základy logiky a teorie množin Pracovní text k přednášce Logika a teorie množin (I/2007) 1 1 Struktura přednášky Matematická logika 2 Výroková logika Základy logiky a teorie množin Petr Pajas pajas@matfyz.cz Predikátová logika 1. řádu

Více

Úvod do logiky (VL): 5. Odvození výrokových spojek z jiných

Úvod do logiky (VL): 5. Odvození výrokových spojek z jiných Logika: systémový rámec rozvoje oboru v ČR a koncepce logických propedeutik pro mezioborová studia (reg. č. CZ.1.07/2.2.00/28.0216, OPVK) Úvod do logiky (VL): 5. Odvození z jiných doc. PhDr. Jiří Raclavský,

Více

Úvod do logiky (presentace 2) Naivní teorie množin, relace a funkce

Úvod do logiky (presentace 2) Naivní teorie množin, relace a funkce Úvod do logiky (presentace 2) Naivní teorie množin, relace a funkce Marie Duží marie.duzi@vsb.cz 1 Úvod do teoretické informatiky (logika) Naivní teorie množin Co je to množina? Množina je soubor prvků

Více

Dobývání znalostí z databází (MI-KDD) Přednáška číslo 1 - Úvod

Dobývání znalostí z databází (MI-KDD) Přednáška číslo 1 - Úvod Dbývání znalstí z databází (MI-KDD) Přednáška čísl 1 - Úvd (c) prf. RNDr. Jan Rauch, CSc. KIZI, Fakulta infrmatiky a statistiky VŠE zimní semestr 2011/2012 Evrpský sciální fnd Praha & EU: Investujeme d

Více

Matematická logika. Rostislav Horčík. horcik

Matematická logika. Rostislav Horčík.    horcik Matematická logika Rostislav Horčík horcik@math.feld.cvut.cz horcik@cs.cas.cz www.cs.cas.cz/ horcik Rostislav Horčík (ČVUT FEL) Y01MLO Letní semestr 2007/2008 1 / 20 Predikátová logika Motivace Výroková

Více

Hodnocení (ne)zajímavosti asociačních pravidel za využití báze znalostí

Hodnocení (ne)zajímavosti asociačních pravidel za využití báze znalostí Hodnocení (ne)zajímavosti asociačních pravidel za využití báze znalostí Přemysl Václav Duben, Stanislav Vojíř Katedra informačního a znalostního inženýrství, FIS, Vysoká škola ekonomická v Praze nám. W.

Více

Výpočet na gridu a LM TaskPooler

Výpočet na gridu a LM TaskPooler Dobývání znalostí z databází MI-KDD ZS 2011 Přednáška 10 Výpočet na gridu a LM TaskPooler v systému LISp-Miner (c) 2011 Ing. M. Šimůnek, Ph.D. KIZI, Fakulta informatiky a statistiky, VŠE Praha Evropský

Více

Organizace. Zápočet: test týden semestru (pátek) bodů souhrnný test (1 pokus) Zkouška: písemná část ( 50 bodů), ústní část

Organizace. Zápočet: test týden semestru (pátek) bodů souhrnný test (1 pokus) Zkouška: písemná část ( 50 bodů), ústní část Matematika I 1/15 2/15 Organizace Zápočet: test 6. + 11. týden semestru (pátek) 80 bodů 50 79 bodů souhrnný test (1 pokus) Zkouška: písemná část ( 50 bodů), ústní část www.vscht.cz/mat Výuka www.vscht.cz/mat/jana.nemcova

Více

1 Základní pojmy. 1.1 Množiny

1 Základní pojmy. 1.1 Množiny 1 Základní pojmy V této kapitole si stručně připomeneme základní pojmy, bez jejichž znalostí bychom se v dalším studiu neobešli. Nejprve to budou poznatky z logiky a teorie množin. Dále se budeme věnovat

Více

PŘÍRODOVĚDECKÁ FAKULTA UNIVERZITY PALACKÉHO KATEDRA INFORMATIKY DIPLOMOVÁ PRÁCE. Analýza dat ze studentských dotazníků Bc.

PŘÍRODOVĚDECKÁ FAKULTA UNIVERZITY PALACKÉHO KATEDRA INFORMATIKY DIPLOMOVÁ PRÁCE. Analýza dat ze studentských dotazníků Bc. PŘÍRODOVĚDECKÁ FAKULTA UNIVERZITY PALACKÉHO KATEDRA INFORMATIKY DIPLOMOVÁ PRÁCE Analýza dat ze studentských dotazníků 2013 Bc. Tomáš Matonoha Anotace Data mining je proces získávání netriviálních a dříve

Více

Matematika pro informatiky KMA/MATA

Matematika pro informatiky KMA/MATA Matematika pro informatiky KMA/MATA Informace k předmětu Mgr. Přemysl Rosa rosapr00@pf.jcu.cz, J349 Konzultační hodiny v ZS: úterý 10-11, čtvrtek 15-16 nebo individuálně po předchozí domluvě aktivní účast

Více

Paradigmata programování 1

Paradigmata programování 1 Paradigmata programování 1 Explicitní aplikace a vyhodnocování Vilém Vychodil Katedra informatiky, PřF, UP Olomouc Přednáška 6 V. Vychodil (KI, UP Olomouc) Explicitní aplikace a vyhodnocování Přednáška

Více

Teoretická informatika Tomáš Foltýnek foltynek@pef.mendelu.cz. Algebra Struktury s jednou operací

Teoretická informatika Tomáš Foltýnek foltynek@pef.mendelu.cz. Algebra Struktury s jednou operací Teoretická informatika Tomáš Foltýnek foltynek@pef.mendelu.cz Algebra Struktury s jednou operací Teoretická informatika 2 Proč zavádíme algebru hledáme nástroj pro popis objektů reálného světa (zejména

Více

MATICE. a 11 a 12 a 1n a 21 a 22 a 2n A = = [a ij]

MATICE. a 11 a 12 a 1n a 21 a 22 a 2n A = = [a ij] MATICE Matice typu m/n nad tělesem T je soubor m n prvků z tělesa T uspořádaných do m řádků a n sloupců: a 11 a 12 a 1n a 21 a 22 a 2n A = = [a ij] a m1 a m2 a mn Prvek a i,j je prvek matice A na místě

Více

1 Soustavy lineárních rovnic

1 Soustavy lineárních rovnic 1 Soustavy lineárních rovnic 1.1 Základní pojmy Budeme uvažovat soustavu m lineárních rovnic o n neznámých s koeficienty z tělesa T (potom hovoříme o soustavě m lineárních rovnic o n neznámých nad tělesem

Více

Databázové systémy. * relační kalkuly. Tomáš Skopal. - relační model

Databázové systémy. * relační kalkuly. Tomáš Skopal. - relační model Databázové systémy Tomáš Skopal - relační model * relační kalkuly Osnova přednášky relační kalkuly doménový n-ticový Relační kalkuly využití aparátu predikátové logiky 1. řádu pro dotazování rozšíření

Více

Výroková a predikátová logika - III

Výroková a predikátová logika - III Výroková a predikátová logika - III Petr Gregor KTIML MFF UK ZS 2017/2018 Petr Gregor (KTIML MFF UK) Výroková a predikátová logika - III ZS 2017/2018 1 / 16 2-SAT 2-SAT Výrok je v k-cnf, je-li v CNF a

Více

Lokální a globální analytické zprávy o výsledcích DZD

Lokální a globální analytické zprávy o výsledcích DZD Univerzita Karlova v Praze Matematicko-fyzikální fakulta DIPLOMOVÁ PRÁCE Zdeněk Reischig Lokální a globální analytické zprávy o výsledcích DZD KATEDRA SOFTWAROVÉHO INŽENÝRSTVÍ Vedoucí diplomové práce:

Více

Trendy v časových oknech jako rizikové faktory kardiovaskulárního onemocnění

Trendy v časových oknech jako rizikové faktory kardiovaskulárního onemocnění Trendy v časových oknech jako rizikové faktory kardiovaskulárního onemocnění Trendy Lenka Novákováv časových 1, Filip Karel oknech 1, Petr Aubrecht jako 1, rizikové Marie Tomečková faktory 2, Jan Rauch

Více

LISp-Miner. 11.5.2004 Martin Šulc Projekt do předmětu Vyhledávání znalostí v databázích

LISp-Miner. 11.5.2004 Martin Šulc Projekt do předmětu Vyhledávání znalostí v databázích LISp-Miner 11.5.2004 Martin Šulc Projekt do předmětu Vyhledávání znalostí v databázích Zadání Popis systému LISp-Miner a experimenty s databází. Abstrakt Tento projekt popisuje systém LISp-Miner, jeho

Více

Úvod do programovacích jazyků (Java)

Úvod do programovacích jazyků (Java) Úvod do programovacích jazyků (Java) Michal Krátký Katedra informatiky VŠB Technická univerzita Ostrava Úvod do programovacích jazyků (Java), 2007/2008 c 2006 2008 Michal Krátký Úvod do programovacích

Více

Výroková logika II. Negace. Již víme, že negace je změna pravdivostní hodnoty výroku (0 1; 1 0).

Výroková logika II. Negace. Již víme, že negace je změna pravdivostní hodnoty výroku (0 1; 1 0). Výroková logika II Negace Již víme, že negace je změna pravdivostní hodnoty výroku (0 1; 1 0). Na konkrétních příkladech si ukážeme, jak se dají výroky negovat. Obecně se výrok dá negovat tak, že před

Více

ZÍSKÁVÁNÍ ZNALOSTÍ Z DATABÁZÍ

ZÍSKÁVÁNÍ ZNALOSTÍ Z DATABÁZÍ metodický list č. 1 Dobývání znalostí z databází Cílem tohoto tematického celku je vysvětlení základních pojmů z oblasti dobývání znalostí z databází i východisek dobývání znalostí z databází inspirovaných

Více

LISp-Miner Na lékal kařských datech. Martin Šulc Cikháj 5.-4..005 4..005 Abstrakt Tato přednp ednáška je o systému vyvíjen jeném m na VŠE V E v Praze a o jeho aplikaci na data, která jsou genetickým obrazem

Více

1 Výrok a jeho negace

1 Výrok a jeho negace 1 Výrok a jeho negace Výrokem se rozumí sdělení, u něhož má smysl otázka, zda je, či není pravdivé. Budeme určovat tzv. pravdivostní hodnotu výroku (PH). Příklady výroků: V Úhlopříčky čtverce jsou na sebe

Více

Výroková logika - opakování

Výroková logika - opakování - opakování ormální zavedení Výroková formule: Máme neprázdnou nejvýše spočetnou množinu A výrokových proměnných. 1. Každá proměnná je výroková formule 2. Když α, β jsou formule, potom ( α), (α β), (α

Více

Výroková a predikátová logika - II

Výroková a predikátová logika - II Výroková a predikátová logika - II Petr Gregor KTIML MFF UK ZS 2015/2016 Petr Gregor (KTIML MFF UK) Výroková a predikátová logika - II ZS 2015/2016 1 / 18 Základní syntax Jazyk Výroková logika je logikou

Více

Naproti tomu gramatika je vlastně soupis pravidel, jak

Naproti tomu gramatika je vlastně soupis pravidel, jak 1 Kapitola 1 Úvod V přednášce se zaměříme hlavně na konečný popis obecně nekonečných množin řetězců symbolů dané množiny A. Prvkům množiny A budeme říkat písmena, řetězcům (konečným posloupnostem) písmen

Více

Obsah. Seznam obrázků. Seznam tabulek. Petr Berka, 2011

Obsah. Seznam obrázků. Seznam tabulek. Petr Berka, 2011 Petr Berka, 2011 Obsah... 1... 1 1 Obsah 1... 1 Dobývání znalostí z databází 1 Dobývání znalostí z databází O dobývání znalostí z databází (Knowledge Discovery in Databases, KDD) se začíná ve vědeckých

Více

Matematika (CŽV Kadaň) aneb Úvod do lineární algebry Matice a soustavy rovnic

Matematika (CŽV Kadaň) aneb Úvod do lineární algebry Matice a soustavy rovnic Přednáška třetí (a pravděpodobně i čtvrtá) aneb Úvod do lineární algebry Matice a soustavy rovnic Lineární rovnice o 2 neznámých Lineární rovnice o 2 neznámých Lineární rovnice o dvou neznámých x, y je

Více

Báze a dimenze vektorových prostorů

Báze a dimenze vektorových prostorů Báze a dimenze vektorových prostorů Buď (V, +, ) vektorový prostor nad tělesem (T, +, ). Nechť u 1, u 2,..., u n je konečná posloupnost vektorů z V. Existují-li prvky s 1, s 2,..., s n T, z nichž alespoň

Více

Získávání dat z databází 1 DMINA 2010

Získávání dat z databází 1 DMINA 2010 Získávání dat z databází 1 DMINA 2010 Získávání dat z databází Motto Kde je moudrost? Ztracena ve znalostech. Kde jsou znalosti? Ztraceny v informacích. Kde jsou informace? Ztraceny v datech. Kde jsou

Více

2. ZÁKLADY MATICOVÉ ALGEGRY 2.1. ZÁKLADNÍ POJMY

2. ZÁKLADY MATICOVÉ ALGEGRY 2.1. ZÁKLADNÍ POJMY 2. ZÁKLADY MAICOVÉ ALGEGRY 2.1. ZÁKLADNÍ POJMY V této kapitole se dozvíte: jak je definována reálná nebo komplexní matice a co rozumíme jejím typem; co jsou to prvky matice, co vyjadřují jejich indexy

Více

Úplný systém m logických spojek. 3.přednáška

Úplný systém m logických spojek. 3.přednáška Úplný sstém m logických spojek 3.přednáška Definice Úplný sstém m logických spojek Řekneme, že množina logických spojek S tvoří úplný sstém logických spojek, jestliže pro každou formuli A eistuje formule

Více

Okruh č.3: Sémantický výklad predikátové logiky

Okruh č.3: Sémantický výklad predikátové logiky Okruh č.3: Sémantický výklad predikátové logiky Predikátová logika 1.řádu formalizuje úsudky o vlastnostech předmětů a vztazích mezi předměty pevně dané předmětné oblasti (univerza). Nebudeme se zabývat

Více

Matematická logika. Rostislav Horčík. horcik

Matematická logika. Rostislav Horčík.  horcik Matematická logika Rostislav Horčík horcik@math.feld.cvut.cz horcik@cs.cas.cz www.cs.cas.cz/ horcik Rostislav Horčík (ČVUT FEL) Y01MLO Letní semestr 2007/2008 1 / 15 Sémantická věta o dedukci Věta Pro

Více

Výroková a predikátová logika - II

Výroková a predikátová logika - II Výroková a predikátová logika - II Petr Gregor KTIML MFF UK ZS 2013/2014 Petr Gregor (KTIML MFF UK) Výroková a predikátová logika - II ZS 2013/2014 1 / 20 Základní syntax Jazyk Výroková logika je logikou

Více

Úvod do logiky (VL): 11. Ověřování, zda je formule tautologií metodou protipříkladu

Úvod do logiky (VL): 11. Ověřování, zda je formule tautologií metodou protipříkladu Jiří Raclavský (214): Úvod do logiky: klasická výroková logika Logika: systémový rámec rozvoje oboru v ČR a koncepce logických propedeutik pro mezioborová studia (reg. č. CZ.1.7/2.2./28.216, OPVK) Úvod

Více

TEORIE ZPRACOVÁNÍ DAT

TEORIE ZPRACOVÁNÍ DAT Vysoká škola báňská - Technická univerzita Ostrava Fakulta elektrotechniky a informatiky TEORIE ZPRACOVÁNÍ DAT pro kombinované a distanční studium Jana Šarmanová Ostrava 2003 Jana Šarmanová, 2003 Fakulta

Více

Výroková a predikátová logika - II

Výroková a predikátová logika - II Výroková a predikátová logika - II Petr Gregor KTIML MFF UK ZS 2017/2018 Petr Gregor (KTIML MFF UK) Výroková a predikátová logika - II ZS 2017/2018 1 / 17 Předběžnosti Základní pojmy n-ární relace a funkce

Více

Vektorové podprostory, lineární nezávislost, báze, dimenze a souřadnice

Vektorové podprostory, lineární nezávislost, báze, dimenze a souřadnice Vektorové podprostory, lineární nezávislost, báze, dimenze a souřadnice Vektorové podprostory K množina reálných nebo komplexních čísel, U vektorový prostor nad K. Lineární kombinace vektorů u 1, u 2,...,u

Více

1.4.6 Negace složených výroků I

1.4.6 Negace složených výroků I 1.4.6 Negace složených výroků I Předpoklady: 010405 Pedagogická poznámka: Dlouho jsem se v počátcích své praxe snažil probrat negace za jednu hodinu. Tvorba negací je skvělým procvičováním schopnosti dodržovat

Více

1. Matematická logika

1. Matematická logika Moderní technologie ve studiu aplikované fyziky CZ.1.07/2.2.00/07.0018 1. Matematická logika Základem každé vědy (tedy i matematiky i fyziky) je soubor jistých znalostí. To, co z těchto izolovaných poznatků

Více

Masterský studijní obor datové & webové inženýrství

Masterský studijní obor datové & webové inženýrství Masterský studijní obor datové & webové inženýrství Předpoklady Struktura studia Přihlášky Poradenství Masterský studijní obor datové & webové inženýrství představuje ve studijním konceptu fakulty informatiky

Více

Stefan Ratschan. Fakulta informačních technologíı. Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti

Stefan Ratschan. Fakulta informačních technologíı. Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti Logika pro každodenní přežití Stefan Ratschan Katedra číslicového návrhu Fakulta informačních technologíı České vysoké učení technické v Praze Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti

Více

0.1 Úvod do lineární algebry

0.1 Úvod do lineární algebry Matematika KMI/PMATE 1 01 Úvod do lineární algebry 011 Lineární rovnice o 2 neznámých Definice 011 Lineární rovnice o dvou neznámých x, y je rovnice, která může být vyjádřena ve tvaru ax + by = c, kde

Více

Karta předmětu prezenční studium

Karta předmětu prezenční studium Karta předmětu prezenční studium Název předmětu: Číslo předmětu: 545-0250 Garantující institut: Garant předmětu: Ekonomická statistika Institut ekonomiky a systémů řízení RNDr. Radmila Sousedíková, Ph.D.

Více

Asociační i jiná. Pravidla. (Ch )

Asociační i jiná. Pravidla. (Ch ) Asociační i jiná Pravidla (Ch. 14 +...) Učení bez učitele Nemáme cílovou třídu Y, G; máme N pozorování což jsou p-dimenzionální vektory se sdruženou pravděpodobností chceme odvozovat vlastnosti. Pro málo

Více

Teoretická informatika Tomáš Foltýnek Teorie čísel Nekonečno

Teoretická informatika Tomáš Foltýnek Teorie čísel Nekonečno Tomáš Foltýnek foltynek@pef.mendelu.cz Teorie čísel Nekonečno strana 2 Opakování z minulé přednášky Jak je definována podmnožina, průnik, sjednocení, rozdíl? Jak je definována uspořádaná dvojice a kartézský

Více

Struktura e-learningových výukových programù a možnosti jejího využití

Struktura e-learningových výukových programù a možnosti jejího využití Struktura e-learningových výukových programù a možnosti jejího využití Jana Šarmanová Klíčová slova: e-learning, programovaná výuka, režimy učení Abstrakt: Autorská tvorba výukových studijních opor je

Více