Vysoká škola ekonomická. Katedra informačního a znalostního inženýrství. Fakulta informatiky a statistiky. Systém LISp-Miner
|
|
- Anežka Dostálová
- před 8 lety
- Počet zobrazení:
Transkript
1 Vysoká škola ekonomická Katedra informačního a znalostního inženýrství Fakulta informatiky a statistiky Systém LISp-Miner Stručný popis určený pro posluchače kurzů Metod zpracování informací verse 20. listopadu 2005 Vypracoval: Jan Rauch
2 Obsah 1 Úvod 5 2 Přehledný popis 7 3 Procedura 4ft-Miner Booleovské atributy Asociační pravidla Vstup procedury 4ft-Miner Výstup procedury 4ft-Miner Asociační pravidla a nákupní košík 21 3
3 4
4 Kapitola 1 Úvod LISp-Miner je akademický softwarový systém určený pro podporu výuky a výzkumu v oblasti dobývání znalostí z databází, viz Systém je vyvíjen skupinou pedagogů a studentů převážně z Fakulty informatiky a statistiky VŠE. Toto jsou provizorní skripta obsahující základní informace o systému. Jsou určena zejména pro posluchače předmětů IZI240 - Metody zpracování informací a IZI212 - Metody zpracování informací - praktika vyučované na VŠE. Předpokádá se, že budou postupně rozšířena na skripta, která se budou systému věnovat podrobně a v širších souvislostech. Systém LISp-Miner se v současné době skládá ze šesti analytických procedur, z procedury KEX pro strojové učení, ze dvou procedur pro vstupní transformace dat a z několika modulů, které různým způsobem doplňují analytické procedury. Stručný přehledný popis systému je v kapitole 2. Z pohledu výuky v letním semestru 2004/2005 je nejdůležitější analytická procedura 4ft-Miner které je věnována kapitola 3. Procedura 4ft-Miner je určena pro získávání asociačních pravidel. Jedná se však o značně obecnější vztahy než jsou klasická asociační pravidla definovaná v souvislosti s analýzou nákupních košíků. Asociační pravidla definovaná pro nákupní košíky a jejich vztah k proceduře 4ft-Miner jsou popsány v kapitole 4 Stručný popis dalších procedur a modulů je prozatím k dispozici pouze na Významným úkolem systému LISp-Miner je podpora výzkumných aktivit v oblasti dobývání znalostí z databází s důrazem na aktivity studentské. Přehled výzkumných aktivit souvisejících se systémem LISp-Miner je v současné době k dispozici na Studentské aktivity mají často formu vypracování diplomové práce. Připadají v úvahu i práce bakalářské např. formou pilotních analýz pomocí procedur jiných než 4ft-Miner nebo formou aplikací modulu AR2NL (viz html a ) na další oblasti. 5
5 Je třeba zdůraznit, že systém LISp-Miner je výsledkem činnosti týmu pedagogů a studentů a že autor této první verse provizorních skript popisuje výsledky práce celého týmu. Dále je uvedena stručná historie vývoje systému. Další podrobnosti o autorech systému jsou uvedeny na vse.cz/people.html a u popisu jednotlivých procedur a modulů na http: //lispminer.vse.cz/procedures/. Vývoj systému LISp-Miner byl zahájen v roce 1996 kdy byla implementována první verse procedury 4ft-Miner. Autorem projektu byl J. Rauch a procedura byla implementována Milanem Šimůnkem. Nová koncepce procedury 4ft-Miner byla v roce 1999 vytvořena J. Rauchem a M. Šimůnkem. V této souvislosti byla M. Šimůnkem implementována matabáze a také procedura LMDataSource. Petr Berka vypracoval projekt procedury KEX pro strojové učení, projekt byl implementován M. Šimůnkem. Při implementaci byly použity softwarové nástroje pro práci s bitovými řetězci vytvořené při implementaci procedury 4ft- Miner. Ucelený systém podprogramů a pravidel pro další vývoj systému LISp-Miner byl připraven M. Šimůnkem. Tento systém jeho autor využil při implementaci nových analytických procedur KL-Miner, CF-Miner, SD4ft-Miner, SDKL- Miner a SDCF-Miner navržených J. Rauchem. Na vývoji těchto nových procedur a na vývoji různých dalších modulů se podíleli další autoři, viz též popis jednotlivých procedur a modulů na http: //lispminer.vse.cz/procedures/. 6
6 Kapitola 2 Přehledný popis Systém LISp-Miner se v současné době skládá ze šesti analytických procedur 4ft-Miner KL-Miner CF-Miner SD4ft-Miner SDKL-Miner SDCF-Miner, z procedury KEX pro strojové učení, ze dvou procedur pro vstupní transformace dat LMDataSource TimeTransf a z několika modulů (např. AR2NL nebo COLLAPS), které různým způsobem doplňují analytické procedury. Každá z analytických procedur i procedura KEX je realizována pomocí dvou modulů. Pro proceduru 4ft-Miner to jsou moduly - programy 4ftTask.exe a 4ftResult.exe. Modul 4ftTask.exe zajišťuje dialog s uživatelem, jehož výsledkem je zadání vstupních parametrů které se uloží do metabáze. Dále modul 4ftTask.exe vyřeší úlohu s takto zadanými parametry a výsledky uloží také do metabáze. Modul 4ftResult.exe umožňuje prohlížení výsledků. Analogicky pro ostatní z těchto procedur. Procedura LMDataSource je realizována pomocí 7
7 Obrázek 2.1: Metabáze a moduly systému LISp-Miner modulu LMDataSource.exe, procedura TimeTransf modulem TimeTransf.exe. Schematicky je celá situace znázorněna na obr Jedním z úkolů metabáze je oddělit analyzovaná data od provozních dat systému LISp-Miner. Analyzovaná data musí být přístupná pomocí ODBC, příkladem takto přístupných dat jsou data uchovávaná pomocí databázového systému Microsoft ACCESS. Informace o ODBC zdroji ve kterém jsou analyzovaná data je uložena také v metabázi. Tím je zajištěno propojení metabáze s analyzovanými daty. Uložení provádí modul LMAdmin.exe. Architektura systému LISp-Miner daná vztahy analyzovaných dat, metabáze a jednotlivých modulů je znázorněna v obr Poznamenejme, že v této kapitole jsou uvedeny skutečně jen základní informace, které je třeba doplnit o další informace z přednášek a cvičení. Rozhodně se zde nejedná o ucelený popis architektury systému LISp-Miner. Další podrobnosti jsou uvedeny v dokumentu LISp-Miner project č. 8 - Metabase Structure který je volně přístupný na adrese php. 8
8 Obrázek 2.2: Arhitektura systému LISp-Miner Dále zde nejsou uvedeny podrobnosti o práci se systémem. Omezujeme se na konstatování, že před zahájením práce s analytickými procedurami je třeba připravit analyzovanou matici pomocí modulu LMDataSource. 9
9 10
10 Kapitola 3 Procedura 4ft-Miner Procedura 4ft-Miner je určena pro získávání asociačních pravidel z matic dat. Zároveň se jedná o implementaci metody GUHA automatické tvorby hypotéz. Cílem metody GUHA je nabízet vše zajímavé co lze k danému problému odvodit z analyzovaných dat. Jedná se o původní českou metodu explorační analýzy dat, viz např. [4, 7]. Metoda GUHA je realizována pomocí GUHA procedur. GUHA procedura je program, jehož vstupem je jednoduché zadání rozsáhlé množiny potenciálně zajímavých vztahů a analyzovaná data. GUHA procedura generuje všechny zadané vztahy a verifikuje každý z nich. Výstupem jsou všechny vztahy ze zadané množiny, které jsou pravdivé v analyzovaných datech. Zároveň jsou do výstupu uváděny pouze takové vztahy, které nevyplývají z jiných, jednušších a ve výstupu již uvedených vztahů. Nejvíce používanou GUHA procedurou je procedura ASSOC. Procedura AS- SOC hledá vztahy, které jsou zobecněním asociačních pravidel tak jak byla definována např. v [1], viz též [3]. Procedura 4ft-Miner je nejnovější implementací procedury ASSOC. Má zároveň některé nové rysy ve srovnání s dřívějšími implementacemi [7, 8, 9]. Schema činnosti GUHA procedury 4ft-Miner je v obr Procedura 4ft-Miner pracuje s booleovskými atributy odvozenými ze sloupců analyzované matice dat, viz odstavec 3.1. Asociační pravidla jsou definována v odstavci 3.2. Zadávání množiny relevantních asociačních pravidel pro proceduru 4ft-Miner je popsáno v odstavci 3.3. Stručný komentář k výstupu procedury 4ft- Miner je v odstavci Booleovské atributy Procedura 4ft-Miner pracuje s booleovskými atributy odvozenými ze sloupců analyzované matice dat. Analyzovaná matice dat vznikne z databázové tabulky 11
11 Obrázek 3.1: Schéma činnosti GUHA procedury 4ft-Miner pomocí procedury LMDataSource. To znamená, že každý řádek matice odpovídá jednomu řádku databázové relace (tabulky) který popisuje jeden pozorovaný objekt. Podstatné je, že každý atribut - sloupec matice může nabývat konečně mnoha hodnot. Tyto hodnoty nazýváme kategoriemi. Ze sloupců matice dat se vytvářejí základní booleovské atributy. Základní booleovský atribut je výraz A(α), kde α je vlastní neprázdná podmnožina množiny všech kategorií atributu A. Základní booleovský atribut A(α) je pravdivý v řádku matice právě když a α kde a je hodnota atributu A v tomto řádku. Booleovské atributy jsou obvyklým způsobem odvozeny ze základních booleovských atributů pomocí logických spojek, and. Příklad matice dat M s atributy A 1,... A K je v obr. 3.2 kde jsou uvedeny i základní booleovské atributy A 1 (1) a A 2 (1, 4, 5) a odvozené booleovské atributy A 1 (1) A 2 (1, 4, 5) a A K (6) (zde A 2 (1, 4, 5) je zkráceným zápisem formálně korektního A 2 ({1, 4, 5, 7}) atd. ). řádek sloupce M příklady booleovských atributů matice (atributy) základní odvozené M A 1 A 2... A K A 1(1) A 2(1, 4, 5) A 1(1) A 2(1, 4, 5) A K(6) o o o o n Obrázek 3.2: Data matrix M and examples of Boolean attributes 12
12 3.2 Asociační pravidla Asociační pravidlo je výraz ϕ ψ kde ϕ a ψ jsou Booleovské atributy. Symbol se nazývá 4ft-kvantifikátor. Asociační pravidlo ϕ ψ se týká analyzované matice dat M. Každému 4ft-kvantifikátoru odpovídá nějaká podmínka týkající se čtyřpolních tabulek. Čtyřpolní tabulkou rozumíme čtveřici a, b, c, d celých nezáporných čísel takových, že a + b + c + d > 0. Pomocí 4ft-kvantifikátorů lze vyjádřit různé typy vzájmných závislostí booloevských atributů ϕ a ψ včetně závislostí odpovídajících statistickým testům hypotéz. Asociační pravidlo ϕ ψ je pravdivé v matici dat M jestliže podmínka odpovídající 4ft-kvantifikátoru je splněna pro kontingenční tabulku booleovských atributů ϕ a ψ v matici dat M. V opačném případě je asociační pravidlo ϕ ψ nepravdivé v matici dat M. Kontingenční tabulka booleovských atributů ϕ a ψ v matici dat M je čtveřice čísel a, b, c, d definovaných tak, že a je počet řádků matice M splňujících jak ϕ tak i ψ b je počet řádků matice M splňujících ϕ a nesplňujících ψ c je počet řádků matice M nesplňujících ϕ ale splňujících ψ d je počet řádků matice M nesplňujících ani ϕ ani ψ. Kontingenční tabulku booleovských atributů ϕ a ψ v matici dat M nazýváme 4ft tabulkou ϕ a ψ v M a značíme ji 4ft(ϕ, ψ, M). Krom frekvencí a, b, c, d používáme někdy ještě obvyklé značení pro dílčí součty těchto frekvencí r = a+b, s = c + d, k = a + c, l = b + d a n = a + b + c + d, viz Tab M ψ ψ ϕ a b r ϕ c d s k l n Tabulka 3.1: 4ft tabulka ϕ a ψ v M Hodnotu V al(ϕ ψ, M) asociačního pravidla ϕ ψ v matici dat M definujeme jako V al(ϕ ψ, M) = 1 je-li ϕ ψ pravdivé v M a jako V al(ϕ ψ, M) = 0 je-li ϕ ψ ne pravdivé v M Uvádíme důležité příklady 4ft-kvantifikátorů: 13
13 4ft-kvantifikátor p,base fundované implikace je pro 0 < p 1 a Base > 0 definován v [4] podmínkou a a + b p a Base. To znamená, že nejméně 100p procent objektů splňujících ϕ splňuje také ψ a že nejméně Base objektů (řádků) matice M splňuje ϕ i ψ. 4ft-kvantifikátor p,base fundované dvojité implikace je pro 0 < p 1 a Base > 0 definován v [7] podmínkou a a + b + c p a Base. To znamená, že nejméně 100p procent objektů splňujících ϕ nebo ψ splňuje také jak ϕ tak i ψ a že zároveň nejméně Base objektů splňuje ϕ i ψ. 4ft-kvantifikátor p,base fundované ekvivalence je pro 0 < p 1 a Base > 0 definován v [7] podmínkou a + d a + b + c + d p a Base. To znamená, že ϕ a ψ mají stejnou hodnotu (true nebo false) pro nejméně 100p procent objektů matice M a že nejméně Base objektů splňuje ϕ i ψ. 4ft-kvantifikátor p,base kladné odchylky od průměru je pro 0 < p a Base > 0 definován podmínkou a a + b a + c (1 + p) a + b + c + d a Base. To znamená, že relativní četnost objektů splňujících ψ mezi objekty spňujícími ϕ je alespoň o 100p procent vyšší, než relativní četnost objektů splňujících ψ v celé matici a že zároveň nejméně Base objektů splňuje ϕ i ψ. 4ft-kvantifikátor p,base se nazývá také AA-kvantifikátor (z anglického Above Average ). Řada dalších 4ft-kvantifikátorů je definována např. v [4], [7] a [10] včetně kvantifikátorů inspirovaných statistickými testy hypotéz a kvantifikátoru odpovídajícího klasickému asociačnímu pravidlu. Procedura 4ft-Miner pracuje i s podmíněnými asociačními pravidly. Podmíněné asosiační pravidlo je výraz ϕ ψ/χ kde ϕ, ψ and χ jsou booleovské atributy. Asociační pravidlo ϕ ψ/χ říká, že ϕ a ψ jsou v relaci dané 4ftkvanifikátorem pokud je splněna podmínka daná booleovským atributem χ. Podmíněné asociační pravidlo ϕ ψ/χ je pravdivé v matici dat M jestliže existuje řádek matice M splňující χ a jestliže asociační pravidlo ϕ ψ je pravdivé v matici dat M/χ. Jinak je ϕ ψ/χ nepravdivé v matici dat M. 14
14 Matice dat M/χ vznikne z matice dat M vynecháním všech řádků nesplňujících χ. Hodnotu V al(ϕ ψ/χ, M) podmíněného asociačního pravidla ϕ ψ/χ v matici dat M definujeme jako V al(ϕ ψ/χ, M) = 1 je-li ϕ ψ/χ pravdivé v M a jako s V al(ϕ ψ/χ, M) = 0 je-li ϕ ψ/χ nepravdivé v M. 3.3 Vstup procedury 4ft-Miner Procedura 4ft-Miner hledá asociační pravidla tvaru ϕ ψ a podmíněná asociační pravidla tvaru ϕ ψ/χ. Booleovský atribut ϕ se nazývá antecedent, ψ se nazývá sukcedent [4] a χ je podmínka. Asociační pravidla i podmíněná asociační pravidla nazýváme souhrnně asociačními pravidly. Antecedent, sukcedent a podmínka se souhrnně nazývají cedenty. Vstup procedury 4ft-Miner je dán: maticí dat zadáním množiny asociačních pravidel která mají být automaticky generována a verifikována zadáním práce s neúplnou informací zadáním způsobu výstupu pro implikace. Asociační pravidla která mají být generována a verifikována se v souvislosti s metodou GUHA nazývají relevantní otázky. Množina asociačních pravidel která mají být automaticky generována a verifikována se nazývá množina relevantních otázek. Množina relevantních otázek je dána zadáním množiny relevantních antecedentů zadáním množiny relevantních sukcedentů zadáním množiny relevantních podmínek zadáním 4ft-kvantifikátoru. Antecedent, sukcedent i podmínka jsou konjunkce literálů. Literál je základní booleovský atribut A(α) nebo negace A(α) základního booleovského atributu. Příklady literálů jsou: A 1 (1), A K (6), A 7 (3, 5, 9), A 9 (4, 1). Literál A(α) nazýváme pozitivním literálem, literál A(α) nazýváme negativním literálem. Množinu α v literálu A(α) a A(α) nazýváme koeficient. Připomeňme, že α je množina kategorií (tj. přípustných hodnot) atributu A. 15
15 Relevantní antecedent je definován jako konjunkce ϕ = ϕ 1 ϕ 2... ϕ k kde ϕ 1, ϕ 2,..., ϕ k jsou dílčí antecedenty. Každý dílčí anteceent ϕ i patří do jedné množiny relevantních dílčích antecedentů To mimo jiné znamená, že každý dílčí antecedent je konjunkce literálů, stejně jako celý antecedent. Délka dílčího antecedentu je počet literálů v dílčím antecedentu. Zadání množiny relevantních antecedentů je dáno zadáním alespoň jedné množiny relevantních dílčích antecedentů. Množina relevantních dílčích antecedentů je zadána: minimální a maximální délkou dílčího antecedentu seznamem atributů z nichž budou generovány literály některé atributy mohou být označeny jako basic, platí že relevantní dílčí antecedent musí obsahovat alespoň jeden basic atribut jednoduchou definicí množiny literálů, které mají být automaticky generovány pro každý atribut navíc je možno definovat nekolik tříd ekvivalence, každý atribut může patřit nejvýše do jedné třídy ekvivalence; relevantní dílčí antecedent potom nesmí obsahovat dva nebo více atributů z jedné třídy ekvivalence. Poznamenejme, že minimální délka dílčího antecedentu může být 0, což vede ke konjunkcím délky 0 a že konjunkce délky 0 je podle definice vždy pravdivá. Délkou literálu A(α) nebo A(α) rozumíme počet kategorií v koeficientu α. Množina literálů, které mají být automaticky generovány je pro každý atribut dána: jedním ze sedmi možných typů koeficientu: subsets (podmnožiny), intervals (intervaly), cyclic intervals (cyklické intervaly), left cuts (levé řezy), right cuts (pravé řezy), cuts (řezy), one particular category (jednotlivá kategorie) minimální a maximální délkou literálu jednou z možností: generovat pouze pozitivní literály generovat pouze negativní literály generovat pozitivní i negativní literály Použijeme atribut A s kategoriemi {1, 2, 3, 4, 5} abychom na příkladech ukázali jednotlivé typy literálů: 16
16 subsets: použití podmnožin s délkou 2-3 definuje literály A(1,2), A(1,3), A(1,4), A(1,5), A(2,3),..., A(4,5), A(1,2,3), A(1,2,4), A(1,2,5), A(2,3,4),..., A(3,4,5) intervals: použití intervalů s délkou 2-3 definuje literály A(1,2), A(2,3), A(3,4), A(4,5), A(1,2,3), A(2,3,4) a A(3,4,5) cyclic intervals: použití cyklických intervalů s délkou 2-3 definuje literály A(1,2), A(2,3), A(3,4), A(4,5), A(5,1) A(1,2,3), A(2,3,4), A(3,4,5), A(4,5,1) a A(5,1,2) left cuts: použití levých řezů s maximální délkou 3 (minimální délka je v tomto případě vždy 1) definuje literály A(1), A(1,2) a A(1,2,3) right cuts: použití pravých řezů s maximální délkou 4 (minimální délka je v tomto případě vždy 1) definuje literály A(5), A(5,4), A(5,4,3) a A(5,4,3,2) cuts: toto zadání znamená, že jsou generovány levé i pravé řezy zadané délky one particular value znamená že bude použit literál s jednou zadanou kategorií, např A(2). Zadání množiny relevantních sukcedentů a zadání množiny relevantních podmínek jsou analogická k definici množiny relevantních antecedentů. Jeden atribut se může vyskytovat i ve dvou nebo ve všech třech definicích. Procedura 4ft-Miner však negeneruje taková asociační pravidla, která obsahují dva nebo více literálů odvozených z jednoho atributu. Zadání 4ft-kvantifikátoru je dáno seznamem základních 4ft-kvantifikátorů. Je k dispozici celkem 18 základních 4ft-kvantifikátorů. Víme již, že ke každému 4ft-kvantifikátoru je přiřazena podmínka týkající se čtyřpolních tabulek, viz odstavec 3.2. Taková podmínka je také přiřazena každému ze základních 4ft-kvantifikátorů. Ke 4ft-kvantifikátoru, který je dán seznamem základních 4ft-kvantifikátorů, je přiřazena podmínka která je konjunkcí podmínek přiřazených jednotlivých základním 4ft-kvantifikátorům použitým v seznamu. Dále uvedeme podmínky přiřazené některým základním 4ft-kvantifikátorům. Jedná se zejména o ty základní kvantifikátory, ze kterých je možno sestavit 4ftkvantifikátory uvedené v odstavci 3.2. Požíváme značení frekvencí z tabulky 3.1. Základní 4ft-kvantifikátor BASE Base s parametrem Base je pro Base 0 definován podmínkou a Base. Volitelně je Base možno zadat v procentech (z intervalu 0, 100 ) z celkového počtu řádků analyzované matice. Je-li Base zadáno v procentech, pak podmínka je 100 a n Base. 17
17 Základní 4ft-kvantifikátor CEILING Ceiling s parametrem Ceiling je pro Ceiling 0 definován podmínkou a Ceiling. Volitelně je Ceiling možno zadat v procentech (z intervalu 0, 100 ) z celkového počtu řádků analyzované matice. Je-li Ceiling zadáno v procentech, pak podmínka je 100 a n Ceiling. Základní 4ft-kvantifikátor p fundované implikace je pro 0 < p 1 definován podmínkou a a + b p. Základní 4ft-kvantifikátor p fundované dvojité implikace je pro 0 < p 1 definován podmínkou a a + b + c p. Základní 4ft-kvantifikátor p fundované ekvivalence je pro 0 < p 1 definován podmínkou a + d a + b + c + d p. Základní 4ft-kvantifikátor p kladné odchylky od průměru je pro 0 < p a definován podmínkou a a + b a + c (1 + p) a + b + c + d. Platí tedy například, že 4ft-kvantifikátor p,base fundované implikace je možno nahradit seznamem obsahující dva základní 4ft-kvantifikátory: základní 4ft-kvantifikátor BASE Base a základní 4ft-kvantifikátor p fundované implikace. Podobně pro ostatní 4ft-kvantifikátory. Zadání práce s neúplnou informací a zadání způsobu výstupu pro implikace bude podrobněji vysvětleno v některé z příštích versí těchto skript. Doporučujeme použít volby dle obr Výstup procedury 4ft-Miner Výstupem procedury 4ft-Miner jsou všechna prostá asociační pravidla. Asociační pravidlo je prosté, pokud je pravdivé a zřejmým způsobem neplyne z jiného, ve výstupu již uvedeného pravidla. Například platí, že je-li pravdivé asociační pravidlo A 1 (1) p,base A 2 (1), pak je pravdivé i asociační pravidlo A 1 (1) p,base A 2 (1, 2). 18
18 Obrázek 3.3: Zadání dalších parametrů pro proceduru 4ft-Miner Podrobnější výklad k prostým asociačním pravidlům bude podán v některé z příštích versí těchto skript. Poznamenejme ještě, že je-li výstup tvořen všemi prostými asociačními pravidly, pak z těchto pravidel plynou všechna pravdivá asociační pravidla. 19
19 20
20 Kapitola 4 Asociační pravidla a nákupní košík Pojem asociační pravidlo byl zaveden Agravalem, viz např. [1] v souvislosti s analýzou nákupního košíku. V souvislosti s metodou GUHA nebyl pojem asociačního pravidla používán, místo něho se používal pojem hypotéza viz např. [7]. Byl však používán pojem asociační kvantifikátor, viz např. [4, 7, 12, 11]. Cílem tohoto odstavce je poukázat na souvislosti asociačních pravidel zavedených Agravalem a asociačních pravidel používaných v souvisosti s metodou GUHA. Abychom je rozlišili, budeme pro asociační pravidla zavedená Agravalem používat v této kapitole pojem klasické asociační pravidlo. Klasickým asociačním pravidlem se obvykle rozumí výraz X Y kde X a Y jsou množiny prvků. Tento výraz říká, že transakce obsahující množinu prvků X mají tendenci obsahovat i množinu prvků Y. Příkladem transakcí jsou nákupy reprezentované nákupními košíky. Každý z nákupních košíků b 1,..., b n obsahuje některé z položek P 1, P 2,..., P K, viz obr nákupní košík položky b 1 P 1, P 2, P 3, P 4, P 5 b 2 P 2, P 3, P 4, P 5, P K b 3 P 1, P 3, P 12 b 4 P 1, P 3.. b n 1 P 2, P 4, P 7, P 9, P 107 b n P 2, P 4, P K Obrázek 4.1: Příklad množiny transakcí - nákupních košíků b 1,..., b n 21
21 Výraz {P 2, P 5 } {P 1, P 3 } je příklad asociačního pravidla které říká, že nákupní košíky obsahující položky P 2 a P 5 často obsahují i položky P 1 a P 3. Používají se dvě míry intenzity asociačního pravidla - podpora (support) a konfidence (confidence). Podpora asociačního pravidla X Y je podíl počtu transakcí obsahujících jak X tak i Y ku počtu všech transakcí. Konfidence je podíl počtu transakcí obsahujících jak X tak Y ku počtu transakcí obsahujících X. Pro formální definici těchto měr intenzity se zavádí výraz M(X) který označuje množinu všech nákupních košíků obsahujících množinu položek X. Podobně pro M(Y ), výraz M(X Y ) označuje množinu všech nákupních košíků obsahujících sjednocení X Y, tedy jak množinu položek X tak i množinu položek Y. Počet prvků v množině Ω se značí Ω, výraz M(X) tedy značí počet košíků obsahujících množimu položek X, analogicky pro M(Y ) a M(X Y ). Konfidence asociačního pravidla X Y se značí conf(x Y ) podpora asociačního pravidla X Y se značí sup(x Y ). Formální definice konfidence a podpory tedy je conf(x Y ) = M(X Y ) M(X) kde n je počet košíků v celé databázi. a sup(x Y ) = M(X Y ) n Asociační pravidlo X Y je v dané databázi pravdivé na úrovni konfidence C a podpory S jestliže platí conf(x Y ) C a zároveň sup(x Y ) S. Na příkladu ukážeme, že takto definované klasické asociační pravidlo můžeme vyjádřit pomocí čtyřpolní tabulky. Použijeme transakční databázi z obr Tuto transakční databázi můžeme reprezentovat jako booleovskou matici dat KOSIKY. Její řádky odpovídají jednotlivým košíkům a sloupce jsou booleovské atributy odpovídající jednotlivým položkám. Ve sloupci, který odpovídá položce P 1, je v řádku b 1 uvedeno 1 protože košík b 1 obsahuje položku P 1. V tomtéž sloupci je v řádku b 2 uvedeno 0, protože košík b 2 položku P 1 neobsahuje. Analogicky pro ostatní sloupce a řádky, viz obr Budeme se zabývat výše uvedeným asociačním pravidlem {P 2, P 5 } {P 1, P 3 }. V matici dat M KOSIKY jsou ještě dva přidané sloupce. V prvním přidaném sloupci je booleovský atribut P 2 P 5 který je v řádku pravdivý právě když nákupní košík odpovídající tomuto řádku obsahuje obě položky P 2 a P 5. Analogicky, ve druhém přidaném sloupci je booleovský atribut P 1 P 3, který je v řádku pravdivý právě když nákupní košík odpovídající tomuto řádku obsahuje obě položky P 1 a P 3. 22
22 nákupní košík P 1 P 2 P 3 P 4 P 5... P K P 2 P 5 P 1 P 3 b b b b b n b n Obrázek 4.2: Matice dat KOSIKY Ukážeme, že podmínku pravdivosti asociačního pravidla X Y na úrovni konfidence C a podpory S v transakční databázi z obr. 4.1 je možno vyjádřit pomocí vhodné čtyřpolní tabulky na matici dat M KOSIKY. Připomeňme, že podpora asociačního pravidla X Y je podíl počtu transakcí obsahujících jak X tak i Y ku počtu všech transakcí a že konfidence asociačního pravidla X Y je podíl počtu transakcí obsahujících jak X tak Y ku počtu transakcí obsahujících X. a V případě asociačního pravidla {P 2, P 5 } {P 1, P 3 } tedy platí conf({p 2, P 5} {P 1, P 3}) = počet košíků obsahujících jak P2 a P5 tak i P1 a P3 počet košíků obsahujících P 2 a P 5 sup({p 2, P 5} {P 1, P 3}) = počet košíků obsahujících jak P2 a P5 tak i P1 a P3 n. Pro vyjádření conf({p 2, P 5 } {P 1, P 3 }) a sup({p 2, P 5 } {P 1, P 3 }) můžeme použít kontingenční tabulku booleovských atributů P 2 P 5 a P 1 P 3 v matici dat KOSIKY, viz Tab KOSIKY P 1 P 3 (P 1 P 3 ) P 2 P 5 a b r (P 2 P 5 ) c d s k l n Tabulka 4.1: 4ft tabulka P 2 P 5 a P 1 P 3 v matici KOSIKY Z definice atributů P 2 P 5 a P 1 P 3 plyne, že počet košíků obsahujících jak P 2 a P 5 tak i P 1 a P 3 = a a počet košíků obsahujících P 2 a P 5 = a + b. 23
23 Platí tedy conf({p 2, P 5 } {P 1, P 3 }) = a a + b a sup({p 2, P 5 } {P 1, P 3 }) = a n. Poznamenejme, že konfidence je definována stejně jako základní 4ft-kvantifikátor p fundované implikace a že suport je definován stejně jako základní 4ftkvantifikátor BASE Base pokud použijeme zadání Base v procentech, viz odstavec 3.3. Podrobnější výklad bude podán v další versi těchto provizorních skript. Je třeba vzít v úvahu i základní 4ft-kvantifikátor SUPP p, který je definován podmínkou a a+b+c+d p, pro podmíněná asociační pravidla se však pro výpočet čtyřpolní tabulky berou v úvahu pouze objekty splňující podmínku. 24
24 Literatura [1] Agraval R et al (1996) Fast Discovery of Association Rules. In: Fayyad UM et al (eds) Advances in Knowledge Discovery and Data Mining. AAAI Press, Menlo Park (CA) [2] Berka P, Ivánek J (1994) Automated knowledge acquisition for PROSPECTOR-like expert systems. In: Bergadano F, de Raedt L (eds) Proceedings of ECML 94. Springer, Berlin Heidelberg New York [3] Berka P: (2003) Dobývání znalostí z databází. ACADEMIA, Praha [4] Hájek P, Havránek T (1978) Mechanising Hypothesis Formation - Mathematical Foundations for a General Theory. Springer, Berlin Heidelberg New York [5] Hájek P (guest editor) (1978) International Journal of Man-Machine Studies, special issue on GUHA, 10 [6] Hájek P (guest editor) (1981) International Journal of Man-Machine Studies, second special issue on GUHA, 15 [7] Hájek P, Havránek T, Chytil M (1983) GUHA Method. Academia, Praha [8] Hájek P, Sochorová A, Zvárová J (1995) GUHA for personal computers. Computational Statistics & Data Analysis 19: [9] Rauch J (1978) Some Remarks on Computer Realisations of GUHA Procedures. International Journal of Man-Machine Studies 10: [10] Rauch J (1998) Classes of Four-Fold Table Quantifiers. In: Zytkow J, Quafafou M (eds) Principles of Data Mining and Knowledge Discovery. Springer, Berlin Heidelberg New York [11] Rauch, J (2005) Logic of Association Rules. Applied Intelligence, č. 22, s [12] Rauch, J (2004) Asociační pravidla a matematická logika. In: SNÁŠEL, Václav (ed.). Znalosti Ostrava : VŠB TU Ostrava, s
25 [13] Šimůnek M (2003) Academic KDD Project LISp-Miner. In Abraham A et al (eds) Advances in Soft Computing - Intelligent Systems Design and Applications, Springer, Berlin Heidelberg New York %bibitemscr:04 Strossa P, Černý Z, Rauch J (2004) 26
DOBÝVÁNÍ ZNALOSTÍ Z DATABÁZÍ PŘÍKLADY APLIKACÍ V KARDIOLOGICKÝCH DATECH Jan Rauch
DOBÝVÁNÍ ZNALOSTÍ Z DATABÁZÍ PŘÍKLADY APLIKACÍ V KARDIOLOGICKÝCH DATECH Jan Rauch Anotace: Příspěvek obsahuje základní informace o dobývání znalostí jakožto důležité disciplíně informatiky a ukazuje příklady
VíceAnalytické procedury v systému LISp-Miner
Dobývání znalostí z databází MI-KDD ZS 2011 Přednáška 8 Analytické procedury v systému LISp-Miner Část II. (c) 2011 Ing. M. Šimůnek, Ph.D. KIZI, Fakulta informatiky a statistiky, VŠE Praha Evropský sociální
VíceÚvod do dobývání. znalostí z databází
POROZUMĚNÍ 4iz260 Úvod do DZD Úvod do dobývání DOMÉNOVÉ OBLASTI znalostí z databází VYUŽITÍ VÝSLEDKŮ POROZUMĚNÍ DATŮM DATA VYHODNO- CENÍ VÝSLEDKŮ MODELOVÁNÍ (ANALYTICKÉ PROCEDURY) PŘÍPRAVA DAT Ukázka slidů
VíceDobývání znalostí z databází (MI-KDD) Přednáška číslo 4 Asociační pravidla
Dobývání znlostí z dtbází (MI-KDD) Přednášk číslo 4 Asociční prvidl (c) prof. RNDr. Jn Ruch, CSc. KIZI, Fkult informtiky sttistiky VŠE zimní semestr 2011/2012 Evropský sociální fond Prh & EU: Investujeme
VíceLISp-Miner: systém pro získávání znalostí z dat 1
LISp-Miner: systém pro získávání znalostí z dat 1 Petr Berka, Jan Rauch, Milan Šimůnek VŠE Praha Nám. W. Churchilla 4, Praha 3 e-mail: {berka,rauch,simunek}@vse.cz Abstrakt. Systém LISp-Miner je otevřený
VíceDobývání znalostí z databází (MI-KDD) Přednáška číslo 5 Zajímavé dvojice podmnožin objektů, procedura SD4ft-Miner
Dobývání znalostí z databází (MI-KDD) Přednáška číslo 5 Zajímavé dvojice podmnožin objektů, procedura SD4ft-Miner (c) prof. RNDr. Jan Rauch, CSc. KIZI, Fakulta informatiky a statistiky VŠE zimní semestr
VíceAsociační pravidla (metoda GUHA)
Vysoká škola báňská Technická univerzita Ostrava Fakulta elektrotechniky a informatiky Katedra informatiky Asociační pravidla (metoda GUHA) Ing. Michal Burda () Získávání znalostí z dat Brno, 27. ledna
VíceDolování asociačních pravidel
Dolování asociačních pravidel Miloš Trávníček UIFS FIT VUT v Brně Obsah přednášky 1. Proces získávání znalostí 2. Asociační pravidla 3. Dolování asociačních pravidel 4. Algoritmy pro dolování asociačních
VíceDobývání znalostí z databází MI-KDD ZS 2011 Přednáška 2. Projekt LISp-Miner.
Dobývání znalostí z databází MI-KDD ZS 2011 Přednáška 2 Projekt LISp-Miner http://lispminer.vse.cz (c) 2011 Ing. M. Šimůnek, Ph.D. KIZI, Fakulta informatiky a statistiky, VŠE Praha Evropský sociální fond
VíceZákladní pojmy matematické logiky
KAPITOLA 1 Základní pojmy matematické logiky Matematická logika se zabývá studiem výroků, jejich vytváření a jejich pravdivostí. Základním kamenem výrokové logiky jsou výroky. 1. Výroková logika Co je
VíceFormální systém výrokové logiky
Formální systém výrokové logiky 1.Jazyk výrokové logiky Nechť P = {p,q,r, } je neprázdná množina symbolů, které nazýváme prvotní formule. Symboly jazyka L P výrokové logiky jsou : a) prvky množiny P, b)
VíceMísto pojmu výroková formule budeme používat zkráceně jen formule. Při jejich zápisu
VÝROKOVÁ LOGIKA Matematická logika se zabývá studiem výroků, jejich vytváření a jejich pravdivostí. Základním kamenem výrokové logiky jsou výroky. Co je výrok nedefinujejme, pouze si řekneme, co si pod
VíceBakalářská matematika I
do předmětu Mgr. Jaroslav Drobek, Ph. D. Katedra matematiky a deskriptivní geometrie Bakalářská matematika I Podmínky absolvování předmětu Zápočet Zkouška 1 účast na přednáškách alespoň v minimálním rozsahu,
VíceDobývání znalostí z databází (MI-KDD) Přednáška číslo 9 Využití doménových znalostí
Dobývání znalostí z databází (MI-KDD) Přednáška číslo 9 Využití doménových znalostí (c) prof. RNDr. Jan Rauch, CSc. KIZI, Fakulta informatiky a statistiky VŠE zimní semestr 2011/2012 Evropský sociální
VíceNová GUHA-procedura ETree-Miner v systému LISp-Miner
Nová GUHA-procedura ETree-Miner v systému LISp-Miner Milan Šimůnek Laboratoř pro inteligentní systémy Praha Fakulta informatiky a statistiky, VŠE Praha nám. W. Churchilla 4, 130 67 Praha 3 simunek@vse.cz
Více4ft-Miner pro začátečníky Získávání znalostí z databází
4ft-Miner pro začátečníky Získávání znalostí z databází Dobývání znalostí z databází (DZD) Knowledge Discovery in (from) Databases (KDD) Data Mining (DM) Materiál pro posluchače kurzů IZI211 Metody zpracování
VíceProjekt LISp-Miner. M. Šimůnek
Projekt LISp-Miner http://lispminer.vse.cz M. Šimůnek Obsah Systém LISp-Miner Vývoj systému v dlouhém období ETree-Miner Project LISp-Miner 2 Systém LISp-Miner Metoda GUHA (od roku 1966) předchozí implementace
VíceEXPERIMENTÁLNÍ GUHA PROCEDURY
Univerzita Karlova v Praze Matematicko-fyzikální fakulta DIPLOMOVÁ PRÁCE Tomáš Kuchař EXPERIMENTÁLNÍ GUHA PROCEDURY Katedra softwarového inženýrství Vedoucí diplomové práce: Doc. RNDr. Jan Rauch, CSc.
VíceMatematická analýza 1
Matematická analýza 1 ZS 2019-20 Miroslav Zelený 1. Logika, množiny a základní číselné obory 2. Limita posloupnosti 3. Limita a spojitost funkce 4. Elementární funkce 5. Derivace 6. Taylorův polynom Návod
VíceÚvod do informatiky. Miroslav Kolařík
Úvod do informatiky přednáška první Miroslav Kolařík Zpracováno dle učebního textu prof. Bělohlávka: Úvod do informatiky, KMI UPOL, Olomouc 2008. Obsah 1 Co a k čemu je logika? 2 Výroky a logické spojky
VíceNegativní informace. Petr Štěpánek. S použitím materiálu M.Gelfonda a V. Lifschitze. Logické programování 15 1
Negativní informace Petr Štěpánek S použitím materiálu M.Gelfonda a V. Lifschitze 2009 Logické programování 15 1 Negace jako neúspěch Motivace: Tvrzení p (atomická formule) neplatí, jestliže nelze odvodit
Víceteorie logických spojek chápaných jako pravdivostní funkce
Výroková logika teorie logických spojek chápaných jako pravdivostní funkce zabývá se způsoby tvoření výroků pomocí spojek a vztahy mezi pravdivostí různých výroků používá specifický jazyk složený z výrokových
VíceUniverzita Karlova v Praze Matematicko-fyzikální fakulta DIPLOMOVÁ PRÁCE
Univerzita Karlova v Praze Matematicko-fyzikální fakulta DIPLOMOVÁ PRÁCE Miron Tegze Procedura SDKL-Miner pro dobývání znalostí z databází Katedra softwarového inženýrství Vedoucí diplomové práce: doc.
VíceMatematika B101MA1, B101MA2
Matematika B101MA1, B101MA2 Zařazení předmětu: povinný předmět 1.ročníku bc studia 2 semestry Rozsah předmětu: prezenční studium 2 + 2 kombinované studium 16 + 0 / semestr Zakončení předmětu: ZS zápočet
VíceLOGIKA VÝROKOVÁ LOGIKA
LOGIKA Popisuje pravidla odvozování jedněch tvrzení z druhých. Je to myšlenková cesta ke správným závěrům. Vznikla jako součást filosofie. Zakladatelem byl Aristoteles. VÝROKOVÁ LOGIKA Obsahuje syntaktická,
Více0. ÚVOD - matematické symboly, značení,
0. ÚVOD - matematické symboly, značení, číselné množiny Výroky Výrok je každé sdělení, u kterého lze jednoznačně rozhodnout, zda je či není pravdivé. Každému výroku lze proto přiřadit jedinou pravdivostní
Více1 Výroková logika 1. 2 Predikátová logika 3. 3 Důkazy matematických vět 4. 4 Doporučená literatura 7
1 Výroková logika 1 Výroková logika 1 2 Predikátová logika 3 3 Důkazy matematických vět 4 4 Doporučená literatura 7 Definice 1.1 Výrokem rozumíme každé sdělení, o kterém má smysl uvažovat, zda je, či není
VíceV předchozí kapitole jsme podstatným způsobem rozšířili naši představu o tom, co je to číslo. Nadále jsou pro nás důležité především vlastnosti
Kapitola 5 Vektorové prostory V předchozí kapitole jsme podstatným způsobem rozšířili naši představu o tom, co je to číslo. Nadále jsou pro nás důležité především vlastnosti operací sčítání a násobení
VíceKapitola 1. Úvod. 1.1 Značení. 1.2 Výroky - opakování. N... přirozená čísla (1, 2, 3,...). Q... racionální čísla ( p, kde p Z a q N) R...
Kapitola 1 Úvod 1.1 Značení N... přirozená čísla (1, 2, 3,...). Z... celá čísla ( 3, 2, 1, 0, 1, 2,...). Q... racionální čísla ( p, kde p Z a q N) q R... reálná čísla C... komplexní čísla 1.2 Výroky -
VíceMatematická logika. Miroslav Kolařík
Matematická logika přednáška třetí Miroslav Kolařík Zpracováno dle textu R. Bělohlávka: Matematická logika poznámky k přednáškám, 2004. a dle učebního textu R. Bělohlávka a V. Vychodila: Diskrétní matematika
VíceZáklady vytěžování dat
Základy vytěžování dat předmět A7Bb36vyd Vytěžování dat Filip Železný, Miroslav Čepek, Radomír Černoch, Jan Hrdlička katedra kybernetiky a katedra počítačů ČVUT v Praze, FEL Evropský sociální fond Praha
VíceBooleovská algebra. Booleovské binární a unární funkce. Základní zákony.
Booleovská algebra. Booleovské binární a unární funkce. Základní zákony. Tomáš Bayer bayertom@natur.cuni.cz Katedra aplikované geoinformatiky a kartografie, Přírodovědecká fakulta UK. Tomáš Bayer bayertom@natur.cuni.cz
VíceKaždé formuli výrokového počtu přiřadíme hodnotu 0, půjde-li o formuli nepravdivou, a hodnotu 1, půjde-li. α neplatí. β je nutná podmínka pro α
1. JAZYK ATEATIKY 1.1 nožiny nožina je souhrn objektů určitých vlastností, které chápeme jako celek. ZNAČENÍ. x A x A θ A = { { a, b a A = B A B 0, 1 2 a, a,..., a n x patří do množiny A x nepatří do množiny
VíceVybrané přístupy řešení neurčitosti
Vybrané přístupy řešení neurčitosti Úvod do znalostního inženýrství, ZS 2015/16 8-1 Faktory jistoty Jedná se o přístup založený na ad hoc modelech Hlavním důvodem vzniku tohoto přístupu je omezení slabin
Více1 Báze a dimenze vektorového prostoru 1
1 Báze a dimenze vektorového prostoru 1 Báze a dimenze vektorového prostoru 1 2 Aritmetické vektorové prostory 7 3 Eukleidovské vektorové prostory 9 Levá vnější operace Definice 5.1 Necht A B. Levou vnější
VíceAplikace asociačních pravidel ve společnosti Zinest s.r.o.
Aplikace asociačních pravidel ve společnosti Zinest sro Daniel Rydzi Zinest sro rydzi@zinestcz Jan Rauch Katedra informačního a znalostního inženýrství VŠE rauch@vsecz Abstrakt Tento článek si klade za
VíceINVESTICE DO ROZVOJE VZDĚLÁVÁNÍ. Modernizace studijního programu Matematika na PřF Univerzity Palackého v Olomouci CZ.1.07/2.2.00/28.
INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ Modernizace studijního programu Matematika na PřF Univerzity Palackého v Olomouci CZ.1.07/2.2.00/28.0141 Báze vektorových prostorů, transformace souřadnic Michal Botur Přednáška
VíceRELATIONAL DATA ANALYSIS
KATEDRA INFORMATIKY PŘÍRODOVĚDECKÁ FAKULTA UNIVERZITA PALACKÉHO RELATIONAL DATA ANALYSIS RADIM BELOHLAVEK, JAN OUTRATA VÝVOJ TOHOTO UČEBNÍHO TEXTU JE SPOLUFINANCOVÁN EVROPSKÝM SOCIÁLNÍM FONDEM A STÁTNÍM
VícePříprava dat v softwaru Statistica
Příprava dat v softwaru Statistica Software Statistica obsahuje pokročilé nástroje pro přípravu dat a tvorbu nových proměnných. Tyto funkcionality přinášejí značnou úsporu času při přípravě datového souboru,
VíceMatematická logika. Miroslav Kolařík
Matematická logika přednáška šestá Miroslav Kolařík Zpracováno dle textu R. Bělohlávka: Matematická logika poznámky k přednáškám, 2004. a dle učebního textu R. Bělohlávka a V. Vychodila: Diskrétní matematika
Více4.2 Syntaxe predikátové logiky
36 [070507-1501 ] 4.2 Syntaxe predikátové logiky V tomto oddíle zavedeme syntaxi predikátové logiky, tj. uvedeme pravidla, podle nichž se tvoří syntakticky správné formule predikátové logiky. Význam a
VíceDEFINICE Z LINEÁRNÍ ALGEBRY
DEFINICE Z LINEÁRNÍ ALGEBRY Skripta Matematické metody pro statistiku a operační výzkum (Nešetřilová, H., Šařecová, P., 2009). 1. definice Vektorovým prostorem rozumíme neprázdnou množinu prvků V, na které
VíceVýroková a predikátová logika - V
Výroková a predikátová logika - V Petr Gregor KTIML MFF UK ZS 2015/2016 Petr Gregor (KTIML MFF UK) Výroková a predikátová logika - V ZS 2015/2016 1 / 21 Dokazovací systémy VL Hilbertovský kalkul Hilbertovský
VíceVědecký tutoriál, část I. A Tutorial. Vilém Vychodil (Univerzita Palackého v Olomouci)
..! POSSIBILISTIC Laboratoř pro analýzu INFORMATION: a modelování dat Vědecký tutoriál, část I A Tutorial Vilém Vychodil (Univerzita Palackého v Olomouci) George J. Klir State University of New York (SUNY)
VíceZákladní pojmy teorie množin Vektorové prostory
Základní pojmy teorie množin Přednáška MATEMATIKA č. 1 Katedra ekonometrie FEM UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz 7. 10. 2010 Základní pojmy teorie množin Základní pojmy
VícePredikátová logika. Teoretická informatika Tomáš Foltýnek
Predikátová logika Teoretická informatika Tomáš Foltýnek foltynek@pef.mendelu.cz strana 2 Opakování z minulé přednášky Z čeho se skládá jazyk výrokové logiky? Jaká jsou schémata pro axiomy VL? Formulujte
VíceINVESTICE DO ROZVOJE VZDĚLÁVÁNÍ. Modernizace studijního programu Matematika na PřF Univerzity Palackého v Olomouci CZ.1.07/2.2.00/28.
INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ Modernizace studijního programu Matematika na PřF Univerzity Palackého v Olomouci CZ.1.07/2.2.00/28.0141 Relace, zobrazení, algebraické struktury Michal Botur Přednáška
VíceMatematika I. Přednášky: Mgr. Radek Výrut, Zkouška:
Přednášky: Mgr. Radek Výrut, Matematika I katedra matematiky, UL-605, rvyrut@kma.zcu.cz tel.: 377 63 2658 Zkouška: Písemná část zkoušky - příklady v rozsahu zápočtových prací Ústní část zkoušky - základní
VíceMETODOLOGIE I - METODOLOGIE KVANTITATIVNÍHO VÝZKUMU
METODOLOGIE I - METODOLOGIE KVANTITATIVNÍHO VÝZKUMU vyučující doc. RNDr. Jiří Zháněl, Dr. M I 4 Metodologie I 7. ANALÝZA DAT (KVANTITATIVNÍ VÝZKUM) (MATEMATICKÁ) STATISTIKA DESKRIPTIVNÍ (popisná) ANALYTICKÁ
VíceM - Výroková logika VARIACE
M - Výroková logika Autor: Mgr. Jaromír Juřek Kopírování a další šíření povoleno pouze s uvedením odkazu na www.jarjurek.cz. VARIACE 1 Tento dokument byl kompletně vytvořen, sestaven a vytištěn v programu
VíceZáklady logiky a teorie množin
Pracovní text k přednášce Logika a teorie množin (I/2007) 1 1 Struktura přednášky Matematická logika 2 Výroková logika Základy logiky a teorie množin Petr Pajas pajas@matfyz.cz Predikátová logika 1. řádu
VíceÚvod do logiky (VL): 5. Odvození výrokových spojek z jiných
Logika: systémový rámec rozvoje oboru v ČR a koncepce logických propedeutik pro mezioborová studia (reg. č. CZ.1.07/2.2.00/28.0216, OPVK) Úvod do logiky (VL): 5. Odvození z jiných doc. PhDr. Jiří Raclavský,
VíceÚvod do logiky (presentace 2) Naivní teorie množin, relace a funkce
Úvod do logiky (presentace 2) Naivní teorie množin, relace a funkce Marie Duží marie.duzi@vsb.cz 1 Úvod do teoretické informatiky (logika) Naivní teorie množin Co je to množina? Množina je soubor prvků
VíceDobývání znalostí z databází (MI-KDD) Přednáška číslo 1 - Úvod
Dbývání znalstí z databází (MI-KDD) Přednáška čísl 1 - Úvd (c) prf. RNDr. Jan Rauch, CSc. KIZI, Fakulta infrmatiky a statistiky VŠE zimní semestr 2011/2012 Evrpský sciální fnd Praha & EU: Investujeme d
VíceMatematická logika. Rostislav Horčík. horcik
Matematická logika Rostislav Horčík horcik@math.feld.cvut.cz horcik@cs.cas.cz www.cs.cas.cz/ horcik Rostislav Horčík (ČVUT FEL) Y01MLO Letní semestr 2007/2008 1 / 20 Predikátová logika Motivace Výroková
VíceHodnocení (ne)zajímavosti asociačních pravidel za využití báze znalostí
Hodnocení (ne)zajímavosti asociačních pravidel za využití báze znalostí Přemysl Václav Duben, Stanislav Vojíř Katedra informačního a znalostního inženýrství, FIS, Vysoká škola ekonomická v Praze nám. W.
VíceVýpočet na gridu a LM TaskPooler
Dobývání znalostí z databází MI-KDD ZS 2011 Přednáška 10 Výpočet na gridu a LM TaskPooler v systému LISp-Miner (c) 2011 Ing. M. Šimůnek, Ph.D. KIZI, Fakulta informatiky a statistiky, VŠE Praha Evropský
VíceOrganizace. Zápočet: test týden semestru (pátek) bodů souhrnný test (1 pokus) Zkouška: písemná část ( 50 bodů), ústní část
Matematika I 1/15 2/15 Organizace Zápočet: test 6. + 11. týden semestru (pátek) 80 bodů 50 79 bodů souhrnný test (1 pokus) Zkouška: písemná část ( 50 bodů), ústní část www.vscht.cz/mat Výuka www.vscht.cz/mat/jana.nemcova
Více1 Základní pojmy. 1.1 Množiny
1 Základní pojmy V této kapitole si stručně připomeneme základní pojmy, bez jejichž znalostí bychom se v dalším studiu neobešli. Nejprve to budou poznatky z logiky a teorie množin. Dále se budeme věnovat
VícePŘÍRODOVĚDECKÁ FAKULTA UNIVERZITY PALACKÉHO KATEDRA INFORMATIKY DIPLOMOVÁ PRÁCE. Analýza dat ze studentských dotazníků Bc.
PŘÍRODOVĚDECKÁ FAKULTA UNIVERZITY PALACKÉHO KATEDRA INFORMATIKY DIPLOMOVÁ PRÁCE Analýza dat ze studentských dotazníků 2013 Bc. Tomáš Matonoha Anotace Data mining je proces získávání netriviálních a dříve
VíceMatematika pro informatiky KMA/MATA
Matematika pro informatiky KMA/MATA Informace k předmětu Mgr. Přemysl Rosa rosapr00@pf.jcu.cz, J349 Konzultační hodiny v ZS: úterý 10-11, čtvrtek 15-16 nebo individuálně po předchozí domluvě aktivní účast
VíceParadigmata programování 1
Paradigmata programování 1 Explicitní aplikace a vyhodnocování Vilém Vychodil Katedra informatiky, PřF, UP Olomouc Přednáška 6 V. Vychodil (KI, UP Olomouc) Explicitní aplikace a vyhodnocování Přednáška
VíceTeoretická informatika Tomáš Foltýnek foltynek@pef.mendelu.cz. Algebra Struktury s jednou operací
Teoretická informatika Tomáš Foltýnek foltynek@pef.mendelu.cz Algebra Struktury s jednou operací Teoretická informatika 2 Proč zavádíme algebru hledáme nástroj pro popis objektů reálného světa (zejména
VíceMATICE. a 11 a 12 a 1n a 21 a 22 a 2n A = = [a ij]
MATICE Matice typu m/n nad tělesem T je soubor m n prvků z tělesa T uspořádaných do m řádků a n sloupců: a 11 a 12 a 1n a 21 a 22 a 2n A = = [a ij] a m1 a m2 a mn Prvek a i,j je prvek matice A na místě
Více1 Soustavy lineárních rovnic
1 Soustavy lineárních rovnic 1.1 Základní pojmy Budeme uvažovat soustavu m lineárních rovnic o n neznámých s koeficienty z tělesa T (potom hovoříme o soustavě m lineárních rovnic o n neznámých nad tělesem
VíceDatabázové systémy. * relační kalkuly. Tomáš Skopal. - relační model
Databázové systémy Tomáš Skopal - relační model * relační kalkuly Osnova přednášky relační kalkuly doménový n-ticový Relační kalkuly využití aparátu predikátové logiky 1. řádu pro dotazování rozšíření
VíceVýroková a predikátová logika - III
Výroková a predikátová logika - III Petr Gregor KTIML MFF UK ZS 2017/2018 Petr Gregor (KTIML MFF UK) Výroková a predikátová logika - III ZS 2017/2018 1 / 16 2-SAT 2-SAT Výrok je v k-cnf, je-li v CNF a
VíceLokální a globální analytické zprávy o výsledcích DZD
Univerzita Karlova v Praze Matematicko-fyzikální fakulta DIPLOMOVÁ PRÁCE Zdeněk Reischig Lokální a globální analytické zprávy o výsledcích DZD KATEDRA SOFTWAROVÉHO INŽENÝRSTVÍ Vedoucí diplomové práce:
VíceTrendy v časových oknech jako rizikové faktory kardiovaskulárního onemocnění
Trendy v časových oknech jako rizikové faktory kardiovaskulárního onemocnění Trendy Lenka Novákováv časových 1, Filip Karel oknech 1, Petr Aubrecht jako 1, rizikové Marie Tomečková faktory 2, Jan Rauch
VíceLISp-Miner. 11.5.2004 Martin Šulc Projekt do předmětu Vyhledávání znalostí v databázích
LISp-Miner 11.5.2004 Martin Šulc Projekt do předmětu Vyhledávání znalostí v databázích Zadání Popis systému LISp-Miner a experimenty s databází. Abstrakt Tento projekt popisuje systém LISp-Miner, jeho
VíceÚvod do programovacích jazyků (Java)
Úvod do programovacích jazyků (Java) Michal Krátký Katedra informatiky VŠB Technická univerzita Ostrava Úvod do programovacích jazyků (Java), 2007/2008 c 2006 2008 Michal Krátký Úvod do programovacích
VíceVýroková logika II. Negace. Již víme, že negace je změna pravdivostní hodnoty výroku (0 1; 1 0).
Výroková logika II Negace Již víme, že negace je změna pravdivostní hodnoty výroku (0 1; 1 0). Na konkrétních příkladech si ukážeme, jak se dají výroky negovat. Obecně se výrok dá negovat tak, že před
VíceZÍSKÁVÁNÍ ZNALOSTÍ Z DATABÁZÍ
metodický list č. 1 Dobývání znalostí z databází Cílem tohoto tematického celku je vysvětlení základních pojmů z oblasti dobývání znalostí z databází i východisek dobývání znalostí z databází inspirovaných
VíceLISp-Miner Na lékal kařských datech. Martin Šulc Cikháj 5.-4..005 4..005 Abstrakt Tato přednp ednáška je o systému vyvíjen jeném m na VŠE V E v Praze a o jeho aplikaci na data, která jsou genetickým obrazem
Více1 Výrok a jeho negace
1 Výrok a jeho negace Výrokem se rozumí sdělení, u něhož má smysl otázka, zda je, či není pravdivé. Budeme určovat tzv. pravdivostní hodnotu výroku (PH). Příklady výroků: V Úhlopříčky čtverce jsou na sebe
VíceVýroková logika - opakování
- opakování ormální zavedení Výroková formule: Máme neprázdnou nejvýše spočetnou množinu A výrokových proměnných. 1. Každá proměnná je výroková formule 2. Když α, β jsou formule, potom ( α), (α β), (α
VíceVýroková a predikátová logika - II
Výroková a predikátová logika - II Petr Gregor KTIML MFF UK ZS 2015/2016 Petr Gregor (KTIML MFF UK) Výroková a predikátová logika - II ZS 2015/2016 1 / 18 Základní syntax Jazyk Výroková logika je logikou
VíceNaproti tomu gramatika je vlastně soupis pravidel, jak
1 Kapitola 1 Úvod V přednášce se zaměříme hlavně na konečný popis obecně nekonečných množin řetězců symbolů dané množiny A. Prvkům množiny A budeme říkat písmena, řetězcům (konečným posloupnostem) písmen
VíceObsah. Seznam obrázků. Seznam tabulek. Petr Berka, 2011
Petr Berka, 2011 Obsah... 1... 1 1 Obsah 1... 1 Dobývání znalostí z databází 1 Dobývání znalostí z databází O dobývání znalostí z databází (Knowledge Discovery in Databases, KDD) se začíná ve vědeckých
VíceMatematika (CŽV Kadaň) aneb Úvod do lineární algebry Matice a soustavy rovnic
Přednáška třetí (a pravděpodobně i čtvrtá) aneb Úvod do lineární algebry Matice a soustavy rovnic Lineární rovnice o 2 neznámých Lineární rovnice o 2 neznámých Lineární rovnice o dvou neznámých x, y je
VíceBáze a dimenze vektorových prostorů
Báze a dimenze vektorových prostorů Buď (V, +, ) vektorový prostor nad tělesem (T, +, ). Nechť u 1, u 2,..., u n je konečná posloupnost vektorů z V. Existují-li prvky s 1, s 2,..., s n T, z nichž alespoň
VíceZískávání dat z databází 1 DMINA 2010
Získávání dat z databází 1 DMINA 2010 Získávání dat z databází Motto Kde je moudrost? Ztracena ve znalostech. Kde jsou znalosti? Ztraceny v informacích. Kde jsou informace? Ztraceny v datech. Kde jsou
Více2. ZÁKLADY MATICOVÉ ALGEGRY 2.1. ZÁKLADNÍ POJMY
2. ZÁKLADY MAICOVÉ ALGEGRY 2.1. ZÁKLADNÍ POJMY V této kapitole se dozvíte: jak je definována reálná nebo komplexní matice a co rozumíme jejím typem; co jsou to prvky matice, co vyjadřují jejich indexy
VíceÚplný systém m logických spojek. 3.přednáška
Úplný sstém m logických spojek 3.přednáška Definice Úplný sstém m logických spojek Řekneme, že množina logických spojek S tvoří úplný sstém logických spojek, jestliže pro každou formuli A eistuje formule
VíceOkruh č.3: Sémantický výklad predikátové logiky
Okruh č.3: Sémantický výklad predikátové logiky Predikátová logika 1.řádu formalizuje úsudky o vlastnostech předmětů a vztazích mezi předměty pevně dané předmětné oblasti (univerza). Nebudeme se zabývat
VíceMatematická logika. Rostislav Horčík. horcik
Matematická logika Rostislav Horčík horcik@math.feld.cvut.cz horcik@cs.cas.cz www.cs.cas.cz/ horcik Rostislav Horčík (ČVUT FEL) Y01MLO Letní semestr 2007/2008 1 / 15 Sémantická věta o dedukci Věta Pro
VíceVýroková a predikátová logika - II
Výroková a predikátová logika - II Petr Gregor KTIML MFF UK ZS 2013/2014 Petr Gregor (KTIML MFF UK) Výroková a predikátová logika - II ZS 2013/2014 1 / 20 Základní syntax Jazyk Výroková logika je logikou
VíceÚvod do logiky (VL): 11. Ověřování, zda je formule tautologií metodou protipříkladu
Jiří Raclavský (214): Úvod do logiky: klasická výroková logika Logika: systémový rámec rozvoje oboru v ČR a koncepce logických propedeutik pro mezioborová studia (reg. č. CZ.1.7/2.2./28.216, OPVK) Úvod
VíceTEORIE ZPRACOVÁNÍ DAT
Vysoká škola báňská - Technická univerzita Ostrava Fakulta elektrotechniky a informatiky TEORIE ZPRACOVÁNÍ DAT pro kombinované a distanční studium Jana Šarmanová Ostrava 2003 Jana Šarmanová, 2003 Fakulta
VíceVýroková a predikátová logika - II
Výroková a predikátová logika - II Petr Gregor KTIML MFF UK ZS 2017/2018 Petr Gregor (KTIML MFF UK) Výroková a predikátová logika - II ZS 2017/2018 1 / 17 Předběžnosti Základní pojmy n-ární relace a funkce
VíceVektorové podprostory, lineární nezávislost, báze, dimenze a souřadnice
Vektorové podprostory, lineární nezávislost, báze, dimenze a souřadnice Vektorové podprostory K množina reálných nebo komplexních čísel, U vektorový prostor nad K. Lineární kombinace vektorů u 1, u 2,...,u
Více1.4.6 Negace složených výroků I
1.4.6 Negace složených výroků I Předpoklady: 010405 Pedagogická poznámka: Dlouho jsem se v počátcích své praxe snažil probrat negace za jednu hodinu. Tvorba negací je skvělým procvičováním schopnosti dodržovat
Více1. Matematická logika
Moderní technologie ve studiu aplikované fyziky CZ.1.07/2.2.00/07.0018 1. Matematická logika Základem každé vědy (tedy i matematiky i fyziky) je soubor jistých znalostí. To, co z těchto izolovaných poznatků
VíceMasterský studijní obor datové & webové inženýrství
Masterský studijní obor datové & webové inženýrství Předpoklady Struktura studia Přihlášky Poradenství Masterský studijní obor datové & webové inženýrství představuje ve studijním konceptu fakulty informatiky
VíceStefan Ratschan. Fakulta informačních technologíı. Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti
Logika pro každodenní přežití Stefan Ratschan Katedra číslicového návrhu Fakulta informačních technologíı České vysoké učení technické v Praze Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti
Více0.1 Úvod do lineární algebry
Matematika KMI/PMATE 1 01 Úvod do lineární algebry 011 Lineární rovnice o 2 neznámých Definice 011 Lineární rovnice o dvou neznámých x, y je rovnice, která může být vyjádřena ve tvaru ax + by = c, kde
VíceKarta předmětu prezenční studium
Karta předmětu prezenční studium Název předmětu: Číslo předmětu: 545-0250 Garantující institut: Garant předmětu: Ekonomická statistika Institut ekonomiky a systémů řízení RNDr. Radmila Sousedíková, Ph.D.
VíceAsociační i jiná. Pravidla. (Ch )
Asociační i jiná Pravidla (Ch. 14 +...) Učení bez učitele Nemáme cílovou třídu Y, G; máme N pozorování což jsou p-dimenzionální vektory se sdruženou pravděpodobností chceme odvozovat vlastnosti. Pro málo
VíceTeoretická informatika Tomáš Foltýnek Teorie čísel Nekonečno
Tomáš Foltýnek foltynek@pef.mendelu.cz Teorie čísel Nekonečno strana 2 Opakování z minulé přednášky Jak je definována podmnožina, průnik, sjednocení, rozdíl? Jak je definována uspořádaná dvojice a kartézský
VíceStruktura e-learningových výukových programù a možnosti jejího využití
Struktura e-learningových výukových programù a možnosti jejího využití Jana Šarmanová Klíčová slova: e-learning, programovaná výuka, režimy učení Abstrakt: Autorská tvorba výukových studijních opor je
Více