Radim Navrátil. Robust 24. ledna 2018
|
|
- Zdeňka Beránková
- před 5 lety
- Počet zobrazení:
Transkript
1 Analýza nákupního košíku - historie a současnost Radim Navrátil Ústav matematiky a statistiky Přírodovědecká fakulta MU, Brno Robust 24. ledna 2018 Radim Navrátil (ÚMS Brno) Analýza nákupního košíku Robust / 34
2 O čem nebudu povídat Penalizované a shrinkage R-odhady v modelu lineární regrese (společně s prof. Salehem, Carleton University, Ottawa). Zkoumání vychýlenosti a střední čtvercové chyby odhadů, je-li vektor parametrů řídký. Vytyčení oboru dominance pro jednotlivé odhady. Výsledky analogické těm pro odhady odvozené od LSE. Radim Navrátil (ÚMS Brno) Analýza nákupního košíku Robust / 34
3 O čem nebudu povídat Penalizované a shrinkage R-odhady v modelu lineární regrese (společně s prof. Salehem, Carleton University, Ottawa). Zkoumání vychýlenosti a střední čtvercové chyby odhadů, je-li vektor parametrů řídký. Vytyčení oboru dominance pro jednotlivé odhady. Výsledky analogické těm pro odhady odvozené od LSE. Radim Navrátil (ÚMS Brno) Analýza nákupního košíku Robust / 34
4 O čem nebudu povídat Penalizované a shrinkage R-odhady v modelu lineární regrese (společně s prof. Salehem, Carleton University, Ottawa). Zkoumání vychýlenosti a střední čtvercové chyby odhadů, je-li vektor parametrů řídký. Vytyčení oboru dominance pro jednotlivé odhady. Výsledky analogické těm pro odhady odvozené od LSE. Radim Navrátil (ÚMS Brno) Analýza nákupního košíku Robust / 34
5 O čem nebudu povídat Penalizované a shrinkage R-odhady v modelu lineární regrese (společně s prof. Salehem, Carleton University, Ottawa). Radim Navrátil (ÚMS Brno) Analýza nákupního košíku Robust / 34
6 O čem budu povídat 1 Úvod a motivace 2 Analýza nákupního košíku - základní pojmy 3 Zobecnění na složitější pravidla 4 Další rozšíření 5 Příklad 6 Výhled do budoucnosti Radim Navrátil (ÚMS Brno) Analýza nákupního košíku Robust / 34
7 Úvod a motivace Asociační analýza Metoda pro objevování častých vzorů (vztahů) ukrytých ve velkých databázích. Tyto vzory jsou vyjadřovány pomocí asociačních pravidel, které popisují společně se vyskytující atributy. Rakesh Agrawal et al. (1993) poprvé uvedli asociační pravidla pro objevování zákonitostí mezi produkty v transakčních datech z pokladních systémů supermarketů. Analýza nákupního košíku (market basket analysis). Další metody: Web mining, Intrusion Detection System (odhalování podezřelé aktivity), Continuous production. Radim Navrátil (ÚMS Brno) Analýza nákupního košíku Robust / 34
8 Úvod a motivace Jsou všechna pravidla zajímavá? Asociační pravidla by měla být: snadno pochopitelná: jakmile je nějaký vztah nalezen, lze ho snadno ověřit, použitelná: obsahují užitečné informace, které mohou vést k dalším intervencím. Asociační pravidla by neměla být: triviální: výsledky už stejně každý zná, nevysvětlitelná: neexistuje k nim žádné vysvětlení a nevedou k žádné akci. Radim Navrátil (ÚMS Brno) Analýza nákupního košíku Robust / 34
9 Úvod a motivace Jsou všechna pravidla zajímavá? Asociační pravidla by měla být: snadno pochopitelná: jakmile je nějaký vztah nalezen, lze ho snadno ověřit, použitelná: obsahují užitečné informace, které mohou vést k dalším intervencím. Asociační pravidla by neměla být: triviální: výsledky už stejně každý zná, nevysvětlitelná: neexistuje k nim žádné vysvětlení a nevedou k žádné akci. Radim Navrátil (ÚMS Brno) Analýza nákupního košíku Robust / 34
10 Úvod a motivace Matematické pozadí Data (transakční): ID Položky transakce 1 x 1, x 3, x 4 2 x 1 3 x 2, x 3, x 4, x 5 4 x 3, x n x 2, x 3, x 4 Množina všech položek I = {x 1,..., x m }. Cíl: Vytvořit pravidla typu x i x j. Radim Navrátil (ÚMS Brno) Analýza nákupního košíku Robust / 34
11 Analýza nákupního košíku - základní pojmy Příklad - transakční data ID Transakce 1 pivo,pečivo 2 pečivo,voda 3 pečivo,máslo,voda 4 pečivo,máslo,zelenina 5 pivo 6 máslo,voda 7 pivo,pečivo,máslo,voda 8 pivo,voda 9 pečivo,máslo,zelenina 10 voda,zelenina Radim Navrátil (ÚMS Brno) Analýza nákupního košíku Robust / 34
12 Analýza nákupního košíku - základní pojmy Příklad - transakční data zobrazená pomocí datové matice ID máslo pivo pečivo voda zelenina Radim Navrátil (ÚMS Brno) Analýza nákupního košíku Robust / 34
13 Analýza nákupního košíku - základní pojmy Matematické pozadí Podpora (support): supp(x i x j ) = Počet transakcí obsahující současně x i a x j, Celkový počet transakcí supp(x i x j ) = Relativní četnost transakcí obsahující současně x i a x j, supp(x i x j ) = P (v dané transakci se vyskytuje současně x i a x j ). Zřejmě: supp(x i x j ) = supp(x j x i ). Radim Navrátil (ÚMS Brno) Analýza nákupního košíku Robust / 34
14 Analýza nákupního košíku - základní pojmy Matematické pozadí Podpora (support): supp(x i x j ) = Počet transakcí obsahující současně x i a x j, Celkový počet transakcí supp(x i x j ) = Relativní četnost transakcí obsahující současně x i a x j, supp(x i x j ) = P (v dané transakci se vyskytuje současně x i a x j ). Zřejmě: supp(x i x j ) = supp(x j x i ). Radim Navrátil (ÚMS Brno) Analýza nákupního košíku Robust / 34
15 Analýza nákupního košíku - základní pojmy Matematické pozadí Podpora (support): supp(x i x j ) = Počet transakcí obsahující současně x i a x j, Celkový počet transakcí supp(x i x j ) = Relativní četnost transakcí obsahující současně x i a x j, supp(x i x j ) = P (v dané transakci se vyskytuje současně x i a x j ). Zřejmě: supp(x i x j ) = supp(x j x i ). Radim Navrátil (ÚMS Brno) Analýza nákupního košíku Robust / 34
16 Analýza nákupního košíku - základní pojmy Matematické pozadí Podpora (support): supp(x i x j ) = Počet transakcí obsahující současně x i a x j, Celkový počet transakcí supp(x i x j ) = Relativní četnost transakcí obsahující současně x i a x j, supp(x i x j ) = P (v dané transakci se vyskytuje současně x i a x j ). Zřejmě: supp(x i x j ) = supp(x j x i ). Radim Navrátil (ÚMS Brno) Analýza nákupního košíku Robust / 34
17 Analýza nákupního košíku - základní pojmy Matematické pozadí Spolehlivost (confidence): conf(x i x j ) = Počet transakcí obsahující současně x i a x j Počet transakcí obsahující x i, conf(x i x j ) = Relativní četnost transakcí obsahující současně x i a x j, mezi těmi, které už x i obsahují. conf(x i x j ) = P(v dané transakci se vyskytuje současně x i a x j v dané transakci se vyskytuje x i ). Radim Navrátil (ÚMS Brno) Analýza nákupního košíku Robust / 34
18 Analýza nákupního košíku - základní pojmy Matematické pozadí Spolehlivost (confidence): conf(x i x j ) = Počet transakcí obsahující současně x i a x j Počet transakcí obsahující x i, conf(x i x j ) = Relativní četnost transakcí obsahující současně x i a x j, mezi těmi, které už x i obsahují. conf(x i x j ) = P(v dané transakci se vyskytuje současně x i a x j v dané transakci se vyskytuje x i ). Radim Navrátil (ÚMS Brno) Analýza nákupního košíku Robust / 34
19 Analýza nákupního košíku - základní pojmy Matematické pozadí Spolehlivost (confidence): conf(x i x j ) = Počet transakcí obsahující současně x i a x j Počet transakcí obsahující x i, conf(x i x j ) = Relativní četnost transakcí obsahující současně x i a x j, mezi těmi, které už x i obsahují. conf(x i x j ) = P(v dané transakci se vyskytuje současně x i a x j v dané transakci se vyskytuje x i ). Radim Navrátil (ÚMS Brno) Analýza nákupního košíku Robust / 34
20 Analýza nákupního košíku - základní pojmy Matematické pozadí Lift (zlepšení): lift(x i x j ) = Počet transakcí obsahující současně x i a x j n Počet transakcí obsahující x i Počet transakcí obsahující x j, lift(x i x j ) = P(v dané transakci se vyskytuje současně x i a x j ) P(v dané transakci je x i ) P(v dané transakci je x j ). Zřejmě: lift(x i x j ) = lift(x j x i ). Radim Navrátil (ÚMS Brno) Analýza nákupního košíku Robust / 34
21 Analýza nákupního košíku - základní pojmy Matematické pozadí Lift (zlepšení): lift(x i x j ) = Počet transakcí obsahující současně x i a x j n Počet transakcí obsahující x i Počet transakcí obsahující x j, lift(x i x j ) = P(v dané transakci se vyskytuje současně x i a x j ) P(v dané transakci je x i ) P(v dané transakci je x j ). Zřejmě: lift(x i x j ) = lift(x j x i ). Radim Navrátil (ÚMS Brno) Analýza nákupního košíku Robust / 34
22 Analýza nákupního košíku - základní pojmy Matematické pozadí Lift (zlepšení): lift(x i x j ) = Počet transakcí obsahující současně x i a x j n Počet transakcí obsahující x i Počet transakcí obsahující x j, lift(x i x j ) = P(v dané transakci se vyskytuje současně x i a x j ) P(v dané transakci je x i ) P(v dané transakci je x j ). Zřejmě: lift(x i x j ) = lift(x j x i ). Radim Navrátil (ÚMS Brno) Analýza nákupního košíku Robust / 34
23 Analýza nákupního košíku - základní pojmy Postup při hledání pravidel Zvoĺıme si minimální hodnotu podpory α. Najdeme všechny dvojice položek x i a x j takové, že spolehlivost pravidla x i x j je alespoň α. Zvoĺıme si minimální hodnotu podpory β. Ze všech dvojic položek x i a x j vytvoříme pravidla x i x j, resp. x j x i. Z nich vybereme jen ta, která mají hodnotu spolehlivosti alespoň β. Radim Navrátil (ÚMS Brno) Analýza nákupního košíku Robust / 34
24 Analýza nákupního košíku - základní pojmy Postup při hledání pravidel Zvoĺıme si minimální hodnotu podpory α. Najdeme všechny dvojice položek x i a x j takové, že spolehlivost pravidla x i x j je alespoň α. Zvoĺıme si minimální hodnotu podpory β. Ze všech dvojic položek x i a x j vytvoříme pravidla x i x j, resp. x j x i. Z nich vybereme jen ta, která mají hodnotu spolehlivosti alespoň β. Radim Navrátil (ÚMS Brno) Analýza nákupního košíku Robust / 34
25 Analýza nákupního košíku - základní pojmy Postup při hledání pravidel Zvoĺıme si minimální hodnotu podpory α. Najdeme všechny dvojice položek x i a x j takové, že spolehlivost pravidla x i x j je alespoň α. Zvoĺıme si minimální hodnotu podpory β. Ze všech dvojic položek x i a x j vytvoříme pravidla x i x j, resp. x j x i. Z nich vybereme jen ta, která mají hodnotu spolehlivosti alespoň β. Radim Navrátil (ÚMS Brno) Analýza nákupního košíku Robust / 34
26 Analýza nákupního košíku - základní pojmy Postup při hledání pravidel Zvoĺıme si minimální hodnotu podpory α. Najdeme všechny dvojice položek x i a x j takové, že spolehlivost pravidla x i x j je alespoň α. Zvoĺıme si minimální hodnotu podpory β. Ze všech dvojic položek x i a x j vytvoříme pravidla x i x j, resp. x j x i. Z nich vybereme jen ta, která mají hodnotu spolehlivosti alespoň β. Radim Navrátil (ÚMS Brno) Analýza nákupního košíku Robust / 34
27 Analýza nákupního košíku - základní pojmy Postup při hledání pravidel Zvoĺıme si minimální hodnotu podpory α. Najdeme všechny dvojice položek x i a x j takové, že spolehlivost pravidla x i x j je alespoň α. Zvoĺıme si minimální hodnotu podpory β. Ze všech dvojic položek x i a x j vytvoříme pravidla x i x j, resp. x j x i. Z nich vybereme jen ta, která mají hodnotu spolehlivosti alespoň β. Radim Navrátil (ÚMS Brno) Analýza nákupního košíku Robust / 34
28 Analýza nákupního košíku - základní pojmy Příklad - matice souslednosti máslo pivo pečivo voda zelenina máslo pivo pečivo voda zelenina máslo, pečivo máslo, voda voda, pečivo Zvoĺıme minimální hodnotu podpory α = 0.3. Radim Navrátil (ÚMS Brno) Analýza nákupního košíku Robust / 34
29 Analýza nákupního košíku - základní pojmy Příklad - matice souslednosti máslo pivo pečivo voda zelenina máslo pivo pečivo voda zelenina máslo, pečivo máslo, voda voda, pečivo Zvoĺıme minimální hodnotu podpory α = 0.3. Radim Navrátil (ÚMS Brno) Analýza nákupního košíku Robust / 34
30 Analýza nákupního košíku - základní pojmy Příklad - výsledná pravidla Pravidlo podpora spolehlivost zlepšení máslo pečivo pečivo máslo máslo voda voda máslo voda pečivo pečivo voda Radim Navrátil (ÚMS Brno) Analýza nákupního košíku Robust / 34
31 Analýza nákupního košíku - základní pojmy Tale of beer and diapers 1990 s: Americký obchodní řetězec Walmart na základě údajů o nákupech svých zákazníků zjistil, že prodej dětských plen a piva je silně korelovaný. Radim Navrátil (ÚMS Brno) Analýza nákupního košíku Robust / 34
32 Analýza nákupního košíku - základní pojmy Tale of beer and diapers Radim Navrátil (ÚMS Brno) Analýza nákupního košíku Robust / 34
33 Analýza nákupního košíku - základní pojmy Tale of beer and diapers 1990s: Americký obchodní řetězec Walmart na základě údajů o nákupech svých zákazníků zjistil, že prodej dětských plen a piva je silně korelovaný. Walmart zpracoval údaje ze svých věrnostních karet a transakčních dat a výsledek zpřesnil: Mladí Američané, kteří v pátek večer kupují dětské pleny, kupují také pivo. Vysvětlení: Mladí Američané jsou zvykĺı v pátek večer popíjet s přáteli (pivo), ale pokud už mají děti, nemohou vysedávat s přáteli v barech, proto si koupí aspoň pivo, aby mohli popíjet doma. Po zjištění této souvislosti Walmart přesunul pivo hned vedle regálu s plenami. Prodej piva se rapidně zvýšil. Walmart nikdy ale statisticky své zdůvodnění neprokázal. Mnoho variací tohoto příběhu: akademických článků, knih, internetových stránek. Radim Navrátil (ÚMS Brno) Analýza nákupního košíku Robust / 34
34 Analýza nákupního košíku - základní pojmy Tale of beer and diapers 1990s: Americký obchodní řetězec Walmart na základě údajů o nákupech svých zákazníků zjistil, že prodej dětských plen a piva je silně korelovaný. Walmart zpracoval údaje ze svých věrnostních karet a transakčních dat a výsledek zpřesnil: Mladí Američané, kteří v pátek večer kupují dětské pleny, kupují také pivo. Vysvětlení: Mladí Američané jsou zvykĺı v pátek večer popíjet s přáteli (pivo), ale pokud už mají děti, nemohou vysedávat s přáteli v barech, proto si koupí aspoň pivo, aby mohli popíjet doma. Po zjištění této souvislosti Walmart přesunul pivo hned vedle regálu s plenami. Prodej piva se rapidně zvýšil. Walmart nikdy ale statisticky své zdůvodnění neprokázal. Mnoho variací tohoto příběhu: akademických článků, knih, internetových stránek. Radim Navrátil (ÚMS Brno) Analýza nákupního košíku Robust / 34
35 Analýza nákupního košíku - základní pojmy Tale of beer and diapers 1990s: Americký obchodní řetězec Walmart na základě údajů o nákupech svých zákazníků zjistil, že prodej dětských plen a piva je silně korelovaný. Walmart zpracoval údaje ze svých věrnostních karet a transakčních dat a výsledek zpřesnil: Mladí Američané, kteří v pátek večer kupují dětské pleny, kupují také pivo. Vysvětlení: Mladí Američané jsou zvykĺı v pátek večer popíjet s přáteli (pivo), ale pokud už mají děti, nemohou vysedávat s přáteli v barech, proto si koupí aspoň pivo, aby mohli popíjet doma. Po zjištění této souvislosti Walmart přesunul pivo hned vedle regálu s plenami. Prodej piva se rapidně zvýšil. Walmart nikdy ale statisticky své zdůvodnění neprokázal. Mnoho variací tohoto příběhu: akademických článků, knih, internetových stránek. Radim Navrátil (ÚMS Brno) Analýza nákupního košíku Robust / 34
36 Analýza nákupního košíku - základní pojmy Tale of beer and diapers 1990s: Americký obchodní řetězec Walmart na základě údajů o nákupech svých zákazníků zjistil, že prodej dětských plen a piva je silně korelovaný. Walmart zpracoval údaje ze svých věrnostních karet a transakčních dat a výsledek zpřesnil: Mladí Američané, kteří v pátek večer kupují dětské pleny, kupují také pivo. Vysvětlení: Mladí Američané jsou zvykĺı v pátek večer popíjet s přáteli (pivo), ale pokud už mají děti, nemohou vysedávat s přáteli v barech, proto si koupí aspoň pivo, aby mohli popíjet doma. Po zjištění této souvislosti Walmart přesunul pivo hned vedle regálu s plenami. Prodej piva se rapidně zvýšil. Walmart nikdy ale statisticky své zdůvodnění neprokázal. Mnoho variací tohoto příběhu: akademických článků, knih, internetových stránek. Radim Navrátil (ÚMS Brno) Analýza nákupního košíku Robust / 34
37 Analýza nákupního košíku - základní pojmy Tale of beer and diapers 1990s: Americký obchodní řetězec Walmart na základě údajů o nákupech svých zákazníků zjistil, že prodej dětských plen a piva je silně korelovaný. Walmart zpracoval údaje ze svých věrnostních karet a transakčních dat a výsledek zpřesnil: Mladí Američané, kteří v pátek večer kupují dětské pleny, kupují také pivo. Vysvětlení: Mladí Američané jsou zvykĺı v pátek večer popíjet s přáteli (pivo), ale pokud už mají děti, nemohou vysedávat s přáteli v barech, proto si koupí aspoň pivo, aby mohli popíjet doma. Po zjištění této souvislosti Walmart přesunul pivo hned vedle regálu s plenami. Prodej piva se rapidně zvýšil. Walmart nikdy ale statisticky své zdůvodnění neprokázal. Mnoho variací tohoto příběhu: akademických článků, knih, internetových stránek. Radim Navrátil (ÚMS Brno) Analýza nákupního košíku Robust / 34
38 Analýza nákupního košíku - základní pojmy Tale of beer and diapers 1990s: Americký obchodní řetězec Walmart na základě údajů o nákupech svých zákazníků zjistil, že prodej dětských plen a piva je silně korelovaný. Walmart zpracoval údaje ze svých věrnostních karet a transakčních dat a výsledek zpřesnil: Mladí Američané, kteří v pátek večer kupují dětské pleny, kupují také pivo. Vysvětlení: Mladí Američané jsou zvykĺı v pátek večer popíjet s přáteli (pivo), ale pokud už mají děti, nemohou vysedávat s přáteli v barech, proto si koupí aspoň pivo, aby mohli popíjet doma. Po zjištění této souvislosti Walmart přesunul pivo hned vedle regálu s plenami. Prodej piva se rapidně zvýšil. Walmart nikdy ale statisticky své zdůvodnění neprokázal. Mnoho variací tohoto příběhu: akademických článků, knih, internetových stránek. Radim Navrátil (ÚMS Brno) Analýza nákupního košíku Robust / 34
39 Analýza nákupního košíku - základní pojmy Příklad - jak využít získaná pravidla Pravidlo: panenka sladkosti Dát je v obchodě do regálu bĺızko sebe. Dát je v obchodě daleko od sebe. Vytvořit baĺıček panenka+sladkosti. Vytvořit baĺıček panenka+sladkosti+špatně prodávané zboží. Snížit cenu jednoho zboží a zvýšit cenu druhého. Nabídnout příslušenství pro panenky jako dárek za nákup. Do slevových letáků nedávat současně panenku a sladkosti. Nabídnout sladkosti ve tvaru panenky. Radim Navrátil (ÚMS Brno) Analýza nákupního košíku Robust / 34
40 Analýza nákupního košíku - základní pojmy Příklad - jak využít získaná pravidla Pravidlo: panenka sladkosti Dát je v obchodě do regálu bĺızko sebe. Dát je v obchodě daleko od sebe. Vytvořit baĺıček panenka+sladkosti. Vytvořit baĺıček panenka+sladkosti+špatně prodávané zboží. Snížit cenu jednoho zboží a zvýšit cenu druhého. Nabídnout příslušenství pro panenky jako dárek za nákup. Do slevových letáků nedávat současně panenku a sladkosti. Nabídnout sladkosti ve tvaru panenky. Radim Navrátil (ÚMS Brno) Analýza nákupního košíku Robust / 34
41 Analýza nákupního košíku - základní pojmy Příklad - jak využít získaná pravidla Pravidlo: panenka sladkosti Dát je v obchodě do regálu bĺızko sebe. Dát je v obchodě daleko od sebe. Vytvořit baĺıček panenka+sladkosti. Vytvořit baĺıček panenka+sladkosti+špatně prodávané zboží. Snížit cenu jednoho zboží a zvýšit cenu druhého. Nabídnout příslušenství pro panenky jako dárek za nákup. Do slevových letáků nedávat současně panenku a sladkosti. Nabídnout sladkosti ve tvaru panenky. Radim Navrátil (ÚMS Brno) Analýza nákupního košíku Robust / 34
42 Analýza nákupního košíku - základní pojmy Příklad - jak využít získaná pravidla Pravidlo: panenka sladkosti Dát je v obchodě do regálu bĺızko sebe. Dát je v obchodě daleko od sebe. Vytvořit baĺıček panenka+sladkosti. Vytvořit baĺıček panenka+sladkosti+špatně prodávané zboží. Snížit cenu jednoho zboží a zvýšit cenu druhého. Nabídnout příslušenství pro panenky jako dárek za nákup. Do slevových letáků nedávat současně panenku a sladkosti. Nabídnout sladkosti ve tvaru panenky. Radim Navrátil (ÚMS Brno) Analýza nákupního košíku Robust / 34
43 Analýza nákupního košíku - základní pojmy Příklad - jak využít získaná pravidla Pravidlo: panenka sladkosti Dát je v obchodě do regálu bĺızko sebe. Dát je v obchodě daleko od sebe. Vytvořit baĺıček panenka+sladkosti. Vytvořit baĺıček panenka+sladkosti+špatně prodávané zboží. Snížit cenu jednoho zboží a zvýšit cenu druhého. Nabídnout příslušenství pro panenky jako dárek za nákup. Do slevových letáků nedávat současně panenku a sladkosti. Nabídnout sladkosti ve tvaru panenky. Radim Navrátil (ÚMS Brno) Analýza nákupního košíku Robust / 34
44 Analýza nákupního košíku - základní pojmy Příklad - jak využít získaná pravidla Pravidlo: panenka sladkosti Dát je v obchodě do regálu bĺızko sebe. Dát je v obchodě daleko od sebe. Vytvořit baĺıček panenka+sladkosti. Vytvořit baĺıček panenka+sladkosti+špatně prodávané zboží. Snížit cenu jednoho zboží a zvýšit cenu druhého. Nabídnout příslušenství pro panenky jako dárek za nákup. Do slevových letáků nedávat současně panenku a sladkosti. Nabídnout sladkosti ve tvaru panenky. Radim Navrátil (ÚMS Brno) Analýza nákupního košíku Robust / 34
45 Analýza nákupního košíku - základní pojmy Příklad - jak využít získaná pravidla Pravidlo: panenka sladkosti Dát je v obchodě do regálu bĺızko sebe. Dát je v obchodě daleko od sebe. Vytvořit baĺıček panenka+sladkosti. Vytvořit baĺıček panenka+sladkosti+špatně prodávané zboží. Snížit cenu jednoho zboží a zvýšit cenu druhého. Nabídnout příslušenství pro panenky jako dárek za nákup. Do slevových letáků nedávat současně panenku a sladkosti. Nabídnout sladkosti ve tvaru panenky. Radim Navrátil (ÚMS Brno) Analýza nákupního košíku Robust / 34
46 Analýza nákupního košíku - základní pojmy Příklad - jak využít získaná pravidla Pravidlo: panenka sladkosti Dát je v obchodě do regálu bĺızko sebe. Dát je v obchodě daleko od sebe. Vytvořit baĺıček panenka+sladkosti. Vytvořit baĺıček panenka+sladkosti+špatně prodávané zboží. Snížit cenu jednoho zboží a zvýšit cenu druhého. Nabídnout příslušenství pro panenky jako dárek za nákup. Do slevových letáků nedávat současně panenku a sladkosti. Nabídnout sladkosti ve tvaru panenky. Radim Navrátil (ÚMS Brno) Analýza nákupního košíku Robust / 34
47 Analýza nákupního košíku - základní pojmy Příklad - jak využít získaná pravidla Pravidlo: panenka sladkosti Dát je v obchodě do regálu bĺızko sebe. Dát je v obchodě daleko od sebe. Vytvořit baĺıček panenka+sladkosti. Vytvořit baĺıček panenka+sladkosti+špatně prodávané zboží. Snížit cenu jednoho zboží a zvýšit cenu druhého. Nabídnout příslušenství pro panenky jako dárek za nákup. Do slevových letáků nedávat současně panenku a sladkosti. Nabídnout sladkosti ve tvaru panenky. Radim Navrátil (ÚMS Brno) Analýza nákupního košíku Robust / 34
48 Zobecnění na složitější pravidla Zobecnění analýzy nákupního košíku - víceprvková pravidla Budeme hledat pravidla typu: x i x j x k x l x m. Analogicky jako v předchozím můžeme definovat podporu a spolehlivost. Pro hledání pravidel opět předem určíme minimální hodnotu podpory α a spolehlivosti β. Radim Navrátil (ÚMS Brno) Analýza nákupního košíku Robust / 34
49 Zobecnění na složitější pravidla Zobecnění analýzy nákupního košíku - víceprvková pravidla Budeme hledat pravidla typu: x i x j x k x l x m. Analogicky jako v předchozím můžeme definovat podporu a spolehlivost. Pro hledání pravidel opět předem určíme minimální hodnotu podpory α a spolehlivosti β. Radim Navrátil (ÚMS Brno) Analýza nákupního košíku Robust / 34
50 Zobecnění na složitější pravidla Zobecnění analýzy nákupního košíku - víceprvková pravidla Budeme hledat pravidla typu: x i x j x k x l x m. Analogicky jako v předchozím můžeme definovat podporu a spolehlivost. Pro hledání pravidel opět předem určíme minimální hodnotu podpory α a spolehlivosti β. Radim Navrátil (ÚMS Brno) Analýza nákupního košíku Robust / 34
51 Zobecnění na složitější pravidla Zobecnění analýzy nákupního košíku - víceprvková pravidla Nejprve najdeme všechny dvouprvkové množiny, jejichž podpora je alespoň α. Poté se zaměříme na 3-prvkové, 4-prvkové,..., celou množinu I. Opět z nich vybereme takové, jejichž podpora je alespoň α. Celkový počet procházených množin: ( ) ( ) ( ) m m m m = 2 m m 1. Pro danou k-prvkovou množinu uvažujeme všechna možná pravidla. Vybereme z nich jen ta, jejichž spolehlivost je alespoň β. Celkový počet procházených pravidel: ( ) ( ) ( ) k k k k 1 = 2 k 2. Radim Navrátil (ÚMS Brno) Analýza nákupního košíku Robust / 34
52 Zobecnění na složitější pravidla Zobecnění analýzy nákupního košíku - víceprvková pravidla Nejprve najdeme všechny dvouprvkové množiny, jejichž podpora je alespoň α. Poté se zaměříme na 3-prvkové, 4-prvkové,..., celou množinu I. Opět z nich vybereme takové, jejichž podpora je alespoň α. Celkový počet procházených množin: ( ) ( ) ( ) m m m m = 2 m m 1. Pro danou k-prvkovou množinu uvažujeme všechna možná pravidla. Vybereme z nich jen ta, jejichž spolehlivost je alespoň β. Celkový počet procházených pravidel: ( ) ( ) ( ) k k k k 1 = 2 k 2. Radim Navrátil (ÚMS Brno) Analýza nákupního košíku Robust / 34
53 Zobecnění na složitější pravidla Zobecnění analýzy nákupního košíku - víceprvková pravidla Nejprve najdeme všechny dvouprvkové množiny, jejichž podpora je alespoň α. Poté se zaměříme na 3-prvkové, 4-prvkové,..., celou množinu I. Opět z nich vybereme takové, jejichž podpora je alespoň α. Celkový počet procházených množin: ( ) ( ) ( ) m m m m = 2 m m 1. Pro danou k-prvkovou množinu uvažujeme všechna možná pravidla. Vybereme z nich jen ta, jejichž spolehlivost je alespoň β. Celkový počet procházených pravidel: ( ) ( ) ( ) k k k k 1 = 2 k 2. Radim Navrátil (ÚMS Brno) Analýza nákupního košíku Robust / 34
54 Zobecnění na složitější pravidla Zobecnění analýzy nákupního košíku - víceprvková pravidla Nejprve najdeme všechny dvouprvkové množiny, jejichž podpora je alespoň α. Poté se zaměříme na 3-prvkové, 4-prvkové,..., celou množinu I. Opět z nich vybereme takové, jejichž podpora je alespoň α. Celkový počet procházených množin: ( ) ( ) ( ) m m m m = 2 m m 1. Pro danou k-prvkovou množinu uvažujeme všechna možná pravidla. Vybereme z nich jen ta, jejichž spolehlivost je alespoň β. Celkový počet procházených pravidel: ( ) ( ) ( ) k k k k 1 = 2 k 2. Radim Navrátil (ÚMS Brno) Analýza nákupního košíku Robust / 34
55 Zobecnění na složitější pravidla Zobecnění analýzy nákupního košíku - víceprvková pravidla Nejprve najdeme všechny dvouprvkové množiny, jejichž podpora je alespoň α. Poté se zaměříme na 3-prvkové, 4-prvkové,..., celou množinu I. Opět z nich vybereme takové, jejichž podpora je alespoň α. Celkový počet procházených množin: ( ) ( ) ( ) m m m m = 2 m m 1. Pro danou k-prvkovou množinu uvažujeme všechna možná pravidla. Vybereme z nich jen ta, jejichž spolehlivost je alespoň β. Celkový počet procházených pravidel: ( ) ( ) ( ) k k k k 1 = 2 k 2. Radim Navrátil (ÚMS Brno) Analýza nákupního košíku Robust / 34
56 Zobecnění na složitější pravidla Zobecnění analýzy nákupního košíku - víceprvková pravidla Velká časová náročnost prořezávání, algoritmická řešení. Zřejmě platí supp(x i, x j ) supp(x i, x j, x k ). Důsledek: Pokud daná množina prvků má podporu menší než α, není třeba procházet všechny množiny, které ji obsahují. Radim Navrátil (ÚMS Brno) Analýza nákupního košíku Robust / 34
57 Zobecnění na složitější pravidla Zobecnění analýzy nákupního košíku - víceprvková pravidla Velká časová náročnost prořezávání, algoritmická řešení. Zřejmě platí supp(x i, x j ) supp(x i, x j, x k ). Důsledek: Pokud daná množina prvků má podporu menší než α, není třeba procházet všechny množiny, které ji obsahují. Radim Navrátil (ÚMS Brno) Analýza nákupního košíku Robust / 34
58 Zobecnění na složitější pravidla Zobecnění analýzy nákupního košíku - víceprvková pravidla Velká časová náročnost prořezávání, algoritmická řešení. Zřejmě platí supp(x i, x j ) supp(x i, x j, x k ). Důsledek: Pokud daná množina prvků má podporu menší než α, není třeba procházet všechny množiny, které ji obsahují. Radim Navrátil (ÚMS Brno) Analýza nákupního košíku Robust / 34
59 Zobecnění na složitější pravidla Zobecnění analýzy nákupního košíku - prořezávání Radim Navrátil (ÚMS Brno) Analýza nákupního košíku Robust / 34
60 Zobecnění na složitější pravidla Zobecnění analýzy nákupního košíku - prořezávání Podobně platí conf(x i x j x k ) conf(x i x j x k ). Radim Navrátil (ÚMS Brno) Analýza nákupního košíku Robust / 34
61 Další rozšíření Zobecnění analýzy nákupního košíku 1 Pravidla: x i NOT x j. Zavedou se nové položky NOT x i indikující, že daná transakce neobsahuje položku x i. Nevýhodou je vyšší časová náročnost (dvakrát tolik položek). Negované položky se vyskytují častěji než původní horší interpretovatelnost pravidel. 2 Využití hierarchie položek. Původní data bývají často řídká. Existuje přirozená hierarchie položek: banán, jablko, pomeranč -> OVOCE. Zavedou se nové položky popisující hierarchii. Pravidla typu banán OVOCE vs. OVOCE banán. 3 Aplikace na spojité a kategoriální náhodné veličiny. VĚK<20 poslouchá POP. 4 Sekvenční analýza. Radim Navrátil (ÚMS Brno) Analýza nákupního košíku Robust / 34
62 Další rozšíření Zobecnění analýzy nákupního košíku 1 Pravidla: x i NOT x j. Zavedou se nové položky NOT x i indikující, že daná transakce neobsahuje položku x i. Nevýhodou je vyšší časová náročnost (dvakrát tolik položek). Negované položky se vyskytují častěji než původní horší interpretovatelnost pravidel. 2 Využití hierarchie položek. Původní data bývají často řídká. Existuje přirozená hierarchie položek: banán, jablko, pomeranč -> OVOCE. Zavedou se nové položky popisující hierarchii. Pravidla typu banán OVOCE vs. OVOCE banán. 3 Aplikace na spojité a kategoriální náhodné veličiny. VĚK<20 poslouchá POP. 4 Sekvenční analýza. Radim Navrátil (ÚMS Brno) Analýza nákupního košíku Robust / 34
63 Další rozšíření Zobecnění analýzy nákupního košíku 1 Pravidla: x i NOT x j. Zavedou se nové položky NOT x i indikující, že daná transakce neobsahuje položku x i. Nevýhodou je vyšší časová náročnost (dvakrát tolik položek). Negované položky se vyskytují častěji než původní horší interpretovatelnost pravidel. 2 Využití hierarchie položek. Původní data bývají často řídká. Existuje přirozená hierarchie položek: banán, jablko, pomeranč -> OVOCE. Zavedou se nové položky popisující hierarchii. Pravidla typu banán OVOCE vs. OVOCE banán. 3 Aplikace na spojité a kategoriální náhodné veličiny. VĚK<20 poslouchá POP. 4 Sekvenční analýza. Radim Navrátil (ÚMS Brno) Analýza nákupního košíku Robust / 34
64 Další rozšíření Zobecnění analýzy nákupního košíku 1 Pravidla: x i NOT x j. Zavedou se nové položky NOT x i indikující, že daná transakce neobsahuje položku x i. Nevýhodou je vyšší časová náročnost (dvakrát tolik položek). Negované položky se vyskytují častěji než původní horší interpretovatelnost pravidel. 2 Využití hierarchie položek. Původní data bývají často řídká. Existuje přirozená hierarchie položek: banán, jablko, pomeranč -> OVOCE. Zavedou se nové položky popisující hierarchii. Pravidla typu banán OVOCE vs. OVOCE banán. 3 Aplikace na spojité a kategoriální náhodné veličiny. VĚK<20 poslouchá POP. 4 Sekvenční analýza. Radim Navrátil (ÚMS Brno) Analýza nákupního košíku Robust / 34
65 Příklad Obĺıbené sporty Data: 49 studentů uvedlo několik svých obĺıbených sportů: ID Obĺıbené sporty 1 běh,plavání,turistika,lezení 2 hokej,tanec,tenis 3 hokej,fotbal,biatlon,stolní tenis,karate brusle,fitness,hokej,squash Radim Navrátil (ÚMS Brno) Analýza nákupního košíku Robust / 34
66 Příklad Obĺıbené sporty - nejobĺıbenější Radim Navrátil (ÚMS Brno) Analýza nákupního košíku Robust / 34
67 Příklad Obĺıbené sporty - netradiční americký fotbal břišní tanec karate kickbox pólo skialpinismus slamball šerm vodní fotbal Radim Navrátil (ÚMS Brno) Analýza nákupního košíku Robust / 34
68 Příklad Obĺıbené sporty - výsledná dvouprvková pravidla Pravidlo podpora (v %) spolehlivost (v %) zlepšení běh volejbal fotbal hokej cyklistika plavání fitness běh cyklistika volejbal lyžování volejbal Radim Navrátil (ÚMS Brno) Analýza nákupního košíku Robust / 34
69 Příklad Obĺıbené sporty - výsledná dvouprvková pravidla Radim Navrátil (ÚMS Brno) Analýza nákupního košíku Robust / 34
70 Příklad Obĺıbené sporty - výsledná víceprvková pravidla Pravidlo podpora (v %) spolehlivost (v %) lyžování cyklistika volejbal cyklistika volejbal plavání běh volejbal plavání běh turistika plavání Radim Navrátil (ÚMS Brno) Analýza nákupního košíku Robust / 34
71 Příklad Obĺıbené sporty - pravidla s využitím hierarchie Hierarchie: 4 kategorie sportů míčové, zimní, pro volný čas, ostatní. Pravidlo podpora (v %) spolehlivost (v %) zimní sporty míčové sporty míčové sporty zimní sporty zimní sporty hokej míčové sporty volejbal hokej míčové sporty volejbal zimní sporty běh míčové sporty Radim Navrátil (ÚMS Brno) Analýza nákupního košíku Robust / 34
72 Výhled do budoucnosti Pohled do budoucna V současné době hojně využíváno v komerční sféře. Youtube mohlo by se vám ĺıbit Internetové obchody doporučené zboží. Optimalizace skladových zásob. Amazon si nechal patentovat službu Method and system for anticipatory package shipping, tj. Amazon vám zašle zboží, ještě než si ho stačíte objednat. Radim Navrátil (ÚMS Brno) Analýza nákupního košíku Robust / 34
73 Výhled do budoucnosti Pohled do budoucna V současné době hojně využíváno v komerční sféře. Youtube mohlo by se vám ĺıbit Internetové obchody doporučené zboží. Optimalizace skladových zásob. Amazon si nechal patentovat službu Method and system for anticipatory package shipping, tj. Amazon vám zašle zboží, ještě než si ho stačíte objednat. Radim Navrátil (ÚMS Brno) Analýza nákupního košíku Robust / 34
74 Výhled do budoucnosti Pohled do budoucna V současné době hojně využíváno v komerční sféře. Youtube mohlo by se vám ĺıbit Internetové obchody doporučené zboží. Optimalizace skladových zásob. Amazon si nechal patentovat službu Method and system for anticipatory package shipping, tj. Amazon vám zašle zboží, ještě než si ho stačíte objednat. Radim Navrátil (ÚMS Brno) Analýza nákupního košíku Robust / 34
75 Výhled do budoucnosti Pohled do budoucna V současné době hojně využíváno v komerční sféře. Youtube mohlo by se vám ĺıbit Internetové obchody doporučené zboží. Optimalizace skladových zásob. Amazon si nechal patentovat službu Method and system for anticipatory package shipping, tj. Amazon vám zašle zboží, ještě než si ho stačíte objednat. Radim Navrátil (ÚMS Brno) Analýza nákupního košíku Robust / 34
76 Výhled do budoucnosti Pohled do budoucna V současné době hojně využíváno v komerční sféře. Youtube mohlo by se vám ĺıbit Internetové obchody doporučené zboží. Optimalizace skladových zásob. Amazon si nechal patentovat službu Method and system for anticipatory package shipping, tj. Amazon vám zašle zboží, ještě než si ho stačíte objednat. Radim Navrátil (ÚMS Brno) Analýza nákupního košíku Robust / 34
77 Výhled do budoucnosti Poděkování Děkuji za pozornost. Práce byla spolufinancována grantem MUNI/A/1204/2017. Radim Navrátil (ÚMS Brno) Analýza nákupního košíku Robust / 34
Dolování asociačních pravidel
Dolování asociačních pravidel Miloš Trávníček UIFS FIT VUT v Brně Obsah přednášky 1. Proces získávání znalostí 2. Asociační pravidla 3. Dolování asociačních pravidel 4. Algoritmy pro dolování asociačních
VíceDobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze
Dobývání znalostí Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze Dobývání znalostí Asociační pravidla Doc. RNDr. Iveta Mrázová, CSc.
VíceZáklady vytěžování dat
Základy vytěžování dat předmět A7Bb36vyd Vytěžování dat Filip Železný, Miroslav Čepek, Radomír Černoch, Jan Hrdlička katedra kybernetiky a katedra počítačů ČVUT v Praze, FEL Evropský sociální fond Praha
VíceANALÝZA NÁKUPNÍHO KOŠÍKU SEMINÁŘ
ANALÝZA NÁKUPNÍHO KOŠÍKU SEMINÁŘ 18.11.2012 Radim Tvardek, Petr Bulava, Daniel Mašek U&SLUNO a.s. I Sadová 28 I 702 00 Ostrava I Czech Republic PŘEDPOKLADY PRO ANALÝZU NÁKUPNÍHO KOŠÍKU 18.11.2012 Daniel
Vícehledání zajímavých asociací i korelací ve velkém množství dat původně pro transakční data obchodní transakce analýza nákupního košíku
Asociační pravidla Asociační pravidla hledání zajímavých asociací i korelací ve velkém množství dat původně pro transakční data obchodní transakce analýza nákupního košíku podpora rozhodování Analýza nákupního
Více4. Aplikace matematiky v ekonomii
4. Aplikace matematiky v ekonomii 1 Lineární algebra Soustavy 1) Na základě statistických údajů se zjistilo, že závislost množství statku z poptávaného v průběhu jednoho týdne lze popsat vztahem q d =
VíceRegresní a korelační analýza
Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).
VíceStatistika (KMI/PSTAT)
Statistika (KMI/PSTAT) Cvičení dvanácté aneb Regrese a korelace Statistika (KMI/PSTAT) 1 / 18 V souboru 25 jedinců jsme měřili jejich výšku a hmotnost. Výsledky jsou v tabulce a grafu. Statistika (KMI/PSTAT)
VíceHOKEJOVÉ GÓLY. Michal Friesl. Katedra matematiky & NTIS Fakulta aplikovaných věd Západočeská univerzita v Plzni. Robust 2018, Rybník
Robust 2018, Rybník HOKEJOVÉ GÓLY Michal Friesl Katedra matematiky & NTIS Fakulta aplikovaných věd Západočeská univerzita v Plzni Robust 2018, Rybník ÚVOD Úvod Podíváme se na průběh počtu gólu během hokejových
VíceTechnická univerzita v Liberci
Technická univerzita v Liberci Ekonomická fakulta Analýza výsledků z dotazníkového šetření Jména studentů: Adam Pavlíček Michal Karlas Tomáš Vávra Anna Votavová Ročník: 2015/2016 Datum odevzdání: 13/05/2016
VíceOdhad parametrů N(µ, σ 2 )
Odhad parametrů N(µ, σ 2 ) Mějme statistický soubor x 1, x 2,, x n modelovaný jako realizaci náhodného výběru z normálního rozdělení N(µ, σ 2 ) s neznámými parametry µ a σ. Jaký je maximální věrohodný
VíceRegresní a korelační analýza
Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).
VíceKGG/STG Statistika pro geografy
KGG/STG Statistika pro geografy 9. Korelační analýza Mgr. David Fiedor 20. dubna 2015 Analýza závislostí v řadě geografických disciplín studujeme jevy, u kterých vyšetřujeme nikoliv pouze jednu vlastnost
VíceAsociační i jiná. Pravidla. (Ch )
Asociační i jiná Pravidla (Ch. 14 +...) Učení bez učitele Nemáme cílovou třídu Y, G; máme N pozorování což jsou p-dimenzionální vektory se sdruženou pravděpodobností chceme odvozovat vlastnosti. Pro málo
VícePokročilé funkce (pokr.)
Co je Kompas Slev? Kompas Slev je moderním portálem umožňujícím uživatelům listovat letákovými nabídkami obchodníků a využívat různé pokročilé funkce. Historie: 7/2012 prvotní nápad ohledně projektu letáků
VíceSPOLEHLIVOST KONSTRUKCÍ & TEORIE SPOLEHLIVOSTI část 5: Aproximační techniky
SPOLEHLIVOST KONSTRUKCÍ & TEORIE SPOLEHLIVOSTI část 5: Aproximační techniky Drahomír Novák Jan Eliáš 2012 Spolehlivost konstrukcí, Drahomír Novák & Jan Eliáš 1 část 5 Aproximační techniky 2012 Spolehlivost
VíceModely přidané hodnoty škol
Modely přidané hodnoty škol Adéla Drabinová, Patrícia Martinková 25.1.2018, Robust Katedra pravděpodobnosti a matematické statistiky, Matematicko-fyzikální fakulta, Univerzita Karlova Oddělení statistického
VíceTeorie náhodných matic aneb tak trochu jiná statistika
Teorie náhodných matic aneb tak trochu jiná statistika B. Vlková 1, M.Berg 2, B. Martínek 3, O. Švec 4, M. Neumann 5 Gymnázium Uničov 1, Gymnázium Václava Hraběte Hořovice 2, Mendelovo gymnázium Opava
VícePokročilé neparametrické metody. Klára Kubošová
Klára Kubošová Další typy stromů CHAID, PRIM, MARS CHAID - Chi-squared Automatic Interaction Detector G.V.Kass (1980) nebinární strom pro kategoriální proměnné. Jako kriteriální statistika pro větvení
VíceZískávání znalostí z databází. Alois Kužela
Získávání znalostí z databází Alois Kužela Obsah související pojmy datové sklady, získávání znalostí asocianí pravidla 2/37 Úvod získávání znalostí z dat, dolování (z) dat, data mining proces netriviálního
VíceTomáš Karel LS 2012/2013
Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není
VíceElektronické cenovky jako marketingový nástroj Martin Rösler, VKF Renzel ČR
Elektronické cenovky jako marketingový nástroj Martin Rösler, VKF Renzel ČR Co je důležité pro to, aby se zákazník v prodejně cítil dobře a vrátil se? snadná orientace mezi zbožím dostatek informací o
VíceOPTIMÁLNÍ SEGMENTACE DAT
ROBUST 2004 c JČMF 2004 OPTIMÁLNÍ SEGMENTACE DAT Petr Novotný Klíčová slova: Výpočetní statistika, po částech spojitá regrese. Abstrakt: Snížení paměťové náročnosti při výpočtu po částech spojitého regresního
VíceSOFTWARE STAT1 A R. Literatura 4. kontrolní skupině (viz obr. 4). Proto budeme testovat shodu středních hodnot µ 1 = µ 2 proti alternativní
ŘEŠENÍ PRAKTICKÝCH ÚLOH UŽITÍM SOFTWARE STAT1 A R Obsah 1 Užití software STAT1 1 2 Užití software R 3 Literatura 4 Příklady k procvičení 6 1 Užití software STAT1 Praktické užití aplikace STAT1 si ukažme
VíceInformační systémy pro podporu rozhodování
Informační systémy pro rozhodování Informační systémy pro podporu rozhodování 5 Jan Žižka, Naděžda Chalupová Ústav informatiky PEF Mendelova universita v Brně Asociační pravidla Asociační pravidla (sdružovací
VíceVlastní čísla a vlastní vektory
Vlastní čísla a vlastní vektory 1 Motivace Uvažujme lineární prostor všech vázaných vektorů v rovině, které procházejí počátkem, a lineární zobrazení tohoto prostoru do sebe(lineární transformaci, endomorfismus)
VíceOBSAH KAPITOLY PODNIKOVÍ ZÁKAZNÍCI DRUHY PODNIKOVÝCH ZÁKAZNÍKŮ SPOTŘEBITELSKÝ TRH
OBSAH KAPITOLY PODNIKOVÍ ZÁKAZNÍCI Ing. Lukáš Kučera druhy podnikových zákazníků spotřebitelský trh a jeho chování průmyslový trh a jeho chování nákupní rozhodovací proces spotřebitele životní cyklus produktu
VíceProfitabilita klienta v kontextu Performance management
IBM Technical specialist team Pre Sale 26/10/2010 Profitabilita klienta v kontextu Performance management Co všechno řadíme do PM? Automatická data Běžný reporting Pokročilé statistické modely Včera What
VíceKontingenční tabulky. (Analýza kategoriálních dat)
Kontingenční tabulky (Analýza kategoriálních dat) Agenda Standardní analýzy dat v kontingenčních tabulkách úvod, KT, míry diverzity nominálních veličin, některá rozdělení chí kvadrát testy, analýza reziduí,
VíceEpidemiologické ukazatele. lních dat. analýza kategoriáln. Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat. a I E
Testování statistických hypotéz z a analýza kategoriáln lních dat Prof. RNDr. Jana Zvárová, DrSc. Epidemiologické ukazatele Rizikový faktor Populace Přítomen Nepřítomen Celkem Nemocní a b a+b Kontroly
Víceanalýza kategoriáln lních dat Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat Epidemiologické ukazatele
Testování statistických hypotéz z a analýza kategoriáln lních dat Prof. RNDr. Jana Zvárová, DrSc. 1 Záznam epidemiologických dat Rizikový faktor Populace Přítomen Nepřítomen Celkem Nemocní a b a+b Kontroly
VíceMetoda backward výběru proměnných v lineární regresi a její vlastnosti
Metoda backward výběru proměnných v lineární regresi a její vlastnosti Aktuárský seminář, 13. dubna 2018 Milan Bašta 1 / 30 1 Metody výběru proměnných do modelu 2 Monte Carlo simulace, backward metoda
VíceKapacita jako náhodná veličina a její měření. Ing. Igor Mikolášek, Ing. Martin Bambušek Centrum dopravního výzkumu, v. v. i.
Kapacita jako náhodná veličina a její měření Ing. Igor Mikolášek, Ing. Martin Bambušek Centrum dopravního výzkumu, v. v. i. Obsah Kapacita pozemních komunikací Funkce přežití Kaplan-Meier a parametrické
VíceKapitola 11: Lineární diferenciální rovnice 1/15
Kapitola 11: Lineární diferenciální rovnice 1/15 Lineární diferenciální rovnice 2. řádu Definice: Lineární diferenciální rovnice 2-tého řádu je rovnice tvaru kde: y C 2 (I) je hledaná funkce a 0 (x)y +
VíceIng. Petr Hájek, Ph.D. Podpora přednášky kurzu Aplikace umělé inteligence
APLIKACE UMĚLÉ INTELIGENCE Ing. Petr Hájek, Ph.D. Podpora přednášky kurzu Aplikace umělé inteligence Aplikace umělé inteligence - seminář ING. PETR HÁJEK, PH.D. ÚSTAV SYSTÉMOVÉHO INŽENÝRSTVÍ A INFORMATIKY
VíceJak využít data o zákaznících ke zvýšení příjmů z prodeje
Jak využít data o zákaznících ke zvýšení příjmů z prodeje Michal Kadlec Marek Loukotka Lubomíra Červová www.acrea.cz info@acrea.cz Program Dívejte se na budoucnost, ne jen na minulost 1 Jaká data využíváme?
VíceVytěžování znalostí z dat
Pavel Kordík, Jan Motl (ČVUT FIT) Vytěžování znalostí z dat BI-VZD, 2012, Přednáška 1 1/32 Vytěžování znalostí z dat Pavel Kordík, Jan Motl Department of Computer Systems Faculty of Information Technology
VíceNFC nákup. Realita současnosti & Vize budoucnosti. Retail Summit 5.-6.2.2013. Jiří VÍTEK
NFC nákup Realita současnosti & Vize budoucnosti Retail Summit 5.-6.2.2013 Jiří VÍTEK Head of NFC & Financial Services Telefonica Czech Republic vitek.j@telefonica.com NFC s Komerční Bankou Telefónica
VíceINFORMOVANÝ SOUHLAS. Podpis zákonného zástupce nebo zúčastněné osoby:
9 PŘÍLOHY Příloha č. I - Vyjádření etické komise UK FTVS Příloha č. II - Informovaný souhlas Příloha č. III - Otázky a odpovědi (A-N) Příloha č. IV - Anketa vzor Příloha č. V - Vzor: originál vyplněná
VíceKonzum je mírně exotické družstvo.
obchod pro komunitu Upozornění na úvod obchod pro komunitu Konzum je mírně exotické družstvo. Upozornění na úvod obchod pro komunitu Tato prezentace vás seznámí s příběhem našeho družstva KONZUM, existujícího
VíceTéma 9: Vícenásobná regrese
Téma 9: Vícenásobná regrese 1) Vytvoření modelu V menu Statistika zvolíme nabídku Vícerozměrná regrese. Aktivujeme kartu Detailní nastavení viz obr.1. Nastavíme Proměnné tak, že v příslušném okně viz.
VíceDolování z textu. Martin Vítek
Dolování z textu Martin Vítek Proč dolovat z textu Obrovské množství materiálu v nestrukturované textové podobě knihy časopisy vědeckéčlánky sborníky konferencí internetové diskuse Proč dolovat z textu
Více13.1. Úvod Cílem regresní analýzy je popsat závislost hodnot znaku Y na hodnotách
13 Regrese 13.1. Úvod Cílem regresní analýzy je popsat závislost hodnot znaku Y na hodnotách znaku X. Přitom je třeba vyřešit jednak volbu funkcí k vystižení dané závislosti a dále stanovení konkrétních
VíceKanonická korelační analýza
Kanonická korelační analýza Kanonická korelační analýza je vícerozměrná metoda, která se používá ke zkoumání závislosti mezi dvěma skupinami proměnných. První ze skupin se považuje za soubor nezávisle
Více3. Optimalizace pomocí nástroje Řešitel
3. Optimalizace pomocí nástroje Řešitel Rovnováha mechanické soustavy Uvažujme dvě různé nehmotné lineární pružiny P 1 a P 2 připevněné na pevné horizontální tyči splývající s osou x podle obrázku: (0,0)
VíceRegresní analýza 1. Regresní analýza
Regresní analýza 1 1 Regresní funkce Regresní analýza Důležitou statistickou úlohou je hledání a zkoumání závislostí proměnných, jejichž hodnoty získáme při realizaci experimentů Vzhledem k jejich náhodnému
VíceVybrané statistické metody. Simulace pokladen supermarketu Albert na Spojovací
ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE, Fakulta dopravní Ústav aplikované matematiky K611 Vybrané statistické metody Simulace pokladen supermarketu Albert na Spojovací 1 85 Jakub Ondřich 2010/2011 85101910/0040
VíceTvorba asociačních pravidel a hledání. položek
Tvorba asociačních pravidel a hledání častých skupin položek 1 Osnova Asociace Transakce Časté skupiny položek Apriori vlastnost podmnožin Asociační pravidla Aplikace 2 Asociace Nechť I je množina položek.
VíceAlgoritmy pro shlukování prostorových dat
Algoritmy pro shlukování prostorových dat Marta Žambochová Katedra matematiky a informatiky Fakulta sociálně ekonomická Univerzita J. E. Purkyně v Ústí nad Labem ROBUST 21. 26. leden 2018 Rybník - Hostouň
VíceStatistika. Regresní a korelační analýza Úvod do problému. Roman Biskup
Statistika Regresní a korelační analýza Úvod do problému Roman Biskup Jihočeská univerzita v Českých Budějovicích Ekonomická fakulta (Zemědělská fakulta) Katedra aplikované matematiky a informatiky 2008/2009
VíceMatematika pro geometrickou morfometrii
Matematika pro geometrickou morfometrii Václav Krajíček Vaclav.Krajicek@mff.cuni.cz Department of Software and Computer Science Education Faculty of Mathematics and Physics Charles University Přednáška
VíceSTATISTICKÉ ODHADY Odhady populačních charakteristik
STATISTICKÉ ODHADY Odhady populačních charakteristik Jak stanovit charakteristiky rozložení sledované veličiny v základní populaci? Populaci většinou nemáme celou k dispozici, musíme se spokojit jen s
VíceZákony hromadění chyb.
Zákony hromadění chyb. Zákon hromadění skutečných chyb. Zákon hromadění středních chyb. Tomáš Bayer bayertom@natur.cuni.cz Přírodovědecká fakulta Univerzity Karlovy v Praze, Katedra aplikované geoinformatiky
VíceStatSoft Úvod do data miningu
StatSoft Úvod do data miningu Tento článek je úvodním povídáním o data miningu, jeho vzniku, účelu a využití. Historie data miningu Rozvoj počítačů, výpočetní techniky a zavedení elektronického sběru dat
VícePravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická
Více7. Analýza rozptylu.
7. Analýza rozptylu. Uvedeme obecnou ideu, která je založena na minimalizaci chyby metodou nejmenších čtverců. Nejdříve uvedeme několik základních tvrzení. Uvažujeme náhodný vektor Y = (Y, Y,..., Y n a
VíceKGG/STG Statistika pro geografy
KGG/STG Statistika pro geografy 4. Teoretická rozdělení Mgr. David Fiedor 9. března 2015 Osnova Úvod 1 Úvod 2 3 4 5 Vybraná rozdělení náhodných proměnných normální rozdělení normované normální rozdělení
VíceLineární algebra - I. část (vektory, matice a jejich využití)
Lineární algebra - I. část (vektory, matice a jejich využití) Michal Fusek Ústav matematiky FEKT VUT, fusekmi@feec.vutbr.cz 2. přednáška z ESMAT Michal Fusek (fusekmi@feec.vutbr.cz) 1 / 40 Obsah 1 Vektory
VíceKatedra kybernetiky laboratoř Inteligentní Datové Analýzy (IDA) Katedra počítačů, Computational Intelligence Group
Vytěžování dat Miroslav Čepek, Filip Železný Katedra kybernetiky laboratoř Inteligentní Datové Analýzy (IDA) Katedra počítačů, Computational Intelligence Group Evropský sociální fond Praha & EU: Investujeme
VíceStatistické řízení jakosti - regulace procesu měřením a srovnáváním
Statistické řízení jakosti - regulace procesu měřením a srovnáváním Statistická regulace výrobního procesu (SPC) SPC = Statistical Process Control preventivní nástroj řízení jakosti, který na základě včasného
VíceRNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.
Analýza dat pro Neurovědy RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Jaro 2014 Institut biostatistiky Janoušová, a analýz Dušek: Analýza dat pro neurovědy Blok 7 Jak hodnotit vztah spojitých proměnných
VícePravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.
Pravděpodobnost a statistika, Biostatistika pro kombinované studium Letní semestr 2015/2016 Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz Jan Kracík jan.kracik@vsb.cz Obsah: Výběrová rozdělení
VícePravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 010 1.týden (0.09.-4.09. ) Data, typy dat, variabilita, frekvenční analýza
VíceManuál internetového obchodu ContiTrade Services s.r.o. (verze k 1.1.2012)
Manuál internetového obchodu ContiTrade Services s.r.o. (verze k 1.1.2012) Tento manuál popisuje základní operace internetového obchodu ContiTrade Services s.r.o. a změny v roce 2012. Nejdůležitější změnou
VíceApriorní rozdělení. Jan Kracík.
Apriorní rozdělení Jan Kracík jan.kracik@vsb.cz Apriorní rozdělení Apriorní rozdělení (spolu s modelem) reprezentuje informaci o neznámém parametru θ, která je dostupná předem, tj. bez informace z dat.
Více4EK201 Matematické modelování. 11. Ekonometrie
4EK201 Matematické modelování 11. Ekonometrie 11. Ekonometrie Ekonometrie Interdisciplinární vědní disciplína Zkoumá vztahy mezi ekonomickými veličinami Mikroekonomickými i makroekonomickými Ekonomie ekonomické
VíceDesign Experimentu a Statistika - AGA46E
Design Experimentu a Statistika - AGA46E Czech University of Life Sciences in Prague Department of Genetics and Breeding Summer Term 2015 Matúš Maciak (@ A 211) Office Hours: T 9:00 10:30 or by appointment
Více8.3). S ohledem na jednoduchost a názornost je výhodné seznámit se s touto Základní pojmy a vztahy. Definice
9. Lineární diferenciální rovnice 2. řádu Cíle Diferenciální rovnice, v nichž hledaná funkce vystupuje ve druhé či vyšší derivaci, nazýváme diferenciálními rovnicemi druhého a vyššího řádu. Analogicky
VíceAfinní transformace Stručnější verze
[1] Afinní transformace Stručnější verze je posunutí plus lineární transformace má svou matici vzhledem k homogenním souřadnicím body a vektory: afinní prostor využití například v počítačové grafice a)
Víceaneb jiný úhel pohledu na prvák
Účelná matematika aneb jiný úhel pohledu na prvák Jan Hejtmánek FEL, ČVUT v Praze 24. června 2015 Jan Hejtmánek (FEL, ČVUT v Praze) Technokrati 2015 24. června 2015 1 / 18 Outline 1 Motivace 2 Proč tolik
VícePokročilé metody geostatistiky v R-projektu
ČVUT V PRAZE, Fakulta stavební, Geoinformatika Pokročilé metody geostatistiky v R-projektu Autoři: Vedoucí projektu: RNDr. Dr. Nosková Jana Studentská grantová soutěž ČVUT 2011 Praha, 2011 Geostatistika
VíceModifikace algoritmu FEKM
Modifikace algoritmu FEKM Marta Žambochová Katedra matematiky a informatiky Fakulta sociálně ekonomická Univerzita J. E. Purkyně v Ústí nad Labem ROBUST 9. 14. září 2012 Němčičky Motivace Potřeba metod
Více4EK211 Základy ekonometrie
4EK Základy ekonometrie Odhad klasického lineárního regresního modelu II Cvičení 3 Zuzana Dlouhá Klasický lineární regresní model - zadání příkladu Soubor: CV3_PR.xls Data: y = maloobchodní obrat potřeb
VícePŘEDSTAVENÍ - NEZÁVISLÁ MO SÍŤ BALA Kdo jsme? BALA je první nezávislá maloobchodní síť v ČR, která ve svých sítích Bala a Gastro v současnosti propojuje už více než 1200 kmenových členů a jejich počet
VíceLineární algebra : Lineární prostor
Lineární algebra : Lineární prostor (3. přednáška) František Štampach, Karel Klouda LS 2013/2014 vytvořeno: 17. dubna 2014, 14:43 1 2 3.1 Aximotické zavedení lineárního prostoru Číselné těleso Celou lineární
VíceKalkulace závažnosti komorbidit a komplikací pro CZ-DRG
Kalkulace závažnosti komorbidit a komplikací pro CZ-DRG Michal Uher a analytický tým projektu DRG Restart Ústav zdravotnických informací a statistiky ČR, Praha Institut biostatistiky a analýzy, Lékařská
VíceJEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica
JEDNOVÝBĚROVÉ TESTY Komentované řešení pomocí programu Statistica Vstupní data Data umístěná v excelovském souboru překopírujeme do tabulky ve Statistice a pojmenujeme proměnné, viz prezentace k tématu
Víceα 1 α 2 + α 3 = 0 2α 1 + α 2 + α 3 = 0
Vzhledem k tomu, že jsem to psala ve velkém spěchu, mohou se vyskytnout nějaké chybičky. Pokud nějaké najdu, opravím je hned po prázdninách. Zadání A. 1. Vektory u, v, w jsou lineárně nezávislé. Rozhodněte,
VíceModelování a optimalizace vozidel, linek a dopravní infrastruktury města. Zdeněk Peroutka, Jan Přikryl, Radim Dudek, Pavel Drábek
Modelování a optimalizace vozidel, linek a dopravní infrastruktury města Zdeněk Peroutka, Jan Přikryl, Radim Dudek, Pavel Drábek Co a proč řešíme? Motivace a cíle Plná elektrifikace MHD optimální skladba
VíceANALÝZA DAT V R 7. KONTINGENČNÍ TABULKA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.
ANALÝZA DAT V R 7. KONTINGENČNÍ TABULKA Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK www.biostatisticka.cz PŘEHLED TESTŮ rozdělení normální spojité alternativní / diskrétní
VíceDoplňování chybějících hodnot v kategoriálních datech 2.00
Doplňování chybějících hodnot v kategoriálních datech 2.00 1. Cíle programu Účelem programu je umožnit uživateli doplnění chybějících hodnot v kategoriálních datech. Pro doplnění chybějících hodnot je
VíceVícerozměrné statistické metody
Vícerozměrné statistické metody Vícerozměrné statistické rozdělení a testy, operace s vektory a maticemi Jiří Jarkovský, Simona Littnerová FSTA: Pokročilé statistické metody Vícerozměrné statistické rozdělení
Více1. Jordanův kanonický tvar
. Jordanův kanonický tvar Obecně nelze pro zadaný lineární operátor ϕ : U U najít bázi α takovou, že (ϕ) α,α by byla diagonální. Obecně však platí, že pro každý lineární operátor ϕ : U U nad komplexními
VícePřednáška 13 Redukce dimenzionality
Vytěžování Dat Přednáška 13 Redukce dimenzionality Miroslav Čepek Fakulta Elektrotechnická, ČVUT Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti ČVUT (FEL) Redukce dimenzionality 1 /
VíceVysoká škola báňská Technická univerzita Ostrava TEORIE ÚDRŽBY. učební text. Jan Famfulík. Jana Míková. Radek Krzyžanek
Vysoká škola báňská Technická univerzita Ostrava TEORIE ÚDRŽBY učební text Jan Famfulík Jana Míková Radek Krzyžanek Ostrava 2007 Recenze: Prof. Ing. Milan Lánský, DrSc. Název: Teorie údržby Autor: Ing.
VícePRAVDĚPODOBNOST A STATISTIKA
PRAVDĚPODOBNOS A SAISIKA Regresní analýza - motivace Základní úlohou regresní analýzy je nalezení vhodného modelu studované závislosti. Je nutné věnovat velkou pozornost tomu aby byla modelována REÁLNÁ
Více7. Rozdělení pravděpodobnosti ve statistice
7. Rozdělení pravděpodobnosti ve statistice Statistika nuda je, má však cenné údaje, neklesejte na mysli, ona nám to vyčíslí Jednou z úloh statistiky je odhad (výpočet) hodnot statistického znaku x i,
VíceOptimalizace prodeje prošlého zboží
Západočeská univerzita v Plzni Plán prezentace Seznámení se s problematikou a popis matematického modelu Analytické vyjádření zisku v jednotlivých případech, kromě posledního Stochastický model posledního
VíceAlternativní přístup k analýze vícefaktorových dat
Alternativní přístup k analýze vícefaktorových dat Kamila Fačevicová 1, Peter Filzmoser 2, Karel Hron 1 1 Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta Univerzity Palackého
VíceUniverzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium Management systému jakosti
Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium Management systému jakosti 3.3 v analýze dat Autor práce: Přednášející: Prof. RNDr. Milan Meloun, DrSc Pro
VíceNáhled testu. Přijímací zkouška magisterského studia. konečný automat bez zbytečných stavů, který přijímá jazyk popsaný tímto výrazem, má:
1 z 6 14.11.2017 0:03 Přijímací zkouška magisterského studia Moodle Test MSP Testy VzorTest-2 Pokus 1 Jste přihlášeni jako Josef Kolář (Odhlásit se) Náhled testu 1 Je dán regulární výraz. Minimální deterministický
VíceMatice. Je dána matice A R m,n, pak máme zobrazení A : R n R m.
Matice lineárních zobrazení [1] Připomenutí Zobrazení A : L 1 L 2 je lineární, když A( x + y ) = A( x ) + A( y ), A(α x ) = α A( x ). Což je ekvivalentní s principem superpozice: A(α 1 x 1 + + α n x n
VíceCO JE VODAFONE EPOKLADNA?
CO JE VODAFONE EPOKLADNA? Elektronický prodejní systém využívající různé platební metody. Řešení pro živnostníky, drobné obchodníky a prodejny. Vodafone epokladna : Hlavní strana VÝHODY V KOSTCE: Elektronicky
VíceLINEÁRNÍ MODELY. Zdeňka Veselá
LINEÁRNÍ MODELY Zdeňka Veselá vesela.zdenka@vuzv.cz Genetika kvantitativních vlastností Jednotlivé geny nejsou zjistitelné ani měřitelné Efekty většího počtu genů poskytují variabilitu, kterou lze většinou
Více8 Coxův model proporcionálních rizik I
8 Coxův model proporcionálních rizik I Předpokládané výstupy z výuky: 1. Student umí formulovat Coxův model proporcionálních rizik 2. Student rozumí významu regresních koeficientů modelu 3. Student zná
VíceRegresní analýza. Eva Jarošová
Regresní analýza Eva Jarošová 1 Obsah 1. Regresní přímka 2. Možnosti zlepšení modelu 3. Testy v regresním modelu 4. Regresní diagnostika 5. Speciální využití Lineární model 2 1. Regresní přímka 3 nosnost
VíceÚvodem Dříve les než stromy 3 Operace s maticemi
Obsah 1 Úvodem 13 2 Dříve les než stromy 17 2.1 Nejednoznačnost terminologie 17 2.2 Volba metody analýzy dat 23 2.3 Přehled vybraných vícerozměrných metod 25 2.3.1 Metoda hlavních komponent 26 2.3.2 Faktorová
Více1 Soustavy lineárních rovnic
1 Soustavy lineárních rovnic 1.1 Základní pojmy Budeme uvažovat soustavu m lineárních rovnic o n neznámých s koeficienty z tělesa T (potom hovoříme o soustavě m lineárních rovnic o n neznámých nad tělesem
VícePravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 2010 1.týden (20.09.-24.09. ) Data, typy dat, variabilita, frekvenční analýza
Více