Datové sklady. Zdeněk Kouba



Podobné dokumenty
Data replication, high availability, load balancing,

3 zdroje dat. Relační databáze EIS OLAP

Informační systémy 2006/2007

Hodnocení klasifikátoru Test nezávislosti. 14. prosinec Rozvoj aplikačního potenciálu (RAPlus) CZ.1.07/2.4.00/

DATA CUBE. Mgr. Jiří Helmich

Ing. Roman Danel, Ph.D. 2010

Získávání dat z databází 1 DMINA 2010

Životní a existenční minimum

GIS Geografické informační systémy

10. Datové sklady (Data Warehouses) Datový sklad

Dolování v objektových datech. Ivana Rudolfová

Získávání znalostí z dat

GIS Geografické informační systémy

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze

Úterý Středa Čtvrtek Pátek do

Ing. Petr Hájek, Ph.D. Podpora přednášky kurzu Aplikace umělé inteligence

Nadstandartní provedení

ZÍSKÁVÁNÍ ZNALOSTÍ Z DATABÁZÍ

Dieta Snídaně Oběd Svačina Večeře II. večeře I. Bílá káva, čaj Polévka bramborová

Analýza a modelování dat. Přednáška 8

Výroba masa na loňské úrovni, ceny výrobců rostou

Business Intelligence

JÍDELNÍ LÍSTEK. 1. říjen říjen alergeny přesnídávka. chléb s máslem a sýrem, mléko 1,3,7 polévka. s rýží 9 hlavní jídlo

JÍDELNÍ LÍSTEK NA OBDOBÍ OD DO

do Čtvrtek Pátek

Multi-dimensional expressions

TEPLOVODNÍ KRBOVÉ VLOŽKY HOT-WATER FIREPLACE INSERTS

BI v rámci IS/ICT komponenty BI architektura. Charakteristika dat a procesů v IS/ICT. Datové sklady ukládání dat návrh datového skladu

Dobývání a vizualizace znalostí. Olga Štěpánková et al.

Text Mining: SAS Enterprise Miner versus Teragram. Petr Berka, Tomáš Kliegr VŠE Praha

Multidimenzionální modelování v rámci analýzy a návrhu IS/ICT

podáváme od pondělí 14.července do pátku 20.července 2014 od 11:00 do 14:30 hodin

Marketingový výzkum 10. Výzkum spokojenosti Analýza image

Analýza a modelování dat 5. přednáška. Helena Palovská

NIŽŠÍ VÝROBA MASA, NÁRŮST VÝVOZU JATEČNÝCH ZVÍŘAT

Trendy v IS/ICT přístupy k návrhu multidimenzionální modelování

Snídaně Oběd Svačina Večeře

Výživový dotazník. Přílohy. Příloha A vzor dotazníku

Září týden 1.9. až 6.9.

ZÍSKÁVÁNÍ ZNALOSTÍ Z DATABÁZÍ

Dieta Snídaně Oběd Svačina Večeře II. večeře I. Bílá káva, čaj Polévka rajská s těstovinou

JÍDELNÍČEK D 3, PŘEJEME VŠEM DOBROU CHUŤ

Pattern Star Schema. RNDr. Ondřej Zýka

Pondělí Úterý Středa Čtvrtek Pátek

Přesnídávka: veka, pomazánka budapešťská, zelenina, čaj / mléko (A:01,07)

Polévka Houbová s bramborem (A: 01,01a) Oběd 1 Boloňské špagety s masem a sýrem (A: 01,01a,03,07) Doplněk Čaj se sirupem, Mléko, Ovoce (A: 07)

J Í D E L N Í Č E K ZŠ

Jídelní lístek leden 2018

Distribuce sluneční energie. Jak navracet vodu do krajinynové vodní paradigma

JÍDELNÍ LÍSTEK. 31. prosinec leden zeleninová s luštěninovou zavářkou 1,3,9 hlavní jídlo

Základy business intelligence. Jaroslav Šmarda

ZMĚNY VE SPOTŘEBĚ POTRAVIN V DOMÁCNOSTECH ZEMĚDĚLCŮ

od do Středa Čtvrtek Pátek

TEPELNÁ ZÁTĚŽ, TEPLOTNÍ REKORDY A SDĚLOVACÍ PROSTŘEDKY

Stravování sestry v třísměnném a nepřetržitém provozu. Danuše Hrbková nutriční terapeutka

nálevem, Čaj B Polévka krupicová s vejci, Čevabčiči s hořčicí a cibulí, Brambory m.m., Čaj B

J Í D E L N Í L Í S T E K

bramborová, selská vepřová pečeně, bramborový knedlík, okurkový salát (A: 01, 03, 07, 09, 51) ovocný čaj, ovocné mléko, pitná voda (A: 07)

Dieta Snídaně Oběd Svačina Večeře II. večeře I. Bílá káva, čaj Polévka kuřecí s masem a nudlemi

chlebíček obložený DUB Kaše rýžová A, Kompot s nálevem, Čaj B chlebíček obložený DUB Kaše rýžová A, Kompot s nálevem, Čaj B chlebíček obložený DUB

Zdeněk Kobes. Tisková konference, 5. prosince 2013, Praha

nálevem, Čaj B Polévka krupicová s vejci, Čevabčiči s hořčicí a cibulí, Brambory m.m., Čaj B

2. Základní typy dat Spojitá a kategoriální data Základní popisné statistiky Frekvenční tabulky Grafický popis dat

Pokročilé neparametrické metody. Klára Kubošová

Kniha receptur. Příloha č. 6 OBSAH. Úvod. Seznam zkratek a definice pojmů. Seznam použitých zkratek Přílohy k jídlům Vývary. Polévky.

JÍDELNÍ LÍS TEK týden 44/8

Název společnosti: VPK, s.r.o. Vypracováno kým: Ing. Michal Troščak Telefon: Datum:

Název společnosti: VPK, s.r.o. Vypracováno kým: Ing. Michal Troščak Telefon: Datum:

Školní jídelna Šafránkova základní škola a mateřská škola Nalžovské Hory

Školní jídelna Šafránkova základní škola a mateřská škola Nalžovské Hory

Polévka mrkvová, Rizoto s vepřovým masem, Kompot s nálevem, Čaj B Polévka couračka, Rizoto s vepřovým masem, Řepa červená, Čaj B

GIS Geografické informační systémy

Obsah. Kapitola 1. Kapitola 2. Kapitola 3. Úvod 9

do Pátek

školní jídelna Trávník 596/2, Loštice

Jídelní lístek únor 2018

Pondělí. Polévka Hlavní jídlo číslo 1 číslo 2 MŠ-R MŠ-O. Úterý. Polévka Hlavní jídlo číslo 1 číslo 2 MŠ-R MŠ-O. Středa

Reservoirs influence on floods in the Elbe basin

Polévka couračka, Rizoto s vepřovým masem, Řepa červená, Čaj B. Polévka mrkvová, Rizoto s vepřovým masem, Řepa červená, Čaj B

Polévka couračka, Rizoto s vepřovým masem, Řepa červená, Čaj B. Polévka mrkvová, Rizoto s vepřovým masem, Řepa červená, Čaj B

Bu B sin i e n s e s s I n I te t l e lig i en e c n e c Skorkovský KA K M A I, E S E F MU

Dotazovací jazyky I. Datová krychle. Soběslav Benda

Databázové systémy. 10. přednáška

J Í D E L N Í Č E K ZŠ

U JÍDELNÍ LÍSTEK

Snídaně Oběd Svačina Večeře

Čtvrtek Pátek

Zelňák (1, 3, 7), Vepřová pečeně (1, 1a), Mrkev zadělávaná. Uzené moravské, vejce, hořčice 50g (1, 3, 6, 7, 10)

Po 9.1. Chléb obložený se sýrem

Jídelní lístek na duben 2017

Polévka rajčatová s těstovinou, Kuřecí nudličky po čínsku, Rýže dušená A, Čaj B

JÍDELNÍČEK OD 2.4. DO Velikonoce. Polévka: Čočková s párkem Hlavní jídlo: Bramborové šišky s mákem, ovoce, čaj

Jídelní lístek na duben 2017

Jídelní lístek na prosinec 2017

Dieta Snídaně Oběd Svačina Večeře II. večeře Rohlík, pomazánka Vepřový závitek se šunkou a sýrem, bramborová Mrkvový Kuřecí kousky na 3 budapešť

od do Úterý Středa Čtvrtek Pátek

VÝVOJE SPOTŘEBY VYBRANÝCH DRUHŮ POTRAVIN V ČR CONSUMPTION DEVELOPMENT ANALYSIS OF SELECTED FOODSTUFFS IN THE CZECH REPUBLIC.

JÍDELNÍ LÍSTEK. 28. květen červen alergeny přesnídávka. chléb s tresčími játry, bílá káva 1,3,4,7 polévka

Polévka couračka, Rizoto s vepřovým masem, Řepa červená, Čaj B Polévka žemlová, Rizoto s vepřovým masem, Řepa červená, Čaj B

Dieta Snídaně Oběd Svačina Večeře II. večeře I. Bílá káva, čaj Rohlík, hemenex Polévka ovarová s krupkami

Transkript:

Datové sklady Zěk Kouba

Data cube Sortiment Pečivo Maso Mléčné výrobky Koblihy Housky Chléb Místo Vepřové Hovězí Petrovice Drůbež Vysoký Chlumec Milevsko Mléko Kovářov Sýry Oslov Neveklov Jogurty Vrchotovy Janovice Bystřice 1Q 2Q 3Q 4Q 1Q 2Q 3Q 4Q 1Q 2Q 3Q 4Q 2000 2001 2002 Čas Písek Benešov Příbram

Proces ETL Extraction Transformation Load Datové zdroje Datová pumpa Datový sklad

Agregační hierarchie dimenze čas Vše Čtvrtletí Rok Měsíc Tý Den Část dne

Star schema místo prodejna okres název_okresu název_prodejny čas tý název_e tržba základ_dph DPH položka_sortimentu prodejna sortiment položka_sortimentu skupina_zboží sazba_dph název_skupiny_zboží název_položky_sort

Konceptuální model motivačního příkladu místo vše okres prodejna sortime nt vše skupina_zbož í položka_sortiment u sazba_dph čas měsí c vše tý tržba základ_dph DPH tržba_včetně_dph

Den v týdnu jako dimenzionální atribut čas vše tý _v_týdnu

Den v týdnu jako agregační úroveň čas vše tý _v_týdnu

Logický model (star-schema) motivačního příkladu místo prodejna okres název_okresu název_prodejny čas tý název_e tržba základ_dph DPH položka_sortim entu prodejna sortiment položka_sortimentu skupina_zboží sazba_dph název_skupiny_zboží název_položky_sort

Snowflake schema s tabulkou agregovaných hodnot okres okres název_okres u místo prodejna okres název_prodejn y tržba základ_dph DPH položka_sortimentu prodejna tržba na okres základ_dph DPH položka_sortimentu okres

Konsolidované star-schema motivačního příkladu místo klíč-místo prodejna okres název_okresu název_prodejny tržba základ_dph DPH klíč-místo klíč-čas klíč-sortiment sortiment klíč-sortiment položka_sortimentu skupina_zboží sazba_dph název_skupiny_zboží název_položky_sort čas klíč-čas tý název_e

Schema konsolidovaných faktů motivačního příkladu tržba místo prodejna okres název_prodejny název_okresu základ_dph DPH položka_sortimentu prodejna tržba na okres základ_dph DPH položka_sortimentu okres

Data mining (vytěžování/dolování dat) predikce klasifikace detekce odchylek asociační pravidla regrese shlukování modelování závislostí modelování kauzalit sumarizace indikace deskripce

Využití nalezených závislosti k predikci Příklad aplikace datového skladu v predikční úloze: Predikce spotřeby pitné vody Faktory, které mohou spotřebu ovlivňovat, nalezeny metodami data mining: počasí v týdnu roční období poloha (zahrádkářská kolonie/sídliště)

Využití nalezených závislosti k predikci Příklad aplikace datového skladu v predikční úloze: Predikce spotřeby pitné vody Faktory, které mohou spotřebu ovlivňovat, nalezeny metodami data mining: počasí v týdnu roční období poloha (zahrádkářská kolonie/sídliště)

Star schema datového skladu Area Day Area Name Description Reservoir Reservoir Area Water supply Name Tank Reservoir Tank Max volume Min level Max level Delta level volume Fact_table Date Time Reservoir Tank Inflow Outflow Delta level Consumption Volume Pressure Chlorine Time Date Time Hour Minute Second Day_part Date Day Month Year Week Day of Week Quarter Temperature Weather type Free days seq No Free days seq Cnt Weather Pipe line Water supply Name Description Weather type Weather Description Min Brightness Max Brightness Min Rain Max Rain

Výsledky Reservoir Michal 1800 1600 1400 1200 1000 800 600 400 200 0 day 3 6 9 12 15 18 21 24 27 30 33 36 39 consumption prediction Average error smaller than 19% After removing unpredictable events about 11%

Histogram chyb Počet dní 120 100 80 60 40 20 0 Histogram chyb -28-22 -16-10 -4 2 8 14 20 26 Chyba [%]

Senzitivita Senzitivita je definována jako relativní četnost případů patřících do třídy T 1, které dané klasifikační pravidlo správně zařadilo do třídy T 1 (správně pozitivně klasifikované případy), tedy Sens ( x, θ) P( d ( x) T ) = T1 > θ 1.

Specificita Specifičnost definujeme jako relativní četnost případů patřících do třídy T2, které však byly nesprávně zařazeny do třídy T1 (nesprávně pozitivně klasifikované případy), tedy Spec( x, θ) = P( d ( x) > θ T ) T1 2

ROC křivka ROC křivka Senzitivita 1,2 1 0,8 0,6 0,4 0,2 0 0 0,2 0,4 0,6 0,8 1 1,2 Specificita Náhodný prediktor Reálný prediktor