Analýza a modelování dat 6. přednáška. Helena Palovská

Podobné dokumenty
Jaký je rozdíl v definicicíh VARCHAR2(20 BYTE) a VARCHAR2(20 CHAR):

Analýza a modelování dat 3. přednáška. Helena Palovská

Marketingová komunikace. 2. a 3. soustředění. Mgr. Pavel Vávra 9103@mail.vsfs.cz. Kombinované studium Skupina N9KMK3PH (vm3aph)

Marketingová komunikace. 3. soustředění. Mgr. Pavel Vávra Kombinované studium Skupina N9KMK3PH (vm3bph)

Databáze I. 5. přednáška. Helena Palovská

Databázové systémy úvod

Databázové systémy. - SQL * definice dat * aktualizace * pohledy. Tomáš Skopal

KIV/ZIS cvičení 6. Tomáš Potužák

Analýza a modelování dat 2. přednáška. Helena Palovská

Databázové systémy. Datová integrita + základy relační algebry. 4.přednáška

Databáze I. 1. přednáška. Helena Palovská

Marketingová komunikace. 2. soustředění. Mgr. Pavel Vávra Kombinované studium Skupina N9KMK1aPH/N9KMK1bPH (um1a1ph/um1b1ph)

Kurz Databáze. Obsah. Dotazy. Zpracování dat. Doc. Ing. Radim Farana, CSc.

SQL SQL-SELECT. Informační a znalostní systémy. Informační a znalostní systémy SQL- SELECT

Úvod do databázových systémů

Databázové systémy. Doc.Ing.Miloš Koch,CSc.

Operátory ROLLUP a CUBE

4IT218 Databáze. 4IT218 Databáze

Databázové systémy Cvičení 5.3

TimescaleDB. Pavel Stěhule 2018

Databáze II. 2. přednáška. Helena Palovská

Informační systémy 2008/2009. Radim Farana. Obsah. Dotazy přes více tabulek

Úvod do databázových systémů

VŠB FEI - Technická Univerzita Ostrava. DAIS - Projekt. Dopravní podnik. Jméno: Matěj Kotyz (KOT0177)

Databázové systémy úvod

Temporální databáze. Jan Kolárik Miroslav Macík

SQL - trigger, Databázové modelování

3. přednáška z předmětu GIS1 atributové a prostorové dotazy

Úvod do databázových systémů

Úvod do databází. Modelování v řízení. Ing. Petr Kalčev

Databázové systémy Cvičení 5

Gymnázium a Střední odborná škola, Rokycany, Mládežníků 1115

Obsah přednášky. Databázové systémy. Normalizace relací. Normalizace relací. Normalizace relací. Normalizace relací

1. Databázové systémy (MP leden 2010)

Databázové systémy úvod

Úvod do databázových systémů. Ing. Jan Šudřich

Databáze I. 4. přednáška. Helena Palovská

Zápisování dat do databáze

Databáze Bc. Veronika Tomsová

Analýza a modelování dat 5. přednáška. Helena Palovská

Databáze I. Přednáška 3

8.2 Používání a tvorba databází

Technické informace. PA152,Implementace databázových systémů 4 / 25. Projekty. pary/pa152/ Pavel Rychlý

Platforma Java. Petr Krajča. Katedra informatiky Univerzita Palackého v Olomouci. Petr Krajča (UP) KMI/PJA: Seminář V. 27. říjen, / 15

Informační systémy ve zdravotnictví. 8. cvičení

Nerelační databázové modely. Helena Palovská

Inovace tohoto kurzu byla spolufinancována z Evropského sociálního fondu a státního rozpočtu České republiky.

NSS - Cache 5. LECTURE MARTIN TOMASEK

Úvod do databázových systémů

RNDr. Jakub Lokoč, Ph.D. RNDr. Michal Kopecký, Ph.D. Katedra softwarového inženýrství Matematicko-Fyzikální fakulta Univerzita Karlova v Praze

Databáze 2011/2012 SQL DDL (CREATE/ALTER/DROP TABLE), DML (INSERT/UPDATE/DELETE) RNDr.David Hoksza, Ph.D.

RELAČNÍ DATABÁZOVÉ SYSTÉMY

Primární klíč, cizí klíč, referenční integrita, pravidla normalizace, relace

Data v informačních systémech

PostgreSQL. Podpora dědičnosti Rozšiřitelnost vlastní datové typy. Univerzální nasazení ve vědecké sféře

Databázové systémy I. 1. přednáška

Databázové systémy. Cvičení 3

Základy databází. O autorech 17 PRVNÍ ČÁST. KAPITOLA 1 Začínáme 19

Administrace Oracle. Práva a role, audit

Obchodní akademie a Jazyková škola s právem státní jazykové zkoušky Jihlava

Databáze SQL SELECT. David Hoksza

DATABÁZOVÉ SYSTÉMY. Metodický list č. 1

Gymnázium a Střední odborná škola, Rokycany, Mládežníků 1115

SII - Informatika. 1. Atribut relace, jehož hodnota jednoznačně určuje prvek v jiné relaci, se nazývá:

DUM 12 téma: Příkazy pro tvorbu databáze

Úvod do databázových systémů

Datové sklady ve školství

Databázové a informační systémy Informační systém prodejny nábytku. Jakub Kamrla, KAM087

Použití databází na Webu

Modely datové. Další úrovní je logická úroveň Databázové modely Relační, Síťový, Hierarchický. Na fyzické úrovni se jedná o množinu souborů.

DJ2 rekurze v SQL. slajdy k přednášce NDBI001. Jaroslav Pokorný

8. Zpracování dotazu. J. Zendulka: Databázové systémy 8 Zpracování dotazu 1

Základy relačních databází, jejich využití v programování webu

J. Zendulka: Databázové systémy 8 Zpracování dotazu Podstata optimalizace zpracování dotazu

Databáze. datum jmeno prijmeni adresa_ulice adresa_mesto cislo_uctu platba zustatek

Informační systémy ve zdravotnictví. 6. cvičení

Databázové systémy. Cvičení 6: SQL

XML databáze. Přednáška pro kurz PB138 Moderní značkovací jazyky Ing. Petr Adámek

Analýza a modelování dat. Přednáška 8

OBJECT DEFINITION LANGUAGE. Jonáš Klimeš NDBI001 Dotazovací Jazyky I 2013

Role BI v e-business řešeních pohled do budoucnosti

Databáze 2013/2014. Konceptuální model DB. RNDr. David Hoksza, Ph.D.

Vzorové příklady SQL. Tabulka: Kniha CREATE TABLE kniha (id INTEGER, název VARCHAR(50), PRIMARY KEY (id))

Úvod do databázových systémů 1. cvičení

Marketingová komunikace. 1. a 2. soustředění. Mgr. Pavel Vávra 9103@mail.vsfs.cz. Kombinované studium Skupina N9KMK3PH (vm3bph)

Systémy řízení proudů dat

Datové modelování II

Ukázka testu Informatiky pro přijímací zkoušky do navazujícího magisterského studia

Marketingová komunikace. 1. soustředění. Mgr. Pavel Vávra Kombinované studium Skupina N9KMK3PH (vm3aph)

Ukládání a vyhledávání XML dat

Úvod, terminologie. Ing. Michal Valenta PhD. Databázové systémy BI-DBS ZS 2010/11, P edn. 1

Dobývání znalostí z databází. Databáze. datum jmeno prijmeni adresa_ulice adresa_mesto cislo_uctu platba zustatek

PA152. Implementace databázových systémů

HELIOS Orange Inventury nedokončené výroby

Relační DB struktury sloužící k optimalizaci dotazů - indexy, clustery, indexem organizované tabulky

Databázové systémy I

SQL v14. 4D Developer konference. 4D Developer conference 2015 Prague, CZ Celebrating 30 years

TSQL2. (aneb jak na to) Tomáš Janků

Materializované pohledy

Databáze I. Přednáška 2

Transkript:

Analýza a modelování dat 6. přednáška Helena Palovská

Historie databázových modelů Jak je řešena temporalita?

Temporalita v databázích Možnosti pro platnost faktu (valid time): platí nyní, je to aktuální fakt, event. odkdy je to událost, která nastala, víme kdy nastala platil v období od..do = období platnosti od nebo do nemusí být známo od nebo do nemusí mít smysl

Temporalita v databázích, II. Doba zaznamenání event. smazání (transaction time) kdy zaznamenán do databáze kdy se má smazat (zrušit platnost záznamu) Tímto se zabývat nebudeme! čas zapsání, aktualizace... běžné postupy kdy se má event. smazat... ne tak běžné, ale řešitelné

Porovnání: Operace s valid time co bylo dříve, co potom najdi následující, předchozí Nastala uvažovaná událost v uvažovaném období? Jaký je vztah dvou období? Možnosti: první je částí druhého překrývají se jedno předchází druhému

Vztah k nyní : Operace s valid time historie, současnost, budoucnost The moving point NOW

Dotazy s obdobím Jsou sledovány odchody a příchody do zařízení. V zařízení také nastávají události. Během kterého pobytu které osoby v zařízení nastaly více než 2 události sledovaného typu? Potřeba GROUP BY podle osoby a období! období nejsou pravidelná, podle žádného rozvrhu...

Primární klíče Zaměstnanec pracoval době od..do na úkolu. Záznamy se nemají překrývat

Normalizace Host byl ubytován v hotelu v období od..do navazující období by se měly spojit

Integritní omezení Když zaměstnanec pracoval v období od..do na úkolu, pak tento zaměstnanec v tomto období musel být v zařízení.

Datový typ období od..do Specifické operace průnik sloučení Specifická porovnání překrývání dříve, potom jestli okamžik spadá do období

Implementace datového typu období Doposud v SQL DBMS není Nahrazováno dvojicí údajů typu datetime Předchozí požadované operace a porovnání je třeba programovat.

1. přístup Zapisuje se žurnál změn Např. se zapisují změny ceny, odkdy platí. Problém 1: Sleduje se jediná cena. Kdy nastalo zdražení o 10%? Řešení: Můžeme záznamy v žurnálu průběžně číslovat (nový záznam má číslo o 1 větší než poslední záznam). SELECT C2.datum FROM Ceny C1 JOIN Ceny C2 ON(C1.cis+1=C2.cis) AND C2.cena>=C1.cena*1.1

Problém 2: Sleduje se více cen. Kdy nastalo zdražení něčeho o 10%? (Průběžné číslování záznamů ceníku nepomůže.) SELECT C2.produkt, C2.datum FROM Ceny C1, Ceny C2 WHERE C1.produkt=C2.produkt AND C1.datum<C2.datum AND C2.cena>=C1.cena*1.1 AND NOT EXISTS (SELECT * FROM Ceny C3 WHERE C1.datum<C3.datum AND C3.datum<C2.datum) Efektivita?!?

Možné řešení: Pro každý produkt zapisujeme poslední číslo záznamu v ceníku. SELECT C2.datum FROM Ceny C1 JOIN Ceny C2 ON(C1.cis+1=C2.cis AND C1.produkt=C2.produkt) AND C2.cena>=C1.cena*1.1 Režie z udržování posledních čísel záznamů pro jednotlivé produkty... Toto je řešení jen pro tento specifický druh dotazu. Jiné možné dotazy: zdražení o 10% během 1 měsíce...?

Problém 3: Objednávka byla podána v nějaký den. Jaká tehdy platila cena? SELECT C1.cena FROM Ceny C1, Ceny C2 WHERE C1.produkt=C2.produkt AND C1.produkt=@p AND C1.datum<C2.datum AND C1.datum<=@d AND C2.datum>=@d AND NOT EXISTS (SELECT * FROM Ceny C3 WHERE C1.datum<C3.datum AND C3.datum<C2.datum) Efektivita?!?

Možné řešení: Přidáme údaj do. SELECT cena FROM Ceny WHERE produkt=@p AND od<=@datum AND do>=@datum Stále ještě ne ideální řešení, málo efektivní provádění dotazů. Praktické řešení: Do objednávky zapisujeme cenu platnou v době objednání. Je toto univerzální řešení?

Problém 4 (podobný jako dříve): Během kterého pobytu které osoby v zařízení nastala událost sledovaného typu? Vedou se žurnály: Záznamy o průchodu vstupem do zařízení. Záznamy o událostech. Řešení dotazu? obtížné... Špatná efektivita. Možné řešení: identifikátory pro každý pobyt, a tabulky provazující události a pobyty...

2.přístup Historie a současnost se vedou zvlášť. historické záznamy s platností od..do aktuální záznamy s aktuálním stavem, event. s údajem odkdy tento stav platí Podobně rozdělení IS na Transaction Processing systém (TPS) Data Warehouse (DWH) Procesní dotazy se řeší v TPS prosazování business rules Dolování dat se provádí v DWH

Řešení temporality v DWH (obecně v historických datech) Libovolná období od..do se nepovolují místo toho roky, čtvrtletí, měsíce,... Podobně deníky a žurnály dodržují rozvrhy týdny, dny, směny... Pouze určitá období, mající ID a event. skladbu celek-část

6. normální forma Pro historická data o stavech objektů a období, kdy tyto stavy platily. Objekt měl v období od..do stav a 1,...,a n Nový záznam vždy, když se změní některé z a 1 až a n..redundance informace o ostatních a i Normalizace: Modelujeme atomické fakty pro časové snímky, ukládáme záznamy o časové platnosti těchto atomických faktů:

OID období atribut1 atribut2 1 01-02 A B 1 03-04 A C 1 05-06 D C normalizace OID období atribut1 1 01-04 A 1 05-06 D OID období atribut2 1 01-02 B 1 03-06 C

3.přístup Zpracování proudů dat: Předdefinované dotazy, prováděné průběžně na vyrovnávací paměti zdražení o 10% opakovaný pokus o přístup ke zdroji v krátkém časovém rozmezí nutná paměť jen pro potřebou část fronty přicházejících dat, ke zpracování dotazů oznamování událostí Zprávy nebo události můžeme ukládat do skladu pro učení definice nových dotazů

Závěr Pro datový sklad s historickým fakty, s udáním období jejich platnosti od..do, tato období libovolná, obtížná proveditelnost dotazů týkajících se: předchozí, následující dvojice faktů s požadavkem na časový interval mezi nimi časová koincidence událostí, období event. agregace vzhledem k období