Analýza a modelování dat 3. přednáška. Helena Palovská

Rozměr: px
Začít zobrazení ze stránky:

Download "Analýza a modelování dat 3. přednáška. Helena Palovská"

Transkript

1 Analýza a modelování dat 3. přednáška Helena Palovská

2 Historie databázových modelů

3 Relační model dat Codd, E.F. (1970). "A Relational Model of Data for Large Shared Data Banks". Communications of the ACM 1975 IBM system R 1979 Oracle V IBM DB2 Mnoho diskusí mezi puristy a pragmatiky...

4 Relační model idea Databáze uchovává fakta, nebo tvrzení považovaná za fakta. Např.: "Jan" je křestní jméno. "Novák" je příjmení. " " je telefonní číslo. Člověk s křestním jménem "Jan" a příjmením "Novák" má telefon " ".

5 Matematické značky místo vět Křestní_jméno("Jan") Příjmení("Novák") Telefonní_číslo(" ") Má_telefon("Jan","Novák"," ") Umoňují efektivněji uvažovat nad větami a jejich kombinacemi jakožto nad fakty.

6 Abstrakce vět relace x,x,z,w proměnné Křestní_jméno(x) Příjmení(y) Telefonní_číslo(z) Má_telefon(x,y,z) Telefonní_operátor(w) Poskytuje_spojení_s(w,z) unární relace ternární relace unární relace binární relace Lze chápat i jako logické operátory...

7 Unární relace vs. domény Křestní_jméno(x) Co to znamená? Buď: X je smysluplné křestní jméno. nebo: Křestní_jméno znamená doménu. V oblasti, o kterou se zajímáme, existuje člověk s křestním jménem X. Křestní jméno znamená unární relaci.

8 Konstrukce matematické relace Máme nějaké domény D 1, D 2,..., D n Vytvoříme kartézský součin D 1 x D 2 x x D n n-tice (d 1, d 2,..., d n ) (každé d i je prvek D i ) Nějaká podmnožina D 1 x D 2 x x D n relace tj. nějaká množina n-tic Může mít smysl či význam, např.: Kapitán, první důstojník, druhý důstojník, lodivod, kormidelník..., tvoří posádku lodi.

9 Databázová relace Názvy pro jednotlivé pozice v n-tici (alà role): Posádka_lodi(kapitán:x, první_důstojník:y, druhý_důstojník:z, ) x je z domény lidí s kapitánskou licencí, y a z jsou z domény lodních důstojníků,...

10 Více-ární relace Zákazník(id:i, jmeno:j, prijmeni:p, adresa:a, telefon:t) Interpretace: Existuje zákazník s id=..., jménem=..., atd. id, jmeno, prijmeni, adresa, telefon jsou názvy atributů atribut jmeno má doménu Křestní_jména, atribut telefon má doménu Telefony...

11 Relační model Používá relace i relace jako formální konstrukce tím umožňuje použít formální aparát relační algebru relační kalkul

12 Relační algebra Spojení JOIN Projekce výběr jen některých z atributů Selekce výběr jen některých z n-tic na základě podmínky, podmínek Sjednocení množin Průnik množin Rozdíl množin Kartézský součin množin

13 Formulace požadavků na data Který dotaz nelze formulovat pomocí relační algebry? zkuste jako cvičení Odvozené relace definujeme jako výsledky operací relační algebry... Jazyk manipulace pomocí relační algebry... Informační princip (E.F.Codd): Všechny informace jsou reprezentovány jako datové hodnoty ve vztazích (=relacích).

14 SQL a relační algebra Se odlišují v relaci mohou být duplicitní n-tice NULL hodnoty (v různém významu?) je možno využít pořadí sloupců je možno specifikovat pořadí řádků agregace LEFT/RIGT join...

15 Výhody relační algebry (ideálního SQL ) Jednoduchý jazyk na logické úrovni fyzické operace jsou zapouzdřeny, v zodpovědnosti SŘBD změny ve fyzické realizaci neovlivní sémantiku příkazů jazyka Vyjadřovací síla jazyka Neprocedurální dotazovací i manipulační jazyk

16 Nevýhody relačního modelu Není nikde dokonale implementován, různé SŘBD mají různé verze SQL SQL (nebo dokonce relační algebra či kalkul) jsou pro leckoho obtížné

17 Jak navrhnout relační databázi? ER model relační schéma transformace je rutinní postup viz např. Zdola nahoru na základě funkcionálních závislostí

18 Funkcionální závislosti Atributy: přednáška, učitel, místnost, hodina, student, známka Platné závislosti (v daném semestru): každou přednášku přednáší jediný učitel každý student má z každé přednášky jedinou známku v jedné místnosti se v jedné vyučovací hodině koná jediná přednáška

19 Funkcionální závislosti každý učitel učí v jedné vyučovací hodině v jediné místnosti každý student má na svém rozvrhu v jedné vyučovací hodině jedinou místnost Symbolicky P U, PS Z, HM P, HU M, HS M (Tyto konkrétní závislosti jsou neodvoditelné žádná z ostatních.) Detailně viz.

20 Multizávislost Všechny kombinace (hodina,místnost), do kterých je umístěna výuka nějaké přednášky, má na svém rozvrhu každý student, který má zapsanou tuto přednášku. Polopaticky: v kontextu jedné přednášky obsahuje rozvrh kombinace studentů a rozvrhových okének způsobem každý s každým Symbolicky: P HM, a také P S (v kontextu P U,PS Z)

21 Návrh dekompozicí Známe závislosti P U, PS Z, HM P, HU M, HS M 1 2 Multizávislost P HM, a také P S 3 Postupně navrhujeme relace: 3 Přednáší(P,U) Byl_ohodnocen(S,P,Z) Se_vyučuje(P,H,M) mezi relacemi zbylo omezení HS M

22 Návrh dekompozicí Jiné pořadí Byl_ohodnocen(P,S,Z) Přednáší(P,U) Je_podle_rozvrhu_v(S,H,M) Má_na_rozvrhu(S,H,P) mezi relacemi zbylo HM P a PH M Závěr: Při dekompozici podle závislostí volí analytik rozumné pořadí.

23 Návrh syntézou Vytvoříme soustavu závislostí vzájemně nedovoditelných jedna z ostatních. Seskupíme závislosti podle společných levých stran. Pro každou skupinu navrhneme relaci, bude mít klíč tvořen tou společnou levou stranou. Př.: P U, PS Z, HM P, HU M, HS M dá se dokázat HM HU Výsledek: (P,S,Z),(H,S,M),(U,H,M,P)

24 Normalizace databáze Vyhnout se aktualizačním anomáliím Mít stabilnější databázové schéma při rozšiřování světa zájmu Mít pravdivější a srozumitelnější databázové schéma pro bezchybné dotazy a manipulace Mít svobodu pro všemožné dotazování neztížit některé pohledy na data

25 Normální formy 1NF E.F.Codd 1970 (atributy=atomy) 2NF E.F.Codd 1971 (vždy na celém klíči) 3NF E.F.Codd 1971 (žádná tranzitivní závislost) BCNF E.F.Codd,R.F.Boyce 1974 (žádná netriviální závislost) Směrovací_čísla(Ulice, PSČ, Město) 4NF R.Fagin 1977 (žádná netriviální multizávislost) 5NF W.Kent 1983 obchodní zástupce prodává typ výrobků značky

26 Normální formy 6NF Ch.Date,H.Darven,N.Lorentzos ? o temporalitě

27 ER RDB schéma Důkladná informační analýza zkušeným analytikem, rutinní transformace normalizovaná databáze? Skoro vždy... A jestli někdo udělal chybu? Kontrola utilitami hledajícími závislosti... (náročné!)

28 Nevýhoda relačního modelu Normalizovaná databáze láme data do mnoha tabulek. Řešení: vědomá a záměrná denormalizace urychlit některá vyhledávání urychlit některé výpočty je to kompromis jedněch provozních požadavků (některých dotazů) vůči jiným (jiným dotazům, manipulacím)

29 STUDENT os_cis... ZAPIS os_cis id_kurz znamka KURZ id_kurz id_predmet obdobi den hodina mistnost ucitel Kandidátní klíče pro relaci KURZ: AK1=(odbobi,den,hodina,mistnost) AK2=(obdobi,den, hodina, ucitel) PREDMET id_predmet... UCITEL os_cis... MUZE_UCIT id_predmet os_cis Omezení pro studenta: TRIGGER BEFORE INSERT,UPDATE(os_cis,id_kurz) na ZAPIS podmínka pro ukončení transakce: EXISTS (select * from KURZ join ZAPIS using(id_kurz) where os_cis=new.os_cis and obdobi=(select obdobi from KURZ where id_kurz=new.id_obdobi) and den=(select den from KURZ where id_kurz=new.id_den) and hodina=(select hodina from KURZ where id_kurz=new.id_hodina) and new.id_kurz<>id_kurz))

30 PREDMET STUDENT os_cis... ZAPIS os_cis id_kurz obdobi den hodina znamka KURZ id_kurz id_predmet obdobi den hodina mistnost ucitel id_predmet... UCITEL os_cis... MUZE_UCIT id_predmet os_cis Kandidátní klíče pro relaci KURZ: AK1=(odbobi,den,hodina,mistnost) AK2=(obdobi,den, hodina, ucitel) Kandidátní klíč pro relaci ZAPIS: AK=(obdobi,den, hodina, os_cis) Integrita odvozených dat mezi ZAPIS, KURZ: TRIGGER before INSERT,UPDATE(id_kurz) new.obdobi:=select obdobi from KURZ where id_kurz=new.id_kurz; new.den:=select den from KURZ where id_kurz=new.id_kurz; new.hodina:=select hodina from KURZ where id_kurz=new.id_kurz;

J. Zendulka: Databázové systémy 4 Relační model dat 1

J. Zendulka: Databázové systémy 4 Relační model dat 1 4. Relační model dat 4.1. Relační struktura dat... 3 4.2. Integritní pravidla v relačním modelu... 9 4.2.1. Primární klíč... 9 4.2.2. Cizí klíč... 11 4.2.3. Relační schéma databáze... 13 4.3. Relační algebra...

Více

Téma 9 Databáze úvod, modelování dat

Téma 9 Databáze úvod, modelování dat Téma 9 Databáze úvod, modelování dat Obsah 1. Základní pojmy databází 2. Abstrakce, schémata, pohledy 3. Databázové modely 4. Modelování reálného světa 5. Entity a vztahy 6. Entity-elationship (E-) model

Více

Zadání. Slovníček pojmů. Otázka 19 A7B36DBS

Zadání. Slovníček pojmů. Otázka 19 A7B36DBS Otázka 19 A7B36DBS Zadání... 1 Slovníček pojmů... 1 Návrh relačního schématu... 2 Normalizace schématu formou dekompozice... 5 Kritéria kvality dekompozice... 15 Návrh schématu relační databáze přímou

Více

Téma 9 Databáze úvod, modelovánídat

Téma 9 Databáze úvod, modelovánídat Téma 9 Databáze úvod, modelovánídat Obsah 1. Základní pojmy databází 2. Abstrakce, schémata, pohledy 3. Databázové modely 4. Modelování reálného světa 5. Entity a vztahy 6. Entity-Relationship (E-R) model

Více

D A T A B Á Z O V É S Y S T É M Y

D A T A B Á Z O V É S Y S T É M Y 1(22) Konceptuální úroveň - vytvářím první model reality - ER-model jednoduchý grafický aparát, dá se jednoduše identifikovat - entita skládá se z vlastností, které chci zpracovávat - Chenovo pojetí -

Více

Databázové systémy 1 KIV/DB1

Databázové systémy 1 KIV/DB1 Databázové systémy 1 KIV/DB1 Celá kniha je exportem z wikipedie, ale spolehlivě pokrývá rozsah znalostí pro tento předmět. Obsah Články Systém řízení báze dat 1 Databáze 2 Relační databáze 5 Relační model

Více

Metodika návrhu multidimenzionální databáze v prostředí zemědělského podniku

Metodika návrhu multidimenzionální databáze v prostředí zemědělského podniku ČESKÁ ZEMĚDĚLSKÁ UNIVERZITA V PRAZE PROVOZNĚ EKONOMICKÁ FAKULTA Metodika návrhu multidimenzionální databáze v prostředí zemědělského podniku disertační práce Autor: Školitel: Ing. Jan Tyrychtr doc. Ing.

Více

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ. FAKULTA STROJNÍHO INŽENÝRSTVÍ Ústav automatizace a informatiky DATABÁZOVÉ SYSTÉMY

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ. FAKULTA STROJNÍHO INŽENÝRSTVÍ Ústav automatizace a informatiky DATABÁZOVÉ SYSTÉMY VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ FAKULTA STROJNÍHO INŽENÝRSTVÍ Ústav automatizace a informatiky DATABÁZOVÉ SYSTÉMY (doplňující text ke konzultacím v 3. ročníku kombinovaného bakalářského studia oboru Aplikovaná

Více

Hierarchický databázový model

Hierarchický databázový model 12. Základy relačních databází Když před desítkami let doktor E. F. Codd zavedl pojem relační databáze, pohlíželo se na tabulky jako na relace, se kterými se daly provádět různé operace. Z matematického

Více

Zadání. Slovníček pojmů

Zadání. Slovníček pojmů Otázka 17 A7B36DBS Zadání... 1 Slovníček pojmů... 1 Datové modely... Chyba! Záložka není definována. Konceptuální datový model... 3 Databázové modely... 6 Fyzický pohled na data... 8 Relační datový model...

Více

Databázové systémy I přednášky

Databázové systémy I přednášky Vostrovský Václav vostrovsky@pef.czu.cz PEF - přízemí č. 15 Po 12:00-13:30-75% docházky na cvičeních - musíme chodit připraveni - 2 testy v průběhu cvičení (teorie a SQL) - max 10 bodů, minimum 5 bodů,

Více

2. Teorie databázových systémů

2. Teorie databázových systémů - 1-1. Úvod Zpracování dat můžeme definovat jako obsažné a účelné sestavení dat provedené strojem ze zadaných údajů. Cílem je nejen ušetřit lidskou práci a čas, ale zejména zabránit možným chybám. Výsledkem

Více

Učební texty k státní bakalářské zkoušce Obecná informatika Databáze. študenti MFF 15. augusta 2008

Učební texty k státní bakalářské zkoušce Obecná informatika Databáze. študenti MFF 15. augusta 2008 Učební texty k státní bakalářské zkoušce Obecná informatika Databáze študenti MFF 15. augusta 2008 1 4 Databáze Požadavky Podstata a architektury DB systémů. Konceptuální, logická a fyzická úroveň pohledů

Více

DATABÁZOVÉ SYSTÉMY JIŘÍ HRONEK KATEDRA INFORMATIKY PŘÍRODOVĚDECKÁ FAKULTA UNIVERZITA PALACKÉHO

DATABÁZOVÉ SYSTÉMY JIŘÍ HRONEK KATEDRA INFORMATIKY PŘÍRODOVĚDECKÁ FAKULTA UNIVERZITA PALACKÉHO KATEDRA INFORMATIKY PŘÍRODOVĚDECKÁ FAKULTA UNIVERZITA PALACKÉHO DATABÁZOVÉ SYSTÉMY JIŘÍ HRONEK VÝVOJ TOHOTO UČEBNÍHO TEXTU JE SPOLUFINANCOVÁN EVROPSKÝM SOCIÁLNÍM FONDEM A STÁTNÍM ROZPOČTEM ČESKÉ REPUBLIKY

Více

Relační databázové systémy. T1 Relační databázov zové systémy

Relační databázové systémy. T1 Relační databázov zové systémy C1 T1 Relační databázov zové systémy Relační databázové systémy (1. část) 1. Základní pojmy 2. Struktura DBS 3. Vztahy a relace 4. Datová integrita 2 Proč používat DBS Základn kladní pojmy Poskytuje rychlejší

Více

Jiří Mašek BIVŠ V Pra r ha 20 2 08

Jiří Mašek BIVŠ V Pra r ha 20 2 08 Jiří Mašek BIVŠ Praha 2008 Procesvývoje IS Unifiedprocess(UP) Iterace vývoje Rysy CASE nástrojů Podpora metodických přístupů modelování Integrační mechanismy propojení modelů Podpora etap vývoje Generování

Více

Kapitola 3: Relační model. Základní struktura. Relační schéma. Instance relace

Kapitola 3: Relační model. Základní struktura. Relační schéma. Instance relace - 3.1 - Struktura relačních databází Relační algebra n-ticový relační kalkul Doménový relační kalkul Rozšířené operace relační algebry Modifikace databáze Pohledy Kapitola 3: Relační model Základní struktura

Více

Databázové systémy 2. Studijní opora. Ing. Zbyněk Bureš. Ph.D.

Databázové systémy 2. Studijní opora. Ing. Zbyněk Bureš. Ph.D. Databázové systémy 2 Studijní opora Ing. Zbyněk Bureš. Ph.D. Zbyněk Bureš DATABÁZOVÉ SYSTÉMY 2 1. vydání ISBN 978-80-87035-89-4 Vydala Vysoká škola polytechnická Jihlava, Tolstého 16, Jihlava, 2014 Tisk

Více

Databázové systémy 1

Databázové systémy 1 Databázové systémy 1 Obsah 1 Relační databáze, databázový server, tabulka...3 2 Jazyk SQL a jeho vývoj. Příkazy DDL, DML, DCL...5 3 Datové typy SQL a Oracle...6 4 Příkaz Select základní syntaxe, projekce,

Více

definovat a vysvětlit na příkladech základní pojmy relačního modelu

definovat a vysvětlit na příkladech základní pojmy relačního modelu 5.1. Relační schéma, relace 5. RELAČNÍ DATOVÝ MODEL Cíl Po prostudování celé kapitoly budete umět definovat relaci, relační schéma a schéma relační databáze, rozumět definicím a na příkladech vysvětlit

Více

Strukturované metodologie

Strukturované metodologie Strukturované metodologie Strukturovaný přístup aplikace má podobu hierarchie funkcí, která je realizována strukturovanými programy styl práce: AKCE OBJEKT Entitně relační model (ERA) alternativní názvy:

Více

Univerzita Hradec Králové. Filozofická fakulta. Katedra pomocných věd historických a archivnictví

Univerzita Hradec Králové. Filozofická fakulta. Katedra pomocných věd historických a archivnictví Univerzita Hradec Králové Filozofická fakulta Katedra pomocných věd historických a archivnictví Databáze soupisu duší s historicko-demografickými výstupy Diplomová práce Autor: Bc. Jiří Kudr Studijní program:

Více

Návrh databázové aplikace pro zadávání a archivaci absolventských prací s využitím MySQL a PHP

Návrh databázové aplikace pro zadávání a archivaci absolventských prací s využitím MySQL a PHP Vysoká škola ekonomická v Praze Fakulta informatiky a statistiky Vyšší odborná škola informačních služeb v Praze Jana Baranová Návrh databázové aplikace pro zadávání a archivaci absolventských prací s

Více

2 Konceptuální modelování a návrh databáze

2 Konceptuální modelování a návrh databáze 2 Konceptuální modelování a návrh databáze 2.1. Úloha konceptuálního modelování v procesu návrhu databáze... 2 2.2. E - R modely... 6 2.3. Doporučení pro modelování a tvorbu ER diagramu... 22 2.4. Transformace

Více

DATABÁZOVÉ SYSTÉMY 1. Základní pojmy databázové technologie

DATABÁZOVÉ SYSTÉMY 1. Základní pojmy databázové technologie DATABÁZOVÉ SYSTÉMY 1. Základní pojmy databázové technologie Úvod Databáze a databázové technologie mají velký vliv na rostoucí používání počítačů. Bylo by správné říci, že databáze hrají kritickou roli

Více

2 Konceptuální modelování a návrh databáze

2 Konceptuální modelování a návrh databáze 2 Konceptuální modelování a návrh databáze 2.. Úloha konceptuálního modelování v procesu návrhu databáze... 2 2.2. E - R modely... 6 2.3. Doporučení pro modelování a tvorbu ER diagramu... 22 2.4. Transformace

Více

7. Normální formy. PŘ: POJIŠŤOVNA Povinné ručení relace Platby

7. Normální formy. PŘ: POJIŠŤOVNA Povinné ručení relace Platby 7. Normální formy PŘ: POJIŠŤOVNA Povinné ručení relace Platby Rodné číslo 7407111234 7407111234 7407111234 7407111234 481123123 481123123 481123123 481123123 Jméno majitele Dvořák Petr Dvořák Petr Dvořák

Více

1. ZPRACOVÁNÍ DAT. Čas ke studiu kapitoly: 2 hodiny. 1.1. Úlohy zpracování dat. Cíl Po prostudování tohoto odstavce budete umět.

1. ZPRACOVÁNÍ DAT. Čas ke studiu kapitoly: 2 hodiny. 1.1. Úlohy zpracování dat. Cíl Po prostudování tohoto odstavce budete umět. 1.1. Úlohy zpracování dat 1. ZPRACOVÁNÍ DAT Čas ke studiu kapitoly: 2 hodiny 1.1. Úlohy zpracování dat Cíl Po prostudování tohoto odstavce budete umět popsat problém evidence a zpracování velkého množství

Více

NÁVRH DATABÁZE PRO NEZISKOVOU ORGANIZACI

NÁVRH DATABÁZE PRO NEZISKOVOU ORGANIZACI VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY FAKULTA PODNIKATELSKÁ ÚSTAV INFORMATIKY FACULTY OF BUSINESS AND MANAGEMENT INSTITUTE OF INFORMATICS NÁVRH DATABÁZE PRO NEZISKOVOU ORGANIZACI

Více

ÚVOD DO DATABÁZÍ I (DISTANČNÍ VÝUKOVÁ OPORA)

ÚVOD DO DATABÁZÍ I (DISTANČNÍ VÝUKOVÁ OPORA) UČEBNÍ TEXTY OSTRAVSKÉ UNIVERZITY Přírodovědecká fakulta ÚVOD DO DATABÁZÍ I (DISTANČNÍ VÝUKOVÁ OPORA) Zdeňka Telnarová Ostravská univerzita 1 Modul 1... 5 1.1 Základní systémové pojmy... 5 1.1.1 Systém...5

Více