Databáze. datum jmeno prijmeni adresa_ulice adresa_mesto cislo_uctu platba zustatek



Podobné dokumenty
Dobývání znalostí z databází. Databáze. datum jmeno prijmeni adresa_ulice adresa_mesto cislo_uctu platba zustatek

Obr. 1 Plochý soubor s daty

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze

3 zdroje dat. Relační databáze EIS OLAP


kapitola 2 Datové sklady, OLAP

10. Datové sklady (Data Warehouses) Datový sklad

Analýza a modelování dat 5. přednáška. Helena Palovská

Databázové systémy. Doc.Ing.Miloš Koch,CSc.

Obsah. Kapitola 1. Kapitola 2. Kapitola 3. Kapitola 4. Úvod 11. Stručný úvod do relačních databází 13. Platforma 10g 23

Základy business intelligence. Jaroslav Šmarda

Kurz Databáze. Obsah. Dotazy. Zpracování dat. Doc. Ing. Radim Farana, CSc.

Datové sklady. Ing. Jan Přichystal, Ph.D. 1. listopadu PEF MZLU v Brně

Analýza a modelování dat. Přednáška 8

Databázové systémy. 10. přednáška

Analýza a modelování dat. Přednáška 9

Databázové a informační systémy

Datové modelování II

Informační systémy 2006/2007

Obsah. Úvod do problematiky. Datový sklad. Proces ETL. Analýza OLAP

Michal Krátký, Miroslav Beneš

Ukládání a vyhledávání XML dat

Dotazovací jazyky I. Datová krychle. Soběslav Benda

Ing. Roman Danel, Ph.D. 2010

Jak velká jsou? Obchodní analytici FB velké datové sady BI = business intelligence. OLAP = Online Analytical Processing. DWH = Data Warehouse

PostgreSQL jako platforma pro datové sklady

Multidimenzionální pohled na zdravotnické prostředí. INMED Petr Tůma

Obsah. Kapitola 1. Kapitola 2. Kapitola 3. Úvod 9

Business Intelligence

DATABÁZOVÉ SYSTÉMY. Metodický list č. 1

ZÍSKÁVÁNÍ ZNALOSTÍ Z DATABÁZÍ

NÁSTROJE BUSINESS INTELLIGENCE

Operátory ROLLUP a CUBE

QAD Business Intelligence

Informační systémy 2008/2009. Radim Farana. Obsah. Dotazy přes více tabulek

Distanční opora předmětu: Databázové systémy Tématický blok č. 3: OLAP, operátory CUBE a ROLLUP Autor: RNDr. Jan Lánský, Ph.D.

KIV/ZIS - SQL dotazy. stáhnout soubor ZIS- 04_TestovaciDatabaze accdb. SQL dotazy. budeme probírat pouze SELECT

Úvod do databázových systémů

Marketingová komunikace. 2. a 3. soustředění. Mgr. Pavel Vávra 9103@mail.vsfs.cz. Kombinované studium Skupina N9KMK3PH (vm3aph)

Informační systémy 2008/2009. Radim Farana. Obsah. Obsah předmětu. Požadavky kreditového systému. Relační datový model, Architektury databází

Databáze Bc. Veronika Tomsová

Business Intelligence

KIV/ZIS cvičení 5. Tomáš Potužák

PV005 Služby počítačových sítí: Data Warehouses

BI v rámci IS/ICT komponenty BI architektura. Charakteristika dat a procesů v IS/ICT. Datové sklady ukládání dat návrh datového skladu

Marketingová komunikace. 3. soustředění. Mgr. Pavel Vávra Kombinované studium Skupina N9KMK3PH (vm3bph)

8.2 Používání a tvorba databází

Databázové a informační systémy Jana Šarmanová

Konceptuální modely datového skladu

Databáze I. 5. přednáška. Helena Palovská

Vzorové příklady SQL. Tabulka: Kniha CREATE TABLE kniha (id INTEGER, název VARCHAR(50), PRIMARY KEY (id))

Podnikové informační systémy Jan Smolík

Multi-dimensional expressions

Data Cube. Luboš Kulič Tomáš Kuthan

Business Intelligence. Adam Trčka

Architektury databázových

Použití databází na Webu

Analýza a modelování dat 3. přednáška. Helena Palovská

Úvod do databázových systémů

Advanced SQL Modeling in RDBMS - SQL Spreadsheet part1. Your Organization (Line #1)

Oracle XML DB. Tomáš Nykodým

Datový sklad. Datový sklad

Analýza a modelování dat 6. přednáška. Helena Palovská

Databázové systémy Cvičení 5.2

Úvod do databázových systémů

Přehled systému Microsoft SQL Server. Komu je kniha určena Struktura knihy Nejvhodnější výchozí bod pro čtení knihy Konvence a struktura knihy

SQL - trigger, Databázové modelování

Databázové systémy BIK-DBS

Temporální databáze. Jan Kolárik Miroslav Macík

TM1 vs Planning & Reporting

Databázové systémy. Cvičení 6: SQL

Bu B sin i e n s e s s I n I te t l e lig i en e c n e c Skorkovský KA K M A I, E S E F MU

Obchodní akademie a Jazyková škola s právem státní jazykové zkoušky Jihlava

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY

B0M33BDT Technologie pro velká data. Supercvičení SQL, Python, Linux

Databázové systémy, MS Access. Autor: Ing. Jan Nožička SOŠ a SOU Česká Lípa VY_32_INOVACE_1130_Databázové systémy, MS Access_PWP

Data Warehouses. Jaroslav Bayer 1. Fakulta informatiky Masarykova univerzita

MS Access Dotazy SQL

Fakulta aplikovaných věd Katedra informatiky a výpočetní techniky DIPLOMOVÁ PRÁCE

Úvod do databázových systémů

Datové sklady. Multidimenzionální modelování Modely datového skladu Návrh datového skladu v rámci návrhu IS/ICT. Vladimíra Zádová, KIN, EF, TUL

Netezza. Martin Pavlík. 2. Února to pravé řešení pro analytický datový sklad

Základní informace o co se jedná a k čemu to slouží

Univerzita Palackého v Olomouci Radek Janoštík (Univerzita Palackého v Olomouci) Základy programování 4 - C# 10.4.

Databázové systémy. Datová integrita + základy relační algebry. 4.přednáška

Kapitola 1: Úvod. Systém pro správu databáze (Database Management Systém DBMS) Účel databázových systémů

Databázové systémy trocha teorie

Dolování v objektových datech. Ivana Rudolfová

Internetový mapový server Karlovarského kraje

Datové sklady ve školství

Úvod, terminologie. Ing. Michal Valenta PhD. Databázové systémy BI-DBS ZS 2010/11, P edn. 1

MBI - technologická realizace modelu

Přizpůsobení JSTL pro Google App Engine Datastore

Modelování a návrh datových skladů

Systém analýzy dat. Systém analysis of data

Úvod do databázových systémů 3. cvičení

Jan Horák. Pilíře řešení

Zdroje informací v organizaci IS/ICT BI v rámci IS/ICT historie architektura OLTP x DW ukládání dat

RELAČNÍ DATABÁZE. Cíl:

4IT218 Databáze. 4IT218 Databáze

Transkript:

Databáze datum jmeno prijmeni adresa_ulice adresa_mesto cislo_uctu platba zustatek 980103 Jan Novak Dlouha 5 Praha 1 9945371 100.00 100.00 980105 Jan Novak Dlouha 5 Praha 1 9945371 1500.00 1600.00 980106 Jan Novak Dlouha 5 Praha 1 9945371-1550.00 50.00 980106 Karel Nemec Podolska 4 Praha 2 24867134 3000.00 6000.00 980107 Karel Nemec Podolska 4 Praha 2 24867134-4000.00 2000.00 980108 Jan Novak Dlouha 5 Praha 1 9945371-150.00-100.00 980111 Karel Nemec Podolska 4 Praha 2 24867134 5000.00 7000.00 Obr. 1 Plochý soubor s daty klient id_klient jmeno prijmeni adresa_ulice adresa_mesto transakce id_transakce id_ucet datum platba zustatek úet id_ucet id_klient Obr. 2 Relaní databáze Způsoby dotazování: QBE vs. SQL SELECT klient.jmeno, klient.prijmeni, klient.adresa_ulice, klient. adresa_ mesto, ucet.cislo_uctu, transkace.zustatek FROM klient, ucet, transakce WHERE klient.id_klent = ucet.id_ucet; AND transakce.id_ucet = ucet.id_ucet; AND transakce.zustatek < 100; GROUP BY klient.adresa_mesto Obr. 3 SQL dotaz 1

P ístup k dat m EIS OLAP multidimenzionální koncept uložení a manipulace s daty (DATOVÁ KRYCHLE), intuitivní manipulace s daty, práce s daty z heterogenních datových zdrojů - provádějí se konverze dat, použití analytických metod - statistické přehledy, what-if analýzy, Client/Server architektura, podpora multiuživatelského pohledu, ukládání výsledků OLAP mimo zdrojová data, dynamická manipulace s řídkými maticemi, zpracování chybějících hodnot, neomezený počet dimenzí a agregačních úrovní. produkt datum region objem prodeje m sto Obr. 4 Struktura databáze 2

datum produkt m sto množství 10.1. šrouby Praha 241 10.1. matky Praha 61 10.1. šrouby Brno 17 10.1. podložky Brno 42 10.2. šrouby Praha 92 10.2. podložky Praha 27 10.2. šrouby Kladno 35 Tab. 1 Záznamy v databázi PRODEJ Praha Brno Kladno šrouby matky podložky šrouby matky podložky šrouby matky podložky 10.1. 241 61 17 42 10.2. 92 27 35 Tab. 2 ídká matice objem prodeje agregace pro produkty agregace pro m sta agregace pro regiony Obr. 5 Multidimenzionální model Práce s daty: slice and dice roll up vs. drill down 3

Implementace: hyperkrychle (hypercube) multikrychle (multicube) čisté OLAP vs. ROLAP uživatelské rozhraní OLAP engine MOLAP ROLAP SQL engine sumarizovaná data granulární data Obr. 6 MOLAP vs. ROLAP fyzické implementace systému: schéma hvězdy (star schema), schéma sněhové vločky (snowflake schema). 4

dimenze prodejna tabulka fakt dimenze asu data o prodejn m sto data o okresu data o regionu úrove (level) po et dimenze produkt data o produktu zna ka výrobce úrove(level) data o období rok tvrtletí m síc den Obr. 7 Hvzda dimenze prodejna data o prodejn m sto data o okresu data o regionu úrove(level) tabulka fakt prodejna poet data o okresu data o regionu tabulka fakt okres poet tabulka fakt region poet Obr. 8 Snhová vloka 5

Datový sklad subjektově orientovaný, integrovaný, časově proměnný, leč stálý soubor dat sloužící pro podporu rozhodování siln sumarizovaná data m e t a d a t a st edn sumarizovaná data sou asná detailní data starší detailní data Obr. 9 Struktura datového skladu 1. vrstva produk ní databáze 2. vrstva ddddd Data Warehouse Data 3. vrstva Data Mart Obr. 10 Tívrstvá (three tiered) architektura datového skladu 6

Dotazovací jazyky pro KDD MINE RULE Priklad AS SELECT DISTINCT 1..n produkt AS BODY, 1..1 produkt AS HEAD, SUPPORT, CONFIDENCE FROM Prodej WHERE BODY.město = HEAD.město AND BODY.datum = HEAD.datum EXTRACTING RULES WITH SUPPORT: 0.1, CONFIDENCE: 0.5 Obr. 11 Dotaz v MINE RULE Emp(Id,Age,Sex,Salary,Position,Car) GetRules (Emp) into R where support > 0.1 and confidence > 0.9 SelectRules (R) where body has {Age=*), (Sex=*)} and body is {(Car=*)} Obr. 12 Dotaz v MSQL - hledání pravidel Select * from Emp where violates all (GetRules (Emp) where body is {(Age=*)} and head is {(Salary=*)} and confidence > 0.3) Obr. 13 Dotaz v MSQL - hledání výjimek 7