Akcentace a inovace konceptuálního modelu při vývoji databázových aplikací

Rozměr: px
Začít zobrazení ze stránky:

Download "Akcentace a inovace konceptuálního modelu při vývoji databázových aplikací"

Transkript

1 Akcentace a inovace konceptuálního modelu při vývoji databázových aplikací JanTyrychtr 1, Julie Poláčková 2, Ivana Švarcová 3 Česká zemědělská univerzita, Provozně ekonomická fakulta Katedra informačních technologií 1, 3 Katedra statistiky 2 Abstrakt: V článku je upraven Entity-Relationship model dat tak, aby vyhovoval procesu databázového návrhu s akcentací na kvalitu softwarových aplikací. Schéma diagramů Entity-Relationship modelu (navržený Chenem v roce 1976) je inovováno o množinu upozornění. Možné způsoby použití inovovaného modelu jsou prezentovány. Článek empiricky ověřuje závislost počtu prvků relace (počtu řádků v tabulkách) v systému Wordpress na rychlosti databázového systému MySQL jako hlavního faktoru decelerace aplikací. Článek akcentuje potřebu predikovat budoucí vytížení databáze na příkladu systému Wordpress. Klíčová slova: databáze, databázový systém, konceptuální návrh, ER diagram, Entity-Relationship. Abstract: The paper is modified Entity-Relationship data model so as to meet the database design process with accentuation on the quality of software applications. Schema diagrams Entity-Relationship model (proposed by Chen in 1976) is innovated on the set alerts. Possible uses an innovative model are presented. The paper empirically tested the dependence of elements of the relation (the number of rows in the tables) in the WordPress on the speed of the database system MySQL as the main factor deceleration applications. The paper emphasizes the need to predict the future workload for the database example of Wordpress Keywords: database, database system, conceptual design, ER diagram, Entity- Relationship. 1. Úvod V současnosti je kladen důraz na kvalitu softwaru jako faktoru ekonomického úspěchu organizace. Databáze a databázové systémy jsou používany pro organizaci a manipulaci s daty ve většině organizací. Také většina aplikačního software a webových aplikací je principiálně zaměřena na použití s databázovým systémem. Důvodem řešené problematiky je fakt, že zpracovatel (firma, programátor - analytik atp.) aplikace je postaven před řadu otázek, nejen jak postupovat při vytváření dané aplikace, ale i jaký zvolit programovací jazyk a databázový systém. Některé otázky jsou zodpovězeny samotnými požadavky zadavatele (firma, vedení organizace atp.). Ne vždy ale je problém výběru nejrychlejšího databázového systému tím rozhodujícím faktorem pro běh aplikace. Zadavatel a zpracovatel aplikace (využívající databázový systém) si většinou neuvědomují, že složitost zpracování databázových dotazů není konstantní O(1), tedy nezávislá na rozměru vstupu. Neznalost, nebo i laxnost při vývoji a návrhu celého databázového schématu se bohužel projeví až po nějaké době běhu aplikace, kdy již většinou změna návrhu struktury databázového schématu bývá velmi obtížná. Tato ztráta výkonnosti vede k restrukturalizaci celé aplikace nebo databázového schématu. Důsledkem je pak ekonomická ztráta pro organizaci. SYSTÉMOVÁ INTEGRACE 4/

2 JanTyrychtr, Julie Poláčková, Ivana Švarcová Příspěvek ve 2. části využívá metriky pro analýzu kvality relačního databázového schématu v návaznosti na ISO / IEC 9126 (ISO, 1994). Je důležité, aby softwarové produkty, a samozřejmě i databáze, byly hodnoceny pro všechny příslušné charakteristiky pomocí validovaných nebo široce přijímaný metrik [11]. Posouzen je statistický vliv vybraných faktorů (počet řádků v tabulce, doba odezvy zpracování SQL dotazů) na dobu odezvy aplikace WordPress. Statistický vliv je testován prostřednictvím SQL DBMS, databázového systému MySQL. SQL DBMS je systém řízení báze dat založený na jazyku SQL (prvně použitý v Systému R [3]). Důležité při návrhu aplikace je zaměření se na jednotlivé kroky procesu databázového návrhu (obrázek č. 1). Obecným úkolem návrhu databáze je zmapovat daný reálný svět aplikace do formálního datového modelu daného systému pro správu databází. [4] Ve 3. části je akcentován návrh konceptuálního datového modelu. Ve druhém kroku (obrázek č. 1) je vytvořeno konceptuální schéma, které popisuje strukturu databáze nezávislé na databázovém systému. Konceptuální model je používán k popisu konceptuálního schématu. [4] Obrázek č. 1: Proces databázového návrhu [4]. V konceptuální datovém modelu musí být zřejmé jednotlivé požadavky aplikace. Na procesu tvorby databázového návrhu se může a většinou i podílí více lidských 52 SYSTÉMOVÁ INTEGRACE 4/2010

3 Akcentace a inovace konceptuálního modelu při vývoji databázových aplikací zdrojů. Každá fáze tohoto procesu může být zpracována jiným designérem. To znamená, že při vytváření databáze je potřeba vytvoření vazby dvou nebo více účastníků procesu. S růstem počtu účastníků klesá možnost plně využít komunikační vazby. Komunikační šum roste s narůstajícím počtem prvků komunikačního řetězce geometrickou řadou. Proto je nutné, aby požadavky a specifika aplikace byly přenášeny jednotlivými kroky návrhu, a to stručnou formou, tak aby nedocházelo ke ztrátě informace a ke zvýšení pravděpodobnosti decelerace aplikace v průběhu jejího života. 2. Empirické ověření Tato část je věnována empirickému ověření závislosti počtu prvků relace (počtu řádků v tabulkách) na rychlosti databázového systému jako hlavního faktoru decelerace aplikací. 2.1 Hypotéza Hlavní hypotézou je, že rychlost webové aplikace WordPress je pozitivně korelována s počtem záznamů v databázi databázového systému MySQL. Účinek tohoto vztahu byl zkoumán pomocí korelační analýzy. Test nulové hypotézy říká, že neexistuje žádný vztah mezi prediktorem (počet řádků) a vysvětlovanou proměnnou (doba odezvy aplikace). Nulová hypotéza pro test korelačního koeficientu je H0: ρ = 0, kde ρ je odhad vzorku korelačního koeficientu. H0: ρ Experimentální materiály Vybraná množina dat obsahuje informace o počtu řádků a rychlosti aplikace. Datový soubor se skládá z 60 záznamů, které byly naměřeny pomocí náhodně generovaných záznamů (od 0 do 50 tisíc) a uloženy v databázi. Pro testovaní byla použita open source webová aplikace Wordpress. Jedná se o volně šiřitelný publikační systém (v roce 2009 používalo Wordpress přibližně 7000 webových stránek v češtině). Wordpress používá pro ukládání dat databázový systém MySQL. Databázový systém MySQL je založen na SQL DBMS. [12] Výchozí podmínky testování: Aplikace Wordpress s výchozím nastavením a pluginem WPDB Profiling (pro měření doby odezvy SQL dotazů). Datové úložiště MyISAM v databázovém systému MySQL. Úprava aplikace o funkce (microtime) pro měření celkové rychlosti aplikace. Měřena byla rychlost úvodní stránky webové aplikace. Úvodní stránka obsahovala výpis článků. K tvorbě programových výstupů byl využit statistický software SAS 9.2, převážně možnosti modulu SAS BASE. SYSTÉMOVÁ INTEGRACE 4/

4 JanTyrychtr, Julie Poláčková, Ivana Švarcová 2.3 Experimentální výsledky Před realizací regresní a korelační analýzy byla provedena explorační analýza zkoumaného datového souboru. Popisné statistiky pro vysvětlující proměnnou, byly získány z procedury UNIVARIATE. Jednorozměrná analýza potvrdila, že se rozdělení analyzovaných proměnných na hladině významnosti α = 0,05 statisticky významně liší od rozdělení normálního. Korelační analýza byla proto provedena pomocí Spearmanova neparametrického koeficientu korelace Posouzení těsnosti závislosti Korelační analýza je použita pro zkoumání a popis vztahu dvou spojitých proměnných. Pro kvantifikaci míry asociace mezi proměnnými prediktoru a odezvy je použito Spearmanova korelačního koeficientu. Spearmanův korelační koeficient získáme pomocí procedury CORR: proc corr data=sasuser.aplikace spearman nosimple; Var pocet_zaznamu; With rychlost_aplikace; Run; Procedura č.1: CORR Vypočítaná p-hodnota, kdy p < 0,05, u Spearmanova koeficientu znamená, že na hladině významnosti α = 0,05 zamítáme nulovou hypotézu o nezávislosti proměnných a přijímáme hypotézu alternativní, která potvrzuje statisticky významnou závislost. Speaman Correlation Coefficients, N = 60 Prob > r under H0: Rho=0 dezva odezva pocet_radku <.0001 Tabulka č. 1: Výstup Corr precedury Hodnota Spearmanova koeficientu rs = 0,998 udává, že mezi proměnnými existuje silná pozitivní korelace. Kladná hodnota tohoto koeficientu naznačuje, že se jedná o pozitivní asociaci, tedy že s růstem počtu záznamů roste také čas rychlosti aplikace. Koeficient determinace (R2) udává, že změnu vysvětlované proměnné (doba odezvy aplikace) lze pomocí vysvětlující proměnné (počet záznamů) vysvětlit z 99,57 % Interpretace experimentu Výsledky potvrdily hypotézu - doba odezvy aplikace Wordpress je pozitivně asociována s počtem řádků v databázi databázového systému MySQL. Jedná se o potvrzení toho, že při zvyšování počtu záznamů v databázi databázového systému MySQL, dochází k deceleraci systému Wordpress. 54 SYSTÉMOVÁ INTEGRACE 4/2010

5 Akcentace a inovace konceptuálního modelu při vývoji databázových aplikací 2.4 Shrnutí experimentu Práce systému Wordpress s databázovým systémem MySQL je velmi neefektivní. Důvodem je, že SQL dotazy provádí plné prohledávání tabulek. Většině času strávené prohledáváním tabulek se lze vyhnout pomocí indexů na pole, která jsou součástí klauzule "WHERE" SQL dotazu. Důvodem neoptimalizovaných SQL dotazů je především to, že všechny části systému Wordpress jsou napsané lidmi (v rámci komunity open source systému Wordpress), kteří neví, jak správně optimalizovat a navrhnout databázové schéma a optimalizovat jej pro různé typy SQL dotazů. Proto je nutné při vývoji databází predikovat budoucí vytížení databáze (kolik bude v navrhované databázi záznamů po dobu její životnosti) a predikci zaznamenat do konceptuálního schématu. Zaznamenání metainformací o entitách umožňuje v dalších fázích optimalizovat návrh databáze. 3. Konceptuální návrh Vytvoření datového modelu je zapotřebí k tvorbě každého databázového systému. Datový model je množina konceptů, které lze použít k popisu struktury a operací na databázi. [10] Představuje výstup datového modelování (nebo konceptuálního návrhu), činnost, která má za cíl vytvořit konceptuální schéma v podobě diagramu a usnadnit komunikaci mezi vývojáři a uživateli. [10]. U většiny databázových řešení je datový model nutné postupně formulovat (obrázek č. 1), to znamená, nejdříve vymezit jeho strukturu obecně. K tomu je nutné využít konceptuální schéma, které využívá abstrakce objektů reálného světa. V současnosti je Entity-Relationship (ER) model nejdůležitějším paradigmatem pro konceptuální návrh databáze. [4] ER model pro konceptuální modelování dat byl představen Chenem [9] v roce Schéma diagramů bylo formalizováno Bachmanem v roce 1969 [2]. ER model může být použit jako základ pro sjednocení odlišných pohledů na data: síťový model, relační model, a model množin entit. [9] Pro grafickou reprezentaci ER modelu je používán ER diagram. Technika tvorby ER diagramů představuje grafický způsob zobrazování typů entit, typů vztahů a atributů. [6] Formální definice konceptu entit a množin je: SYSTÉMOVÁ INTEGRACE 4/

6 JanTyrychtr, Julie Poláčková, Ivana Švarcová Obrázek č. 3 zobrazuje ER diagram dvou entit. Typy entit EMP a PROJ jsou reprezentovány obdélníkem, typy vztahů jako WORK-FOR jsou reprezentovány kosočtvercem. Množina hodnot (doména) jako EMP#, NAME, a PHONE jsou reprezentovány kružnicí, zatímco atributy jsou mapovány z entit a vztahů na množinu hodnot. [6] Kardinalita vztahu mezi relacemi je v diagramu znázorněna u spojovací čáry, například "1" a "N". Obrázek č. 3: ER diagram [6] Inovace Entity-Relationship diagramu Vytvořením konceptuálního schématu pomocí ER diagramu a následném převodu na logické schéma, může být realizováno konkrétní fyzické schéma databáze. Tento postup však nepočítá s komunikačním šumem, tak jak bylo uvedeno v úvodu tzn. kdy mezi jednotlivými pracovníky (pracujícími na návrhu databáze a jeho modelu) dochází ke ztrátě popřípadě zkreslení informace. Dalším faktorem ovlivňujícím výslednou aplikaci je neakcentování důležitosti vlivu počtu záznamů uložených v databázi. Toto má za následek, že aplikace (využívající databázový systém), která je vytvořená podle požadavků zadavatele a splňuje stanovenou funkčnost, nemusí nutně splňovat účinnost takové aplikace. Především tehdy je-li měřena atributem dobou odezvy. Mezi další faktory ovlivňující účinnost relačních databází patří počet cizích klíčů. Počet cizích klíčů ve schématu relační databáze je solidním ukazatelem složitosti, délka referenčního stromu není relevantní sama o sobě, ale může modulovat účinek počtu cizích klíčů. [11] Všechny tyto faktory ovlivňují účinnost relační databáze a snižují účinnost celé aplikace. Již v konceptuální fázi je nutné tyto faktory do ER modelu zaznamenat. Obrázek č. 1 ilustruje grafickou reprezentaci ER modelu založenou na frameworku ER modelu [7]. ER diagram je založen na GERM. 56 SYSTÉMOVÁ INTEGRACE 4/2010

7 Akcentace a inovace konceptuálního modelu při vývoji databázových aplikací Obrázek č. 4: Atributy entit a vztahů [7]. Na základě empiricky ověřené závislosti počtu řádků v relačních tabulkách na době odezvy RDBMS (2. část) a výsledkům experimentu [11] je upraven ER diagram, tak aby vyhovoval procesu databázového návrhu s akcentací na kvalitu softwarových aplikací. Do ER diagramu (inovace ER diagramu je prezentována na příkladu z obrázku č. 4) je přidána množina entit, která se nazývá množinou upozornění (obrázek č. 5). Množina upozornění má dva atributy PROJ a PART. Tyto dva atributy představují v ER diagramu (obrázek č. 4) množinu entit PROJ a PART. V množině upozornění slouží tyto dva atributy pro zaznamenání vlastností typických pravě pro množinu entit PROJ a PART. Text připsaný u šipky, představuje hodnotu v příslušném atributu (tento způsob byl použit Chenem [8]). Obrázek č. 5: Množina upozornění Množina upozornění ESA (Entity Set - Alert) slouží pro zaznamenání předpokládaných charakteristik reálných objektů (entit), přístupem prostupujícím od konceptuálního datového modelu ke schématu databáze. ESA lze transformovat na logický datový model (obrázek č. 6). V ESA je přidán atribut NUMBER A. Tento atribut je nepovinný, slouží jako primární klíč, je však vhodné z důvodu budoucí indexace tabulky atribut do modelu zaznamenat. SYSTÉMOVÁ INTEGRACE 4/

8 JanTyrychtr, Julie Poláčková, Ivana Švarcová Obrázek č. 6: Množina upozornění - převod na logický datový model Tabulka č. 2 představuje výsledný převod ESA z logického datového modelu do relačního datového modelu. Sloupce PROJ a PART představují množiny entit z ER diagramu (obrázek č. 4). Sloupec NUMBER A je primárním klíčem tabulky. Při použití projekce v manipulačním jazyku (DML), je možné pro každý atribut zobrazit data, která byla zaznamenána již v konceptuálním návrhu datového modelu. V tomto případě nám například druhý sloupec poskytuje informace o entitě (v konceptuálním modelu), tabulce (v relačním modelu) PROJ. S tabulkou PROJ je předpokládaná větší frekvence práce (čtení, zápis nebo změna záznamů) a predikováno je, že do tabulky bude každý rok přidáno 2000 záznamů. NUMBER A (Primární PROJ PART klíč) 1 'Častý přístup k entitám.' 'Predikce: entit za rok.' 2 'Predikce: 2000 entit za rok.' Tabulka č. 2: Množina upozornění po převodu do tabulky Grafická podoba ESA tak jak byla zobrazena na obrázku č. 5 se stává v rozsáhlých konceptuálních modelech nepřehlednou. Proto je ESA možné transformovat na zjednodušený způsob znázornění (obrázek č. 7). Množina upozornění je graficky vyjádřena trojúhelníkem. Hodnoty atributů jsou napsány po stranách trojúhelníku. Názvy atributů jsou vyjádřeny v závorkách, které jsou připsány ke každé hodnotě. Obrázek č. 7: Množina upozornění - zjednodušený způsob znázornění Matematický aparát konceptu entit a vztahů zůstává zachován. Konceptuální datový model vyjádřený pomocí ER diagramu s množinou upozornění se nazývá Entity-Relationship Alert (ERA) model. 58 SYSTÉMOVÁ INTEGRACE 4/2010

9 Akcentace a inovace konceptuálního modelu při vývoji databázových aplikací 3.2 Přínosy ERA modelu Ověřením použití ERA modelu v praxi byly potvrzeny následující přínosy: 1. ERA model zaznamenává důležité metainformace o entitách, které by jinak pro členy vývojového týmu byly nedostupné nebo podléhaly zkreslení. 2. Model využívá pro svoji grafickou reprezentaci klasické prvky ER diagramu. Možné je použít symbol trojúhelníku pro grafickou reprezentaci množiny upozornění. 3. Model lze použít v odlišných typech databázových projektů. 4. Složitost modelu se zvyšuje minimálně. Model je snadno čitelný pro všechny členy vývojového týmu (za předpokladu, že ovládají modelování pomocí ER diagramů). Hlavním přínosem modelu ERA je efektivnější způsob tvorby databází, tak aby databáze byly optimalizované pro konkrétní typ použití na základě zaznamenání metainformací o entitách. 3.3 Případová studie použití Entity-Relationship Alert modelu Analýza požadavků Formulace požadavků Vytvořit internetovou aplikaci zabývající se prezentací nabídek práce tak, aby redaktoři mohli vytvářet, upravovat a zobrazovat příspěvky s možností online prezentováním uživatelům na webovém portálu. Smyslem je, aby práce všech uživatelů byla efektivnější. Koncept projektu Jedná se o webový portál, životnost je plánována na 10 let. Předpokládáno je, že denně bude přidáno 80 nabídek práce. Nabídky práce jsou napsány uživatelem v administračním rozhraní. Příspěvek je zařazen do kategorie. Každý příspěvek může mít komentář, který je přidáván registrovaným uživatelem Konceptuální schéma Slovník entit CATEGORY - kategorie příspěvku USER - registrovaný uživatel COMMENT - komentář příspěvku POST - příspěvek konkrétní nabídky práce SYSTÉMOVÁ INTEGRACE 4/

10 JanTyrychtr, Julie Poláčková, Ivana Švarcová ERA diagram 4. Shrnutí V příspěvku je posouzen statistický vliv vybraných faktorů (počet řádků v tabulce, doba odezvy zpracování SQL dotazů) na dobu odezvy systému Wordpress. Statistický vliv je testován na prostřednictvím SQL DBMS databázového systému MySQL. Hlavní zkoumanou hypotézou je, že rychlost systému Wordpress je pozitivně korelována s počtem řádků v databázi databázového systému MySQL. Účinek tohoto vztahu byl zkoumán pomocí korelační analýzy. Výsledky potvrdily, že rychlost je pozitivně asociována s počtem řádků v databázi. Na základě výsledků byl inovován ER model o množinu upozornění. Množina upozornění ESA (Entity Set - Alert) slouží pro zaznamenání předpokládaných charakteristik reálných objektů (entit), přístupem prostupujícím od konceptuálního datového modelu ke schématu databáze. ESA lze transformovat na logický datový model. Grafickou podobu ESA je možné transformovat na zjednodušený způsob znázornění. Množina upozornění je graficky vyjádřena trojúhelníkem. Hodnoty atributů jsou napsány po stranách trojúhelníku. Názvy atributů jsou vyjádřeny v závorkách, které jsou připsány ke každé hodnotě. Matematický aparát konceptu entit a vztahů zůstává zachován. Konceptuální datový model vyjádřený pomocí ER diagramu s množinou upozornění je nazván Entity-Relationship Alert model. 60 SYSTÉMOVÁ INTEGRACE 4/2010

11 Akcentace a inovace konceptuálního modelu při vývoji databázových aplikací 5. Náměty pro další výzkum Způsob akcentace neoptimalizovaných databází je ověřen na jediném typu aplikace. Autoři dosud model ERA neporovnávali z hlediska návaznosti mezi jednotlivými artefakty zapojenými do jakékoli fáze procesu vývoje databáze což bude předmětem dalšího výzkumu. Připravuje se porovnání modelu například s MEDEA. [13] Model ERA lze případně řešit z hlediska obohacení o asociační pravidla (AR-EER, [14]), Mesodata [15] apod. Rozšířením modelu ERA o výše uvedené náměty dostává aplikace tohoto modelu nový procesní a ekonomický rozměr, který zvyšuje její použitelnost v reálné praxi podniků. 6. Závěr V současnosti je konceptuální schéma nejčastěji znázorňováno prostřednictvím ER-modelu. Tento model a jeho notace byly publikovány Chenem v roce Od té doby vznikaly různé alternativní notace (Martinova notace, Bachmanova notace, IDEF1X, UML a další ) a modely - nejznámější je EER model (v současnosti velmi často používán). Smysl samotného konceptuálního návrhu se začal postupně přesouvat do pozadí a novým cílem tvůrců notací a modelů se stala schopnost zaznamenat co nejvíce různých typů vztahů, typů atributů, hierarchií a jejich vzájemnou korelaci (EER model, AER model a další). V článku [5] je navržen soubor metrik pro měření strukturálních vlastností ER diagramů pro předpověď vnější kvality modelu. Článek [1] poukazuje na to, že přítomnost vztahu hierarchie je hlavním zdrojem složitosti modelu. Všechny tyto poznatky jsou důvodem pro používání srozumitelných notací pro tvorbu konceptuálních modelů, bez přídavných prvků, které srozumitelnost modelu snižují. Autory byl představen inovovaný Chenův ER model (nazvaný ERA model). Tento model využívá klasickou "jednoduchou" Chenovu notaci, modifikovanou o množinu upozornění (ESA). ESA přidává do modelu důležitou informaci o entitách, která by jinak pro členy vývojového týmu byla nedostupná nebo podléhala zkreslení (vlastní představy o entitách). Výsledky statistických testů potvrdily, že doba odezvy systému Wordpress je pozitivně asociována s počtem řádků v databázi databázového systému MySQL. Jedná se o důležité potvrzení toho, že při vývoji databází v systému Wordpress je nutné predikovat budoucí vytížení databáze. To je nutné provádět tak, aby každý z členů vývojového týmu mohl provést kroky pro optimalizaci a správný návrh struktury a logiky konceptuálních, logických modelů a databází. Výrazně je proto akcentována potřeba zaznamenávat informace (mající na budoucí aplikaci vliv z hlediska decelerace celkové účinnosti databázového systému) do ER modelu. Navržená inovace konceptuálního modelu dat má za cíl zlepšit kvalitu vytvářených databázových projektů a to tak, aby nedocházelo ke komunikačnímu šumu v rámci přenosu informací mezi jednotlivými členy vývojového týmu. SYSTÉMOVÁ INTEGRACE 4/

12 JanTyrychtr, Julie Poláčková, Ivana Švarcová Tento příspěvek byl zpracován v rámci řešení IGA ČZU v Praze (reg. č ) Akcentace procesní orientace tvorby databázových struktur jako hlavního faktoru decelerace odezvy webových aplikací. Literatura [1] Artale, A., Calvanese, D., Kontchakov, R., Ryzhikov, V., Zakharyaschev, M.(2007) Reasoning over Extended ER Models, (2007) ER 2007, pp [2] Bachman, C. W. (1969) Data Structure Diagrams, Database 1, 2, pp [3] Chamberlin, D., (1981) A History and Evaluation of System R, Communications of the ACM, vol. 24, No.10, pp [4] Fahrner, C., Vossen, G.(1995) A survey of database design transformations based on the Entity-Relationship model, (1995) Data and Knowledge Engineering, 15 (3), pp [5] Genero, M., Poels, G., Piattini, M.(2007) Defining and validating metrics for assessing the understandability of entity-relationship diagrams, (2007) Elsevier, October [6] Chen, P. P., (2002) Entity-Relationship Modeling: Historical Events, Future Trends, and Lessons Learned in: Software Pioneers: Contributions to Software Engineering, Broy M. and Denert, E. (eds.), Springer-Verlag, Berlin, Lecturing Notes in Computer Sciences, June 2002, pp , ISBN# [7] Chen, P. P. (1983) A prelimary framework Entity-Relationship models, Entity-Relationship Approach to Systems Analysis and Design (North-Holland, 1983). [8] Chen, P. P.(1980) English sentence structures and Entity-Relationship diagrams, in: Chen, P.P. (ed.), Entity-Relationship Approach to Systems Analysis and Design (North-Holland, Amsterdam, June 1980). [9] Chen, P. P.(1976) The entity relationship model: toward a unified view of data, ACM Transactions on Database Systems, 1, 1 (March 1976),9-37. [10] Navathe, S.B., (1992) Evolution of data modeling for databases. Commun ACM 35(9): [11] Piattini, M., Calero, C., Genero, M.(2001) Table Oriented Metrics for Relational Databases, (2001) Software Quality Journal, 9 (2), pp [12] MySQL 5.5 Reference Manual [online]. Publikováno 2010 [cit ]. Dostupné z: < [13] Dominguez, E., Lloret, J., Rubio, A., Zapata, M. (2008) MeDEA: A database evolution architecture with traceability, Data & Knowledge Engineering 65, pp [14] Chen, G., Ren, M., Yan, P., Guo, X. (2007) Enriching the ER model based on discovered association rules, Information Sciences 177, pp [15] La-Ongsri, S., Roddick, J. Vries, D. (2008) Accommodating mesodata into conceptual modelling methodologies, Information and Software Technology, 50, pp SYSTÉMOVÁ INTEGRACE 4/2010

Modely datové. Další úrovní je logická úroveň Databázové modely Relační, Síťový, Hierarchický. Na fyzické úrovni se jedná o množinu souborů.

Modely datové. Další úrovní je logická úroveň Databázové modely Relační, Síťový, Hierarchický. Na fyzické úrovni se jedná o množinu souborů. Modely datové Existují různé úrovně pohledu na data. Nejvyšší úroveň je úroveň, která zachycuje pouze vztahy a struktury dat samotných. Konceptuální model - E-R model. Další úrovní je logická úroveň Databázové

Více

Ilustrační příklad odhadu LRM v SW Gretl

Ilustrační příklad odhadu LRM v SW Gretl Ilustrační příklad odhadu LRM v SW Gretl Podkladové údaje Korelační matice Odhad lineárního regresního modelu (LRM) Verifikace modelu PEF ČZU Praha Určeno pro posluchače předmětu Ekonometrie Needitovaná

Více

Analýza a modelování dat. Helena Palovská

Analýza a modelování dat. Helena Palovská Analýza a modelování dat Helena Palovská Analýza a modelování pro SW projekt Strukturovaný přístup Dynamická část (procesy, aktivity, funkce) Statická část (data) Objektově orientovaný přístup use case

Více

Databázové systémy úvod

Databázové systémy úvod Databázové systémy úvod Michal Valenta Katedra softwarového inženýrství FIT České vysoké učení technické v Praze c Michal Valenta, 2012 BI-DBS, ZS 2012/13 https://edux.fit.cvut.cz/courses/bi-dbs/ Michal

Více

Databázové systémy úvod

Databázové systémy úvod Databázové systémy úvod Michal Valenta Katedra softwarového inženýrství FIT České vysoké učení technické v Praze c Michal Valenta, 2011 BI-DBS, ZS 2011/12 https://edux.fit.cvut.cz/courses/bi-dbs/ Michal

Více

A5M33IZS Informační a znalostní systémy. O čem předmět bude? Úvod do problematiky databázových systémů

A5M33IZS Informační a znalostní systémy. O čem předmět bude? Úvod do problematiky databázových systémů A5M33IZS Informační a znalostní systémy O čem předmět bude? Úvod do problematiky databázových systémů Co se dozvíte? Návrh datových struktur (modelování relačních dat) Relační modelování úlohy z oblasti

Více

Kapitola 1: Úvod. Systém pro správu databáze (Database Management Systém DBMS) Účel databázových systémů

Kapitola 1: Úvod. Systém pro správu databáze (Database Management Systém DBMS) Účel databázových systémů - 1.1 - Kapitola 1: Úvod Účel databázových systémů Pohled na data Modely dat Jazyk pro definici dat (Data Definition Language; DDL) Jazyk pro manipulaci s daty (Data Manipulation Language; DML) Správa

Více

Statistická analýza jednorozměrných dat

Statistická analýza jednorozměrných dat Statistická analýza jednorozměrných dat Prof. RNDr. Milan Meloun, DrSc. Univerzita Pardubice, Pardubice 31.ledna 2011 Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem

Více

Modelování procesů s využitím MS Visio.

Modelování procesů s využitím MS Visio. Modelování procesů s využitím MS Visio jan.matula@autocont.cz Co je to modelování procesů? Kreslení unifikovaných či standardizovaných symbolů, tvarů a grafů, které graficky znázorňují hlavní, řídící nebo

Více

Obsah Úvod Kapitola 1 Než začneme Kapitola 2 Práce s hromadnými daty před analýzou

Obsah Úvod Kapitola 1 Než začneme Kapitola 2 Práce s hromadnými daty před analýzou Úvod.................................................................. 11 Kapitola 1 Než začneme.................................................................. 17 1.1 Logika kvantitativního výzkumu...........................................

Více

Obsah přednášky. Databázové systémy RDBMS. Fáze návrhu RDBMS. Coddových 12 pravidel. Coddových 12 pravidel

Obsah přednášky. Databázové systémy RDBMS. Fáze návrhu RDBMS. Coddových 12 pravidel. Coddových 12 pravidel Obsah přednášky Databázové systémy Konceptuální model databáze Codd a návrh relační databáze fáze návrhu pojem konceptuální model základní pojmy entity, relace, atributy, IO kardinalita, 2 historie: RDBMS

Více

Databázové systémy. Ing. Radek Holý

Databázové systémy. Ing. Radek Holý Databázové systémy Ing. Radek Holý holy@cvut.cz Literatura: Skripta: Jeřábek, Kaliková, Krčál, Krčálová, Kalika: Databázové systémy pro dopravní aplikace Vydavatelství ČVUT, 09/2010 Co je relační databáze?

Více

Hierarchický databázový model

Hierarchický databázový model 12. Základy relačních databází Když před desítkami let doktor E. F. Codd zavedl pojem relační databáze, pohlíželo se na tabulky jako na relace, se kterými se daly provádět různé operace. Z matematického

Více

Jiří Mašek BIVŠ V Pra r ha 20 2 08

Jiří Mašek BIVŠ V Pra r ha 20 2 08 Jiří Mašek BIVŠ Praha 2008 Procesvývoje IS Unifiedprocess(UP) Iterace vývoje Rysy CASE nástrojů Podpora metodických přístupů modelování Integrační mechanismy propojení modelů Podpora etap vývoje Generování

Více

Informační systémy 2008/2009. Radim Farana. Obsah. Obsah předmětu. Požadavky kreditového systému. Relační datový model, Architektury databází

Informační systémy 2008/2009. Radim Farana. Obsah. Obsah předmětu. Požadavky kreditového systému. Relační datový model, Architektury databází 1 Vysoká škola báňská Technická univerzita Ostrava Fakulta strojní, Katedra automatizační techniky a řízení 2008/2009 Radim Farana 1 Obsah Požadavky kreditového systému. Relační datový model, relace, atributy,

Více

TEORIE ZPRACOVÁNÍ DAT

TEORIE ZPRACOVÁNÍ DAT Vysoká škola báňská - Technická univerzita Ostrava Fakulta elektrotechniky a informatiky TEORIE ZPRACOVÁNÍ DAT pro kombinované a distanční studium Jana Šarmanová Ostrava 2003 Jana Šarmanová, 2003 Fakulta

Více

6 Objektově-orientovaný vývoj programového vybavení

6 Objektově-orientovaný vývoj programového vybavení 6 Objektově-orientovaný vývoj programového vybavení 6.1 Co značí objektově-orientovaný - organizace SW jako kolekce diskrétních objektů, které zahrnují jak data tak chování objekt: OMG: Objekt je věc (thing).

Více

SOU Valašské Klobouky. VY_32_INOVACE_3_20_IKT_Tvorba_webovych_stranek_Redakcni_systemy. Mgr. Radomír Soural. Zkvalitnění výuky prostřednictvím ICT

SOU Valašské Klobouky. VY_32_INOVACE_3_20_IKT_Tvorba_webovych_stranek_Redakcni_systemy. Mgr. Radomír Soural. Zkvalitnění výuky prostřednictvím ICT SOU Valašské Klobouky VY_32_INOVACE_3_20_IKT_Tvorba_webovych_stranek_Redakcni_systemy Mgr. Radomír Soural Zkvalitnění výuky prostřednictvím ICT Název a číslo projektu CZ.1.07/1.5.00/34.0459 Název školy

Více

Tomáš Karel LS 2012/2013

Tomáš Karel LS 2012/2013 Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není

Více

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Prostá regresní a korelační analýza 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Problematika závislosti V podstatě lze rozlišovat mezi závislostí nepodstatnou, čili náhodnou

Více

{ } ( 2) Příklad: Test nezávislosti kategoriálních znaků

{ } ( 2) Příklad: Test nezávislosti kategoriálních znaků Příklad: Test nezávislosti kategoriálních znaků Určete na hladině významnosti 5 % na základě dat zjištěných v rámci dotazníkového šetření ve Šluknově, zda existuje závislost mezi pohlavím respondenta a

Více

ROZDÍLY V NÁVRZÍCH RELAČNÍCH A OBJEKTOVÝCH DATABÁZÍ A JEJICH DŮSLEDKY PRO TRANSFORMACI MODELŮ

ROZDÍLY V NÁVRZÍCH RELAČNÍCH A OBJEKTOVÝCH DATABÁZÍ A JEJICH DŮSLEDKY PRO TRANSFORMACI MODELŮ ROZDÍLY V NÁVRZÍCH RELAČNÍCH A OBJEKTOVÝCH DATABÁZÍ A JEJICH DŮSLEDKY PRO TRANSFORMACI MODELŮ RELATIONAL AND OBJECT DATABASES DESIGN DIFFERENCES AND IT S IMPLICATIONS TO MODEL TRANSFORMATION Vít Holub

Více

různé typy přehledových studií integrativní typ snaha o zobecnění výsledků z množství studií

různé typy přehledových studií integrativní typ snaha o zobecnění výsledků z množství studií Meta-analýza přehledové studie, definice postup meta-analýzy statistické techniky ověření homogenity studií, agregace velikosti účinku, moderující proměnné, analýza citlivosti, publikační zkreslení přínosy

Více

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1 Logistická regrese Menu: QCExpert Regrese Logistická Modul Logistická regrese umožňuje analýzu dat, kdy odezva je binární, nebo frekvenční veličina vyjádřená hodnotami 0 nebo 1, případně poměry v intervalu

Více

Relace x vztah (relationship)

Relace x vztah (relationship) Relace x vztah (relationship) Peter Chen, Peter Pin-Shan (March 1976): "The Entity-Relationship Model Toward a Unified View of Data". ACM Transactions on Database Systems 1. E-R diagram v Chennově notaci

Více

Databázové modelování. Analýza Návrh konceptuálního schématu

Databázové modelování. Analýza Návrh konceptuálního schématu Databázové modelování Analýza Návrh konceptuálního schématu 1 Vytváření IS Analýza Návrh Implementace Testování Předání SW Jednotlivé fáze mezi sebou iterují 2 Proč modelovat/analyzovat? Standardizované

Více

Databázové systémy úvod

Databázové systémy úvod Databázové systémy úvod Michal Valenta Katedra softwarového inženýrství Fakulta informačních technologií České vysoké učení technické v Praze c Michal Valenta, 2016 BI-DBS, LS 2015/16 https://edux.fit.cvut.cz/courses/bi-dbs/

Více

You created this PDF from an application that is not licensed to print to novapdf printer (http://www.novapdf.com)

You created this PDF from an application that is not licensed to print to novapdf printer (http://www.novapdf.com) Závislost náhodných veličin Úvod Předchozí přednášky: - statistické charakteristiky jednoho výběrového nebo základního souboru - vztahy mezi výběrovým a základním souborem - vztahy statistických charakteristik

Více

Úvod do databázových systémů 6. cvičení

Úvod do databázových systémů 6. cvičení Vysoká škola báňská Technická univerzita Ostrava Fakulta elektrotechniky a informatiky Úvod do databázových systémů 6. cvičení Ing. Petr Lukáš petr.lukas@nativa.cz Ostrava, 2012 Modelování databází [1]

Více

Znalostní systém nad ontologií ve formátu Topic Maps

Znalostní systém nad ontologií ve formátu Topic Maps Znalostní systém nad ontologií ve formátu Topic Maps Ladislav Buřita, Petr Do ladislav.burita@unob.cz; petr.do@unob.cz Univerzita obrany, Fakulta vojenských technologií Kounicova 65, 662 10 Brno Abstrakt:

Více

Marketingová komunikace. 2. soustředění. Mgr. Pavel Vávra 9103@mail.vsfs.cz. Kombinované studium Skupina N9KMK1aPH/N9KMK1bPH (um1a1ph/um1b1ph)

Marketingová komunikace. 2. soustředění. Mgr. Pavel Vávra 9103@mail.vsfs.cz. Kombinované studium Skupina N9KMK1aPH/N9KMK1bPH (um1a1ph/um1b1ph) Marketingová komunikace Kombinované studium Skupina N9KMK1aPH/N9KMK1bPH (um1a1ph/um1b1ph) 2. soustředění Mgr. Pavel Vávra 9103@mail.vsfs.cz http://vavra.webzdarma.cz/home/index.htm Minulé soustředění úvod

Více

Databázové systémy. Doc.Ing.Miloš Koch,CSc. koch@fbm.vutbr.cz

Databázové systémy. Doc.Ing.Miloš Koch,CSc. koch@fbm.vutbr.cz Databázové systémy Doc.Ing.Miloš Koch,CSc. koch@fbm.vutbr.cz Vývoj databázových systémů Ukládání dat Aktualizace dat Vyhledávání dat Třídění dat Výpočty a agregace 60.-70. léta Program Komunikace Výpočty

Více

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Analýza dat pro Neurovědy RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Jaro 2014 Institut biostatistiky Janoušová, a analýz Dušek: Analýza dat pro neurovědy Blok 7 Jak hodnotit vztah spojitých proměnných

Více

TÉMATICKÝ OKRUH Softwarové inženýrství

TÉMATICKÝ OKRUH Softwarové inženýrství TÉMATICKÝ OKRUH Softwarové inženýrství Číslo otázky : 24. Otázka : Implementační fáze. Postupy při specifikaci organizace softwarových komponent pomocí UML. Mapování modelů na struktury programovacího

Více

Korelační a regresní analýza

Korelační a regresní analýza Korelační a regresní analýza Analýza závislosti v normálním rozdělení Pearsonův (výběrový) korelační koeficient: r = s XY s X s Y, kde s XY = 1 n (x n 1 i=0 i x )(y i y ), s X (s Y ) je výběrová směrodatná

Více

2. Modelovací jazyk UML 2.1 Struktura UML 2.1.1 Diagram tříd 2.1.1.1 Asociace 2.1.2 OCL. 3. Smalltalk 3.1 Jazyk 3.1.1 Pojmenování

2. Modelovací jazyk UML 2.1 Struktura UML 2.1.1 Diagram tříd 2.1.1.1 Asociace 2.1.2 OCL. 3. Smalltalk 3.1 Jazyk 3.1.1 Pojmenování 1. Teoretické základy modelování na počítačích 1.1 Lambda-kalkul 1.1.1 Formální zápis, beta-redukce, alfa-konverze 1.1.2 Lambda-výraz jako data 1.1.3 Příklad alfa-konverze 1.1.4 Eta-redukce 1.2 Základy

Více

Korelační a regresní analýza. 1. Pearsonův korelační koeficient 2. jednoduchá regresní analýza 3. vícenásobná regresní analýza

Korelační a regresní analýza. 1. Pearsonův korelační koeficient 2. jednoduchá regresní analýza 3. vícenásobná regresní analýza Korelační a regresní analýza 1. Pearsonův korelační koeficient 2. jednoduchá regresní analýza 3. vícenásobná regresní analýza Pearsonův korelační koeficient u intervalových a poměrových dat můžeme jako

Více

MÍRY ZÁVISLOSTI (KORELACE A REGRESE)

MÍRY ZÁVISLOSTI (KORELACE A REGRESE) zhanel@fsps.muni.cz MÍRY ZÁVISLOSTI (KORELACE A REGRESE) 2.5 MÍRY ZÁVISLOSTI 2.5.1 ZÁVISLOST PEVNÁ, VOLNÁ, STATISTICKÁ A KORELAČNÍ Jednorozměrné soubory - charakterizovány jednotlivými statistickými znaky

Více

TRANSFORMACE RELAČNÍHO DATOVÉHO MODELU NA OBJEKTOVÝ TRANSFORMATION OF RELATIONAL TO OBJECT DATA MODEL

TRANSFORMACE RELAČNÍHO DATOVÉHO MODELU NA OBJEKTOVÝ TRANSFORMATION OF RELATIONAL TO OBJECT DATA MODEL TRANSFORMACE RELAČNÍHO DATOVÉHO MODELU NA OBJEKTOVÝ TRANSFORMATION OF RELATIONAL TO OBJECT DATA MODEL Vít Holub Anotace Článek poskytne čtenáři základní přehled v datových modelech, ukáže výhody a nevýhody

Více

Korelace. Komentované řešení pomocí MS Excel

Korelace. Komentované řešení pomocí MS Excel Korelace Komentované řešení pomocí MS Excel Vstupní data Tabulka se vstupními daty je umístěna v oblasti A2:B84 (viz. obrázek) Prvotní představu o tvaru a síle závislosti docházky a počtu bodů nám poskytne

Více

Úvod do databází. Modelování v řízení. Ing. Petr Kalčev

Úvod do databází. Modelování v řízení. Ing. Petr Kalčev Úvod do databází Modelování v řízení Ing. Petr Kalčev Co je databáze? Množina záznamů a souborů, které jsou organizovány za určitým účelem. Jaké má mít přínosy? Rychlost Spolehlivost Přesnost Bezpečnost

Více

Marketingová komunikace. 2. a 3. soustředění. Mgr. Pavel Vávra 9103@mail.vsfs.cz. Kombinované studium Skupina N9KMK3PH (vm3aph)

Marketingová komunikace. 2. a 3. soustředění. Mgr. Pavel Vávra 9103@mail.vsfs.cz. Kombinované studium Skupina N9KMK3PH (vm3aph) Marketingová komunikace Kombinované studium Skupina N9KMK3PH (vm3aph) 2. a 3. soustředění Mgr. Pavel Vávra 9103@mail.vsfs.cz http://vavra.webzdarma.cz/home/index.htm Co nás čeká: 2. soustředění 16.1.2009

Více

Návrh ROLAP databáze v zemědělském podniku: Transformace ekonometrického modelu do konceptuálního modelu dat

Návrh ROLAP databáze v zemědělském podniku: Transformace ekonometrického modelu do konceptuálního modelu dat Návrh ROLAP databáze v zemědělském podniku: Transformace ekonometrického modelu do konceptuálního modelu dat Tyrychtr Jan 1, Buchtela David 2, Havlíček Zdeněk 3 Česká zemědělská univerzita, Provozně ekonomická

Více

Databázové systémy. Přednáška 1

Databázové systémy. Přednáška 1 Databázové systémy Přednáška 1 Vyučující Ing. Martin Šrotýř, Ph.D. K614 Místnost: K311 E-mail: srotyr@fd.cvut.cz Telefon: 2 2435 9532 Konzultační hodiny: Dle domluvy Databázové systémy 14DATS 3. semestr

Více

Klasické metodiky softwarového inženýrství I N G M A R T I N M O L H A N E C, C S C. Y 1 3 A N W

Klasické metodiky softwarového inženýrství I N G M A R T I N M O L H A N E C, C S C. Y 1 3 A N W Klasické metodiky softwarového inženýrství I N G M A R T I N M O L H A N E C, C S C. Y 1 3 A N W Osnova přednášky Co to je softwarové inženýrství Softwarový proces Metodika a metoda Evoluce softwarových

Více

Analýza a Návrh. Analýza

Analýza a Návrh. Analýza Analysis & Design Návrh nebo Design? Design = návrh Není vytváření použitelného uživatelského prostředí (pouze malinká podmnožina celého návrhu) Často takto omezeně chápáno studenty nedokáží si představit,

Více

Metody inventarizace a hodnocení biodiverzity stromové složky

Metody inventarizace a hodnocení biodiverzity stromové složky ČESKÁ ZEMĚDĚLSKÁ UNIVERZITA V PRAZE Fakulta lesnická a dřevařská Metody inventarizace a hodnocení biodiverzity stromové složky Methods for inventory and biodiversity evaluation of tree layer SBORNÍK ZE

Více

Obsah. Zpracoval:

Obsah. Zpracoval: Zpracoval: houzvjir@fel.cvut.cz 03. Modelem řízený vývoj. Doménový (business), konceptuální (analytický) a logický (návrhový) model. Vize projektu. (A7B36SIN) Obsah Modelem řízený vývoj... 2 Cíl MDD, proč

Více

Databázové systémy trocha teorie

Databázové systémy trocha teorie Databázové systémy trocha teorie Základní pojmy Historie vývoje zpracování dat: 50. Léta vše v programu nevýhody poměrně jasné Aplikace1 alg.1 Aplikace2 alg.2 typy1 data1 typy2 data2 vytvoření systémů

Více

KORELACE. Komentované řešení pomocí programu Statistica

KORELACE. Komentované řešení pomocí programu Statistica KORELACE Komentované řešení pomocí programu Statistica Vstupní data I Data umístěná v excelovském souboru překopírujeme do tabulky ve Statistice a pojmenujeme proměnné, viz prezentace k tématu Popisná

Více

PŘÍLOHA C Požadavky na Dokumentaci

PŘÍLOHA C Požadavky na Dokumentaci PŘÍLOHA C Požadavky na Dokumentaci Příloha C Požadavky na Dokumentaci Stránka 1 z 5 1. Obecné požadavky Dodavatel dokumentaci zpracuje a bude dokumentaci v celém rozsahu průběžně aktualizovat při každé

Více

Geografické informační systémy p. 1

Geografické informační systémy p. 1 Geografické informační systémy Slajdy pro předmět GIS Martin Hrubý hrubym @ fit.vutbr.cz Vysoké učení technické v Brně Fakulta informačních technologií, Božetěchova 2, 61266 Brno akademický rok 2004/05

Více

Kritéria hodnocení praktické maturitní zkoušky z databázových systémů

Kritéria hodnocení praktické maturitní zkoušky z databázových systémů Kritéria hodnocení praktické maturitní zkoušky z databázových systémů Otázka č. 1 Datový model 1. Správně navržený ERD model dle zadání max. 40 bodů teoretické znalosti konceptuálního modelování správné

Více

Tématické okruhy pro státní závěrečné zkoušky. bakalářské studium. studijní obor "Management jakosti"

Tématické okruhy pro státní závěrečné zkoušky. bakalářské studium. studijní obor Management jakosti Tématické okruhy pro státní závěrečné zkoušky bakalářské studium studijní obor "Management jakosti" školní rok 2010/2011 Management jakosti A 1. Pojem jakosti a význam managementu jakosti v současném období.

Více

Metadata. RNDr. Ondřej Zýka

Metadata. RNDr. Ondřej Zýka Metadata RNDr. Ondřej Zýka 1 Metadata Jedna z kompetencí Data managementu Cíle kompetence: Zajistit jednotné porozumění a užití termínů Provázat informace na různých úrovních (byznys, aplikační, technické)

Více

5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza

5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza 5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza 5.1 Vícerozměrná data a vícerozměrná rozdělení Při zpracování vícerozměrných dat se hledají souvislosti mezi dvěma, případně

Více

Tématické okruhy pro státní závěrečné zkoušky. bakalářské studium. studijní obor "Management jakosti"

Tématické okruhy pro státní závěrečné zkoušky. bakalářské studium. studijní obor Management jakosti Tématické okruhy pro státní závěrečné zkoušky bakalářské studium studijní obor "Management jakosti" školní rok 2009/2010 Management jakosti A 1. Pojem jakosti a význam managementu jakosti v současném období.

Více

Konceptuální datové modely používané při analýze

Konceptuální datové modely používané při analýze Konceptuální datové modely používané při analýze Abstraktní datové typy jako definice domén atributů ADT (Abstraktní datový typ) zapouzdření datového typu lidský mozek je schopen řešit úlohy jen do určité

Více

Olga Rudikova 2. ročník APIN

Olga Rudikova 2. ročník APIN Olga Rudikova 2. ročník APIN Redakční (publikační) systém neboli CMS - content management system (systém pro správu obsahu) je software zajišťující správu dokumentů, nejčastěji webového obsahu. (webová

Více

Databázové systémy BIK-DBS

Databázové systémy BIK-DBS Databázové systémy BIK-DBS Ing. Ivan Halaška katedra softwarového inženýrství ČVUT FIT Thákurova 9, m.č. T9:311 ivan.halaska@fit.cvut.cz Stránka předmětu: https://edux.fit.cvut.cz/courses/bi-dbs/parttime/start

Více

Obsah. Kapitola 1. Kapitola 2. Kapitola 3. Úvod 9

Obsah. Kapitola 1. Kapitola 2. Kapitola 3. Úvod 9 Obsah Úvod 9 Kapitola 1 Business Intelligence, datové sklady 11 Přechod od transakčních databází k analytickým..................... 13 Kvalita údajů pro analýzy................................................

Více

U Úvod do modelování a simulace systémů

U Úvod do modelování a simulace systémů U Úvod do modelování a simulace systémů Vyšetřování rozsáhlých soustav mnohdy nelze provádět analytickým výpočtem.často je nutné zkoumat chování zařízení v mezních situacích, do kterých se skutečné zařízení

Více

Inovace tohoto kurzu byla spolufinancována z Evropského sociálního fondu a státního rozpočtu České republiky.

Inovace tohoto kurzu byla spolufinancována z Evropského sociálního fondu a státního rozpočtu České republiky. Inovace tohoto kurzu byla spolufinancována z Evropského sociálního fondu a státního rozpočtu České republiky. Projekt ESF OP VK reg.č. CZ.1.07/2.2.00/28.0209 Elektronické opory a e-learning pro obory výpočtového

Více

Regresní a korelační analýza

Regresní a korelační analýza Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).

Více

Interakce úrovně vzdělání a faktoru nezaměstnanosti v hospodářsky slabých a silných obcích České republiky

Interakce úrovně vzdělání a faktoru nezaměstnanosti v hospodářsky slabých a silných obcích České republiky Interakce úrovně vzdělání a faktoru nezaměstnanosti v hospodářsky slabých a silných obcích České republiky Vladimíra Hovorková Valentová Iva Nedomlelová 17. 6. 2010 Cíl příspěvku provedení analýz a dalších

Více

INDUKTIVNÍ STATISTIKA

INDUKTIVNÍ STATISTIKA 10. SEMINÁŘ INDUKTIVNÍ STATISTIKA 3. HODNOCENÍ ZÁVISLOSTÍ HODNOCENÍ ZÁVISLOSTÍ KVALITATIVNÍ VELIČINY - Vychází se z kombinační (kontingenční) tabulky, která je výsledkem třídění druhého stupně KVANTITATIVNÍ

Více

(motto: An unsophisticated forecaster uses statistics as a drunken man uses lamp-posts - for support rather than for illumination.

(motto: An unsophisticated forecaster uses statistics as a drunken man uses lamp-posts - for support rather than for illumination. Neparametricke testy (motto: An unsophisticated forecaster uses statistics as a drunken man uses lamp-posts - for support rather than for illumination. Andrew Lang) 1. Příklad V následující tabulce jsou

Více

RNDr. Jakub Lokoč, Ph.D. RNDr. Michal Kopecký, Ph.D. Katedra softwarového inženýrství Matematicko-Fyzikální fakulta Univerzita Karlova v Praze

RNDr. Jakub Lokoč, Ph.D. RNDr. Michal Kopecký, Ph.D. Katedra softwarového inženýrství Matematicko-Fyzikální fakulta Univerzita Karlova v Praze RNDr. Jakub Lokoč, Ph.D. RNDr. Michal Kopecký, Ph.D. Katedra softwarového inženýrství Matematicko-Fyzikální fakulta Univerzita Karlova v Praze 1 Konceptuální modelování 2 Vytvořte model pro reprezentaci

Více

Tématické okruhy pro státní závěrečné zkoušky. bakalářské studium. studijní obor "Management jakosti"

Tématické okruhy pro státní závěrečné zkoušky. bakalářské studium. studijní obor Management jakosti Tématické okruhy pro státní závěrečné zkoušky bakalářské studium studijní obor "Management jakosti" školní rok 2013/2014 Management jakosti A 1. Pojem jakosti a význam managementu jakosti v současném období.

Více

Česká zemědělská univerzita v Praze. Provozně ekonomická fakulta. Katedra informačních technologií

Česká zemědělská univerzita v Praze. Provozně ekonomická fakulta. Katedra informačních technologií Česká zemědělská univerzita v Praze Provozně ekonomická fakulta Katedra informačních technologií Teze diplomové práce Analýza a návrh informačního systému Miloš Rajdl 2012 ČZU v Praze 1 Souhrn Diplomová

Více

Primární klíč (Primary Key - PK) Je právě jedna množina atributů patřící jednomu z kandidátů primárního klíče.

Primární klíč (Primary Key - PK) Je právě jedna množina atributů patřící jednomu z kandidátů primárního klíče. Primární a cizí klíč Kandidát primárního klíče (KPK) Je taková množina atributů, která splňuje podmínky: Unikátnosti Minimálnosti (neredukovatelnosti) Primární klíč (Primary Key - PK) Je právě jedna množina

Více

6. Lineární regresní modely

6. Lineární regresní modely 6. Lineární regresní modely 6.1 Jednoduchá regrese a validace 6.2 Testy hypotéz v lineární regresi 6.3 Kritika dat v regresním tripletu 6.4 Multikolinearita a polynomy 6.5 Kritika modelu v regresním tripletu

Více

Databáze 2013/2014. Konceptuální model DB. RNDr. David Hoksza, Ph.D.

Databáze 2013/2014. Konceptuální model DB. RNDr. David Hoksza, Ph.D. Databáze 2013/2014 Konceptuální model DB RNDr. David Hoksza, Ph.D. http://siret.cz/hoksza Osnova Organizace Stručný úvod do DB a DB modelování Konceptuální modelování Cvičení - ER modelování Náplň přednášky

Více

Databáze Bc. Veronika Tomsová

Databáze Bc. Veronika Tomsová Databáze Bc. Veronika Tomsová Databázové schéma Mapování konceptuálního modelu do (relačního) databázového schématu. 2/21 Fyzické ik schéma databáze Určuje č jakým způsobem ů jsou data v databázi ukládána

Více

04 - Databázové systémy

04 - Databázové systémy 04 - Databázové systémy Základní pojmy, principy, architektury Databáze (DB) je uspořádaná množina dat, se kterými můžeme dále pracovat. Správa databáze je realizována prostřednictvím Systému pro správu

Více

Statistika. Regresní a korelační analýza Úvod do problému. Roman Biskup

Statistika. Regresní a korelační analýza Úvod do problému. Roman Biskup Statistika Regresní a korelační analýza Úvod do problému Roman Biskup Jihočeská univerzita v Českých Budějovicích Ekonomická fakulta (Zemědělská fakulta) Katedra aplikované matematiky a informatiky 2008/2009

Více

Vznik a vývoj DDI. Struktura DDI. NESSTAR Systém pro publikování, prezentaci a analýzu dat. PhDr. Martin Vávra, Mgr. Tomáš Čížek

Vznik a vývoj DDI. Struktura DDI. NESSTAR Systém pro publikování, prezentaci a analýzu dat. PhDr. Martin Vávra, Mgr. Tomáš Čížek NESSTAR Systém pro publikování, prezentaci a analýzu dat PhDr. Martin Vávra, Mgr. Tomáš Čížek Vznik a vývoj DDI Potřeba standardizace popisu datových souborů v souvislosti s elektronickou archivací dat

Více

Znalostní báze pro obor organizace informací a znalostí

Znalostní báze pro obor organizace informací a znalostí Znalostní báze pro obor organizace informací a znalostí Představení projektu Programu aplikovaného výzkumu a vývoje národní a kulturní identity (NAKI) DF13P01OVV013 2013 2015 Helena Kučerová ÚISK FF UK

Více

MODELOVÁNÍ DAT V INFORMAČNÍCH SYSTÉMECH. Jindřich Kaluža Ludmila Kalužová

MODELOVÁNÍ DAT V INFORMAČNÍCH SYSTÉMECH. Jindřich Kaluža Ludmila Kalužová MODELOVÁNÍ DAT V INFORMAČNÍCH SYSTÉMECH Jindřich Kaluža Ludmila Kalužová Recenzenti: prof. Ing. Milan Turčáni, CSc. prof. Ing. Ivan Vrana, DrSc. Tato kniha vznikla za finanční podpory Studentské grantové

Více

DBS Konceptuální modelování

DBS Konceptuální modelování DBS Konceptuální modelování Michal Valenta Katedra softwarového inženýrství FIT České vysoké učení technické v Praze Michal.Valenta@fit.cvut.cz c Michal Valenta, 2010 BIVŠ DBS I, ZS 2010/11 https://users.fit.cvut.cz/

Více

Regresní a korelační analýza

Regresní a korelační analýza Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).

Více

1 Webový server, instalace PHP a MySQL 13

1 Webový server, instalace PHP a MySQL 13 Úvod 11 1 Webový server, instalace PHP a MySQL 13 Princip funkce webové aplikace 13 PHP 14 Principy tvorby a správy webového serveru a vývojářského počítače 14 Co je nezbytné k instalaci místního vývojářského

Více

Kurz je rozdělen do čtyř bloků, které je možné absolvovat i samostatně. Podmínkou pro vstup do kurzu je znalost problematiky kurzů předešlých.

Kurz je rozdělen do čtyř bloků, které je možné absolvovat i samostatně. Podmínkou pro vstup do kurzu je znalost problematiky kurzů předešlých. Soubor kurzů XHTML, CSS, PHP a MySQL Kurz je rozdělen do čtyř bloků, které je možné absolvovat i samostatně. Podmínkou pro vstup do kurzu je znalost problematiky kurzů předešlých. Jeden blok se skládá

Více

Úvod do databázových systémů

Úvod do databázových systémů Vysoká škola báňská Technická univerzita Ostrava Fakulta elektrotechniky a informatiky Úvod do databázových systémů Cvičení 8 Ing. Petr Lukáš petr.lukas@vsb.cz Ostrava, 2014 Opakování Entita Entitní typ

Více

Relační DB struktury sloužící k optimalizaci dotazů - indexy, clustery, indexem organizované tabulky

Relační DB struktury sloužící k optimalizaci dotazů - indexy, clustery, indexem organizované tabulky Otázka 20 A7B36DBS Zadání... 1 Slovníček pojmů... 1 Relační DB struktury sloužící k optimalizaci dotazů - indexy, clustery, indexem organizované tabulky... 1 Zadání Relační DB struktury sloužící k optimalizaci

Více

DATABÁZOVÉ SYSTÉMY. Metodický list č. 1

DATABÁZOVÉ SYSTÉMY. Metodický list č. 1 Metodický list č. 1 Cíl: Cílem předmětu je získat přehled o možnostech a principech databázového zpracování, získat v tomto směru znalosti potřebné pro informačního manažera. Databázové systémy, databázové

Více

8.2 Používání a tvorba databází

8.2 Používání a tvorba databází 8.2 Používání a tvorba databází Slide 1 8.2.1 Základní pojmy z oblasti relačních databází Slide 2 Databáze ~ Evidence lidí peněz věcí... výběry, výpisy, početní úkony Slide 3 Pojmy tabulka, pole, záznam

Více

Databáze. Logický model DB. David Hoksza

Databáze. Logický model DB. David Hoksza Databáze Logický model DB David Hoksza http://siret.cz/hoksza Osnova Relační model dat Převod konceptuálního schématu do logického Funkční závislosti Normalizace schématu Cvičení převod do relačního modelu

Více

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13 Příklad 1 Máme k dispozici výsledky prvního a druhého testu deseti sportovců. Na hladině významnosti 0,05 prověřte, zda jsou výsledky testů kladně korelované. 1.test : 7, 8, 10, 4, 14, 9, 6, 2, 13, 5 2.test

Více

Metody analýzy modelů. Radek Pelánek

Metody analýzy modelů. Radek Pelánek Metody analýzy modelů Radek Pelánek Fáze modelování 1 Formulace problému 2 Základní návrh modelu 3 Budování modelu 4 Verifikace a validace 5 Simulace a analýza 6 Sumarizace výsledků Simulace a analýza

Více

xrays optimalizační nástroj

xrays optimalizační nástroj xrays optimalizační nástroj Optimalizační nástroj xoptimizer je součástí webového spedičního systému a využívá mnoho z jeho stavebních bloků. xoptimizer lze nicméně provozovat i samostatně. Cílem tohoto

Více

Informační systémy 2006/2007

Informační systémy 2006/2007 13 Vysoká škola báňská Technická univerzita Ostrava Fakulta strojní, Katedra automatizační techniky a řízení Informační systémy 2006/2007 Ivan Kedroň 1 Obsah Analytické nástroje SQL serveru. OLAP analýza

Více

Obsah. Kapitola 1. Kapitola 2. Kapitola 3. Kapitola 4. Úvod 11. Stručný úvod do relačních databází 13. Platforma 10g 23

Obsah. Kapitola 1. Kapitola 2. Kapitola 3. Kapitola 4. Úvod 11. Stručný úvod do relačních databází 13. Platforma 10g 23 Stručný obsah 1. Stručný úvod do relačních databází 13 2. Platforma 10g 23 3. Instalace, první přihlášení, start a zastavení databázového serveru 33 4. Nástroje pro administraci a práci s daty 69 5. Úvod

Více

Smysl metodiky IS/IT. Koncentrovaná zkušenost Checklist na nic nezapomeneme

Smysl metodiky IS/IT. Koncentrovaná zkušenost Checklist na nic nezapomeneme Smysl metodiky IS/IT Koncentrovaná zkušenost Checklist na nic nezapomeneme Přínosy metodik Větší produktivita a kooperace týmů Komunikační standard Specializace projektových týmů Nezávislost na konkrétních

Více

Porovnání dvou výběrů

Porovnání dvou výběrů Porovnání dvou výběrů Menu: QCExpert Porovnání dvou výběrů Tento modul je určen pro podrobnou analýzu dvou datových souborů (výběrů). Modul poskytuje dva postupy analýzy: porovnání dvou nezávislých výběrů

Více

Jazyk UML - přehled. diagram hierarchie procesů. IS firmy. podpora řízení. evidence zaměstnanců. pokladny. výroba. diagram procesních vláken

Jazyk UML - přehled. diagram hierarchie procesů. IS firmy. podpora řízení. evidence zaměstnanců. pokladny. výroba. diagram procesních vláken Jazyk UML - přehled Unified Modeling Language jazyk pro popis objektově orientované analýzy a návrhu aplikací slouží k vzájemné komunikaci mezi zadavatelem a návrhářem systému má několik částí, není nutné

Více

PRODUKTY. Tovek Tools

PRODUKTY. Tovek Tools Analyst Pack je desktopovou aplikací určenou k vyhledávání informací, tvorbě různých typů analýz a vytváření přehledů a rešerší. Jsou vhodné pro práci i s velkým objemem textových dat z různorodých informačních

Více

Inovace výuky prostřednictvím ICT v SPŠ Zlín, CZ.1.07/1.5.00/34.0333 Vzdělávání v informačních a komunikačních technologií

Inovace výuky prostřednictvím ICT v SPŠ Zlín, CZ.1.07/1.5.00/34.0333 Vzdělávání v informačních a komunikačních technologií VY_32_INOVACE_33_02 Škola Název projektu, reg. č. Vzdělávací oblast Vzdělávací obor Tematický okruh Téma Tematická oblast Název Autor Vytvořeno, pro obor, ročník Anotace Přínos/cílové kompetence Střední

Více