Informatika 2 Data v informačních systémech EIS MIS TPS strategické řízení taktické řízení operativní řízení a provozu Spojení: e-mail: jan.skrbek@tul.cz tel.: 48 535 2442 Konzultace: pondělí 10 30-11 30 17.5.2016 1 IN2-16-02
Dnešní info: Informatika 2 02 Uniklá hesla Výpalné IS2 Autentizace bankovních karet Odposlechy politiků 2
Dnešní info: Informatika 2 02 IS2 3
Dnešní info: Informatika 2 02 IS2 Hackeři se nabourali do sítě losangeleské nemocnice v pátek 5. února. Do systému se zřejmě dostali přes e-mail a síť zaplavili škodlivým počítačovým programem ransomware, který uložená data zašifrovává a který znepřístupní uživatelům počítač či dokumenty. Pro obnovení přístupu vyžaduje zaplacení určité finanční částky. Program se nazývá podle anglického slova ransom - výkupné. 4
Dnešní info: Informatika 2 02 Výpalné IS2 5
Data v počítači Data strukturovaná Základní typy (dělení z důvodu rozlišení povolených a nepovolených manipulací a hodnot): textová (řetězce znaků) číselná čísla reálná, racionální datum, čas logická splnění podmínek, existence či neexistence vlastností objektu kategorie hodnota vlastností vybraná ze škály (často číselníky, umožňující zaznamenání hodnoty pouze kódem) Strukturováním je vytvářena taková organizace dat, která umožňuje efektivně zpracovat a vyhledat údaje podle potřeby. Strukturovaná data vytvářejí vyhledávací klíče. Klíče, jež jednoznačně identifikující datový záznam, jsou nazývány primární klíče (někdy též identifikační klíče). 17.5.2016 6
Data v počítači Data strukturovaná představují údaje o něčem jméno, příjmení, adresa, rodné číslo, telefonní číslo, věk, váha, cena, datum, počet bodů, kategorie, průměrná známka, počet kusů, počet stran,... operace aneb co s daty mohu dělat: sčítání, zaokrouhlení, násobení připojení (jméno + příjmení), zkrácení, řazení den v týdnu, negace, jsou charakterizována datovým typem číslo textový údaj datum a čas logický údaj (ano/ne) kódovaná data různá vyjádření čísel - např. 324H 101000100 - binárně text, písmena - různé kódové standardy (tabulky) datum a čas - převod na jediné číslo logická hodnota - 1 bit kategorie - číselníky 17.5.2016 7
Data nestrukturovaná Data typu: volný text audio video grafika multimédia Data v počítači Jsou datově bohatší, než strohé strukturované údaje Problém: podle nestrukturovaných dat lze obtížněji vyhledávat Používané řešení - nestrukturová data bývají doplněna daty strukturovanými Přibližné objemy dat Stránka textu ASCII 1800 B Stránka textu - Word Vektorová grafika A4 Bitmapový obraz A4 jpg Záznam 1 minuty zvuku Záznam 90 minut obrazu 50 kb 30 kb 5 MB 10 MB 3 GB 17.5.2016 8
Souborový a databázový přístup Datová základna - samostatná část informačního systému (IS) měla by co nejlépe obstát při změnách v IS návrh datové základny - pohled na to, co datová základna obsahuje - odpovídá pohledu na skutečnost, ve které se odehrává činnost podniku nebo organizace. Základní pojmy databázových struktur: záznam (record) - množina údajů v datové základně, které se týkají jednoho reálného objektu (věci, jevu, osoby, děje - např. záznam o konkrétním druhu zboží), atribut - zaznamenaná vlastnost reálného objektu - např. název zboží, jeho váha, rozměry, barva, materiál, datum výroby, trvanlivost, 17.5.2016 9
Historicky první aplikace ukládá svá data do jednoho či několika datových souborů Soubor obsahuje záznamy o jednom typu objektů ve formě datových vět Hodnoty atributů v jednom záznamu se nazývají položky Omezení Souborový a databázový přístup Souborový přístup každá aplikace si udržuje svá data problémové využívání týchž dat pro různé aplikace (např. adresa bydliště nutnost opakovaných změn dat v řadě souborů při přestěhování) přístup je koncipován pro jednoúkolové zpracování (při zpracování několik úloh současně mají různé aplikace potíže) 17.5.2016 10
Souborový a databázový přístup Souborový přístup Organizace vět v souboru položky tvoří strukturu záznamu (v aplikačním programu) záznamy se ukládají jako věty do souboru Hodnoty atributů v jednom záznamu se nazývají položky Omezení souborového přístupu koncipován pro jednoúkolové zpracování těsná vazba struktury dat na aplikační program 17.5.2016 11
Základní pojmy pro zpracování dat Entita - každý objekt, jev, událost a pod., který je pro nás ve vymezeném systému z nějakého důvodu významný a který označujeme vhodným jménem Typ entity - vymezuje množinu objektů stejného typu, charakterizovaných názvem typu a popsaných pomocí jejich vlastností atributů Výskyt entity individuum, jeden objekt z typu entity Atribut významná vlastnost či souhrn významných vlastností typu entity Doména množina hodnot, kterých může atribut nabývat Primární klíč - slouží k vzájemnému rozlišení výskytů entit stejného typu Příklad: Typ entity - "student TU Liberec" Atributy - např. jméno, datum narození, číslo indexu, studijní obor, ročník, číslo OP, výška, znalost cizích jazyků, r.č., Výskyt entity - každý ze studentů TU Liberec Primární klíč - číslo OP nebo číslo indexu 17.5.2016 12
Základní pojmy pro zpracování dat datová věta - je datovým obrazem jednoho výskytu entity, obsahuje primární klíč datová položka - zobrazuje, resp. vyjadřuje hodnotu jednoho z atributů PK hodnota A1 hodnota A2 hodnota A3... primární klíč jednotlivé datové položky datový soubor - datový obraz všech výskytů entit stejného typu datová základna - souhrn datových souborů v systému (ve většině informačních systémů je datově zobrazeno více typů entit) vlastní data - konkrétní udávané hodnoty jednotlivých atributů 17.5.2016 13
Souborový a databázový přístup Databázový přístup Základní princip Koncepce oddělení dat od aplikací a svěření jejich správy do databáze Databáze spravuje a řídí datovou základnu Jednotlivé aplikace, pokud chtějí nějaká data uložit nebo přečíst, žádají o tuto službu databázi 17.5.2016 14
Souborový a databázový přístup Databázový přístup Databáze Aplikace 1 Data Aplikace 3 Aplikace 2 17.5.2016 15
Databázový přístup Požadavky na databázový systém: Souborový a databázový přístup sdílení dat - odstranění redundance a paralelní přístup Každý údaj je v databázi pouze jedenkrát a mohou k němu přistupovat různé aplikace; různé aplikace obecně mohou do databáze přistupovat paralelně (zároveň) nezávislost aplikací na změnách ve fyzickém uložení dat, abstraktní pohled na data, možnost definice datových typů, centrální popis dat Fyzické uložení dat spravuje systém řízení báze dat (SŘBD) - pro přístup k datům nabízí aplikacím a uživatelům nástroje, s jejichž pomocí mohou vyjádřit, jaká data požadují. ochrana dat před neoprávněným přístupem a poškozením Různí uživatelé mají různá přístupová práva do databáze; databáze má být schopna ochránit data i před výpadky elektřiny, poruchami různých zařízení apod. 17.5.2016 16
Souborový a databázový přístup Database Management System (DBMS) Informační systém SŘBD DB DBS DBS = SŘBD + DB SŘBD - umožňuje definovat a udržovat data v databázi mimo programy, které tato data využívají 17.5.2016 17
Souborový a databázový přístup Databázový přístup Požadavky na databázový systém: kontrola konzistence dat Databáze má být schopna zajistit dodržování určených pravidel (tzv. integritních omezení) a zabezpečit data před případnými nehodami, které mohou vzniknout v průběhu transakcí Transakce je posloupnost manipulací s daty, která musí proběhnout celá, aby data byla uložena "správně". Např. převod z jednoho účtu na jiný účet v bance musí proběhnout jako odpovídající změny na obou účtech. spolehlivost dat - integrity zajištění integrity, konzistence databáze - security autorizace, ochrana před neoprávněným přístupem 17.5.2016 18
Databázový přístup Požadavky na databázový systém: perzistence dat Souborový a databázový přístup - přetrvání dat po ukončení procesu, který s nimi pracuje - možnost znovupoužití dat v dalších procesech paralelní přístup sdílení dat - častý přístup více uživatelů ve stejnou dobu - aktualizace menšího objemu dat - požadavky na transakční zpracování neredundance - neopakování dat (prvků dat) nezávislost - programy přistupující k datům nejsou závislé na datových úložištích 17.5.2016 19
Souborový a databázový přístup Správa dat - etapy vývoje Souborový (agendový) přístup Databázový (systémový) přístup UŽIVATEL UŽIVATEL UŽIVATEL UŽIVATEL APLIKACE APLIKAČNÍ PROGRAMY SOUBOR DAT SŘBD BÁZE DAT F 17.5.2016 20
Souborový a databázový přístup Databázový přístup Velké relační databázové systémy - firmy ORACLE, IDB2 (IBM), Progress, SYBASE - nákladné Menší (cenově dostupnější) databázové systémy - MS Access, Paradox, F ("malé" databázové systémy - dostupné zcela zdarma, př. MySQL) jazyk SQL - standard, umožňující využívání datových zdrojů spravovaných různými databázovými systémy Tvorba datové základny IS organizace - složitá záležitost, vyžadující péči lidí s různým odborným zaměřením. Při návrhu konceptuálního schématu datové základny se rozhoduje o tom, co v datové základně bude 17.5.2016 21
Návrh strukturované datové základny Realita, jejímž odrazem má být navrhovaná datová základna, se skládá z různých objektů neboli entit Mezi sledovanými entitami mohou existovat různé vztahy Vztah mezi entitami stejného typu rekurzivní vztah Kardinalita vztahu - symbolické označení 1:1, 1:n nebo m:n 1:1 pedagog A má manželku B 1:n pedagog A přednáší studentům CCC m:n studenti CCC navštěvují přednášky pedagogů DDD 17.5.2016 23
Návrh strukturované datové základny Integritní omezení datové základny veškerá pravidla, vymezující přípustné hodnoty (a kombinace hodnot) atributů přípustné hodnoty, formát zobrazení Relační model dat předpokládá existenci jednohodnotových atributů představa zobrazení formou relační tabulky, ve které odpovídá pojmu n-tice řádek a pojmu atribut sloupec 17.5.2016 24
Návrh strukturované datové základny Relační databáze všechna data mají tvar jedné nebo více tabulek s pojmenovanými sloupci každý sloupec obsahuje data z jedné domény (tj. jednoho datového typu) prvky jednotlivých sloupců (jimž je dáno jméno a typ) se nazývají obvykle položky nebo pole a pojem řádek splývá s pojmem záznam (věta) Relacemi ve smyslu relačního modelu dat se obecně popisují jak entity, tak vztahy mezi nimi. 17.5.2016 26
Datové sklady Datový sklad (anglicky Data Warehouse, případně DWH) je zvláštní typ relační databáze, která umožňuje řešit úlohy zaměřené převážně na analytické dotazování nad rozsáhlými soubory dat. poskytuje přehledný přístup k datům celé organizace poskytování souhrnů tj. statistik, přehledů vývoje, porovnání analytické pohledy na sumární skutečnosti různých dimenzí Odlišnosti od relační databáze Nízká proměnlivost - Data jsou do datového skladu obvykle nahrávána ve větších dávkách (například v denních nebo týdenních intervalech) a pak již nejsou nijak modifikována. Historizace - Data jsou v datovém skladu obvykle udržována v historické podobě, nikoliv pouze v aktuálním stavu. To je dáno nutností provádění analýz zaměřených na vývoj v čase. 17.5.2016 27