Podíl zdrojů informací



Podobné dokumenty
Data v počítači EIS MIS TPS. Informační systémy 2. Spojení: jan.skrbek@tul.cz tel.: Konzultace: úterý

Objektově orientované databáze

Konzistence databáze v nekonzistentním světě

Národní mnohostranné fórum České republiky pro elektronickou fakturaci

Příloha č. 54. Specifikace hromadné aktualizace SMS-KLAS

Příloha č. 2 - Integrace SpiritÚAP do ESB Jihočeského kraje

Databázovéa informačnísystémy NÁVRH IMPLEMENTACE 2 KONZISTENCE DATABÁZE

Příloha č. 1 - Popis realizace sociální služby

Cvičení 1,2 Osnova studie strategie ICT

SPECIFIKACE ZADÁNÍ. 1. Identifikační údaje zadavatele. 2. Předmět veřejné zakázky malého rozsahu Základní údaje Oprávněné osoby zadavatele

téma: Formuláře v MS Access

Pravidla poskytování pečovatelské služby (PS) (pro zájemce a uživatele PS)

Operace nad celými tabulkami

MEZINÁRODNÍ AUDITORSKÝ STANDARD ISA 505 EXTERNÍ KONFIRMACE OBSAH

ROZKLIKÁVACÍ ROZPOČET - ONLINE ZVEŘEJŇOVÁNÍ EKONOMICKÝCH DAT ÚŘADU

Makroekonomie I. Přednáška 2. Ekonomický růst. Osnova přednášky: Shrnutí výpočtu výdajové metody HDP. Presentace výpočtu přidané hodnoty na příkladě

MV ČR, Odbor egovernmentu. Webové stránky veřejné správy - minimalizace jejich zranitelnosti a podpora bezpečnostních prvků

VI. Finanční gramotnost šablony klíčových aktivit

VÝBĚR DOČASNÝCH ZAMĚSTNANCŮ PRO GENERÁLNÍ ŘEDITELSTVÍ PRO LIDSKÉ ZDROJE A BEZPEČNOST

Právní a daňové aspekty vysílání pracovníků do zahraničí

Metodika testování navazujících evidencí

OBEC HORNÍ MĚSTO Spisový řád

Specialista pro vytvá řenívztahů Specialist for Creating Relations

KOMISE EVROPSKÝCH SPOLEČENSTVÍ

Ministerstvo vnitra České republiky vyhlašuje Výzvu k předkládání žádostí o finanční podporu v rámci. IOP Integrovaný operační program

Specifikace předmětu plnění veřejné zakázky: Poskytování mobilních hlasových a datových služeb pro potřeby Města Uherské Hradiště

I. Základní pojmy a zkratky. - provedení koordinační funkční zkoušky EPS a navazujících zařízení,

Upíše-li akcie osoba, jež jedná vlastním jménem, na účet společnosti, platí, že tato osoba upsala akcie na svůj účet.

Popis realizace poskytování sociální služby

INFORMAČNÍ SYSTÉM O AREÁLU

Budování aplikačních rozhraní pro obousměrnou komunikaci mezi ERMS a jejich vztah k Národnímu standardu pro komunikaci mezi ERMS.

Soubory a databáze. Soubor označuje množinu dat, která jsou kompletní k určitému zpracování a popisují vybrané vlastnosti reálných objektů

DOMOVNÍ ŘÁD BYTOVÉHO DRUŽSTVA ZÁZVORKOVA 2007, 2008, 2009

Řízení kalibrací provozních měřicích přístrojů

1 Indikátory pro monitoring a evaluaci

29 Evidence smluv. Popis modulu. Záložka Evidence smluv

Dobývání znalostí z databází. Databáze. datum jmeno prijmeni adresa_ulice adresa_mesto cislo_uctu platba zustatek

Pokyn D Sdělení Ministerstva financí k rozsahu dokumentace způsobu tvorby cen mezi spojenými osobami

Název veřejné zakázky: Sdružené služby dodávky zemního plynu pro Mikroregion Střední Haná na rok 2013

Vnitřní pravidla stanovená poskytovatelem pro poskytování služby denní stacionáře

VIRTUÁLNÍ SVAŘOVACÍ TRENAŽÉR. Corporate presentation 1/6/2014-1

Uživatelská dokumentace

PŘÍLOHA 1.6 SMLOUVY O PŘÍSTUPU K VEŘEJNÉ PEVNÉ KOMUNIKAČNÍ SÍTI LOGISTIKA KONCOVÝCH ZAŘÍZENÍ

KAPITOLA 6.3 POŽADAVKY NA KONSTRUKCI A ZKOUŠENÍ OBALŮ PRO INFEKČNÍ LÁTKY KATEGORIE A TŘÍDY 6.2

Tel/fax: IČO:

1 METODICKÉ POKYNY AD HOC MODUL 2007: Pracovní úrazy a zdravotní problémy související se zaměstnáním

Ministerstvo školství, mládeže a tělovýchovy

Hlavní účetní a daňové novinky roku 2016

Informačnígramotnost a informačnívýchova

STANDARD 3. JEDNÁNÍ SE ZÁJEMCEM (ŽADATELEM) O SOCIÁLNÍ SLUŽBU

UŽIVATELSKÁ PŘÍRUČKA REGISTR CHMELNIC NA EAGRI ZÁKLADNÍ POPIS FUNKCÍ A FORMULÁŘŮ. CCV, s. r. o.

Hodnotová analýza nového pákového pořadače zn. Leitz ve společnosti Esselte

13. Sítě WAN. Rozlehlé sítě WAN. Počítačové sítě I. 1 (6) KST/IPS1. Studijní cíl. Představíme rozlehlé sítě typu WAN. Doba nutná k nastudování

DODATEČNÉ INFORMACE K ZADÁVACÍM PODMÍNKÁM

SO 01 STAVEBNÍ ÚPRAVY A INTER.ŘEŠENÍ PŘEDPROSTORU,ŠATEN,UMÝVÁREN A WC PRO MUŽE A ŽENY V BUDOVĚ 25M BAZÉNU

Systém elektronického zpracování údajů o výzkumných projektech a jejich hodnocení v GA AV

Stanovy spolku. I. Úvodní ustanovení. 1.Název spolku : KLUB PŘÁTEL HISTORICKÝCH VOJENSKÝCH JEDNOTEK z.s.

51/2006 Sb. ze dne 17. února o podmínkách připojení k elektrizační soustavě

Bezdrátové připojení (pouze u vybraných modelů) Uživatelská příručka

Pravidla. používání Národního elektronického nástroje při realizaci zadávacích postupů prostřednictvím národního elektronického nástroje

Univerzita pro obchodní partnery InfoSphere Guardium. Jan Musil 2009 IBM Corporation

Datasheet Fujitsu Transportní brašny pro notebooky - univerzální Příslušenství

SMĚRNICE č. 11/2011 kterou se stanoví pravidla pro výkon služby Operačního střediska MP. Hlava I.

Zajištění provozní funkčnosti platebních automatů a měničů bankovek pro Fakultní nemocnici Královské Vinohrady. Zadavatel

č. A/0../10 Smlouva o poskytnutí sociální služby v Azylovém domě Samaritán

VÝZVA K PODÁNÍ NABÍDKY

Aplikace pro správu uživatelů

ODŮVODNĚNÍ VEŘEJNÉ ZAKÁZKY Dostavba splaškové kanalizace - Prostřední Bečva a Horní Bečva, zhotovitel, dle vyhlášky č. 232/2012 Sb.

S_5_Spisový a skartační řád

Metody hodnocení rizik

Městys Lomnice Nám. Palackého 32, Lomnice Druh sociální služby: Pečovatelská služba INFORMOVANOST O SOCIÁLNÍ SLUŽBĚ.

Spolupráce škol a orgánu sociálně-právní ochrany dětí

Vzdělávací program pro obchodní partnery společnosti ROCKWOOL průvodce školením

Definice, metody měření a výpočtu

Úvod do světa patentů pro studenty práv

Projekt: Inovace oboru Mechatronik pro Zlínský kraj Registrační číslo: CZ.1.07/1.1.08/

účetních informací státu při přenosu účetního záznamu,

GEOGRAFICKÉ INFORMAČNÍ SYSTÉMY CVIČENÍ 8

Zvyšování kvality výuky technických oborů

Příloha č. 13. Statistický metainformační systém - úvod

Tento projekt je spolufinancován z prostředků Evropského sociálního fondu a státního rozpočtu ČR. Výzva k podání nabídek

Seriál: Management projektů 7. rámcového programu

Memoria Mundi Series Bohemica z trezoru na Internet

-1- N á v r h ČÁST PRVNÍ OBECNÁ USTANOVENÍ. 1 Předmět úpravy

ZÁKLADNÍ POVINNOSTI DOPRAVCE I PRÁCI S DATY Z DIGITÁLNÍHO TACHOGRAFU

Průzkum veřejného mínění věcné hodnocení

Badatelský řád Archivu České televize v Praze

Česká Republika Státní oblastní archiv v Zámrsku Státní okresní archiv Rychnov nad Kněžnou, Kolowratská 862, Rychnov nad Kněžnou

Organizační řád Č.j.: Spisový znak Skartační znak

S t r á n k a 1 I N V E S T I C E D O R O Z V O J E V Z D Ě L Á V Á N Í

Studie proveditelnosti. Marketingová analýza trhu

Základní škola a Mateřská škola Kašava, okres Zlín, příspěvková organizace

Novela zákona o DPH a změny v programu Účtárna k

Informace o naší organizaci

DATOVÉ SCHRÁNKY. Seminární práce z předmětu Information and communication policy

Podrobná uživatelská příručka aplikace Sběr dat pro RIV

PODROBNÉ VYMEZENÍ PŘEDMĚTU VEŘEJNÉ ZAKÁZKY A TECHNICKÉ PODMÍNKY

Číslo veřejné zakázky (bude doplněno poskytovatelem dotace) 1 Název programu: Operační program Vzdělávání pro konkurenceschopnost

Registr UJO. Příručka pro uživatele. Institut biostatistiky a analýz. Lékařské a Přírodovědecké fakulty Masarykovy univerzity.

Transkript:

Podíl zdrojů informací 80% nestrukturovaných (10 -) 20 % strukturovaných 80% vnitřní informační zdroje 20% vnější informační zdroje

Současný stav Business Intelligence Procesy: dolování dat (Data Mining) OLAP (On-line Analytical Processing) reporting Úložiště dat: datové sklady (Data Warehouse) datová tržiště (Data Mart) BI 1.0

Business Intelligence z hlediska zdrojů převážně strukturované aktualizace zdrojových aplikací na základě konkrétních událostí, které nejsou příliš časté (jedná se tedy o nespojitou manipulaci s daty)

Požadavky a trendy BI ve struktuře zdrojů informací nestrukturované, semistrukturované dynamická data pro orientaci v organizaci/analýze zaměření na pravidla, jejich aktualizaci, řízení až k business procesům využití řízení pravidel v oblasti IS na podporu rozhodování Business Rules přístup

Nestrukturované a semistrukturované zdroje informací Požadavek vybudovat sklad dokumentů (Document Warehouse) Procesy vyhledání a dolování textu Propojení s BI 1.0

Dynamická data proudy dat, proudy událostí Charakteristika: Strukturovaná Odlišnosti proti datům v klasických databázích přicházejí neustále (on-line) mají obecně neomezenou velikost nelze předpokládat nic o pořadí dat, může být více proudů souběžně nelze je jednoduchým způsobem opětovně získat může se měnit jejich struktura (topologie)

Příklady data z bezpečnostních kamer, telefonní hovory, vývoj cen na burze, bankovní operace Požadavky na Business Intelligence dolování dat nad proudy dat modifikace klasicky používaných metod dolování dat jako jsou shlukování, analýza časových řad na základě stanovených hodnot klíčových indikátorů výkonu (KPI) a dosahovaných hodnot optimalizovat business procesy

Trendy BI Integrace jednotlivých částí do BI Začleňování dalších oblastí dat a jejich zpracování

Big data

Big data is generally defined as high volume, velocity and variety information assets that demand cost-effective, innovative forms of information processing for enhanced insight and decision making (Gartner, 2013)

Big data V charakteristiky Volume data s proměnlivým rozsahem - velikost od TB do PB a více Velocity jak rychle jsou data produkována a jak rychle musí být zpracována pro analýzu na požádání (př. proudy dat) Variability - různorodost dat; různé významy/kontexty spojené s množinou dat senzor, internet, sociální sítě Variety data v mnoha formátech/mediích strukturovaná, nestrukturovaná, semistrukturovaná,.. Veracity věrohodnost (spolehlivost, pravdivost) a predikabilita dat, která jsou ze své podstaty většinou nepřesná.

Big data Charakteristika Value hodnotná a cenná data pro byznys (vytváření sociální a ekonomické přidané hodnoty tzv. informační ekonomie) Visualization - vizuální reprezentace dat pro provádění rozhodnutí Volatility jak dlouho jsou data validní a jak dlouho by měla být uložena (kdy už data nejsou relevantní pro prováděnou analýzu)

Big Data Zdroje - velké kolekce dat v tradičních DW nebo databázích, - podniková data z velkých newebových společností, které pracují s internetovými transakcemi, - data z velkých webových společností poskytujících soc. sítě a média, - data z mobilních zařízení, - proudy dat generované vzdálenými senzory a dalším IT hardwarem, - datové archivy z e-science ( bioinformatika, astronomie ), - současný rozvoj Internetu věcí vede k velkému zatížení sítí a následnému zvýšení nároků na ukládání odpovídajících dat Problémy: složitost dat, rychlost jejich vzniku heterogenní kolekce dat, problém s integrací

Big Analytics z hlediska uživatele je nejdůležitější zpracování Big Dat mění informace ve znalosti pomocí kombinace stávajících a nových přístupů

Big Analytics zahrnuje interaktivní zpracování zpracování dat v klidu (data at rest) pro podporu rozhodování zpracování dat v pohybu (data in motion) v reálném čase obvykle pomocí systémůřízení proudů dat vždy je dimenze čas analytik nemůže data poté, co proud proběhl, znovu analyzovat hodnota analýzy (a často i dat) se snižuje s časem pokud je potřeba více průchodů proudu, údaje musí být vloženy do DW pro provedení dalších analýz nebo jsou uložena a zpracována např pomocí. NoSQL databáze..

Hadoop, NoSQL, NewSQL

NoSQL databáze = not only SQL v širším smyslu zahrnuje XML db., db. dokumentů, obj. db. vznik iniciovaly webové společnosti koncem 90.let x RDB jednodušší škálovatelnost, vyšší výkon různé datové modely

slabě konzistentní databáze nejsou realizovány vlastnosti ACID v plném rozsahu x RDB transakční zpracování založeno na vlastnostech ACID tj. silná konzistence CAP teorém zohledňuje požadavky potřebné při návrhu webových služeb C (consistency,konzistence) bez ohledu na zapsání dat, vždy bude zobrazena posledníé verze dat» Ve srovnání s konzistenci v ACID je menší A (availibility, dostupnost) každá operace obdržená nechybujícím uzlem musí vést k obdržení výsledku (nebo chyby). P (partitioning tolerance, odolnost vůči rozdělení sítě) do db. se může zapisovat, číst z ní i když jsou její části zcela nepřístupné

Nástroje NoSQL: NoSQL mají malou nebo žádnou podporu pro modelování dat (nevytvářen logický datový model), návrh databáze je spíš řízený dotazem, data nejsou omezena integritními omezeními, v různých aplikacích mají rozdílné chování, absence standardního dotazovacího jazyka, různá vyspělost nástrojů

NewSQL databáze efektivní škálování (jako NoSQL db) garance konzistence transakcí (viz RDBS) konzistence s SQL vhodnośt pro analýzu v reálném čase (přístup in-memory)

NewSQL databáze - jsou škálovatelné horizontálně, - rozdělení dat je transparentní, - poskytují záruku ACID, - interakce aplikací s databází je primárně pomocí SQL (včetně operace spojení), - pro řízení souběžného zpracování nepoužívají zámky, - poskytují vyšší výkon než tradiční systémy. NewSQL SŘBD poskytují podstatně vyšší výkon a škálovatelnost ve srovnání s tradičními SŘBD či Hadoop.

Vlastnosti ACID a transakce A = (atomicity) atomicita transakce transakce je jeden celek - musí proběhnout celá či vůbec ne C = (Consistency) konzistence transakce transformuje databázi z jednoho konzistentního stavu databáze do jiného konzistentního stavu I = (Isolation) nezávislost transakce transakce jsou nezávislé, dílčí efekty transakce nejsou viditelné jiným transakcím (nezávislost požaduje aby transakce měla vždy konzistentní databázi t.j. výsledky transakce viditelné pro ostatní transakce až pro potvrzení) D =(Durability) trvanlivost (perzistence) úspěšně ukončené transakce (potvrzené) jsou uloženy do databáze Údržba atomicity transakce se nazývá zotavení z chyb vlastnosti ACID jsou základním principem transakčního zpracování pozn. doplnit strukturu objektů i strukturu z članku 42/96 vlastnosti ACID