Získávání znalostí z dat

Rozměr: px
Začít zobrazení ze stránky:

Download "Získávání znalostí z dat"

Transkript

1 Získávání znalostí z dat Informační a komunikační technologie ve zdravotnictví

2 Získávání znalostí z dat Definice: proces netriviálního získávání implicitní, dříve neznámé a potencionálně užitečné informace z dat. Cíl: částečná automatizace procesu získání zajímavých vzorů chování z reálných dat: tvorba jejich modelů - např. pomocí nástrojů strojového učení Nové slibné odvětví SW průmyslu, jehož cílem je využít existující data pro zlepšení rozhodovacích procesů

3 Získávání znalostí z dat (ZZD)

4 ZZD - Příklady aplikací Segmentace a klasifikace klientů banky (např. rozpoznání problémových nebo naopak vysoce bonitních klientů). Predikce vývoje kursů akcií. Analýza důvodů změny poskytovatele nějakých služeb (internet, mobilní telefony). Segmentace a klasifikace klientů pojišťovny. Analýza nákupního košíku (Market Basket Analysis). Predikce spotřeby elektrické energie, plynu, Analýza příčin poruch v telekomunikačních sítích. Rozbor databáze pacientů v nemocnici. Charakterizace karcinogenních látek. Mapování lidského genomu. Veřejné mínění a sčítání lidu.

5 ZZD - Terminologie Koncept oblast zájmu co chceme předpověď počasí Objekt (třída) obecný (abstraktní) prvek konceptu den předpovědi počasí Atributy jednotlivé vlastnosti objektu teplota, tlak, množství srážek Instance Kokrétní případ objektu - jednotlivá data data o počasí jednoho konkrétního dne

6 ZZD - Typy atributů Nominální 2 hodnoty - muž/žena => binární více hodnot barva (červená, modrá, zelená) Binární boolean (True/False) Ordinální celá čísla, reálná čísla jakou přesnost dají se řadit Kategoriální nabývají diskrétních hodnot, avšak nelze je řadit Řady veličin, které pravidelně měřeny zaznamenávány vždy vztaženy k jediné monotónní veličině, která slouží jako index

7 ZZD - Typy úloh Klasifikace přiřazení třídy objektu Predikce předpověď chování objektu v čase Asociace hledání vazeb mezi objekty Shluková analýza seskupování podobných objektů

8 Klasifikace / Predikce Cílem je nalézt znalosti použitelné pro klasifikaci nových případů Požadujeme, aby získané znalosti co nejlépe odpovídaly danému konceptu Dáváme přednost přesnosti pokrytí na úkor jednoduchosti - připouštíme větší množství méně srozumitelných dílčích znalostí. Rozdíl mezi klasifikací a predikcí spočívá v roli času Predikce = ze starších hodnot nějaké veličiny se pokoušíme odhadnout její vývoj v budoucnosti.

9 Asociace / Shluková analýza Asociace žádný atribut (sloupec tabulky) není vyčleněn jako cíl klasifikace asociace je proces hledaní všech zajímavých vztahů (implikace, ekvivalence) mezi hodnotami různých atributů. Jednoduchá (pravděpodobnostní) tvrzení o spoluvýskytu událostí v datech Shluková analýza vícerozměrná statistická metoda, která se používá ke klasifikaci objektů slouží k třídění jednotek do skupin (shluků) tak, aby si jednotky náležící do stejné skupiny byly podobnější než objekty ze skupin různých

10 ZZD - Typy úloh detekce odchylek highlighting predikce klasifikace regrese asociační pravidla shlukování modelování závislostí modelování kauzalit sumarizace deskripce vztahy v databázích SQO pravidla

11 Metodiky ZZD Metodika SEMMA Podle metodologie SEMMA spočívá proces dobývání v těchto krocích: Sample - vybírání vhodných objektů Explore - vizuální explorace a redukce dat Modify - seskupování objektů a hodnot atributů, datové transformace Model - analýza dat Assess - porovnání modelů a interpretace Metodika 5A Assess - posouzení potřeb projektu Access - shromáždění potřebných dat Analyze - provedení analýz Act - přeměna znalostí na akční znalosti Automate - převedení výsledků analýzy do praxe

12 Metodika CRISP-DM CRISP-DM (CRoss-Industry Standard Process for DataMining) Vznikla vrámci výzkumného projektu Evropské komise. Cílem projektu je navrhnout univerzální postup použitelný v nejrůznějších aplikacích. Na projektu spolupracují firmy NCR (přední dodavatel datových skladů) DaimlerChrysler Integral Solutions (tvůrce systému Clementine) OHRA (velká holandská pojišťovna).

13 Metodika CRISP-DM CRISP-DM (CRoss-Industry Standard Process for DataMining) 1. Zadání 2. Porozumění datům 3. Příprava dat 5. Vyhodnocení 4. Modelování 6. Použití

14 Zadání / porozumění cílům Pochopení cílů úlohy Co klient chce Manažerský náhled, např. Primární cíl: Udržet si současné zákazníky pomocí predikce okamžiku, kdy jsou nakloněni přejít ke konkurenci Související cíl: Budou nižší poplatky pro výběr z automatu signifikantně sníží počet bonitních klientů, kteří odejdou? Hodnocení situace Seznam zdrojů (personál, data) Požadavky (srozumitelnost, přesnost) Omezení (bezpečnostní otázky, anonimizace) Terminologie Analýza náklady / přínos

15 Zadání / porozumění cílům Vymezení cílů ZZD Příklad odlišnosti terminologií Cíl obchodníka: Rozšířit katalog prodeje pro existující zákazníky. Cíl informatika: Predikovat jak mnoho věcí bude zákazník kupovat z jeho nákupů za poslední tři měsíce, demografických informací (věk, město, plat, atd.) a ceny nabízené věci. Vytvoření projektového plánu Období provádění projektu společně s dobou trvání, požadavky na zdroje, vstupy, výstupy a závislostmi. Výběr možných nástrojů pro řešení

16 Porozumění datům Shromáždění dat Počáteční předzpracování dat Popis dat Formát dat Množství Prozkoumání dat Descriptivní charakteristiky dat Rozložení klíčových atributů, jednoduché statistiky, Jednoduché vztahy mezi atributy, významné podskupiny, odlehlé hodnoty (outliers). Použití vizualizačních technik Ověření dat Jsou kompletní (popisují celou oblast) Složitost formy uložení dat Šum, chybějící a špatné údaje

17 Problém reálných dat Data nejsou sbírána jako zdroj trénovacích příkladů, ale především kvůli podnikové dokumentaci a archivaci. Z tohoto hlediska bývá sběr i uložení optimalizováno. Data obsahují špatné údaje způsobené chybami měřicích přístrojů i lidské obsluhy. Nevyplněné údaje. U některých atributů se stává, že vyplnění údaje je skoro výjimkou mluvíme pak o řídce (sparse) obsazených atributech. Data jsou popsána pomocí příliš mnoha atributů není zřejmé, které z nich jsou pro řešení zvolené úlohy relevantní. Úspěch modelování závisí na volbě vhodné množiny atributů. Data mají formu složitého relačního schématu, nikoliv jediné tabulky předpokládané atributovými metodami strojového učení.

18 Úkoly předzpracování dat Množina vlastností (atributů nebo příznaků) Bohatost dat (počet dimenzí) má zásadní vliv i pro úspěch použití technik strojového učení. S dimenzí exponenciálně rostou i nároky na počet trénovacích příkladů. Příprava dat pro modelování Čištění dat Normalizace dat Převod typů dat, formátování a kódování Transformace dat do jedné tabulky Úpravy dimenze

19 Předzpracování dat Zpráva o stavu proměnných typ (spojitá X diskrétní) rozsah definičního oboru (počet hodnot) rozsah a frekvence výskytů (histogram) typ rozdělení a jeho statistické charakteristiky osamělé mimořádné hodnoty (outliers) téměř konstantní atributy (možné vynechat) nevyplněná datová pole znečištění dat data neodpovídají deklarovanému formátu hodnoty neodpovídají deklarované množině

20 Předzpracování dat Čištění dat (chybějící a špatné údaje) Nedělat nic některým algoritmům chybějící hodnoty nevadí Ignorovat celou instanci ideální pro data s minimem chybějících hodnot pozor u časových řad na porušení vzorkování Náhrada nejčetnější hodnotou průměrem, mediánem nalezení nejbližšího souseda využití algoritmu pro modelování Náhrada hodnotou nevím

21 Předzpracování dat Čištění dat (čištění signálů) Korekce resp. odstranění šumu - tento proces se nazývá filtrace. Většinou velmi podstatné pro získání příznaků ze signálu Ignorování šumu Čištění dat (monotónní atributy) Představují obvykle jednoznačnou identifikaci pro uvažované objekty, např. pořadové číslo měření, číslo bankovního účtu. Rostou bez omezení a při tom jejich přímá hodnota jako taková nemá pro vytvoření modelu význam.

22 Předzpracování dat Normalizace dat Převod numerických hodnot do intervalu <0,1> a i vi - Avg ( vi ) vi min( vi ) = nebo ai = StDev( v ) max( v ) min( v ) i i i Úprava rozsahu hodnot atributů pomocí logistické transformace g(x) x a = 0, b = 1 a = 0, b = 2 a = 0, b = 4

23 Převod formátování a kódování Datum volba přesnosti např. roky, měsíce, dny, hodin, reprezentace reálným číslem Nominální hodnoty 2 hodnoty 0,1 výběr nejfrekventovanějších hodnot spojení do větších přirozených celků (město,kraj) Při sloučení atributů Častokrát nutné nové kódování Numerické hodnoty některé analytické algoritmy vyžadují pouze kategoriální data diskretizace dat volba intervalů

24 Diskretizace Neinformované metody ekvidistantní intervaly ekvifrekvenční intervaly

25 Diskretizace Informované metody využití znalosti o příslušnosti objekt -> třída strategie rozdělování nebo spojování intervalů Fayyadův a Iraniho algoritmus (Entropy Based Discretization) Metoda založená na použití informací o třídách přítomných v datech kritérium entropie objekty mezi, kterými se mění třída výběr nejlepšího dělicího bodu Jde o hledání místa s maximálním informačním ziskem Fayyad, Irani : Multi-interval discretization of continuous-valued attributes for classification learning In: Proc. 1st Int. Conf. on Knowledge Discovery and Data Mining. AAAI Press, 1995, s

26 Transformace dat do jedné tabulky 1:1 prakticky pouze doplnění tabulky o nové atributy 1:N vytvoření agregovaných hodnot součet, min, max, průměr, regresní křivka majoritní hodnota, počet různých hodnot, výskyt konkrétní hodnoty do této skupiny patří časové řady M:N nutná volba úlohy, zda chceme 1:N nebo 1:M

27 Úpravy dimenze Snížení dimenze Vynecháním konstantních atributů atributů řídce obsazených atributů s duplicitní informací (rok narození X věk, apod.) Sloučením atributů řídce obsazených z několika řídce obsazených atributů je možné zřetězením vytvořit jeden nový (PVP - present value pattern)

28 Úpravy dimenze Zvýšení dimenze Obohacení doplněním údajů z jiných zdrojů (např. meteorologická měření, demografické údaje, apod.) Rozšíření přidání odvozených atributů např. pohlaví z rodného čísla Body Mass Index (BMI) BMI = váha [kg] 2 výška [m] otočení dat (reverse pivoting) - nový atribut a n+1 přebírá údaj z objektu následujícího. Pro každý objekt i platí a n+1 (i) = a n (i+1).

29 Úpravy dimenze Selekce atributů hledáme k správnému výsledku nejvíce přispívající atributy metoda filtru spočteme charakteristiku vyjadřující vhodnost atributu chi-kvadrát, entropie, informační míra závislosti vychází z kontingenční tabulky nevýhoda: posuzujeme každý atribut samostatně ne množiny atributů metoda obálky použití metod strojového učení Analýza hlavních komponent (PCA) Nové atributy nelze interpretovat

30 Úprava množin pro modelování Hlavní zásada každý nový soubor musí s rozumnou dávkou důvěry zachovávat původní pestrost či rozložení výchozího souboru. Vytvoření trénovacích a testovacích dat Vzorkování dat obrovský počet instancí redukce počtu dat tvorba modelů na základě podmnožin a jejich následná kombinace pro algoritmy pracující v dávkovém režimu nutnost nevyvážená data např třída A 95%, třída B 5% různé ceny chybného rozhodnutí výběr dat pro různé třídy s různou pravděpodobností

31 Modelování Výběr techniky modelování s ohledem na data, pochopitelnosti, budoucímu použití a omezením rozhodovací stromy, asociační pravidla, neuronové sítě, regresní analýza, shluková analýza Kombinace více modelů Návrh testování Technika validace techniky (trenovací/testovací množina), scóre, atd. Vytvoření modelu Ladění parametrů, následné zpracování vygenerovaných pravidel Ohodnocení modelu Splnění požadovaných testovacích kriterií. Přesnost a obecnost vytvořeného modelu

32 Vyhodnocení Úspěšné dosažení zadavatelových cílů Výsledek je kombinace Modelu a Závěry Závěry nemusí být srozumitelné vzhledem k zadavatelovým cílům nutné převézt do zadavatelovy terminologie Hodnocední výsledků Rozdílné stupně než u ohodnocení modelu Jestliže je to možné test na reálné aplikaci Revizní proces Rekapitulace, hlavní cíl: nalézt přehlédnuté úlohy Určení dalších kroků Rozhodnutí o možném vylepšení

33 Použití Plán použití Shrnutí použitelných výsledků Rozhodnutí o způsobu předání (nasazení) získaných znalostí a informací uživateli. Rozhodnutí jak bude vytvořený model nebo software použit v rámci exitujících systémů. Odhalení možných problémů při nasazení výsledků ZZD Plán monitorování a podpory Je důležité vyhnout se dlouhým obdobím nesprávného užívání Vytvoření závěrečné zprávy (dokumentace)

34 Časové nároky v ZZD Formulace problému Volba typu řešení Předpokládané využití Posouzení dat Potřebná čast času v rámci celého projektu (v %) Význam pro úspěch projektu (v %) Příprava dat Modelování

35 Vizualizace dat Omezení vnímání na 3D Vizualizace 1-D, 2-D a 3-D standard grafy, matematika, statistika Vizualizace n-d nutná pro ZZD (Data mining)

36 Vizualizace dat Grafy sloupcové grafy koláčové grafy grafy X-Y časové řady, trendy

37 Vizualizace dat 3D vizualizace

38 Vizualizace dat Statistické grafy

39 Iris data Iris setosa sepal sepal petal petal length width length width Iris versicolor Iris virginica

40 Vizualizace dat Zobrazení matice rozptylů

41 Parallel coordinates

42 RadViz

43 Dobrá příprava dat je klíčem k vytvoření platného a spolehlivého modelu Konec? Ne! Začátek!

Dobývání znalostí z databází

Dobývání znalostí z databází Dobývání znalostí z databází (Knowledge Discovery in Databases, Data Mining,..., Knowledge Destilery,...) Non-trivial process of identifying valid, novel, potentially useful and ultimately understandable

Více

DOBÝVÁNÍ ZNALOSTÍ Z DATABÁZÍ

DOBÝVÁNÍ ZNALOSTÍ Z DATABÁZÍ DOBÝVÁNÍ ZNALOSTÍ Z DATABÁZÍ Úvod a oblasti aplikací Martin Plchút plchut@e-globals.net DEFINICE A POJMY Netriviální extrakce implicitních, ch, dříve d neznámých a potenciáln lně užitečných informací z

Více

Získávání dat z databází 1 DMINA 2010

Získávání dat z databází 1 DMINA 2010 Získávání dat z databází 1 DMINA 2010 Získávání dat z databází Motto Kde je moudrost? Ztracena ve znalostech. Kde jsou znalosti? Ztraceny v informacích. Kde jsou informace? Ztraceny v datech. Kde jsou

Více

Předzpracování dat. Lenka Vysloužilová

Předzpracování dat. Lenka Vysloužilová Předzpracování dat Lenka Vysloužilová 1 Metodika CRISP-DM (www.crisp-dm.org) Příprava dat Data Preparation příprava dat pro modelování selekce příznaků výběr relevantních příznaků čištění dat získávání

Více

Obsah. Seznam obrázků. Seznam tabulek. Petr Berka, 2011

Obsah. Seznam obrázků. Seznam tabulek. Petr Berka, 2011 Petr Berka, 2011 Obsah... 1... 1 1 Obsah 1... 1 Dobývání znalostí z databází 1 Dobývání znalostí z databází O dobývání znalostí z databází (Knowledge Discovery in Databases, KDD) se začíná ve vědeckých

Více

IBM SPSS Decision Trees

IBM SPSS Decision Trees IBM Software IBM SPSS Decision Trees Jednoduše identifikujte skupiny a predikujte Stromově uspořádané postupné štěpení dat na homogenní podmnožiny je technika vhodná pro exploraci vztahů i pro tvorbu rozhodovacích

Více

ZÍSKÁVÁNÍ ZNALOSTÍ Z DATABÁZÍ

ZÍSKÁVÁNÍ ZNALOSTÍ Z DATABÁZÍ metodický list č. 1 Dobývání znalostí z databází Cílem tohoto tematického celku je vysvětlení základních pojmů z oblasti dobývání znalostí z databází i východisek dobývání znalostí z databází inspirovaných

Více

Dobývání a vizualizace znalostí

Dobývání a vizualizace znalostí Dobývání a vizualizace znalostí Olga Štěpánková et al. 1 Osnova předmětu 1. Dobývání znalostí - popis a metodika procesu a objasnění základních pojmů 2. Nástroje pro modelování klasifikovaných dat a jejich

Více

ZÍSKÁVÁNÍ ZNALOSTÍ Z DATABÁZÍ

ZÍSKÁVÁNÍ ZNALOSTÍ Z DATABÁZÍ Metodický list č. 1 Dobývání znalostí z databází Cílem tohoto tematického celku je vysvětlení základních pojmů z oblasti dobývání znalostí z databází i východisek dobývání znalostí z databází inspirovaných

Více

Předzpracování dat. Pavel Kordík. Department of Computer Systems Faculty of Information Technology Czech Technical University in Prague

Předzpracování dat. Pavel Kordík. Department of Computer Systems Faculty of Information Technology Czech Technical University in Prague Předzpracování dat Pavel Kordík Department of Computer Systems Faculty of Information Technology Czech Technical University in Prague Cvičení 1: Visualizace MI-PDD, 09/2011 MI-POA Evropský sociální fond

Více

Dobývání a vizualizace znalostí. Olga Štěpánková et al.

Dobývání a vizualizace znalostí. Olga Štěpánková et al. Dobývání a vizualizace znalostí Olga Štěpánková et al. 1 Osnova předmětu Dobývání znalostí - popis a metodika procesu CRISP a objasnění základních pojmů Nástroje pro modelování klasifikovaných dat a jejich

Více

Přednáška 13 Redukce dimenzionality

Přednáška 13 Redukce dimenzionality Vytěžování Dat Přednáška 13 Redukce dimenzionality Miroslav Čepek Fakulta Elektrotechnická, ČVUT Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti ČVUT (FEL) Redukce dimenzionality 1 /

Více

Dobývání a vizualizace znalostí

Dobývání a vizualizace znalostí Dobývání a vizualizace znalostí Olga Štěpánková et al. 1 Osnova předmětu 1. Dobývání znalostí - popis a metodika procesu a objasnění základních pojmů 2. Nástroje pro modelování klasifikovaných dat a jejich

Více

Dobývání a vizualizace znalostí

Dobývání a vizualizace znalostí Dobývání a vizualizace znalostí Olga Štěpánková, Lenka Vysloužilová, et al. https://cw.fel.cvut.cz/wiki/courses/a6m33dvz/start 1 Osnova přednášky Úvod: data, objem, reprezentace a základní terminologie

Více

OSOBNÍ ANGAŽOVANOST SOCIÁLNÍHO PRACOVNÍKA

OSOBNÍ ANGAŽOVANOST SOCIÁLNÍHO PRACOVNÍKA OSOBNÍ ANGAŽOVANOST SOCIÁLNÍHO PRACOVNÍKA Tomáš Kocyan OBSAH PREZENTACE Představení výzkumu Popis analyzovaných dat Analýza Asociace Fundovaná implikace Interpretace výsledků Rozhodovací stromy Výběr atributů

Více

Analýza dat z porodnického modulu nemocničního informačního systému

Analýza dat z porodnického modulu nemocničního informačního systému ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE Fakulta elektrotechnická Katedra kybernetiky Analýza dat z porodnického modulu nemocničního informačního systému Hospital information system Obstetrics-module data

Více

NAIL072 ROZPOZNÁVÁNÍ VZORŮ

NAIL072 ROZPOZNÁVÁNÍ VZORŮ NAIL072 ROZPOZNÁVÁNÍ VZORŮ RNDr. Jana Štanclová, Ph.D. jana.stanclova@ruk.cuni.cz www.cuni.cz/~stancloj LS Zk 2/0 OSNOVA 1. Úvod do rozpoznávání vzorů 2. Bayesovská teorie rozpoznávání 3. Diskriminační

Více

MINISTERSTVO VNITRA ČR

MINISTERSTVO VNITRA ČR Standard agendy 20.3.2016 A 3 Verze 1.0 (Návrh standardu) Úroveň: ústřední správní úřady Odbor egovernmentu MINISTERSTVO VNITRA ČR OBSAH 1 STANDARDIZACE AGEND... 2 1.1 CÍLE A DŮVODY PRO VYTVÁŘENÍ STANDARDŮ...

Více

Datový sklad. Datový sklad

Datový sklad. Datový sklad Datový sklad Postavení v rámci IS/ICT Specifika návrhu Modelování Datový sklad POSTAVENÍ NÁVRH Postavení datového skladu (DW) v IS/ICT z hlediska aplikací jako součást Business Intelligence z hlediska

Více

Etapy tvorby lidského díla

Etapy tvorby lidského díla Systém Pojem systém Obecně jej chápeme jako seskupení prvků spolu s vazbami mezi nimi, jejich uspořádání, včetně struktury či hierarchie. Synonymum organizace či struktura. Pro zkoumání systému je důležité

Více

Univerzita Pardubice. Fakulta ekonomicko-správní

Univerzita Pardubice. Fakulta ekonomicko-správní Univerzita Pardubice Fakulta ekonomicko-správní Model pro ohodnocení ojetého vozidla Bc. Ivo Brett Diplomová práce 2008 2 3 SOUHRN Diplomová práce se zabývá problematikou stanovení ceny ojetých vozidel.

Více

Katedra kybernetiky laboratoř Inteligentní Datové Analýzy (IDA) Katedra počítačů, Computational Intelligence Group

Katedra kybernetiky laboratoř Inteligentní Datové Analýzy (IDA) Katedra počítačů, Computational Intelligence Group Vytěžování dat Miroslav Čepek, Filip Železný Katedra kybernetiky laboratoř Inteligentní Datové Analýzy (IDA) Katedra počítačů, Computational Intelligence Group Evropský sociální fond Praha & EU: Investujeme

Více

1. Dobývání znalostí z databází

1. Dobývání znalostí z databází 1. Dobývání znalostí z databází O dobývání znalostí z databází (Knowledge Discovery in Databases, KDD) se začíná ve vědeckých kruzích mluvit počátkem 90. let. První impuls přišel z Ameriky, kde se na konferencích

Více

Simulace systému hromadné obsluhy Nejčastější chyby v semestrálních pracích

Simulace systému hromadné obsluhy Nejčastější chyby v semestrálních pracích Simulace systému hromadné obsluhy Nejčastější chyby v semestrálních pracích Nedostatešný popis systému a jeho modelu vstupy S výstupy Systém Část prostředí, kterou lze od jeho okolí oddělit fyzickou nebo

Více

V praxi pracujeme s daty nominálními (nabývají pouze dvou hodnot), kategoriálními (nabývají více

V praxi pracujeme s daty nominálními (nabývají pouze dvou hodnot), kategoriálními (nabývají více 9 Vícerozměrná data a jejich zpracování 9.1 Vícerozměrná data a vícerozměrná rozdělení Při zpracování vícerozměrných dat, hledáme souvislosti mezi dvěmi, případně více náhodnými veličinami. V praxi pracujeme

Více

Pokročilé neparametrické metody. Klára Kubošová

Pokročilé neparametrické metody. Klára Kubošová Pokročilé neparametrické metody Klára Kubošová Pokročilé neparametrické metody Výuka 13 přednášek doplněných o praktické cvičení v SW Úvod do neparametrických metod + princip rozhodovacích stromů Klasifikační

Více

Vysoká škola báňská Technická univerzita Ostrava METODY ANALÝZY DAT. Učební text. Jana Šarmanová

Vysoká škola báňská Technická univerzita Ostrava METODY ANALÝZY DAT. Učební text. Jana Šarmanová Vysoká škola báňská Technická univerzita Ostrava METODY ANALÝZY DAT Učební text Jana Šarmanová Ostrava 2012 Recenze: prof. RNDr. Alena Lukasová, CSc. Název: Metody analýzy dat Autor: Jana Šarmanová Vydání:

Více

RNDr. Tomáš Pavlík, PhD. RNDr. Jiří Jarkovský, PhD. Doc. RNDr. Ladislav Dušek, PhD. Ústav zdravotnických informací a statistiky České republiky

RNDr. Tomáš Pavlík, PhD. RNDr. Jiří Jarkovský, PhD. Doc. RNDr. Ladislav Dušek, PhD. Ústav zdravotnických informací a statistiky České republiky Metodika vı cerozme rne analy zy Na rodnı ho registru hospitalizovany ch za u c elem vy be ru reprezentativnı sı te poskytovatelu zdravotnı ch sluz eb CČR RNDr. Tomáš Pavlík, PhD. RNDr. Jiří Jarkovský,

Více

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze Dobývání znalostí Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze Dobývání znalostí Úvod do problematiky Doc. RNDr. Iveta Mrázová,

Více

Rozhodovací stromy a jejich konstrukce z dat

Rozhodovací stromy a jejich konstrukce z dat Příklad počítačová hra. Můžeme počítač naučit rozlišovat přátelské a přátelské roboty? Rozhodovací stromy a jejich konstruk z dat Učení s učitelem: u některých už víme, jakou mají povahu (klasifika) Neparametrická

Více

ELEKTRONICKÁ PORODNÍ KNIHA POPIS APLIKACE Michal Huptych, Petr Janků, Lenka Lhotská

ELEKTRONICKÁ PORODNÍ KNIHA POPIS APLIKACE Michal Huptych, Petr Janků, Lenka Lhotská ELEKTRONICKÁ PORODNÍ KNIHA POPIS APLIKACE Michal Huptych, Petr Janků, Lenka Lhotská Anotace Tento příspěvek popisuje aplikaci, která je převodem tzv. porodní knihy do elektronické podoby. Aplikace vzniká

Více

PREDIKCE DÉLKY KOLONY V KŘIŽOVATCE PREDICTION OF THE LENGTH OF THE COLUMN IN THE INTERSECTION

PREDIKCE DÉLKY KOLONY V KŘIŽOVATCE PREDICTION OF THE LENGTH OF THE COLUMN IN THE INTERSECTION PREDIKCE DÉLKY KOLONY V KŘIŽOVATCE PREDICTION OF THE LENGTH OF THE COLUMN IN THE INTERSECTION Lucie Váňová 1 Anotace: Článek pojednává o předpovídání délky kolony v křižovatce. Tato úloha je řešena v programu

Více

Pořízení licencí statistického SW

Pořízení licencí statistického SW Pořízení licencí statistického SW Zadavatel: Česká školní inspekce, Fráni Šrámka 37, 150 21 Praha 5 IČO: 00638994 Jednající: Mgr. Tomáš Zatloukal Předpokládaná (a maximální cena): 1.200.000 vč. DPH Typ

Více

Předzpracování dat pro data mining: metody a nástroje

Předzpracování dat pro data mining: metody a nástroje Předzpracování dat pro data mining: metody a nástroje Olga Štěpánková, Zdeněk Kouba, P. Mikšovský, P. Aubrecht Gerstnerova laboratoř pro inteligentní rozhodování a řízení České vysoké učení technické v

Více

Jazyk matematiky. 2.1. Matematická logika. 2.2. Množinové operace. 2.3. Zobrazení. 2.4. Rozšířená číslená osa

Jazyk matematiky. 2.1. Matematická logika. 2.2. Množinové operace. 2.3. Zobrazení. 2.4. Rozšířená číslená osa 2. Jazyk matematiky 2.1. Matematická logika 2.2. Množinové operace 2.3. Zobrazení 2.4. Rozšířená číslená osa 1 2.1 Matematická logika 2.1.1 Výrokový počet logická operace zapisujeme čteme česky negace

Více

Dálkový průzkum Země. Ústav geoinformačních technologií Lesnická a dřevařská fakulta MENDELU

Dálkový průzkum Země. Ústav geoinformačních technologií Lesnická a dřevařská fakulta MENDELU Dálkový průzkum Země Ústav geoinformačních technologií Lesnická a dřevařská fakulta MENDELU Klasifikace obrazu Klasifikaci můžeme obecně definovat jako seskupování vzájemně si podobných prvků (entit) do

Více

VEŘEJNÁ ZAKÁZKA MODEL MAPY PRO SLEDOVÁNÍ SOCIÁLNÍCH JEVŮ, KTERÉ SOUVISÍ SE SOCIÁLNÍM OHROŽENÍM NEBO VYLOUČENÍM

VEŘEJNÁ ZAKÁZKA MODEL MAPY PRO SLEDOVÁNÍ SOCIÁLNÍCH JEVŮ, KTERÉ SOUVISÍ SE SOCIÁLNÍM OHROŽENÍM NEBO VYLOUČENÍM VEŘEJNÁ ZAKÁZKA MODEL MAPY PRO SLEDOVÁNÍ SOCIÁLNÍCH JEVŮ, KTERÉ SOUVISÍ SE SOCIÁLNÍM OHROŽENÍM NEBO VYLOUČENÍM Projekt je součástí aktivity č. 2 Identifikace a vyhodnocování problematických sociálních

Více

Rozhodovací stromy a lesy

Rozhodovací stromy a lesy Rozhodovací stromy a lesy Klára Komprdová Leden 2012 Příprava a vydání této publikace byly podporovány projektem ESF č. CZ.1.07/2.2.00/07.0318 Víceoborová inovace studia Matematické biologie a státním

Více

Statistické metody v ekonomii. Ing. Michael Rost, Ph.D.

Statistické metody v ekonomii. Ing. Michael Rost, Ph.D. Statistické metody v ekonomii Ing. Michael Rost, Ph.D. Jihočeská univerzita v Českých Budějovicích Cíle kurzu: seznámit posluchače s vybranými statistickými metodami, které jsou aplikovatelné v ekonomických

Více

Dolování znalostí z rozsáhlých statistických souborů lékařských dat

Dolování znalostí z rozsáhlých statistických souborů lékařských dat Mendelova univerzita v Brně Provozně ekonomická fakulta Dolování znalostí z rozsáhlých statistických souborů lékařských dat Diplomová práce Vedoucí práce: doc. Ing. Jan Žižka, CSc. Brno 2015 Vypracoval:

Více

Vytěžování znalostí z dat

Vytěžování znalostí z dat Pavel Kordík, Jan Motl (ČVUT FIT) Vytěžování znalostí z dat BI-VZD, 2012, Přednáška 4 1/27 Vytěžování znalostí z dat Pavel Kordík, Jan Motl Department of Computer Systems Faculty of Information Technology

Více

Prof. Ing. Miloš Konečný, DrSc. Nedostatky ve výzkumu a vývoji. Klíčové problémy. Tyto nedostatky vznikají v následujících podmínkách:

Prof. Ing. Miloš Konečný, DrSc. Nedostatky ve výzkumu a vývoji. Klíčové problémy. Tyto nedostatky vznikají v následujících podmínkách: Podnik je konkurenčně schopný, když může novými výrobky a službami s vysokou hodnotou pro zákazníky dobýt vedoucí pozice v oboru a na trhu. Prof. Ing. Miloš Konečný, DrSc. Brno University of Technology

Více

přetrénování = ztráta schopnosti generalizovat vlivem přílišného zaměření klasifikátorů na rozeznávání pouze konkrétních trénovacích dat

přetrénování = ztráta schopnosti generalizovat vlivem přílišného zaměření klasifikátorů na rozeznávání pouze konkrétních trénovacích dat Zkouška ISR 2013 přetrénování = ztráta schopnosti generalizovat vlivem přílišného zaměření klasifikátorů na rozeznávání pouze konkrétních trénovacích dat 1. Rozdílné principy u induktivního a deduktivního

Více

BA_EM Electronic Marketing. Pavel

BA_EM Electronic Marketing. Pavel BA_EM Electronic Marketing Pavel Kotyza @VŠFS Agenda Efektivní data mining jako zdroj relevantních dat o potřebách zákazníků Co je data mining? Je absolutní Je předem neznámý Je užitečný Co jsou data?

Více

Úvod do zpracování obrazů. Petr Petyovský Miloslav Richter

Úvod do zpracování obrazů. Petr Petyovský Miloslav Richter Úvod do zpracování obrazů Petr Petyovský Miloslav Richter 1 OBSAH Motivace, prvky a základní problémy počítačového vidění, pojem scéna Terminologie, obraz, zpracování a analýza obrazu, počítačové vidění,

Více

KE STATISTICKÉ DEFINICI DOMÁCNOSTI Jaromír Běláček

KE STATISTICKÉ DEFINICI DOMÁCNOSTI Jaromír Běláček KE STATISTICKÉ DEFINICI DOMÁCNOSTI Jaromír Běláček (9.SLOVENSKÁ DEMOGRAFICKÁ KONFERENCIA RODINA, 17.-19.9.2003, Tajov pro Banskej Bystrici) 1 ÚVOD Při úlohách vztažených k analýze a prezentaci výsledků

Více

Dynamické metody pro predikci rizika

Dynamické metody pro predikci rizika Dynamické metody pro predikci rizika 1 Úvod do analýzy časových řad Časová řada konečná posloupnost reálných hodnot určitého sledovaného ukazatele měřeného v určitých časových intervalech okamžikové např

Více

Bayesovská klasifikace digitálních obrazů

Bayesovská klasifikace digitálních obrazů Výzkumný ústav geodetický, topografický a kartografický Bayesovská klasifikace digitálních obrazů Výzkumná zpráva č. 1168/2010 Lubomír Soukup prosinec 2010 1 Úvod V průběhu nedlouhého historického vývoje

Více

Informační systém banky

Informační systém banky doc.ing.božena Petrjánošová,CSc. Progres Slovakia, s.r.o. Informační systém banky Rozvoj bankovního systému a bankovních služeb, ale i řízení činností banky v tržních podmínkách vyžadují přesné a pohotové

Více

(n, m) (n, p) (p, m) (n, m)

(n, m) (n, p) (p, m) (n, m) 48 Vícerozměrná kalibrace Podobně jako jednorozměrná kalibrace i vícerozměrná kalibrace se používá především v analytické chemii Bude vysvětlena na příkladu spektroskopie: cílem je popis závislosti mezi

Více

Ing. Petr Hájek, Ph.D. Podpora přednášky kurzu Aplikace umělé inteligence

Ing. Petr Hájek, Ph.D. Podpora přednášky kurzu Aplikace umělé inteligence APLIKACE UMĚLÉ INTELIGENCE Ing. Petr Hájek, Ph.D. Podpora přednášky kurzu Aplikace umělé inteligence Aplikace umělé inteligence - seminář ING. PETR HÁJEK, PH.D. ÚSTAV SYSTÉMOVÉHO INŽENÝRSTVÍ A INFORMATIKY

Více

Regresní a korelační analýza

Regresní a korelační analýza Přednáška STATISTIKA II - EKONOMETRIE Katedra ekonometrie FEM UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Regresní analýza Cíl regresní analýzy: stanovení formy (trendu, tvaru, průběhu)

Více

SYSTÉM TECHNICKO-EKONOMICKÉ ANALÝZY VÝROBY TEKUTÉHO KOVU - CESTA KE SNIŽOVÁNÍ NÁKLADŮ

SYSTÉM TECHNICKO-EKONOMICKÉ ANALÝZY VÝROBY TEKUTÉHO KOVU - CESTA KE SNIŽOVÁNÍ NÁKLADŮ SYSTÉM TECHNICKO-EKONOMICKÉ ANALÝZY VÝROBY TEKUTÉHO KOVU - CESTA KE SNIŽOVÁNÍ NÁKLADŮ FIGALA V. a), KAFKA V. b) a) VŠB-TU Ostrava, FMMI, katedra slévárenství, 17. listopadu 15, 708 33 b) RACIO&RACIO, Vnitřní

Více

Informační systémy pro podporu rozhodování

Informační systémy pro podporu rozhodování Informační systémy pro rozhodování Informační systémy pro podporu rozhodování 5 Jan Žižka, Naděžda Chalupová Ústav informatiky PEF Mendelova universita v Brně Asociační pravidla Asociační pravidla (sdružovací

Více

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY FAKULTA INFORMAČNÍCH TECHNOLOGIÍ ÚSTAV INFORMAČNÍCH SYSTÉMŮ FACULTY OF INFORMATION TECHNOLOGY DEPARTMENT OF INFORMATION SYSTEMS DOLOVÁNÍ ASOCIAČNÍCH

Více

Dobývání znalostí z databází (MI-KDD) Přednáška číslo 9 Využití doménových znalostí

Dobývání znalostí z databází (MI-KDD) Přednáška číslo 9 Využití doménových znalostí Dobývání znalostí z databází (MI-KDD) Přednáška číslo 9 Využití doménových znalostí (c) prof. RNDr. Jan Rauch, CSc. KIZI, Fakulta informatiky a statistiky VŠE zimní semestr 2011/2012 Evropský sociální

Více

APLIKACE NÁSTROJŮ KVALITY VE SPOLEČNOSTI METEOSERVIS V.O.S. SVOČ FST 2011

APLIKACE NÁSTROJŮ KVALITY VE SPOLEČNOSTI METEOSERVIS V.O.S. SVOČ FST 2011 APLIKACE NÁSTROJŮ KVALITY VE SPOLEČNOSTI METEOSERVIS V.O.S. SVOČ FST 2011 Petr Novák, Ing. Martin Melichar Ph.D. Západočeská univerzita v Plzni, Západočeská univerzita v Plzni, Univerzitní 8, 306 14 Plzeň

Více

Budování informačních systémů pro komunitní plánování

Budování informačních systémů pro komunitní plánování Ústí nad Labem 1 Budování informačních systémů pro komunitní plánování Ústí nad Labem Zpracoval: MUDr.Miroslav Seiner Obsahová část materiálu vznikla za finanční podpory projektu Komunitní plánování jako

Více

Přednáška 5. Výběrová šetření, Exploratorní analýza

Přednáška 5. Výběrová šetření, Exploratorní analýza Přednáška 5 Výběrová šetření, Exploratorní analýza Pravděpodobnost vs. statistika Výběrová šetření aneb jak získat výběrový soubor Exploratorní statistika aneb jak popsat výběrový soubor Typy proměnných

Více

Centrální databáze nežádoucích událostí

Centrální databáze nežádoucích událostí Centrální databáze nežádoucích událostí srovnání zdravotnických zařízení 4.čtvrtletí 2009 Kabinet veřejného zdravotnictví 3.lékařská fakulta Univerzity Karlovy v Praze Obsah Centrální databáze nežádoucích

Více

Extrakce a selekce příznaků

Extrakce a selekce příznaků Extrakce a selekce příznaků Based on slides Martina Bachlera martin.bachler@igi.tugraz.at, Makoto Miwa And paper Isabelle Guyon, André Elisseeff: An Introduction to variable and feature selection. JMLR,

Více

Business Intelligence. Adam Trčka

Business Intelligence. Adam Trčka Business Intelligence Adam Trčka 09:00 11:30: BI v kostce Navrhněme si sklad Ukázka BI Datamining 12:30 14:30: Pokračování kurzu 14:30 15:00: Q&A Agenda Co se dnes dovíme? Data informace znalost Business

Více

Vytěžování znalostí z dat

Vytěžování znalostí z dat Vytěžování znalostí z dat Department of Computer Systems Faculty of Information Technology Czech Technical University in Prague Přednáška 5: Hodnocení kvality modelu BI-VZD, 09/2011 MI-POA Evropský sociální

Více

INTRODUCTION TO MACHINE LEARNING (NPFL054) A template for Homework #2

INTRODUCTION TO MACHINE LEARNING (NPFL054) A template for Homework #2 INTRODUCTION TO MACHINE LEARNING (NPFL054) A template for Homework #2 Name: Petr Bělohlávek School year: 2015/2016 Provide answers for the exercises 1. (a) - (c), 2.(c), 2.(d.1-2), 2.(e.1-2) For each exercise,

Více

Úvod do dobývání. znalostí z databází

Úvod do dobývání. znalostí z databází POROZUMĚNÍ 4iz260 Úvod do DZD Úvod do dobývání DOMÉNOVÉ OBLASTI znalostí z databází VYUŽITÍ VÝSLEDKŮ POROZUMĚNÍ DATŮM DATA VYHODNO- CENÍ VÝSLEDKŮ MODELOVÁNÍ (ANALYTICKÉ PROCEDURY) PŘÍPRAVA DAT Ukázka slidů

Více

Lineární programování

Lineární programování Lineární programování Úlohy LP patří mezi takové úlohy matematického programování, ve kterých jsou jak kriteriální funkce, tak i všechny rovnice a nerovnice podmínek výhradně tvořeny lineárními výrazy.

Více

1 VZNIK, VÝVOJ A DEFINICE MECHATRONIKY

1 VZNIK, VÝVOJ A DEFINICE MECHATRONIKY 1 VZNIK, VÝVOJ A DEFINICE MECHATRONIKY 1.1 VÝVOJ MECHATRONIKY Ve vývoji mechatroniky lze vysledovat tři období: 1. etapa polovina 70. let, Japonsko, založení nového oboru shrnuje poznatky z mechaniky,

Více

Implementace metodiky oceňování v RN

Implementace metodiky oceňování v RN Implementace metodiky oceňování v RN Markéta Bartůňková, Petr Mašek a tým DRG Restart 4. Expertní rada 02. 12. 2015 Struktura prezentace Příprava implementace metodiky oceňování v RN Ověření implementace

Více

ZPRACOVÁNÍ NEURČITÝCH ÚDAJŮ V DATABÁZÍCH

ZPRACOVÁNÍ NEURČITÝCH ÚDAJŮ V DATABÁZÍCH 0. Obsah Strana 1 z 12 VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY FAKULTA STROJNÍHO INŽENÝRSTVÍ ÚSTAV AUTOMATIZACE A INFORMATIKY FACULTY OF MECHANICAL ENGINEERING INSTITUTE OF AUTOMATION

Více

znalostí z databází- mnohostranná interpretace dat

znalostí z databází- mnohostranná interpretace dat Dobývání znalostí z databází- mnohostranná interpretace dat Petr Berka VŠE Praha berka@vse vse.cz Dobývání znalostí z databází Non-trivial process of identifying valid, novel, potentially useful and ultimately

Více

STATISTICA Téma 8. Regresní a korelační analýza, regrese prostá

STATISTICA Téma 8. Regresní a korelační analýza, regrese prostá STATISTICA Téma 8. Regresní a korelační analýza, regrese prostá 1) Lineární i nelineární regrese prostá, korelace Naeditujeme data viz obr. 1. Obr. 1 V menu Statistika zvolíme submenu Pokročilé lineární/nelineární

Více

DOJÍŽĎKA A VYJÍŽĎKA DO ZAMĚSTNÁNÍ DO/Z HL. M. PRAHY

DOJÍŽĎKA A VYJÍŽĎKA DO ZAMĚSTNÁNÍ DO/Z HL. M. PRAHY DOJÍŽĎKA A VYJÍŽĎKA DO ZAMĚSTNÁNÍ DO/Z HL. M. PRAHY Analýza základních charakteristik a vývoje Ing. Jiří Mejstřík září 2012 Dojížďka a vyjížďka do zaměstnání do/z hl. m. Prahy aktualizace 2012 Analýza

Více

Obsah přednášky Jaká asi bude chyba modelu na nových datech?

Obsah přednášky Jaká asi bude chyba modelu na nových datech? Obsah přednášky Jaká asi bude chyba modelu na nových datech? Chyba modelu Bootstrap Cross Validation Vapnik-Chervonenkisova dimenze 2 Chyba skutečná a trénovací Máme 30 záznamů, rozhodli jsme se na jejich

Více

1. Číselné posloupnosti - Definice posloupnosti, základní vlastnosti, operace s posloupnostmi, limita posloupnosti, vlastnosti limit posloupností,

1. Číselné posloupnosti - Definice posloupnosti, základní vlastnosti, operace s posloupnostmi, limita posloupnosti, vlastnosti limit posloupností, KMA/SZZS1 Matematika 1. Číselné posloupnosti - Definice posloupnosti, základní vlastnosti, operace s posloupnostmi, limita posloupnosti, vlastnosti limit posloupností, operace s limitami. 2. Limita funkce

Více

Institut biostatistiky a analýz MU. Zkušenosti s vyhodnocováním telemedicínských technologií

Institut biostatistiky a analýz MU. Zkušenosti s vyhodnocováním telemedicínských technologií Institut biostatistiky a analýz MU Zkušenosti s vyhodnocováním telemedicínských technologií 1 O IBA hlavní oblasti zájmu Faculty of Science, Masaryk University Faculty of Medicine, Masaryk University Analýza

Více

Vyhodnocování biologických dat pomocí statistických metod Eva Gelnarová

Vyhodnocování biologických dat pomocí statistických metod Eva Gelnarová Vyhodnocování biologických dat pomocí statistických metod Eva Gelnarová Úvod Kdybyste se zeptali studentů nebo absolventů přírodovědecké fakulty, co je to Statistika, většina by si vzpomněla na písničku

Více

Vícekriteriální hodnocení variant metody

Vícekriteriální hodnocení variant metody Katedra aplikované matematiky a informatiky Jihočeská Univerzita v Českých Budějovicích, Ekonomická fakulta 2010 Metody vícekriteriální hodnocení variant (VHV) Jak jsme již zmiňovali, VHV obecně neposkytuje

Více

KVALITA OČIMA PACIENTŮ - A

KVALITA OČIMA PACIENTŮ - A KVALITA OČIMA PACIENTŮ - A Hodnocení kvality zdravotních služeb prostřednictvím spokojenosti pacientů FN Ostrava - AMBULANCE Leden 2010 / Závěrečná zpráva / PUBLIC / Řešitel projektu: RNDr. Tomáš Raiter

Více

VYBRANÉ MOŽNOSTI SNIŽOVÁNÍ EMISÍ SO2 U STÁVAJÍCÍCH UHELNÝCH ZDROJŮ

VYBRANÉ MOŽNOSTI SNIŽOVÁNÍ EMISÍ SO2 U STÁVAJÍCÍCH UHELNÝCH ZDROJŮ VYBRANÉ MOŽNOSTI SNIŽOVÁNÍ EMISÍ SO2 U STÁVAJÍCÍCH UHELNÝCH ZDROJŮ Oldřich Mánek, Pavel Slezák, Petr Julínek Příspěvek shrnuje vybrané možnosti snižování emisí oxidu siřičitého SO 2 u stávajících zdrojů

Více

1. ZÁKLADNÍ ÚDAJE O ŠETŘENÍ

1. ZÁKLADNÍ ÚDAJE O ŠETŘENÍ 1. ZÁKLADNÍ ÚDAJE O ŠETŘENÍ Název šetření: Podoba formuláře: Roční šetření o výzkumu a vývoji Výkaz o výzkumu a vývoji VTR 5 01 je distribuován ve dvou mutacích podle sektorů provádění VaV: mutace (a)

Více

M. Litschmannová: Scénař videa Analýza závislosti kvantitativní proměnné na proměnné kategoriální příklad

M. Litschmannová: Scénař videa Analýza závislosti kvantitativní proměnné na proměnné kategoriální příklad Úkol: S využitím popisné statistiky analyzujte vliv proměnné vekkat na proměnnou bmi (body mass index). (Datový soubor biometrie.csv - http://homen.vsb.cz/am/lit40/data/.) Úlohu si rozdělíme do několika

Více

Okruhy ke státní závěrečné zkoušce z vedlejší specializace Informatika v řízení podniku

Okruhy ke státní závěrečné zkoušce z vedlejší specializace Informatika v řízení podniku Okruhy ke státní závěrečné zkoušce z vedlejší specializace Informatika v řízení podniku Aplikace auditních postupů Vyberte si jeden typ auditu (útvaru, projektu, aplikace, procesu, ) a na něm demonstrujte

Více

Marta Vomlelová marta@ktiml.mff.cuni.cz

Marta Vomlelová marta@ktiml.mff.cuni.cz Strojové učení Úvod, lineární regrese Marta Vomlelová marta@ktiml.mff.cuni.cz References [1] P. Berka. Dobývání znalostí z databází. Academia, 2003. [2] T. Hastie, R. Tishirani, and J. Friedman. The Elements

Více

UNIVERZITA PARDUBICE

UNIVERZITA PARDUBICE UNIVERZITA PARDUBICE Fakulta chemicko technologická Katedra analytické chemie Licenční studium chemometrie na téma Tvorba grafů v programu Origin Vedoucí licenčního studia Prof. RNDr. Milan Meloun, DrSc.

Více

Vytěžování dat přednáška I

Vytěžování dat přednáška I České vysoké učení technické v Praze Fakulta elektrotechnická Katedra kybernetiky Katedra počítačů Vytěžování dat přednáška I Úvod do vytěžování dat Filip Železný: zelezny@fel.cvut.cz Pavel Kordík: kordikp@fel.cvut.cz

Více

Výzvy využívání otevřených dat v ČR

Výzvy využívání otevřených dat v ČR a cesty k jejich řešení Praha, 8. 11. 2013 Výzvy využívání otevřených dat v ČR Dušan Chlapek 1, Jan Kučera 1, Martin Nečaský 2, 1 Fakulta informatiky a statistiky, Vysoká škola ekonomická v Praze 2 Matematicko-fyzikální

Více

Klíčová slova prediktory absolvování studia medicíny, logistická regrese, ROC křivky

Klíčová slova prediktory absolvování studia medicíny, logistická regrese, ROC křivky STUDIUM SOUVISLOSTÍ MEZI ÚSPĚŠNOSTÍ STUDIA MEDICÍNY, ZNÁMKAMI STUDENTŮ NA STŘEDNÍ ŠKOLE A VÝSLEDKY PŘIJÍMACÍCH ZKOUŠEK 1 Čestmír Štuka, Petr Šimeček Anotace Studie analyzuje úspěšnost studentů přijatých

Více

PROFIL BUDOUCÍHO ABSOLVENTA OBORU INFORMATIKA

PROFIL BUDOUCÍHO ABSOLVENTA OBORU INFORMATIKA PROFIL BUDOUCÍHO ABSOLVENTA OBORU INFORMATIKA Cyril Klimeš Ostravská univerzita, katedra informatiky a počítačů, 30. dubna 22, 701 03 Ostrava, ČR, e-mail: cyril.klimes@osu.cz Abstrakt Tento příspěvek si

Více

KONTROLA PŘESNOSTI VÝROBY S VYUŽITÍM MATLABU

KONTROLA PŘESNOSTI VÝROBY S VYUŽITÍM MATLABU KONTROLA PŘESNOSTI VÝROBY S VYUŽITÍM MATLABU Ing. Vladislav Matějka, Ing. Jiří Tichý, Ing. Radovan Hájovský Katedra měřicí a řídicí techniky, VŠB-TU Ostrava Abstrakt: Příspěvek se zabývá možností využít

Více

Metodické postupy tvorby architektury

Metodické postupy tvorby architektury Metodické postupy tvorby architektury Název Metodické postupy tvorby architektury Datum zhotovení 14. 3. 2016 Zhotovitel KPMG Česká republika, s.r.o. Zpracoval za zhotovitele Tomáš Martinka Verze 2.1 Veřejná

Více

Moderní systémy pro získávání znalostí z informací a dat

Moderní systémy pro získávání znalostí z informací a dat Moderní systémy pro získávání znalostí z informací a dat Jan Žižka IBA Institut biostatistiky a analýz PřF & LF, Masarykova universita Kamenice 126/3, 625 00 Brno Email: zizka@iba.muni.cz Bioinformatika:

Více

INFORMAČNÍ A ŘÍDÍCÍ SYSTÉMY PRO TECHNOLOGICKÉ PROCESY (Soudobé vážicí systémy se zaměřením na zemědělskou výrobu)

INFORMAČNÍ A ŘÍDÍCÍ SYSTÉMY PRO TECHNOLOGICKÉ PROCESY (Soudobé vážicí systémy se zaměřením na zemědělskou výrobu) INFORMAČNÍ A ŘÍDÍCÍ SYSTÉMY PRO TECHNOLOGICKÉ PROCESY (Soudobé vážicí systémy se zaměřením na zemědělskou výrobu) Jan Havel Ing. Jan Havel, DrSc., TONAVA, a.s. Úpice Anotace: Problematika informačních

Více

4IT218 Databáze. 4IT218 Databáze

4IT218 Databáze. 4IT218 Databáze 4IT218 Databáze Šestá přednáška Dušan Chlapek (katedra informačních technologií, VŠE Praha) 4IT218 Databáze Datové modelování Transformace KS do LS Šestá přednáška Program přednášek (12 přednášek) Týden

Více

Data mining. Letní semestr. únor 2016 - červen 2016. Ondřej Brom lektor, analytik, konzultant spoluautor knihy SPSS Praktická analýza dat

Data mining. Letní semestr. únor 2016 - červen 2016. Ondřej Brom lektor, analytik, konzultant spoluautor knihy SPSS Praktická analýza dat Letní semestr únor 2016 - červen 2016 Ondřej Brom lektor, analytik, konzultant spoluautor knihy SPSS Praktická analýza dat Centrum výuky ACREA Začněte číst v budoucnosti a otevřete si cestu k úspěchu prostřednictvím

Více

Řízení SW projektů. Lekce 1 Základní pojmy a jejich vztahy. přednáška pro studenty FJFI ČVUT. zimní semestr 2012

Řízení SW projektů. Lekce 1 Základní pojmy a jejich vztahy. přednáška pro studenty FJFI ČVUT. zimní semestr 2012 Řízení SW projektů Lekce 1 Základní pojmy a jejich vztahy přednáška pro studenty FJFI ČVUT zimní semestr 2012 Ing. Pavel Rozsypal IBM Česká republika Global Business Services Lekce 1 - Základní pojmy a

Více

Hledání závislostí technologických a nákladových charakteristik při tavení oceli na elektrických obloukových pecích

Hledání závislostí technologických a nákladových charakteristik při tavení oceli na elektrických obloukových pecích Hledání závislostí technologických a nákladových charakteristik při tavení oceli na elektrických obloukových pecích Firková, L. 1), Kafka, V. 2), Figala, V. 3), Herzán, M. 4), Nykodýmová, V. 5) 1) VŠB

Více

Alternativní ovládání PC a okolí

Alternativní ovládání PC a okolí Alternativní ovládání PC a okolí Nature Inspired Technologies Group (NIT) - http://nit.felk.cvut.cz/ Katedra kybernetiky Fakulta elektrotechnická ČVUT v Praze http://cyber.felk.cvut.cz/ Alternativní ovládání

Více

10. blok Logický návrh databáze

10. blok Logický návrh databáze 10. blok Logický návrh databáze Studijní cíl Tento blok je věnován převodu konceptuálního návrhu databáze na návrh logický. Blok se věnuje tvorbě tabulek na základě entit z konceptuálního modelu a dále

Více

KGG/STG Statistika pro geografy

KGG/STG Statistika pro geografy KGG/STG Statistika pro geografy 1. Úvod, základní pojmy Mgr. David Fiedor 16. února 2015 Osnova 1 Úvod - organizace výuky 2 3 Struktura přednášek Úvod, základní pojmy Popisná statistika Teoretická rozdělení

Více

GEOGRAFICKÉ INFORMAČNÍ SYSTÉMY 6

GEOGRAFICKÉ INFORMAČNÍ SYSTÉMY 6 UNIVERZITA TOMÁŠE BATI VE ZLÍNĚ FAKULTA APLIKOVANÉ INFORMATIKY GEOGRAFICKÉ INFORMAČNÍ SYSTÉMY 6 Lubomír Vašek Zlín 2013 Obsah... 3 1. Základní pojmy... 3 2. Princip rastrové reprezentace... 3 2.1 Užívané

Více