STRUČNÝ PRŮVODCE ANALYTICKÝM PROCESEM

Rozměr: px
Začít zobrazení ze stránky:

Download "STRUČNÝ PRŮVODCE ANALYTICKÝM PROCESEM"

Transkript

1 SPOLEČNOST ACREA Váš dlouholetý partner v oblasti analýzy dat - od dodání softwaru, přes řešení analytických úkolů, až po výuku statistických a dataminingových metod. STRUČNÝ PRŮVODCE ANALYTICKÝM PROCESEM picture: Designed by jcomp / Freepik ACREA CR, spol. s r. o. Krakovská Praha 1 tel.: info@acrea.cz web:

2 STRUČNÝ PRŮVODCE ANALYTICKÝM PROCESEM Každý, kdo pracuje s daty, prochází určitými fázemi analytického procesu. Někdy řeší pouze jeho část, jindy ho musí projít kompletně celý. Analytický proces zahrnuje vše od plánování sběru a shromažďování dat, až po samotné zavedení výsledků do praxe. Uvědomit si důležitost jednotlivých fází a kroků je nezbytné pro kvalitní a správnou analýzu. 1. POROZUMĚNÍ DATŮM Jakou úlohu chceme analýzou dat řešit? 5. REPORTOVÁNÍ A ZAVEDENÍ DO PRAXE Jak výsledky z analýzy dat dále využijeme? 2. PŘÍPRAVA DAT Jaká data budeme analyzovat? 3. ANALÝZA DAT Jaké metody při analýze dat budeme používat? 4. PREDIKCE Jaký je budoucí vývoj či odhad predikce chování? 2

3 1. Porozumění datům Než začneme plánovat jaká data budeme shromažďovat, musíme si být vědomi, jaký typ problému budeme řešit a tomu také přizpůsobit sběr dat. Co zvážit před sběrem dat? jaké využít datové zdroje, jaké proměnné zahrnout do sběru dat, jaké techniky budeme využívat ve fázi analýzy dat. Shromáždění dat Doporučení: Při vytváření datových souborů je důležité dát si pozor na formát dat. Některé softwary nepodporují méně obvyklé datové typy nebo formát konkurenčních programů. Při následném pokusu o import dat, tak dochází k problémům, kterých jsme se mohli vyvarovat. Pokud už víme, co je cílem dalších analýz, můžeme začít data shromažďovat ze všech dostupných datových zdrojů (databáze, internet, měřicí přístroje ), případně zajistit úplně nový zdroj dat, který dosud nebyl potřeba. Tato data je vhodné doplnit o dodatečné informace, které se nazývají metadata. Tato metadata mohou obsahovat: odkud data pochází, jakými metodami byla data sesbírána, jaké problémy se při jejich sběru vyskytly a jakým způsobem byly vyřešeny. V případě více datových zdrojů je sloučení dat jedním z dalších úkolů ve fázi přípravy dat. Popis datových zdrojů Doporučení: Naše data by měla pocházet vždy pouze z důvěryhodných zdrojů. Ať už se jedná například o správnost seřízení měřícího zařízení nebo využití veřejně dostupných či placených databázových zdrojů. Vždy bychom měli být schopni ověřit důvěryhodnost dat a mít přehled o jejich aktuálnosti. Popis má obsahovat informace o datech jako jsou formát dat, počty případů nebo proměnných, názvy všech proměnných a další informace, které nám pomohou správně porozumět získaným datům a pomohou nám orientovat se v datech budoucích analýz, nebo pokud bude data zpracovávat také někdo jiný. 3

4 Přehled dat Na co se zaměřit v této fázi: rozdělení četností kategorizovaných proměnných, popisné statistiky číselných proměnných, vztahy mezi vybranými proměnnými, vztah k proměnné, kterou chceme predikovat (cílová proměnná) nebo jiným klíčovým proměnným, výsledky jednoduchých agregací. Obr. 1 Histogram rozdělení četností Výsledky těchto analýz by měly opět směřovat k našemu cíli. Také by měly pomoci vylepšit naše pochopení dat a být vodítkem v dalších krocích úpravy a analýzy. Doporučení: V tomto kroku je vhodné využívat různé grafy. Může se jednat například o histogramy, boxploty, Q-Q ploty atp. Díky těmto grafům získáme velice rychle přehled o hlavních charakteristikách datového souboru. Ověření kvality dat Podle čeho ověříme kvalitu dat: jsou data kompletní (obsahují všechny potřebné proměnné)? obsahují data chyby (pokud ano, jak často a jakého druhu)? obsahují data vynechané hodnoty (jak jsou popsány, kde se vyskytují, jak často)? Doporučení: Pokud si nejsme jistí, zda máme nasbíraná data v dostatečné kvalitě, je vhodné konzultovat situaci s expertem z dané oblasti. Můžeme se tím snadno vyvarovat situaci, kdy opomeneme důležitou proměnnou jen proto, že neznáme zvyklosti či nemáme dostatečné zkušenosti z daného oboru. 4

5 2. Příprava dat Výběr dat V tomto bodě je důležité rozhodnout, jaká data budeme dále analyzovat. Data musí být kvalitní a relevantní pro řešenou úlohu. Jak postupovat při výběru dat: provést testy korelací mezi proměnnými a vybrat neredundantní proměnné, vytvořit z původního výběru podsoubory (vzhledem k cílům analýzy), provést techniky na redukci dimenzionality pokud je to vhodné (např. faktorová analýza). Doporučení: Snažíme se o co největší zjednodušení datové struktury, bez ztráty relevantní informace. Při výběru dat do analýzy je vhodné konkrétní výběr opět konzultovat s odborníkem z daného oboru. Čištění dat V tomto kroku se zajišťuje kvalita dat potřebná pro zvolené analytické techniky. Jak zvýšit kvalitu dat: výběr podsouboru, který neobsahuje žádná chybějící pozorování, nahrazování chybějících hodnot (např. pomocí matematického modelování), identifikovat odlehlá pozorování. Doporučení: Jednou z možností, jak se vypořádat s odlehlými či extrémními hodnotami, je úplně je vyřadit z datového souboru. Při tomto postupu si ale musíme být jistí, neboť se můžeme připravit o část důležité informace, která se v datech vyskytuje. Tvorba nových proměnných Při tvorbě nových proměnných bychom se opět měli řídit cílem naší analýzy a mít jasno jak a proč novou proměnnou odvozujeme. Snažíme se vytvořit zejména proměnné, které mají silný vztah k cílové proměnné. Příklady odvozených proměnných: zisk za měsíc, rok atd., podíl počtu vozidel k počtu obyvatel, plocha = výška * šířka. Doporučení: Tvorbou nových proměnných si můžeme pomoci ke splnění předpokladů pro jednotlivé analytické techniky, např. normalita dat. Může se jednat o logaritmickou transformaci, nebo transformaci odmocninou. Nicméně nesmíme přijít o schopnost interpretovat výsledky! 5

6 Slučování datových zdrojů Slučováni zdrojů probíhá ve chvíli, kdy máme dvě nebo více tabulek obsahující různé informace o stejných objektech nebo stejné informace za různá období, organizační jednotky či jiný aspekt. Příklad: Maloobchodní řetězec má v jedné tabulce obecné informace o každé jednotlivé prodejně (prodejní plocha, typ obchodu ), v další tabulce jsou uloženy informace o prodejích (zisk, změna v prodejích oproti předchozím letům, ) a další obsahující demografické informace okolní oblasti. Každá z těchto tabulek obsahuje jeden záznam o jedné prodejně. Tyto tabulky můžeme sloučit do jediné, která bude obsahovat jeden záznam o jednom obchodě a kombinovat informace ze všech zdrojů. Obr. 2 Schéma spojování tabulek 3. Analýza dat Výběr modelovacího algoritmu Prvním krokem při samotné analýze dat je výběr konkrétního algoritmu, který bude využit pro modelování. Většina modelovacích technik má určité předpoklady, které by se měly ověřit před začátkem analýzy. Může jít o předpoklady na rozdělení sledovaných veličin, předpoklad úplnosti dat atp. V realitě nejsou předpoklady nikdy přesně splněny, ale snažíme se, aby byly splněny alespoň přibližně. Například odstraníme odlehlé hodnoty, které silně ovlivňují rozdělení veličin, nebo se vhodnou transformací přiblížíme k symetrickému rozdělení okolo průměru. Některé nejčastěji používané modelovací techniky: diskriminační analýza, seskupovací analýza, korelační analýza. Doporučení: Výběr konkrétního algoritmu vždy závisí na typu řešené úlohy. Často jsme také nuceni kombinovat výsledky několika algoritmů či vybírat z několika modelů ten nejvíce vyhovující. Design modelu Ještě před vytvořením modelu bychom měli mít nástroj na měření kvality či přesnosti našeho modelu. Například v supervizovaných (známe cílovou proměnnou) dataminingových úlohách, jako je např. klasifikace, je vhodné model posuzovat podle schopnosti rozlišit kategorie cílové proměnné. K tomu je vhodná např. ROC křivka a z ní vycházející Giniho koeficient. Z tohoto důvodu se data rozdělují na dvě disjunktní datové sady. Jedna z nich je trénovací a druhá je testovací. Model připravíme na trénovací datové sadě a ověříme na sadě testovací. 6

7 Výstavba modelu Na připravený datový soubor aplikujeme postupy jednotlivých algoritmů a získáme výsledný model, popřípadě více modelů. V téměř každém algoritmu se vyskytuje množství parametrů, které mohou být upravovány. Na co myslet při budování a výběru modelu: splnění předpokladů modelu, hodnoty parametrů modelu společně se zdůvodněním těchto hodnot, schopnost interpretovat výsledky jednotlivých procedur a možnost implementace do jiných procesů. Obr.3 ROC křivka Posouzení modelu Doporučení: Výsledkem modelování by mělo být rozhodnutí, nalezení skupin či odhad budoucího vývoje. Nesmíme zapomenout, že model je pouze nástroj, ne cíl našeho analytického procesu! V tomto kroku se interpretují výsledky jednotlivých modelů. A to vzhledem k požadavkům na přesnost pro jednotlivé dataminingové úlohy, požadovaným obchodním výstupům atd. Také se v tomto bodě pokusíme srovnat jednotlivé modely mezi sebou a vybrat ten, který dává nejlepší výsledky. Běžně upravujeme parametry některých modelů, vracíme se do fáze budování modelu. Proces opakujeme a model zpřesňujeme, dokud s ním nejsme spokojeni. 4. Predikce Skupiny úloh Jedním z možných dělení dataminingových úloh je dělení na skupinu supervizovaných a nesupervizovaných modelů. Supervizované úlohy: (učení s učitelem) regresní modely, klasifikační modely (logistická regrese, klasifikační stromy, diskriminační analýza, neuronové sítě atd.), modely časových řad, asociační a sekvenční pravidla. Supervizované úlohy jsou charakteristické tím, že máme nějakou informaci o tom, jak by řešení mělo vypadat (historická zkušenost, výsledky experimentu ). Náplní úlohy je prozkoumání toho, co známe, vytvoření statisticko-matematického algoritmu (modelu) a jeho následná aplikace na neznámé příklady. 7

8 Některé konkrétní úlohy, které se řeší pomocí supervizovaných modelů, jsou např. zacílení kampaně, odhad hodnoty zákazníka nebo plánování prodejů do budoucna atd. Nesupervizované úlohy: (učení bez učitele) detekce anomálií, analýza sociálních sítí, seskupování. U nesupervizovaných úloh neexistuje cílová proměnná a nemáme tudíž náznak toho, jak by řešení mělo vypadat. Jedná se o obecné prohledávání dat bez předem definovaného výsledku (hledání skrytých podobností, vztahů a anomálií). Může se také jednat o porovnávání profilů, hledání sociálních vazeb či skupin. Pomocí nesupervizovaných modelů se řeší např. segmentace zákazníků, detekce podvodů, RFM analýza atd. Časové řady Časové řady se svou povahou liší od standardních dataminingových úloh. Jednou z odlišností je například uspořádání v datové matici. V případě časové řady je předmětem analýzy sloupec v datové matici na rozdíl od běžných dataminingových úloh, kde jím je řádek. V případě časové řady jsou také řádky na sobě závislé a musejí být chronologicky uspořádány. Základními přístupy k analýze časových řad je tzv. dekompozice nebo Box Jenkinsonova ARIMA metodologie. V případě dekompozice se snažíme o rozklad časové řady na jednotlivé složky, jako jsou trend, sezónnost, cyklus a náhodná složka. Jedná se o modelování systematické složky v časové řadě. Výhodou tohoto přístupu je relativní jednoduchost (základní regresní funkce) a snadná interpretace modelu. Metoda také nepotřebuje tolik dat, jako ARIMA. Nevýhodu je nemožnost předpovídat složitější časové řady, které se ale v praxi často vyskytují. Obr. 4 Graf autokorelační funkce 8

9 ARIMA modelování využívá tři druhy procesů. Jedná se o autoregresní proces (AR), proces klouzavých průměrů (MA) a integrovaný proces. Předpoklady pro ARIMA modely jsou dostatek pozorování (uvádí se alespoň 50) a stacionarita. Tu můžeme chápat jako ustálené pravděpodobnostní chování. Důležitými pojmy jsou zde také autokorelační (ACF) a parciální autokorelační funkce (PACF). Tyto funkce ukazují vztahy mezi hodnotami řady vzdálených o daný počet období. Cílem je vyčistit ACF a PACF tak, aby nebyl (téměř) žádný korelační koeficient významný a v časové řadě zůstal pouze tzv. bílý šum. Výhodou tohoto přístupu je jeho všeobecné používání v různých softwarech, dobré vlastnosti krátkodobých a střednědobých predikcí. Nevýhodou je požadavek na dostatečný počet pozorování, použití složitějších statistických postupů a nemožnost interpretace. 5. Reportování a zavedení do praxe Poslední fází analytického procesu by mělo být reportování a prezentace výsledků. Report by měl sloužit jako podpora pro rozhodování. Data by v něm měla být dostatečně přehledná a jednoduchá na pochopení, na druhé straně by měla zachycovat vše podstatné. Také může mít formu pouhého shrnutí nebo se naopak může jednat o finální prezentaci výsledku dataminingového procesu. Určitě by v něm neměly chybět nalezené výsledky, popis procesu, kterým jsme při získávání výsledků prošli, jakékoliv odchylky od původního plánu či doporučení do budoucna. Výsledná podoba reportu je velice závislá na tom, komu jej budeme prezentovat. Může se tedy stát, že pro jednu úlohu budeme mít několik různých výstupů. Obr. 5 Ukázka z reportu ze softwaru PS IMAGO Doporučení: Při zavádění výsledků do praxe, je důležité mít systém na hodnocení přesnosti modelu a při jakékoliv změně situace pružně reagovat. Ať už úpravou modelu stávajícího, nebo vytvořením modelu zcela nového. Také je dobré sledovat vývojové aspekty obchodního prostředí a případné změny okamžitě implementovat. 9

10 Závěrem je nutné zmínit, že problematika analytického procesu může být mnohem komplexnější a objevují se překážky, které se musí řešit ad hoc. Dalším hlediskem, na které musí člověk myslet, jsou náklady. Celkovým výstupem by mělo být zavedení nového postupu, odhalení podvodů či identifikace nejdůležitějších zákazníků a s tím spojené navýšení zisků či úspora nákladů. Mimo to bychom měli být schopni využít znalosti a zkušenosti získané v průběhu celého procesu, například při řešení budoucího analytického problému. Velice důležitý je také výběr softwaru, pomocí kterého se získaná data analyzují. Na trhu se vyskytuje celá řada více či méně profesionálních softwarů a některé svými schopnostmi na straně jedné a uživatelskou přívětivostí na straně druhé převyšují ostatní. Výše uvedené obrázky a grafy byly vytvořeny pomocí softwaru IBM SPSS Statistics a PS IMAGO. Kdo je ACREA ACREA je certifikovaným partnerem společnosti IBM Česká republika pro prodej softwaru IBM SPSS v České a Slovenské republice a poskytovatelem analytických, statistických a dataminingových služeb. Pomůžeme vám s přípravou vašich dat pro odbornou analýzu a její samotné zpracování naučit se, jak data zpracovat a pochopit základy statistiky a data miningu vytěžit ze svých dat potřebné informace pro predikci budoucího vývoje Jak to dokážeme? Díky dlouholetým zkušenostem z různorodých analytických projektů, spolehlivému softwaru SPSS a především díky znalostem našeho týmu lektorů a analytiků. PS Quaestio Remark Portfolio softwarových produktů ACREA: IBM Cognos IBM SPSS Collaboration & Deployment Services IBM SPSS Statistics PS Imago IBM SPSS Modeler PS Clementine ACREA CR, spol. s r. o. Krakovská Praha 1 tel.: info@acrea.cz web:

IBM SPSS Exact Tests. Přesné analýzy malých datových souborů. Nejdůležitější. IBM SPSS Statistics

IBM SPSS Exact Tests. Přesné analýzy malých datových souborů. Nejdůležitější. IBM SPSS Statistics IBM Software IBM SPSS Exact Tests Přesné analýzy malých datových souborů Při rozhodování o existenci vztahu mezi proměnnými v kontingenčních tabulkách a při používání neparametrických ů analytici zpravidla

Více

ANALÝZA NÁKUPNÍHO KOŠÍKU SEMINÁŘ

ANALÝZA NÁKUPNÍHO KOŠÍKU SEMINÁŘ ANALÝZA NÁKUPNÍHO KOŠÍKU SEMINÁŘ 18.11.2012 Radim Tvardek, Petr Bulava, Daniel Mašek U&SLUNO a.s. I Sadová 28 I 702 00 Ostrava I Czech Republic PŘEDPOKLADY PRO ANALÝZU NÁKUPNÍHO KOŠÍKU 18.11.2012 Daniel

Více

Cíle supervizovaného učení Ondřej Háva

Cíle supervizovaného učení Ondřej Háva Cíle supervizovaného učení Ondřej Háva ACREA CR Využíváme více než 40 let zkušeností IBM s hlavním cílem: řízení rozhodovacích procesů Akvizice SPSS společností IBM v říjnu 2009 Přejmenování SPSS CR na

Více

Profitabilita klienta v kontextu Performance management

Profitabilita klienta v kontextu Performance management IBM Technical specialist team Pre Sale 26/10/2010 Profitabilita klienta v kontextu Performance management Co všechno řadíme do PM? Automatická data Běžný reporting Pokročilé statistické modely Včera What

Více

IBM SPSS Modeler Professional

IBM SPSS Modeler Professional IBM SPSS Modeler Professional 16 IBM SPSS Software IBM SPSS Modeler Professional Včasné rozhodnutí díky přesným informacím Metodami data miningu získáte detailní přehled o svém současném stavu i jasnější

Více

Příprava dat v softwaru Statistica

Příprava dat v softwaru Statistica Příprava dat v softwaru Statistica Software Statistica obsahuje pokročilé nástroje pro přípravu dat a tvorbu nových proměnných. Tyto funkcionality přinášejí značnou úsporu času při přípravě datového souboru,

Více

IBM SPSS Modeler. Hlavní přínosy. Intuitivní ovládání IBM

IBM SPSS Modeler. Hlavní přínosy. Intuitivní ovládání IBM IBM SPSS Software IBM SPSS Modeler Objevte vzory v historických datech, které budou sloužit k predikci budoucích událostí, dělejte lepší rozhodnutí a dosáhněte lepších výsledků. IBM SPSS Modeler je komlpexní

Více

IBM SPSS Decision Trees

IBM SPSS Decision Trees IBM Software IBM SPSS Decision Trees Jednoduše identifikujte skupiny a predikujte Stromově uspořádané postupné štěpení dat na homogenní podmnožiny je technika vhodná pro exploraci vztahů i pro tvorbu rozhodovacích

Více

Úvodem Dříve les než stromy 3 Operace s maticemi

Úvodem Dříve les než stromy 3 Operace s maticemi Obsah 1 Úvodem 13 2 Dříve les než stromy 17 2.1 Nejednoznačnost terminologie 17 2.2 Volba metody analýzy dat 23 2.3 Přehled vybraných vícerozměrných metod 25 2.3.1 Metoda hlavních komponent 26 2.3.2 Faktorová

Více

Popisná statistika. Komentované řešení pomocí MS Excel

Popisná statistika. Komentované řešení pomocí MS Excel Popisná statistika Komentované řešení pomocí MS Excel Vstupní data Máme k dispozici data o počtech bodů z 1. a 2. zápočtového testu z Matematiky I v zimním semestru 2015/2016 a to za všech 762 studentů,

Více

METODY DOLOVÁNÍ V DATECH DATOVÉ SKLADY TEREZA HYNČICOVÁ H2IGE1

METODY DOLOVÁNÍ V DATECH DATOVÉ SKLADY TEREZA HYNČICOVÁ H2IGE1 METODY DOLOVÁNÍ V DATECH DATOVÉ SKLADY TEREZA HYNČICOVÁ H2IGE1 DOLOVÁNÍ V DATECH (DATA MINING) OBJEVUJE SE JIŽ OD 60. LET 20. ST. S ROZVOJEM POČÍTAČOVÉ TECHNIKY DEFINICE PROCES VÝBĚRU, PROHLEDÁVÁNÍ A MODELOVÁNÍ

Více

Moderní systémy pro získávání znalostí z informací a dat

Moderní systémy pro získávání znalostí z informací a dat Moderní systémy pro získávání znalostí z informací a dat Jan Žižka IBA Institut biostatistiky a analýz PřF & LF, Masarykova universita Kamenice 126/3, 625 00 Brno Email: zizka@iba.muni.cz Bioinformatika:

Více

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Analýza dat pro Neurovědy RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Jaro 2014 Institut biostatistiky Janoušová, a analýz Dušek: Analýza dat pro neurovědy Blok 7 Jak hodnotit vztah spojitých proměnných

Více

Informační systémy 2006/2007

Informační systémy 2006/2007 13 Vysoká škola báňská Technická univerzita Ostrava Fakulta strojní, Katedra automatizační techniky a řízení Informační systémy 2006/2007 Ivan Kedroň 1 Obsah Analytické nástroje SQL serveru. OLAP analýza

Více

IBM SPSS Neural Networks

IBM SPSS Neural Networks IBM Software IBM SPSS Neural Networks Nové nástroje pro tvorbu prediktivních modelů Aby mohla Vaše organizace zlepšit rozhodovaní ve všech procesních postupech, potřebuje odhalit vztahy a souvislosti v

Více

Kalendář kurzů. zimní semestr. září 2017 leden Podporujeme Váš profesionální růst

Kalendář kurzů. zimní semestr. září 2017 leden Podporujeme Váš profesionální růst Kalendář kurzů zimní semestr září 2017 leden 2018 Statistika a analýza dat Data mining Marketingové analýzy Software IBM SPSS Podporujeme Váš profesionální růst doc. RNDr. Jan Řehák Vzdělávání v oblastech

Více

POPISNÁ STATISTIKA Komentované řešení pomocí programu Statistica

POPISNÁ STATISTIKA Komentované řešení pomocí programu Statistica POPISNÁ STATISTIKA Komentované řešení pomocí programu Statistica Program Statistica I Statistica je velmi podobná Excelu. Na základní úrovni je to klikací program určený ke statistickému zpracování dat.

Více

5EN306 Aplikované kvantitativní metody I

5EN306 Aplikované kvantitativní metody I 5EN306 Aplikované kvantitativní metody I Přednáška 3 Zuzana Dlouhá Předmět a struktura kurzu 1. Úvod: struktura empirických výzkumů 2. Tvorba ekonomických modelů: teorie 3. Data: zdroje a typy dat, význam

Více

Obsah Úvod Kapitola 1 Než začneme Kapitola 2 Práce s hromadnými daty před analýzou

Obsah Úvod Kapitola 1 Než začneme Kapitola 2 Práce s hromadnými daty před analýzou Úvod.................................................................. 11 Kapitola 1 Než začneme.................................................................. 17 1.1 Logika kvantitativního výzkumu...........................................

Více

K možnostem krátkodobé předpovědi úrovně znečištění ovzduší statistickými metodami. Josef Keder

K možnostem krátkodobé předpovědi úrovně znečištění ovzduší statistickými metodami. Josef Keder K možnostem krátkodobé předpovědi úrovně znečištění ovzduší statistickými metodami Josef Keder Motivace Předpověď budoucí úrovně znečištění ovzduší s předstihem v řádu alespoň několika hodin má význam

Více

Časové řady, typy trendových funkcí a odhady trendů

Časové řady, typy trendových funkcí a odhady trendů Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel 973 442029 email:jirineubauer@unobcz Stochastický proces Posloupnost náhodných veličin {Y t, t = 0, ±1, ±2 } se nazývá stochastický proces

Více

Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012. Tutoriál č. 4: Exploratorní analýza. Jan Kracík

Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012. Tutoriál č. 4: Exploratorní analýza. Jan Kracík Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012 Tutoriál č. 4: Exploratorní analýza Jan Kracík jan.kracik@vsb.cz Statistika věda o získávání znalostí z empirických dat empirická

Více

Ing. Petr Hájek, Ph.D. Podpora přednášky kurzu Aplikace umělé inteligence

Ing. Petr Hájek, Ph.D. Podpora přednášky kurzu Aplikace umělé inteligence APLIKACE UMĚLÉ INTELIGENCE Ing. Petr Hájek, Ph.D. Podpora přednášky kurzu Aplikace umělé inteligence Aplikace umělé inteligence - seminář ING. PETR HÁJEK, PH.D. ÚSTAV SYSTÉMOVÉHO INŽENÝRSTVÍ A INFORMATIKY

Více

Jak využít data o zákaznících ke zvýšení příjmů z prodeje

Jak využít data o zákaznících ke zvýšení příjmů z prodeje Jak využít data o zákaznících ke zvýšení příjmů z prodeje Michal Kadlec Marek Loukotka Lubomíra Červová www.acrea.cz info@acrea.cz Program Dívejte se na budoucnost, ne jen na minulost 1 Jaká data využíváme?

Více

ZÍSKÁVÁNÍ ZNALOSTÍ Z DATABÁZÍ

ZÍSKÁVÁNÍ ZNALOSTÍ Z DATABÁZÍ Metodický list č. 1 Dobývání znalostí z databází Cílem tohoto tematického celku je vysvětlení základních pojmů z oblasti dobývání znalostí z databází i východisek dobývání znalostí z databází inspirovaných

Více

Časové řady, typy trendových funkcí a odhady trendů

Časové řady, typy trendových funkcí a odhady trendů Časové řady, typy trendových funkcí a odhady trendů Jiří Neubauer Katedra ekonometrie FVL UO Brno kancelář 69a, tel 973 442029 email:jirineubauer@unobcz Jiří Neubauer (Katedra ekonometrie UO Brno) Časové

Více

IBM SPSS Modeler Premium

IBM SPSS Modeler Premium IBM SPSS Modeler Premium 16 IBM SPSS Software IBM SPSS Modeler Premium Modelování strukturovaných a nestrukturovaných dat, identifikace entit a analýza sociálních sítí IBM SPSS Modeler Premium je software

Více

Statistika a analýza dat Data mining Marketingové analýzy Software IBM SPSS. Kalendář kurzů letní semestr únor červen 2018

Statistika a analýza dat Data mining Marketingové analýzy Software IBM SPSS. Kalendář kurzů letní semestr únor červen 2018 Statistika a analýza dat Data mining Marketingové analýzy Software IBM SPSS Kalendář kurzů letní semestr únor červen 2018 O nás Vzdělávání v oblastech Centrum výuky ACREA je vzdělávací instituce, která

Více

Lineární regrese. Komentované řešení pomocí MS Excel

Lineární regrese. Komentované řešení pomocí MS Excel Lineární regrese Komentované řešení pomocí MS Excel Vstupní data Tabulka se vstupními daty je umístěna v oblasti A1:B11 (viz. obrázek) na listu cela data Postup Základní výpočty - regrese Výpočet základních

Více

Pořízení licencí statistického SW

Pořízení licencí statistického SW Pořízení licencí statistického SW Zadavatel: Česká školní inspekce, Fráni Šrámka 37, 150 21 Praha 5 IČO: 00638994 Jednající: Mgr. Tomáš Zatloukal Předpokládaná (a maximální cena): 1.200.000 vč. DPH Typ

Více

Obohacení dat o statistické výsledky a potenciál jejich využití 2.2.2011

Obohacení dat o statistické výsledky a potenciál jejich využití 2.2.2011 Obohacení dat o statistické výsledky a potenciál jejich využití 2.2.2011 Společnost SPSS CR nyní výhradní partner IBM pro prodej software IBM SPSS v ČR a SR od roku 1998 franchise SPSS Inc. SPSS Inc. vývoj

Více

Objevte vzory v historických datech, které budou sloužit k predikci budoucích událostí, dělejte lepší rozhodnutí a dosáhněte lepších výsledků.

Objevte vzory v historických datech, které budou sloužit k predikci budoucích událostí, dělejte lepší rozhodnutí a dosáhněte lepších výsledků. IBM SPSS Modeler IBM SPSS Software IBM SPSS Modeler Objevte vzory v historických datech, které budou sloužit k predikci budoucích událostí, dělejte lepší rozhodnutí a dosáhněte lepších výsledků. V obchodní

Více

ZÍSKÁVÁNÍ ZNALOSTÍ Z DATABÁZÍ

ZÍSKÁVÁNÍ ZNALOSTÍ Z DATABÁZÍ metodický list č. 1 Dobývání znalostí z databází Cílem tohoto tematického celku je vysvětlení základních pojmů z oblasti dobývání znalostí z databází i východisek dobývání znalostí z databází inspirovaných

Více

5EN306 Aplikované kvantitativní metody I

5EN306 Aplikované kvantitativní metody I 5EN306 Aplikované kvantitativní metody I Přednáška 3 Zuzana Dlouhá Předmět a struktura kurzu 1. Úvod: struktura empirických výzkumů 2. Tvorba ekonomických modelů: teorie 3. Data: zdroje a typy dat, význam

Více

Strojové učení Marta Vomlelová

Strojové učení Marta Vomlelová Strojové učení Marta Vomlelová marta@ktiml.mff.cuni.cz KTIML, S303 Literatura 1.T. Hastie, R. Tishirani, and J. Friedman. The Elements of Statistical Learning, Data Mining, Inference and Prediction. Springer

Více

KORELACE. Komentované řešení pomocí programu Statistica

KORELACE. Komentované řešení pomocí programu Statistica KORELACE Komentované řešení pomocí programu Statistica Vstupní data I Data umístěná v excelovském souboru překopírujeme do tabulky ve Statistice a pojmenujeme proměnné, viz prezentace k tématu Popisná

Více

PowerOPTI Řízení účinnosti tepelného cyklu

PowerOPTI Řízení účinnosti tepelného cyklu PowerOPTI Řízení účinnosti tepelného cyklu VIZE Zvýšit konkurenceschopnost provozovatelů elektráren a tepláren. Základní funkce: Spolehlivé hodnocení a řízení účinnosti tepelného cyklu, včasná diagnostika

Více

Big Data a oficiální statistika. Unicorn College Open 24. dubna 2015 Doc. Ing. Marie Bohatá, CSc.

Big Data a oficiální statistika. Unicorn College Open 24. dubna 2015 Doc. Ing. Marie Bohatá, CSc. Big Data a oficiální statistika Unicorn College Open 24. dubna 2015 Doc. Ing. Marie Bohatá, CSc. Obsah příspěvku Charakteristiky Big Data Výzvy a úskalí z perspektivy statistiky Výzvy z perspektivy computing

Více

Úvod do analýzy časových řad

Úvod do analýzy časových řad Přednáška STATISTIKA II - EKONOMETRIE Katedra ekonometrie FEM UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Posloupnost náhodných veličin {Y t, t = 0, ±1, ±2... } se nazývá stochastický

Více

Neuronové časové řady (ANN-TS)

Neuronové časové řady (ANN-TS) Neuronové časové řady (ANN-TS) Menu: QCExpert Prediktivní metody Neuronové časové řady Tento modul (Artificial Neural Network Time Series ANN-TS) využívá modelovacího potenciálu neuronové sítě k predikci

Více

POLYNOMICKÁ REGRESE. Jedná se o regresní model, který je lineární v parametrech, ale popisuje nelineární závislost mezi proměnnými.

POLYNOMICKÁ REGRESE. Jedná se o regresní model, který je lineární v parametrech, ale popisuje nelineární závislost mezi proměnnými. POLYNOMICKÁ REGRESE Jedná se o regresní model, který je lineární v parametrech, ale popisuje nelineární závislost mezi proměnnými. y = b 0 + b 1 x + b 2 x 2 + + b n x n kde b i jsou neznámé parametry,

Více

Algoritmy a struktury neuropočítačů ASN - P10. Aplikace UNS v biomedicíně

Algoritmy a struktury neuropočítačů ASN - P10. Aplikace UNS v biomedicíně Aplikace UNS v biomedicíně aplikace v medicíně postup při zpracování úloh Aplikace UNS v medicíně Důvod: nalezení exaktnějších, levnějších a snadnějších metod určování diagnóz pro lékaře nalezení šetrnějších

Více

MODERNÍ METODY SEGMENTACE ZÁKAZNÍKŮ Ing. Miloš Uldrich ZÁKAZNICKÁ LOAJALITA A AKVIZICE VE FINANČNÍCH SLUŽBÁCH. StatSoft CR

MODERNÍ METODY SEGMENTACE ZÁKAZNÍKŮ Ing. Miloš Uldrich ZÁKAZNICKÁ LOAJALITA A AKVIZICE VE FINANČNÍCH SLUŽBÁCH. StatSoft CR Váš pomocník pro analýzu dat MODERNÍ METODY SEGMENTACE ZÁKAZNÍKŮ Ing. Miloš Uldrich StatSoft CR StatSoft StatSoft CR Dodavatel komplexních analytických řešení Výhradní dodavatel softwaru STATISTICA pro

Více

ANALÝZA DAT V R 3. POPISNÉ STATISTIKY, NÁHODNÁ VELIČINA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK

ANALÝZA DAT V R 3. POPISNÉ STATISTIKY, NÁHODNÁ VELIČINA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK ANALÝZA DAT V R 3. POPISNÉ STATISTIKY, NÁHODNÁ VELIČINA Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK www.biostatisticka.cz POPISNÉ STATISTIKY - OPAKOVÁNÍ jedna kvalitativní

Více

Statistické metody v ekonomii. Ing. Michael Rost, Ph.D.

Statistické metody v ekonomii. Ing. Michael Rost, Ph.D. Statistické metody v ekonomii Ing. Michael Rost, Ph.D. Jihočeská univerzita v Českých Budějovicích Cíle kurzu: seznámit posluchače s vybranými statistickými metodami, které jsou aplikovatelné v ekonomických

Více

Analýza dat na PC I.

Analýza dat na PC I. CENTRUM BIOSTATISTIKY A ANALÝZ Lékařská a Přírodovědecká fakulta, Masarykova univerzita Analýza dat na PC I. Popisná analýza v programu Statistica IBA výuka Základní popisná statistika Popisná statistika

Více

Ondřej Bothe, Richard Dobiš

Ondřej Bothe, Richard Dobiš Portfolio PM - "What-if" analýza v plánovací aplikaci Ondřej Bothe, Richard Dobiš 2.2.2011 PM systém : Je to systém, zajišťující komplexní proces práce s daty pro koncového uživatele 1. Plánuj Plán nákladů

Více

Korelace. Komentované řešení pomocí MS Excel

Korelace. Komentované řešení pomocí MS Excel Korelace Komentované řešení pomocí MS Excel Vstupní data Tabulka se vstupními daty je umístěna v oblasti A2:B84 (viz. obrázek) Prvotní představu o tvaru a síle závislosti docházky a počtu bodů nám poskytne

Více

Regresní a korelační analýza

Regresní a korelační analýza Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).

Více

BA_EM Electronic Marketing. Pavel

BA_EM Electronic Marketing. Pavel BA_EM Electronic Marketing Pavel Kotyza @VŠFS Agenda Efektivní data mining jako zdroj relevantních dat o potřebách zákazníků Co je data mining? Je absolutní Je předem neznámý Je užitečný Co jsou data?

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 2010 1.týden (20.09.-24.09. ) Data, typy dat, variabilita, frekvenční analýza

Více

STATISTIKA I Metodický list č. 1 Název tématického celku:

STATISTIKA I Metodický list č. 1 Název tématického celku: STATISTIKA I Metodický list č. 1 Analýza závislostí Základním cílem tohoto tématického celku je seznámit se s pokročilejšími metodami zpracování statistických údajů.. 1. kontingenční tabulky 2. regresní

Více

Regresní a korelační analýza

Regresní a korelační analýza Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).

Více

Data mining. Letní semestr. únor 2016 - červen 2016. Ondřej Brom lektor, analytik, konzultant spoluautor knihy SPSS Praktická analýza dat

Data mining. Letní semestr. únor 2016 - červen 2016. Ondřej Brom lektor, analytik, konzultant spoluautor knihy SPSS Praktická analýza dat Letní semestr únor 2016 - červen 2016 Ondřej Brom lektor, analytik, konzultant spoluautor knihy SPSS Praktická analýza dat Centrum výuky ACREA Začněte číst v budoucnosti a otevřete si cestu k úspěchu prostřednictvím

Více

Automatická detekce anomálií při geofyzikálním průzkumu. Lenka Kosková Třísková NTI TUL Doktorandský seminář, 8. 6. 2011

Automatická detekce anomálií při geofyzikálním průzkumu. Lenka Kosková Třísková NTI TUL Doktorandský seminář, 8. 6. 2011 Automatická detekce anomálií při geofyzikálním průzkumu Lenka Kosková Třísková NTI TUL Doktorandský seminář, 8. 6. 2011 Cíle doktorandské práce Seminář 10. 11. 2010 Najít, implementovat, ověřit a do praxe

Více

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1 Logistická regrese Menu: QCExpert Regrese Logistická Modul Logistická regrese umožňuje analýzu dat, kdy odezva je binární, nebo frekvenční veličina vyjádřená hodnotami 0 nebo 1, případně poměry v intervalu

Více

Učící se klasifikátory obrazu v průmyslu

Učící se klasifikátory obrazu v průmyslu Učící se klasifikátory obrazu v průmyslu FCC průmyslové systémy s.r.o. FCC průmyslové systémy je technicko obchodní společností, působící v oblasti průmyslové automatizace. Tvoří ji dvě základní divize:

Více

Surfujte v business analýze jako profík. Naučíme Vás podpořit klíčová rozhodnutí firmy.

Surfujte v business analýze jako profík. Naučíme Vás podpořit klíčová rozhodnutí firmy. Surfujte v business analýze jako profík Naučíme Vás podpořit klíčová rozhodnutí firmy. Intuice nestačí S čím Vám pomůžeme? Firmy čelí narůstající záplavě dat, posilují své analytické schopnosti a hledají

Více

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica JEDNOVÝBĚROVÉ TESTY Komentované řešení pomocí programu Statistica Vstupní data Data umístěná v excelovském souboru překopírujeme do tabulky ve Statistice a pojmenujeme proměnné, viz prezentace k tématu

Více

Datová kvalita. RNDr. Ondřej Zýka

Datová kvalita. RNDr. Ondřej Zýka Datová kvalita RNDr. Ondřej Zýka 1 Datová kvalita Jedna z kompetencí Data managementu Cíl: Zajistit uživatelům data v kvalitě potřebné k jejich činnosti Kvalita dat: Subjektivní pojem závislý na požadavcích

Více

MODEL TVÁŘECÍHO PROCESU

MODEL TVÁŘECÍHO PROCESU MODEL TVÁŘECÍHO PROCESU Zkouška tlakem na válcových vzorcích 2 Vyhodnocení tlakové zkoušky Síla F způsobí změnu výšky H a průměru D válce. V každém okamžiku při stlačování je přetvárný odpor definován

Více

Získávání znalostí z dat

Získávání znalostí z dat Získávání znalostí z dat Informační a komunikační technologie ve zdravotnictví Získávání znalostí z dat Definice: proces netriviálního získávání implicitní, dříve neznámé a potencionálně užitečné informace

Více

Tématické okruhy pro státní závěrečné zkoušky. Navazující magisterské studium. studijní obor "Management jakosti"

Tématické okruhy pro státní závěrečné zkoušky. Navazující magisterské studium. studijní obor Management jakosti Tématické okruhy pro státní závěrečné zkoušky Navazující magisterské studium studijní obor "Management jakosti" školní rok 2013/2014 Integrované systémy managementu A 1. Koncepce a principy integrovaných

Více

Popisná statistika kvantitativní veličiny

Popisná statistika kvantitativní veličiny StatSoft Popisná statistika kvantitativní veličiny Protože nám surová data obvykle žádnou smysluplnou informaci neposkytnou, je žádoucí vyjádřit tyto ve zhuštěnější formě. V předchozím dílu jsme začali

Více

Korelační a regresní analýza

Korelační a regresní analýza Korelační a regresní analýza Analýza závislosti v normálním rozdělení Pearsonův (výběrový) korelační koeficient: r = s XY s X s Y, kde s XY = 1 n (x n 1 i=0 i x )(y i y ), s X (s Y ) je výběrová směrodatná

Více

Statistika. Regresní a korelační analýza Úvod do problému. Roman Biskup

Statistika. Regresní a korelační analýza Úvod do problému. Roman Biskup Statistika Regresní a korelační analýza Úvod do problému Roman Biskup Jihočeská univerzita v Českých Budějovicích Ekonomická fakulta (Zemědělská fakulta) Katedra aplikované matematiky a informatiky 2008/2009

Více

Pearsonův korelační koeficient

Pearsonův korelační koeficient I I.I Pearsonův korelační koeficient Úvod Předpokládejme, že náhodně vybereme n objektů (nebo osob) ze zkoumané populace. Často se stává, že na každém z objektů měříme ne pouze jednu, ale několik kvantitativních

Více

KGG/STG Statistika pro geografy. Mgr. David Fiedor 4. května 2015

KGG/STG Statistika pro geografy. Mgr. David Fiedor 4. května 2015 KGG/STG Statistika pro geografy 11. Analýza časových řad Mgr. David Fiedor 4. května 2015 Motivace Úvod chceme získat představu o charakteru procesu, která časová řada reprezentuje Jaké jevy lze znázornit

Více

Hodnocení klasifikátoru Test nezávislosti. 14. prosinec Rozvoj aplikačního potenciálu (RAPlus) CZ.1.07/2.4.00/

Hodnocení klasifikátoru Test nezávislosti. 14. prosinec Rozvoj aplikačního potenciálu (RAPlus) CZ.1.07/2.4.00/ Čtyřpolní tabulky Čtyřpolní tabulky 14. prosinec 2012 Rozvoj aplikačního potenciálu (RAPlus) CZ.1.07/2.4.00/17.0117 O čem se bude mluvit? Čtyřpolní tabulky Osnova prezentace Čtyřpolní tabulky 1. přístupy

Více

Katedra kybernetiky laboratoř Inteligentní Datové Analýzy (IDA) Katedra počítačů, Computational Intelligence Group

Katedra kybernetiky laboratoř Inteligentní Datové Analýzy (IDA) Katedra počítačů, Computational Intelligence Group Vytěžování dat Miroslav Čepek, Filip Železný Katedra kybernetiky laboratoř Inteligentní Datové Analýzy (IDA) Katedra počítačů, Computational Intelligence Group Evropský sociální fond Praha & EU: Investujeme

Více

Návod pro práci s SPSS

Návod pro práci s SPSS Návod pro práci s SPSS Návody pro práci s programem SPSS pro kurz Metodologie pro Informační studia a knihovnictví 2 (jaro 2013) Ladislava Zbiejczuk Suchá Instalace programu SPSS najdete v INETu. Po přihlášení

Více

Tématické okruhy pro státní závěrečné zkoušky. Navazující magisterské studium. studijní obor "Management kvality"

Tématické okruhy pro státní závěrečné zkoušky. Navazující magisterské studium. studijní obor Management kvality Tématické okruhy pro státní závěrečné zkoušky Navazující magisterské studium studijní obor "Management kvality" školní rok 2016/2017 Integrované systémy managementu A 1. Koncepce a principy integrovaných

Více

vzorek1 0.0033390 0.0047277 0.0062653 0.0077811 0.0090141... vzorek 30 0.0056775 0.0058778 0.0066916 0.0076192 0.0087291

vzorek1 0.0033390 0.0047277 0.0062653 0.0077811 0.0090141... vzorek 30 0.0056775 0.0058778 0.0066916 0.0076192 0.0087291 Vzorová úloha 4.16 Postup vícerozměrné kalibrace Postup vícerozměrné kalibrace ukážeme na úloze C4.10 Vícerozměrný kalibrační model kvality bezolovnatého benzinu. Dle následujících kroků na základě naměřených

Více

StatSoft Úvod do data miningu

StatSoft Úvod do data miningu StatSoft Úvod do data miningu Tento článek je úvodním povídáním o data miningu, jeho vzniku, účelu a využití. Historie data miningu Rozvoj počítačů, výpočetní techniky a zavedení elektronického sběru dat

Více

Hledání optimální polohy stanic a zastávek na tratích regionálního významu

Hledání optimální polohy stanic a zastávek na tratích regionálního významu Hledání optimální polohy stanic a zastávek na tratích regionálního významu Václav Novotný 31. 10. 2018 Anotace 1. Dopravní obsluha území tratěmi regionálního významu 2. Cíle výzkumu a algoritmus práce

Více

Základy popisné statistiky. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

Základy popisné statistiky. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Základy popisné statistiky Anotace Realitu můžeme popisovat různými typy dat, každý z nich se specifickými vlastnostmi, výhodami, nevýhodami a vlastní sadou využitelných statistických metod -od binárních

Více

Kalendář kurzů letní semestr únor červen 2019

Kalendář kurzů letní semestr únor červen 2019 a analýza dat Data mining Marketingové analýzy Software IBM SPSS Foto: Created by Freepik.com Kalendář kurzů letní semestr únor červen 2019 O nás V Centru výuky ACREA věříme, že v dnešní době nepřeberného

Více

Metodologie práce dětí a mládeže na vědeckých a technických projektech

Metodologie práce dětí a mládeže na vědeckých a technických projektech Metodologie práce dětí a mládeže na vědeckých a technických projektech Proč by měli žáci a studenti pracovat na výzkumných projektech? 1. Učí se celoživotnímu vzdělávání 2. Učí se organizačním schopnostem

Více

EXPERIMENTÁLNÍ MECHANIKA 2 Přednáška 5 - Chyby a nejistoty měření. Jan Krystek

EXPERIMENTÁLNÍ MECHANIKA 2 Přednáška 5 - Chyby a nejistoty měření. Jan Krystek EXPERIMENTÁLNÍ MECHANIKA 2 Přednáška 5 - Chyby a nejistoty měření Jan Krystek 9. května 2019 CHYBY A NEJISTOTY MĚŘENÍ Každé měření je zatíženo určitou nepřesností způsobenou nejrůznějšími negativními vlivy,

Více

DRG systém klasifikuje případy akutní hospitalizační péče do DRG skupin DRG skupiny = nákladově homogenní a klinicky příbuzné skupiny případů

DRG systém klasifikuje případy akutní hospitalizační péče do DRG skupin DRG skupiny = nákladově homogenní a klinicky příbuzné skupiny případů AGENDA Definice kvality DRG systému Statistické metody hodnocení kvality DRG klasifikace Identifikace nenáhodného rozložení případů Využití regresní analýzy nákladů při hledání důvodů v rozdílných nákladech

Více

STATISTICKÉ PROGRAMY

STATISTICKÉ PROGRAMY Slezská univerzita v Opavě Obchodně podnikatelská fakulta v Karviné STATISTICKÉ PROGRAMY VYUŽITÍ EXCELU A SPSS PRO VĚDECKO-VÝZKUMNOU ČINNOST Elena Mielcová, Radmila Stoklasová a Jaroslav Ramík Karviná

Více

Obsah přednášky Jaká asi bude chyba modelu na nových datech?

Obsah přednášky Jaká asi bude chyba modelu na nových datech? Obsah přednášky Jaká asi bude chyba modelu na nových datech? Chyba modelu Bootstrap Cross Validation Vapnik-Chervonenkisova dimenze 2 Chyba skutečná a trénovací Máme 30 záznamů, rozhodli jsme se na jejich

Více

Program Statistica Base 9. Mgr. Karla Hrbáčková, Ph.D.

Program Statistica Base 9. Mgr. Karla Hrbáčková, Ph.D. Program Statistica Base 9 Mgr. Karla Hrbáčková, Ph.D. OBSAH KURZU obsluha jednotlivých nástrojů, funkce pro import dat z jiných aplikací, práce s popisnou statistikou, vytváření grafů, analýza dat, výstupní

Více

Design of Experiment (DOE) Petr Misák. Brno 2017

Design of Experiment (DOE) Petr Misák. Brno 2017 Navrhování experimentů Design of Experiment (DOE) Petr Misák Vysoké učení technické v Brně, Fakulta stavební, Ústav stavebního zkušebnictví Brno 2017 Úvod - Experiment jako nástroj hledání slavné vynálezy

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 2010 1.týden (20.09.-24.09. ) Data, typy dat, variabilita, frekvenční analýza

Více

STATISTIKA. Inovace předmětu. Obsah. 1. Inovace předmětu STATISTIKA... 2 2. Sylabus pro předmět STATISTIKA... 3 3. Pomůcky... 7

STATISTIKA. Inovace předmětu. Obsah. 1. Inovace předmětu STATISTIKA... 2 2. Sylabus pro předmět STATISTIKA... 3 3. Pomůcky... 7 Inovace předmětu STATISTIKA Obsah 1. Inovace předmětu STATISTIKA... 2 2. Sylabus pro předmět STATISTIKA... 3 3. Pomůcky... 7 1 1. Inovace předmětu STATISTIKA Předmět Statistika se na bakalářském oboru

Více

5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza

5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza 5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza 5.1 Vícerozměrná data a vícerozměrná rozdělení Při zpracování vícerozměrných dat se hledají souvislosti mezi dvěma, případně

Více

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Prostá regresní a korelační analýza 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Problematika závislosti V podstatě lze rozlišovat mezi závislostí nepodstatnou, čili náhodnou

Více

Analytické metody v motorsportu

Analytické metody v motorsportu Analytické metody v motorsportu Bronislav Růžička Ústav konstruování Odbor konstruování strojů Fakulta strojního inženýrství Vysoké učení technické v Brně 26. června 2013, FSI VUT v Brně, Česká republika

Více

Datová kvalita. RNDr. Ondřej Zýka

Datová kvalita. RNDr. Ondřej Zýka Datová kvalita RNDr. Ondřej Zýka 1 Datová kvalita Jedna z kompetencí Data managementu Cíl: Zajistit uživatelům data v kvalitě potřebné k jejich činnosti Kvalita dat: Subjektivní pojem závislý na požadavcích

Více

1. Číselné posloupnosti - Definice posloupnosti, základní vlastnosti, operace s posloupnostmi, limita posloupnosti, vlastnosti limit posloupností,

1. Číselné posloupnosti - Definice posloupnosti, základní vlastnosti, operace s posloupnostmi, limita posloupnosti, vlastnosti limit posloupností, KMA/SZZS1 Matematika 1. Číselné posloupnosti - Definice posloupnosti, základní vlastnosti, operace s posloupnostmi, limita posloupnosti, vlastnosti limit posloupností, operace s limitami. 2. Limita funkce

Více

PRODUKTY. Tovek Tools

PRODUKTY. Tovek Tools jsou desktopovou aplikací určenou k vyhledávání informací, tvorbě různých typů analýz a vytváření přehledů a rešerší. Jsou vhodné pro práci i s velkým objemem textových dat z různorodých informačních zdrojů.

Více

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 3. 11.

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 3. 11. UNIVERZITA OBRANY Fakulta ekonomiky a managementu Aplikace STAT1 Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 Jiří Neubauer, Marek Sedlačík, Oldřich Kříž 3. 11. 2012 Popis a návod k použití aplikace

Více

Statistika. Základní pojmy a cíle statistiky. Roman Biskup. (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at) .

Statistika. Základní pojmy a cíle statistiky. Roman Biskup. (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at) . Statistika Základní pojmy a cíle statistiky Roman Biskup (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at)email.cz 12. února 2012 Statistika by Birom Statistika Pojmy a cíle

Více

Tabulka 1. Výběr z datové tabulky

Tabulka 1. Výběr z datové tabulky 1. Zadání domácího úkolu Vyberte si datový soubor obsahující alespoň jednu kvalitativní a jednu kvantitativní proměnnou s alespoň 30 statistickými jednotkami (alespoň 30 jednotlivých údajů). Zdroje dat

Více

DVOUVÝBĚROVÉ A PÁROVÉ TESTY Komentované řešení pomocí programu Statistica

DVOUVÝBĚROVÉ A PÁROVÉ TESTY Komentované řešení pomocí programu Statistica DVOUVÝBĚROVÉ A PÁROVÉ TESTY Komentované řešení pomocí programu Statistica Úloha A) koncentrace glukózy v krvi V této části posoudíme pomocí párového testu, zda nový lék prokazatelně snižuje koncentraci

Více

Aplikace moderních analytických a optimalizačních metod na data získaná z technologií Smart Metering

Aplikace moderních analytických a optimalizačních metod na data získaná z technologií Smart Metering Aplikace moderních analytických a optimalizačních metod na data získaná z technologií Smart Metering Ing. Michal Osladil, Ph.D., IBM Global Business Services CZ, SK & HU Datová exploze Každým dnem je generováno

Více

2. Základní typy dat Spojitá a kategoriální data Základní popisné statistiky Frekvenční tabulky Grafický popis dat

2. Základní typy dat Spojitá a kategoriální data Základní popisné statistiky Frekvenční tabulky Grafický popis dat 2. Základní typy dat Spojitá a kategoriální data Základní popisné statistiky Frekvenční tabulky Grafický popis dat Anotace Realitu můžeme popisovat různými typy dat, každý z nich se specifickými vlastnostmi,

Více

Charakterizují kvantitativně vlastnosti předmětů a jevů.

Charakterizují kvantitativně vlastnosti předmětů a jevů. Měřicí aparatura 1 / 34 Fyzikální veličiny Charakterizují kvantitativně vlastnosti předmětů a jevů. Můžeme je dělit: Podle rozměrů: Bezrozměrné (index lomu, poměry) S rozměrem fyzikální veličiny velikost

Více