prekrocena mez ukazatele kvality.

Rozměr: px
Začít zobrazení ze stránky:

Download "prekrocena mez ukazatele kvality."

Transkript

1 Příklad efektivního využití dataminingových metod v oblasti kontroly kvality výroby Mgr. Petra Beranová Pokud hovoříme o data miningu (dolování dat), většina z nás si jako typické oblasti využití vybaví bankovní sektor, pojišťovny, telekomunikace či například marketing. Použití je samozřejmě daleko širší. Protože dataminingové metody přinášejí řadu nesporných výhod, prosazují se postupně s úspěchem v medicíně, genetickém inženýrství a také například v průmyslové sféře. A právě možnostem využití data miningu v průmyslu je věnován tento článek. Konkrétně se zaměříme na potravinářský průmysl a seznámíme se s aplikací dataminingových metod v oblasti kontroly kvality výroby. S jakými daty budeme pracovat a co je cílem? Soubor popcorn.sta obsahuje data z výrobní linky na praženou kukuřici popcorn. Aby byla výroba efektivní a bylo dosaženo požadované kvality popcornu, je třeba optimálně nastavit parametry výrobního procesu. Určitě nás tedy zajímá, co všechno má podstatný vliv na výslednou kvalitu popcornu a čeho je třeba se vyvarovat, aby kvalita výroby neklesla pod určité meze. Potřebujeme tedy sestavit model, který nám dokáže komplexně popsat vztahy mezi různými nastaveními jednotlivých parametrů výrobního procesu a kvalitou produktu. Tabulka 1: Vstupní data Vstupní data byla získána provedením testů s různým nastavením parametrů výrobního procesu (čísla testů jsou uvedena v prvním sloupci tabulky 1). Nastavení se týkala například obsahu CO 2, hmotnosti dávky, tlaku CO 2, teploty CO 2, ph, tlaku vzduchu, plnění O 2 atd. Kvalita vyrobeného popcornu se posuzovala na základě kvantitativní charakteristiky, uvedené jako ukazatel kvality ve třetím sloupci tabulky 1. 1

2 Jak nejlépe posoudit kvalitu výroby? Samozřejmě je mnoho způsobů, jak můžeme kvalitu posoudit. Pokud chceme mít komplexní pohled na situaci a podchytit i různé složitější vztahy v datech, nabízí se právě možnost použití dataminingových metod. V následujících odstavcích si popíšeme jeden z řady možných přístupů využívajících metody data miningu. Vlastní analýza Ať už se jedná o jakoukoli analýzu, je pochopitelně třeba znát co nejlépe věcnou povahu dat. Na základě expertní analýzy se ukázalo, že kvalita popcornu výrazně klesá, pokud sledovaný ukazatel kvality roste nad mez 0,15. Tím můžeme celý pohled na data zjednodušit a zajímat se o to, zda se hodnota ukazatele kvality dostane pod nebo nad 0,15. Proměnná prekrocena mez ukazatele kvality, která tuto informaci obsahuje, je uvedena v tabulce 1 ve čtvrtém sloupci. Nabývá hodnot 0 a 1 (0 = hodnota 0,15 nebyla překročena, 1 = hodnota 0,15 byla překročena). Dále je třeba poznamenat, že v uvedené analýze se zaměřujeme výhradně na regulovatelné faktory, i když samozřejmě výsledná kvalita popcornu závisí také na faktorech neregulovatelných. Celkově tedy v jednotlivých testech nastavujeme 31 různých parametrů. Sledujeme vliv těchto nastavení a hledáme nejdůležitější faktory, které nejlépe rozlišují mezi hodnotami ukazatele kvality pod a nad mezí 0,15. Pomocí těchto faktorů pak dokážeme vysvětlit příčinu variability ukazatele kvality a efektivně ovlivňovat kvalitu výroby. Jak bude náš model konkrétně vypadat? Závislou proměnnou je kategorická proměnná prekrocena mez ukazatele kvality. Z obrázku 1 je patrné, které charakteristiky na ni mají největší vliv. Obrázek 1: Graf důležitosti vlivu vstupních parametrů 2

3 Největší vliv má parametr nastaveni polohy nadoby. Mezi další důležité parametry patří tlak_h1, tlak_h3, tlak_h2, MFR, prutok CO 2 atd. (řazeno podle klesajícího vlivu). Pro náš model využijeme 15 faktorů, které jsou nejvíce spojovány s kvalitou výroby popcornu. Počet vstupních proměnných jsme tedy zredukovali z původních 31 na 15. S redukcí samozřejmě souvisí také jednodušší interpretace modelu a méně náročné nasazení v praxi. V našem dataminingovém projektu použijeme různé klasifikační modely a poté vyhodnotíme, který přístup k datům vede k dosažení nejlepších výsledků. Pro analýzu využijeme rozhodovací stromy CHAID, boosted stromy, MARSpliny a support vector machines. Účinnost jednotlivých modelů se v praxi velmi často posuzuje na základě různých typů grafů, jako je například graf navýšení (lift chart) či ROC (Receiver Operating Characteristic) křivka. Jejich výhodou je přehlednost a jednoduchá orientace ve výsledcích. Grafy také mívají mnohem větší přesvědčovací schopnost při jednání s managementem. V našem případě využijeme oblíbený lift chart. Obrázek 2: Lift chart posuzující míru efektivity jednotlivých modelů Na obrázku 2 je znázorněn jeden z typů lift chartu % Response Lift Chart. Graf vlevo posuzuje úspěšnost klasifikace do skupiny 0 (hodnota ukazatele kvality nepřekročila mez 0,15). Graf vpravo posuzuje úspěšnost klasifikace do skupiny 1 (hodnota ukazatele kvality překročila mez 0,15). Zaměřme se nyní na graf vlevo. Modrá křivka (baseline) odpovídá situaci, kdy nepoužijeme ke klasifikaci žádný model. Můžeme z ní vyčíst, že zastoupení skupiny 0 v daném souboru je 68%. Ostatní křivky ukazují, jaký efekt přinese použití jednotlivých modelů. Čím více se křivka blíží pravému hornímu rohu, tím lépe model klasifikuje. V naší datové sadě tedy nejlépe klasifikují boosted stromy (na obrázku 2 jsou označeny růžovou barvou). Proč tomu tak je? Lift chart vlevo znázorňuje procentní zastoupení vzorků ze skupiny 0 v určité části datové sady, jejíž prvky jsou seřazeny podle pravděpodobnosti příslušnosti ke skupině 0. Tato pravděpodobnost je vypočtena klasifikačním modelem. Vezměme z celého souboru 20 % vzorků, kterým boosted stromy předpověděly nejvyšší pravděpodobnost, že náleží do skupiny 0 (tj. první dva decily, které jsou odděleny svislou čerchovanou čárou). Díky použitému modelu je v tomto výběru 93 % prvků klasifikovaných do skupiny 0. Je to tedy výrazně více, než kdybychom nepoužili žádný model. V takovém případě by zastoupení 3

4 skupiny 0 v daném vzorku bylo jen 68%. Pokud spočítáme podíl 93 % / 68 %, dostaneme hodnotu navýšení (liftu). Lift vyjadřuje, jak je model efektivní. V našem případě dostáváme hodnotu liftu 1,37. Tedy jinými slovy pomocí boosted stromů dokážeme vybrat 20 % vzorků (první dva decily) tak, že výběr bude obsahovat 1,37krát více vzorků ze skupiny 0, než by tomu bylo bez použití modelu (baseline). Podobně můžeme interpretovat výsledky, které vidíme na obrázku 2 vpravo. Uvažujme opět první dva decily. V efektivitě klasifikace do skupiny 1 zvítězily MARSpliny s liftem 78 % / 32 % = 2,44 vůči baseline. Nyní záleží na odborných znalostech a heuristice, kolik prvních decilů budeme uvažovat pro výběr nejlepšího modelu. Než podrobněji prozkoumáme přesnost, které vítězné modely dosáhly na testovacích datech, popišme si stručně principy těchto metod. Boosting je poměrně nový algoritmus trénování modelů. Jeho základní princip spočívá v tom, že opakovanou změnou vah jednotlivých pozorování vytváří i ze slabých modelů modely velice silné. Výsledkem je pak skupina (třeba i několika set) slabých modelů, z nichž každý je expertem na jednotlivé části vstupního prostoru. Vícerozměrné adaptivní regresní spliny (MARSplines) lze navzdory jménu využít pro klasifikační i regresní problémy s kategoriálními i spojitými vstupními veličinami. MARSpliny jsou neparametrickou modelovací procedurou a nekladou žádné nároky na vztahy mezi vstupními a výstupními proměnnými. Konstrukce modelu místo toho spočívá v určení koeficientů a počtu jednoduchých bázových funkcí. Jejich konstrukce je svým způsobem podobná konstrukci stromů typu C&RT. Velice dobře se uplatňují při řešení úloh s mnoha vstupními proměnnými, kde by jiným metodám mohlo dělat problémy tzv. prokletí rozměrnosti, tj. prudce narůstající výpočetní složitost při použití teoreticky optimálních postupů. Nyní se vraťme k posouzení přesnosti, s jakou naše modely dokážou klasifikovat. Využijeme kontingenční tabulky pro pozorované versus predikované hodnoty závislé proměnné prekrocena mez ukazatele kvality. Tabulka 2: Kontingenční tabulka znázorňující úspěšnost klasifikace pomocí boosted stromů Celková úspěšnost boosted stromů je 77,52 %. Předmětem našeho zájmu je skupina, ve které hodnota ukazatele kvality překročila mez 0,15. Úspěšnost boosted stromů v klasifikaci do této skupiny je 66,99 % (viz tabulka 2). 4

5 Tabulka 3: Kontingenční tabulka znázorňující úspěšnost klasifikace pomocí MARSplinů Pokud jde o MARSpliny, celková úspěšnost je ještě o něco vyšší 78,98 %. Vzorky, u nichž hodnota ukazatele kvality překročila mez 0,15, model správně klasifikuje z 51,13 % (viz tabulka 3). S jakou přesností klasifikují ostatní modely v porovnání s výše uvedenými? Vše je přehledně vidět v tabulce 4. Tabulka 4: Porovnání přesnosti klasifikačních modelů Metoda support vector machines má druhou nejvyšší celkovou klasifikační sílu. Avšak vzorků s hodnotou ukazatele kvality vyšší než 0,15 dokáže tato metoda identifikovat jen 47,9 %. Nejméně v našem případě uspěly rozhodovací stromy CHAID. Pro naše potřeby jsou tedy nejlepšími klasifikátory boosted stromy a MARSpliny. Při rozhodování je třeba také mít na paměti, kolik procent vzorků s hodnotou ukazatele kvality nižší než 0,15 je klasifikováno chybně. Pokud je při výrobě využíván systém alarmů, vede takováto chybná klasifikace ke spuštění falešného alarmu, což může zbytečně způsobit prostoje ve výrobě. Nicméně nejlépe dokážou identifikovat stěžejní skupinu vzorků s ukazatelem kvality vyšším než 0,15 boosted stromy. Finální rozhodnutí, který model zvolit, závisí na mnoha faktorech a vždy je třeba rozhodovat na základě komplexních informací o konkrétním výrobním procesu. 5

6 Závěr Cílem výše uvedeného dataminingového modelování bylo nalezení prediktivního modelu, který dokáže odhalit riziko poklesu kvality výroby popcornu ještě dříve, než dojde k vlastní výrobě, a tak eliminovat možné ztráty. Model natrénovaný a ověřený na historických datech, u nichž známe kvalitu výstupu, můžeme nyní aplikovat na aktuální data, a zajistit tak efektivní kontrolu kvality výroby v reálném čase. Výrobní společnosti jsou díky silné konkurenci nuceny optimalizovat výrobní procesy. Hledají sofistikované a ekonomicky výhodné způsoby řízení a kontroly kvality výrobního procesu pomocí modelování a simulací. Metody demonstrované v tomto článku mohou při řízení a kontrole kvality výrobního procesu výrazně pomoci. V dataminingových technologiích je skrytý velký potenciál. Nasazování v praxi je postupné a masivní využití i v menších výrobních společnostech je věcí budoucnosti. Nicméně praxe již ukázala, že dataminingové aplikace přinášejí zvýšení efektivity v mnoha výrobních procesech. Autorka působí jako senior consultant ve společnosti StatSoft CR. Copyright 2008 StatSoft CR s.r.o. 6

Moderní systémy pro získávání znalostí z informací a dat

Moderní systémy pro získávání znalostí z informací a dat Moderní systémy pro získávání znalostí z informací a dat Jan Žižka IBA Institut biostatistiky a analýz PřF & LF, Masarykova universita Kamenice 126/3, 625 00 Brno Email: zizka@iba.muni.cz Bioinformatika:

Více

Intervalový odhad. Interval spolehlivosti = intervalový odhad nějakého parametru s danou pravděpodobností = konfidenční interval pro daný parametr

Intervalový odhad. Interval spolehlivosti = intervalový odhad nějakého parametru s danou pravděpodobností = konfidenční interval pro daný parametr StatSoft Intervalový odhad Dnes se budeme zabývat neodmyslitelnou součástí statistiky a to intervaly v nejrůznějších podobách. Toto téma je také úzce spojeno s tématem testování hypotéz, a tedy plynule

Více

Popisná statistika. Komentované řešení pomocí MS Excel

Popisná statistika. Komentované řešení pomocí MS Excel Popisná statistika Komentované řešení pomocí MS Excel Vstupní data Máme k dispozici data o počtech bodů z 1. a 2. zápočtového testu z Matematiky I v zimním semestru 2015/2016 a to za všech 762 studentů,

Více

Diagnostika regrese pomocí grafu 7krát jinak

Diagnostika regrese pomocí grafu 7krát jinak StatSoft Diagnostika regrese pomocí grafu 7krát jinak V tomto článečku si uděláme exkurzi do teorie regresní analýzy a detailně se podíváme na jeden jediný diagnostický graf. Jedná se o graf Předpovědi

Více

Popisná statistika kvantitativní veličiny

Popisná statistika kvantitativní veličiny StatSoft Popisná statistika kvantitativní veličiny Protože nám surová data obvykle žádnou smysluplnou informaci neposkytnou, je žádoucí vyjádřit tyto ve zhuštěnější formě. V předchozím dílu jsme začali

Více

Neuronové časové řady (ANN-TS)

Neuronové časové řady (ANN-TS) Neuronové časové řady (ANN-TS) Menu: QCExpert Prediktivní metody Neuronové časové řady Tento modul (Artificial Neural Network Time Series ANN-TS) využívá modelovacího potenciálu neuronové sítě k predikci

Více

Jana Vránová, 3. lékařská fakulta, UK Praha

Jana Vránová, 3. lékařská fakulta, UK Praha Jana Vránová, 3. lékařská fakulta, UK Praha Byla navržena v 60tých letech jako alternativa k metodě nejmenších čtverců pro případ, že vysvětlovaná proměnná je binární Byla především používaná v medicíně

Více

Rozdělování dat do trénovacích a testovacích množin

Rozdělování dat do trénovacích a testovacích množin Rozdělování dat do trénovacích a testovacích množin Marcel Jiřina Rozpoznávání je důležitou metodou při zpracování reálných úloh. Rozpoznávání je definováno dvěma kroky a to pořízením dat o reálném rozpoznávaném

Více

Ing. Petr Hájek, Ph.D. Podpora přednášky kurzu Aplikace umělé inteligence

Ing. Petr Hájek, Ph.D. Podpora přednášky kurzu Aplikace umělé inteligence APLIKACE UMĚLÉ INTELIGENCE Ing. Petr Hájek, Ph.D. Podpora přednášky kurzu Aplikace umělé inteligence Aplikace umělé inteligence - seminář ING. PETR HÁJEK, PH.D. ÚSTAV SYSTÉMOVÉHO INŽENÝRSTVÍ A INFORMATIKY

Více

StatSoft Jaký je mezi nimi rozdíl?

StatSoft Jaký je mezi nimi rozdíl? StatSoft Jaký je mezi nimi rozdíl? GAINS ROC X P okud se zabýváte klasifikačními úlohami, pak většinou potřebujete nějakým způsobem mezi sebou porovnat kvalitu vyprodukovaných modelů. Mezi základní pomůcky

Více

Tvar dat a nástroj přeskupování

Tvar dat a nástroj přeskupování StatSoft Tvar dat a nástroj přeskupování Chtěli jste někdy použít data v jistém tvaru a STATISTICA Vám to nedovolila? Jistě se najde někdo, kdo se v této situaci již ocitl. Není ale potřeba propadat panice,

Více

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica JEDNOVÝBĚROVÉ TESTY Komentované řešení pomocí programu Statistica Vstupní data Data umístěná v excelovském souboru překopírujeme do tabulky ve Statistice a pojmenujeme proměnné, viz prezentace k tématu

Více

Strojové učení Marta Vomlelová

Strojové učení Marta Vomlelová Strojové učení Marta Vomlelová marta@ktiml.mff.cuni.cz KTIML, S303 Literatura 1.T. Hastie, R. Tishirani, and J. Friedman. The Elements of Statistical Learning, Data Mining, Inference and Prediction. Springer

Více

IBM SPSS Decision Trees

IBM SPSS Decision Trees IBM Software IBM SPSS Decision Trees Jednoduše identifikujte skupiny a predikujte Stromově uspořádané postupné štěpení dat na homogenní podmnožiny je technika vhodná pro exploraci vztahů i pro tvorbu rozhodovacích

Více

TESTOVÁNÍ KVALITATIVNÍCH ZNAKŮ V PROGRAMU

TESTOVÁNÍ KVALITATIVNÍCH ZNAKŮ V PROGRAMU TESTOVÁNÍ KVALITATIVNÍCH ZNAKŮ V PROGRAMU Copyright StatSoft CR s.r.o. 2014 Dell Information Management Group, Dell Software Ringhofferova 115/1 155 21 Praha 5 Zličín tel.: +420 233 325 006 fax: +420 233

Více

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1 Logistická regrese Menu: QCExpert Regrese Logistická Modul Logistická regrese umožňuje analýzu dat, kdy odezva je binární, nebo frekvenční veličina vyjádřená hodnotami 0 nebo 1, případně poměry v intervalu

Více

StatSoft Jak poznat vliv faktorů vizuálně

StatSoft Jak poznat vliv faktorů vizuálně StatSoft Jak poznat vliv faktorů vizuálně V tomto článku bychom se rádi věnovali otázce, jak poznat již z grafického náhledu vztahy a závislosti v analýze rozptylu. Pomocí následujících grafických zobrazení

Více

Metodologie pro ISK 2, jaro Ladislava Z. Suchá

Metodologie pro ISK 2, jaro Ladislava Z. Suchá Metodologie pro ISK 2, jaro 2014. Ladislava Z. Suchá Metodologie pro Informační studia a knihovnictví 2 Modul 7: Třídění druhého stupně. Kontingenční tabulky Co se dozvíte v tomto modulu? Co je třídění

Více

K možnostem krátkodobé předpovědi úrovně znečištění ovzduší statistickými metodami. Josef Keder

K možnostem krátkodobé předpovědi úrovně znečištění ovzduší statistickými metodami. Josef Keder K možnostem krátkodobé předpovědi úrovně znečištění ovzduší statistickými metodami Josef Keder Motivace Předpověď budoucí úrovně znečištění ovzduší s předstihem v řádu alespoň několika hodin má význam

Více

Z X 5 0 4 H o d n o c e n í v l i v ů n a ž i v o t n í p r o s t ř e d í. Vybrané metody posuzování dopadu záměrů na životní

Z X 5 0 4 H o d n o c e n í v l i v ů n a ž i v o t n í p r o s t ř e d í. Vybrané metody posuzování dopadu záměrů na životní Z X 5 0 4 H o d n o c e n í v l i v ů n a ž i v o t n í p r o s t ř e d í Vybrané metody posuzování dopadu záměrů na životní prostředí. ř Posuzování dopadu (impaktu) posuzované činnosti na životní prostředí

Více

Pokročilé neparametrické metody. Klára Kubošová

Pokročilé neparametrické metody. Klára Kubošová Pokročilé neparametrické metody Klára Kubošová Pokročilé neparametrické metody Výuka 13 přednášek doplněných o praktické cvičení v SW Úvod do neparametrických metod + princip rozhodovacích stromů Klasifikační

Více

Lineární regrese. Komentované řešení pomocí MS Excel

Lineární regrese. Komentované řešení pomocí MS Excel Lineární regrese Komentované řešení pomocí MS Excel Vstupní data Tabulka se vstupními daty je umístěna v oblasti A1:B11 (viz. obrázek) na listu cela data Postup Základní výpočty - regrese Výpočet základních

Více

ČVUT FEL X36PAA - Problémy a algoritmy. 4. úloha - Experimentální hodnocení algoritmů pro řešení problému batohu

ČVUT FEL X36PAA - Problémy a algoritmy. 4. úloha - Experimentální hodnocení algoritmů pro řešení problému batohu ČVUT FEL X36PAA - Problémy a algoritmy 4. úloha - Experimentální hodnocení algoritmů pro řešení problému batohu Jméno: Marek Handl Datum: 3. 2. 29 Cvičení: Pondělí 9: Zadání Prozkoumejte citlivost metod

Více

StatSoft Úvod do data miningu

StatSoft Úvod do data miningu StatSoft Úvod do data miningu Tento článek je úvodním povídáním o data miningu, jeho vzniku, účelu a využití. Historie data miningu Rozvoj počítačů, výpočetní techniky a zavedení elektronického sběru dat

Více

Ing. Alena Šafrová Drášilová, Ph.D.

Ing. Alena Šafrová Drášilová, Ph.D. Rozhodování Ing. Alena Šafrová Drášilová, Ph.D. Rozhodování??? video Obsah typy rozhodování principy rozhodování rozhodovací fáze základní pojmy hodnotícího procesu rozhodovací podmínky rozhodování v podmínkách

Více

Obsah přednášky Jaká asi bude chyba modelu na nových datech?

Obsah přednášky Jaká asi bude chyba modelu na nových datech? Obsah přednášky Jaká asi bude chyba modelu na nových datech? Chyba modelu Bootstrap Cross Validation Vapnik-Chervonenkisova dimenze 2 Chyba skutečná a trénovací Máme 30 záznamů, rozhodli jsme se na jejich

Více

VYUŽITÍ PRAVDĚPODOBNOSTNÍ METODY MONTE CARLO V SOUDNÍM INŽENÝRSTVÍ

VYUŽITÍ PRAVDĚPODOBNOSTNÍ METODY MONTE CARLO V SOUDNÍM INŽENÝRSTVÍ VYUŽITÍ PRAVDĚPODOBNOSTNÍ METODY MONTE CARLO V SOUDNÍM INŽENÝRSTVÍ Michal Kořenář 1 Abstrakt Rozvoj výpočetní techniky v poslední době umožnil také rozvoj výpočetních metod, které nejsou založeny na bázi

Více

Korelace. Komentované řešení pomocí MS Excel

Korelace. Komentované řešení pomocí MS Excel Korelace Komentované řešení pomocí MS Excel Vstupní data Tabulka se vstupními daty je umístěna v oblasti A2:B84 (viz. obrázek) Prvotní představu o tvaru a síle závislosti docházky a počtu bodů nám poskytne

Více

StatSoft Jak vyzrát na datum

StatSoft Jak vyzrát na datum StatSoft Jak vyzrát na datum Tento článek se věnuje podrobně možnostem práce s proměnnými, které jsou ve formě datumu. A že jich není málo. Pokud potřebujete pracovat s datumem, pak se Vám bude tento článek

Více

Nejvhodnější rozhodovací styl v daném kontextu

Nejvhodnější rozhodovací styl v daném kontextu FAKULTA INFORMATIKY A MANAGEMENTU UNIVERZITA HRADEC KRÁLOVÉ Nejvhodnější rozhodovací styl v daném kontextu Individuální projekt SPM1 Vypracoval: Bc. Martin Petruželka Studijní obor: K-IM2 Emailová adresa:

Více

Úloha - rozpoznávání číslic

Úloha - rozpoznávání číslic Úloha - rozpoznávání číslic Vojtěch Franc, Tomáš Pajdla a Tomáš Svoboda http://cmp.felk.cvut.cz 27. listopadu 26 Abstrakt Podpůrný text pro cvičení předmětu X33KUI. Vysvětluje tři způsoby rozpoznávání

Více

Statistická teorie učení

Statistická teorie učení Statistická teorie učení Petr Havel Marek Myslivec přednáška z 9. týdne 1 Úvod Představme si situaci výrobce a zákazníka, který si u výrobce objednal algoritmus rozpoznávání. Zákazník dodal experimentální

Více

Algoritmy a struktury neuropočítačů ASN P9 SVM Support vector machines Support vector networks (Algoritmus podpůrných vektorů)

Algoritmy a struktury neuropočítačů ASN P9 SVM Support vector machines Support vector networks (Algoritmus podpůrných vektorů) Algoritmy a struktury neuropočítačů ASN P9 SVM Support vector machines Support vector networks (Algoritmus podpůrných vektorů) Autor: Vladimir Vapnik Vapnik, V. The Nature of Statistical Learning Theory.

Více

Regresní a korelační analýza

Regresní a korelační analýza Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).

Více

POPISNÁ STATISTIKA Komentované řešení pomocí programu Statistica

POPISNÁ STATISTIKA Komentované řešení pomocí programu Statistica POPISNÁ STATISTIKA Komentované řešení pomocí programu Statistica Program Statistica I Statistica je velmi podobná Excelu. Na základní úrovni je to klikací program určený ke statistickému zpracování dat.

Více

Západočeská univerzita v Plzni. Fakulta aplikovaných věd. Ivana Kozlová. Modely analýzy obalu dat

Západočeská univerzita v Plzni. Fakulta aplikovaných věd. Ivana Kozlová. Modely analýzy obalu dat Západočeská univerzita v Plzni Fakulta aplikovaných věd SEMESTRÁLNÍ PRÁCE Z PŘEDMĚTU MATEMATICKÉ MODELOVÁNÍ Ivana Kozlová Modely analýzy obalu dat Plzeň 2010 Obsah 1 Efektivnost a její hodnocení 2 2 Základní

Více

ANALÝZA DAT V R 3. POPISNÉ STATISTIKY, NÁHODNÁ VELIČINA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK

ANALÝZA DAT V R 3. POPISNÉ STATISTIKY, NÁHODNÁ VELIČINA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK ANALÝZA DAT V R 3. POPISNÉ STATISTIKY, NÁHODNÁ VELIČINA Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK www.biostatisticka.cz POPISNÉ STATISTIKY - OPAKOVÁNÍ jedna kvalitativní

Více

Projekční algoritmus. Urychlení evolučních algoritmů pomocí regresních stromů a jejich zobecnění. Jan Klíma

Projekční algoritmus. Urychlení evolučních algoritmů pomocí regresních stromů a jejich zobecnění. Jan Klíma Urychlení evolučních algoritmů pomocí regresních stromů a jejich zobecnění Jan Klíma Obsah Motivace & cíle práce Evoluční algoritmy Náhradní modelování Stromové regresní metody Implementace a výsledky

Více

Testy do hodin - souhrnný test - 6. ročník

Testy do hodin - souhrnný test - 6. ročník Kolik procent škol jste předstihli Škola: Název: Obec: BCEH ZŠ a MŠ, Slezská 316 Slavkov - 6. ročník ČESKÝ JAZYK Máte lepší výsledky než 7 % zúčastněných škol. MATEMATIKA Máte lepší výsledky než 7 % zúčastněných

Více

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Analýza dat pro Neurovědy RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Jaro 2014 Institut biostatistiky Janoušová, a analýz Dušek: Analýza dat pro neurovědy Blok 6 Jak analyzovat kategoriální a binární

Více

Experimentální realizace Buquoyovy úlohy

Experimentální realizace Buquoyovy úlohy Experimentální realizace Buquoyovy úlohy ČENĚK KODEJŠKA, JAN ŘÍHA Přírodovědecká fakulta Univerzity Palackého, Olomouc Abstrakt Tato práce se zabývá experimentální realizací Buquoyovy úlohy. Jedná se o

Více

Metodologie pro Informační studia a knihovnictví 2

Metodologie pro Informační studia a knihovnictví 2 Metodologie pro Informační studia a knihovnictví 2 Modul 7: Třídění druhého stupně. Kontingenční tabulky Co se dozvíte v tomto modulu? Co je třídění druhého stupně Jak vytvořit a interpretovat kontingenční

Více

Pokročilé neparametrické metody. Klára Kubošová

Pokročilé neparametrické metody. Klára Kubošová Klára Kubošová Další typy stromů CHAID, PRIM, MARS CHAID - Chi-squared Automatic Interaction Detector G.V.Kass (1980) nebinární strom pro kategoriální proměnné. Jako kriteriální statistika pro větvení

Více

UČENÍ BEZ UČITELE. Václav Hlaváč

UČENÍ BEZ UČITELE. Václav Hlaváč UČENÍ BEZ UČITELE Václav Hlaváč Fakulta elektrotechnická ČVUT v Praze katedra kybernetiky, Centrum strojového vnímání hlavac@fel.cvut.cz, http://cmp.felk.cvut.cz/~hlavac 1/22 OBSAH PŘEDNÁŠKY ÚVOD Učení

Více

11. Trhy výrobních faktorů Průvodce studiem: 11.1 Základní charakteristika trhu výrobních faktorů Poptávka po VF Nabídka výrobního faktoru

11. Trhy výrobních faktorů Průvodce studiem: 11.1 Základní charakteristika trhu výrobních faktorů Poptávka po VF Nabídka výrobního faktoru 11. Trhy výrobních faktorů V předchozích kapitolách jsme zkoumali způsob rozhodování firmy o výstupu a ceně v rámci různých tržních struktur (dokonalá a nedokonalá konkurence). Ačkoli se fungování firem

Více

Lineární klasifikátory

Lineární klasifikátory Lineární klasifikátory Lineární klasifikátory obsah: perceptronový algoritmus základní verze varianta perceptronového algoritmu přihrádkový algoritmus podpůrné vektorové stroje Lineární klasifikátor navrhnout

Více

časovém horizontu na rozdíl od experimentu lépe odhalit chybné poznání reality.

časovém horizontu na rozdíl od experimentu lépe odhalit chybné poznání reality. Modelování dynamických systémů Matematické modelování dynamických systémů se využívá v různých oborech přírodních, technických, ekonomických a sociálních věd. Použití matematického modelu umožňuje popsat

Více

Měření závislosti statistických dat

Měření závislosti statistických dat 5.1 Měření závislosti statistických dat Každý pořádný astronom je schopen vám předpovědět, kde se bude nacházet daná hvězda půl hodiny před půlnocí. Ne každý je však téhož schopen předpovědět v případě

Více

Analýza výsledků maturit 2018 na Gymnáziu Teplice

Analýza výsledků maturit 2018 na Gymnáziu Teplice Analýza výsledků maturit 2018 na Gymnáziu Teplice Situace k analýze, data Jakub Mráček U maturit 2018 na Gymnáziu Teplice propadlo větší procento studentů, než bylo obvyklé (cca 14 % oproti dlouhodobě

Více

Trénování sítě pomocí učení s učitelem

Trénování sítě pomocí učení s učitelem Trénování sítě pomocí učení s učitelem! předpokládá se, že máme k dispozici trénovací množinu, tj. množinu P dvojic [vstup x p, požadovaný výstup u p ]! chceme nastavit váhy a prahy sítě tak, aby výstup

Více

Fyzikální korespondenční seminář MFF UK

Fyzikální korespondenční seminář MFF UK Úloha I.S... náhodná 10 bodů; průměr 7,04; řešilo 45 studentů a) Zkuste vlastními slovy popsat, co je to náhodná veličina a jaké má vlastnosti (postačí vlastními slovy objasnit následující pojmy: náhodná

Více

TPS1200 Setup Protínání zpět. Pozn.: některé dialogy TPS1200 musely být převzaty z orig. textu a jsou tudíž v angličtině

TPS1200 Setup Protínání zpět. Pozn.: některé dialogy TPS1200 musely být převzaty z orig. textu a jsou tudíž v angličtině TPS1200 Setup Protínání zpět Pozn.: některé dialogy TPS1200 musely být převzaty z orig. textu a jsou tudíž v angličtině Metoda Protínání zpět je u přístrojů TPS1200 použita pro následující výpočty: 2D

Více

Regresní a korelační analýza

Regresní a korelační analýza Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).

Více

STATISTICKÉ ODHADY Odhady populačních charakteristik

STATISTICKÉ ODHADY Odhady populačních charakteristik STATISTICKÉ ODHADY Odhady populačních charakteristik Jak stanovit charakteristiky rozložení sledované veličiny v základní populaci? Populaci většinou nemáme celou k dispozici, musíme se spokojit jen s

Více

Diskriminační analýza hodnocení rozdílů mezi 2 nebo více skupinami objektů charakterizovanými více znaky

Diskriminační analýza hodnocení rozdílů mezi 2 nebo více skupinami objektů charakterizovanými více znaky Diskriminační analýza hodnocení rozdílů mezi 2 nebo více skupinami objektů charakterizovanými více znaky Interpretují rozdíly mezi předem stanovenými třídami Cílem je klasifikace objektů do skupin Hledáme

Více

KORELACE. Komentované řešení pomocí programu Statistica

KORELACE. Komentované řešení pomocí programu Statistica KORELACE Komentované řešení pomocí programu Statistica Vstupní data I Data umístěná v excelovském souboru překopírujeme do tabulky ve Statistice a pojmenujeme proměnné, viz prezentace k tématu Popisná

Více

3. Optimalizace pomocí nástroje Řešitel

3. Optimalizace pomocí nástroje Řešitel 3. Optimalizace pomocí nástroje Řešitel Rovnováha mechanické soustavy Uvažujme dvě různé nehmotné lineární pružiny P 1 a P 2 připevněné na pevné horizontální tyči splývající s osou x podle obrázku: (0,0)

Více

StatSoft Jak se pozná normalita pomocí grafů?

StatSoft Jak se pozná normalita pomocí grafů? StatSoft Jak se pozná normalita pomocí grafů? Dnes se podíváme na zoubek speciální třídě grafů, podle názvu článku a případně i ilustračního obrázku vpravo jste jistě již odhadli, že půjde o třídu pravděpodobnostních

Více

Gymnázium a Střední odborná škola, Rokycany, Mládežníků 1115

Gymnázium a Střední odborná škola, Rokycany, Mládežníků 1115 Číslo projektu: Gymnázium a Střední odborná škola, Rokycany, Mládežníků 1115 Číslo šablony: 8 Název materiálu: Ročník: Identifikace materiálu: Jméno autora: Předmět: Tématický celek: Anotace: CZ.1.07/1.5.00/34.0410

Více

2. Bodové a intervalové rozložení četností

2. Bodové a intervalové rozložení četností . Bodové a intervalové rozložení četností (Jak získat informace z datového souboru?) Po prostudování této kapitoly budete umět: konstruovat diagramy znázorňující rozložení četností vytvářet tabulky četností

Více

StatSoft Úvod do neuronových sítí

StatSoft Úvod do neuronových sítí StatSoft Úvod do neuronových sítí Vzhledem k vzrůstající popularitě neuronových sítí jsme se rozhodli Vám je v tomto článku představit a říci si něco o jejich využití. Co si tedy představit pod pojmem

Více

Statistické metody v ekonomii. Ing. Michael Rost, Ph.D.

Statistické metody v ekonomii. Ing. Michael Rost, Ph.D. Statistické metody v ekonomii Ing. Michael Rost, Ph.D. Jihočeská univerzita v Českých Budějovicích Cíle kurzu: seznámit posluchače s vybranými statistickými metodami, které jsou aplikovatelné v ekonomických

Více

Pravděpodobně skoro správné. PAC učení 1

Pravděpodobně skoro správné. PAC učení 1 Pravděpodobně skoro správné (PAC) učení PAC učení 1 Výpočetní teorie strojového učení Věta o ošklivém kačátku. Nechť E je klasifikovaná trénovací množina pro koncept K, který tvoří podmnožinu konečného

Více

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Analýza dat pro Neurovědy RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Jaro 2014 Institut biostatistiky Janoušová, a analýz Dušek: Analýza dat pro neurovědy Blok 7 Jak hodnotit vztah spojitých proměnných

Více

Rozhodování. Ing. Alena Šafrová Drášilová, Ph.D.

Rozhodování. Ing. Alena Šafrová Drášilová, Ph.D. Rozhodování Ing. Alena Šafrová Drášilová, Ph.D. Rozhodování??? video Obsah typy rozhodování principy rozhodování rozhodovací fáze základní pojmy hodnotícího procesu rozhodovací podmínky rozhodování v podmínkách

Více

ZÍSKÁVÁNÍ ZNALOSTÍ Z DATABÁZÍ

ZÍSKÁVÁNÍ ZNALOSTÍ Z DATABÁZÍ Metodický list č. 1 Dobývání znalostí z databází Cílem tohoto tematického celku je vysvětlení základních pojmů z oblasti dobývání znalostí z databází i východisek dobývání znalostí z databází inspirovaných

Více

Statistické vyhodnocení průzkumu funkční gramotnosti žáků 4. ročníku ZŠ

Statistické vyhodnocení průzkumu funkční gramotnosti žáků 4. ročníku ZŠ Statistické vyhodnocení průzkumu funkční gramotnosti žáků 4. ročníku ZŠ Ing. Dana Trávníčková, PaedDr. Jana Isteníková Funkční gramotnost je používání čtení a psaní v životních situacích. Nejde jen o elementární

Více

Algoritmy a struktury neuropočítačů ASN - P10. Aplikace UNS v biomedicíně

Algoritmy a struktury neuropočítačů ASN - P10. Aplikace UNS v biomedicíně Aplikace UNS v biomedicíně aplikace v medicíně postup při zpracování úloh Aplikace UNS v medicíně Důvod: nalezení exaktnějších, levnějších a snadnějších metod určování diagnóz pro lékaře nalezení šetrnějších

Více

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Prostá regresní a korelační analýza 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Problematika závislosti V podstatě lze rozlišovat mezi závislostí nepodstatnou, čili náhodnou

Více

{ } ( 2) Příklad: Test nezávislosti kategoriálních znaků

{ } ( 2) Příklad: Test nezávislosti kategoriálních znaků Příklad: Test nezávislosti kategoriálních znaků Určete na hladině významnosti 5 % na základě dat zjištěných v rámci dotazníkového šetření ve Šluknově, zda existuje závislost mezi pohlavím respondenta a

Více

Příprava dat v softwaru Statistica

Příprava dat v softwaru Statistica Příprava dat v softwaru Statistica Software Statistica obsahuje pokročilé nástroje pro přípravu dat a tvorbu nových proměnných. Tyto funkcionality přinášejí značnou úsporu času při přípravě datového souboru,

Více

Credit scoring. Libor Vajbar Analytik řízení rizik. 18. dubna 2013. Brno

Credit scoring. Libor Vajbar Analytik řízení rizik. 18. dubna 2013. Brno Credit scoring Libor Vajbar Analytik řízení rizik 18. dubna 2013 Brno 1 PROFIL SPOLEČNOSTI Home Credit a.s. přední poskytovatel spotřebitelského financování Úvěrové produkty nákup na splátky u obchodních

Více

Asociační i jiná. Pravidla. (Ch )

Asociační i jiná. Pravidla. (Ch ) Asociační i jiná Pravidla (Ch. 14 +...) Učení bez učitele Nemáme cílovou třídu Y, G; máme N pozorování což jsou p-dimenzionální vektory se sdruženou pravděpodobností chceme odvozovat vlastnosti. Pro málo

Více

3.3 Data použitá v analýze

3.3 Data použitá v analýze ALCHYMIE NEPOJISTNÝCH SOCIÁLNÍCH DÁVEK 3.3 Data použitá v analýze V kapitole se vychází zejména z mikrodat statistického šetření SILC, které je dnes jednotně využíváno ve všech zemích EU k měření sociální

Více

LINEÁRNÍ REGRESE Komentované řešení pomocí programu Statistica

LINEÁRNÍ REGRESE Komentované řešení pomocí programu Statistica LINEÁRNÍ REGRESE Komentované řešení pomocí programu Statistica Vstupní data Data umístěná v excelovském souboru překopírujeme do tabulky ve Statistice a pojmenujeme proměnné, viz prezentace k tématu Popisná

Více

Regresní analýza. Eva Jarošová

Regresní analýza. Eva Jarošová Regresní analýza Eva Jarošová 1 Obsah 1. Regresní přímka 2. Možnosti zlepšení modelu 3. Testy v regresním modelu 4. Regresní diagnostika 5. Speciální využití Lineární model 2 1. Regresní přímka 3 nosnost

Více

Metody výběru variant

Metody výběru variant Metody výběru variant Používají se pro výběr v případě více variant řešení stejného problému Lze vybírat dle jednoho nebo více kritérií V případě více kritérií mohou mít všechna stejnou důležitost nebo

Více

Cvičení 12: Binární logistická regrese

Cvičení 12: Binární logistická regrese Cvičení 12: Binární logistická regrese Příklad: V roce 2014 konalo státní závěrečné zkoušky bakalářského studia na jisté fakultě 167 studentů. U každého studenta bylo zaznamenáno jeho pohlaví (0 žena,

Více

podnikatelských koncepcí, objasnit přístupy sektoru finančních služeb k trhu a

podnikatelských koncepcí, objasnit přístupy sektoru finančních služeb k trhu a Metodický list pro první soustředění kombinovaného studia ------------------------------------------------------------------------------------- Název tematického celku: MARKETINGOVÉ ŘÍZENÍ. KLIENT. Cíl:

Více

Předzpracování dat. Lenka Vysloužilová

Předzpracování dat. Lenka Vysloužilová Předzpracování dat Lenka Vysloužilová 1 Metodika CRISP-DM (www.crisp-dm.org) Příprava dat Data Preparation příprava dat pro modelování selekce příznaků výběr relevantních příznaků čištění dat získávání

Více

Program Statistica Base 9. Mgr. Karla Hrbáčková, Ph.D.

Program Statistica Base 9. Mgr. Karla Hrbáčková, Ph.D. Program Statistica Base 9 Mgr. Karla Hrbáčková, Ph.D. OBSAH KURZU obsluha jednotlivých nástrojů, funkce pro import dat z jiných aplikací, práce s popisnou statistikou, vytváření grafů, analýza dat, výstupní

Více

Téma 9: Vícenásobná regrese

Téma 9: Vícenásobná regrese Téma 9: Vícenásobná regrese 1) Vytvoření modelu V menu Statistika zvolíme nabídku Vícerozměrná regrese. Aktivujeme kartu Detailní nastavení viz obr.1. Nastavíme Proměnné tak, že v příslušném okně viz.

Více

Stanovení nejistot při výpočtu kontaminace zasaženého území

Stanovení nejistot při výpočtu kontaminace zasaženého území Stanovení nejistot při výpočtu kontaminace zasaženého území Michal Balatka Abstrakt Hodnocení ekologického rizika kontaminovaných území představuje komplexní úlohu, která vyžaduje celou řadu vstupních

Více

Studie webů automobilek

Studie webů automobilek Studie webů automobilek červen 2006 [manažerské shrnutí] Obsah Obsah... 1 Manažerské shrnutí... 2 Kvalita obsahu a použitelnost webu... 3 Základní nedostatky negativně ovlivňují použitelnost většiny webů...

Více

Pro zvládnutí této kapitoly budete potřebovat 4-5 hodin studia.

Pro zvládnutí této kapitoly budete potřebovat 4-5 hodin studia. Úvod (Proč se zabývat statistikou?) Statistika je metoda analýzy dat, která nachází široké uplatnění v celé řadě ekonomických, technických, přírodovědných a humanitních disciplín. Její význam v poslední

Více

SLOŽENÉ ÚROKOVÁNÍ. částky naspořené po n letech při m úrokových obdobích za jeden rok platí formule

SLOŽENÉ ÚROKOVÁNÍ. částky naspořené po n letech při m úrokových obdobích za jeden rok platí formule Klasický termínovaný vklad SLŽENÉ ÚRKVÁNÍ PŘÍKLAD: Podnikatel uložil na klasický termínovaný vklad částku 300 000 Kč. Jaká bude výše kapitálu za 3 roky, jestliže úroková sazba činí 2% p.a. a je a) roční

Více

FAKULTA INFORMATIKY A MANAGEMENTU UNIVERZITA HRADEC KRÁLOVÉ VOLBA TECHNOLOGIE. Semestrální práce MIE2

FAKULTA INFORMATIKY A MANAGEMENTU UNIVERZITA HRADEC KRÁLOVÉ VOLBA TECHNOLOGIE. Semestrální práce MIE2 FAKULTA INFORMATIKY A MANAGEMENTU UNIVERZITA HRADEC KRÁLOVÉ VOLBA TECHNOLOGIE Semestrální práce MIE2 Vypracoval: Bc. Martin Petruželka Studijní obor: K-IM2 Emailová adresa: Martin.Petruzelka@uhk.cz Datum

Více

DATA MINING KLASIFIKACE DMINA LS 2009/2010

DATA MINING KLASIFIKACE DMINA LS 2009/2010 DATA MINING KLASIFIKACE DMINA LS 2009/2010 Osnova co je to klasifikace typy klasifikátoru typy výstupu jednoduchý klasifikátor (1R) rozhodovací stromy Klasifikace (ohodnocení) zařazuje data do předdefinovaných

Více

7 Kardinální informace o kritériích (část 1)

7 Kardinální informace o kritériích (část 1) 7 Kardinální informace o kritériích (část 1) Předpokládejme stejná značení jako v předchozích cvičeních. Kardinální informací o kritériích se rozumí ohodnocení jejich důležitosti k pomocí váhového vektoru

Více

Josef Keder, Lenka Janatová Český hydrometeorologický ústav

Josef Keder, Lenka Janatová Český hydrometeorologický ústav ZHODNOENÍ MOŽNOSTI SNÍŽENÍ ČETNOSTI VÝSKYTU PŘEKRAČOVÁNÍ IMISNÍH LIMITŮ ESTOU REGULAE EMISÍ Josef Keder, Lenka Janatová Český hydrometeorologický ústav MOTIVAE Potřeba aplikace vhodných opatření k expozici

Více

Protokol č. 7. Jednotné objemové křivky. Je zadána výměra porostu, výška dřevin a počty stromů v jednotlivých tloušťkových stupních.

Protokol č. 7. Jednotné objemové křivky. Je zadána výměra porostu, výška dřevin a počty stromů v jednotlivých tloušťkových stupních. Protokol č. 7 Jednotné objemové křivky Zadání: Pro zadané dřeviny stanovte zásobu pomocí JOK tabulek. Součástí protokolu bude tabulka obsahující střední Weisseho tloušťku, Weisseho procento, číslo JOK,

Více

Optimální rozdělující nadplocha 4. Support vector machine. Adaboost.

Optimální rozdělující nadplocha 4. Support vector machine. Adaboost. Optimální rozdělující nadplocha. Support vector machine. Adaboost. Petr Pošík Czech Technical University in Prague Faculty of Electrical Engineering Dept. of Cybernetics Opakování Lineární diskriminační

Více

Pearsonův korelační koeficient

Pearsonův korelační koeficient I I.I Pearsonův korelační koeficient Úvod Předpokládejme, že náhodně vybereme n objektů (nebo osob) ze zkoumané populace. Často se stává, že na každém z objektů měříme ne pouze jednu, ale několik kvantitativních

Více

Změkčování hranic v klasifikačních stromech

Změkčování hranic v klasifikačních stromech Změkčování hranic v klasifikačních stromech Jakub Dvořák Seminář strojového učení a modelování 24.5.2012 Obsah Klasifikační stromy Změkčování hran Ranking, ROC křivka a AUC Metody změkčování Experiment

Více

ZÍSKÁVÁNÍ ZNALOSTÍ Z DATABÁZÍ

ZÍSKÁVÁNÍ ZNALOSTÍ Z DATABÁZÍ metodický list č. 1 Dobývání znalostí z databází Cílem tohoto tematického celku je vysvětlení základních pojmů z oblasti dobývání znalostí z databází i východisek dobývání znalostí z databází inspirovaných

Více

Pokročilé operace s obrazem

Pokročilé operace s obrazem Získávání a analýza obrazové informace Pokročilé operace s obrazem Biofyzikální ústav Lékařské fakulty Masarykovy univerzity Brno prezentace je součástí projektu FRVŠ č.2487/2011 (BFÚ LF MU) Získávání

Více

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze Dobývání znalostí Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze Dobývání znalostí Bayesovské modely Doc. RNDr. Iveta Mrázová, CSc.

Více

Obr. 1: Vizualizace dat pacientů, kontrolních subjektů a testovacího subjektu.

Obr. 1: Vizualizace dat pacientů, kontrolních subjektů a testovacího subjektu. Řešení příkladu - klasifikace testovacího subjektu pomocí Bayesova klasifikátoru: ata si vizualizujeme (Obr. ). Objem mozkových komor 9 8 7 6 5 pacienti kontroly testovací subjekt 5 6 Objem hipokampu Obr.

Více

PRŮZKUM VÝŽIVY LESA NA ÚZEMÍ ČESKÉ REPUBLIKY

PRŮZKUM VÝŽIVY LESA NA ÚZEMÍ ČESKÉ REPUBLIKY PRŮZKUM VÝŽIVY LESA NA ÚZEMÍ ČESKÉ REPUBLIKY Aplikované metodické postupy Tomáš Samek počet odběrných míst/vzorků volba odběrných míst pokyny k odběru vzorků, jejich označování a skladování předávání

Více