Chybějící atributy a postupy pro jejich náhradu
|
|
- Matěj Bureš
- před 8 lety
- Počet zobrazení:
Transkript
1 Chybějící atributy a postupy pro jejich náhradu
2 Jedná se o součást čištění dat Čistota dat je velmi důležitá, neboť kvalita dat zásadně ovlivňuje kvalitu výsledků, které DM vyprodukuje, neboť platí Garbage in, garbage out! Jaké kroky se používají při čištění dat? Řešení problému chybějících údajů Identifikace mimořádných hodnot (outliers) a vyhlazení zašuměných dat Oprava nekonzistentních údajů v datech Řešení redundancí vzniklých při integraci dat 2
3 (diagnoza chřipka?) 1 zvýšená? ne ano 3? ne ne ne Z jakých důvodů mohou data chybět? 5 zvýšená? ano ne 8? ano? ano Bylo zbytečné je zjišťovat, neboť rozhodnutí lze udělat i bez nich nebo v daném případě nemají smysl (např. spotřeba u bezmotorového dopravního prostředku) : data jsou pak označovány jako údaje, o které nestojíme ( do not care ) Jedná se o ztracené údaje, tedy ty hodnoty, které 3 se nepodařilo zjistit z neznámých důvodů, byly omylem vymazány, šlo o evidentní překlep,.
4 Způsoby řešení problému chybějících atributů Sekvenční metody jsou součástí předzpracování dat. Jejich cílem je ze souboru s nekompletními daty vytvořit nový soubor, který je úplný: příslušné případy mohou být vynechány nebo naopak v nich chybějící data doplněna. Paralelní metody řeší problém chybějících hodnot až v průběhu nasazení algoritmu strojového učení (např. při hledání příslušných rozhodovacích pravidel) 4
5 5 SEKVENČNÍ METODY
6 1. Vynechání neúplných příkladů Nejjednodušší řešení. Ovšem tím se připravíme o významnou část cenných dat: z původní množiny případů může zbýt malý díl (zde jen polovina!) (diagnoza chřipka?) 6
7 2a. Náhrada nejobvyklejší hodnotou Pro všechny atributy se zjistí relativní frekvence jednotlivých hodnot a pro náhradu se zvolí hodnota s nejvyšší frekvencí, viz příklad: : zvýšená (3/8), normální (2/8), vysoká (1/8) _: ano (4/8), ne (2/8) : ano (4/8), ne (3/8) 1 zvýšená? ne ano 3? ne ne ne 5 zvýšená? ano ne 8? ano? ano 1 zvýšená ano ne ano 3 zvýšená ne ne ne 7 Výsledek náhrady Přístup použitý např. v algoritmu CN2 5 zvýšená anp ano ne 8 zvýšená ano ano ano
8 2b. Náhrada nejobvyklejší hodnotou vzhledem ke klasifikaci případu Při nahrazování hodnoty pro případ, který je klasifikován do třídy c1, se vybírá nejfrekventovanější odpověď zjištěná jenom mezi případy dané třídy c1. Např. pro pacienty 3 a 5 zařazené do třídy diagnóza chřipka ne musíme zjistit frekvence výskytu hodnot mezi pacienty {3,5,6,7}: : zvýšená (1/4), normální (2/4), vysoká (0/4) _: ano (1/4), ne (2/4) Tato náhrada není použita pro pacienty 1 a 8, pro něž musíme naopak zjišťovat relativní frekvenci výskytů v množině pacientů {1,2,4,8}, tedy: _: ano (3/4), ne (0/4) : ano (2/4), ne (1/4) 1 zvýšená? Ne ano 2 vysoká ano Ano ano 3? ne Ne ne 5 zvýšená? ano ne 8? ano? ano 1 zvýšená ano ne ano 2 vysoká Ano ano ano 3 normální ne ne ne 8 Výsledek náhrady Použito např. v ASSISTANT (Kononenko et. al., 1984) 5 zvýšená ne ano ne 8 zvýšená ano ano ano
9 3. Náhrada všemi možnými hodnotami daného atributu 1 zvýšená? ne ano 3? ne ne ne Každý případ (pacient) je popsán více alternativními vektory údajů. Výsledná data mohou být nekonzistentní (např. řádky 1 a 3 ) - vhodné jen pro metody stroj. učení, které s tím dovedou pracovat (např. užívající rough sets theory). Opět jsou 2 přístupy: 5 zvýšená? ano ne 8? ano? ano každá možná hodnota chybějícího atributu je použita 1 zvýšená ano ne ano 1 zvýšená ne ne ano 3 zvýšená ne ne ne 3 vysoká ne ne ne 3 normální ne ne ne každá možná hodnota chybějícího atributu v dané klasifikační třídě je použita: Např. u pacienta 1 tedy není použita náhrada hodnotou ne, která pro třídu diagnóza chřipka ano, tj. pro pacienty { 1,2,4,8 } není nikdy v datech použita. Dále u pacienta 3 tedy není použita náhrada hodnotou vysoká, která pro třídu diagnóza chřipka ne, tj. pro pacienty {3,5,6,7} není nikdy v datech použita. 9 1 zvýšená ano ne ano 3 zvýšená ne ne ne 3 normální ne ne ne
10 4. Náhrada průměrem (u spoj.dat) nebo nejčastější hodnotou Průměrná hodnota pro teplotu je 37,4 o C pro celý soubor. 37,9 o C pro data klasifikovaná diagnóza chřipka ano, 36,4 o C pro diagnóza chřipka ne. 1 37,5? ne ano 2 39,1 ano ano ano 3? ne ne ne 4 37,2 ano ano ano 5 37,6? ano ne 6 36,2 ano ne ne 7 36,7 ne ano Ne 8? ano? ano 1 37,5 ano ne ano Opět jsou 2 přístupy: 2 39,1 ano ano ano 3 37,4 ne ne ne 4 37,2 ano ano ano Náhrada je provedena pomocí průměru na celém souboru 5 37,6 ano ano ne 1 37,5 ano ne ano 10 Pro náhradu se používají hodnoty průměru v příslušné klasifikační třídě. 2 39,1 ano ano ano 3 36,4 ne ne ne 4 37,2 ano ano ano 5 37,6 ano ano ne
11 5. Náhrada hodnotou nejbližšího souseda Vzdále 2 vzorků x a y popsaných n atributy, jejichž některé hodnoty mohou chybět: n distance(x, y)= distance(x i, y i ), kde i = i ,5? ne ano 2 39,1 ano ano ano 3? ne ne ne 4 37,2 ano ano ano 5 37,6? ano ne 6 36,1 ano ne ne 7 36,7 ne ano ne 8? ano? ano { 0 pokud x i = y i distance(x i, y i ) 1 pokud hodnoty x i a y i jsou výčtového typu nebo jedna z nich chybí x i - y i /r i jinak (tedy jde o reálné hodnoty s rozsahem r i, odpovídajícímu rozdílu mezi max a min hodnotou) a) Postup náhrady hodnoty atributu bolest pro vzorek 1 přes všechna data: Postup náhrady hodnoty atributu bolest pro vzorek 1 d(1,2) d(1,3) d(1,4) d(1,5) d(1,6) d(1,7) d(1,8) 1. Vypočti vzdálei vzorku 1 od ostatních. 2. Vyber nejbližší (je jím???) 3. Jeho hodnotu (???) použij jako náhradu pro vzorek ,5 ano ne ano 11 b) Obdobně lze postupovat také jen uvnitř jediné třídy! 2 39,1 ano ano ano 3 36,4 ne ne ne 4 37,2 ano ano ano
12 12 PARALELNÍ METODY
Doplňování chybějících hodnot v kategoriálních datech 2.00
Doplňování chybějících hodnot v kategoriálních datech 2.00 1. Cíle programu Účelem programu je umožnit uživateli doplnění chybějících hodnot v kategoriálních datech. Pro doplnění chybějících hodnot je
odlehlých hodnot pomocí algoritmu k-means
Chybějící a odlehlé hodnoty; odstranění odlehlých hodnot pomocí algoritmu k-means Návod ke druhému cvičení Matěj Holec, holecmat@fel.cvut.cz ZS 2011/2012 Úvod Cílem cvičení je připomenout důležitost předzpracování
Dolování asociačních pravidel
Dolování asociačních pravidel Miloš Trávníček UIFS FIT VUT v Brně Obsah přednášky 1. Proces získávání znalostí 2. Asociační pravidla 3. Dolování asociačních pravidel 4. Algoritmy pro dolování asociačních
Moderní systémy pro získávání znalostí z informací a dat
Moderní systémy pro získávání znalostí z informací a dat Jan Žižka IBA Institut biostatistiky a analýz PřF & LF, Masarykova universita Kamenice 126/3, 625 00 Brno Email: zizka@iba.muni.cz Bioinformatika:
Pravděpodobně skoro správné. PAC učení 1
Pravděpodobně skoro správné (PAC) učení PAC učení 1 Výpočetní teorie strojového učení Věta o ošklivém kačátku. Nechť E je klasifikovaná trénovací množina pro koncept K, který tvoří podmnožinu konečného
Katedra kybernetiky skupina Inteligentní Datové Analýzy (IDA) 9. ledna 2017
Vytěžování dat Filip Železný Katedra kybernetiky skupina Inteligentní Datové Analýzy (IDA) 9. ledna 2017 Rozhodovací pravidla Strom lze převést na seznam pravidel ve tvaru if podmínky then třída if teplota=horečka
Dolování z textu. Martin Vítek
Dolování z textu Martin Vítek Proč dolovat z textu Obrovské množství materiálu v nestrukturované textové podobě knihy časopisy vědeckéčlánky sborníky konferencí internetové diskuse Proč dolovat z textu
Algoritmy a struktury neuropočítačů ASN - P11
Aplikace UNS při rozpoznání obrazů Základní úloha segmentace obrazu rozdělení obrazu do několika významných oblastí klasifikační úloha, clusterová analýza target Metody Kohonenova metoda KSOM Kohonenova
Omezení barevného prostoru
Úpravy obrazu Omezení barevného prostoru Omezení počtu barev v obraze při zachování obrazového vjemu z obrazu Vytváření barevné palety v některých souborových formátech Různé filtry v grafických programech
Inovace tohoto kurzu byla spolufinancována z Evropského sociálního fondu a státního rozpočtu České republiky.
Inovace tohoto kurzu byla spolufinancována z Evropského sociálního fondu a státního rozpočtu České republiky. Projekt ESF OP VK reg.č. CZ.1.07/2.2.00/28.0209 Elektronické opory a e-learning pro obory výpočtového
Obr. 1: Vizualizace dat pacientů, kontrolních subjektů a testovacího subjektu.
Řešení příkladu - klasifikace testovacího subjektu pomocí Bayesova klasifikátoru: ata si vizualizujeme (Obr. ). Objem mozkových komor 9 8 7 6 5 pacienti kontroly testovací subjekt 5 6 Objem hipokampu Obr.
Aplikace vytěžování dat
Aplikace vytěžování dat Funkcionalita aplikace Tato sekce popisuje stavájící funkcionalitu aplikace. Stav projektu Aplikace je v současnosti ve fázi prototypu, který lze v relativně krátkém čase 2 měsíců
Lineární klasifikátory
Lineární klasifikátory Lineární klasifikátory obsah: perceptronový algoritmus základní verze varianta perceptronového algoritmu přihrádkový algoritmus podpůrné vektorové stroje Lineární klasifikátor navrhnout
Algoritmizace Dynamické programování. Jiří Vyskočil, Marko Genyg-Berezovskyj 2010
Dynamické programování Jiří Vyskočil, Marko Genyg-Berezovskyj 2010 Rozděl a panuj (divide-and-conquer) Rozděl (Divide): Rozděl problém na několik podproblémů tak, aby tyto podproblémy odpovídaly původnímu
Usuzování za neurčitosti
Usuzování za neurčitosti 25.11.2014 8-1 Usuzování za neurčitosti Hypotetické usuzování a zpětná indukce Míry postačitelnosti a nezbytnosti Kombinace důkazů Šíření pravděpodobnosti v inferenčních sítích
Automatizace je proces při němž je řídicí funkce člověka nahrazována činností
Automatizace je proces při němž je řídicí funkce člověka nahrazována činností různých přístrojů a zařízení. (Mechanizace, Automatizace, Komplexní automatizace) Kybernetika je Věda, která zkoumá obecné
Algoritmy a struktury neuropočítačů ASN - P10. Aplikace UNS v biomedicíně
Aplikace UNS v biomedicíně aplikace v medicíně postup při zpracování úloh Aplikace UNS v medicíně Důvod: nalezení exaktnějších, levnějších a snadnějších metod určování diagnóz pro lékaře nalezení šetrnějších
Opravný list k diplomové práci ERRATA
Opravný list k diplomové práci ERRATA Str. 36 (kapitola 3.1.8, první řádek): Chybně: (kavkazská populace) Správně: (česká populace) Str. 45 Chybně: Tab. 11: Složení směsi pro jednu Real Time PCR reakci
1 z 16 11.5.2009 11:33 Test: "CIT_04_SLO_30z50" Otázka č. 1 U Mooreova automatu závisí okamžitý výstup Odpověď A: na okamžitém stavu pamětí Odpověď B: na minulém stavu pamětí Odpověď C: na okamžitém stavu
Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze
Dobývání znalostí Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze Dobývání znalostí Pravděpodobnost a učení Doc. RNDr. Iveta Mrázová,
Neuronové sítě v DPZ
Univerzita J. E. Purkyně v Ústí nad Labem Fakulta životního prostředí Neuronové sítě v DPZ Seminární práce z předmětu Dálkový průzkum Země Vypracovali: Jan Lantora Rok: 2006 Zuzana Vašková Neuronové sítě
Ing. Petr Hájek, Ph.D. Podpora přednášky kurzu Aplikace umělé inteligence
APLIKACE UMĚLÉ INTELIGENCE Ing. Petr Hájek, Ph.D. Podpora přednášky kurzu Aplikace umělé inteligence Aplikace umělé inteligence - seminář ING. PETR HÁJEK, PH.D. ÚSTAV SYSTÉMOVÉHO INŽENÝRSTVÍ A INFORMATIKY
PRAVDĚPODOBNOST A STATISTIKA. Neparametrické testy hypotéz čast 1
PRAVDĚPODOBNOST A STATISTIKA Neparametrické testy hypotéz čast 1 Neparametrické testy hypotéz - úvod Neparametrické testy statistických hypotéz se používají v případech, kdy neznáme rozdělení pozorované
Překladač a jeho struktura
Překladač a jeho struktura Překladače, přednáška č. 1 Šárka Vavrečková Ústav informatiky, FPF SU Opava sarka.vavreckova@fpf.slu.cz http://fpf.slu.cz/ vav10ui Poslední aktualizace: 23. září 2008 Definice
Metody založené na analogii
Metody založené na analogii V neznámé situaci lze použít to řešení, které se osvědčilo v situaci podobné případové usuzování (Case-Based Reasoning CBR) pravidlo nejbližšího souseda (nearest neighbour rule)
Algoritmy a datové struktury
Algoritmy a datové struktury 1 / 34 Obsah přednášky Základní řídící struktury posloupnost příkazů podmínka cyklus s podmínkou na začátku cyklus s podmínkou na konci cyklus s pevným počtem opakování Jednoduchá
Automatické vyhledávání informace a znalosti v elektronických textových datech
Automatické vyhledávání informace a znalosti v elektronických textových datech Jan Žižka Ústav informatiky & SoNet RC PEF, Mendelova universita Brno (Text Mining) Data, informace, znalost Elektronická
Fakulta chemicko-technologická Katedra analytické chemie. 3.2 Metody s latentními proměnnými a klasifikační metody
Fakulta chemicko-technologická Katedra analytické chemie 3.2 Metody s latentními proměnnými a klasifikační metody Vypracoval: Ing. Tomáš Nekola Studium: licenční Datum: 21. 1. 2008 Otázka 1. Vypočtěte
Databáze I. 4. přednáška. Helena Palovská
Databáze I 4. přednáška Helena Palovská palovska@vse.cz Mapování ER modelu do relačního DB schématu Od 80. let 20. stol. znám algoritmus, implementován v CASE nástrojích Rutinní postup s volbami rozhodnutí
Analytické procedury v systému LISp-Miner
Dobývání znalostí z databází MI-KDD ZS 2011 Přednáška 8 Analytické procedury v systému LISp-Miner Část II. (c) 2011 Ing. M. Šimůnek, Ph.D. KIZI, Fakulta informatiky a statistiky, VŠE Praha Evropský sociální
Algoritmy a struktury neuropočítačů ASN P9 SVM Support vector machines Support vector networks (Algoritmus podpůrných vektorů)
Algoritmy a struktury neuropočítačů ASN P9 SVM Support vector machines Support vector networks (Algoritmus podpůrných vektorů) Autor: Vladimir Vapnik Vapnik, V. The Nature of Statistical Learning Theory.
VZÁJEMNÁ POLOHA DVOU PŘÍMEK V ROVINĚ
VZÁJEMNÁ POLOHA DVOU PŘÍMEK V ROVINĚ Dvě přímky v rovině mohou být: různoběžné - mají jediný společný bod, rovnoběžné různé - nemají společný bod, totožné - mají nekonečně mnoho společných bodů. ŘEŠENÉ
SDĚLENÍ Ministerstva pro místní rozvoj ze dne 12. června 2009
SDĚLENÍ Ministerstva pro místní rozvoj ze dne 12. června 2009 o roztřídění obcí do velikostních kategorií podle počtu obyvatel, o územním rozčlenění obcí seskupením katastrálních území, o výši základních
Direct Digital Synthesis (DDS)
ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE Fakulta elektrotechnická Ing. Radek Sedláček, Ph.D., katedra měření K13138 Direct Digital Synthesis (DDS) Přímá číslicová syntéza Tyto materiály vznikly za podpory
Test č.1 Porozumění zadání úloh
Před zadáním testu je vhodné upozornit studenty na cíl testování, tedy: ověřování srozumitelnost výukových materiálů. A upozornit, že se nejedná o ověřování jejich znalostí. Testy mohou být anonymní. (Pro
Úloha - rozpoznávání číslic
Úloha - rozpoznávání číslic Vojtěch Franc, Tomáš Pajdla a Tomáš Svoboda http://cmp.felk.cvut.cz 27. listopadu 26 Abstrakt Podpůrný text pro cvičení předmětu X33KUI. Vysvětluje tři způsoby rozpoznávání
Konvolučníkódy. MI-AAK(Aritmetika a kódy)
MI-AAK(Aritmetika a kódy) Konvolučníkódy c doc. Ing. Alois Pluháček, CSc., 2011 Katedra číslicového návrhu Fakulta informačních technologií České vysoké učení technické v Praze Evropský sociální fond Praha&
Kombinatorická minimalizace
Kombinatorická minimalizace Cílem je nalézt globální minimum ve velké diskrétní množině, kde může být mnoho lokálních minim. Úloha obchodního cestujícího Cílem je najít nejkratší cestu, která spojuje všechny
Stavový model a Kalmanův filtr
Stavový model a Kalmanův filtr 2 prosince 23 Stav je veličina, kterou neznáme, ale chtěli bychom znát Dozvídáme se o ní zprostředkovaně prostřednictvím výstupů Příkladem může býapř nějaký zašuměný signál,
Statistická teorie učení
Statistická teorie učení Petr Havel Marek Myslivec přednáška z 9. týdne 1 Úvod Představme si situaci výrobce a zákazníka, který si u výrobce objednal algoritmus rozpoznávání. Zákazník dodal experimentální
Kybernetika a umělá inteligence, cvičení 10/11
Kybernetika a umělá inteligence, cvičení 10/11 Program 1. seminární cvičení: základní typy klasifikátorů a jejich princip 2. počítačové cvičení: procvičení na problému rozpoznávání číslic... body za aktivitu
jednoduchá heuristika asymetrické okolí stavový prostor, kde nelze zabloudit připustit zhoršují cí tahy Pokročilé heuristiky
Pokročilé heuristiky jednoduchá heuristika asymetrické stavový prostor, kde nelze zabloudit připustit zhoršují cí tahy pokročilá heuristika symetrické stavový prostor, který vyžaduje řízení 1 2 Paměť pouze
Funkce rostoucí, funkce klesající II
.. Funkce rostoucí, funkce klesající II Předpoklad: Př. : Rozhodni, zda funkce = na následujícím obrázku je rostoucí nebo klesající. = - - - - Pro záporná jde funkce dolů, pro kladná nahoru není ani rostoucí
ANALÝZA A KLASIFIKACE DAT
ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc. INVESTICE Institut DO biostatistiky ROZVOJE VZDĚLÁVÁNÍ a analýz III. PŘÍZNAKOVÁ KLASIFIKACE - ÚVOD PŘÍZNAKOVÝ POPIS Příznakový obraz x zpracovávaných
Milí rodiče a prarodiče,
Milí rodiče a prarodiče, chcete pomoci svým dětem, aby se jim dobře počítalo se zlomky? Procvičujte s nimi. Tento text je pokračováním publikace Mami, tati, já těm zlomkům nerozumím. stupeň ZŠ, ve které
Vzdělávací materiál projektu Zlepšení podmínek výuky v ZŠ Sloup
Kód: Vzdělávací materiál projektu Zlepšení podmínek výuky v ZŠ Sloup Název vzdělávacího materiálu Důsledky poruch příjmu potravy Anotace Pracovní list shrnuje negativní důsledky poruch příjmu potravy a
Jana Vránová, 3. lékařská fakulta UK
Jana Vránová, 3. lékařská fakulta UK Vznikají při zkoumání vztahů kvalitativních resp. diskrétních znaků Jedná se o analogii s korelační analýzou spojitých znaků Přitom předpokládáme, že každý prvek populace
Autodiagnostika učitele
Autodiagnostika učitele Přednáška PdF MU Jana Kratochvílová Autodiagnostika učitele Co si představíme pod daným pojmem? Autodiagnostika učitele V nejširším smyslu jako způsob poznávání a hodnocení vlastní
Autor práce: Mgr. Romana Klímová ARO, Slezská nemocnice Opava Vedoucí práce: PhDr. Sabina Psennerová, Ph.D. LF, Ostravská univerzita v Ostravě
Autor práce: Mgr. Romana Klímová ARO, Slezská nemocnice Opava Vedoucí práce: PhDr. Sabina Psennerová, Ph.D. LF, Ostravská univerzita v Ostravě Nedílná součást každého operačního zákroku Optimální přístup
Předzpracování dat. Lenka Vysloužilová
Předzpracování dat Lenka Vysloužilová 1 Metodika CRISP-DM (www.crisp-dm.org) Příprava dat Data Preparation příprava dat pro modelování selekce příznaků výběr relevantních příznaků čištění dat získávání
Začátek budování sítě, současný stav, návrh rozvoje, problémy při stavbách dálnice, ekologické aspekty
Začátek budování sítě, současný stav, návrh rozvoje, problémy při stavbách dálnice, ekologické aspekty Daniel Klár, 9. B Základní škola a Mateřská škola Kladno, Norská 2633 Školní rok 2014 2015 Absolventskou
Využití metod strojového učení v bioinformatice David Hoksza
Využití metod strojového učení v bioinformatice David Hoksza SIRET Research Group Katedra softwarového inženýrství, Matematicko-fyzikální fakulta Karlova Univerzita v Praze Bioinformatika Biologické inspirace
Postup měření při stanovení radonového indexu pozemku
Jak se měří radon Jak se měří radon Postup měření při stanovení radonového indexu pozemku Měřeným parametrem je objemová aktivita radonu 222 Rn v půdním vzduchu. Výsledek je udáván v jednotkách kbq/m 3.
SOUHRNNÉ VÝSLEDKY ZPĚTNÝCH VAZEB NA PACIENTSKÝ PROGRAM AD VITAM
SOUHRNNÉ VÝSLEDKY ZPĚTNÝCH VAZEB NA PACIENTSKÝ PROGRAM AD VITAM 2013 Dotazníkové šetření u pacientů s roztroušenou sklerózou 1. Cíle a způsob provedení dotazníkového šetření Dotazníkové šetření mezi pacienty
Jak postavit nízkoenergetický dům - Průkaz energetické náročnosti nízkoenergetických budov
Jak postavit nízkoenergetický dům - Průkaz energetické náročnosti nízkoenergetických budov Od ledna 2009 je povinnou součástí dokumentace ke stavebnímu povolení (na novostavby i rekonstrukce) Průkaz energetické
SOFTWAROVÉ INŽENÝRSTVÍ
SOFTWAROVÉ INŽENÝRSTVÍ Plán a odhady projeku Ing. Ondřej Macek 2013/14 ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE Příprava plánu projektu 3 Motivace k plánování Průběh projektu Bolest Dobré plánování Špatné
OSA. maximalizace minimalizace 1/22
OSA Systémová analýza metodika používaná k navrhování a racionalizaci systémů v podmínkách neurčitosti vyšší stupeň operační analýzy Operační analýza (výzkum) soubor metod umožňující řešit rozhodovací,
Jednoznačná identifikace jako předpoklad funkčního e-health. Martin Pavlík
Jednoznačná identifikace jako předpoklad funkčního e-health Martin Pavlík Růst nároků na IT Stárnoucí populace Rostoucí náklady Nedostatek pracovníků Větší nároky na IT Izolovaná datová sila Pacientská
ZÍSKÁVÁNÍ ZNALOSTÍ Z DATABÁZÍ
Metodický list č. 1 Dobývání znalostí z databází Cílem tohoto tematického celku je vysvětlení základních pojmů z oblasti dobývání znalostí z databází i východisek dobývání znalostí z databází inspirovaných
Vytěžování znalostí z dat
Pavel Kordík, Jan Motl (ČVUT FIT) Vytěžování znalostí z dat BI-VZD, 2012, Přednáška 7 1/27 Vytěžování znalostí z dat Pavel Kordík, Jan Motl Department of Computer Systems Faculty of Information Technology
Vyhledávání. doc. Mgr. Jiří Dvorský, Ph.D. Katedra informatiky Fakulta elektrotechniky a informatiky VŠB TU Ostrava. Prezentace ke dni 21.
Vyhledávání doc. Mgr. Jiří Dvorský, Ph.D. Katedra informatiky Fakulta elektrotechniky a informatiky VŠB TU Ostrava Prezentace ke dni 21. září 2018 Jiří Dvorský (VŠB TUO) Vyhledávání 242 / 433 Osnova přednášky
Straumann CARES Visual 8.9
Straumann CARES Visual 8.9 Aktualizace software Co je nového? Verze softwaru 8.9.0. Datum vydání 01. 07. 2014 1. Vylepšení programu Straumann CARES Visual... 2 1.1 Vyhlazení všech protetických indikací...
11. Tabu prohledávání
Jan Schmidt 2011 Katedra číslicového návrhu Fakulta informačních technologií České vysoké učení technické v Praze Zimní semestr 2011/12 MI-PAA EVROPSKÝ SOCIÁLNÍ FOND PRAHA & EU: INVESTUJENE DO VAŠÍ BUDOUCNOSTI
III/2 Inovace a zkvalitnění výuky prostřednictvím ICT
Název školy Gymnázium, Šternberk, Horní nám. 5 Číslo projektu CZ.1.07/1.5.00/34.0218 Šablona III/2 Inovace a zkvalitnění výuky prostřednictvím ICT Označení materiálu VY_32_INOVACE_Hor017 Vypracoval(a),
Univerzita Pardubice 8. licenční studium chemometrie
Univerzita Pardubice 8. licenční studium chemometrie Statistické zpracování dat při managementu jakosti Semestrální práce Metody s latentními proměnnými a klasifikační metody Ing. Jan Balcárek, Ph.D. vedoucí
Aplikace obrazové fúze pro hledání vad
Marek Vajgl, Irina Perfilieva, Petr Hurtík, Petra Hoďáková Národní superpočítačové centrum IT4Innovations Divize Ostravské univerzity Ústav pro výzkum a aplikaci fuzzy modelování Ostrava, Česká republika
Integrovaný Ekonomický Systém Účetnictví - IES WIN 2006. Úvod...5
Úvod...5 Přehled funkcí modulu účetnictví...6 Účtový rozvrh...11 Výsledovka...12 Rozvaha...12 Saldokonto...12 Druh dokladu...12 Zpracování daňového dokladu...12 Nastavení zpracování DPH (období, sazeb,
7. Rozdělení pravděpodobnosti ve statistice
7. Rozdělení pravděpodobnosti ve statistice Statistika nuda je, má však cenné údaje, neklesejte na mysli, ona nám to vyčíslí Jednou z úloh statistiky je odhad (výpočet) hodnot statistického znaku x i,
Klasifikace hudebních stylů
Klasifikace hudebních stylů Martin Šimonovský (mys7@seznam.cz) Rozpoznávání hudby úloha z oblasti DSP klasifikace dle hudebních stylů
Prodejní ceny zemního plynu Pražské plynárenské, a. s., platné od 1. ledna 2014 pro zákazníky kategorie Maloodběratel a Domácnost
Prodejní zemního plynu Pražské plynárenské, a. s., né od 1. ledna 2014 pro zákazníky kategorie Tyto prodejní jsou né pro všechna odběrná místa a pro předací místa souběžného držitele licence na distribuci
ZPRACOVÁNÍ DAT DÁLKOVÉHO PRŮZKUMU
A - zdroj záření B - záření v atmosféře C - interakce s objektem D - změření záření přístrojem E - přenos, příjem dat F - zpracování dat G - využití informace v aplikaci Typ informace získávaný DPZ - vnitřní
Matice. Modifikace matic eliminační metodou. α A = α a 2,1, α a 2,2,..., α a 2,n α a m,1, α a m,2,..., α a m,n
[1] Základní pojmy [2] Matice mezi sebou sčítáme a násobíme konstantou (lineární prostor) měníme je na jiné matice eliminační metodou násobíme je mezi sebou... Matice je tabulka čísel s konečným počtem
PRINCIPY OPERAČNÍCH SYSTÉMŮ
Metodický list č. 1 Název tématického celku: Přehled operačních systémů a jejich funkcí Základním cílem tohoto tematického celku je seznámení se s předmětem (vědním oborem) Operační systémy (OS) a se základními
Text Mining: SAS Enterprise Miner versus Teragram. Petr Berka, Tomáš Kliegr VŠE Praha
Text Mining: SAS Enterprise Miner versus Teragram Petr Berka, Tomáš Kliegr VŠE Praha Text mining vs. data mining Text mining = data mining na nestrukturovaných textových dokumentech otázka vhodné reprezentace
Prodejní ceny zemního plynu Pražské plynárenské, a. s., platné od 1. ledna 2015 pro zákazníky kategorie Maloodběratel a Domácnost
Prodejní zemního plynu Pražské plynárenské, a. s., né od 1. ledna 2015 pro zákazníky kategorie Maloodběratel Tyto prodejní jsou né pro všechna odběrná místa a pro předací místa souběžného držitele licence
Jednoznačná identifikace jako předpoklad funkčního e-health. Matěj Adam
Jednoznačná identifikace jako předpoklad funkčního e-health Matěj Adam Izolovaná datová sila Pacientská data jsou v izolovaných systémech Problém se ale týká i dalších entit: Zdravotničtí pracovníci Dodavatelé
Lokační referenční metody a jejich interpretace ve standardech
Lokační referenční metody a jejich interpretace ve standardech Jiří Plíhal Tento příspěvek by rád na konkrétním příkladu standardu přiblížil referenční metody stanovení polohy a zejména jejich dynamickou
S databázemi se v běžném životě setkáváme velmi často. Uvádíme běžné použití databází velkého rozsahu:
Úvod do databází Základní pojmy Databáze je množina záznamů, kterou shromažďujeme za nějakým konkrétním účelem. Databáze používáme zejména pro ukládání obsáhlých informací. Databázové systémy jsou k dispozici
Projekční algoritmus. Urychlení evolučních algoritmů pomocí regresních stromů a jejich zobecnění. Jan Klíma
Urychlení evolučních algoritmů pomocí regresních stromů a jejich zobecnění Jan Klíma Obsah Motivace & cíle práce Evoluční algoritmy Náhradní modelování Stromové regresní metody Implementace a výsledky
Vývojové diagramy - zápis algoritmu
DUM Vyšší odborná škola, Obchodní akademie a Střední odborná škola EKONOM, o. p. s. Algoritmy DUM III/2-T1-1-12 PRG-01A-var1 Téma: Vývojové diagramy - výklad Střední škola Rok: 2012 2013 Varianta: A Zpracoval:
Prodejní ceny zemního plynu Pražské plynárenské, a. s., platné od 1. ledna 2016 pro zákazníky kategorie Maloodběratel a Domácnost
Prodejní zemního plynu Pražské plynárenské, a. s., né od 1. ledna 2016 pro zákazníky kategorie Maloodběratel Tyto prodejní jsou né pro všechna odběrná místa a pro předací místa souběžného držitele licence
ODR metody Runge-Kutta
ODR metody Runge-Kutta Teorie (velmi stručný výběr z přednášek) Úloha s počátečními podmínkami (Cauchyova) 1 řádu Hledáme aprox řešení Y(x) soustavy obyčejných diferenciálních rovnic 1 řádu kde Y(x) =
GEODETICKÉ VÝPOČTY I.
SPŠS Č.Budějovice Obor Geodézie a Katastr nemovitostí 2.ročník GEODETICKÉ VÝPOČTY I. TABELACE FUNKCE LINEÁRNÍ INTERPOLACE TABELACE FUNKCE Tabelace funkce se v minulosti často využívala z důvodu usnadnění
0.1 Úvod do lineární algebry
Matematika KMI/PMATE 1 01 Úvod do lineární algebry 011 Vektory Definice 011 Vektorem aritmetického prostorur n budeme rozumět uspořádanou n-tici reálných čísel x 1, x 2,, x n Definice 012 Definice sčítání
Kartografické modelování. VIII Modelování vzdálenosti
VIII Modelování vzdálenosti jaro 2015 Petr Kubíček kubicek@geogr.muni.cz Laboratory on Geoinformatics and Cartography (LGC) Institute of Geography Masaryk University Czech Republic Vzdálenostní funkce
Lineární regrese. Komentované řešení pomocí MS Excel
Lineární regrese Komentované řešení pomocí MS Excel Vstupní data Tabulka se vstupními daty je umístěna v oblasti A1:B11 (viz. obrázek) na listu cela data Postup Základní výpočty - regrese Výpočet základních
METODY ŘEŠENÍ ÚLOH MX2M
METODY ŘEŠENÍ ÚLOH MX2M doc. RNDr. Jana Příhonská, Ph.D., jana.prihonska@tul.cz, linka 2370 Rozdělení úloh Podle obsahu, zadání, požadavku Podle využité řešitelské strategie Podle poznávacích procesů Podle
P = 1;3;3; 4; Množiny. Předpoklady:
3218 Množiny Předpoklady: 030201 Př 1: Kolik lidí může v souladu s předpisy cestovat v běžném osobním autě (například Škoda Octavia)? Hledej různé způsoby, jak odpověď vyjádřit 1 způsob: Autem může cestovat
6 Samodružné body a směry afinity
6 Samodružné body a směry afinity Samodružnými body a směry zobrazení rozumíme body a směry, které se v zobrazují samy na sebe. Například otočení R(S má jediný samodružný bod, střed S, anemá žádný samodružný
Přednáška. Správa paměti II. Katedra počítačových systémů FIT, České vysoké učení technické v Praze Jan Trdlička, 2012
Přednáška Správa paměti II. Katedra počítačových systémů FIT, České vysoké učení technické v Praze Jan Trdlička, 2012 Příprava studijního programu Informatika je podporována projektem financovaným z Evropského
PODPROGRAMY PROCEDURY A FUNKCE
PODPROGRAMY PROCEDURY A FUNKCE Programy bez podprogramů Příklady: a) Napište program, který na obrazovku nakreslí čáru složenou ze znaků pomlčka. program Cara; b) Napište program, který na obrazovku nakreslí
4.2.12 Spojování rezistorů I
4.2.2 Spojování rezistorů Předpoklady: 4, 4207, 420 Jde nám o to nahradit dva nebo více rezistorů jedním rezistorem tak, aby nebylo zvenku možné poznat rozdíl. Nová součástka se musí vzhledem ke zbytku
1 0 0 u 22 u 23 l 31. l u11
LU dekompozice Jedná se o rozklad matice A na dvě trojúhelníkové matice L a U, A=LU. Matice L je dolní trojúhelníková s jedničkami na diagonále a matice U je horní trojúhelníková. a a2 a3 a 2 a 22 a 23
Kalibrační proces ve 3D
Kalibrační proces ve 3D FCC průmyslové systémy společnost byla založena v roce 1995 jako součást holdingu FCC dodávky komponent pro průmyslovou automatizaci integrace systémů kontroly výroby, strojového
Obsah přednášky Jaká asi bude chyba modelu na nových datech?
Obsah přednášky Jaká asi bude chyba modelu na nových datech? Chyba modelu Bootstrap Cross Validation Vapnik-Chervonenkisova dimenze 2 Chyba skutečná a trénovací Máme 30 záznamů, rozhodli jsme se na jejich
Mgr. Tomáš Kotler. I. Cvičný test 2 II. Autorské řešení 7 III. Klíč 15 IV. Záznamový list 17
Mgr. Tomáš Kotler I. Cvičný test 2 II. Autorské řešení 7 III. Klíč 15 IV. Záznamový list 17 VÝCHOZÍ TEXT A OBRÁZEK K ÚLOZE 1 Je dán rovinný obrazec, v obrázku vyznačený barevnou výplní, který představuje
Network Management Software
Network Management Software Jakým problémům nejčastěji čelí naši zákazníci? Síť se rozšířila a stala se komplexnější Nemají vhodnou metodu bezpečné dokumentace Přídavky, přesuny a změny jsou nákladné a
VÝBĚR A JEHO REPREZENTATIVNOST
VÝBĚR A JEHO REPREZENTATIVNOST Induktivní, analytická statistika se snaží odhadnout charakteristiky populace pomocí malého vzorku, který se nazývá VÝBĚR neboli VÝBĚROVÝ SOUBOR. REPREZENTATIVNOST VÝBĚRU:
Náhodné chyby přímých měření
Náhodné chyby přímých měření Hodnoty náhodných chyb se nedají stanovit předem, ale na základě počtu pravděpodobnosti lze zjistit, která z možných naměřených hodnot je více a která je méně pravděpodobná.
METODY DOLOVÁNÍ V DATECH DATOVÉ SKLADY TEREZA HYNČICOVÁ H2IGE1
METODY DOLOVÁNÍ V DATECH DATOVÉ SKLADY TEREZA HYNČICOVÁ H2IGE1 DOLOVÁNÍ V DATECH (DATA MINING) OBJEVUJE SE JIŽ OD 60. LET 20. ST. S ROZVOJEM POČÍTAČOVÉ TECHNIKY DEFINICE PROCES VÝBĚRU, PROHLEDÁVÁNÍ A MODELOVÁNÍ