INTRODUCTION TO MACHINE LEARNING (NPFL054) A template for Homework #2
|
|
- David Richard Vacek
- před 8 lety
- Počet zobrazení:
Transkript
1 INTRODUCTION TO MACHINE LEARNING (NPFL054) A template for Homework #2 Name: Petr Bělohlávek School year: 2015/2016 Provide answers for the exercises 1. (a) - (c), 2.(c), 2.(d.1-2), 2.(e.1-2) For each exercise, your answer cannot exceed one sheet of paper. 1
2 1. (a) Scatterplot matrix, correlation matrix [5 pts] Implicitně nezobrazuji pole name, přestože v zadání jsou požadovány všechny sloupce. Výsledný graf by nedával smysl. Nicméně stačí smazat selektor a graf bude podle zadání validní. mpg cylinders displacement horsepower weight acceleration year mpg cylinders displacement horsepower weight acceleration year
3 1. (b) Multiple linear regression [10 pts] Původní sloupec origin jsem nahradil dvěma novými sloupci european a japanese. Jednička v nich indikuje původ auta. Pokud je v obou nula, auto je americké. Druhá varianta je zakázat intercept a přidat další proměnnou american, ale to je zbytečně komplikované. Data nenormalizuji (zadání o tom nemluví), nicméně si myslím, že by normalizace mohla model zpřesnit (zejména kvůli vysokým hodnotám roku výroby). Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) e e *** cylinders e e displacement 2.398e e ** horsepower e e weight e e < 2e-16 *** acceleration 7.910e e year 7.770e e < 2e-16 *** european 2.630e e e-06 *** japanese 2.853e e e-07 *** U koeficientů bez hvězdičky v posledním sloupci se neprokázal signifikantní vliv na sloupec mpg. Dále je tedy ignoruji. U kvantifikačních proměnných platí, že získané koeficienty vyjadřují změnu mpg při jednotkovém zvýšení dané proměnné a fixaci ostatních proměnných. Kladné koeficienty ukazují rostoucí závislost, záporné klesající. Např. váha vozu výrazně snižuje dojezd, tedy zvyšuje spotřebu, což je očekávaný výsledek. Naopak novější auta mají spotřebu nižší. U ostatních proměnných je vysvětelní totožné. Rozdílná situace je u posledních dvou proměnných, které nabývají hodnoty pouze nula nebo jedna. Jak jsem psal výše, americký původ nechávám zahrnutý v intercept. Obě proměnné mají signifikantní vliv na cílovou proměnnou. Vysvětlení koeficientů je následující. Při fixaci všech proměnných má evropské auto oproti americkému o 2.63 větší dojezd. Podobně, japonské má oproti americkému dojezd větší o Oba tyto rozdíly jsou signifikantní. Jelikož volíme stejnou bázi (americké zahrnuté v intercept), můžeme odhadnout i rozdíl mezi evropskými a japonskými auty (rozdíl koeficientů). U tohoto poslendího rozdílu nemůžeme zjistit, jestli je signifikantní. Mohli bychom vyrobit nový model, který bude v intercept zahrnovat např. evropská auta potom je s japonskými porovnat. Vzhledem k omezení na délku odpovědi tento model vynechávám. Při fixaci všech ostatních proměnných budou proměnné intercept, european a japanese určovat pouze posun (absolutní člen) celého modelu. 3
4 1. (c) Polynomial regression [10 pts] Model Konstantní Nemá smysl, resp. 0 Lineární Kvadratický Kubický stupně stupně R^2 je pouze jeden parametr modelu a pouze na jeho základě se nedá model hodnotit. Vizualizované residuály (viz R skript) ukazují na první pohled, že modely příliš dobře nesedí, protože ve všech grafech residuálů je jasně patrný trend. Dle předpokladů můžeme konstatovat, že komplikovanější modely vysvětlují rozptyl dat lépe. Pozn.: U modelů vyšších stupňů nejsou všechny koeficienty signifikantně odlišné od nuly. R^2 4
5 2. (c) Trivial classifier [10 pts] Seed nastavuji na 123 jako na cvičení (kvůli ladění). Pro jiný seed vyjdou výledky pravděpodobně jinak. Při tomto seedu vyšel triviální klasifikátor takový, že vždy vrací True. Přesnost vyšla přibližně 44.87%. Entropie zjevně musí být jedna, protože na zakódování True/False informace stačí jediný bit. > p.mpg = c(0.5, 0.5) # because of median > -sum(p.mpg * log2(p.mpg)) # entropy [1] 1 5
6 2. (d.1) Logistic regression: training and test error rate, confusion matrix [5 pts] glm.ts.prediction FALSE TRUE FALSE 37 4 TRUE 6 31 Train accuracy: 92.99% Train err. rate: 7.00% Test accuracy: 87.17% Test err. rate: 12.82% 6
7 2. (d.2) Logistic regression: interpretation of the hypothesis parameters [10 pts] Coefficients: Estimate Std. Error z value Pr(> z ) (Intercept) ** cylinders displacement horsepower weight e-05 *** acceleration year e-07 *** european japanese Podobně jako v předchozím komentáři modelu uvažujeme pouze proměnné, jejichž koeficienty jsou signifikantně odlišné od nuly (tedy váhu a rok výroby). Každý z odpovídajících odhadnutých koeficientů vyjadřuje logaritmickou změnu šance (logitu) při jednotkovém zvýšení dané proměnné. Tedy je potřeba predikovanou hodnotu val transformovat na e^val abychom získali skutečnou šanci. Dummy proměnné nemá smysl interpretovat, protože nejsou signifikantní. 7
8 2. (e.1) Decision trees: plot of the tree, training and test error rate [5 pts] Train: tr.prediction FALSE TRUE FALSE TRUE Test: ts.prediction FALSE TRUE FALSE 42 5 TRUE 1 30 Train accuracy: 95.22% Train err. rate: 4.77% Test accuracy: 92.30% Test err. rate: 7.69% 8
9 2. (e.2) Decision trees: tuning the cp parameter [10 pts] Pomocí funkce printcp získáme následující údaje: CP nsplit rel error xerror xstd Vybereme cp s nejnižší chybovostí, tedy cp=0.01. Tato hodnota se ukázala jako optimální pro složitost stromu. Je dostatečně malá, aby byl strom dost rozvětvený a zároveň dost velká na to, aby nedošlo k příliš velkému přeučení. Nový model má stejné vlastnosti jako předchozí. 9
Vytěžování znalostí z dat
Vytěžování znalostí z dat Department of Computer Systems Faculty of Information Technology Czech Technical University in Prague Přednáška 5: Hodnocení kvality modelu BI-VZD, 09/2011 MI-POA Evropský sociální
VícePřipomeň: Shluková analýza
Připomeň: Shluková analýza Data Návrh kategorií X Y= 1, 2,..., K resp. i jejich počet K = co je s čím blízké + jak moc Neposkytne pravidlo pro zařazování Připomeň: Klasifikace Data (X,Y) X... prediktory
VícePředzpracování dat. Pavel Kordík. Department of Computer Systems Faculty of Information Technology Czech Technical University in Prague
Pavel Kordík(ČVUT FIT) Předzpracování dat MI-PDD, 2012, Cvičení 3 1/23 Předzpracování dat Pavel Kordík Department of Computer Systems Faculty of Information Technology Czech Technical University in Prague
VíceZpracování studie týkající se průzkumu vlastností statistických proměnných a vztahů mezi nimi.
SEMINÁRNÍ PRÁCE Zadání: Data: Statistické metody: Zpracování studie týkající se průzkumu vlastností statistických proměnných a vztahů mezi nimi. Minimálně 6 proměnných o 30 pozorováních (z toho 2 proměnné
VícePokud data zadáme přes "Commands" okno: SDF1$X1<-c(1:15) //vytvoření řady čísel od 1 do 15 SDF1$Y1<-c(1.5,3,4.5,5,6,8,9,11,13,14,15,16,18.
Regresní analýza; transformace dat Pro řešení vztahů mezi proměnnými kontinuálního typu používáme korelační a regresní analýzy. Korelace se používá pokud nelze určit "kauzalitu". Regresní analýza je určena
VíceVliv odlehlých hodnot, korelační koeficient, mnohonásobná regrese
Vliv odlehlých hodnot, korelační koeficient, mnohonásobná regrese 1. Vliv odlehlých hodnot Na následujících dvou příkladech ukážeme jak odlehlé hodnoty (outliers) ovlivňují výsledek analýzy a jak je identifikovat.
VíceZískávání znalostí z dat
Získávání znalostí z dat Informační a komunikační technologie ve zdravotnictví Získávání znalostí z dat Definice: proces netriviálního získávání implicitní, dříve neznámé a potencionálně užitečné informace
VíceOpravená data Úloha (A) + (E) Úloha (C) Úloha (B) Úloha (D) Lineární regrese
- základní ukazatele Komentované řešení pomocí programu R Ústav matematiky Fakulta chemicko inženýrská Vysoká škola chemicko-technologická v Praze - základní ukazatele Načtení vstupních dat Vstupní data
VíceÚKOL 2 1886 22 5,77 5,00 5 2,531,003,056 -,869,113
ÚKOL 2 Jméno a příjmení: UČO: Imatrik. ročník: Úkol 2.1: V souboru EVS99_cvicny.sav zjistěte, zdali rozložení názoru na to, kdo by měl být odpovědný za zajištění bydlení (proměnná q54h), je normální. Řešte
Více1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.
Vícenásobná regresní a korelační analýza 1 1 Tto materiál bl vtvořen za pomoci grantu FRVŠ číslo 1145/2004. O vícenásobné závislosti mluvíme tehd, jestliže je závisle proměnná závislá na více nezávislých
VíceFaktorová analýza příklad. Obrázek 1 Ukázka části vstupních dat
Faktorová analýza příklad Obrázek 1 Ukázka části vstupních dat Maticový graf vybraných proměnných: Fueltank Passengers Length Wheelbase Width U Turn Space Rear seat Luggage Weight Horsepower Engine Size
VíceZadání Máme data hdp.wf1, která najdete zde: Bodová předpověď: Intervalová předpověď:
Predikce Text o predikci pro upřesnění pro ty, které zajímá, kde se v EViews všechna ta čísla berou. Ruční výpočty u průběžného testu nebudou potřeba. Co bude v závěrečném testu, to nevím. Ale přečíst
VíceStatistické metody v marketingu. Ing. Michael Rost, Ph.D.
Statistické metody v marketingu Ing. Michael Rost, Ph.D. Jihočeská univerzita v Českých Budějovicích Regresní analýza doplnění základů Vzhledem k požadavku Vašich kolegů zařazuji doplňující partii o regresní
VíceModerní regresní metody. Petr Šmilauer Biologická fakulta JU České Budějovice (c) 1998-2007
Moderní regresní metody Petr Šmilauer Biologická fakulta JU České Budějovice (c) 1998-2007 Obsah Úvod... 5 1 Klasický lineární model a analýza variance... 7 Motivační příklad... 7 Fitování klasického lineárního
VíceTesty nezávislosti kardinálních veličin
Testy nezávislosti kardinálních veličin Komentované řešení pomocí programu R Ústav matematiky Fakulta chemicko inženýrská Vysoká škola chemicko-technologická v Praze Načtení vstupních dat Vstupní data
VíceKarta předmětu prezenční studium
Karta předmětu prezenční studium Název předmětu: Číslo předmětu: 545-0250 Garantující institut: Garant předmětu: Ekonomická statistika Institut ekonomiky a systémů řízení RNDr. Radmila Sousedíková, Ph.D.
VíceZpracování a vyhodnocování analytických dat
Zpracování a vyhodnocování analytických dat naměřená data Zpracování a statistická analýza dat analytické výsledky Naměř ěřená data jedna hodnota 5,00 mg (bod 1D) navážka, odměřený objem řada dat 15,8;
VíceÚstav matematiky Fakulta chemicko inženýrská Vysoká škola chemicko-technologická v Praze
Komentované řešení pomocí programu R Ústav matematiky Fakulta chemicko inženýrská Vysoká škola chemicko-technologická v Praze Popis vstupních dat Vstupní data pro úlohu (A) se nacházejí v souboru "glukoza.csv".
VíceKarnaughovy mapy. Pravdivostní tabulka pro tři vstupní proměnné by mohla vypadat například takto:
Karnaughovy mapy Metoda je použitelná již pro dvě vstupní proměnné, své opodstatnění ale nachází až s větším počtem vstupů, kdy návrh takového výrazu přestává být triviální. Prvním krokem k sestavení logického
VíceM cvičení : GLM04b (Vztah mezi Poissonovým a
RNDr. Marie Forbelská, Ph.D. 1 M7222 4. cvičení : GLM04b (Vztah mezi Poissonovým a binomických rozdělením) Připomeňme, že pomocí Poissonova rozdělení P o(λ) lze dobře aproximovat binomické rozdělení Bi(n,
VíceZápadočeská univerzita v Plzni Fakulta aplikovaných věd Katedra matematiky. Bakalářská práce. Výsledky vstupních testů z matematiky a úspěšnost studia
Západočeská univerzita v Plzni Fakulta aplikovaných věd Katedra matematiky Bakalářská práce Výsledky vstupních testů z matematiky a úspěšnost studia Plzeň, 2014 Zuzana Rábová Prohlášení Prohlašuji, že
Více4EK211 Základy ekonometrie
4EK211 Základy ekonometrie ZS 2015/16 Cvičení 7: Časově řady, autokorelace LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE 1. Časové řady Data: HDP.wf1
VíceTato tematika je zpracována v Záznamy přednášek: str. 214 235 + materiál: PrikladyZobrazeniCisel.pdf
Obsah 11. přednášky: Kódování dat - terminologie Rozdělení kódů Kódování čísel Kódování znaků Tato tematika je zpracována v Záznamy přednášek: str. 214 235 + materiál: PrikladyZobrazeniCisel.pdf Jak bude
VíceY36SAP - aritmetika. Osnova
Y36SAP - aritmetika Čísla se znaménkem a aritmetické operace pevná a pohyblivá řádová čárka Kubátová 2007 Y36SAP-aritmetika 1 Osnova Zobrazení záporných čísel Přímý, aditivní a doplňkový kód a operace
VíceStatistické metody v marketingu. Ing. Michael Rost, Ph.D.
Statistické metody v marketingu Ing. Michael Rost, Ph.D. Jihočeská univerzita v Českých Budějovicích Úvodem Modelování vztahů mezi vysvětlující a vysvětlovanou (závisle) proměnnou patří mezi základní aktivity,
VíceVliv přesnosti kalibrační křivky na výsledek verifikace plánů EBT3 filmem
Vliv přesnosti kalibrační křivky na výsledek verifikace plánů EBT3 filmem TEREZA HANUŠOVÁ, FJFI ČVUT A T HOMAYEROVA NEMOCNICE SIMONA BURYŠKOVÁ, GYMNÁZIUM MATYÁŠE L ERCHA BRNO 14.04.2016 KONFERENCE RADIOLOGICKÉ
Více2 Spojité modely rozhodování
2 Spojité modely rozhodování Jak již víme z přednášky, diskrétní model rozhodování lze zapsat ve tvaru úlohy hodnocení variant: f(a i ) max, a i A = {a 1, a 2,... a p }, kde f je kriteriální funkce a A
VíceStatistika. cílem je zjednodušit nějaká data tak, abychom se v nich lépe vyznali důsledkem je ztráta informací!
Statistika aneb známe tři druhy lži: úmyslná neúmyslná statistika Statistika je metoda, jak vyjádřit nejistá data s přesností na setinu procenta. den..00..00 3..00..00..00..00..00..00..00..00..00..00 3..00..00..00..00..00..00..00
VíceV praxi pracujeme s daty nominálními (nabývají pouze dvou hodnot), kategoriálními (nabývají více
9 Vícerozměrná data a jejich zpracování 9.1 Vícerozměrná data a vícerozměrná rozdělení Při zpracování vícerozměrných dat, hledáme souvislosti mezi dvěmi, případně více náhodnými veličinami. V praxi pracujeme
VíceAplikovaná statistika v R - cvičení 3
Aplikovaná statistika v R - cvičení 3 Filip Děchtěrenko Matematicko-fyzikální fakulta filip.dechterenko@gmail.com 5.8.2014 Filip Děchtěrenko (MFF UK) Aplikovaná statistika v R 5.8.2014 1 / 10 Lineární
VíceFrekvenční analýza, čtyřpolní tabulky
Frekvenční analýza, čtyřpolní tabulky V následujícím příkladě nás zajímá, zda sekání má pozitivní vliv na reprodukci studovaného druhu. V experimentu tedy máme dva druhy ošetření (sekané, nesekané) a pro
VíceM cvičení : GLM03a (The Working Activities of Bees)
RNDr. Marie Forbelská, Ph.D. 1 M7222 3. cvičení : GLM03a (The Working Activities of Bees) Popis dat je v souboru bees.txt, samotná data jsou uložena v souboru bees.dat. Nejprve načteme popisný soubor pomocí
VíceTECHNICKÁ UNIVERZITA V LIBERCI EKONOMICKÁ FAKULTA
TECHNICKÁ UNIVERZITA V LIBERCI EKONOMICKÁ FAKULTA Semestrální práce Semestrální práce z předmětu Statistický rozbor dat z dotazníkového šetření Vypracoval: Bonaconzová, Bryknarová, Milkovičová, Škrdlová
Více4EK211 Základy ekonometrie
4EK211 Základy ekonometrie LS 2014/15 Cvičení 4: Statistické vlastnosti MNČ LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE Upřesnění k pojmům a značení
VícePSY117/454 Statistická analýza dat v psychologii Přednáška 5 ZOBRAZENÍ DVOUROZMĚRNÝCH DAT KORELAČNÍ KOEFICIENT. Všichni žijeme v matrixu.
PSY117/454 Statistická analýza dat v psychologii Přednáška 5 ZOBRAZENÍ DVOUROZMĚRNÝCH DAT KORELAČNÍ KOEFICIENT Všichni žijeme v matrixu. V minulých dílech jsme viděli/y: Frekvence = četnosti Procenta =
VíceVelmi stručný úvod do použití systému WEKA pro Data Mining (Jan Žižka, ÚI PEF)
Velmi stručný úvod do použití systému WEKA pro Data Mining (Jan Žižka, ÚI PEF) Systém WEKA, implementovaný v jazyce Java, lze získat nejlépe z následující URL: . Dále
VícePředzpracování dat. Cvičení 2: Import a příprava dat v Matlabu MI-PDD, 09/2011. Pavel Kordík MI-POA
Pavel Kordík(ČVUT FIT) Předzpracování dat MI-PDD, 2012, Cvičení 2 1/29 Předzpracování dat Pavel Kordík Department of Computer Systems Faculty of Information Technology Czech Technical University in Prague
VíceTeorie informace a kódování (KMI/TIK)
Teorie informace a kódování (KMI/TIK) Bezpečnostní kódy Lukáš Havrlant Univerzita Palackého 13. listopadu 2012 Konzultace V pracovně 5.076. Každý čtvrtek 9.00 11.00. Emaily: lukas@havrlant.cz lukas.havrlant@upol.cz
VíceNa úvod tip, jak kontrolovat šířku tabulky před a po změně. Chování makra ukazují obrázky. Jak změnit rastr v hotové tabulce Excelu
Znáte to. Máte v Excelu hotovou tabulku, ne-li celý formulář, hrajete si s každým pixelem, aby se vše vešlo na jednu A4, a zjistíte, že potřebujete přidat další informace, sloupec. Ve výsledku to znamená
Více5. PŘEDNÁŠKA EKONOMETRICKÝ MODEL REGRESNÍ ANALÝZA DUMMIES VÍCENÁSOBNÁ REGRESE
5. PŘEDNÁŠKA EKONOMETRICKÝ MODEL REGRESNÍ ANALÝZA DUMMIES VÍCENÁSOBNÁ REGRESE 1 STRUKTURA PŘEDNÁŠKY - DNES - Formulace a strukturace problému za pomoci teorie; data; ekonometrický model; identifikační
VíceSTATISTIKA MIGRANTŮ PRO REGIONY V MORAVSKOSLEZSKÉM KRAJI A PRO KRAJ V OBDOBÍ 1992-2005
VYSOKÁ ŠKOLA BÁŇSKÁ - TECHNICKÁ UNIVERZITA OSTRAVA Hornicko-geologická fakulta institut geoinformatiky STATISTIKA MIGRANTŮ PRO REGIONY V MORAVSKOSLEZSKÉM KRAJI A PRO KRAJ V OBDOBÍ 1992-2005 Speciální metody
VíceKorelační a regresní analýza. 1. Pearsonův korelační koeficient 2. jednoduchá regresní analýza 3. vícenásobná regresní analýza
Korelační a regresní analýza 1. Pearsonův korelační koeficient 2. jednoduchá regresní analýza 3. vícenásobná regresní analýza Pearsonův korelační koeficient u intervalových a poměrových dat můžeme jako
VíceInovace výuky prostřednictvím ICT v SPŠ Zlín, CZ.1.07/1.5.00/34.0333 Vzdělávání v informačních a komunikačních technologií
VY_32_INOVACE_33_03 Škola Název projektu, reg. č. Vzdělávací oblast Vzdělávací obor Tematický okruh Téma Tematická oblast Název Autor Vytvořeno, pro obor, ročník Anotace Přínos/cílové kompetence Střední
VícePokročilé neparametrické metody. Klára Kubošová
Pokročilé neparametrické metody Klára Kubošová Klasifikační a regresní lesy Pokročilé neparametrické metody Klasifikační a regresní lesy Klasifikační les Klasifikační les je klasifikační model vytvořený
Více(motto: An unsophisticated forecaster uses statistics as a drunken man uses lamp-posts - for support rather than for illumination.
Neparametricke testy (motto: An unsophisticated forecaster uses statistics as a drunken man uses lamp-posts - for support rather than for illumination. Andrew Lang) 1. Příklad V následující tabulce jsou
VíceEKONOMIE TENISU: NOVÉ
Vysoká škola ekonomická v Praze Národohospodářská fakulta EKONOMIE TENISU: NOVÉ EMPIRICKÉ TESTY TEORIE MINIMAXU (PRÁCE STUDENTŮ BAKALÁŘSKÉHO STUDIA) Barbora Kuncová Počet znaků: 35 927 Kontakt: kuncova.bara@seznam.cz,
VíceNávrhy dalších možností statistického zpracování aktualizovaných dat
Návrhy dalších možností statistického zpracování aktualizovaných dat Při zjišťování disparit ve fyzické dostupnosti bydlení navrhuji použití těchto statistických metod: Bag plot; Krabicové grafy a jejich
VíceRozhodovací stromy a lesy
Rozhodovací stromy a lesy Klára Komprdová Leden 2012 Příprava a vydání této publikace byly podporovány projektem ESF č. CZ.1.07/2.2.00/07.0318 Víceoborová inovace studia Matematické biologie a státním
VíceUpozornění: Dne: 12.10.2015
Objekt : Pod Haltýřem 5 Dne: 12.10.2015 Byty č. : 183,182,169,168 od 8:00 hod. do 9:00 hod. Byty č. : 167,149,148,147 od 9:00 hod. do 10:00 hod. Byty č. : 123,122,121,94 od 10:00 hod. do 11:00 hod. Byty
VíceJak pracovat s absolutními hodnotami
Jak pracovat s absolutními hodnotami Petr Matyáš 1 Co to je absolutní hodnota Absolutní hodnota čísla a, dále ji budeme označovat výrazem a, je jeho vzdálenost od nuly na ose x, tedy je to vždy číslo kladné.
VíceDIGITÁLNÍ KOMUNIKACE S OPTICKÝMI VLÁKNY. Digitální signál bude rekonstruován přijímačem a přiváděn do audio zesilovače.
DIGITÁLNÍ KOMUNIKACE S OPTICKÝMI VLÁKNY 104-4R Pomocí stavebnice Optel sestavte optický systém, který umožní přenos zvuku. Systém bude vysílat audio informaci prostřednictvím optického kabelu jako sekvenci
Více5. Maticová algebra, typy matic, inverzní matice, determinant.
5. Maticová algebra, typy matic, inverzní matice, determinant. Matice Matice typu m,n je matice složená z n*m (m >= 1, n >= 1) reálných (komplexních) čísel uspořádaných do m řádků a n sloupců: R m,n (resp.
VíceV tabulce jsou uvedeny roční náklady na údržbu (v dolarech) a cena domu (v tis. dolarů).
1. Příklad V tabulce jsou uvedeny roční náklady na údržbu (v dolarech) a cena domu (v tis. dolarů). Náklady 835 63 240 1005 184 213 313 658 195 545 Cena 136 24 52 143 42 43 67 106 61 99 a.) Modelujte závislost
VíceDATA MINING KLASIFIKACE DMINA LS 2009/2010
DATA MINING KLASIFIKACE DMINA LS 2009/2010 Osnova co je to klasifikace typy klasifikátoru typy výstupu jednoduchý klasifikátor (1R) rozhodovací stromy Klasifikace (ohodnocení) zařazuje data do předdefinovaných
Vícematice([[1,1,0,0,0],[1,1,1,0,0],[0,1,1,0,0],[0,0,0,1,1],[0,0,0,1,1]],1). matice([[1,1,1],[1,1,0],[1,0,1]],2).
% Zápočtový program % souvislost grafu % popis algoritmu a postupu % Program využívá algoritmu na násobení matic sousednosti A. % Příslušná mocnina n matice A určuje z kterých do kterých % vrcholů se lze
Víceskladbu obou směsí ( v tunách komponenty na 1 tunu směsi):
Klíčová slova: simplexová metoda 1 Simplexová metoda Postup výpočtu: 1. Nalezení výchozího řešení. 2. Test optima: pokud je řešení optimální výpočet končí, jinak krok 3. 3. Iterační krok, poté opět test
VícePopisná statistika. Komentované řešení pomocí MS Excel
Popisná statistika Komentované řešení pomocí MS Excel Vstupní data Máme k dispozici data o počtech bodů z 1. a 2. zápočtového testu z Matematiky I v zimním semestru 2015/2016 a to za všech 762 studentů,
VíceProjekt LISp-Miner. M. Šimůnek
Projekt LISp-Miner http://lispminer.vse.cz M. Šimůnek Obsah Systém LISp-Miner Vývoj systému v dlouhém období ETree-Miner Project LISp-Miner 2 Systém LISp-Miner Metoda GUHA (od roku 1966) předchozí implementace
VícePlánované experimenty - Návrh
Plánované experimenty - Návrh Menu: QCExpert Plánované experimenty Návrh: Plný faktor, Frakc. faktor Tento modul umožňuje navrhnout dvouúrovňový vícefaktoriální ortogonální plán typu 2 n k a následně provést
VíceAnalýza dat z dotazníkových šetření. Zdrojová data: dotazník http://www.vyplnto.cz/realizovane-pruzkumy/konzumace-ryb-a-rybich-vyrob/
Analýza dat z dotazníkových šetření Cvičení 3. - Jednorozměrné třídění Zdrojová data: dotazník http://www.vyplnto.cz/realizovane-pruzkumy/konzumace-ryb-a-rybich-vyrob/ - Seznamte se s dotazníkem a strukturou
Více{ } ( 2) Příklad: Test nezávislosti kategoriálních znaků
Příklad: Test nezávislosti kategoriálních znaků Určete na hladině významnosti 5 % na základě dat zjištěných v rámci dotazníkového šetření ve Šluknově, zda existuje závislost mezi pohlavím respondenta a
VíceAnalýza rozptylu. Přednáška STATISTIKA II - EKONOMETRIE. Jiří Neubauer
ANOVA Přednáška STATISTIKA II - EKONOMETRIE Katedra ekonometrie FEM UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz ANOVA ANOVA je nástroj pro zkoumání vztahu mezi vysvětlovanými a vysvětlujícími
VíceVYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE VYUŽITÍ LOGISTICKÉ REGRESE VE VÝZKUMU TRHU
VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE Fakulta informatiky a statistiky Studijní program: Kvantitativní metody v ekonomice Studijní obor: Statistické a pojistné inženýrství Diplomant: Hana Brabcová Vedoucí diplomové
VíceÚvod do RapidMineru. Praha & EU: Investujeme do vaší budoucnosti. 1 / 23 Úvod do RapidMineru
Vytěžování dat, cvičení 2: Úvod do RapidMineru Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti Fakulta elektrotechnická, ČVUT 1 / 23 Úvod do RapidMineru Dnes vám ukážeme jeden z mnoha
VícePomůcka pro cvičení: 3. semestr Bc studia
Pomůcka pro cvičení: 3. semestr Bc studia Statistika Základní pojmy balíček: Statistics Pro veškeré výpočty je třeba načíst balíček Statistic. Při řešení můžeme použít proceduru infolevel[statistics]:=1,
VíceAVDAT Klasický lineární model, metoda nejmenších
AVDAT Klasický lineární model, metoda nejmenších čtverců Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Lineární model y i = β 0 + β 1 x i1 + + β k x ik + ε i (1) kde y i
VíceZabezpečení datových přenosů pomocí CRC
Zabezpečení datových přenosů pomocí CRC Cílem úlohy je seznámit se s funkčními principy využití CRC (Cyclic Redundancy Check), tedy s jeho: - matematickým základem - vlastnostmi a detekčními schopnostmi
Více2. Základní typy dat Spojitá a kategoriální data Základní popisné statistiky Frekvenční tabulky Grafický popis dat
2. Základní typy dat Spojitá a kategoriální data Základní popisné statistiky Frekvenční tabulky Grafický popis dat Anotace Realitu můžeme popisovat různými typy dat, každý z nich se specifickými vlastnostmi,
VíceExtrakce a selekce příznaků
Extrakce a selekce příznaků Based on slides Martina Bachlera martin.bachler@igi.tugraz.at, Makoto Miwa And paper Isabelle Guyon, André Elisseeff: An Introduction to variable and feature selection. JMLR,
VíceLogaritmus, logaritmická funkce, log. Rovnice a nerovnice. 3 d) je roven číslu: c) -1 d) 0 e) 3 c) je roven číslu: b) -1 c) 0 d) 1 e)
Logaritmus, logaritmická funkce, log. Rovnice a nerovnice ) Výraz log log +log není správná 0 - žádná z předchozích odpovědí ) Číslo log 8 6 je rovno číslu: ) Výraz log log +log - 0 ) Číslo log 6 6 je
VíceEvropské výběrové šetření o zdravotním stavu v ČR - EHIS CR Index tělesné hmotnosti, fyzická aktivita, spotřeba ovoce a zeleniny
Aktuální informace Ústavu zdravotnických informací a statistiky České republiky Praha 22. 12. 2010 70 Evropské výběrové šetření o zdravotním stavu v ČR - EHIS CR Index tělesné hmotnosti, fyzická aktivita,
VíceMetodologie pro ISK 2, jaro Ladislava Z. Suchá
Metodologie pro ISK 2, jaro 2014. Ladislava Z. Suchá Metodologie pro Informační studia a knihovnictví 2 Modul 7: Třídění druhého stupně. Kontingenční tabulky Co se dozvíte v tomto modulu? Co je třídění
VíceDepartment of Mathematical Analysis and Applications of Mathematics Faculty of Science, Palacký University Olomouc Czech Republic
ROBUST 13. září 2016 regression regresních modelů Categorical Continuous - explanatory, Eva Fišerová Department of Mathematical Analysis and Applications of Mathematics Faculty of Science, Palacký University
VíceSeznámení se se zvolenou pokročilou iterativní metodou na problému batohu
4. 12. 213 MI-PAA úkol č. 4 Antonín Daněk Seznámení se se zvolenou pokročilou iterativní metodou na problému batohu 1 SPECIFIKACE ÚLOHY Cílem tohoto úkolu bylo seznámit se s vybranou pokročilou iterativní
VíceStatistické metody vyhodnocení vlivu škodlivin na denní úmrtnost, hospitalizaci a příznaky kardiovaskulárních a respiračních onemocnění
Statistické metody vyhodnocení vlivu škodlivin na denní úmrtnost, hospitalizaci a příznaky kardiovaskulárních a respiračních onemocnění Jiří Skorkovský Úvod a cíle studie vlivu PM10 na denní
VícePSY117/454 Statistická analýza dat v psychologii. Zobrazení dvojrozměrných dat Bodový graf - Scatterplot Korelační koeficient
PSY117/454 Statistická analýza dat v psychologii Zobrazení dvojrozměrných dat Bodový graf - Scatterplot Korelační koeficient Analýza vztahů mezi dvěma proměnnými Souvisí nějak? Výška a váha Známky u jednotlivých
VíceRNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.
Analýza dat pro Neurovědy RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Jaro 2014 Institut biostatistiky Janoušová, a analýz Dušek: Analýza dat pro neurovědy Blok 4 Jak a kdy použít parametrické a
VíceStrojové učení Marta Vomlelová
Strojové učení Marta Vomlelová marta@ktiml.mff.cuni.cz KTIML, S303 Literatura T. Hastie, R. Tishirani, and J. Friedman. The Elements of Statistical Learning, Data Mining, Inference and Prediction. Springer
VíceTECHNICKÁ UNIVERZITA V LIBERCI SEMESTRÁLNÍ PRÁCE
TECHNICKÁ UNIVERZITA V LIBERCI Ekonomická fakulta Studentská 2 461 17 Liberec 1 SEMESTRÁLNÍ PRÁCE STATISTICKÝ ROZBOR DAT Z DOTAZNÍKOVÝCH ŠETŘENÍ Gabriela Dlasková, Veronika Bukovinská Sára Kroupová, Dagmar
VíceVYSOK A ˇ SKOLA POLYTECHNICK A JIHLAVA Katedra matematiky Statistick a anal yza a ˇ casov e ˇ rady v pˇ r ıkladech Stanislava Dvoˇ r akov a 2015
VYSOKÁ ŠKOLA POLYTECHNICKÁ JIHLAVA Katedra matematiky Statistická analýza a časové řady v příkladech Stanislava Dvořáková 2015 Stanislava Dvořáková STATISTICKÁ ANALÝZA A ČASOVÉ ŘADY V PŘÍKLADECH 1. vydání
VíceUni- and multi-dimensional parametric tests for comparison of sample results
Uni- and multi-dimensional parametric tests for comparison of sample results Jedno- a více-rozměrné parametrické testy k porovnání výsledků Prof. RNDr. Milan Meloun, DrSc. Katedra analytické chemie, Universita
VíceDnešní program odvozování v Bayesovských sítích exaktní metody (enumerace, eliminace proměnných) aproximační metody y( (vzorkovací techniky)
Umělá inteligence II Roman Barták, KTIML roman.bartak@mff.cuni.cz http://ktiml.mff.cuni.cz/~bartak Bayesovská síť zachycuje závislosti mezi náhodnými proměnnými Pro zopakování orientovaný acyklický graf
Více05/29/08 cvic5.r. cv5.dat <- read.csv("cvic5.csv")
Zobecněné lineární modely Úloha 5: Vzdělání a zájem o politiku cv5.dat
VíceFiltrace snímků ve frekvenční oblasti. Rychlá fourierova transformace
Filtrace snímků ve frekvenční oblasti Rychlá fourierova transformace semestrální práce z předmětu KIV/ZVI zpracoval: Jan Bařtipán A03043 bartipan@students.zcu.cz Obsah Úvod....3 Diskrétní Fourierova transformace
VíceUniverzita Pardubice Chemicko-technologická fakulta Katedra analytické chemie
Univerzita Pardubice Chemicko-technologická fakulta Katedra analytické chemie 12. licenční studium PYTHAGORAS Statistické zpracování dat 3.3 Tvorba nelineárních regresních modelů v analýze dat Semestrální
VíceAnalýza variance (ANOVA) - jednocestná; faktor s pevným efektem; mnohonásobná srovnání
Analýza variance (ANOVA) - jednocestná; faktor s pevným efektem; mnohonásobná srovnání 1. Analýzu variance (ANOVu) používáme při studiu problémů, kdy máme závislou proměnou spojitého typu a nezávislé proměnné
VíceTéma je podrobně zpracováno ve skriptech [1], kapitola
Břetislav Fajmon, UMAT FEKT, VUT Brno Téma je podrobně zpracováno ve skriptech [1], kapitola 6. Základní aproximační úlohu lze popsat následovně: Jsou dány body [x 0, y 0 ], [x 1, y 1 ],..., [x n, y n
VíceMetodologie pro Informační studia a knihovnictví 2
Metodologie pro Informační studia a knihovnictví 2 Modul 7: Třídění druhého stupně. Kontingenční tabulky Co se dozvíte v tomto modulu? Co je třídění druhého stupně Jak vytvořit a interpretovat kontingenční
VíceÚkol 12. Přemysl Bejda. 22. března SAS slouží pro statistiky, jeho využití není příliš flexibilní, protože v něm nelze psát vlastní procedury.
Úkol 12 Přemysl Bejda 22. března 2008 1 Něco málo k SAS SAS slouží pro statistiky, jeho využití není příliš flexibilní, protože v něm nelze psát vlastní procedury. Komentáře v programu píšeme pomocí symbolu
VíceFiremní aplikace pro nástěnný ovladač AMR-OP60. Aplikace disponuje automatickým přepínáním zobrazení vnitřní / venkovní teploty.
Firemní aplikace pro nástěnný ovladač AMR-OP60. Aplikace disponuje automatickým přepínáním zobrazení vnitřní / venkovní teploty. Historie revizí Verze Datum Změny 100 18. 7. 2014 Nový dokument 101 1. 6.
VíceProblémy konstrukce a implementace modelů strukturální analýzy
Problémy konstrukce a implementace modelů strukturální analýzy Modely strukturální analýzy jsou určitou třídou lineárních modelů, tzn. že všechny obsažené funkce uvnitř těchto modelů mají lineární tvar.
VíceVYSOKÉ UČENÍ TECHNICKÉ V BRNĚ Fakulta strojního inženýrství Ústav strojírenské technologie odbor slévárenství. Ing. Martin Svadbík
VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ Fakulta strojního inženýrství Ústav strojírenské technologie odbor slévárenství Ing. Martin Svadbík OBJEMOVÉ MODELY JAKO NOVÝ PROSTŘEDEK KE STANOVENÍ VÝROBNÍCH ČASŮ VE SLÉVÁRENSTVÍ
VíceAnalýza reziduí gyroskopu umístěného na kyvadle p.1
Analýza reziduí gyroskopu umístěného na kyvadle Petr Šimeček Analýza reziduí gyroskopu umístěného na kyvadle p.1 Data z gyroskopu na kyvadle Data: 2 vzorky: RFILE, SIM frekvence 0.1s 30000 pozorování Proměnné:
Více13. Soustava lineárních rovnic a matice
@9. Soustv lineárních rovnic mtice Definice: Mtice je tbulk reálných čísel. U mtice rozlišujeme řádky (i=,..n), sloupce (j=,..m) říkáme, že mtice je typu (n x m). Oznčíme-li mtici písmenem A, její prvky
VíceLaboratorní zdroj - 6. část
Laboratorní zdroj - 6. část Publikované: 20.05.2016, Kategória: Silové časti www.svetelektro.com V tomto článku popíšu způsob, jak dojít k rovnicím (regresní funkce), které budou přepočítávat milivolty
VícePřednáška 2: Model, hodnocení modelu, metoda K nejbližších sousedů
České vysoké učení technické v Praze Fakulta informačních technologií Katedra teoretické informatiky Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti MI-ADM Algoritmy data miningu (2010/2011)
VíceRegresní analýza jednoduchá lineární regrese mnohonásobná lineární regrese logistická regrese
Regresní analýza jednoduchá lineární regrese mnohonásobná lineární regrese logistická regrese Regresní analýza korelační koeficient říká, že mezi dvěma proměnnými existuje souvislost - jsme schopni vyslovit
VíceJak začít pracovat s programem BetOptim.exe?
Jak začít pracovat s programem BetOptim.exe? A. Stažení a Instalace programu BetOptim Stažení instalačního souboru : www.betoptim.com/files/betoptim_install.exe Popis průběhu instalace je v angličtině,
VíceLineární regrese. Komentované řešení pomocí MS Excel
Lineární regrese Komentované řešení pomocí MS Excel Vstupní data Tabulka se vstupními daty je umístěna v oblasti A1:B11 (viz. obrázek) na listu cela data Postup Základní výpočty - regrese Výpočet základních
Více