Parametry hledáme tak, aby součet čtverců odchylek byl minimální. Řešením podle teorie je =
|
|
- Květoslava Bednářová
- před 8 lety
- Počet zobrazení:
Transkript
1 Příklad 1 Metodou nejmenších čtverců nalezněte odhad lineární regresní funkce popisující závislost mezi výnosy pšenice a množstvím použitého hnojiva na základě hodnot výběrového souboru uvedeného v tabulce. Závislost studujme na hladině významnosti 0,05. id Y výnos [t/ha] x hnojivo [kg/ha] Celkem Řešení 1 Hledáme odhad regresní přímky ve tvaru =+ Parametry hledáme tak, aby součet čtverců odchylek byl minimální. Řešením podle teorie je = =, = Pro řešení si tabulku ze zadání doplníme o dva sloupce, do kterých si připravíme výsledky mezivýpočtů a. Ze zadání víme, že =8. Do tabulky si doplníme i řádek pro průměry,. Dostaneme id Y x yx x Celkem Průměr 62,5 443, ,38 Dosadíme do prvního vzorce a dostaneme = ,75 62, ,75 = = ,5 =0, Tento výsledek dosadíme do druhého vzorce a dostaneme =62,5 0, ,75=62,5 25,93019=36,56981 Nalezli jsme potřebné koeficienty. Můžeme tvrdit, že na základě množství použitelného hnojiva odhadneme výnos pomocí funkce =0, ,
2 Celou situaci můžeme znázornit grafem jednotlivých naměřených závislostí s proloženou regresní přímkou. POZOR! V tomto případě je osa svislá a osa vodorovná (podle pořadí sloupců v MS Excel). Proložená regresní přímka byla vložena prostředky MS Excel. Je zřejmé, že odpovídá námi vypočteným hodnotám Závislost výnosu na množství hnojiva Dále se budeme zabývat problémem, zda lze vypočtenou závislost považovat za statisticky významnou na zadané hladině ( =0,05. Nejprve si vypočteme reziduální součet čtverců podle vzorce ) =*+,+ -. Výpočet provedeme dalším rozšířením naší tabulky id Y x yx x2 Y-(a+bx) (Y-(a+bx)) , , , , , , , , , , , , , , , , Celkem , Průměr 62,5 443, ,38 n 8 Se 177,9257 b 0, s2 29,65429 a 36,56981 s 5, Dostáváme tedy ) =177,9257 2
3 Odtud snadno vypočteme reziduální rozptyl jako / = ) 2 / = 177,9257 = 177,9257 =29, Z reziduálního rozptylu dostaneme snadno reziduální směrodatnou odchylku / =0/ =029,65429=5, Hypotézu 1 2 : =0 (závislost je nevýznamná) testujeme proti hypotéze 1 : 0 (tato závislost je významná) pomocí statistiky 5 = / 6* Dosadíme a dostaneme 5 = 0, , ,75 =0, ,0625 = 0, ,5 = 0, ,5 =0, , =6,677 Hypotézu, že závislost je nevýznamná na hladině ( zamítneme, pokud 5 9 : +1 ( 2. Připomínáme, že 9 : 1 ( 2 označuje 1 ( 2-kvantil Studentova t-rozdělení o 2 stupních volnosti (ten najdeme ve statistických tabulkách). Do testové nerovnosti odsadíme a vyhledáme hodnotu v tabulkách. Dostaneme 5 = 6,677 =6,677 2,447=9 <: =1 0,05 2 >=9?=1 0,05 2 > Je zřejmé, že nerovnost je platná, proto nulovou hypotézu, že závislost je nevýznamná můžeme na hladině 0,05 zamítnout. Současně můžeme konstatovat, že vypočtená závislost = 0, ,56981je statisticky významná na hladině 0,05. Na závěr ještě vypočteme koeficient determinance, který určuje, jaká část celkové variability proměnné je závislostí vysvětlena. Tento koeficient se počítá podle =1 Nejprve si vypočítáme hodnotu jmenovatele zlomku. ) =A * =40 62, , , , , , , ,5 = 22,5 + 12,5 + 12,5 +7,5 +2,5 +2,5 +17,5 +17,5 =1 177,9257 =1 0,118617=0, Kvalita lineárního modelu je vyjádřena zjištěnou hodnotou koeficientu determinace. 3
4 Příklad 2 Měřením bylo získáno 10 hodnot statistických znaků B a. Odhadněte parametry regresní přímky, která vystihuje závislost na B. Rozhodněte o kvalitě regresního modelu pomocí koeficientu determinance. B:1, 2, 3, 4, 5, 6, 7, 8, 9, 10 : 290, 365, 420, 445, 501, 598, 635, 687, 750, 880 Řešení 2 Hledáme odhad regresní přímky ve tvaru =+ Parametry hledáme tak, aby součet čtverců odchylek byl minimální. Řešením podle teorie je = =, = Pro řešení si tabulku ze zadání doplníme o dva sloupce, do kterých si připravíme výsledky mezivýpočtů a. Ze zadání víme, že =10. Do tabulky si doplníme i řádek pro průměry,. Dostaneme id X Y xy x Celkem Průměr 5,5 557,1 3564,4 Dosadíme do prvního vzorce a dostaneme = ,5 557, ,5 = ,5 = 5003, ,5 82,5 =60,64848 Tento výsledek dosadíme do druhého vzorce a dostaneme =557,1 60, ,5=557,1 333,5667=223,5333 Nalezli jsme potřebné koeficienty. Můžeme tvrdit, že na základě odhadneme hodnotu pomocí funkce =60, ,5333. Celou situaci můžeme znázornit grafem jednotlivých naměřených závislostí s proloženou regresní přímkou. Proložená regresní přímka byla vložena prostředky MS Excel. Je zřejmé, že odpovídá námi vypočteným hodnotám. 4
5 Závislost statistických znaků X a Y Dále se budeme zabývat problémem, zda lze vypočtenou závislost považovat za statisticky významnou na zadané hladině ( =0,05. Nejprve si vypočteme reziduální součet čtverců podle vzorce ) =*+,+ -. Výpočet provedeme dalším rozšířením naší tabulky id X Y xy x2 Y-(a+bx) (Y-(a+bx)) , , , , , , , , , , , , , , , , , , , ,1903 Celkem ,2061 Průměr 5,5 557,1 3564,4 n 10 a 223,5333 b 60,64848 Dostáváme tedy ) =5390,2061 Odtud snadno vypočteme reziduální rozptyl jako / = ) 2 5
6 / = 5390,2061 = 5390,2061 =673, Z reziduálního rozptylu dostaneme snadno reziduální směrodatnou odchylku / =0/ =0673,7758=25,95719 Hypotézu 1 2 : =0 (závislost je nevýznamná) testujeme proti hypotéze 1 : 0 (tato závislost je významná) pomocí statistiky 5 = / 6* Dosadíme a dostaneme 5 = 60, , ,5 =2, ,25=2, ,5 =2, ,5=2, ,082951=21,22214 Hypotézu, že závislost je nevýznamná na hladině ( zamítneme, pokud 5 9 : +1 ( 2. Připomínáme, že 9 : 1 ( 2 označuje 1 ( 2-kvantil Studentova t-rozdělení o 2 stupních volnosti (ten najdeme ve statistických tabulkách). Do testové nerovnosti odsadíme a vyhledáme hodnotu v tabulkách. Dostaneme 5 = 21,22214 =21, ,306=9 2: =1 0,05 2 >=9 <=1 0,05 2 > Je zřejmé, že nerovnost je platná, proto nulovou hypotézu, že závislost je nevýznamná můžeme na hladině 0,05 zamítnout. Současně můžeme konstatovat, že vypočtená závislost = 60, ,5333je statisticky významná na hladině 0,05. Na závěr ještě vypočteme koeficient determinance, který určuje, jaká část celkové variability proměnné je závislostí vysvětlena. Tento koeficient se počítá podle =1 Nejprve si vypočítáme hodnotu jmenovatele zlomku. ) =A * = , , , , , , , , , ,1 = 267, , , ,1 + 56,1 +40,9 +77,9 +129,9 +192,9 +322,9 =71342, , , , , ,81 =1 5390, ,9 =1 0, =0, Kvalita lineárního modelu je vyjádřena zjištěnou hodnotou koeficientu determinace. 6
7 Příklad 3 Charakterizujte závislost proměnné na B lineární regresní funkcí. B:12, 14, 16, 18, 20, 24, 26, 28, 30 :186, 216, 246, 276, 306, 366, 396, 426, 456 Řešení 3 Hledáme odhad regresní přímky ve tvaru =+ Parametry hledáme tak, aby součet čtverců odchylek byl minimální. Řešením podle teorie je = =, = Pro řešení si tabulku ze zadání doplníme o dva sloupce, do kterých si připravíme výsledky mezivýpočtů a. Ze zadání víme, že =9. Do tabulky si doplníme i řádek pro průměry,. Dostaneme id X Y xy x Celkem Průměr 20, , ,667 Dosadíme do prvního vzorce a dostaneme = ,9 319, ,9 = , ,3 =4907,7 324,7 =15,11401 Tento výsledek dosadíme do druhého vzorce a dostaneme =319,3 15, ,9=319,3 315,7149=3,61847 Nalezli jsme potřebné koeficienty. Můžeme tvrdit, že na základě odhadneme hodnotu pomocí funkce =15, , Celou situaci můžeme znázornit grafem jednotlivých naměřených závislostí s proloženou regresní přímkou. Proložená regresní přímka byla vložena prostředky MS Excel. Je zřejmé, že odpovídá námi vypočteným hodnotám. 7
8 Závislost Y na X Dále se budeme zabývat problémem, zda lze vypočtenou závislost považovat za statisticky významnou na zadané hladině ( =0,05. Nejprve si vypočteme reziduální součet čtverců podle vzorce ) =*+,+ -. Výpočet provedeme dalším rozšířením naší tabulky id X Y xy x2 Y-(a+bx) (Y-(a+bx)) ,06 1, ,84 0, ,62 0, ,4 0, ,18 0, ,26 0, ,48 0, ,7 0, ,92 0,8464 Celkem ,0404 Průměr 20, , ,667 n 9 a 3,62 b 15,11 Dostáváme tedy ) =4,0404 Odtud snadno vypočteme reziduální rozptyl jako / = ) 2 8
9 / = 4, =4,0404 =0, Z reziduálního rozptylu dostaneme snadno reziduální směrodatnou odchylku / =0/ =00,5772=0, Hypotézu 1 2 : =0 (závislost je nevýznamná) testujeme proti hypotéze 1 : 0 (tato závislost je významná) pomocí statistiky 5 = / 6* Dosadíme a dostaneme 5 = 15, , ,9 =19, ,29=19, ,71 =19, ,01971=315,7149 Hypotézu, že závislost je nevýznamná na hladině ( zamítneme, pokud 5 9 : +1 ( 2. Připomínáme, že 9 : 1 ( 2 označuje 1 ( 2-kvantil Studentova t-rozdělení o 2 stupních volnosti (ten najdeme ve statistických tabulkách). Do testové nerovnosti odsadíme a vyhledáme hodnotu v tabulkách. Dostaneme 5 = 315,7149 =315,7149 2,365=9 D: =1 0,05 2 >=9 E=1 0,05 2 > Je zřejmé, že nerovnost je platná, proto nulovou hypotézu, že závislost je nevýznamná můžeme na hladině 0,05 zamítnout. Současně můžeme konstatovat, že vypočtená závislost = 15, ,61847je statisticky významná na hladině 0,05. Na závěr ještě vypočteme koeficient determinance, který určuje, jaká část celkové variability proměnné je závislostí vysvětlena. Tento koeficient se počítá podle =1 Nejprve si vypočítáme hodnotu jmenovatele zlomku. Pomůžeme si dalším rozšířením tabulky ) =A id X Y xy x2 Y-(a+bx) (Y-(a+bx))2 Y-pY (Y-pY) ,06 1, , , ,84 0, , , ,62 0, , , ,4 0,16-43, , ,18 0, , , ,26 0, , , ,48 0, , , ,7 0,49 106, , ,92 0, , ,778 Celkem , Průměr 20, , ,667 n 9 a 3,62 b 15,11 9
10 * =1 4, =1 0, =0, Kvalita lineárního modelu je vyjádřena zjištěnou hodnotou koeficientu determinace. 10
11 Příklad 4 Charakterizujte závislost proměnné na B lineární regresní funkcí. B:5, 15, 25, 35, 45, 55, 65 :3.5, 5.2, 5.5, 6.1, 5.9, 6.4, 7.8 Řešení 4 Hledáme odhad regresní přímky ve tvaru =+ Parametry hledáme tak, aby součet čtverců odchylek byl minimální. Řešením podle teorie je = =, = Pro řešení si tabulku ze zadání doplníme o dva sloupce, do kterých si připravíme výsledky mezivýpočtů a. Ze zadání víme, že =7. Do tabulky si doplníme i řádek pro průměry,. Dostaneme id X Y xy x ,5 17, , ,5 137, ,1 213, ,9 265, , , Celkem , Průměr 35 5, ,4286 Dosadíme do prvního vzorce a dostaneme = , = , =157, =0, Tento výsledek dosadíme do druhého vzorce a dostaneme =5,77 0, =5,77 1,966875=3, Nalezli jsme potřebné koeficienty. Můžeme tvrdit, že na základě odhadneme hodnotu pomocí funkce =0, , Závislost X a Y
12 Celou situaci jsme znázornili grafem jednotlivých naměřených závislostí s proloženou regresní přímkou. Proložená regresní přímka byla vložena prostředky MS Excel. Je zřejmé, že odpovídá námi vypočteným hodnotám. Dále se budeme zabývat problémem, zda lze vypočtenou závislost považovat za statisticky významnou na zadané hladině ( =0,05. Nejprve si vypočteme reziduální součet čtverců podle vzorce ) =*+,+ -. Výpočet provedeme dalším rozšířením naší tabulky id X Y xy x2 Y-(a+bx) (Y-(a+bx)) ,5 17,5 25-0, , , , , ,5 137, , , ,1 213, , , ,9 265, , , , , , , , , Celkem , , Průměr 35 5, ,4286 n 7 a 3, b 0, Dostáváme tedy ) =1, Odtud snadno vypočteme reziduální rozptyl jako / = ) 2 / = 1, = 1, =0, Z reziduálního rozptylu dostaneme snadno reziduální směrodatnou odchylku / =0/ =00,278223=0, Hypotézu 1 2 : =0 (závislost je nevýznamná) testujeme proti hypotéze 1 : 0 (tato závislost je významná) pomocí statistiky 5 = / 6* Dosadíme a dostaneme 5 = 0, , =0, =0, =0, ,91503=5, Hypotézu, že závislost je nevýznamná na hladině ( zamítneme, pokud 12
13 5 9 : +1 ( 2. Připomínáme, že 9 : 1 ( 2 označuje 1 ( 2-kvantil Studentova t-rozdělení o 2 stupních volnosti (ten najdeme ve statistických tabulkách). Do testové nerovnosti odsadíme a vyhledáme hodnotu v tabulkách. Dostaneme 5 = 5, =5, ,571=9 E: =1 0,05 2 >=9 H=1 0,05 2 > Je zřejmé, že nerovnost je platná, proto nulovou hypotézu, že závislost je nevýznamná můžeme na hladině 0,05 zamítnout. Současně můžeme konstatovat, že vypočtená závislost = 0, , je statisticky významná na hladině 0,05. Na závěr ještě vypočteme koeficient determinance, který určuje, jaká část celkové variability proměnné je závislostí vysvětlena. Tento koeficient se počítá podle =1 Nejprve si vypočítáme hodnotu jmenovatele zlomku. Pomůžeme si dalším rozšířením tabulky ) =A id X Y xy x2 Y-(a+bx) (Y-(a+bx))2 Y-pY (Y-pY) ,5 17,5 25-0, , , , , , , , , ,5 137, , , , , ,1 213, , , , , ,9 265, , , , , , , , , , , , , , , Celkem , , , Průměr 35 5, ,4286 n 7 a 3, b 0, * =1 1, , =1 0, =0, Kvalita lineárního modelu je vyjádřena zjištěnou hodnotou koeficientu determinace. 13
Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13
Příklad 1 Máme k dispozici výsledky prvního a druhého testu deseti sportovců. Na hladině významnosti 0,05 prověřte, zda jsou výsledky testů kladně korelované. 1.test : 7, 8, 10, 4, 14, 9, 6, 2, 13, 5 2.test
Více676 + 4 + 100 + 196 + 0 + 484 + 196 + 324 + 64 + 324 = = 2368
Příklad 1 Je třeba prověřit, zda lze na 5% hladině významnosti pokládat za prokázanou hypotézu, že střední doba výroby výlisku je 30 sekund. Přitom 10 náhodně vybraných výlisků bylo vyráběno celkem 540
VíceTestování hypotéz o parametrech regresního modelu
Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Lineární regresní model kde Y = Xβ + e, y 1 e 1 β y 2 Y =., e = e 2 x 11 x 1 1k., X =....... β 2,
VíceTestování hypotéz o parametrech regresního modelu
Testování hypotéz o parametrech regresního modelu Ekonometrie Jiří Neubauer Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra UO
VíceRegresní a korelační analýza
Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).
VíceRegresní a korelační analýza
Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).
VíceRegresní a korelační analýza
Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).
VíceRegresní a korelační analýza
Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).
VíceRegresní analýza 1. Regresní analýza
Regresní analýza 1 1 Regresní funkce Regresní analýza Důležitou statistickou úlohou je hledání a zkoumání závislostí proměnných, jejichž hodnoty získáme při realizaci experimentů Vzhledem k jejich náhodnému
VíceTomáš Karel LS 2012/2013
Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není
VíceBodové a intervalové odhady parametrů v regresním modelu
Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Lineární regresní model Mějme lineární regresní model (LRM) Y = Xβ + e, kde y 1 e 1 β y 2 Y =., e
VíceRegresní a korelační analýza
Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).
VíceStatistika (KMI/PSTAT)
Statistika (KMI/PSTAT) Cvičení dvanácté aneb Regrese a korelace Statistika (KMI/PSTAT) 1 / 18 V souboru 25 jedinců jsme měřili jejich výšku a hmotnost. Výsledky jsou v tabulce a grafu. Statistika (KMI/PSTAT)
VíceSEMESTRÁLNÍ PRÁCE. Leptání plasmou. Ing. Pavel Bouchalík
SEMESTRÁLNÍ PRÁCE Leptání plasmou Ing. Pavel Bouchalík 1. ÚVOD Tato semestrální práce obsahuje písemné vypracování řešení příkladu Leptání plasmou. Jde o praktickou zkoušku znalostí získaných při přednáškách
VíceKGG/STG Statistika pro geografy
KGG/STG Statistika pro geografy 10. Mgr. David Fiedor 27. dubna 2015 Nelineární závislost - korelační poměr užití v případě, kdy regresní čára není přímka, ale je vyjádřena složitější matematickou funkcí
VícePlánování experimentu
Fakulta chemicko technologická Katedra analytické chemie licenční studium Management systému jakosti Autor: Ing. Radek Růčka Přednášející: Prof. Ing. Jiří Militký, CSc. 1. LEPTÁNÍ PLAZMOU 1.1 Zadání Proces
VíceLINEÁRNÍ REGRESE. Lineární regresní model
LINEÁRNÍ REGRESE Chemometrie I, David MILDE Lineární regresní model 1 Typy závislosti 2 proměnných FUNKČNÍ VZTAH: 2 závisle proměnné: určité hodnotě x odpovídá jediná hodnota y. KORELACE: 2 náhodné (nezávislé)
Více2 ) 4, Φ 1 (1 0,005)
Příklad 1 Ze zásilky velkého rozsahu byl náhodně vybrán soubor obsahující 1000 kusů. V tomto souboru bylo zjištěno 26 kusů nekvalitních. Rozhodněte, zda je možné s 99% jistotou tvrdit, že zásilka obsahuje
VíceCvičící Kuba Kubina Kubinčák Body u závěrečného testu
1. Příklad U 12 studentů jsme sledovali počet dosažených bodů na závěrečném testu (od 0 do 60). Vždy 4 z těchto studentů chodili k jednomu ze 3 cvičících panu Kubovi, panu Kubinovi, nebo panu Kubinčákovi.
VíceNormální (Gaussovo) rozdělení
Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení popisuje vlastnosti náhodné spojité veličiny, která vzniká složením různých náhodných vlivů, které jsou navzájem nezávislé, kterých je velký
VíceLineární regrese. Komentované řešení pomocí MS Excel
Lineární regrese Komentované řešení pomocí MS Excel Vstupní data Tabulka se vstupními daty je umístěna v oblasti A1:B11 (viz. obrázek) na listu cela data Postup Základní výpočty - regrese Výpočet základních
VíceSever Jih Západ Plechovka Točené Sever Jih Západ Součty Plechovka Točené Součty
Neparametrické testy (motto: Hypotézy jsou lešením, které se staví před budovu a pak se strhává, je-li budova postavena. Jsou nutné pro vědeckou práci, avšak skutečný vědec nepokládá hypotézy za předmětnou
VíceUNIVERZITA PARDUBICE
UNIVERZITA PARDUBICE Fakulta chemicko technologická Katedra analytické chemie Licenční studium chemometrie na téma Kalibrace a limity její přesnosti Vedoucí licenčního studia Prof. RNDr. Milan Meloun,
VíceCharakteristika datového souboru
Zápočtová práce z předmětu Statistika Vypracoval: 10. 11. 2014 Charakteristika datového souboru Zadání: Při kontrole dodržování hygienických norem v kuchyni se prováděl odběr vzduchu a pomocí filtru Pallflex
VíceInovace bakalářského studijního oboru Aplikovaná chemie
http://aplchem.upol.cz CZ.1.07/2.2.00/15.0247 Tento projekt je spolufinancován Evropským sociálním fondem a státním rozpočtem České republiky. Regrese Závislostproměnných funkční y= f(x) regresní y= f(x)
VíceYou created this PDF from an application that is not licensed to print to novapdf printer (http://www.novapdf.com)
Závislost náhodných veličin Úvod Předchozí přednášky: - statistické charakteristiky jednoho výběrového nebo základního souboru - vztahy mezi výběrovým a základním souborem - vztahy statistických charakteristik
VíceProtokol č. 1. Tloušťková struktura. Zadání:
Protokol č. 1 Tloušťková struktura Zadání: Pro zadané výčetní tloušťky (v cm) vypočítejte statistické charakteristiky a slovně interpretujte základní statistické vlastnosti tohoto souboru tloušťek. Dále
VíceBodové a intervalové odhady parametrů v regresním modelu
Bodové a intervalové odhady parametrů v regresním modelu 1 Odhady parametrů 11 Bodové odhady Mějme lineární regresní model (LRM) kde Y = y 1 y 2 y n, e = e 1 e 2 e n Y = Xβ + e, x 11 x 1k, X =, β = x n1
VíceSemestrální práce. 2. semestr
Licenční studium č. 89002 Semestrální práce 2. semestr Tvorba lineárních regresních modelů při analýze dat Příklad 1 Porovnání dvou regresních přímek u jednoduchého lineárního regresního modelu. Počet
VíceJEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica
JEDNOVÝBĚROVÉ TESTY Komentované řešení pomocí programu Statistica Vstupní data Data umístěná v excelovském souboru překopírujeme do tabulky ve Statistice a pojmenujeme proměnné, viz prezentace k tématu
VíceStanovení manganu a míry přesnosti kalibrace ( Lineární kalibrace )
Příklad č. 1 Stanovení manganu a míry přesnosti kalibrace ( Lineární kalibrace ) Zadání : Stanovení manganu ve vodách se provádí oxidací jodistanem v kyselém prostředí až na manganistan. (1) Sestrojte
VíceRegresní analýza. Eva Jarošová
Regresní analýza Eva Jarošová 1 Obsah 1. Regresní přímka 2. Možnosti zlepšení modelu 3. Testy v regresním modelu 4. Regresní diagnostika 5. Speciální využití Lineární model 2 1. Regresní přímka 3 nosnost
VíceNárodníinformačnístředisko pro podporu jakosti
Národníinformačnístředisko pro podporu jakosti OVĚŘOVÁNÍ PŘEDPOKLADU NORMALITY Doc. Ing. Eva Jarošová, CSc. Ing. Jan Král Používané metody statistické testy: Chí-kvadrát test dobré shody Kolmogorov -Smirnov
VíceANOVA. Semestrální práce UNIVERZITA PARDUBICE. Fakulta chemicko-technologická Katedra analytické chemie
UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie ANOVA Semestrální práce Licenční studium Galileo Interaktivní statistická analýza dat Brno 2015 Ing. Petra Hlaváčková, Ph.D.
VíceNormální (Gaussovo) rozdělení
Normální (Gaussovo) rozdělení f x = 1 2 exp x 2 2 2 f(x) je funkce hustoty pravděpodobnosti, symetrická vůči poloze maxima x = μ μ střední hodnota σ směrodatná odchylka (tzv. pološířka křivky mezi inflexními
Více11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.
11 cvičení z PSI 12-16 prosince 2016 111 (Test dobré shody - geometrické rozdělení Realizací náhodné veličiny X jsme dostali následující četnosti výsledků: hodnota 0 1 2 3 4 5 6 pozorovaná četnost 29 15
VíceTestování statistických hypotéz
Testování statistických hypotéz Na základě náhodného výběru, který je reprezentativním vzorkem základního souboru (který přesně neznáme, k němuž se ale daná statistická hypotéza váže), potřebujeme ověřit,
VíceKorelační a regresní analýza
Korelační a regresní analýza Analýza závislosti v normálním rozdělení Pearsonův (výběrový) korelační koeficient: r = s XY s X s Y, kde s XY = 1 n (x n 1 i=0 i x )(y i y ), s X (s Y ) je výběrová směrodatná
VícePRAVDĚPODOBNOST A STATISTIKA
PRAVDĚPODOBNOS A SAISIKA Regresní analýza - motivace Základní úlohou regresní analýzy je nalezení vhodného modelu studované závislosti. Je nutné věnovat velkou pozornost tomu aby byla modelována REÁLNÁ
VíceZápočtová práce STATISTIKA I
Zápočtová práce STATISTIKA I Obsah: - úvodní stránka - charakteristika dat (původ dat, důvod zpracování,...) - výpis naměřených hodnot (v tabulce) - zpracování dat (buď bodové nebo intervalové, podle charakteru
VíceVýrobní produkce divizí Ice Cream Po lo ha plane t Rozložený výse ový 3D graf Bublinový graf Histogram t s tn e ídy
Výrobní produkce divizí Ice Cream Polo ha planet Rozložený výsečový 3D graf Bublinový graf Ice Cream 1 15% Ice Cream 2 12% Ice Cream 3 18% Ice Cream 4 20% Statistika 40 30 20 Ice Cream 6 19% Ice Cream
VíceANALÝZA VZTAHU DVOU SPOJITÝCH VELIČIN
ANALÝZA VZTAHU DVOU SPOJITÝCH VELIČIN V dokumentu 7a_korelacn_a_regresn_analyza jsme řešl rozdíl mez korelační a regresní analýzou. Budeme se teď věnovat pouze lneárnímu vztahu dvou velčn, protože je nejjednodušší
VíceUNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice
UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, 532 10 Pardubice 10. licenční studium chemometrie STATISTICKÉ ZPRACOVÁNÍ DAT Semestrální práce ANALÝZA
VíceSTATISTICA Téma 6. Testy na základě jednoho a dvou výběrů
STATISTICA Téma 6. Testy na základě jednoho a dvou výběrů 1) Test na velikost rozptylu Test na velikost rozptylu STATISTICA nemá. 2) Test na velikost střední hodnoty V menu Statistika zvolíme nabídku Základní
VícePRAVDĚPODOBNOST A STATISTIKA
PRAVDĚPODOBNOST A STATISTIKA Testování hypotéz Nechť X je náhodná proměnná, která má distribuční funkci F(x, ϑ). Předpokládejme, že známe tvar distribuční funkce (víme jaké má rozdělení) a neznáme parametr
VíceTestování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času
Testování hypotéz 1 Jednovýběrové testy 90/ odhad času V podmínkách naprostého odloučení má voák prokázat schopnost orientace v čase. Úkolem voáka e provést odhad časového intervalu 1 hodiny bez hodinek
VíceOptimální trvanlivost nástroje
Ústav Strojírenské technologie Speciální technologie výroby Cvičení Optimální trvanlivost nástroje č. zadání: Zadání: Z naměřených hodnot opotřebení vyměnitelné břitové destičky určete optimální trvanlivost
VícePravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická
VíceKalibrace a limity její přesnosti
Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium chemometrie Statistické zpracování dat Kalibrace a limity její přesnosti Zdravotní ústav se sídlem v Ostravě
VíceStatistická analýza jednorozměrných dat
Statistická analýza jednorozměrných dat Prof. RNDr. Milan Meloun, DrSc. Univerzita Pardubice, Pardubice 31.ledna 2011 Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem
Více4EK211 Základy ekonometrie
4EK211 Základy ekonometrie ZS 2016/17 Cvičení 3: Lineární regresní model LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE 1. Seznámení s EViews Upřesnění
Více4EK211 Základy ekonometrie
4EK Základy ekonometrie Odhad klasického lineárního regresního modelu II Cvičení 3 Zuzana Dlouhá Klasický lineární regresní model - zadání příkladu Soubor: CV3_PR.xls Data: y = maloobchodní obrat potřeb
Více12. cvičení z PST. 20. prosince 2017
1 cvičení z PST 0 prosince 017 11 test rozptylu normálního rozdělení Do laboratoře bylo odesláno n = 5 stejných vzorků krve ke stanovení obsahu alkoholu X v promilích alkoholu Výsledkem byla realizace
VíceJednofaktorová analýza rozptylu
Jednofaktorová analýza rozptylu David Hampel Ústav statistiky a operačního výzkumu, Mendelova univerzita v Brně Kurz pokročilých statistických metod Global Change Research Centre AS CR, 5 7 8 2015 Tato
VíceSTATISTICKÉ TESTY VÝZNAMNOSTI
STATISTICKÉ TESTY VÝZNAMNOSTI jsou statistické postupy, pomocí nichž ověřujeme, zda mezi proměnnými existuje vztah (závislost, rozdíl). Pokud je výsledek šetření statisticky významný (signifikantní), znamená
VíceTomáš Karel LS 2012/2013
Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není
VíceTestování předpokladů pro metodu chain-ladder. Seminář z aktuárských věd Petra Španihelová
Testování předpokladů pro metodu chain-ladder Seminář z aktuárských věd 4. 11. 2016 Petra Španihelová Obsah Datová struktura Posouzení dat Předpoklady metody chain-ladder dle T. Macka Běžná lineární regrese
VíceAnalýza rozptylu. Ekonometrie. Jiří Neubauer. Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel
Analýza rozptylu Ekonometrie Jiří Neubauer Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra UO Brno) Analýza rozptylu 1 / 30 Analýza
VíceKorelace. Komentované řešení pomocí MS Excel
Korelace Komentované řešení pomocí MS Excel Vstupní data Tabulka se vstupními daty je umístěna v oblasti A2:B84 (viz. obrázek) Prvotní představu o tvaru a síle závislosti docházky a počtu bodů nám poskytne
VíceINDUKTIVNÍ STATISTIKA
10. SEMINÁŘ INDUKTIVNÍ STATISTIKA 3. HODNOCENÍ ZÁVISLOSTÍ HODNOCENÍ ZÁVISLOSTÍ KVALITATIVNÍ VELIČINY - Vychází se z kombinační (kontingenční) tabulky, která je výsledkem třídění druhého stupně KVANTITATIVNÍ
Více1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.
Prostá regresní a korelační analýza 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Problematika závislosti V podstatě lze rozlišovat mezi závislostí nepodstatnou, čili náhodnou
VíceTéma 9: Vícenásobná regrese
Téma 9: Vícenásobná regrese 1) Vytvoření modelu V menu Statistika zvolíme nabídku Vícerozměrná regrese. Aktivujeme kartu Detailní nastavení viz obr.1. Nastavíme Proměnné tak, že v příslušném okně viz.
VíceMatematické modelování Náhled do ekonometrie. Lukáš Frýd
Matematické modelování Náhled do ekonometrie Lukáš Frýd Výnos akcie vs. Výnos celého trhu - CAPM model r it = r ft + β 1. (r mt r ft ) r it r ft = α 0 + β 1. (r mt r ft ) + ε it Ekonomický (finanční model)
VíceSemestrální práce. 3.3 Tvorba nelineárních regresních modelů v analýze dat
Semestrální práce 1 3.3 Tvorba nelineárních regresních modelů v analýze dat Ing. Ján Lengyel, CSc. Centrální analytická laboratoř Ústav jaderného výzkumu Řež, a. s. Husinec Řež 130 250 68 Řež V Řeži, únor
VíceKGG/STG Statistika pro geografy
KGG/STG Statistika pro geografy 9. Korelační analýza Mgr. David Fiedor 20. dubna 2015 Analýza závislostí v řadě geografických disciplín studujeme jevy, u kterých vyšetřujeme nikoliv pouze jednu vlastnost
VíceII. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal
Základy navrhování průmyslových experimentů DOE II. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal! Testování statistických hypotéz kvalitativní odezva kvantitativní chí-kvadrát test homogenity,
VíceLINEÁRNÍ REGRESE Komentované řešení pomocí programu Statistica
LINEÁRNÍ REGRESE Komentované řešení pomocí programu Statistica Vstupní data Data umístěná v excelovském souboru překopírujeme do tabulky ve Statistice a pojmenujeme proměnné, viz prezentace k tématu Popisná
VícePorovnání dvou výběrů
Porovnání dvou výběrů Menu: QCExpert Porovnání dvou výběrů Tento modul je určen pro podrobnou analýzu dvou datových souborů (výběrů). Modul poskytuje dva postupy analýzy: porovnání dvou nezávislých výběrů
VíceTesty dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, TESTY DOBRÉ SHODY (angl. goodness-of-fit tests)
Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, např. hmotnost a pohlaví narozených dětí. Běžný statistický postup pro ověření závislosti dvou veličin je zamítnutí jejich
Více4ST201 STATISTIKA CVIČENÍ Č. 7
4ST201 STATISTIKA CVIČENÍ Č. 7 testování hypotéz parametrické testy test hypotézy o střední hodnotě test hypotézy o relativní četnosti test o shodě středních hodnot testování hypotéz v MS Excel neparametrické
Víceodpovídá jedna a jen jedna hodnota jiných
8. Regresní a korelační analýza Problém: hledání, zkoumání a hodnocení souvislostí, závislostí mezi dvěma a více statistickými znaky (veličinami). Typy závislostí: pevné a volné Pevná závislost každé hodnotě
VíceRegresní a korelační analýza
Přednáška STATISTIKA II - EKONOMETRIE Katedra ekonometrie FEM UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Regresní analýza Cíl regresní analýzy: stanovení formy (trendu, tvaru, průběhu)
Více13.1. Úvod Cílem regresní analýzy je popsat závislost hodnot znaku Y na hodnotách
13 Regrese 13.1. Úvod Cílem regresní analýzy je popsat závislost hodnot znaku Y na hodnotách znaku X. Přitom je třeba vyřešit jednak volbu funkcí k vystižení dané závislosti a dále stanovení konkrétních
Více31. 3. 2014, Brno Hanuš Vavrčík Základy statistiky ve vědě
31. 3. 2014, Brno Hanuš Vavrčík Základy statistiky ve vědě Motto Statistika nuda je, má však cenné údaje. strana 3 Statistické charakteristiky Charakteristiky polohy jsou kolem ní seskupeny ostatní hodnoty
VíceUNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 3. 11.
UNIVERZITA OBRANY Fakulta ekonomiky a managementu Aplikace STAT1 Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 Jiří Neubauer, Marek Sedlačík, Oldřich Kříž 3. 11. 2012 Popis a návod k použití aplikace
Více(motto: An unsophisticated forecaster uses statistics as a drunken man uses lamp-posts - for support rather than for illumination.
Neparametricke testy (motto: An unsophisticated forecaster uses statistics as a drunken man uses lamp-posts - for support rather than for illumination. Andrew Lang) 1. Příklad V následující tabulce jsou
VíceSTATISTICA Téma 7. Testy na základě více než 2 výběrů
STATISTICA Téma 7. Testy na základě více než 2 výběrů 1) Test na homoskedasticitu Nalezneme jej v několika submenu. Omezme se na submenu Základní statistiky a tabulky základního menu Statistika. V něm
VíceTesty statistických hypotéz
Testy statistických hypotéz Statistická hypotéza je jakýkoliv předpoklad o rozdělení pravděpodobnosti jedné nebo několika náhodných veličin. Na základě náhodného výběru, který je reprezentativním vzorkem
VíceSTATISTICKÉ TESTY VÝZNAMNOSTI
STATISTICKÉ TESTY VÝZNAMNOSTI jsou statistické postupy, pomocí nichž ověřujeme, zda mezi proměnnými existuje vztah (závislost, rozdíl). Pokud je výsledek šetření statisticky významný (signifikantní), znamená
Více4ST201 STATISTIKA CVIČENÍ Č. 8
4ST201 STATISTIKA CVIČENÍ Č. 8 analýza závislostí kontingenční tabulky test závislosti v kontingenční tabulce analýza rozptylu regresní analýza lineární regrese Analýza závislostí Budeme ověřovat existenci
Více4EK211 Základy ekonometrie
4EK211 Základy ekonometrie ZS 2015/16 Cvičení 7: Časově řady, autokorelace LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE 1. Časové řady Data: HDP.wf1
VíceIlustrační příklad odhadu LRM v SW Gretl
Ilustrační příklad odhadu LRM v SW Gretl Podkladové údaje Korelační matice Odhad lineárního regresního modelu (LRM) Verifikace modelu PEF ČZU Praha Určeno pro posluchače předmětu Ekonometrie Needitovaná
VíceTest dobré shody v KONTINGENČNÍCH TABULKÁCH
Test dobré shody v KONTINGENČNÍCH TABULKÁCH Opakování: Mějme náhodné veličiny X a Y uspořádané do kontingenční tabulky. Řekli jsme, že nulovou hypotézu H 0 : veličiny X, Y jsou nezávislé zamítneme, když
Více4EK211 Základy ekonometrie
4EK211 Základy ekonometrie LS 2014/15 Cvičení 4: Statistické vlastnosti MNČ LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE Upřesnění k pojmům a značení
VíceÚloha č. 2 - Kvantil a typická hodnota. (bodově tříděná data): (intervalově tříděná data): Zadání úlohy: Zadání úlohy:
Úloha č. 1 - Kvantily a typická hodnota (bodově tříděná data): Určete typickou hodnotu, 40% a 80% kvantil. Tabulka hodnot: Varianta Četnost 0 4 1 14 2 17 3 37 4 20 5 14 6 7 7 11 8 20 Typická hodnota je
VíceAnalýza rozptylu. Podle počtu analyzovaných faktorů rozlišujeme jednofaktorovou, dvoufaktorovou a vícefaktorovou analýzu rozptylu.
Analýza rozptylu Analýza rozptylu umožňuje ověřit významnost rozdílu mezi výběrovými průměry většího počtu náhodných výběrů, umožňuje posoudit vliv různých faktorů. Podle počtu analyzovaných faktorů rozlišujeme
Více4EK211 Základy ekonometrie
4EK211 Základy ekonometrie LS 2014/15 Cvičení 7: Autokorelace LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE 1. Autokorelace - teorie Zopakujte si G-M
VíceAVDAT Geometrie metody nejmenších čtverců
AVDAT Geometrie metody nejmenších čtverců Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Lineární model klasický lineární regresní model odhad parametrů MNČ y = Xβ + ε, ε
VíceJednovýběrové testy. Komentované řešení pomocí MS Excel
Jednovýběrové testy Komentované řešení pomocí MS Excel Vstupní data V dalším budeme předpokládat, že tabulka se vstupními daty je umístěna v oblasti A1:C23 (viz. obrázek) Základní statistiky vložíme vzorce
VíceUNIVERZITA PARDUBICE
UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Vedoucí studia a odborný garant: Prof. RNDr. Milan Meloun, DrSc. Vyučující: Prof. RNDr. Milan Meloun, DrSc. Autor práce: ANDRII
VíceStatistická analýza jednorozměrných dat
Statistická analýza jednorozměrných dat Prof. RNDr. Milan Meloun, DrSc. Univerzita Pardubice, Pardubice 31.ledna 2011 Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem
VíceStručný úvod do testování statistických hypotéz
Stručný úvod do testování statistických hypotéz 1. Formulujeme hypotézu (předpokládáme, že pozorovaný jev je pouze náhodný). 2. Zvolíme hladinu významnosti testu a, tj. riziko, s nímž jsme ochotni se smířit.
VíceUNIVERZITA PARDUBICE FAKULTA CHEMICKO-TECHNOLOGICKÁ
UNIVERZITA PARDUBICE FAKULTA CHEMICKO-TECHNOLOGICKÁ SEMESTRÁLNÍ PRÁCE Kalibrace a limity její přesnosti Precheza a.s. Přerov 2005 Ing. Miroslav Štrajt 1. Zadání Úloha 1. Lineární kalibrace: u přímkové
VíceUNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice
UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, 532 10 Pardubice 10. licenční studium chemometrie STATISTICKÉ ZPRACOVÁNÍ DAT Semestrální práce KALIBRACE
VíceCvičení ze statistiky - 3. Filip Děchtěrenko
Cvičení ze statistiky - 3 Filip Děchtěrenko Minule bylo.. Dokončili jsme základní statistiky, typy proměnných a začali analýzu kvalitativních dat Tyhle termíny by měly být známé: Histogram, krabicový graf
VíceKorelační a regresní analýza. 1. Pearsonův korelační koeficient 2. jednoduchá regresní analýza 3. vícenásobná regresní analýza
Korelační a regresní analýza 1. Pearsonův korelační koeficient 2. jednoduchá regresní analýza 3. vícenásobná regresní analýza Pearsonův korelační koeficient u intervalových a poměrových dat můžeme jako
VíceZávislost obsahu lipoproteinu v krevním séru na třech faktorech ( Lineární regresní modely )
Úloha M608 Závislost obsahu lipoproteinu v krevním séru na třech faktorech ( Lineární regresní modely ) Zadání : Při kvantitativní analýze lidského krevního séra ovlivňují hodnotu obsahu vysokohustotního
Více