Závislost vysvětlujících proměnných v regresním modelu
|
|
- Jiřina Sedláková
- před 7 lety
- Počet zobrazení:
Transkript
1 Závislost vysvětlujících proměnných v regresním modelu The dependency of the explanatory variables in the regression model Hynek ČERNÝ Abstrakt Neexistence (či spíše akceptovatelná hodnota) multikolinearity je jedním z předpokladů úspěšné aplikace klasického lineárního regresního modelu. Obvyklé řešení bývá postupná eliminace vzájemně provázaných proměnných a hodnocení parametrů takto vzniklých modelů. V poslední době se osvědčily méně pracné techniky a systematičtější způsoby řešení tohoto zajímavého problému. Klíčová slova: multikolinearita, regrese, PCL, PLSR. Abstract The absence (or rather the acceptable value) of multicolinearity is one of the prerequisites of a successful application of the classical linear regression model. The usual solution is the gradual elimination of interrelated variables and followingassessmentof the resulting models. In recent times the less laborious techniques and more systematic ways of resolving this interesting issue appeared. Key words: multicollinearity, regression, PCL, PLSR.
2 Úvod V regresní analýze se zabýváme vytvořením vhodného matematického modelu závislosti mezi vysvětlovanou a vysvětlujícími proměnnými (prediktory), stanovujeme parametry tohoto modelu a ověřujeme hypotézy vhodnosti modelu a jeho vlastností.počet potenciálních faktorů, které lze začlenit do regresního modelu je teoreticky omezen pouze kapacitami a dostupností dat.fakticky je však třeba vzít v úvahu některá omezení. Předpoklady klasického modelu Předpoklady klasického lineárního regresního modelu (Greene, 2008) jsou následující: linearita model specifikuje lineární závislost mezi y a x 1,, x k, hodnotnost (neexistence multikolinearity) neexistuje přímá lineární závislost mezi žádnou z nezávislých proměnných x i v modelu, exogenita nezávislých proměnných odhadovaná hodnota reziduí ε i pozorovánínení funkcí pozorování žádných nezávislých proměnných. To znamená, ženezávislé proměnné nejsou nositeli žádné informace použitelné k predikcináhodné složky.předpokládá se, že náhodná složka má, podmíněně, očekávanou hodnotu každého pozorování rovnu nule, homoskedasticita a neautokorelace reziduí každá náhodná složka ε i má stejnýa konečný rozptyl σ 2 a není korelována s žádnými jinými rezidui. Předpokládáse, že odchylky pozorování od jejich očekávaných hodnot jsou nekorelované, normální rozdělení náhodné složky jsou náhodně rozděleny. Multikolinearita Často diskutovaným požadavkem je neexistence multikolinearity. Multikolinearita je pojem, jehož význam spočívá ve faktu, že je třeba vážit nejen výběr vhodných regresorů ale i jejich počet. Neadekvátní výběr a počet regresorů může způsobit nemožnost stanovení jeho koeficientů, v lepším případě učiní model nesrozumitelným a neaplikovatelným. Multikolinearita je dána korelací prediktoru s jiným prediktorem, nebo se skupinou jiných prediktorů v navrhovaném modelu (silná závislost mezi vysvětlujícími proměnnými) a znamená, že některé prediktory jsou v navrhovaném modelu více či méně nadbytečné a způsobují tak jeho zbytnělost a nesrozumitelnost. Multikolinearita je do určité míry běžný jev a nemusí způsobovat větší potíže. Avšak velká multikolinearita je značný problém, neboť nadhodnocuje součty čtverců regresních koeficientů, což vede k nadhodnocení důležitosti některých vysvětlujících proměnných. Multikolinearitataké zvyšuje rozptyly odhadů a snižuje tím přesnost odhadů individuálních hodnot.
3 Některé regresní koeficienty se tak jeví statisticky nevýznamné, i když F-test může být významný, což by jinak nasvědčovalo dobrému modelu. Odhady regresních koeficientů mohou být nestabilní, dochází k numerickým problémům při jejich vyčíslení. Čím větší rozptyl koeficienty mají, tím obtížnější je interpretace individuálního vlivu jednotlivých vysvětlujících proměnných a jejich vliv nelze odděleně sledovat. Obecné příčiny multikolinearity jsou zejména: regresní model obsahuje nadměrný počet vysvětlujících proměnných, nevhodná volba kombinací hodnot vysvětlujících proměnných, nevhodné rozmístění experimentálních bodů, omezení v modelu nebo v datech, tendence časových řad ekonomických ukazatelů (makroúdajů) vyvíjet se stejným směrem (např. HDP, export, import...), zahrnutí zpožděných endonebo exogenních proměnných. Pro posouzení, zda se v daném modelu zabývat problémem multikolinearity je vhodné sledovat následující signály. regresní koeficient není významný, ačkoli by teoreticky měl být vysoce korelován se závisle proměnnou, přidání nebo odebrání proměnné do/z modelu způsobí dramatické změny v regresních koeficientech, regresní koeficient má opačné znaménko, např. záporné, když očekáváme pozitivní změnu závisle proměnné na kladný pohyb příslušné nezávisle proměnné, nezávisle proměnné mají zjevně vysoké párové korelace. Multikolinearita se prokazuje zejména následujícími metodami: determinant korelační matice se při silné vzájemné lineární závislosti vysvětlujících proměnných blíží nule, nízká hodnota nejmenšího charakteristického čísla indikuje silnou lineární závislost vysvětlujících proměnných, index podmíněnosti korelační matice (odmocnina poměru největšího a nejmenšího charakteristického čísla) nad hodnotou 30 naznačuje existenci multikolinearity,
4 jednoduché korelační koeficienty dvojic vysvětlujících proměnných (nebo vícenásobné korelační koeficienty j-té vysvětlující proměnné vzhledem k ostatním vysvětlujícím proměnným) mají absolutní hodnoty> 0,8 (někdy se udává 0,9), kritérium M (založeno na paradoxu F-testu a dílčích t-testů) -kde t i jsou testová kritéria pro dílčí t-testy a F je testové kritérium pro celkový F-test. Orientačně, je-li (M>0,8), lineární závislost se označuje za silnou. Jedním ze způsobů měření multikolinearity je VIF (variance inflationfactor), který vyhodnocuje, jak moc se rozptyl odhadovaného regresního koeficientu zvýší, pokud jsou prediktory korelované. Pokud má VIF hodnotu jedna, nevyskytuje se v modelu multikolinearita. Naopak hodnota VIF v rozmezí 5-10 svědčí již o vysoké multikolinearitě. Hodnoty nad 10 znamenají problematickou spolehlivost korelačních koeficientů. S multikolinearitou se běžně lze vypořádat různými způsoby. Nejradikálnější možností bývá opatření jiných dat a pozorovacích metod, výběr jiných proměnných do modelu. Zpravidla se však zpočátku zkouší odstranění vysoce korelovaných prediktorů z modelu. V případě existence dvou, nebo více faktorů s vysokým VIF, je třeba jeden z nich z modeluodstranit, neboť představuje zřejmě nadbytečnou informaci. Odstranění jedné ze zkorelovaných proměnných zpravidla nesníží nijak dramaticky R 2. Účinným postupempři provádění regrese je postupné vynechávání proměnných i s využitím speciálních znalostí sady dat (použití pomocných regresí). Pokud jsoukoeficienty determinace z pomocných regresí nižší než koeficient zkoumaného celku, pak lze multikolinearitu posoudit jako akceptovatelnou 1. Progresivní možnosti řešení Zmíněné možnosti mají nevýhodu, že bývají pracné a nejsou úplně systematické. V posledních letech se proto začaly úspěšně využívat další techniky. Programový modul PrincipalComponent and Partial Least SquaresRegression in R 2. Z názvu plyne, že modul běží v dostupném programovém prostředí R. Jde o relativně nově vyvinuté regresní metody (tzv. multivariate regression methods ), které omezujípočet prediktorů na menší datovou sadu nekorelovaných komponent 3. Patří sem principalcomponentregression (PCR)apartial leastsquaresregression (PLSR). Tyto metody se staly populární v celé řadě oblastí, včetně přírodních Autoři Bjørn-HelgeMevik (Norwegian University oflifesciences), Ron Wehrens (Radboud University Nijmegen)
5 věd. Hlavním důvodem je, že byly navrženy, aby se vyrovnaly se situací, kdy je mnoho, zřejmě též korelovaných, prediktorů a relativně málo pozorování. Zobecněný tvar regresní funkce má tvar Y = XB + a jeho řešení je dáno vztahem B = (X T X) 1 X T Y Častým problémem je, žex T X je singulární, protože počet proměnných (sloupců)x překračuje počet objektů (pozorování), nebo proměnné vykazují multi/kolinearitu. Obě metody, PCR i PLSR řeší tento problém dekompozicí X na ortogonální vektory T a sloupcové vektory P X = T P a regresí Y nikoli vůči X samotným ale vůči prvním sloupcům vektorů T. Zajímavým a relativně novým způsobem řešení problému je využití metod Bayesovské statistiky, např. Bayesian Model Averaging 4 pro lineární modelys možností volby a vlastních definic priors (apriorní informace). Naše informace o hodnotě neznámého parametru (apriorní informace)může totiž být vyjádřena pomocí pravděpodobnostního rozdělení, tj. neznámý parametr můžeme považovat za náhodnou proměnnou s určitým rozdělením pravděpodobnosti a nikoliv za neznámou konstantu, jak je tomu v klasické statistice.kvalita apriorních informací je důležitá, protože zásadním způsobem ovlivňuje aposteriorní rozdělení a tím i závěr, který vyvodíme.když o parametru žádné apriorní informaceneznáme,předpokládáme, že každá možná hodnota odhadovaného parametru je stejně pravděpodobná. Je třeba se smířit s argumentací klasické statistiky, že apriorní informace másubjektivní charakter, čímž je dána i subjektivita modelu. V modelu vestavěné priors zahrnují apriorní koeficienty (fixní, flexibilní a hyper-g priors),pět typů modelů apriorních informací, dále vzorkovací modely nebo různé postupy na bázi MCMC.Navazující funkce umožňujíanalýzy posteriorních rozdělení apravděpodobností modelů, koeficientů, momentů a prediktivních hustot. Závěr Nejčastější případy multikolinearity jsou bohužel způsobeny ekonomickými souvislostmi vysvětlujících proměnných v modelu (analogicky v přírodních vědách). Jsou svým způsobem dané a přirozené a jejich eliminace např. vypuštěním proměnných může vést k systematickým chybám a ani 4 Autoři Martin Feldkircher and Stefan Zeugner,
6 pokus o pořízení jiného vzorku dat k lepším výstupům nemusí vést. Nastíněné metody řešení však mohou významně urychlit a zjednodušit optimalizaci výběru proměnných do modelu. Použitá literatura Hušek, R.: Ekonometrická analýza, 1. vydání, Praha 1999 Hebák, P., Svobodová, A.: Regrese II. část, VŠE v Praze, Praha 2001 Handling Multicollinearity in Regression Analysis dostupné na: Hynek Černý Česká národní banka Na Příkopě Praha 1 hnk.cerny@gmail.com
6. Lineární regresní modely
6. Lineární regresní modely 6.1 Jednoduchá regrese a validace 6.2 Testy hypotéz v lineární regresi 6.3 Kritika dat v regresním tripletu 6.4 Multikolinearita a polynomy 6.5 Kritika modelu v regresním tripletu
VíceTestování hypotéz o parametrech regresního modelu
Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Lineární regresní model kde Y = Xβ + e, y 1 e 1 β y 2 Y =., e = e 2 x 11 x 1 1k., X =....... β 2,
VíceTestování hypotéz o parametrech regresního modelu
Testování hypotéz o parametrech regresního modelu Ekonometrie Jiří Neubauer Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra UO
VíceAVDAT Klasický lineární model, metoda nejmenších
AVDAT Klasický lineární model, metoda nejmenších čtverců Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Lineární model y i = β 0 + β 1 x i1 + + β k x ik + ε i (1) kde y i
Více5EN306 Aplikované kvantitativní metody I
5EN306 Aplikované kvantitativní metody I Přednáška 5 Zuzana Dlouhá Předmět a struktura kurzu 1. Úvod: struktura empirických výzkumů 2. Tvorba ekonomických modelů: teorie 3. Data: zdroje a typy dat, význam
VíceKorelační a regresní analýza
Korelační a regresní analýza Analýza závislosti v normálním rozdělení Pearsonův (výběrový) korelační koeficient: r = s XY s X s Y, kde s XY = 1 n (x n 1 i=0 i x )(y i y ), s X (s Y ) je výběrová směrodatná
Více4EK211 Základy ekonometrie
4EK211 Základy ekonometrie Predikce Multikolinearita Cvičení 4 Zuzana Dlouhá Aplikace EM predikce obecně ekonomické prognózování, předpověď, předvídání hlavním cílem je odhad hodnot vysvětlované proměnné
Více1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.
Prostá regresní a korelační analýza 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Problematika závislosti V podstatě lze rozlišovat mezi závislostí nepodstatnou, čili náhodnou
Více4EK211 Základy ekonometrie
4EK211 Základy ekonometrie Predikce Multikolinearita Cvičení 4 Zuzana Dlouhá Aplikace EM predikce obecně ekonomické prognózování, předpověď, předvídání hlavním cílem je odhad hodnot vysvětlované proměnné
VíceStatistická analýza jednorozměrných dat
Statistická analýza jednorozměrných dat Prof. RNDr. Milan Meloun, DrSc. Univerzita Pardubice, Pardubice 31.ledna 2011 Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem
VícePOLYNOMICKÁ REGRESE. Jedná se o regresní model, který je lineární v parametrech, ale popisuje nelineární závislost mezi proměnnými.
POLYNOMICKÁ REGRESE Jedná se o regresní model, který je lineární v parametrech, ale popisuje nelineární závislost mezi proměnnými. y = b 0 + b 1 x + b 2 x 2 + + b n x n kde b i jsou neznámé parametry,
VíceEKONOMETRIE 7. přednáška Fáze ekonometrické analýzy
EKONOMETRIE 7. přednáška Fáze ekonometrické analýzy Ekonometrická analýza proces, skládající se z následujících fází: a) specifikace b) kvantifikace c) verifikace d) aplikace Postupné zpřesňování jednotlivých
Více4EK211 Základy ekonometrie
4EK Základy ekonometrie Odhad klasického lineárního regresního modelu II Cvičení 3 Zuzana Dlouhá Klasický lineární regresní model - zadání příkladu Soubor: CV3_PR.xls Data: y = maloobchodní obrat potřeb
VíceRegresní analýza 1. Regresní analýza
Regresní analýza 1 1 Regresní funkce Regresní analýza Důležitou statistickou úlohou je hledání a zkoumání závislostí proměnných, jejichž hodnoty získáme při realizaci experimentů Vzhledem k jejich náhodnému
VíceRegresní a korelační analýza
Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).
VíceStatistika. Regresní a korelační analýza Úvod do problému. Roman Biskup
Statistika Regresní a korelační analýza Úvod do problému Roman Biskup Jihočeská univerzita v Českých Budějovicích Ekonomická fakulta (Zemědělská fakulta) Katedra aplikované matematiky a informatiky 2008/2009
VíceZávislost obsahu lipoproteinu v krevním séru na třech faktorech ( Lineární regresní modely )
Úloha M608 Závislost obsahu lipoproteinu v krevním séru na třech faktorech ( Lineární regresní modely ) Zadání : Při kvantitativní analýze lidského krevního séra ovlivňují hodnotu obsahu vysokohustotního
VíceIlustrační příklad odhadu LRM v SW Gretl
Ilustrační příklad odhadu LRM v SW Gretl Podkladové údaje Korelační matice Odhad lineárního regresního modelu (LRM) Verifikace modelu PEF ČZU Praha Určeno pro posluchače předmětu Ekonometrie Needitovaná
VíceLINEÁRNÍ REGRESE. Lineární regresní model
LINEÁRNÍ REGRESE Chemometrie I, David MILDE Lineární regresní model 1 Typy závislosti 2 proměnných FUNKČNÍ VZTAH: 2 závisle proměnné: určité hodnotě x odpovídá jediná hodnota y. KORELACE: 2 náhodné (nezávislé)
VíceÚvodem Dříve les než stromy 3 Operace s maticemi
Obsah 1 Úvodem 13 2 Dříve les než stromy 17 2.1 Nejednoznačnost terminologie 17 2.2 Volba metody analýzy dat 23 2.3 Přehled vybraných vícerozměrných metod 25 2.3.1 Metoda hlavních komponent 26 2.3.2 Faktorová
VícePRAVDĚPODOBNOST A STATISTIKA
PRAVDĚPODOBNOS A SAISIKA Regresní analýza - motivace Základní úlohou regresní analýzy je nalezení vhodného modelu studované závislosti. Je nutné věnovat velkou pozornost tomu aby byla modelována REÁLNÁ
VíceMetoda backward výběru proměnných v lineární regresi a její vlastnosti
Metoda backward výběru proměnných v lineární regresi a její vlastnosti Aktuárský seminář, 13. dubna 2018 Milan Bašta 1 / 30 1 Metody výběru proměnných do modelu 2 Monte Carlo simulace, backward metoda
VíceYou created this PDF from an application that is not licensed to print to novapdf printer (http://www.novapdf.com)
Závislost náhodných veličin Úvod Předchozí přednášky: - statistické charakteristiky jednoho výběrového nebo základního souboru - vztahy mezi výběrovým a základním souborem - vztahy statistických charakteristik
VíceRegresní a korelační analýza
Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).
VíceInovace bakalářského studijního oboru Aplikovaná chemie
http://aplchem.upol.cz CZ.1.07/2.2.00/15.0247 Tento projekt je spolufinancován Evropským sociálním fondem a státním rozpočtem České republiky. Regrese Závislostproměnných funkční y= f(x) regresní y= f(x)
VíceStatistika II. Jiří Neubauer
Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Časová řada konečná posloupnost reálných hodnot určitého sledovaného ukazatele měřeného v určitých
VíceEkonometrie. Jiří Neubauer
Úvod do analýzy časových řad Ekonometrie Jiří Neubauer Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra ekonometrie UO Brno) Úvod do analýzy
VíceTomáš Karel LS 2012/2013
Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není
VíceAVDAT Geometrie metody nejmenších čtverců
AVDAT Geometrie metody nejmenších čtverců Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Lineární model klasický lineární regresní model odhad parametrů MNČ y = Xβ + ε, ε
VíceStatgraphics v. 5.0 STATISTICKÁ INDUKCE PRO JEDNOROZMĚRNÁ DATA. Martina Litschmannová 1. Typ proměnné. Požadovaný typ analýzy
Dichotomická proměnná (0-1) Spojitá proměnná STATISTICKÁ INDUKCE PRO JEDNOROZMĚRNÁ DATA Typ proměnné Požadovaný typ analýzy Ověření variability Předpoklady Testy, resp. intervalové odhad Test o rozptylu
VíceLineární regrese. Komentované řešení pomocí MS Excel
Lineární regrese Komentované řešení pomocí MS Excel Vstupní data Tabulka se vstupními daty je umístěna v oblasti A1:B11 (viz. obrázek) na listu cela data Postup Základní výpočty - regrese Výpočet základních
VíceAVDAT Výběr regresorů v mnohorozměrné regresi
AVDAT Výběr regresorů v mnohorozměrné regresi Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Výběr správného lineárního modelu y = Xβ + ε, ale v matici X typu n (p + 1) je
Více4ST201 STATISTIKA CVIČENÍ Č. 10
4ST201 STATISTIKA CVIČENÍ Č. 10 regresní analýza - vícenásobná lineární regrese korelační analýza Př. 10.1 Máte zadaný výstup regresní analýzy závislosti závisle proměnné Y na nezávisle proměnné X. Doplňte
VíceRegresní a korelační analýza
Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).
Více4EK211 Základy ekonometrie
4EK211 Základy ekonometrie ZS 2015/16 Cvičení 6: Multikolinearita, umělé proměnné LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE Otevřete si data z
VíceRNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.
Analýza dat pro Neurovědy RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Jaro 2014 Institut biostatistiky Janoušová, a analýz Dušek: Analýza dat pro neurovědy Blok 7 Jak hodnotit vztah spojitých proměnných
VíceRegresní analýza. Eva Jarošová
Regresní analýza Eva Jarošová 1 Obsah 1. Regresní přímka 2. Možnosti zlepšení modelu 3. Testy v regresním modelu 4. Regresní diagnostika 5. Speciální využití Lineární model 2 1. Regresní přímka 3 nosnost
VíceMÍRY ZÁVISLOSTI (KORELACE A REGRESE)
zhanel@fsps.muni.cz MÍRY ZÁVISLOSTI (KORELACE A REGRESE) 2.5 MÍRY ZÁVISLOSTI 2.5.1 ZÁVISLOST PEVNÁ, VOLNÁ, STATISTICKÁ A KORELAČNÍ Jednorozměrné soubory - charakterizovány jednotlivými statistickými znaky
Více6. Lineární regresní modely
6. Lineární regresní modely 6.1 Jednoduchá regrese a validace 6.2 Testy hypotéz v lineární regresi 6.3 Kritika dat v regresním tripletu 6.4 Multikolinearita a polynomy 6.5 Kritika modelu v regresním tripletu
Více31. 3. 2014, Brno Hanuš Vavrčík Základy statistiky ve vědě
31. 3. 2014, Brno Hanuš Vavrčík Základy statistiky ve vědě Motto Statistika nuda je, má však cenné údaje. strana 3 Statistické charakteristiky Charakteristiky polohy jsou kolem ní seskupeny ostatní hodnoty
VíceTomáš Karel LS 2012/2013
Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není
VíceRegresní a korelační analýza
Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).
VíceBodové a intervalové odhady parametrů v regresním modelu
Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Lineární regresní model Mějme lineární regresní model (LRM) Y = Xβ + e, kde y 1 e 1 β y 2 Y =., e
VíceTechnická univerzita v Liberci
Technická univerzita v Liberci Ekonomická fakulta Analýza výsledků z dotazníkového šetření Jména studentů: Adam Pavlíček Michal Karlas Tomáš Vávra Anna Votavová Ročník: 2015/2016 Datum odevzdání: 13/05/2016
Víceodpovídá jedna a jen jedna hodnota jiných
8. Regresní a korelační analýza Problém: hledání, zkoumání a hodnocení souvislostí, závislostí mezi dvěma a více statistickými znaky (veličinami). Typy závislostí: pevné a volné Pevná závislost každé hodnotě
VíceDiagnostika regrese pomocí grafu 7krát jinak
StatSoft Diagnostika regrese pomocí grafu 7krát jinak V tomto článečku si uděláme exkurzi do teorie regresní analýzy a detailně se podíváme na jeden jediný diagnostický graf. Jedná se o graf Předpovědi
VíceKanonická korelační analýza
Kanonická korelační analýza Kanonická korelační analýza je vícerozměrná metoda, která se používá ke zkoumání závislosti mezi dvěma skupinami proměnných. První ze skupin se považuje za soubor nezávisle
VíceZáklady ekonometrie. XI. Vektorové autoregresní modely. Základy ekonometrie (ZAEK) XI. VAR modely Podzim / 28
Základy ekonometrie XI. Vektorové autoregresní modely Základy ekonometrie (ZAEK) XI. VAR modely Podzim 2015 1 / 28 Obsah tématu 1 Prognózování s VAR modely 2 Vektorové modely korekce chyb (VECM) 3 Impulzní
VícePříloha č. 1 Grafy a protokoly výstupy z adstatu
1 Příklad 3. Stanovení Si metodou OES Byly porovnávány naměřené hodnoty Si na automatickém analyzátoru OES s atestovanými hodnotami. Na základě testování statistické významnosti regresních parametrů (úseku
VíceAVDAT Mnohorozměrné metody, metody klasifikace
AVDAT Mnohorozměrné metody, metody klasifikace Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Mnohorozměrné metody Regrese jedna náhodná veličina je vysvětlována pomocí jiných
Více10. Předpovídání - aplikace regresní úlohy
10. Předpovídání - aplikace regresní úlohy Regresní úloha (analýza) je označení pro statistickou metodu, pomocí nichž odhadujeme hodnotu náhodné veličiny (tzv. závislé proměnné, cílové proměnné, regresandu
Více6. Lineární regresní modely
6. Lineární regresní modely 6.1 Jednoduchá regrese a validace 6.2 Testy hypotéz v lineární regresi 6.3 Kritika dat v regresním tripletu 6.4 Multikolinearita a polynomy 6.5 Kritika modelu v regresním tripletu
VíceKGG/STG Statistika pro geografy
KGG/STG Statistika pro geografy 9. Korelační analýza Mgr. David Fiedor 20. dubna 2015 Analýza závislostí v řadě geografických disciplín studujeme jevy, u kterých vyšetřujeme nikoliv pouze jednu vlastnost
Více4EK211 Základy ekonometrie
4EK11 Základy ekonometrie Autokorelace Cvičení 5 Zuzana Dlouhá Gauss-Markovy předpoklady Náhodná složka: Gauss-Markovy předpoklady 1. E(u) = náhodné vlivy se vzájemně vynulují. E(uu T ) = σ I n konečný
VíceRegresní a korelační analýza
Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).
Více5EN306 Aplikované kvantitativní metody I
5EN306 Aplikované kvantitativní metody I Přednáška 3 Zuzana Dlouhá Předmět a struktura kurzu 1. Úvod: struktura empirických výzkumů 2. Tvorba ekonomických modelů: teorie 3. Data: zdroje a typy dat, význam
Více1. Číselné posloupnosti - Definice posloupnosti, základní vlastnosti, operace s posloupnostmi, limita posloupnosti, vlastnosti limit posloupností,
KMA/SZZS1 Matematika 1. Číselné posloupnosti - Definice posloupnosti, základní vlastnosti, operace s posloupnostmi, limita posloupnosti, vlastnosti limit posloupností, operace s limitami. 2. Limita funkce
VíceStanovení manganu a míry přesnosti kalibrace ( Lineární kalibrace )
Příklad č. 1 Stanovení manganu a míry přesnosti kalibrace ( Lineární kalibrace ) Zadání : Stanovení manganu ve vodách se provádí oxidací jodistanem v kyselém prostředí až na manganistan. (1) Sestrojte
VíceTeorie časových řad Test 2 Varianta A HODNOCENÍ (max. 45 bodů z 50 možných)
Teorie časových řad Test 2 Varianta A HODNOCENÍ (max. 45 bodů z 50 možných) 1. SPECIFIKACE (12 bodů): (1) Graf průběhu proměnných (1) Obě řady se chovají stejně, lze předpokládat jejich lineární vztah
Více4EK211 Základy ekonometrie
4EK211 Základy ekonometrie ZS 2014/15 Cvičení 5: Vícenásobná regrese, multikolinearita LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE 1. Jednoduchá
VíceRegresní a korelační analýza
Přednáška STATISTIKA II - EKONOMETRIE Katedra ekonometrie FEM UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Regresní analýza Cíl regresní analýzy: stanovení formy (trendu, tvaru, průběhu)
VíceNáhodné veličiny jsou nekorelované, neexistuje mezi nimi korelační vztah. Když jsou X; Y nekorelované, nemusí být nezávislé.
1. Korelační analýza V životě většinou nesledujeme pouze jeden statistický znak. Sledujeme více statistických znaků zároveň. Kromě vlastností statistických znaků nás zajímá také jejich těsnost (velikost,
VíceTestování hypotéz a měření asociace mezi proměnnými
Testování hypotéz a měření asociace mezi proměnnými Testování hypotéz Nulová a alternativní hypotéza většina statistických analýz zahrnuje různá porovnání, hledání vztahů, efektů Tvrzení, že efekt je nulový,
VíceDynamické metody pro predikci rizika
Dynamické metody pro predikci rizika 1 Úvod do analýzy časových řad Časová řada konečná posloupnost reálných hodnot určitého sledovaného ukazatele měřeného v určitých časových intervalech okamžikové např
VíceMultikolinearita. V principu jde o velmi jednoduchý postup, který může vést k úplné
Multikolinearita Problém multikolinearity se váže k matici vysvětluících proměnných X, eíž sloupce mohou být někdy (přesně nebo přibližně) lineárně závislé. ím e zřemě porušen předpoklad o maximální možné
VíceLINEÁRNÍ MODELY. Zdeňka Veselá
LINEÁRNÍ MODELY Zdeňka Veselá vesela.zdenka@vuzv.cz Genetika kvantitativních vlastností Jednotlivé geny nejsou zjistitelné ani měřitelné Efekty většího počtu genů poskytují variabilitu, kterou lze většinou
VícePRAVDĚPODOBNOST A STATISTIKA
PRAVDĚPODOBNOST A STATISTIKA Definice lineárního normálního regresního modelu Lineární normální regresní model Y β ε Matice n,k je matice realizací. Předpoklad: n > k, h() k - tj. matice je plné hodnosti
Více18AEK Aplikovaná ekonometrie a teorie časových řad. Řešení domácích úkolů č. 1 a 2 příklad 1
18AEK Aplikovaná ekonometrie a teorie časových řad Řešení domácích úkolů č. 1 a 2 příklad 1 Obecné pravidlo pro všechny testy Je stanovena nulová hypotéza: H 0 Je stanovena alternativní hypotéza: H A Je
VíceStatistická analýza jednorozměrných dat
Statistická analýza jednorozměrných dat Prof. RNDr. Milan Meloun, DrSc. Univerzita Pardubice, Pardubice 31.ledna 2011 Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem
VíceKlasická a robustní ortogonální regrese mezi složkami kompozice
Klasická a robustní ortogonální regrese mezi složkami kompozice K. Hrůzová, V. Todorov, K. Hron, P. Filzmoser 13. září 2016 Kompoziční data kladná reálná čísla nesoucí pouze relativní informaci, x = (x
VíceChyby měření 210DPSM
Chyby měření 210DPSM Jan Zatloukal Stručný přehled Zdroje a druhy chyb Systematické chyby měření Náhodné chyby měření Spojité a diskrétní náhodné veličiny Normální rozdělení a jeho vlastnosti Odhad parametrů
VícePravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1
Logistická regrese Menu: QCExpert Regrese Logistická Modul Logistická regrese umožňuje analýzu dat, kdy odezva je binární, nebo frekvenční veličina vyjádřená hodnotami 0 nebo 1, případně poměry v intervalu
Více2 Zpracování naměřených dat. 2.1 Gaussův zákon chyb. 2.2 Náhodná veličina a její rozdělení
2 Zpracování naměřených dat Důležitou součástí každé experimentální práce je statistické zpracování naměřených dat. V této krátké kapitole se budeme věnovat určení intervalů spolehlivosti získaných výsledků
VíceTestování předpokladů pro metodu chain-ladder. Seminář z aktuárských věd Petra Španihelová
Testování předpokladů pro metodu chain-ladder Seminář z aktuárských věd 4. 11. 2016 Petra Španihelová Obsah Datová struktura Posouzení dat Předpoklady metody chain-ladder dle T. Macka Běžná lineární regrese
Více4EK211 Základy ekonometrie
4EK211 Základy ekonometrie ZS 2014/15 Cvičení 6: Dummy proměnné, multikolinearita LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE 1. Pokračování z minula:
VíceAplikovaná statistika v R - cvičení 3
Aplikovaná statistika v R - cvičení 3 Filip Děchtěrenko Matematicko-fyzikální fakulta filip.dechterenko@gmail.com 5.8.2014 Filip Děchtěrenko (MFF UK) Aplikovaná statistika v R 5.8.2014 1 / 10 Lineární
VíceÚvod do problematiky měření
1/18 Lord Kelvin: "Když to, o čem mluvíte, můžete změřit, a vyjádřit to pomocí čísel, něco o tom víte. Ale když to nemůžete vyjádřit číselně, je vaše znalost hubená a nedostatečná. Může to být začátek
VíceSemestrální práce. 2. semestr
Licenční studium č. 89002 Semestrální práce 2. semestr Tvorba lineárních regresních modelů při analýze dat Příklad 1 Porovnání dvou regresních přímek u jednoduchého lineárního regresního modelu. Počet
VíceStatistická analýza dat
Statistická analýza dat Jméno: Podpis: Cvičení Zkouška (písemná + ústní) 25 Celkem 50 Známka Pokyny k vypracování: doba řešení je 120min, jasně zodpovězte pokud možno všechny otázky ze zadání, pracujte
VíceZX510 Pokročilé statistické metody geografického výzkumu. Téma: Měření síly asociace mezi proměnnými (korelační analýza)
ZX510 Pokročilé statistické metody geografického výzkumu Téma: Měření síly asociace mezi proměnnými (korelační analýza) Měření síly asociace (korelace) mezi proměnnými Vztah mezi dvěma proměnnými existuje,
Více5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza
5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza 5.1 Vícerozměrná data a vícerozměrná rozdělení Při zpracování vícerozměrných dat se hledají souvislosti mezi dvěma, případně
VíceÚlohy nejmenších čtverců
Úlohy nejmenších čtverců Petr Tichý 7. listopadu 2012 1 Problémy nejmenších čtverců Ax b Řešení Ax = b nemusí existovat, a pokud existuje, nemusí být jednoznačné. Často má smysl hledat x tak, že Ax b.
VíceDiskriminační analýza hodnocení rozdílů mezi 2 nebo více skupinami objektů charakterizovanými více znaky
Diskriminační analýza hodnocení rozdílů mezi 2 nebo více skupinami objektů charakterizovanými více znaky Interpretují rozdíly mezi předem stanovenými třídami Cílem je klasifikace objektů do skupin Hledáme
VíceZákony hromadění chyb.
Zákony hromadění chyb. Zákon hromadění skutečných chyb. Zákon hromadění středních chyb. Tomáš Bayer bayertom@natur.cuni.cz Přírodovědecká fakulta Univerzity Karlovy v Praze, Katedra aplikované geoinformatiky
VíceEva Fišerová a Karel Hron. Katedra matematické analýzy a aplikací matematiky Přírodovědecká fakulta Univerzity Palackého v Olomouci.
Ortogonální regrese pro 3-složkové kompoziční data využitím lineárních modelů Eva Fišerová a Karel Hron Katedra matematické analýzy a aplikací matematiky Přírodovědecká fakulta Univerzity Palackého v Olomouci
VíceTvorba nelineárních regresních
Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium chemometrie Statistické zpracování dat Tvorba nelineárních regresních modelů v analýze dat Zdravotní ústav
VíceKalibrace a limity její přesnosti
Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie Licenční studium GALILEO a limity její přesnosti Seminární práce Monika Vejpustková leden 2016 OBSAH Úloha 1. Lineární kalibrace...
VíceMatematické modelování Náhled do ekonometrie. Lukáš Frýd
Matematické modelování Náhled do ekonometrie Lukáš Frýd Výnos akcie vs. Výnos celého trhu - CAPM model r it = r ft + β 1. (r mt r ft ) r it r ft = α 0 + β 1. (r mt r ft ) + ε it Ekonomický (finanční model)
VíceSPOLEHLIVOST KONSTRUKCÍ & TEORIE SPOLEHLIVOSTI část 5: Aproximační techniky
SPOLEHLIVOST KONSTRUKCÍ & TEORIE SPOLEHLIVOSTI část 5: Aproximační techniky Drahomír Novák Jan Eliáš 2012 Spolehlivost konstrukcí, Drahomír Novák & Jan Eliáš 1 část 5 Aproximační techniky 2012 Spolehlivost
VícePRAVDĚPODOBNOST A STATISTIKA
PRAVDĚPODOBNOST A STATISTIKA Definice lineárního normálního regresního modelu Lineární normální regresní model Y Xβ ε Předpoklady: Matice X X n,k je matice realizací. Předpoklad: n > k, h(x) k - tj. matice
Více4EK211 Základy ekonometrie
4EK211 Základ ekonometrie Odhad klasického lineárního regresního modelu I Cvičení 2 Zuzana Dlouhá Metodologický postup tvor EM 1. Specifikace modelu určení proměnných určení vzájemných vaze mezi proměnnými
VícePokročilé neparametrické metody. Klára Kubošová
Klára Kubošová Další typy stromů CHAID, PRIM, MARS CHAID - Chi-squared Automatic Interaction Detector G.V.Kass (1980) nebinární strom pro kategoriální proměnné. Jako kriteriální statistika pro větvení
Více{ } ( 2) Příklad: Test nezávislosti kategoriálních znaků
Příklad: Test nezávislosti kategoriálních znaků Určete na hladině významnosti 5 % na základě dat zjištěných v rámci dotazníkového šetření ve Šluknově, zda existuje závislost mezi pohlavím respondenta a
Vícevzorek1 0.0033390 0.0047277 0.0062653 0.0077811 0.0090141... vzorek 30 0.0056775 0.0058778 0.0066916 0.0076192 0.0087291
Vzorová úloha 4.16 Postup vícerozměrné kalibrace Postup vícerozměrné kalibrace ukážeme na úloze C4.10 Vícerozměrný kalibrační model kvality bezolovnatého benzinu. Dle následujících kroků na základě naměřených
VíceSEMESTRÁLNÍ PRÁCE. Leptání plasmou. Ing. Pavel Bouchalík
SEMESTRÁLNÍ PRÁCE Leptání plasmou Ing. Pavel Bouchalík 1. ÚVOD Tato semestrální práce obsahuje písemné vypracování řešení příkladu Leptání plasmou. Jde o praktickou zkoušku znalostí získaných při přednáškách
VíceTomáš Karel LS 2012/2013
Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není
VíceFakulta chemicko technologická Katedra analytické chemie licenční studium Management systému jakosti Kalibrace a limity její přesnosti
Fakulta chemicko technologická Katedra analytické chemie licenční studium Management systému jakosti Kalibrace a limity její přesnosti Autor: Přednášející: Prof. RNDr. Milan Meloun, DrS 1. VÝPOČET OBSAHU
Více8 Coxův model proporcionálních rizik I
8 Coxův model proporcionálních rizik I Předpokládané výstupy z výuky: 1. Student umí formulovat Coxův model proporcionálních rizik 2. Student rozumí významu regresních koeficientů modelu 3. Student zná
Více