Regresní a korelační analýza
|
|
- Věra Bláhová
- před 8 lety
- Počet zobrazení:
Transkript
1 Regresní a korelační analýza
2 Závslost příčnná (kauzální). Závslostí pevnou se označuje případ, kdy výskytu jednoho jevu nutně odpovídá výskyt druhé jevu (a často naopak). Z pravděpodobnostního hledska jde o vztah, který se projeví s jstotou. Průběh závslost (v určtém ntervalu) lze přesně charakterzovat určtou matematckou funkcí. Volná závslost je závslost, př níž jeden jev podmňuje jev jný jen s určtou pravděpodobností a v různé ntenztě. Určté hodnotě jedné velčny odpovídá celá řada různých hodnot druhé velčny. U této závslost lze charakterzovat teoretcký průběh závslost a její těsnost. Regresní analýza se zabývá jednostranným závslostm. Jedná se o stuac, kdy prot sobě stojí vysvětlující (nezávsle) proměnná v úloze příčn a vysvětlovaná (závsle) proměnná v úloze následků. Korelační analýza se zabývá vzájemným (většnou lneárním) závslostm, kdy se klade důraz především na ntenztu (sílu) vzájemného vztahu než na zkoumání velčn ve směru příčna následek.
3 Dvourozměrné rozdělení četnost (x,y) = y x
4 Kontngenční (korelační) tabulka Řádek korelační tabulky obsahuje rozdělení četností znaku Y za podmínky, že znak X nabyl určté konkrétní hodnoty (příp. hodnot určtého ntervalu). - podmíněné rozdělení četností znaku Y. oučtový řádek nepodmíněné rozdělení četností znaku Y. loupec korelační tabulky obsahuje rozdělení četností znaku X za podmínky, že znak Y nabyl určté konkrétní hodnoty (hodnot z určtého ntervalu), - podmíněné rozdělení četností znaku X. oučtový sloupec nepodmíněné rozdělení četností znaku X. Četnost v součtovém řádku a součtovém sloupc nazýváme okrajovým (margnálním) četnostm.
5 Příklad 1 Př sledování tělesné výšky chlapců byl vysloven předpoklad, že výška dítěte je do značné míry ovlvněna výškou rodčů. Následné šetření bylo provedeno celkem u 45 chlapců a jejch otců. Z výsledků šetření byla sestavena korelační tabulka pro znaky výška otce v cm (X) a výška syna v cm (Y) : Y , , , ,9 X 190 a více n , , , , , a více 1 1 n.j
6 Výška syna (cm) Příklad Bodový korelační graf pro znázornění závslost mez výškou otce a výškou syna Výška otce (cm)
7
8 Postup př stanovení nejvhodnější funkce logcké posouzení daného vztahu které proměnné a funkce přcházejí v úvahu, využtí zkušeností z podobných analýz apod. vytvoření bodového korelačního grafu (scatter plot) jako nejvhodnější zvolíme tu funkc, která má nejvyšší hodnotu koefcenty determnace, příp. lze využít dalších matematckostatstckých krtérí (F test).
9 Výška syna (cm) Lneární regrese Metoda nejmenších čtverců Parametry funkce hledáme tak, aby součet čtverců chyb e byl mnmální. Pro danou regresní funkc tento součet nazýváme rezduální součet čtverců Bodový korelační ngraf pro n znázornění závslost mez výškou otce a výškou rez e ( y y ) mn. syna 1 1 y a x, y x, y e bx
10 Lneární regrese y=b 1 x+b 0 Z podmínky mnmálnost čtverců jsou vyvozeny normální rovnce, ze kterých se jejch řešením vypočtou neznámé parametry b 1 a b 0. b 1 cov( xy, ) var( x) Výběrový lneární korelační koefcent xy xx b0 y b1 x n 1 cov( x, y) x x y y n 1 1 Root Mean quare Error: RME n 1 Y Y n
11 Rezduální a regresní součet čtverců Rezduální součet čtverců (ME* n) Regresní součet čtverců odchylek predkcí od průměru rez n 1 e reg n ( y 1 n ( y 1 y) y) Celkový součet = součet čtverců odchylek dat od průměru yy n ( y 1 y) Regresní dentta Koefcent determnace R yy reg yy reg rez 1 rez yy Mean quared Error = rez /n Root Mean quared Error RME rez n
12 Výška syna (cm) 00 Korelační pole pro závslost výšky syna na výšce otce y = 0,573x + 80, Výška otce (cm)
13 y Interval spolehlvost pro predkc Pás spolehlvost Lneární regrese y=x y =,007x +,3778 R = 0, x
14
15 Lneární regrese v Matlabu 10 y=b(1)*x+b() n=100; x=randn(n,1); y=*x+randn(n,1)/+3; % data scatter(x,y,50,'g','flled') [R,P]=corr(x,y); % ln. korelace, p-value, [b,bnt,r,rnt,stats]=regress(y,[x,ones(n,1)]); % stats: R^, F statstcs, p-value, reflne(b) fprntf('r^ %1.3g \n',stats(1)) fprntf('p-hodnota = %1.3g \n',stats(3)) %
16 Resduals Lneární regrese v Matlabu rcoplot(r,rnt) Resdual Case Order Plot Case Number
17 Lneární regrese v Matlabu polytool(x,y,1)
18 Robustní lneární regrese v Matlabu robustdemo(x,y); [b_r,stats_r]=robustft(x,y) Use left mouse button to select and drag ponts Use rght mouse button to query pont propertes rez n 1 e ( y 1 Mean quared Error = rez /n Root Mean quared Error n y) yleast 3 squares Robust x RME rez n Least squares: Robust: Y = *X Y = *X RM error = RM error =
19 Nelneární regrese
20 Nelneární regrese Funkc hledám v předepsaném tvaru (exponencální, polynomální, ) parametry nalezneme metodou nejmenších čtverců Koefcent determnace R popsná míra vhodnost použtí regresní rovnce pro predkování. Hodnoty blízké nule naznačují, že zvolená funkce není vhodná. Naopak, hodnoty blízké 1 naznačují, že rovnce je velm vhodná pro extrapolac. Malá hodnota ale nemusí znamenat nízký stupeň závslost mez proměnným, ale může sgnalzovat špatně zvolenou regresní funkc R N 1 N 1 y y y y R reg yy 1 rez yy Mean quared Error = rez /n Root Mean quared Error RME rez n rez n 1 e n ( y 1 y)
21 Korelace náhodných proměnných 6 (x,y) = (x,y) = (x,y) = y 0 y x x N = 10000
22 Korelace náhodných proměnných (x,y) (x,y) = -0.7 = - (x,y) (x,y) = = y 0 y x x N = 10000
23 Korelace náhodných proměnných
24 Nelneární regrese v Excelu Graf > přdat spojnc trendu koefcent spolehlvost R je koefcent determnace
25 Nelneární regrese v Excelu Graf > přdat spojnc trendu koefcent spolehlvost R je koefcent determnace R reg yy
26 y Nelneární regrese v Matlabu 10 y=b(1)*x +b()*x+b(3) x=randn(100,1); y=x.^ randn(100,1)/; scatter(x,y,50,'g','flled') b=polyft(x,y,); refcurve(b) x
27 Nelneární regrese v Matlabu polytool(x,y,)
28 y Nelneární regrese v Matlabu func=@(a,x)(a(1)*x.^+a()*x+a(3)); 9 a0=[1;0;3]; ahat=nlnft(x,y,func,a0); %graf xrange = mn(x):.0:max(x); 7 hold on scatter(x,y) 6 plot(xrange,func(ahat,xrange),'m') hold off a()*x+a(3)); x
29 Nelneární regrese v Matlabu nlntool(x,y,func,a0)
30 Testy korelační analýzy Kontngenční tabulky umožňují testování různých statstckých hypotéz: hypotéza o nezávslost znaků - oba znaky se vzájemně neovlvňují (výška rodčů nemá vlv na výšku dětí) hypotéza o shodnost struktury (homogentě) - očekávané četnost jsou v políčcích každého řádku ve stejném vzájemném poměru bez ohledu na konkrétní volbu řádku (rozložení výšky je stejné u otců u synů) Klascký test nezávslost nebo homogenty je založen na testu dobré shody, tedy porovnání očekávaných četností v jednotlvých políčcích tabulky za předpokladu, že hodnoty obou sledovaných znaků na sobě nezávsí, a skutečných četností
31 Chí-kvadrát test v Excelu H 0 náhodné výběry pocházejí ze stejného rozdělené CHITET(aktuální;očekávané) aktuální četnost získáné použtím funkce četnost(data, hodnoty). očekávané jak by četnost vypadaly pro teoretcké rozdělení sestejným počtem pozorování a stejným hodnotam. funkce CHITET vrací p-hodnotu. Pro p<a zamítáme hypotézu, že jsou rozdělení stejná Chí-kvadrát test v Matlabu (procedury I.Nagy) chsquare_test.m chsquare_test_h.m H 0 :obě rozdělení jsou shodná chsquare_test_.m H 0 :rozdělení jsou nezávslá
32 Testování lneární regrese T test korelačního koefcentu (Pearsonův test) H 0 : data nejsou vhodná k lneární regres t_test_reg.m F test poměru vysvětleného a nevysvětleného rozptylu H 0 : data nejsou vhodná k lneární regres f_test_reg.m y kx q =LINREGREE(pole_y;pole_x;PRAVDA;PRAVDA) =INTERCEPT(pole_y;pole_x) =LOPE(pole_y;pole_x) absolutní člen q směrnce k
33 y Kvadratcká regrese Koefcent determnace 10 9 y = 1,9733x - 0,0103x + 0,5794 R = 0, x rez 3,617 reg 349,6751 `=VAR(f(x))*n průměr y,89,89 xx 56,75074 `=VAR(x)*n Celkový součet čtverců yy 353, ,9 =rez+reg `=VAR(y)*n Rezduální rozptyl e 0, =rez/(n-) Koefcent determnace R 0, ,04605 =reg/(rez+reg) `=R^ Pearsonův korel. Koefcent R -0, ,146 =PEARON(data_x;data_y)
34 F test poměru vysvětleného a nevysvětleného rozptylu H0: Data nejsou vhodná pro regres F ( n ) reg rez F(1, n ) pravostranný test p hodnota P F F 0 LINREGREE y=kx+q směrnce k, q, , st.chyba koefcentů 0, , Koef. Determnace R,st. Chyba odhadu y 0, ,45447 F statstka, df 40, regresn a rezdualn součet čtverců reg, rez 116, ,706
35 Korelační analýza ordnálních velčn Je důležté odlšt případy, kdy je ordnálního charakteru pouze jedna proměnná a kdy obě. V případech, kdy jsou obě sledované proměnné ordnálního charakteru, můžeme použít testování, založené na pořadí. Wlcoxonův test Mann-Whtney test Kendallův korelační koefcent τk - tau k Goodman-Kruskalův koefcent γ je varantou kendallova τk Pokud je ordnální jen jedna, pak: Kruskal-Wallsův test
ANALÝZA VZTAHU DVOU SPOJITÝCH VELIČIN
ANALÝZA VZTAHU DVOU SPOJITÝCH VELIČIN V dokumentu 7a_korelacn_a_regresn_analyza jsme řešl rozdíl mez korelační a regresní analýzou. Budeme se teď věnovat pouze lneárnímu vztahu dvou velčn, protože je nejjednodušší
VíceREGRESNÍ ANALÝZA. 13. cvičení
REGRESNÍ ANALÝZA 13. cvčení Závslost náhodných velčn Závslost mez kvanttatvním proměnným X a Y: Funkční závslost hodnotam nezávsle proměnných je jednoznačně dána hodnota závslé proměnné. Y=f(X) Stochastcká
Více9. cvičení 4ST201. Obsah: Jednoduchá lineární regrese Vícenásobná lineární regrese Korelační analýza. Jednoduchá lineární regrese
cvčící 9. cvčení 4ST01 Obsah: Jednoduchá lneární regrese Vícenásobná lneární regrese Korelační analýza Vysoká škola ekonomcká 1 Jednoduchá lneární regrese Regresní analýza je statstcká metoda pro modelování
Vícepodle typu regresní funkce na lineární nebo nelineární model Jednoduchá lineární regrese se dá vyjádřit vztahem y
4 Lneární regrese 4 LINEÁRNÍ REGRESE RYCHLÝ NÁHLED DO KAPITOLY Častokrát potřebujete zjstt nejen, jestl jsou dvě nebo více proměnných na sobě závslé, ale také jakým vztahem se tato závslost dá popsat.
VíceRegresní a korelační analýza
Regresí a korelačí aalýza Závslost příčá (kauzálí). Závslostí pevou se ozačuje případ, kdy výskytu jedoho jevu utě odpovídá výskyt druhé jevu (a často aopak). Z pravděpodobostího hledska jde o vztah, který
VíceStatistika. Regresní a korelační analýza Úvod do problému. Roman Biskup
Statistika Regresní a korelační analýza Úvod do problému Roman Biskup Jihočeská univerzita v Českých Budějovicích Ekonomická fakulta (Zemědělská fakulta) Katedra aplikované matematiky a informatiky 2008/2009
Více6. Demonstrační simulační projekt generátory vstupních proudů simulačního modelu
6. Demonstrační smulační projekt generátory vstupních proudů smulačního modelu Studjní cíl Na příkladu smulačního projektu představeného v mnulém bloku je dále lustrována metodka pro stanovování typů a
VíceANOVA. Analýza rozptylu při jednoduchém třídění. Jana Vránová, 3.lékařská fakulta UK, Praha
ANOVA Analýza rozptylu př jednoduchém třídění Jana Vránová, 3.léařsá faulta UK, Praha Teore Máme nezávslých výběrů, > Mají rozsahy n, teré obecně nemusí být stejné V aždém z nch známe průměr a rozptyl
VíceVyužití logistické regrese pro hodnocení omaku
Využtí logstcké regrese pro hodnocení omaku Vladmír Bazík Úvod Jedním z prmárních proevů textlí e omak. Jedná se o poct který vyvolá textle př kontaktu s pokožkou. Je to ntegrální psychofyzkální vlastnost
VíceSTATISTIKA (pro navazující magisterské studium)
Slezská unverzta v Opavě Obchodně podnkatelská fakulta v Karvné STATISTIKA (pro navazující magsterské studum) Jaroslav Ramík Karvná 007 Jaroslav Ramík, Statstka Jaroslav Ramík, Statstka 3 OBSAH MODULU
VíceStatistická analýza jednorozměrných dat
Statistická analýza jednorozměrných dat Prof. RNDr. Milan Meloun, DrSc. Univerzita Pardubice, Pardubice 31.ledna 2011 Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem
VíceZpracování studie týkající se průzkumu vlastností statistických proměnných a vztahů mezi nimi.
SEMINÁRNÍ PRÁCE Zadání: Data: Statistické metody: Zpracování studie týkající se průzkumu vlastností statistických proměnných a vztahů mezi nimi. Minimálně 6 proměnných o 30 pozorováních (z toho 2 proměnné
VíceTomáš Karel LS 2012/2013
Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není
VíceYou created this PDF from an application that is not licensed to print to novapdf printer (http://www.novapdf.com)
Závislost náhodných veličin Úvod Předchozí přednášky: - statistické charakteristiky jednoho výběrového nebo základního souboru - vztahy mezi výběrovým a základním souborem - vztahy statistických charakteristik
VíceRegresní a korelační analýza
Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).
VíceRegresní a korelační analýza
Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).
VícePRAVDĚPODOBNOST A STATISTIKA
PRAVDĚPODOBNOS A SAISIKA Regresní analýza - motivace Základní úlohou regresní analýzy je nalezení vhodného modelu studované závislosti. Je nutné věnovat velkou pozornost tomu aby byla modelována REÁLNÁ
VíceVLIV VELIKOSTI OBCE NA TRŽNÍ CENY RODINNÝCH DOMŮ
VLIV VELIKOSTI OBCE NA TRŽNÍ CENY RODINNÝCH DOMŮ Abstrakt Martn Cupal 1 Prncp tvorby tržní ceny nemovtost je sce založen na tržní nabídce a poptávce, avšak tento trh je značně nedokonalý. Nejvíce ovlvňuje
VíceRegresní a korelační analýza
Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).
VíceRegresní a korelační analýza
Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).
VíceTomáš Karel LS 2012/2013
Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není
VíceRegresní analýza 1. Regresní analýza
Regresní analýza 1 1 Regresní funkce Regresní analýza Důležitou statistickou úlohou je hledání a zkoumání závislostí proměnných, jejichž hodnoty získáme při realizaci experimentů Vzhledem k jejich náhodnému
VíceLINEÁRNÍ REGRESE. Lineární regresní model
LINEÁRNÍ REGRESE Chemometrie I, David MILDE Lineární regresní model 1 Typy závislosti 2 proměnných FUNKČNÍ VZTAH: 2 závisle proměnné: určité hodnotě x odpovídá jediná hodnota y. KORELACE: 2 náhodné (nezávislé)
VíceMĚŘENÍ STATISTICKÝCH ZÁVISLOSTÍ
MĚŘENÍ STATISTICKÝCH ZÁVISLOSTÍ v praxi u jednoho prvku souboru se často zkoumá více veličin, které mohou na sobě různě záviset jednorozměrný výběrový soubor VSS X vícerozměrným výběrovým souborem VSS
Více4ST201 STATISTIKA CVIČENÍ Č. 10
4ST201 STATISTIKA CVIČENÍ Č. 10 regresní analýza - vícenásobná lineární regrese korelační analýza Př. 10.1 Máte zadaný výstup regresní analýzy závislosti závisle proměnné Y na nezávisle proměnné X. Doplňte
VíceKGG/STG Statistika pro geografy
KGG/STG Statistika pro geografy 10. Mgr. David Fiedor 27. dubna 2015 Nelineární závislost - korelační poměr užití v případě, kdy regresní čára není přímka, ale je vyjádřena složitější matematickou funkcí
Více6 LINEÁRNÍ REGRESNÍ MODELY
1 6 LINEÁRNÍ REGRESNÍ MODELY Př budování regresních modelů se běžně užívá metody nejmenších čtverců. Metoda nejmenších čtverců poskytuje postačující odhady parametrů jenom př současném splnění všech předpokladů
Více4EK211 Základy ekonometrie
4EK Základy ekonometre Zobecněná MNČ Cvčení 8 Zuzana Dlouhá Gauss-Markovy předpoklady Náhodná složka: Gauss-Markovy předpoklady. E(u) = náhodné vlvy se vzájemně vynulují. E(u u T ) = σ I n konečný a konstantní
VíceMnohorozměrná statistická data
Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Statistický znak, statistický soubor Jednotlivé objekty nebo subjekty, které jsou při statistickém
VíceMÍRY ZÁVISLOSTI (KORELACE A REGRESE)
zhanel@fsps.muni.cz MÍRY ZÁVISLOSTI (KORELACE A REGRESE) 2.5 MÍRY ZÁVISLOSTI 2.5.1 ZÁVISLOST PEVNÁ, VOLNÁ, STATISTICKÁ A KORELAČNÍ Jednorozměrné soubory - charakterizovány jednotlivými statistickými znaky
Více1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.
Prostá regresní a korelační analýza 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Problematika závislosti V podstatě lze rozlišovat mezi závislostí nepodstatnou, čili náhodnou
VíceANALÝZA ROZPTYLU (Analysis of Variance ANOVA)
NLÝZ OZPYLU (nalyss of Varance NOV) Používá se buď ako samostatná technka, nebo ako postup, umožňuící analýzu zdroů varablty v lneární regres. Př. použtí: k porovnání středních hodnot (průměrů) více než
VíceMnohorozměrná statistická data
Mnohorozměrná statistická data Ekonometrie Jiří Neubauer Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra ekonometrie UO Brno) Mnohorozměrná
VíceRegresní a korelační analýza
Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).
VíceMODELOVÁNÍ A SIMULACE
MODELOVÁNÍ A SIMULACE základní pojmy a postupy vytváření matematckých modelů na základě blancí prncp numerckého řešení dferencálních rovnc základy práce se smulačním jazykem PSI Základní pojmy matematcký
VíceKorelační a regresní analýza. 1. Pearsonův korelační koeficient 2. jednoduchá regresní analýza 3. vícenásobná regresní analýza
Korelační a regresní analýza 1. Pearsonův korelační koeficient 2. jednoduchá regresní analýza 3. vícenásobná regresní analýza Pearsonův korelační koeficient u intervalových a poměrových dat můžeme jako
VíceUNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 3. 11.
UNIVERZITA OBRANY Fakulta ekonomiky a managementu Aplikace STAT1 Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 Jiří Neubauer, Marek Sedlačík, Oldřich Kříž 3. 11. 2012 Popis a návod k použití aplikace
VíceV praxi pracujeme s daty nominálními (nabývají pouze dvou hodnot), kategoriálními (nabývají více
9 Vícerozměrná data a jejich zpracování 9.1 Vícerozměrná data a vícerozměrná rozdělení Při zpracování vícerozměrných dat, hledáme souvislosti mezi dvěmi, případně více náhodnými veličinami. V praxi pracujeme
VíceAVDAT Klasický lineární model, metoda nejmenších
AVDAT Klasický lineární model, metoda nejmenších čtverců Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Lineární model y i = β 0 + β 1 x i1 + + β k x ik + ε i (1) kde y i
VíceTéma 5: Parametrická rozdělení pravděpodobnosti spojité náhodné veličiny
0.05 0.0 0.05 0.0 0.005 Nomnální napětí v pásnc Std Mean 40 60 80 00 0 40 60 Std Téma 5: Parametrcká rozdělení pravděpodobnost spojté náhodné velčn Přednáška z předmětu: Pravděpodobnostní posuzování konstrukcí
VícePravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 010 1.týden (0.09.-4.09. ) Data, typy dat, variabilita, frekvenční analýza
Více4EK211 Základy ekonometrie
4EK Základy ekonometre Zobecněná MNČ Cvčení 7 Zuzana Dlouhá Gauss-Markovy předpoklady Náhodná složka: Gauss-Markovy předpoklady. E(u) = náhodné vlvy se vzájemně vynulují. E(uu T ) = σ I n konečný a konstantní
VíceKorelační a regresní analýza
Korelační a regresní analýza Analýza závislosti v normálním rozdělení Pearsonův (výběrový) korelační koeficient: r = s XY s X s Y, kde s XY = 1 n (x n 1 i=0 i x )(y i y ), s X (s Y ) je výběrová směrodatná
VíceStatistická šetření a zpracování dat.
Statstcká šetření a zpracování dat. Vyjadřovací prostředky ve statstce STATISTICKÉ TABULKY Typckým vyjadřovacím prostředkem statstky je číslo formalzovaným nástrojem číselného vyjádření je statstcká tabulka.
VíceOtto DVOŘÁK 1 NEJISTOTA STANOVENÍ TEPLOTY VZNÍCENÍ HOŘLAVÝCH PLYNŮ A PAR PARABOLICKOU METODOU PODLE ČSN EN 14522
Otto DVOŘÁK 1 NEJISTOTA STANOVENÍ TEPLOTY VZNÍCENÍ HOŘLAVÝCH PLYNŮ A PAR PARABOLICKOU METODOU PODLE ČSN EN 145 UNCERTAINTY OF DETEMINATION OF THE AUTO-IGNITION TEMPERATURE OF FLAMMABLE GASES OR VAPOURS
Více5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza
5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza 5.1 Vícerozměrná data a vícerozměrná rozdělení Při zpracování vícerozměrných dat se hledají souvislosti mezi dvěma, případně
VíceII. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal
Základy navrhování průmyslových experimentů DOE II. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal! Testování statistických hypotéz kvalitativní odezva kvantitativní chí-kvadrát test homogenity,
VíceRegresní analýza. Eva Jarošová
Regresní analýza Eva Jarošová 1 Obsah 1. Regresní přímka 2. Možnosti zlepšení modelu 3. Testy v regresním modelu 4. Regresní diagnostika 5. Speciální využití Lineární model 2 1. Regresní přímka 3 nosnost
VíceZápadočeská univerzita v Plzni Fakulta aplikovaných věd Katedra matematiky. Bakalářská práce. Zpracování výsledků vstupních testů z matematiky
Západočeská unverzta v Plzn Fakulta aplkovaných věd Katedra matematky Bakalářská práce Zpracování výsledků vstupních testů z matematky Plzeň, 13 Tereza Pazderníková Prohlášení Prohlašuj, že jsem bakalářskou
VíceInovace bakalářského studijního oboru Aplikovaná chemie
http://aplchem.upol.cz CZ.1.07/2.2.00/15.0247 Tento projekt je spolufinancován Evropským sociálním fondem a státním rozpočtem České republiky. Regrese Závislostproměnných funkční y= f(x) regresní y= f(x)
Víceina ina Diskrétn tní náhodná veličina může nabývat pouze spočetně mnoha hodnot (počet aut v náhodně vybraná domácnost, výsledek hodu kostkou)
Náhodná velčna na Výsledek náhodného pokusu, daný reálným číslem je hodnotou náhodné velčny. Náhodná velčna je lbovolná reálná funkce defnovaná na množně elementárních E pravděpodobnostního prostoru S.
VíceAnalýza závislosti veličin sledovaných v rámci TBD
Analýza závslost velčn sledovaných v rámc BD Helena Koutková Vysoké učení techncké v Brně, Fakulta stavební, Ústav matematky a deskrptvní geometre e-mal: koutkovah@fcevutbrcz Abstrakt Příspěvek se zabývá
VícePříklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13
Příklad 1 Máme k dispozici výsledky prvního a druhého testu deseti sportovců. Na hladině významnosti 0,05 prověřte, zda jsou výsledky testů kladně korelované. 1.test : 7, 8, 10, 4, 14, 9, 6, 2, 13, 5 2.test
Více3 VYBRANÉ MODELY NÁHODNÝCH VELIČIN. 3.1 Náhodná veličina
3 VBRANÉ MODEL NÁHODNÝCH VELIČIN 3. Náhodná velčna Tato kaptola uvádí stručný pops vybraných pravděpodobnostních modelů spojtých náhodných velčn s důrazem na jejch uplatnění př rozboru spolehlvost stavebních
VíceKGG/STG Statistika pro geografy
KGG/STG Statistika pro geografy 9. Korelační analýza Mgr. David Fiedor 20. dubna 2015 Analýza závislostí v řadě geografických disciplín studujeme jevy, u kterých vyšetřujeme nikoliv pouze jednu vlastnost
Více{ } ( 2) Příklad: Test nezávislosti kategoriálních znaků
Příklad: Test nezávislosti kategoriálních znaků Určete na hladině významnosti 5 % na základě dat zjištěných v rámci dotazníkového šetření ve Šluknově, zda existuje závislost mezi pohlavím respondenta a
Víceodpovídá jedna a jen jedna hodnota jiných
8. Regresní a korelační analýza Problém: hledání, zkoumání a hodnocení souvislostí, závislostí mezi dvěma a více statistickými znaky (veličinami). Typy závislostí: pevné a volné Pevná závislost každé hodnotě
VíceVztah mezi počtem květů a celkovou biomasou rostliny CELKE EM. slá pro KVETU = závi
Regrese a korelace Regrese versus korelace Regrese (regresson)* popsuje vztah = závslost dvou a více kvanttatvních (popř. ordnálních) proměnných formou funkční závslost měří těsnost Korelace (correlaton)
VícePravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická
VícePřednáška č. 11 Analýza rozptylu při dvojném třídění
Přednáška č. Analýza roztlu ř dvojném třídění Ve většně říadů v rax výsledk exermentu, rozboru závsí na více faktorech. Př této analýze se osuzují výsledk náhodných okusů (exerment nebo soubor získané
Více6. Lineární regresní modely
6. Lineární regresní modely 6.1 Jednoduchá regrese a validace 6.2 Testy hypotéz v lineární regresi 6.3 Kritika dat v regresním tripletu 6.4 Multikolinearita a polynomy 6.5 Kritika modelu v regresním tripletu
VíceYou created this PDF from an application that is not licensed to print to novapdf printer (http://www.novapdf.com)
Testování statistických hypotéz Testování statistických hypotéz Princip: Ověřování určitého předpokladu zjišťujeme, zda zkoumaný výběr pochází ze základního souboru, který má určité rozdělení zjišťujeme,
VíceIntervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace
Intervalové odhady Interval spolehlivosti pro střední hodnotu v Nµ, σ 2 ) Situace: X 1,..., X n náhodný výběr z Nµ, σ 2 ), kde σ 2 > 0 známe měli jsme: bodové odhady odhadem charakteristiky je číslo) nevyjadřuje
VíceZáklady biostatistiky II. Veřejné zdravotnictví 3.LF UK - II
Základy biostatistiky II Veřejné zdravotnictví 3.LF UK - II Teoretické rozložení-matematické modely rozložení Naměřená data Výběrové rozložení Teoretické rozložení 1 e 2 x 2 Teoretické rozložení-matematické
VíceINDUKTIVNÍ STATISTIKA
10. SEMINÁŘ INDUKTIVNÍ STATISTIKA 3. HODNOCENÍ ZÁVISLOSTÍ HODNOCENÍ ZÁVISLOSTÍ KVALITATIVNÍ VELIČINY - Vychází se z kombinační (kontingenční) tabulky, která je výsledkem třídění druhého stupně KVANTITATIVNÍ
Více4EK211 Základy ekonometrie
4EK Základy ekonometrie Odhad klasického lineárního regresního modelu II Cvičení 3 Zuzana Dlouhá Klasický lineární regresní model - zadání příkladu Soubor: CV3_PR.xls Data: y = maloobchodní obrat potřeb
VíceTestování hypotéz a měření asociace mezi proměnnými
Testování hypotéz a měření asociace mezi proměnnými Testování hypotéz Nulová a alternativní hypotéza většina statistických analýz zahrnuje různá porovnání, hledání vztahů, efektů Tvrzení, že efekt je nulový,
VíceIntervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace
Intervalové odhady Interval spolehlivosti pro střední hodnotu v Nµ, σ 2 ) Situace: X 1,..., X n náhodný výběr z Nµ, σ 2 ), kde σ 2 > 0 známe měli jsme: bodové odhady odhadem charakteristiky je číslo) nevyjadřuje
VíceÚvodem Dříve les než stromy 3 Operace s maticemi
Obsah 1 Úvodem 13 2 Dříve les než stromy 17 2.1 Nejednoznačnost terminologie 17 2.2 Volba metody analýzy dat 23 2.3 Přehled vybraných vícerozměrných metod 25 2.3.1 Metoda hlavních komponent 26 2.3.2 Faktorová
Více(motto: An unsophisticated forecaster uses statistics as a drunken man uses lamp-posts - for support rather than for illumination.
Neparametricke testy (motto: An unsophisticated forecaster uses statistics as a drunken man uses lamp-posts - for support rather than for illumination. Andrew Lang) 1. Příklad V následující tabulce jsou
VíceTechnická univerzita v Liberci
Technická univerzita v Liberci Ekonomická fakulta Analýza výsledků z dotazníkového šetření Jména studentů: Adam Pavlíček Michal Karlas Tomáš Vávra Anna Votavová Ročník: 2015/2016 Datum odevzdání: 13/05/2016
VíceNárodníinformačnístředisko pro podporu jakosti
Národníinformačnístředisko pro podporu jakosti OVĚŘOVÁNÍ PŘEDPOKLADU NORMALITY Doc. Ing. Eva Jarošová, CSc. Ing. Jan Král Používané metody statistické testy: Chí-kvadrát test dobré shody Kolmogorov -Smirnov
VícePravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1
Logistická regrese Menu: QCExpert Regrese Logistická Modul Logistická regrese umožňuje analýzu dat, kdy odezva je binární, nebo frekvenční veličina vyjádřená hodnotami 0 nebo 1, případně poměry v intervalu
Více4EK211 Základy ekonometrie
4EK211 Základy ekonometrie ZS 2015/16 Cvičení 7: Časově řady, autokorelace LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE 1. Časové řady Data: HDP.wf1
VíceStatgraphics v. 5.0 STATISTICKÁ INDUKCE PRO JEDNOROZMĚRNÁ DATA. Martina Litschmannová 1. Typ proměnné. Požadovaný typ analýzy
Dichotomická proměnná (0-1) Spojitá proměnná STATISTICKÁ INDUKCE PRO JEDNOROZMĚRNÁ DATA Typ proměnné Požadovaný typ analýzy Ověření variability Předpoklady Testy, resp. intervalové odhad Test o rozptylu
VíceIlustrační příklad odhadu LRM v SW Gretl
Ilustrační příklad odhadu LRM v SW Gretl Podkladové údaje Korelační matice Odhad lineárního regresního modelu (LRM) Verifikace modelu PEF ČZU Praha Určeno pro posluchače předmětu Ekonometrie Needitovaná
VíceKontingenční tabulky, korelační koeficienty
Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel 973 442029 email:jirineubauer@unobcz Budeme předpokládat, že X a Y jsou kvalitativní náhodné veličiny, obor hodnot X obsahuje r hodnot (kategorií,
VícePorovnání dvou výběrů
Porovnání dvou výběrů Menu: QCExpert Porovnání dvou výběrů Tento modul je určen pro podrobnou analýzu dvou datových souborů (výběrů). Modul poskytuje dva postupy analýzy: porovnání dvou nezávislých výběrů
VíceJiří Militky Škály měření Nepřímá měření Teorie měření Kalibrace
Tetlní zkušebnctv ebnctví II Jří Mltky Škály měření epřímá měření Teore měření Kalbrace Základní pojmy I PRAVDĚPODOBOST Jev A, byl sledován v m pokusech. astal celkem m a krát. Relatvní četnost výskytu
VíceVYSOKÉ UČENÍ TECHNICKÉ V BRNĚ. FAKULTA STROJNÍHO INŽENÝRSTVÍ Ústav materiálového inženýrství - odbor slévárenství
1 PŘÍLOHA KE KAPITOLE 11 2 Seznam příloh ke kapitole 11 Podkapitola 11.2. Přilité tyče: Graf 1 Graf 2 Graf 3 Graf 4 Graf 5 Graf 6 Graf 7 Graf 8 Graf 9 Graf 1 Graf 11 Rychlost šíření ultrazvuku vs. pořadí
VíceBodové a intervalové odhady parametrů v regresním modelu
Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Lineární regresní model Mějme lineární regresní model (LRM) Y = Xβ + e, kde y 1 e 1 β y 2 Y =., e
VíceKontingenční tabulky, korelační koeficienty
Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Mějme kategoriální proměnné X a Y. Vytvoříme tzv. kontingenční tabulku. Budeme tedy testovat hypotézu
Více2. Najděte funkce, které vedou s těmto soustavám normálních rovnic
Zadání. Sestavte soustavu normálních rovnc ro funkce b b a) b + + b) b b +. Najděte funkce, které vedou s těmto soustavám normálních rovnc nb a) nb. Z dat v tabulce 99 4 4 b) určete a) rovnc regresní funkce
VíceTeoretické modely diskrétních náhodných veličin
Teoretcké modely dskrétních náhodných velčn Velčny, kterým se zabýváme, bývají nejrůznější povahy. Přesto však estují skupny náhodných velčn, které mají podobně rozloženou pravděpodobnostní funkc a lze
VíceStav Svobodný Rozvedený Vdovec. Svobodná 37 10 6. Rozvedená 8 12 8. Vdova 5 8 6
1. Příklad Byly sledovány rodinné stavy nevěst a ženichů při uzavírání sňatků a byla vytvořena následující tabulka četností. Stav Svobodný Rozvedený Vdovec Svobodná 37 10 6 Rozvedená 8 12 8 Vdova 5 8 6
VícePravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 2010 1.týden (20.09.-24.09. ) Data, typy dat, variabilita, frekvenční analýza
VíceObsah. 3 Testy 31 3.1 z test... 32 3.2 z test 2... 33 3.3 t test... 34 3.4 t test 2s... 35
Obsah 1 Popisná statistika 4 1.1 bas stat........................................ 5 1.2 mean.......................................... 6 1.3 meansq........................................ 7 1.4 sumsq.........................................
Více10. Předpovídání - aplikace regresní úlohy
10. Předpovídání - aplikace regresní úlohy Regresní úloha (analýza) je označení pro statistickou metodu, pomocí nichž odhadujeme hodnotu náhodné veličiny (tzv. závislé proměnné, cílové proměnné, regresandu
VíceStatistické metody uţívané při ověřování platnosti hypotéz
Statistické metody uţívané při ověřování platnosti hypotéz Hypotéza Domněnka, předpoklad Nejčastěji o rozdělení, středních hodnotách, závislostech, Hypotézy ve vědeckém výzkumu pracovní, věcné hypotézy
VícePRAVDĚPODOBNOST A STATISTIKA
PRAVDĚPODOBNOST A STATISTIKA Definice lineárního normálního regresního modelu Lineární normální regresní model Y β ε Matice n,k je matice realizací. Předpoklad: n > k, h() k - tj. matice je plné hodnosti
VíceOdhady Parametrů Lineární Regrese
Odhady Parametrů Lineární Regrese Mgr. Rudolf B. Blažek, Ph.D. prof. RNDr. Roman Kotecký, DrSc. Katedra počítačových systémů Katedra teoretické informatiky Fakulta informačních technologií České vysoké
VíceMann-Whitney U-test. Znaménkový test. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek
10. Neparametrické y Mann-Whitney U- Wilcoxonův Znaménkový Shrnutí statistických ů Typ srovnání Nulová hypotéza Parametrický Neparametrický 1 skupina dat vs. etalon Střední hodnota je rovna hodnotě etalonu.
VíceVÍCEROZMĚRNÝ STATISTICKÝ SOUBOR
KORELACE A REGRESE 1 Vytvořeno s podporou projektu Průřezová inovace studijních programů Lesnické a dřevařské fakulty MENDELU v Brně (LDF) s ohledem na discipliny společného základu (reg. č. CZ.1.07/..00/8.001)
VíceZadání Máme data hdp.wf1, která najdete zde: Bodová předpověď: Intervalová předpověď:
Predikce Text o predikci pro upřesnění pro ty, které zajímá, kde se v EViews všechna ta čísla berou. Ruční výpočty u průběžného testu nebudou potřeba. Co bude v závěrečném testu, to nevím. Ale přečíst
VíceSemestrální práce. 3.3 Tvorba nelineárních regresních modelů v analýze dat
Semestrální práce 1 3.3 Tvorba nelineárních regresních modelů v analýze dat Ing. Ján Lengyel, CSc. Centrální analytická laboratoř Ústav jaderného výzkumu Řež, a. s. Husinec Řež 130 250 68 Řež V Řeži, únor
VíceStatistika (KMI/PSTAT)
Statistika (KMI/PSTAT) Cvičení dvanácté aneb Regrese a korelace Statistika (KMI/PSTAT) 1 / 18 V souboru 25 jedinců jsme měřili jejich výšku a hmotnost. Výsledky jsou v tabulce a grafu. Statistika (KMI/PSTAT)
VíceKategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1
Kategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA 2018 4. dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1 Typy proměnných nominální (nominal) o dvou hodnotách lze říci pouze
VíceTeoretické modely diskrétních náhodných veličin
Teoretcké modely dskrétních náhodných velčn Velčny, kterým se zabýváme, bývají nejrůznější povahy. Přesto však estují skupny náhodných velčn, které mají podobně rozloženou pravděpodobnostní funkc a lze
VíceSimulační metody hromadné obsluhy
Smulační metody hromadné osluhy Systém m a model vstupy S výstupy Systém Část prostředí, kterou lze od jeho okolí oddělt fyzckou neo myšlenkovou hrancí Model Zjednodušený, astraktní nástroj používaný pro
Více