VÍCEROZMĚRNÝ STATISTICKÝ SOUBOR
|
|
- Romana Švecová
- před 8 lety
- Počet zobrazení:
Transkript
1 KORELACE A REGRESE 1 Vytvořeno s podporou projektu Průřezová inovace studijních programů Lesnické a dřevařské fakulty MENDELU v Brně (LDF) s ohledem na discipliny společného základu (reg. č. CZ.1.07/..00/8.001) za přispění finančních prostředků EU a státního rozpočtu České republiky
2 VÍCEROZMĚRNÝ STATISTICKÝ SOUBOR Vícerozměrný statistický soubor je množina C souběžných realizací určitého počtu veličin X 1, X,, X m. Množina C vznikne získáním hodnot znaků X 1, X,, X m na prvcích množiny n. C je potom množina uspořádaných m- tic hodnot [x 1, x,, x m ] znaků X 1, X,, X m. n-tý OBJEKT C = x x x T 1 T j T n x = x x 1,1 j,1 n,1 x x x 1,i j,i n,i x x x 1,m j,m n,m m-tá VELIČINA
3 3 STATISTICKÁ ZÁVISLOST
4 STATISTICKÁ ZÁVISLOST pokud měříme v příliš malém intervalu, nemusí se závislost prokázat!! 4
5 STATISTICKÁ ZÁVISLOST jedna proměnná je násobkem druhé v tom případě je možné jednu proměnnou z analýzy vyloučit bez ztráty informace 5
6 STATISTICKÁ ZÁVISLOST korelace popisuje vliv změny úrovně jednoho znaku na změnu úrovně jiných znaků a platí pro kvantitativní (měřené) znaky; kontingence popisuje závislost kvalitativních (slovních, popisných) znaků, které mají více než dvě alternativy, tzv. množných znaků (např. druh dřeviny, národnost, apod.); 6 asociace - popisuje závislost kvalitativních (slovních, popisných) znaků, které mají pouze dvě alternativy, tzv. alternativních znaků (např. pohlaví, odpovědi typu ano/ne, ).
7 KORELACE typy podle počtu korelovaných znaků jednoduchá popisuje vztah dvou znaků, mnohonásobná popisuje vztahy více než dvou znaků, parciální popisuje závislost dvou znaků ve vícerozměrném statistickém souboru při vyloučení vlivu ostatních znaků na tuto závislost 7
8 KORELACE typy podle smyslu změny hodnot kladná se zvyšováním hodnot jednoho znaku se zvyšují i hodnoty druhého znaku záporná - se zvyšováním hodnot jednoho znaku se zmenšují hodnoty druhého znaku 8
9 KORELACE typy podle tvaru závislosti přímková (lineární) grafickým obrazem závislosti je přímka (lineární trend) křivková (nelineární) grafickým obrazem závislosti je křivka (nelineární trend) 9
10 KORELAČNÍ POČET korelační analýza zjišťuje existenci závislosti a její druhy, měří těsnost závislosti, ověřuje hypotézy o statistické významnosti závislosti; 10 regresní analýza zabývá se vytvořením vhodného matematického modelu závislosti, stanoví parametry tohoto modelu, ověřuje hypotézy o vhodnosti a důležitých vlastnostech modelu.
11 MÍRA KORELAČNÍ ZÁVISLOSTI x CELKOVÁ VARIABILITA Y (odchylka měřené hodnoty od průměru) REZIDUÁLNÍ VARIABILITA (odchylka měřených a modelových - vypočítaných hodnot) x VARIABILITA VYSVĚTLENÁ MODELEM (odchylka modelových hodnot od průměru) 11 x 1
12 MÍRA LINEÁRNÍ KORELAČNÍ ZÁVISLOSTI x CELKOVÁ VARIABILITA Y (odchylka měřené hodnoty od průměru) REZIDUÁLNÍ VARIABILITA (odchylka měřených a modelových - vypočítaných hodnot) x VARIABILITA VYSVĚTLENÁ MODELEM (odchylka modelových hodnot od průměru) n ( ) xi -x i=1 n = x 1 n ( ) xi - x i= 1 n + n i=1 x -x ( ) i n i 1
13 MÍRA LINEÁRNÍ KORELAČNÍ ZÁVISLOSTI KOEFICIENT DETERMINACE S x R = = S x x S 1- S xx 1 13 KOEFICIENT KORELACE S x 1 R= = 1- S Sx S x x x
14 KOEFICIENT DETERMINACE vyjadřuje, jakou část celkové variability závisle proměnné (vysvětlované proměnné) objasňuje regresní model. r = 0.9 r = 0.05 r = 1 14
15 KORELAČNÍ KOEFICIENT PRO JEDNODUCHOU KORELACI párový - zvláštní případ vícenásobného korelačního koeficientu, kdy vyjadřuje míru lineární stochastické závislosti mezi náhodnými veličinami Xi a Xj, Pearsonův Spearmanův (korelace pořadí) 15
16 KORELAČNÍ KOEFICIENT PRO VÍCENÁSOBNOU KORELACI vícenásobný - definuje míru lineární stochastické závislosti mezi náhodnou veličinou X 1 a nejlepší lineární kombinací složek X, X 3,..., X m náhodného vektoru X parciální - definuje míru lineární stochastické závislosti mezi náhodnými veličinami X i a X j při zkonstantnění dalších složek vektoru X x 1 x x 3 x 4 x 1 x x 3 x 4 16
17 PEARSONŮV KORELAČNÍ KOEFICIENT (r) podmínkou je dodržení dvourozměného normálního rozdělení = normovaná kovariance r x 1 x = r x x 1 = cov S x 1 x 1 S x x 17
18 PEARSONŮV KORELAČNÍ KOEFICIENT (r) KOVARIANCE: míra intenzity vztahu mezi složkami vícerozměrného souboru je mírou intenzity lineární závislosti je vždy nezáporná její limitou je součin směrodatných odchylek je symetrickou funkcí svých argumentů její velikost je závislá na měřítku argumentů nutnost normování 18 cov x 1 x n 1 = n i= 1 ( x x ) ( x x ) 1i 1 i
19 PEARSONŮV KORELAČNÍ KOEFICIENT (r) Základní vlastnosti Pearsonova korelačního koeficientu: 19 je to bezrozměrná míra lineární korelace; nabývá hodnoty 0 1 pro kladnou korelaci, 0 (-1) pro zápornou korelaci; hodnota 0 znamená, že mezi posuzovanými veličinami není žádný lineární vztah (může být nelineární) nebo tento vztah zůstal na základě dat, které máme k dispozici, neprokázán; hodnota 1 nebo (-1) indikuje funkční závislost; hodnota korelačního koeficientu je stejná pro závislost x 1 na x i pro opačnou závislost x na x 1.
20 Souvislost mezi velikosti Pearsonova korelačního koeficientu a typem závislosti r =1,000 r =-1,000 r =0,000 r =0,934 r =0,967 r =0,857 r =-0,143 r =0,608
21 PEARSONŮV KORELAČNÍ KOEFICIENT (r) výpočet v Excelu Pearsonův R 1
22 SPEARMANŮV KORELAČNÍ KOEFICIENT neparametrický korelační koeficient, vycházející nikoli z hodnot, ale z jejich pořadí. Používá se tehdy, nejsou-li závažným způsobem splněny předpoklady pro použití Pearsonova korelačního koeficientu. r S = 1 6 n n i= 1 3 d i n diference mezi pořadími hodnot X a Y v jednom řádku
23 SPEARMANŮV KORELAČNÍ KOEFICIENT vlivné body Pearsonův R = -0,41 (započítává se účinek vlivných bodů) Spearmanův R = +0,541 (účinek vlivných bodů je značně omezen) 3
24 MNOHONÁSOBNÝ KORELAČNÍ KOEFICIENT vyjadřuje sílu závislosti jedné proměnné na dvou a více jiných proměnných x x I1 x x x x x x II1 III1 m1 In IIn II I n mn 4
25 MNOHONÁSOBNÝ KORELAČNÍ KOEFICIENT - vlastnosti Základní vlastnosti: 0 R 1 pokud je R = 1, znamená to, že závisle proměnná x 1 je přesně lineární kombinací veličin x,..., x m pokud je R = 0, potom jsou také všechny párové korelační koeficienty nulové s růstem počtu vysvětlujících (nezávislých) proměnných hodnota vícenásobného korelačního koeficientu neklesá, tj. platí R 1() R 1(,3)... R 1(,..., m) 5
26 MNOHONÁSOBNÝ KORELAČNÍ KOEFICIENT - výpočet R ) 1(,3,...,m = 1 det( R) det( korelační koeficient 1. a. proměnné R (11) ) = determinant korelační matice = determinant korelační matice s vypuštěným sloupcem a řádkem odpovídajícím té proměnné, jejíž závislost na zbytku matice se vypočítává 6 R = 1 R R R 1 i1 m1 R R 1 1 m 1 R 1 R 1i mi 1 R R 1 1m im Korelační matice R
27 MNOHONÁSOBNÝ KORELAČNÍ KOEFICIENT 7 R 1(,3,..., m) 1 R1 R1 i R1 m R1 1 1 det( R) Ri1 1 Rim 1 R R R 1 1 R1 R1 i R1 m R1 1 1 det( R(11) ) Ri1 1 Rim 1 Rm 1 Rm Rmi 1 m1 m mi = 1 det( R) det( R ) (11)
28 MNOHONÁSOBNÝ KORELAČNÍ KOEFICIENT výpočet v Excelu 8
29 MNOHONÁSOBNÝ KORELAČNÍ KOEFICIENT výpočet v Excelu det( R ) = DETERMINANT(R) 1 = 1 = det( R ) = DETERMINANT( R ) (11) (11) = 1 =
30 MNOHONÁSOBNÝ KORELAČNÍ KOEFICIENT výpočet v Excelu Nástroje Analýza dat Regrese 30
31 PARCIÁLNÍ KORELAČNÍ KOEFICIENT používá se k posouzení síly závislosti dvou veličin ve vícerozměrném souboru při vyloučení vlivu ostatních veličin podle počtu vyloučených proměnných se stanovují řády parciálního R v příkladu vlevo to je parciální korelace III. řádu (3 vyloučené proměnné) 31
32 PARCIÁLNÍ KORELAČNÍ KOEFICIENT - výpočet Klasický výpočet je velmi zdlouhavý vychází se z korelační matice, poté se počítají parciální korelace I. řádu (s jednou vyloučenou proměnnou), z nich II. řádu (dvě vyloučené proměnné), atd. až do potřebného řádu. Při využití Excelu je možné využít vzorce R ij(1,,...,m) = ( 1) det( R j det( R (ii) (ij) ) det( R ) ( jj) ) 3
33 PARCIÁLNÍ KORELAČNÍ KOEFICIENT výpočet v Excelu R R ij(1,,...,m) ij(1,,..., m) = = ( 1) det( R j det( R (ii) (ij) ) det( R ( 1) det( R(1) ) ) ( jj) det( R ) det( R ) (11) () ) 33
34 PARCIÁLNÍ KORELAČNÍ KOEFICIENT výpočet v Excelu det(r (11) ) = det(r (1) ) = det(r () ) =
35 PARCIÁLNÍ KORELAČNÍ KOEFICIENT výpočet v Excelu R 1(3,4,5) ( 1) det( R(1) ) = = = det( R ) det( R ) (11) () Parciální korelační koeficient III. řádu pro závislost proměnných X1 a X (při vyloučení vlivu proměnných X3, X4 a X5) je
36 REGRESNÍ ANALÝZA Základní úlohou regresní analýzy je nalezení vhodného modelu studované závislosti. Snažíme se nahradit každou měřenou (experimentální, empirickou, zjištěnou) hodnotu závisle proměnné (vysvětlované proměnné) Y hodnotou teoretickou (modelovou, vyrovnanou, predikovanou), tj. hodnotou ležící na spojité funkci (modelu) nezávisle proměnné (vysvětlující proměnné) X (X) 36
37 Francis Galton ( ) položil základy regresní analýzy (vztah mezi výškou syna a výškou otce) zázračné dítě, bratranec Charlese Darwina zakladatel eugeniky (nauky o zlepšování genetického základu)
38 REGRESNÍ ANALÝZA měřené hodnoty závisle proměnná Y modelové (vypočítané) hodnoty 38 nezávisle proměnná X
39 39 REGRESNÍ MODEL j m j m i i ij im n n nj nm i n j m i n y x x x x x x x x x x x x x y x y x x y β ε ε β β ε ε β = + X ε β y závisle nezávisle proměnná regresní náhodná proměnná parametry chyba y = X β + ε
40 REGRESNÍ MODEL závisle proměnná Y 1 absolutní člen regresní parametr nezávisle proměnná X 40
41 REGRESNÍ MODEL - typy Regresní model předpokládá, že nezávislá proměnná (proměnné) je nenáhodná (tj. pevně určena, např. experimentátorem) a závislá proměnná je náhodná (měřená).tento předpoklad nebývá v praxi striktně naplněn (v mnoha případech jsou obě nebo všechny veličiny náhodné, tj. měřené, potom mluvíme o tzv. korelačním modelu). 41 Rozeznáváme: regresní modely lineární mají lineární postavení parametrů regresní modely nelineární mají nelineární postavení parametrů
42 REGRESNÍ MODEL - typy Příklady lineárních regresních modelů: y = a + bx - přímka y = a + bx + cx - parabola y = a + (b/x) - hyperbola lineární modely jsou i některé, jejichž grafickým vyjádřením je křivka!! Příklady nelineárních regresních modelů: 4 y = a x b y = a e bx k y= a e x Výhody jsou schopny modelovat složité reálné děje, např. růst, včetně reálné predikce. Nevýhody složitý výpočet
43 POSTUP REGRESNÍ ANALÝZY Podstatou řešení regresní analýzy je: stanovit nejvhodnější tvar regresního modelu (tedy určit příslušnou rovnici, která bude popisovat závislost Y na X) stanovit jeho parametry (tj. stanovit konkrétní hodnoty parametrů β) stanovit statistickou významnost modelu (tj. zda model podstatným způsobem přispěje ke zpřesnění odhadu závisle proměnné oproti použití průměru) výsledky dané modelem interpretovat z hlediska zadání 43
44 STANOVENÍ VHODNÉHO TVARU MODELU 1) najít množinu modelů, které svými vlastnostmi vyhovují řešenému problému (např. růstové funkce) ) teprve mezi nimi najít podle statistických kritérií ten model, která nejlépe vyhovuje měřeným datům Je nutné věnovat velkou pozornost tomu, aby byla modelována REÁLNÁ PŘÍČINNÁ ZÁVISLOST!! 44
45 reziduum xi ˆy i yi hodnota vypočítaná Y regresní čára STANOVENÍ PARAMETRŮ MODELU METODA NEJMENŠÍCH ČTVERCŮ hodnoty závisle proměnné Y měřená hodnota n ( ˆ ) yi - y i i=1 reziduum = min. 45 hodnoty nezávisle proměnné X
46 46 MNČ PRO PŘÍMKU = a + bx ŷ ( ) = = + n 1 i i i. min x b a y ( ) ( ) ( ) = = = = + n 1 i i i n 1 i i i 0 1 x b a y a x b a y ( ) ( ) ( ) = = = = + n 1 i i i i n 1 i i i 0 x x b a y b x b a y Parciální derivace podle parametrů:
47 MNČ PRO PŘÍMKU Získáme soustavu normálních rovnic: n i= 1 y i = n a + n b x i i = 1 n n n xy i i = xa+ b x i i i= 1 i= 1 i = 1 47
48 48 MNČ obecný postup n i i n n i n i i n i i i i g b i i A n x x x y a b xy = = = = = = g - A b =0
49 MNČ obecný postup n y1 1 1 yi i= 1 n x1 x n y xy n i i i= 1 T g = = = X y n 1 x1 1 1 n xi i= 1 = n n x1 x = = n 1 x x n i xi i= 1 i= 1 A XT X 49
50 MNČ obecný postup g - A b =0 X T T y X X b = 0 ( T ) T b= X X X y ( T ) 1 yˆ = X X X X y T 1 obecný vztah pro výpočet regresních parametrů lineárního modelu obecný vztah pro výpočet predikovaných (modelových) lineárního modelu 50 projekční matice H
51 PŘEDPOKLADY MNČ 1) Regresní parametry β mohou teoreticky nabývat jakýchkoli hodnot. ) Regresní model je lineární v parametrech. 3) Jednotlivé nezávislé proměnné jsou skutečně vzájemně nezávislé, tedy mezi nimi nedochází k tzv. multikolinearitě. 4) Podmíněný rozptyl D(y/x) = σ je konstantní (tzv. podmínka homoskedasticity). 5) Náhodné chyby mají nulovou střední hodnotu E(ε i ) = 0, mají konečný rozptyl E(ε i ) = σ a jsou nekorelované. 51
52 5 MULTIKOLINEARITA j m j m i i ij im n n nj nm i n j m i n y x x x x x x x x x x x x x y x y x x y β ε ε β β ε ε β = + X ε β y Vektory matice X musí být skutečně navzájem nezávislé (jejich párové R musí být nulové nebo statisticky nevýznamné). Pokud tomu tak není, dochází k multikolinearitě, která způsobuje početní i statistické problémy.
53 MULTIKOLINEARITA proč je nebezpečná 53 Početní problémy: způsobuje špatnou podmíněnost matice X T X, (determinant této matice je nula nebo číslo blízké nule) potíže při invertaci matice (regresní model není jednoznačně řešitelný (singularita matice)). Statistické problémy: nelze odděleně sledovat skutečný vliv jednotlivých vysvětlujících vstupních proměnných na vysvětlovanou (závislou) proměnnou nespolehlivé určení parametrů regresního modelu (interval spolehlivosti parametrů je tak velký, že odhad parametrů ztrácí smysl) nestabilita odhadů regresních parametrů (např. malá změna hodnot závisle proměnné znamená zásadní změnu parametrů)
54 MULTIKOLINEARITA příčiny Příčiny: přeurčenost regresního modelu ( zbytečně mnoho nezávislých proměnných) skutečně existující závislost mezi nezávislými proměnnými povaha modelu (např. polynom) nevhodné rozmístění experimentálních bodů (např. malá variabilita hodnot nezávisle proměnné) 54
55 MULTIKOLINEARITA vliv variability nezávisle proměnné správný průběh regresní čáry chyba měření nesprávný průběh regresní čáry 55 malá variabilita nezávisle proměnné
56 MULTIKOLINEARITA vliv variability nezávisle proměnné 56 vhodná variabilita nezávisle proměnné
57 MULTIKOLINEARITA - testování VIF variance inflation factor diagonální prvky inverzní matice ke korelační matici nezávisle proměnných (diag(r -1 )) VIF > 10 kritická multikolinearita korelační matice R =INVERZE(B..F6) Ctrl+Shift+Enter inverzní matice R kriticky vysoké hodnoty VIF
58 MULTIKOLINEARITA - řešení K odstranění (nebo zmenšení nepříznivého vlivu) multikolinearity může vést: snížení počtu nezávisle proměnných použití jiného modelu použití jiné metody výpočtu (obvykle metody regrese hlavních komponent PCR) 58
59 HOMOSKEDASTICITA x HETEROSKEDASTICITA Homoskedasticita znamená, že hodnoty závisle proměnné y mají pro všechny hodnoty nezávisle proměnné X konstantní rozptyl (variabilitu, proměnlivost). závisle proměnná závisle proměnná malá variabilita hodnot y pr o hodnotu x1 vysok á var iabilita hodnot y pr o hodnotu x nezávisle proměnná x1 x nezávisle proměnná 59 homoskedasticita heteroskedasticita
60 HOMOSKEDASTICITA - princip měřené hodnoty nejpravděpodobnější hodnota veličiny Y (modelová) 60
61 HOMOSKEDASTICITA - testování n i i= 1 Test trendu reziduí ( ˆ ) ρ = 1 s n 3 6 n D D= R e i Testujeme významnost Spearmanova korelačního koeficientu ρ s 61 t R = ρ n s 1 ρ s
62 HOMOSKEDASTICITA - testování Vycházíme z předpokladu, že rozptyl naměřené hodnoty y i je určitou funkcí proměnné x i β (např. exponenciální funkcí) Cookův - Weisbergův test S f = n ( y i y ) i= 1 σ 4 n ( y i y ) i= 1 e i Pokud v datech není heteroskedasticita, potom platí, že S f < χ (1) 6
63 HOMOSKEDASTICITA řešení Nejobvyklejším způsobem je použití metody vážených nejmenších čtverců, kdy se podmínka sumy reziduí násobí vhodně zvolenými váhami n m U( b) = yv V xb i ii ii ij j i= 1 j= 1 V běžných případech je možné jako váhy volit hodnoty 1/y i nebo 1/y i. 63
64 INTERVALY SPOLEHLIVOSTI V KORELAČNÍ A REGRESNÍ ANALÝZE IS korelačního koeficientu (koeficientu determinace) IS regresních parametrů IS modelových hodnot (modelu) IS predikovaných hodnot (pás spolehlivosti) 64
65 INTERVAL SPOLEHLIVOSTI R (IS) IS vymezuje interval možných hodnot korelačního koeficientu základního souboru ρ (s pravděpodobností 1 - α) Protože rozdělení výběrových korelačních koeficientů není normální, musíme použít Fisherovu transformaci Z(R) = arctgh(r) = ln 1 R R která má přibližně normální rozdělení se střední hodnotou E(Z) = Z(ρ) a rozptylem D(Z) = 1/(n-3). 65
66 INTERVAL SPOLEHLIVOSTI R R Postup výpočtu IS R: Fisherova transformace v Excelu funkce FISHER(R) statistické tabulky Z(R) Z( R) ± z 1 polovina IS α 1 n 3 horní a dolní hranice IS ve Fisherově transformaci horní a dolní hranice IS ve Fisherově transformaci retransformace Z(R) na korelační koeficient v Excelu funkce FISHERINV(Z(R)) statistické tabulky horní a dolní hranice IS korelačního koeficientu 66
67 INTERVAL SPOLEHLIVOSTI R Fisherova proměnná R = FISHER( ) = IS Fisherovy proměnné: 1 Z ( ρ ) = ± 1.96 = ± = 1 3 = 1.107; IS korelačního koeficientu: =FISHERINV(1.107) = =FISHERINV(.5174) =
68 INTERVAL SPOLEHLIVOSTI REGRESNÍCH PARAMETRŮ vyjadřuje interval na číselné ose, ve kterém se s pravděpodobností 1 - α vyskytuje neznámý parametr β základního souboru β = b ± t s j j b α, n m j Pokud IS obsahuje nulu tedy dolní hranice je záporná a horní kladná - je daný parametr statisticky nevýznamný. 68 s Směrodatné odchylky pro přímku: a syx x = 1+ s = xy b n s s n x x s
69 IS REGRESNÍCH PARAMETRŮ - příklad Bodový Intervalový odhad odhad dolní horní a b průběh přímky pro dolní hranici IS (1,1) průběh přímky pro hodní hranici IS (1,91)
70 IS REGRESNÍCH PARAMETRŮ - příklad Bodový Intervalový odhad odhad dolní horní a b
71 INTERVAL SPOLEHLIVOSTI MODELOVÝCH HODNOT JEDNA HODNOTA REGRESNÍHO MODELU (tyto hodnoty platí jen pro jeden konkrétní výběr, ze kterého byly vypočítány) IS jedné modelové hodnoty horní hranice IS dolní hranice IS plocha, ve které se s pravděpodobností 1 - α nacházejí všechny možné modely vypočítané z jakéhokoliv výběru pocházejícího z daného základního souboru 71
72 IS MODELOVÝCH HODNOT Pro model přímky: směr.odchylka reziduí y µ y = i ± α modelová hodnota t,n σ 1+ n n(x n i= 1 i (x i polovina IS modelu přímky x) x) 7
73 IS Y HODNOT PÁS SPOLEHLIVOSTI udává rozpětí, ve kterém se budou v základním souboru nacházet hodnoty závisle (vysvětlované) proměnné se zvolenou pravděpodobností 1 - α y i(min,max) = y i ± t α ;n m σ 73
74 IS MODELU A PÁS SPOLEHLIVOSTI - příklad šířka listu (mm) délka listu (mm) 74 měřené hodnoty modelové hodnoty intervalový odhad modelu pás spolehlivosti měřených hodnot
75 IS MODELU - příklad
76 TESTY VÝZNAMNOSTI V REGRESNÍ ANALÝZE proč musíme testovat? Y skutečný regresní model platný pro základní soubor (neznáme ho!!!) statisticky nevýznamný 76 Regresní model získaný na základě výběru ( nešťastný výběr dat) vede k závěru, že model je statisticky významný X Statistický test významnosti modelu určí, zda na základě dat získaných z výběru můžeme uvěřit, že model je významný i v základním souboru
77 TESTY VÝZNAMNOSTI V KORELAČNÍ A REGRESNÍ ANALÝZE test významnosti korelačního koeficientu test významnosti modelu jako celku test významnosti jednotlivých regresních parametrů test shody lineárních regresních modelů a mnoho dalších.. 77
78 TEST VÝZNAMNOSTI R Test významnosti odpovídá na otázku, zda je korelace mezi výběrovými proměnnými (R) natolik silná, abychom mohli tuto korelaci považovat za prokázanou i pro základní soubor (ρ). Pro párový R: Pro násobný R: t F R R = R n 1 R R ( n m) ( 1 R )( m 1) KH t α,n- = t α,n-m n počet hodnot výběru m počet proměnných 78 Pro parciální R: t R = R n k 1 R t α,n-k- k počet vyloučených proměnných
79 TEST VÝZNAMNOSTI REGRESNÍHO MODELU co testujeme Y = b 0 + b 1 x 1 + b x + b 3 x b m x m 79 Testujeme JEDNOTLIVÉ PARAMETRY (jestliže je daný parametr nevýznamný, příslušná proměnná x j nijak nepřispívá ke zpřesnění odhadu závisle proměnné a je v modelu zbytečná). Testujeme MODEL JAKO CELEK (zda příslušná kombinace nezávisle proměnných statisticky významně zpřesní odhad závisle proměnné oproti použití jejího průměru)
80 TEST VÝZNAMNOSTI REGRESNÍHO MODELU JAKO CELKU 1. Test významnosti korelačního koeficientu. Pomocí analýzy rozptylu Zdroj variability Součet čtverců odchylek regresní model REG ( y i y) reziduum (nevysvětleno regresním modelem) = n i= 1 Počet stupňů volnosti S DF REG = m 1 R ( yi y i ) = n i= 1 S DF R = n m Celkový C ( yi y) = n i= 1 S DF C = n - 1 Průměrný čtverec odchylek (rozptyl) S M REG = DF SR M R = DF REG REG R Testové kritérium M F = M REG R 80 Testové kritérium F se porovná s kritickou hodnotou F α;m-1;n-m.
81 TEST VÝZNAMNOSTI REGRESNÍCH PARAMETRŮ H 0 : β j = 0, tj. j-tý regresní parametr je nevýznamný t b β j j = pro β j = 0 s b t = b s j b Pokud platí, že t > t α;n-m, potom je j-tý regresní parametr statisticky významný a příslušná proměnná musí zůstat v modelu. 81
82 HODNOCENÍ MODELU Z HLEDISKA VÝSLEDKŮ TESTŮ VÝZNAMNOSTI Výsledek F testu TEST CELÉHO MODELU nevýznamný významný významný významný Výsledek t testu TEST JEDNOTLIVÝCH PARAMETRŮ všechny nevýznamné všechny významné některé nevýznamné všechny nevýznamné Hodnocení modelu posuzované veličiny jsou lineárně nezávislé nebo model je nevhodný (nevystihuje variabilitu závisle proměnné) vhodný (ale nemusí být optimálně navržen) vhodný (je možné vypustit nevýznamné členy modelu) zvláštní případ způsobený multikolinearitou je nutné upravit nebo zcela změnit model 8
83 TEST SHODY REGRESNÍCH MODELŮ Porovnává se: empirický model (modely) s teoretickým dva nebo více empirických modelů mezi sebou H 0 : Porovnávané modely jsou shodné (tj. shodují se ve směrnici i v úseku). 83
84 TEST SHODY REGRESNÍCH MODELŮ A B C D 84
85 TEST SHODY REGRESNÍCH MODELŮ SHODA EMPIRICKÉHO A TEORETICKÉHO MODELU: H 0 : Empirický model y = a + bx pochází ze základního souboru, jehož model y = α + βx je shodný s teoretickým modelem y 0 = α 0 +β 0 x, tj. platí α = α 0, β =β 0. t a α0 b β = t = 0 s s a b 85
86 TEST SHODY REGRESNÍCH MODELŮ SHODA DVOU EMPIRICKÝCH MODELŮ: H0: β j,1 = β j,, tj. regresní koeficienty obou modelů jsou v základním souboru shodné Vycházíme z testování shody regresních parametrů dvou lineárních modelů y 1 = X 1 β 1 + ε 1 a y = X β + ε 86 Při tomto testu využijeme tzv. složeného modelu, tj. oba porovnávané výběry sloučíme do jednoho a také pro něj stanovíme parametry stejného modelu jako pro oba dílčí výběry
87 TEST SHODY REGRESNÍCH MODELŮ F C = (RSC s RSC RSC )(n ( RSC + RSC ) m 1 1 m) n celkový počet prvků obou výběrů, tj. n 1 + n RSC s reziduální součet čtverců složeného modelu RSC 1 reziduální součet čtverců prvního modelu RSC reziduální součet čtverců druhého modelu 87
88 HODNOCENÍ KVALITY REGRESNÍHO MODELU MEP střední kvadratická chyba predikce (MEP) = 1 n n e i i= 1 ( 1 H ) ii e i čtverec reziduí modelu H ii i-tý diagonální prvek projekční matice H Akaikovo informační kritérium (AIC) RSC AIC = n ln + m n RSC reziduální součet čtverců m počet parametrů Čím je AIC (MEP) menší, tím je model vhodnější. 88
89 REGRESNÍ DIAGNOSTIKA stačí vždy jen testování modelu a parametrů? Výběr A Výběr B Y Y 6 4 y = 0,5x + 3,0 R = 0, y = 0,5x + 3,0 R = 0, X X 89
90 REGRESNÍ DIAGNOSTIKA stačí vždy jen testování modelu a parametrů? Výběr C Výběr D Y Y 6 4 y = 0,5x + 3,0 R = 0, y = 0,5x + 3,0 R = 0, X X 90
91 REGRESNÍ DIAGNOSTIKA Zkoumá regresní triplet data (kvalitu dat pro navržený model) model (kvalitu modelu pro daná data) metoda odhadu (splnění předpokladů metody MNČ) 91
92 REGRESNÍ DIAGNOSTIKA analýza reziduí Používá se grafická analýza reziduí - tři typy grafů: Typ grafu Osa X Osa Y I pořadové číslo bodu i reziduum e i II j-tá nezávislá proměnná x j reziduum e i III vypočítaná (modelová) hodnota y i reziduum e i 9
93 REGRESNÍ DIAGNOSTIKA analýza reziduí mrak bodů graf nesignalizuje žádný problém 93
94 REGRESNÍ DIAGNOSTIKA analýza reziduí klín bodů indikace heteroskedasticity (nekonstantního rozptylu) 94
95 REGRESNÍ DIAGNOSTIKA analýza reziduí indikace chybného modelu 95
96 REGRESNÍ DIAGNOSTIKA vlivné body Vlivné body (data, jejichž zařazení do modelu průběh modelu podstatně ovlivní): 1) hrubé chyby - jsou způsobeny chybou měření nebo pozorování, ) body s vysokým vlivem (tzv. zlaté body ) jsou speciálně vybrané body, které byly přesně změřeny a zpravidla zlepšují predikční schopnosti modelu; 3) zdánlivě vlivné body - jsou způsobeny nevhodným modelem; 96
97 REGRESNÍ DIAGNOSTIKA vlivné body odlehlé body v pořádku e e Ji Si = e Si = σ n m 1 n m e e i 1 H ii Si 97 i-tý diagonální prvek projekční matice H
98 REGRESNÍ DIAGNOSTIKA kvalita modelu 1) Graf reziduí ) Parciální regresní grafy vyjadřuje závislost mezi vysvětlovanou proměnnou (tedy vektorem y) a jednou vysvětlující proměnnou x j při statisticky neměnném vlivu ostatních vysvětlujících proměnných, které tvoří matici X (j) (vynechaná j-tá proměnná). Je to tedy určitá grafická obdoba parciálního korelačního koeficientu u korelačních modelů. 98
99 REGRESNÍ DIAGNOSTIKA kvalita modelu Zajímá nás, zda všechny proměnné x 1-3 jsou v modelu oprávněně. Postup je ukázán pro proměnnou x 1. X X (1) y x 1 x x 3 y x 1 x x 3 x 1 =f(x (1) ) regrese v 1 rezidua u 1 Proměnná x 1 do modelu patří u 1 y=f(x (1) ) regrese u 1 rezidua Proměnná x 1 do modelu nepatří 99 v 1 v 1
100 REGRESNÍ DIAGNOSTIKA kvalita modelu pokud body parciálního regresního grafu leží na přímce s nulovým úsekem (absolutním členem), potom existuje skutečná lineární závislost mezi y a x j směrnice přímky proložené body parciálního regresního grafu číselně odpovídá příslušnému regresnímu koeficientu b j původního (posuzovaného) regresního modelu korelační koeficient mezi u j a v j odpovídá parciálnímu korelačnímu koeficientu rezidua regresní přímky mezi u j a v j odpovídají reziduím původního modelu 100
101 REGRESNÍ DIAGNOSTIKA podmínky MNČ multikolinearita VIF heteroskedasticita testy heteroskedasticity (např. Cook Weinsberg) autokorelace reziduí test významnosti autokorelačního koeficientu normalita reziduí testy normality 101
102 REGRESNÍ MODEL - typy Příklady lineárních regresních modelů: y = a + bx - přímka y = a + bx + cx - parabola y = a + (b/x) - hyperbola lineární modely jsou i některé, jejichž grafickým vyjádřením je křivka!! Příklady nelineárních regresních modelů: 10 y = a x b y = a e bx k y= a e x Výhody jsou schopny modelovat složité reálné děje, např. růst, včetně reálné predikce. Nevýhody složitý výpočet
103 NELINEÁRNÍ REGRESNÍ MODELY Platí podmínka, že 1. parciální derivace regresního modelu podle parametrů g j = δ f ( ) δβ x,β j je alespoň pro jeden parametr jeho funkcí. 103
104 NELINEÁRNÍ REGRESNÍ MODELY Regresní modely se dělí na: neseparabilní všechny parametry jsou v nelineárním postavení separabilní část parametrů je lineárních, část nelineárních linearizovatelné vhodnou transformací je lze převést na lineární model 104
105 NELINEÁRNÍ REGRESNÍ MODELY pro lineární model: účelová (minimalizační) funkce pro nelineární model: 105 jednoznačné řešení
106 NELINEÁRNÍ REGRESNÍ MODELY 1. odhad parametrů 1. aproximace. odhad parametrů (první vypočítaný). aproximace 3. odhad parametrů (druhý vypočítaný) 106
107 NELINEÁRNÍ REGRESNÍ MODELY lokální min. (zde není optimální řešení) 107 globální minimum (optimální řešení) sedlový bod
108 NELINEÁRNÍ REGRESNÍ MODELY Metody odhadů parametrů nederivační metody přímého hledání (např. krokové hledání minima, Rosenbrockova metoda) simplexové metody (postupné vytváření adaptivních polyedrů simplexů a jejich překlápění směrem k minimu) metody využívající náhodných čísel 108 derivační (tendence k lokálním minimům, závislost na prvních odhadech, vhodné k jemnému nalezení minima jako pokračování nederivačních metod) Gauss-Newton Levenberg-Marquart dog-leg
109 HODNOCENÍ NELINEÁRNÍHO REGRESNÍHO MODELU 1. Kvalita nalezených odhadů parametrů a) podle intervalů spolehlivosti (čím menší interval spolehlivosti, tím lépe) β j = j ± mm 1 ; m; n m b C m s F α b) podle rozptylů parametrů, kde by pro kvalitní odhad mělo platit D ( b j ) < b j 109
110 HODNOCENÍ NELINEÁRNÍHO REGRESNÍHO MODELU. Kvalita dosažené těsnosti proložení 1. a) podle reziduálního rozptylu b) podle regresního rabatu, což je v procentech vyjádřený koeficient determinace (čím více se blíží 100 %, tím lepší proložení) 3. Vhodnost navrženého modelu Akaikovo informační kritérium(aic) - (čím je AIC menší, tím vhodnější je model). 110
111 HODNOCENÍ NELINEÁRNÍHO REGRESNÍHO MODELU 4. Predikční schopnost modelu střední kvadratická chyba predikce (MEP) - čím je MEP menší, tím je predikční schopnost modelu lepší 5. Kvalita experimentálních dat a) na základě analýzy reziduí 111 b) na základě analýzy vlivných bodů (podle Jackknife reziduí, Cookovy vzdálenosti, diagonální prvky projekční matice a věrohodnostní vzdálenost).
6. Lineární regresní modely
6. Lineární regresní modely 6.1 Jednoduchá regrese a validace 6.2 Testy hypotéz v lineární regresi 6.3 Kritika dat v regresním tripletu 6.4 Multikolinearita a polynomy 6.5 Kritika modelu v regresním tripletu
VíceV praxi pracujeme s daty nominálními (nabývají pouze dvou hodnot), kategoriálními (nabývají více
9 Vícerozměrná data a jejich zpracování 9.1 Vícerozměrná data a vícerozměrná rozdělení Při zpracování vícerozměrných dat, hledáme souvislosti mezi dvěmi, případně více náhodnými veličinami. V praxi pracujeme
VíceRegresní a korelační analýza
Přednáška STATISTIKA II - EKONOMETRIE Katedra ekonometrie FEM UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Regresní analýza Cíl regresní analýzy: stanovení formy (trendu, tvaru, průběhu)
Více6. Lineární regresní modely
6. Lineární regresní modely 6.1 Jednoduchá regrese a validace 6.2 Testy hypotéz v lineární regresi 6.3 Kritika dat v regresním tripletu 6.4 Multikolinearita a polynomy 6.5 Kritika modelu v regresním tripletu
VíceStatistická analýza jednorozměrných dat
Statistická analýza jednorozměrných dat Prof. RNDr. Milan Meloun, DrSc. Univerzita Pardubice, Pardubice 31.ledna 2011 Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem
VíceUniverzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium Management systému jakosti
Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium Management systému jakosti 2.1 Tvorba lineárních regresních modelů při analýze dat Autor práce: Přednášející:
VíceKGG/STG Statistika pro geografy
KGG/STG Statistika pro geografy 10. Mgr. David Fiedor 27. dubna 2015 Nelineární závislost - korelační poměr užití v případě, kdy regresní čára není přímka, ale je vyjádřena složitější matematickou funkcí
VícePříloha č. 1 Grafy a protokoly výstupy z adstatu
1 Příklad 3. Stanovení Si metodou OES Byly porovnávány naměřené hodnoty Si na automatickém analyzátoru OES s atestovanými hodnotami. Na základě testování statistické významnosti regresních parametrů (úseku
VíceZávislost obsahu lipoproteinu v krevním séru na třech faktorech ( Lineární regresní modely )
Úloha M608 Závislost obsahu lipoproteinu v krevním séru na třech faktorech ( Lineární regresní modely ) Zadání : Při kvantitativní analýze lidského krevního séra ovlivňují hodnotu obsahu vysokohustotního
Více6. T e s t o v á n í h y p o t é z
6. T e s t o v á n í h y p o t é z Na základě hodnot z realizace náhodného výběru činíme rozhodnutí o platnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlastnostech. Používáme k tomu vhodně
Vícehttp: //meloun.upce.cz,
Porovnání rozlišovací schopnosti regresní analýzy spekter a spolehlivosti Prof. RNDr. Milan Meloun, DrSc. Katedra analytické chemie, Chemickotechnologická fakulta, Univerzita Pardubice, nám. s. Legií 565,
VíceInovace bakalářského studijního oboru Aplikovaná chemie
http://aplchem.upol.cz CZ.1.07/2.2.00/15.0247 Tento projekt je spolufinancován Evropským sociálním fondem a státním rozpočtem České republiky. Regrese Závislostproměnných funkční y= f(x) regresní y= f(x)
VíceDynamické metody pro predikci rizika
Dynamické metody pro predikci rizika 1 Úvod do analýzy časových řad Časová řada konečná posloupnost reálných hodnot určitého sledovaného ukazatele měřeného v určitých časových intervalech okamžikové např
Více6. Lineární regresní modely
6. Lineární regresní modely 6.1 Jednoduchá regrese a validace 6.2 Testy hypotéz v lineární regresi 6.3 Kritika dat v regresním tripletu 6.4 Multikolinearita a polynomy 6.5 Kritika modelu v regresním tripletu
Více6. Lineární regresní modely
6. Lineární regresní modely 6.1 Jednoduchá regrese a validace 6.2 Testy hypotéz v lineární regresi 6.3 Kritika dat v regresním tripletu 6.4 Multikolinearita a polynomy 6.5 Kritika modelu v regresním tripletu
VíceLINEÁRNÍ REGRESE. Lineární regresní model
LINEÁRNÍ REGRESE Chemometrie I, David MILDE Lineární regresní model 1 Typy závislosti 2 proměnných FUNKČNÍ VZTAH: 2 závisle proměnné: určité hodnotě x odpovídá jediná hodnota y. KORELACE: 2 náhodné (nezávislé)
VíceStatistická analýza jednorozměrných dat
Statistická analýza jednorozměrných dat Prof. RNDr. Milan Meloun, DrSc. Univerzita Pardubice, Pardubice 31.ledna 2011 Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem
VíceUniverzita Pardubice SEMESTRÁLNÍ PRÁCE. Tvorba lineárních regresních modelů. 2015/2016 RNDr. Mgr. Leona Svobodová, Ph.D.
Univerzita Pardubice SEMESTRÁLNÍ PRÁCE Tvorba lineárních regresních modelů 2015/2016 RNDr. Mgr. Leona Svobodová, Ph.D. Úloha 1 Porovnání regresních přímek u jednoduchého lineárního regresního modelu Porovnání
VíceSemestrální práce. 2. semestr
Licenční studium č. 89002 Semestrální práce 2. semestr Tvorba lineárních regresních modelů při analýze dat Příklad 1 Porovnání dvou regresních přímek u jednoduchého lineárního regresního modelu. Počet
VíceStanovení manganu a míry přesnosti kalibrace ( Lineární kalibrace )
Příklad č. 1 Stanovení manganu a míry přesnosti kalibrace ( Lineární kalibrace ) Zadání : Stanovení manganu ve vodách se provádí oxidací jodistanem v kyselém prostředí až na manganistan. (1) Sestrojte
VícePOLYNOMICKÁ REGRESE. Jedná se o regresní model, který je lineární v parametrech, ale popisuje nelineární závislost mezi proměnnými.
POLYNOMICKÁ REGRESE Jedná se o regresní model, který je lineární v parametrech, ale popisuje nelineární závislost mezi proměnnými. y = b 0 + b 1 x + b 2 x 2 + + b n x n kde b i jsou neznámé parametry,
VíceTVORBA LINEÁRNÍCH REGRESNÍCH MODELŮ PŘI ANALÝZE DAT. Semestrální práce UNIVERZITA PARDUBICE. Fakulta chemicko-technologická Katedra analytické chemie
UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie TVORBA LINEÁRNÍCH REGRESNÍCH MODELŮ PŘI ANALÝZE DAT Semestrální práce Licenční studium Galileo Interaktivní statistická analýza
VíceKalibrace a limity její přesnosti
Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie Licenční studium GALILEO a limity její přesnosti Seminární práce Monika Vejpustková leden 2016 OBSAH Úloha 1. Lineární kalibrace...
VícePRAVDĚPODOBNOST A STATISTIKA
PRAVDĚPODOBNOST A STATISTIKA Definice lineárního normálního regresního modelu Lineární normální regresní model Y Xβ ε Předpoklady: Matice X X n,k je matice realizací. Předpoklad: n > k, h(x) k - tj. matice
VíceLiteratura učebnice z minulého semestru Jarošová, Pecáková sbírka příkladů pro statistiku B (2000 a novější)
1. přednáška Literatura učebnice z minulého semestru Jarošová, Pecáková sbírka příkladů pro statistiku B (2000 a novější) 1. Testování hypotéz H0 testovaná (nulová) hypotéza H1 alternativní hypotéza (dvoustranná,
VíceTvorba lineárních regresních modelů
Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium chemometrie Statistické zpracování dat Tvorba lineárních regresních modelů při analýze dat Zdravotní ústav
Více4ST201 STATISTIKA CVIČENÍ Č. 8
4ST201 STATISTIKA CVIČENÍ Č. 8 analýza závislostí kontingenční tabulky test závislosti v kontingenční tabulce analýza rozptylu regresní analýza lineární regrese Analýza závislostí Budeme ověřovat existenci
VíceTabulka č. 1 95%ní intervaly Úsek Směrnice model L1 L2 L1 L2 Leco1-0, , , ,15618 OES -0, , , ,21271
1 Příklad 1. Porovnání dvou regresních přímek Při výrobě automatových ocelí dané jakosti byla porovnávána závislost obsahu uhlíku v posledním zkušebním vzorku (odebraném z mezipánve na ZPO a analyzovaném
VíceRegresní analýza. Eva Jarošová
Regresní analýza Eva Jarošová 1 Obsah 1. Regresní přímka 2. Možnosti zlepšení modelu 3. Testy v regresním modelu 4. Regresní diagnostika 5. Speciální využití Lineární model 2 1. Regresní přímka 3 nosnost
VíceStatistická analýza jednorozměrných dat
Statistická analýza jednorozměrných dat Prof. RNDr. Milan Meloun, DrSc. Univerzita Pardubice, Pardubice 31.ledna 2011 Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem
VíceRegresní a korelační analýza
Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).
VícePRAVDĚPODOBNOST A STATISTIKA
PRAVDĚPODOBNOS A SAISIKA Regresní analýza - motivace Základní úlohou regresní analýzy je nalezení vhodného modelu studované závislosti. Je nutné věnovat velkou pozornost tomu aby byla modelována REÁLNÁ
VíceFakulta chemicko technologická Katedra analytické chemie licenční studium Management systému jakosti Kalibrace a limity její přesnosti
Fakulta chemicko technologická Katedra analytické chemie licenční studium Management systému jakosti Kalibrace a limity její přesnosti Autor: Přednášející: Prof. RNDr. Milan Meloun, DrS 1. VÝPOČET OBSAHU
VíceUniverzita Pardubice
Univerzita Pardubice 8. licenční studium chemometrie Statistické zpracování dat při managementu jakosti Semestrální práce Lineární regrese Ing. Jan Balcárek, Ph.D. vedoucí Centrálních laboratoří Precheza
VíceTvorba modelu sorpce a desorpce 85 Sr na krystalických horninách za dynamických podmínek metodou nelineární regrese
Tvorba modelu sorpce a desorpce 85 Sr na krystalických horninách za dynamických podmínek metodou nelineární regrese Závěrečná práce 12. licenčního studia Pythagoras Fakulta chemicko-technologická, katedra
VíceKALIBRACE A LIMITY JEJÍ PŘESNOSTI. Semestrální práce UNIVERZITA PARDUBICE. Fakulta chemicko-technologická Katedra analytické chemie
UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie KALIBRACE A LIMITY JEJÍ PŘESNOSTI Semestrální práce Licenční studium Galileo Interaktivní statistická analýza dat Brno 2016
VíceRegresní a korelační analýza
Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).
Víceodpovídá jedna a jen jedna hodnota jiných
8. Regresní a korelační analýza Problém: hledání, zkoumání a hodnocení souvislostí, závislostí mezi dvěma a více statistickými znaky (veličinami). Typy závislostí: pevné a volné Pevná závislost každé hodnotě
VíceUNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice
UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, 532 10 Pardubice 10. licenční studium chemometrie STATISTICKÉ ZPRACOVÁNÍ DAT Semestrální práce KALIBRACE
VíceRegresní a korelační analýza
Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).
Více6. Lineární regresní modely
6. Lineární regresní modely 6.1 Jednoduchá regrese a validace 6.2 Testy hypotéz v lineární regresi 6.3 Kritika dat v regresním tripletu 6.4 Multikolinearita a polynomy 6.5 Kritika modelu v regresním tripletu
VíceTvorba lineárních regresních modelů při analýze dat
Fakulta chemicko technologická Katedra analytické chemie licenční studium Management systému jakosti Tvorba lineárních regresních modelů při analýze dat Autor: Přednášející: Prof. RNDr. Milan Meloun, DrS
VíceTvorba nelineárních regresních
Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium chemometrie Statistické zpracování dat Tvorba nelineárních regresních modelů v analýze dat Zdravotní ústav
VíceKalibrace a limity její přesnosti
Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie Kalibrace a limity její přesnosti Semestrální práce Licenční studium GALILEO Interaktivní statistická analýza dat Brno, 2015
VíceZpracování studie týkající se průzkumu vlastností statistických proměnných a vztahů mezi nimi.
SEMINÁRNÍ PRÁCE Zadání: Data: Statistické metody: Zpracování studie týkající se průzkumu vlastností statistických proměnných a vztahů mezi nimi. Minimálně 6 proměnných o 30 pozorováních (z toho 2 proměnné
VíceSemestrální práce. 2. semestr
Licenční studium č. 89002 Semestrální práce 2. semestr PŘEDMĚT 2.1 TVORBA LINEÁRNÍCH REGRESNÍCH MODELŮ PŘI ANALÝZE DAT Příklad 4 Vícerozměrný lineární regresní model 2/24 V Ústí nad Orlicí dne: 20.8.2000
VíceÚloha 1: Lineární kalibrace
Úloha 1: Lineární kalibrace U pacientů s podezřením na rakovinu prostaty byl metodou GC/MS měřen obsah sarkosinu v moči. Pro kvantitativní stanovení bylo nutné změřit řadu kalibračních roztoků o různé
VíceStatistická analýza jednorozměrných dat
Statistická analýza jednorozměrných dat Prof. RNDr. Milan Meloun, DrSc. Univerzita Pardubice, Pardubice 31.ledna 2011 Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem
VíceJazyk matematiky. 2.1. Matematická logika. 2.2. Množinové operace. 2.3. Zobrazení. 2.4. Rozšířená číslená osa
2. Jazyk matematiky 2.1. Matematická logika 2.2. Množinové operace 2.3. Zobrazení 2.4. Rozšířená číslená osa 1 2.1 Matematická logika 2.1.1 Výrokový počet logická operace zapisujeme čteme česky negace
VícePRAVDĚPODOBNOST A STATISTIKA
PRAVDĚPODOBNOST A STATISTIKA Definice lineárního normálního regresního modelu Lineární normální regresní model Y β ε Matice n,k je matice realizací. Předpoklad: n > k, h() k - tj. matice je plné hodnosti
VíceTvorba lineárních regresních modelů při analýze dat
Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie Licenční studium GALILEO Tvorba lineárních regresních modelů při analýze dat Seminární práce Monika Vejpustková leden 2016
Více12. licenční studium Statistické zpracování dat při managementu jakosti. Lenka Hromádková
12. licenční studium Statistické zpracování dat při managementu jakosti Lenka Hromádková Desinfekční přípravky slouží k zneškodňování mikroorganismů (MO) vyvolávající onemocnění člověka nebo zvířat Druhy
Více1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.
Prostá regresní a korelační analýza 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Problematika závislosti V podstatě lze rozlišovat mezi závislostí nepodstatnou, čili náhodnou
VícePro bodový odhad při základním krigování by soustava rovnic v maticovém tvaru vypadala následovně:
KRIGING Krigování (kriging) označujeme interpolační metody, které využívají geostacionární metody odhadu. Těchto metod je celá řada, zde jsou některé příklady. Pro krigování se používá tzv. Lokální odhad.
VíceAnalýza rozptylu. Přednáška STATISTIKA II - EKONOMETRIE. Jiří Neubauer
ANOVA Přednáška STATISTIKA II - EKONOMETRIE Katedra ekonometrie FEM UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz ANOVA ANOVA je nástroj pro zkoumání vztahu mezi vysvětlovanými a vysvětlujícími
VíceKALIBRACE A LIMITY JEJÍ PŘESNOSTI 2015
UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, 532 10 Pardubice 15. licenční studium INTERAKTIVNÍ STATISTICKÁ ANALÝZA DAT Semestrální práce KALIBRACE
VíceTvorba nelineárních regresních modelů v analýze dat
Univerzita Pardubice Fakulta chemicko-technologická, Katedra analytické chemie Licenční studium GALILEO Interaktivní statistická analýza dat Semestrální práce z předmětu Tvorba nelineárních regresních
VíceRegresní a korelační analýza
Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).
Více(n, m) (n, p) (p, m) (n, m)
48 Vícerozměrná kalibrace Podobně jako jednorozměrná kalibrace i vícerozměrná kalibrace se používá především v analytické chemii Bude vysvětlena na příkladu spektroskopie: cílem je popis závislosti mezi
VíceUNIVERZITA PARDUBICE
UNIVERZITA PARDUBICE Fakulta chemicko technologická Katedra analytické chemie Licenční studium chemometrie na téma Tvorba nelineárních regresních modelů v analýze dat Vedoucí licenčního studia Prof. RNDr.
VíceSemestrální práce. 3.3 Tvorba nelineárních regresních modelů v analýze dat
Semestrální práce 1 3.3 Tvorba nelineárních regresních modelů v analýze dat Ing. Ján Lengyel, CSc. Centrální analytická laboratoř Ústav jaderného výzkumu Řež, a. s. Husinec Řež 130 250 68 Řež V Řeži, únor
Více1. Pravděpodobnost a statistika (MP leden 2010)
1. Pravděpodobnost a statistika (MP leden 2010) Pravděpodobnost pojmy 1. Diskrétní pravděpodobnostní prostor(definice, vlastnosti, příklad). Diskrétní pravděpodobnostní prostor je trojice(ω, A, P), kde
VíceAnalýza rozptylu. Statistika II. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.
ANOVA Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz ANOVA ANOVA je nástroj pro zkoumání vztahu mezi vysvětlovanými a vysvětlujícími proměnnými.
Více(Auto)korelační funkce. 2. 11. 2015 Statistické vyhodnocování exp. dat M. Čada www.fzu.cz/ ~ cada
(Auto)korelační funkce 1 Náhodné procesy Korelace mezi náhodnými proměnnými má široké uplatnění v elektrotechnické praxi, kde se snažíme o porovnávání dvou signálů, které by měly být stejné. Příkladem
VíceKorelační a regresní analýza
Korelační a regresní analýza Analýza závislosti v normálním rozdělení Pearsonův (výběrový) korelační koeficient: r = s XY s X s Y, kde s XY = 1 n (x n 1 i=0 i x )(y i y ), s X (s Y ) je výběrová směrodatná
Více1. Alternativní rozdělení A(p) (Bernoulli) je diskrétní rozdělení, kdy. p(0) = P (X = 0) = 1 p, p(1) = P (X = 1) = p, 0 < p < 1.
2. Některá důležitá rozdělení Diskrétní rozdělení. Alternativní rozdělení Ap) Bernoulli) je diskrétní rozdělení, kdy náhodná veličina X nabývá pouze dvou hodnot a a pro její pravděpodobnostní funkci platí:
VícePoznámky k předmětu Aplikovaná statistika, 9.téma
Poznámky k předmětu Aplikovaná statistika, 9téma Princip testování hypotéz, jednovýběrové testy V minulé hodině jsme si ukázali, jak sestavit intervalové odhady pro některé číselné charakteristiky normálního
VíceStatistika. Regresní a korelační analýza Úvod do problému. Roman Biskup
Statistika Regresní a korelační analýza Úvod do problému Roman Biskup Jihočeská univerzita v Českých Budějovicích Ekonomická fakulta (Zemědělská fakulta) Katedra aplikované matematiky a informatiky 2008/2009
Více5. Maticová algebra, typy matic, inverzní matice, determinant.
5. Maticová algebra, typy matic, inverzní matice, determinant. Matice Matice typu m,n je matice složená z n*m (m >= 1, n >= 1) reálných (komplexních) čísel uspořádaných do m řádků a n sloupců: R m,n (resp.
VíceTestování hypotéz o parametrech regresního modelu
Testování hypotéz o parametrech regresního modelu Ekonometrie Jiří Neubauer Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra UO
VíceTestování hypotéz o parametrech regresního modelu
Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Lineární regresní model kde Y = Xβ + e, y 1 e 1 β y 2 Y =., e = e 2 x 11 x 1 1k., X =....... β 2,
VíceNáhodné veličiny jsou nekorelované, neexistuje mezi nimi korelační vztah. Když jsou X; Y nekorelované, nemusí být nezávislé.
1. Korelační analýza V životě většinou nesledujeme pouze jeden statistický znak. Sledujeme více statistických znaků zároveň. Kromě vlastností statistických znaků nás zajímá také jejich těsnost (velikost,
VíceRegresní a korelační analýza
Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).
VíceSemestrální práce. 2. semestr
Licenční studium č. 89002 Semestrální práce 2. semestr PŘEDMĚT 2.2 KALIBRACE A LIMITY JEJÍ PŘESNOSTI Příklad 1 Lineární kalibrace Příklad 2 Nelineární kalibrace Příklad 3 Rozlišení mezi lineární a nelineární
VíceStatgraphics v. 5.0 STATISTICKÁ INDUKCE PRO JEDNOROZMĚRNÁ DATA. Martina Litschmannová 1. Typ proměnné. Požadovaný typ analýzy
Dichotomická proměnná (0-1) Spojitá proměnná STATISTICKÁ INDUKCE PRO JEDNOROZMĚRNÁ DATA Typ proměnné Požadovaný typ analýzy Ověření variability Předpoklady Testy, resp. intervalové odhad Test o rozptylu
Více2.2 Kalibrace a limity její p esnosti
UNIVERZITA PARDUBICE Òkolní rok 000/001 Fakulta chemicko-technologická, Katedra analytické chemie LICEN NÍ STUDIUM STATISTICKÉ ZPRACOVÁNÍ DAT PÌI MANAGEMENTU JAKOSTI P EDM T:. Kalibrace a limity její p
VíceUNIVERZITA PARDUBICE
UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Licenční studium chemometrie na téma Statistické zpracování dat Semestrální práce ze 6. soustředění Předmět: 3.3 Tvorba nelineárních
VíceLicenční studium Galileo: Statistické zpracování dat. Tvorba lineárních regresních modelů při analýze dat. Semestrální práce
Licenční studium Galileo: Statistické zpracování dat Tvorba lineárních regresních modelů při analýze dat Semestrální práce Lenka Husáková Pardubice 2016 Obsah 1 Porovnání dvou regresních přímek u jednoduchého
VíceUniverzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie
Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie Semestrální práce Licenční studium Galileo Předmět Nelineární regrese Jiří Danihlík Olomouc, 2016 Obsah... 1 Hledání vhodného
VíceSemestrální práce str. 1. Semestrální práce. 2.1 Tvorba lineárních regresních modelů při analýze dat. 2.3 Kalibrace a limity její přesnosti
Semestrální práce str. Semestrální práce 2. Tvorba lineárních regresních modelů při analýze dat 2.3 Kalibrace a limity její přesnosti Ing. Ján Lengyel, CSc. Centrální analytická laboratoř Ústav jaderného
VíceKalibrace a limity její přesnosti
SEMESTRÁLNÍ PRÁCE Kalibrace a limity její přesnosti 005/006 Ing. Petr Eliáš 1. LINEÁRNÍ KALIBRACE 1.1 Zadání Povrchově upravená suspenze TiO je protiproudně promývána v kaskádě Dorrových usazováků. Nejvíce
Více6. Lineární regresní modely
6. Lineární regresní modely 6.1 Jednoduchá regrese a validace 6.2 Testy hypotéz v lineární regresi 6.3 Kritika dat v regresním tripletu 6.4 Multikolinearita a polynomy 6.5 Kritika modelu v regresním tripletu
VíceTvorba nelineárních regresních modelů v analýze dat
Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie Licenční studium GALILEO Tvorba nelineárních regresních modelů v analýze dat Seminární práce Monika Vejpustková červen 2016
VíceTvorba nelineárních regresních modelů v analýze dat
Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie Tvorba nelineárních regresních modelů v analýze dat Semestrální práce Licenční studium GALILEO Interaktivní statistická analýza
VíceRegresní analýza. Statistika II. Jiří Neubauer. Katedra ekonometrie FEM UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.
Statistika II Katedra ekonometrie FEM UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Cíl regresní analýzy: stanovení formy (trendu, tvaru, průběhu) této závislosti pomocí vhodné funkce
VíceZpracování a vyhodnocování analytických dat
Zpracování a vyhodnocování analytických dat naměřená data Zpracování a statistická analýza dat analytické výsledky Naměř ěřená data jedna hodnota 5,00 mg (bod 1D) navážka, odměřený objem řada dat 15,8;
VíceLineární Regrese Hašovací Funkce
Hašovací Funkce Mgr. Rudolf B. Blažek, Ph.D. prof. RNDr. Roman Kotecký, DrSc. Katedra počítačových systémů Katedra teoretické informatiky Fakulta informačních technologií České vysoké učení technické v
VíceAVDAT Geometrie metody nejmenších čtverců
AVDAT Geometrie metody nejmenších čtverců Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Lineární model klasický lineární regresní model odhad parametrů MNČ y = Xβ + ε, ε
VíceRozptyl. Pozn.: rozptyl je nezávislý na posunu hustoty pravděpodobnosti na ose x, protože Var(X) mi určuje jen šířku rozdělení.
Rozptyl Základní vlastnosti disperze Var(konst) = 0 Var(X+Y) = Var(X) + Var(Y) (nezávislé proměnné) Lineární změna jednotek Y = rx + s, například z C na F. Jak vypočítám střední hodnotu a rozptyl? Pozn.:
VíceMÍRY ZÁVISLOSTI (KORELACE A REGRESE)
zhanel@fsps.muni.cz MÍRY ZÁVISLOSTI (KORELACE A REGRESE) 2.5 MÍRY ZÁVISLOSTI 2.5.1 ZÁVISLOST PEVNÁ, VOLNÁ, STATISTICKÁ A KORELAČNÍ Jednorozměrné soubory - charakterizovány jednotlivými statistickými znaky
VíceUniverzita Pardubice SEMESTRÁLNÍ PRÁCE. Tvorba nelineárních regresních modelů v analýze dat. 2015/2016 RNDr. Mgr. Leona Svobodová, Ph.D.
Univerzita Pardubice SEMESTRÁLNÍ PRÁCE Tvorba nelineárních regresních modelů v analýze dat 2015/2016 RNDr. Mgr. Leona Svobodová, Ph.D. Úloha Nalezení vhodného modelu pro popis reakce TaqMan real-time PCR
Více4EK211 Základy ekonometrie
4EK211 Základy ekonometrie Predikce Multikolinearita Cvičení 4 Zuzana Dlouhá Aplikace EM predikce obecně ekonomické prognózování, předpověď, předvídání hlavním cílem je odhad hodnot vysvětlované proměnné
VíceKontingenční tabulky, korelační koeficienty
Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Mějme kategoriální proměnné X a Y. Vytvoříme tzv. kontingenční tabulku. Budeme tedy testovat hypotézu
VíceNěkteré zákony rozdělení pravděpodobnosti. 1. Binomické rozdělení
Přednáška 5/1 Některé zákony rozdělení pravděpodobnosti 1. Binomické rozdělení Předpoklady: (a) pst výskytu jevu A v jediném pokuse P (A) = π, (b) je uskutečněno n pokusů, (c) pokusy jsou nezávislé, tj.
VíceInterpolace pomocí splajnu
Interpolace pomocí splajnu Interpolace pomocí splajnu Připomenutí U interpolace požadujeme, aby graf aproximující funkce procházel všemi uzlovými body. Interpolační polynom aproximující funkce je polynom
VíceMěření závislosti statistických dat
5.1 Měření závislosti statistických dat Každý pořádný astronom je schopen vám předpovědět, kde se bude nacházet daná hvězda půl hodiny před půlnocí. Ne každý je však téhož schopen předpovědět v případě
VíceNěkolik poznámek na téma lineární algebry pro studenty fyzikální chemie
Několik poznámek na téma lineární algebry pro studenty fyzikální chemie Jiří Kolafa Vektory. Vektorový prostor Vektor je často zaveden jako n-tice čísel, (v,..., v n ), v i R (pro reálný vektorový prostor);
VíceUNIVERZITA PARDUBICE FAKULTA CHEMICKO-TECHNOLOGICKÁ
UNIVERZITA PARDUBICE FAKULTA CHEMICKO-TECHNOLOGICKÁ SEMESTRÁLNÍ PRÁCE Kalibrace a limity její přesnosti Precheza a.s. Přerov 2005 Ing. Miroslav Štrajt 1. Zadání Úloha 1. Lineární kalibrace: u přímkové
VíceIlustrační příklad odhadu LRM v SW Gretl
Ilustrační příklad odhadu LRM v SW Gretl Podkladové údaje Korelační matice Odhad lineárního regresního modelu (LRM) Verifikace modelu PEF ČZU Praha Určeno pro posluchače předmětu Ekonometrie Needitovaná
Více