Analýza závislosti veličin sledovaných v rámci TBD

Rozměr: px
Začít zobrazení ze stránky:

Download "Analýza závislosti veličin sledovaných v rámci TBD"

Transkript

1 Analýza závslost velčn sledovaných v rámc BD Helena Koutková Vysoké učení techncké v Brně, Fakulta stavební, Ústav matematky a deskrptvní geometre e-mal: koutkovah@fcevutbrcz Abstrakt Příspěvek se zabývá analýzou závslost velčn, které jsou sledovány v rámc technckobezpečnostního dohledu přehrad (BD) Je orentován především na některá úskalí vyskytující se př rutnním použtí statstckých metod, kdy nejsou ověřovány předpoklady těchto metod Úvod Statstcká analýza rozsáhlých souborů dat, které jsou získávány v rámc BD na vodních dílech, se dosud omezuje převážně na odhad korelace (těsnost lneární závslost) a odhad parametrů lneární regresní funkce sledovaných velčn metodou nejmenších čtverců Předpokladem úspěchu použtí statstckých metod je respektování jejch předpokladů Důležté je také uvědomt s, za jakým účelem se statstcké hodnocení provádí ak například z hstorckého chování hráze odvozená přléhavá regresní závslost mez nezávslým (např poloha hladny v nádrž, srážkový úhrn) a závslým (pezometrcká výška ve vrtech, průsak) velčnam by měla umožnt kontrolu, zda se závslé velčny pohybují v přjatelných mezích o vede k doplnění regresního modelu o pásy spolehlvost Základním vstupním předpokladem pro úspěšné použtí regresních modelů je homogenta dat ( stejné vstupní podmínky v období jejch získávání) K odlšení dat získaných za jných podmínek může sloužt mmo jné shluková analýza V dalším textu jsou v případě analýzy závslost pezometrcké výšky (dále označované jako ) ve vrtech (náhodná velčna Y) na hladně vody v nádrž (náhodná velčna X) demonstrovány některé postupy, které by bylo vhodné aplkovat v rámc vyhodnocení velčn naměřených v rámc BD K dspozc bylo 40 měření hodnot hladny a u v období od /3/00 do /6/07, měření byla prováděna průměrně x za 7 dní Grafcká prezentace Základní představu o vlastnostech datového souboru poskytne grafcká prezentace dat, která umožňuje odhalt případné zvláštnost v datech Označme jako x, resp y zjštěné hodnoty hladny a u v -tém pozorování ( =,, N) Zapíšeme-l vektory pozorování (x,y ) do řádků matce, dostaneme datovou matc typu N/ Dvourozměrný datový soubor lze znázornt pomocí bodového dagramu, kde hodnoty proměnných chápeme jako souřadnce bodů v rovně Z bodového dagramu (obr) je patrné, že data netvoří homogenní soubor, což je pro statstcké analýzy nutný předpoklad Jsou zde rozpoznatelné dva shluky a navíc podezřelá měření označená v elpse Jedná se o měření ve dnech /9/0 až /3/03 Z obr lze usuzovat, že tyto body patrně odpovídají poruše měření v daném období, kdy byla měřena konstantní hodnota u 93,0 Př další analýze tyto údaje vypustíme Zbývající data podrobíme shlukové analýze za účelem dentfkace příslušných shluků

2 = -,573+,7066*hladna 96,85 96,5 95,65 95,05 94,45 93,85 93,0 9,55 9,85 9,30 90,75 90,8 89,60 300,7 30,4 30,7 30,0 30,7 303,4 300,97 30,48 30,96 30,47 30,95 303,48 hladna Obr Bodový dagram 304,00 30,00 300,00 98,00 96,00 94,95 93,85 9,80 9,68 90,64 89, číslo měření hladna Obr Průběh hodnot hladny a u v závslost na pořadí měření 3 Shluková analýza Cílem shlukové analýzy je roztřídění N pozorování do několka pokud možno homogenních shluků Požadujeme, aby pozorování uvntř jednotlvých shluků byla podobná co nejvíce a pozorování z různých shluků co nejméně Podobnost nebo nepodobnost pozorování měříme pomocí různých měr vzdáleností Nejčastěj se používá eukldovská vzdálenost Z datové matce víme, že: -té pozorování je charakterzováno vektorem pozorování (x, y ), j-té pozorování je charakterzováno vektorem pozorování (x j, y j ) Jejch eukldovská vzdálenost d j je: d j = ( x x j ) + ( y y j ) Čím je vzdálenost d j menší, tím jsou pozorování s ndexy a j podobnější Vzdálenost vypočítané pro všechna pozorování se zapsují do tzv matce vzdáleností Pro vytváření shluků exstuje celá řada algortmů Pokud známe počet k shluků, můžeme např použít tzv metodu k-průměrů Pokud počet k shluků neznáme, což je v aplkacích častější, používá se nejčastěj tzv aglomeratvní herarchcký algortmus, kde se jednotlvé typy lší tím, jak měříme vzdálenost mez vytvářeným shluky Herarchcké shlukování spočívá v tom, že postupně slučujeme pozorování, a to nejprve nejblžší a v dalších krocích pak stále vzdálenější Dostáváme tak postupně rozklady S (),,

3 S (N) od rozkladu na jednotlvá pozorování S () až do rozkladu S (N), který obsahuje jedný shluk, a to všechna pozorování Přtom každý předchozí rozklad S (m) je zjemněním následujícího S (m+) Př zjemnění shluky v rozkladu S (m) vznkají rozdělením některých shluků v rozkladu S (m+) Postup lze shrnout do 3 kroků Každé pozorování považujeme za samostatný shluk V matc vzdáleností najdeme shluky, jejchž vzdálenost je mnmální 3 yto shluky spojíme do nového, většího shluku Přepočítáme matc vzdáleností Její řád se zmenší o Pokud je počet shluků k >, vrátíme se na krok, pokud je k =, ukončíme výpočet Pro výpočet vzdálenost mez vícebodovým shluky byla použta metoda průměrné vazby, kdy je vzdálenost mez shluky průměrem vzdáleností mez jejch pozorováním Výsledky herarchckého shlukování znázorňujeme grafcky pomocí tzv dendrogramu Je to grafcky znázorněná posloupnost dvojc {(ν,s () ),,(ν N,S (N) )}, kde ν,, ν N je neklesající posloupnost úrovní spojování a S () je roztřídění pozorování odpovídající úrovn ν, =,, N Z dendrogramu pro danou úroveň vzdáleností tzv řez dendrogramu, určíme počet k shluků složení shluků Metoda k-průměrů je neherarchcká metoda, vychází z následujícího algortmu Náhodně stanovíme rozklad souboru N pozorování do k shluků Určíme výběrové průměry (centrody) 3 Pro všechna pozorování spočítáme vzdálenost od všech výběrových centrodů Pozorování zařadíme do toho shluku, k jehož výběrovému centrodu má nejblíže Pokud nedošlo k žádnému přesunu, považujeme aktuální shluky za defntvní, jnak se vrátíme na krok Stejně postupujeme v případě, kdy pracujeme s vícerozměrným daty, než jsou dvourozměrná Na obr 3 je zachycen výsledek herarchckého shlukování pro data z obr Pro úroveň vzdáleností 5 jsme dostal výrazné shluky Stejný výsledek byl získán pomocí metody k-průměrů, k = Do jednotlvých shluků byla zařazena stejná pozorování jako v případě herarchckého shlukování Rozklad do dvou shluků je tvořen tak, jak je jž předem patrné z obr, kde shluk č je pod škmou čárou a shluk č nad ní Vzdálenost C_3 C_343 C_394 C_379 C_335 C_353 C_98 C_45 Obr 3 Dendrogram C_43 C_3 C_57 C_6 C_7 C_ C_7 Ve shluku je 07 pozorování, v shluku 66 Popsné statstky shluků jsou v tab, ndexy značí shluk resp Na obr 4 jsou znázorněny krabcové grafy Je vdět, že se shluky přílš nelší úrovní hladny, lší se ale její varabltou a varabltou a úrovní u Větší varablta u v shluku je způsobena větší varabltou hladny v shluku Ze stuace na přehradě je známo, že shluk přísluší stavu po technckém zásahu a shluk stavu před zásahem, který nastal mez 7 a 003 Př analýze musí být každý shluk zpracováván zvlášť

4 Proměnná hladna hladna ab Popsné statstky shluků Počet Průměr Medán Mn Max Dolní kvartl Horní kvartl Rozpětí Kvart rozpětí Sm odch 66 30,48 30, ,70 303,480 30,990 30,970,760 0,980 0, ,6 9,335 89,600 93,00 90,50 9,800 3,500,80 0, ,684 30,850 30, ,380 30, ,030,030 0,650 0, ,695 95,950 93,850 96,950 95,350 96,50 3,00 0,800 0,75 304, , ,0 95 hladna 30,5 30, , ,0 300,5 shluk Medán 5%-75% Neodlehlé hodnoty Odlehlé hodnoty Obr 4 Krabcové grafy shluk Medán 5%-75% Neodlehlé hodnoty Odlehlé hodnoty 4 Regresní model Dále se zabýváme závslostí u na hladně v případě shluku Bodový dagram (obr5) ndkuje slnou lneární závslost ěsnost lneární závslost dvou kvanttatvních náhodných velčn měříme výběrovým korelačním koefcentem R, jehož druhá mocnna (výběrový koefcent determnace R ) násobená 00 udává, kolk % varablty jedné z proměnných lze vysvětlt lneární závslostí na druhé V případě shluku je r = 0,895 Jde tedy o slnou lneární závslost, neboť lze lneární závslostí u na hladně vysvětlt 80,% varablty u Zamítáme sce shodu margnálních rozdělení s normálním na hladně významnost 0,0, protože p-hodnota Lleforsova varanty Kolmogorovova testu shody je menší než 0,0 ato rozdělení jsou mírně zeškmená Dvourozměrné rozdělení je však elptcké, což vysthuje graf elpsy na obr 5 Vzhledem k tomu, že se nejedná o výrazné odchýlení od normálního rozdělení, lze testovat hypotézy o hodnotě korelačního koefcentu a konstruovat ntervaly spolehlvost vz [3] hladna: D = 0,73, p < 0,00, Lllefors-p < 0,00 : D = 0,096, p < 0,00, Lllefors-p < 0,00 hladna:: r = 0,80; r = 0,895, p = 00,000; y = -3,87 +,040*x ,5 300,5 30,5 30,5 303,5 304, ,0 30,0 30,0 303,0 304,0 hladna Obr 5 Analýza rozdělení sledovaných velčn ve shluku

5 Průběh závslost hodnot u (závsle proměnné Y) na hodnotách hladny (nezávsle proměnné X) vysthuje regresní funkce velčny Y vzhledem k velčně X, tj podmíněná střední hodnota E(Y x) náhodné velčny Y za podmínky, že náhodná velčna X nabyla hodnoty x Na základě výše uvedených výsledů předpokládáme, že y = E(Y x) = β 0 + β x, kde β 0 a β jsou neznámé konstanty, tzv regresní parametry Označme β = (β 0,β ) vektorový parametr a x = (,x), potom lze psát y = E(Y x) = x β Jedná se o specální případ lneární regresní funkce velčny Y vzhledem k velčně X (tj funkce, která je lneární vzhledem k parametrům), protože je lneární vzhledem k hodnotám nezávsle proměnné Vektorový parametr β se běžně odhaduje metodou nejmenších čtverců (MNČ), anž by se ověřovaly předpoklady, které zaručují dobré vlastnost MNČ odhadů y jsou zaručeny, pokud se vektor pozorování závsle proměnné řídí tzv klasckým lneárním regresním modelem (KLRM) Označme tedy Y =(Y,,Y n ) sloupcový n-rozměrný náhodný vektor, jehož složky Y jsou neznámé hodnoty závsle proměnné Y za podmínky, že nezávsle proměnná X nabyla hodnoty x, tj Y =Y x pro =,, n O náhodném vektoru Y říkáme, že se řídí KLRM, jestlže pro jeho střední hodnotu E(Y) a kovaranční matc cov(y) platí E(Y )= Aβ, cov(y) = σ I, kde A je tzv regresní matce, což je v případě naší regresní funkce matce, jejíž -tý řádek je x = (,x ), =,, n β je k rozměrný sloupcový vektorový parametr, u nás β = (β 0,β ) I je jednotková matce typu n/n a σ je neznámý parametr KLRM můžeme psát ve tvaru Y = Aβ + ε, kde ε = ( ε,, ε n ) je vektor tzv náhodných chyb, který má nulový vektor středních hodnot a kovaranční matc σ I a který je výsledncí neuvažovaných náhodných vlvů V běžně používané MNČ se předpokládá, že regresní parametry mohou nabývat lbovolných hodnot, tj nejsou na ně kladeny žádné omezující požadavky Jednoznačnost MNČ pak zaručuje regulárnost matce A Pokud je regresní matce A stochastcká, což v našem případě je, protože se nejedná o plánovaný a řízený laboratorní experment, ale o pozorování dvourozměrného rozdělení náhodného vektoru (X,Y), můžeme využít všech postupů regresních modelů s tím, že požadujeme, aby vysvětlující proměnná a náhodná chyba byly nezávslé náhodné velčny Matc A můžeme také považovat za determnstckou, pokud jsou hodnoty nezávsle proměnných měřeny s větší přesností než hodnoty závsle proměnných Pro konstrukc ntervalů spolehlvost a testy hypotéz se předpokládá vícerozměrné normální rozdělení vektoru náhodných chyb ε (tedy náhodného vektoru Y) nebo dostatečně velký rozsah souboru a nevelké odchylky od normálního rozdělení Za výše uvedených předpokladů je MNČ odhad βˆ vektorového parametru β, tj statstka, ve které funkce S ( β ) = ( Y Aβ ) ( Y Aβ ) = ε ε nabude absolutní mnmum, nejlepším nestranným lneárním odhadem parametru β edy odhady složek vektorového parametru β jsou lneárním kombnacem složek vektoru Y, jejch realzace kolísají okolo jejch skutečné hodnoty a mez všem nestranným lneárním odhady mají nejmenší rozptyl Hledání MNČ odhadu βˆ pak vede na řešení soustavy normálních rovnc A Aβ = A Y

6 Jedná se o soustavu k lneárních rovnc pro neznámý vektor parametrů β, která má v případě regulární regresní matce A právě jedno řešení βˆ = - ( A A) A Y oto řešení je přímo hledaným odhadem vektoru β získaným metodou nejmenších čtverců Bodové odhady parametrckých funkcí, tj funkcí parametru β, pak dostaneme tak, že za parametr β dosadíme jeho odhad βˆ ak např pro odhad Ŷ vektoru Y používáme odhad Ê( Y ) jeho střední hodnoty E(Y), tj Y ˆ = Ê( Y ) = Aβˆ Odhad εˆ vektoru chyb ε je εˆ = Y Yˆ Složky tohoto vektoru se nazývají (klascká) rezdua Bodovým odhadem regresní funkce y=e(y x)= β 0 + β x = x β je statstka Ê(Y x ) = x βˆ uto statstku používáme pro předpověď Ŷ x hodnoty y x velčny Y x= E(Y x)+ ε x Všechny výše uvedené odhady jsou za předpokladu, že se náhodný vektor Y řídí KLRM, opět nejlepší nestranné lneární odhady Nestranným odhadem rozptylu σ je statstka S = Se /( n k ), kde k je počet regresních parametrů v regresní funkc a S e = ˆ S( β) = ( Y Y) ˆ ( Y Y) ˆ = ˆε εˆ je tzv rezduální součet čtverců Statstku S nazýváme směrodatná chyba modelu 4 Adekvátnost modelu Statstckým krtérem kvalty modelu je rezduální součet čtverců S e směrodatná chyba modelu S, které měří rozptýlenost hodnot náhodné velčny Y okolo regresní funkce Čím jsou obě statstky menší, tím je model adekvátnější Nevýhodou obou statstk je, že nejsou omezeny shora a hodí se tudíž spíše pro porovnávání kvalty různých modelů V případě, že má regresní funkce absolutní člen, lze varabltu závsle proměnné Y vyjádřenou tzv celkovým součtem čtverců S c rozložt na část, která není vysvětlená regresním modelem (tj rezduální součet čtverců S e ) a část, která je regresním modelem vysvětlena, tj tzv teoretcký (regresní) součet čtverců S t, tj n n n Sc = Se + St, Sc = (Y MY ), St = (Ŷ M Y ), MY = Y = = n = Lze ukázat, že St / Sc = Se / Sc = R, kde R je výběrový koefcent determnace Krtérem shody modelu s daty je tedy v tomto případě výběrový koefcent determnace R, který je omezen shora číslem a jehož nterpretac známe O kvaltě modelu svědčí délka ntervalů spolehlvost pro konkrétní hodnoty Y x V případě velkého rozsahu souboru je 95 resp 99%-ní nterval spolehlvost pro konkrétní hodnotu Y x (tj nterval, který j s pravděpodobností aspoň 0,95 resp 0,99 překryje) nterval, jehož krajní meze jsou přblžně rovny Ŷ x ± S resp Ŷ x ± 3S Vztahy pro výpočet přesného ntervalu spolehlvost pro konkrétní hodnotu Y x, regresní funkc, tj E(Y x) regresní parametry lze najít např v [5] Meze ntervalu spolehlvost pro konkrétní hodnotu Y x př spojtě se měnícím x vytvoří tzv pás spolehlvost okolo regresní

7 funkce V aproxmatvním případě jsou meze pásu rovnoběžné s regresní funkcí Př menším rozsahu dat je pás nejužší v bodě, jehož souřadnce jsou průměry nezávsle a závsle proměnné a směrem k větším menším hodnotám nezávsle proměnné se rozšřuje Odhad regresní funkce ve shluku je ŷ = -3,873+,0398x Směrodatná chyba modelu, která se používá ke konstrukc ntervalů spolehlvost, je s = 0,34 Odhad koefcentu determnace je 0,80 Z hledska shody pozorovaných a modelovaných hodnot (odhadů hstorckých dat) se jedná o kvaltní model Realzace 95%-ního ntervalu spolehlvost pro konkrétní hodnotu Y x je přblžně (,040x -3,605,,040x-,605) Regresní model včetně 95%-ního pásu spolehlvost je na obr6, výsek tímto modelem v závslost na pořadí měření je na obr7 Příslušné hodnoty pro měření jsou uvedeny v tab ak např odhad hodnoty u a odhad střední hodnoty u ve dn //07 je 89,636, naměřená hodnota byla 89,6 Hodnota u je s pravděpodobností aspoň 0,95 v rozmezí 88,949 až 90,30 93,00 9,55 9,7 9,77 9,40 9,05 90,64 90,30 89,94 89,60 93,5 300,7 30,8 30,59 30,03 30,47 30,87 303,34 300,95 30,39 30,80 30,4 30,67 303,07 hladna Obr 6 Regresní model v případě shluku odhad u 95%-ní pás spolehlvost pro konkrétní hodnotu u 93,0 9,5 9,0 9,5 9,0 90,5 90,0 89,5 89,0 88, číslo měření odhad u 95%-ní pás spolehlvost pro konkrétní hodnotu u Obr 7 Výsek regresním modelem včetně pásů spolehlvost

8 ab Odhady u a střední hodnoty u získané metodou nejmenších čtverců Čísm Datum Hladna lak Odhad u Klascká rezdua -95%PI +95%PI Odhad AR /8/06 300,97 89,67 89,656 0,04 88,970 90,34 89,808 /5/06 300,98 89,65 89,666-0,06 88,98 90,35 89,73 //07 300,95 89,6 89,635-0,05 88,949 90,30 89,69 /8/07 300,99 89,6 89,676-0,056 88,99 90,36 89,664 /5/07 30,06 89,63 89,749-0,9 89,065 90,433 89,74 //07 30,8 89,66 89,874-0,4 89,9 90,557 89,794 /9/07 30,5 89,70 89,947-0,47 89,65 90,69 89,798 /5/07 30,34 90, 9,080-0,960 90,405 9,756 90,89 //07 30,6 90,46 9,37-0,9 90,695 9,047 90,774 /9/07 30,83 9,8 9,590-0,40 90,93 9,66 90,849 /6/07 30,87 9,44 9,63-0,9 90,955 9,308 9,83 Legenda: -95%PI a +95%PI značí dolní a horní mez 95%-ního ntervalu spolehlvost konkrétní hodnoty u, odhad AR značí odhad hodnoty u pomocí autoregresního modelu řádu 4 Analýza rezduí K ověřování předpokladů o náhodné chybě, kvaltě dat ale k vylepšování modelu využíváme analýzu rezduí Obecně lze říc, že jakákolv nenáhodnost zjštěná u rezduí naznačuje určté nedostatky modelu Př analýze rezduí se vychází z klasckých rezduí, která jsou nestranným odhady náhodných chyb Na rozdíl od nch jsou ale korelovaná a mají nekonstantní rozptyl Místo klasckých rezduí se používají další typy rezduí, které mají některé lepší vlastnost pro statstckou analýzu Dále se používají různé grafy, zejména grafy rezduí prot hodnotám predkce, hodnotám nezávsle proměnné nebo prot pořadovému číslu pozorování Graf rezduí prot nezávsle proměnné hladna (obr 8) mírně ndkuje heteroskedastcký model Rozptyl podmíněných rozdělení se nejeví konstantní, má tendenc slabě růst s růstem hodnot nezávsle proměnné Statstckým testy (Glejser a Goldfeld vz [3]), ale nezamítáme hypotézu o konstantním rozptylu na hladně významnost 0,0 Z grafu rezduí prot pořadí měření (obr 8) je patrné nenáhodné cyklcké kolísání, což ndkuje, že navržený model není správný Nenáhodné kolísání může být způsobeno nezařazením proměnné čas do modelu nebo autokorelací náhodných chyb Pro test nulové hypotézy o nekorelovanost náhodných chyb prot alternatvní hypotéze o korelovanost sousedních chyb lze použít Durbn - Watsonovu statstku D N ( ˆ ε ˆ ε ) = = N ε =,6 klrezdua =,5566E--5,353E-4*x,6 klrezdua = 0,8555-0,006*x,4,4,,,0,0 rezdua 0,8 0,6 0,4 0, 0,0-0, -0,4-0,6-0,8 -,0 -, 300,7 30,4 30,80 30,3 30,8 303,34 300,97 30,49 30,04 30,57 303,06 rezdua 0,8 0,6 0,4 0, 0,0-0, -0,4-0,6-0,8 -,0 -, hladna číslo měření Obr 8 Graf klasckých rezduí prot nezávsle proměnné a pořadí měření

9 Prot nulové hypotéze svědčí hodnoty statstky D vzdálené od čísla Korelovanost náhodných chyb byla potvrzena tímto testem na hladně významnost 0,0 Na obr 9 je hstogram rozdělení standardzovaných rezduí, z něhož je patrné nepřílš velké odchýlení od normálního rozdělení Lleforsova varanta Kolmogorovova testu shody normální rozdělení na hladně významnost 0,05 nezamítá 70 D = 0,04, p < ns, Lllefors-p < absolutní četnost standartzovaná rezdua Obr 9 Hstogram standardzovaných rezduí a jeho porovnání s hustotou normálního rozdělení 43 Postupy př porušení předpokladů KLRM Pokud lneární model není základní, tj kovaranční matce náhodné chyby ε není rovna σ I, ale lze j vyjádřt ve tvaru σ W, kde matce W není jednotková, mluvíme o tzv zobecněném lneárním regresním modelu Pokud je matce W regulární, hledáme odhad βˆ Z vektoru β tzv zobecněnou metodu nejmenších čtverců, tj hledáme statstku β ˆ Z, ve která funkce S Z ( β ) = ( Y Aβ ) W ( Y Aβ ) = ε W ε nabude absolutního mnma Z teoretckého hledska je zobecněný lneární regresní model trválním zobecněním KLRM, na který jej lze převést lneární transformací Z praktckého hledska je to ale horší, protože matc W obvykle neznáme a musíme najít její odhad Pokud bychom odhad vektoru β v zobecněném modelu hledal stejně jako v KLRM, dostaneme obecně méně přesné odhady regresních parametrů a vychýlený a méně přesný odhad směrodatné odchylky σ modelu Zobecněný lneární model dostaneme např v případě nekonstantnost rozptylu náhodné chyby, tj v případě tzv heteroskedastckého modelu, ale v případě, že jsou náhodné chyby korelované, tj v případě autoregresního modelu Pomocí zobecněného modelu lze řešt případy, kdy jsou na regresní parametry kladeny omezující podmínky My se zde omezíme pouze na případ autokorelace, tj korelovanost náhodných chyb Ostatní případy lze nalézt např v [3] S autokorelací se setkáváme především v případech, kdy se pozorování vztahují k různým časovým okamžkům nebo ntervalům Pak se může stát, že náhodné chyby ε závsí na předchozích hodnotách, tj není splněn předpoklad o jejch nekorelovanost S autokorelací se můžeme setkat v případě, že do regresního modelu nejsou zařazeny všechny významné vysvětlující proměnné Předpokládejme, tedy, že jsou náhodné chyby ε korelovány a řídí se autoregresním modelem AR(p) řádu p, tj ε = ϕ ε + + ϕ pε p + τ pro =,, n, kde ϕ,, ϕ p jsou neznámé parametry a τ je jná náhodná chyba, která splňuje stejné předpoklady jako náhodná chyba v KLRM V případě AR(), který se vyskytuje nejčastěj, lze psát

10 Y = x β + ε, ε = ϕε + τ pro =,, n, kde ϕ = ρ = cor( ε, ε ), E( ε ) = E( τ ) = 0, D( ε ) = σ ε, D( τ ) = στ Lze ukázat, že στ j στ j σ ε =, cov( ε ε ρ ρ σ, j ) = = ε ρ ρ edy cov( ε ) = σ τ W, kde n ρ ρ K ρ n = ρ ρ K ρ W ρ M M M M M n n n 3 ρ ρ ρ L Model AR() lze zapsat ve tvaru Y = Aβ + ε, E( ε ) = 0, cov( ε ) = σ τ W Inverzní matc W - k matc W lze vyjádřt ve tvaru W - = P P, kde ρ 0 0 L 0 ρ 0 L 0 P = 0 ρ L 0 M M M L M L Vynásobíme-l AR() zleva matcí P, převedeme jej na KLRM: Z = Qβ + τ, E( τ ) = 0, cov( τ ) = στ I, Z = PY, Q = PA, τ = Pε Zobecněný odhad βˆ Z parametru β pak můžeme hledat v transformovaném KLRM, podobně tam můžeme konstruovat ntervalové odhady a testovat hypotézy Výsledky transformujeme zpět do původního modelu Pro test nulové hypotézy o nekorelovanost náhodných chyb prot alternatvní hypotéze o korelovanostε,ε lze použít jž zmíněnou Durbn - Watsonovu statstku D Za odhad ρ lze vzít odhad ρˆ korelačního koefcentu velčn ε,ε ˆ ρ = 0, 5D Potom pro odhad Y ~ hodnoty velčny Y pomocí AR() dostaneme Y ~ = ˆ ˆ (Y ˆ x β + ρ Z x βz ) pro =,, n Korelovanost náhodných chyb našch dat byla prokázána Průběh závslost u na hladně lépe než KLRM vysthuje AR() V případě shluku dostáváme odhad ρ 0,735 a odhad ~ y = 6,7+,040x 0,764x + 0, 735y pro =,, n Směrodatná chyba autoregresního modelu je 0,4, zatímco pro KLRM je 0,34 Šířka 95%- ního pásu spolehlvost pro konkrétní hodnotu u je 0,896 oprot šířce,364 tohoto pásu v KLRM Šířka pásu je tedy o 0,34 menší, tj představuje 65,7% šířky pásu v KLRM Hodnoty odhadů ve shluku pomocí modelu AR() jsou uvedeny v posledním sloupc tab Na obr 0 je výsek autoregresním modelem spolu s regresním odhady Na obr je pak autokorelační model včetně pásů spolehlvost pro konkrétní hodnotu u

11 93,0 9,80 9,55 9,7 9,9 9,66 9,37 9, 90,86 90,60 90,35 90,0 89,85 89,60 odhad odhad AR číslo měření Obr 0 Základní a autoregresní model 93,00 9,50 9,09 9,8 9,54 9,7 9,00 90,7 90,45 90,8 89,8 89,50 89, číslo měření odhad AR 95%-ní pás spolehlvost pro konkrétní hodnotu Obr Autoregresní model s pásy spolehlvost pro konkrétní hodnotu u 5 Závěr Př statstcké analýze závslost dvou velčn je vhodné vždy vycházet z grafcké prezentace dat a umožní odhalt případné defekty v datech, jako jsou např hrubé chyby měření a heterogenta dat Hrubé chyby je zapotřebí odstrant a pokud jsou data heterogenní, je zapotřebí je rozložt do homogenních skupn a analýzu provádět s každým shlukem zvlášť Identfkac shluků realzujeme shlukovou analýzou nebo na základě znalost poměrů na vodním díle Př samotné analýze závslost sledujeme dvě její vlastnost - těsnost a průběh Orentační nformace o těchto aspektech získáme z bodového dagramu dat Pro měření těsnost závslost dvou velčn se nejčastěj používá korelační koefcent, který měří těsnost lneární závslost Průběh závslost modelujeme pomocí regresní funkce, u které se předpokládá, že je znám její tvar Regresní parametry se v aplkacích běžně odhadují metodou nejmenších čtverců Běžně

12 se ale neověřují podmínky její použtelnost, které zaručují dobré vlastnost získaných odhadů, an se nekonstruují ntervalové odhady konkrétních hodnot závsle proměnné, jejchž šířka mmo jné svědčí také o kvaltách odhadů Je tedy třeba znát předpoklady metody nejmenších čtverců a umět je ověřt V tomto směru je důležtá analýza rezduí, která umožní nejen ověřt dané předpoklady, ale naznačí, jak model opravt v případě, že tyto předpoklady nejsou splněny Pozn Příspěvek byl zpracován v rámc řešení grantového projektu GAČR 03/05/39 Lteratura [] Anděl, J Matematcká statstka MAFYZPRESS Praha, 993 [] Budíková, M Aplkace shlukové analýzy v ekolog Sborník prací letní školy ROBUS 000 [3] Hebák, P - Hustopecký, J Vícerozměrné statstcké metody s aplkacem SNL Praha, 987 [4] Hendl, J Přehled statstckých metod zpracování dat PORÁL Praha, 006 [5] Meloun, M - Mltký, J Statstcké zpracování expermentálních dat ARS MAGNA Praha, 998 [6] SAISICA for Wndows StatSoft, Inc 000

ANALÝZA VZTAHU DVOU SPOJITÝCH VELIČIN

ANALÝZA VZTAHU DVOU SPOJITÝCH VELIČIN ANALÝZA VZTAHU DVOU SPOJITÝCH VELIČIN V dokumentu 7a_korelacn_a_regresn_analyza jsme řešl rozdíl mez korelační a regresní analýzou. Budeme se teď věnovat pouze lneárnímu vztahu dvou velčn, protože je nejjednodušší

Více

REGRESNÍ ANALÝZA. 13. cvičení

REGRESNÍ ANALÝZA. 13. cvičení REGRESNÍ ANALÝZA 13. cvčení Závslost náhodných velčn Závslost mez kvanttatvním proměnným X a Y: Funkční závslost hodnotam nezávsle proměnných je jednoznačně dána hodnota závslé proměnné. Y=f(X) Stochastcká

Více

Regresní a korelační analýza

Regresní a korelační analýza Regresní a korelační analýza Závslost příčnná (kauzální). Závslostí pevnou se označuje případ, kdy výskytu jednoho jevu nutně odpovídá výskyt druhé jevu (a často naopak). Z pravděpodobnostního hledska

Více

ANOVA. Analýza rozptylu při jednoduchém třídění. Jana Vránová, 3.lékařská fakulta UK, Praha

ANOVA. Analýza rozptylu při jednoduchém třídění. Jana Vránová, 3.lékařská fakulta UK, Praha ANOVA Analýza rozptylu př jednoduchém třídění Jana Vránová, 3.léařsá faulta UK, Praha Teore Máme nezávslých výběrů, > Mají rozsahy n, teré obecně nemusí být stejné V aždém z nch známe průměr a rozptyl

Více

9. cvičení 4ST201. Obsah: Jednoduchá lineární regrese Vícenásobná lineární regrese Korelační analýza. Jednoduchá lineární regrese

9. cvičení 4ST201. Obsah: Jednoduchá lineární regrese Vícenásobná lineární regrese Korelační analýza. Jednoduchá lineární regrese cvčící 9. cvčení 4ST01 Obsah: Jednoduchá lneární regrese Vícenásobná lneární regrese Korelační analýza Vysoká škola ekonomcká 1 Jednoduchá lneární regrese Regresní analýza je statstcká metoda pro modelování

Více

6 LINEÁRNÍ REGRESNÍ MODELY

6 LINEÁRNÍ REGRESNÍ MODELY 1 6 LINEÁRNÍ REGRESNÍ MODELY Př budování regresních modelů se běžně užívá metody nejmenších čtverců. Metoda nejmenších čtverců poskytuje postačující odhady parametrů jenom př současném splnění všech předpokladů

Více

6. Demonstrační simulační projekt generátory vstupních proudů simulačního modelu

6. Demonstrační simulační projekt generátory vstupních proudů simulačního modelu 6. Demonstrační smulační projekt generátory vstupních proudů smulačního modelu Studjní cíl Na příkladu smulačního projektu představeného v mnulém bloku je dále lustrována metodka pro stanovování typů a

Více

3 VYBRANÉ MODELY NÁHODNÝCH VELIČIN. 3.1 Náhodná veličina

3 VYBRANÉ MODELY NÁHODNÝCH VELIČIN. 3.1 Náhodná veličina 3 VBRANÉ MODEL NÁHODNÝCH VELIČIN 3. Náhodná velčna Tato kaptola uvádí stručný pops vybraných pravděpodobnostních modelů spojtých náhodných velčn s důrazem na jejch uplatnění př rozboru spolehlvost stavebních

Více

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie 4EK Základy ekonometre Zobecněná MNČ Cvčení 8 Zuzana Dlouhá Gauss-Markovy předpoklady Náhodná složka: Gauss-Markovy předpoklady. E(u) = náhodné vlvy se vzájemně vynulují. E(u u T ) = σ I n konečný a konstantní

Více

podle typu regresní funkce na lineární nebo nelineární model Jednoduchá lineární regrese se dá vyjádřit vztahem y

podle typu regresní funkce na lineární nebo nelineární model Jednoduchá lineární regrese se dá vyjádřit vztahem y 4 Lneární regrese 4 LINEÁRNÍ REGRESE RYCHLÝ NÁHLED DO KAPITOLY Častokrát potřebujete zjstt nejen, jestl jsou dvě nebo více proměnných na sobě závslé, ale také jakým vztahem se tato závslost dá popsat.

Více

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie 4EK Základy ekonometre Zobecněná MNČ Cvčení 7 Zuzana Dlouhá Gauss-Markovy předpoklady Náhodná složka: Gauss-Markovy předpoklady. E(u) = náhodné vlvy se vzájemně vynulují. E(uu T ) = σ I n konečný a konstantní

Více

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA PRAVDĚPODOBNOS A SAISIKA Regresní analýza - motivace Základní úlohou regresní analýzy je nalezení vhodného modelu studované závislosti. Je nutné věnovat velkou pozornost tomu aby byla modelována REÁLNÁ

Více

VLIV VELIKOSTI OBCE NA TRŽNÍ CENY RODINNÝCH DOMŮ

VLIV VELIKOSTI OBCE NA TRŽNÍ CENY RODINNÝCH DOMŮ VLIV VELIKOSTI OBCE NA TRŽNÍ CENY RODINNÝCH DOMŮ Abstrakt Martn Cupal 1 Prncp tvorby tržní ceny nemovtost je sce založen na tržní nabídce a poptávce, avšak tento trh je značně nedokonalý. Nejvíce ovlvňuje

Více

ANALÝZA ROZPTYLU (Analysis of Variance ANOVA)

ANALÝZA ROZPTYLU (Analysis of Variance ANOVA) NLÝZ OZPYLU (nalyss of Varance NOV) Používá se buď ako samostatná technka, nebo ako postup, umožňuící analýzu zdroů varablty v lneární regres. Př. použtí: k porovnání středních hodnot (průměrů) více než

Více

Korelační energie. Celkovou elektronovou energii molekuly lze experimentálně určit ze vztahu. E vib. = E at. = 39,856, E d

Korelační energie. Celkovou elektronovou energii molekuly lze experimentálně určit ze vztahu. E vib. = E at. = 39,856, E d Korelační energe Referenční stavy Energ molekul a atomů lze vyjádřt vzhledem k různým referenčním stavům. V kvantové mechance za referenční stav s nulovou energí bereme stav odpovídající nenteragujícím

Více

Západočeská univerzita v Plzni Fakulta aplikovaných věd Katedra matematiky. Bakalářská práce. Zpracování výsledků vstupních testů z matematiky

Západočeská univerzita v Plzni Fakulta aplikovaných věd Katedra matematiky. Bakalářská práce. Zpracování výsledků vstupních testů z matematiky Západočeská unverzta v Plzn Fakulta aplkovaných věd Katedra matematky Bakalářská práce Zpracování výsledků vstupních testů z matematky Plzeň, 13 Tereza Pazderníková Prohlášení Prohlašuj, že jsem bakalářskou

Více

4.4 Exploratorní analýza struktury objektů (EDA)

4.4 Exploratorní analýza struktury objektů (EDA) 4.4 Exploratorní analýza struktury objektů (EDA) Průzkumová analýza vícerozměrných dat je stejně jako u jednorozměrných dat založena na vyšetření grafckých dagnostk. K tomuto účelu se využívá různých technk

Více

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Lineární regresní model kde Y = Xβ + e, y 1 e 1 β y 2 Y =., e = e 2 x 11 x 1 1k., X =....... β 2,

Více

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu Testování hypotéz o parametrech regresního modelu Ekonometrie Jiří Neubauer Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra UO

Více

Transformace dat a počítačově intenzivní metody

Transformace dat a počítačově intenzivní metody Transformace dat a počítačově ntenzvní metody Jří Mltký Katedra textlních materálů, Textlní fakulta, Techncká unversta v Lberc, Lberec, e- mal jr.mltky@vslb.cz Mlan Meloun, Katedra analytcké cheme, Unversta

Více

VĚROHODNOST VÝSLEDKŮ PŘI UŽITÍ EXPLORATORNÍ ANALÝZY DAT

VĚROHODNOST VÝSLEDKŮ PŘI UŽITÍ EXPLORATORNÍ ANALÝZY DAT VĚROHODNOST VÝSLEDKŮ PŘI UŽITÍ EXPLORATORNÍ ANALÝZY DAT Mlan Meloun Unverzta Pardubce, Čs. Legí 565, 53 10 Pardubce, mlan.meloun@upce.cz 1. Obecný postup analýzy jednorozměrných dat V prvním kroku se v

Více

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA PRAVDĚPODOBNOST A STATISTIKA Definice lineárního normálního regresního modelu Lineární normální regresní model Y Xβ ε Předpoklady: Matice X X n,k je matice realizací. Předpoklad: n > k, h(x) k - tj. matice

Více

Neparametrické metody

Neparametrické metody Neparametrcké metody Přestože parametrcké metody zaujímají klíčovou úlohu ve statstcké analýze dat, je možné některé problémy řešt př neparametrckém přístupu. V této přednášce uvedeme neparametrcké odhady

Více

VYBOČUJÍCÍ HODNOTY VE VÍCEROZMĚRNÝCH DATECH

VYBOČUJÍCÍ HODNOTY VE VÍCEROZMĚRNÝCH DATECH VYBOČUJÍCÍ HODOTY VE VÍCEROZMĚRÝCH DATECH JIŘÍ MILITKÝ, Katedra tetlních materálů, Techncká unversta v Lberc, Hálkova 6 461 17 Lberec, e- mal: jr.mlky@vslb.cz MILA MELOU, Katedra analytcké cheme, Unversta

Více

Regresní analýza 1. Regresní analýza

Regresní analýza 1. Regresní analýza Regresní analýza 1 1 Regresní funkce Regresní analýza Důležitou statistickou úlohou je hledání a zkoumání závislostí proměnných, jejichž hodnoty získáme při realizaci experimentů Vzhledem k jejich náhodnému

Více

STATISTIKA (pro navazující magisterské studium)

STATISTIKA (pro navazující magisterské studium) Slezská unverzta v Opavě Obchodně podnkatelská fakulta v Karvné STATISTIKA (pro navazující magsterské studum) Jaroslav Ramík Karvná 007 Jaroslav Ramík, Statstka Jaroslav Ramík, Statstka 3 OBSAH MODULU

Více

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA PRAVDĚPODOBNOST A STATISTIKA Definice lineárního normálního regresního modelu Lineární normální regresní model Y β ε Matice n,k je matice realizací. Předpoklad: n > k, h() k - tj. matice je plné hodnosti

Více

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie 4EK211 Základy ekonometrie LS 2014/15 Cvičení 7: Autokorelace LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE 1. Autokorelace - teorie Zopakujte si G-M

Více

7. Analýza rozptylu jednoduchého třídění

7. Analýza rozptylu jednoduchého třídění 7. nalýza rozptylu jednoduchého třídění - V této kaptole se budeme zabývat vztahem mez znaky kvanttatvním (kolk) a kvaltatvním (kategorálním, jaké jsou) Doposud jsme schopn u nch hodnott: - podmíněné charakterstky

Více

Statistická analýza jednorozměrných dat

Statistická analýza jednorozměrných dat Statistická analýza jednorozměrných dat Prof. RNDr. Milan Meloun, DrSc. Univerzita Pardubice, Pardubice 31.ledna 2011 Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem

Více

CHYBY MĚŘENÍ. uvádíme ve tvaru x = x ± δ.

CHYBY MĚŘENÍ. uvádíme ve tvaru x = x ± δ. CHYBY MĚŘENÍ Úvod Představte s, že máte změřt délku válečku. Použjete posuvné měřítko a získáte určtou hodnotu. Pamětlv přísloví provedete ještě jedno měření. Ale ouha! Výsledek je jný. Co dělat? Měřt

Více

2.5. MATICOVÉ ŘEŠENÍ SOUSTAV LINEÁRNÍCH ROVNIC

2.5. MATICOVÉ ŘEŠENÍ SOUSTAV LINEÁRNÍCH ROVNIC 25 MATICOVÉ ŘEŠENÍ SOUSTAV LINEÁRNÍCH ROVNIC V této kaptole se dozvíte: jak lze obecnou soustavu lneárních rovnc zapsat pomocí matcového počtu; přesnou formulac podmínek řeštelnost soustavy lneárních rovnc

Více

Lokace odbavovacího centra nákladní pokladny pro víkendový provoz

Lokace odbavovacího centra nákladní pokladny pro víkendový provoz Markéta Brázdová 1 Lokace odbavovacího centra nákladní pokladny pro víkendový provoz Klíčová slova: odbavování záslek, centrum grafu, vážená excentrcta vrcholů sítě, časová náročnost odbavení záslky, vážená

Více

MODELOVÁNÍ A SIMULACE

MODELOVÁNÍ A SIMULACE MODELOVÁNÍ A SIMULACE základní pojmy a postupy vytváření matematckých modelů na základě blancí prncp numerckého řešení dferencálních rovnc základy práce se smulačním jazykem PSI Základní pojmy matematcký

Více

Numerická matematika 1. t = D u. x 2 (1) tato rovnice určuje chování funkce u(t, x), která závisí na dvou proměnných. První

Numerická matematika 1. t = D u. x 2 (1) tato rovnice určuje chování funkce u(t, x), která závisí na dvou proměnných. První Numercká matematka 1 Parabolcké rovnce Budeme se zabývat rovncí t = D u x (1) tato rovnce určuje chování funkce u(t, x), která závsí na dvou proměnných. První proměnná t mívá význam času, druhá x bývá

Více

Otto DVOŘÁK 1 NEJISTOTA STANOVENÍ TEPLOTY VZNÍCENÍ HOŘLAVÝCH PLYNŮ A PAR PARABOLICKOU METODOU PODLE ČSN EN 14522

Otto DVOŘÁK 1 NEJISTOTA STANOVENÍ TEPLOTY VZNÍCENÍ HOŘLAVÝCH PLYNŮ A PAR PARABOLICKOU METODOU PODLE ČSN EN 14522 Otto DVOŘÁK 1 NEJISTOTA STANOVENÍ TEPLOTY VZNÍCENÍ HOŘLAVÝCH PLYNŮ A PAR PARABOLICKOU METODOU PODLE ČSN EN 145 UNCERTAINTY OF DETEMINATION OF THE AUTO-IGNITION TEMPERATURE OF FLAMMABLE GASES OR VAPOURS

Více

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Prostá regresní a korelační analýza 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Problematika závislosti V podstatě lze rozlišovat mezi závislostí nepodstatnou, čili náhodnou

Více

AVDAT Geometrie metody nejmenších čtverců

AVDAT Geometrie metody nejmenších čtverců AVDAT Geometrie metody nejmenších čtverců Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Lineární model klasický lineární regresní model odhad parametrů MNČ y = Xβ + ε, ε

Více

Statistická šetření a zpracování dat.

Statistická šetření a zpracování dat. Statstcká šetření a zpracování dat. Vyjadřovací prostředky ve statstce STATISTICKÉ TABULKY Typckým vyjadřovacím prostředkem statstky je číslo formalzovaným nástrojem číselného vyjádření je statstcká tabulka.

Více

SIMULACE. Numerické řešení obyčejných diferenciálních rovnic. Měřicí a řídicí technika magisterské studium FTOP - přednášky ZS 2009/10

SIMULACE. Numerické řešení obyčejných diferenciálních rovnic. Měřicí a řídicí technika magisterské studium FTOP - přednášky ZS 2009/10 SIMULACE numercké řešení dferencálních rovnc smulační program dentfkace modelu Numercké řešení obyčejných dferencálních rovnc krokové metody pro řešení lneárních dferencálních rovnc 1.řádu s počátečním

Více

Monte Carlo metody Josef Pelikán CGG MFF UK Praha.

Monte Carlo metody Josef Pelikán CGG MFF UK Praha. Monte Carlo metody 996-7 Josef Pelkán CGG MFF UK Praha pepca@cgg.mff.cun.cz http://cgg.mff.cun.cz/~pepca/ Monte Carlo 7 Josef Pelkán, http://cgg.ms.mff.cun.cz/~pepca / 44 Monte Carlo ntegrace Odhadovaný

Více

u (x i ) U i 1 2U i +U i+1 h 2. Na hranicích oblasti jsou uzlové hodnoty dány okrajovými podmínkami bud přímo

u (x i ) U i 1 2U i +U i+1 h 2. Na hranicích oblasti jsou uzlové hodnoty dány okrajovými podmínkami bud přímo Metoda sítí základní schémata h... krok sítě ve směru x, tj. h = x x q... krok sítě ve směru y, tj. q = y j y j τ... krok ve směru t, tj. τ = j... hodnota přblžného řešení v uzlu (x,y j ) (Possonova rovnce)

Více

9. Měření kinetiky dohasínání fluorescence ve frekvenční doméně

9. Měření kinetiky dohasínání fluorescence ve frekvenční doméně 9. Měření knetky dohasínání fluorescence ve frekvenční doméně Gavolův experment (194) zdroj vzorek synchronní otáčení fázový posun detektor Měření dob žvota lumnscence Frekvenční doména - exctace harmoncky

Více

Spojité regulátory - 1 -

Spojité regulátory - 1 - Spojté regulátory - 1 - SPOJIÉ EGULÁOY Nespojté regulátory mají většnou jednoduchou konstrukc a jsou levné, ale jsou nevhodné tím, že neudržují regulovanou velčnu přesně na žádané hodnotě, neboť regulovaná

Více

Normální (Gaussovo) rozdělení

Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení f x = 1 2 exp x 2 2 2 f(x) je funkce hustoty pravděpodobnosti, symetrická vůči poloze maxima x = μ μ střední hodnota σ směrodatná odchylka (tzv. pološířka křivky mezi inflexními

Více

AVDAT Klasický lineární model, metoda nejmenších

AVDAT Klasický lineární model, metoda nejmenších AVDAT Klasický lineární model, metoda nejmenších čtverců Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Lineární model y i = β 0 + β 1 x i1 + + β k x ik + ε i (1) kde y i

Více

Využití logistické regrese pro hodnocení omaku

Využití logistické regrese pro hodnocení omaku Využtí logstcké regrese pro hodnocení omaku Vladmír Bazík Úvod Jedním z prmárních proevů textlí e omak. Jedná se o poct který vyvolá textle př kontaktu s pokožkou. Je to ntegrální psychofyzkální vlastnost

Více

2. Definice pravděpodobnosti

2. Definice pravděpodobnosti 2. Defnce pravděpodobnost 2.1. Úvod: V přírodě se setkáváme a v přírodních vědách studujeme pomocí matematckých struktur a algortmů procesy dvojího druhu. Jednodušší jsou determnstcké procesy, které se

Více

Energie elektrického pole

Energie elektrického pole Energe elektrckého pole Jž v úvodní kaptole jsme poznal, že nehybný (centrální elektrcký náboj vytváří v celém nekonečném prostoru slové elektrcké pole, které je konzervatvní, to znamená, že jakýkolv jný

Více

12. cvičení z PST. 20. prosince 2017

12. cvičení z PST. 20. prosince 2017 1 cvičení z PST 0 prosince 017 11 test rozptylu normálního rozdělení Do laboratoře bylo odesláno n = 5 stejných vzorků krve ke stanovení obsahu alkoholu X v promilích alkoholu Výsledkem byla realizace

Více

MOŽNOSTI MODELOVÁNÍ A ŘEŠENÍ STŘETU PŘI OBJASŇOVÁNÍ FINGOVANÝCH DOPRAVNÍCH NEHOD

MOŽNOSTI MODELOVÁNÍ A ŘEŠENÍ STŘETU PŘI OBJASŇOVÁNÍ FINGOVANÝCH DOPRAVNÍCH NEHOD XV. konference absolventů studa technckého znalectví s meznárodní účastí MOŽNOSTI MODELOVÁNÍ A ŘEŠENÍ STŘETU PŘI OBJASŇOVÁNÍ FINGOVANÝCH DOPRAVNÍCH NEHOD Zdeněk Mrázek 1 1. Ř ešení stř etu u fngovaných

Více

Matematika I A ukázkový test 1 pro 2018/2019

Matematika I A ukázkový test 1 pro 2018/2019 Matematka I A ukázkový test 1 pro 2018/2019 1. Je dána soustava rovnc s parametrem a R x y + z = 1 x + y + 3z = 1 (2a 1)x + (a + 1)y + z = 1 a a) Napšte Frobenovu větu (předpoklady + tvrzení). b) Vyšetřete

Více

7. STATISTICKÝ SOUBOR S JEDNÍM ARGUMENTEM

7. STATISTICKÝ SOUBOR S JEDNÍM ARGUMENTEM 7. STATISTICKÝ SOUBOR S JEDNÍM ARGUMENTEM Průvodce studem Předchozí kaptoly byly věnovány pravděpodobnost a tomu, co s tímto pojmem souvsí. Nyní znalost z počtu pravděpodobnost aplkujeme ve statstce. Předpokládané

Více

Teoretické modely diskrétních náhodných veličin

Teoretické modely diskrétních náhodných veličin Teoretcké modely dskrétních náhodných velčn Velčny, kterým se zabýváme, bývají nejrůznější povahy. Přesto však estují skupny náhodných velčn, které mají podobně rozloženou pravděpodobnostní funkc a lze

Více

KOMPLEXNÍ ČÍSLA. Algebraický tvar komplexního čísla

KOMPLEXNÍ ČÍSLA. Algebraický tvar komplexního čísla KOMPLEXNÍ ČÍSLA Příklad Řešte na množně reálných čísel rovnc: x + = 0. x = Rovnce nemá v R řešení. Taková jednoduchá rovnce a nemá na množně reálných čísel žádné řešení! Co s tím? Zavedeme tzv. magnární

Více

Regresní analýza. Ekonometrie. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel

Regresní analýza. Ekonometrie. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel Regresní analýza Ekonometrie Jiří Neubauer Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra ekonometrie UO Brno) Regresní analýza 1 / 23

Více

Čísla přiřazená elementárním jevům tvoří obor hodnot M proměnné, kterou nazýváme náhodná veličina (označujeme X, Y, Z,...)

Čísla přiřazená elementárním jevům tvoří obor hodnot M proměnné, kterou nazýváme náhodná veličina (označujeme X, Y, Z,...) . NÁHODNÁ VELIČINA Průvodce studem V předchozích kaptolách jste se seznáml s kombnatorkou a pravděpodobností jevů. Tyto znalost použjeme v této kaptole, zavedeme pojem náhodná velčna, funkce, které náhodnou

Více

Přednášky část 4 Analýza provozních zatížení a hypotézy kumulace poškození, příklady. Milan Růžička

Přednášky část 4 Analýza provozních zatížení a hypotézy kumulace poškození, příklady. Milan Růžička Přednášky část 4 Analýza provozních zatížení a hypotézy kumulace poškození, příklady Mlan Růžčka mechanka.fs.cvut.cz mlan.ruzcka@fs.cvut.cz Analýza dynamckých zatížení Harmoncké zatížení x(t) přes soubor

Více

Téma 5: Parametrická rozdělení pravděpodobnosti spojité náhodné veličiny

Téma 5: Parametrická rozdělení pravděpodobnosti spojité náhodné veličiny 0.05 0.0 0.05 0.0 0.005 Nomnální napětí v pásnc Std Mean 40 60 80 00 0 40 60 Std Téma 5: Parametrcká rozdělení pravděpodobnost spojté náhodné velčn Přednáška z předmětu: Pravděpodobnostní posuzování konstrukcí

Více

Neřešené příklady k procvičení

Neřešené příklady k procvičení Vysoká škola báňská - Techncká unverzta Ostrava Fakulta elektrotechnky a nformatky Katedra aplkované matematky Neřešené příklady k procvčení Lenka Šmonová Ostrava, 2006 Následující sbírka neřešených příkladů

Více

Bodové a intervalové odhady parametrů v regresním modelu

Bodové a intervalové odhady parametrů v regresním modelu Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Lineární regresní model Mějme lineární regresní model (LRM) Y = Xβ + e, kde y 1 e 1 β y 2 Y =., e

Více

Dále budeme předpokládat, že daný Markovův řetězec je homogenní. p i1 i 2

Dále budeme předpokládat, že daný Markovův řetězec je homogenní. p i1 i 2 4 Markovovy řetězce se nazývá Markovův řetě- Defnce 7 Posloupnost celočíselných náhodných velčn {X n } zec (markovský řetězec), jestlže P(X n+ = j X n = n,, X 0 = 0 ) = P(X n+ = j X n = n ) (7) pro každé

Více

Teoretické modely diskrétních náhodných veličin

Teoretické modely diskrétních náhodných veličin Teoretcké modely dskrétních náhodných velčn Velčny, kterým se zabýváme, bývají nejrůznější povahy. Přesto však estují skupny náhodných velčn, které mají podobně rozloženou pravděpodobnostní funkc a lze

Více

Čísla a aritmetika. Řádová čárka = místo, které odděluje celou část čísla od zlomkové.

Čísla a aritmetika. Řádová čárka = místo, které odděluje celou část čísla od zlomkové. Příprava na cvčení č.1 Čísla a artmetka Číselné soustavy Obraz čísla A v soustavě o základu z: m A ( Z ) a z (1) n kde: a je symbol (číslce) z je základ m je počet řádových míst, na kterých má základ kladný

Více

1 Řešení soustav lineárních rovnic

1 Řešení soustav lineárních rovnic 1 Řešení soustav lineárních rovnic 1.1 Lineární rovnice Lineární rovnicí o n neznámých x 1,x 2,..., x n s reálnými koeficienty rozumíme rovnici ve tvaru a 1 x 1 + a 2 x 2 +... + a n x n = b, (1) kde koeficienty

Více

Vztah mezi počtem květů a celkovou biomasou rostliny CELKE EM. slá pro KVETU = závi

Vztah mezi počtem květů a celkovou biomasou rostliny CELKE EM. slá pro KVETU = závi Regrese a korelace Regrese versus korelace Regrese (regresson)* popsuje vztah = závslost dvou a více kvanttatvních (popř. ordnálních) proměnných formou funkční závslost měří těsnost Korelace (correlaton)

Více

ina ina Diskrétn tní náhodná veličina může nabývat pouze spočetně mnoha hodnot (počet aut v náhodně vybraná domácnost, výsledek hodu kostkou)

ina ina Diskrétn tní náhodná veličina může nabývat pouze spočetně mnoha hodnot (počet aut v náhodně vybraná domácnost, výsledek hodu kostkou) Náhodná velčna na Výsledek náhodného pokusu, daný reálným číslem je hodnotou náhodné velčny. Náhodná velčna je lbovolná reálná funkce defnovaná na množně elementárních E pravděpodobnostního prostoru S.

Více

Regresní a korelační analýza

Regresní a korelační analýza Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).

Více

Odhad parametrů N(µ, σ 2 )

Odhad parametrů N(µ, σ 2 ) Odhad parametrů N(µ, σ 2 ) Mějme statistický soubor x 1, x 2,, x n modelovaný jako realizaci náhodného výběru z normálního rozdělení N(µ, σ 2 ) s neznámými parametry µ a σ. Jaký je maximální věrohodný

Více

POROVNÁNÍ MEZI SKUPINAMI

POROVNÁNÍ MEZI SKUPINAMI POROVNÁNÍ MEZI SKUPINAMI Potřeba porovnání počtů mez určtým skupnam jednců např. porovnání počtů onemocnění mez kraj nebo okresy v prax se obvykle pracuje s porovnáním na 100.000 osob. Stuace ale nebývá

Více

Matematické modelování Náhled do ekonometrie. Lukáš Frýd

Matematické modelování Náhled do ekonometrie. Lukáš Frýd Matematické modelování Náhled do ekonometrie Lukáš Frýd Výnos akcie vs. Výnos celého trhu - CAPM model r it = r ft + β 1. (r mt r ft ) r it r ft = α 0 + β 1. (r mt r ft ) + ε it Ekonomický (finanční model)

Více

7. Analýza rozptylu.

7. Analýza rozptylu. 7. Analýza rozptylu. Uvedeme obecnou ideu, která je založena na minimalizaci chyby metodou nejmenších čtverců. Nejdříve uvedeme několik základních tvrzení. Uvažujeme náhodný vektor Y = (Y, Y,..., Y n a

Více

X = x, y = h(x) Y = y. hodnotám x a jedné hodnotě y. Dostaneme tabulku hodnot pravděpodobnostní

X = x, y = h(x) Y = y. hodnotám x a jedné hodnotě y. Dostaneme tabulku hodnot pravděpodobnostní ..08 8cv7.tex 7. cvičení - transformace náhodné veličiny Definice pojmů a základní vzorce Je-li X náhodná veličina a h : R R je měřitelná funkce, pak náhodnou veličinu Y, která je definovaná vztahem X

Více

LOGICKÉ OBVODY J I Ř Í K A L O U S E K

LOGICKÉ OBVODY J I Ř Í K A L O U S E K LOGICKÉ OBVODY J I Ř Í K A L O U S E K Ostrava 2006 Obsah předmětu 1. ČÍSELNÉ SOUSTAVY... 2 1.1. Číselné soustavy - úvod... 2 1.2. Rozdělení číselných soustav... 2 1.3. Polyadcké číselné soustavy... 2

Více

Lineární regrese. Komentované řešení pomocí MS Excel

Lineární regrese. Komentované řešení pomocí MS Excel Lineární regrese Komentované řešení pomocí MS Excel Vstupní data Tabulka se vstupními daty je umístěna v oblasti A1:B11 (viz. obrázek) na listu cela data Postup Základní výpočty - regrese Výpočet základních

Více

8a.Objektové metody viditelnosti. Robertsův algoritmus

8a.Objektové metody viditelnosti. Robertsův algoritmus 8a. OBJEKOVÉ MEODY VIDIELNOSI Cíl Po prostudování této kaptoly budete znát metody vdtelnost 3D objektů na základě prostorových vlastností těchto objektů tvořt algortmy pro určování vdtelnost hran a stěn

Více

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie 4EK11 Základy ekonometrie Autokorelace Cvičení 5 Zuzana Dlouhá Gauss-Markovy předpoklady Náhodná složka: Gauss-Markovy předpoklady 1. E(u) = náhodné vlivy se vzájemně vynulují. E(uu T ) = σ I n konečný

Více

Necht tedy máme přirozená čísla n, k pod pojmem systém lineárních rovnic rozumíme rovnice ve tvaru

Necht tedy máme přirozená čísla n, k pod pojmem systém lineárních rovnic rozumíme rovnice ve tvaru 2. Systémy lineárních rovnic V této kapitole se budeme zabývat soustavami lineárních rovnic s koeficienty z pole reálných případně komplexních čísel. Uvádíme podmínku pro existenci řešení systému lineárních

Více

Aplikace simulačních metod ve spolehlivosti

Aplikace simulačních metod ve spolehlivosti XXVI. ASR '2001 Semnar, Instruments and Control, Ostrava, Aprl 26-27, 2001 Paper 40 Aplkace smulačních metod ve spolehlvost MARTINEK, Vlastml Ing., Ústav automatzace a nformatky, FSI VUT v Brně, Techncká

Více

Úvodem Dříve les než stromy 3 Operace s maticemi

Úvodem Dříve les než stromy 3 Operace s maticemi Obsah 1 Úvodem 13 2 Dříve les než stromy 17 2.1 Nejednoznačnost terminologie 17 2.2 Volba metody analýzy dat 23 2.3 Přehled vybraných vícerozměrných metod 25 2.3.1 Metoda hlavních komponent 26 2.3.2 Faktorová

Více

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457. 0 cvičení z PST 5 prosince 208 0 (intervalový odhad pro rozptyl) Soubor (70, 84, 89, 70, 74, 70) je náhodným výběrem z normálního rozdělení N(µ, σ 2 ) Určete oboustranný symetrický 95% interval spolehlivosti

Více

populace soubor jednotek, o jejichž vlastnostech bychom chtěli vypovídat letní semestr Definice subjektech.

populace soubor jednotek, o jejichž vlastnostech bychom chtěli vypovídat letní semestr Definice subjektech. Populace a Šárka Hudecová Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy letní semestr 2012 1 populace soubor jednotek, o jejichž vlastnostech bychom

Více

Teorie efektivních trhů (E.Fama (1965))

Teorie efektivních trhů (E.Fama (1965)) Teore efektvních trhů (E.Fama (965)) Efektvní efektvní zpracování nových nformací Efektvní trh trh, který rychle a přesně absorbuje nové nf. Ceny II (akcí) náhodná procházka Předpoklady: na trhu partcpuje

Více

Úvod do teorie odhadu. Ing. Michael Rost, Ph.D.

Úvod do teorie odhadu. Ing. Michael Rost, Ph.D. Úvod do teorie odhadu Ing. Michael Rost, Ph.D. Náhodný výběr Náhodným výběrem ze základního souboru populace, která je popsána prostřednictvím hustoty pravděpodobnosti f(x, θ), budeme nazývat posloupnost

Více

Kontingenční tabulky, korelační koeficienty

Kontingenční tabulky, korelační koeficienty Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel 973 442029 email:jirineubauer@unobcz Budeme předpokládat, že X a Y jsou kvalitativní náhodné veličiny, obor hodnot X obsahuje r hodnot (kategorií,

Více

PŘÍSPĚVEK K NEJISTOTÁM VÝSLEDKŮ MĚŘENÍ

PŘÍSPĚVEK K NEJISTOTÁM VÝSLEDKŮ MĚŘENÍ PŘÍSPĚVEK K NEJISTOTÁM VÝSLEDKŮ MĚŘENÍ JIŘÍ MILITKÝ, Katedra textlních materálů, Techncká unversta v Lberc, MILAN MELOUN, Katedra analytcké cheme, Unversta Pardubce, Pardubce. Úvod Je známo, že měření

Více

Regresní a korelační analýza

Regresní a korelační analýza Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).

Více

VÝVOJ SOFTWARU NA PLÁNOVÁNÍ PŘESNOSTI PROSTOROVÝCH SÍTÍ PRECISPLANNER 3D. Martin Štroner 1

VÝVOJ SOFTWARU NA PLÁNOVÁNÍ PŘESNOSTI PROSTOROVÝCH SÍTÍ PRECISPLANNER 3D. Martin Štroner 1 VÝVOJ SOFWARU NA PLÁNOVÁNÍ PŘESNOSI PROSOROVÝCH SÍÍ PRECISPLANNER 3D DEVELOPMEN OF HE MEASUREMEN ACCURACY PLANNING OF HE 3D GEODEIC NES PRECISPLANNER 3D Martn Štroner 1 Abstract A software for modellng

Více

2 TESTOVÁNÍ HYPOTÉZ. RYCHLÝ NÁHLED KAPITOLY Neříkej: Objevil jsem pravdu! ale raději: Objevil jsem jednu z pravd! Chalil Gibran

2 TESTOVÁNÍ HYPOTÉZ. RYCHLÝ NÁHLED KAPITOLY Neříkej: Objevil jsem pravdu! ale raději: Objevil jsem jednu z pravd! Chalil Gibran Elena Melcová, Radmla Stoklasová a Jaroslav Ramík; Statstcké programy TESTOVÁNÍ HYPOTÉZ RYCHLÝ NÁHLED KAPITOLY Neříkej: Objevl jsem pravdu! ale raděj: Objevl jsem jednu z pravd! Chall Gbran Testování hypotéz

Více

Analýza rozptylu. Ekonometrie. Jiří Neubauer. Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel

Analýza rozptylu. Ekonometrie. Jiří Neubauer. Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel Analýza rozptylu Ekonometrie Jiří Neubauer Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra UO Brno) Analýza rozptylu 1 / 30 Analýza

Více

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA PRAVDĚPODOBNOST A STATISTIKA Testování hypotéz Nechť X je náhodná proměnná, která má distribuční funkci F(x, ϑ). Předpokládejme, že známe tvar distribuční funkce (víme jaké má rozdělení) a neznáme parametr

Více

Časové řady, typy trendových funkcí a odhady trendů

Časové řady, typy trendových funkcí a odhady trendů Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel 973 442029 email:jirineubauer@unobcz Stochastický proces Posloupnost náhodných veličin {Y t, t = 0, ±1, ±2 } se nazývá stochastický proces

Více

Časové řady, typy trendových funkcí a odhady trendů

Časové řady, typy trendových funkcí a odhady trendů Časové řady, typy trendových funkcí a odhady trendů Jiří Neubauer Katedra ekonometrie FVL UO Brno kancelář 69a, tel 973 442029 email:jirineubauer@unobcz Jiří Neubauer (Katedra ekonometrie UO Brno) Časové

Více

MATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci

MATEMATICKÁ STATISTIKA.   Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci MATEMATICKÁ STATISTIKA Dana Černá http://www.fp.tul.cz/kmd/ Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci Matematická statistika Matematická statistika se zabývá matematickým

Více

Jiří Militky Škály měření Nepřímá měření Teorie měření Kalibrace

Jiří Militky Škály měření Nepřímá měření Teorie měření Kalibrace Tetlní zkušebnctv ebnctví II Jří Mltky Škály měření epřímá měření Teore měření Kalbrace Základní pojmy I PRAVDĚPODOBOST Jev A, byl sledován v m pokusech. astal celkem m a krát. Relatvní četnost výskytu

Více

5EN306 Aplikované kvantitativní metody I

5EN306 Aplikované kvantitativní metody I 5EN306 Aplikované kvantitativní metody I Přednáška 3 Zuzana Dlouhá Předmět a struktura kurzu 1. Úvod: struktura empirických výzkumů 2. Tvorba ekonomických modelů: teorie 3. Data: zdroje a typy dat, význam

Více

Simulační metody hromadné obsluhy

Simulační metody hromadné obsluhy Smulační metody hromadné osluhy Systém m a model vstupy S výstupy Systém Část prostředí, kterou lze od jeho okolí oddělt fyzckou neo myšlenkovou hrancí Model Zjednodušený, astraktní nástroj používaný pro

Více

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie 4EK211 Základy ekonometrie ZS 2015/16 Cvičení 7: Časově řady, autokorelace LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE 1. Časové řady Data: HDP.wf1

Více

Normální rozložení a odvozená rozložení

Normální rozložení a odvozená rozložení I Normální rozložení a odvozená rozložení I.I Normální rozložení Data, se kterými pracujeme, pocházejí z různých rozložení. Mohou být vychýlena (doleva popř. doprava, nebo v nich není na první pohled vidět

Více