statistiky zavedeme jednu novou a porovnáme její přednosti a nedostatky Výsledky pozorování náhodných veličin lze reprezentovat pomocí ukazatelů

Rozměr: px
Začít zobrazení ze stránky:

Download "statistiky zavedeme jednu novou a porovnáme její přednosti a nedostatky Výsledky pozorování náhodných veličin lze reprezentovat pomocí ukazatelů"

Transkript

1 Skalární skór Zdeněk Fabián Ústav informatiky AV ČR, Praha Abstrakt. Po stručném přehledu základních inferenčních funkcí matematické statistiky zavedeme jednu novou a porovnáme její přednosti a nedostatky s ostatními. Úvod Výsledky pozorování náhodných veličin lze reprezentovat pomocí ukazatelů a čísel, které shrnují nějaké obecnější tendence. K tomu slouží statistické charakteristiky dat typu středu a poloměru rozptýlenosti, šikmosti či špičatosti, a statistické analýzy, např. korelace či regrese, kterými se hledají souvislosti mezi náhodnými veličinami. Charakteristiky populace jsou získávány z pozorovaných dat obvykle jako řešení rovnic typu Ψ(data; θ) = 0 kde θ je vektor parametrů zvoleného statistického modelu a Ψ statistická inferenční funkce. V tomto textu popisuji přednosti a nedostatky nejužívanějších inferenčních funkcí a představuji jednu novou, uvedenou do statistické literatury pod jménem core funkce v r. 200 (viz [3]), kterou dnes nazývám skalárním skórem. Skalární skór je užitečný sice univerzálně, ale zdá se, že nejvíce pro rozdělení, jejichž hustoty neklesají dostatečně rychle nule, t.zv. rozdělení s těžkými chvosty, která nemusí mít střední hodnotu ani rozptyl. 2 Základní pojmy a značení R značí reálnou osu a X R otevřený (konečný či nekonečný) interval. P značí pravděpodobnost. Spojitá náhodná veličina X má rozdělení F, popsané distribuční funkcí F (x) = P (X < x) na nosiči X, jestliže je její pravděpodobnostní hustota (dále jen hustota) f(x) = df (x)/dx na X kladná a na R X rovna nule. Místo F s nosičem X někdy říkáme F na X.

2 Budeme se zabývat úlohami, kdy je možné předpokládat, že pozorovaná data X n = (x,..., x n ) jsou náhodným výběrem z F, t.j. jsou realizací spojitých náhodných veličin X,..., X n, nezávislých a stejně rozdělených podle (neznámého) rozdělení F zkoumané populace (a nabývajícich hodnot v X ). Dat je obvykle méně, než by bylo potřeba k určení hustoty populace např. aproximací histogramu a je nutno použít jiných metod. Parametrický přístup spočívá v předpokladu, že F je člen F θ0 předpokládaného modelu, rodiny {F θ : θ Θ}, kde Θ R m, s hustotami f(x; θ), které jsou spojité a mají v x i θ potřebné derivace. Často užívanou modelovou rodinou je normální rozdělení (Tabulka ) s nosičem R a s parametrem θ = (µ, s). Jako µ R se obecně označuje parametr polohy, t.j. x-ová souřadnice maxima hustoty (mód), a jako s (0, ) značíme parametr měřítka, popisující rozptýlenost hodnot kolem středu µ. Hodnota estimátoru T n (X) = T (X,..., X n ) parametru θ 0, určená z náhodného výběru X n, odhad ˆθ n, kolísá od výběru k výběru: T n (X) je náhodná veličina, která má určité rozdělení, které vypovídá o přesnosti odhadu. Toto rozdělení se obvykle nedá odvodit pro pevné n a je fajn, když určíme alespoň asymptotické, limitní rozdělení pro n. Známe-li je, lze pak doufat (a případně podepřít výsledky počítačových simulací metodou zvanou bootstrap), že přibližně platí i pro taková n, která máme k dispozici. Pak můžeme konstruovat intervaly spolehlivosti, určovat míru rizika že se na základě daného odhadu rozhodneme chybně atd. V dalším nebudeme rozlišovat mezi estimátorem (náhodnou veličinou) a její konkrétní hodnotou pro určitý náhodný výběr (odhadem). Estimátor je konzistentní když ˆθ n θ 0 pro velká n (pokládá se za nutnou vlastnost). Konzistentní odhad ˆθ n je asymptoticky normální, AN(θ 0, v 2 /n), když pro velká n má ˆθ n θ 0 přibližně normální rozdělení s parametrem θ = (0, v/ n). Odhady (kromě výběrového průměru) značíme v dalším stříškou a index n vynecháváme. 3 Identická inferenční funkce Předností identické inferenční funkce Ψ(x) = x je samozřejmě její jednoduchost. Charakteristikami rozdělení jsou momenty µ k = EΨ k (X) = x k f(x) dx () X 2

3 a centrální momenty ν k = E(X m) k. Pokud integrály () konvergují (momenty existují), populace má střední hodnotu m = µ a rozptyl σ 2 = ν 2. Veličina ν 3 /σ 3 charakterizuje šikmost a ν 4 /σ 4 špičatost rozdělení. Předpokládejme, že střední hodnota a rozptyl populace s rozdělením F existují. Data pak lze charakterizovat konečnou aproximací µ, výběrovým průměrem x = x i (2) n (připomeňme, že se jedná o náhodnou veličinu X = n n X i), a výběrovou středněkvadratickou odchylkou ˆσ, kde ˆσ 2 = (x i x) 2 (3) n je výběrový rozptyl. x a ˆσ 2 jsou konzistentními odhady veličin m a σ 2, a pokud je σ známé, platí podle centrální limitní věty že x je AN(µ, σ 2 /n). Tento hluboký, dobře známý výsledek teorie pravděpodobnosti má nepříjemný důsledek: x se zhusta považuje za typickou pozorovanou hodnotu, což asi není ono v případě šikmých rozdělení s nosičem (0, ). Jednoduchou mírou závislosti (korelace) náhodných veličin X, Y je první smíšený moment, jehož výběrovou podobou je Pearsonův korelační koeficient ˆr XY = (x i x) (y i ȳ) (4) n ˆσ X ˆm Y kde ˆσ X, ˆσ Y jsou příslušné výběrové středněkvadratické odchylky. Nejjednodušší inferenční funkce, Ψ(x) = x, má samozřejmě své mouchy. Generuje jednoduché charakteristiky rozdělení a dat, které nepříliš dobře charakterizují data z šikmých rozdělení a které jsou zcela nepoužitelné pro data z rozdělení s těžkými chvosty, pro které integrály () nekonvergují a výběrové průměry nemají asymptoticky normální rozdělení. Charakteristiky (2), (3) i (4) zásadním způsobem ovlivňují odlehlá data: výběrové charakteristiky nejsou robustní. 4 Skór pro parametr polohy Podle principu maximální věrohodnosti je nejvhodnějším kandidátem pro odhad parametru θ takové ˆθ, které maximalizuje věrohodnost n f(x i; θ), t.j. 3

4 pravděpodobnost současného výskytu x,..., x n v předpokládaném modelu. Protože f(x) a log f(x) jdou paralelně, máme ˆθ = arg max θ log f(x i ; θ). (5) Pro rodinu s nosičem R a hustotou f(x µ) dostáváme maximálně věrohodný (ML) odhad parametru polohy z rovnice kde U µ (x i ˆµ ML ) = 0, (6) U µ (x µ) = log f(x µ) (7) µ je t.zv. skór pro parametr polohy. Podle (6) je odhad ˆµ ML (módu) konzistentní a za nepříliš omezujících podmínek je AN(µ, σ 2 µ/n), kde σ 2 µ = /I µ a kde I µ = EU 2 µ je Fisherova míra informace o parametru µ. Veličina σ 2 µ/n je pro dané n Cramér-Raova dolní mez rozptylu odhadu: ˆµ ML je vydatný (eficientní). Jasná zpráva, jako skalární inferenční funkci můžeme uvažovat funkci S(x µ) = U µ (x µ). V obecném případě rozdělení s nosičem R a hustotou f(x; µ, θ 2,..., θ m ) je S(x; θ) = U µ (x; µ, θ 2,..., θ m ). Několik rozdělení s parametrem polohy uvádíme v Tabulce. Z důvodu, který bude jasný později, značíme hustotu g(y; µ, s) a položíme u = y µ. s Z tabulky je patrné, že identická inferenční funkce je vlastně skór pro parametr polohy normálního rozdělení. Skór je v tomto případě neomezený pro y ±. Skór U µ Gumbelova rozdělení je neomezený pro y, logistické rozdělení má skór omezený a Cauchyho dokonce redescentní, t.j. klesající pro velká y k nule. Tabulka. Několik rozdělení s parametrem polohy. 4

5 Rozdělení g(y; µ, s) U µ (y; µ, s) normální 2πs e 2 u2 u s Gumbelovo s eu e eu s (eu ) e logistické u e u s (+e u ) 2 s e u + 2u Cauchyho πs +u 2 s +u 2 Poslední dvě rozdělení tabulky mají těžké chvosty, ale jejich skóry pro parametr polohy jsou omezené. V povaze modelu tedy je generovat odlehlá data, která si ale sám reguluje ve smyslu že ˆµ ML k nim není příliš citlivý, odhad je robustní: přidáme-li k výběru X n obrovské x n+, ˆµ n+ ˆµ n. Poznamenejme zde že Cauchyho rozdělení sice nemá střední hodnotu, ale má mód y = µ, který lze považovat za alternativní charakteristiku středu (centrální tendence) rozdělení, a právě toto my učiníme pro všechna rozdělení s nosičem R (hustota rozdělení na R musí mít maximum, a když je má vícenásobné, lze ji chápat jako hustotu směsi). Rozdělení, jejichž skór pro parametr polohy je u některého z konců nosiče neomezený, jsou v té části naopak k odlehlým hodnotám v datech citlivá. Zde předpokládáme, že odlehlá data pocházejí z kontaminovaného modelu F c = ( ɛ)f + ɛh, ɛ. kde H je rozdělení s velkým rozptylem. Pro takové situace doporučuje robustní statistika modelu F θ do jisté míry nedbat a použít jako inferenční funkci nějakou spojitou a omezenou psí-funkci ψ(x) s vlastností Eψ = 0, a namísto (6) řešit rovnici ψ(x i ˆµ M ) = 0. (8) Odhad ˆµ M je zobecnění ML odhadu, t.zv. M-odhad. Je konzistentní a asymptoticky normální, AN(µ, σm 2 /n), kde σ 2 M = Eψ2 (x) [Eψ (x)] 2. (9) Poznamenejme, že poměr σml 2 /σ2 M je asymptotická vydatnost M-odhadu parametru polohy. ɛ je vždy menší než (Cramer-Raova mez). Volbou ψ se volí 5

6 určitý kompromis mezi vydatností a robustností odhadu. V případě kontaminovaného normálního rozdělení se jako psí funkce často používá Huberova funkce b pro x > b ψ(x) = x pro x < b b pro x < b, kde b je určeno z požadovaného kompromisu mezi robustností a vydatností. 5 Skórová funkce Parametrický model má obvykle parametr θ s více (2-3) složkami. Derivováním (5) podle θ j dostáváme soustavu m rovnic pro m složek θ, U θj (x i ; ˆθ ML ) = 0, j =,..., m (0) kde U θj (x; θ) = log f(x; θ) θ j () jsou parciální skóry pro jednotlivé složky. Maximálně věrohodné odhady ˆθ ML jsou konzistentní, asymptoticky normální a vydatné. Platí, že (ˆθ MLj θ 0 ) je AN(0, J jj /n), j =,..., m, kde J = {I (θ 0 )} i,j=,...,m a I(θ) = {EU θi U θj (θ)} i,j=,...,m je Fisherova informační matice. Vektorová skórová funkce Ψ(x; θ) = [U θ (x; θ),..., U θm (x; θ)] (2) je inferenční funkcí klasické statistiky a ˆθ ML tím nejlepším odhadem z hlediska minimálníko rozptylu. Má to však několik háčků. a) Namísto výsledku ve tvaru f(x; ˆθ ML ) je často pro další analýzy dobré mít několik čísel charakterizujících data. Parametry různých modelů ale mají 6

7 různou strukturu a různý význam. Ideální by bylo charakterizovat data nějakou typickou hodnotou a poloměrem rozptýlenosti. Nabízejí se ovšem momenty: střední hodnota a středněkvadratická odchylka jako funkce odhadnutého ˆθ ML. Tento postup se však nepoužívá; momenty jsou často vyjádřeny pomocí speciálních funkcí a momenty rozdělení s těžkými chvosty neexistují. b) Skóry pro různá θ j mají různou citlivost k odlehlým hodnotám. Například rovnice (0) pro model s parametry polohy a měřítka s hustotami s f((x µ)/s) mají tvar ( ) xi µ U µ = 0 (3) s n ( x i µ xi µ U µ s s ) =. (4) Inferenční funkce rovnice (4) je tedy Ψ(ξ) = ξu µ (ξ), což je neomezená funkce, takže simultánní odhady (ˆµ ML, ŝ ML ) nejsou robustní ani když je U µ omezená. Robustní statistika navrhuje v tomto případě použít M-odhady (µ M, s M ) určené z rovnic ( ) xi µ ψ = 0 s ( ) xi µ χ = n s kde ψ(x) je omezená funkce a χ(x) = dψ(x)/dx. Rovnice je nutno řešit iteračním postupem s vhodnými počátečními robustními odhady parametrů, obvykle se používá µ 0 = med(x), což je medián (teoreticky bod x, kde P (X < x) = P (X > x) a prakticky prostřední pozorovaný bod), a s 0 = MAD(x) = med{x med(x)} (pro normálně rozdělená data je s =.4785 MAD(x)). Robustní statistické metody (např. [,3]) eliminují vliv odlehlých pozorování. Volba psí funkce však částečně eliminuje informaci, která vedla k uvažovanému modelu, který může mít i jiné parametry než jsou parametry polohy a měřítka. Pro modely s jinými parametry nebo více parametry jsou však robustní postupy známy spšee jen výjimečně. c) Robustní verze korelačního koeficientu (4) je ˆr XY = n ψ X ( xi ˆm X ˆσ X 7 ) ψ Y ( yi ˆm Y ˆσ Y ), (5)

8 kde Ψ X, Ψ Y jsou vhodné psí funkce a odhady nšjaké robustní odhady středních hodnot a rozptylu (medián, MAD). Vektorová skórová funkce klasické statistiky je však je pro tento a jiné podobné účely příliš komplikovaná. V praxi se tedy používají korelační koeficienty (4) a v případě možného výskytu odlehlých hodnot (5) nebo koeficient konstruovaný z uspořádaného výběru (Spearmanův). Žádný z nich nevyužívá předpokládané modely náhodných veličin X a Y. 6 Skalární skórová funkce V této kapitole popíšeme postup, kterým lze zavést skalární inferenční funkci S(x), resp. S(x; θ), která koresponduje s hlavními rysy rozdělení) pro libovolné spojité, parametrické či neparametické rozdělení. Uvidíme, že ji lze zvolit tak, aby pro některá rozdělení byla identická s parciálním skórem pro určitý (nejdůležitější) parametr rozdělení. Nazveme ji skalární skórovou funkcí nebo skalárním skórem. Jejími numerickými charakteristikami budou skórové momenty: zobecněné momenty tvaru M k (θ) = ES k (x; θ) = S k (x; θ)f(x; θ) dx. (6) Namísto řešení soustavy (6) získáme odhad ˆθ SM parametru θ = (θ,..., θ m ) jako řešení rovnic n X S k (x i ; θ) = M k (θ) k =,..., m. (7) Z důvodů popsaných v kap. 4 je přirozené zvolit za skalární skór náhodné veličiny Y s rozdělením G na R s hustotou g funkci S G (y) = g (y) g(y) (8) vyjadřující relativní změnu hustoty. Řešením y rovnice S G (y) = 0, a v parametrickém případě S G (y; θ) = 0), je mód rozdělení. Funkce (8) bohužel není vhodným popisem rozdělení s nosičem X = R (viz třeba exponenciální rozdělení na X = (0, ) s hustotou g(y) = e y, pro které S G (y) nebo rovnoměrné rozdělení, kde S G (x) 0). Hustota f(x) 8

9 nemusí mít na X maximum (může mít třeba supremum v x = 0). Následující konstrukce byla publikována v [3]: X s rozdělením F na X = R považujeme za transformovanou náhodnou veličinu X = η (Y ), kde η : X R je vhodné spojité rostoucí zobrazení a Y = η(x) je prototyp s rozdělením G na R. Rozdělení náhodné veličiny X je F (x) = G(η(x)) a má hustotu f(x) = g(η(x))η (x), (9) kde η (x) = dη(x)/dx je Jacobián zobrazení. Za signifikantní funkci rozdělení F považujeme transformovaný skalární skór prototypu, funkci T F (x) = S G (η(x)). (20) Z (8) a (9) se snadno odvodí, že (20) lze vyjádřit pomocí hustoty f rozdělení F jako T F (x) = ( ) d f(x) dx η (x) f(x). (2) Pro porovnání vlastností různých rozdělení na X je třeba zvolit pro daný nosič jedno určité zobrazení, nejlépe takové, aby (2) byla vyjádřena jednoduchými vzorci pro podstatnou část prakticky užívaných rozdělení. Protože velké množství modelových hustot je vyjádřeno pomocí exponenciálních funkcí, je pro tento účel vhodné Johnsonovo zobrazení [2] { log(x a) pro X = (a, ) η(x) = log x x pro X = (0, ) (22) (jeho zobecnění pro obecný interval je zřejmé). Po dosazení (22) do (2) dostaneme explicitní tvar funkce T F pro různé nosiče X ve tvaru T F (x) = f (x) f(x) X = R (x a) f (x) f(x) X = (a, ) + 2x x( x) f (x) f(x) X = (0, ). T F (x) a její parametrický tvar T F (x; θ) budeme nazývat t-skór. Těžištěm x rozdělení F nazveme řešení rovnice (23) T F (x) = 0. (24) 9

10 Protože podle (20) 0 = T F (x ) = S G (η(x )) = g (y ) g(y ), je těžiště rozdělení F obrazem módu svého prototypu G. Takto jsme tedy vyřešili dodnes diskutovaný problém, totiž co je nejvhodnější centrální charakteristikou (typickou hodnotou) rozdělení na nosiči (0, ), zda střední hodnota (nemusí existovat) či mód (nemusí existovat) nebo medián (matematicky špatně uchopitelná veličina). Odpověď zní těžiště: transformovaný mód prototypu (ten, jak jsme viděli v kap. 4, existuje). Uvažujme nyní parametrická rozdělení F θ na X = R. Může se stát, že x je přímo jedním z parametrů. Je-li µ parametrem polohy prototypu G θ s vektorovým parametrem θ = (µ, θ 2,..., θ m ), parametrem rozdělení F θ (x) = G θ(η(x)) je θ = (τ, θ 2,..., θ m ), kde τ = η (µ) (25) je obrazem parametru polohy prototypu. Označme třídu těchto rozdělení třeba D X. V Tabulce 2 jsou uvedeny hustoty a t-skóry transformovaných rozdělení z třídy D (0, ) s prototypy z Tabulky. τ (25) je transformovaný parametr polohy, který se obvykle považuje za parametr měřítka; my jej však interpretujeme jako parametr polohy rozdělení s nosičem (0, ). /x je Jakobián transformace, c = /s a výraz u z Tabulky se transformuje na v = log y log µ s ( x ) c =. τ Tabulka 2. Transformovaná rozdělení z třídy D (0, ). Rozdělení f(x; τ, c) T F (x; τ, c) lognormální Weibullovo log-logistické log-cauchy c x 2π e 2 log2 v c log v c x ve v c(v ) c v x (v+) 2 c πx +log 2 v c v v+ 2c log v +log 2 v Ve třídě rozdělení D X platí vztah, dokázaný v [3], že totiž U τ (x; θ) = η (τ)t F (x; θ). (26) 0

11 Parciální skór pro τ, definovaný pomocí derivace podle parametru, se nám podařilo rozložit na součin Jakobiánu transformace a členu určeného derivací podle proměnné. Ovšem ne každý prototyp musí mít parametr polohy a většina rozdělení na (0, ) není z D (0 ) (jsou to většinou rozdělení s prototypy, které se neuvažují a neužívají, takže není na první pohled patrné, že je lze chápat jako transformovaná). Rozhodujícím krokem bylo si uvědomit, že τ funguje v (26) nejen jako parametr, ale také jako těžiště rozdělení. Rozdělení, která nejsou v D X, sice nemají parametr, který by byl obrazem módu prototypu, mají však těžiště. V práci [4] je definována funkce S(x; θ) = η (x )T F (x; θ) (27) kterou nazýváme skalárním skórem a považujeme ji za obecnou skalární inferenční funkci. Je utvořena podle vzoru (26), proto lze o ní předpokládat, že bude mít podobný význam jako má (26) pro rozdělení z D X. Funkce sice není tak důkladným popisem rozdělení jako vektorová skórová funkce, ale zachycuje jeho hlavní rysy a je to snadno manipulovatelná funkce, a to je ono. Pro rozdělení, která nejsou ve třídě D X, byla (27) (stejně jako T F ) dosud neznámou funkcí. Veličinu ES 2 lze pak chápat jako Fisherovu informaci o těžišti (pro rozdělení z třídy D X je to podle (26) skutečná Fisherova míra informace I τ (θ) o τ). Jako charakteristiku variability rozdělení F pak definujeme její převrácenou hodnotu, ω 2 = ES 2, (28) které budeme říkat s-variance (ze score variance). Podobně jako x, ω 2 existuje i pro rozdělení s těžkými chvosty (poznamenejme, že podmínka 0 < Fisherova míra informace < je obvyklou podmínkou regularity rozdělení). Skalární skór normálního rozdělení s parametry µ a s je S(x; µ, s) = x µ s 2 a protože ES 2 = s 2, platí ω 2 = s 2. Pro normální rozdělení tedy nic nového. V Tabulce 3, kde B značí beta funkci a Γ gamma funkci, uvádíme kromě t-skóru střední hodnotu, těžiště a s-varianci několika dalších rozdělení s nosičem X = R, která nejsou z D X. Skalární skór rozdělení s nosičem (0, ) je S(x; θ) = T F (x; θ)/x, Paretovo rozdělení má nosič (, ) a skalární skór S(x; θ) = T F (x; θ)/(x ) = c( x /x) s použitím (27) a (22). Pro gamma rozdělení s lineárním t-skórem se střední hodnota a těžiště shodují. Zbývající tři rozdělení jsou rozdělení s těžkým chvostem v + ;

12 jejich skalární skór je omezený (ale všiměte si, že skór Fréchetova rozdělení je neomezený v nule). Pro hodnotu parametru menší nebo rovnou jedné střední hodnoty neexistují, ale jsou nesmyslné velké i v oboru, kde existují, když se Tabulka 3. Těžiště a s-variance některých rozdělení. rozdělení f(x) T F (x) m x ω 2 γ gamma α Γ(α) xα e γx γx α α/γ α/γ α/γ 2 Paretovo c/x c+ c c+ c c+ c+2 x c c c 3 x beta 2.druhu p qx p p p B(p,q) (x+) p+q x+ q q c Fréchetovo ( τ x x )c e ( τ x )c c[ ( ) τ c] x τγ( ) τ τ 2 /c 2 c hodnota parametru blíží k jedné. p(p+q+) q 3 Na obr. jsou znázorněny hustoty a normované skalární skóry S(x)/ES 2 Weibullova (Tabulka 2) a Paretova (Tabulka 3) rozdělení pro několik hodnot parametru c. Hustoty Weibull Hustoty Pareto =0.5 c=0.75 c= Skalar score Weibull Scalar score Pareto c=2.5 c=0.5 c=2.5 c= Obr.. Skalární skóry dvou rozdělení, která nejsou v D (0, ) Weibullovo rozdělení s těžištěm x = 5 a hustotami rychle klesajícími k nule má pro x + neomezené skalární skóry. Paretovo rozdělení je jednoduché rozdělení s těžkým chvostem a tedy omezenými skóry v +. 2

13 7 Použití skalární skórové funkce 7. Zobecněné momentové odhady Skalární skóry jsou často dány jednoduchými vzorci, pasují totiž ke svému rozdělení, takže skórové momenty (6) jsou pro běžná rozdělení elementárními (ale někdy ne zcela jednoduchými) funkcemi parametrů. Odhady parametrů metodou skórových momentů (SM odhady, rovnice (7) kde S je dáno vztahem (27)) jsou M-odhady, takže jsou konzistentní a asymptoticky normální. V jednodušších případech lze skalární skór vyjádřit ve tvaru S(x; x ) kde x = x (θ). Protože M = 0, odhad ˆx SM těžiště x se určí z rovnice S(x i ; ˆx SM) = 0 (29) a má asymptotický rozptyl (9), kde ψ(x; x ) = S(x; x ). Tak např. pro gamma rozdělení (Tabulka 4) je S(x; α, γ) = γ α (γx α) = γ(x/x ), takže z (29) plyne, že x SM = x je AN(α/γ, α/nγ2 ). Pozoruhodné je, že v rovnicích (6) se proměnná vyskytuje pouze uvnitř skalárního skóru. Pokud je tedy S omezená funkce, jsou odhady všech parametrů robustní. V této skutečnosti spočívá hlavní přednost metody skórových momentů oproti metodě maximální věrohodnosti. V případě, že pracujeme s modelem, ve kterém lze předpokládat výskyt odlehlých pozorování, tato pozorování jen málo zkreslí výsledky. Cenou za tuto vlastnost je menší vydatnost nových odhadů. V obr. 2 jsou vyneseny průměry ML a SM odhadů těžiště ˆx na základě 5000 výběrů z Paretova rozdělení s ω =, t.j. (c =.52), v závislosti na velikosti kontaminace d. Rozdělení jsme kontaminovali tak, že k desetině hodnot výběru X 00 byla přičtena konstanta d. Pro představu uvádíme průměrné hodnoty kvantilů uspořádaných výběrů při ω = : q 25 =.23, q 50 =.70, q 75 = 2.9, q 90 = Průměrná standardní odchylka odhadů, σ/ n, byla pro ML a 0.08 pro SM. Vydatnost SM odhadů je tedy zhruba 0.8, ale s rostoucím d roste vychýlení ML odhadů, kdežto ˆx SM se ustálí na určité zvýšené hladině. 3

14 Pareto: x* * ML o SM d Obr. 2. Odhady těžiště pro kontaminované Pareto Pro rozdělení s neomezeným skalárním skórem (je to většina prakticky používaných rozdělení) lze jednoduše použít postupů robustní statistiky, např. zobecnit Huberovu funkci (kap. 3). Buď X = (a, b) R, a < u < v < b a nechť parametrické rozdělění (rodina) F θ má nosič X a na něm neomezený skór S(x; θ). Definujme zobecněnou Huberovou funkci vztahem v pro x > v Ψ F (x) = S(x; θ) pro u < x < v u pro x < u. Robustní odhady parametrů ve shodě s uvažovaným modelem pak obecně dostaneme řešením soustavy (7) ve tvaru n Ψ k F (x i ; θ) M k (θ) = 0 k =,..., m kde M k (θ) je k-tý moment funkce Ψ k F (x; θ). Kromě nejednodušších případů, praktická aplikace metody zatím naráží na obtížný výpočet těchto momentů. 7.2 Charakteristiky rozdělení a datových souborů Skórové momenty M k = ES k představují nové charakteristiky rozdělení. M = 0 a kořen rovnice S(x) = 0 je těžiště ( střed ), ω 2 = /M 2 je charakteristikou variability (ω je poloměr ), M 3 jistým způsobem charakterizuje šikmost a /M 4 špičatost rozdělení. Namísto výběrové střední hodnoty a výběrového rozptylu můžeme za charakteristiky výběru z rozdělení považovat odhady těžiště a s-variance. Položíme-li ˆx = x (ˆθ) a ˆω 2 = ω 2 (ˆθ), zkonstruujeme jejich odhady z (třeba 4

15 maximálně věrohodných) odhadů parametrů. Rodina, do které patří rozdělení populace F, je obvykle známa jen přibližně, rozumné je proto vyzkoušet více modelů. Odhady parametrů různě parametrizovaných rodin se porovnávají jen obtížně, je však snadné porovnávat odhady těžiště a s-variance (a jejich přesnost). Z tohoto hlediska nemusí být odhady parametrů konečným cílem zpracování, ale prostředkem k sestrojení výběrového těžiště a výběrové s-variance. Podobně jako pro rozdělení gamma v kap 7., z rovnice (29) lze nalézt analytické výrazy pro ˆx i pro některá další rozdělení, viz Tabulka 4. Výběrovým těžištěm gamma (a tedy i exponenciálního) rozdělení je aritmetický průměr, lognormálního geometrický průměr a Paretova harmonický průměr. Výběrové těžiště Lomaxova rozdělení (beta 2.druhu pro p = ) je dáno jakýmsi originálním průměrem. V tabulce uvádíme i výběrové s-variance. Pro rozdělení s jedním parametrem je ˆω 2 ovšem funkcí ˆx, pro rozdělení se dvěma parametry se po připojení rovnice pro druhý skórový moment našly analytické vzorce pro gamma a lognormální rozdělení. Obecně je třeba ˆx and ˆω 2 hledat iteračními postupy. Tabulka 4. Výběrové těžiště a výběrová skórová variance některých rozdělení. rozdělení ˆx ˆω 2 gamma x (xi x) 2 lognormální x G = xi n n log 2 x i / x G Paretovo x H = n/ /x i (2 x H )( x H ) 2 Lomaxovo x L = 7.3 Vzdálenosti x i + xi x i + x 2 L (2 x L + ) Z předchozího textu kapitoly je patrné, že za relevantní charakteristiky rozdělení lze považovat skórové momenty a za charakteristiky dat výběrové skórové momenty, obecně konstruované z odhadnutých parametrů, které jsou určeny z rovnic, ve kterých vystupují pozorovaná data X n pouze prostřednictvím skalárního skóru. Je tedy možné namísto náhodných veličin X,..., X n s identickým rozdělením F uvažovat náhodné veličiny S(X ),..., S(X n ), kde S je skalární skór rozdělení F, a namísto pozorovaných dat uvažovat latentní data S(x ; θ),..., S(x n ; θ), (30) 5

16 kde S(x, θ) je skalární skór příslušný uvažovanému modelu F θ 9podobným způsobem se můžeme dívat na data v modelech se skórem pro parametr polohy, a podle (26) i v modelech z třídy D X )). Z tohoto pohledu je přirozená vzdálenost (diference) bodů x, x 2 ve výběrovém prostoru X rozdělení F se skalárním skórem S dána vztahem D(x, x 2 ) = S(x 2 ) S(x ) (3) a latentní vzdálenost ve výběrovém (datovém) prostoru D θ (x, x 2 ) = S(x 2 ; θ) S(x ; θ). Po odhadnutí θ lze diferenci Dˆθ(ˆx, x ) využít ke konstrukci intervalů spolehlivosti pro odhad těžiště, viz [6]. 7.4 Informace a neurčitost Domníváme se, že veličina ES 2 (Fisherova informace) představuje informaci rozdělení. ES 2 je pro štíhlá rozdělení velká a malá pro placatá, což opravňuje volbu s-variance jako ω 2 = /ES 2. Funkce neurčitosti náhodné veličiny X je definována v [7] jako U(x) = S2 (x) (ES 2 ) 2. (32) Střední neurčitost rozdělení je pak EU = ω 2. Na obr. 3 jsou znázorněny funkce neurčitosti tří rozdělení s nosičem (0, ). U(x) x Obr. 3. Funkce neurčitosti rozdělení gamma (plná čára), lognormalného (čárkovaná) and log-logistického (beta 2. druhu s p = q =, tečkovaná). 6

17 7.5 Korelace a regrese Máme-li data typu (30) pro dvě náhodné veličiny, můžeme je použít pro studium jejich vzájemného vztahu. Skórový kovarianční koeficient náhodných veličin X, Y s rozděleními F X, F Y a skalárními skóry S X, S Y definujeme jako Cov S (X, Y ) = ES X S Y. Skórový korelační koeficient je pak a jeho výběrový protějšek je R(X, Y ) = Cov S (X, Y )/ M 2 (X)M 2 (Y ). (33) ˆR XY = n n S X(x i, ˆθ X )S Y (x i ; ˆθ Y ) S2 X (x i, ˆθ X ) n S2 Y (y i, ˆθ, (34) Y ) kde ˆθ X a ˆθ Y jsou odhady parametrů (marginálních) rozdělení X a Y. V horní části obr. 4 je znázorněna závislost průměrného Pearsonova, Spearmanova a skórového korelačního koeficientu z 5000 výběrů délky n = 00 náhodných veličin X a Y, kde X a Z jsou generovány z Paretova roz- Korel. koeficient, Pareto * ML o SM x Spearman ω 2 Chyba odhadu ω 2 Obr. 4. Korelační koeficienty pro kontaminované výběry z Paretova rozdělení 7

18 dělení a Y = 0.32X Z, na rostoucí variabilitě rozdělení popsané veličinou ω. Teoretický korelační koeficient je r XY = 0.5. Z horního obrázku je patrné, že ˆR XY roste (v tomto případě) podobně jako Spearmanův koeficient. Pearsonův ˆr XY sice vypadá na horním obrázku méně ovlivněn generovanými velkými hodnotami při rostoucím ω, ale ze spodního obrázku, kde je vynesena průměrná středněkvadratická odchylka odhadu, je jasné, že v jednotlivých případech ˆr XY poskakuje zcela libovolně. Předpokládejme teď, že náhodnou veličinu Y lze vyjádřit jako Y = α 0 + α X + ε, kde ε je náhodná proměnná s rozdělením F ε. Pro odhad koeficientů α 0 a α požadujme minimální Fisherovu informaci reziduí, t.j. n Sε 2 (ε i ) = min., (35) Zde ε i = y i (α 0 + α x i ) jsou rezidua a S ε je skalární skór rozdělení F ε. Ve dvojicích (x i, y i ) vyznačených kroužky na obr. 5 je x i realizací rovnoměrně rozdělené X a y i = x i + (ε ε ), kde ε je generována jako náhodná veličina s nesymetrickým Lomaxovým rozdělením s těžištěm ε. Předpokládáme-li tento model reziduí, určíme během iteračního procesu jeho parametry a výsledkem skórové regrese je přímka, která se od přímky proložené standardní metodou nejmenších čtverců i od přímky proložené robustní metodou s obvyklým předpokladem symetrie rozdělení chyb (kód robustfit v Matlabu) docela výrazně liší. Přímka proložená podle (35) bere nesymetrii v úvahu. Lineární regrese... klasická Huberova beta prime Obr. 5. Porovnání tří typů lineární regrese 8

19 Literatura [] Antoch J., Vorlíčková D. (992). Vybrané metody statistické analýzy dat. Academia. [2] Casella, G., Berger, R.L. (2002). Statistical inference. Duxbury. [3] Fabián, Z. (200). Induced cores and their use in robust parametric estimation. Comm. Statist. Theory Methods 30, [4] Fabián, Z. (2007). Estimation of simple characteristics of samples from skewed and heavy-tailed distribution. In Skiadas, C. (ed.) Recent Advances in Stochastic Modeling and Data Analysis, Singapore, World Scientific, [5] Fabián, Z. (2009). The t-information and its use in multivariate problems and time series analysis. J. Statist. Planning and Inference 39, [6] Fabián, Z. (2009). Confidence intervals for a new characteristic of central tendency of distributions. Comm. Statist. Theory Methods 38, [7] Fabián, Z. (2009). O rozděleních s těžkými chvosty. Informační bulletin ČSS 20, 3. [8] Fabián, Z. (200). Score moment estimators. Proc. of COMPSTAT 200. [9] Fabián, Z. (200). Characteristics of data from skewed distributions. In V. Snášel, V. Voženílek (eds.): Artificial inteligence in GIS, -22. [0] Fabián, Z. (20). A new statistical tool: Scalar score function. Computer Technology and Application 2, []. Huber, P. J., Ronchetti, E. M. (2003). Robust Statistic. The Approach Based on Influence Functions, Wiley, New York. [2] Johnson, N.L. (949). Systems of frequency curves generated by methods of translations. Biometrika 36, [3] Jurečková, J. (200). Robustní statistické metody. Nakl. Karolinum. [4] Stehlík, M., Potocký, R., Waldl, H., Fabián, Z. (200). On the favorable estimation for fitting heavy tailed data. Comput. Stat. 25,

MATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci

MATEMATICKÁ STATISTIKA.   Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci MATEMATICKÁ STATISTIKA Dana Černá http://www.fp.tul.cz/kmd/ Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci Matematická statistika Matematická statistika se zabývá matematickým

Více

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457. 0 cvičení z PST 5 prosince 208 0 (intervalový odhad pro rozptyl) Soubor (70, 84, 89, 70, 74, 70) je náhodným výběrem z normálního rozdělení N(µ, σ 2 ) Určete oboustranný symetrický 95% interval spolehlivosti

Více

Charakterizace rozdělení

Charakterizace rozdělení Charakterizace rozdělení Momenty f(x) f(x) f(x) μ >μ 1 σ 1 σ >σ 1 g 1 g σ μ 1 μ x μ x x N K MK = x f( x) dx 1 M K = x N CK = ( x M ) f( x) dx ( xi M 1 C = 1 K 1) N i= 1 K i K N i= 1 K μ = E ( X ) = xf

Více

Základy teorie odhadu parametrů bodový odhad

Základy teorie odhadu parametrů bodový odhad Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Odhady parametrů Úkolem výběrového šetření je podat informaci o neznámé hodnotě charakteristiky základního souboru

Více

Odhad parametrů N(µ, σ 2 )

Odhad parametrů N(µ, σ 2 ) Odhad parametrů N(µ, σ 2 ) Mějme statistický soubor x 1, x 2,, x n modelovaný jako realizaci náhodného výběru z normálního rozdělení N(µ, σ 2 ) s neznámými parametry µ a σ. Jaký je maximální věrohodný

Více

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Prostá regresní a korelační analýza 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Problematika závislosti V podstatě lze rozlišovat mezi závislostí nepodstatnou, čili náhodnou

Více

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Jan Kracík

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Jan Kracík Pravděpodobnost a statistika, Biostatistika pro kombinované studium Letní semestr 2017/2018 Tutoriál č. 2:, náhodný vektor Jan Kracík jan.kracik@vsb.cz náhodná veličina rozdělení pravděpodobnosti náhodné

Více

Výběrové charakteristiky a jejich rozdělení

Výběrové charakteristiky a jejich rozdělení Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Statistické šetření úplné (vyčerpávající) neúplné (výběrové) U výběrového šetření se snažíme o to, aby výběrový

Více

Úvod do teorie odhadu. Ing. Michael Rost, Ph.D.

Úvod do teorie odhadu. Ing. Michael Rost, Ph.D. Úvod do teorie odhadu Ing. Michael Rost, Ph.D. Náhodný výběr Náhodným výběrem ze základního souboru populace, která je popsána prostřednictvím hustoty pravděpodobnosti f(x, θ), budeme nazývat posloupnost

Více

Odhad parametrů N(µ, σ 2 )

Odhad parametrů N(µ, σ 2 ) Odhad parametrů N(µ, σ 2 ) Mějme statistický soubor x 1, x 2,, x n modelovaný jako realizaci náhodného výběru z normálního rozdělení N(µ, σ 2 ) s neznámými parametry µ a σ. Jaký je maximální věrohodný

Více

Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Výsledky některých náhodných pokusů jsou přímo vyjádřeny číselně (např. při hodu kostkou padne 6). Náhodnou veličinou

Více

Charakteristika datového souboru

Charakteristika datového souboru Zápočtová práce z předmětu Statistika Vypracoval: 10. 11. 2014 Charakteristika datového souboru Zadání: Při kontrole dodržování hygienických norem v kuchyni se prováděl odběr vzduchu a pomocí filtru Pallflex

Více

MATEMATICKÁ STATISTIKA - XP01MST

MATEMATICKÁ STATISTIKA - XP01MST MATEMATICKÁ STATISTIKA - XP01MST 1. Úvod. Matematická statistika (statistics) se zabývá vyšetřováním zákonitostí, které v sobě obsahují prvek náhody. Zpracováním hodnot, které jsou výstupem sledovaného

Více

P13: Statistické postupy vyhodnocování únavových zkoušek, aplikace normálního, Weibullova rozdělení, apod.

P13: Statistické postupy vyhodnocování únavových zkoušek, aplikace normálního, Weibullova rozdělení, apod. P13: Statistické postupy vyhodnocování únavových zkoušek, aplikace normálního, Weibullova rozdělení, apod. Matematický přístup k výsledkům únavových zkoušek Náhodnost výsledků únavových zkoušek. Únavové

Více

KGG/STG Statistika pro geografy

KGG/STG Statistika pro geografy KGG/STG Statistika pro geografy 5. Odhady parametrů základního souboru Mgr. David Fiedor 16. března 2015 Vztahy mezi výběrovým a základním souborem Osnova 1 Úvod, pojmy Vztahy mezi výběrovým a základním

Více

veličin, deskriptivní statistika Ing. Michael Rost, Ph.D.

veličin, deskriptivní statistika Ing. Michael Rost, Ph.D. Vybraná rozdělení spojitých náhodných veličin, deskriptivní statistika Ing. Michael Rost, Ph.D. Třídění Základním zpracováním dat je jejich třídění. Jde o uspořádání získaných dat, kde volba třídícího

Více

Odhady Parametrů Lineární Regrese

Odhady Parametrů Lineární Regrese Odhady Parametrů Lineární Regrese Mgr. Rudolf B. Blažek, Ph.D. prof. RNDr. Roman Kotecký, DrSc. Katedra počítačových systémů Katedra teoretické informatiky Fakulta informačních technologií České vysoké

Více

Pravděpodobnost a aplikovaná statistika

Pravděpodobnost a aplikovaná statistika Pravděpodobnost a aplikovaná statistika MGR. JANA SEKNIČKOVÁ, PH.D. 2. KAPITOLA PODMÍNĚNÁ PRAVDĚPODOBNOST 3. KAPITOLA NÁHODNÁ VELIČINA 9.11.2017 Opakování Uveďte příklad aplikace geometrické definice pravděpodobnosti

Více

4. Aplikace matematiky v ekonomii

4. Aplikace matematiky v ekonomii 4. Aplikace matematiky v ekonomii 1 Lineární algebra Soustavy 1) Na základě statistických údajů se zjistilo, že závislost množství statku z poptávaného v průběhu jednoho týdne lze popsat vztahem q d =

Více

3 Bodové odhady a jejich vlastnosti

3 Bodové odhady a jejich vlastnosti 3 Bodové odhady a jejich vlastnosti 3.1 Statistika (Skripta str. 77) Výběr pořizujeme proto, abychom se (více) dověděli o souboru, ze kterého jsme výběr pořídili. Zde se soustředíme na situaci, kdy známe

Více

AVDAT Klasický lineární model, metoda nejmenších

AVDAT Klasický lineární model, metoda nejmenších AVDAT Klasický lineární model, metoda nejmenších čtverců Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Lineární model y i = β 0 + β 1 x i1 + + β k x ik + ε i (1) kde y i

Více

I. D i s k r é t n í r o z d ě l e n í

I. D i s k r é t n í r o z d ě l e n í 6. T y p y r o z d ě l e n í Poznámka: V odst. 5.5-5.10 jsme uvedli příklady náhodných veličin a jejich distribučních funkcí. Poznali jsme, že se od sebe liší svým typem. V příkladech 5.5, 5.6 a 5.8 jsme

Více

6. ZÁKLADY STATIST. ODHADOVÁNÍ. Θ parametrický prostor. Dva základní způsoby odhadu neznámého vektoru parametrů bodový a intervalový.

6. ZÁKLADY STATIST. ODHADOVÁNÍ. Θ parametrický prostor. Dva základní způsoby odhadu neznámého vektoru parametrů bodový a intervalový. 6. ZÁKLADY STATIST. ODHADOVÁNÍ X={X 1, X 2,..., X n } výběr z rozdělení s F (x, θ), θ={θ 1,..., θ r } - vektor reálných neznámých param. θ Θ R k. Θ parametrický prostor. Dva základní způsoby odhadu neznámého

Více

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA PRAVDĚPODOBNOST A STATISTIKA Náhodný výběr Nechť X je náhodná proměnná, která má distribuční funkci F(x, ϑ). Předpokládejme, že známe tvar distribuční funkce (víme jaké má rozdělení) a neznáme parametr

Více

p(x) = P (X = x), x R,

p(x) = P (X = x), x R, 6. T y p y r o z d ě l e n í Poznámka: V odst. 5.5-5.10 jsme uvedli příklady náhodných veličin a jejich distribučních funkcí. Poznali jsme, že se od sebe liší svým typem. V příkladech 5.5, 5.6 a 5.8 jsme

Více

z Matematické statistiky 1 1 Konvergence posloupnosti náhodných veličin

z Matematické statistiky 1 1 Konvergence posloupnosti náhodných veličin Příklady k procvičení z Matematické statistiky Poslední úprava. listopadu 207. Konvergence posloupnosti náhodných veličin. Necht X, X 2... jsou nezávislé veličiny s rovnoměrným rozdělením na [0, ]. Definujme

Více

Základy teorie pravděpodobnosti

Základy teorie pravděpodobnosti Základy teorie pravděpodobnosti Náhodná veličina Roman Biskup (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at)email.cz 12. února 2012 Statistika by Birom Základy teorie

Více

Přijímací zkouška na navazující magisterské studium 2014

Přijímací zkouška na navazující magisterské studium 2014 Přijímací zkouška na navazující magisterské studium 24 Příklad (25 bodů) Spočtěte Studijní program: Studijní obor: Matematika Finanční a pojistná matematika Varianta A M x 2 dxdy, kde M = {(x, y) R 2 ;

Více

8.1. Definice: Normální (Gaussovo) rozdělení N(µ, σ 2 ) s parametry µ a. ( ) ϕ(x) = 1. označovat písmenem U. Její hustota je pak.

8.1. Definice: Normální (Gaussovo) rozdělení N(µ, σ 2 ) s parametry µ a. ( ) ϕ(x) = 1. označovat písmenem U. Její hustota je pak. 8. Normální rozdělení 8.. Definice: Normální (Gaussovo) rozdělení N(µ, ) s parametry µ a > 0 je rozdělení určené hustotou ( ) f(x) = (x µ) e, x (, ). Rozdělení N(0; ) s parametry µ = 0 a = se nazývá normované

Více

Matematika III 10. týden Číselné charakteristiky střední hodnota, rozptyl, kovariance, korelace

Matematika III 10. týden Číselné charakteristiky střední hodnota, rozptyl, kovariance, korelace Matematika III 10. týden Číselné charakteristiky střední hodnota, rozptyl, kovariance, korelace Jan Slovák Masarykova univerzita Fakulta informatiky 28. 11 2. 12. 2016 Obsah přednášky 1 Literatura 2 Střední

Více

M - ODHADY M - ODHADY

M - ODHADY M - ODHADY M - ODHADY Jan Voříšek 26. 10. 2009 Obsah Obecný případ Odhady polohy Odhady měřítka Optimally bounding the gross-error sensitivity Change-of-variance function Obecný případ Úvod Názem M-odhad je odvozen

Více

STANOVENÍ SPOLEHLIVOSTI GEOTECHNICKÝCH KONSTRUKCÍ. J. Pruška, T. Parák

STANOVENÍ SPOLEHLIVOSTI GEOTECHNICKÝCH KONSTRUKCÍ. J. Pruška, T. Parák STANOVENÍ SPOLEHLIVOSTI GEOTECHNICKÝCH KONSTRUKCÍ J. Pruška, T. Parák OBSAH: 1. Co je to spolehlivost, pravděpodobnost poruchy, riziko. 2. Deterministický a pravděpodobnostní přístup k řešení problémů.

Více

Pravděpodobnost a matematická statistika

Pravděpodobnost a matematická statistika Pravděpodobnost a matematická statistika Příklady k přijímacím zkouškám na doktorské studium 1 Popisná statistika Určete aritmetický průměr dat, zadaných tabulkou hodnot x i a četností n i x i 1 2 3 n

Více

Pojmy z kombinatoriky, pravděpodobnosti, znalosti z kapitoly náhodná veličina, znalost parciálních derivací, dvojného integrálu.

Pojmy z kombinatoriky, pravděpodobnosti, znalosti z kapitoly náhodná veličina, znalost parciálních derivací, dvojného integrálu. 6. NÁHODNÝ VEKTOR Průvodce studiem V počtu pravděpodobnosti i v matematické statistice se setkáváme nejen s náhodnými veličinami, jejichž hodnotami jsou reálná čísla, ale i s takovými, jejichž hodnotami

Více

Aplikovaná numerická matematika

Aplikovaná numerická matematika Aplikovaná numerická matematika 6. Metoda nejmenších čtverců doc. Ing. Róbert Lórencz, CSc. České vysoké učení technické v Praze Fakulta informačních technologií Katedra počítačových systémů Příprava studijních

Více

Apriorní rozdělení. Jan Kracík.

Apriorní rozdělení. Jan Kracík. Apriorní rozdělení Jan Kracík jan.kracik@vsb.cz Apriorní rozdělení Apriorní rozdělení (spolu s modelem) reprezentuje informaci o neznámém parametru θ, která je dostupná předem, tj. bez informace z dat.

Více

M-estimators. Oct 19th Charles University in Prague, Faculty of Mathematics and Physics. M-estimators. Základní pojmy - připomenutí.

M-estimators. Oct 19th Charles University in Prague, Faculty of Mathematics and Physics. M-estimators. Základní pojmy - připomenutí. Další Charles University in Prague, Faculty of Mathematics and Physics Oct 19th 2009 Influence Function Pracujeme s parametrickým modelem {F θ } θ Θ, kde Θ R je otevřená konvexní množina. Definice Influence

Více

Téma 22. Ondřej Nývlt

Téma 22. Ondřej Nývlt Téma 22 Ondřej Nývlt nyvlto1@fel.cvut.cz Náhodná veličina a náhodný vektor. Distribuční funkce, hustota a pravděpodobnostní funkce náhodné veličiny. Střední hodnota a rozptyl náhodné veličiny. Sdružené

Více

ANALÝZA DAT V R 3. POPISNÉ STATISTIKY, NÁHODNÁ VELIČINA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK

ANALÝZA DAT V R 3. POPISNÉ STATISTIKY, NÁHODNÁ VELIČINA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK ANALÝZA DAT V R 3. POPISNÉ STATISTIKY, NÁHODNÁ VELIČINA Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK www.biostatisticka.cz POPISNÉ STATISTIKY - OPAKOVÁNÍ jedna kvalitativní

Více

X = x, y = h(x) Y = y. hodnotám x a jedné hodnotě y. Dostaneme tabulku hodnot pravděpodobnostní

X = x, y = h(x) Y = y. hodnotám x a jedné hodnotě y. Dostaneme tabulku hodnot pravděpodobnostní ..08 8cv7.tex 7. cvičení - transformace náhodné veličiny Definice pojmů a základní vzorce Je-li X náhodná veličina a h : R R je měřitelná funkce, pak náhodnou veličinu Y, která je definovaná vztahem X

Více

Pravděpodobnost a statistika

Pravděpodobnost a statistika Pravděpodobnost a statistika Bodové odhady a intervaly spolehlivosti Vilém Vychodil KMI/PRAS, Přednáška 10 Vytvořeno v rámci projektu 963/011 FRVŠ V. Vychodil (KMI/PRAS, Přednáška 10) Bodové odhady a intervaly

Více

Interpolace Uvažujme třídu funkcí jedné proměnné ψ(x; a 0,..., a n ), kde a 0,..., a n jsou parametry, které popisují jednotlivé funkce této třídy. Mějme dány body x 0, x 1,..., x n, x i x k, i, k = 0,

Více

5. B o d o v é o d h a d y p a r a m e t r ů

5. B o d o v é o d h a d y p a r a m e t r ů 5. B o d o v é o d h a d y p a r a m e t r ů Na základě hodnot náhodného výběru z rozdělení určitého typu odhadujeme parametry tohoto rozdělení, tak aby co nejlépe odpovídaly hodnotám výběru. Formulujme

Více

1. Číselné posloupnosti - Definice posloupnosti, základní vlastnosti, operace s posloupnostmi, limita posloupnosti, vlastnosti limit posloupností,

1. Číselné posloupnosti - Definice posloupnosti, základní vlastnosti, operace s posloupnostmi, limita posloupnosti, vlastnosti limit posloupností, KMA/SZZS1 Matematika 1. Číselné posloupnosti - Definice posloupnosti, základní vlastnosti, operace s posloupnostmi, limita posloupnosti, vlastnosti limit posloupností, operace s limitami. 2. Limita funkce

Více

9. T r a n s f o r m a c e n á h o d n é v e l i č i n y

9. T r a n s f o r m a c e n á h o d n é v e l i č i n y 9. T r a n s f o r m a c e n á h o d n é v e l i č i n y Při popisu procesů zpracováváme vstupní údaj, hodnotu x tak, že výstupní hodnota y závisí nějakým způsobem na vstupní, je její funkcí y = f(x).

Více

Statistika. Regresní a korelační analýza Úvod do problému. Roman Biskup

Statistika. Regresní a korelační analýza Úvod do problému. Roman Biskup Statistika Regresní a korelační analýza Úvod do problému Roman Biskup Jihočeská univerzita v Českých Budějovicích Ekonomická fakulta (Zemědělská fakulta) Katedra aplikované matematiky a informatiky 2008/2009

Více

Střední hodnota a rozptyl náhodné. kvantilu. Ing. Michael Rost, Ph.D.

Střední hodnota a rozptyl náhodné. kvantilu. Ing. Michael Rost, Ph.D. Střední hodnota a rozptyl náhodné veličiny, vybraná rozdělení diskrétních a spojitých náhodných veličin, pojem kvantilu Ing. Michael Rost, Ph.D. Príklad Předpokládejme že máme náhodnou veličinu X která

Více

2 Zpracování naměřených dat. 2.1 Gaussův zákon chyb. 2.2 Náhodná veličina a její rozdělení

2 Zpracování naměřených dat. 2.1 Gaussův zákon chyb. 2.2 Náhodná veličina a její rozdělení 2 Zpracování naměřených dat Důležitou součástí každé experimentální práce je statistické zpracování naměřených dat. V této krátké kapitole se budeme věnovat určení intervalů spolehlivosti získaných výsledků

Více

Interpolace, ortogonální polynomy, Gaussova kvadratura

Interpolace, ortogonální polynomy, Gaussova kvadratura Interpolace, ortogonální polynomy, Gaussova kvadratura Petr Tichý 20. listopadu 2013 1 Úloha Lagrangeovy interpolace Dán omezený uzavřený interval [a, b] a v něm n + 1 různých bodů x 0, x 1,..., x n. Nechť

Více

Deskriptivní statistické metody II. Míry polohy Míry variability

Deskriptivní statistické metody II. Míry polohy Míry variability Deskriptivní statistické metody II. Míry polohy Míry variability Jana Vránová, 3.lékařská fakulta UK, Praha Náhodný výběr všechny prvky výběru {x i }, i = 1, 2,, n, se chápou jako náhodné veličiny, které

Více

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz. Pravděpodobnost a statistika, Biostatistika pro kombinované studium Letní semestr 2015/2016 Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz Jan Kracík jan.kracik@vsb.cz Obsah: Výběrová rozdělení

Více

1. Náhodný vektor (X, Y ) má diskrétní rozdělení s pravděpodobnostní funkcí p, kde. p(x, y) = a(x + y + 1), x, y {0, 1, 2}.

1. Náhodný vektor (X, Y ) má diskrétní rozdělení s pravděpodobnostní funkcí p, kde. p(x, y) = a(x + y + 1), x, y {0, 1, 2}. VIII. Náhodný vektor. Náhodný vektor (X, Y má diskrétní rozdělení s pravděpodobnostní funkcí p, kde p(x, y a(x + y +, x, y {,, }. a Určete číslo a a napište tabulku pravděpodobnostní funkce p. Řešení:

Více

Statistika a spolehlivost v lékařství Charakteristiky spolehlivosti prvků I

Statistika a spolehlivost v lékařství Charakteristiky spolehlivosti prvků I Statistika a spolehlivost v lékařství Charakteristiky spolehlivosti prvků I Příklad Tahová síla papíru používaného pro výrobu potravinových sáčků je důležitá charakteristika kvality. Je známo, že síla

Více

KGG/STG Statistika pro geografy

KGG/STG Statistika pro geografy KGG/STG Statistika pro geografy 4. Teoretická rozdělení Mgr. David Fiedor 9. března 2015 Osnova Úvod 1 Úvod 2 3 4 5 Vybraná rozdělení náhodných proměnných normální rozdělení normované normální rozdělení

Více

Téma 2: Pravděpodobnostní vyjádření náhodných veličin

Téma 2: Pravděpodobnostní vyjádření náhodných veličin 0.05 0.0 0.05 0.0 0.005 Nominální napětí v pásnici Std Mean 40 60 80 00 0 40 60 Std Téma : Pravděpodobnostní vyjádření náhodných veličin Přednáška z předmětu: Spolehlivost a bezpečnost staveb 4. ročník

Více

ODHADY NÁVRATOVÝCH HODNOT

ODHADY NÁVRATOVÝCH HODNOT ODHADY NÁVRATOVÝCH HODNOT KLIMATOLOGICKÝCH DAT Katedra aplikované matematiky Fakulta přírodovědně-humanitní a pedagogická Technická univerzita v Liberci Robust 2018 ÚVOD Velká pozornost v analýze extrémních

Více

Bakalářské studium na MFF UK v Praze Obecná matematika Zaměření: Stochastika. 1 Úvodní poznámky. Verze: 13. června 2013

Bakalářské studium na MFF UK v Praze Obecná matematika Zaměření: Stochastika. 1 Úvodní poznámky. Verze: 13. června 2013 Bakalářské studium na MFF UK v Praze Obecná matematika Zaměření: Stochastika Podrobnější rozpis okruhů otázek pro třetí část SZZ Verze: 13. června 2013 1 Úvodní poznámky 6 Smyslem SZZ by nemělo být toliko

Více

7. Rozdělení pravděpodobnosti ve statistice

7. Rozdělení pravděpodobnosti ve statistice 7. Rozdělení pravděpodobnosti ve statistice Statistika nuda je, má však cenné údaje, neklesejte na mysli, ona nám to vyčíslí Jednou z úloh statistiky je odhad (výpočet) hodnot statistického znaku x i,

Více

pravděpodobnosti, popisné statistiky

pravděpodobnosti, popisné statistiky 8. Modelová rozdělení pravděpodobnosti, popisné statistiky Rozdělení pravděpodobnosti Normální rozdělení jako statistický model Přehled a aplikace modelových rozdělení Popisné statistiky Anotace Klasickým

Více

jevu, čas vyjmutí ze sledování byl T j, T j < X j a T j je náhodná veličina.

jevu, čas vyjmutí ze sledování byl T j, T j < X j a T j je náhodná veličina. Parametrické metody odhadů z neúplných výběrů 2 1 Metoda maximální věrohodnosti pro cenzorované výběry 11 Náhodné cenzorování Při sledování složitých reálných systémů často nemáme možnost uspořádat experiment

Více

Úvodem Dříve les než stromy 3 Operace s maticemi

Úvodem Dříve les než stromy 3 Operace s maticemi Obsah 1 Úvodem 13 2 Dříve les než stromy 17 2.1 Nejednoznačnost terminologie 17 2.2 Volba metody analýzy dat 23 2.3 Přehled vybraných vícerozměrných metod 25 2.3.1 Metoda hlavních komponent 26 2.3.2 Faktorová

Více

Normální rozložení a odvozená rozložení

Normální rozložení a odvozená rozložení I Normální rozložení a odvozená rozložení I.I Normální rozložení Data, se kterými pracujeme, pocházejí z různých rozložení. Mohou být vychýlena (doleva popř. doprava, nebo v nich není na první pohled vidět

Více

y = 0, ,19716x.

y = 0, ,19716x. Grafické ověřování a testování vybraných modelů 1 Grafické ověřování empirického rozdělení Při grafické analýze empirického rozdělení vycházíme z empirické distribuční funkce F n (x) příslušné k náhodnému

Více

Praktická statistika. Petr Ponížil Eva Kutálková

Praktická statistika. Petr Ponížil Eva Kutálková Praktická statistika Petr Ponížil Eva Kutálková Zápis výsledků měření Předpokládejme, že známe hodnotu napětí U = 238,9 V i její chybu 3,3 V. Hodnotu veličiny zapíšeme na tolik míst, aby až poslední bylo

Více

Oct 19th Charles University in Prague, Faculty of Mathematics and Physics. Multidimensional estimators. Základní pojmy.

Oct 19th Charles University in Prague, Faculty of Mathematics and Physics. Multidimensional estimators. Základní pojmy. Charles University in Prague, Faculty of Mathematics and Physics Oct 19th 2009 Influence Function Stejné jako pro jednorozměrný případ až na Θ R p. Influence Function IF (x; T, F) = lim h 0 T [(1 h)f +

Více

MATEMATICKÁ STATISTIKA

MATEMATICKÁ STATISTIKA MATEMATICKÁ STATISTIKA 1. Úvod. Matematická statistika se zabývá vyšetřováním zákonitostí, které v sobě obsahují prvek náhody. Zpracováním hodnot, které jsou výstupem sledovaného procesu, se snažíme popsat

Více

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu Testování hypotéz o parametrech regresního modelu Ekonometrie Jiří Neubauer Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra UO

Více

Chyby měření 210DPSM

Chyby měření 210DPSM Chyby měření 210DPSM Jan Zatloukal Stručný přehled Zdroje a druhy chyb Systematické chyby měření Náhodné chyby měření Spojité a diskrétní náhodné veličiny Normální rozdělení a jeho vlastnosti Odhad parametrů

Více

Mnohorozměrná statistická data

Mnohorozměrná statistická data Mnohorozměrná statistická data Ekonometrie Jiří Neubauer Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra ekonometrie UO Brno) Mnohorozměrná

Více

Regresní analýza 1. Regresní analýza

Regresní analýza 1. Regresní analýza Regresní analýza 1 1 Regresní funkce Regresní analýza Důležitou statistickou úlohou je hledání a zkoumání závislostí proměnných, jejichž hodnoty získáme při realizaci experimentů Vzhledem k jejich náhodnému

Více

VLIV STATISTICKÉ ZÁVISLOSTI NÁHODNÝCH VELIČIN NA SPOLEHLIVOST KONSTRUKCE

VLIV STATISTICKÉ ZÁVISLOSTI NÁHODNÝCH VELIČIN NA SPOLEHLIVOST KONSTRUKCE IV. ročník celostátní konference SPOLEHLIVOST KONSTRUKCÍ Téma: Posudek - poruchy - havárie 25 23.až 24.4.2003 Dům techniky Ostrava ISBN 80-02-055-7 VLIV STATISTICKÉ ZÁVISLOSTI NÁHODNÝCH VELIČIN NA SPOLEHLIVOST

Více

Definice 7.1 Nechť je dán pravděpodobnostní prostor (Ω, A, P). Zobrazení. nebo ekvivalentně

Definice 7.1 Nechť je dán pravděpodobnostní prostor (Ω, A, P). Zobrazení. nebo ekvivalentně 7 Náhodný vektor Nezávislost náhodných veličin Definice 7 Nechť je dán pravděpodobnostní prostor (Ω, A, P) Zobrazení X : Ω R n, které je A-měřitelné, se nazývá (n-rozměrný) náhodný vektor Měřitelností

Více

PSY117/454 Statistická analýza dat v psychologii přednáška 8. Statistické usuzování, odhady

PSY117/454 Statistická analýza dat v psychologii přednáška 8. Statistické usuzování, odhady PSY117/454 Statistická analýza dat v psychologii přednáška 8 Statistické usuzování, odhady Výběr od deskripce k indukci Deskripce dat, odhad parametrů Usuzování = inference = indukce Počítá se s náhodným

Více

Normální (Gaussovo) rozdělení

Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení popisuje vlastnosti náhodné spojité veličiny, která vzniká složením různých náhodných vlivů, které jsou navzájem nezávislé, kterých je velký

Více

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Testy hypotéz na základě více než 2 výběrů 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Testy hypotéz na základě více než 2 výběrů Na analýzu rozptylu lze pohlížet v podstatě

Více

8. Normální rozdělení

8. Normální rozdělení 8. Normální rozdělení 8.. Definice: Normální (Gaussovo) rozdělení N(µ, 2 ) s parametry µ a > 0 je rozdělení určené hustotou ( ) f(x) = (x µ) 2 e 2 2, x (, ). Rozdělení N(0; ) s parametry µ = 0 a = se nazývá

Více

PRAVDĚPODOBNOST A STATISTIKA. Bayesovské odhady

PRAVDĚPODOBNOST A STATISTIKA. Bayesovské odhady PRAVDĚPODOBNOST A STATISTIKA Bayesovské odhady Bayesovské odhady - úvod Klasický bayesovský přístup: Klasický přístup je založen na opakování pokusech sledujeme rekvenci nastoupení zvolených jevů Bayesovský

Více

Statistika pro geografy

Statistika pro geografy Statistika pro geografy 2. Popisná statistika Mgr. David Fiedor 23. února 2015 Osnova 1 2 3 Pojmy - Bodové rozdělení četností Absolutní četnost Absolutní četností hodnoty x j znaku x rozumíme počet statistických

Více

a způsoby jejího popisu Ing. Michael Rost, Ph.D.

a způsoby jejího popisu Ing. Michael Rost, Ph.D. Podmíněná pravděpodobnost, náhodná veličina a způsoby jejího popisu Ing. Michael Rost, Ph.D. Podmíněná pravděpodobnost Pokud je jev A vázán na uskutečnění jevu B, pak tento jev nazýváme jevem podmíněným

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 010 1.týden (0.09.-4.09. ) Data, typy dat, variabilita, frekvenční analýza

Více

ÚVOD DO TEORIE ODHADU. Martina Litschmannová

ÚVOD DO TEORIE ODHADU. Martina Litschmannová ÚVOD DO TEORIE ODHADU Martina Litschmannová Obsah lekce Výběrové charakteristiky parametry populace vs. výběrové charakteristiky limitní věty další rozdělení pravděpodobnosti (Chí-kvadrát (Pearsonovo),

Více

Minikurz aplikované statistiky. Minikurz aplikované statistiky p.1

Minikurz aplikované statistiky. Minikurz aplikované statistiky p.1 Minikurz aplikované statistiky Marie Šimečková, Petr Šimeček Minikurz aplikované statistiky p.1 Program kurzu základy statistiky a pravděpodobnosti regrese (klasická, robustní, s náhodnými efekty, ev.

Více

AVDAT Mnohorozměrné metody, metody klasifikace

AVDAT Mnohorozměrné metody, metody klasifikace AVDAT Mnohorozměrné metody, metody klasifikace Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Mnohorozměrné metody Regrese jedna náhodná veličina je vysvětlována pomocí jiných

Více

PRŮZKUMOVÁ ANALÝZA JEDNOROZMĚRNÝCH DAT Exploratory Data Analysis (EDA)

PRŮZKUMOVÁ ANALÝZA JEDNOROZMĚRNÝCH DAT Exploratory Data Analysis (EDA) PRŮZKUMOVÁ ANALÝZA JEDNOROZMĚRNÝCH DAT Exploratory Data Analysis (EDA) Reprezentativní náhodný výběr: 1. Prvky výběru x i jsou vzájemně nezávislé. 2. Výběr je homogenní, tj. všechna x i jsou ze stejného

Více

STATISTICKÉ ODHADY Odhady populačních charakteristik

STATISTICKÉ ODHADY Odhady populačních charakteristik STATISTICKÉ ODHADY Odhady populačních charakteristik Jak stanovit charakteristiky rozložení sledované veličiny v základní populaci? Populaci většinou nemáme celou k dispozici, musíme se spokojit jen s

Více

Definice spojité náhodné veličiny zjednodušená verze

Definice spojité náhodné veličiny zjednodušená verze Definice spojité náhodné veličiny zjednodušená verze Náhodná veličina X se nazývá spojitá, jestliže existuje nezáporná funkce f : R R taková, že pro každé a, b R { }, a < b, platí P(a < X < b) = b a f

Více

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA PRAVDĚPODOBNOST A STATISTIKA Náhodná proměnná Náhodná veličina slouží k popisu výsledku pokusu. Před provedením pokusu jeho výsledek a tedy ani sledovanou hodnotu neznáme. Přesto bychom chtěli tento pokus

Více

9. T r a n s f o r m a c e n á h o d n é v e l i č i n y

9. T r a n s f o r m a c e n á h o d n é v e l i č i n y 9. T r a n s f o r m a c e n á h o d n é v e l i č i n Při popisu procesů zpracováváme vstupní údaj, hodnotu x tak, že výstupní hodnota závisí nějakým způsobem na vstupní, je její funkcí = f(x). Pokud

Více

Statistická analýza dat v psychologii. Věci, které můžeme přímo pozorovat, jsou téměř vždy pouze vzorky. Alfred North Whitehead

Statistická analýza dat v psychologii. Věci, které můžeme přímo pozorovat, jsou téměř vždy pouze vzorky. Alfred North Whitehead PSY117/454 Statistická analýza dat v psychologii Přednáška 8 Statistické usuzování, odhady Věci, které můžeme přímo pozorovat, jsou téměř vždy pouze vzorky. Alfred North Whitehead Barevná srdíčka kolegyně

Více

Definice 1.1. Nechť je M množina. Funkci ρ : M M R nazveme metrikou, jestliže má následující vlastnosti:

Definice 1.1. Nechť je M množina. Funkci ρ : M M R nazveme metrikou, jestliže má následující vlastnosti: Přednáška 1. Definice 1.1. Nechť je množina. Funkci ρ : R nazveme metrikou, jestliže má následující vlastnosti: (1 pro každé x je ρ(x, x = 0; (2 pro každé x, y, x y, je ρ(x, y = ρ(y, x > 0; (3 pro každé

Více

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Lineární regresní model kde Y = Xβ + e, y 1 e 1 β y 2 Y =., e = e 2 x 11 x 1 1k., X =....... β 2,

Více

AVDAT Nelineární regresní model

AVDAT Nelineární regresní model AVDAT Nelineární regresní model Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Nelineární regresní model Ey i = f (x i, β) kde x i je k-členný vektor vysvětlujících proměnných

Více

Zápočtová práce STATISTIKA I

Zápočtová práce STATISTIKA I Zápočtová práce STATISTIKA I Obsah: - úvodní stránka - charakteristika dat (původ dat, důvod zpracování,...) - výpis naměřených hodnot (v tabulce) - zpracování dat (buď bodové nebo intervalové, podle charakteru

Více

Numerická matematika 1

Numerická matematika 1 Numerická matematika 1 Obsah 1 Řešení nelineárních rovnic 3 1.1 Metoda půlení intervalu....................... 3 1.2 Metoda jednoduché iterace..................... 4 1.3 Newtonova metoda..........................

Více

Informační technologie a statistika 1

Informační technologie a statistika 1 Informační technologie a statistika 1 přednášející: konzul. hodiny: e-mail: Martin Schindler KAP, tel. 48 535 2836, budova G po dohodě martin.schindler@tul.cz naposledy upraveno: 21. září 2015, 1/33 Požadavek

Více

Číselné charakteristiky a jejich výpočet

Číselné charakteristiky a jejich výpočet Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz charakteristiky polohy charakteristiky variability charakteristiky koncetrace charakteristiky polohy charakteristiky

Více

Popisná statistika. Jaroslav MAREK. Univerzita Palackého

Popisná statistika. Jaroslav MAREK. Univerzita Palackého Popisná statistika Jaroslav MAREK Univerzita Palackého Přírodovědecká fakulta Katedra matematické analýzy a aplikací matematiky Tomkova 40, 779 00 Olomouc Hejčín tel. 585634606 marek@inf.upol.cz pondělí

Více

Matematika III. 27. listopadu Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

Matematika III. 27. listopadu Vysoká škola báňská - Technická univerzita Ostrava. Matematika III Vysoká škola báňská - Technická univerzita Ostrava 27. listopadu 2017 Typy statistických znaků (proměnných) Typy proměnných: Kvalitativní proměnná (kategoriální, slovní,... ) Kvantitativní proměnná (numerická,

Více