Matematika III 10. týden Číselné charakteristiky střední hodnota, rozptyl, kovariance, korelace

Podobné dokumenty
AVDAT Náhodný vektor, mnohorozměrné rozdělení

Statistika II. Jiří Neubauer

správně - A, jeden celý příklad správně - B, jinak - C. Pro postup k ústní části zkoušky je potřeba dosáhnout stupně A nebo B.

Téma 22. Ondřej Nývlt

Pravděpodobnost a statistika (BI-PST) Cvičení č. 7

1 Rozptyl a kovariance

n = 2 Sdružená distribuční funkce (joint d.f.) n. vektoru F (x, y) = P (X x, Y y)

I. D i s k r é t n í r o z d ě l e n í

p(x) = P (X = x), x R,

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Jan Kracík

Drsná matematika IV 7. přednáška Jak na statistiku?

Poznámky k předmětu Aplikovaná statistika, 4. téma

Charakterizace rozdělení

Výběrové charakteristiky a jejich rozdělení

1. Náhodný vektor (X, Y ) má diskrétní rozdělení s pravděpodobnostní funkcí p, kde. p(x, y) = a(x + y + 1), x, y {0, 1, 2}.

Pravděpodobnost a aplikovaná statistika

Pojmy z kombinatoriky, pravděpodobnosti, znalosti z kapitoly náhodná veličina, znalost parciálních derivací, dvojného integrálu.

Poznámky k předmětu Aplikovaná statistika, 4. téma

X = x, y = h(x) Y = y. hodnotám x a jedné hodnotě y. Dostaneme tabulku hodnot pravděpodobnostní

Mgr. Rudolf Blažek, Ph.D. prof. RNDr. Roman Kotecký Dr.Sc.

MATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci

Náhodná veličina Číselné charakteristiky diskrétních náhodných veličin Spojitá náhodná veličina. Pravděpodobnost

Drsná matematika III 1. přednáška Funkce více proměnných: křivky, směrové derivace, diferenciál

Drsná matematika III 3. přednáška Funkce více proměnných: Inverzní a implicitně definovaná zobrazení, vázané extrémy

Definice 7.1 Nechť je dán pravděpodobnostní prostor (Ω, A, P). Zobrazení. nebo ekvivalentně

Vícerozměrná rozdělení

Drsná matematika III 6. přednáška Obyčejné diferenciální rovnice vyšších řádů, Eulerovo přibližné řešení a poznámky o odhadech chyb

Náhodný vektor a jeho charakteristiky

4EK211 Základy ekonometrie

MATEMATICKÁ STATISTIKA - XP01MST

Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Definice spojité náhodné veličiny zjednodušená verze

MATEMATICKÉ PRINCIPY VÍCEROZMĚRNÉ ANALÝZY DAT

Matematika IV přednáška Transformace a číselné charakteristiky náhodných veličin

Náhodný vektor. Náhodný vektor. Hustota náhodného vektoru. Hustota náhodného vektoru. Náhodný vektor je dvojice náhodných veličin (X, Y ) T = ( X

1. Přednáška. Ing. Miroslav Šulai, MBA

Náhodné veličiny jsou nekorelované, neexistuje mezi nimi korelační vztah. Když jsou X; Y nekorelované, nemusí být nezávislé.

z Matematické statistiky 1 1 Konvergence posloupnosti náhodných veličin

Limitní věty teorie pravděpodobnosti. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

prof. RNDr. Roman Kotecký DrSc., Dr. Rudolf Blažek, PhD Pravděpodobnost a statistika Katedra teoretické informatiky Fakulta informačních technologií

Náhodné vektory a matice

Pravděpodobnost a statistika I KMA/K413

NMAI059 Pravděpodobnost a statistika

Matematika IV 10. týden Kódování

Základy teorie pravděpodobnosti

Příklady ke čtvrtému testu - Pravděpodobnost

NÁHODNÝ VEKTOR. 4. cvičení

Ortogonální projekce a ortogonální zobrazení

MATEMATICKÁ STATISTIKA

ZÁklady teorie pravděpodobnosti

ROZDĚLENÍ SPOJITÝCH NÁHODNÝCH VELIČIN

E(X) = np D(X) = np(1 p) 1 2p np(1 p) (n + 1)p 1 ˆx (n + 1)p. A 3 (X) =

Drsná matematika III 2. přednáška Funkce více proměnných: Aproximace vyšších rádů, Taylorova věta, inverzní zobrazení

Střední hodnota a rozptyl náhodné. kvantilu. Ing. Michael Rost, Ph.D.

Normální rozložení a odvozená rozložení

9. T r a n s f o r m a c e n á h o d n é v e l i č i n y

Inovace bakalářského studijního oboru Aplikovaná chemie

Chyby měření 210DPSM

Náhodná veličina a její charakteristiky. Před provedením pokusu jeho výsledek a tedy ani sledovanou hodnotu neznáte. Proto je proměnná, která

Náhodný vektor. Náhodný vektor. Hustota náhodného vektoru. Hustota náhodného vektoru. Náhodný vektor je dvojice náhodných veličin (X, Y ) T = ( X

letní semestr Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika vektory

Rozdělení náhodné veličiny. Distribuční funkce. Vlastnosti distribuční funkce

15. T e s t o v á n í h y p o t é z

AVDAT Klasický lineární model, metoda nejmenších

STATISTICKÁ VAZBA. 1.1 Statistická vazba Charakteristiky statistické vazby dvou náhodných veličin Literatura 9

15. T e s t o v á n í h y p o t é z

8.1. Definice: Normální (Gaussovo) rozdělení N(µ, σ 2 ) s parametry µ a. ( ) ϕ(x) = 1. označovat písmenem U. Její hustota je pak.

PRAVDĚPODOBNOST A STATISTIKA aneb Krátký průvodce skripty [1] a [2]

Drsná matematika III 2. přednáška Funkce více proměnných: Aproximace vyšších rádů, Taylorova věta, inverzní zobrazení

8. Normální rozdělení

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

10. N á h o d n ý v e k t o r

Statistika. Teorie odhadu statistická indukce. Roman Biskup. (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at) .

Náhodná veličina a rozdělení pravděpodobnosti

Požadavky k písemné přijímací zkoušce z matematiky do navazujícího magisterského studia pro neučitelské obory

ÚSTAV MATEMATIKY A DESKRIPTIVNÍ GEOMETRIE. Matematika 0A4. Cvičení, letní semestr DOMÁCÍ ÚLOHY. Jan Šafařík

4. Aplikace matematiky v ekonomii

KMA/P506 Pravděpodobnost a statistika KMA/P507 Statistika na PC

Náhodná veličina. Michal Fusek. 10. přednáška z ESMAT. Ústav matematiky FEKT VUT, Michal Fusek

Pravděpodobnost a matematická statistika

Statistická analýza jednorozměrných dat

Charakteristika datového souboru

Poznámky k předmětu Aplikovaná statistika, 5.téma

Pravděpodobnost a statistika

Zpracování náhodného vektoru. Ing. Michal Dorda, Ph.D.

2. Friesl, M.: Posbírané příklady z pravděpodobnosti a statistiky. Internetový zdroj (viz odkaz).

Všechno, co jste chtěli vědět z teorie pravděpodobnosti, z teorie informace a

Univerzita Karlova v Praze procesy II. Zuzana. funkce

Odhad parametrů N(µ, σ 2 )

STANOVENÍ SPOLEHLIVOSTI GEOTECHNICKÝCH KONSTRUKCÍ. J. Pruška, T. Parák

Přijímací zkouška na navazující magisterské studium 2014

PRAVDĚPODOBNOST A STATISTIKA

NÁHODNÁ VELIČINA. 3. cvičení

PRAVDĚPODOBNOST A STATISTIKA

5. T e s t o v á n í h y p o t é z

Odhad parametrů N(µ, σ 2 )

Někdy lze výsledek pokusu popsat jediným číslem, které označíme X (nebo jiným velkým písmenem). Hodíme dvěma kostkami jaký padl součet?

9. T r a n s f o r m a c e n á h o d n é v e l i č i n y

Transkript:

Matematika III 10. týden Číselné charakteristiky střední hodnota, rozptyl, kovariance, korelace Jan Slovák Masarykova univerzita Fakulta informatiky 28. 11 2. 12. 2016

Obsah přednášky 1 Literatura 2 Střední hodnota a rozptyl 3 Kovariance

Kde je dobré číst? Karel Zvára, Josef Štěpán, Pravděpodobnost a matematická pravděpodobnost statistika, Matfyzpress, 2006, 230pp. J. Slovák, M. Panák, M. Bulant, Matematika drsně a svižně, Muni Press, Brno 2013, v+773 s., elektronická edice www.math.muni.cz/matematika_drsne_svizne Marie Budíková, Štěpán Mikoláš, Pavel Osecký, Teorie pravděpodobnosti a matematická statistika (sbírka příkladů), Masarykova univerzita, 3. vydání, 2004, 117 stran, ISBN 80-210-3313-4. Marie Budíková, Tomáš Lerch, Štěpán Mikoláš, Základní statistické metody, Masarykova univerzita, 2005, 170 stran, ISBN 80-210-3886-1. Riley, K.F., Hobson, M.P., Bence, S.J. Mathematical Methods for Physics and Engineering, second edition, Cambridge University Press, Cambridge 2004, ISBN 0 521 89067 5, xxiii + 1232 pp.

Střední hodnota Nechť X je náhodná veličina s diskrétním rozdělením. Jestliže řada k=1 x ip(x = x i ) konverguje absolutně (zejména tedy pro všechny X s konečně mnoha možnými hodnotami x i ), pak její součet E X nazýváme střední hodnotou X. Je-li X náhodná veličina se spojitým rozdělením s hustotou f (x) a nevlastní integrál xf (x)dx konverguje absolutně, pak jeho hodnota E X se nazývá střední hodnota X. Je tedy E X = np, je-li X Bi(n, p), zatímco pro rovnoměrné rozdělení na intervalu (a, b) dostaneme dle očekávání E X = b a x b a dx = 1 b 2 a 2 2 b a = 1 (a + b). 2

Vlastnosti střední hodnoty Theorem Uvažme náhodné veličiny X, Y, skaláry a, b R, náhodný vektor W = (X 1,..., X n ) a čtvercovou skalární matici B s n řádky. Pro konstantní náhodnou veličinu X = a R je E a = a. E(a + bx ) = a + b E X. E(X + Y ) = E X + E Y. E(a + BX ) = a + B(E X ). Theorem Jsou-li veličiny X a Y nezávislé, pak E(XY ) = E X E Y.

Rozptyl Další charakteristika popisuje, jak moc se dá čekat, že se hodnoty náhodné veličiny hemží kolem nějaké hodnoty. Definition Nechť X je náhodná veličina s konečnou střední hodnotou. Pak definujeme rozptyl veličiny X výrazem var X = E(X E X ) 2, pokud taková konečná hodnota existuje. Odmocnina z rozptylu var X se nazývá směrodatná odchylka náhodné veličiny X. Jde o zjevnou obdobu definice kvadrátu vzdálenosti vektorů nebo funkcí. Zachycujeme tak očekávanou vzdálenost hodnot X od její střední hodnoty.

Theorem Jestliže má náhodná veličina X konečný rozptyl, pro libovolné skaláry a, b R platí var X = E X 2 (E X ) 2 var(a + bx ) = b 2 var X var(a + bx ) = b var X. Občas přiřazujeme k X normovanou veličinu Z, Z = X E X var X, která má zjevně nulovou střední hodnotu a jednotkový rozptyl.

Normální rozdělení Z má hustotu ϕ(z) = 1 2π e z2 /2 distribuční funkci Φ(z) = z ϕ(t)dt = z 1 2π e z2 /2 dt. Náhodná veličina Y = µ + σz, µ, σ R, σ > 0 má distribuční funkci F Y (y) = y µ σ 1 2π e z2 /2 dz {substituce x = µ + σz} y 1 = exp ( 2πσ (x µ)2 2σ 2 Takové rozdělení je normální, píšeme Y N(µ, σ 2 ). Parametry odpovídají střední hodnotě a rozptylu. ) dx

Uvažme Z N(0, 1) a podívejme se na náhodnou veličinu X = Z 2. F X (x) = P[Z 2 < x] = = x x x 0 1 2π e z2 /2 dz 1 2π t 1/2 e t/2 dt s hustotou f X (x) = 1 2π t 1/2 e t/2. Říkáme mu rozdělení χ 2, píšeme X χ 2 (1).

kvantilová funkce Je-li F (x) distibuční funkce náhodné veličiny X, pak F 1 (u) = inf{x R; F (x) u}, 0 < u < 1 je kvantilová funkce náhodné veličiny X. Hodnota F 1 (α) se nazývá α-kvantil. Tzv. kritické hodnoty pro veličinu X jsou pak F 1 (1 α).

Čebyševova nerovnost Theorem Má-li X rozptyl a ɛ > 0 je libovolné, pak platí P( X E X ɛ) var X ɛ 2.

Kovariance veličin Jsou-li X a Y dvě náhodné veličiny, pro které existují jejich konečné royptyly, pak definijeme jejich kovarianci vztahem cov(x, Y ) = E(X E X )(Y E Y ). Evidentně je cov(x, X ) = var X a cov(x, Y ) = cov(y, X ). Theorem Nechť existují konečné rozptyly veličin X a Y. Pak cov(x, Y ) = E(XY ) (E X )(E Y ) pro jakékoliv skaláry a, b, c, d platí cov(a + bx, c + dy ) = bd cov(x, Y ) var(x + Y ) = var X + var Y + 2 cov(x, Y ).

Od kovariance snadno odvodíme tzv. korelační koeficient dvou náhodných veličin X a Y. Definujeme jej jako kovarianci příslušných normovaných veličin: ( X E X ρ X,Y = cov, Y E Y ) = cov(x, Y ). var X var Y var X vary Theorem ρ a+bx,c+dy = sign(bd)ρ X,Y, pro bd 0 ρ X,X = 1 ρ X,Y = 0, pokud jsou veličiny X a Y nezávislé. pokud je ρ X,Y definován, pak je roven jedné právě, když existují konstanty a, b, c tak, že P(aX + by = c) = 1.

Varianční matice Uvažme náhodný vektor W = (X 1,..., X n ) takový, že pro všechny jeho komponenty existuje rozptyl. Pak varianční matice var W je dána var X 1 cov(x 1, X 2 )... cov(x 1, X n ) var W = cov(x 2, X 1 ) var X 2... cov(x 2, X n ).... cov(x n, X 1 ) cov(x n, X 2 )... var X n Theorem Pro náhodný vektor X, skaláry a, matice skalárů B platí var(a + BX ) = B var XB T.