Výběrové charakteristiky a jejich rozdělení

Podobné dokumenty
Limitní věty teorie pravděpodobnosti. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Statistika II. Jiří Neubauer

Základy teorie odhadu parametrů bodový odhad

Pravděpodobnost a statistika I KMA/K413

Charakterizace rozdělení

Mgr. Rudolf Blažek, Ph.D. prof. RNDr. Roman Kotecký Dr.Sc.

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

I. D i s k r é t n í r o z d ě l e n í

p(x) = P (X = x), x R,

LIMITNÍ VĚTY DALŠÍ SPOJITÁ ROZDĚLENÍ PR. 8. cvičení

Definice spojité náhodné veličiny zjednodušená verze

MATEMATICKÁ STATISTIKA

Téma 22. Ondřej Nývlt

ROZDĚLENÍ SPOJITÝCH NÁHODNÝCH VELIČIN

E(X) = np D(X) = np(1 p) 1 2p np(1 p) (n + 1)p 1 ˆx (n + 1)p. A 3 (X) =

AVDAT Náhodný vektor, mnohorozměrné rozdělení

PRAVDĚPODOBNOST A STATISTIKA

8.1. Definice: Normální (Gaussovo) rozdělení N(µ, σ 2 ) s parametry µ a. ( ) ϕ(x) = 1. označovat písmenem U. Její hustota je pak.

Pravděpodobnost a aplikovaná statistika

Náhodná veličina. Michal Fusek. 10. přednáška z ESMAT. Ústav matematiky FEKT VUT, Michal Fusek

X = x, y = h(x) Y = y. hodnotám x a jedné hodnotě y. Dostaneme tabulku hodnot pravděpodobnostní

z Matematické statistiky 1 1 Konvergence posloupnosti náhodných veličin

Vybraná rozdělení náhodné veličiny

KGG/STG Statistika pro geografy

populace soubor jednotek, o jejichž vlastnostech bychom chtěli vypovídat letní semestr Definice subjektech.

MATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci

prof. RNDr. Roman Kotecký DrSc., Dr. Rudolf Blažek, PhD Pravděpodobnost a statistika Katedra teoretické informatiky Fakulta informačních technologií

Základy teorie pravděpodobnosti

Minikurz aplikované statistiky. Minikurz aplikované statistiky p.1

KMA/P506 Pravděpodobnost a statistika KMA/P507 Statistika na PC

Přednáška. Další rozdělení SNP. Limitní věty. Speciální typy rozdělení. Další rozdělení SNP Limitní věty Speciální typy rozdělení

Matematika III 10. týden Číselné charakteristiky střední hodnota, rozptyl, kovariance, korelace

Přednáška. Diskrétní náhodná proměnná. Charakteristiky DNP. Základní rozdělení DNP

ÚVOD DO TEORIE ODHADU. Martina Litschmannová

Střední hodnota a rozptyl náhodné. kvantilu. Ing. Michael Rost, Ph.D.

9. T r a n s f o r m a c e n á h o d n é v e l i č i n y

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

Náhodné (statistické) chyby přímých měření

Cvičení ze statistiky - 7. Filip Děchtěrenko

MATEMATICKÁ STATISTIKA - XP01MST

NÁHODNÉ VELIČINY JAK SE NÁHODNÁ ČÍSLA PŘEVEDOU NA HODNOTY NÁHODNÝCH VELIČIN?

Náhodná veličina Číselné charakteristiky diskrétních náhodných veličin Spojitá náhodná veličina. Pravděpodobnost

Definice 7.1 Nechť je dán pravděpodobnostní prostor (Ω, A, P). Zobrazení. nebo ekvivalentně

Diskrétní náhodná veličina. November 12, 2008

7. Rozdělení pravděpodobnosti ve statistice

8. Normální rozdělení

Praktická statistika. Petr Ponížil Eva Kutálková

Soustavy lineárních rovnic

Základy teorie pravděpodobnosti

Bakalářské studium na MFF UK v Praze Obecná matematika Zaměření: Stochastika. 1 Úvodní poznámky. Verze: 13. června 2013

správně - A, jeden celý příklad správně - B, jinak - C. Pro postup k ústní části zkoušky je potřeba dosáhnout stupně A nebo B.

9. T r a n s f o r m a c e n á h o d n é v e l i č i n y

n = 2 Sdružená distribuční funkce (joint d.f.) n. vektoru F (x, y) = P (X x, Y y)

Pravděpodobnost a statistika (BI-PST) Cvičení č. 7

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Jan Kracík

Všechno, co jste chtěli vědět z teorie pravděpodobnosti, z teorie informace a

ROZDĚLENÍ NÁHODNÝCH VELIČIN

1 Klasická pravděpodobnost. Bayesův vzorec. Poslední změna (oprava): 11. května 2018 ( 6 4)( 43 2 ) ( 49 6 ) 3. = (a) 1 1 2! + 1 3!

Náhodná veličina a rozdělení pravděpodobnosti

Pravděpodobnost a statistika

Aproximace binomického rozdělení normálním

1. Přednáška. Ing. Miroslav Šulai, MBA

Pravděpodobnost a matematická statistika

1. Náhodný vektor (X, Y ) má diskrétní rozdělení s pravděpodobnostní funkcí p, kde. p(x, y) = a(x + y + 1), x, y {0, 1, 2}.

P13: Statistické postupy vyhodnocování únavových zkoušek, aplikace normálního, Weibullova rozdělení, apod.

Náhodné vektory a matice

4EK211 Základy ekonometrie

Statistika. Teorie odhadu statistická indukce. Roman Biskup. (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at) .

15. T e s t o v á n í h y p o t é z

Charakteristika datového souboru

Pojmy z kombinatoriky, pravděpodobnosti, znalosti z kapitoly náhodná veličina, znalost parciálních derivací, dvojného integrálu.

Náhodné chyby přímých měření

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

Téma 2: Pravděpodobnostní vyjádření náhodných veličin

Příklady: - počet členů dané domácnosti - počet zákazníků ve frontě - počet pokusů do padnutí čísla šest - životnost televizoru - věk člověka

Určete zákon rozložení náhodné veličiny, která značí součet ok při hodu a) jednou kostkou, b) dvěma kostkami, c) třemi kostkami.

12. cvičení z PST. 20. prosince 2017

Intervalové Odhady Parametrů

Zápočtová práce STATISTIKA I

Modely diskrétní náhodné veličiny. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Tomáš Karel LS 2012/2013

Přednáška 9. Testy dobré shody. Grafická analýza pro ověření shody empirického a teoretického rozdělení

Inovace bakalářského studijního oboru Aplikovaná chemie

pravděpodobnosti, popisné statistiky

Mnohorozměrná statistická data

Pravděpodobnost a statistika

Chyby měření 210DPSM

NÁHODNÝ VEKTOR. 4. cvičení

Téma 2: Pravděpodobnostní vyjádření náhodných veličin

Pravděpodobnost a statistika (BI-PST) Cvičení č. 4

Cvičení ze statistiky - 5. Filip Děchtěrenko

Odhady Parametrů Lineární Regrese

KMA/P506 Pravděpodobnost a statistika KMA/P507 Statistika na PC

Poznámky k předmětu Aplikovaná statistika, 4. téma

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA. Bayesovské odhady

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM

Transkript:

Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz

Statistické šetření úplné (vyčerpávající) neúplné (výběrové) U výběrového šetření se snažíme o to, aby výběrový soubor dobře reprezentoval základní soubor. Za tohoto předpokladu je možné zobecnit poznatky z výběrového souboru na celý základní soubor.

Statistické šetření úplné (vyčerpávající) neúplné (výběrové) U výběrového šetření se snažíme o to, aby výběrový soubor dobře reprezentoval základní soubor. Za tohoto předpokladu je možné zobecnit poznatky z výběrového souboru na celý základní soubor.

Statistické šetření úplné (vyčerpávající) neúplné (výběrové) U výběrového šetření se snažíme o to, aby výběrový soubor dobře reprezentoval základní soubor. Za tohoto předpokladu je možné zobecnit poznatky z výběrového souboru na celý základní soubor.

Výběrový soubor získáme buď záměrným nebo náhodným výběrem. Nejjednodušší náhodný výběr je tzv. prostý náhodný výběr, tj. přímý výběr, kde každá jednotka má stejnou pravděpodobnost výběru. Problém výběru s vracením a bez vracení Je-li n/n 0,05 nebo základní soubor je nekonečný, hypotetický, považuje se požadavek na nezávislost za splněný, tedy mezi výběrem svracením a bez vracení nebudeme dělat rozdíl.

Výběrový soubor získáme buď záměrným nebo náhodným výběrem. Nejjednodušší náhodný výběr je tzv. prostý náhodný výběr, tj. přímý výběr, kde každá jednotka má stejnou pravděpodobnost výběru. Problém výběru s vracením a bez vracení Je-li n/n 0,05 nebo základní soubor je nekonečný, hypotetický, považuje se požadavek na nezávislost za splněný, tedy mezi výběrem svracením a bez vracení nebudeme dělat rozdíl.

Nezávislé náhodné veličiny Náhodné veličiny X 1, X 2,..., X n jsou nezávislé právě tehdy, když pro libovolná čísla x 1, x 2,..., x n R platí P(X 1 x 1, X 2 x 2,..., X n x n) = P(X 1 x 1) P(X 2 x 2) P(X n x n).

Nezávislé náhodné veličiny Mějme náhodný vektor X = (X 1, X 2,..., X n ), jehož složky X 1, X 2,..., X n jsou náhodné veličiny. Nechť F (x) = F (x 1, x 2,..., x n ) = P(X 1 x 1, X 2 x 2,..., X n x n ) je sdružená distribuční funkce a F (x 1 ), F (x 2 ),..., F (x n ) jsou distribuční funkce náhodných veličin X 1, X 2,..., X n. Náhodné veličiny X 1, X 2,..., X n jsou nezávislé právě tehdy, když F (x 1, x 2,..., x n ) = F (x 1 ) F (x 2 ) F (x n ).

Nezávislé náhodné veličiny Je-li X náhodný vektor, jehož složky jsou diskrétní náhodné veličiny, funkce p(x) = p(x 1, x 2,..., x n ) = P(X 1 = x 1, X 2 = x 2,..., X n = x n ) je sdružená pravděpodobnostní funkce a p(x 1 ), p(x 2 ),..., p(x n ) jsou pravděpodobnostní funkce náhodných veličin X 1, X 2,..., X n, pak platí: Náhodné veličiny X 1, X 2,..., X n jsou nezávislé právě tehdy, když p(x 1, x 2,..., x n ) = p(x 1 ) p(x 2 ) p(x n ).

Nezávislé náhodné veličiny Je-li X náhodný vektor, jehož složky jsou spojité náhodné veličiny, funkce f (x) = f (x 1, x 2,..., x n ) je sdružená funkce hustoty pravděpodobnosti a f (x 1 ), f (x 2 ),..., f (x n ) jsou funkce hustoty pravděpodobnosti náhodných veličin X 1, X 2,..., X n, pak platí: Náhodné veličiny X 1, X 2,..., X n jsou nezávislé právě tehdy, když f (x 1, x 2,..., x n ) = f (x 1 ) f (x 2 ) f (x n ).

Náhodný výběr U každé jednotky, která se dostane do výběrového souboru, zjistíme hodnotu zkoumaného znaku x i (i = 1, 2,..., n). Tuto hodnotu můžeme chápat jako jednu z možných hodnot náhodné veličiny X i. Každá z těchto n náhodných veličin má stejné rozdělení.

Náhodný výběr U každé jednotky, která se dostane do výběrového souboru, zjistíme hodnotu zkoumaného znaku x i (i = 1, 2,..., n). Tuto hodnotu můžeme chápat jako jednu z možných hodnot náhodné veličiny X i. Každá z těchto n náhodných veličin má stejné rozdělení.

Náhodný výběr Definice Náhodný výběr o rozsahu n je posloupnost nezávislých náhodných veličin X 1, X 2,..., X n se stejným rozdělení. Můžeme ho chápat jako vektor X = (X 1, X 2,..., X n ). Konkrétní realizaci budeme značit x = (x 1, x 2,..., x n ). Naměřené hodnoty x 1, x 2,..., x n nazýváme pozorování nebo také vstupní (empirická) data.

Náhodný výběr Protože jsou náhodné veličiny X 1, X 2,..., X n nezávislé a mají stejné rozdělení, platí pro distribuční funkci F (x) náhodného výběru F (x) = F (x 1 )F (x 2 ) F (x n ), x i R.

Příklad Nechť X = (X 1, X 2,..., X n ) je náhodný výběr z rovnoměrného rozdělení na intervalu (0, 1). Určete distribuční funkci F (x) náhodného výběru. Řešení: X i R(0, 1) tedy F (x i ) = x i pro 0 < x i < 1, F (x) = F (x 1 )F (x 2 ) F (x n ) = x 1 x 2 x n.

Příklad Nechť X = (X 1, X 2,..., X n ) je náhodný výběr z rovnoměrného rozdělení na intervalu (0, 1). Určete distribuční funkci F (x) náhodného výběru. Řešení: X i R(0, 1) tedy F (x i ) = x i pro 0 < x i < 1, F (x) = F (x 1 )F (x 2 ) F (x n ) = x 1 x 2 x n.

Náhodný výběr Pravděpodobnostní funkce p(x) náhodného výběru v případě diskrétního rozdělení veličin X 1, X 2,..., X n je p(x) = p(x 1 )p(x 2 ) p(x n ), x i R.

Příklad Nechť X = (X 1, X 2,..., X n ) je náhodný výběr z Poissonova rozdělení s parametrem λ. Určete pravděpodobnostní funkci p(x) náhodného výběru. Řešení: X i Po(λ) tedy p(x i ) = λx i x i! e λ pro x i = 0, 1, 2,..., i = 1, 2,..., n p(x) = λx1 x 1! e λ λxn x n! e λ = λ n xi e nλ 1 x 1! x 2! x n!.

Příklad Nechť X = (X 1, X 2,..., X n ) je náhodný výběr z Poissonova rozdělení s parametrem λ. Určete pravděpodobnostní funkci p(x) náhodného výběru. Řešení: X i Po(λ) tedy p(x i ) = λx i x i! e λ pro x i = 0, 1, 2,..., i = 1, 2,..., n p(x) = λx1 x 1! e λ λxn x n! e λ = λ n xi e nλ 1 x 1! x 2! x n!.

Náhodný výběr Hustota rozdělení f (x) náhodného výběru z rozdělení s hustotou f (x) je kde x i R, i = 1, 2,..., n. f (x) = f (x 1, x 2,..., x n ) = f (x 1 )f (x 2 ) f (x n ),

Příklad Nechť X = (X 1, X 2,..., X n ) je náhodný výběr z normálního rozdělení N(µ, σ 2 ). Určete hustotu pravděpodobnosti f (x) náhodného výběru. Řešení: X i N(µ, σ 2 ) tedy f (x i ) = 1 2πσ e (x i µ)2 2σ 2 pro x i R, i = 1, 2,..., n f (x) = n 1 e (x i µ) 2πσ 2 2σ 2 = 1 1 n (2π) n/2 σ n e 2σ 2 (xi µ)2

Příklad Nechť X = (X 1, X 2,..., X n ) je náhodný výběr z normálního rozdělení N(µ, σ 2 ). Určete hustotu pravděpodobnosti f (x) náhodného výběru. Řešení: X i N(µ, σ 2 ) tedy f (x i ) = 1 2πσ e (x i µ)2 2σ 2 pro x i R, i = 1, 2,..., n f (x) = n 1 e (x i µ) 2πσ 2 2σ 2 = 1 1 n (2π) n/2 σ n e 2σ 2 (xi µ)2

Výběrové charakteristiky Definice Funkce náhodných veličin X 1, X 2,..., X n se nazývá statistika T = T (X 1, X 2,..., X n ) = T (X).

Výběrové charakteristiky Výběrový úhrn M = Výběrový průměr X = 1 n X i X i

Výběrové charakteristiky Výběrový úhrn M = Výběrový průměr X = 1 n X i X i

Výběrové charakteristiky Výběrový rozptyl S 2 = 1 n 1 Výběrová směrodatná odchylka Základní rozptyl výběru (X i X ) 2 S = S 2 S 2 n = 1 n (X i X ) 2 = n 1 n S 2

Výběrové charakteristiky Výběrový rozptyl S 2 = 1 n 1 Výběrová směrodatná odchylka Základní rozptyl výběru (X i X ) 2 S = S 2 S 2 n = 1 n (X i X ) 2 = n 1 n S 2

Výběrové charakteristiky Výběrový rozptyl S 2 = 1 n 1 Výběrová směrodatná odchylka Základní rozptyl výběru (X i X ) 2 S = S 2 S 2 n = 1 n (X i X ) 2 = n 1 n S 2

Výběrové charakteristiky Výběrový r-tý obecný moment M r = 1 n X r i Výběrový r-tý centrální moment M r = 1 n (X i X ) r

Výběrové charakteristiky Výběrový r-tý obecný moment M r = 1 n X r i Výběrový r-tý centrální moment M r = 1 n (X i X ) r

Výběrové charakteristiky Výběrový koeficient šikmosti Výběrový koeficient špičatosti A 3 = M 3 M 3/2 2 A 4 = M 4 M 2 2 3

Výběrové charakteristiky Výběrový koeficient šikmosti Výběrový koeficient špičatosti A 3 = M 3 M 3/2 2 A 4 = M 4 M 2 2 3

Rozdělení výběrového úhrnu Mějme náhodný výběr X 1, X 2,..., X n z rozdělení se střední hodnotou µ a rozptylem σ 2, tzn. E(X i ) = µ, D(X i ) = σ 2, pro i = 1, 2..., n. Střední hodnota a rozptyl výběrového úhrnu jsou [ ] E(M) = E X i = E(X i ) = nµ [ ] D(M) = D X i = D(X i ) = nσ 2

Rozdělení výběrového úhrnu Věta Je-li X 1, X 2,..., X n náhodný výběr z normálního rozdělení N(µ, σ 2 ), má také výběrový úhrn normální rozdělení M N(nµ, nσ 2 ).

Rozdělení výběrového průměru Mějme náhodný výběr X 1, X 2,..., X n z rozdělení se střední hodnotou µ a rozptylem σ 2, tzn. E(X i ) = µ, D(X i ) = σ 2, pro i = 1, 2..., n. Střední hodnota a rozptyl výběrového průměru jsou [ ] 1 E(X ) = E X i = 1 E(X i ) = 1 n n n nµ = µ D(X ) = D [ 1 n ] X i = 1 n 2 D(X i ) = 1 n 2 nσ2 = σ2 n

Rozdělení výběrového průměru Věta Je-li X 1, X 2,..., X n náhodný výběr z normálního rozdělení N(µ, σ 2 ), má také výběrový průměr normální rozdělení ) X N (µ, σ2. n Normováním dostaneme statistiku Z = X µ n, σ která má normované normální rozdělení N(0, 1).

Rozdělení výběrového průměru Je-li X 1, X 2,..., X n náhodný výběr z rozdělení se střední hodnotou µ a rozptylem σ 2, pak ná veličina Z = X µ n σ má pro n 30 přibližně normované normální rozdělení N(0, 1) viz centrální limitní věta.

Rozdělení výběrového rozptylu Mějme náhodný výběr X 1, X 2,..., X n z rozdělení se střední hodnotou µ a rozptylem σ 2, tzn. E(X i ) = µ, D(X i ) = σ 2, pro i = 1, 2..., n. Střední hodnoty výběrového a základního rozptylu jsou E(S 2 ) = σ 2 E(S 2 n ) = n 1 n σ2.

Rozdělení výběrového rozptylu Při odvození střední hodnoty výběrového rozptylu použijeme vztahy: S 2 n = 1 n (X i X ) 2 = 1 n X 2 i X 2 D(X i ) = E(X 2 i ) E(X i ) 2 E(X 2 i ) = D(X i ) + E(X i ) 2 = σ 2 + µ 2 D(X ) = E(X 2 ) E(X ) 2 E(X 2 ) = D(X ) + E(X ) 2 = σ2 n + µ2

Rozdělení výběrového rozptylu Při odvození střední hodnoty výběrového rozptylu použijeme vztahy: S 2 n = 1 n (X i X ) 2 = 1 n X 2 i X 2 D(X i ) = E(X 2 i ) E(X i ) 2 E(X 2 i ) = D(X i ) + E(X i ) 2 = σ 2 + µ 2 D(X ) = E(X 2 ) E(X ) 2 E(X 2 ) = D(X ) + E(X ) 2 = σ2 n + µ2

Rozdělení výběrového rozptylu Při odvození střední hodnoty výběrového rozptylu použijeme vztahy: S 2 n = 1 n (X i X ) 2 = 1 n X 2 i X 2 D(X i ) = E(X 2 i ) E(X i ) 2 E(X 2 i ) = D(X i ) + E(X i ) 2 = σ 2 + µ 2 D(X ) = E(X 2 ) E(X ) 2 E(X 2 ) = D(X ) + E(X ) 2 = σ2 n + µ2

Rozdělení výběrového rozptylu E(S 2 n ) = E = 1 n ( 1 n X 2 i X 2 ) = E ( 1 n X 2 i ) E(X 2 i ) E(X 2 ) = 1 n n(σ2 + µ 2 ) = σ 2 σ2 n = n 1 n σ2 ( ) n E(S 2 ) = E n 1 S n 2 = n n 1 n 1 n σ2 = σ 2 E(X 2 ) ( ) σ 2 n + µ2 =

Rozdělení výběrového rozptylu Věta Mějme náhodný výběr z normálního rozdělení se střední hodnotou µ a rozptylem σ 2. Náhodná veličina χ 2 = n 1 σ 2 S 2 má χ 2 -rozdělení s n 1 stupni volnosti.

Rozdělení výběrového rozptylu Předpokládejme, že máme výběr z normálního rozdělení se střední hodnotou µ a rozptylem σ 2. Víme, že Z = X µ σ n N(0, 1) a χ 2 = n 1 σ S 2 χ 2 (n 1). Náhodná veličina 2 T = Z χ 2 n 1 = X µ σ n 1 n = n 1 σ S 2 2 má Studentovo t-rozdělení s n 1 stupni volnosti. X µ σ n σ S = X µ n S

Rozdělení výběrového rozptylu Věta Mějme náhodný výběr z normálního rozdělení se střední hodnotou µ a rozptylem σ 2. Náhodná veličina T = X µ n S má Studentovo t-rozdělení s n 1 stupni volnosti.

Rozdělení výběrového podílu Předpokládejme, že rozdělení v základním souboru je alternativní s parametrem π. Náhodný výběr mohou být buď jedničky nebo nuly. Náhodnou veličina X = X 1 + X 2 + + X n potom určuje počet jedniček ve výběru (tzv. výběrová absolutní četnost). Podíl P = X n bývá označován jako výběrová relativní četnost nebo častěji výběrový podíl

Rozdělení výběrového podílu Předpokládejme, že máme náhodný výběr velkého rozsahu n z alternativního rozdělení s parametrem π. Náhodná veličina P = X n má přibližně normální rozdělení se střední hodnotou π a směrodatnou odchylkou π(1 π)/n viz centrální limitní věta. Z CLV plyne, že normovaná náhodná veličina Z = P π π(1 π)/n má pro velká n přibližně normální rozdělení. Aproximace je vhodná, pokud nπ 5 a zároveň n(1 π) 5.