Výběrové charakteristiky a jejich rozdělení

Save this PDF as:
 WORD  PNG  TXT  JPG

Rozměr: px
Začít zobrazení ze stránky:

Download "Výběrové charakteristiky a jejich rozdělení"

Transkript

1 Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

2 Statistické šetření úplné (vyčerpávající) neúplné (výběrové) U výběrového šetření se snažíme o to, aby výběrový soubor dobře reprezentoval základní soubor. Za tohoto předpokladu je možné zobecnit poznatky z výběrového souboru na celý základní soubor.

3 Statistické šetření úplné (vyčerpávající) neúplné (výběrové) U výběrového šetření se snažíme o to, aby výběrový soubor dobře reprezentoval základní soubor. Za tohoto předpokladu je možné zobecnit poznatky z výběrového souboru na celý základní soubor.

4 Statistické šetření úplné (vyčerpávající) neúplné (výběrové) U výběrového šetření se snažíme o to, aby výběrový soubor dobře reprezentoval základní soubor. Za tohoto předpokladu je možné zobecnit poznatky z výběrového souboru na celý základní soubor.

5 Výběrový soubor získáme buď záměrným nebo náhodným výběrem. Nejjednodušší náhodný výběr je tzv. prostý náhodný výběr, tj. přímý výběr, kde každá jednotka má stejnou pravděpodobnost výběru. Problém výběru s vracením a bez vracení Je-li n/n 0,05 nebo základní soubor je nekonečný, hypotetický, považuje se požadavek na nezávislost za splněný, tedy mezi výběrem svracením a bez vracení nebudeme dělat rozdíl.

6 Výběrový soubor získáme buď záměrným nebo náhodným výběrem. Nejjednodušší náhodný výběr je tzv. prostý náhodný výběr, tj. přímý výběr, kde každá jednotka má stejnou pravděpodobnost výběru. Problém výběru s vracením a bez vracení Je-li n/n 0,05 nebo základní soubor je nekonečný, hypotetický, považuje se požadavek na nezávislost za splněný, tedy mezi výběrem svracením a bez vracení nebudeme dělat rozdíl.

7 Nezávislé náhodné veličiny Náhodné veličiny X 1, X 2,..., X n jsou nezávislé právě tehdy, když pro libovolná čísla x 1, x 2,..., x n R platí P(X 1 x 1, X 2 x 2,..., X n x n) = P(X 1 x 1) P(X 2 x 2) P(X n x n).

8 Nezávislé náhodné veličiny Mějme náhodný vektor X = (X 1, X 2,..., X n ), jehož složky X 1, X 2,..., X n jsou náhodné veličiny. Nechť F (x) = F (x 1, x 2,..., x n ) = P(X 1 x 1, X 2 x 2,..., X n x n ) je sdružená distribuční funkce a F (x 1 ), F (x 2 ),..., F (x n ) jsou distribuční funkce náhodných veličin X 1, X 2,..., X n. Náhodné veličiny X 1, X 2,..., X n jsou nezávislé právě tehdy, když F (x 1, x 2,..., x n ) = F (x 1 ) F (x 2 ) F (x n ).

9 Nezávislé náhodné veličiny Je-li X náhodný vektor, jehož složky jsou diskrétní náhodné veličiny, funkce p(x) = p(x 1, x 2,..., x n ) = P(X 1 = x 1, X 2 = x 2,..., X n = x n ) je sdružená pravděpodobnostní funkce a p(x 1 ), p(x 2 ),..., p(x n ) jsou pravděpodobnostní funkce náhodných veličin X 1, X 2,..., X n, pak platí: Náhodné veličiny X 1, X 2,..., X n jsou nezávislé právě tehdy, když p(x 1, x 2,..., x n ) = p(x 1 ) p(x 2 ) p(x n ).

10 Nezávislé náhodné veličiny Je-li X náhodný vektor, jehož složky jsou spojité náhodné veličiny, funkce f (x) = f (x 1, x 2,..., x n ) je sdružená funkce hustoty pravděpodobnosti a f (x 1 ), f (x 2 ),..., f (x n ) jsou funkce hustoty pravděpodobnosti náhodných veličin X 1, X 2,..., X n, pak platí: Náhodné veličiny X 1, X 2,..., X n jsou nezávislé právě tehdy, když f (x 1, x 2,..., x n ) = f (x 1 ) f (x 2 ) f (x n ).

11 Náhodný výběr U každé jednotky, která se dostane do výběrového souboru, zjistíme hodnotu zkoumaného znaku x i (i = 1, 2,..., n). Tuto hodnotu můžeme chápat jako jednu z možných hodnot náhodné veličiny X i. Každá z těchto n náhodných veličin má stejné rozdělení.

12 Náhodný výběr U každé jednotky, která se dostane do výběrového souboru, zjistíme hodnotu zkoumaného znaku x i (i = 1, 2,..., n). Tuto hodnotu můžeme chápat jako jednu z možných hodnot náhodné veličiny X i. Každá z těchto n náhodných veličin má stejné rozdělení.

13 Náhodný výběr Definice Náhodný výběr o rozsahu n je posloupnost nezávislých náhodných veličin X 1, X 2,..., X n se stejným rozdělení. Můžeme ho chápat jako vektor X = (X 1, X 2,..., X n ). Konkrétní realizaci budeme značit x = (x 1, x 2,..., x n ). Naměřené hodnoty x 1, x 2,..., x n nazýváme pozorování nebo také vstupní (empirická) data.

14 Náhodný výběr Protože jsou náhodné veličiny X 1, X 2,..., X n nezávislé a mají stejné rozdělení, platí pro distribuční funkci F (x) náhodného výběru F (x) = F (x 1 )F (x 2 ) F (x n ), x i R.

15 Příklad Nechť X = (X 1, X 2,..., X n ) je náhodný výběr z rovnoměrného rozdělení na intervalu (0, 1). Určete distribuční funkci F (x) náhodného výběru. Řešení: X i R(0, 1) tedy F (x i ) = x i pro 0 < x i < 1, F (x) = F (x 1 )F (x 2 ) F (x n ) = x 1 x 2 x n.

16 Příklad Nechť X = (X 1, X 2,..., X n ) je náhodný výběr z rovnoměrného rozdělení na intervalu (0, 1). Určete distribuční funkci F (x) náhodného výběru. Řešení: X i R(0, 1) tedy F (x i ) = x i pro 0 < x i < 1, F (x) = F (x 1 )F (x 2 ) F (x n ) = x 1 x 2 x n.

17 Náhodný výběr Pravděpodobnostní funkce p(x) náhodného výběru v případě diskrétního rozdělení veličin X 1, X 2,..., X n je p(x) = p(x 1 )p(x 2 ) p(x n ), x i R.

18 Příklad Nechť X = (X 1, X 2,..., X n ) je náhodný výběr z Poissonova rozdělení s parametrem λ. Určete pravděpodobnostní funkci p(x) náhodného výběru. Řešení: X i Po(λ) tedy p(x i ) = λx i x i! e λ pro x i = 0, 1, 2,..., i = 1, 2,..., n p(x) = λx1 x 1! e λ λxn x n! e λ = λ n xi e nλ 1 x 1! x 2! x n!.

19 Příklad Nechť X = (X 1, X 2,..., X n ) je náhodný výběr z Poissonova rozdělení s parametrem λ. Určete pravděpodobnostní funkci p(x) náhodného výběru. Řešení: X i Po(λ) tedy p(x i ) = λx i x i! e λ pro x i = 0, 1, 2,..., i = 1, 2,..., n p(x) = λx1 x 1! e λ λxn x n! e λ = λ n xi e nλ 1 x 1! x 2! x n!.

20 Náhodný výběr Hustota rozdělení f (x) náhodného výběru z rozdělení s hustotou f (x) je kde x i R, i = 1, 2,..., n. f (x) = f (x 1, x 2,..., x n ) = f (x 1 )f (x 2 ) f (x n ),

21 Příklad Nechť X = (X 1, X 2,..., X n ) je náhodný výběr z normálního rozdělení N(µ, σ 2 ). Určete hustotu pravděpodobnosti f (x) náhodného výběru. Řešení: X i N(µ, σ 2 ) tedy f (x i ) = 1 2πσ e (x i µ)2 2σ 2 pro x i R, i = 1, 2,..., n f (x) = n 1 e (x i µ) 2πσ 2 2σ 2 = 1 1 n (2π) n/2 σ n e 2σ 2 (xi µ)2

22 Příklad Nechť X = (X 1, X 2,..., X n ) je náhodný výběr z normálního rozdělení N(µ, σ 2 ). Určete hustotu pravděpodobnosti f (x) náhodného výběru. Řešení: X i N(µ, σ 2 ) tedy f (x i ) = 1 2πσ e (x i µ)2 2σ 2 pro x i R, i = 1, 2,..., n f (x) = n 1 e (x i µ) 2πσ 2 2σ 2 = 1 1 n (2π) n/2 σ n e 2σ 2 (xi µ)2

23 Výběrové charakteristiky Definice Funkce náhodných veličin X 1, X 2,..., X n se nazývá statistika T = T (X 1, X 2,..., X n ) = T (X).

24 Výběrové charakteristiky Výběrový úhrn M = Výběrový průměr X = 1 n X i X i

25 Výběrové charakteristiky Výběrový úhrn M = Výběrový průměr X = 1 n X i X i

26 Výběrové charakteristiky Výběrový rozptyl S 2 = 1 n 1 Výběrová směrodatná odchylka Základní rozptyl výběru (X i X ) 2 S = S 2 S 2 n = 1 n (X i X ) 2 = n 1 n S 2

27 Výběrové charakteristiky Výběrový rozptyl S 2 = 1 n 1 Výběrová směrodatná odchylka Základní rozptyl výběru (X i X ) 2 S = S 2 S 2 n = 1 n (X i X ) 2 = n 1 n S 2

28 Výběrové charakteristiky Výběrový rozptyl S 2 = 1 n 1 Výběrová směrodatná odchylka Základní rozptyl výběru (X i X ) 2 S = S 2 S 2 n = 1 n (X i X ) 2 = n 1 n S 2

29 Výběrové charakteristiky Výběrový r-tý obecný moment M r = 1 n X r i Výběrový r-tý centrální moment M r = 1 n (X i X ) r

30 Výběrové charakteristiky Výběrový r-tý obecný moment M r = 1 n X r i Výběrový r-tý centrální moment M r = 1 n (X i X ) r

31 Výběrové charakteristiky Výběrový koeficient šikmosti Výběrový koeficient špičatosti A 3 = M 3 M 3/2 2 A 4 = M 4 M 2 2 3

32 Výběrové charakteristiky Výběrový koeficient šikmosti Výběrový koeficient špičatosti A 3 = M 3 M 3/2 2 A 4 = M 4 M 2 2 3

33 Rozdělení výběrového úhrnu Mějme náhodný výběr X 1, X 2,..., X n z rozdělení se střední hodnotou µ a rozptylem σ 2, tzn. E(X i ) = µ, D(X i ) = σ 2, pro i = 1, 2..., n. Střední hodnota a rozptyl výběrového úhrnu jsou [ ] E(M) = E X i = E(X i ) = nµ [ ] D(M) = D X i = D(X i ) = nσ 2

34 Rozdělení výběrového úhrnu Věta Je-li X 1, X 2,..., X n náhodný výběr z normálního rozdělení N(µ, σ 2 ), má také výběrový úhrn normální rozdělení M N(nµ, nσ 2 ).

35 Rozdělení výběrového průměru Mějme náhodný výběr X 1, X 2,..., X n z rozdělení se střední hodnotou µ a rozptylem σ 2, tzn. E(X i ) = µ, D(X i ) = σ 2, pro i = 1, 2..., n. Střední hodnota a rozptyl výběrového průměru jsou [ ] 1 E(X ) = E X i = 1 E(X i ) = 1 n n n nµ = µ D(X ) = D [ 1 n ] X i = 1 n 2 D(X i ) = 1 n 2 nσ2 = σ2 n

36 Rozdělení výběrového průměru Věta Je-li X 1, X 2,..., X n náhodný výběr z normálního rozdělení N(µ, σ 2 ), má také výběrový průměr normální rozdělení ) X N (µ, σ2. n Normováním dostaneme statistiku Z = X µ n, σ která má normované normální rozdělení N(0, 1).

37 Rozdělení výběrového průměru Je-li X 1, X 2,..., X n náhodný výběr z rozdělení se střední hodnotou µ a rozptylem σ 2, pak ná veličina Z = X µ n σ má pro n 30 přibližně normované normální rozdělení N(0, 1) viz centrální limitní věta.

38 Rozdělení výběrového rozptylu Mějme náhodný výběr X 1, X 2,..., X n z rozdělení se střední hodnotou µ a rozptylem σ 2, tzn. E(X i ) = µ, D(X i ) = σ 2, pro i = 1, 2..., n. Střední hodnoty výběrového a základního rozptylu jsou E(S 2 ) = σ 2 E(S 2 n ) = n 1 n σ2.

39 Rozdělení výběrového rozptylu Při odvození střední hodnoty výběrového rozptylu použijeme vztahy: S 2 n = 1 n (X i X ) 2 = 1 n X 2 i X 2 D(X i ) = E(X 2 i ) E(X i ) 2 E(X 2 i ) = D(X i ) + E(X i ) 2 = σ 2 + µ 2 D(X ) = E(X 2 ) E(X ) 2 E(X 2 ) = D(X ) + E(X ) 2 = σ2 n + µ2

40 Rozdělení výběrového rozptylu Při odvození střední hodnoty výběrového rozptylu použijeme vztahy: S 2 n = 1 n (X i X ) 2 = 1 n X 2 i X 2 D(X i ) = E(X 2 i ) E(X i ) 2 E(X 2 i ) = D(X i ) + E(X i ) 2 = σ 2 + µ 2 D(X ) = E(X 2 ) E(X ) 2 E(X 2 ) = D(X ) + E(X ) 2 = σ2 n + µ2

41 Rozdělení výběrového rozptylu Při odvození střední hodnoty výběrového rozptylu použijeme vztahy: S 2 n = 1 n (X i X ) 2 = 1 n X 2 i X 2 D(X i ) = E(X 2 i ) E(X i ) 2 E(X 2 i ) = D(X i ) + E(X i ) 2 = σ 2 + µ 2 D(X ) = E(X 2 ) E(X ) 2 E(X 2 ) = D(X ) + E(X ) 2 = σ2 n + µ2

42 Rozdělení výběrového rozptylu E(S 2 n ) = E = 1 n ( 1 n X 2 i X 2 ) = E ( 1 n X 2 i ) E(X 2 i ) E(X 2 ) = 1 n n(σ2 + µ 2 ) = σ 2 σ2 n = n 1 n σ2 ( ) n E(S 2 ) = E n 1 S n 2 = n n 1 n 1 n σ2 = σ 2 E(X 2 ) ( ) σ 2 n + µ2 =

43 Rozdělení výběrového rozptylu Věta Mějme náhodný výběr z normálního rozdělení se střední hodnotou µ a rozptylem σ 2. Náhodná veličina χ 2 = n 1 σ 2 S 2 má χ 2 -rozdělení s n 1 stupni volnosti.

44 Rozdělení výběrového rozptylu Předpokládejme, že máme výběr z normálního rozdělení se střední hodnotou µ a rozptylem σ 2. Víme, že Z = X µ σ n N(0, 1) a χ 2 = n 1 σ S 2 χ 2 (n 1). Náhodná veličina 2 T = Z χ 2 n 1 = X µ σ n 1 n = n 1 σ S 2 2 má Studentovo t-rozdělení s n 1 stupni volnosti. X µ σ n σ S = X µ n S

45 Rozdělení výběrového rozptylu Věta Mějme náhodný výběr z normálního rozdělení se střední hodnotou µ a rozptylem σ 2. Náhodná veličina T = X µ n S má Studentovo t-rozdělení s n 1 stupni volnosti.

46 Rozdělení výběrového podílu Předpokládejme, že rozdělení v základním souboru je alternativní s parametrem π. Náhodný výběr mohou být buď jedničky nebo nuly. Náhodnou veličina X = X 1 + X X n potom určuje počet jedniček ve výběru (tzv. výběrová absolutní četnost). Podíl P = X n bývá označován jako výběrová relativní četnost nebo častěji výběrový podíl

47 Rozdělení výběrového podílu Předpokládejme, že máme náhodný výběr velkého rozsahu n z alternativního rozdělení s parametrem π. Náhodná veličina P = X n má přibližně normální rozdělení se střední hodnotou π a směrodatnou odchylkou π(1 π)/n viz centrální limitní věta. Z CLV plyne, že normovaná náhodná veličina Z = P π π(1 π)/n má pro velká n přibližně normální rozdělení. Aproximace je vhodná, pokud nπ 5 a zároveň n(1 π) 5.