Výběrové charakteristiky a jejich rozdělení

Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz

Statistické šetření úplné (vyčerpávající) neúplné (výběrové) U výběrového šetření se snažíme o to, aby výběrový soubor dobře reprezentoval základní soubor. Za tohoto předpokladu je možné zobecnit poznatky z výběrového souboru na celý základní soubor.

Výběrový soubor získáme buď záměrným nebo náhodným výběrem. Nejjednodušší náhodný výběr je tzv. prostý náhodný výběr, tj. přímý výběr, kde každá jednotka má stejnou pravděpodobnost výběru. Problém výběru s vracením a bez vracení Je-li n/n 0,05 nebo základní soubor je nekonečný, hypotetický, považuje se požadavek na nezávislost za splněný, tedy mezi výběrem svracením a bez vracení nebudeme dělat rozdíl.

Nezávislé náhodné veličiny Náhodné veličiny X 1, X 2,..., X n jsou nezávislé právě tehdy, když pro libovolná čísla x 1, x 2,..., x n R platí P(X 1 x 1, X 2 x 2,..., X n x n) = P(X 1 x 1) P(X 2 x 2) P(X n x n).

Nezávislé náhodné veličiny Mějme náhodný vektor X = (X 1, X 2,..., X n ), jehož složky X 1, X 2,..., X n jsou náhodné veličiny. Nechť F (x) = F (x 1, x 2,..., x n ) = P(X 1 x 1, X 2 x 2,..., X n x n ) je sdružená distribuční funkce a F (x 1 ), F (x 2 ),..., F (x n ) jsou distribuční funkce náhodných veličin X 1, X 2,..., X n. Náhodné veličiny X 1, X 2,..., X n jsou nezávislé právě tehdy, když F (x 1, x 2,..., x n ) = F (x 1 ) F (x 2 ) F (x n ).

Nezávislé náhodné veličiny Je-li X náhodný vektor, jehož složky jsou diskrétní náhodné veličiny, funkce p(x) = p(x 1, x 2,..., x n ) = P(X 1 = x 1, X 2 = x 2,..., X n = x n ) je sdružená pravděpodobnostní funkce a p(x 1 ), p(x 2 ),..., p(x n ) jsou pravděpodobnostní funkce náhodných veličin X 1, X 2,..., X n, pak platí: Náhodné veličiny X 1, X 2,..., X n jsou nezávislé právě tehdy, když p(x 1, x 2,..., x n ) = p(x 1 ) p(x 2 ) p(x n ).

Nezávislé náhodné veličiny Je-li X náhodný vektor, jehož složky jsou spojité náhodné veličiny, funkce f (x) = f (x 1, x 2,..., x n ) je sdružená funkce hustoty pravděpodobnosti a f (x 1 ), f (x 2 ),..., f (x n ) jsou funkce hustoty pravděpodobnosti náhodných veličin X 1, X 2,..., X n, pak platí: Náhodné veličiny X 1, X 2,..., X n jsou nezávislé právě tehdy, když f (x 1, x 2,..., x n ) = f (x 1 ) f (x 2 ) f (x n ).

Náhodný výběr U každé jednotky, která se dostane do výběrového souboru, zjistíme hodnotu zkoumaného znaku x i (i = 1, 2,..., n). Tuto hodnotu můžeme chápat jako jednu z možných hodnot náhodné veličiny X i. Každá z těchto n náhodných veličin má stejné rozdělení.

Náhodný výběr Definice Náhodný výběr o rozsahu n je posloupnost nezávislých náhodných veličin X 1, X 2,..., X n se stejným rozdělení. Můžeme ho chápat jako vektor X = (X 1, X 2,..., X n ). Konkrétní realizaci budeme značit x = (x 1, x 2,..., x n ). Naměřené hodnoty x 1, x 2,..., x n nazýváme pozorování nebo také vstupní (empirická) data.

Náhodný výběr Protože jsou náhodné veličiny X 1, X 2,..., X n nezávislé a mají stejné rozdělení, platí pro distribuční funkci F (x) náhodného výběru F (x) = F (x 1 )F (x 2 ) F (x n ), x i R.

Příklad Nechť X = (X 1, X 2,..., X n ) je náhodný výběr z rovnoměrného rozdělení na intervalu (0, 1). Určete distribuční funkci F (x) náhodného výběru. Řešení: X i R(0, 1) tedy F (x i ) = x i pro 0 < x i < 1, F (x) = F (x 1 )F (x 2 ) F (x n ) = x 1 x 2 x n.

Náhodný výběr Pravděpodobnostní funkce p(x) náhodného výběru v případě diskrétního rozdělení veličin X 1, X 2,..., X n je p(x) = p(x 1 )p(x 2 ) p(x n ), x i R.

Příklad Nechť X = (X 1, X 2,..., X n ) je náhodný výběr z Poissonova rozdělení s parametrem λ. Určete pravděpodobnostní funkci p(x) náhodného výběru. Řešení: X i Po(λ) tedy p(x i ) = λx i x i! e λ pro x i = 0, 1, 2,..., i = 1, 2,..., n p(x) = λx1 x 1! e λ λxn x n! e λ = λ n xi e nλ 1 x 1! x 2! x n!.

Náhodný výběr Hustota rozdělení f (x) náhodného výběru z rozdělení s hustotou f (x) je kde x i R, i = 1, 2,..., n. f (x) = f (x 1, x 2,..., x n ) = f (x 1 )f (x 2 ) f (x n ),

Příklad Nechť X = (X 1, X 2,..., X n ) je náhodný výběr z normálního rozdělení N(µ, σ 2 ). Určete hustotu pravděpodobnosti f (x) náhodného výběru. Řešení: X i N(µ, σ 2 ) tedy f (x i ) = 1 2πσ e (x i µ)2 2σ 2 pro x i R, i = 1, 2,..., n f (x) = n 1 e (x i µ) 2πσ 2 2σ 2 = 1 1 n (2π) n/2 σ n e 2σ 2 (xi µ)2

Výběrové charakteristiky Definice Funkce náhodných veličin X 1, X 2,..., X n se nazývá statistika T = T (X 1, X 2,..., X n ) = T (X).

Výběrové charakteristiky Výběrový úhrn M = Výběrový průměr X = 1 n X i X i

Výběrové charakteristiky Výběrový rozptyl S 2 = 1 n 1 Výběrová směrodatná odchylka Základní rozptyl výběru (X i X ) 2 S = S 2 S 2 n = 1 n (X i X ) 2 = n 1 n S 2

Výběrové charakteristiky Výběrový r-tý obecný moment M r = 1 n X r i Výběrový r-tý centrální moment M r = 1 n (X i X ) r

Výběrové charakteristiky Výběrový koeficient šikmosti Výběrový koeficient špičatosti A 3 = M 3 M 3/2 2 A 4 = M 4 M 2 2 3

Rozdělení výběrového úhrnu Mějme náhodný výběr X 1, X 2,..., X n z rozdělení se střední hodnotou µ a rozptylem σ 2, tzn. E(X i ) = µ, D(X i ) = σ 2, pro i = 1, 2..., n. Střední hodnota a rozptyl výběrového úhrnu jsou [ ] E(M) = E X i = E(X i ) = nµ [ ] D(M) = D X i = D(X i ) = nσ 2

Rozdělení výběrového úhrnu Věta Je-li X 1, X 2,..., X n náhodný výběr z normálního rozdělení N(µ, σ 2 ), má také výběrový úhrn normální rozdělení M N(nµ, nσ 2 ).

Rozdělení výběrového průměru Mějme náhodný výběr X 1, X 2,..., X n z rozdělení se střední hodnotou µ a rozptylem σ 2, tzn. E(X i ) = µ, D(X i ) = σ 2, pro i = 1, 2..., n. Střední hodnota a rozptyl výběrového průměru jsou [ ] 1 E(X ) = E X i = 1 E(X i ) = 1 n n n nµ = µ D(X ) = D [ 1 n ] X i = 1 n 2 D(X i ) = 1 n 2 nσ2 = σ2 n

Rozdělení výběrového průměru Věta Je-li X 1, X 2,..., X n náhodný výběr z normálního rozdělení N(µ, σ 2 ), má také výběrový průměr normální rozdělení ) X N (µ, σ2. n Normováním dostaneme statistiku Z = X µ n, σ která má normované normální rozdělení N(0, 1).

Rozdělení výběrového průměru Je-li X 1, X 2,..., X n náhodný výběr z rozdělení se střední hodnotou µ a rozptylem σ 2, pak ná veličina Z = X µ n σ má pro n 30 přibližně normované normální rozdělení N(0, 1) viz centrální limitní věta.

Rozdělení výběrového rozptylu Mějme náhodný výběr X 1, X 2,..., X n z rozdělení se střední hodnotou µ a rozptylem σ 2, tzn. E(X i ) = µ, D(X i ) = σ 2, pro i = 1, 2..., n. Střední hodnoty výběrového a základního rozptylu jsou E(S 2 ) = σ 2 E(S 2 n ) = n 1 n σ2.

Rozdělení výběrového rozptylu Při odvození střední hodnoty výběrového rozptylu použijeme vztahy: S 2 n = 1 n (X i X ) 2 = 1 n X 2 i X 2 D(X i ) = E(X 2 i ) E(X i ) 2 E(X 2 i ) = D(X i ) + E(X i ) 2 = σ 2 + µ 2 D(X ) = E(X 2 ) E(X ) 2 E(X 2 ) = D(X ) + E(X ) 2 = σ2 n + µ2

Rozdělení výběrového rozptylu E(S 2 n ) = E = 1 n ( 1 n X 2 i X 2 ) = E ( 1 n X 2 i ) E(X 2 i ) E(X 2 ) = 1 n n(σ2 + µ 2 ) = σ 2 σ2 n = n 1 n σ2 ( ) n E(S 2 ) = E n 1 S n 2 = n n 1 n 1 n σ2 = σ 2 E(X 2 ) ( ) σ 2 n + µ2 =

Rozdělení výběrového rozptylu Věta Mějme náhodný výběr z normálního rozdělení se střední hodnotou µ a rozptylem σ 2. Náhodná veličina χ 2 = n 1 σ 2 S 2 má χ 2 -rozdělení s n 1 stupni volnosti.

Rozdělení výběrového rozptylu Předpokládejme, že máme výběr z normálního rozdělení se střední hodnotou µ a rozptylem σ 2. Víme, že Z = X µ σ n N(0, 1) a χ 2 = n 1 σ S 2 χ 2 (n 1). Náhodná veličina 2 T = Z χ 2 n 1 = X µ σ n 1 n = n 1 σ S 2 2 má Studentovo t-rozdělení s n 1 stupni volnosti. X µ σ n σ S = X µ n S

Rozdělení výběrového rozptylu Věta Mějme náhodný výběr z normálního rozdělení se střední hodnotou µ a rozptylem σ 2. Náhodná veličina T = X µ n S má Studentovo t-rozdělení s n 1 stupni volnosti.

Rozdělení výběrového podílu Předpokládejme, že rozdělení v základním souboru je alternativní s parametrem π. Náhodný výběr mohou být buď jedničky nebo nuly. Náhodnou veličina X = X 1 + X 2 + + X n potom určuje počet jedniček ve výběru (tzv. výběrová absolutní četnost). Podíl P = X n bývá označován jako výběrová relativní četnost nebo častěji výběrový podíl

Rozdělení výběrového podílu Předpokládejme, že máme náhodný výběr velkého rozsahu n z alternativního rozdělení s parametrem π. Náhodná veličina P = X n má přibližně normální rozdělení se střední hodnotou π a směrodatnou odchylkou π(1 π)/n viz centrální limitní věta. Z CLV plyne, že normovaná náhodná veličina Z = P π π(1 π)/n má pro velká n přibližně normální rozdělení. Aproximace je vhodná, pokud nπ 5 a zároveň n(1 π) 5.