(y i Y ) 2 = N 2 1 f

Podobné dokumenty
1.cvičení randomized response

Odhady parametrů 1. Odhady parametrů

6 Intervalové odhady. spočteme aritmetický průměr, pak tyto průměry se budou chovat jako by pocházely z normálního. nekonečna.

P2: Statistické zpracování dat

Pravděpodobnost a aplikovaná statistika

PRAVDĚPODOBNOST A STATISTIKA

odhady parametrů. Jednostranné a oboustranné odhady. Intervalový odhad střední hodnoty, rozptylu, relativní četnosti.

Deskriptivní statistika 1

12. N á h o d n ý v ý b ě r

Přednáška VI. Intervalové odhady. Motivace Směrodatná odchylka a směrodatná chyba Centrální limitní věta Intervaly spolehlivosti

Intervalové odhady parametrů některých rozdělení.

8. Analýza rozptylu.

Náhodný výběr 1. Náhodný výběr

jako konstanta nula. Obsahem centrálních limitních vět je tvrzení, že distribuční funkce i=1 X i konvergují za určitých

Intervalové odhady parametrů

ZÁKLADNÍ STATISTICKÉ VÝPOČTY (S VYUŽITÍM EXCELU)

Pravděpodobnost a aplikovaná statistika

Odhady parametrů polohy a rozptýlení pro často se vyskytující rozdělení dat v laboratoři se vyčíslují podle následujících vztahů:

Úloha II.S... odhadnutelná

4. B o d o v é o d h a d y p a r a m e t r ů

Mezní stavy konstrukcí a jejich porušov. Hru IV. Milan RůžR. zbynek.hruby.

Odhady parametrů základního souboru. Ing. Michal Dorda, Ph.D.

Odhady parametrů základního. Ing. Michal Dorda, Ph.D.

14. B o d o v é o d h a d y p a r a m e t r ů

Cvičení 6.: Výpočet střední hodnoty a rozptylu, bodové a intervalové odhady střední hodnoty a rozptylu

Při sledování a studiu vlastností náhodných výsledků poznáme charakter. podmínek různé výsledky. Ty odpovídají hodnotám jednotlivých realizací

8. Odhady parametrů rozdělení pravděpodobnosti

Pravděpodobnost a aplikovaná statistika

V. Normální rozdělení

veličiny má stejný řád jako je řád poslední číslice nejistoty. Nejistotu píšeme obvykle jenom jednou

Pro statistické šetření si zvolte si statistický soubor např. všichni žáci třídy (několika tříd, školy apod.).

17. Statistické hypotézy parametrické testy

Přednáška VIII. Testování hypotéz o kvantitativních proměnných

Cvičení 6.: Bodové a intervalové odhady střední hodnoty, rozptylu a koeficientu korelace, test hypotézy o střední hodnotě při známém rozptylu

Závislost slovních znaků

Katedra pravděpodobnosti a matematické statistiky. χ 2 test nezávislosti

i 1 n 1 výběrový rozptyl, pro libovolné, ale pevně dané x Roznačme n 1 Téma 6.: Základní pojmy matematické statistiky

Testujeme hypotézu: proti alternativě. Jednoduché třídění:

VYSOCE PŘESNÉ METODY OBRÁBĚNÍ

1 POPISNÁ STATISTIKA V PROGRAMU MS EXCEL

2. Náhodná veličina. je konečná nebo spočetná množina;

Popisná statistika - zavedení pojmů. 1 Jednorozměrný statistický soubor s kvantitativním znakem

Parametr populace (populační charakteristika) je číselná charakteristika sledované vlastnosti

14. Testování statistických hypotéz Úvod statistické hypotézy Definice 14.1 Statistickou hypotézou parametrickou neparametrickou. nulovou testovanou

OKRUŽNÍ A ROZVOZNÍ ÚLOHY: OBCHODNÍ CESTUJÍCÍ. FORMULACE PŘI RESPEKTOVÁNÍ ČASOVÝCH OKEN

MATICOVÉ HRY MATICOVÝCH HER

3. Lineární diferenciální rovnice úvod do teorie

Úloha III.S... limitní

vají statistické metody v biomedicíně Literatura Statistika v biomedicínsk nském výzkumu a ve zdravotnictví

UPLATNĚNÍ ZKOUŠEK PŘI PROHLÍDKÁCH MOSTŮ

} kvantitativní znaky. korelace, regrese. Prof. RNDr. Jana Zvárov. Obecné principy

PRAVDĚPODOBNOST A STATISTIKA

7. Odhady populačních průměrů a ostatních parametrů populace

vají statistické metody v biomedicíně

STATISTIKA. Statistika se těší pochybnému vyznamenání tím, že je nejvíce nepochopeným vědním oborem. H. Levinson

Pravděpodobnostní modely

Petr Šedivý Šedivá matematika

Testování statistických hypotéz

Náhodný výběr, statistiky a bodový odhad

Intervalový odhad. nazveme levostranným intervalem pro odhad parametru Θ. Statistiku. , kde číslo α je blízké nule, nazveme horním

Univerzita Karlova v Praze Matematicko-fyzikální fakulta. Michaela Kurková. Katedra pravděpodobnosti a matematické statistiky

procesy II Zuzana 1 Katedra pravděpodobnosti a matematické statistiky Univerzita Karlova v Praze

Elementární zpracování statistického souboru

13 Popisná statistika

Pravděpodobnostní model doby setrvání ministra školství ve funkci

Náhodu bychom mohli definovat jako součet velkého počtu drobných nepoznaných vlivů.

Metody zkoumání závislosti numerických proměnných

MOŽNOSTI STATISTICKÉHO POSOUZENÍ KVANTITATIVNÍCH VÝSLEDKŮ POŽÁRNÍCH ZKOUŠEK PRO POTŘEBY CERTIFIKACE A POSUZOVÁNÍ SHODY VÝROBKŮ

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

Matematika 1. Katedra matematiky, Fakulta stavební ČVUT v Praze. středa 10-11:40 posluchárna D / 13. Posloupnosti

DERIVACE FUNKCÍ JEDNÉ REÁLNÉ PROM

Odhad parametru p binomického rozdělení a test hypotézy o tomto parametru. Test hypotézy o parametru p binomického rozdělení

Tržní ceny odrážejí a zahrnují veškeré informace předpokládá se efektivní trh, pro cenu c t tedy platí c t = c t + ε t.

Číselné charakteristiky náhodných veličin

Prorážka DOC. ING. PAVEL HÁNEK, CSC. Uvedené materiály jsou doplňkem přednášek předmětu 154GP10

základním prvkem teorie křivek v počítačové grafice křivky polynomiální n

Základy statistiky. Zpracování pokusných dat Praktické příklady. Kristina Somerlíková

Statistika pro metrologii

Seriál XXX.II Zpracování dat fyzikálních měření

Kvantová a statistická fyzika 2 (Termodynamika a statistická fyzika)

1.1. Definice Reálným vektorovým prostorem nazýváme množinu V, pro jejíž prvky jsou definovány operace sčítání + :V V V a násobení skalárem : R V V

je konvergentní, právě když existuje číslo a R tak, že pro všechna přirozená <. Číslu a říkáme limita posloupnosti ( ) n n 1 n n n

Teorie chyb a vyrovnávací počet. Obsah:

NEPARAMETRICKÉ METODY

Pevnost a životnost - Hru III 1. PEVNOST a ŽIVOTNOST. Hru III. Milan Růžička, Josef Jurenka, Zbyněk Hrubý.

1.3. POLYNOMY. V této kapitole se dozvíte:

2. Znát definici kombinačního čísla a základní vlastnosti kombinačních čísel. Ovládat jednoduché operace s kombinačními čísly.

8.2.1 Aritmetická posloupnost

Kvantily. Problems on statistics.nb 1

Užití binomické věty

Spojitost a limita funkcí jedné reálné proměnné

3. Charakteristiky a parametry náhodných veličin

6. P o p i s n á s t a t i s t i k a

Kombinatorika- 3. Základy diskrétní matematiky, BI-ZDM

EKONOMETRIE 9. přednáška Zobecněný lineární regresní model

PoznÁmky k přednášce

MATEMATICKÁ INDUKCE. 1. Princip matematické indukce

Komplexní čísla. Definice komplexních čísel

FUNKCÍ JEDNÉ REÁLNÉ PROMĚNNÉ PRVNÍ DIFERENCIÁL

Mendelova univerzita v Brně Statistika projekt

Transkript:

Posledí aktualizace: červa 05 VÝBĚRY Z KOEČÝCH POPULACÍ Podpůrý text shrující vzorečky z předášek a cvičeí Budu velmi vděčý každému, kdo mě v případě podezřeí a jakoukoliv chybu upozorí Základí začeí U celá populace obsahující jedotky, které si očíslujeme jako,,, tedy U {,, } y i s Y Y σ y hodota sledovaého zaku pro i-tou jedotku výběr z populace U populačí průměr, tj Y y i populačí úhr, tj Y y i Y populačí rozptyl, tj σy (y i Y Prostý áhodý výběr (PV rozsah výběru ȳ výběrový průměr, tj ȳ y i Sy (korigovaý populačí rozptyl, tj Sy s y výběrový rozptyl, tj s y (y i ȳ f koečostí ásobitel (y i Y Úhr odhademe pomocí vzorce Ŷ ȳ Teto odhad má rozptyl var(ŷ ( (y i Y f který odhadujeme pomocí var(ŷ f s y S y, Takže přibližý kofidečí iterval (pro úhr Y založeý a ormálí aproximaci je [ ] Ŷ u α/ var( Ŷ, Ŷ + u α/ var( Ŷ, kde u α je α-kvatil ormovaého ormálího rozděleí Pro opatrost eí od věci ahradit kvatil u α kvatilem t-rozděleí o ( -stupích volosti Cochraovo pravidlo: pro dobré fugováí ormálí aproximace se doporučuje (viz Cochra (977, str 4, aby rozsah výběru splňoval: > 5 G, kde G S 3 y (y i Ȳ 3

VÝBĚRY Z KOEČÝCH POPULACÍ ějakou iformaci o (populačí šikmosti G můžeme získat a základě miulých výzkumů, či výzkumech a podobé populaci Z výběru pak můžeme G odhadout pomocí Odhad podílu v populaci g s 3 y (y i ȳ 3 Asymptotické přístupy echť hodoty y i abývají pouze hodot ula ebo jeda Ozačme y i a y i Potom populačí podíl P odhadujeme pomocí P Rozptyl tohoto odhadu var( P f P ( P odhadujeme pomocí var( P f P ( P Využijme-li ormálí aproximaci, pak můžeme sestavit přibližý kofidečí iterval pro P pomocí [ ] P u α/ var( P, P + u α/ var( P, kde u α je α-kvatil ormovaého ormálího rozděleí Pro opatrost eí od věci ahradit kvatil u α kvatilem t-rozděleí o ( -stupích volosti a přidat ještě tzv opravu a spojitost [ ] P t, α/ var( P, P + + t, α/ var( P Další možost, jak využít ormálí aproximaci, je založea a ásledující úvaze Asymptotická ormalita ám říká, že áhodá veličia P P var( P v kofidečím itervalu jsou taková P, která splňují erovosti má asymptoticky ormálí rozděleí Tedy u α/ f P P u α/ P ( P To vede a kvadratickou rovici, jejíž vyřešeím dostaeme kofidečí iterval tvaru [P, P ], kde P, P + C C ( 4 P ( P + C, C u α/ ( + C f Pro opravu a spojitost dosazujeme při výpočtu dolí meze P místo P a při výpočtu horí meze P + místo P

VÝBĚRY Z KOEČÝCH POPULACÍ 3 Přístup založeý a hypergeometrickém rozděleí V případě koečé populace a prostého áhodého výběru bez vraceí se jedá o přesý model Ozačme si X áhodou veličiu, která představuje počet jediček ve výběru Potom P (X k ( ( k k (, k max{0, + },, mi{, } Uvažujme test H 0 : 0 proti H : < 0 Proti H 0 svědčí, když apozorovaé je malé a jeho p-hodotu dostaeme jako sup P M (X P 0 (X, M 0 jelikož P (X k je pro pevé k klesající v Horí iterval spolehlivosti pro tedy obsahuje všechy 0 takové, pro která ezamítáme ulovou hypotézu, tj IS { M : P M (X α } Podobě se dá odvodit, že dolí iterval spolehlivosti by byl IS { M : P M (X α } Jako oboustraý iterval spolehlivosti pro se pak bere IS [ L, U ], kde L mi { M : P M (X α }, U max { M : P M (X α } Iterval spolehlivosti pro populačí podíl P pak je [ L, ] U Vzhledem k diskrétí povaze dat je zapotřebí počítat s tím, že teto iterval spolehlivosti bude mít zpravidla skutečé pokrytí větší ež α Přístup založeý a biomickém rozděleí (Clopper-Pearsoův iterval spolehlivosti Pokud je malé a a jsou velké, pak se dá hypergeometrické rozděleí úspěšě aproximovat biomickým Podobě jako v předchozím modelu si ozačme P p (X k ( k p k ( p k, k 0,,, Aalogicky jako pro hypergeometrický model se dá odvodit oboustraý iterval spolehlivosti pro parametr p jako IS [p L, p U ], kde p L mi { p : P p (Y y α }, p U max { p : P p (Y y α } Literatura: Thompso (0 str 60, Vorlíčková (985 str 4, Cochra (977 str 50 60, Aděl et al (004 str 0, Čermák (980 str 89 99

4 VÝBĚRY Z KOEČÝCH POPULACÍ 3 Obecá teorie výběrů s růzými pravděpodobostmi π i pravděpodobost zahrutí i-té jedotky π ij pravděpodobost zahrutí i-té a zároveň j-té jedotky, spec π ii π i Horvitz-Thompsoův odhad úhru : ( Ŷ HT π i y i Horvitz-Thompsoova formule pro rozptyl odhadu úhru : ( var ( ( πij Ŷ HT y i y j ( yi + π i π j π i j U Odhad rozptylu úhru založeý a H-T formuli (3 var ( y ( Ŷ HT i + π i π i i,j s, i j y i y j π ij i,j U, i j ( πij π i π j ( πij y i y j π i π j V případě výběru s pevým rozsahem je H-T formule pro rozptyl ( ekvivaletí Yates- Grudyho formuli pro rozptyl odhadu úhru : (4 var ( Ŷ HT j U Odhad rozptylu úhru založeý a Y-G formuli : (5 var ( Ŷ HT l s ( yi π i y j π j ( yi π i y j π j (π i π j π ij ( πi π j π ij Literatura: Vorlíčková (985 str 7, 48 49, 5 53 ěkteré druhy výběrů s růzými pravděpodbostmi Poissoovský výběr (Poisso samplig Každou jedotku vybíráme ezávisle a ostatích a vybereme ji s pravděpodobostí p i Rozsah výběru K(s je tedy áhodá veličia, pro kterou platí: E K(s p i, var(k(s p i ( p i, Jelikož pro Poissoův výběr platí π i p i a π ij π i π j p i p j, dostáváme dosazeím do obecých vzorečků pro výběr s estejými pravděpodobostmi ásledující: var ( Ŷ HT y i p i ( p i

VÝBĚRY Z KOEČÝCH POPULACÍ 5 Protože zde emáme pevý rozsah výběru, odhaduje se var ( Ŷ HT z H-T formule (3: var ( Ŷ HT yi p i ( p i Problémem H-T odhadu je, že ebere v potaz áhodost rozsahu výběru Proto se pro Poissoův výběr ěkdy doporučuje ásledující odhad Ŷ a E K(s K(s Jiou alterativí možostí je použít jako odhad úhru tzv Hájkův odhad: Ŷ Ha y i/π i Ṋ y i, kde /π i π i /π i y i π i a odhad Ŷa se můžeme také ekvivaletě dívat jako a vážeý odhad Ŷ a y i w i, kde w i (s /π i j s /π, i s j Odhad Ŷa sice eí desigově estraý, ale je apř ekvivariatí vůči posuutí Pokud jsme si však jisti, že π i ijak esouvisí s y i, tak se doporučuje použít stejý odhad úhru jako pro prostý áhodý výběr Ŷ a ȳ, kde ȳ K(s y i Beroulliho výběr (Beroulli samplig Speciálí případ Poissoovského výběru, kdy p p p Pro účely iferece (tj apř pro kostrukci itervalu spolehlivosti pro úhr se a ěj můžeme dívat jako a prostý áhodý výběr o rozsahu K(s Podmíěý poissoovský výběr Při tomto výběru provádíme obyčejý Poissoovský výběr tak dlouho, až se ám podaří vybrat předepsaý počet jedotek yí však již obecě eplatí, že π i P i a π ij π i π j p i p j Provádíme-li tedy podmíěý poissoovský výběr s pravděpodobostmi P,, P, je třeba vypočítat pravděpodobosti zahrutí π,, π Přesý výpočet je začě obtížý, proto můžeme využít ásledující aproximaci ( π i p i ( p p i ( p i d + o( d, kde d p i ( p i, p p i ( p i d

6 VÝBĚRY Z KOEČÝCH POPULACÍ Pro použití rozptylových vzorců (4 a (5 potřebujeme zát pravděpodobosti zahrutí dvojic π ij Opět ejsme schopi tyto hodoty přesě vypočítat Proto se používá ásledující aproximace (Vorlíčková, 985, str 8: (6 π ij π i π j [ ( π i ( π j + o( ], kde π i ( π i Zamítací výběr Provádíme výběr o rozsahu s estejými pravděpodobostmi (α (α,, α s vraceím Pokud emáme ve výběru všechy prvky růzé, výběr zamíteme a děláme úplě ový výběr Pokud pro i,, platí, že α i b p i p i, kde b je vhodá kostata, pak je zamítací výběr ekvivaletí s podmíěým poissoovským výběrem Tj zamítací výběr je pouze jiý způsob realizace podmíěého poissoovského výběru, který se hodí zejméa pro malé výběry z velkých populací Máme-li předepsáy pravděpodobosti zahrutí π (π,, π (0 < π i <, pak můžeme odpovídající pravděpodobosti vytažeí α aproximovat pomocí (Vorlíčková, 985, str 9, rce (46: [ ] α i λ ( + π π i π i + π i + o(, kde π i ( π i, π π i ( π i a λ je vhodá kostata, aby platila podmíka i α i Pro odhad var ( Ŷ HT pak pravděpodobosti zahrutí dvojic πij aproximujeme opět pomocí vzorce (6 Literatura: Vorlíčková (985 str 4 33, Särdal et al (99, str 6 65 Postupý výběr Postupě vybíráme jedotky s estejými pravděpodobostmi (α (α,, α s vraceím Pokud vytáheme již vybraou jedotku, tak tuto jedotku zamíteme a taháme zovu Máme-li předepsáy pravděpodobosti zahrutí π (π,, π (0 < π i <, pak můžeme vypočítat pravděpodobosti vytažeí α pomocí ásledující aproximace uvedeé a předášce α i λ π i ( + π i, kde λ určíme tak, aby α i Jiou možostí založeou a Větě 6 z Vorlíčková (985 je položit α i ( π i T, kde T řeší rovici i ( π i T i

VÝBĚRY Z KOEČÝCH POPULACÍ 7 Pro použití rozptylových vzorců (4 a (5 potřebujeme zát π ij Jelikož ejsme schopi tyto hodoty přesě vypočítat, můžeme použít ásledující aproximaci (Čermák (980, str 59, rce (39 π ij π i π j ( + π i + π j Literatura: Čermák (980 str 59, Vorlíčková (985 str 33 37 Systematický výběr Kvalita odhadu záleží a uspořádáí populace Problematický je odhad rozptylu Pokud se dá předpokládat, že populace je uspořádaá áhodě, pak lze použít stejý vzoreček jako pro PV Pokud lze v populaci očekávat slabý tred, tak ěkteří autoři doporučují použít ( var(ȳ (y ( [i] y [i ], kde y [] y i0, y [] y i0 +k, y [3] y i0 + k,, y [] y i0 +( k, a i 0 je počátečí idex a k je výběrový krok 3 Odhad rozptylu založeý a modelu Předpokládejme, že data byla vygeerováa apř pomocí ásledujícího modelu i (7 y i β x i + x i e i, kde e,, e jsou ezávislé s rozptylem σ Potom var ( ȳ Y ( var(y i + var(y i σ [ ( x i + \s Teto rozptyl pak můžeme odhadout pomocí kde var ( ȳ Y σ [ ( x i + σ ( yi βx i, β x i l π l \s x i ], y i x i \s Vhodost tohoto odhadu rozptylu závisí a tom, jak dobře model (7 odpovídá realitě V kize Valliat et al (000 jsou odvozey odhady rozptylu, které by měly fugovat slušě, i když model (7 eodpovídá přesě realitě Literatura: Vorlíčková (985 str 37 40, Fuller (009 str 5, Cochra (977, str 05 3 x i ]

8 VÝBĚRY Z KOEČÝCH POPULACÍ Restricted radom samplig Mějme ějakou pomocou veličiu {x i, i U} jejíchž hodoty záme pro celou populaci již před provedeím výběru a o které můžeme předpokládat, že souvisí se zkoumaou veličiou {y i, i U} Základí myšleka restricted radom samplig je udělat takový výběr, který v hodotách x i je dobrou zmešeou kopií celé populace Většiou požadujeme balace v prvích dvou mometech veličiy x k Ispirovaí t-statistikou defiujme ( x X ( t (s, a t ( x s X ( (s, kde a kde a x ( s S x x i, X( S x x i, [ ( S x xi X ] / [ ] / (, S x x i X (, i i ( x X ( t (s, a t ( x s X ( (s, i x ( s S x x i, X( i S x x i, [ ( S x xi X ] / [ ] / (, S x x i X ( Provádíme prostý áhodý výběr tak dlouho, dokud veličiy t (s a t (s (defiovaé výše ejsou dostatečě malé Autoři kihy Valliat et al (000 doporučují jako rozumou volbu i i t (s < 0,5 a t (s < 0,5 Pro takovýto výběr elze dost dobře dělat desig-based iferece Je třeba zkusit dělat model-based iferece tak, aby to edopadlo katastrofou, i kdybychom přesě etrefili model Více o tomto přístupu lze ajít v kize Valliat et al (000 Důvody: Stratifikovaý (oblastí výběr kromě celkových (celorepublikových odhadů, chceme odhad také za jedotlivá strata (apř kraje, věkové skupiy, kategorie dle vzděláí, vytvořeí strat, která jsou uvitř homogeí, ale avzájem růzá, může začě sížit variabilitu odhadu,

VÝBĚRY Z KOEČÝCH POPULACÍ 9 růzá ákladost prošetřeí jedotek v růzých oblastech V dalším budeme předpokládat, že v každé oblasti děláme PV bez vraceí Začeí: L počet strat, U k k-té stratum o velikosti k, k rozsah výběru v k-tém stratu, f k k k výběrový podíl ve stratu k Odhad úhru: (8 Ŷ L k ȳ k, kde ȳ k k k je výběrový průměr v k-tém stratu Rozptyl tohoto odhadu je var ( Ŷ L k je rozptyl v k-tém stratu k Odhad rozptylu odhadu úhru pak bude (9 L var(ŷ k k je výběrový rozptyl v k-tém stratu k y i f k k S k, kde S k k k (y i ȳ k f k s k, kde s k (y i ȳ k k k k Itervalový odhad Pokud jsou všechy k dostatečě velké má veličia Ŷ Y přibližě var( Ŷ ormálí rozděleí Opatrější je však použít t-rozděleí eí však úplě zřejmé, kolik by mělo mít toto t-rozděleí stupňů volosti Vhodý počet stupňů volosti se tedy odhaduje pomocí ásledujícího postupu Spočteme počet stupňů volosti v jedotlivých oblastech ν k k, pro k,, L Dále spočteme podíly odhadů rozptylů odhadů úhrů v jedotlivých stratech a odhadu rozptylu celkového úhru T l l ( f l l Sl L k k ( f, pro l,, K k k Sk 3 Celkový počet stupňů volosti pak odhademe jako vážeý harmoický průměr stupňů volosti v jedotlivých oblastech ν L k Tk ν k

0 VÝBĚRY Z KOEČÝCH POPULACÍ Pozámka Pro odhad počtu stupňů volosti platí mi ν k ν k L L ν k k L ( k L, tedy stratifikace sižuje počet stupňů volosti oproti PV, pro který je počet stupňů volosti Speciálě pokud L, L a s s s L, pak k T T T L L a ν L ( L Pozámka Odhad stupňů volosti je založe a Satterthwaitově aproximaci rozděleí vážeého součtu ezávislých kvadratických forem pomocí χ -rozděleí, viz Satterthwaite (946 Stejá myšleka je využita v Satterthwaitově verzi dvouvýběrového t-testu v případě estejých rozptylů, viz Aděl (998, str 88 Optimálí alokace Chceme-li miimalizovat rozptyl odhadu úhru za předpokladu daých celkových ákladů a výběr C L k c k k, kde c k je cea prošetřeí jedé jedotky v k tém stratu, pak volíme rozsahy výběrů v jedotlivých oblastech pomocí vzorce k C ck k S k L g, k,, L g S g cg Speciálě pro c c L a C dostáváme k k S k L g g S g, k,, L Post-stratifikace PV se provede a celém souboru (tedy žádá ezávislé vybíráí ve stratech Pro odhad úhru však epoužiji ȳ, ale vzoreček (8 Ozačme teto odhad ŶP Přibližý rozptyl tohoto odhadu je (pro k / dostatečě velké [ (0 var(ŷp f L k S k + L ( ] k Sk k Teto vzorec se hodí pro zhodoceí pláu: PV + post-stratifkace Pokud však chceme pro kokrétí data odhadout rozptyl odhadu úhru ŶP, pak je lépe využít vzorce (9 Post-stratifikace může začě vylepšit áš odhad, pokud se průměry v růzých stratech výrazě liší Je však třeba dát pozor, aby apozorovaé rozsahy ve stratech byly dostatečě velké, aby odhady průměrů ȳ k ebyly příliš estabilí (variabilí Literatura: Vorlíčková (985 str 40 43, Fuller (009 str 5, Cochra (977, str 89 4 Thompso (0 str 4 5 k

VÝBĚRY Z KOEČÝCH POPULACÍ Model assisted estimatio Základí idea je ásledující: Předpokládejme, že pro každou jedotku dokážeme a základě pomocé veličiy, áhodého výběru,, sestavit odhad ŷ i zjišťovaé y i Potom můžeme rozepsat úhr Y jako ( Y y i (y i ŷ i + ŷ i Prví čle a pravé straě ( yí odhaděme pomocí HT-odhadu a dostáváme ( Ŷ MA y i ŷ i π i + ŷ i Rozdílový odhad Vychází z predikce ŷ i x i, kde {x i, i U} je pomocá veličia zámá již před výběrovým šetřeím Pro rovoměrý výběr π pak dostáváme odhad úhru Ŷ rozd X + (ȳ x, kde X x i Odhad Ŷrozd je desigově estraý Obecý regresí odhad (geeralized regressio estimator Pomocým modelem v tomto případě je (relativě obecý lieárí model (3 y i x T i β + σ i e i kde e,, e jsou ezávislé áhodé veličiy se stejým rozptylem Odhad ŶMA daý vzorcem ( pak vede k ásledujícím odhadu úhru Ŷ GREG ŶHT + β T (X Σ X HT kde β a X Σ x i, X HT x i π i Odhad ŶGREG lze přepsat do tvaru lieárího odhadu ( x i x T i σ i π i ( x i y i σi π i (4 Ŷ GREG y i g i π i, kde g i + xt i σ i ( x i x T i σ i π i (XΣ X HT Čísla {g i, i s} se v odboré aglické literatuře azývají G-weights Tyto váhy se využívají ke kostrukci rozptylu a ke zjišťováí, zda ěkterá pozorováí emají příliš velkou váhu ve výsledém rozptylu Za povšimutí stojí, že se stadardě dá očekávat, že g i + O P (

VÝBĚRY Z KOEČÝCH POPULACÍ Ozačme B ( x i x T i σ i ( x i y i σi a z i y i B T x i Asymptotický rozptyl odhadu ŶGREG je (za určitých podmíek regularity totožý s rozptylem odhadu ẐHT z i π i S využitím ( (5 avar ( ( πij Ŷ GREG z i z j π i π j j U V případě pevého rozsahu výběru pak lze využít Yates-Grudyho formuli (4 (6 avar ( Ŷ GREG l s ( zi z j (π i π j π ij π i π j Pro odhad asymptotického rozptylu ŶGREG se doporučuje ahradit z i pomocí z i g i ẑ i g i ( yi ˆβ T x i Tedy z využitím H-T formule (3 dostáváme a dostáváme (7 avar ( Ŷ GREG j s g i ẑ i g j ẑ j π ij ( πij π i π j Pokud máme pevý rozsah výběru, pak lze použít Y-G formuli (5 a dostáváme odhad asymptotického rozptylu (8 avar ( Ŷ GREG ( gi ẑ i j s π i g ( jẑ j πi π j π j π ij Odhad ŶGREG eí obecě D-estraý Stadardě se však dá očekávat, že jeho vychýleí bude řádu O ( Jelikož (asymptotická směrodatá odchylka odhadu je stadardě O (, dá se toto vychýleí při ifereci zpravidla zaedbat Prostý áhodý výběr V případě prostého áhodého výběru dostáváme odhad Ŷ GREG ȳ + β T ( XΣ x ( (, kde β x i x T i x i y i Vzorec pro odhad asymptotického rozptylu (8 lze upravit do tvaru (9 avar ( Ŷ GREG ( (g i ẑ i gz, kde gz g i ẑ i Literatura: Särdal et al (99, str 9 39

VÝBĚRY Z KOEČÝCH POPULACÍ 3 Poměrové odhady Poměrový odhad (I typu Pomocým modelem je v tomto případě (heteroskedastický model lieárí regrese bez absolutího čleu, tj (0 y i β x i + x i e i, kde e,, e jsou ezávislé áhodé veličiy se stejým rozptylem Pro π dává metoda vážeých ejmeších čtverců (MVČ odhad parametru β jako poměr ˆr ȳ x Odhad úhru ŶMA daý ( pak lze psát ve tvaru Ŷ R X ˆr X ȳ x, Ŷ R X ȳ x, kde X x i, X x i Teto odhad eí obecě D-estraý a jeho desigové vychýleí je pro PV přibližě bias(ŷ R ( ( f Y X X S X S XY ( f ( X R S Y X S XY, kde R X a S XY je populačí kovariace, tj S XY (y i Ȳ (x i X pro všecha i s, tak vzorec pro odhad asympto- Jelikož ẑ i y i ˆr x i a G-váhy g i X x tického rozptylu (9 dává ( var ( Ŷ R ( f ( X x (y i ˆrx i Odhad rozptylu založeý a Model-based iferece ejpřímočařejší odhad asi je var ( Ŷ R Y ( f X x U\s x (y i ˆrx i x i kde x U\s \s x i Ukazuje se však, že teto odhad podhodocuje skutečý rozptyl, pokud předpokládaý model eí úplě pravdivý Jako jeda z alterativ se avrhuje var ( Ŷ R Y ( f X x U\s (y i ˆrx i x ( xi x Poměrový odhad II typu (pro PV Pomocým modelem je v tomto případě (heteroskedastický model lieárí regrese bez absolutího čleu, tj ( y i β x i + x i e i, kde e,, e jsou ezávislé áhodé veličiy se stejým rozptylem Pro π dává MVČ odhad parametru β jako průměrý poměr ˆr y i x i Poměrovým odhadem II typu se pak často rozumí Ŷ r X ˆr, kde ˆr y i x i

4 VÝBĚRY Z KOEČÝCH POPULACÍ Model assisted estimatio ( však vede a odhad Pro PV mají odhady Ŷr bias ( Ŷ r R X Y, a (přibližé rozptyly Ŷ (MA r a Ŷ (MA r var ( Ŷ r f X ˆr + (ȳ ˆr x ásledující (přibližé vychýleí bias ( Ŷ r (MA f X avar ( Ŷ r (MA f i ( y i x i R, i ( yi x i R ( xi X ( yi Ȳ R (x i X i Všiměme si, že ˆr je estraým odhadem R poměru R Y X Proto tedy vychýleí odhadu Ŷ r Ŷr směrodatou odchylku odhadu Ŷ R, která je řádu O ( y i x i, což je však obecě růzé od je obecě řádu O( a domiuje Tedy vychýleí asymptoticky ezmizí, ale aopak s rostoucím rozsahem výběru abývá a důležitosti Proto se zpravidla dává předost odhadu Ŷ r (MA Jeho rozptyl můžeme odhadout pomocí vzorce (9, kde g i + x i ( X x, ẑ i y i ˆr x i, gz ȳ ˆr x Výběry s růzými pravděpodobostmi V případě, že pro pravděpodobosti zahrutí platí x π i i j U x, pak Ŷr j je desigově estraý odhad úhru Literatura: Thompso (0 str 93 4, Cochra (977, str 50 6, Čermák (980 str 75 96 Regresí odhad Pomocým modelem je v tomto případě (homoskedastický model lieárí regrese, tj (3 y i α + β x i + e i, se dá od- kde e,, e jsou ezávislé áhodé veličiy se stejým rozptylem Pro π had ŶMA daý ( psát ve tvaru Ŷ regr (ȳ + β( X x, kde β (x i x y i (x i x ejpřímočařejší odhad rozptylu v případě PV by byl var(ŷregr f ( yi ȳ β(x i x,

VÝBĚRY Z KOEČÝCH POPULACÍ 5 Doporučuje se však využít tzv G-weights (viz Obecý regresí odhad Vzorec (9 se pak dá upravit a tvar kde g i + var(ŷregr f (x i x( X x j s (x j x pro i s Literatura: Cochra (977, str 89 95 g i ( y i ȳ β(x i x, Mějme pomocou veličiu x i Kalibračí odhady (x i,, x ip T a předpokládejme, že záme populačí úhry X Σ ( x i,, x ip T Chceme ajít takové váhy {wi, i s}, že platí kalibračí rovice (4 x i w i X Σ Váhy {w i } se sažíme ajít tak, aby byly co ejblíže vahám z H-T odhadu d i π i Kalibrovaý odhad úhru pak bude ve tvaru ŶK y i w i ejčastější je hledat váhy {w i } jako váhy, které miimalizují (w i d i d i a i, za podmíky (4, kde a i je specifická váha pro i-té pozorováí Tato úloha vede pak k odhadu Ŷ K y i g i π i, kde g i + a i x T i ( a i x i x T i π i (XΣ X HT Volba a i pak dává, že σi ŶK je v tomto případě totožý s obecým regresím odhadem Y GREG, viz (4 Rakig Jedá se o sahu využít zámou strukturu populace dle kvalitativích zaků (apř pohlaví, ejvyšší dosažeé vzděláí, kraj trvalého bydliště, ejedá se však o úplou post-stratifikaci, ale o kalibraci takovou, aby seděly margiálí součty Za tímto účelem se hledají váhy {w i }, které miimalizují ( ( w i log wi d i w i + d i Při hledáí vah {w i } se pak s úspěchem využívá algoritmu IPF (iterative proportioal fittig Literatura: Deville ad Särdal (99

6 VÝBĚRY Z KOEČÝCH POPULACÍ Skupikový výběr (cluster samplig Populace se rozpadá a skupiky My vybereme ěkolik skupiek a ty prošetříme celé Důvody: eexistuje sezam elemetárích jedotek skupiky jedotek jsou rozptýley a velkém území Zásady: skupiky by měly být přibližě stejě velké Pokud ejsou stejě velké doporučuje se vybírat skupikami s pstmi úměrými jejich velikosti, skupiky jsou uvitř co ejvíce růzorodé, ale aveek co ejvíce podobé To je sice pěká zásada, ale v praxi bývá problém, že jedotky ze stejé skupiky bývají podobější ež jedotky z růzých skupiek Jedá se vlastě o speciálí případ dvoustupňového výběru (viz dále V dalším textu budeme předpokládat, že skupiky jsou vybráy pomocí PV Začeí: U M i U i rozklad populace a skupiky M celkový počet skupiek m počet vybraých skupiek s I sezam vybraých skupiek s I U i rozklad výběru a skupiky f I m M koečostí ásobitel Y r r y i celkový úhr v r té skupice Ȳ M M r Y r průměr úhrů a jedu skupiku Ȳ i y i populačí průměr a jedu jedotku Dále budeme uvažovat prostý áhodý výběr skupiek metoda Jelikož pst zahrutí je pro každou jedotku π i m M, pak H-T odhad má tvar Ŷ M Y i m M Ŷ, kde Ŷ Y i m I I Iterpretace: odhademe průměrý úhr připadající a jedu skupiku a vyásobíme počtem skupiek Výše uvedeý odhad má rozptyl a Ȳ M M i Y i var ( Ŷ M f I m S M, kde S M M M ( Yi Ȳ i

VÝBĚRY Z KOEČÝCH POPULACÍ 7 Teto rozptyl můžeme odhadout aalogicky jako u PV: var ( Ŷ M f I m s M, kde s M m r s I je výběrový rozptyl skupikových úhrů Pozámky: ( Y r Ŷ teto odhad je sice desigově estraý, ale evyužívá vztahu mezi velikostí skupiky a úhrem v této skupiě; při ezalosti celkového počtu jedotek elze odhadout průměr a jedu jedotku metoda Odhad průměru: Y m m r s I Y r r s I r Iterpretace: odhademe průměrý úhr připadající a jedu skupiku (Ŷ m r s I r Y r s I Y r a vydělíme průměrou velikostí vybraých skupiek m Y je vlastě poměrový odhad I typu (viz poměrové odhady My vlastě odhadujeme R ( M i y i/ M i x i, pomocí ȳ/ x, kde roli yi hrají skupikové úhry Y i a roli x i hrají rozsahy skupiek i ; Můžeme tedy využít vzorce ( a dostaeme, že Ŷ má asymptotický (desigový rozptyl a Ȳ M M i Y i avar ( Y f I m M M ( Yi Y i Odhad asymptotického (desigového rozptylu pak dostaeme upraveím ( Pozámky: i avar (Ŷ f I m ( ( Y r m Ŷ r r s I odhad eí obecě estraý, ale jeho vychýleí je zpravidla vzhledem ke směrodaté chybě tohoto odhadu zaedbatelé; při ezalosti celkového počtu jedotek elze odhadout celkový úhr 3 metoda Poměrový odhad II typu ( model based estimatio vede k odhadu průměru Y 3 ȳ + ˆr (, kde ˆr Y i, m i I M M i i

8 VÝBĚRY Z KOEČÝCH POPULACÍ Asymptotický (desigový rozptyl odhadu Ŷ 3 dostaeme upraveím vzorce (3 avar(ŷ 3 f I ( Yi Y Y m( 3 ( i M Asymptotický (desigový rozptyl odhadu průměru odhademe pomocí vzorce (9, kde Pozámky: g i + i (, ẑ i Y i Ŷ 3 i, gz Ŷ Ŷ 3 v případě, že místo PV vybíráme skupiky s pravděpodobostí zahrutí úměrou rozsahům skupiek,, M, pak ˆr by byl HT odhad (a tudíž by byl desigové estraý; Pokud ezáme a ahradíme jej pomocí, pak Ŷ 3 Ŷ Pokud bychom použili jako odhad Ŷ 3 ˆr, pak teto odhad je desigově vychýleý, pokud M M i Y i i Y ; Literatura: Särdal et al (99, str 9 33, Cochra (977, str 49 50 Provádí se ve dvou krocích Dvoustupňový výběr ( Výběr větších, tzv primárích výběrových jedotek (PVJ ( V rámci PVJ vybírám meší, tzv sekudárí výběrové jedotky (SVJ Důvody pro teto typ výběru jsou tedy především admiistrativí (apř chybí opora výběru a ekoomické (apř bylo by drahé procestovat všechy kouty republiky Budeme předpokládat, že a obou stupích vybíráme jedotky pomocí PV Začeí: M celkový počet PVJ m počet vybraých PVJ f I m M koečostí ásobitel a I stupi výběru f IIr r r koečostí ásobitel a II stupi výběru Y r r y i celkový úhr v r té PVJ Y M M r Y r průměr úhrů a jedu PVJ Y i y i populačí průměr a jedu SVJ ȳ r výběrový průměr v r-té PVJ Ŷ r r ȳ r odhad úhru pro r-tou PVJ S r populačí rozptyl v r-té PVJ s r výběrový rozptyl v r-té PVJ

VÝBĚRY Z KOEČÝCH POPULACÍ 9 metoda Jelikož pro jedotku y k z i-té PVJ je pst zahrutí π i m M úhru má tvar Ŷ M m r s I r ȳ r M m r s I Ŷ r i i, pak H-T odhad Iterpretace: v každé PVJ odhademe úhr (Ŷr, spočteme průměr těchto odhadů úhru a vyásobíme počtem PVJ Rozptyl odhadu úhru Ŷ je var(ŷ M f I m S M + M m M r r f IIr r S r, kde SM bylo defiováo u skupikového výběru Výše uvedeý rozptyl můžeme odhadout pomocí (5 var ( Ŷ M f I m s M + M m r s I r f IIr r s r, kde s M m r s I (Ŷr Ŷ, Ŷ Ŷ k a s r m r k s I k s II r ( yk ȳ r metoda Odhad průměru: Y r si Ŷr r s I r r s I r ȳ r r s I, r Iterpretace: odhademe celkový úhr ve všech vybraých PVJ a vydělíme počtem všech jedotek v těchto PVJ Asymptotický (desigový rozptyl tohoto odhadu je avar (Ŷ f I m M M r Odhad tohoto (asymptotického rozptylu, pak je ( Y r r Y + mm M r r f IIr r S r (6 avar (Ŷ f I m( m r s I (Ŷr r Ŷ + mm( r s I r f IIr r s r, kde m m i i je průměrá velikost PVJ zahrutých ve výběru Odhad Ŷ eí desigově estraý, ale jeho vychýleí je mešího řádu, ež jeho směrodatá chyba, a proto toto vychýleí můžeme zpravidla zaedbat

0 VÝBĚRY Z KOEČÝCH POPULACÍ 3 metoda Odhad průměru: Y 3 ˆr + ( Ŷ ˆr /, kde ˆr m I Ŷ i i, M M i i Asymptotický (desigový rozptyl tohoto odhadu je (7 avar ( Ŷ 3 f I m( M M ( Yr Ȳ R ( r + kde R M M r Yr r Výše uvedeý (asymptotický rozptyl pak odhaduje pomocí r mm( M r r f IIr r S r (8 kde avar ( f I ( Ŷ 3 m( gr z r gz + m r s I mm ( r s I r g i + i (, ẑ i Ŷi Ŷ 3 i, gz Ŷ Ŷ 3 f IIr r s r, ěkteří autoři avrhují odhadovat populačí průměr pomocí ˆr Teto odhad však eí desigově estraý (a to ai asymptoticky, přičemž vychýleí je rové bias (ˆr R Y M M r Y r r Y Toto vychýleí může představovat závažý problém, pokud eí ve srováí se směrodatou odchylkou zaedbatelé Odhad rozptylů a druhém stupi výběru Jelikož se často stává, že výběry a druhém stupi ebývají příliš rozsáhlé, mohou být výběrové rozptyly s r ve vzorcích (5, (6 a (8 hodě variabilí Proto se v těchto vzorcích výběrové rozptyly s r ěkdy ahrazují pomocí průměrého výběrového rozptylu s w r s I ( r s r r s I ( r Literatura: Cochra (977, str 9 305, Thompso (0, str 7 8 Dvoufázový výběr V prví fázi uděláme rozsáhlý výběr s I o rozsahu I a a všech jedotkách zjistíme pomocou iformaci V druhé fázi děláme podvýběr s II o rozsahu z výběru s II a zjišťujeme odezvu y i V ásledujícím, pokud ebude řečeo jiak, budeme předpokládat prostý áhodý výběr v obou fázích

VÝBĚRY Z KOEČÝCH POPULACÍ Dvoufázový výběr za účelem stratifikace Účelem prví fáze je vytvořit L strat a základě těchto strat pak děláme v druhé fázi stratifikovaý výběr Začeí: s I k jedotky z si, které patří do k-tého strata I k počet jedotek v si k s II k jedotky vybraých z si k v druhé fázi k počet jedotek vybraých z s I k v druhé fázi W k k podíl k-tého strata a celé populaci w k I k podíl k-tého strata a výběru prví fáze I Populačí průměr odhadujeme pomocí Y Rozptyl tohoto odhadu je L w k ȳ k k var (Ŷ L k ( I S y I + I Teto rozptyl se dá odhadout apř pomocí var ( Ŷ kde s k k II k L k (y i ȳ k I k ȳ I k, kde ȳ k k L W k Sk k II k y i ( I k k ( I k I k wk s k + I k ( I L w k (ȳk Ŷ, Dvoufázový výběr a regresí odhad V prví fázi získáme u všech vybraých jedotek pomocou veličiu x i V druhé fázi děláme prostý áhodý výběr s II o rozsahu z s I Ozačme X I I i x i Potom jako odhad populačího průměru můžeme vzít Y ȳ + β ( X I x, kde ȳ II y i, k x x i, β II II (x i xy i II (x i x Asymptotický desigový rozptyl tohoto odhadu je avar ( Ŷ ( I S y ( I + ( yi I Ȳ B(x i X, kde B (x i Xy i (x i X Odhadout teto rozptyl pak můžeme pomocí ( avar(ŷ I s y ( I + I gi ri, II

VÝBĚRY Z KOEČÝCH POPULACÍ g i + (x i x( X I x j s II (x j x a r i y i ȳ β (x i x pro i s II Literatura: Cochra (977, str 37 344, Thompso (0, str 83 98 orespose Pravděpodobostí výběr idealisticky předpokládá, že dokážeme provést všechy ásledující kroky: ( Zkostruovat potřebou oporu výběru (frame pro cílovou populaci ( Vybrat soubor způsobem, který ám dává požadovaé pravděpodobosti zahrutí (3 U každé jedotky ve výběru apozorovat všechy sledovaé veličiy (4 Bezchybě zpracovat (tj zazameat, přeést z formulářů, data a připravit je k aalýze (5 Správě zpracovat data (tj použít metody vhodé pro daou situaci Jestliže výběrovou chybou rozumíme kolísáí (variabilitu odhadů v důsledku prováděí áhodého výběru, pak evýběrovou chybou se zpravidla rozumí chyba v důsledku porušeí jedoho či více předpokladů ( (5 Velmi často vzikají problémy u bodu (3 Jedotky buď eodpovídají správě záměrě, ebo otázku emusí správě pochopit, či mohou být ovlivěi způsobem položeí otázky atd V případě, že ám pro daou jedotku chybí zjišťovaá veličia, mluvíme o orespose V praxi se často rozlišuje tzv jedotková (uit orespose, kdy ám u jedotky chybí všechy zjišťovaé veličiy, ebo tzv položková (item orespose, kdy ám chybí pouze ěkteré ze zjišťovaých veliči Učebice ám říkají, že orespose je spíše pravidlem ež výjimkou V podstatě každé výběrové šetřeí obsahuje orespose Rozdíly mohou být pouze v míře této orespose echť s začí soubor vybraých jedotek a s r začí soubor skutečě prošetřeých jedotek ejjedodušší mírou orespose je λ r K(s, kde K(s je rozsah souboru s a r je rozsah souboru s r V případě, že jedotky emají shodé pravděpodobosti zahrutí, bývá zpravidla vhodější použit tzv vážeou míru orespose k s λ w r /π k k s /π k Hlavím problémem orespose je, že ám zpravidla vychyluje populaci Tj populace, ze které vybíráme se ve sledovaé veličiě liší od populace, o které bychom rádi proášeli ějaké úsudky Proto se doporučuje již při pláováí šetřeí myslet a to, jak miimalizovat orespose (školeí tazatelů, způsob získáváí údajů Pro citlivé otázky se může

VÝBĚRY Z KOEČÝCH POPULACÍ 3 využít metoda záhoděého dotazováí Jiou metodou sižováí orespose je, že se ezastižeé jedotky pokoušíme opětově kotaktovat (callback, follow-ups Teprve po vyčerpáí těchto možostí prevece orespose (resp fiačích prostředků přistupujeme ke vhodým statistickým metodám V zásadě se využívá převážeí a imputace Převážeí echť p i je pravděpodobost, že od i-té jedotky, která je ve výběru získáme odpověď za předpokladu, že jsme ji zahruli do výběru Potom HT-odhad modifikujeme jako Ŷ HT r y i πi, π i π i p i V praxi však p i ezáme, takže je ahrazujeme odhady Ty se často získávají apř pomocí logistické regrese Pravděpodobost, že jediec odpoví, zde modelujeme s využitím pomocých veliči x i, které záme pro všechy vybraé jedotky Multiple imputatio ásti myšleky Předpokládejme, že se chceme odhadout apř úhr populace {y k, k U} a za tímto účelem provedeme výběr Y {y k, k s} Pokud by odpověděli všichi dotazovaí, tak bychom udělali odhad Ŷ f(y a zkostruovali odhad rozptylu var ( Ŷ V ašem výběru Ŷ f(y máme však chybějící data U těchto dat však záme pomocou áhodou veličiu {x k, k s} a doufáme, že by apř mohli platit model y k β T x k + e k, kde e k jsou ezávislé s rozděleím (0, σ a datech, která jsme apozorovali, tedy metodou ejmeších čtverců odhademe ezámé parametry tohoto modelu Potom pro j,, m (m je předem zvoleý počet imputací: ( Doplíme chybějící data pomocí modelu ỹ (j k ˆβ T x k + ˆσ (0,, k s \ s r ( Z takto doplěých dat spočteme odhad úhru pomocí Ŷj a rozptyl tohoto odhadu pomocí var ( Ŷ j Fiálí odhad úhru a odhad rozptylu úhru jsou kde Ŷ MI m V m m m Ŷ j, j m var ( Ŷ j, j Literatura: Särdal et al (99, str 556 594 var ( Ŷ MI Vm + ( + m B m, Bm m m j (Ŷj ŶMI

4 VÝBĚRY Z KOEČÝCH POPULACÍ Použitá literatura Aděl, J (998 Statistické metody (vyd Matfyzpress, Praha Aděl, M, Čerý, R, Charamza, P, ad eustadt, J (004 Přehled metod odhadu statistické chyby ve výběrových šetřeích Iformačí Bulleti České statistické společosti, 5(-3: 48 Cochra, W G (977 Samplig Techiques Wiley, ew York Third Editio Čermák, V (980 Výběrové statistické zjišťováí STL Deville, J C ad Särdal, C E (99 Calibratio estimators i survey samplig Joural of the America Statistical Associatio, 87(48:376 38 Fuller, W A (009 Samplig statistics Wiley, ew York Särdal, C-E, Swesso, B, ad Wretma, J (99 Model Assisted Survey Samplig Spriger, ew York Satterthwaite, F E (946 A approximate distributio of estimates of variace compoets Biometrics Bulleti, :0 4 Thompso, S K (0 Samplig Wiley, ew York Third Editio Valliat, R, Dorfma, A H, ad Royall, R M (000 Fiite Populatio Samplig ad Iferece Wiley, ew York Vorlíčková, D (985 Výběry z koečých souborů Uiverzita Karlova Skripta