LIMITNÍ VĚTY DALŠÍ SPOJITÁ ROZDĚLENÍ PR. 8. cvičení

Podobné dokumenty
ÚVOD DO TEORIE ODHADU. Martina Litschmannová

Výběrové charakteristiky a jejich rozdělení

ROZDĚLENÍ SPOJITÝCH NÁHODNÝCH VELIČIN

Limitní věty teorie pravděpodobnosti. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

KGG/STG Statistika pro geografy

Vybraná rozdělení náhodné veličiny

Přednáška. Další rozdělení SNP. Limitní věty. Speciální typy rozdělení. Další rozdělení SNP Limitní věty Speciální typy rozdělení

Test z teorie VÝBĚROVÉ CHARAKTERISTIKY A INTERVALOVÉ ODHADY

PRAVDĚPODOBNOST A STATISTIKA

Střední hodnota a rozptyl náhodné. kvantilu. Ing. Michael Rost, Ph.D.

Test z teorie VÝBĚROVÉ CHARAKTERISTIKY A INTERVALOVÉ ODHADY

ROZDĚLENÍ NÁHODNÝCH VELIČIN

Charakterizace rozdělení

Všechno, co jste chtěli vědět z teorie pravděpodobnosti, z teorie informace a

Biostatistika Cvičení 7

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

Náhodná veličina a rozdělení pravděpodobnosti

Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Přednáška X. Testování hypotéz o kvantitativních proměnných

populace soubor jednotek, o jejichž vlastnostech bychom chtěli vypovídat letní semestr Definice subjektech.

Pravděpodobnost a aplikovaná statistika

8.1. Definice: Normální (Gaussovo) rozdělení N(µ, σ 2 ) s parametry µ a. ( ) ϕ(x) = 1. označovat písmenem U. Její hustota je pak.

E(X) = np D(X) = np(1 p) 1 2p np(1 p) (n + 1)p 1 ˆx (n + 1)p. A 3 (X) =

Pravděpodobnost, náhoda, kostky

Definice spojité náhodné veličiny zjednodušená verze

Cvičení ze statistiky - 7. Filip Děchtěrenko

Tomáš Karel LS 2012/2013

Poznámky k předmětu Aplikovaná statistika, 5.téma

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

Téma 22. Ondřej Nývlt

Pravděpodobnost a aplikovaná statistika

SPOJITÉ ROZDĚLENÍ PRAVDĚPODOBNOSTI. 7. cvičení

PSY117/454 Statistická analýza dat v psychologii přednáška 8. Statistické usuzování, odhady

ÚVOD. Rozdělení slouží: K přesnému popisu pravděpodobnostního chování NV Střední hodnota, rozptyl, korelace atd.

VYBRANÁ ROZDĚLENÍ. DISKRÉTNÍ NÁH. VELIČINY Martina Litschmannová

X = x, y = h(x) Y = y. hodnotám x a jedné hodnotě y. Dostaneme tabulku hodnot pravděpodobnostní

P13: Statistické postupy vyhodnocování únavových zkoušek, aplikace normálního, Weibullova rozdělení, apod.

Statistická analýza dat v psychologii. Věci, které můžeme přímo pozorovat, jsou téměř vždy pouze vzorky. Alfred North Whitehead

12. cvičení z PST. 20. prosince 2017

Náhodná veličina Číselné charakteristiky diskrétních náhodných veličin Spojitá náhodná veličina. Pravděpodobnost

Aproximace binomického rozdělení normálním

Pravděpodobnost a statistika (BI-PST) Cvičení č. 4

Bakalářské studium na MFF UK v Praze Obecná matematika Zaměření: Stochastika. 1 Úvodní poznámky. Verze: 13. června 2013

Příklady na testy hypotéz o parametrech normálního rozdělení

Pravděpodobnost, náhodná proměnná. Statistické metody a zpracování dat. III. Pravděpodobnost, teoretická rozdělení. Pravděpodobnost, náhodná proměnná

Minikurz aplikované statistiky. Minikurz aplikované statistiky p.1

Pravděpodobnost a statistika I KMA/K413

Normální rozložení a odvozená rozložení

NÁHODNÁ VELIČINA. 3. cvičení

Náhodná veličina. Michal Fusek. 10. přednáška z ESMAT. Ústav matematiky FEKT VUT, Michal Fusek

Matematika III. 4. října Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

Inovace bakalářského studijního oboru Aplikovaná chemie

Diskrétní náhodná veličina

Intervalové Odhady Parametrů

MATEMATIKA III V PŘÍKLADECH

pravděpodobnosti, popisné statistiky

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B

Cvičení ze statistiky - 8. Filip Děchtěrenko

MATEMATICKÁ STATISTIKA

15. T e s t o v á n í h y p o t é z

Statistika. Teorie odhadu statistická indukce. Roman Biskup. (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at) .

PRAVDĚPODOBNOST A STATISTIKA

I. D i s k r é t n í r o z d ě l e n í

You created this PDF from an application that is not licensed to print to novapdf printer (

správně - A, jeden celý příklad správně - B, jinak - C. Pro postup k ústní části zkoušky je potřeba dosáhnout stupně A nebo B.

Statistika II. Jiří Neubauer

Základy teorie pravděpodobnosti

p(x) = P (X = x), x R,


Náhodné chyby přímých měření

y = 0, ,19716x.

Jednofaktorová analýza rozptylu

KMA/P506 Pravděpodobnost a statistika KMA/P507 Statistika na PC

1. Statistická analýza dat Jak vznikají informace Rozložení dat

Testy. Pavel Provinský. 19. listopadu 2013

STATISTICKÉ ZJIŠŤOVÁNÍ

Náhodné (statistické) chyby přímých měření

Základní typy pravděpodobnostních rozdělení

Tomáš Karel LS 2012/2013

KGG/STG Statistika pro geografy

Přednáška 9. Testy dobré shody. Grafická analýza pro ověření shody empirického a teoretického rozdělení

Tomáš Karel LS 2012/2013

NÁHODNÉ VELIČINY JAK SE NÁHODNÁ ČÍSLA PŘEVEDOU NA HODNOTY NÁHODNÝCH VELIČIN?

VYBRANÉ DVOUVÝBĚROVÉ TESTY. Martina Litschmannová

VŠB-TU OSTRAVA, FAKULTA ELEKTROTECHNIKY A INFORMATIKY, KATEDRA APLIKOVANÉ MATEMATIKY. Statistika. Vzorce a tabulky

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně

Pravděpodobnostní rozdělení

Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, TESTY DOBRÉ SHODY (angl. goodness-of-fit tests)

Odhad parametrů N(µ, σ 2 )

prof. RNDr. Roman Kotecký DrSc., Dr. Rudolf Blažek, PhD Pravděpodobnost a statistika Katedra teoretické informatiky Fakulta informačních technologií

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze

Jana Vránová, 3. lékařská fakulta UK

Příklady: - počet členů dané domácnosti - počet zákazníků ve frontě - počet pokusů do padnutí čísla šest - životnost televizoru - věk člověka

MATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

4EK211 Základy ekonometrie

1. Náhodný vektor (X, Y ) má diskrétní rozdělení s pravděpodobnostní funkcí p, kde. p(x, y) = a(x + y + 1), x, y {0, 1, 2}.

Diskrétní náhodná veličina. November 12, 2008

Transkript:

LIMITNÍ VĚTY DALŠÍ SPOJITÁ ROZDĚLENÍ PR. 8. cvičení

Způsoby statistického šetření Vyčerpávající šetření prošetření všech jednotek statistického souboru (populace) Výběrové šetření ze základního souboru (populace) o rozsahu N vybereme jeho část, tzv. výběrový soubor, zkráceně výběr, o rozsahu n. Ze zpracovaných výsledků pak usuzujeme na vlastnosti celé populace Výhody: přesnost a detailnost zjištěných informací Nevýhody: personální, finanční a časová náročnost Výhody: menší personální, finanční a časová náročnost Nevýhody: mírou objektivnosti získaných informací je kvalita provedení výběrového šetření 011 Ing. Janurová Kateřina, FEI VŠB-TU Ostrava, STATISTIKA

Náhodné výběry Používáme k modelování a zkoumání populace. Výběr musí být reprezentativní (všechny jednotky, z nichž se skládá populace, musí mít stejnou šanci na zařazení do zkoumaného výběru) Statistická indukce na základě zkoumání omezeného počtu statistických jednotek (výběru) usuzuje na vlastnosti celé populace. 011 Ing. Janurová Kateřina, FEI VŠB-TU Ostrava, STATISTIKA

Parametry populace vs. výběrové charakteristiky Parametry základního souboru (populace) střední hodnota µ, rozptyl σ, směrodatná odchylka σ, pravděpodobnost π,. Parametry populace jsou konstantní hodnoty (pro určitou náhodnou veličinu, v pevném čase). Jestliže neznáme rozdělení náhodné veličiny, nedokážeme parametry většinou přesně určit. Parametry výběrového souboru jsou příslušné protějšky parametrů populace, ozn. výběrové charakteristiky. Výběrů ze základního souboru může být mnoho =>výběrové charakteristiky jsou proměnlivé (variabilní), proto mají charakter náhodných veličin, lze je popsat nějakým rozdělením, mají také svou střední hodnotu, rozptyl a všechny ostatní charakteristiky. 011 Ing. Janurová Kateřina, FEI VŠB-TU Ostrava, STATISTIKA

Základní parametry populace a příslušné výběrové charakteristiky výběrové charakteristiky jsou náhodné veličiny, jejichž jednotlivé realizace lze získat výpočtem pozorovaných hodnot těchto charakteristik pro jednotlivé výběry o rozsahu n. (Např. Průměrný plat 0 občanů ČR je náhodná veličina. Výpočtem průměrného platu konkrétních 0 občanů získáme jednu realizaci tohoto průměru, výpočtem průměrného platu jiného vzorku 0 občanů ČR získáme jinou realizaci průměru.) výběrová rozdělení = rozdělení pravděpodobností výběrových charakteristik. 011 Ing. Janurová Kateřina, FEI VŠB-TU Ostrava, STATISTIKA

Limitní věty Tvrzení, která jsou důležitá pro popis pravděpodobnostních modelů v případě rostoucího počtu náhodných pokusů. Zákon velkých čísel Zabývá se konvergencí výběrového průměru ke střední hodnotě v posloupnosti nezávislých veličin. Centrální limitní věta - zabývá se konvergencí rozdělení k normálnímu rozdělení, dvě dílčí formulace: Lindebergova-Lévyho věta Moivreova-Laplaceova věta 011 Ing. Janurová Kateřina, FEI VŠB-TU Ostrava, STATISTIKA

Zákon velkých čísel Říká, že průměr nezávislých náhodných veličin se stejnými středními hodnotami konverguje podle pravděpodobnosti k jejich střední hodnotě. Důsledkem je Bernoulliho věta: Relativní četnost sledovaného jevu konverguje podle pravděpodobnosti k jeho pravděpodobnosti. Umožňuje experimentálně odhadovat neznámou pravděpodobnost pomocí pozorované relativní četnosti (viz. pravděpodobnost toho, že padne šestka na cinknuté kostce, cv.3). 011 Ing. Janurová Kateřina, FEI VŠB-TU Ostrava, STATISTIKA

Lindebergova-Lévyho věta Aproximace rozdělení součtů náhodných veličin Jestliže X 1, X,, X n jsou nezávislé náhodné veličiny se stejným (libovolným) rozdělením, stejnými středními hodnotami a se stejnými (konečnými) rozptyly, pak jejich součet konverguje v distribuci k normálnímu rozdělení o parametrech: nµ;nσ. {X n }: - nezávislé NV - NV se stejným typem rozdělení Pak: - EX 1 =EX = =EX n - DX 1 =DX = =DX n <, X n = i= 1 Xi N nµ ; ( nσ ) 011 Ing. Janurová Kateřina, FEI VŠB-TU Ostrava, STATISTIKA

Důsledek Linderbergovy-Lévyho věty Aproximace rozdělení průměru náhodných veličin Jestliže X 1, X,, X n jsou nezávislé náhodné veličiny se stejným (libovolným) rozdělením, stejnými středními hodnotami a se stejnými (konečnými) rozptyly, pak jejich průměr konverguje v distribuci k normálnímu rozdělení o parametrech: µ;σ /n. {X n }: - nezávislé NV - NV se stejným typem rozdělení Pak: - EX 1 =EX = =EX n - DX 1 =DX = =DX n <, X = n N µ σ n i i= 1 ; n X 011 Ing. Janurová Kateřina, FEI VŠB-TU Ostrava, STATISTIKA

1. Zatížení letadla s 64 místy nemá překročit 6 000 kg. Jaká je pravděpodobnost, že při plném obsazení bude tato hodnota překročena, jestliže má hmotnost cestujícího střední hodnotu 90 kg a směrodatnou odchylku 10 kg? 011 Ing. Janurová Kateřina, FEI VŠB-TU Ostrava, STATISTIKA

Řešení: X i... hmotnost i-tého cestujícího Rozdělení NV neznáme, ale víme: EX i = 90 kg, DXi X celková hmotnost všech cestujících podle Lindebergovy- Lévyho věty: P X 64 = i = 1 X X n = ( X > 6000 ) = 0, 0014 i i = 1 N X i ( 90; n 10 ) N n Pravděpodobnost, že při plném obsazení bude překročena hodnota 6000 kg je 0,14 %. = 10 kg ( 64 90 = 5760;64 10 = 6400), 011 Ing. Janurová Kateřina, FEI VŠB-TU Ostrava, STATISTIKA

. Denní procento přijatých kalorií z tuku můžeme u Američanů modelovat normálním rozdělením se střední hodnotou 36 % a směrodatnou odchylkou 10 %. Předpokládejte, že jste náhodně vybrali 45 Američanů, určete: a) rozdělení průměrného procenta přijatých kalorií z tuků, b) pravděpodobnost, že 45 Američanů bude přijímat denně průměrně více než 40 % kalorií z tuku, 011 Ing. Janurová Kateřina, FEI VŠB-TU Ostrava, STATISTIKA

Řešení: X i... denní procento přijatých kalorií z tuku u i-tého Američana X i N(36;100) a) X průměrné denní procento kalorií přijatých z tuku u 45 Američanů podle Lindebergovy-Lévyho věty: X = 45 X i i = 1 N 45 100 36; 45 X N( 36;, ) Průměrné procento přijatých kalorií z tuků můžeme u 45 Američanů modelovat normálním rozdělením se střední hodnotou 36 % a směrodatnou odchylkou 1,5 %. 011 Ing. Janurová Kateřina, FEI VŠB-TU Ostrava, STATISTIKA

Řešení: b) X průměrné denní procento kalorií přijatých z tuku u 45 Američanů X N( 36;, ) P ( X > 40 ) = 0, 004 Pravděpodobnost, že průměrné procento denně přijatých kalorií z tuku je u 45 Američanů větší než 40 % je 0,4%. 011 Ing. Janurová Kateřina, FEI VŠB-TU Ostrava, STATISTIKA

3. Předpokládejme, že délku odevzdávaných seminárních projektů ze statistiky můžeme modelovat rovnoměrným rozdělením od 13 do 5 stran. Mějme cvičícího se 47 studenty, určete pravděpodobnost, že cvičící musí za semestr přečíst více než 1000 stran semestrálních projektů. 011 Ing. Janurová Kateřina, FEI VŠB-TU Ostrava, STATISTIKA

Řešení: X i... délka i-tého odevzdaného smestrálního projektu X i R(13;5) Střední hodnotu a rozptyl dopočítáme podle vzorečků pro rovnoměrné rozdělení: E ( ) = = 19 D( X i ) X i X celková délka všech odevzdaných projektů podle Lindebergovy-Lévyho věty: X 13 + 5 47 = i = 1 X i ( X > 1000 ) = 0, 097 Pravděpodobnost, že cvičící musí za semestr přečíst více než 1000 stran semestrálních projektů je 9,7 %. P N ( 13 5) 1 ( 47 19 = 893;47 1 = 6768) = = 1 011 Ing. Janurová Kateřina, FEI VŠB-TU Ostrava, STATISTIKA

4. Předpokládejme, že světová třída vytrvalostních běžců uběhne maratón průměrně za 135 minut se směrodatnou odchylkou 14 minut. Nalezněte: a) rozdělení průměrného času na maratónu u 49 závodníků, b) pravděpodobnost, že průměrná doba na dokončení maratónu je u těchto 49 závodníků mezi 13 a 136 minutami. 011 Ing. Janurová Kateřina, FEI VŠB-TU Ostrava, STATISTIKA

Řešení: a) X i... doba běhu i-tého závodníka Rozdělení NV neznáme, ale víme: EX i 135 min, DX = 14 min, = i X průměrná doba běhu 49 závodníků podle Lindebergovy- Lévyho věty: X = 49 X 196 135; 49 i i = 1 N 4 49 14 = 7 = X N( 135;4 ) Průměrný čas běhu maratónu u 49 závodníků můžeme modelovat pomocí normálního rozdělení se střední hodnotou 135 minut a směrodatnou odchylkou minuty. 011 Ing. Janurová Kateřina, FEI VŠB-TU Ostrava, STATISTIKA

Řešení: b) P X ( 13 < X < 136) = 0, 65 průměrná doba běhu 49 závodníků X N( 135;4 ) Pravděpodobnost, že průměrná doba na dokončení maratónu je u 49 závodníků mezi 13 a 136 minutami je 6,5 %. 011 Ing. Janurová Kateřina, FEI VŠB-TU Ostrava, STATISTIKA

Moivreova-Laplaceova věta Vyjadřuje konvergenci binomického rozdělení k normálnímu rozdělení ( n;p ); EX = np; DX = np( -p) X Bi 1, pak pro dostatečně velká n: X ( ; ( p) ) N np np 1 Aproximace dává dobré výsledky, když: { } 5 np ( 1 p) > 9 nebo min np; np( 1 p) > 011 Ing. Janurová Kateřina, FEI VŠB-TU Ostrava, STATISTIKA

Další aplikace CLV Aproximace výběrové relativní četnosti normálním rozdělením: π ( 1 π) p N π; n Aproximace Poissonova rozdělení normálním rozdělením: ( ) t X Po λt, EX = λt, DX = λ pak pro dostatečně velké t platí, že X můžeme aproximovat norm. rozdělením X N λt, λt ( ) Aproximace průměrného počtu výskytu události za časovou jednotku normálním rozdělením: Nechť Y je průměrný počet výskytu události za časovou jednotku, pak: λ Y N λ, t 011 Ing. Janurová Kateřina, FEI VŠB-TU Ostrava, STATISTIKA

Oprava na spojitost Oprava na spojitost (u pravděpodobnostní funkce): Jestliže aproximujeme diskrétní náhodnou veličinu spojitou, pak: ( X = a) = P( a 0 5 X < a+ 0,5) P, Obecně oprava na spojitost: Posouzení vhodnosti použití opravy na spojitost provádíme vždy při řešení konkrétního příkladu důsledným převodem pravděpodobnosti výskytu náhodné veličiny na nějakém intervalu na vztah mezi distribučními funkcemi v příslušných bodech.

5. Na telefonní ústřednu je napojeno 3000 účastníků. Každý z nich bude volat telefonní ústřednu během hodiny s pravděpodobností 10%. Jaká je pravděpodobnost, že během následující hodiny zavolá ústřednu: a) právě 300 účastníků? b) více než 310 účastníků? c) mezi 00 a 450 účastníky(včetně)? 011 Ing. Janurová Kateřina, FEI VŠB-TU Ostrava, STATISTIKA

Řešení: X počet účastníků volajících ústřednu (z 3000) X Bi(3000;0,1) a) 3000! P( X = 300) = ( 0,1 ) 300 ( 0, 9) 700 700!300! Na kalkulačce nelze vypočítat => aproximujeme pomocí Moivreovy-Laplaceovy věty: EX=n p DX=n p (1-p) X Bi(3000;0,1) X N(3000 0,1;3000 0,1 0,9) X N(300;70) P ( X = 300) = 0 oprava na spojitost: P ( 99,5 X < 300,5 ) = P( X < 300,5 ) P( X < 99,5 ) = 0, 04 Pravděpodobnost, že během následující hodiny zavolá ústřednu právě 300 účastníků je,4 %. 011 Ing. Janurová Kateřina, FEI VŠB-TU Ostrava, STATISTIKA

Řešení: b) Aproximujeme pomocí Moivreovy-Laplaceovy věty: X Bi(3000;0,1) X N(300;70) P ( X > 310) = 1 P( X 310) oprava na spojitost: P ( X > 310 ) = 1 P( X < 310,5 ) = 0, 61 Pravděpodobnost, že během následující hodiny zavolá ústřednu více než 310 účastníků je 6,1 %. 011 Ing. Janurová Kateřina, FEI VŠB-TU Ostrava, STATISTIKA

Řešení: c) Aproximujeme pomocí Moivreovy-Laplaceovy věty: X Bi(3000;0,1) X N(300;70) P ( 00 X 450) = P( X 450) P( X < 00) = 1 Pravděpodobnost, že během následující hodiny zavolá na ústřednu mezi 00 a 450 účastníky (včetně) je 100 %. Použitá aproximace dává velmi dobré výsledky (velmi blízké skutečným), protože je splněna podmínka, že: np(1- p)>9, (70 > 9). 011 Ing. Janurová Kateřina, FEI VŠB-TU Ostrava, STATISTIKA

6. Sekretářka Petra píše na stroji rychlosti 50 úhozů / min. Při této rychlosti udělá průměrně 3 chyby za 10 minut. Jaká je pravděpodobnost, že při 30 minutovém diktátu udělá více než 10 chyb? 011 Ing. Janurová Kateřina, FEI VŠB-TU Ostrava, STATISTIKA

Řešení: P ( X > 10) = 1 P( X 10) = 094, X počet chyb v diktátu (30 minut) X Po(9) = 1 Srovnání s výpočtem pomocí centrální limitní věty: Poissonovu náhodnou veličinu s parametrem λt můžeme aproximovat pro dostatečně velká λt normálním rozdělením s parametry: µ=λt, σ =λt. X N(9;9) P Výsledky obou postupů se liší o 0,015, to je asi 5%ní chyba (0,015/0,94 100%). k 9 k! 011 Ing. Janurová Kateřina, FEI VŠB-TU Ostrava, STATISTIKA 10 k = 0 e 9 průměrný počet chyb za 30 min = 1 e 9 0 9 0! ( X > 10) = 1 P( X 10) = 1 P( X < 105, ) = 1 F ( 105, ) = 1 Φ 05 (, ) = 1 0691, = 0, 309 1 9 + 1! +... + 10 9 10! 105, 9 = 1 Φ 9 =

011 Ing. Janurová Kateřina, FEI VŠB-TU Ostrava, STATISTIKA

χ - rozdělení (Pearsonovo) Mějme nezávislé náhodné veličiny Z 1, Z,, Z n. i = 1,.. n : Z N 01 ; Pak X = n i= 1 i ( ) X χ n Z i n počet sčítaných nezávislých veličin = počet stupňů volnosti = jediný parametr rozdělení ( χ ) n D( χ ) n = n E n = x p... tabelovány 011 Ing. Janurová Kateřina, FEI VŠB-TU Ostrava, STATISTIKA Hustota pravděpodobnosti χ rozdělení

χ - rozdělení - vlastnosti Součet nezávislých náhodných veličin s χ rozdělením má opět χ rozdělení a počet stupňů volnosti je roven součtu stupňů volnosti jednotlivých veličin v součtu. X i χ, X = χ, n i n i pak ( i ) ( i ) Jestliže provedeme náhodný pokus spočívající v náhodném výběru o rozsahu n z populace podléhající normálnímu rozdělení s rozptylem σ. Pro uvedený výběr určíme výběrovou směrodatnou odchylku s. Lze ukázat, že náhodná veličina ( n 1) s σ máχ rozdělení s n-1 stupni volnosti. ( n 1) s Xi N ( µ ; σ ) χ n 1 σ X χ n i 011 Ing. Janurová Kateřina, FEI VŠB-TU Ostrava, STATISTIKA

χ - rozdělení - použití ( n 1) σ s je testová statistika pro testy o rozptylu (je-li výběr z N(0;1)) χ se používá při testování nezávislosti kategoriálních veličin (testy nezávislosti v kontingenční tabulce) Test dobré shody (testování toho, zda data pocházejí z určitého rozdělení). Se vzrůstajícím počtem stupňů volnosti se χ rozdělení blíží normálnímu rozdělení N(n;n). 011 Ing. Janurová Kateřina, FEI VŠB-TU Ostrava, STATISTIKA

7. Odvoďte distribuční funkci a hustotu pravděpodobnosti náhodné veličiny X, která má rozděleníχ n s jedním stupněm volnosti. 011 Ing. Janurová Kateřina, FEI VŠB-TU Ostrava, STATISTIKA

Řešení: X = Z Z N(0;1) => X χ 1 Náhodná veličina X je funkcí náhodné veličiny Z (náhodná veličina s rozdělením χ 1 nabývá pouze kladných hodnot): pro x>0: pro x 0 011 Ing. Janurová Kateřina, FEI VŠB-TU Ostrava, STATISTIKA ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) [ ] ( ) 1 1 1 Φ Φ 1 Φ Φ Φ = = = = = = = < < = < = < = x t x t dt e π dt e π x x x x x x Z x P x Z P x X P x F ( ) 0 = x F Náhodné výběry Limitní věty Další spojitá rozdělení Test

Řešení: Hustotu pravděpodobnosti určíme jako derivaci distribuční funkce: pro x>0: f ( x) ( ) ( ( ) ) ( ) x x d Φ x 1 1 1 df = = = φ dx dx x x = πx e pro x 0: f ( x) ( ) df x = dx = 0 011 Ing. Janurová Kateřina, FEI VŠB-TU Ostrava, STATISTIKA

Studentovo rozdělení (t rozdělení) Z a X jsou nezávislé náhodné veličiny, kde ( 0; 1), X χ Z N, náhodná veličina T má studentovo rozdělení s n stupni volnosti Z Tn = t n X n n E ( T n ) = 0 D( T n ) = n t p tabelovány pro n (v praxi n>30) se Studentovo t rozdělení blíží normovanému normálnímu rozdělení. n pak Hustota pravděpodobnosti Studentova t rozdělení 011 Ing. Janurová Kateřina, FEI VŠB-TU Ostrava, STATISTIKA

Studentovo rozdělení - vlastnosti Pokud náhodné veličiny X 1,X,...,X n mají normální rozdělení N(µ;σ ) a jsou navzájem nezávislé, pak náhodná veličina definována jako X µ n s má Studentovo t rozdělení s (n-1) stupni volnosti: X s µ n t n 1 011 Ing. Janurová Kateřina, FEI VŠB-TU Ostrava, STATISTIKA

Studentovo rozdělení - použití Studentovo t rozdělení má uplatnění zejména při modelování založeném na analýze malých výběrů. X s µ n je testovou statistikou využívanou při testování střední hodnoty (neznáme-li σ a jde-li o výběr z N(0;1)). Užívá se k testování hypotéz o shodě středních hodnot dvou náhodných výběrů, se stejnými předpoklady jako v předcházejícím případě - navíc musí být tyto výběry nezávislé. Rozdělení je vhodným prostředkem pro analýzu výsledků regresní analýzy. 011 Ing. Janurová Kateřina, FEI VŠB-TU Ostrava, STATISTIKA

Fisher-Snedecorovo rozdělení V a W jsou nezávislé náhodné veličiny, obě s rozdělením chí-kvadrát, s různým počtem stupňů volnosti: V χ, W χn, pak m V m W n = n pro n n F = F m, n E ( F ) > D( F ) n n 1 + m = pro n ( n ) ( n 4) Hustota pravděpodobnosti Fisher-Snedecorova rozdělení > 4 F p = F 1 p 1 ( m, n) 011 Ing. Janurová Kateřina, FEI VŠB-TU Ostrava, STATISTIKA

Fisher-Snedecorovo rozdělení - vlastnosti Mějme dva výběry z normálního rozdělení. i = 1,,.. n1, kde n1 je rozsah prvního výběru: X1 i N µ 1; σ1 j = 1,,.. n, kde n je rozsah druhého výběru: X j N µ ; σ Nechť výběrové rozptyly S 1, S a jsou náhodné veličiny definované jako S 1 = n ( X X ) ( X j X ) n1 i= 1 1i 1 j= 1, S = n1 1 n 1 ( ) ( ) pak S σ S σ 1 1 F n 1 1, n 1 011 Ing. Janurová Kateřina, FEI VŠB-TU Ostrava, STATISTIKA

Fisher-Snedecorovo rozdělení - použití Široké uplatnění, zejména při hodnocení výsledků statistických analýz. Používá se především testy o shodnosti rozptylů dvou náhodných výběrů testy o shodě středních hodnot pro více náhodných výběrů, v analýze rozptylu testy v regresní analýze 011 Ing. Janurová Kateřina, FEI VŠB-TU Ostrava, STATISTIKA

8. Firma Edison vyrábí žárovky Ed. Životnost těchto žárovek je průměrně 5 let se směrodatnou odchylkou 6 měsíců. Žárovky jsou vyráběny na dvou linkách. Předpokládejme, že obě linky mají srovnatelné parametry, tj. že průměrná životnost a variabilita životnosti žárovek Ed vyrobených ve firmě Edison nezávisí na tom, na jaké lince byly vyrobeny. Pro ověření kvality výroby bude testována životnost 0 žárovek z linky 1 a 30 žárovek z linky. Jaká je pravděpodobnost, že u vzorku z linky 1 bude zjištěn více než dvojnásobný rozptyl oproti rozptylu zjištěnému u vzorku z linky? 011 Ing. Janurová Kateřina, FEI VŠB-TU Ostrava, STATISTIKA

Řešení: S 1 S rozptyl životnosti zjištěný u vzorku z linky 1 rozptyl životnosti zjištěný u vzorku z linky Hledáme pravděpodobnost, že, tzn. S S. 1 > S 1 > S S P S 1 > =? Za předpokladu, že oba vzorky jsou výběrem z normálního rozdělení, platí: S1 σ1 F n 1 1, n 1 S σ 011 Ing. Janurová Kateřina, FEI VŠB-TU Ostrava, STATISTIKA

Řešení: Ze zadání předpokládáme, že rozptyl životnosti žárovek vyrobených na jednotlivých linkách je stejný: σ = 1 σ Pak Testujeme: 0 žárovek z linky 1 => n 1 = 0 a 30 žárovek z linky => n = 30. S P S S S 1 > = 1 F19 9 F n 1 1, n 1 1,, ( ) 0045 1 S S F 19, 9 Pravděpodobnost, že u vzorku z linky 1 bude zjištěn více než dvojnásobný rozptyl oproti rozptylu zjištěnému u vzorku z linky je přibližně 4,5 %. 011 Ing. Janurová Kateřina, FEI VŠB-TU Ostrava, STATISTIKA

Test 011 Ing. Janurová Kateřina, FEI VŠB-TU Ostrava, STATISTIKA

1. Střední hodnota pevně zvolené náhodné veličiny je a) náhodná veličina, b) konstanta, c) náhodný jev, d) výběrová charakteristika. 011 Ing. Janurová Kateřina, FEI VŠB-TU Ostrava, STATISTIKA

1. Střední hodnota pevně zvolené náhodné veličiny je a) náhodná veličina, b) konstanta, c) náhodný jev, d) výběrová charakteristika. 011 Ing. Janurová Kateřina, FEI VŠB-TU Ostrava, STATISTIKA

. Výběrový průměr je a) náhodná veličina, b) konstanta, c) náhodný jev, d) populační charakteristika. 011 Ing. Janurová Kateřina, FEI VŠB-TU Ostrava, STATISTIKA

. Výběrový průměr je a) náhodná veličina, b) konstanta, c) náhodný jev, d) populační charakteristika. 011 Ing. Janurová Kateřina, FEI VŠB-TU Ostrava, STATISTIKA

3. S rostoucím rozsahem výběru se obvykle rozptyl průměru a) snižuje, b) zvyšuje, c) nemění. 011 Ing. Janurová Kateřina, FEI VŠB-TU Ostrava, STATISTIKA

3. S rostoucím rozsahem výběru se obvykle rozptyl průměru a) snižuje, b) zvyšuje, c) nemění. 011 Ing. Janurová Kateřina, FEI VŠB-TU Ostrava, STATISTIKA

4. Statistická indukce je a) experiment, b) metoda, která umožňuje odhadnout vlastnosti výběru na základě znalostí vlastností populace, c) zobecnění statistických výsledků získaných zpracováním výběru na celou populaci, d) metoda sběru dat. 011 Ing. Janurová Kateřina, FEI VŠB-TU Ostrava, STATISTIKA

4. Statistická indukce je a) experiment, b) metoda, která umožňuje odhadnout vlastnosti výběru na základě znalostí vlastností populace, c) zobecnění statistických výsledků získaných zpracováním výběru na celou populaci, d) metoda sběru dat. 011 Ing. Janurová Kateřina, FEI VŠB-TU Ostrava, STATISTIKA

5. Zákon velkých čísel v důsledku říká, že při dostatečném rozsahu výběru a) má průměr normální rozdělení, b) má průměr Studentovo rozdělení, c) se střední hodnota přibližuje teoretické hodnotě průměru, d) se relativní četnost přibližuje teoretické hodnotě pravděpodobnosti. 011 Ing. Janurová Kateřina, FEI VŠB-TU Ostrava, STATISTIKA

5. Zákon velkých čísel v důsledku říká, že při dostatečném rozsahu výběru a) má průměr normální rozdělení, b) má průměr Studentovo rozdělení, c) se střední hodnota přibližuje teoretické hodnotě průměru, d) se relativní četnost přibližuje teoretické hodnotě pravděpodobnosti. 011 Ing. Janurová Kateřina, FEI VŠB-TU Ostrava, STATISTIKA

6. Pro modelování průměru výběru dostatečně velkého rozsahu je vhodné použít rozdělení a) normální, b) Pearsonovo ( χ ), c) Studentovo, d) Fisher-Snedecorovo. 011 Ing. Janurová Kateřina, FEI VŠB-TU Ostrava, STATISTIKA

6. Pro modelování průměru výběru dostatečně velkého rozsahu je vhodné použít rozdělení a) normální, b) Pearsonovo ( χ ), c) Studentovo, d) Fisher-Snedecorovo. 011 Ing. Janurová Kateřina, FEI VŠB-TU Ostrava, STATISTIKA

7. Pro modelování průměru výběru malého rozsahu je vhodné použít rozdělení a) normální, b) Pearsonovo ( χ ), c) Studentovo, d) Fisher-Snedecorovo. 011 Ing. Janurová Kateřina, FEI VŠB-TU Ostrava, STATISTIKA

7. Pro modelování průměru výběru malého rozsahu je vhodné použít rozdělení a) normální, b) Pearsonovo ( χ ), c) Studentovo, d) Fisher-Snedecorovo. 011 Ing. Janurová Kateřina, FEI VŠB-TU Ostrava, STATISTIKA

8. Pro modelování relativní četnosti ve výběru o dostatečném rozsahu je vhodné použít rozdělení a) normální, b) Pearsonovo ( χ ), c) Studentovo, d) Fisher-Snedecorovo. 011 Ing. Janurová Kateřina, FEI VŠB-TU Ostrava, STATISTIKA

8. Pro modelování relativní četnosti ve výběru o dostatečném rozsahu je vhodné použít rozdělení a) normální, b) Pearsonovo ( χ ), c) Studentovo, d) Fisher-Snedecorovo. 011 Ing. Janurová Kateřina, FEI VŠB-TU Ostrava, STATISTIKA

9. Pro modelování rozptylu výběru z normálního rozdělení je vhodné použít rozdělení a) normální, b) Pearsonovo ( χ ), c) Studentovo, d) Fisher-Snedecorovo. 011 Ing. Janurová Kateřina, FEI VŠB-TU Ostrava, STATISTIKA

9. Pro modelování rozptylu výběru z normálního rozdělení je vhodné použít rozdělení a) normální, b) Pearsonovo ( χ ), c) Studentovo, d) Fisher-Snedecorovo. 011 Ing. Janurová Kateřina, FEI VŠB-TU Ostrava, STATISTIKA

10. Pro modelování poměru rozptylů dvou výběrů z normálního rozdělení je vhodné použít rozdělení a) normální, b) Pearsonovo ( χ ), c) Studentovo, d) Fisher-Snedecorovo. 011 Ing. Janurová Kateřina, FEI VŠB-TU Ostrava, STATISTIKA

10. Pro modelování poměru rozptylů dvou výběrů z normálního rozdělení je vhodné použít rozdělení a) normální, b) Pearsonovo ( χ ), c) Studentovo, d) Fisher-Snedecorovo. 011 Ing. Janurová Kateřina, FEI VŠB-TU Ostrava, STATISTIKA