Statistika v příkladech



Podobné dokumenty
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

E(X) = np D(X) = np(1 p) 1 2p np(1 p) (n + 1)p 1 ˆx (n + 1)p. A 3 (X) =

Pravděpodobnost a matematická statistika

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Regresní analýza 1. Regresní analýza

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Testování statistických hypotéz

Diskrétní náhodná veličina

Poznámky k předmětu Aplikovaná statistika, 4. téma

Vybraná rozdělení náhodné veličiny

Výběrové charakteristiky a jejich rozdělení

Inženýrská statistika pak představuje soubor postupů a aplikací teoretických principů v oblasti inženýrské činnosti.

STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky)

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

4. ZÁKLADNÍ TYPY ROZDĚLENÍ PRAVDĚPODOBNOSTI DISKRÉTNÍ NÁHODNÉ VELIČINY

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM

VYBRANÁ ROZDĚLENÍ. DISKRÉTNÍ NÁH. VELIČINY Martina Litschmannová

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Statistické metody - nástroj poznání a rozhodování anebo zdroj omylů a lží

Pravděpodobnost a aplikovaná statistika

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Poznámky k předmětu Aplikovaná statistika, 4. téma

Pojmy z kombinatoriky, pravděpodobnosti, znalosti z kapitoly náhodná veličina, znalost parciálních derivací, dvojného integrálu.

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

ROZDĚLENÍ NÁHODNÝCH VELIČIN

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Náhodná veličina a rozdělení pravděpodobnosti

PRAVDĚPODOBNOST A STATISTIKA

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

Odhady Parametrů Lineární Regrese

8. Normální rozdělení

KGG/STG Statistika pro geografy

Téma 22. Ondřej Nývlt

Charakterizace rozdělení

Tomáš Karel LS 2012/2013

Odhad parametrů N(µ, σ 2 )

12. cvičení z PST. 20. prosince 2017

1. Náhodný vektor (X, Y ) má diskrétní rozdělení s pravděpodobnostní funkcí p, kde. p(x, y) = a(x + y + 1), x, y {0, 1, 2}.

15. T e s t o v á n í h y p o t é z

Minikurz aplikované statistiky. Minikurz aplikované statistiky p.1

Statistika II. Jiří Neubauer

5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

Zpracování náhodného vektoru. Ing. Michal Dorda, Ph.D.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

STATISTIKA. Inovace předmětu. Obsah. 1. Inovace předmětu STATISTIKA Sylabus pro předmět STATISTIKA Pomůcky... 7

NÁHODNÁ VELIČINA. 3. cvičení

Tématické okruhy pro státní závěrečné zkoušky. bakalářské studium. studijní obor "Management jakosti"

Limitní věty teorie pravděpodobnosti. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Střední hodnota a rozptyl náhodné. kvantilu. Ing. Michael Rost, Ph.D.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

4ST201 STATISTIKA CVIČENÍ Č. 7

8.1. Definice: Normální (Gaussovo) rozdělení N(µ, σ 2 ) s parametry µ a. ( ) ϕ(x) = 1. označovat písmenem U. Její hustota je pak.

Tématické okruhy pro státní závěrečné zkoušky. bakalářské studium. studijní obor "Management jakosti"

Statistická analýza jednorozměrných dat

Korelační a regresní analýza

Tomáš Karel LS 2012/2013

X = x, y = h(x) Y = y. hodnotám x a jedné hodnotě y. Dostaneme tabulku hodnot pravděpodobnostní

Základy teorie pravděpodobnosti

Statistika. Regresní a korelační analýza Úvod do problému. Roman Biskup

15. T e s t o v á n í h y p o t é z

HODNOCENÍ VÝKONNOSTI ATRIBUTIVNÍCH ZNAKŮ JAKOSTI. Josef Křepela, Jiří Michálek. OSSM při ČSJ

Bakalářské studium na MFF UK v Praze Obecná matematika Zaměření: Stochastika. 1 Úvodní poznámky. Verze: 13. června 2013

Náhodná veličina X má Poissonovo rozdělení se střední hodnotou lambda. Poissonovo rozdělení je definováno jako. P(X=k) = 0,036

Matematika III. 4. října Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

MÍRY ZÁVISLOSTI (KORELACE A REGRESE)

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

Příklad 1. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 11

Přednáška. Diskrétní náhodná proměnná. Charakteristiky DNP. Základní rozdělení DNP

KGG/STG Statistika pro geografy

Kontingenční tabulky, korelační koeficienty

1. Přednáška. Ing. Miroslav Šulai, MBA

Náhodná veličina Číselné charakteristiky diskrétních náhodných veličin Spojitá náhodná veličina. Pravděpodobnost

Testování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času

KMA/P506 Pravděpodobnost a statistika KMA/P507 Statistika na PC

Tématické okruhy pro státní závěrečné zkoušky. bakalářské studium. studijní obor "Management jakosti"

6.1 Normální (Gaussovo) rozdělení

Aproximace binomického rozdělení normálním

ROZDĚLENÍ SPOJITÝCH NÁHODNÝCH VELIČIN

n = 2 Sdružená distribuční funkce (joint d.f.) n. vektoru F (x, y) = P (X x, Y y)

Zápočtová práce STATISTIKA I

= = 2368

Téma 2: Pravděpodobnostní vyjádření náhodných veličin

2 Zpracování naměřených dat. 2.1 Gaussův zákon chyb. 2.2 Náhodná veličina a její rozdělení

NÁHODNÝ VEKTOR. 4. cvičení

Základy teorie pravděpodobnosti

Statistika a spolehlivost v lékařství Charakteristiky spolehlivosti prvků I

Porovnání dvou výběrů

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1

1. Číselné posloupnosti - Definice posloupnosti, základní vlastnosti, operace s posloupnostmi, limita posloupnosti, vlastnosti limit posloupností,

Tomáš Karel LS 2012/2013

NÁHODNÉ VELIČINY JAK SE NÁHODNÁ ČÍSLA PŘEVEDOU NA HODNOTY NÁHODNÝCH VELIČIN?

You created this PDF from an application that is not licensed to print to novapdf printer (

Normy ČSN a ČSN ISO z oblasti aplikované statistiky (stav aktualizovaný k )

NMAI059 Pravděpodobnost a statistika

P13: Statistické postupy vyhodnocování únavových zkoušek, aplikace normálního, Weibullova rozdělení, apod.

Tomáš Karel LS 2012/2013

Úvod do teorie odhadu. Ing. Michael Rost, Ph.D.

Příklad 1. Řešení 1a. Řešení 1b. Řešení 1c ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 7

Transkript:

Verlag Dashöfer Statistika v příkladech Praktické aplikace řešené v MS Ecel Ukázkové tety z připravované učebnice Doc. Ing. Jan Kožíšek, CSc. Ing. Barbora Stieberová, Ph.D. Praha 0

Obsah Obsah. Předmluva 3. Obsah 4 3. Budoucí struktura kapitol 4 4. Ukázky učebních tetů s příklady 5 Ukázka : Dvourozměrná náhodná veličina 5 Ukázka : Základní pravděpodobnostní rozdělení (modely) 0 Ukázka 3: Rozdělení spojitých náhodných veličin 4 Ukázka 4: Příklad testování hypotéz při regresní a korelační analýze 9 5. Ukázka úloh 6. Ukázka slovníčku důležitých pojmů 3

. Předmluva. Předmluva Vážení čtenáři, dostává se vám do rukou ukázka z připravovaného vydání učebnice statistiky, která je určena studentům vysokých škol, především technických oborů, a také všem, kteří se setkávají se statistikou při řešení problémů v podnikové prai výrobním manažerům, technikům, kontrolorům nebo manažerům v oblasti řízení kvality. Kniha je rozdělena do 8 kapitol a zahrnuje jak základní statistické metody používané v celé řadě vědních disciplín a oblastí, tak také aplikace statistických metod pro technickou a výrobní prai statistiku v metrologii, statistickou analýzu a regulaci výrobního procesu, statistickou přejímku a také statistiku ve spolehlivosti. Začíná se metodami popisné statistiky, následuje navržení vhodných pravděpodobnostních modelů, aproimace a vyrovnání. Navazují metody matematické statistiky, a to statistický odhad a ověřování statistických hypotéz včetně neparametrických testů. Jednotlivé kapitoly obsahují teoretický výklad doplněný pro rychlé pochopení problematiky velkým množstvím detailně zpracovaných příkladů. Důraz je kladen na správné použití metod v prai a na interpretaci získaných výsledků. Příklady jsou řešeny početně a také v MS Ecel. Tento software byl vybrán pro jeho nejsnazší dostupnost všem čtenářům a jeho názornost při řešení příkladů. K publikaci je pro lepší pochopení přiloženo CD s řešením všech příkladů v MS Ecel, což umožňuje také rozvíjet dovednost pracovat s tímto softwarem. Samozřejmostí je i soubor úloh pro samostatnou práci včetně výsledků. Každá kapitola je doplněna anglicko-českým slovníčkem základních pojmů, aby se čtenáři orientovali v zahraniční literatuře a byli vybaveni pro práci v mezinárodních společnostech. Za připomínky a podněty předem děkujeme. Autoři Praha, říjen 0 3

. Obsah. Obsah. Úvod. Popisná statistika 3. Regresní a korelační analýza 4. Základy pravděpodobnosti 5. Náhodné veličiny 6. Pravděpodobnostní modely 7. Limitní vlastnosti náhodných veličin 8. Aproimace a vyrovnání 9. Náhodný výběr a výběrová rozdělení 0. Statistický odhad. Ověřování statistických hypotéz. Vybrané neparametrické testy 3. Analýza rozptylu 4. Statistika v metrologii 5. Statistická analýza výrobního procesu 6. Statistická regulace procesů 7. Statistická přejímka 8. Statistika ve spolehlivosti 9. Statistické tabulky 3. Budoucí struktura kapitol. Výkladový učební tet s řešenými příklady. Úlohy 3. Výsledky úloh 4. Pojmy k zapamatování (odborný česko-anglický slovníček) 4

4. Ukázky učebních tetů s příklady 4. Ukázky učebních tetů s příklady Ukázka : Dvourozměrná náhodná veličina Podmíněná rozdělení V kapitole základy pravděpodobnosti jsme se zabývali podmíněnou pravděpodobností P( AB) náhodných jevů, tj. pravděpodobností náhodného jevu A podmíněného eistencí (výskytem) náhodného jevu B. Nyní se budeme zabývat podmíněnými rozděleními náhodných veličin. Podmíněné pravděpodobnosti U dvourozměrné diskrétní náhodné veličiny zadané tabulkou máme dány pravděpodobnosti p( i; yj) uvnitř tabulky a okrajové (marginální) pravděpodobnosti p( i ) a p( y j ). Pomocí těchto pravděpodobností můžeme definovat podmíněné pravděpodobnosti P( i yj) a P( yj i ). Tyto podmíněné pravděpodobnosti jsou definovány obdobně jako podmíněné pravděpodobnosti náhodných jevů. p i yj P( (, ) p i yj i yj)= a P( (, ) yj i)=. p y p ( j ) Podmíněné pravděpodobnosti dvourozměrné diskrétní náhodné veličiny (X, Y): t p (, y) = P ( / y) py = p, p (, y) = Py ( / ) p = py. i j j= j= i= t i j j i s i j i= i= s i j i i p( y) p ( y py ( i j ) t i, j) = j = p ( i ) P ( i / yj) = = =, Py ( j / i) = = =. py py p p s i j s j j j= t i i j Podmíněné hustoty pravděpodobnosti dvourozměrné spojité náhodné veličiny (X, Y): f( / y) = f( y, ) f y, f(y / ) f ( y) = (, ) f ( ), f (, y) d f (, y) dy f ( y) f( ) f ( / y) d = = = a f ( y / ) dy = = =. f ( y) f ( y) f ( ) f ( ) Podmíněné distribuční funkce diskrétní náhodné veličiny: F ( / y ) = P ( / y = y ) j a F ( y / ) = P ( y / = ) i, i je podmíněná pravděpodobnostní funkce (pravděpodobnost) náhodné veličiny X pro zvolenou hodnotu kde P X y = y j y = yj ( j =,,, t), a P y = i pro zvolenou hodnotu = i =,,, s. yj y je podmíněná pravděpodobnostní funkce (pravděpodobnost) náhodné veličiny Y i Podmíněné distribuční funkce spojité dvourozměrné náhodné veličiny (X, Y): f (, t y) dt F( / y) = f ( t / y) dt = = f (, y) d f ( t, y ) dt f ( y), 5

Statistika v příkladech y f (, z) dz F( y / ) = f ( z / ) dz = = f (, y) dy f (, z ) dz f ( ). Z předcházejících vztahů plyne: = = F y f y dy dt f, y d F a F y f d f, y dy dz F y. = = y Stochasticky nezávislé náhodné veličiny Pro stochasticky nezávislé diskrétní náhodné veličiny X a Y platí obdobné vztahy jako u nezávislých náhodných jevů: = a P y p y P y p i j i ( j i)= ( j). Pro stochasticky nezávislé náhodné veličiny X a Y spojité platí pro libovolnou dvojici (, y): f ( y)= f ( ) =. a f y f y Po dosazení předcházejících vztahů do vzorce pro podmíněné pravděpodobnosti dostaneme: případně ( i j)= ( i) ( j), p, y p p y =. p,,..., p p... p s ( y, ) dvouroz- Po dosazení do vzorců pro podmíněné hustoty pravděpodobnosti obdržíme hustotu pravděpodobnosti f měrné spojité náhodné veličiny (X, Y) v případě stochastické nezávislosti náhodných veličin X a Y = f y, f f y. s Z výsledných vztahů vidíme, že v případě stochastické nezávislosti náhodných veličin X a Y můžeme soudit na pravděpodobnostní chování dvourozměrné náhodné veličiny (X, Y) z pravděpodobnostního (stochastického) chování jednotlivých náhodných veličin X a Y. Výsledné vztahy můžeme rozšířit na konečný počet mezi sebou (v souhrnu) nezávislých náhodných veličin =. f,,, f f f s s s Stochastickou (pravděpodobnostní) nezávislost dvou náhodných veličin můžeme definovat také pomocí distribučních funkcích náhodných veličin X a Y = F ( y )= F ( y), F y F = F y, F F y. Také tyto vztahy můžeme rozšířit na vícerozměrnou náhodnou veličinu při konečném počtu mezi sebou (v souhrnu) nezávislých náhodných veličin,,, s. =. F,,, F F F s s s 6

4. Ukázky učebních tetů s příklady Příklad. Tabulka obsahující rozdělení četností názorů na novou reklamu: (n = 354 respondentů) Úkol:. Stanovte pravděpodobnostní rozdělení.. Znázorněte zákon rozdělení graficky. 3. Určete podmíněné pravděpodobnosti P( i yj) a P( yj i). Pravděpodobnostní rozdělení Grafické znázornění Podmíněné pravděpodobnosti p i yj P( (, ) i yj)= p y ( j ) P(názor/ženy) p y 0 655 P( y)= (, ), = = 0, 53 p y 05, p y 0 469 P( y)= (, ), = = 0, 94 p y 05, Pro 53, % žen je reklama výborná. Pro 9,4 % žen je reklama dobrá. 7,5 % žen se reklama nelíbí. 7

Statistika v příkladech Podmíněné pravděpodobnosti p i yj P( (, ) yj i)= p y ( j ) P(pohlaví/výborná) p y 0 655 P( y )= (, ), = = 0, 60 p 0, 4350 p y 0 6949 P( y )= (, ), = = 0, 3896 p 0, 4350 Reklama je výborná pro: 6 % žen 39 % mužů Podmíněné střední hodnoty a podmíněné rozptyly Paralelou podmíněných (dílčích) průměrů y j a i v regresní a korelační analýze popisné (empirické) statistiky jsou u náhodných veličin podmíněné střední hodnoty E(Y/X) a E(X/Y), paralelou rozptylů podmíněných průměrů s y a s jsou podmíněné rozptyly D(Y/X) a D(X/Y). Podmíněné střední hodnoty E(Y/X) a E(X/Y) a podmíněné rozptyly D(Y/X) a D(X/Y) slouží k posouzení stochastické korelační závislosti (korelačního vztahu) mezi náhodnými veličinami Y a X. Podmíněné střední hodnoty diskrétních náhodných veličin Y a X: t = i j ( j i) j= EY X= yp y s ( j )= i ( i j) i= a E X Y= y P y. Podmíněné střední hodnoty spojitých náhodných veličin Y a X: = E Y X yf y dy a E Y X f y d. = = i ) a o měnlivosti náhod- Abychom získali představu o měnlivosti náhodné veličiny Y pro zvolené hodnoty X (tj. pro X né veličiny X pro zvolené hodnoty (pevné hodnoty) Y =, určíme podmíněné rozptyly. Podmíněné rozptyly D(Y/X) diskrétní náhodné veličiny Y a D(X/Y) diskrétní náhodné veličiny X: y j t D( Y X)= yj E( Y X = i) P yj i j = s DXY = E XY= y P y i= j j i j. Podmíněné rozptyly spojitých náhodných veličin Y a X: = D Y X y E Y X f y dy = D X Y E X Y f y d. 8

4. Ukázky učebních tetů s příklady Příklad. Vrátíme se k předchozímu příkladu. Vypočítáme si podmíněné střední hodnoty a podmíněné rozptyly pro názor na reklamu. (Abychom mohli stanovit očekávané hodnocení, je třeba převést slovní hodnocení na numerické vyjádření: Výborná 3, Dobrá, Nic moc.) Podmíněné střední hodnoty náhodné veličiny X (názor) pro hodnoty Y = ženy, muži 3 = = + + = E X Y= zeny Æ P i i y 3 0, 530 0, 938 0, 754, 355 Od žen se očekává průměrné bodové ohodnocení reklamám,355. i= 3 = i ( i )= + + = E X Y= muzi Æ P y 3 0, 339 0, 437 0, 373, 0 i= Od mužů se očekává průměrná známka reklamám,0. Podmíněné rozptyly hodnoty náhodné veličiny X (názor) pro hodnoty Y = ženy, muži s s D( X Y = yj)= i E( X Y = yj) P( y )= P( y ) E X Y = y i= i j i i j j i= D( X Y = ženy)= ( 3, 355) 0, 530 + (, 355) 0, 938 + (, 355) 0, 754 = 0, 5795 Rozptyly u hodnocení mužů a žen jsou obdobné. 9

Statistika v příkladech Ukázka : Základní pravděpodobnostní rozdělení (modely) Rozdělení diskrétních náhodných veličin Binomické rozdělení Budeme uvažovat n nezávislých pokusů, při každém z nich může nastat zdar s pravděpodobností p nebo nenastat s pravděpodobností π. Uvažujeme-li určité uspořádání výsledků n nezávislých pokusů, potom bude pravděpodobnost, že zdar nastane v pokusech a nenastane v ( n ) pokusech, rovna součinu pravděpodobností ve všech jednotlivých nezávislých pokusech. Tento součin je roven π ( π) a je vyjádřením tzv. Bernoulliho schématu. Takovýmito uspořádání- n mi n nezávislých pokusů, při nichž krát zdar nastane a ( n ) krát nenastane, jsou všechny možné kombinace té třídy z n prvků, tj. jejich počet je. Hledaná pravděpodobnost, že v n nezávislých pokusech zdar nastane krát a nenastane n krát je rovna n n P( X = )= π ( π). Rozdělení pravděpodobností dané tímto vztahem nazýváme binomické a charakterizuje tzv. výběr s vracením. E( X)= nπ D( X)= nπ( π), σ( X)= nπ ( π). Příklad. Zmetkovitost výrobní linky je,5 %. Jaká je pravděpodobnost, že při výběru 5 součástí bude zmetek? Můžou nastat např. tyto kombinace: NNNNNNNNNNNNNNZ pravděpodobnost této kombinace 0, 05 0, 05 NNNNNNNNNNNNNZN pravděpodobnost této kombinace 0, 05 0, 05 NNNNNNNNNNNNZNN pravděpodobnost této kombinace 0, 05 0, 05 NNNNNNNNNNNZNNN pravděpodobnost této kombinace 0, 05 0, 05 5 Celkem je kombinací 5 Takže hledaná pravděpodobnost P()= 0 05 0 05,, Celé rozdělení si můžeme stanovit v MS Ecel 5 0 0 0 0 BINOM.DIST(počet úspěšných pokusů; počet pokusů; pravděpodobnost úspěchu; PRAVDA, pokud chceme distribuční funkci, NEPRAVDA, pokud chceme pravděpodobnostní funkci) 0

4. Ukázky učebních tetů s příklady Hypergeometrické rozdělení Při statistické přejímce nebo destruktivních zkouškách nevracíme zpět výrobek do dávky nebo ho zničíme a jedná se tedy o tzv. výběr bez vracení. Pravděpodobnost výskytu ve výběru n není stálá, a proto znak, který takto vzniká, má jiné pravděpodobnostní chování než binomický znak. Vybereme-li místo n výrobků za sebou bez vracení zpět n výrobků najednou a ptáme se na pravděpodobnost, že ve výběru n výrobků je právě výrobků s vlastností a, přičemž v celkové dávce N výrobků je (M/N)00 % s vlastností a, jde o hypergeo metrické rozdělení. M N M n P( X = )= N n N počet výrobků celkem M počet výrobků s vlastností a celkem (tedy např. zmetků) (N-M) počet výrobků bez vlastnosti a v základním souboru (tedy např. počet dobrých výrobků v celém základním souboru) n výběr n je počet výrobků s vlastností a ve výběru (tedy např. počet zmetků ve výběru n) (n-) počet výrobků bez vlastnosti a ve výběru (tedy např. počet dobrých výrobků ve výběru) min (n, M) Pro N přechází rozdělení hypergeometrické v binomické rozdělení a mizí rozdíl mezi výběrem bez vracení a výběrem s vracením. Můžeme odvodit střední hodnotu a rozptyl přímo z definice E( X)= n M, D X n M M N n = N N N N ; σ ( X)= D( X). N n Výraz N je tzv. konečnostní násobitel, který má význam v teorii náhodných výběrů. Je patrné, že jej lze zanedbat pro nn< 0,05, ( 0 ),, M N < 0,0 a N. Pro n je také výběr bez vracení a výběr s vracením totožný, jde o výběr pouze jednoho výrobku (tj. alternativní rozdělení).

Statistika v příkladech Příklad. Z dodávky 500 výrobků je kontrolováno 5 výrobků. Zmetkovitost činí 6 %. Jaká je pravděpodobnost, že v 5 vybraných výrobcích bude 0,,, 3, 4, 5 zmetků? Řešení M N M n P( X = )= N n 30 P( X = 470 0 5 470 469 466 0)= = = 0, 73 500 500 499 4 9 6 5 Pravděpodobnost, že v 5 vybraných výrobcích není žádný zmetek, je 73, %. V MS Ecel použijeme následující funkce pro získání hodnot pravděpodobnostní funkce a hodnot distribuční funkce HYPGEOM.DIST(počet zmetků ve výběru; velikost výběru; počet zmetků v základním souboru; počet hodnot v základním souboru; PRAVDA, pokud chceme distribuční funkci, NEPRAVDA, pokud chceme pravděpodobnostní funkci) =HYPGEOM.DIST(A6;5;30;500;NEPRAVDA) =HYPGEOM.DIST(A6;5;30;500;PRAVDA) Poissonovo rozdělení Poissonovo rozdělení je levostranně nesymetrické, a proto nachází uplatnění u tzv. řídkých jevů (počet vad, počet zameškaných dnů) jak v technologii, tak v konstrukci nebo v oblasti ekonomických jevů. Používá se pro modelování počtu událostí za jednotku času (kolik automobilů přijede na čerpací stanici za hodinu, kolik zákazníků přijde do obchodu za jeden den, kolik zákazníků se dovolá na zákaznickou linku za hodinu). Pravděpodobnost, že za jednotku času nastane událostí: λ P( X = )= e λ!, E( X)= µ = µ = λ, D( X)= µ = λ, σ( X )= λ.

4. Ukázky učebních tetů s příklady Poissonovo rozdělení aproimuje binomické rozdělení pro lim n π = λpro π 0, n. Poissonovo rozdělení je jednoparametrické. Tabulky distribuční i pravděpodobnostní funkce Poissonova rozdělení jsou uvedeny ve statistických tabulkách. Tyto hodnoty lze najít také pomocí MS Ecel. Příklad:.3 Průměrný počet nemocných pracovníků na dílně je 5 za měsíc. Určete pravděpodobnost, že za týden onemocní 3 pracovníci. λ P( X = )= e λ! V MS Ecel využijeme následující funkci P( X = 3)= e 54 ( 54) 3! 3 = 0, 093 Kde střední představuje λ =POISSON.DIST(A7;5/4;NEPRAVDA) =POISSON.DIST(A7;5/4;PRAVDA) Určete pravděpodobnost, že za týden onemocní víc než 3 pracovníci. P X > 3 F 3 0, 9673 0, 03869 = = = 3

Statistika v příkladech Ukázka 3: Rozdělení spojitých náhodných veličin Rozdělení rovnoměrné Náhodná veličina X má rovnoměrné rozdělení, jestliže má hustotu pravděpodobnosti: f ( )= pro ab, b a 0 pro ostatní a b Distribuční funkce F b a dt b a t a = = [] = pro ab, a b a a F( )= 0 Pro < a F( )= Pro > b a b E( X)= +, α 3 = 0, D( X)= ( b a) b a, α 4 = 8,, σ ( X )= 3. Toto rozdělení se používá pro charakterizování náhodných veličin spojitých se stejnou pravděpodobností výskytu v určitém intervalu stejné délky (např. rozměry, tolerance). 4

4. Ukázky učebních tetů s příklady Příklad 3. Na prohlídce výstavy je promítán doprovodný film o životě autora vystavovaných děl. Jeho projekce začíná každých 0 minut. Určete pravděpodobnost, že pokud náhodně přijdete do promítacího sálu, a) nebudete čekat víc než 5 minut, b) budete čekat mezi 5 a 0 minutami, c) střední hodnotu a směrodatnou odchylku. P( X < 5 )= F( 5 5 0 )= 0 0 = 0 5, 0 0 5 0 P( 5 < X < 0)= F( 0) F( 5)= 0 5 0 0 0 0 =, 0 E( X)= + 0 = 0 minut b a σ ( X )= 0 0 = = 5 minut 7 7, 3 3 Rozdělení eponenciální Náhodná veličina se řídí eponenciálním rozdělením, jestliže její hustota pravděpodobnosti je: f ( )= 0 pro 0 λ e λ pro > 0 K eponenciálnímu rozdělení můžeme dojít limitním přechodem od geometrického rozdělení. To vidíme i srovnáním charakteristik : E( X)= λ a D( X)= λ, F ( )= e λ. Eponenciální rozdělení slouží jako vhodný model pro výpočet pravděpodobnosti životnosti zařízení v teorii spolehlivosti. Je také velmi často používaným rozdělením v teorii front, tj. v teorii hromadné obsluhy, kde modeluje dobu mezi po sobě následujícími událostmi. 5

Statistika v příkladech Příklad 3. Průměrná životnost strojní součástky je 30 000 hodin. Určete:. pravděpodobnost, že součástka nevydrží více než 000 hodin. pravděpodobnost, že součástka vydrží více než 35 000 hodin 3. dobu, do kdy se porouchá 95 % součástek EXPON.DIST(A;/30000;NEPRAVDA) EXPON.DIST(A;/30000;PRAVDA) λ = 30000 000 = = = P X < 000 λ e λ d F 000 0, 064 0 35000 = = = P X > 35000 λ e λ d F 35000 0, 3 0 0, 95 = 30000ln ( 0, 95)= 8987, 97 hodiny 6

4. Ukázky učebních tetů s příklady Weibullovo rozdělení Používá se například v teorii spolehlivosti pro modelování doby života: hustota pravděpodobnosti: f ( )= λα α e λ α, > 0, λ >, α > 0 distribuční funkce: F( )= e λ α α = α > α < přechází Weibullovo rozdělení v eponenciální rozdělení úbytek je konstatní úbytek se s časem zmenšuje (na začátku se porouchává více součástek) úbytek se s časem zvyšuje (na konci se porouchává více součástek) λ souvisí se střední hodnotou Hustota rozdělení pravděpodobnosti Weibullova rozdělení f Distribuční funkce Weibullova rozdělení F( ) 7

Statistika v příkladech Příklad 3.3 Weibullovo rozdělení s parametry α = 5, a λ = 50 hodin modeluje životnost elektronické součástky. Nalezněte pravděpodobnost, že elektronická součástka vydrží funkční více než 900 hodin. Řešíme v MS Ecel a hledáme hodnotu distribuční funkce pro 900: Výsledkem je F ( 900)= 0, 75, takže hledaná pravděpodobnost je P ( X > 900) = F( 900) = 0, 75. 8

4. Ukázky učebních tetů s příklady Ukázka 4: Příklad testování hypotéz při regresní a korelační analýze Příklad 4. Posuďte vzájemnou závislost mezi hodnotami benzo(a)pyrenu (ng/m 3 ) naměřeného stacionárně v určité oblasti v průběhu měsíce února s hodnotami naměřených personálních epozic benzo(a)pyrenu (z odběrů krve). Naměřené údaje Grafické zobrazení lineární regrese a korelace V MS Ecel pro získání dat pro testování použijeme Data Analýza dat Regrese (viz kapitola o regresní a korelační analýze) a obdržíme následující výstup. Korelační koeficient Koeficient determinace Æ ( y i y ) Æ ( yi yi) ( y i y ) Hodnota p F testu Testové kritérium F ST p F = S n p R Regresní koeficienty s b b T = y β s b y Hodnota p t-testu Intervaly spolehlivosti pro střední hodnotu P( by t α sb βy by + t α sb )= α 9

Statistika v příkladech Testování regresního koeficientu a) t-test H : b y = β y = 0 0 H : b y β y 0 P( tα/ T t α/ )= α by β y P tα t α = α sb 0, 5056 0 P tα t α α 0 348 =, P(, 9983 3, 754, 9983)= 0, 95 Testové kritérium neleží v intervalu, což podporuje zamítnutí hypotézy o nulové hodnotě regresního koeficientu. t α = t0, 975 ( 63) =, 9983 (Určíme z Ecelu jako =T.INV(0,975;63)) Převod na p hodnotu Převod na p hodnotu spočívá v určení procenta, které je vymezeno testovým kritériem. by β y Tedy pro hodnotu T = = 3, 754 nalezneme odpovídající procento. Tuto hodnotu určíme z Ecelu (jedná se s b o dvoustranný test) jako = T.DIST.T(3,754;63) = 0,000385, tedy 0,0385 %. Tato hodnota je menší než 5 %, tzn., že hodnota podporuje zamítnutí hypotézy o nulové hodnotě regresního koeficientu. Tzn., že mezi jevy je závislost. b) Celkový F-test H : b y = β y = 0 0 H : b y β y 0 Testové kritérium F ST p 3,594 F = S n p 6,09 65 R = ( ) = 4, 05655 = = Kritická hodnota Fisher-Snedecorova rozdělení je F α p ; n p F0, 95 ; 63 3, 99, (určeno v Ecelu jako =F.INV(0,95;;63)). Významnost F ST p Pro hodnotu F = S n p R = 4, 073 nalezneme odpovídající procento. Tuto hodnotu určíme z Ecelu jako (=F.DIST(4,073;;63;)) = 0,000385, tedy 0,0385 %. Což odpovídá t-testu. 0

4. Ukázky učebních tetů s příklady Testování korelačního koeficientu H 0 : ρ = ρ 0 H : ρ ρ 0 T = r y r y [ n ] 0, 47 T = [ 65 ] = 3, 748 0, 47 ( α α ) P t T t P, 9983 3, 748, 9983 Testové kritérium neleží v intervalu, tzn., že máme podpořeno zamítnutí hypotézy nula o nulovosti korelačního koeficientu. Hodnota korelačního koeficientu 0,47 není příliš vysoká - jedná se o střední závislost. Intervaly spolehlivosti pro parametr β y P( by t α sb βy by + t α sb )= α P ( b y + ) = 0, 5056, 9983 0, 3478 0, 5056, 9983 0, 3478 0, 95 P( 0, 367 β y 0, 77493)= 0, 95

Statistika v příkladech Ukázka úloh. Úloha Vypočtěte procento zmetků, jestliže rozměry součástí mají normální rozdělení s parametry: µ = 6, 656 mm, σ 0 = 0, 080 mm. 0 00 Toleranční meze jsou 6, 500 +, + 0, 00.. Úloha Do servisu přijde průměrně 6 požadavků za hodinu. Určete pravděpodobnost, že do servisu přijde 0 požadavků za hodinu. Určete pravděpodobnost, že počet požadavků za hodinu nebude větší než 5 požadavků. 3. Úloha Pravděpodobnost výskytu jevu v každém z pokusů je stejná a je rovna 0,. Pokusy jsou na sobě nezávislé a provádějí se tak dlouho, dokud jev nenastane. Jaká je pravděpodobnost, že se bude muset provádět 5. pokus? 4. Úloha Jaká je pravděpodobnost, že v n = 0 pokusech se výrobek. jakostní třídy a možnosti výskytu 0,60 objeví 5krát, výrobek. jakostní třídy s možností výskytu 0,5 objeví 3krát, výrobek 3. jakostní třídy s možností výskytu 0,0 objeví krát a zmetek krát? 5. Úloha K montáži výrobku jsou potřebné 3 součástky. V dodávce první součástky se objevuje 0 % zmetků, druhé 5 % zmetků, třetí % zmetků. Najděte pravděpodobnost, že při montáží výrobku se neobjeví žádný,,, 3 zmetky. 6. Úloha V dodávce 00 hotových výrobků bývá 5 % zmetků. Provedeme výběr 5 výrobků. Určete pravděpodobnost, že mezi 5 vybranými výrobky nebude žádný zmetek. 7. Úloha Určete pravděpodobnosti P( X 8 ) a 6, P( X 0 ),a P 8, 6 X 0, µ = 9 a 8, σ = 0. 5, u normální náhodné veličiny s parametry 8. Úloha Určete pravděpodobnosti P( / U/ ), P( / U/ ), P( / U/ 3 ) u normované normální náhodné veličiny. 9. Úloha Určete pravděpodobnost výhry v I., II., III., IV. pořadí ve Sportce.

6. Ukázka slovníčku důležitých pojmů Ukázka slovníčku důležitých pojmů Statistický odhad Parametr základního souboru Výběrová charakteristika Velikost výběrového souboru Bodový odhad Konzistentní odhad Nevychýlený odhad Suficience Vydatný odhad Rao-Cramérova nerovnost Metoda momentů Metoda největší (maimální) věrohodnosti Věrohodnostní funkce Intervalový odhad Interval spolehlivosti (dvoustranný, jednostranný) Hladina významnosti Směrodatná odchylka výběrová Estimation theory Population parameter Sample statistic Sample size Point estimation (point estimator) Consistent estimator Unbiased estimator Sufficiency Efficient estimator Cramér Rao bound (CRB) or Cramér Rao lower bound (CRLB) Method of moments Maimum-likelihood estimation (MLE) Likelihood function Interval Estimation Confidence interval CI (two-tailed, one-tailed) (two-sided, one-sided) Confidence level Standard error Chyba odhadu u α σ n Margin of error 3