Statistika v příkladech

Rozměr: px
Začít zobrazení ze stránky:

Download "Statistika v příkladech"

Transkript

1 Verlag Dashöfer Statistika v příkladech Praktické aplikace řešené v MS Ecel Ukázkové tety z připravované učebnice Doc. Ing. Jan Kožíšek, CSc. Ing. Barbora Stieberová, Ph.D. Praha 0

2 Obsah Obsah. Předmluva 3. Obsah 4 3. Budoucí struktura kapitol 4 4. Ukázky učebních tetů s příklady 5 Ukázka : Dvourozměrná náhodná veličina 5 Ukázka : Základní pravděpodobnostní rozdělení (modely) 0 Ukázka 3: Rozdělení spojitých náhodných veličin 4 Ukázka 4: Příklad testování hypotéz při regresní a korelační analýze 9 5. Ukázka úloh 6. Ukázka slovníčku důležitých pojmů 3

3 . Předmluva. Předmluva Vážení čtenáři, dostává se vám do rukou ukázka z připravovaného vydání učebnice statistiky, která je určena studentům vysokých škol, především technických oborů, a také všem, kteří se setkávají se statistikou při řešení problémů v podnikové prai výrobním manažerům, technikům, kontrolorům nebo manažerům v oblasti řízení kvality. Kniha je rozdělena do 8 kapitol a zahrnuje jak základní statistické metody používané v celé řadě vědních disciplín a oblastí, tak také aplikace statistických metod pro technickou a výrobní prai statistiku v metrologii, statistickou analýzu a regulaci výrobního procesu, statistickou přejímku a také statistiku ve spolehlivosti. Začíná se metodami popisné statistiky, následuje navržení vhodných pravděpodobnostních modelů, aproimace a vyrovnání. Navazují metody matematické statistiky, a to statistický odhad a ověřování statistických hypotéz včetně neparametrických testů. Jednotlivé kapitoly obsahují teoretický výklad doplněný pro rychlé pochopení problematiky velkým množstvím detailně zpracovaných příkladů. Důraz je kladen na správné použití metod v prai a na interpretaci získaných výsledků. Příklady jsou řešeny početně a také v MS Ecel. Tento software byl vybrán pro jeho nejsnazší dostupnost všem čtenářům a jeho názornost při řešení příkladů. K publikaci je pro lepší pochopení přiloženo CD s řešením všech příkladů v MS Ecel, což umožňuje také rozvíjet dovednost pracovat s tímto softwarem. Samozřejmostí je i soubor úloh pro samostatnou práci včetně výsledků. Každá kapitola je doplněna anglicko-českým slovníčkem základních pojmů, aby se čtenáři orientovali v zahraniční literatuře a byli vybaveni pro práci v mezinárodních společnostech. Za připomínky a podněty předem děkujeme. Autoři Praha, říjen 0 3

4 . Obsah. Obsah. Úvod. Popisná statistika 3. Regresní a korelační analýza 4. Základy pravděpodobnosti 5. Náhodné veličiny 6. Pravděpodobnostní modely 7. Limitní vlastnosti náhodných veličin 8. Aproimace a vyrovnání 9. Náhodný výběr a výběrová rozdělení 0. Statistický odhad. Ověřování statistických hypotéz. Vybrané neparametrické testy 3. Analýza rozptylu 4. Statistika v metrologii 5. Statistická analýza výrobního procesu 6. Statistická regulace procesů 7. Statistická přejímka 8. Statistika ve spolehlivosti 9. Statistické tabulky 3. Budoucí struktura kapitol. Výkladový učební tet s řešenými příklady. Úlohy 3. Výsledky úloh 4. Pojmy k zapamatování (odborný česko-anglický slovníček) 4

5 4. Ukázky učebních tetů s příklady 4. Ukázky učebních tetů s příklady Ukázka : Dvourozměrná náhodná veličina Podmíněná rozdělení V kapitole základy pravděpodobnosti jsme se zabývali podmíněnou pravděpodobností P( AB) náhodných jevů, tj. pravděpodobností náhodného jevu A podmíněného eistencí (výskytem) náhodného jevu B. Nyní se budeme zabývat podmíněnými rozděleními náhodných veličin. Podmíněné pravděpodobnosti U dvourozměrné diskrétní náhodné veličiny zadané tabulkou máme dány pravděpodobnosti p( i; yj) uvnitř tabulky a okrajové (marginální) pravděpodobnosti p( i ) a p( y j ). Pomocí těchto pravděpodobností můžeme definovat podmíněné pravděpodobnosti P( i yj) a P( yj i ). Tyto podmíněné pravděpodobnosti jsou definovány obdobně jako podmíněné pravděpodobnosti náhodných jevů. p i yj P( (, ) p i yj i yj)= a P( (, ) yj i)=. p y p ( j ) Podmíněné pravděpodobnosti dvourozměrné diskrétní náhodné veličiny (X, Y): t p (, y) = P ( / y) py = p, p (, y) = Py ( / ) p = py. i j j= j= i= t i j j i s i j i= i= s i j i i p( y) p ( y py ( i j ) t i, j) = j = p ( i ) P ( i / yj) = = =, Py ( j / i) = = =. py py p p s i j s j j j= t i i j Podmíněné hustoty pravděpodobnosti dvourozměrné spojité náhodné veličiny (X, Y): f( / y) = f( y, ) f y, f(y / ) f ( y) = (, ) f ( ), f (, y) d f (, y) dy f ( y) f( ) f ( / y) d = = = a f ( y / ) dy = = =. f ( y) f ( y) f ( ) f ( ) Podmíněné distribuční funkce diskrétní náhodné veličiny: F ( / y ) = P ( / y = y ) j a F ( y / ) = P ( y / = ) i, i je podmíněná pravděpodobnostní funkce (pravděpodobnost) náhodné veličiny X pro zvolenou hodnotu kde P X y = y j y = yj ( j =,,, t), a P y = i pro zvolenou hodnotu = i =,,, s. yj y je podmíněná pravděpodobnostní funkce (pravděpodobnost) náhodné veličiny Y i Podmíněné distribuční funkce spojité dvourozměrné náhodné veličiny (X, Y): f (, t y) dt F( / y) = f ( t / y) dt = = f (, y) d f ( t, y ) dt f ( y), 5

6 Statistika v příkladech y f (, z) dz F( y / ) = f ( z / ) dz = = f (, y) dy f (, z ) dz f ( ). Z předcházejících vztahů plyne: = = F y f y dy dt f, y d F a F y f d f, y dy dz F y. = = y Stochasticky nezávislé náhodné veličiny Pro stochasticky nezávislé diskrétní náhodné veličiny X a Y platí obdobné vztahy jako u nezávislých náhodných jevů: = a P y p y P y p i j i ( j i)= ( j). Pro stochasticky nezávislé náhodné veličiny X a Y spojité platí pro libovolnou dvojici (, y): f ( y)= f ( ) =. a f y f y Po dosazení předcházejících vztahů do vzorce pro podmíněné pravděpodobnosti dostaneme: případně ( i j)= ( i) ( j), p, y p p y =. p,,..., p p... p s ( y, ) dvouroz- Po dosazení do vzorců pro podmíněné hustoty pravděpodobnosti obdržíme hustotu pravděpodobnosti f měrné spojité náhodné veličiny (X, Y) v případě stochastické nezávislosti náhodných veličin X a Y = f y, f f y. s Z výsledných vztahů vidíme, že v případě stochastické nezávislosti náhodných veličin X a Y můžeme soudit na pravděpodobnostní chování dvourozměrné náhodné veličiny (X, Y) z pravděpodobnostního (stochastického) chování jednotlivých náhodných veličin X a Y. Výsledné vztahy můžeme rozšířit na konečný počet mezi sebou (v souhrnu) nezávislých náhodných veličin =. f,,, f f f s s s Stochastickou (pravděpodobnostní) nezávislost dvou náhodných veličin můžeme definovat také pomocí distribučních funkcích náhodných veličin X a Y = F ( y )= F ( y), F y F = F y, F F y. Také tyto vztahy můžeme rozšířit na vícerozměrnou náhodnou veličinu při konečném počtu mezi sebou (v souhrnu) nezávislých náhodných veličin,,, s. =. F,,, F F F s s s 6

7 4. Ukázky učebních tetů s příklady Příklad. Tabulka obsahující rozdělení četností názorů na novou reklamu: (n = 354 respondentů) Úkol:. Stanovte pravděpodobnostní rozdělení.. Znázorněte zákon rozdělení graficky. 3. Určete podmíněné pravděpodobnosti P( i yj) a P( yj i). Pravděpodobnostní rozdělení Grafické znázornění Podmíněné pravděpodobnosti p i yj P( (, ) i yj)= p y ( j ) P(názor/ženy) p y P( y)= (, ), = = 0, 53 p y 05, p y P( y)= (, ), = = 0, 94 p y 05, Pro 53, % žen je reklama výborná. Pro 9,4 % žen je reklama dobrá. 7,5 % žen se reklama nelíbí. 7

8 Statistika v příkladech Podmíněné pravděpodobnosti p i yj P( (, ) yj i)= p y ( j ) P(pohlaví/výborná) p y P( y )= (, ), = = 0, 60 p 0, 4350 p y P( y )= (, ), = = 0, 3896 p 0, 4350 Reklama je výborná pro: 6 % žen 39 % mužů Podmíněné střední hodnoty a podmíněné rozptyly Paralelou podmíněných (dílčích) průměrů y j a i v regresní a korelační analýze popisné (empirické) statistiky jsou u náhodných veličin podmíněné střední hodnoty E(Y/X) a E(X/Y), paralelou rozptylů podmíněných průměrů s y a s jsou podmíněné rozptyly D(Y/X) a D(X/Y). Podmíněné střední hodnoty E(Y/X) a E(X/Y) a podmíněné rozptyly D(Y/X) a D(X/Y) slouží k posouzení stochastické korelační závislosti (korelačního vztahu) mezi náhodnými veličinami Y a X. Podmíněné střední hodnoty diskrétních náhodných veličin Y a X: t = i j ( j i) j= EY X= yp y s ( j )= i ( i j) i= a E X Y= y P y. Podmíněné střední hodnoty spojitých náhodných veličin Y a X: = E Y X yf y dy a E Y X f y d. = = i ) a o měnlivosti náhod- Abychom získali představu o měnlivosti náhodné veličiny Y pro zvolené hodnoty X (tj. pro X né veličiny X pro zvolené hodnoty (pevné hodnoty) Y =, určíme podmíněné rozptyly. Podmíněné rozptyly D(Y/X) diskrétní náhodné veličiny Y a D(X/Y) diskrétní náhodné veličiny X: y j t D( Y X)= yj E( Y X = i) P yj i j = s DXY = E XY= y P y i= j j i j. Podmíněné rozptyly spojitých náhodných veličin Y a X: = D Y X y E Y X f y dy = D X Y E X Y f y d. 8

9 4. Ukázky učebních tetů s příklady Příklad. Vrátíme se k předchozímu příkladu. Vypočítáme si podmíněné střední hodnoty a podmíněné rozptyly pro názor na reklamu. (Abychom mohli stanovit očekávané hodnocení, je třeba převést slovní hodnocení na numerické vyjádření: Výborná 3, Dobrá, Nic moc.) Podmíněné střední hodnoty náhodné veličiny X (názor) pro hodnoty Y = ženy, muži 3 = = + + = E X Y= zeny Æ P i i y 3 0, 530 0, 938 0, 754, 355 Od žen se očekává průměrné bodové ohodnocení reklamám,355. i= 3 = i ( i )= + + = E X Y= muzi Æ P y 3 0, 339 0, 437 0, 373, 0 i= Od mužů se očekává průměrná známka reklamám,0. Podmíněné rozptyly hodnoty náhodné veličiny X (názor) pro hodnoty Y = ženy, muži s s D( X Y = yj)= i E( X Y = yj) P( y )= P( y ) E X Y = y i= i j i i j j i= D( X Y = ženy)= ( 3, 355) 0, (, 355) 0, (, 355) 0, 754 = 0, 5795 Rozptyly u hodnocení mužů a žen jsou obdobné. 9

10 Statistika v příkladech Ukázka : Základní pravděpodobnostní rozdělení (modely) Rozdělení diskrétních náhodných veličin Binomické rozdělení Budeme uvažovat n nezávislých pokusů, při každém z nich může nastat zdar s pravděpodobností p nebo nenastat s pravděpodobností π. Uvažujeme-li určité uspořádání výsledků n nezávislých pokusů, potom bude pravděpodobnost, že zdar nastane v pokusech a nenastane v ( n ) pokusech, rovna součinu pravděpodobností ve všech jednotlivých nezávislých pokusech. Tento součin je roven π ( π) a je vyjádřením tzv. Bernoulliho schématu. Takovýmito uspořádání- n mi n nezávislých pokusů, při nichž krát zdar nastane a ( n ) krát nenastane, jsou všechny možné kombinace té třídy z n prvků, tj. jejich počet je. Hledaná pravděpodobnost, že v n nezávislých pokusech zdar nastane krát a nenastane n krát je rovna n n P( X = )= π ( π). Rozdělení pravděpodobností dané tímto vztahem nazýváme binomické a charakterizuje tzv. výběr s vracením. E( X)= nπ D( X)= nπ( π), σ( X)= nπ ( π). Příklad. Zmetkovitost výrobní linky je,5 %. Jaká je pravděpodobnost, že při výběru 5 součástí bude zmetek? Můžou nastat např. tyto kombinace: NNNNNNNNNNNNNNZ pravděpodobnost této kombinace 0, 05 0, 05 NNNNNNNNNNNNNZN pravděpodobnost této kombinace 0, 05 0, 05 NNNNNNNNNNNNZNN pravděpodobnost této kombinace 0, 05 0, 05 NNNNNNNNNNNZNNN pravděpodobnost této kombinace 0, 05 0, 05 5 Celkem je kombinací 5 Takže hledaná pravděpodobnost P()= ,, Celé rozdělení si můžeme stanovit v MS Ecel BINOM.DIST(počet úspěšných pokusů; počet pokusů; pravděpodobnost úspěchu; PRAVDA, pokud chceme distribuční funkci, NEPRAVDA, pokud chceme pravděpodobnostní funkci) 0

11 4. Ukázky učebních tetů s příklady Hypergeometrické rozdělení Při statistické přejímce nebo destruktivních zkouškách nevracíme zpět výrobek do dávky nebo ho zničíme a jedná se tedy o tzv. výběr bez vracení. Pravděpodobnost výskytu ve výběru n není stálá, a proto znak, který takto vzniká, má jiné pravděpodobnostní chování než binomický znak. Vybereme-li místo n výrobků za sebou bez vracení zpět n výrobků najednou a ptáme se na pravděpodobnost, že ve výběru n výrobků je právě výrobků s vlastností a, přičemž v celkové dávce N výrobků je (M/N)00 % s vlastností a, jde o hypergeo metrické rozdělení. M N M n P( X = )= N n N počet výrobků celkem M počet výrobků s vlastností a celkem (tedy např. zmetků) (N-M) počet výrobků bez vlastnosti a v základním souboru (tedy např. počet dobrých výrobků v celém základním souboru) n výběr n je počet výrobků s vlastností a ve výběru (tedy např. počet zmetků ve výběru n) (n-) počet výrobků bez vlastnosti a ve výběru (tedy např. počet dobrých výrobků ve výběru) min (n, M) Pro N přechází rozdělení hypergeometrické v binomické rozdělení a mizí rozdíl mezi výběrem bez vracení a výběrem s vracením. Můžeme odvodit střední hodnotu a rozptyl přímo z definice E( X)= n M, D X n M M N n = N N N N ; σ ( X)= D( X). N n Výraz N je tzv. konečnostní násobitel, který má význam v teorii náhodných výběrů. Je patrné, že jej lze zanedbat pro nn< 0,05, ( 0 ),, M N < 0,0 a N. Pro n je také výběr bez vracení a výběr s vracením totožný, jde o výběr pouze jednoho výrobku (tj. alternativní rozdělení).

12 Statistika v příkladech Příklad. Z dodávky 500 výrobků je kontrolováno 5 výrobků. Zmetkovitost činí 6 %. Jaká je pravděpodobnost, že v 5 vybraných výrobcích bude 0,,, 3, 4, 5 zmetků? Řešení M N M n P( X = )= N n 30 P( X = )= = = 0, Pravděpodobnost, že v 5 vybraných výrobcích není žádný zmetek, je 73, %. V MS Ecel použijeme následující funkce pro získání hodnot pravděpodobnostní funkce a hodnot distribuční funkce HYPGEOM.DIST(počet zmetků ve výběru; velikost výběru; počet zmetků v základním souboru; počet hodnot v základním souboru; PRAVDA, pokud chceme distribuční funkci, NEPRAVDA, pokud chceme pravděpodobnostní funkci) =HYPGEOM.DIST(A6;5;30;500;NEPRAVDA) =HYPGEOM.DIST(A6;5;30;500;PRAVDA) Poissonovo rozdělení Poissonovo rozdělení je levostranně nesymetrické, a proto nachází uplatnění u tzv. řídkých jevů (počet vad, počet zameškaných dnů) jak v technologii, tak v konstrukci nebo v oblasti ekonomických jevů. Používá se pro modelování počtu událostí za jednotku času (kolik automobilů přijede na čerpací stanici za hodinu, kolik zákazníků přijde do obchodu za jeden den, kolik zákazníků se dovolá na zákaznickou linku za hodinu). Pravděpodobnost, že za jednotku času nastane událostí: λ P( X = )= e λ!, E( X)= µ = µ = λ, D( X)= µ = λ, σ( X )= λ.

13 4. Ukázky učebních tetů s příklady Poissonovo rozdělení aproimuje binomické rozdělení pro lim n π = λpro π 0, n. Poissonovo rozdělení je jednoparametrické. Tabulky distribuční i pravděpodobnostní funkce Poissonova rozdělení jsou uvedeny ve statistických tabulkách. Tyto hodnoty lze najít také pomocí MS Ecel. Příklad:.3 Průměrný počet nemocných pracovníků na dílně je 5 za měsíc. Určete pravděpodobnost, že za týden onemocní 3 pracovníci. λ P( X = )= e λ! V MS Ecel využijeme následující funkci P( X = 3)= e 54 ( 54) 3! 3 = 0, 093 Kde střední představuje λ =POISSON.DIST(A7;5/4;NEPRAVDA) =POISSON.DIST(A7;5/4;PRAVDA) Určete pravděpodobnost, že za týden onemocní víc než 3 pracovníci. P X > 3 F 3 0, , = = = 3

14 Statistika v příkladech Ukázka 3: Rozdělení spojitých náhodných veličin Rozdělení rovnoměrné Náhodná veličina X má rovnoměrné rozdělení, jestliže má hustotu pravděpodobnosti: f ( )= pro ab, b a 0 pro ostatní a b Distribuční funkce F b a dt b a t a = = [] = pro ab, a b a a F( )= 0 Pro < a F( )= Pro > b a b E( X)= +, α 3 = 0, D( X)= ( b a) b a, α 4 = 8,, σ ( X )= 3. Toto rozdělení se používá pro charakterizování náhodných veličin spojitých se stejnou pravděpodobností výskytu v určitém intervalu stejné délky (např. rozměry, tolerance). 4

15 4. Ukázky učebních tetů s příklady Příklad 3. Na prohlídce výstavy je promítán doprovodný film o životě autora vystavovaných děl. Jeho projekce začíná každých 0 minut. Určete pravděpodobnost, že pokud náhodně přijdete do promítacího sálu, a) nebudete čekat víc než 5 minut, b) budete čekat mezi 5 a 0 minutami, c) střední hodnotu a směrodatnou odchylku. P( X < 5 )= F( )= 0 0 = 0 5, P( 5 < X < 0)= F( 0) F( 5)= =, 0 E( X)= + 0 = 0 minut b a σ ( X )= 0 0 = = 5 minut 7 7, 3 3 Rozdělení eponenciální Náhodná veličina se řídí eponenciálním rozdělením, jestliže její hustota pravděpodobnosti je: f ( )= 0 pro 0 λ e λ pro > 0 K eponenciálnímu rozdělení můžeme dojít limitním přechodem od geometrického rozdělení. To vidíme i srovnáním charakteristik : E( X)= λ a D( X)= λ, F ( )= e λ. Eponenciální rozdělení slouží jako vhodný model pro výpočet pravděpodobnosti životnosti zařízení v teorii spolehlivosti. Je také velmi často používaným rozdělením v teorii front, tj. v teorii hromadné obsluhy, kde modeluje dobu mezi po sobě následujícími událostmi. 5

16 Statistika v příkladech Příklad 3. Průměrná životnost strojní součástky je hodin. Určete:. pravděpodobnost, že součástka nevydrží více než 000 hodin. pravděpodobnost, že součástka vydrží více než hodin 3. dobu, do kdy se porouchá 95 % součástek EXPON.DIST(A;/30000;NEPRAVDA) EXPON.DIST(A;/30000;PRAVDA) λ = = = = P X < 000 λ e λ d F 000 0, = = = P X > λ e λ d F , 3 0 0, 95 = 30000ln ( 0, 95)= 8987, 97 hodiny 6

17 4. Ukázky učebních tetů s příklady Weibullovo rozdělení Používá se například v teorii spolehlivosti pro modelování doby života: hustota pravděpodobnosti: f ( )= λα α e λ α, > 0, λ >, α > 0 distribuční funkce: F( )= e λ α α = α > α < přechází Weibullovo rozdělení v eponenciální rozdělení úbytek je konstatní úbytek se s časem zmenšuje (na začátku se porouchává více součástek) úbytek se s časem zvyšuje (na konci se porouchává více součástek) λ souvisí se střední hodnotou Hustota rozdělení pravděpodobnosti Weibullova rozdělení f Distribuční funkce Weibullova rozdělení F( ) 7

18 Statistika v příkladech Příklad 3.3 Weibullovo rozdělení s parametry α = 5, a λ = 50 hodin modeluje životnost elektronické součástky. Nalezněte pravděpodobnost, že elektronická součástka vydrží funkční více než 900 hodin. Řešíme v MS Ecel a hledáme hodnotu distribuční funkce pro 900: Výsledkem je F ( 900)= 0, 75, takže hledaná pravděpodobnost je P ( X > 900) = F( 900) = 0, 75. 8

19 4. Ukázky učebních tetů s příklady Ukázka 4: Příklad testování hypotéz při regresní a korelační analýze Příklad 4. Posuďte vzájemnou závislost mezi hodnotami benzo(a)pyrenu (ng/m 3 ) naměřeného stacionárně v určité oblasti v průběhu měsíce února s hodnotami naměřených personálních epozic benzo(a)pyrenu (z odběrů krve). Naměřené údaje Grafické zobrazení lineární regrese a korelace V MS Ecel pro získání dat pro testování použijeme Data Analýza dat Regrese (viz kapitola o regresní a korelační analýze) a obdržíme následující výstup. Korelační koeficient Koeficient determinace Æ ( y i y ) Æ ( yi yi) ( y i y ) Hodnota p F testu Testové kritérium F ST p F = S n p R Regresní koeficienty s b b T = y β s b y Hodnota p t-testu Intervaly spolehlivosti pro střední hodnotu P( by t α sb βy by + t α sb )= α 9

20 Statistika v příkladech Testování regresního koeficientu a) t-test H : b y = β y = 0 0 H : b y β y 0 P( tα/ T t α/ )= α by β y P tα t α = α sb 0, P tα t α α =, P(, , 754, 9983)= 0, 95 Testové kritérium neleží v intervalu, což podporuje zamítnutí hypotézy o nulové hodnotě regresního koeficientu. t α = t0, 975 ( 63) =, 9983 (Určíme z Ecelu jako =T.INV(0,975;63)) Převod na p hodnotu Převod na p hodnotu spočívá v určení procenta, které je vymezeno testovým kritériem. by β y Tedy pro hodnotu T = = 3, 754 nalezneme odpovídající procento. Tuto hodnotu určíme z Ecelu (jedná se s b o dvoustranný test) jako = T.DIST.T(3,754;63) = 0,000385, tedy 0,0385 %. Tato hodnota je menší než 5 %, tzn., že hodnota podporuje zamítnutí hypotézy o nulové hodnotě regresního koeficientu. Tzn., že mezi jevy je závislost. b) Celkový F-test H : b y = β y = 0 0 H : b y β y 0 Testové kritérium F ST p 3,594 F = S n p 6,09 65 R = ( ) = 4, = = Kritická hodnota Fisher-Snedecorova rozdělení je F α p ; n p F0, 95 ; 63 3, 99, (určeno v Ecelu jako =F.INV(0,95;;63)). Významnost F ST p Pro hodnotu F = S n p R = 4, 073 nalezneme odpovídající procento. Tuto hodnotu určíme z Ecelu jako (=F.DIST(4,073;;63;)) = 0,000385, tedy 0,0385 %. Což odpovídá t-testu. 0

21 4. Ukázky učebních tetů s příklady Testování korelačního koeficientu H 0 : ρ = ρ 0 H : ρ ρ 0 T = r y r y [ n ] 0, 47 T = [ 65 ] = 3, 748 0, 47 ( α α ) P t T t P, , 748, 9983 Testové kritérium neleží v intervalu, tzn., že máme podpořeno zamítnutí hypotézy nula o nulovosti korelačního koeficientu. Hodnota korelačního koeficientu 0,47 není příliš vysoká - jedná se o střední závislost. Intervaly spolehlivosti pro parametr β y P( by t α sb βy by + t α sb )= α P ( b y + ) = 0, 5056, , , 5056, , , 95 P( 0, 367 β y 0, 77493)= 0, 95

22 Statistika v příkladech Ukázka úloh. Úloha Vypočtěte procento zmetků, jestliže rozměry součástí mají normální rozdělení s parametry: µ = 6, 656 mm, σ 0 = 0, 080 mm Toleranční meze jsou 6, 500 +, + 0, 00.. Úloha Do servisu přijde průměrně 6 požadavků za hodinu. Určete pravděpodobnost, že do servisu přijde 0 požadavků za hodinu. Určete pravděpodobnost, že počet požadavků za hodinu nebude větší než 5 požadavků. 3. Úloha Pravděpodobnost výskytu jevu v každém z pokusů je stejná a je rovna 0,. Pokusy jsou na sobě nezávislé a provádějí se tak dlouho, dokud jev nenastane. Jaká je pravděpodobnost, že se bude muset provádět 5. pokus? 4. Úloha Jaká je pravděpodobnost, že v n = 0 pokusech se výrobek. jakostní třídy a možnosti výskytu 0,60 objeví 5krát, výrobek. jakostní třídy s možností výskytu 0,5 objeví 3krát, výrobek 3. jakostní třídy s možností výskytu 0,0 objeví krát a zmetek krát? 5. Úloha K montáži výrobku jsou potřebné 3 součástky. V dodávce první součástky se objevuje 0 % zmetků, druhé 5 % zmetků, třetí % zmetků. Najděte pravděpodobnost, že při montáží výrobku se neobjeví žádný,,, 3 zmetky. 6. Úloha V dodávce 00 hotových výrobků bývá 5 % zmetků. Provedeme výběr 5 výrobků. Určete pravděpodobnost, že mezi 5 vybranými výrobky nebude žádný zmetek. 7. Úloha Určete pravděpodobnosti P( X 8 ) a 6, P( X 0 ),a P 8, 6 X 0, µ = 9 a 8, σ = 0. 5, u normální náhodné veličiny s parametry 8. Úloha Určete pravděpodobnosti P( / U/ ), P( / U/ ), P( / U/ 3 ) u normované normální náhodné veličiny. 9. Úloha Určete pravděpodobnost výhry v I., II., III., IV. pořadí ve Sportce.

23 6. Ukázka slovníčku důležitých pojmů Ukázka slovníčku důležitých pojmů Statistický odhad Parametr základního souboru Výběrová charakteristika Velikost výběrového souboru Bodový odhad Konzistentní odhad Nevychýlený odhad Suficience Vydatný odhad Rao-Cramérova nerovnost Metoda momentů Metoda největší (maimální) věrohodnosti Věrohodnostní funkce Intervalový odhad Interval spolehlivosti (dvoustranný, jednostranný) Hladina významnosti Směrodatná odchylka výběrová Estimation theory Population parameter Sample statistic Sample size Point estimation (point estimator) Consistent estimator Unbiased estimator Sufficiency Efficient estimator Cramér Rao bound (CRB) or Cramér Rao lower bound (CRLB) Method of moments Maimum-likelihood estimation (MLE) Likelihood function Interval Estimation Confidence interval CI (two-tailed, one-tailed) (two-sided, one-sided) Confidence level Standard error Chyba odhadu u α σ n Margin of error 3

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická

Více

E(X) = np D(X) = np(1 p) 1 2p np(1 p) (n + 1)p 1 ˆx (n + 1)p. A 3 (X) =

E(X) = np D(X) = np(1 p) 1 2p np(1 p) (n + 1)p 1 ˆx (n + 1)p. A 3 (X) = Základní rozdělení pravděpodobnosti Diskrétní rozdělení pravděpodobnosti. Pojem Náhodná veličina s Binomickým rozdělením Bi(n, p), kde n je přirozené číslo, p je reálné číslo, < p < má pravděpodobnostní

Více

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 3. 11.

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 3. 11. UNIVERZITA OBRANY Fakulta ekonomiky a managementu Aplikace STAT1 Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 Jiří Neubauer, Marek Sedlačík, Oldřich Kříž 3. 11. 2012 Popis a návod k použití aplikace

Více

ROZDĚLENÍ NÁHODNÝCH VELIČIN

ROZDĚLENÍ NÁHODNÝCH VELIČIN ROZDĚLENÍ NÁHODNÝCH VELIČIN 1 Vytvořeno s podporou projektu Průřezová inovace studijních programů Lesnické a dřevařské fakulty MENDELU v Brně (LDF) s ohledem na discipliny společného základu (reg. č. CZ.1.07/2.2.00/28.0021)

Více

Tomáš Karel LS 2012/2013

Tomáš Karel LS 2012/2013 Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není

Více

5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza

5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza 5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza 5.1 Vícerozměrná data a vícerozměrná rozdělení Při zpracování vícerozměrných dat se hledají souvislosti mezi dvěma, případně

Více

STATISTIKA. Inovace předmětu. Obsah. 1. Inovace předmětu STATISTIKA... 2 2. Sylabus pro předmět STATISTIKA... 3 3. Pomůcky... 7

STATISTIKA. Inovace předmětu. Obsah. 1. Inovace předmětu STATISTIKA... 2 2. Sylabus pro předmět STATISTIKA... 3 3. Pomůcky... 7 Inovace předmětu STATISTIKA Obsah 1. Inovace předmětu STATISTIKA... 2 2. Sylabus pro předmět STATISTIKA... 3 3. Pomůcky... 7 1 1. Inovace předmětu STATISTIKA Předmět Statistika se na bakalářském oboru

Více

4. ZÁKLADNÍ TYPY ROZDĚLENÍ PRAVDĚPODOBNOSTI DISKRÉTNÍ NÁHODNÉ VELIČINY

4. ZÁKLADNÍ TYPY ROZDĚLENÍ PRAVDĚPODOBNOSTI DISKRÉTNÍ NÁHODNÉ VELIČINY 4. ZÁKLADNÍ TYPY ROZDĚLENÍ PRAVDĚPODOBNOSTI DISKRÉTNÍ NÁHODNÉ VELIČINY Průvodce studiem V této kapitole se seznámíte se základními typy rozložení diskrétní náhodné veličiny. Vašim úkolem by neměla být

Více

4ST201 STATISTIKA CVIČENÍ Č. 7

4ST201 STATISTIKA CVIČENÍ Č. 7 4ST201 STATISTIKA CVIČENÍ Č. 7 testování hypotéz parametrické testy test hypotézy o střední hodnotě test hypotézy o relativní četnosti test o shodě středních hodnot testování hypotéz v MS Excel neparametrické

Více

Korelační a regresní analýza

Korelační a regresní analýza Korelační a regresní analýza Analýza závislosti v normálním rozdělení Pearsonův (výběrový) korelační koeficient: r = s XY s X s Y, kde s XY = 1 n (x n 1 i=0 i x )(y i y ), s X (s Y ) je výběrová směrodatná

Více

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. Testování statistických hypotéz Ing. Michal Dorda, Ph.D. Testování normality Př. : Při simulaci provozu na křižovatce byla získána data o mezerách mezi přijíždějícími vozidly v [s]. Otestujte na hladině

Více

Statistika. Regresní a korelační analýza Úvod do problému. Roman Biskup

Statistika. Regresní a korelační analýza Úvod do problému. Roman Biskup Statistika Regresní a korelační analýza Úvod do problému Roman Biskup Jihočeská univerzita v Českých Budějovicích Ekonomická fakulta (Zemědělská fakulta) Katedra aplikované matematiky a informatiky 2008/2009

Více

Náhodná veličina X má Poissonovo rozdělení se střední hodnotou lambda. Poissonovo rozdělení je definováno jako. P(X=k) = 0,036

Náhodná veličina X má Poissonovo rozdělení se střední hodnotou lambda. Poissonovo rozdělení je definováno jako. P(X=k) = 0,036 Příklad : Statistika A, doc. Kropáč, str. 6, příklad 2 K benzínovému čerpadlu přijíždí průměrně 4 aut za hodinu. Určete pravděpodobnost, že během pěti minut přijede nejvýše jedno auto. Pokus: Zjištění,

Více

Tomáš Karel LS 2012/2013

Tomáš Karel LS 2012/2013 Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není

Více

Střední hodnota a rozptyl náhodné. kvantilu. Ing. Michael Rost, Ph.D.

Střední hodnota a rozptyl náhodné. kvantilu. Ing. Michael Rost, Ph.D. Střední hodnota a rozptyl náhodné veličiny, vybraná rozdělení diskrétních a spojitých náhodných veličin, pojem kvantilu Ing. Michael Rost, Ph.D. Príklad Předpokládejme že máme náhodnou veličinu X která

Více

HODNOCENÍ VÝKONNOSTI ATRIBUTIVNÍCH ZNAKŮ JAKOSTI. Josef Křepela, Jiří Michálek. OSSM při ČSJ

HODNOCENÍ VÝKONNOSTI ATRIBUTIVNÍCH ZNAKŮ JAKOSTI. Josef Křepela, Jiří Michálek. OSSM při ČSJ HODNOCENÍ VÝKONNOSTI ATRIBUTIVNÍCH ZNAKŮ JAKOSTI Josef Křepela, Jiří Michálek OSSM při ČSJ Červen 009 Hodnocení způsobilosti atributivních znaků jakosti (počet neshodných jednotek) Nechť p je pravděpodobnost

Více

2 Zpracování naměřených dat. 2.1 Gaussův zákon chyb. 2.2 Náhodná veličina a její rozdělení

2 Zpracování naměřených dat. 2.1 Gaussův zákon chyb. 2.2 Náhodná veličina a její rozdělení 2 Zpracování naměřených dat Důležitou součástí každé experimentální práce je statistické zpracování naměřených dat. V této krátké kapitole se budeme věnovat určení intervalů spolehlivosti získaných výsledků

Více

Testování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času

Testování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času Testování hypotéz 1 Jednovýběrové testy 90/ odhad času V podmínkách naprostého odloučení má voák prokázat schopnost orientace v čase. Úkolem voáka e provést odhad časového intervalu 1 hodiny bez hodinek

Více

676 + 4 + 100 + 196 + 0 + 484 + 196 + 324 + 64 + 324 = = 2368

676 + 4 + 100 + 196 + 0 + 484 + 196 + 324 + 64 + 324 = = 2368 Příklad 1 Je třeba prověřit, zda lze na 5% hladině významnosti pokládat za prokázanou hypotézu, že střední doba výroby výlisku je 30 sekund. Přitom 10 náhodně vybraných výlisků bylo vyráběno celkem 540

Více

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13 Příklad 1 Máme k dispozici výsledky prvního a druhého testu deseti sportovců. Na hladině významnosti 0,05 prověřte, zda jsou výsledky testů kladně korelované. 1.test : 7, 8, 10, 4, 14, 9, 6, 2, 13, 5 2.test

Více

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1 Logistická regrese Menu: QCExpert Regrese Logistická Modul Logistická regrese umožňuje analýzu dat, kdy odezva je binární, nebo frekvenční veličina vyjádřená hodnotami 0 nebo 1, případně poměry v intervalu

Více

10. Předpovídání - aplikace regresní úlohy

10. Předpovídání - aplikace regresní úlohy 10. Předpovídání - aplikace regresní úlohy Regresní úloha (analýza) je označení pro statistickou metodu, pomocí nichž odhadujeme hodnotu náhodné veličiny (tzv. závislé proměnné, cílové proměnné, regresandu

Více

6.1 Normální (Gaussovo) rozdělení

6.1 Normální (Gaussovo) rozdělení 6 Spojitá rozdělení 6.1 Normální (Gaussovo) rozdělení Ze spojitých rozdělení se v praxi setkáme nejčastěji s normálním rozdělením. Toto rozdělení je typické pro mnoho náhodných veličin z rozmanitých oborů

Více

You created this PDF from an application that is not licensed to print to novapdf printer (http://www.novapdf.com)

You created this PDF from an application that is not licensed to print to novapdf printer (http://www.novapdf.com) Závislost náhodných veličin Úvod Předchozí přednášky: - statistické charakteristiky jednoho výběrového nebo základního souboru - vztahy mezi výběrovým a základním souborem - vztahy statistických charakteristik

Více

Tomáš Karel LS 2012/2013

Tomáš Karel LS 2012/2013 Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není

Více

Porovnání dvou výběrů

Porovnání dvou výběrů Porovnání dvou výběrů Menu: QCExpert Porovnání dvou výběrů Tento modul je určen pro podrobnou analýzu dvou datových souborů (výběrů). Modul poskytuje dva postupy analýzy: porovnání dvou nezávislých výběrů

Více

MĚŘENÍ STATISTICKÝCH ZÁVISLOSTÍ

MĚŘENÍ STATISTICKÝCH ZÁVISLOSTÍ MĚŘENÍ STATISTICKÝCH ZÁVISLOSTÍ v praxi u jednoho prvku souboru se často zkoumá více veličin, které mohou na sobě různě záviset jednorozměrný výběrový soubor VSS X vícerozměrným výběrovým souborem VSS

Více

Normy ČSN a ČSN ISO z oblasti aplikované statistiky (stav aktualizovaný k 1.1.2008)

Normy ČSN a ČSN ISO z oblasti aplikované statistiky (stav aktualizovaný k 1.1.2008) Normy ČSN a ČSN ISO z oblasti aplikované statistiky (stav aktualizovaný k 1.1.2008) Ing. Vratislav Horálek, DrSc., předseda TNK 4 při ČNI 1 Terminologické normy [1] ČSN ISO 3534-1:1994 Statistika Slovník

Více

4ST201 STATISTIKA CVIČENÍ Č. 10

4ST201 STATISTIKA CVIČENÍ Č. 10 4ST201 STATISTIKA CVIČENÍ Č. 10 regresní analýza - vícenásobná lineární regrese korelační analýza Př. 10.1 Máte zadaný výstup regresní analýzy závislosti závisle proměnné Y na nezávisle proměnné X. Doplňte

Více

6. T e s t o v á n í h y p o t é z

6. T e s t o v á n í h y p o t é z 6. T e s t o v á n í h y p o t é z Na základě hodnot z realizace náhodného výběru činíme rozhodnutí o platnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlastnostech. Používáme k tomu vhodně

Více

NÁHODNÉ VELIČINY JAK SE NÁHODNÁ ČÍSLA PŘEVEDOU NA HODNOTY NÁHODNÝCH VELIČIN?

NÁHODNÉ VELIČINY JAK SE NÁHODNÁ ČÍSLA PŘEVEDOU NA HODNOTY NÁHODNÝCH VELIČIN? NÁHODNÉ VELIČINY GENEROVÁNÍ SPOJITÝCH A DISKRÉTNÍCH NÁHODNÝCH VELIČIN, VYUŽITÍ NÁHODNÝCH VELIČIN V SIMULACI, METODY TRANSFORMACE NÁHODNÝCH ČÍSEL NA HODNOTY NÁHODNÝCH VELIČIN. JAK SE NÁHODNÁ ČÍSLA PŘEVEDOU

Více

Úvodem Dříve les než stromy 3 Operace s maticemi

Úvodem Dříve les než stromy 3 Operace s maticemi Obsah 1 Úvodem 13 2 Dříve les než stromy 17 2.1 Nejednoznačnost terminologie 17 2.2 Volba metody analýzy dat 23 2.3 Přehled vybraných vícerozměrných metod 25 2.3.1 Metoda hlavních komponent 26 2.3.2 Faktorová

Více

Příklad 1. Řešení 1a. Řešení 1b. Řešení 1c ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 7

Příklad 1. Řešení 1a. Řešení 1b. Řešení 1c ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 7 Příklad 1 a) Autobusy městské hromadné dopravy odjíždějí ze zastávky v pravidelných intervalech 5 minut. Cestující může přijít na zastávku v libovolném okamžiku. Určete střední hodnotu a směrodatnou odchylku

Více

Normální (Gaussovo) rozdělení

Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení popisuje vlastnosti náhodné spojité veličiny, která vzniká složením různých náhodných vlivů, které jsou navzájem nezávislé, kterých je velký

Více

Biostatistika Cvičení 7

Biostatistika Cvičení 7 TEST Z TEORIE 1. Střední hodnota pevně zvolené náhodné veličiny je a) náhodná veličina, b) konstanta, c) náhodný jev, d) výběrová charakteristika. 2. Výběrový průměr je a) náhodná veličina, b) konstanta,

Více

Průzkumová analýza dat

Průzkumová analýza dat Průzkumová analýza dat Proč zkoumat data? Základ průzkumové analýzy dat položil John Tukey ve svém díle Exploratory Data Analysis (odtud zkratka EDA). Často se stává, že data, se kterými pracujeme, se

Více

6. Lineární regresní modely

6. Lineární regresní modely 6. Lineární regresní modely 6.1 Jednoduchá regrese a validace 6.2 Testy hypotéz v lineární regresi 6.3 Kritika dat v regresním tripletu 6.4 Multikolinearita a polynomy 6.5 Kritika modelu v regresním tripletu

Více

Tomáš Karel LS 2012/2013

Tomáš Karel LS 2012/2013 Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není

Více

Cvičení ze statistiky - 9. Filip Děchtěrenko

Cvičení ze statistiky - 9. Filip Děchtěrenko Cvičení ze statistiky - 9 Filip Děchtěrenko Minule bylo.. Dobrali jsme normální rozdělení Tyhle termíny by měly být známé: Inferenční statistika Konfidenční intervaly Z-test Postup při testování hypotéz

Více

24.11.2009 Václav Jirchář, ZTGB

24.11.2009 Václav Jirchář, ZTGB 24.11.2009 Václav Jirchář, ZTGB Síťová analýza 50.let V souvislosti s potřebou urychlit vývoj a výrobu raket POLARIS v USA při závodech ve zbrojení za studené války se SSSR V roce 1958 se díky aplikaci

Více

PRAVDĚPODOBNOST A STATISTIKA aneb Krátký průvodce skripty [1] a [2]

PRAVDĚPODOBNOST A STATISTIKA aneb Krátký průvodce skripty [1] a [2] PRAVDĚPODOBNOST A STATISTIKA aneb Krátký průvodce skripty [1] a [2] Použitá literatura: [1]: J.Reif, Z.Kobeda: Úvod do pravděpodobnosti a spolehlivosti, ZČU Plzeň, 2004 (2. vyd.) [2]: J.Reif: Metody matematické

Více

{ } ( 2) Příklad: Test nezávislosti kategoriálních znaků

{ } ( 2) Příklad: Test nezávislosti kategoriálních znaků Příklad: Test nezávislosti kategoriálních znaků Určete na hladině významnosti 5 % na základě dat zjištěných v rámci dotazníkového šetření ve Šluknově, zda existuje závislost mezi pohlavím respondenta a

Více

MATEMATICKO STATISTICKÉ PARAMETRY ANALYTICKÝCH VÝSLEDKŮ

MATEMATICKO STATISTICKÉ PARAMETRY ANALYTICKÝCH VÝSLEDKŮ MATEMATICKO STATISTICKÉ PARAMETRY ANALYTICKÝCH VÝSLEDKŮ Má-li analytický výsledek objektivně vypovídat o chemickém složení vzorku, musí splňovat určitá kriteria: Mezinárodní metrologický slovník (VIM 3),

Více

Popisná statistika kvantitativní veličiny

Popisná statistika kvantitativní veličiny StatSoft Popisná statistika kvantitativní veličiny Protože nám surová data obvykle žádnou smysluplnou informaci neposkytnou, je žádoucí vyjádřit tyto ve zhuštěnější formě. V předchozím dílu jsme začali

Více

Test z teorie VÝBĚROVÉ CHARAKTERISTIKY A INTERVALOVÉ ODHADY

Test z teorie VÝBĚROVÉ CHARAKTERISTIKY A INTERVALOVÉ ODHADY VÝBĚROVÉ CHARAKTERISTIKY A INTERVALOVÉ ODHADY Test z teorie 1. Střední hodnota pevně zvolené náhodné veličiny je a) náhodná veličina, b) konstanta, c) náhodný jev, d) výběrová charakteristika. 2. Výběrový

Více

Kontingenční tabulky, korelační koeficienty

Kontingenční tabulky, korelační koeficienty Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Mějme kategoriální proměnné X a Y. Vytvoříme tzv. kontingenční tabulku. Budeme tedy testovat hypotézu

Více

Statistické testování hypotéz II

Statistické testování hypotéz II PSY117/454 Statistická analýza dat v psychologii Přednáška 9 Statistické testování hypotéz II Přehled testů, rozdíly průměrů, velikost účinku, síla testu Základní výzkumné otázky/hypotézy 1. Stanovení

Více

Statistické metody v ekonomii. Ing. Michael Rost, Ph.D.

Statistické metody v ekonomii. Ing. Michael Rost, Ph.D. Statistické metody v ekonomii Ing. Michael Rost, Ph.D. Jihočeská univerzita v Českých Budějovicích Test χ 2 v kontingenční tabulce typu 2 2 Jde vlastně o speciální případ χ 2 testu pro čtyřpolní tabulku.

Více

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina Testování hypotéz Analýza dat z dotazníkových šetření Kuranova Pavlina Statistická hypotéza Možné cíle výzkumu Srovnání účinnosti různých metod Srovnání výsledků různých skupin Tzn. prokázání rozdílů mezi

Více

Intervalový odhad. Interval spolehlivosti = intervalový odhad nějakého parametru s danou pravděpodobností = konfidenční interval pro daný parametr

Intervalový odhad. Interval spolehlivosti = intervalový odhad nějakého parametru s danou pravděpodobností = konfidenční interval pro daný parametr StatSoft Intervalový odhad Dnes se budeme zabývat neodmyslitelnou součástí statistiky a to intervaly v nejrůznějších podobách. Toto téma je také úzce spojeno s tématem testování hypotéz, a tedy plynule

Více

8 Střední hodnota a rozptyl

8 Střední hodnota a rozptyl Břetislav Fajmon, UMAT FEKT, VUT Brno Této přednášce odpovídá kapitola 10 ze skript [1]. Také je k dispozici sbírka úloh [2], kde si můžete procvičit příklady z kapitol 2, 3 a 4. K samostatnému procvičení

Více

Statistické metody uţívané při ověřování platnosti hypotéz

Statistické metody uţívané při ověřování platnosti hypotéz Statistické metody uţívané při ověřování platnosti hypotéz Hypotéza Domněnka, předpoklad Nejčastěji o rozdělení, středních hodnotách, závislostech, Hypotézy ve vědeckém výzkumu pracovní, věcné hypotézy

Více

Pravděpodobnost, náhoda, kostky

Pravděpodobnost, náhoda, kostky Pravděpodobnost, náhoda, kostky Radek Pelánek IV122, jaro 2015 Výhled pravděpodobnost náhodná čísla lineární regrese detekce shluků Dnes lehce nesourodá směs úloh souvisejících s pravděpodobností krátké

Více

31. 3. 2014, Brno Hanuš Vavrčík Základy statistiky ve vědě

31. 3. 2014, Brno Hanuš Vavrčík Základy statistiky ve vědě 31. 3. 2014, Brno Hanuš Vavrčík Základy statistiky ve vědě Motto Statistika nuda je, má však cenné údaje. strana 3 Statistické charakteristiky Charakteristiky polohy jsou kolem ní seskupeny ostatní hodnoty

Více

Národníinformačnístředisko pro podporu jakosti

Národníinformačnístředisko pro podporu jakosti Národníinformačnístředisko pro podporu jakosti OVĚŘOVÁNÍ PŘEDPOKLADU NORMALITY Doc. Ing. Eva Jarošová, CSc. Ing. Jan Král Používané metody statistické testy: Chí-kvadrát test dobré shody Kolmogorov -Smirnov

Více

Pojem a úkoly statistiky

Pojem a úkoly statistiky Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Pojem a úkoly statistiky Statistika je věda, která se zabývá získáváním, zpracováním a analýzou dat pro potřeby

Více

Téma 10: Spolehlivost a bezpečnost stavebních nosných konstrukcí

Téma 10: Spolehlivost a bezpečnost stavebních nosných konstrukcí Téma 10: Spolehlivost a bezpečnost stavebních nosných konstrukcí Přednáška z předmětu: Pravděpodobnostní posuzování konstrukcí 4. ročník bakalářského studia Katedra stavební mechaniky Fakulta stavební

Více

Simulace. Simulace dat. Parametry

Simulace. Simulace dat. Parametry Simulace Simulace dat Menu: QCExpert Simulace Simulace dat Tento modul je určen pro generování pseudonáhodných dat s danými statistickými vlastnostmi. Nabízí čtyři typy rozdělení: normální, logaritmicko-normální,

Více

EKONOMETRIE 7. přednáška Fáze ekonometrické analýzy

EKONOMETRIE 7. přednáška Fáze ekonometrické analýzy EKONOMETRIE 7. přednáška Fáze ekonometrické analýzy Ekonometrická analýza proces, skládající se z následujících fází: a) specifikace b) kvantifikace c) verifikace d) aplikace Postupné zpřesňování jednotlivých

Více

T E O R I E C H Y B A V Y R O V N Á V A C Í P O

T E O R I E C H Y B A V Y R O V N Á V A C Í P O ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE FAKULTA STAVEBNÍ, OBOR GEODÉZIE A KARTOGRAFIE KATEDRA VYŠŠÍ GEODÉZIE název předmětu T E O R I E C H Y B A V Y R O V N Á V A C Í P O Č E T 2 č. úlohy 6 název úlohy T

Více

Hodina 50 Strana 1/14. Gymnázium Budějovická. Hodnocení akcií

Hodina 50 Strana 1/14. Gymnázium Budějovická. Hodnocení akcií Hodina 50 Strana /4 Gymnázium Budějovická Volitelný předmět Ekonomie - jednoletý BLOK ČÍSLO 8 Hodnocení akcií Předpokládaný počet : 9 hodin Použitá literatura : František Egermayer, Jan Kožíšek Statistická

Více

Rovnoměrné rozdělení

Rovnoměrné rozdělení Rovnoměrné rozdělení Nejjednodušší pravděpodobnostní rozdělení pro diskrétní náhodnou veličinu. V literatuře se také nazývá jako klasické rozdělení pravděpodobnosti. Náhodná veličina může nabývat n hodnot

Více

Přejímka jedním výběrem

Přejímka jedním výběrem Přejímka jedním výběrem Menu: QCExpert Přejímka Jedním výběrem Statistická přejímka jedním výběrem slouží k rozhodnutí, zda dané množství nějakých výrobků vyhovuje našim požadavkům na kvalitu, která je

Více

Měření závislosti statistických dat

Měření závislosti statistických dat 5.1 Měření závislosti statistických dat Každý pořádný astronom je schopen vám předpovědět, kde se bude nacházet daná hvězda půl hodiny před půlnocí. Ne každý je však téhož schopen předpovědět v případě

Více

Aplikovaná statistika pro učitele a žáky v hodinách zeměpisu aneb jak využít MS Excel v praxi. Geografický seminář 30. března 2011 Pavel Bednář

Aplikovaná statistika pro učitele a žáky v hodinách zeměpisu aneb jak využít MS Excel v praxi. Geografický seminář 30. března 2011 Pavel Bednář Aplikovaná statistika pro učitele a žáky v hodinách zeměpisu aneb jak využít MS Excel v praxi Geografický seminář 30. března 2011 Pavel Bednář Výchozí stav Sebehodnocení práce s MS Excel studujícími oboru

Více

NÁHODNÁ ČÍSLA. F(x) = 1 pro x 1. Náhodná čísla lze generovat některým z následujících generátorů náhodných čísel:

NÁHODNÁ ČÍSLA. F(x) = 1 pro x 1. Náhodná čísla lze generovat některým z následujících generátorů náhodných čísel: NÁHODNÁ ČÍSLA TYPY GENERÁTORŮ, LINEÁRNÍ KONGRUENČNÍ GENERÁTORY, TESTY NÁHODNOSTI, VYUŽITÍ HODNOT NÁHODNÝCH VELIČIN V SIMULACI CO JE TO NÁHODNÉ ČÍSLO? Náhodné číslo definujeme jako nezávislé hodnoty z rovnoměrného

Více

tazatel 1 2 3 4 5 6 7 8 Průměr ve 15 250 18 745 21 645 25 754 28 455 32 254 21 675 35 500 Počet 110 125 100 175 200 215 200 55 respondentů Rozptyl ve

tazatel 1 2 3 4 5 6 7 8 Průměr ve 15 250 18 745 21 645 25 754 28 455 32 254 21 675 35 500 Počet 110 125 100 175 200 215 200 55 respondentů Rozptyl ve Příklady k procvičení k průběžnému testu: 1) Při zpracování studie o průměrné výši měsíčních příjmů v České republice jsme získali data celkem od 8 tazatelů. Každý z těchto pěti souborů dat obsahoval odlišný

Více

Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu

Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu K čemu slouží statistika Popisuje velké soubory dat pomocí charakteristických čísel (popisná statistika). Hledá skryté zákonitosti v souborech

Více

Přednáška 9. Testy dobré shody. Grafická analýza pro ověření shody empirického a teoretického rozdělení

Přednáška 9. Testy dobré shody. Grafická analýza pro ověření shody empirického a teoretického rozdělení Přednáška 9 Testy dobré shody Grafická analýza pro ověření shody empirického a teoretického rozdělení χ 2 test dobré shody ověření, zda jsou relativní četnosti jednotlivých variant rovny číslům π 01 ;

Více

BAYESOVSKÉ ODHADY. Michal Friesl V NĚKTERÝCH MODELECH. Katedra matematiky Fakulta aplikovaných věd Západočeská univerzita v Plzni

BAYESOVSKÉ ODHADY. Michal Friesl V NĚKTERÝCH MODELECH. Katedra matematiky Fakulta aplikovaných věd Západočeská univerzita v Plzni BAYESOVSKÉ ODHADY V NĚKTERÝCH MODELECH Michal Friesl Katedra matematiky Fakulta aplikovaných věd Západočeská univerzita v Plzni Slunce Řidiči IQ Regrese Přežití Obvyklý model Pozorování X = (X 1,..., X

Více

Program Statistica Base 9. Mgr. Karla Hrbáčková, Ph.D.

Program Statistica Base 9. Mgr. Karla Hrbáčková, Ph.D. Program Statistica Base 9 Mgr. Karla Hrbáčková, Ph.D. OBSAH KURZU obsluha jednotlivých nástrojů, funkce pro import dat z jiných aplikací, práce s popisnou statistikou, vytváření grafů, analýza dat, výstupní

Více

Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie STATISTICKÉ ZPRACOVÁNÍ EXPERIMENTÁLNÍCH DAT

Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie STATISTICKÉ ZPRACOVÁNÍ EXPERIMENTÁLNÍCH DAT Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie STATISTICKÉ ZPRACOVÁNÍ EXPERIMENTÁLNÍCH DAT STATISTICKÁ ANALÝZA JEDNOROZMĚRNÝCH DAT Seminární práce 1 Brno, 2002 Ing. Pavel

Více

Vysoká škola báňská Technická univerzita Ostrava TEORIE ÚDRŽBY. učební text. Jan Famfulík. Jana Míková. Radek Krzyžanek

Vysoká škola báňská Technická univerzita Ostrava TEORIE ÚDRŽBY. učební text. Jan Famfulík. Jana Míková. Radek Krzyžanek Vysoká škola báňská Technická univerzita Ostrava TEORIE ÚDRŽBY učební text Jan Famfulík Jana Míková Radek Krzyžanek Ostrava 2007 Recenze: Prof. Ing. Milan Lánský, DrSc. Název: Teorie údržby Autor: Ing.

Více

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie 4EK211 Základy ekonometrie ZS 2015/16 Cvičení 7: Časově řady, autokorelace LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE 1. Časové řady Data: HDP.wf1

Více

PSY117/454 Statistická analýza dat v psychologii Přednáška 10

PSY117/454 Statistická analýza dat v psychologii Přednáška 10 PSY117/454 Statistická analýza dat v psychologii Přednáška 10 TESTY PRO NOMINÁLNÍ A ORDINÁLNÍ PROMĚNNÉ NEPARAMETRICKÉ METODY... a to mělo, jak sám vidíte, nedozírné následky. Smrť Analýza četností hodnot

Více

Praktická statistika. Petr Ponížil Eva Kutálková

Praktická statistika. Petr Ponížil Eva Kutálková Praktická statistika Petr Ponížil Eva Kutálková Zápis výsledků měření Předpokládejme, že známe hodnotu napětí U = 238,9 V i její chybu 3,3 V. Hodnotu veličiny zapíšeme na tolik míst, aby až poslední bylo

Více

VYUŽITÍ SIMULACE PŘI MODELOVÁNÍ PROVOZU NA SVÁŽNÉM PAHRBKU SEŘAĎOVACÍ STANICE

VYUŽITÍ SIMULACE PŘI MODELOVÁNÍ PROVOZU NA SVÁŽNÉM PAHRBKU SEŘAĎOVACÍ STANICE VYUŽITÍ SIMULACE PŘI MODELOVÁNÍ PROVOZU NA SVÁŽNÉM PAHRBKU SEŘAĎOVACÍ STANICE 1 Úvod Michal Dorda, Dušan Teichmann VŠB - TU Ostrava, Fakulta strojní, Institut dopravy Seřaďovací stanice jsou železniční

Více

Vysoká škola báňská technická univerzita Ostrava. Fakulta elektrotechniky a informatiky

Vysoká škola báňská technická univerzita Ostrava. Fakulta elektrotechniky a informatiky Vysoká škola báňská technická univerzita Ostrava Fakulta elektrotechniky a informatiky Bankovní účty (semestrální projekt statistika) Tomáš Hejret (hej124) 18.5.2013 Úvod Cílem tohoto projektu, zadaného

Více

t-test, Studentův párový test Ing. Michael Rost, Ph.D.

t-test, Studentův párový test Ing. Michael Rost, Ph.D. Testování hypotéz: dvouvýběrový t-test, Studentův párový test Ing. Michael Rost, Ph.D. Úvod do problému... Již známe jednovýběrový t-test, při kterém jsme měli k dispozici pouze jeden výběr. Můžeme se

Více

2. Friesl, M.: Posbírané příklady z pravděpodobnosti a statistiky. Internetový zdroj (viz odkaz).

2. Friesl, M.: Posbírané příklady z pravděpodobnosti a statistiky. Internetový zdroj (viz odkaz). 1 Cvičení z předmětu KMA/PST1 Pro získání zápočtu je nutno mimo docházky (max. 3 absence) uspět minimálně ve dvou ze tří písemek, které budou v průběhu semestru napsány. Součástí třetí písemky bude též

Více

LINEÁRNÍ REGRESE. Lineární regresní model

LINEÁRNÍ REGRESE. Lineární regresní model LINEÁRNÍ REGRESE Chemometrie I, David MILDE Lineární regresní model 1 Typy závislosti 2 proměnných FUNKČNÍ VZTAH: 2 závisle proměnné: určité hodnotě x odpovídá jediná hodnota y. KORELACE: 2 náhodné (nezávislé)

Více

1. Alternativní rozdělení A(p) (Bernoulli) je diskrétní rozdělení, kdy. p(0) = P (X = 0) = 1 p, p(1) = P (X = 1) = p, 0 < p < 1.

1. Alternativní rozdělení A(p) (Bernoulli) je diskrétní rozdělení, kdy. p(0) = P (X = 0) = 1 p, p(1) = P (X = 1) = p, 0 < p < 1. 2. Některá důležitá rozdělení Diskrétní rozdělení. Alternativní rozdělení Ap) Bernoulli) je diskrétní rozdělení, kdy náhodná veličina X nabývá pouze dvou hodnot a a pro její pravděpodobnostní funkci platí:

Více

Kombinatorika, pravděpodobnost a statistika, Posloupnosti a řady

Kombinatorika, pravděpodobnost a statistika, Posloupnosti a řady Předmět: Náplň: Třída: Počet hodin: Pomůcky: Matematika Kombinatorika, pravděpodobnost a statistika, Posloupnosti a řady 4. ročník 3 hodiny týdně PC a dataprojektor Kombinatorika Řeší jednoduché úlohy

Více

Náhodný jev a definice pravděpodobnosti

Náhodný jev a definice pravděpodobnosti Náhodný jev a definice pravděpodobnosti Obsah kapitoly Náhodný jev. Vztahy mezi náhodnými jevy. Pravidla pro počítání s pravděpodobnostmi. Formule úplné pravděpodobnosti a Bayesův vzorec. Studijní cíle

Více

Protokol č. 1. Tloušťková struktura. Zadání:

Protokol č. 1. Tloušťková struktura. Zadání: Protokol č. 1 Tloušťková struktura Zadání: Pro zadané výčetní tloušťky (v cm) vypočítejte statistické charakteristiky a slovně interpretujte základní statistické vlastnosti tohoto souboru tloušťek. Dále

Více

Inferenční statistika - úvod. z-skóry normální rozdělení pravděpodobnost rozdělení výběrových průměrů

Inferenční statistika - úvod. z-skóry normální rozdělení pravděpodobnost rozdělení výběrových průměrů Inferenční statistika - úvod z-skóry normální rozdělení pravděpodobnost rozdělení výběrových průměrů Pravděpodobnost postupy induktivní statistiky vycházejí z teorie pravděpodobnosti pravděpodobnost, že

Více

KGG/STG Statistika pro geografy

KGG/STG Statistika pro geografy KGG/STG Statistika pro geografy 10. Mgr. David Fiedor 27. dubna 2015 Nelineární závislost - korelační poměr užití v případě, kdy regresní čára není přímka, ale je vyjádřena složitější matematickou funkcí

Více

VYUŽITÍ MATLAB WEB SERVERU PRO INTERNETOVOU VÝUKU ANALÝZY DAT A ŘÍZENÍ JAKOSTI

VYUŽITÍ MATLAB WEB SERVERU PRO INTERNETOVOU VÝUKU ANALÝZY DAT A ŘÍZENÍ JAKOSTI VYUŽITÍ MATLAB WEB SERVERU PRO INTERNETOVOU VÝUKU ANALÝZY DAT A ŘÍZENÍ JAKOSTI Aleš Linka 1, Petr Volf 2 1 Katedra textilních materiálů, FT TUL, 2 Katedra aplikované matematiky, FP TUL ABSTRAKT. Internetové

Více

Statistická analýza dat podzemních vod. Statistical analysis of ground water data. Vladimír Sosna 1

Statistická analýza dat podzemních vod. Statistical analysis of ground water data. Vladimír Sosna 1 Statistická analýza dat podzemních vod. Statistical analysis of ground water data. Vladimír Sosna 1 1 ČHMÚ, OPZV, Na Šabatce 17, 143 06 Praha 4 - Komořany sosna@chmi.cz, tel. 377 256 617 Abstrakt: Referát

Více

Nadstavba pro statistické výpočty Statistics ToolBox obsahuje více než 200 m-souborů které podporují výpočty v následujících oblastech.

Nadstavba pro statistické výpočty Statistics ToolBox obsahuje více než 200 m-souborů které podporují výpočty v následujících oblastech. Statistics ToolBox Nadstavba pro statistické výpočty Statistics ToolBox obsahuje více než 200 m-souborů které podporují výpočty v následujících oblastech. [manual ST] 1. PROBABILITY DISTRIBUTIONS Statistics

Více

Analýza dat z dotazníkových šetření

Analýza dat z dotazníkových šetření Analýza dat z dotazníkových šetření Cvičení 6. Rozsah výběru Př. Určete minimální rozsah výběru pro proměnnou věk v souboru dovolena, jestliže 95% interval spolehlivost průměru proměnné nemá být širší

Více

naopak více variant odpovědí, bude otázka hodnocena jako nesprávně zodpovězená.

naopak více variant odpovědí, bude otázka hodnocena jako nesprávně zodpovězená. Datum:... Jméno:... Přijímací řízení pro akademický rok 28/9 na magisterské studijní obor Finanční informatiky a statistika Písemná část přijímací zkoušky z matematiky Za každou správnou odpověd se získávají

Více

6. Lineární regresní modely

6. Lineární regresní modely 6. Lineární regresní modely 6.1 Jednoduchá regrese a validace 6.2 Testy hypotéz v lineární regresi 6.3 Kritika dat v regresním tripletu 6.4 Multikolinearita a polynomy 6.5 Kritika modelu v regresním tripletu

Více

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1 Testování statistických hypotéz Ing. Michal Dorda, Ph.D. 1 Úvodní poznámky Statistickou hypotézou rozumíme hypotézu o populaci (základním souboru) např.: Střední hodnota základního souboru je rovna 100.

Více

Předpoklad o normalitě rozdělení je zamítnut, protože hodnota testovacího kritéria χ exp je vyšší než tabulkový 2

Předpoklad o normalitě rozdělení je zamítnut, protože hodnota testovacího kritéria χ exp je vyšší než tabulkový 2 Na úloze ukážeme postup analýzy velkého výběru s odlehlými prvky pro určení typu rozdělení koncentrace kyseliny močové u 50 dárců krve. Jaká je míra polohy a rozptýlení uvedeného výběru? Z grafických diagnostik

Více

Bodové a intervalové odhady parametrů v regresním modelu

Bodové a intervalové odhady parametrů v regresním modelu Bodové a intervalové odhady parametrů v regresním modelu 1 Odhady parametrů 11 Bodové odhady Mějme lineární regresní model (LRM) kde Y = y 1 y 2 y n, e = e 1 e 2 e n Y = Xβ + e, x 11 x 1k, X =, β = x n1

Více

Testování hypotéz. 4. přednáška 6. 3. 2010

Testování hypotéz. 4. přednáška 6. 3. 2010 Testování hypotéz 4. přednáška 6. 3. 2010 Základní pojmy Statistická hypotéza Je tvrzení o vlastnostech základního souboru, o jehož pravdivosti se chceme přesvědčit. Předem nevíme, zda je pravdivé nebo

Více

Projekt ŠABLONY NA GVM Gymnázium Velké Meziříčí registrační číslo projektu: CZ.1.07/1.5.00/34.0948

Projekt ŠABLONY NA GVM Gymnázium Velké Meziříčí registrační číslo projektu: CZ.1.07/1.5.00/34.0948 Projekt ŠABLONY NA GVM Gymnázium Velké Meziříčí registrační číslo projektu: CZ.1.07/1.5.00/34.0948 IV-2 Inovace a zkvalitnění výuky směřující k rozvoji matematické gramotnosti žáků středních škol PRAVDĚPODOBNOST

Více

veličin, deskriptivní statistika Ing. Michael Rost, Ph.D.

veličin, deskriptivní statistika Ing. Michael Rost, Ph.D. Vybraná rozdělení spojitých náhodných veličin, deskriptivní statistika Ing. Michael Rost, Ph.D. Třídění Základním zpracováním dat je jejich třídění. Jde o uspořádání získaných dat, kde volba třídícího

Více