1 Popisná statistika. 1.1 Základní pojmy. 1.2 Třídění dat. Četnosti. Grafické znázornění. Rozdělení znaků. Statistika I

Rozměr: px
Začít zobrazení ze stránky:

Download "1 Popisná statistika. 1.1 Základní pojmy. 1.2 Třídění dat. Četnosti. Grafické znázornění. Rozdělení znaků. Statistika I"

Transkript

1 Statistika I 1 Popisná statistika 1.1 Základní pojmy Statistický soubor konečná množina prvků, které jsou nositeli určitého hromadného jevu Rozsah s.s. počet prvků množiny Statistické jednotky prvky s.s. Statistické znaky vlastnosti s.j. Rozdělení znaků Kvantitativní reálná čísla: o Diskrétní nabude konečného počtu hodnot (známky ve škole) o Spojité může nabýt libovolné hodnoty z nějakého intervalu (výška dětí) Kvalitativní slovní popis o Alternativní dichotomický znaky: ano/ne Značení znaků: X,Y a jejich hodnoty x 1, x 2 a y 1, y Třídění dat Výsledkem statistického zjišťování je neuspořádaná posloupnost údajů. Je vhodné ji upravit: o Uspořádat vzestupně podle velikosti, rozdělit do skupin a zjistit četnosti dat ve skupinách. Jednodstupňové - podle jednoho znaku Vícestupňové podle více znaků Četnosti Absolutní, kumulativní absolutní Relativní, kumulativní relativní Jednoduché třídění Pro diskrétní znaky uspořádat vzestupně a pokud se hodnoty opakují, udělat: Tabulka rozdělení četností - napíšeme vzestupně hodnoty znaku a vedle nich četnosti Skupinové třídění vždy pro spojité znaky, pro diskrétní pokud je počet úrovní příliš vysoký postup: počet tříd, šířka intervalu, sestrojit tabulku intervalového rozdělení četností Grafické znázornění Polygon četností, histogram, výsečový graf

2 1.3 Charakteristiky polohy Poskytují představu o celém st. souboru ve formě st. charakteristik (čísel) - úroveň hodnoty znaku. Modus - nejčastější hodnota znaku Jednoduché t. jednoduše spočítám co je nejčastější Skupinové t. parabolická interpolace o vzorec d m dolní hranice modální třídy (ta s největší četností) Kvantil hodnota, která rozděluje variační řadu v určitém poměru četností Jednoduché t.: o Y je celé: o Y není celé: n=počet prvků (kolikátý člen je x y zjistím přímo nebo z kumulativní četnosti) (y zakrouhlit nahoru) Skupinové t.: o Dle vzorce d ip dolní hranice třídy, která obsahuje ten kvantil z kp i medián hodnota která rozděluje uspořádaný statistický soubor na dvě poloviny Průměr Je ovlivněn všemi hodnotami znaku v souboru. Zjišťuje se jím střední hodnota souboru. Aritmetický Má smysl to sčítat objemová data - těžiště hodnot znaku; součet všech hodnot děleno počet hodnot Dána tabulka rozdělení četností vážený průměr - abs. četnost fi je váha hodnoty znaku xi Intervalové t. xi je střed intervalu (součet mezí děleno dvěma) Vážený ar. průměr z více souborů: průměry je potřeba zvážit rozsahem souboru Příklad: Harmonický Když hodnota znaku zabírá různou část součtu. Úrovňové veličiny s různou váhou, rychlost, výkonové limity: napouštění vody, jízda autem, atd. je dobré si to uspořádat do tabulky Nebo jako ar. vážený mám spočítat rychlost: produkce děleno čas: o nachystat si to do zlomku a spočítat Geometrický Když se v souboru vyskytuje odlehlá vysoká hodnota Má smysl to násobit - růstové, časově provázané veličiny - Koeficient růstu = běžný růst / předcházející růst

3 1.4 Charakteristiky variability Popisují variabilitu hodnot pozorovaného znaku míra rozptýlení. Variační rozpětí R - rozdíl mezi největší a nejmenší hodnotou závislost na extrémních hodnotách Kvartilové rozpětí: Q = Průměrná odchylka Aritmetický průměr absolutních hodnot odchylek hodnot znaku od nějaké charakteristiky polohy Nejčastějí od průměru nebo mediánu: e, d Rozptyl Ar. průměr čtverců odchylek hodnot od ar. průměru (také vážená forma) Společný rozptyl = vnitroskupinová + meziskupinová variabilita: Jeho použitím namísto průměrné odchylky zvýrazníme extrémní hodnoty. Je zadána relativní četnost: Směrodatná odchylka Variabilita znaku se charakterizuje pomocí ní, protože směrodatná odchylka má stejný rozměr jako pozorovaný znak. Variační koeficient podíl sm. odchylky a ar. průměru Používá se pro srovnávání variability souborů, které mají různé charakteristiky úrovně nebo nesrovnatelné jednotky. Uvádí se většinou v procentech. Poznámky: Transformace a multiplikativní konstanta, b aditivní konstanta Průměr reaguje na oboje konstanty: a=3 z je 3x větší Rozptyl reaguje jen na multiplikativní k: Tvar rozdělení Šikmost K 3 třetí normovaný moment a=3 s je 3 2 větší Číslo, které charakterizuje nesouměrnost rozdělení četností. Poskytuje představu o tvaru rozdělení co do sešikmení, resp. nesouměrnosti. Míra šikmosti symetrického rozdělení je nulová. 0 symetrické rozdělení, >0 levostranná asymetrie, <0 pravostranná asymetrie Je-li dolní kvartil blíže k mediánu než horní, hovoříme o levostranném sešikmení. Špičatost K 4 čtvrtý centrovaný moment Číslo, které charakterizuje zkoncentrování prvků souboru v blízkosti určité hodnoty znaku. Poskytuje představu o tvaru rozdělení četnosti co do špičatosti nebo plochosti. 0 normální špičatost, >0 nadnormální špičatost, <0 podnormální špičatost

4 Vztahy pro šikmost Pokud jsou průměr, medián a modus stejné souměrné rozdělení. pravostranné rozdělení záporná asymetrie levostranné rozdělení kladná asymetrie Pozitivní šikmost: negativní šikmost: Normální špičatost: nadnormální: podnormální: 2 Pravděpodobnost 2.1 Základní pojmy Pokus činnost, jejíž výsledek je jednoznačně určený realizací určitého komplexu podmínek. Výsledek pokusu - jedna z možností, které mohou nastat - se nazývá jev (událost). o Jistý I - při splnění určitých podmínek neodvratně nastane o Nemožný V - při splnění určitých podmínek nikdy nenastane o Náhodný A při splnění určitých pomínek může, ale nemusí nastat Náhodný pokus činnost, jejíž výsledkem je náhodný jev. Zajímají nás hromadné n.p. daný pokus je možné za stejných podmínek neomezeně opakovat. Relativní četnost události A: k/n kde k značí kolikrát jev nastal a n značí počet pokusů P(A) statistická pravděpodobnost události A o číslo, okolo kterého kolísá relativní četnost dané události o Je to hodnota, ke které se přibližuje k/n při roustoucím počtu pokusů Terminologie Elementární událost Prostor elementárních událostí - výsledek náhodného pokusu (každý možný) - množina všech možných výsledků pokusu Náhodná událost (jev) podmnožina množiny, značíme ji velkými písmeny: A, B, C,

5 Říkáme, že nastala událost A, když nastal výsledek výsledek ω je příznivý události A. Lze používat standardní množinové operace: Opačná událost: A = A 2.2 Klasická pravděpodobnost Definice Pravděpodobnost P(A) náhodné události A je definována rovností, kde m je počet výsledků příznivých události A a n je počet všech možných výsledků. Velikost množiny A / Ω. Tuto definici můžeme použít pouze v případě, že: o všechny výsledky náhodného pokusu jsou stejně možné a o množina Ω má konečně mnoho prvků. Příklad: událost A na hrací kostce padne sudé číslo: { }; { } o P(A)=3/6=0,5 Pokud potřebujeme pracovat s událostmi s různou pstí, jde to nějak upravit: o Psti určíme experimentálně, suma musí být 1. Operace - sjednocení událostí: o nezávislé o závislé počet unikátních prvků/počet všech možných Riziko Událost je: o Praktický nemožná, pokud je její pst menší než určitá zvolená pst α (blízká nule). o Prakticky jistá, pokud je její pst větší, než určitá zvolená pst 1 α (blízká jedné). Riziko číslo 100 α udává stonásobek psti, že jev nemožný přece jen nastane 2.3 Různé pravděpodobnosti Podmíněná Číslo je podmíněná pst události A za podmínky, že nastala událost H. Pro nezávislé jevy platí, že podmíněná a nepodmíněná pst je stejná. Úplná Vážený průměr podmíněných pstí : P(A)=P(H 1 )*P(A H 1 )+ P(H 2 )*P(A H 2 ) Je dáno více podm. p. a toto udává pst pro náhodně vybraný prvek. Aposteriorní Také Bayesova pst upravená na základě zjištěného výsledku náhodného pokusu Bayesův vzorec:

6 Příklad: A stromek se ujme P(H 1 )=0,7 P(A H 1 )=0,9 P(H 2 )=0,3 P(A H 2 )=0,8 a) Pst že se náhodně vybraný stromek ujme: P(A)=0,7*0,9+0,3*0,8=0,87 b) Pst že se náhodně vybraný stromek ujme a pochází od 2. pěstitele: P(A H 2 ) = P(H 2 )*P(A H 2 )=0,3*0,8=0,24 c) Stromek se ujal. Jaká je pst že byl od 2.p.? P(H 2 A)=P(A H 2 ) / P(A)=0,24/0,87=0, Opakované pokusy Příklady: střelba do terče, hody kostkou, opakovaná měření, sériová výroba Jev nastane aspoň x-krát: součet pstí pro každé x Nezávislé pokusy Jevy jsou na sobě nezávislé pravděpodobnost že nastane A je pořád stejná. Vracím zpět. Používá se Bernoulliho vzorec : n počet pokusů, p konstantní pst Nejpravděpodobnější počet výskytů jevu A v n nez. op. p : nerovnice s Nejmenší počet pokusů, které je třeba vykonat, aby jev A nastal alespoň jednou: n Závislé pokusy Jevy jsou na sobě závislé pst že nastane A je v určitém pokusu proměnlivá. Nevracím zpět. Používá se hypergeometrický vzorec: o (počet možností příznivých jevu A * zbytek možností) / počet všech možností 2.5 Kombinatorika Slouží k určení počtu možností. n počet všech prvků, r počet vybíraných prvků Variace Záleží na pořadí prvků Bez opakování: S opakováním: Kombinace Nezáleží na pořadí prvků Bez opakování: ( ) S opakováním: to se moc nepoužívá Příklad: 6 žen a 9 mužů. Kolika způsoby může vybrat 5 pracovníků, když chce navhrnout: a) právě dvě ženy: N=15 6 Ž a 9 M, r=5 2 Ž a 3 M: ( ) ( ) b) alespoň 4 ženy: r=4ž a 1 M nebo r= 5Ž a 0 M: ( ) ( ) ( ) ( )

7 3 Náhodná proměnná a její rozdělení 3.1 Definice Náhodná proměnná Na množině výsledků náhodného pokusu definujeme reálnou funkci X - náhodná proměnná. NP velké písmeno, hodnota funkce malé písmeno Hodnota NP je určená výsledkem náhodného pokusu. NP charakterizují hodnoty, kterých může nabývat, a také pravděpodobnosti, se kterými těchto hodnota nabývá. Distribuční funkce Určuje rozdělení pravděpodobnosti náhodné proměnné: F(x) = P(X<x) Udává pst, že NP nabude hodnoty menší než x. Diskrétní NP Nabývá konečně mnoha hodnot přirozená čísla. Pravděpodobnostní funkce: p(x)=p(x=x) F(x)= Součet pstí je 1. Rozdělení lze zapsat do pstní tabulky. Spojitá NP Nekonečně mnoho hodnot v intervalu p(x=x) není definována Existuje f(x) pro kterou platí f(x) hustota psti Pst, že proměnná nabude hodnoty z intervalu: Plocha pod křivkou f(x) je pst jistého jevu (1) Číselné charakteristiky Střední hodnota: E(X) (Nemusí se dělit n, protože suma p je 1) Rozptyl: D 2 (X) Kvantil 100*p procentní kvantil je číslo x p pro které platí: F(x p )= Zápis rozdělení Proměnná X má rozdělení G: Pst pro určité x: P(X) nebo P(X a) Graf: osa y hodnoty f(x) nebo F(x); osa x hodnoty X Výpočet psti 1. P(X a) = F(a) 2. P(X>a) = 1 F(a) 3. P(a X b) = F(b) F(a)

8 3.2 Diskrétní rozdělení Binomické Bi(n,p) bernouliho vzorec: počet výskytů určitého jevu v n nezávislých opakovaných pokusech Alternativní rozdělení: n=1: E(X)=n*p a D 2 (X)=n*p*(1-p) Poissonovo P o (λ) počet událostí, které nastanou v jednotkovém časovém intervalu Používá se pro projektování hromadné obsluhy opravy, zmetky. V zadání slovo průměrně. E(X)=D 2 (X)= λ λ střední počet událostí: nutné spočítat pro konkrétní časový úsek Příklad: K automatu přijde průměrně 30 zákazníků za 60 minut. a) Jaká je pst že během příští minuty nepřijde k automatu ani jeden zákazník? b) Jaká je pst že za 10 minut, kdy se automat doplňuje, přijdou minimálně 4 zákazníci? X počet zákazníků a) X úsek: 1 minuta: P(x=0) b) úsek: 10 min: [ ] 3.3 Spojitá rozdělení Rovnoměrné [ ] - X může nabývat libovolné hodnoty z <a,b>; výskyt stejně možný F(x) = 0 pro ; pro a<x<b; 1 pro x a f(x) = pro a x b; 0 pro jiná x E(X)=(a+b)/2; D 2 (X)=(b-a) 2 /12 Normální f(x) je hodně složitá hodnoty F(x) jsou tabelované, a to pro normovaný případ µ=0 a σ 2 =1 ostatní případy se upraví na normovaný tvar pomocí vztahu: ( ) pro záporné hodnoty x: zvolíme např: ; NR se používá velmi často mnohé NP jej mají (např. chyby měření) nebo se rozdělení aproximuje

9 Tvar křivky je to tzv. Gaussova křivka maximum v bodě x=µ hodnota okolo které jsou soustředěny hodnoty X; nepřímo úměrné σ σ sm. odchylka určuje nakolik je plocha určená křivkou rozptýlená okolo hodnoty µ inflexní body: µ - σ, µ + σ Příklady 1. obyčejná pst: X výše IQ; Jaké procento lidí by získalo více než 105 bodů? P(X>105)=1-P(X 105)= ( ) ( ) 37% 2. více hodnot a pst průměru: X max. nosnost tašky; Stanovte pst, že po testování 16 náhodně vybraných tašek bude průměr menší než 4,5. n=16: ( 3. Celková suma pro více pokusů X hmotnot masa v jedné porci: Jaká je pst, že na přípravu 10 obědů bude stačit 0,97 kg masa? X jsou nezávislé. Nové rozdělení: ) ( ) 4. Výpočet minimální hodnoty pro určitou pravděpodobnost X váha člověka Do letadla nastoupí 64 lidí. Jaká musí být minimální nosnost letadla, aby s pstí 99% udrželo ty lidi. Nové rozdělení: a = ( ) - najdu hodnotu tohoto kvantilu v tabulce 3: 2,326 kg nebo to jde počítat nejdřív jako průměr pro jednoho a pak to vynásobit počtem lidí

10 4 Teorie odhadu 4.1 Soubory Základní soubor všechny statistické jednotky Výběrový soubor vybrané jednotky ze základního s., které jej vhodně reprezentují Náhodný v.s. o umístění určité jednotky do v.s. rozhoduje pouze náhoda St. analýza Jejím cílem je dospět na základě údajů o výběrovém souboru ke všeobecným závěrům o základním souboru. Reálně neznáme parametry základního souboru. Podle výsledků pozorování v.s. vyvodíme závěry o rozdělení psti z.s. resp. o jeho neznámých parametrech. Teorie odhadu získávání co nejlepších odhadů o neznámých parametrech Testování st. hypotéz ověřování správnosti předpokladů o rozdělení psti z.s. resp hodnotě n.p. 4.2 Kvantily Normované normální rozdělení u p : tabulka 3: u p =-u 1-p Studentovo rozdělení tabulka 4: t p (v) p kvantil, v stupeň volnosti Pearsonovo rozdělení chí-kvadrát rozdělení: tabulka 6: F-rozdělení tabulka 7: má dva stupně volnosti: n-1 pro každý soubor: 4.3 Bodový odhad t p (v)=-t 1-p (v) Předpokládejme, že pozorovaný znak X má pstní rozdělení se střední hodnotou µ a disperzí σ 2, přičemž hodboty těchto parametrů neznáme. V popisné statistice jsme z naměřených údajů vypočítali aritmetický průměr a rozptyl (výběrový průměr a výběrový rozptyl). realizace bodového odhadu střední hodnoty µ realizace bodového odhadu disperze σ 2 často nestranný odhad kde se suma dělí 1/(n-1) Realizace proto, že jsou vyjádřené jediným číslem. 4.4 Intervalový odhad Cílem int. odhadu je najít realizaci takového intervalu, ve kterém by se hledaný parametr nacházel s dostatečně velkou (předem danou) pstí. Realizace dvě čísla, pstní model dvě statistiky. Předpokládáme, že základní soubor má normální rozdělení a budeme odhadovat jeho parametry. Odhad - interval spolehlivosti XXX norm. r. N rozsah souboru, výběrový průměr, u 1-α/2 kvantil, α riziko, 1-α spolehlivost Pro střední hodnotu Podoba: přípustná chyba Pravostranný : hodnota nesmí překročit hranici maximálně - menší než horní Levostranný : hodnota nesmí klesnout pod hranici minimálně - větší než spodní

11 Minimální rozsah souboru k dané přípustné chybě: 1. známý rozptyl z.s. Použíjeme normální rozdělení; odhad µ ar. průměr, σ 2 známe Statistika U má N(0,1). Hodnotu u α náhodné proměnné U s rozdělením N(0,1) nazýváme kritickou hodnotou N(0,1) rozdělení, jestliže platí P( U > u α ). Platí rovnost P( U u α )=1-α. Po dosazení a upravení dostaneme interval, ve kterém se neznámá střední hodnota µ nachází s pravděpodobností 1-α. Je to 100*(1-α)%-ní oboustranný interval spolehlivosti. 2. neznámý rozptyl z.s. Toto je častější situace. Použijeme statistiku, která má Studentovo t-rozdělení o n-1 stupních volnosti. Dále použijeme kritické hodnoty tohoto rozdělení. Pokud je n>30 můžeme použít norm. rozdělení. Pozor!!! Jednostranný interval místo α/2 je pouze α Pro rozptyl Použijeme Paersonovo rozdělení s n-1 stupni volnosti. Pro relativní četnost Normální rozdělení; rel.č. v základním souboru; p rel.č. ve výběrovém souboru 5 Testování st. hypotéz 5.1 Obecné principy St. hypotéza je tvrzení, které se týká rozdělení psti pozorovaného znaku, případně jeho parametrů. Prověřování správnosti tohoto vrzení se nazývá testování hypotézy. Klademe proti sobě dvě odporující si hypotézy: o h. kterou ověřujeme nulová h. - H 0 o alternativní h. H 1 Hypotézy a) jednoduchá testovaný parametr může nabývat jen jednu hodnotu Příklad: Testujeme h., že náhodný výběr pochází z 1. souboru oproti tomu, že pochází z 2. Zápis problému: H 0 : µ =µ 0 oproti H 1 : µ=µ 1 b) složená H 0 : µ =µ 0 oproti H 1 : µ µ 0 H 0 : µ µ 0 oproti H 1 : µ < µ 0 H 0 : µ µ 0 oproti H 1 : µ > µ 0 Princip testování Na testování H 0 oproti H 1 použijeme vhodné testovací kritérium (tzv. testovací statistiku). Množinu hodnot, kterých může test. st. nabývat rozdělíme na dvě disjunktní oblasti: o kritický (W α ) a doplňkový obor. Z naměřených hodnot vypočítáme hodnotu test. st. g. Pokud tak zamítáme H 0 a za správnou příjímáme H 1. Pokud tam g není, H 0 nezamítáme to ale neznamená, že je h. správná.

12 Chyby 1. Druhu H 0 je správná, ale vlivem náhody hodnota g padne do W α neprávem zamítneme H 0 o Pst této chyby hladina významnosti testu α 2. Druhu H 1 je správná, ale vlivem náhody se může stát, že neprávem přijmeme H 0 o Pst této chyby síla testu β Kritický obor musíme určit tak, aby obě chyby byly co nejmenší. Ovšem zmenšením α roste β a naopak. Postupujeme tak, že zvolíme a hledáme v této třídě test s nejmenší β. Shrnutí postupu testování 1. Zformulujeme testovaný problém, tj. zvolíme nulovou a alternativní hypotézu. 2. Zvolíme hladinu významnosti α. Obvykle se volí 0,05 případně 0, Z naměřených údajů vypočítáme hodnotu testovacího kritéria g. Jaké t.k. je potřeba použít pro daný t. problém viz dále. 4. Určíme kritický obor W α vyhledáním příslušných kritických hodnot v tabulkách. Tvar viz dále. 5. Vyhodnotíme test: a. Když tak zamítáme nulovou hypotézu H 0 na hladině významnosti α. b. Když tak nulovou hypotézu H 0 nemůžeme zamítnout. Druhy testů Parametrické vázané na určité předpoklady o rozdělení resp. parametrech st. souborů Neparametrické použijeme jej pokud nejsou splněné předpoklady 5.2 Testy normality Testují hypotézu, zda náhodný výběr pochází z normálního rozdělení: H 0 : F = F 0 H 1 :F F 0 Test podle Shapira-Wilka Pro rozsah náhodného výběru Hodnoty uspořádáme podle velikosti. Testovací kritérium W. Kritický obor v tabulce. Pokud je zamítáme H 0. D Agostinův test Pro rozsah. Uspořádáme dle velikosti, test. kriterium D, obor složitý - test dobré shody Pro rozsah n > 100. Naměřené hodnoty rozdělíme do r disjunktních intervalů a zjistíme jejich četnosti. Potom musíme porovnat naměřené a teoretické četnosti spočítat pst pro každou třídu. Testovací kritérium: vzorec, n*p teoretické četnosti, n*p musí být všude > 5 Počet stupňů volnosti: známé parametry: r-1; s odhadnutých parametrů: r-s-1 Kritický obor:

13 5.3 Parametrické testy Předpokládáme, že znaky mají normální rozdělení. 1. Jednovýběrové Znak X pozorujeme na prvcích jednoho výběrového souboru. Poznámka: Kraje intervalů asi patří do W ve cvičeních to takhle je, ve skriptech ale ne. Test o střední hodnotě Testovaný problém: H 0 : µ =µ 0 oproti H 1 : µ µ 0 Testovací kritérium: podle toho jestli známe rozptyl z.s. nebo ne o Známe: U normální rozdělení; neznáme: t studentovo rozdělení Kritický obor: Pro levostrannou alternativní hypotézu je obor Test o rozptylu Problém: H 0 : σ 2 = σ 2 0 oproti H 1 : σ 2 σ 2 0 Kritérium: =(n-1) Obor: nebo místo toho t Test o relativní četnosti Problém: H 0 : π = π 0 oproti H 1 : π π 0 Kritérium: U = p-c/ Obor: : 2. Dvouvýběrové Znak X pozorujeme na prvcích více výběrových souborů a potřebujeme ověřit, zda se rozdělení hodnot pozorovaného znaku na těchto souborech shoduje. Test o dvou středních hodnotách Známé rozptyly: U=x-x/ Neznámé rozptyly: o stejné rozptyly: t=x-x/to velký o nestejné: t=x-x/mensi Test o shodě dvou rozptylů problem: H0: µ1-µ2=0; kriterium F=S1/S2 obor: větší lomeno menší Párový test srovnává znak u dvou souborů: H 0 : µ 1 =µ 2 oproti H 1 : µ 1 µ2 například střední hodnoty, lze také jednostranné: o jestli se to změnilo: H0:E(D)=0 H1: E(D) 0 o případně zlepšilo: H0:E(D) 0 H1: E(D)>0 kritérium: t= /Sd =ar. průměr rozdílů X-Y Sd=to velké obor:

14 5.4 Neparametrické testy Při použití neparametrického testu vystačíme s menším počtem informací než při odpovídajícím parametrickém testu, tím je ale síla nep. testu nižší než síla odpovídajícího par. testu. Znaménkový test Používá se místo testu střední hodnoty nebo párového t-testu v případě, že není splněný předpoklad o normálním rozdělení základního souboru a rozdělení z.s. je výrazně zešikmené. Je založen na principu, že jednotlivé hodnoty byly nahrazeny znaménky odchylek jednotlivých hodnot od mediánu. Počet kladných odchylek v souboru o rozsahu n - náhodná veličina m +. Problém: H 0 : 1 = 2 proti H 1 : 1 2 Kritérium: m+ Postup Vytvoříme rozdíly x1 y 1, x2 y 2,..., xn y n. m+ počet kladných rozdílů Může se stát, že některé rozdíly jsou rovné 0. Tyto rozdíly nebudeme uvažovat a za n budeme brát počet nenulových rozdílů. Kritický obor Pro n<20: čísla k1 a k2 jsou tabelována 2m n Pro n 20: kritérium bude U =, m min( m, m ), m je počet záporných rozdílů. n Wilcoxonův jednovýběrový test Wilcoxonův test na rozdíl od znaménkového testu nebere do úvahy pouze znaménka rozdílů, ale také velikost a pořadí těchto rozdílů, a proto je jeho síla větší než síla znaménkového testu. Dvouvýběrový: neparametrická analogie dvouvýběrového t-testu Kruskalův-Wallisův test Obdoba jednoduchého třídění analýzy rozptylu. Friedmanův test Analogií analýzy rozptylu dvojného třídění s jedním pozorováním v každé podtřídě.

Charakteristika datového souboru

Charakteristika datového souboru Zápočtová práce z předmětu Statistika Vypracoval: 10. 11. 2014 Charakteristika datového souboru Zadání: Při kontrole dodržování hygienických norem v kuchyni se prováděl odběr vzduchu a pomocí filtru Pallflex

Více

Zápočtová práce STATISTIKA I

Zápočtová práce STATISTIKA I Zápočtová práce STATISTIKA I Obsah: - úvodní stránka - charakteristika dat (původ dat, důvod zpracování,...) - výpis naměřených hodnot (v tabulce) - zpracování dat (buď bodové nebo intervalové, podle charakteru

Více

Statistika pro geografy

Statistika pro geografy Statistika pro geografy 2. Popisná statistika Mgr. David Fiedor 23. února 2015 Osnova 1 2 3 Pojmy - Bodové rozdělení četností Absolutní četnost Absolutní četností hodnoty x j znaku x rozumíme počet statistických

Více

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru. 1 Statistické odhady Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru. Odhad lze provést jako: Bodový odhad o Jedna číselná hodnota Intervalový

Více

4ST201 STATISTIKA CVIČENÍ Č. 7

4ST201 STATISTIKA CVIČENÍ Č. 7 4ST201 STATISTIKA CVIČENÍ Č. 7 testování hypotéz parametrické testy test hypotézy o střední hodnotě test hypotézy o relativní četnosti test o shodě středních hodnot testování hypotéz v MS Excel neparametrické

Více

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 3. 11.

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 3. 11. UNIVERZITA OBRANY Fakulta ekonomiky a managementu Aplikace STAT1 Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 Jiří Neubauer, Marek Sedlačík, Oldřich Kříž 3. 11. 2012 Popis a návod k použití aplikace

Více

Praktická statistika. Petr Ponížil Eva Kutálková

Praktická statistika. Petr Ponížil Eva Kutálková Praktická statistika Petr Ponížil Eva Kutálková Zápis výsledků měření Předpokládejme, že známe hodnotu napětí U = 238,9 V i její chybu 3,3 V. Hodnotu veličiny zapíšeme na tolik míst, aby až poslední bylo

Více

Testování statistických hypotéz

Testování statistických hypotéz Testování statistických hypotéz Na základě náhodného výběru, který je reprezentativním vzorkem základního souboru (který přesně neznáme, k němuž se ale daná statistická hypotéza váže), potřebujeme ověřit,

Více

E(X) = np D(X) = np(1 p) 1 2p np(1 p) (n + 1)p 1 ˆx (n + 1)p. A 3 (X) =

E(X) = np D(X) = np(1 p) 1 2p np(1 p) (n + 1)p 1 ˆx (n + 1)p. A 3 (X) = Základní rozdělení pravděpodobnosti Diskrétní rozdělení pravděpodobnosti. Pojem Náhodná veličina s Binomickým rozdělením Bi(n, p), kde n je přirozené číslo, p je reálné číslo, < p < má pravděpodobnostní

Více

STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky)

STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky) STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky) 1) Význam a využití statistiky v biologických vědách a veterinárním lékařství ) Rozdělení znaků (veličin) ve statistice 3) Základní a

Více

Základní statistické charakteristiky

Základní statistické charakteristiky Základní statistické charakteristiky Základní statistické charakteristiky slouží pro vzájemné porovnávání statistických souborů charakteristiky = čísla, pomocí kterých porovnáváme Základní statistické

Více

676 + 4 + 100 + 196 + 0 + 484 + 196 + 324 + 64 + 324 = = 2368

676 + 4 + 100 + 196 + 0 + 484 + 196 + 324 + 64 + 324 = = 2368 Příklad 1 Je třeba prověřit, zda lze na 5% hladině významnosti pokládat za prokázanou hypotézu, že střední doba výroby výlisku je 30 sekund. Přitom 10 náhodně vybraných výlisků bylo vyráběno celkem 540

Více

Normální (Gaussovo) rozdělení

Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení popisuje vlastnosti náhodné spojité veličiny, která vzniká složením různých náhodných vlivů, které jsou navzájem nezávislé, kterých je velký

Více

Náhodná veličina a rozdělení pravděpodobnosti

Náhodná veličina a rozdělení pravděpodobnosti 3.2 Náhodná veličina a rozdělení pravděpodobnosti Bůh hraje se světem hru v kostky. Jsou to ale falešné kostky. Naším hlavním úkolem je zjistit, podle jakých pravidel byly označeny, a pak toho využít pro

Více

7. Rozdělení pravděpodobnosti ve statistice

7. Rozdělení pravděpodobnosti ve statistice 7. Rozdělení pravděpodobnosti ve statistice Statistika nuda je, má však cenné údaje, neklesejte na mysli, ona nám to vyčíslí Jednou z úloh statistiky je odhad (výpočet) hodnot statistického znaku x i,

Více

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně Testování hypotéz Nechť,, je náhodný výběr z nějakého rozdělení s neznámými parametry. Máme dvě navzájem si odporující hypotézy o parametrech daného rozdělení: Nulová hypotéza parametry (případně jediný

Více

KGG/STG Statistika pro geografy

KGG/STG Statistika pro geografy KGG/STG Statistika pro geografy 4. Teoretická rozdělení Mgr. David Fiedor 9. března 2015 Osnova Úvod 1 Úvod 2 3 4 5 Vybraná rozdělení náhodných proměnných normální rozdělení normované normální rozdělení

Více

ROZDĚLENÍ NÁHODNÝCH VELIČIN

ROZDĚLENÍ NÁHODNÝCH VELIČIN ROZDĚLENÍ NÁHODNÝCH VELIČIN 1 Vytvořeno s podporou projektu Průřezová inovace studijních programů Lesnické a dřevařské fakulty MENDELU v Brně (LDF) s ohledem na discipliny společného základu (reg. č. CZ.1.07/2.2.00/28.0021)

Více

Matematika III. 27. listopadu Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

Matematika III. 27. listopadu Vysoká škola báňská - Technická univerzita Ostrava. Matematika III Vysoká škola báňská - Technická univerzita Ostrava 27. listopadu 2017 Typy statistických znaků (proměnných) Typy proměnných: Kvalitativní proměnná (kategoriální, slovní,... ) Kvantitativní proměnná (numerická,

Více

veličin, deskriptivní statistika Ing. Michael Rost, Ph.D.

veličin, deskriptivní statistika Ing. Michael Rost, Ph.D. Vybraná rozdělení spojitých náhodných veličin, deskriptivní statistika Ing. Michael Rost, Ph.D. Třídění Základním zpracováním dat je jejich třídění. Jde o uspořádání získaných dat, kde volba třídícího

Více

Normální (Gaussovo) rozdělení

Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení f x = 1 2 exp x 2 2 2 f(x) je funkce hustoty pravděpodobnosti, symetrická vůči poloze maxima x = μ μ střední hodnota σ směrodatná odchylka (tzv. pološířka křivky mezi inflexními

Více

Pravděpodobnost a statistika

Pravděpodobnost a statistika Pravděpodobnost a statistika Teorie pravděpodobnosti popisuje vznik náhodných dat, zatímco matematická statistika usuzuje z dat na charakter procesů, jimiž data vznikla. NÁHODNOST - forma existence látky,

Více

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA PRAVDĚPODOBNOST A STATISTIKA Testování hypotéz Nechť X je náhodná proměnná, která má distribuční funkci F(x, ϑ). Předpokládejme, že známe tvar distribuční funkce (víme jaké má rozdělení) a neznáme parametr

Více

Testy statistických hypotéz

Testy statistických hypotéz Testy statistických hypotéz Statistická hypotéza je jakýkoliv předpoklad o rozdělení pravděpodobnosti jedné nebo několika náhodných veličin. Na základě náhodného výběru, který je reprezentativním vzorkem

Více

23. Matematická statistika

23. Matematická statistika Projekt: Inovace oboru Mechatronik pro Zlínský kraj Registrační číslo: CZ.1.07/1.1.08/03.0009 23. Matematická statistika Statistika je věda, která se snaží zkoumat reálná data a s pomocí teorii pravděpodobnosti

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická

Více

Neparametrické metody

Neparametrické metody Neparametrické metody Dosud jsme se zabývali statistickými metodami, které zahrnovaly předpoklady o rozdělení dat. Zpravidla jsme předpokládali normální rozdělení. Např. Grubbsův test odlehlých hodnot

Více

Vybraná rozdělení náhodné veličiny

Vybraná rozdělení náhodné veličiny 3.3 Vybraná rozdělení náhodné veličiny 0,16 0,14 0,12 0,1 0,08 0,06 0,04 0,02 0 Rozdělení Z 3 4 5 6 7 8 9 10 11 12 13 14 15 Život je umění vytvářet uspokojivé závěry na základě nedostatečných předpokladů.

Více

STATISTICKÉ CHARAKTERISTIKY

STATISTICKÉ CHARAKTERISTIKY STATISTICKÉ CHARAKTERISTIKY 1 Vytvořeno s podporou projektu Průřezová inovace studijních programů Lesnické a dřevařské fakulty MENDELU v Brně (LDF) s ohledem na discipliny společného základu (reg. č. CZ.1.07/2.2.00/28.0021)

Více

15. T e s t o v á n í h y p o t é z

15. T e s t o v á n í h y p o t é z 15. T e s t o v á n í h y p o t é z Na základě hodnot náhodného výběru činíme rozhodnutí o platnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlastnostech. Rozeznáváme dva základní typy testů:

Více

2 ) 4, Φ 1 (1 0,005)

2 ) 4, Φ 1 (1 0,005) Příklad 1 Ze zásilky velkého rozsahu byl náhodně vybrán soubor obsahující 1000 kusů. V tomto souboru bylo zjištěno 26 kusů nekvalitních. Rozhodněte, zda je možné s 99% jistotou tvrdit, že zásilka obsahuje

Více

Přednáška. Diskrétní náhodná proměnná. Charakteristiky DNP. Základní rozdělení DNP

Přednáška. Diskrétní náhodná proměnná. Charakteristiky DNP. Základní rozdělení DNP IV Přednáška Diskrétní náhodná proměnná Charakteristiky DNP Základní rozdělení DNP Diskrétní náhodná veličina Funkce definovaná na Ω, přiřazující každému elementárnímu jevu E prvky X(E) D R kde D je posloupnost

Více

15. T e s t o v á n í h y p o t é z

15. T e s t o v á n í h y p o t é z 15. T e s t o v á n í h y p o t é z Na základě hodnot náhodného výběru činíme rozhodnutí o platnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlastnostech. Rozeznáváme dva základní typy testů:

Více

Střední hodnota a rozptyl náhodné. kvantilu. Ing. Michael Rost, Ph.D.

Střední hodnota a rozptyl náhodné. kvantilu. Ing. Michael Rost, Ph.D. Střední hodnota a rozptyl náhodné veličiny, vybraná rozdělení diskrétních a spojitých náhodných veličin, pojem kvantilu Ing. Michael Rost, Ph.D. Príklad Předpokládejme že máme náhodnou veličinu X která

Více

MATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci

MATEMATICKÁ STATISTIKA.   Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci MATEMATICKÁ STATISTIKA Dana Černá http://www.fp.tul.cz/kmd/ Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci Matematická statistika Matematická statistika se zabývá matematickým

Více

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY Statistická hypotéza je určitá domněnka (předpoklad) o vlastnostech ZÁKLADNÍHO SOUBORU. Test statistické hypotézy je pravidlo (kritérium), které na základě

Více

Náhodné (statistické) chyby přímých měření

Náhodné (statistické) chyby přímých měření Náhodné (statistické) chyby přímých měření Hodnoty náhodných chyb se nedají stanovit předem, ale na základě počtu pravděpodobnosti lze zjistit, která z možných naměřených hodnot je více a která je méně

Více

Náhodná proměnná. Náhodná proměnná může mít rozdělení diskrétní (x 1. , x 2. ; x 2. spojité (<x 1

Náhodná proměnná. Náhodná proměnná může mít rozdělení diskrétní (x 1. , x 2. ; x 2. spojité (<x 1 Náhodná proměnná Náhodná proměnná může mít rozdělení diskrétní (x 1, x 2,,x n ) spojité () Poznámky: 1. Fyzikální veličiny jsou zpravidla spojité, ale změřené hodnoty jsou diskrétní. 2. Pokud

Více

Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D.

Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D. Zpracování náhodného výběru popisná statistika Ing. Michal Dorda, Ph.D. Základní pojmy Úkolem statistiky je na základě vlastností výběrového souboru usuzovat o vlastnostech celé populace. Populace(základní

Více

Pravděpodobnost a aplikovaná statistika

Pravděpodobnost a aplikovaná statistika Pravděpodobnost a aplikovaná statistika MGR. JANA SEKNIČKOVÁ, PH.D. 2. KAPITOLA PODMÍNĚNÁ PRAVDĚPODOBNOST 3. KAPITOLA NÁHODNÁ VELIČINA 9.11.2017 Opakování Uveďte příklad aplikace geometrické definice pravděpodobnosti

Více

NÁHODNÁ ČÍSLA. F(x) = 1 pro x 1. Náhodná čísla lze generovat některým z následujících generátorů náhodných čísel:

NÁHODNÁ ČÍSLA. F(x) = 1 pro x 1. Náhodná čísla lze generovat některým z následujících generátorů náhodných čísel: NÁHODNÁ ČÍSLA TYPY GENERÁTORŮ, LINEÁRNÍ KONGRUENČNÍ GENERÁTORY, TESTY NÁHODNOSTI, VYUŽITÍ HODNOT NÁHODNÝCH VELIČIN V SIMULACI CO JE TO NÁHODNÉ ČÍSLO? Náhodné číslo definujeme jako nezávislé hodnoty z rovnoměrného

Více

Číselné charakteristiky

Číselné charakteristiky . Číselné charakteristiky statistických dat Průměrný statistik se během svého života ožení s 1,75 ženami, které se ho snaží vytáhnout večer do společnosti,5 x týdně, ale pouze s 50% úspěchem. W. F. Miksch

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 2010 1.týden (20.09.-24.09. ) Data, typy dat, variabilita, frekvenční analýza

Více

Mnohorozměrná statistická data

Mnohorozměrná statistická data Mnohorozměrná statistická data Ekonometrie Jiří Neubauer Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra ekonometrie UO Brno) Mnohorozměrná

Více

Testování statistických hypotéz

Testování statistických hypotéz Testování statistických hypotéz 1 Testování statistických hypotéz 1 Statistická hypotéza a její test V praxi jsme nuceni rozhodnout, zda nějaké tvrzeni o parametrech náhodných veličin nebo o veličině samotné

Více

Testování hypotéz. 4. přednáška 6. 3. 2010

Testování hypotéz. 4. přednáška 6. 3. 2010 Testování hypotéz 4. přednáška 6. 3. 2010 Základní pojmy Statistická hypotéza Je tvrzení o vlastnostech základního souboru, o jehož pravdivosti se chceme přesvědčit. Předem nevíme, zda je pravdivé nebo

Více

Jednovýběrový Wilcoxonův test a jeho asymptotická varianta (neparametrická obdoba jednovýběrového t-testu)

Jednovýběrový Wilcoxonův test a jeho asymptotická varianta (neparametrická obdoba jednovýběrového t-testu) Jednovýběrový Wilcoxonův test a jeho asymptotická varianta (neparametrická obdoba jednovýběrového t-testu) Frank Wilcoxon (1892 1965): Americký statistik a chemik Nechť X 1,..., X n je náhodný výběr ze

Více

Mnohorozměrná statistická data

Mnohorozměrná statistická data Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Statistický znak, statistický soubor Jednotlivé objekty nebo subjekty, které jsou při statistickém

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 010 1.týden (0.09.-4.09. ) Data, typy dat, variabilita, frekvenční analýza

Více

Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012. Tutoriál č. 4: Exploratorní analýza. Jan Kracík

Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012. Tutoriál č. 4: Exploratorní analýza. Jan Kracík Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012 Tutoriál č. 4: Exploratorní analýza Jan Kracík jan.kracik@vsb.cz Statistika věda o získávání znalostí z empirických dat empirická

Více

PRAVDĚPODOBNOST A STATISTIKA. Neparametrické testy hypotéz čast 1

PRAVDĚPODOBNOST A STATISTIKA. Neparametrické testy hypotéz čast 1 PRAVDĚPODOBNOST A STATISTIKA Neparametrické testy hypotéz čast 1 Neparametrické testy hypotéz - úvod Neparametrické testy statistických hypotéz se používají v případech, kdy neznáme rozdělení pozorované

Více

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II Základy biostatistiky II Veřejné zdravotnictví 3.LF UK - II Teoretické rozložení-matematické modely rozložení Naměřená data Výběrové rozložení Teoretické rozložení 1 e 2 x 2 Teoretické rozložení-matematické

Více

Tématické okruhy pro státní závěrečné zkoušky. bakalářské studium. studijní obor "Management jakosti"

Tématické okruhy pro státní závěrečné zkoušky. bakalářské studium. studijní obor Management jakosti Tématické okruhy pro státní závěrečné zkoušky bakalářské studium studijní obor "Management jakosti" školní rok 2013/2014 Management jakosti A 1. Pojem jakosti a význam managementu jakosti v současném období.

Více

Testování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času

Testování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času Testování hypotéz 1 Jednovýběrové testy 90/ odhad času V podmínkách naprostého odloučení má voák prokázat schopnost orientace v čase. Úkolem voáka e provést odhad časového intervalu 1 hodiny bez hodinek

Více

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Statistickou hypotézou se rozumí určité tvrzení o parametrech rozdělení zkoumané náhodné veličiny (µ, σ 2, π,

Více

ÚVOD. Rozdělení slouží: K přesnému popisu pravděpodobnostního chování NV Střední hodnota, rozptyl, korelace atd.

ÚVOD. Rozdělení slouží: K přesnému popisu pravděpodobnostního chování NV Střední hodnota, rozptyl, korelace atd. ROZDĚLENÍ NV ÚVOD Velké skupiny náhodných pokusů vykazují stejné pravděpodobnostní chování Mince panna/orel Výška mužů/žen NV mohou být spojeny s určitým pravděpodobnostním rozdělení (již známe jeho hustotu

Více

Stručný úvod do testování statistických hypotéz

Stručný úvod do testování statistických hypotéz Stručný úvod do testování statistických hypotéz 1. Formulujeme hypotézu (předpokládáme, že pozorovaný jev je pouze náhodný). 2. Zvolíme hladinu významnosti testu a, tj. riziko, s nímž jsme ochotni se smířit.

Více

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457. 0 cvičení z PST 5 prosince 208 0 (intervalový odhad pro rozptyl) Soubor (70, 84, 89, 70, 74, 70) je náhodným výběrem z normálního rozdělení N(µ, σ 2 ) Určete oboustranný symetrický 95% interval spolehlivosti

Více

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.) Lékařská biofyzika, výpočetní technika I Biostatistika Josef Tvrdík (doc. Ing. CSc.) Přírodovědecká fakulta, katedra informatiky josef.tvrdik@osu.cz konzultace úterý 14.10 až 15.40 hod. http://www1.osu.cz/~tvrdik

Více

Tématické okruhy pro státní závěrečné zkoušky. bakalářské studium. studijní obor "Management jakosti"

Tématické okruhy pro státní závěrečné zkoušky. bakalářské studium. studijní obor Management jakosti Tématické okruhy pro státní závěrečné zkoušky bakalářské studium studijní obor "Management jakosti" školní rok 2010/2011 Management jakosti A 1. Pojem jakosti a význam managementu jakosti v současném období.

Více

I. D i s k r é t n í r o z d ě l e n í

I. D i s k r é t n í r o z d ě l e n í 6. T y p y r o z d ě l e n í Poznámka: V odst. 5.5-5.10 jsme uvedli příklady náhodných veličin a jejich distribučních funkcí. Poznali jsme, že se od sebe liší svým typem. V příkladech 5.5, 5.6 a 5.8 jsme

Více

Mann-Whitney U-test. Znaménkový test. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

Mann-Whitney U-test. Znaménkový test. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek 10. Neparametrické y Mann-Whitney U- Wilcoxonův Znaménkový Shrnutí statistických ů Typ srovnání Nulová hypotéza Parametrický Neparametrický 1 skupina dat vs. etalon Střední hodnota je rovna hodnotě etalonu.

Více

Příklad 1. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 11

Příklad 1. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 11 Příklad 1 Vyhláška Ministerstva zdravotnictví předpokládala, že doba dojezdu k pacientovi od nahlášení požadavku nepřekročí 17 minut. Hodnoty deseti náhodně vybraných dob příjezdu sanitky k nemocnému byly:

Více

Tématické okruhy pro státní závěrečné zkoušky. bakalářské studium. studijní obor "Management jakosti"

Tématické okruhy pro státní závěrečné zkoušky. bakalářské studium. studijní obor Management jakosti Tématické okruhy pro státní závěrečné zkoušky bakalářské studium studijní obor "Management jakosti" školní rok 2009/2010 Management jakosti A 1. Pojem jakosti a význam managementu jakosti v současném období.

Více

p(x) = P (X = x), x R,

p(x) = P (X = x), x R, 6. T y p y r o z d ě l e n í Poznámka: V odst. 5.5-5.10 jsme uvedli příklady náhodných veličin a jejich distribučních funkcí. Poznali jsme, že se od sebe liší svým typem. V příkladech 5.5, 5.6 a 5.8 jsme

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 2010 1.týden (20.09.-24.09. ) Data, typy dat, variabilita, frekvenční analýza

Více

Testování statistických hypotéz

Testování statistických hypotéz Testování statistických hypotéz Michal Fusek Ústav matematiky FEKT VUT, fusekmi@feec.vutbr.cz 11. přednáška z ESMAT Michal Fusek (fusekmi@feec.vutbr.cz) 1 / 27 Obsah 1 Testování statistických hypotéz 2

Více

Základy popisné statistiky

Základy popisné statistiky Základy popisné statistiky Michal Fusek Ústav matematiky FEKT VUT, fusekmi@feec.vutbr.cz 8. přednáška z ESMAT Michal Fusek (fusekmi@feec.vutbr.cz) 1 / 26 Obsah 1 Základy statistického zpracování dat 2

Více

Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Výsledky některých náhodných pokusů jsou přímo vyjádřeny číselně (např. při hodu kostkou padne 6). Náhodnou veličinou

Více

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B TESTOVÁNÍ HYPOTÉZ Od statistického šetření neočekáváme pouze elementární informace o velikosti některých statistických ukazatelů. Používáme je i k ověřování našich očekávání o výsledcích nějakého procesu,

Více

JAK MODELOVAT VÝSLEDKY NÁH. POKUSŮ? Martina Litschmannová

JAK MODELOVAT VÝSLEDKY NÁH. POKUSŮ? Martina Litschmannová JAK MODELOVAT VÝSLEDKY NÁH. POKUSŮ? Martina Litschmannová Opakování Základní pojmy z teorie pravděpodobnosti Co je to náhodný pokus? Děj, jehož výsledek není předem jednoznačně určen podmínkami, za nichž

Více

Jednostranné intervaly spolehlivosti

Jednostranné intervaly spolehlivosti Jednostranné intervaly spolehlivosti hledáme jen jednu z obou mezí Princip: dle zadání úlohy hledáme jen dolní či jen horní mez podle oboustranného vzorce s tou změnou, že výraz 1-α/2 ve vzorci nahradíme

Více

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica JEDNOVÝBĚROVÉ TESTY Komentované řešení pomocí programu Statistica Vstupní data Data umístěná v excelovském souboru překopírujeme do tabulky ve Statistice a pojmenujeme proměnné, viz prezentace k tématu

Více

pravděpodobnosti Pravděpodobnost je teorií statistiky a statistika je praxí teorie pravděpodobnosti.

pravděpodobnosti Pravděpodobnost je teorií statistiky a statistika je praxí teorie pravděpodobnosti. 3.1 Základy teorie pravděpodobnosti Pravděpodobnost je teorií statistiky a statistika je praxí teorie pravděpodobnosti. Co se dozvíte Náhodný pokus a náhodný jev. Pravděpodobnost, počítání s pravděpodobnostmi.

Více

Základy popisné statistiky. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

Základy popisné statistiky. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Základy popisné statistiky Anotace Realitu můžeme popisovat různými typy dat, každý z nich se specifickými vlastnostmi, výhodami, nevýhodami a vlastní sadou využitelných statistických metod -od binárních

Více

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA PRAVDĚPODOBNOST A STATISTIKA Náhodná proměnná Náhodná veličina slouží k popisu výsledku pokusu. Před provedením pokusu jeho výsledek a tedy ani sledovanou hodnotu neznáme. Přesto bychom chtěli tento pokus

Více

Průzkumová analýza dat

Průzkumová analýza dat Průzkumová analýza dat Proč zkoumat data? Základ průzkumové analýzy dat položil John Tukey ve svém díle Exploratory Data Analysis (odtud zkratka EDA). Často se stává, že data, se kterými pracujeme, se

Více

Základy teorie pravděpodobnosti

Základy teorie pravděpodobnosti Základy teorie pravděpodobnosti Náhodná veličina Roman Biskup (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at)email.cz 12. února 2012 Statistika by Birom Základy teorie

Více

TECHNICKÁ UNIVERZITA V LIBERCI SEMESTRÁLNÍ PRÁCE

TECHNICKÁ UNIVERZITA V LIBERCI SEMESTRÁLNÍ PRÁCE TECHNICKÁ UNIVERZITA V LIBERCI Ekonomická fakulta Studentská 2 461 17 Liberec 1 SEMESTRÁLNÍ PRÁCE STATISTICKÝ ROZBOR DAT Z DOTAZNÍKOVÝCH ŠETŘENÍ Gabriela Dlasková, Veronika Bukovinská Sára Kroupová, Dagmar

Více

12. cvičení z PST. 20. prosince 2017

12. cvičení z PST. 20. prosince 2017 1 cvičení z PST 0 prosince 017 11 test rozptylu normálního rozdělení Do laboratoře bylo odesláno n = 5 stejných vzorků krve ke stanovení obsahu alkoholu X v promilích alkoholu Výsledkem byla realizace

Více

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1 Testování statistických hypotéz Ing. Michal Dorda, Ph.D. 1 Úvodní poznámky Statistickou hypotézou rozumíme hypotézu o populaci (základním souboru) např.: Střední hodnota základního souboru je rovna 100.

Více

Matematika III. 4. října Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

Matematika III. 4. října Vysoká škola báňská - Technická univerzita Ostrava. Matematika III Vysoká škola báňská - Technická univerzita Ostrava 4. října 2018 Podmíněná pravděpodobnost Při počítání pravděpodobnosti můžeme k náhodnému pokusu přidat i nějakou dodatečnou podmínku. Podmíněná pravděpodobnost

Více

Statistické metody - nástroj poznání a rozhodování anebo zdroj omylů a lží

Statistické metody - nástroj poznání a rozhodování anebo zdroj omylů a lží Statistické metody - nástroj poznání a rozhodování anebo zdroj omylů a lží Zdeněk Karpíšek Jsou tři druhy lží: lži, odsouzeníhodné lži a statistiky. Statistika je logická a přesná metoda, jak nepřesně

Více

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ. FAKULTA STROJNÍHO INŽENÝRSTVÍ Ústav materiálového inženýrství - odbor slévárenství

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ. FAKULTA STROJNÍHO INŽENÝRSTVÍ Ústav materiálového inženýrství - odbor slévárenství 1 PŘÍLOHA KE KAPITOLE 11 2 Seznam příloh ke kapitole 11 Podkapitola 11.2. Přilité tyče: Graf 1 Graf 2 Graf 3 Graf 4 Graf 5 Graf 6 Graf 7 Graf 8 Graf 9 Graf 1 Graf 11 Rychlost šíření ultrazvuku vs. pořadí

Více

Úloha č. 2 - Kvantil a typická hodnota. (bodově tříděná data): (intervalově tříděná data): Zadání úlohy: Zadání úlohy:

Úloha č. 2 - Kvantil a typická hodnota. (bodově tříděná data): (intervalově tříděná data): Zadání úlohy: Zadání úlohy: Úloha č. 1 - Kvantily a typická hodnota (bodově tříděná data): Určete typickou hodnotu, 40% a 80% kvantil. Tabulka hodnot: Varianta Četnost 0 4 1 14 2 17 3 37 4 20 5 14 6 7 7 11 8 20 Typická hodnota je

Více

Co je to statistika? Úvod statistické myšlení. Základy statistického hodnocení výsledků zkoušek. Petr Misák

Co je to statistika? Úvod statistické myšlení. Základy statistického hodnocení výsledků zkoušek. Petr Misák Základy statistického hodnocení výsledků zkoušek Petr Misák misak.p@fce.vutbr.cz Co je to statistika? Statistika je jako bikiny. Odhalí téměř vše, ale to nejdůležitější nám zůstane skryto. (autor neznámý)

Více

Pravděpodobnost a aplikovaná statistika

Pravděpodobnost a aplikovaná statistika Pravděpodobnost a aplikovaná statistika MGR. JANA SEKNIČKOVÁ, PH.D. 8. KAPITOLA STATISTICKÉ TESTOVÁNÍ HYPOTÉZ 22.11.2016 Opakování: CLV příklad 1 Zadání: Před volbami je v populaci státu 52 % příznivců

Více

8.1. Definice: Normální (Gaussovo) rozdělení N(µ, σ 2 ) s parametry µ a. ( ) ϕ(x) = 1. označovat písmenem U. Její hustota je pak.

8.1. Definice: Normální (Gaussovo) rozdělení N(µ, σ 2 ) s parametry µ a. ( ) ϕ(x) = 1. označovat písmenem U. Její hustota je pak. 8. Normální rozdělení 8.. Definice: Normální (Gaussovo) rozdělení N(µ, ) s parametry µ a > 0 je rozdělení určené hustotou ( ) f(x) = (x µ) e, x (, ). Rozdělení N(0; ) s parametry µ = 0 a = se nazývá normované

Více

Vzorová prezentace do předmětu Statistika

Vzorová prezentace do předmětu Statistika Vzorová prezentace do předmětu Statistika Popis situace: U 3 náhodně vybraných osob byly zjišťovány hodnoty těchto proměnných: SEX - muž, žena PUVOD Skandinávie, Středomoří, 3 západní Evropa IQ hodnota

Více

ZÁKLADNÍ STATISTICKÉ CHARAKTERISTIKY

ZÁKLADNÍ STATISTICKÉ CHARAKTERISTIKY zhanel@fsps.muni.cz ZÁKLADNÍ STATISTICKÉ CHARAKTERISTIKY METODY DESKRIPTIVNÍ STATISTIKY 1. URČENÍ TYPU ŠKÁLY (nominální, ordinální, metrické) a) nominální + ordinální neparametrické stat. metody b) metrické

Více

5 Parametrické testy hypotéz

5 Parametrické testy hypotéz 5 Parametrické testy hypotéz 5.1 Pojem parametrického testu (Skripta str. 95-96) Na základě výběru srovnáváme dvě tvrzení o hodnotě určitého parametru θ rozdělení f(x, θ). První tvrzení (které většinou

Více

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina Testování hypotéz Analýza dat z dotazníkových šetření Kuranova Pavlina Statistická hypotéza Možné cíle výzkumu Srovnání účinnosti různých metod Srovnání výsledků různých skupin Tzn. prokázání rozdílů mezi

Více

Stručný úvod do vybraných zredukovaných základů statistické analýzy dat

Stručný úvod do vybraných zredukovaných základů statistické analýzy dat Stručný úvod do vybraných zredukovaných základů statistické analýzy dat Statistika nuda je, má však cenné údaje. Neklesejme na mysli, ona nám to vyčíslí. Z pohádky Princové jsou na draka Populace (základní

Více

marek.pomp@vsb.cz http://homel.vsb.cz/~pom68

marek.pomp@vsb.cz http://homel.vsb.cz/~pom68 Statistika B (151-0303) Marek Pomp ZS 2014 marek.pomp@vsb.cz http://homel.vsb.cz/~pom68 Cvičení: Pavlína Kuráňová & Marek Pomp Podmínky pro úspěšné ukončení zápočet 45 bodů, min. 23 bodů, dvě zápočtové

Více

Tomáš Karel LS 2012/2013

Tomáš Karel LS 2012/2013 Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není

Více

Inženýrská statistika pak představuje soubor postupů a aplikací teoretických principů v oblasti inženýrské činnosti.

Inženýrská statistika pak představuje soubor postupů a aplikací teoretických principů v oblasti inženýrské činnosti. Přednáška č. 1 Úvod do statistiky a počtu pravděpodobnosti Statistika Statistika je věda a postup jak rozvíjet lidské znalosti použitím empirických dat. Je založena na matematické statistice, která je

Více