Testování typ dat. T test, Mann-Whitney test, Wilcoxon test, Znaménkový test atd.

Podobné dokumenty
PRAVDĚPODOBNOST ... m n

Národní informační středisko pro podporu kvality

Přednáška č. 10 Analýza rozptylu při jednoduchém třídění

PRAVDĚPODOBNOST A STATISTIKA. Náhodná proměnná vybraná rozdělení

ZÁKLADNÍ STATISTICKÉ VÝPOČTY (S VYUŽITÍM EXCELU)

6 Intervalové odhady. spočteme aritmetický průměr, pak tyto průměry se budou chovat jako by pocházely z normálního. nekonečna.

PRAVDĚPODOBNOST A STATISTIKA. Náhodný vektor nezávislost, funkce náhodného vektoru

8. Analýza rozptylu.

PRAVDĚPODOBNOST A STATISTIKA

můžeme toto číslo považovat za pravděpodobnost jevu A.

Pravděpodobnost a aplikovaná statistika

Pravděpodobnost a aplikovaná statistika

Cvičení 6.: Výpočet střední hodnoty a rozptylu, bodové a intervalové odhady střední hodnoty a rozptylu

11 TESTOVÁNÍ HYPOTÉZ Základní pojmy

PRAVDĚPODOBNOST A STATISTIKA. Náhodný vektor nezávislost, funkce náhodného vektoru

3. Charakteristiky a parametry náhodných veličin

i 1 n 1 výběrový rozptyl, pro libovolné, ale pevně dané x Roznačme n 1 Téma 6.: Základní pojmy matematické statistiky

Testování statistických hypotéz

Pravděpodobnost a aplikovaná statistika

Odhady parametrů 1. Odhady parametrů

P2: Statistické zpracování dat

Katedra pravděpodobnosti a matematické statistiky. χ 2 test nezávislosti

Cvičení 6.: Bodové a intervalové odhady střední hodnoty, rozptylu a koeficientu korelace, test hypotézy o střední hodnotě při známém rozptylu

Intervalové odhady parametrů některých rozdělení.

odhady parametrů. Jednostranné a oboustranné odhady. Intervalový odhad střední hodnoty, rozptylu, relativní četnosti.

jako konstanta nula. Obsahem centrálních limitních vět je tvrzení, že distribuční funkce i=1 X i konvergují za určitých

Mezní stavy konstrukcí a jejich porušov. Hru IV. Milan RůžR. zbynek.hruby.

NEPARAMETRICKÉ METODY

12. N á h o d n ý v ý b ě r

Náhodný výběr 1. Náhodný výběr

Z mých cvičení dostalo jedničku 6 studentů, dvojku 8 studentů, trojku 16 studentů a čtyřku nebo omluveno 10 studentů.

2. Úvod do indexní analýzy

Úloha II.S... odhadnutelná

Závislost slovních znaků

8. cvičení 4ST201-řešení

2. Náhodná veličina. je konečná nebo spočetná množina;

17. Statistické hypotézy parametrické testy

14. Testování statistických hypotéz Úvod statistické hypotézy Definice 14.1 Statistickou hypotézou parametrickou neparametrickou. nulovou testovanou

Odhady parametrů polohy a rozptýlení pro často se vyskytující rozdělení dat v laboratoři se vyčíslují podle následujících vztahů:

c) Pomocí Liouvillovy věty dokažte, že Liouvillovo číslo je transcendentí. xp 1 (p 1)! (x 1)p (x 2) p... (x d) p e x t f(t) d t = F (0)e x F (x),

PRAVDĚPODOBNOST A STATISTIKA

Přednáška VIII. Testování hypotéz o kvantitativních proměnných

9 NÁHODNÉ VÝBĚRY A JEJICH ZPRACOVÁNÍ. Čas ke studiu kapitoly: 30 minut. Cíl:

VYSOCE PŘESNÉ METODY OBRÁBĚNÍ

procesy II Zuzana 1 Katedra pravděpodobnosti a matematické statistiky Univerzita Karlova v Praze

Náhodu bychom mohli definovat jako součet velkého počtu drobných nepoznaných vlivů.

Pro statistické šetření si zvolte si statistický soubor např. všichni žáci třídy (několika tříd, školy apod.).

Pravděpodobnostní model doby setrvání ministra školství ve funkci

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ

Přednáška VI. Intervalové odhady. Motivace Směrodatná odchylka a směrodatná chyba Centrální limitní věta Intervaly spolehlivosti

3. Decibelové veličiny v akustice, kmitočtová pásma

1. JEV JISTÝ a. je jev, který nikdy nenastane b. je jev, jehož pravděpodobnost = ½ c. je jev, jehož pravděpodobnost = 0 d.

STATISTIKA. Statistika se těší pochybnému vyznamenání tím, že je nejvíce nepochopeným vědním oborem. H. Levinson

Odhad parametru p binomického rozdělení a test hypotézy o tomto parametru. Test hypotézy o parametru p binomického rozdělení

1 POPISNÁ STATISTIKA V PROGRAMU MS EXCEL

8. cvičení 4ST201. Obsah: Neparametrické testy. Chí-kvadrát test dobréshody Kontingenční tabulky Analýza rozptylu (ANOVA) Neparametrické testy

UPLATNĚNÍ ZKOUŠEK PŘI PROHLÍDKÁCH MOSTŮ

2 STEJNORODOST BETONU KONSTRUKCE

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

Testujeme hypotézu: proti alternativě. Jednoduché třídění:

vají statistické metody v biomedicíně Literatura Statistika v biomedicínsk nském výzkumu a ve zdravotnictví

1.3. POLYNOMY. V této kapitole se dozvíte:

vají statistické metody v biomedicíně

Směrnice 1/2011 Statistické vyhodnocování dat, verze 3 Verze 3 je shodná s původní Směrnicí 1/2011 verze 2, za čl. 2.3 je vložen nový odstavec

1. ZÁKLADY VEKTOROVÉ ALGEBRY 1.1. VEKTOROVÝ PROSTOR A JEHO BÁZE

0,063 0,937 0,063 0, P 0,048 0,078 0,95. = funkce CONFIDENCE.NORM(2α; p(1 p)

Příklady z finanční matematiky I

1 ROVNOMĚRNOST BETONU KONSTRUKCE

Intervalové odhady parametrů

Téma 6: Indexy a diference

Intervalový odhad. nazveme levostranným intervalem pro odhad parametru Θ. Statistiku. , kde číslo α je blízké nule, nazveme horním

Kvantová a statistická fyzika 2 (Termodynamika a statistická fyzika)

2. Znát definici kombinačního čísla a základní vlastnosti kombinačních čísel. Ovládat jednoduché operace s kombinačními čísly.

Způsobilost. Data a parametry. Menu: QCExpert Způsobilost

Vícekanálové čekací systémy

VaR analýza citlivosti, korekce

b c a P(A B) = c = 4% = 0,04 d

ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE

V. Normální rozdělení

Deskriptivní statistika 1

3. Lineární diferenciální rovnice úvod do teorie

veličiny má stejný řád jako je řád poslední číslice nejistoty. Nejistotu píšeme obvykle jenom jednou

Statistika pro metrologii

Odhad parametrů normálního rozdělení a testy hypotéz o těchto parametrech * Věty o výběru z normálního rozdělení

Při sledování a studiu vlastností náhodných výsledků poznáme charakter. podmínek různé výsledky. Ty odpovídají hodnotám jednotlivých realizací

OVMT Přesnost měření a teorie chyb

Kapitola 6. : Neparametrické testy o mediánech

Co je to statistika? Statistické hodnocení výsledků zkoušek. Úvod statistické myšlení. Úvod statistické myšlení. Popisná statistika

Kvantily. Problems on statistics.nb 1

MOŽNOSTI STATISTICKÉHO POSOUZENÍ KVANTITATIVNÍCH VÝSLEDKŮ POŽÁRNÍCH ZKOUŠEK PRO POTŘEBY CERTIFIKACE A POSUZOVÁNÍ SHODY VÝROBKŮ

14. B o d o v é o d h a d y p a r a m e t r ů

EKONOMETRIE 9. přednáška Zobecněný lineární regresní model

7. Odhady populačních průměrů a ostatních parametrů populace

Jihočeská univerzita v Českých Budějovicích. Pedagogická fakulta PRAVDĚPODOBNOSTNÍ MODELY KOLEM NÁS BAKALÁŘSKÁ PRÁCE. Radka Glücksmannová

8.3.1 Vklady, jednoduché a složené úrokování

Základy statistiky. Zpracování pokusných dat Praktické příklady. Kristina Somerlíková

6.1 Systémy hromadné obsluhy

Teorie odhadů 2 Teorie odhadů... 3 Odhad parametrů... 4

Entropie, relativní entropie a sdílená (vazební) informace

13 Popisná statistika

Transkript:

Testováí ty dat Sojitá čísla T test, Ma-Whitey test, Wilcoxo test, Zamékový test atd. Biárí data? Kategoriálí data? Výše zmíěé testy elze oužít Základí řístuy testováí lze ovšem oužít i a tato data Nulová a alterativí hyotéza Oe samle a two samle testy Aalýzy a biomickém rozložeí Aalýzy a Poissoově rozložeí Aalýza kotigečích tabulek

Biomické rozložeí

Alterativí rozložeí Π(x) Π ro X Π(x) - Π ro X Π(x) jiak X...jev Π -Π X

Biomické rozložeí X... celkový očet astáí jevu v ezávislých okusech E(x). Π D(x). Π (-Π) Π ~ jediý arametr distribuce určuje tvar distribuce Π,5 Π,

Biomické rozložeí - model ro zkoumáí výskytu sledovaého jevu... očet ezávislých oakováí (dotazů) X... očet lidí s jistým symtomem r zameá celkový očet astáí jevu v ezávislých exerimetech ~ π.. jediý arametr biomického rozložeí... relativí četost astáí jevu... určuje tvar distribuce r : r π,5 π, X Biomická roměá X X

Biomické rozložeí jako model Jev: arozeí chlace П,5 : rodia s 5 dětmi r:,,,3,4,5 chlaců! r () ( ) ( r ) r r!( r) P r r : r : r : P(r),35 5! 5! r q ( r) ( ) (,5 )! 5! (,5 ), 3 5! 4 ( ) (,5 )! 4! (,5 ), 565 X: Biomická roměá Střed rozložeí: Roztyl: D E ( x) ( x) ( ) Příklad: resodetů r má symtom ( x) E r 3: P(r),35 r 4: P(r),565 r 5: P(r),3 je střed rozložeí a ejravděodobější..hodota

Biomické rozložeí jako model P ( x r ) ( r ) ( r ) r q q - r!!!,3,3,5,3,5, 3,3,3,5,3,,5,,5,,5,,5,,5,,8,6,4,,,8,6,4, 3 4 5 6 7 8 9 5, 5 5 5 3 35 4 45 5,,,8,6,4, 5 5 5 3 5,5 5 5 5 3 35 4 45 5,5,,8,6,4,,,8,6,4, 3 4 5 6 7 8 9 5,9 5 5 5 3 35 4 45 5

Alikace biomického rozložeí Výskyt kreví skuiy B v určité oulaci:,8 B ot B B ot B B B ot B ot B Number i blood grou B Probability,64,736,736,8464 Probability,5,4,3,, Biomial distributio showig the umber of subjects out of te i blood grou B based o the robability of beig i i blood grou B of,8. 3 4 5 6 7 8 9,6 Number of subjects Probability,9,8,7,6,5,4,3,, Biomial distributio of umber of eole out of two i blood grou B Number: blood grou B i cases Probability,4,,,8,6,4, Biomial distributio showig the umber of subjects out of i blood grou B based o the robability of beig i i blood grou B of,8. 3 4 5 6 7 8 9 Number of subjects

Alikace biomického rozložeí Poulace: 6% jediců má zvýšeou hladiu cholesterolu Výběr: 5 lidí I. Kolik lidí má ve výběru vyšší hladiu cholesterolu? II. Jaká je P, že rávě 3 lidé budou mít vyšší hladiu cholesterolu? ~ Tz. Výběr řesě odovídá daé oulaci? P(3)? (x) Jaká je P, že většia jediců (tedy miimálě 3) má vyšší hladiu cholesterolu? ~ Tz. výběr alesoň obecě odovídá zkoumaé oulaci?

Alikace biomického rozložeí Poulace: 6% jediců má zvýšeou hladiu cholesterolu Výběr: 5 lidí I. Kolik lidí má ve výběru vyšší hladiu cholesterolu?. 5.,6 3 lidé ~ E(x). (-), ~ D(x) II. Jaká je P, že rávě 3 lidé budou mít vyšší hladiu cholesterolu? ~ Tz. Výběr řesě odovídá daé oulaci? P(3)? P 5! 3 ( 3 ) (,6) (,4), 346 3! (5-3)! (x) P(3) 35% Jaká je P, že většia jediců (tedy miimálě 3) má vyšší hladiu cholesterolu? ~ Tz. výběr alesoň obecě odovídá zkoumaé oulaci? X P(X > 3) P(3) P(4) P (5),346,59,78 68 %

Odhad arametru Π biomického rozložeí Při víceásobém odhadu se arametr Π chová jako ormálě rozlože ; ϕ(x) ; 3;3 Π U malých ebo velkých hodot (Π) je však ředoklad ormality omeze ϕ(x) Π ϕ(x) Π

Odhad arametru Π biomického rozložeí I. vztahy ) Bodový ) Itervalový aroximace r ˆ ; ˆ π ( ) ˆ ˆ ˆ; s ( ) ( ) ˆ ˆ ˆ ˆ ˆ ˆ Z Z α α π ( ) ˆ : ± Z α π

Odhad arametru Π biomického rozložeí II. aroximace X: % jediců s daým zakem jediců r 6; ˆ,6 s ˆ,49 Iterval solehlivosti : 95 % Z,975,96,6,96,49 π,6,96,49 P,54 π,697 (,54 π,697), 95

Odhad arametru biomického rozložeí Itervalový odhad bez aroximací a ormálí rozložeí - I. Vztahy L r r ( ) ( ν; ν ) r F α sodí limit itervalu ν ( r ); r ν L ( ν ; ν ) ( r ) Fα ( ν ; ν ) r ( r ) F horí limit itervalu P α ν ν ( π ) α L L ( r ) ν ( r) ν

Odhad arametru biomického rozložeí Itervalový odhad bez aroximací a ormálí rozložeí - II. Příklad: Náhodý vzorek jediců. Zjištěo ouze r 4 jedici bez určitého zaku. ˆ 4, 95% iterval solehlivosti? Sodí hraice Horí hraice ν ( r ) ( 4 ) 394 ν ( r ) ν r 4 8 ν ( r ) ( 4 ) 39 F L ( 394 ;8 ) α 4 3,67 4 ( 4 ) 3,67,55 F L ( ;39 ) α,8 ( 4 ),8 4 ( 4 ),8,5

Biomické rozložeí v datech - shrutí П (x) ϕ(x) X Π Pravděodobost výskytu hodot X Modelové rozložeí odhadovaého arametru oakováí jev ANO jev NE П NE ANO Biárí odstata ůvodích hodot I. II. Iterval solehlivosti ro П

Two samle biomial test

Aalýza biárích ebo kategoriálích dat I. Biárí roměá ( / ) Kategoriálí roměá II I III : : 9 :,,9 I: II: 4 III: 5 : I, II,4 III,5

Aalýza biárích ebo kategoriálích dat II. I. Liší se odhad od ředokládaé hodoty P? II. Liší se dva ebo více odhadů? - závislé odhady - - ezávislé odhady - III. Je výskyt kategorií dvou jevů ezávislý? IV. Hodoceí relativího rizika z výskytu určitého jevu v rámci skuiy lidí

Jedovýběrový biomický test (Oe samle biomial test) H H A Testová statistika Iterval solehlivosti Π > Π z z > z -α Π < Π z z < z α Π Π z z > z -α/ Korekce a kotiuitu ( ) ( ) Z ˆ ˆ,5 ˆ ˆ ˆ ˆ π π H H A Testová statistika Iterval solehlivosti Π > Π r / > L Π < Π < L Π Π L ; L (F α/ ; F -α/ ) < L v > L,,,, ) ( ) ( v v v v F r r F r L α α,, ) ( v v F r r r L α

Test? π Stromy s ozměěým tvarem koruy 9 jediců r 5 změěých jediců Jak je ravděodobá změa u až /3 jediců? Z π ( ) 5, 5 3,75 9 8, 6 α 5 %; Z -α/,96; Z -α,645 Z > Z -α/ zamítáme H :,3 P <<, 95 % Iterval solehlivosti : (,4;,58)

Test? π Příklad testu bez aroximace a ormálí rozložeí jediců bylo zkoumáo ro výskyt určitého zaku, jediců zak emělo Jak hodě se teto výsledek liší od výsledku 6-6: tedy od situace, kdy olovia jediců zak má? a) Využití distribučí fukce r 3 4 5 6 7 8 9 P(r),4,93,6,537,85,9335,559,9336,85,537,6,93,4 P (r ),6,393,4,98 H :,5 je tedy začě eravděodobá b) Pozorovaé ˆ,833 řekročilo horí limit 95 % itervalu solehlivosti ro : ( 6 ) 6 ( 6 ),64,5 : L,64,755

Dvouvýběrový biomický test (? ) ( ) ( ) ˆ ˆ Z ( ) ( ) ( ) ( ) ˆ ˆ Z ± α

Dvouvýběrový biomický test (? ) Teto říklad je ůvodí ukázkou testováí rozdílů mezi dvěma biomickými oulacemi (tedy srováí dvou odhadů arametru ). Celkem 49 okusých myší bylo oužito k testováí toxického rearátu během dvouměsíčí kultivace. Následující tabulka obsahuje ůvodí data zároveň s testem ulové hyotézy: Podíl řežívajících jediců je u zasažeé oulace stejý. Alive Dead Total Proortio alive Proortio dead Treated 5 9 4 ˆ,65 qˆ,375 Not Treated 5 5 Total 5 4 49 ˆ ˆ,4, 5 qˆ qˆ,6, 49,65,4,5 Z,573 Z,5() t,5(),96 (,5) (,49) (,5) (,49),43,9996 4 5 Nezamítáme H :, < P <, S korekcí 5,5,5 4 5,64,4 a kotiuitu: Z,87 Z,5() t,5(),96,43,43 Nezamítáme H :, < P <,

Aalýza kotigečích tabulek

Test dobré shody - základí teorie Biomické jevy (/) χ () ozorovaá očekávaá četost - četost očekávaá četost ozorovaá četost - očekávaá četost očekávaá četost Příklad I. jev II. jev lidí hází micí rub: 4 říadů (R) líc: 6 říadů (L) Lze výsledek ovažovat za statisticky výzamě odlišý (ebo eodlišý) od očekávaého oměru R : L :? χ ( ) ( 4 5 ) ( 6 5 ) 5 χ (,95) 5 4 Tabulková hodota: ( ν ) 3,84 (,95 α ) Rozdíl je vysoce statisticky výzamý ( <<,]

Kotigečí tabulka x B P Kotigečí tabulky - H : Nezávislost dvou jevů A a B ( A B) P( A) P( B) - Podíl () a b - c d Podíl () A a ( a c ) b ( b d ) a ( a b ) c ( c d ) N a b c d P P ( ) ( a b ) B N ( ) ( c d ) B N Očekávaé četosti: ( a b) ( a c) F( A ) N ( a b)( b d ) F( B ) N ν s P ( A) ; P( B ) ( a c) ( d c) F C ) N 4 ( ( f F ) ( b d ) ( c d ) F( D ) N očet arametrů χ ν χ i i F i ( f F, ) ij ij 5 c Fij i

x kotigečí tabulka - říklad (α,5) ge Ao Ne Σ Ao 8 Ne 54 64 Σ 3 36 66 F A * 3 / 66 8,43 F B * 36 / 66 83,57 F C,57 F D 5,43 ( 8,43) ( 883,57) (,57) ( 545,43) () χ( ),43,43 < χ,95 3, 84 8,43 83,57,57 5,43 Kotigečí tabulka v obrázku b: 6% a: % c: 49% % Ge: ANO 8 % Ge: NE 84,4 5,6 d: 33% Zemřelí Žijící Zemřelí Žijící

R x C kotigečí tabulka Výběr: N lidí ze sociologického růzkumu (delikveti) Jev A: Původ z rozvráceých rodi Jev B: Stueň zločiosti I < II < III < IV A B I. II. III. IV. ANO a b c d Σ číslo NE e f g h Σ číslo Stuě volosti: (R-) * (C-) * 3 3 číslo číslo F a N Tabulky: ( ν ) χ( α ) Očekávaé četosti: a a a e b b b f c c c g d d d h

Kotigečí tabulky Příklad Ověřte a datech z okusu se květikami určitého druhu, že barva květů se geeticky štěí v oměru žlutá : červeá 3 :. H : Pozorovaá frekvece ro jedotlivé barvy květů jsou vzorkem oulace mající oměr mezi žlutými a červeými květy 3 :. Součet frekvecí u obou barev květů (f i ) se rová a ozorovaé frekvece u kategorií barvy budou srováy s očekávaými frekvecemi (uvedey v závorkách): Kategorie barvy Žlutá Červeá f oz. 84 6 χ ( f oz. foč. ) ( 84 75) ( 6 5) f oč. 75 5 4,3 f oček. 75 5 St. volosti k - Zamítáme hyotézu shody srovávaých četostí Při testováí H jsme oužili matematický záis (,5 < P <,5). Z tabulek χ rozložeí vidíme, že ravděodobost řekročeí hraice,76 je, ( %), což může být stručě zasáo jako P (χ,76),. Dále lze zjistit ro P (χ 3,84),5. V řešeé úloze jsme dosěli k hodotě testové statistiky χ 4,3. Pro teto říad lze tedy sát,5 < P (χ 4,3) <,5; a jedodušeji,5 < P <,5. Jde v odstatě o řibližé určeí hraic chyby. druhu.

Kotigečí tabulky Příklad Teto říklad je rozšířeím roblému z říkladu a srováí ozorovaých a očekávaých frekvecí ro více kategorií sledovaého zaku: Celkem bylo zkoumáo 5 seme určitého druhu rostliy a roztříděo do ásledujících kategorií: žluté/hladké; žluté/vrásčité; zeleé/hladké; zeleé/vrásčité. Předokládaý oměr výskytu těchto kategorií v oulaci je 9 : 3 : 3 :. Následující tabulka obsahuje ůvodí data z ozorováí a dále ostu ři testováí H. žluté/hladké žluté/vrásčité zeleé/hladké zeleé/vrásčité f oz. 5 39 53 6 5 f oček. 4,65 46,875 46,875 5,65 ν k - 3 χ,375 4,65 7,875 46,875 6,5 46,875 9,65 5,65 8,97 Zamítáme hyotézu shody ozorovaých četostí s očekávaými

Testy dobré shody - říklad Příklad 3 Složitější říklady řešeé srováváím frekvecí je možé rozdělit a testováí dílčích hyotéz: Předokládejme, že chceme ro data z ředchozí úlohy testovat hyotézu existece štěého oměru 9 : 3 : 3 ro rví tři kategorie seme: žluté/hladké žluté/vrásčité zeleé/hladké f oz. 5 39 53 44 k - f oček. 46,4 48,8 48,8 χ 5,6 46,4 9,8 48,8 4, 48,8,544 Nezamítáme hyotézu shody ozorovaých četostí s očekávaými. Nyí otestujeme hyotézu štěého oměru kategorií zeleé/vrásčité:ostatí tyy :5 zeleé/vrásčité ostatí f oz. 6 44 5 f oček 5,65 34,375 k - χ 9, 65 5, 65 9, 65 34,375 6,34 Zamítáme hyotézu shody ozorovaých četostí s očekávaými.

Příklad Test dobré shody ro více kategorií využití aditivity testu U 93 árů dvojčat byly zjištěy ásledující oměry ohlaví: 56 Ch - Ch 7 Ch H 65 H - H Za ředokladu, že arozeí chlaečka má stejou ravděodobost jako arozeí holčičky, lze očekávat oměry ro výše uvedeé skuiy,5 :,5 :,5. Ověřte teto ředoklad a uvedeém vzorku oulace. Σ 93 árů /4 : / : /4 očekávaé četosti 48,5 : 96,5 : 48,5 Proč lze v ředchozím říadě očekávat zamítutí H? χ ( ) 3,8 Testujte ásledující hyotézy: ) Jsou relativí očty árů se shodým ohlavím ve shodě s očekávaými četostmi? (igorujte Ch H áry) ) Je relativí četost kombiace Ch - Ch a H - H árů oroti árům s rozdílým ohlavím ve shodě s očekávaými četostmi? Σ árů : očekávaé četosti 6,5 : 6,5 χ ( ),669 Σ 93 árů : očekávaé četosti 96,5 : 96,5 χ ( ), 44 H Ch H Ch

Test dobré shody - říklad Města - zatížeí exhalacemi - třídy (A > B > C > D) Svět: A : B : C : D : 3 : 6 : 4 Kokrétí země ( 84 měst): A : B : C : D 3 : 5 : 8 : 6 H : shoda f i a F i a,5 F A : 64,3 F C : 9,39 F B : 96,9 F D : 8,7 χ ( 3 64,3 ) ( 6 8,7 ) ( 3 ) K K K 64,3 Tabulky : χ ( ν ) ( 3 ) α χ,95 8 7,8,7 49,6 Absolutí hodota Zamítáme hyotézu shody ozorovaých četostí s očekávaými. Přísěvek kategorií A, B, C, D k celkové hodotě χ % A B C D A B C D

Test homogeity více biomických rozložeí Jev: Úmrtost a leukemii Předoklad: Π,6 Absolutí četost jevu ozačea r i Sledovalo s autorů z s zemí: Autor i r i i... s i N Test homogeity biomických rozložeí χ S S i ( ri i ri ) ( ) Po možém sloučeí s výběrů χ () r i N Π N Π ( Π ) Test shody reálého r ( r i ) a Π

Příklad aalýzy homogeity biomických četostí Pomocí χ rozložeí lze rověž osuzovat homogeitu většího možství ezávislých okusů testujících tutéž hyotézu. Bylo rovedeo 6 ezávislých výběrů z oulace mladých mužů, kteří v dětství oemocěli těžkým záětem mozkových bla. H : V této oulaci se vyskytují raváci a leváci v oměru :. Nalezěte v literatuře říslušé vztahy ro testováí homogeity všech šesti výběrových oulací a a základě výsledků tohoto testu rozhoděte o dalším ostuu. Vzorek Praváci Leváci χ St. volosti Následující tabulka obsahuje ůvodí data a výsledek testováí (v závorkách jsou uvedey očekávaé četosti): 3 (7) (7) 4 4,574 4 (8) (8) 6 4, 3 5 () 5 () 5, 4 4 (9) 4 (9) 8 5,5556 5 3 (8,5) 4 (8,5) 7 4,7647 6 7 () 5 () 6,5455 χ heterogei ta ν s 3,36 5 P <, Jedoduchým testováím lze zjistit, že všechy testy ro jedotlivé výběry jsou výzamé, což zameá, že ai v jedom říadě ebyla otvrzea shoda očekávaých a ozorovaých četostí. Test homogeity štěého oměru v zkoumaých oulacích rověž vedl k zamítutí možosti sloučit jedotlivé výběry a osuzovat je jako celek (kromě testovaého oměru : eexistuje tedy v datech žádý jiý jedotý štěý oměr mezi oběma vlastostmi. V říadě, že by teto test erokázal odchylky mezi jedotlivými výběrovými oulacemi, bylo by možé jedotlivé odběry sloučit a osuzovat jako homogeí vzorek.

χ test - říklad složitější kotigečí tabulky I. Caffeie cosumtio ad marital status i ateatal aties (from Marti ad Bracke, 987) Caffeie cosumtio (mg/day) Marital status - 5 5-3 > 3 Total Married 65 537 598 4 39 Divorced, seared or widowed 36 46 38 4 Sigle 8 37 6 67 78 Total 96 9 74 33 3888 Caffeie cosumtio ad marital status data Caffeie cosumtio (mg/day) Marital status - 5 5-3 > 3 Total Married % 5 % % 8 % 39 ( %) Divorced, seared or widowed 6 % 33 % 7 % 5 % 4 ( %) Sigle 3 % 46 % 5 % 9 % 78 ( %) Total 3 % 49 % 9 % 8 % 3888 ( %)

χ test - říklad složitější kotigečí tabulky II. Exected frequecies Caffeie cosumtio (mg/day) Marital status - 5 5-3 > 3 Total Married 75,8 488 578, 57, 39 Divorced, seared or widowed 3,9 69,3 6,9, 4 Sigle 67,3 35,7 37 6,9 78 Total 96 9 74 33 3888 Cotributios of each cell Caffeie cosumtio (mg/day) Marital status - 5 5-3 > 3 Total Married 4,,6,69,89 7,3 Divorced, seared or widowed,3 7,8 4,57 6,8 9,5 Sigle 5,36,88 7,,6 4,86 Total 9,77,3,8 8,3 5,66

χ test - říklad frakcioace složitější kotigečí tabulky I. Cílem rozsáhlejšího růzkumu oulace bylo rozkoumat vztah mezi dvěma tyy chorob a krevími skuiami u lidí. Kokrétí data jsou uvedea v tabulce: Kreví skuia Žaludečí vředy Rakovia žaludku Kotrola Celkem 983 383 89 458 A 679 46 65 37 B 34 84 57 788 Celkem 796 883 687 8766 Vyočítejte testovou charakteristiku ro tuto kotigečí tabulku a otestujte ulovou hyotézu ezávislosti jevů (χ 4,54; 4 st. volosti)

χ test - říklad frakcioace složitější kotigečí tabulky II. K odrobějšímu růzkumu složitějších tabulek výrazě aomáhá řeis ůvodí tabulky do odoby rocetického zastoueí kategorií: Kreví skuia Žaludečí vředy Rakovia žaludku Kotrola Z této tabulky je atré: 983 383 89 A 679 46 65 B 34 84 57 Celkem 796 883 687 Jsou jeom malé rozdíly v distribuci krevích skui u kotroly a u skuiy emocých rakoviou žaludku. Pacieti s vředy mají mohem častěji kreví skuiu. Na základě těchto ozatků je možé sestrojit meší kotigečí tabulku, která otestuje hyotézu o shodé distribuci krevích skui ro emocé rakoviou a ro zdravé lidi. Sestavte tuto tabulku a otestujte ulovou hyotézu. (χ 5,64 ( st. v.), P je řibližě rova,6)

χ test - říklad frakcioace složitější kotigečí tabulky III. Z tohoto dílčího testu vylývá možost sloučeí skuiy emocých rakoviou a zdravých lidí eboť se vzhledem k distribuci krevích skui chovají jako homogeí oulace. Dalším logickým krokem v odrobé aalýze je testováí shody relativích četostí výskytu krevích skui A a B mezi kombiovaým vzorkem (sloučeá skuia s rakoviou a kotrola) a mezi vzorkem lidí emocých žaludečími vředy - tz. yí euvažujeme kreví skuiu. Výsledkem tohoto testu je χ,68 ( st. vol.); P >,7. Vzorky ro kreví skuiy A a B lze tedy sloučit do směsého vzorku A B. Nyí otestujeme shodu relativích četostí výskytu skuiy oroti A B, a to mezi kombiovaou oulací (kotrola emocí rakoviou) a mezi vzorkem emocých vředařů (χ 34,9; st. vol.). Lze tedy shrout, že vysoká hodota ůvodího χ se 4 st. volosti byla zůsobea zvýšeou četostí lidí s kreví skuiou mezi emocými žaludečími vředy.

χ test - říklad frakcioace složitější kotigečí tabulky IV. Průběh hodoceí lze shrout do tabulky: Srováí St. volosti χ, A, B skuia u acietů s rakoviou (r) x kotrola (k) 5,64 A, B skuia u acietů s vředy x kombiovaý vzorek (r k),68, A, B skuia u acietů s s vředy x kombiovaý vzorek (r k) 34,9 Celkem 4 4,6 Celkový součet testových statistik χ (4,6) odovídá řibližě ůvodí hodotě χ (4,54). Což latí i o stuích volosti (4). Tato skutečost otvrzuje, že jsme detailím rozborem vyčerali iformačí obsah ůvodí kotigečí tabulky a kromě osaé závislosti (zvýšeý výskyt kreví skuiy u lidí s žaludečími vředy) jsou jedotlivé kategorie zkoumaých jevů zcela ezávislé.

Kotigečí tabulka x : Řešeí ři edostatečé velikosti vzorku Yates' corectio Fisher's exact test H : Nezávislost jevů Test aalyzuje všechy možé x tabulky, které dávají stejou sumu řádků a slouců jako tabulka zdrojová. Algoritmus každé tabulce řiřazuje ravděodobost, že taková situace astae, je-li H ravdivá. Sectacle wearig amog juveile deliquets ad o-deliquets who failed a visio test (Weidlig et al., 986) Juveile deliquets No- deliquets Total Sectacle wearers Yes No Total 5 6 8 9 7 6

Kotigečí tabulka x : Řešeí ři edostatečé velikosti vzorku All tables of frequecies which have the same row ad colum totals Probability associated with each set of frequecies (I) 6 (V) 4 a b c d P (II) (III) 9 8 7 5 4 3 (VI) (VII) 5 5 5 4 6 6 3 7 ( I ) 6 9,87 ( II ) 5 8,36 ( III ) 4 7 3,5734 ( IV ) 3 3 6 4,3673 ( V ) 4 5 5,334 ( VI ) 5 4 6,4 ( VII ) 6 3 7,49 Total,99999 (IV) 3 3 6 4

x frekvečí tabulka ro árové usořádáí (Mc Nemar's test - matched variables) Příklad: Srováí metod staoveí atigeu v krvi (atige vždy řítome) H : metoda metoda Metoda Metoda Frekvece úsěch úsěch úsěch eúsěch 6 eúsěch úsěch 4 eúsěch eúsěch χ ( 6 4 ) ( c ) Tabulky : χ ( ν ) α,83 3,84 H ezamítuta

Alikace aalýzy x tabulky ro hodoceí rizika I. Prosektiví studie - odhad relativího rizika Jedici jsou sledovái rosektivě, zda se vyskyte ějaká vlastost. VÝBĚR JE DÁN SLOUPCEM OBECNĚ PŘÍKLAD Zak Riziko: RR Skuia Skuia ANO a b NE c d a ( a c ) b ( b d ) a b ( a c) ( b d ) H : RR Agar skore > 7 RR ANO NE / 6 33 / 9 Symetrická 4 Retardace lodu Asymetrická 33 58 /6,3 33/9,36,345 Riziko u "symetrické skuiy" je asi 35 % rizika u asymetrické skuiy SE ( l RR ) a a IS: l RR - Z -α/. SE (l RR) l RR Z -α/. SE (l RR) c b b d

Alikace aalýzy x tabulky ro hodoceí rizika II. Retrosektiví studie - "ODDS RATIO" Zcela zásadě odlišý řístu od retrosektiví studie VÝBĚR JE DÁN VLASTNOSTÍ - ŘÁDKEM Neí tedy možé aalyzovat relativí riziko, rotože říravou řádků můžeme měit velikost kotrol. OBECNĚ PŘÍKLAD Skuia Skuia Vady chruu ANO NE Zak ANO a b NE c d odds a/c b/d Plaváí týdě > 6h 6h 3 7 8 7 Odds ratio : a b / / c d SE(l OR) a b c d OR ( 3 /7)/ ( 8 /7), 6 ( OR ), 76 l SE ( l ( OR )), 36

Srováí dvou relativích četostí u árově usořádaého okusu (air - matched grous) Situace: Skuiy ejsou ezávislé OBECNĚ Výskyt jevu Skuia Skuia Počet árů a - b - c - - d Drogy - - PŘÍKLAD Potíže se saím Kotrola - - Frekvece 6 D 7/3 K 3/3 ( a b) áry ( a c) ( 3 7 ) / 3, 875 K / / SE b c ( ) ( b c) b c ( b c ) b c Z / SE D ( K ), 3 D 3 9 Z,73 3 9 4 3 9 (,8)

Poissoovo rozložeí

Poissoovo rozložeí Celkový očet jevů v ezávislých okusech E(x) } E(x) D(x) D(x) µλ P () r e µ r r µ λ λ e r! r! růměrý očet jevů z okusů P µ ( X ) e P ( X ) e µ µ P ( X ) e µ µ P ( X 3 ) e µ (3)( ) 3 µ P ( X 4) 4 e µ µ (4)(3)()

Poissoovo rozložeí jako model P ( x r ) e λ r λ r!,,7,9,8,7,6,5,4,3 λ,,9,8,7,6,5,4,3 λ,,6,5,4,3, λ,5,,,,, 3 4 5 6 7 8 9 3 4 5 6 7 8 9 3 4 5 6 7 8 9,4,35 λ,,8 λ 5,4, λ,3,5,6,4,,,8,,5,,8,6,,5,6,4,,4, 3 4 5 6 7 8 9 3 4 5 6 7 8 9 3 4 5 6 7 8 9 3456 789

Poissoovo rozložeí v řírodě existuje Mutace bakterií a ikubačích miskách Orietačí staoveí jevu (ři rodukci lyu bakteriemi) Výskyt jevu v rostoru (očet žížal a určitou lochu ole) - - The most robable umber techique Výskyt jevu v čase (srdečí arytmie v určitých časových itervalech) čas

Poissoovo rozložeí jako model ro áhodý výskyt jevů Předoklad: áhodá distribuce jevu mezi studovaými objekty (ří. v čase, v rostoru). σ < µ σ > µ σ µ Uiform Clustered Radom Poisso Pokud je λ síše větší (~ 5 - ), ak Poisso odovídá síše biomickému až ormálímu rozložeí.

Formálí rezetace Poissoova rozložeí Př: okus... bakterií a misce misek Jev: mutace (r5) λ...růměrý očet mutatů a jedu misku r 5 x λ 5/,5 95 % IS: x Z x λ x Z α α x,5,96,5 λ,5,96,5,5 λ 3,48

Poissoova áhodá roměá Při měřeí očtu krviek změěých určitou chorobou (relativě vzácé) je ozorová zředěý vzorek krve od mikroskoem v komůrce rozděleé a stejě velká ole. Sledovaá veličia, udávající očet krviek v i-tém oli může být ovažováa za rozděleou odle Poissoova rozložeí: 69 očet ezávislých ozorováí roměé r očet ozorovaých krviek Jaká je hodota arametru λ Poissoova rozložeí a jaká je jeho iterretace? Jaký je iterval 95% solehlivosti ro arametr λ? Pokud bychom sledovali celkový očet červeých krviek (oět v 69 ezávislých olíčkách), bylo by i tuto roměou možo ovažovat za rozložeou odle Poissoova rozložeí? Uvažujte celkový očet ozorovaých krviek jako 3. Výočet itervalu solehlivosti ro λ (bez aroximace a ormálí rozložeí) Sodí hraice IS Horí hraice IS L χ α ( f r ) L χ α ( f f )

P Poissoova áhodá roměá Kostatí zářič: 68 časových itervalů (každý 7,5 s) i: očet částic v itervalu (x) s i : ozorovaá četost itervalů s i částicemi i λ e i! λ ( x i) ~ i Poissoova roměá: * Výborý model ro exerimety, v ichž je během časového růběhu zjišťová očet výskytu určitého jevu i 3 4 5 6 7 8 9 3 Počet itervalů s rávě i zazameaými částicemi s t 57 3 383 55 53 48 73 39 45 7 4 68 teoretické četosti i 54,399,53 47,36 55,496 58,48 393,55 53,87 4,35 67,88 9,89 7,75 ( P{ ξ }) 68, ( s ) i i,44,688,4568,5,938,533,4498,5 7,73,64,677 i,8849

Alikace Poissoova rozložeí Number of crimes er day i three aeras of Idia durig 978 to 98(Thrakur ad Sharma, 984) showig observed frequecies (Obs) ad exected frequecies usig the Poisso distributio (Ex) Number of crimes Full moo days Obs Ex 4 64 56 9 83 45, 63, 44,3,7 7,,,5, 83,4,6 New moo days Obs Ex 4 56 4 86,8 56,4 4,,4,3 86,5,75 Comariso of distributios of crimes o the ew moo days (Thrakur ad Sharma, 984) ad umber of deaths i a Motreal hosital i 97 (Zweig ad Csak, 978) 3 4 Total Mea SD Crimes o ew moo days i Idia % Frequecy 6,3 3, 5,9,,5 4 56 4 86,55,75 Deaths er day i Motreal hosital % Frequecy 6,3 3, 6,3,,3, 3 3 8 365,5,736 Exected distributio Poisso (,5) 6, 3,6 7,8,3, 99,9%

Poisso distributio: oe - samle test P ( r ) Př: Počet hízd křeelek a daé loše 8 "od lokalit" r 8 } ^,35 ( e λ r λ ) r! ) Vzít data jako ocházející z oulace: P( r e 8) 6 6 8! 8,9 Nechť je srovávací soubor (ředchozí růzkum) ) P( r 8)? } < [,4 ],5 > H o zamítuta o, o 8 6 µ λ r 8 je říliš velké ro oulaci s o H : ~ µ o o 6? > o, aby r 8 bylo ravděodobější