Pohádkový soudní proces



Podobné dokumenty
Statistika. Testování hypotéz statistická indukce Úvod do problému. Roman Biskup

7.1. Podstata testu statistické hypotézy

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test

Ing. Michael Rost, Ph.D.

Testování statistických hypotéz

Testování hypotéz. testujeme (většinou) tvrzení o parametru populace. tvrzení je nutno předem zformulovat

Cvičení ze statistiky - 8. Filip Děchtěrenko

= = 2368

Intervalový odhad. Interval spolehlivosti = intervalový odhad nějakého parametru s danou pravděpodobností = konfidenční interval pro daný parametr

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry

Testování statistických hypotéz

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

Jednofaktorová analýza rozptylu

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

Příklad datového souboru. Pravděpodobnost vs. statistika. Formální definice. Teorie odhadu

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně

Testování statistických hypotéz

Jana Vránová, 3. lékařská fakulta UK

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

Náhodné veličiny, náhodné chyby

Epidemiologické ukazatele. lních dat. analýza kategoriáln. Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat. a I E

4ST201 STATISTIKA CVIČENÍ Č. 7

Ranní úvahy o statistice

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B

analýza kategoriáln lních dat Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat Epidemiologické ukazatele

Korelace. Komentované řešení pomocí MS Excel

ANALÝZA DAT V R 9. VÝPOČET VELIKOSTI SOUBORU. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.

Testy statistických hypotéz

Jednostranné intervaly spolehlivosti

Vymezení důležitých pojmů. nulová hypotéza, alternativní hypotéza testování hypotézy hladina významnosti (alfa) chyba I. druhu, chyba II.

KORELACE. Komentované řešení pomocí programu Statistica

Pravděpodobnost a aplikovaná statistika

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

Dvouvýběrové a párové testy. Komentované řešení pomocí MS Excel

PRAVDĚPODOBNOST A STATISTIKA

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

Jana Vránová, 3.lékařská fakulta UK, Praha. Hypotézy o populacích

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Test obsahoval 7 otevřených otázek a 2 uzavřené alternativní otázky s možností volby ano, ne.

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika t-test

Program Statistica Base 9. Mgr. Karla Hrbáčková, Ph.D.

STATISTICKÝ SOUBOR. je množina sledovaných objektů - statistických jednotek, které mají z hlediska statistického zkoumání společné vlastnosti

12. cvičení z PST. 20. prosince 2017

Tomáš Karel LS 2012/2013

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

DVOUVÝBĚROVÉ A PÁROVÉ TESTY Komentované řešení pomocí programu Statistica

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1

Statistika, Biostatistika pro kombinované studium. Jan Kracík

Metodologie pro Informační studia a knihovnictví 2

Statistické metody v ekonomii. Ing. Michael Rost, Ph.D.

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13

13538/14 mhr/zc/kno 1 DG D 2B

Povinnost státního zástupce stíhat všechny trestné činy, o kterých se dozví.

STATISTICKÉ HYPOTÉZY

Statistické metody uţívané při ověřování platnosti hypotéz

Výzkumná pilotní studie: Efektivita vysílání v rámci projektu ŠIK (shrnutí)

Matematická statistika Zimní semestr

MÍRY ZÁVISLOSTI (KORELACE A REGRESE)

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

Normální (Gaussovo) rozdělení

Úvod do analýzy rozptylu

2 Zpracování naměřených dat. 2.1 Gaussův zákon chyb. 2.2 Náhodná veličina a její rozdělení

Univerzita Karlova v Praze Evangelická teologická fakulta

Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, TESTY DOBRÉ SHODY (angl. goodness-of-fit tests)

SAMOSTATNÁ STUDENTSKÁ PRÁCE ZE STATISTIKY

STATISTICKÉ ODHADY Odhady populačních charakteristik

VYBRANÉ DVOUVÝBĚROVÉ TESTY. Martina Litschmannová

populace soubor jednotek, o jejichž vlastnostech bychom chtěli vypovídat letní semestr Definice subjektech.

11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.

Testování hypotéz a měření asociace mezi proměnnými

Statistická teorie učení

Vzorová prezentace do předmětu Statistika

Název testu Předpoklady testu Testová statistika Nulové rozdělení. ( ) (p počet odhadovaných parametrů)

diskriminaci žen letní semestr = výrok, o jehož pravdivosti chceme rozhodnout tvrzení o populaci, o jehož platnosti rozhodujeme

Pearsonův korelační koeficient

Číslo projektu: CZ.1.07/1.5.00/

Testování hypotéz o parametrech regresního modelu

Normální (Gaussovo) rozdělení

Cvičení ze statistiky - 9. Filip Děchtěrenko

Testování hypotéz o parametrech regresního modelu

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

12 Úvod do statistiky

Mann-Whitney U-test. Znaménkový test. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

TECHNICKÁ UNIVERZITA V LIBERCI. Statistický rozbor dat z dotazníkového šetření

Úvod do statistické metodologie

Předpovídejte snadno a rychle

4EK211 Základy ekonometrie

Jednovýběrový Wilcoxonův test a jeho asymptotická varianta (neparametrická obdoba jednovýběrového t-testu)

Zdrojem trestního práva procesního je Zákon o trestním řízení soudním trestní řád.

Gymnázium a Střední odborná škola, Rokycany, Mládežníků 1115

ÚVOD DO TESTOVÁNÍ HYPOTÉZ. Martina Litschmannová

Test dobré shody v KONTINGENČNÍCH TABULKÁCH

Transkript:

StatSoft Pohádkový soudní proces Pojďme si nyní vysvětlit princip testování hypotéz na příkladu se středověkým soudním procesem. A v duchu celého vánočního vydání na Vás bude čekat další pohádková postavička. Nejprve však trocha teorie, abychom se v příběhu neztratili. D osud jsme si v našem seriálu ukazovali aplikace výpočtů, které svým charakterem spadají do deskriptivní statistiky. Vypočtené charakteristiky polohy a variability doplněné patřičnými grafy nám dají velmi slušný přehled o našem konkrétním datovém souboru, nicméně občas bychom rádi například rozhodli o správnosti nějakého tvrzení (střední hodnota pro danou veličinu je 0, veličiny jsou nezávislé, data pocházejí z normálního rozdělení, ). Chtěli bychom mít nějaký prostředek, který by rozhodl, jak to vlastně je. Takovéto otázky řeší oblast testování hypotéz, kterou si dnes opět odlehčenější formou představíme. Postup testování hypotéz Jaký je postup testování hypotéz? Začít bychom měli tím, že máme nějakou tezi, domněnku, tvrzení. Náš výrok potom chceme prověřit pomocí naměřených dat. Otázkami, které nás mohou zajímat, mohou být například: Jsou muži v průměru vyšší než ženy? Mají studenti žijící v Praze méně sourozenců než ostatní studenti? Je chirurgická léčba lepší než léčba medikamentózní? Je nový lék účinnější než starý? Jak často mám provádět seřízení stroje? Je IQ žáků deváté třídy vyšší než 100? K tomu, abychom mohli prokázat platnost našeho tvrzení, potřebujeme dvě věci: Nějakého arbitra, který rozhodne o platnosti či neplatnosti našeho výroku a důkazní materiál, které by ho přesvědčil. Arbitrem nebude v našem případě člověk, ale statistický test. Důkazním materiálem nebudou otisky prstů, nahrávky, kousky vlasů s DNA na místě činu, ale data. Náš výběrový soubor dat by pro účely daného testu měl splňovat určité předpoklady, o kterých si ale povíme někdy příště. Dnes nám jde pouze o princip testování hypotéz.

Základní pojmy Než se podíváme na slíbený pohádkový příběh z dávné minulosti, definujeme si několik základních pojmů: Testování hypotéz ověřování platnosti nějakého výroku (tvrzení). Statistický test pravidlo, které rozhoduje o platnosti nebo neplatnosti naší hypotézy. Kritériem bývá většinou velikost nějaké funkce, která je spočítána přímo z datového souboru, při různých datech nabývá různých hodnot (je to tedy náhodná veličina). Testová statistika funkce, pomocí které rozhodujeme. Je vždy nutné zformulovat dvě hypotézy: : Nulová hypotéza, o které se primárně předpokládá, že platí. Testová statistika se tedy řídí rozdělením, jako by platila nulová hypotéza. : Alternativní hypotéza (někdy také označovánu jako ), která platí, pokud je zamítnuta hypotéza nulová. Pro konstrukci testu je potřeba definovat obě hypotézy, nestačí jen, musíme přeci vědět, co platí, když neplatí. Poznámka: V praxi se jako alternativní hypotéza definuje obvykle náš výzkumný záměr, kvůli kterému jsme začali sbírat data a zahájili výzkumný projekt. Sbíráme data, provádíme výzkum a poté už jen můžeme doufat, že test zamítne nulovou hypotézu a my tedy prokážeme náš záměr (typicky: chceme ukázat, že lék má pozitivní vliv na pacientovo zdraví, tedy je, že nemá pozitivní vliv, že má pozitivní vliv). Výsledkem testu může být zamítnutí nebo nezamítnutí. Z filozofického hlediska platí u testu, stejně jako u soudního řízení, presumpce neviny, tedy nulová hypotéza platí (testová statistika se řídí rozdělením podle ), pokud jí nezamítneme. Hypotézy u soudního procesu mají tuto podobu: : Obžalovaný je nevinný : Obžalovaný je vinen Zde se však bijí dva či dokonce tři úhly pohledu. Pohled soudce, který ctí právě presumpci neviny. Pohled žalobce, který je přesvědčen o opaku, tedy o platnosti alternativní hypotézy. I když by soudce odsouzeného nevydal, stejně bude trvat na tom, že je vinen, ale tentokrát pouze neměl dost důkazů k jeho prokázání. A to ještě nemluvíme o obhájci. Kdybychom to zjednodušili, soudce je náš test, žalobce je ten, kdo sbírá data vhodná pro zamítnutí hypotézy, obhájce zase sbírá data pro podpoření hypotézy nulové. Na první pohled se může zdát, že máme pouze dva scénáře, které mohou nastat, zjednodušeně řečeno: vinen/nevinen. Stejně jako soudce, tak i statistický test se na základě předložených důkazů, resp. dat, může splést. Tedy může prokázat tvrzení, které ve skutečnosti neplatí. Kromě správného verdiktu mohou nastat další dvě situace: Nulová hypotéza ve skutečnosti platí, ale test prokázal alternativu Alternativní hypotéza ve skutečnosti platí, ale test nezamítl nulovou Ve statistice se tyto varianty pochybení nazývají: Chyba I. druhu (její velikost se běžně označuje jako ) Chyba II. druhu ( )

Různé možnosti vztahu mezi skutečností a rozhodnutím soudu (výsledkem testu) ukazuje následující tabulka: Pravděpodobnost chyby prvního druhu ( ) nazýváme hladina významnosti testu. Pravděpodobnost správného zamítnutí neboli síla testu je 1- Tak to by byly pojmy, nyní si princip testování hypotéz ilustrujeme na čarodějnickém soudním procesu. Čarodějnický soudní proces Na úvod se sluší říci, že podobnost s jinými příběhy či reálnými událostmi je čistě náhodná. Tento příběh se podle dostupných zdrojů odehrál již před mnoha lety v místě, myslím, zvaném Středozemě. Jeden z místních obyvatel, který se posléze stane obviněným v tomto příběhu, si všiml podobných znaků mezi synem a otcem, matkou a dcerou. A tak začal tyto znaky předpovídat přímo i u nově narozených dětí. Jeho (přesněji řečeno její) předpovědi se po narození s postupem času, tak jak miminka stárla, vyplňovaly. Po té, co se s odstupem času potvrdilo několik relativně úspěšných předpovědí, byla tato osoba, mladá dáma, obviněna z čarodějnictví. Zajímavé, že její kamarád, se kterým na tomto výzkumu také pracovala, obviněn nebyl. Soud středověkého charakteru, který je v danou dobu považován za jediný spravedlivý, zasedl. Jde o jednoduchý soudní proces, ve kterém existuje pouze jediný možný trest (upálení). Soud rozhodne, jestli se tomuto trestu obžalovaná podrobí anebo nepodrobí. Na rozdíl od dnešních soudů zde neexistuje žádné odvolání. Obžalovaná je obviněna z čarodějnictví, což je velmi závažné obvinění. Mimochodem, kdyby byla například obviněna z toho, že je pohádková bytost, tak by to ještě šlo, neboť vyhoštění z vesnice do pohádkového lesa se dá přežít, protože v lese důsledkem soudních procesů mezitím vyrostlo vlastní, ve stromech skryté město, ve kterém žijí všichni za pohádkové bytosti prohlášení. Byl zde skoro každý člověk, co v něčem (kromě hrubé síly) výrazně vynikal. No ale čarodějnictví, to je horší. Můžou nastat dvě situace, jak to dopadne. Buď prokážeme, na základě důkazů z posledních let, že je to čarodějnice, anebo nám tyto důkazy stačit nebudou, ale čarodějnice to je tak i tak, sdělí žalobce den před procesem svému kolegovi. Pokud je test statistiky významný, pak žalobce prokáže svou tezi (alternativní hypotézu). Zamítnutí nulové hypotézy je ekvivalentní přijetí alternativy. Pokud však test nezamítne, žalobce zkoumanou

hypotézu neprokáže, ale to neznamená, že neměl pravdu. Nemyslete si, pan žalobce si bude pořád myslet, že má pravdu, třeba jen neměl dostatek důkazů. Jak už jsme si naznačili výše, mohou nastat dva případy špatného rozhodnutí: I. Obžalovaná je nevinná, ale soud jí odsoudí a pošle na hranici. II. Obžalovaná je vinná, je to skutečně čarodějnice, ale důkazní materiál předložený žalobou na to nestačí a odsouzena a upálena na hranici nebude. Které z těchto pochybení je horší? Neupálit nebezpečnou pohádkovou bytost oplývající magickými schopnostmi nebo upálit nevinnou ženu, které nemá s kouzly nic společného? Odpověď si řekneme za chvíli, nyní se pojďme podívat, jak tento příběh dopadl. Soudný den Pan soudce, který tento proces soudí, je relativně liberální a příčí se mu, že by odsoudil nevinného člověka. Je známý tím, že potřebuje dostatečné množství důkazů na to, aby prokázal tvrzení žalobce, tedy rozhodl o vině. V této historické době nevídaná věc, neboť většina soudců je velmi konzervativních až posedlých a k odsouzení jim stačí i nepřímé a často hloupé důkazy. Je pravda, že skutečný viník jim nikdy neutekl, ale na hranicích a v žalářích končí velké množství populace úplně zbytečně. Potom se není čemu divit, že v pohádkovém lese vyrostlo již zmíněné město odsouzených, složené z převážně nadaných lidí. Souzená má tedy štěstí, že bude soudit tento soudce (mezi kolegy pro svůj styl nazývaný Měkouš ). V naší terminologii můžeme tohoto soudce přirovnat k testu s velmi nízkou chybou prvního druhu (chce mít jistotu, že neodsoudí nevinného) nebo například k neparametrickému testu, ale o tom v některém z budoucích čísel. U tohoto soudce se ale může stát a často se to i stává, že obvinění zamítne, ve skutečnosti je však viník zlosyn. Žalobce prostě nesehnal dostatek důkazního materiálu k přesvědčení soudce. Soudcovi drsnější kolegové bychom poté přirovnali naopak k testům s velkou hodnotou. Obžalovaná povstaňte Podle dochovaných záznamů v šuplíku v kanceláři StatSoftu se dochovala část přepisu tohoto dějství: Soudce: Stojíte před vážným obviněním, jste obviněna z čarodějnictví. Prosím pana žalobce o předložení důkazů. Žalobce: Důkazy jsou zde, ukáže na syna s blonďatými vlasy a modrýma očima, které jsou stejné, jako má jeho otec. Obžalovaná rodině sama řekla, že syn bude mít tyto rysy a přitom se ještě nenarodil. Není to náhoda, stejné je to u těchto dalších 4 dětí. Soudce: Tvrdíte, že předpověděla barvu očí a vlasů u všech těchto dětí, ještě před jejich narozením? Žalobce: Ano, a u těchto dvou dokonce jejich výšku, řekl žalobce a ukázal na enormně vysokého chlapce, jehož otec mezitím zemřel, ale patřil k nejvyšším dlouhánům ve vesnici. Soudce: Hmm, tyto důkazy jsou celkem závažné, nechť promluví obžalovaná. Obžalovaná: Pane soudce, všimla jsem si, že těmito znaky existuje souvislost, dědičnost, tedy, že existuje závislost mezi výškou otce a výškou jeho syna. Matka obžalované po tomto výroku omdlela.

Soudce: V kolika případech se obžalovaná spletla při svých předpovědích? Obhájce: Celkem u zhruba dalších pěti dětí, kde předpověděla úplně jiné znaky, než má jejich otec. Je to tedy celé pouhá spekulace. Trváme na tom, že obžalovaná je člověk a vždy jím byla. Soudce: Aha, takže ono to zas s tou předpovědí není tak horké, s podobným úspěchem předpovídáme počasí, vezmu si čas na rozmyšlenou Po chvíli soudce vyřkl rozsudek. Soudce: Obžalovaná je zproštěna obvinění, tvrzení, že je čarodějnice, se neprokázalo. Stále platí, že je člověk jako každý z nás v této místnosti a tak s ní budeme i nakládat. Obžalovaná byla tedy pro nedostatek důkazů propuštěna, ale bylo to správně? Zachránilo jí, že její předpovědi měly přibližně 50% úspěšnost, ale nebylo to pouze nevhodným vzorkem dat? Tento vzorek byl velmi malý. Zasvěcení navíc věděli, že obžalovaná měla pravdu i v mnoha dalších případech, ale protože si opravdu mysleli, že je čarodějnice, tak ze strachu raději mlčeli a o skutečném původu některých dětí se raději nezmiňovali. V městečku tedy panovala podivná atmosféra a zhruba půlka stále věřila, že se o bytost s nadpřirozenými schopnostmi opravdu jedná. Proto někteří začínali pomalu shánět další důkazy pro nový soudní proces, tedy nový vzorek dat. Shrnutí Ať už se soudce mýlil nebo ne, v důkazním materiálu bylo příliš mnoho pozorování, která hovořila v neprospěch alternativy, kterou chtěla obžaloba prokázat. V úvodu jsme vymezili dva případy, jak se může soudce zmýlit. Která z těchto pochybení je závažnější? Všeobecně se domníváme, že mnohem závažnější je odsoudit nevinného člověka než neodsoudit skutečného zločince (navíc, upálíme-li někoho, jistě s tím později již nebudeme moci nic dělat) a takto se chovají i testy. Proto se také běžně stanovuje pevně na nějakou hodnotu chceme mít jistotu pro velikost chyby, že odsoudíme nevinného. A co soudcovo pojmenování Měkouš? Byl tento soudce špatný? Kvalita soudce by měla být zkoumána nejen podle toho, jakou chce mít jistotu neodsouzení nevinného, ale také podle toho, jak správně odsoudí skutečně vinného (což určuje v terminologii testování hypotéz vlastně síla testu). Žádné z těchto pochybení není možné úplně vyrušit, protože snížím-li možnost výskytu jednoho typu pochybení soudce, enormně vzroste výskyt druhého pochybení. Chyby prvního a druhého druhu jdou proti sobě. Jak tedy poznat kvalitního soudce? V teorii testování hypotéz se to řeší následovně: stanoví se pevná hladina a z testů, které ji dosahují, se vybere ten, který má nejmenší chybu druhého druhu, tedy největší sílu testu. Rozhodnutí o pojmenování Měkouš bychom tedy museli rozhodnout na základě porovnání s jinými soudci, kteří se chovají stejně liberálně jako on. K aplikaci těchto myšlenek se vrátíme v nějakém z příštích čísel. Závěrem Ať už se příběh z našeho zaprášeného šuplíku stal nebo nestal, osobně jsme s rozsudkem soudce spokojeni. Přeci jenom by nám bylo líto odsouzení nadějné mladé statističky z čarodějnictví. Popravdě jsme si i trochu oddechli, můžeme totiž dále bezpečně chodit do práce bez vidiny upálení. Prozatím.