Západočeská univerzita v Plzni. Fakulta aplikovaných věd Katedra matematiky

Podobné dokumenty
Matematika III. 4. října Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

Základy teorie pravděpodobnosti

5. Náhodná veličina. 2. Házíme hrací kostkou dokud nepadne šestka. Náhodná veličina nabývá hodnot z posloupnosti {1, 2, 3,...}.

PRAVDĚPODOBNOST A STATISTIKA

Pravděpodobnost a aplikovaná statistika

Pravděpodobnost a její vlastnosti

a způsoby jejího popisu Ing. Michael Rost, Ph.D.

7. Rozdělení pravděpodobnosti ve statistice

Náhodný pokus Náhodným pokusem (stručněji pokusem) rozumíme každé uskutečnění určitého systému podmínek resp. pravidel.

NMAI059 Pravděpodobnost a statistika

Pravděpodobnost a statistika

Intuitivní pojem pravděpodobnosti

Diskrétní náhodná veličina. November 12, 2008

IB112 Základy matematiky

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze

Náhodná veličina a její charakteristiky. Před provedením pokusu jeho výsledek a tedy ani sledovanou hodnotu neznáte. Proto je proměnná, která

Náhodná veličina Číselné charakteristiky diskrétních náhodných veličin Spojitá náhodná veličina. Pravděpodobnost

1. Statistická analýza dat Jak vznikají informace Rozložení dat

4. ZÁKLADNÍ TYPY ROZDĚLENÍ PRAVDĚPODOBNOSTI DISKRÉTNÍ NÁHODNÉ VELIČINY

Inženýrská statistika pak představuje soubor postupů a aplikací teoretických principů v oblasti inženýrské činnosti.

Teorie pravěpodobnosti 1

KMA/P506 Pravděpodobnost a statistika KMA/P507 Statistika na PC

Téma 22. Ondřej Nývlt

Testování statistických hypotéz

III. Úplná pravděpodobnost. Nezávislé pokusy se dvěma výsledky. Úplná pravděpodobnost Nezávislé pokusy se dvěma výsledky Náhodná veličina

Chyby měření 210DPSM

Náhodné chyby přímých měření

Náhodná veličina. Michal Fusek. 10. přednáška z ESMAT. Ústav matematiky FEKT VUT, Michal Fusek

Základy teorie pravděpodobnosti

Někdy lze výsledek pokusu popsat jediným číslem, které označíme X (nebo jiným velkým písmenem). Hodíme dvěma kostkami jaký padl součet?

Náhodná veličina a rozdělení pravděpodobnosti

Statistika kolem nás aneb hrátky s procenty

Pravděpodobnost a statistika (BI-PST) Cvičení č. 4

Náhodné jevy. Teorie pravděpodobnosti. Náhodné jevy. Operace s náhodnými jevy

1. Přednáška. Ing. Miroslav Šulai, MBA

Rozdělení náhodné veličiny. Distribuční funkce. Vlastnosti distribuční funkce

KGG/STG Statistika pro geografy

Diskrétní matematika. DiM /01, zimní semestr 2016/2017

E(X) = np D(X) = np(1 p) 1 2p np(1 p) (n + 1)p 1 ˆx (n + 1)p. A 3 (X) =

Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

PRAVDĚPODOBNOST A STATISTIKA

9. T r a n s f o r m a c e n á h o d n é v e l i č i n y

Všechno, co jste chtěli vědět z teorie pravděpodobnosti, z teorie informace a

Diskrétní matematika. DiM /01, zimní semestr 2018/2019

pravděpodobnosti Pravděpodobnost je teorií statistiky a statistika je praxí teorie pravděpodobnosti.

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY

5.1. Klasická pravděpodobnst

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

10. N á h o d n ý v e k t o r

Téma 2: Pravděpodobnostní vyjádření náhodných veličin

Cvičení ze statistiky - 5. Filip Děchtěrenko

Inovace bakalářského studijního oboru Aplikovaná chemie

KGG/STG Statistika pro geografy

Kategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Jan Kracík

Statistika kolem nás aneb hrátky s procenty

P13: Statistické postupy vyhodnocování únavových zkoušek, aplikace normálního, Weibullova rozdělení, apod.

I. D i s k r é t n í r o z d ě l e n í

NÁHODNÁ VELIČINA. 3. cvičení

ROZDĚLENÍ NÁHODNÝCH VELIČIN

p(x) = P (X = x), x R,

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Pravděpodobnost a aplikovaná statistika

1 Pravděpodobnostní prostor

Diskrétní náhodná veličina

Náhodné (statistické) chyby přímých měření

8 Střední hodnota a rozptyl

X = x, y = h(x) Y = y. hodnotám x a jedné hodnotě y. Dostaneme tabulku hodnot pravděpodobnostní

Základy matematické analýzy

0.1 Úvod do lineární algebry

Bakalářská práce Nejslabší! Máte padáka! Strategie ukládání

Výběrové charakteristiky a jejich rozdělení

Úvod do teorie odhadu. Ing. Michael Rost, Ph.D.

5. Lokální, vázané a globální extrémy

9. T r a n s f o r m a c e n á h o d n é v e l i č i n y

2. Definice pravděpodobnosti

Pravděpodobnost a statistika

Zadání a řešení testu z matematiky a zpráva o výsledcích přijímacího řízení do magisterského navazujícího studia od jara 2014

2. přednáška - PRAVDĚPODOBNOST

Pojem a úkoly statistiky

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

STATISTICKÉ ZJIŠŤOVÁNÍ

Zákony hromadění chyb.

Základy počtu pravděpodobnosti a metod matematické statistiky

15. T e s t o v á n í h y p o t é z

Přednáška. Diskrétní náhodná proměnná. Charakteristiky DNP. Základní rozdělení DNP

VYUŽITÍ PRAVDĚPODOBNOSTNÍ METODY MONTE CARLO V SOUDNÍM INŽENÝRSTVÍ

Náhodný vektor a jeho charakteristiky

Moderní technologie ve studiu aplikované fyziky CZ.1.07/2.2.00/ Množiny, funkce

Kapitola 1. Úvod. 1.1 Značení. 1.2 Výroky - opakování. N... přirozená čísla (1, 2, 3,...). Q... racionální čísla ( p, kde p Z a q N) R...

Zadání a řešení testu z matematiky a zpráva o výsledcích přijímacího řízení do magisterského navazujícího studia od podzimu 2016

Jana Vránová, 3. lékařská fakulta UK

Téma 2: Pravděpodobnostní vyjádření náhodných veličin

Mnohorozměrná statistická data

Tomáš Karel LS 2012/2013

Náhodné veličiny, náhodné chyby

Afinita je stručný název pro afinní transformaci prostoru, tj.vzájemně jednoznačné afinní zobrazení bodového prostoru A n na sebe.

STEM PREFERENCE PREZIDENTSKÝCH KANDIDÁTŮ PROSINEC 2012

Regrese. 28. listopadu Pokud chceme daty proložit vhodnou regresní křivku, musíme obvykle splnit tři úkoly:

Transkript:

Západočeská univerzita v Plzni Fakulta aplikovaných věd Katedra matematiky BAKALÁŘSKÁ PRÁCE Ověřování podpisů prezidentských kandidátů Plzeň 2016 Kateřina Filipová

Prohlášení Prohlašuji, že jsem bakalářskou práci vypracovala samostatně a výhradně s použitím uvedených pramenů v seznamu literatury. V Plzni dne...................... Podpis autora...................... 1

Poděkování Ráda bych poděkovala vedoucímu své práce Mgr. Michalu Frieslovi, Ph.D. za jeho odborné vedení, vstřícný přístup a za jeho čas, který mi věnoval. Poděkování také patří rodině a přátelům, kteří mě podporovali nejen při psaní této práce ale i v dobách celého studia. Děkuji. 2

Abstrakt Název práce: Ověřování podpisů prezidentských kandidátů Katedra: Katedra matematiky Vedoucí bakalářské práce: Mgr. Michal Friesl, Ph.D., KMA Abstrakt: Bakalářská práce popisuje úlohu kontroly podpisů na petičních arších prezidentských kandidátů pro rok 2013 z pohledu matematické statistiky. Hlavním cílem je určit pravděpodobnosti chybného závěru (registraci či zamítnutí prezidentské kandidatury) při zákonem předepsaném postupu. Klíčová slova: Prezidentské volby, pravděpodobnost, počet dodaných podpisů. 3

Abstract Title: Verification of signatures presidential candidates Department: Department of Mathematics Supervisor: Mgr. Michal Friesl, Ph.D., KMA Abstract: This bachelor s thesis describes the task of checking the signatures on the petition sheets of presidential candidates for 2013 in terms of mathematical statistics. The main objective is to determine the probability of an erroneous conclusion (registration or refusal presidential candidacy) according to the procedure prescribed by law. Keywords: Presidental election, probability, the number of delivered signatures. 4

Obsah 1 Úvod 6 2 Řečí paragrafů 7 3 Základní pojmy 9 3.1 Pravděpodobnost........................... 9 3.1.1 Podmíněná pravděpodobnost................ 10 3.1.2 Věta o úplné pravděpodobnosti............... 10 3.2 Náhodná veličina........................... 10 4 Odvození postupu kontroly 12 4.1 Odvození výpočtu pravděpodobnosti................ 13 4.2 Simulace a intervaly spolehlivosti.................. 16 5 Výsledky 18 5.1 Volba hodnot K........................... 18 5.2 Vstupní data............................. 19 5.3 Skutečné pravděpodobnosti zamítnutí............... 19 5.4 Výsledky simulace a intervaly spolehlivosti............. 22 6 Závěr 30 5

Kapitola 1 Úvod V lednu roku 2013 proběhly historicky první přímé volby prezidenta České republiky. Jedním ze způsobů, jak se mohl občan České republiky stát možným kandidátem, bylo odevzdání petičních archů obsahujících minimálně 50 000 podpisů občanů oprávněných volit. U těchto kandidátů, kteří odevzdali petiční archy s minimálně 50 000 podpisy, byla provedena Ministerstvem vnitra České republiky kontrola správnosti údajů pod peticí dle prováděcího zákona č. 275/2012 Sb., o volbě prezidenta republiky. Cílem této bakalářské práce je určení pravděpodobnosti chybného závěru (registraci či zamítnutí prezidentské kandidatury) při zákonem předepsaném postupu pro různé hodnoty počtu neplatných, resp. platných podpisů v celkovém počtu dodaných podpisů pod peticí. 6

Kapitola 2 Řečí paragrafů Jak již bylo řečeno, v lednu roku 2013 proběhly historicky první přímé volby prezidenta České republiky. Občané České republiky volili v prvním kole jednoho z devíti možných kandidátů. Prezidentským kandidátem se mohl stát občan České republiky, který má právo volit a dosáhl věku 40 let, jež byl nominován minimálně dvaceti poslanci parlamentu České republiky nebo minimálně deseti senátory České republiky nebo občanem České republiky starším 18 let, který dodal petiční archy s minimálně 50 000 podpisy občanů oprávněných volit. U prezidentských kandidátů, kteří odevzdali petici s minimálně 50 000 podpisy, byla provedena kontrola správnosti údajů pod peticí. Ministerstvo vnitra České republiky ověřovalo správnost údajů na dodaných petičních arších s minimálně 50 000 podpisy. Kontrola správnosti údajů na petici byla provedena dle prováděcího zákona č. 275/2012 Sb., o volbě prezidenta republiky, celé znění v [5], dle 25, odstavce 5 a 6: Ministerstvo vnitra ověří správnost údajů na peticích namátkově na náhodně vybraném vzorku údajů u 8 500 občanů podepsaných na každé petici. Zjistí-li nesprávné údaje u méně než 3 % podepsaných občanů, nezapočítá Ministerstvo vnitra tyto občany do celkového počtu občanů podepsaných na petici., Zjistí-li Ministerstvo vnitra postupem podle odstavce 5 nesprávné údaje u 3 % nebo více než 3 % podepsaných občanů, provede kontrolu u dalšího vzorku stejného rozsahu (dále jen druhý kontrolní vzorek ). Zjistí-li Ministerstvo vnitra, že druhý kontrolní vzorek vykazuje chybovost u méně než 3 % občanů podepsaných na petici, nezapočítá Ministerstvo vnitra občany z obou kontrolních vzorků do celkového počtu občanů podepsaných na petici. Zjistí-li Ministerstvo vnitra, že druhý kontrolní vzorek vykazuje chybovost u 3 % nebo více než 3 % občanů podepsaných na petici, odečte od celkového počtu občanů podepsaných na petici počet občanů, který procentuálně odpovídá chybovosti v obou kontrolních vzorcích. 7

Zákon jasně nepopisuje, zda se první výběr vrací či nevrací zpět do celkového počtu podpisů pod peticí před realizací druhého výběru. Avšak více logické je, první výběr nevracet. Předpokládáme tedy, že když se v prvním vzorku zjistí nesprávnost údajů u 3 % nebo více občanů podepsaných pod peticí, první výběr se nevrací zpět a druhý kontrolní vzorek se vybírá už jen z celkového počtu dodaných podpisů bez prvního výběru. Díky tomu se druhý výběr stává závislý na výsledku prvního výběru. 8

Kapitola 3 Základní pojmy 3.1 Pravděpodobnost Mějme množinu Ω, což je množina všech možných výsledků náhodného pokusu. Náhodný pokus je každý děj, jehož výsledek není předem jednoznačně určen podmínkami, za kterých probíhá. Výsledky tohoto náhodného pokusu se nazývají elementární jevy ω. Potom je tedy množina Ω množinou elementárních jevů ω. Většinou se nezabýváme konkrétními jednotlivými výsledky, ale nějakou jejich množinou, tj. podmnožinou množiny Ω. Každá podmnožina množiny Ω se nazývá náhodný jev. Mějme množinu Ω. Pak σ - algebrou A nazveme neprázdný systém podmnožin množiny Ω splňující: Ω A, A A Ω \ A A, A 1, A 2,... A A i A. i Náhodným jevům se připisují určité pravděpodobnosti pomocí pravděpodobnostních měr P. Pravděpodobnostní míra je reálná funkce, která je definovaná na σ - algebře náhodných jevů v množině elementárních jevů. Pravděpodobnostní míru lze také definovat jako zobrazení P : A 0, 1 takové, pro něž platí: P (Ω) = 1, P ( ) = 0, pro po dvou disjunktní (též neslučitelné, nemající společný prvek) množiny A 1, A 2, A, tj. P (A i A j ) = pro i j, platí: P ( i A i ) = i P (A i ) (3.1) Trojice (Ω, A, P ) se nazývá pravděpodobnostní prostor. 9

3.1.1 Podmíněná pravděpodobnost Podmíněná pravděpodobnost jevu A za podmínky, že nastal jev B, s P (B) > 0, je definována jako P (A B) P B (A) = P (A B) =, (3.2) P (B) kde P značí nepodmíněnou pravděpodobnost. 3.1.2 Věta o úplné pravděpodobnosti Necht pro jevy H 1, H 2,... platí: náhodné jevy jsou po dvou disjunktní, tj. P (H i H j ) = i H i = Ω P (H i ) > 0 pro i = 1, 2,... Pak pro každý jev A Ω platí: pro i j P (A) = i P (A H i )P (H i ) = }{{} i P (A H i) P (A H i ) (3.3) 3.2 Náhodná veličina Náhodná veličina X je funkce, která každému výsledku náhodného pokusu přiřadí reálné číslo. Náhodná veličina je zobrazení X : Ω R, které je definované na Ω se σ-algebrou A a je měřitelné. Že je zobrazení měřitelné znamená, že pro každé B B(R) platí [X B] := {ω Ω : X(ω) B} A Každé náhodné veličině B B(R) lze připsat pravděpodobnostní míru Q: kde Q(B) = P {X 1 (B)}, X 1 (B) = {ω Ω : X(ω) B} je vzor množiny B R při zobrazení X. Potom se pravděpodobnostní míra Q nazývá rozdělení náhodné veličiny X. Častěji se používá zkráceně rozdělení pravděpodobnosti nebo dokonce jen rozdělení. Rozdělení pravděpodobnosti je pravidlo, které každé hodnotě (nebo intervalu hodnot) přiřazuje pravděpodobnost, že náhodná veličina nabude právě této hodnoty (nebo intervalu hodnot). Rozdělení náhodné veličiny popisuje její pravděpodobnostní chování při dané pravděpodobnostní míře P. 10

Funkce F : R 0, 1, která je neklesající, zprava spojitá a platí pro ní lim F (x) = 0 x lim F (x) = 1 x se nazývá distribuční funkcí. Distribuční funkcí náhodné veličiny X rozumíme funkci F (x) = P (X x), x R (3.4) Pro distribuční funkci platí následující: P (X (a, b ) = F (b) F (a) P (X = a) = F (a) F (a ), kde F (a ) značí limitu F v bodě a zleva P (X > a) = 1 F (a) Náhodná veličina může mít rozdělení různých typů, nás bude zajímat rozdělení diskrétního typu. Řekneme, že náhodná veličina X má pravděpodobnostní rozdělení diskrétního typu právě tehdy, když existuje konečná nebo spočetná množina reálných čísel M = {x 1, x 2,...} R taková, že P (X = x i ) = p i > 0 pro i = 1, 2,... a P (X = x i ) = p i = 1 x i Pravděpodobnostní funkcí nazveme takovou funkci, která u diskrétní náhodné veličiny X přiřadí každému x R pravděpodobnost P (X = x), zkráceně P (x): { pi x = x P (x) = i, i = 1, 2,... (3.5) 0 x x i Distribuční funkce F diskrétní náhodné veličiny X je schodovitá, po úsecích konstantní, se skoky v bodech x i, i = 1, 2,.... Pro distribuční funkci platí vztah F (x) = p i (3.6) Hypergeometrické rozdělení i,x i x Mějme konečnou množinu N prvků, z nichž K prvků má určitou sledovanou vlastnost. Z této množiny náhodně vybereme (bez vracení zpět) n prvků. Necht veličina X značí počet prvků ve výběru mající sledovanou vlastnost. Pak náhodná veličina X má hypergeometrické rozdělení pravděpodobnosti HG(N, K, n) s parametry N, K, n N, n N, K N, když pravděpodobnostní funkce má tvar: { ( K x)( N K n x ) x N {0}, taková, že x K, 0 n x N K P (x) = ( N n) 0 jinde (3.7) Píšeme X HG(N, K, n). i 11

Kapitola 4 Odvození postupu kontroly V této kapitole se budeme věnovat výpočtu pravděpodobnosti zamítnutí při různém počtu neplatných podpisů v celkovém počtu dodaných podpisů pod peticí podle zákonem předepsaného postupu. V první části se zaměříme na konkrétní odvození výpočtu pravděpodobnosti zamítnutí, ve druhé části pak získáme pravděpodobnosti zamítnutí simulačně. V následujících částech práce budeme pracovat s proměnnými, které si označíme: N... celkový počet dodaných podpisů pod peticí, n... velikost každého kontrolního vzorku = 8 500, K... počet neplatných podpisů v N, X 1... náhodná veličina značící počet neplatných podpisů v 1. kontrolním vzorku, X 2... náhodná veličina značící počet neplatných podpisů v 2. kontrolním vzorku, q... chybovost = 3 %, h... mez chybovosti = q n = 255. Dle zákonem předepsaného postupu může nastat zamítnutí prezidentské kandidatury třemi možnými způsoby. První možností je, že se provede pouze první kontrolní vzorek, a na jeho základě se rozhoduje o zamítnutí či registraci prezidentské kandidatury. Pouze jeden kontrolní vzorek se provádí v případě, že nebudou splněny podmínky pro realizaci druhého, tj. počet neplatných podpisů v prvním vzorku x 1 je menší než mez chybovosti, což jsou 3 % z rozsahu náhodného výběru n. Potom se počet nalezených neplatných podpisů v prvním vzorku x 1 pouze odečte od celkového počtu dodaných podpisů N a kandidatura bude zamítnuta právě tehdy, když N x 1 < 50 000. Možnost zamítnutí kandidatury po prvním kontrolním vzorku záleží na velikosti N. Jelikož maximální možná hodnota x 1 je h 1 (má být menší než mez chybovosti), pak pro hodnotu N platí: N < 50 000+h 1. Reálně může být kandidatura zamítnuta po uskutečnění pouze prvního kontrolního vzorku jen tehdy, když N 50 000 + h 2, to jest konkrétně N 50 253. 12

Druhou možností zamítnutí prezidentské kandidatury je případ, kdy v prvním kontrolním vzorku bude počet neplatných podpisů x 1 větší nebo rovno h a ve druhém kontrolním vzorku bude počet neplatných podpisů x 2 < h. Potom se počet všech nalezených neplatných podpisů z obou kontrolních vzorků odečte od celkového počtu dodaných podpisů N a kandidatura bude zamítnuta právě tehdy, když N x 1 x 2 < 50 000. Zamítnutí prezidentské kandidatury pouze odečtením nalezených neplatných podpisů v prvním a druhém kontrolním vzorku opět záleží na velikosti N. Maximálních možných hodnot, kterých můžou x 1 a x 2 pro tento případ nabývat, jsou x 1 = n a x 2 = h 1. Pak pro N platí: N < 50000 + n + h 1. Reálné zamítnutí kandidatury v tomto případě může nastat jen tehdy, když N 50 000 + n + h 2, to jest konkrétně N 58 753. Třetí možností zamítnutí prezidentské kandidatury je opět po uskutečnění obou kontrolních vzorků za předpokladů, že x 1 i x 2 nabudou hodnot větších nebo rovno h. Pak se výsledný počet platných podpisů získá odečtením průměrné chybovosti z obou kontrolních vzorků z N od N a kandidatura bude zamítnuta právě tehdy, když N N ( x1+x2 2 n ) < 50 000. Zde nedokážeme určit velikost N, kdy dojde k zamítnutí kandidatury, nebot tento postup závisí na výši chybovosti jednotlivých kontrolních vzorků. Dokážeme ale naopak určit minimální hodnotu N, aby tato možnost - uskutečnění obou vzorků s chybovostmi minimálně 3 % v každém vzorku - nastala. Hodnoty x 1 a x 2 musí být rovny minimálně h, tedy pro N bude platit N 50 000 + 2 h, to jest konkrétně N 50 510. Za zmínění stojí chybný postup, který byl pro kontrolu správnosti údajů na petičních arších v roce 2013 kontrolní komisí použit. V prvních dvou výše zmíněných možností zamítnutí byl postup shodný. Rozdílnost zamítnutí nastala ve třetí možnosti, kdy namísto zprůměrování chybovostí z obou kontrolních vzorků pouze tyto chybovosti sečetli. Díky tomu předpokládali, že v N je jednou tolik procent neplatných podpisů. Například, bylo-li by dodáno N = 55 000 podpisů a byla-li by chybovost prvního kontrolního vzorku 4 % a druhého 6 %, tak správně mělo být odečteno 5 % z celkového počtu dodaných podpisů N (tj. 2750), kdežto chybným postupem odečetli 10 %, což je 5500. Z tohoto příkladu je vidět, že chybným postupem by byla kandidatura zamítnuta, ačkoliv by neměla. Je tedy zřejmé, že tento postup mohl prezidentské kandidáty poškodit. 4.1 Odvození výpočtu pravděpodobnosti Označme si jev zamítnutí prezidentské kandidatury dle zákonem předepsaného postupu Z. Dále si označíme výše zmíněné možnosti zamítnutí prezidentské kandidatury dle zákonem předepsaného postupu. Necht jev zamítnutí kandidatury na základě uskutečnění pouze prvního kontrolního vzorku je značen A, jev zamítnutí kandidatury na základě uskutečnění obou kontrolních vzorků, kdy h x 1 n a x 2 < h, je značen B a jev zamítnutí kandidatury na základě uskutečnění obou kontrolních vzorků, kdy h x 1 n a h x 2 n je značen C. Pravděpodobnost zamítnutí kandidatury P (Z) je rovna pravděpodobnosti 13

sjednocení jevů A, B a C. P (Z) = P (A B C) (4.1) Jelikož jsou tyto tři varianty zamítnutí kandidatury disjunktními jevy, potom pro pravděpodobnost zamítnutí platí, že se rovná pravděpodobnosti sjednocení disjunktních jevů: P (Z) = P (A) + P (B) + P (C) (4.2) V následující části rozebereme jednotlivé sčítance pro získání pravděpodobnosti zamítnutí kandidatury P (Z). Pravděpodobnost zamítnutí kandidatury ve všech třech případech záleží na počtu neplatných podpisů x 1 v prvním kontrolním vzorku. Pravděpodobnosti P (A), P (B) a P (C) lze tedy vyjádřit podmíněnými pravděpodobnostmi za podmínky, že nastane jev X 1 = x 1. Aplikujeme větu o úplné pravděpodobnosti, nebot nabývání hodnot X 1 = x 1 jsou disjunktními jevy a získáme P (A) = x 1 P (A X 1 = x 1 ) P (X 1 = x 1 ) (4.3) P (B) = x 1 P (B X 1 = x 1 ) P (X 1 = x 1 ) (4.4) P (C) = x 1 P (C X 1 = x 1 ) P (X 1 = x 1 ) (4.5) Náhodná veličina X 1 se řídí hypergeometrickým rozdělením s parametry N, K, n N, n N, K N, tj. X 1 HG(N, K, n). Náhodná veličina X 2 je závislá na výsledcích X 1. Také se řídí hypergeometrickým rozdělením, ale s parametry N n, K x 1, n N, n N n, K x 1 N n, to znamená, že (X 2 X 1 = x 1 ) HG(N n, K x 1, n). Začneme odvozením výpočtu pro P (A). Podmíněná pravděpodobnost jevu A z rovnice (4.3) za podmínky, že nastane X 1 = x 1, bude rovna 0 nebo 1, nebot se po uskutečnění pouze prvního vzorku rozhodujeme o zamítnutí či nikoliv. Z 0 x 1 K a 0 n x 1 N K plyne obor hodnot hypergeometrického rozdělení pro x 1 : max(0, n N + K) x 1 min(k, n). K získanému oboru hodnot přidáme podmínku 0 x 1 h 1, nebot nemá být proveden druhý vzorek. Kandidatura bude zamítnuta právě tehdy, když N x 1 < 50 000. Z toho vyplývá, že x 1 N 50 000 + 1. Díky přidaným podmínkám k oboru hodnot hypergeometrického rozdělení získáme hodnoty x 1, pro které bude kandidatura zamítnuta, tzn. P (A X 1 = x 1 ) = 1. Výsledný obor hodnot pro x 1 je: max(0, n N + K, N 50 000 + 1) x 1 min(k, h 1, n) a pro X 1 platí X 1 HG(N, K, n). Potom pro P (A) platí: P (A) = = min(k,h 1,n) max(0,n N+K,N 50000+1) min(k,h 1,n) max(0,n N+K,N 50000+1) P (A X 1 = x 1 ) P (X 1 = x 1 ) = 1 P (HG(N, K, n) = x 1 ) (4.6) 14

Pro jevy B a C nastává rozhodnutí o zamítnutí kandidatury až po realizaci druhého vzorku. Obor hodnot hypergeometrického rozdělení pro x 1 je max(0, n N + K) x 1 min(k, n). Pro oba jevy platí h x 1 n. Tuto informaci zahrneme do oboru hodnot proměnné x 1. Potom pro x 1 platí: max(0, n N + K, h) x 1 min(k, n) a pravděpodobnost zamítnutí kandidatury po realizaci druhého kontrolního vzorku má tvar: P (B) = P (C) = min(k,n) max(0,n N+K,h) min(k,n) max(0,n N+K,h) P (B X 1 = x 1 ) P (X 1 = x 1 ) (4.7) P (C X 1 = x 1 ) P (X 1 = x 1 ) (4.8) Nyní odvodíme výpočet pro P (B). Podmíněná pravděpodobnost P X1=x 1 (B) znamená, že za platnosti X 1 = x 1 bude existovat více hodnot X 2 = x 2 splňujících podmínky jevu B, tj. 0 x 2 h 1. Proto podmíněné pravděpodobnosti P (B X 1 = x 1 ) sečteme a poté vynásobíme P (X 1 = x 1 ). Nyní potřebujeme odvodit x 2, které pro dané X 1 = x 1 nastanou. Obor hodnot hypergeometrického rozdělení pro x 2 doplníme o podmínku 0 x 2 h 1, která platí pro jev B. Kandidatura bude zamítnuta právě tehdy, když N x 1 x 2 < 50 000, tj. x 2 N 50 000 x 1 + 1. Díky přidaným podmínkám je výsledný obor hodnot: max(0, n+k N, N 50 000 x 1 +1) x 2 min(k x 1, n x 1, h 1). Pro X 2 platí X 2 HG(N n, K x 1, n). Potom výsledný tvar pro výpočet P (B) je P (B) = P (HG(N n, K x 1, n) = x 2 ) P (HG(N, K, n) = x 1 ), x 2 M 2 x 1 M 1 (4.9) kde M 1 = {max(0, n N + K, h),..., min(k, n)} a M 2 = {max(0, n N + K, N 50000 x 1 + 1),..., min(k x 1, n x 1, h 1)}. Nakonec odvodíme výpočet pro P (C). Pro jev C doplníme obor hodnot hypergeometrického rozdělení pro x 2 podmínkou h x 2 n. Dále platí, že kandidatura bude zamítnuta právě tehdy, když N N ( x1+x2 ) < 50 000, tj. 2 n (N 50 000) x 2 N x 1 + 1. Po přidání zmíněných podmínek je výsledný obor hodnot pro x 2 2n(N 50 000) max(0, n N + K, h, N x 1 + 1) x 2 min(k x 1, n x 1, n). Tvar pro výpočet P (C) je pak P (C) = P (HG(N n, K x 1, n) = x 2 ) P (HG(N, K, n) = x 1 ), x 2 M 3 x 1 M 1 2 n (4.10) kde M 1 = {max(0, n N + K, h,..., min(k, n)} a M 3 = {max(0, n N +K, h, 2n(N 50000) N x 1 +1)),..., min(k x 1, n x 1, n)}. 15

Pro chybný postup kontroly je odvození výpočtu pravděpodobnosti zamítnutí stejný až do vyjádření si oboru hodnot x 2 pro výpočet P (C). Samozřejmě platí, že obor hodnot bude doplněn o podmínku h x 2 n. Ale kandidatura má být zamítnuta pravě tehdy, když N N ( x1+x2 ) < 50 000, tj. x 2 je P (C) = n (N 50 000) N x 1 M 1 n x 1 +1. Potom tvar výpočtu P (C) pro chybný postup kontroly x 2 M 4 P (HG(N n, K x 1, n) = x 2 ) P (HG(N, K, n) = x 1 ), (4.11) kde M 1 = {max(0, n N + K, h,..., min(k, n)} a M 4 = {max(0, n N + K, h, n(n 50000) N x 1 + 1)),..., min(k x 1, n x 1, n)}. Číselné výsledky P (Z) pro zvolená N budou v kapitole 4. 4.2 Simulace a intervaly spolehlivosti V této části popíšeme, jak budeme získávat pravděpodobnosti zamítnutí kandidatury simulačně a odvodíme si, jak budeme vytvářet intervaly spolehlivosti pro některé hodnoty. Konkrétní číselné výsledky pak budou uvedeny v kapitole 4. Při získávání pravděpodobností simulací potřebujeme, aby hodnoty x 1 a x 2 byly hodnotami pocházejícími z hypergeometrického rozdělení. Na základě těchto vygenerovaných hodnot x 1 a x 2 rozhodujeme o zamítnutí či nezamítnutí prezidentské kandidatury. Jelikož vygenerování náhodných čísel s hypergeometrickým rozdělením pomocí matlabovské funkce hyge je časově náročné, zvolíme pro vygenerování hodnot jiný přístup. Hlavní myšlenkou je vygenerování náhodných permutací. Náhodnou permutaci získáme seřazením posloupnosti náhodně vygenerovaných neopakujících se čísel z intervalu (0, 1). Číslice od 1 do K v náhodné permutaci značí neplatné podpisy. Pro 1. kontrolní vzorek vezmeme prvních n prvků této permutace, pro druhý kontrolní vzorek pak n + 1 až 2n prvků, a v každém vzorku porovnáváme, kolik čísel je menších či rovno K. Potom počet takových hodnot jsou hodnoty x 1 a x 2. Počet simulací, tj. kolikrát tento postup opakujeme pro každé zvolené K, je 20 000. Výsledná pravděpodobnost zamítnutí kandidatury pomocí simulace je odhadnuta jako podíl počtu zamítnutí ku počtu simulací. Nyní si popíšeme, jak budeme získávat intervaly spolehlivosti. Mějme počet simulací s = 20 000. Simulací získáme pouze dva výsledky, bud bude kandidatura zamítnuta, nebo nikoliv, a my sledujeme, kolikrát zamítnuta bude. Stane-li se to r - krát, pak relativní četnost zamítnutí v simulaci je ˆp = r s. Taktéž lze říct, že ˆp je odhadem pravděpodobnosti zamítnutí kandidatury P (Z) získaným simulací. Budeme počítat interval spolehlivosti pro parametr p alternativního rozdělení, kde p znamená skutečnou pravděpodobnost zamítnutí kandidatury, 16

pomocí parametru ˆp. Pro dostatečně velké s, to jest takové, pro které platí sˆp(1 ˆp) 9 bude mít přibližně 100(1-α)%-ní interval spolehlivosti tvar ( ) ˆp (1 ˆp) ˆp (1 ˆp) ˆp u 1 α, ˆp + u 2 1 α 2 s, (4.12) s kde α (0, 1) a u 1 α je kvantil normovaného normálního rozdělení. 2 Šířka (taktéž absolutní chyba) intervalu spolehlivosti e charakterizuje přesnost lokalizace skutečné hodnoty. Máme-li interval spolehlivosti (a, b), potom šířka intervalu e = b a. Pro šířku e námi získaného přibližně 100(1-α)% - ní intervalu spolehlivosti platí e = ˆp + u 1 α 2 ˆp (1 ˆp) s ˆp + u 1 α 2 ˆp (1 ˆp) s = 2 u 1 α 2 ˆp (1 ˆp) s (4.13) 17

Kapitola 5 Výsledky V této kapitole jsou v grafickém znázornění uvedeny výsledky pravděpodobností zamítnutí P (Z) získané použitím odvozeného vzorce pro výpočet P (Z) z předchozí kapitoly. Dále je zde graficky zpracované srovnání hodnot pravděpodobností zamítnutí získané simulací se skutečnými hodnotami P (Z). Výpočet P (Z) i simulace jsou provedeny pouze pro vybrané hodnoty K. 5.1 Volba hodnot K Jak již bylo řečeno, výpočty a simulace jsou provedeny jen na některých vybraných hodnotách K, proto si zde uvedeme, na jakém principu jsou hodnoty K voleny. Znamená-li K počet neplatných podpisů v celkovém počtu dodaných podpisů N, potom N K znamená počet platných podpisů v N. Budeme počítat pravděpodobnosti zamítnutí podle toho, kolik platných podpisů je v N, tj. zvolíme si pro všechna N stejné hodnoty N K. Jelikož minimální počet platných podpisů pro registraci kandidatury je 50 000, budeme volit N K kolem této hodnoty. Zvolíme interval od 49 000 do 51 000 platných podpisů. V intervalech 49 000, 49 900 a 50 100, 51 000 použijeme rozložení hodnot s krokem 30 a v intervalu 49 900, 50 100 použijeme krok 8, tj. volíme N K = 49 000, 49 030,..., 49 900, 49 908,..., 50 092, 50 100, 50 130,..., 50 970, 51 000 pro výpočet P (Z). Pro lepší přehlednost a porovnání výsledků při různých hodnotách N jsou výsledné hodnoty P (Z) graficky znázorněné v závislosti na N K, nikoliv na K. Pro porovnávání hodnot získaných pomocí simulace a skutečných hodnot P (Z) volíme menší počet hodnot s jiným rozložením. Interval platných podpisů N K zůstává stejný, tj. 49 000 až 51 000. Avšak volíme rozdílné rozložení hodnot platných podpisů, a to takto: N K = 49 000, 49 070,..., 49 700, 49 720,..., 49 900, 49 910,..., 50 100, 50 120,..., 50 300, 50 370,..., 51 000. 18

5.2 Vstupní data V roce 2013, kdy byly konány historicky první přímé volby prezidenta České republiky, bylo podáno pouze 8 peticí splňujících podmínku na minimální počet 50 000 podpisů, jak je uvedeno v [6], které měly podpořit osobnosti jakožto prezidentské kandidáty. U těchto peticí byla provedena Ministerstvem vnitra České republiky kontrola správnosti údajů, na jejímž základě se poté rozhodlo o zamítnutí či registraci prezidentské kandidatury. Počty dodaných podpisů N na petičních arších každého z potenciálních prezidentských kandidátů jsou uvedeny v tabulce 5.1. Dále jsou v této tabulce uvedeny jisté hodnoty K. Pro tyto hodnoty platí, že pokud by v N bylo minimálně tolik neplatných podpisů, tak by v ideálním případě měly být kandidatury zamítnuty, tj. pravděpodobnost zamítnutí by měla být rovna jedné. Tabulka 5.1: Přehled počtu dodaných podpisů N prezidentskými kandidáty Jméno a příjmení kandidáta N K Ing. Jana Bobošíková 56 191 6 192 Ing. Vladimír Dlouhý, CSc. 59 165 9 166 Tomio Okamura 61 966 11 967 Tat ana Fischerová 72 434 22 435 MUDr. Zuzana Roithová, MBA 81 199 31 200 Prof. JUDr. Vladimír Franz 87 782 37 783 Ing. Jan Fischer, CSc. 101 261 51 262 Ing. Miloš Zeman 106 081 56 082 Dále budeme pracovat s hodnotami N blízkými 50 000. Jako první volíme N = 51 000. Dále zvolíme takové N, aby mohlo dojít k zamítnutí už po prvním vzorku, tj. N 50 253, volíme N = 50 200. 5.3 Skutečné pravděpodobnosti zamítnutí V této části nejprve graficky porovnáme hodnoty pravděpodobností zamítnutí P (Z) pro zvolená N, a potom graficky porovnáme pravděpodobnosti zamítnutí P (Z) získané podle zákonem předepsaného postupu a získané podle chybného postupu, který byl v roce 2013 použit. Všechny hodnoty pravděpodobností zamítnutí prezidentských kandidatur P (Z) jsou získány z předpisu pro výpočet P (Z) odvozený v 4.1. Na obrázku 5.1 jsou znázorněné křivky pravděpodobností zamítnutí P (Z) v závislosti na počtu platných podpisů N K pro zvolená N z předchozí podkapitoly. 19

Obrázek 5.1: Srovnání P (Z) pro všechna zvolená N P(Z) 1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 Bobosikova Dlouhy Okamura Fischerova Roithova Franz Fischer Zeman N=51000 N=50200 P(Z)=0,05 0.2 0.1 0 4.9 4.92 4.94 4.96 4.98 5 N K 5.02 5.04 5.06 5.08 5.1 x 10 4 Vodorovná černá přímka v obrázku 5.1 značí 5%-ní pravděpodobnost, že prezidentská kandidatura bude zamítnuta při daném počtu platných podpisů v N. Obráceně lze říci, že pokud dodáme N podpisů, a chceme mít alespoň 95%- ní pravděpodobnost, že naše kandidatura bude přijata, mělo by být v celkovém počtu dodaných podpisů alespoň N K platných podpisů. Z obrázku vyplývá, že čím více podpisů dodáme, tím více platných podpisů musí petice obsahovat, aby naše kandidatura byla s 95%-ní pravděpodobností přijata. Například v N = 56 191 by mělo být přibližně 50 180 platných podpisů a v N = 106 081 by mělo být přibližně 56 610 podpisů, aby došlo s 95%-ní pravděpodobností k registraci kandidatury. Z toho jasně vyplývá, že větší počet dodaných podpisů by měl obsahovat více platných podpisů. Avšak když se podíváme na rozdíl počtu platných podpisů (tj. konkrétně na příkladě 6 430), který je podstatně menší než rozdíl počtu dodaných podpisů (49 890), bylo by asi lepší se zabývat procentuálním vyjádřením počtu platných podpisů v N. Z toho pak vyplývá, že z celkového počtu dodaných podpisů N rovno 56 191 by mělo být přibližně 89,3 % platných podpisů. Kdežto již zmíněných 56 610 platných podpisů v 106 081 dodaných podpisů činí jen zhruba 53,4 %. Je tedy zřejmé, že pokud se pro přijetí prezidentské kandidatury požaduje (minimálně) 50 000 platných podpisů, tak větší pravděpodobnost budeme mít s větším počtem dodaných podpisů. Na obrázcích 5.2 a 5.3 jsou znázorněné dvě křivky, které představují závislost pravděpodobnosti zamítnutí prezidentské kandidatury P (Z) na počtu platných podpisů N K pro paní Ing. Bobošíkovou a pana Ing. Zemana. Modrá křivka 20

představuje závislost pravděpodobnosti zamítnutí kandidatury P (Z) získané podle zákonem předepsaného postupu na N K. Červená křivka pak značí závislost P (Z) získané podle chybného postupu na N K. Vodorovné přímky v obou obrázcích opět představují 5%-ní pravděpodobnost, že bude kandidatura zamítnuta při daném počtu platných podpisů, resp. 95%-ní pravděpodobnost, že bude prezidentská kandidatura přijata. Obrázek 5.2: Srovnání P (Z) získaných dle správného a chybného postupu pro Ing. Bobošíkovou 1 0.9 0.8 spravny postup chybny postup P(Z)=0,05 0.7 0.6 P(Z) 0.5 0.4 0.3 0.2 0.1 0 4.9 4.95 5 5.05 5.1 5.15 N K 5.2 5.25 5.3 5.35 5.4 x 10 4 21

Obrázek 5.3: Srovnání P (Z) získaných dle správného a chybného postupu pro Ing. Zemana 1 0.9 0.8 spravny postup chybny postup P(Z)=0,05 0.7 0.6 P(Z) 0.5 0.4 0.3 0.2 0.1 0 4.5 5 5.5 6 6.5 7 7.5 8 N K x 10 4 Pro chybný postup vyplývá, stejně jako pro ten správný, že pro větší N je požadovaný větší počet N K v N, aby byla kandidatura s 95%-ní pravděpodobností přijata. I nyní si vyjádříme počet platných podpisů v N procentuálně pro 95%-ní pravděpodobnost zamítnutí kandidatury, tentokrát ale pro hodnoty získané chybným postupem kontroly. Získáme, že v N = 56 191 by mělo být přibližně 94,7 % platných podpisů a v N = 106 081 přibližně 74,1 %. Obě hodnoty K N se zvýšily, každá řádově jinak, což bude mít nejspíš za následek velikost N. Je zřejmé, že chybný postup kontroly mohl poškodit (a skutečně tomu tak i bylo) prezidentské kandidáty. Například pro Ing. Zemana mohla být získaná chybovost z kontrolních vzorků podle správného postupu kontroly dokonce lehce přes 50 %, nebot odečtením 0, 5N od N získáme stále více než 50 000 podpisů. Kdežto u chybného postupu kontroly je maximální chybovost pro nezamítnutí kandidatury velmi přibližně 24,6 %, což jest zhruba poloviční. Což by mohlo plynout z faktu, že chybovosti získané z kontrolních vzorků nebyly zprůměrovány, ale pouze sečteny. 5.4 Výsledky simulace a intervaly spolehlivosti V této části budeme opět graficky porovnávat a poté vytvářet intervaly spolehlivosti. Tentokrát srovnáme skutečné pravděpodobnosti zamítnutí P (Z) s pravděpodobnostmi získanými simulací. Pak pro několik hodnot P (Z) vyjádříme in- 22

tervaly spolehlivosti pomocí hodnot získaných simulací a porovnáme, jaký vliv na ně má velikost N. Konkrétně budeme zjišt ovat 95%-ní interval spolehlivosti pro N K = 49 700, 50 000 a 50 300, když počet simulací s je roven 20 000. Obrázky 5.4 až 5.11 znázorňují srovnání skutečných hodnot pravděpodobností zamítnutí P (Z) (modré křížky) a pravděpodobností zamítnutí získané simulací (červené body) pro potenciální prezidentské kandidáty. Na obrázcích 5.12 a 5.13 je pak znázorněné srovnání pravděpodobností pro obecně zvolené hodnoty N. Obrázek 5.4: Porovnání hodnot P (Z) získaných výpočtem a simulací pro Ing. Janu Bobošíkovou 1 0.9 0.8 vypocet simulace 0.7 0.6 P(Z) 0.5 0.4 0.3 0.2 0.1 0 4.9 4.92 4.94 4.96 4.98 5 N K 5.02 5.04 5.06 5.08 5.1 x 10 4 23

Obrázek 5.5: Porovnání hodnot P (Z) získaných výpočtem a simulací pro Ing. Vladimíra Dlouhého, CSc. 1 0.9 0.8 0.7 vypocet simulace 0.6 P(Z) 0.5 0.4 0.3 0.2 0.1 0 4.9 4.92 4.94 4.96 4.98 5 N K 5.02 5.04 5.06 5.08 5.1 x 10 4 Obrázek 5.6: Porovnání hodnot P (Z) získaných výpočtem a simulací pro Tomia Okamuru 1 0.9 0.8 vypocet simulace 0.7 0.6 P(Z) 0.5 0.4 0.3 0.2 0.1 0 4.9 4.92 4.94 4.96 4.98 5 N K 5.02 5.04 5.06 5.08 5.1 x 10 4 24

Obrázek 5.7: Porovnání hodnot P (Z) získaných výpočtem a simulací pro Tat anu Fischerovou 1 0.9 0.8 vypocet simulace 0.7 0.6 P(Z) 0.5 0.4 0.3 0.2 0.1 0 4.9 4.92 4.94 4.96 4.98 5 N K 5.02 5.04 5.06 5.08 5.1 x 10 4 Obrázek 5.8: Porovnání hodnot P (Z) získaných výpočtem a simulací pro MUDr. Zuzanu Roithovou, MBA 1 0.9 0.8 vypocet simulace 0.7 0.6 P(Z) 0.5 0.4 0.3 0.2 0.1 0 4.9 4.92 4.94 4.96 4.98 5 N K 5.02 5.04 5.06 5.08 5.1 x 10 4 25

Obrázek 5.9: Porovnání hodnot P (Z) získaných výpočtem a simulací pro Prof. JUDr. Vladimíra Franze 1 0.9 0.8 vypocet simulace 0.7 0.6 P(Z) 0.5 0.4 0.3 0.2 0.1 0 4.9 4.92 4.94 4.96 4.98 5 N K 5.02 5.04 5.06 5.08 5.1 x 10 4 Obrázek 5.10: Porovnání hodnot P (Z) získaných výpočtem a simulací pro Ing. Jana Fischera, CSc. 1 0.9 0.8 vypocet simulace 0.7 0.6 P(Z) 0.5 0.4 0.3 0.2 0.1 0 4.9 4.92 4.94 4.96 4.98 5 N K 5.02 5.04 5.06 5.08 5.1 x 10 4 26

Obrázek 5.11: Porovnání hodnot P (Z) získaných výpočtem a simulací pro Ing. Miloše Zemana 1 0.9 0.8 vypocet simulace 0.7 0.6 P(Z) 0.5 0.4 0.3 0.2 0.1 0 4.9 4.92 4.94 4.96 4.98 5 N K 5.02 5.04 5.06 5.08 5.1 x 10 4 Obrázek 5.12: Porovnání hodnot P (Z) získaných výpočtem a simulací pro N = 51 000 1 0.9 0.8 vypocet simulace 0.7 0.6 P(Z) 0.5 0.4 0.3 0.2 0.1 0 4.9 4.92 4.94 4.96 4.98 5 N K 5.02 5.04 5.06 5.08 5.1 x 10 4 27

Obrázek 5.13: Porovnání hodnot P (Z) získaných výpočtem a simulací pro N = 50 200 0.7 0.6 vypocet simulace 0.5 0.4 P(Z) 0.3 0.2 0.1 0 4.9 4.92 4.94 4.96 4.98 5 5.02 N K x 10 4 Jak již bylo řečeno, chceme si vyjádřit 95%-ní interval spolehlivosti pro 49 700, 50 000 a 50 300 platných podpisů. To znamená, že volíme α = 0, 05, což nám říká, že s 95%-ní pravděpodobností bude daný interval obsahovat skutečnou hodnotu P (Z). Počet simulací je 20 000. Ve skutečnosti pomocí vzorce (4.12) získáme (pro α = 0, 05) přibližně 95%-ní interval spolehlivosti. Chceme-li zjistit, jak přesná byla simulace, vyjádříme si ze získaných intervalů spolehlivosti jejich šířky e. Čím je šířka e kratší (pro stejné α), tím je interval spolehlivosti pro skutečnou hodnotu přesnější. Šířku e získáme odečtením krajních hodnot intervalu spolehlivosti a dosazením za α = 0, 05 a s = 20 000. Výsledný předpis pro e je závislý už jen na odhadu pravděpodobnosti zamítnutí ˆp e = 2 u 1 0,05 2 ˆp (1 ˆp) = 20000 2 1, 96 20000 ˆp (1 ˆp) Pokud hodnoty ˆp budou blízké 0, resp. 1, bude šířka e menší než pro hodnoty ˆp kolem 0,5. Což potvrzují i tabulky 5.4 pro N K = 50 300, kdy hodnoty ˆp jsou blízká nule, resp. 5.2, a 5.3 pro N K = 50 000, kdy hodnoty ˆp se pohybují kolem 0,05. Nyní se podívejme, jaký vliv má velikost N na šířku intervalu. Z tabulek 5.2 a 5.4 vyplývá, že větší přesnost simulace pro skutečnou hodnotu P (Z) se dosahuje pro menší N. Kdežto pro počet platných podpisů N K = 50 000 nemá velikost N, při zaokrouhlení na 4 desetinná místa, žádný vliv na rozdílnost přesností, jak vyplývá z tabulky 5.3. 28

Tabulka 5.2: Přehled intervalů spolehlivosti pro N K = 49 700 N Interval spolehlivosti Délka intervalu 56 191 (0,9951, 0,9969) 0,0017 59 165 (0,9799, 0,9836) 0,0037 61 966 (0,9661, 0,9709) 0,0048 72 434 (0,9030, 0,9110) 0,0081 81 199 (0,8674, 0,8767) 0,0093 87 782 (0,8347, 0,8448) 0,0102 101 261 (0,8010, 0,8119) 0,0110 106 081 (0,7844, 0,7956) 0,0113 Tabulka 5.3: Přehled intervalů spolehlivosti pro N K = 50 000 N Interval spolehlivosti Šířka intervalu 56 191 (0,4921, 0,5059) 0,0139 59 165 (0,4887, 0,5026) 0,0139 61 966 (0,4970, 0,5108) 0,0139 72 434 (0,4914, 0,5053) 0,0139 81 199 (0,5047, 0,5186) 0,0139 87 782 (0,4974, 0,5113) 0,0139 101 261 (0,4955, 0,5093) 0,0139 106 081 (0,4870, 0,5008) 0,0139 Tabulka 5.4: Přehled intervalů spolehlivosti pro N K = 50 300 N Interval spolehlivosti Šířka intervalu 56 191 (0,0018, 0,0031) 0,0014 59 165 (0,0122, 0,0155) 0,0032 61 966 (0,0279, 0,0327) 0,0048 72 434 (0,0844, 0,0922) 0,0079 81 199 (0,1294, 0,1388) 0,0094 87 782 (0,1533, 0,1635) 0,0101 101 261 (0,1931, 0,2041) 0,0111 106 081 (0,2089, 0,2202) 0,0114 29

Kapitola 6 Závěr Bakalářská práce se zabývala kontrolou správnosti údajů na dodaných petičních arších prováděnou Ministerstvem vnitra České republiky při historicky první přímé volbě prezidenta České republiky. Cílem této bakalářské práce bylo seznámit se se zákonem předepsaným postupem pro kontrolu správnosti údajů na dodaných petičních arších a vypočítat pravděpodobnosti zamítnutí prezidentské kandidatury, když celkový počet dodaných podpisů obsahoval určitý počet neplatných, resp. platných, podpisů. Pro různé hodnoty celkového počtu dodaných podpisů pod peticí potenciálními prezidentskými kandidáty byly vypočítány skutečné pravděpodobnosti zamítnutí prezidentské kandidatury. Také byla provedena simulace, na jejímž základě byly získány odhady pravděpodobnosti zamítnutí prezidentské kandidatury. Nejprve byl odvozen předpis pro výpočet skutečných pravděpodobností zamítnutí prezidentské kandidatury pomocí definice sjednocení disjunktních jevů a následnou aplikací věty o úplné pravděpodobnosti. Poté byla uvedena myšlenka postupu simulace a byl vyjádřen tvar přibližně 100(1 α)%-ního intervalu spolehlivosti pro odhady pravděpodobností zamítnutí prezidentské kandidatury získané právě touto simulací. V závěrečné kapitole byly uvedeny číselné výsledky získané postupem uvedeným v předcházející kapitole. Pro získání výsledků byl použit matematický software MATLAB od společnosti The MathWorks. Nejprve jsme porovnali závislost pravděpodobností zamítnutí prezidentských kandidatur na počtu platných podpisů v celkovém počtu dodaných podpisů pro všechny potenciální kandidáty. Porovnáním krajních hodnot celkového počtu dodaných podpisů jsme ověřili, že větší pravděpodobnosti registrace kandidatury docílíme tím, že dodáme větší počet podpisů, což jsme intuitivně předpokládali. V závěru jsme pomocí simulace získaly odhady pravděpodobností zamítnutí prezidentských kandidatur. Na jejich základě jsme si vyjádřily 95%-ní intervaly spolehlivosti, když celkový počet dodaných podpisů pod peticí obsahoval 49 700, 50 000 a 50 300 platných podpisů. Zjistili jsme, že absolutní chyba intervalů spolehlivosti pro 50 000 platných podpisů v celkovém počtu dodaných 30

je pro všechny zvolené počty dodaných podpisů stejná. Zatímco pro 50 300. resp. 49 700, platných podpisů ve všech dodaných se absolutní chyba s větším počtem dodaných popisů zvětšuje. 31

Literatura [1] Anděl, J.: Matematická statistika. SNTL, Praha, 1985. [2] Johnson, N. L., Kemp, A. W., Kotz, S.: Univariate discrete distributions. Third edition, Wiley, Hoboken, 2005. [3] Reif, J.: Metody matematické statistiky. Západočeská univerzita, Plzeň, 2004. [4] Vencálek, O.: Volba prezidenta: problém kontroly podpisů. Informační bulletin České statistické společnosti 25 (2014), no. 2, 1-11. [5] ČESKO. Zákon č. 275 ze dne 18. července 2012 o volbě prezidenta republiky a o změně některých zákonů (zákon o volbě prezidenta republiky). In: Sbírka zákonů České republiky. 2012, částka 95, s. 3554-3582. ISSN 1211-1244. [6] MINISTERSTVO VNITRA ČR, Ministerstvo vnitra České republiky [online]. [cit. 2016-05-20]. Dostupné z: http://www.mvcr.cz/clanek/rozhodnuti.aspx 32

Seznam obrázků 5.1 Srovnání P (Z) pro všechna zvolená N............... 20 5.2 Srovnání P (Z) získaných dle správného a chybného postupu pro Ing. Bobošíkovou........................... 21 5.3 Srovnání P (Z) získaných dle správného a chybného postupu pro Ing. Zemana.............................. 22 5.4 Porovnání hodnot P (Z) získaných výpočtem a simulací pro Ing. Janu Bobošíkovou.............................. 23 5.5 Porovnání hodnot P (Z) získaných výpočtem a simulací pro Ing. Vladimíra Dlouhého, CSc......................... 24 5.6 Porovnání hodnot P (Z) získaných výpočtem a simulací pro Tomia Okamuru............................. 24 5.7 Porovnání hodnot P (Z) získaných výpočtem a simulací pro Tat anu Fischerovou.............................. 25 5.8 Porovnání hodnot P (Z) získaných výpočtem a simulací pro MUDr. Zuzanu Roithovou, MBA...................... 25 5.9 Porovnání hodnot P (Z) získaných výpočtem a simulací pro Prof. JUDr. Vladimíra Franze....................... 26 5.10 Porovnání hodnot P (Z) získaných výpočtem a simulací pro Ing. Jana Fischera, CSc.............................. 26 5.11 Porovnání hodnot P (Z) získaných výpočtem a simulací pro Ing. Miloše Zemana................................ 27 5.12 Porovnání hodnot P (Z) získaných výpočtem a simulací pro N = 51 000................................. 27 5.13 Porovnání hodnot P (Z) získaných výpočtem a simulací pro N = 50 200................................. 28 33

Seznam tabulek 5.1 Přehled počtu dodaných podpisů N prezidentskými kandidáty.. 19 5.2 Přehled intervalů spolehlivosti pro N K = 49 700........ 29 5.3 Přehled intervalů spolehlivosti pro N K = 50 000........ 29 5.4 Přehled intervalů spolehlivosti pro N K = 50 300........ 29 34

Přílohy Přílohy na CD Bakalářská práce Vstupní data Zdrojové kódy v MATLABu Získané výsledky v MS Excel 35