Predikce volebních výsledků z průběžného sčítání. Jan Tuček a Daniel Prokop

Podobné dokumenty
STEM VOLEBNÍ PREFERENCE PROSINEC 2015

STEM VOLEBNÍ PREFERENCE LEDEN 2016

STEM VOLEBNÍ PREFERENCE ČERVEN 2014

Výzkum pro volební studio ČT II. Analýza výsledků voleb podle typu obcí Zpracováno exkluzivně pro:

STEM VOLEBNÍ PREFERENCE PROSINEC 2016

METODOLOGIE. SANEP s.r.o. kvótní výběr. multiplechoice

Volby do PS Volební účast. Výsledky jednotlivých stran podle regionů, zde v členění podle okresů.

STEM VOLEBNÍ PREFERENCE KVĚTEN 2015

VOLEBNÍ PREFERENCE ČERVEN 2018

KLIENTSKÉ SETKÁNÍ 2017

VOLEBNÍ PREFERENCE BŘEZEN 2018

VOLBY DO EVROPSKÉHO PARLAMENTU volební model (duben 2019), vliv účasti, potenciál stran

ŘÍJEN 2017 VOLEBNÍ POTENCIÁL

VOLEBNÍ POTENCIÁL ČERVEN 2017

METODOLOGIE. Praha N= Brno N= 351 Ostrava N= 348 Plzeň N= 242 Liberec N= 228 Ústí nad Labem N= 186. internetový CAWI on/off-line průzkum

PREZIDENTSKÁ VOLBA 1. kolo - Leden 2018

OCHOTA ZÚČASTNIT SE VOLEB DO POSLANECKÉ SNĚMOVNY

VOLEBNÍ PREFERENCE LISTOPAD 2018

nezávislá analýza nad daty pro

VOLEBNÍ PREFERENCE ČR + PRAHA ZÁŘÍ 2018

METODOLOGIE. SANEP s.r.o. kvótní výběr. multiplechoice

VOLIČI A VOLIČSKÉ MOTIVACE 2013

Preference politických subjektů - březen celkový přehled 5,5% 5,5% 5,4% 4,5% 2,0% 1,6% 1,5% 1,5% 1,4%

Miloš Zeman Rok ve funkci

sněmovní volební model srpen 2018 (sběr 25. července 28. srpna 2018)

KRAJSKÉ VOLBY BŘEZEN 2016

Sněmovní volební model MEDIAN KVĚTEN 2015

PREFERENCE KVĚTEN 2017 sběr: ,7% 10,3% 7,7% 7,4% 5,9% 4,9% 3,8% 3,4% 2,8% 1,6% 1,3% 1,1%

Sněmovní volební model MEDIAN LISTOPAD 2014

Sněmovní volební model MEDIAN

Sněmovní volební model MEDIAN

DĚKUJEME VŠEM VOLIČŮM, KTEŘÍ DALI HLAS NAŠÍ STRANĚ V PARLAMENTNÍCH VOLBÁCH

Sněmovní volební model MEDIAN (říjen-listopad 2012)

sněmovní volební model červen 2018 (sběr 25. května 26. června 2018)

sněmovní volební model duben 2019 (sběr 23. března dubna 2019)

Transparentní financování jako faktor stranické důvěry

Sněmovní volební model MEDIAN

sněmovní volební model říjen 2018 (sběr 25. září 25. října 2018)

sněmovní volební model květen 2019 (sběr 24. dubna května 2019)

sněmovní volební model srpen 2019 (sběr 27. července srpna 2019 )

1/5. volební výzkum PRAHA Praha S 1 5. preference a potenciál

Listopad vlna

OBSAH METODOLOGIE VÝSLEDKY PRŮZKUMU KOMENTÁŘ PANEL BOOK KONTAKTY

sněmovní volební model únor 2019 (sběr 24. ledna února 2019)

Současná politická situace

Hodnocení aktérů kauzy A. Babiše. (bleskový průzkum, sběr 26. a 27. listopadu 2018) zpracováno pro

Sněmovní volební model MEDIAN (listopad-prosinec 2012)

Sněmovní volební model MEDIAN

Listopad vlna

Analýza auditorů ověřujících hospodaření politických stran

ANO ČSSD KSČM nevím jiné strany ODS TOP09 KDU-ČSL Piráti STAN Svobodní Strana zelených

Sněmovní volební model MEDIAN

Preference politických subjektů - prosinec celkový přehled 10,4% 10,3% 9,1% 6,5% 5,0% 5,0% 4,6% 1,5% 1,3% 1,2% 1,2% 1,1%

Oddlužení metodika výzkumu

KRAJSKÉ VOLEBNÍ PREFERENCE ČERVENEC 2016 VOLEBNÍ POTENCIÁL

ANALÝZA VÝSLEDKŮ VOLEB DO ZASTUPITELSTEV KRAJŮ V ROCE 2016 Z HLEDISKA ZASTOUPENÍ ŽEN

Červen vlna

1/5. Celá ČR. PREFERENCE PROSINEC 2018 sběr: Celá ČR Preference politických subjektů - PROSINEC % 20% 10%

KRAJSKÉ VOLBY 2016 Předvolební výzkumy ČT - zhodnocení

Výsledky volebních stran se ziskem mandátů krajského zastupitelstva v roce v tom okres Moravskoslezský Frýdek-

Červen vlna

Květen vlna

sněmovní volební model prosinec2018 / leden 2019 (sběr 10. prosince ledna 2019)

Sněmovní volební model MEDIAN. Červen 2017

VOLEBNÍ POTENCIÁL ZÁŘÍ 2017 sběr: ? Piráti 5,9% KDU-ČSL 5,7% Realisté 5,5%

Volební model květen 2017 a vliv vládní krize

sněmovní volební model červenec 2018 (sběr 27. června 23. července 2018)

Březen vlna

11,0% 10,5% 7,9% 6,3% 5,8% 5,5% 3,4% 2,5% 2,0% 1,7% 1,3% ANO ČSSD nevím KSČM ODS KDU-ČSL TOP09 jiné strany Piráti STAN Strana zelených

bleskový průzkum k aktuálnímu dění 3. část výsledků

sněmovní volební model listopad/prosinec 2018 (sběr 10. listopadu 9. prosince 2018)

sněmovní volební model červen 2019 (sběr 1. června června 2019)

VOLBY 2017: Volební rozhodování, kampaně a povolební realita

Hodnocení výsledků voleb a vnímání povolební situace voliči

Sněmovní volební model MEDIAN

Sněmovní volební model MEDIAN. První polovina října 2017 (sběr )

Sněmovní volební model MEDIAN. Září 2017

sněmovní volební model červenec 2019 (sběr 1. července července 2019)

Hodnocení povolební situace

Sněmovní volební model MEDIAN

Duben vlna

Sněmovní volební model MEDIAN ÚNOR 2015

Červen vlna

Volební model v květnu 2018

Dva týdny před volbami. 51 % nerozhodnutých

METODOLOGIE. SANEP s.r.o. kvótní výběr. multiplechoice

Sněmovní volební model MEDIAN

Výzkum před komunálními volbami 2018 Volební potenciál. Závěrečná zpráva, Zpracováno exkluzivně pro

Březen vlna

Rozpuštění sněmovny a směřování k volbám. Srpen 2013

Sněmovní volební model MEDIAN. Červenec 2017

Volební preference v pěti největších krajích ČR

Sněmovní volební model MEDIAN. Srpen 2017

Lidský kapitál Bleskový výzkum Hamé: QN výstupy

Březen vlna

9. květen 2008 MEDIAN ČR

Leden vlna

VOLBY LIBERECKÝ KRAJ

Sněmovní volební model MEDIAN. (březen-duben 2013) 29. duben 2013

Volby do Poslanecké sněmovny Parlamentu ČR Rýmařovsko

Transkript:

Predikce volebních výsledků z průběžného sčítání Jan Tuček a Daniel Prokop

O co jde v predikci Exit-polls Predikce ze sčítání publikace 14:00 průměrné odchylky cca 1 p.b. a maximální 2,5 p.b. 15-25 tisíc respondentů cena v řádech milionů korun model finálního výsledku z průběžného sčítání publikace prvních výsledků 14:30-15:00 cíle přesnost do 1,5 p.b. na stranu zpřesnění sčítání: redukce odchylky na cca 1/3 průběžnost: ideálně real-time více možných metod (AUS, FR, CZ)

Ukázka výsledků v jednotlivých VO (2013) Kód obce-okrsek, cca 14.800 okrsků 589250-33 593435-1 584975-2 506753-4 556254-5 597961-1 598003-6 584291-6 547492-2 554308-284 540471-12 537438-1 568414-11 545988-83 549169-1 537004-3 534528-1 588024-2 569810-24 546135-147 574538-2 560413-1 555771-15 592455-2 513423-1 576824-3 561380-38 548669-1 585068-42 500224-867 578053-1 577057-1 500097-75 585068-48 0 20 40 60 80 100

Metodika STEM/MARK (kolektiv autorů ) Výsledky z roku 2013 agregace okrsků do shluků (kontrola na výsledky 2010) zjištění velikosti shluků Průběžné výsledky 2017 zařazení okrsků do shluků (dle 2013) převážení podle očekávané velikosti shluku (dle 2013) Model

Shluková analýza Strom podobnosti okrsků rozdělit co nejpodrobněji i nejmenší cluster musí být dostatečně velký Vhodný počet skupin = 13 k = 9 velikost nejmenšího = 400 k = 13 velikost nejmenšího = 400 k = 14 velikost nejmenšího = 105 14 872 okrsků

Typologie volebních okrsků Vážený průměr volebních výsledků 2013 1 (457 okrsků, 202 tis. voličů) 2 (1818 okrsků, 852 tis. voličů) 3 (1627 okrsků, 565 tis. voličů) 4 (1645 okrsků, 477 tis. voličů) 5 (1469 okrsků, 608 tis. voličů) 6 (657 okrsků, 216 tis. voličů) 7 (2300 okrsků, 827 tis. voličů) 8 (1089 okrsků, 313 tis. voličů) 9 (939 okrsků, 229 tis. voličů) 10 (402 okrsků, 71 tis. voličů) 11 (857 okrsků, 250 tis. voličů) 12 (982 okrsků, 217 tis. voličů) 13 (630 okrsků, 145 tis. voličů) 0 20 40 60 80 100

Rychlost sčítání skupin okrsků 2013 Shluk č.1 se sčítá výrazně pomaleji Shluk Sečteno 10% Sečteno 25% Sečteno 50% Sečteno 75% Sečteno 90% Sečteno 100% 1 15:28 15:56 16:30 17:06 17:35 19:54 2 15:17 15:38 16:04 16:33 17:01 19:38 3 15:04 15:23 15:49 16:14 16:42 19:02 4 14:59 15:16 15:38 16:04 16:31 19:10 5 15:07 15:25 15:47 16:10 16:33 19:18 6 15:00 15:17 15:39 16:04 16:29 18:48 7 15:05 15:21 15:42 16:04 16:28 19:02 8 14:58 15:12 15:34 16:00 16:26 18:40 9 14:55 15:11 15:34 15:58 16:23 18:31 10 14:59 15:09 15:32 15:56 16:21 19:43 11 15:02 15:18 15:40 16:05 16:30 17:49 12 14:57 15:11 15:30 15:55 16:19 17:39 13 14:54 15:08 15:27 15:51 16:11 19:03

Geografické rozložení okrsků podle skupin Barva odpovídá vítězi voleb v daném okrsku 1 2 3 4 5 6 7 8 9 10 11 12 13

Shluk 1: Praha a velká města 29 19 14 13 11 6 6 3 TOP 09 ANO ODS ČSSD KDU-ČSL KSČM Úsvit Ostatní

Shluk 2: Velká města a satelity 21 19 15 15 11 6 9 5 TOP 09 ANO ODS ČSSD KDU-ČSL KSČM Úsvit Ostatní

Shluk 9: Moravské vesničky 21 8 16 17 13 9 10 5 TOP 09 ANO ODS ČSSD KDU-ČSL KSČM Úsvit Ostatní

Shluk 10: Ústecko a podobné 24 26 18 11 7 5 2 7 TOP 09 ANO ODS ČSSD KDU-ČSL KSČM Úsvit Ostatní

Metodika MEDIAN (autor: Tomáš Hovorka) Odhad výsledku strany v okrsku odhadovaná jednotka = STRANA x OKRSEK odhad u každé strany (P) ze všech sečtených okrsků (N) a do všech nesečtených okrsků (M) Příklad: 1000 sečtených okrsků. Každá ze 13 stran má v každém z 13 000 nesečtených okrsku 1000 separátních odhadů výsledku. Agregování odhadů První agregace agregace (N) odhadů pro danou stranu (P) v okrsku (M) vážená agregace zohledněna např. korelace okrsků v minulých volbách spojitá metoda (místo dichotomizace segmentací) Druhá agregace sečtení výsledků v okrscích pro celou ČR Naučení modelu Vychází ze srovnání dvou voleb stejného typu Možná verifikace v posledních 20 letech voleb

Metodika MEDIAN spojitý odhad Odhad strany X - spojitý Okr1 Okr2 Okr3 Okr4 Okr5 Okr6 Okr7 Okr8 Okr9 Okr10 Okr1 100 75 78 52 65 27 16 24 10 38 Okr2 100 62 59 92 49 13 21 22 36 Okr3 100 64 51 39 10 17 25 41 Okr4 100 74 24 9 25 23 27 Okr5 100 32 24 29 24 26 Okr6 100 91 82 56 68 Okr7 100 59 53 61 Okr8 100 79 71 Okr9 100 58 Okr10 100 Odhad strany X - segmentovaný Okr1 Okr2 Okr3 Okr4 Okr5 Okr6 Okr7 Okr8 Okr9 Okr1 0 Okr1 100 100 100 100 100 0 0 0 0 0 Okr2 100 100 100 100 0 0 0 0 0 Okr3 100 100 100 0 0 0 0 0 Okr4 100 100 0 0 0 0 0 Okr5 100 0 0 0 0 0 Okr6 100 100 100 100 100 Okr7 100 100 100 100 Okr8 100 100 100 Okr9 100 100 Okr10 100

Predikce a průběžné sčítání v čase volby 2013 na základě 2010

Snižování průměrné odchylky volby 2013 na základě 2010

Výsledky MEDIAN od roku 2010 Jaké volby z jakých odhadujeme Průměrná chyba v 14:40 Průměrná chyba v 14:50 Maximální chyba v 14:40 Maximální chyba v 14:50 2010 z 2006 1,67 0,68 3,62 1,87 2013 z 2006 0,85 0,94 2,07 2,04 2013 z 2010 0,67 0,25 2,05 0,66 2017 z 2006 1,10 0,74 3,79 1,06 2017 z 2010 0,67 0,52 2,64 1,04 2017 z 2013 0,47 0,44 1,09 1,18 0,95 0,61 2,50 1,38

15:00 - Median lepší v průměru odchylek, STEM/MARK v maximální 35 30 25 STEM/MARK Konečné výsledky Median STEM/MARK Median maximální odchylka 1,28 1,62 průměr odchylek 0,61 0,42 20 15 10 5 0 ANO ODS Piráti SPD KSČM ČSSD KDU-ČSL TOP 09 STAN Ostatní

15:15 - Predikce se zpřesňují 35 30 25 STEM/MARK Konečné výsledky Median STEM/MARK Median maximální odchylka 0,77 1,41 průměr odchylek 0,44 0,38 20 15 10 5 0 ANO ODS Piráti SPD KSČM ČSSD KDU-ČSL TOP 09 STAN Ostatní

15:30 - v průměru nastejno 35 30 25 STEM/MARK Konečné výsledky Median STEM/MARK Median maximální odchylka 0,73 1,33 průměr odchylek 0,34 0,36 20 15 10 5 0 ANO ODS Piráti SPD KSČM ČSSD KDU-ČSL TOP 09 STAN Ostatní

16:00 - STEM/MARK přesnější v průměru i max. odchylce 35 30 25 STEM/MARK Konečné výsledky Median STEM/MARK Median maximální odchylka 0,43 1,09 průměr odchylek 0,19 0,32 20 15 10 5 0 ANO ODS Piráti SPD KSČM ČSSD KDU-ČSL TOP 09 STAN Ostatní

Vývoj modelu a průběžných součtů: ANO 33 32 STEM/MARK Median Sčítání 31 30 29 28 27 14:35 14:55 15:15 15:35 15:55 16:15 16:35 16:55 17:15 17:35 17:55 18:15 18:35

Vývoj modelu a průběžných součtů: TOP 09 8 7 STEM/MARK Median Sčítání 6 5 4 3 2 14:35 14:55 15:15 15:35 15:55 16:15 16:35 16:55 17:15 17:35 17:55 18:15 18:35

Vývoj modelu a průběžných součtů: KSČM 12 11 STEM/MARK Median Sčítání 10 9 8 7 6 14:35 14:55 15:15 15:35 15:55 16:15 16:35 16:55 17:15 17:35 17:55 18:15 18:35

Vývoj modelu a průběžných součtů: ODS 13 12 11 10 9 8 STEM/MARK Median Sčítání 7 14:35 14:55 15:15 15:35 15:55 16:15 16:35 16:55 17:15 17:35 17:55 18:15 18:35

Vývoj modelu a průběžných součtů: SPD 13 12 11 10 9 8 STEM/MARK Median Sčítání 7 14:35 14:55 15:15 15:35 15:55 16:15 16:35 16:55 17:15 17:35 17:55 18:15 18:35

Srovnání výsledků STEM/MARK a Median Median STEM/MARK lepší průměrná chyba na stranu do 15:45 lepší pořadí stran v prvních odhadech přesnější predikce vítěze (ANO pod 30 %) nižší maximální chyba u odhadů celkově lepší přibližování volbám: průměrná chyba na stranu od 16:00 přesnější predikce TOP09 a STAN

Pro a proti metodik Median STEM/MARK + robustnější: vážený odhad místo oddělených odhadů v rámci v segmentu z méně okrsků + rychlejší: vyšší přesnost v začátku + neměnná a testovatelná napříč volbami minulostí + nevadí vznik nových stran + lepší přibližování volbám: ve chvíli nasycení všech segmentů přesnější + výpočetně jednodušší a laicky pochopitelnější - více vadil vznik nových stran - citlivá na proměnu regionální struktury podpory strany (posun zisku TOP09 v Praha / mimo Prahu), mohlo déle udržovat nepřesnost - potřebuje více voleb stejného typu na naučení - pomalejší: potřebovala zástupce všech typů - citlivá na zásah nereprezentativního okrsku v rámci pomaleji sčítaných typů - citlivá na velkou proměnu typologie okrsků mezi volbami obě: citlivé na velké změny volební účasti v různých typech okrsků