www.pwc.com/cz Model výkonnosti hokejových reprezentačních týmů Duben 5
Poradenská společnost analyzovala předpoklady jednotlivých zemí pro úspěch na mistrovství světa v hokeji, které začíná. května v Praze. Statistická analýza, zohledňující mimo jiné historické výsledky na šampionátech v posledních letech, počty stadionů, registrovaných hokejistů, demografické a ekonomické ukazatele či průměrnou roční teplotu, favorizuje domácí Českou republiku. Stříbro by měl získat tým Ruska a bronz, která v boji o třetí místo porazí. Černým koněm šampionátu budou Švýcaři, kteří zatím nenaplňují svůj potenciál. V této práci jsme použili regresní analýzu pro odhad hodnoty tzv. bodového indexu. Tento index představuje historické výkony reprezentačních týmů za posledních let (994 4) konání šampionátů. Zohledňuje nejen medailový zisk, ale i jakékoli umístění, viz tabulka. Tabulka : Princip výpočtu historické výkonnosti Pořadí Body za umístění Bonus za zisk medaile Váha medaile Celkem bodů 6 4 * body stříbrného týmu 9 5 * body bronzového týmu 48 3 4 4 4 3 3 5 ( ) 6 Výpočet tedy jasně upřednostňuje týmy, kterým se na šampionátu podařilo získat cenný kov s tím, že využíváme následující přepočet vah jednotlivých medailí zlatá má hodnotu 4 stříbrných, stříbrná jsou bronzové. Na rozdíl od jiných bodovacích modelů však nezapomínáme ani na týmy, které se umístily na žebříčku hlouběji tato mužstva obdrží počet bodů dle vztahu: Počet bodů = počet týmů celkem konečné umístění týmu + V našem výpočtu jsme rovněž zohlednili fakt, že šampionátů v letech 994 997 se účastnilo pouze týmů, teprve na mistrovství světa v roce 998 došlo k rozšíření formátu na 6 týmů. Dalším faktorem, který jsme do bodování výkonnosti týmů zanesli, je aktuálnost dosaženého výsledku, tedy, před kolika lety tým na daném mistrovství získal výše popsaný počet bodů. Z jednoduché úvahy vyplývá, že čím starší výsledek je, tím méně relevantní pro naši analýzu musí být. Vezmeme-li v úvahu, že vlastníme data z posledních dvaceti let a potřebujeme rovnoměrně upravit bodové hodnocení týmů za jednotlivé roky, nabízí se upravení těchto hodnot pomocí vhodně zvolených vah. Nejstarší rok jsme pevně stanovili s vahou.33, vítězství ročníku 994 by tedy mělo mít pouze třetinovou váhu oproti vítězství v loňském šampionátu. Mezi lety 4 (který má stoprocentní váhu) a 994 (s třetinovou vahou) jsme jednotlivé roky upravovali krokem,335. Počty bodů jsme pak vynásobili korespondující váhou a všechny takto upravené bodové indexy jsme pro každé reprezentační mužstvo sečetli. Tím jsme získali základ budoucí analýzy vysvětlovanou proměnnou historickou výkonnost reprezentačních mužstev. Strana z 8
Další částí naší práce bylo najít dostatečně významné vysvětlující proměnné. Prvním jednoznačným zdrojem dat se staly ekonomické a demografické údaje publikované ve World Economic Outlook Mezinárodního měnového fondu. Mezi použité atributy výše uvedených zemí jsme zvolili mimo jiné HDP, míra nezaměstnanosti, počet obyvatel. Jak se později při tvorbě modelu ukázalo, ekonomické ani demografické údaje nebyly pro vysvětlení bodového skóre dostačující. Tabulka : Přehled historického bodového hodnocení jednotlivých zemí (řazeno abecedně) Země Historické bodové hodnocení Bělorusko 7,87 846,345 Dánsko 5,5765 53,55 Francie 43,456 748,645 Lotyšsko 85,64 Německo 8,56 66,96 Rakousko 3,555 Jak je zřejmé z grafů a, schopnost ukazatelů HDP a počtu obyvatel, tedy zástupců ekonomických a demografických kritérií, věrohodně popsat vysvětlovanou proměnnou (historickou výkonnost týmů), je velmi nízká (koeficient determinace téměř nulový při použití lineární funkce). 865,8 86,8 Slovinsko,645 Spojené státy Ze zjištění vyplývá, že ekonomická prosperita země má na výkonnost reprezentačních týmů velmi malý vliv (vzhledem k dostupným datům spíše i negativní). Rozhodli jsme se proto využít jinou sadu dat, u které jsme očekávali podstatně lepší výsledky statistická data Mezinárodní hokejové federace (IIHF). 6,335 7,343 Švýcarsko 47,3445 Graf : Závislost bodového skóre výkonnosti na počtu obyvatel dané země 8 6 R² =,33 4 Spojené státy Bodové skóre historické výkonnosti Bodové skóre historické výkonnosti Graf : Závislost bodového skóre výkonnosti na HDP na obyvatele 8 6 4 5 R² =,435 5 5 Počet obyvatel (4) 3 35 5 5 35 45 55 65 HDP na obyvatele (4 PPP) 75 Strana 3 z 8
Mezinárodní hokejová federace uvádí na svých webových stránkách (http://www.iihf.com/iihf-home/countries/) údaje členských zemí týkajících se ledního hokeje datum, kdy země vstoupila do federace, jméno současného prezidenta místního hokejového svazu, pořadí dané země v žebříčku IIHF a další. Pro model jsme vybrali numerické údaje, o kterých jsme předpokládali, že by mohly významně popisovat úspěchy jednotlivých zemí: Počet registrovaných hráčů (muži) Počet registrovaných hráček (ženy) Počet registrovaných juniorů Počet registrovaných rozhodčích Počet krytých stadionů Počet venkovních stadionů Tyto atributy mají již výrazně vyšší schopnost popsat výkonnostní úrovně jednotlivých týmů, jak také názorně ukazují grafy 3 a 4. K těmto proměnným získaným ze stránek Mezinárodní hokejové federace jsme doplnili údaje o průměrné roční teplotě v jednotlivých zemích (data získaná z volně dostupných stránek popisujících podnebí zemí na Wikipedia.org). Existuje předpoklad, že v zemích s chladnějším počasím je větší tradice a popularita ledního hokeje, než v jižních zemích. Toto tvrzení podporuje i mapa zemí účastnících se mistrovství světa 5. Graf 3: Závislost bodového skóre na počtu registrovaných rozhodčích Bodové skóre historické výkonnosti Jako poslední vstupní proměnnou jsme využili atribut, který udává, kolikrát každá ze zemí za posledních let pořádala mistrovství světa v ledním hokeji na svém území. Tento atribut dále podporuje hypotézu, že v zemích, kde je lední hokej populární (je tedy rozumné pořádat v nich šampionát), jsou kvalitnější reprezentační týmy, než v ostatních. 8 6 R² =,33 4 Spojené státy 5 5 5 3 Počet registrovaných rozhodčích 35 Graf 4: Závislost bodového skóre na počtu registrovaných hráčů Bodové skóre historické výkonnosti Obrázek Účastnické země MS 5 8 6 R² =,349 4 Spojené státy 5 5 Počet registrovaných hráčů Strana 4 z 8
Konečná zdrojová data jsou přiložena v tabulce 3. Tabulka 3: Zdrojová data pro regresní analýzu (řazeno abecedně) Země Historická Průměrná výkonnost teplota Bělorusko Počet pořadatelství Počet registrovaných hráčů Muži Junioři Počet registrovaných Kryté Nekryté Ženy rozhodčích stadiony stadiony 7,87 5,9 3 43 4 89 4 9 3 3 846,35 6,8 85 576 3 647 4 77 58 3 Dánsko 5,577 7,5 678 74 4 5 53,6,6 3 8 589 39 63 5 83 8 6 8 Francie 43,456, 6 89 7 3 9 35 9 748,65 3,6 6 884 58 8 86 6 3 7 63 5 Lotyšsko 85,64 6 3 965 689 86 87 7 Německo 8,56 7,8 8 389 8 84 898 3 45 66,96 4,4 88 4 79 63 7 45 Rakousko 3,555 7 6 69 4 978 673 65 45 7 865,8 -,6 966 8 59 7 64 49 45 86,8 6, 8 675 5 546 64 7 Slovinsko,645 7,9 45 799 76 38 7 Spojené státy 6,34,6 49 884 3 33 67 3 3 43 898 5 7,343 4,7 3 884 4 5 3 434 4 96 355 36 Švýcarsko 47,345 6 584 3 74 9 6 58 3 Na této množině dat jsme poté provedli regresní analýzu s použitím lineární funkce. Veškeré vstupní proměnné byly signifikantní a pro použité v modelu. Tabulka 4: Výsledky regrese pro model výkonnosti hokejových reprezentací Vysvětlující proměnná Koeficient Standardní chyba t-test Průměrná teplota -6,49949 6,593833 -,93 Počet pořadatelství,88936 7,5569,43446 Muži,66446,3375 4,968 Junioři,68595,6565,5683 -,5879,95-5,5778 Rozhodčí,948,87,3584 Kryté stadiony,354684,434,87363 -,968958,587554 -,875 Ženy Nekryté stadiony Strana 5 z 8
Aplikováním těchto výsledků zpět na původní sadu dat (bez hodnoty vysvětlované proměnné) jsme získali modelový odhad výkonnosti, jaké by měly reprezentační týmy dle předpokladů dosahovat. Tabulka 5: Aplikace regresní analýzy na původní datové sadě bez původních hodnot vysvětlované proměnné (řazeno podle modelového odhadu) Země Historická výkonnost Modelový odhad 846,345 8,7345 865,8 794,4395 748,645 73,646 7,343 63,33 53,55 39,8 Švýcarsko 47,3445 59,6385 86,8 4,999 6,335 5,535 Německo 8,56 94,84 Bělorusko 7,87 9,9333 Francie 43,456 55,8584 Rakousko 3,555 36,833 Lotyšsko 85,64 3,93697 66,96 4,43 Dánsko 5,5765,645 Spojené státy Slovinsko Hodnoty pro Dánsko a Slovinsko byly upraveny, jelikož model u těchto dvou zemí předpovídal záporné skóre výkonnosti, což pro účely interpretace tohoto modelu nenese žádný význam. I kdyby země skončila poslední, vždy by (alespoň minimální) počet bodů, podle modelu hodnocení prezentovaného na straně, získala. Tudíž došlo k ruční úpravě těchto dvou hodnot na nulu. Další zajímavou analýzou by dozajista bylo využití obdobných atributů v časovém rozlišení bylo by možné přesněji predikovat konkrétní ročník šampionátu. Data IIHF však tento časosběrný pohled neobsahují, tudíž jsme se tomuto v naší práci nevěnovali. Na následující stránce najdete finální vizualizaci odhadů výkonnosti reprezentačních mužstev tak, jak ji určil regresní model popsaný v této práci. Strana 6 z 8
Graf : Model výkonnosti hokejových reprezentací Strana 7 z 8
Kontakt Pavel Jankech Senior manažer pavel.jankech@cz.pwc.com +4 5 5 336 Informace obsažené v této publikaci mají obecný charakter a neslouží jako zdroj odborného poradenství. Nedoporučujeme, abyste na základě těchto informací podnikali konkrétní kroky bez dodatečné odborné konzultace. Neposkytujeme žádná prohlášení ani záruky (výslovné ani učiněné mlčky), pokud jde o úplnost a přesnost informací obsažených v této publikaci. PricewaterhouseCoopers, s.r.o., její členové, zaměstnanci a spolupracovníci, v rozsahu povoleném příslušnými právními předpisy, neodpovídají za jakékoliv následky způsobené případným jednáním, zdržením se jednání, spoléháním se na informace obsažené v této publikaci či jakýmkoliv rozhodnutím učiněným na základě informací v této publikaci. 5 PricewaterhouseCoopers, s.r.o. Všechna práva vyhrazena. je značka, pod níž členské společnosti PricewaterhouseCoopers International Limited (IL) podnikají a poskytují své služby. Společně tvoří světovou síť společností. Každá společnost je samostatným právním subjektem a jednotlivé společnosti nezastupují síť IL ani žádnou jinou členskou společnost. IL neposkytuje žádné služby klientům. IL neodpovídá za jednání či opomenutí jednotlivých společností sítě, ani nemůže kontrolovat výkon jejich profesionální činnosti či je jakýmkoli způsobem ovlivňovat.