Binomické rozdělení zobrazené pomocí modelu římské kašny nádržky se naplní podle Pascalova trojúhelníku: 1:4:6:4:1



Podobné dokumenty
Jevy, které za daných podmínek mohou, ale nemusí nastat, nazýváme náhodnými jevy. Příklad: při hodu hrací kostkou padne trojka

Náhodný jev. Jevy, které za daných podmínek mohou, ale nemusí nastat, nazýváme náhodnými jevy.

Diskrétní matematika. DiM /01, zimní semestr 2016/2017

Diskrétní matematika. DiM /01, zimní semestr 2018/2019

5 Pravděpodobnost. Sestavíme pravděpodobnostní prostor, který modeluje vytažení dvou ponožek ze šuplíku. Elementární jevy

Diskrétní náhodná veličina. November 12, 2008

IB112 Základy matematiky

Náhodné (statistické) chyby přímých měření

Informační a znalostní systémy

Intuitivní pojem pravděpodobnosti

Všechno, co jste chtěli vědět z teorie pravděpodobnosti, z teorie informace a

KGG/STG Statistika pro geografy

Odhady - Sdružené rozdělení pravděpodobnosti

Přednáška. Diskrétní náhodná proměnná. Charakteristiky DNP. Základní rozdělení DNP

Induktivní statistika. z-skóry pravděpodobnost

SEMINÁRNÍ PRÁCE Z MATEMATIKY

Inženýrská statistika pak představuje soubor postupů a aplikací teoretických principů v oblasti inženýrské činnosti.

Náhodná veličina a rozdělení pravděpodobnosti

PRAVDĚPODOBNOST Náhodné pokusy. Náhodný jev

Matematika III. 4. října Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

Náhodné chyby přímých měření

Tomáš Karel LS 2012/2013

Inferenční statistika - úvod. z-skóry normální rozdělení pravděpodobnost rozdělení výběrových průměrů

ANALÝZA DAT V R 3. POPISNÉ STATISTIKY, NÁHODNÁ VELIČINA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK

Cvičení ze statistiky - 5. Filip Děchtěrenko

Pravděpodobnost a statistika (BI-PST) Cvičení č. 1

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

4.5.9 Pravděpodobnost II

pravděpodobnosti a Bayesova věta

2 ) 4, Φ 1 (1 0,005)

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

Kombinatorika. Michael Krbek. 1. Základní pojmy. Kombinatorika pracuje se spočitatelnými (tedy obvykle

Zdroje chyb. Absolutní a relativní chyba. Absolutní chyba. Absolutní chyba přibližného čísla a se nazývá absolutní hodnota rozdílu přesného

Pravděpodobnost a statistika

pravděpodobnosti Pravděpodobnost je teorií statistiky a statistika je praxí teorie pravděpodobnosti.

ZÁKLADY STATISTICKÉHO ZPRACOVÁNÍ ÚDAJŮ 5. hodina , zapsala Veronika Vinklátová Revize zápisu Martin Holub,

Obecné, centrální a normované momenty

ŘEŠENÍ KVADRATICKÝCH A ZLOMKOVÝCH NEROVNIC V ŠESTI BODECH

Komplexní čísla, Kombinatorika, pravděpodobnost a statistika, Posloupnosti a řady

STATISTICKÝ SOUBOR. je množina sledovaných objektů - statistických jednotek, které mají z hlediska statistického zkoumání společné vlastnosti

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

Jevy A a B jsou nezávislé, jestliže uskutečnění jednoho jevu nemá vliv na uskutečnění nebo neuskutečnění jevu druhého

5. Náhodná veličina. 2. Házíme hrací kostkou dokud nepadne šestka. Náhodná veličina nabývá hodnot z posloupnosti {1, 2, 3,...}.

Pravděpodobnost kolem nás

Kombinatorika, pravděpodobnost a statistika, Posloupnosti a řady

VYUŽITÍ PRAVDĚPODOBNOSTNÍ METODY MONTE CARLO V SOUDNÍM INŽENÝRSTVÍ

EXPERIMENTÁLNÍ MECHANIKA 2 Přednáška 5 - Chyby a nejistoty měření. Jan Krystek

ANALYTICKÁ GEOMETRIE LINEÁRNÍCH ÚTVARŮ V ROVINĚ

7. Rozdělení pravděpodobnosti ve statistice

Vybraná rozdělení náhodné veličiny

Příklad 1. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 11

Pravděpodobnost, náhoda, kostky

Výpočet pravděpodobností

KGG/STG Statistika pro geografy

Pravděpodobnost a statistika

Statistická teorie učení

PRAVDĚPODOBNOST A JEJÍ UŽITÍ

Pravděpodobnost a její vlastnosti

Pravděpodobnostní rozdělení

Teorie pravěpodobnosti 1

Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012. Tutoriál č. 4: Exploratorní analýza. Jan Kracík

5.1. Klasická pravděpodobnst

Diskrétní náhodná veličina

Pravděpodobnost a statistika (BI-PST) Cvičení č. 2

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM

MATEMATIKA III V PŘÍKLADECH

ROZDĚLENÍ NÁHODNÝCH VELIČIN

Matematika I 2a Konečná pravděpodobnost

Motivace. Náhodný pokus, náhodný n jev. Pravděpodobnostn. podobnostní charakteristiky diagnostických testů, Bayesův vzorec

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

Rovnoměrné rozdělení

TEORIE PRAVDĚPODOBNOSTI. 2. cvičení

Logaritmická rovnice

Řešení úloh z TSP MU SADY S 1

( ) ( ) Nezávislé jevy I. Předpoklady: 9204

Základy popisné statistiky

1. Házíme hrací kostkou. Určete pravděpodobností těchto jevů: a) A při jednom hodu padne šestka;

Pojem a úkoly statistiky

TEST 1 (40 bodů) (9 4)! 2. Nejméně kolikrát musíme hodit kostkou, abychom měli alespoň 80% pravděpodobnost, že padne alespoň jedna šestka?

Tomáš Karel LS 2012/2013

Cvičení 1. Přednášející: Mgr. Rudolf B. Blažek, Ph.D. prof. RNDr. Roman Kotecký, DrSc.

Rozšiřování = vynásobení čitatele i jmenovatele stejným číslem různým od nuly

Učební plán 4. letého studia předmětu matematiky. Učební plán 6. letého studia předmětu matematiky

Pravděpodobnost a aplikovaná statistika

ZŠ ÚnO, Bratří Čapků 1332

ANALYTICKÁ GEOMETRIE V ROVINĚ

POPISNÁ STATISTIKA Komentované řešení pomocí programu Statistica

Intervalový odhad. Interval spolehlivosti = intervalový odhad nějakého parametru s danou pravděpodobností = konfidenční interval pro daný parametr

CVIČNÝ TEST 43. OBSAH I. Cvičný test 2. Mgr. Tomáš Kotler. II. Autorské řešení 6 III. Klíč 13 IV. Záznamový list 15

3. Reálná čísla. většinou racionálních čísel. V analytických úvahách, které praktickým výpočtům

Teoretická rozdělení

4. ZÁKLADNÍ TYPY ROZDĚLENÍ PRAVDĚPODOBNOSTI DISKRÉTNÍ NÁHODNÉ VELIČINY

7 = 3 = = Učivo Vysvětlení Př. + pozn. Zlomek = vyjádření části celku 3 část snědla jsem 3 kousky

Pravděpodobnost, náhoda, kostky

INDUKTIVNÍ STATISTIKA

STATISTICKÉ ODHADY Odhady populačních charakteristik

VYBRANÁ ROZDĚLENÍ DISKRÉTNÍ NÁHODNÉ VELIČINY

CVIČNÝ TEST 48. OBSAH I. Cvičný test 2. Mgr. Tomáš Kotler. II. Autorské řešení 6 III. Klíč 15 IV. Záznamový list 17

1 Rozptyl a kovariance

Transkript:

Binomické rozdělení Někdy se říká, že statistika je užitý počet pravděpodobnosti, a na tomto tvrzení je nepochybně něco pravdy, pokud se nevezme doslovně. Připomeňme si, že statistiku lze rozdělit na statistiku popisnou a induktivní. Popisná (deskriptivní) statistika. která je nejtypičtější pro sčítání lidu a podobná hromadná šetření, se zabývá především tím, jak přehledně uspořádat nepřehledné množství údajů, jak vyjádřit jejich znaky a provést zjednodušení všude tam, kde se tím nezmenší jejich vypovídací schopnost. Až do 20. století se statistika pěstovala převážně v tomto smyslu jako popis veřejného života, politická aritmetika, matematická věda o státě. Stále více však nyní vystupuje do popředí zájmu induktivní statistika, statistická analýza. Ta sice také pracuje s měřením, sčítáním, šetřením, ale nemá k dispozici celkové soubory, často ani větší části těchto celkových souborů. Opírá se o vzorky, které představují malé nebo někdy velmi malé podíly z daného základního souboru, jehož struktura a náplň mají být zjištěny a zobrazeny na základě výsledků získaných z výběrových vzorků. Most mezi těmito dvěma hlavními oblastmi statistické práce tvoří teorie pravděpodobnosti. Poskytuje matematický základ pro posuzování spolehlivosti a přesnosti všech výběrových postupů včetně přesnosti a spolehlivosti metod, jimiž jsou získané vzorky zpracovávány. Skutečnost, že počet pravděpodobnosti je matematickou disciplínou, nás nesmí mýlit v tom, že důraz je na druhém slově - pravděpodobnost. Často lze počítat na mnoho desetinných míst, ale pravděpodobnost končí mnohdy již před desetinnou čárkou! Zákony pravděpodobnosti jsou proto zákony zcela zvláštního druhu - snášenlivé, pružné, nezavrhující pošetilé krajnosti, a přece dlouhodobě spolehlivé, nechybující a důvěryhodné. Téměř každý výklad pojmu matematické pravděpodobnosti vychází z házení mincí, a i my zůstaneme této staré tradici věrni. Hodíme-li si mincí, může se, jak známo, po dopadu ukázat buď hlava (H), nebo orel (O). Pro oba tyto jevy je pravděpodobnost a priori stejná, předpokládáme-li ovšem, že mince není falešná. Tato stejná pravděpodobnost se vyjadřuje tak, že se řekne (napíše): p H = p O, nebo zápisem funkce P(H) = P(O). Pro hod ideální mincí platí: P(H) = 0,5, stejně i P(O) = 0,5, neboť každý jednotlivý jev je z poloviny pravděpodobný, stejně jako absolutní jistota, že jeden z obou jevů nastane. Tato jistota, tento celkový prostor všech myslitelných možností se tedy vyjadřuje jedničkou (1). Součet jednotlivých pravděpodobností nemůže proto za žádných okolností být větší než 1. I v hovorové řeči známe ostatně matematickou pravděpodobnost. Říká se: naděje na úspěch je jedna ku jedné a myslí se právě (což je přesnější zápis): P(H) = 0,5, P(O) = 0,5. To jsou pravděpodobnosti pro jedno hození mincí. Házíme-li mincí vícekrát, lze vypočítat pravděpodobnost jednotlivých výsledných kombinací (HOO, HOH, HHH atd.) násobením výchozích pravděpodobností (p H = 0,5 atd.), protože jde o navzájem zcela nezávislé pokusy. Další hod mincí či kostkou vůbec nic neví o předchozích výsledcích, proces házení nemá paměť. (Pozor, to neplatí o všech náhodných procesech, že by neměly paměť, byly nezávislé. Například po vytažení jednoho čísla ve Sportce je druhý tah závislý na výsledku předchozím nelze už vytáhnout číslo již dříve vytažené.) Počítejme. Pro jev dvakrát hlava dostaneme p HH = p H p H = p H 2 = 0,25; stejně p OO = 0,25. K tomu přistupují ještě dvě možnosti: pro jednou hlava, jednou orel, tzn. p OH = 0,25 (nejdříve orel, pak hlava) a p HO = 0,25 (nejdříve hlava, pak orel). Zajímá-li nás celkový výsledek, nikoli však pořadí, dostaneme při dvojím hodu mincí tyto pravděpodobnosti: p HH = p OO = 0,25, p HOlib.pořadí = 0,5. Podobným způsobem lze vypočítat očekávané četnosti při třech, čtyřech a více hodech mincí a získané rozdělení četnosti zobrazené jako histogram se vyvíjí způsobem uvedeným

v obrázku Pravděpodobnost výsledků při troj, čtyř, šesti a osminásobném hození mincí. Relativní četnosti se doplňují vždy na celek 1 všech možností. V grafu osminásobného hození jsou naproti tomu uvedeny očekávané absolutní četnosti (celek=256, relativní pravděpodobnosti se vypočítávají dělením: pravděpodobnost pro 4krát hlava (K) a 4krát orel (W) činí například 70/256). Z toho, co jsme uvedli, je zřetelně vidět, že se vytváří velmi charakteristický tvar, který se projeví ještě silněji, jestliže přes histogram promítneme frekvenční polygon, a jestliže počet pokusů ještě zvýšíme. Velmi dobrým názorným zobrazením takového rozdělení je také model římské kašny, kde voda přetékající z jednotlivých mís odtéká stejnoměrně vlevo i vpravo. Další model, znázorňující posloupnost stejných pravděpodobností náhodných jevů, představuje tzv. Galtonovo prkno. Základní myšlenkou je, že koule kutálející se po nakloněném prkně shora dolů narazí na kolíček, od něhož se odrazí vpravo nebo vlevo dolů. Tam narazí do dvou kolíčků, aby se znovu náhodně odrazila a narazila na trojici kolíčků, atd. Po libovolném počtu řad kolíčků koule zapadne do přihrádky, nejčastěji uprostřed, do vedlejší přihrádky padne méně často a celkem zřídka padá do krajních přihrádek. Galtonovo prkno je dnes známější než kdykoliv jindy, i když nikoli pod tímto názvem, zato v kýčovitém provedení a pseudoelektronickém vyparádění. Tento mechanismus náhodného rozdělení odchýlením kuliček na překážkách vpravo nebo vlevo je totiž základním konstrukčním principem hracích automatů.

Binomické rozdělení zobrazené pomocí modelu římské kašny nádržky se naplní podle Pascalova trojúhelníku: 1:4:6:4:1 Galtonovo prkno s kolíčky kuličky se náhodným mechanismem rozdělí do přihrádek podle Pascalova trojúhelníku: 1:6:15:20:15:6:1 Uvedené případy (včetně problému rodin o pěti dětech popsaných v jiném článku) jsou příklady tzv. binomického rozdělení. Pro binomické rozdělení je charakteristické, že má jen dvě rozdílná vyjádření znaků, která však společně vyplňují celý pravděpodobnostní prostor. Při hodu mincí je to samozřejmé, protože jsou jen dva znaky (hlava nebo orel). Avšak již při tažení hrací karty máme čtyři barvy. V takových případech, a ty jsou v praxi velmi časté, rozlišuje se prostě hledaný znak a všechny ostatní. Jak velká je pravděpodobnost, že z dobře zamíchaného balíčku karet vytáhneme pikovou kartu? Zřejmě jedna čtvrtina, zatímco zbytek tři čtvrtiny - zůstává pro nepiky : žaludy, srdce či kára. Proto se často vedle pravděpodobnosti p, že očekávaný jev nastane, klade doplňková hodnota (1 - p), která se označuje q. Přitom musí platit p + q = 1. Proto čím menší je p, tím větší je q a obráceně. Jestliže máme znak muži (narození syna), je v každém jen poněkud reprezentativním výběrovém souboru obyvatelstva p jen nepatrně větší než q. Jestliže znakem je muži přes 40 let, kteří byli v minulém roce v Portugalsku, pak p je velmi malé, protože q tvoří nejen všechny ženy, ale také všichni muži pod 40 let a všichni, kdo nebyli v Portugalsku. Binomické rozdělení tedy udává, jaká je pravděpodobnost pro určitý výsledek výběrového souboru. Tvoří do jisté míry empirickou základnu pro teorii výběrových souborů. Umožňuje nám z přesně známého základního souboru, např. 52 karet, zjistit pravděpodobnost výsledku pro každé pořadí tahů. V praxi při vytváření výběrových souborů skutečný základní soubor neznáme, avšak víme, jak je pravděpodobné, že výběrové soubory poskytují jeho skutečný nebo zkreslený obraz. Podívejme se např., kolik piků bude pravděpodobně taženo, jestliže se z dobře zamíchaného balíčku karet táhne pětkrát za sebou po jedné kartě. Tažená karta se přitom dá zpět a zamíchá se společně s ostatními; v daném případě máme před sebou model binomického rozdělení. Binomické rozdělení je dáno pravděpodobností p sledovaného jevu a počtem n provedených pokusů (tahů, hodů, ) a budeme ho značit Bi(n;p). Očekávaný počet úspěchů (obdoba aritmetického průměru ve statistickém zpracování) se teoreticky vypočítá jako součin np. Na grafech házení mincí si všimněte, že tato očekávaná hodnota je nejčetnější 8 hodů: np = 8.0,5 = 4; 6 hodů: np = 3. Při jednom jediném tahu karty z balíčku pro piky platí p = 0,25. Při 5 tazích je tedy početní očekávaná hodnota 5p = 1,25. Není však dosti dobře možné táhnout 1,25 piku; očekávaná hodnota slouží proto v tomto případě jen jako jistý druh orientační pomůcky. Můžeme již teď předpokládat, že 1 pik mezi 5 kartami se objeví poměrně často. Nejjednodušší však bude, když vypočítáme nejdříve oba extrémy: 5 piků, případně žádný pik. Protože při tazích jde o navzájem nezávislé náhodné jevy (dali jsme přece taženou kartu vždy zpět a dobře se zamíchalo), platí pravidlo o násobení pravděpodobnosti: P 5piků = (0,25) 5 0,001. Tento výsledek by bylo možné

očekávat jen jednou v 1000 sériích pokusů. Častěji se dá počítat s 5 nepiky: q 5nepiků = (0,75) 5 0,237. A teď jak často se vyskytne 1 pik a 4 nepiky? Můžeme vypočítat, kolik je (0,25).(0,75) 4 0,079 avšak k tomuto výsledku lze dojít více než jedním způsobem, neboť 1 pik může být tažen jako první, ale také jako druhá, třetí, čtvrtá nebo dokonce pátá karta. Co lze v daném případě poměrně pohodlně vypočítat, nelze tak lehce zjistit ve složitějších případech (třeba 3 piky z 8). V dané obtížné situaci najdeme pomoc ve zvláštním uspořádání čísel, které je známo jako Pascalův trojúhelník, ačkoliv celkem neprávem, protože Pascal není ani jeho znovuobjevitelem, nýbrž poznal jej u svého učitele Hérigona. Podobné uspořádání nacházíme však už o 150 let dříve v knize Arithmetica integra Michaela Stifela (Norimberk 1544); stejně tak se toto číselné uspořádání vyskytuje již v perské a čínské literatuře 13. a počátku 14. století, takže by bylo lépe, kdyby bylo označeno neutrálně, např. jako aritmetický trojúhelník. Jak tedy tato číselná sestava vypadá? Vrstva jedniček obklopuje trojúhelník, ve kterém je každé číslo složeno ze součtu obou nad ním šikmo, vpravo i vlevo, stojících čísel. To, co nejprve vypadá jako podivná hračka, nabývá rychle na významu, když znovu připomeneme římskou kašnu a necháme vodu stékat ze stupně na stupeň do dvou, tří, čtyř atd. mís. Předpokládáme-li v nejvyšší míse jednotku vody, pak v následujícím stupni se dělí na 1/2 + 1/2, na třetím stupni na 1/4 + 2/4 + 1/4, v dalším na 1/8 + 3/8 + 3/8 + 1/8, atd., jak je vyznačeno v uvedeném schématu. To přesně odpovídá výsledkům našeho házení mincí. Při jednom hodu je pravděpodobnost 1/2 : 1/2, při dalším je pravděpodobnost 1/4 (HH) : 1/2 (HO, resp. OH) : 1/4 (OO), při třech hodech 1/8 HHH, 3/8 HHO, 3/8 HOD, 1/8 000 atd. Někteří z vás už znají binomickou poučku: (a + b) 2 = a 2 + 2ab + b 2, tzn. rozdělení 1 (a 2 ) : 2(ab) : 1 (b 2 ), stejně jako v Pascalově trojúhelníku, resp. v čitateli zlomků naší římské kašny. V případě (a + b) 3 = a 3 + 3a 2 b + 3ab 2 + b 3 se to také potvrzuje, což obecně znamená, že v Pascalově trojúhelníku jsou přesně a pečlivě uspořádány binomické koeficienty. Pro mnohé v matematice téměř neřešitelný problém, např. (a + b) 5, lze nyní vyřešit skoro bez námahy, prostě přečíst: na pátém řádku čteme 1 5 10 10 5 1, tudíž: (a + b) 5 = a 5 + 5a 4 b + 10a 3 b 2 + 10a 2 b 3 + 5ab 4 + b 5. Teď už není třeba nic jiného než za koeficienty a, b dosadit pravděpodobnosti p a q, a můžeme vypočítat pravděpodobnost všech kombinací pěti tahů z balíčku karet. Hledáme sledovaný případ pq 4, tzn. 1 pik a 4 nepiky. Protože pq 4 = (0,25). (0,75) 4, a (0,75) 4 = 0,317, dostaneme pravděpodobnost 0,079, kterou však musíme ještě násobit četností 5, protože v řádku je p 5 +... + 5 pq 4 + q 5. Protože (0,079).5 = 0,396, je hledaná pravděpodobnost,,1 pik v pěti tazích" přibližně 0,4. Podobným způsobem vypočítáme: počet piků 0 1 2 3 4 5 pravděpodobnost 0,237 0,396 0,264 0,088 0,014 0,001

Součet všech těchto výrazů dává zase 1. tedy prostor pravděpodobnosti všech výběrových souborů v rozsahu 5 tahů. Největší dílčí souhrn z nich je 5(0,25).(0,75) 4 = 0,4, tzn. ten, který jsme vypočítali pro 1 pik, což je úplně správné, neboť,,1 pik" zobrazuje situaci očekávaná hodnota 1,25 nejlépe. Získání binomických koeficientů pomocí Pascalova trojúhelníku pro velká n je značně pracné a nepohodlné. Totéž platí i pro jejich získání přes vzorec (dozvíte se v oktávě nebo na semináři). Naštěstí se však v takové případě může binomické rozdělení, a to nejen v případě p = q = 0,5, na mnohem pohodlnějšího normálního rozdělení, které je i při menších p plně uspokojivé. A pro ještě menší p < 0,1 se použije Poissonova rozdělení. Oběma rozdělením budeme věnovat některý příští článek. Zákon velkých čísel Hráčská kasina zpravidla neznají úpadek. Je tomu tak z mnoha důvodů, z nichž dva nejdůležitější jsou: každá hra provozovaná v kasinu má včleněnu takovou možnost výhry, že bank musí v dlouhodobém výhledu dosáhnout zisku, a za druhé, že téměř všichni hráči jsou zatíženi pověrčivostí, která je pokřivena představou o zákonu velkých čísel. V jejich představách se snoubí elementární počet pravděpodobnosti a naivní optimismus s chybnou matematikou do fantastické legendy, kterou lze vyjádřit takto: Jestliže desetkrát po sobě padla červená, musí dříve nebo později padnout častěji černá, protože zákon velkých čísel tvrdě vyžaduje, aby červená a černá padaly koneckonců stejně často. Stejnou představu by bylo možno uplatňovat, když v ruletě nebo ve Sportce dlouho nevyšlo určité číslo. Mnoho hráčů Sportky sází systematicky čísla, která dlouho nebyla tažena nebo jsou tažena nadprůměrně zřídka, na základě přesvědčení, že tato čísla jsou zralá, ba dokonce přezrálá k tahu. To je však legenda o dozrávání šancí. Podle vtipného výroku jednoho francouzského matematika nemá ruleta ani svědomí, ani paměť. Moc málo lidí je však ochotno tomu věřit a své naděje upínají místo toho na špatně zažitou moudrost o zákonu velkých čísel, který prý slibuje kompenzaci tím, že kategoricky vyžaduje, aby v dlouhodobém výhledu zcela nutně vyšla hodnota očekávaná podle teorie počtu pravděpodobnosti. Hodíme-li mincí stokrát, musí padnout hlava a orel stejně často, a nevyjde-li to ani při stém hodu, musí se tak stát při tisícím nebo desetitisícím nebo také při pozdějších hodech. Zákon velkých čísel je ve svém původním znění znám již více než půl tisíciletí. Objevuje se v Ars coniectandi (Umění dohadu) Jakuba Bernoulliho, uveřejněném v roce 1713, po autorově smrti, a říká asi toto: Jestliže jsou pokusné řady dosti dlouhé a dostatečně často se opakují, lze dosáhnout vypočítané pravděpodobnosti v průměru těchto pokusů s libovolnou přesností. Důraz se přitom klade na průměr četných řad pokusů. Jestliže to, co jsme zde uvedli, ilustrujeme na praktickém příkladu, vypadá to asi takto: pravděpodobnost čísla 4 při házení bezvadnou kostkou je - protože kostka má šest ploch rovna 1/6. Protože očekávaná hodnota navzájem nezávislých pokusů se rovná pravděpodobnosti správného hodu (p), násobené počtem pokusů (n), vychází při 6 pokusných hodnotách očekávaná hodnota 1 (=6.1/6), při 300 pokusech je očekávaná hodnota 50 (P = 1/6, n = 300), při 9000 je očekávaná hodnota 1500. Zákon velkých čísel vůbec neříká. že při 9000 hodech zcela jistě hodím 1500 čtyřek bez ohledu na to, zda mám smůlu nebo štěstí. Především jde o to, že je možno stanovit uvedené číslo při třístovkových, tisícových nebo jiných sériích, jejichž výsledky vyjádřené jako aritmetický průměr se koneckonců neodchýlí od očekávané hodnoty o více než 1 nebo 3 nebo 7 anebo jinou libovolnou hodnotu. V jediné pokusné řadě nemůže být ani řeči o kompenzaci v průběhu řady. To, co nastane - a to jsme měli možnost pozorovat v náznacích již v Pascalově trojúhelníku je koncentrace četností v blízkosti očekávané hodnoty se současným stále širším

celkovým rozptylem. Při dvou hodech mincí vyjde očekávaná hodnota 1 hlava (p = 1/2, n = 2) v polovině pokusné řady. Při dvanácti hodech vyjde očekávaná hodnota 6 (p = 1/2, n = 12) jen v 924/4096 = 22,5 % případů, neboli méně než v 1/4 všech případů. Souhrn blízkých výsledků (totiž 4, 5. 6, 7 a 8 hlav) dává však celkově asi 70% pravděpodobnost, zatímco horní a dolní krajní případy (0,1,2,3 a 9,10,11,12 hlav) nedávají celkem víc než 30 %. Co dělá zákon velkých čísel tak důležitým pro statistiku, není jeho užitečnost nebo bezcennost v hráčském kasinu, nýbrž jeho význam při využití výběrových souborů. Protože pokusná řada je prakticky výběrovým souborem, platí i v tomto případě, že očekávanou hodnotu je možno určit (případně skutečnou hodnotu celkového množství) s libovolnou přesností, jestliže jsou vytvořeny dostatečně velké vzorky. V části, kde se budeme zabývat výběry podrobněji, uvidíme, že v praxi se však musí dělat většinou velmi skromné kompromisy. Jedna zajímavost z historie z roku 1380: Příklad: Dva stejně dobří hráči A a B hrají spolu sérii partií (třeba šachu); nepřipouští se nerozhodně. Hráči hrají o milion, který získá ten, kdo první vyhraje celkem 6 partií. Hra musela být přerušena v okamžiku, kdy hráč A dosáhl 5 vítězství a hráč B 3 vítězství. Ve hře se již nemůže a nebude pokračovat. Určete v jakém poměru si mají hráči celkovou částku spravedlivě rozdělit. řešení uveřejněné v roce 1494 udává dělící poměr A:B = 2:1 řešení uveřejněné v roce 1556 udává dělící poměr A:B = 3:1 řešení uveřejněné v roce 1654 udává dělící poměr A:B = 7:1 Který poměr rozdělení výhry je spravedlivý? To se dozvíte na semináři.