Statistika. Poznámky z přednášek



Podobné dokumenty
Deskriptivní statistika 1

6 Intervalové odhady. spočteme aritmetický průměr, pak tyto průměry se budou chovat jako by pocházely z normálního. nekonečna.

NEPARAMETRICKÉ METODY

Pro statistické šetření si zvolte si statistický soubor např. všichni žáci třídy (několika tříd, školy apod.).

STATISTIKA. Statistika se těší pochybnému vyznamenání tím, že je nejvíce nepochopeným vědním oborem. H. Levinson

1 POPISNÁ STATISTIKA V PROGRAMU MS EXCEL

P2: Statistické zpracování dat

Pravděpodobnost a aplikovaná statistika

Komplexní čísla. Definice komplexních čísel

Cvičení 6.: Výpočet střední hodnoty a rozptylu, bodové a intervalové odhady střední hodnoty a rozptylu

12. N á h o d n ý v ý b ě r

ZÁKLADNÍ STATISTICKÉ VÝPOČTY (S VYUŽITÍM EXCELU)

Intervalové odhady parametrů některých rozdělení.

odhady parametrů. Jednostranné a oboustranné odhady. Intervalový odhad střední hodnoty, rozptylu, relativní četnosti.

Cvičení 6.: Bodové a intervalové odhady střední hodnoty, rozptylu a koeficientu korelace, test hypotézy o střední hodnotě při známém rozptylu

ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE

Odhad parametru p binomického rozdělení a test hypotézy o tomto parametru. Test hypotézy o parametru p binomického rozdělení

17. Statistické hypotézy parametrické testy

Náhodný výběr 1. Náhodný výběr

České vysoké učení technické v Praze. Fakulta dopravní. Semestrální práce. Statistika

Statistika. Statistické funkce v tabulkových kalkulátorech MSO Excel a OO.o Calc

Pravděpodobnost a aplikovaná statistika

1. ZÁKLADY VEKTOROVÉ ALGEBRY 1.1. VEKTOROVÝ PROSTOR A JEHO BÁZE

Elementární zpracování statistického souboru

veličiny má stejný řád jako je řád poslední číslice nejistoty. Nejistotu píšeme obvykle jenom jednou

Závislost slovních znaků

1 PSE Definice základních pojmů. (ω je elementární jev: A ω (A ω) nebo (A );

Odhady parametrů 1. Odhady parametrů

2 STEJNORODOST BETONU KONSTRUKCE

Pravděpodobnost a aplikovaná statistika

6. Posloupnosti a jejich limity, řady

8.2.1 Aritmetická posloupnost

8. Základy statistiky. 8.1 Statistický soubor

Statistika je vědní obor zabývající se zkoumáním jevů, které mají hromadný charakter.

14. Testování statistických hypotéz Úvod statistické hypotézy Definice 14.1 Statistickou hypotézou parametrickou neparametrickou. nulovou testovanou

Náhodu bychom mohli definovat jako součet velkého počtu drobných nepoznaných vlivů.

8.2.1 Aritmetická posloupnost I

1.3. POLYNOMY. V této kapitole se dozvíte:

jako konstanta nula. Obsahem centrálních limitních vět je tvrzení, že distribuční funkce i=1 X i konvergují za určitých

Základy statistiky. Zpracování pokusných dat Praktické příklady. Kristina Somerlíková

i 1 n 1 výběrový rozptyl, pro libovolné, ale pevně dané x Roznačme n 1 Téma 6.: Základní pojmy matematické statistiky

1. Základy počtu pravděpodobnosti:

2. Náhodná veličina. je konečná nebo spočetná množina;

2. Znát definici kombinačního čísla a základní vlastnosti kombinačních čísel. Ovládat jednoduché operace s kombinačními čísly.

8. Analýza rozptylu.

Přednáška VI. Intervalové odhady. Motivace Směrodatná odchylka a směrodatná chyba Centrální limitní věta Intervaly spolehlivosti

Přednáška VIII. Testování hypotéz o kvantitativních proměnných

VYSOCE PŘESNÉ METODY OBRÁBĚNÍ

10.3 GEOMERTICKÝ PRŮMĚR

Intervalový odhad. nazveme levostranným intervalem pro odhad parametru Θ. Statistiku. , kde číslo α je blízké nule, nazveme horním

PRAVDĚPODOBNOST A STATISTIKA

1 ROVNOMĚRNOST BETONU KONSTRUKCE

Mezní stavy konstrukcí a jejich porušov. Hru IV. Milan RůžR. zbynek.hruby.

PŘÍKLAD NA PRŮMĚRNÝ INDEX ŘETĚZOVÝ NEBOLI GEOMETRICKÝ PRŮMĚR

Petr Šedivý Šedivá matematika

Intervalové odhady parametrů

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ

Parametr populace (populační charakteristika) je číselná charakteristika sledované vlastnosti

3. Lineární diferenciální rovnice úvod do teorie

Pravděpodobnostní modely

8.1.3 Rekurentní zadání posloupnosti I

Odhady parametrů polohy a rozptýlení pro často se vyskytující rozdělení dat v laboratoři se vyčíslují podle následujících vztahů:

Cvičení 3 - teorie. Teorie pravděpodobnosti vychází ze studia náhodných pokusů.

je konvergentní, právě když existuje číslo a R tak, že pro všechna přirozená <. Číslu a říkáme limita posloupnosti ( ) n n 1 n n n

Kapitola 6. : Neparametrické testy o mediánech

Mendelova univerzita v Brně Statistika projekt

1. K o m b i n a t o r i k a

f x a x DSM2 Cv 9 Vytvořující funkce Vytvořující funkcí nekonečné posloupnosti a0, a1,, a n , reálných čísel míníme formální nekonečnou řadu ( )

4.2 Elementární statistické zpracování Rozdělení četností

Popisná statistika - zavedení pojmů. 1 Jednorozměrný statistický soubor s kvantitativním znakem

Katedra pravděpodobnosti a matematické statistiky. χ 2 test nezávislosti

Ilustrativní příklad ke zkoušce z B_PS_A léto 2014.

MATICOVÉ HRY MATICOVÝCH HER

n=1 ( Re an ) 2 + ( Im a n ) 2 = 0 Im a n = Im a a n definujeme předpisem: n=1 N a n = a 1 + a a N. n=1

Matematika I, část II

13 Popisná statistika

Popisná statistika. Zdeněk Janák 9. prosince 2007

Užití binomické věty

STUDIUM MAXWELLOVA ZÁKONA ROZDĚLENÍ RYCHLSOTÍ MOLEKUL POMOCÍ DERIVE 6

1.7.4 Těžiště, rovnovážná poloha

OVMT Přesnost měření a teorie chyb

je konvergentní, právě když existuje číslo a R tak, že pro všechna přirozená <. Číslu a říkáme limita posloupnosti ( ) n n 1 n n n

6. P o p i s n á s t a t i s t i k a

z možností, jak tuto veličinu charakterizovat, je určit součet

Kvantová a statistická fyzika 2 (Termodynamika a statistická fyzika)

Zhodnocení přesnosti měření

Při sledování a studiu vlastností náhodných výsledků poznáme charakter. podmínek různé výsledky. Ty odpovídají hodnotám jednotlivých realizací

Mod(x) = 2, Med(x) = = 2

Vzorový příklad na rozhodování BPH_ZMAN

Ilustrativní příklad ke zkoušce z B_PS_A léto 2013.

Úloha II.S... odhadnutelná

0,063 0,937 0,063 0, P 0,048 0,078 0,95. = funkce CONFIDENCE.NORM(2α; p(1 p)

1.2. NORMA A SKALÁRNÍ SOUČIN

Iterační výpočty projekt č. 2

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

Odhad parametrů normálního rozdělení a testy hypotéz o těchto parametrech * Věty o výběru z normálního rozdělení

Funkce. RNDr. Yvetta Bartáková. Gymnázium, SOŠ a VOŠ Ledeč nad Sázavou

Matematická analýza I

Zformulujme PMI nyní přesně (v duchu výrokové logiky jiný kurz tohoto webu):

7. KOMBINATORIKA, BINOMICKÁ VĚTA. Čas ke studiu: 2 hodiny. Cíl

Transkript:

Statistika Pozámky z předášek Materiál obsahuje pozámky ze předášek plus to co se musíme doučit včetě ukázkových příkladů, které se objevily a předášce, ebo z aplikace etstorage. J.T.

OBSAH Úvodí stráka OBSAH Základí pojmy (Statistické ukazatele) Základí pojmy, Příklad Průměry - Harmoický průměr Geometrický průměr Kvadratický průměr 7 Prostorové bodové struktury, zjištěí stupě agregace 8 Pravděpodobost - pojmy 9 Pravděpodobost, příklady 0 Geometrická pravděpodobost, Náhodé veličiy Náhodé veličiy, Biomické rozděleí Náhodé veličiy - defiováí biomického rozděleí Matematická statistika - testováí hypotéz Testováí hypotéz - zamékový test Studetův t-test Studetův t-test, F test (dvou výběrový test) Odhad středí hodoty 7 Porováí průměrů zkoumaých vzorků (dvou výběrový test) Welchův test 8 Wilcoxoův test dvouvýběrový 9 Wilcoxoův test jedovýběrový a párový 0

Základí pojmy Etapa statistického zjišťováí (získáváí a shromažďováí údajů). hodoty (zaky) diskrétí (espojité) Nejčastěji počet ěčeho, protože stromů v porostu emůže být,. hodoty spojité Váha, výška, rychlost a jié údaje, které umožňují jakoukoliv hodotu v oboru reálých čísel. Etapa statistického zpracováí (tříděí a výpočet ukazatelů). Grafické zázorěí Histogram Polygo Statistické ukazatele míry polohy Průměr ( ) Modus je hodota s ejvětší četostí. ( Ĥ ) Mediá je prostředí hodota ( H ) míry rozptýleosti Míra rozptýleosti je rozpětí, jehož dosahují jedotlivé aměřeé hodoty. Odchylka je rozdíl mezi aměřeou a středí hodotou (mediáem) Průměrá odchylka se pak vypočte jako suma všech odchylek a její vyděleí počtem měřeí. (scripta uvádějí průměrou odchylku jako sumu odchylek od průměru vyděleou počtem měřeí. Rozptyl je defiová jako středí hodota druhým moci (kvadrátů) odchylek od průměru. Směrodatá odchylka je odmociou z rozptylu

Základí pojmy Variačí koeficiet je podílem mezi směrodatou odchylkou a průměrem. Příklad Je použit z příkladů poskytutých v doporučeých materiálech a etstorage. Jedá se o druhý soubor, příklad. Ve dvaáctičleé studijí skupiě bylo při zápočtovém testu dosažeo ásledujících bodových výsledků (maximálí možý počet bodů je rove deseti): 7 0 0 0 0 8 0 0 8 Vypočítejte modus, mediá, aritmetický průměr, průměrou odchylku, rozptyl a směrodatou odchylku zazameaých výsledků. a) Zápis měřeí Dosažeá hodota 0 7 8 0 Absolutí četost Relativí četost 0,08 0,7 0,08 0,08 0,7 0, Počet měřeí: = Relativí četost = Absolutí četost počet měřeí Aritmetický průměr = ( 0* + * + * + *7 + *8 + *0 ) = 7 Modus = 0 Mediá = středí hodota ze součtu všech hodot bude mezi. pořadím (0 + + + + 7 + 8 ) a. pořadím (0 + + + + 7 + 8 + 0), což by odpovídalo hodotě 9. Průměrá odchylka: [ * ( 9 0 ) + * ( 9 ) + * ( 9 ) + * ( 9 7 ) + * ( 9 8 ) + * ( 0 9) ] = ( 9 + + + + + ) =,8 při počítáí s absolutí četostí. Pokud použijeme četost relativí je výpočet mohem sice jedodušší, protože počítáme ( * 0,08 + * 0,7 + * 0,08 + *0,08 + * 0,7 + * 0,), ale výsledek se může lišit díky zaokrouhleí, které jsme použili při výpočtu relativí četosti. Rozptyl: s² = [ * ( 7 0 )² + * ( 7 )² + * ( 7 )² + * ( 7 7 )² + * ( 8 7 )² + * ( 0 7)² ] = ( *9 + * + * +*0 + * + *9 ) = Směrodatá odchylka: odmocia z rozptylu () =, Variačí koeficiet: Směrodatá odchylka průměr, tj., 7 = 0,7 Poz.: V tištěých scriptech se vzorec pro výpočet rozptylu tváří eje složitěji, ale také trošku více odlišě. Teto vzorec odpovídá vzorci z elektroických script z webu ČZU.

Průměry Aritmetický průměr Je každému jasý, takže je pro úplost x = [ Naměřeá hodota (h) * počet měřeí () s výsledkem h + h * () (h) * () / celkový počet měřeí () Harmoický průměr Se využívá zejméa u rychlosti, měřeí el. odporu,. Vzorec se zapisuje takhle a dá se přečíst jako počet měřeí děleo suma všech aměřeých hodot a mius prvou. Doložeí vzorce xh = xi Příklad č. z etstorage je shodou okolostí tetýž, jaký použil profesor při výpočtu a kozultaci a zí: Automobil jede do kopce rychlostí čtyřicet km/hod a poté stejou trasou zpátky rychlostí osmdesát km/hod. Jaká je průměrá rychlost automobilu během této projížďky? Protože se oba časy jedotlivých částí projížďky rovají musí být rove i součet jejich rychlostí. Z toho vyplývá, že hodoty zapíšeme takto: s s s + = + 0 80 xh + = + 0 80 xh s xh xh s = čas, a protože ám a ěm ezáleží, tak můžeme říci, že projížďka trvala jedotku času a zapsat to takhle: = xh = 0 xh =, km/h 80 xh

Průměry Geometrický průměr můžeme využít apř. u průměrováí úroků v bace, ebo u jiých hodot, které arůstají geometrickou řadou. Vzorec se zapisuje takhle: xg = x + x + x + x a příklad č., který zí: Doložeí vzorce Určete celkovou aspořeou částku z vkladu 0 000 Kč po pěti letech spořeí, jestliže vklad měl ročí úročeí a úroková míra čiila v prvím roce %, ve druhém 8%, ve třetím % a ve čtvrtém i pátém roce %. Určete též průměrou ročí úrokovou míru za daé období. To, co se ám v tomto případě eměí a zůstává výsledkem levé i pravé stray rovice je výše zůstatku a koci spořeí. Takže hodoty zapíšeme takto: 0 000 *,0 *,08 *,0 *, *, = 0 000 * xg * xg * xg * xg * xg (vykrátíme),9 = xg xg =,9 xg =,08 8% Kvadratický průměr Použijeme tam, kde průměrujeme plochy (ejčastěji kruhové) a při tom záme pouze jejich průměr, ebo obdobou veličiu. Vzorec se zapisuje takhle: a příklad č., který zí: Doložeí vzorce xk = xi Nechť d, d,, d jsou výčetí tloušťky stromů a daém staovišti. Určete průměrou velikost kruhových výčetích základe těchto stromů. Dále určete tloušťku stromu s průměrě velikou kruhovou výčetí základou. Speciálě předpokládejte, že a staovišti je devět stromů s ásledujícími tloušťkami (v cetimetrech): 0 0 0 0 0 0 0 0 0 To, co se ám v tomto případě eměí a zůstává výsledkem levé i pravé stray rovice je celková plocha kruhové výčetí základy. Na rozdíl od způsobu, kterým jsme řešili příklad a kozultaci, bude pro me jedoduší pracovat s poloměry: 0 0 0 0 0 * *0² + * * ² + * * 0² + * * ² + * * 0² = 9 * * rk² (vykrátíme ) 00 + 0 + 800 + 0 + 900 = 9 rk² 00 = rk² rk = 0 dk = 0

Průměry Kvadratický průměr Pokud bychom místo s poloměrem pracovali s průměrem vypadalo by to takto: * * 0² + * * 0² + * * 0² + * * 0² + * 0² = 9 dk² Vykrátíme, a dostaeme 800 + 800 + 00 + 000 + 00 = 9 dk² 00 = dk² dk = 0 Obtížost tedy bude asi stejá, rozdíl bude je v délce zápisu, takže hlavě eudělat chybu ve vzorečku. Kubický průměr Použijeme tam, kde průměrujeme objemy a při tom záme pouze jejich průměr, ebo obdobou veličiu v měřeých tělesech. Vzorec se zapisuje takhle: Doložeí vzorce xc = xi a trochu upraveém příkladu č., který po úpravě zí: Nechť d, d, d, jsou průměry borůvek v košíku. Určete průměrý objem těchto borůvek. Dále určete průměr borůvky s průměrým objemem. To, co se ám v tomto případě eměí a zůstává výsledkem levé i pravé stray rovice je celkový objem borůvek. Pro výpočet použijeme vzorec pro objem koule. d³ d³ d³ d³ dk³ + + = (vykrátíme ) d³ + d³ + d³ d³ + d³ + d³ = dk³ dk = d³ + d³ + d³ ( d³ + d³ + d³ ) Objem průměré borůvky tedy bude: * = 8

Prostorové bodové struktury Zjištěí stupě agregace Na příkladu č. z etstorage Prostorové rozmístěí velkých stíek (Philoscia muscorum). Na ásledujícím obrázku je zazameá výsledek aalýzy prostorového rozmístěí stíek ve spadaém listí a humusu v části bukového háje poblíž Oxfordu. ) Prostor (plocha) se rozčleí a pravidelé části (ejlépe čtverce) ) Zjistí se počet bodů (vzorků) ve čtvercích (blocích) ) Spočítá se agregace pomocí koeficietu disperze, který se počítá jako podíl mezi rozptylem a aritmetickým průměrem. i = s² x Pokud se i rová, jedá se o pravidelé rozmístěí bodů v prostoru s maximálím rozestupem pokud je i větší ež, jedá se o shlukovité rozmístěí pokud je i meší ež, je rozmístěí bodů spíše áhodé, epravidelé a) Zjištěý výskyt bodů zapíšeme do tabulky Možství stíek () 0 Absolutí četost 9 relativí 0, 0, 0, 0, 0,0 0,0 b) Aritmetický průměr (*0 + * + 9* + * + * + * ) 7 =, c) Rozptyl = [ * (, 0 )² + * (, )² + 9 * (,)² + * (, )² + * (, )² + * (, )² ] 7 = [0,7 + 0,9 +,9 + 9,8 +, +,9] 7 =, d) i =,, =,7 Prostorové rozmístěí stíek je tedy shlukovité.

Pojmy Pravděpodobost Náhodým pokusem zkoumáme výskyt áhodých jevů. Je to takový pokus (zkoumáí jehož výsledek eí jedozačě urče počátečími podmíkami. Možia áhodých jevů tvoří áhodý pokus. Jevy mohou být vzájemě eslučitelé, tj. takové které se vzájemě vylučují, jako apř. možost, že při hodu kostkou emůže padout číslo, které by bylo zároveň sudým i lichým. Neí u ich žádý průik moži. druhou kategorií jsou jevy vzájemě slučitelé. Tady už dochází k průiku moži áhodých jevů Za ezávislý jev ozačujeme takový áhodý jev, kdy výskyt jedoho jevu eovliví výskyt jevu druhého. Např. u rulety, když si vytočíte jakékoliv číslo, tak to emá vliv a vytočeí čísla při další hře, a rozdíl třeba od sportky, kdy vylosováí. míčku změí pravděpodobost losováí míčku druhého jev závislý. Jev u ěhož pravděpodobost vyjádříme číslem ozačujeme jako jev jistý (astae vždy Při hodu hrací kostkou pade vždy celé číslo). Opakem je jev emožý, tuto pravděpodobost vyjádříme číslem 0. Pravděpodobosti mezi ulou a jedičkou jsou jevy ejisté. Pravděpodobosti výskytu eslučitelých jevů se sčítají. P(A + B) = P(A) + P(B) U jevů slučitelých je potřeba ještě odečíst jejich průik. P(A + B) = P(A) + P(B) P(A B) Pravděpodobosti jevů ezávislých ásobíme. P(A B) = P(A) * P(B) Pravděpodobost, že při hodech hrací kostkou bude součet paduvších hodot rove, spočteme tak, že vyásobíme pravděpodobosti jevu, že při každém hodu pade jedička. / * / = /. Použít můžeme i základí schéma pro výpočet pravděpodobosti ezávislých jevů, které zapisujeme takto: m(a) a můžeme ji vyjádřit jako podíl moži jevů, které P(A) = m(ώ) chceme zjistit a všech možých jevů. Pravděpodobost jevu, že při hodech hrací kostkou bude součet paduvších hodot rove tedy bude /, tj. /.

Příklady Pravděpodobost S jakou pravděpodobostí se jako řidič dostaete z místa A do místa B, pokud a vás čekají takovéto křižovatky. Podíváme se a pláek a vidíme, že k cíli vedou cesty, tz., že budeme sčítat pravděpodobosti možosti jet cestou horí a dolí. Ať už pojedeme horem ebo dolem, čekají ás křižovatky, kde, jak je z ákresu vidět mohou astat jevy ezávislé. Horí cesta: Pravděpodobost, že a křižovatce pojedeme správě je ½. To vyásobíme pravděpodobostí, že z bodu A pojedeme právě horí cestou a vyjde ám ½ * ½ = ¼. Dolí cesta: Pravděpodobost, že a křižovatce zaheme správě /. To vyásobíme pravděpodobostí, že z bodu A pojedeme právě dolí cestou a vyjde ám / * ½ = /. A teď už je sečteme pravděpodobosti dvou eslučitelých jevů ¼ + / = /. Pozor!!! Mapka může mít i jié uspořádáí tras, takže logika bude jistě potřeba. Nicméě si myslím, že by se ám mohly vyhout špeky typu křižovatek s kruhovým objezdem. A B Stojíte a kraji útesu. S jakou pravděpodobostí spadete dolů, pokud v rámci povoleých kroků dvěmi směry (dopředu a dozadu) uděláte,,,, kroků? Opět bude potřeba si uvědomit, kdy budeme počítat s jevy ezávislými a eslučitelými. Opět je to o logice. U každého jedoho kroku je pravděpodobost že ho uděláme jedím směrem je ½, protože jak zazělo v zadáí byly dáy je dva možé směry kroků. Počet kroků Možosti U sudých počtů kroků už eexistuje možost, Pravděpodobost ½ 0 / = 0 ½ * ½ * ½ = /8 jak udělat sudý krok a spadout dolů, tedy P = 0 ½ * ½ * ½ * ½ * ½ + ½ * ½ * ½ * ½ * ½ = / U podobých příkladů tedy epočítat celkový počet možostí jak dosáhout kýžeého výsledku, ale sečíst pravděpodobosti možých cest, které vedou k cíli.

Geometrická pravděpodobost Pro geometrickou pravděpodobost používáme stejý vzorec jako pro pravděpodobost aritmetickou (klasickou). Rozdíl je v tom, že místo s určitým počtem jevů, pracujeme s určitou délkou, prostorem, ebo jiou veličiou. Máme příklad: Na 00 metrovém úseku cesty ztratíme mici. S jakou pravděpodobostí ji ajdeme, budeme-li prohledávat 00 metrový úsek? P(A) = m(a) m(ώ) Dosadíme do vzorce: P(A) = 00 / 00 = / Pokud by áhodou vzorec vypadul, tak ke stejému výsledku se dojde logickou úvahou. Na každém metru v prohledávaém úseku mám pravděpodobost, že ji ajdu /00. Těch metrů je celkem sto, jedá se o jevy eslučitelé, takže je můžeme sčítat. Po sečteí stovky /00 ám opět vyjde výsledek /. Máme 0kg těsta. Do ěj dáme roziku. Zapracujeme ho do kilových bocháků. S jakou pravděpodobostí ajdeme roziku v jedom kokrétím upečeém bocháku. Opět je ejdůležitější se ezamotat v číslech a apř. edělit roziku 0 kily těsta. Dělit můžeme kg / 0 kg ebo bocháek 0 bocháky. Vyjde ám tedy P(A) = 0,. Kdybychom do těsta dali roziky, tak pravděpodobost, že v jedom bocháku ajdeme aspoň jedu roziku bude 0, + 0, = 0,. Náhodé veličiy Rovoměré rozděleí pravděpodobostí rozděluje jedotlivým výsledkům pokusu (zkoumáí) pravděpodobosti, že astaou. Např. u hodu kostkou je u hodu jedou kostkou se hodoty jedotlivých pravděpodobostí pro čísla rovají jedé šestiě. Pokud budeme eustále přidávat přidávat kostky, tak se graf křivky (osa x součet hodů, osa y - pravděpodobost, bude stále více podobat gaussově křivce. 0,7 0,7 0,7 0,7 0,7 0,7 7 8 9 0 0,08 0,0 0,08 0, 0,9 0,7 0,9 0, 0,08 0,0 0,08 U biomického rozděleí rozdělujeme pravděpodobosti pro jevy, které buď astaou ebo eastaou, jsou tedy dvě možosti, ale pro růzé pravděpodobosti, že určitý jev astae ebo eastae. Takže zatímco u hodu kostkou můžete dostat výsledků s pravděpodobostí, že jev astae a která je dáa a elze ji změit, tak semeo buď vzklíčí ebo e, ale stupeň pravděpodobosti se musí dodat.

Biomické rozděleí Náhodé veličiy S jako pravděpodobostí vyklíčí 0,,,,, seme pokud mají 80% klíčivost? U ula seme je to už a prví pohled jedoduché. Musíme * vyásobit pravděpodobost, že semeo evzejde 0, * 0, * 0, * 0, * 0, což jest ( 0,8) a to se tedy rová 0,000. U dalších seme už využíváme biomická čísla (středoškolská matika). Trošku zopakuji. ( ) Biomické číslo se čte apř. jako pět ad třetí a v podstatě se rová o variaci k-té třídy o prvcích, v ašem případě o variaci. Třídy o -ti prvcích. Vzoreček pro její výpočet je:! k! * (-k)! Takže v ašem případě, by to bylo takhle:!! * (-)! Pokud by jste echtěli a toto použít kalkulačku, tak ručě se to spočítá takhle: **** ** * * k 0 = 0 možých variací. Takže jdeme dokočit příklad se semey. Písmeem k si ozačíme počet vyklíčivších seme, jejichž pravděpodobost vyklíčeí počítáme, písmeo P zůstává ozačea pravděpodobost. P (x = k) 0, = 0,000 (0,8 * 0, * 0, * 0, * 0,) * = 0,00 0,8 * 0,8 * ( ) * 0, * 0, * 0, = 0,8 * 0 * 0, = 0,0 0,8 * 0,8 * 0,8 *( )*0, * 0, = 0,8 * 0 * 0, = 0,08 0,8 * 0,8 * 0,8 * 0,8 *( )* 0, = 0,8 * *0, = 0,09 0,8 = 0,77 Poz. k. a posl. řádku: ( )=( )= 0 Poz. k. a předposl. řádku: ( )=( )= zí: k- I z tohoto příkladu odvoditelý vzorec P(x=k) =( )p k * ( p) - k k

Náhodé veličiy - defiováí biomického rozděleí Mějme posloupost ezávislých áhodých pokusů, které mohou dopadout je dvěma způsoby (biomicí), pravděpodobost úspěchu p, potom počet úspěchů v celé sérii má biomické rozděleí s parametry a p. Pokud písmeem x ozačíme počet úspěchů tak vzorečkem zapíšeme toto rozděleí takto: x ~ Bi (, p) Pokud 0* hodíme kostkou, s jakou pravděpodobostí hodíme 0* šestku. Poz.: I když házíme kostkou, jedá se o biomické rozděleí protože šestka buď pade ebo epade. = 0 ; k = 0 ( 0 )* *( ) 0 0 = 0, 0 Matematická statistika - testováí hypotéz Statistickou hypotézou rozumíme každé tvrzeí o tvaru ebo charakteristikách rozděleí jedoho či ěkolika statistických zaků. Testem statistické hypotézy budeme azývat postup, jímž a základě áhodého výběru ověřujeme, zda daá hypotéza platí, či ikoliv. Hypotézy, které se týkají hodot parametrů rozděleí se azývají parametrické testy. Testováí tvrzeí o rozděleí základího souboru, bez vyhodocováí jeho parametrů se azývá testem eparametrickým. Testovaá statistická hypotéza se obvykle azývá ulová hypotéza a ozačuje se H0. Proti sobě stojí tato ulová hypotéza H0 a alterativí hypotéza H. Testovaý soubor zpravidla dělíme a dvě části. Tu která, splňuje daou hypotézu, a tu, která ji esplňuje. Pokud apř., jako při předášce testujeme, kolikrát hostiský při čepováí pivího moku alil špatou míru a ezajímá ás, jestli pod míru ebo ad míru, tak testujeme s oboustraou alterativou. Pokud testujeme, jestli čepuje pod míru, tak testujeme s levostraou alterativou. Pokud testujeme, jestli čepuje ad míru, tak testujeme s pravostraou alterativou. Levostraá i pravostraá alterativa jsou alterativy jedostraé. Dalším pojmem je tzv. hladia výzamosti, které začíme písmekem alfa. Kdybychom u již zmíěého hostiského vyjádřili hypotézu, že hostiský je křivák pokud ačepuje pivo pod míru s větší ež -ti procetí pravděpodobostí, tak oa hladia výzamosti by se rovala hodotě 0,0 (%). Tuto hladiu výzamosti azýváme též pravděpodobostí chyby.druhu. Udává výši rizika, s jakým se H0 zamítá, i když platí. Abychom se vyhli dopočítáváí chyby. druhu, tak i když to bude vypadat, že hostiský je poctivý, tak odpověď a testovaou hypotézu bude zít: Nelze dokázat, že hostiský je epoctivý a e Hostiský je poctivý. Holt elze vyloučit možost, že hostiský aléval dobrou míru byla je áhoda chyba. druhu. V tomto příkladě bylo testové kritérium hostiského poctivost. Obor hodot, kdy zamítáme ulovou hypotézu se azývá kritickým oborem K, ebo-li oborem zamítutí. Hodoty, které tyto dva obory oddělují se azývají kritické hodoty.

Testováí hypotéz Mezi ty ejvíce jedoduché, ale také ejméě vypovídající patří zamékový test. Jeho meší spolehlivost byla ilustrováa příkladem který zěl: Testujeme hostiského poctivost a zkušebím vzorku 8 skleic piva. Budeme předpokládat, že hostiský může být poctivý když z těch osmi skleic ačepuje a více skleic ad míru. Skleice ačepovaé ad míru si ozačíme zamékem plus, a ty pod míru zamékem mius. + - - - + + + - - + + + + + + - - - - - - + + + Od pohledu je zřejmé, že výsledky se budou lišit, podle toho, ze které časové řady (umístěí) bude zkušebí vzorek pocházet. K testováí podle zamékového testu budeme ještě potřebovat vědět jakou předpokládáme pravděpodobost, že hostiský ačepuje skleici úplě přesě. Jako ezaujatí budeme předpokládat, že p = ½. Trochu si v je tomto případě pozměíme hladiu výzamosti (alfa) z ¼ a 0,0, což je stadardí odchylka, se kterou se počítá i ve statistických tabulkách, coby povoleé pomůcce při zkoušce. x ~ Bi (, p) Podle schématu z již zmiňovaého biomického rozděleí zapíšeme příklad takto: x ~ Bi (8; ½) při α = 0,0. Pro výpočty použijeme: P(x=k) =( )p k * ( p) - k k k 0 7 8 p ( x = k ) 8 ( 0)0, 0 * 0, 8 = 0,009 8 ( )0, * 0, 7 = 0,0 8 ( )0, * 0, = 0,09 ( 8)0, * 0, = 0,88 8 ( )0, * 0, = 0,7 8 ( )0, * 0, = 0,88 8 ( )0, * 0, = 0,09 8 ( )0, 7 * 0, = 0,0 7 8 ( 8)0, 8 * 0, 0 = 0,009 Je jasé, že očekávaý výsledek je /. Protože jde o jedostraou a v ašem případě pravostraou alterativu, začíáme sčítat pravděpodobosti zezdola, dokud epřekročíme hladiu výzamosti. 0,009 + 0,0 (0,0) + 0,09 (0,). Kritická hodota se tedy alézá po podměrečých pivech. U -tého piva tedy řekeme, že hypotézu o hostiského poctivost přijímáme, ale epoctivost zamítout emůžeme, u 7-mého piva už to bude aopak. Pokud bychom si řekli, že každé pivo, které emá přesě míru je chybou, tak by se jedalo o oboustraou alterativu testu. V tom případě bychom ale začali sčítat z obou krajích stra. 0,009 + 0,009 (0,0078) + 0,0 + 0,0 (0,070). To už by se tedy. kritická hodota alézala mezi 0-tým a - ím pivem a. kritická hodota alézala mezi 7-mým a 8-mým pivem. Při H0, že hostiský je poctivý by v tomto případě byly hodoty zamítutí 0 a 8. Stat. Tabulka se též vztahuje k oboustraé alterativě, takže tam můžete ajít, že pro 8 pivech kočí hostiského epoctivost při -ti procetí hladiě výzamosti a 0-tém pivu a začíá a 8-mém pivu.

Testováí hypotéz Studetův t-test U testováí hypotéz, kdy se echceme opírat je o výskyt jevů, ale chceme do zjištěí pravděpodobosti zahrout i jiý parametr (apř. kolik cm zbývá do toho, aby skleice měla řádou míru, můžeme využít Kotrolí test zjišťoval pravdivost hypotézy H0, že výrobí stroj je špatě seříze (převažuje, edovažuje) a vzorku o 0-ti ábojích avážil tyto hodoty (g):,0,99,00,0,0,0,98,0,0,99. Podle zamékové testu by jsme v tabulkách zjistili, že kritický poměr (při hladiě výzamosti α = 0,0) je :9, tedy že aby se potvrdila správost hypotézy, z 0 ábojů může mít jede áboj adváhu a ostatí podváhu ebo akorát. Aebo obráceě podváhu a 9 akorát ebo s adváhou. My jsme zjistili, že adváhu mají tři áboje, takže hypotézu H0, že stroj špatě váží epřijímáme, ale s tím, že ji elze zamítout. S pomocí studetova t-testu zjišťujeme testovací statistiku (T) s pomocí studetova rozděleí s - stupi volosti. Takhle vypadá vzoreček x orma s je směrodatá odchylka a x je průměr z t = * s aměřeých hodot. Aritmetický průměr je tedy (*,98 + *,99 + *,00+ *,0 + *,0 + *,0 + *,0) / 0 =,0. Norma jsou dva gramy. Ke směrodaté odchylce se dostaeme v těchto krocích: ) Zjištěí rozptylu s = [ *(,0-,98) + *(,0-,99) + *(,0-,00) + *(,0-,0) + * (,0-,0) + *(,0-,0) + *(,0-,0) ] / 0 = 0,0009. Profesorovi vyšlo 0,000 ) Směrodatá odchylka je odmocia z rozptylu a to v tomto případě je 0,09. Profesorovi vyšlo 0,00 Teď už je dosadíme do vzorce: T = (,0,00) / 0,09 * 0 =,8. Profesorovi vyšlo,. I kdyby ale dosadil svou směrodatou odchylku do vzorce, který je zapsá správě, tak mu to emůže vyjít. T = (,0,00) / 0,00 * 0 =,7.

Studetův t-test A teď to ejdůležitější. Jak bez zamékového testu ověřit platost ulové hypotézy? Porováí hodoty t s kritickou hodotou tα(-), která je uvedea v tabulkách, kde je meší chybička levý sloupec emá být adepsá, ale -. V ašem případě tedy ajdeme hodotu pro (0 ) stupňů volosti a -ti % hladiu volosti, což je,. ) S pomocí vzorce určit hodotu spočítaé veličiy t Nulovou hypotézu H0 zamíteme, pokud spočítaá hodota t bude větší ež hodota tα (-). Protože hodota,77 je meší ež,, tak můžeme odpovědět, že odchylka výběrového průměru od očekávaé hodoty (ormy) ų0 eí statisticky výzamá. Shrutí studetova t-testu ) V tabulkách ajít hodotu odpovídající hladiě výzamosti a - stupňům volosti ) Na základě porováí odmítout, či přijmout ulovou hypotézu a určit, zda odchylka očekávaé hodoty od průměru je statisticky výzamá či ikoliv. F test (dvou výběrový test) Teto test použijeme pokud srováváme dvě vzorky proti sobě, e oproti ějaké ormě ebo očekávaému výsledku. Nulovou hypotézu testujeme a dvou áhodě vybraých vzorcích. Testovací kritérium F spočteme jako podíl rozptylů (!!! Větší rozptyl / meší rozptyl) Toto spočítaé kritérium pak porováme s tabulkovým pro - stupě volosti a průměrou požadovaou hladiu výzamosti. Nulovou hypotézu (při oboustraé alterativě) zamíteme pokud F bude větší ež Fα/(m-, -). Při pravostraí alterativě, bychom ji zamítli, kdyby F bylo větší ež Fα(m-, -). (s ) F = (s ) S s

Odhad středí hodoty Na rozdíl od klasického způsobu zde zjišťujeme hraičí hodoty mediáu, při ámi zvoleé spolehlivosti (pravděpodobosti) P. Vzorec zí takto: Aritmetický Směrodatá průměr odchylka Mediá = x + [t - (-P)]* - S Tabulková hodota pro - stupňů volosti a hladiu α (-P) Počet prvků ve výběru Příklad a odhad středí hodoty P = 0,9 = 0,0 ; = 0 ; t 9 (0,0) podle tabulek a studetův t-test =, ; Průměr =, hodoty odchylka,,87,,,,0, 0,9,7 0,,9 0,,00 0,7,7 0,8,0,07,97, Rozptyl = [,87 +, +,0 + 0,9 + 0, + 0, + 0,7 + 0,8 +,07 +, ) / 0 =,088 Směrodatá odchylka =,088 =,088. Dosadíme do vzorce : Dolí hodota mediáu =, (, *,088 / 0 ) =,79 ; Dolí hodota mediáu =, + (, *,088 / 0 ) =, Pokud odhademe jakoukoliv středí hodotu ze zkoumaého vzorku, pak ulovou hypotézu, že teto odhad je středí hodotou daého vzorku při 9-ti procetí pravděpodobosti zamíteme pokud bude ležet mimo rozpětí,7 až,0.

Porováí průměrů zkoumaých vzorků (dvou výběrový test) Teto parametrický test porovává průměry z dvou měřeí za účelem staoveí zda rozdíly mezi zkoumaými vzorky ejsou větší ež staoveá hladia výzamosti. [H0 : µ = µ] Nejprve staovíme, zda jsou rozptyly obou vzorků stejé, ebo se aspoň k sobě velmi blíží (hraici zjistíme s pomocí F-testu a hladiy výzamosti. Pokud kostatujeme, že vyhovují aší podmíce stejosti může využít ke staoveí testové kritéria t tzv. dvouvýběrový t-test. Testové kritérium t vypočteme podle vzorce: m začí počet měřeí v prvím měřeí (x, x, t = ), pak v druhém (y, y, ). s spočítáme s * + obdobě jako kdybychom počítali rozptyl u - m oho vzorku. K přijmutí či zamítutí ulové hypotézy budeme opět porovávat hodotu t spočteou s kritickou hodotou pro daou hladiu výzamosti a m + stupi volosti v kritických hodotách. Platí, že ulovou hypotézu (při oboustraé alterativě) zamíteme pokud t bude větší ež tα (m+-). Při pravostraé alterativě, bychom ji zamítli, kdyby t bylo větší ež tα(m+-). Při levvostraí alterativě, bychom ji zamítli, kdyby t bylo meší ež -tα(m+-). Pokud rozptyly obou měřeí (vzorků ) ebudou vyhovovat ašemu požadavku a stejost ahradíme dvouvýběrový t-test testem, který je azývá: Testové kritérium t vypočteme podle vzorce: Welchův test Na rozdíl od t-testu je zde počítá každý rozptyl zvlášť, a pak teprve dosaze do vzorce. Pro přijetí, či zamítutí ulové hypotézy se rozhodujeme stejým způsobem jako u t-testu s jediým rozdílem. Stupě volosti f si spočítáme podle vzorce, který se tváří složitě, ale je docela sado zapamatovatelý a odvoditelý. t = x - y x - y (s ) m + (s ) f = (s ) m (s ) + + (s ) m (s ) Myslím, že další z dvouvýběrových testů párový t-test tam ebude, protože se jedá o testováí s výběry tzv. závislými. Dále si oddecheme, že u dvouvýběrových testů to kočí, a že už ás čeká je m -

Wilcoxoův test dvouvýběrový Což je vlastě eparametrická obdoba dvouvýběrového t-testu. Slouží k testu hypotézy, že dva ezávislé výběry / X = x,, x m a Y = y,, y / pocházejí ze stejého základího souboru, proti alterativě, že se výzamě liší svou polohou. Neparametrické testy se využívají hlavě tam, kde pracujeme s výběry poměrě malých rozsahů ebo ze souborů o jejichž rozděleí ic evíme. Mají meší schopost odhalit esprávost daé hypotézy, to je však kompezováo širší možostí použití. ) Výběrové hodoty se seřadí od ejmešího k ejvětšímu a přiřadíme jim pořadová čísla R x,, R xm, R y,, R ym, přičemž stejě velkým hodotám přiřazujeme stejá pořadová čísla. ) Zjistíme součty T x = R x + + R xm, T y = R y + + R ym ) Vypočteme statistické veličiy podle vzorečků m(m + ) ( + ) U x = m* + - T x ; Uy = m* + - Ty Nulovou hypotézu zamíteme a hladiě výzamosti α, jestliže miimálí hodota ze statistických veliči Ux a Uy jsou meší ebo rovy tabulkové hodotě Uα. (etestuje se a jedostraých alterativách) Příklad a wilcoxoův dvouvýběrový test Zameá to, že bílý je lepší ež čerý? ) Seřazeí a přiřazeí pořadových čísel Čerý x x x x x x 8 x 9 x x x 8 ; bílý y y 7 y 0 y y y y y 7 y 9 y 0 ) Zjištěí součtů Tx = + + + + + 8 + 9 + + + 8 = 7 ; Ty = + 7 + 0 + + + + + 7 + 9 + 0 = 0 0 ) Dosazeí do vzorce: Ux = 0*0 + (0+) - 7 = 8 ; Uy = 0*0 + (0+) - = 9 ) V tabulce pro zvoleou hladiu výzamosti si ajdeme tabulkovou hodotu statistické veličiy U (pro Uα = 0,0) to bude hodotu a protože 9 je meší ež, můžeme odpovědět, že hypotézu o tom že bílý je lepší ež čerý a -ti procetí hladiě výzamosti epřijímáme. Pro Uα = 0,0 to bude hodotu a protože 9 je větší ež, můžeme odpovědět, že hypotézu o tom že bílý je lepší ež čerý a -o procetí hladiě výzamosti přijímáme.

Wilcoxoův test jedovýběrový Na rozdíl zamékového testu, bereme v úvahu odchylky od ormy (předpokládaého jevu) ) Odchylky od ormy vzestupě seřadíme podle jejich absolutí hodoty a přiřadíme jim pořadová čísla ) Vyjádříme zvlášť součty pořadových čísel pro kladé odchylky a zvlášť pro záporé. Tyto součty jsou pro teto test aší statistickou veličiou. ) Porováme meší z ašich stat. veliči (součtů) s tabulkovou hodotou. Nulovou hypotézu zamíteme, pokud hodota spočítaé statistické veličiy bude meší ebo rova tabulkové hodotě. Příklad a wilcoxoův jedovýběrový test ) Seřazeí a přiřazeí pořadových čísel _-0,; _-,; _,; _-,; _-,; _,0; 7_,9; 8_,7; 9_,7; 0_,; _,8; _8,9 ) Vyjádřeí součtů: S - = + + + = ; S + = + + 7 + 8 + 9 + 0 + + = ) Porováí s tabulkovou hodotou: Meší z obou součtů je hodota a ta je meší ež tab. hodota pro = a α= 0,0, takže můžeme říci, že hypotézu o tom, že hostiský točí ad míru epřijímáme při -ti procetí hladiě výzamosti, ale při hodotě α= 0,0 můžeme říci, že hypotézu o tom, že hostiský točí ad míru přijímáme při -o procetí hladiě výzamosti, protože eí větší ež 7. Wilcoxoův párový test se liší od klasického wilcoxoova jedovýběrového testu je tím, že odchylka zde eí vypočítáváa jako rozdíl od ormy, ale jako rozdíl mezi hodotami v páru měřeí (pro jedo x) Seřadit podle absolutích hodot, přiřadit pořadová čísla, vyjádřit součty pořadových čísel pro miusové a plusové odchylky, porovat meší z obou součtů s tabulkovou hodotou,