Ilustrativní příklad ke zkoušce z B_PS_A léto 2014.

Podobné dokumenty
Ilustrativní příklad ke zkoušce z B_PS_A léto 2013.

Mendelova univerzita v Brně Statistika projekt

Odhady parametrů základního. Ing. Michal Dorda, Ph.D.

PRAVDĚPODOBNOST A STATISTIKA. Neparametrické testy hypotéz čast 2

Testování statistických hypotéz

Odhady parametrů základního souboru. Ing. Michal Dorda, Ph.D.

Tento odhad má rozptyl ( ) σ 2 /, kde σ 2 je rozptyl souboru, ze kterého výběr pochází. Má-li každý prvek i. σ 2 ( i. ( i

a další charakteristikou je četnost výběrového souboru n.

Metody zkoumání závislosti numerických proměnných

Test dobré shody se používá nejčastěji pro ověřování těchto hypotéz:

12. N á h o d n ý v ý b ě r

Deskriptivní statistika 1

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA

Nejistoty měření. Aritmetický průměr. Odhad směrodatné odchylky výběrového průměru = nejistota typu A

Odhady parametrů polohy a rozptýlení pro často se vyskytující rozdělení dat v laboratoři se vyčíslují podle následujících vztahů:

Přednáška č. 2 náhodné veličiny

6 Intervalové odhady. spočteme aritmetický průměr, pak tyto průměry se budou chovat jako by pocházely z normálního. nekonečna.

Soustava momentů. k s. Je-li tedy ve vzorci obecného momentu s = 1, získáme vzorec aritmetického průměru.

PRAVDĚPODOBNOST A STATISTIKA

Pravděpodobnost a aplikovaná statistika

Elementární zpracování statistického souboru

ZÁKLADNÍ STATISTICKÉ VÝPOČTY (S VYUŽITÍM EXCELU)

Úvod do teorie měření

11. Popisná statistika

Cvičení 6.: Výpočet střední hodnoty a rozptylu, bodové a intervalové odhady střední hodnoty a rozptylu

Odhady parametrů 1. Odhady parametrů

PRAVDĚPODOBNOST A STATISTIKA. Bodové a intervalové odhady

Doc. Ing. Dagmar Blatná, CSc.

Cvičení 6.: Bodové a intervalové odhady střední hodnoty, rozptylu a koeficientu korelace, test hypotézy o střední hodnotě při známém rozptylu

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ

Generování dvojrozměrných rozdělení pomocí copulí

[ jednotky ] Chyby měření

Testy statistických hypotéz

Mezní stavy konstrukcí a jejich porušov. Hru IV. Milan RůžR. zbynek.hruby.

Spolehlivost a diagnostika

PRAVDĚPODOBNOST A STATISTIKA

Pravděpodobnost a aplikovaná statistika

12. Neparametrické hypotézy

- metody, kterými lze z napozorovaných hodnot NV získat co nejlepší odhady neznámých parametrů jejího rozdělení.

Náhodný výběr 1. Náhodný výběr

Odhady a testy hypotéz o regresních přímkách

Úvod do korelační a regresní analýzy

V. Normální rozdělení

1 POPISNÁ STATISTIKA V PROGRAMU MS EXCEL

4.2 Elementární statistické zpracování Rozdělení četností

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ

Intervalové odhady parametrů některých rozdělení.

PRAVDĚPODOBNOST A STATISTIKA

Při sledování a studiu vlastností náhodných výsledků poznáme charakter. podmínek různé výsledky. Ty odpovídají hodnotám jednotlivých realizací

STATISTIKA. Statistika se těší pochybnému vyznamenání tím, že je nejvíce nepochopeným vědním oborem. H. Levinson

Popisná statistika. Zdeněk Janák 9. prosince 2007

Statistika - vícerozměrné metody

VY_52_INOVACE_J 05 01

NEPARAMETRICKÉ METODY

Pravděpodobnost a aplikovaná statistika

Momenty a momentové charakteristiky

S1P Popisná statistika. Popisná statistika. Libor Žák

Přednáška č. 10 Analýza rozptylu při jednoduchém třídění

14. B o d o v é o d h a d y p a r a m e t r ů

PRAVDĚPODOBNOST A STATISTIKA

2. Náhodná veličina. je konečná nebo spočetná množina;

1 Popis statistických dat. 1.1 Popis nominálních a ordinálních znaků

P2: Statistické zpracování dat

Statistická rozdělení

P1: Úvod do experimentálních metod

ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE

i 1 n 1 výběrový rozptyl, pro libovolné, ale pevně dané x Roznačme n 1 Téma 6.: Základní pojmy matematické statistiky

Testování statistických hypotéz

Základy statistiky. Petr Kladivo

Statistika. Jednotlivé prvky této množiny se nazývají prvky statistického souboru (statistické jednotky).

odhady parametrů. Jednostranné a oboustranné odhady. Intervalový odhad střední hodnoty, rozptylu, relativní četnosti.

jako konstanta nula. Obsahem centrálních limitních vět je tvrzení, že distribuční funkce i=1 X i konvergují za určitých

1.1 Rozdělení pravděpodobnosti dvousložkového náhodného vektoru

Pravděpodobnostní modely

BIVŠ. Pravděpodobnost a statistika

4. B o d o v é o d h a d y p a r a m e t r ů

SP2 Korelační analýza. Korelační analýza. Libor Žák

Číselné charakteristiky náhodných veličin

UNIVERZITA JANA EVANGELISTY PURKYNĚ V ÚSTÍ NAD LABEM PEDAGOGICKÁ FAKULTA Katedra tělesné výchovy

, jsou naměřené a vypočtené hodnoty závisle

MASARYKOVA UNIVERZITA PŘÍRODOVĚDECKÁ FAKULTA BAKALÁŘSKÁ PRÁCE. Dvouvýběrové parametrické a neparametrické testy

8 DALŠÍ SPOJITÁ ROZDĚLENÍ PRAVDĚPODOBNOSTI

Fakulta elektrotechniky a informatiky Statistika STATISTIKA

Metody statistické analýzy. doc. Ing. Dagmar Blatná, CSc.

0,063 0,937 0,063 0, P 0,048 0,078 0,95. = funkce CONFIDENCE.NORM(2α; p(1 p)

14. Testování statistických hypotéz Úvod statistické hypotézy Definice 14.1 Statistickou hypotézou parametrickou neparametrickou. nulovou testovanou

Chyby přímých měření. Úvod

Statistika je vědní obor zabývající se zkoumáním jevů, které mají hromadný charakter.

Katedra pravděpodobnosti a matematické statistiky. χ 2 test nezávislosti

Národní informační středisko pro podporu jakosti

APLIKOVANÁ STATISTIKA

5.5. KOMPLEXNÍ ODMOCNINA A ŘEŠENÍ KVADRATICKÝCH A BINOMICKÝCH ROVNIC

Pravděpodobnostní model doby setrvání ministra školství ve funkci

8 NELINEÁRNÍ REGRESNÍ MODELY

vají statistické metody v biomedicíně Literatura Statistika v biomedicínsk nském výzkumu a ve zdravotnictví

8. Analýza rozptylu.

České vysoké učení technické v Praze. Fakulta dopravní. Semestrální práce. Statistika

EKONOMETRIE 9. přednáška Zobecněný lineární regresní model

1. Základy měření neelektrických veličin

Transkript:

Ilustratví příklad ke zkoušce z B_PS_A léto 0. Jsou dáa data výběrového souboru výšky že vz IS/ Učebí materály/ Témata 8, M. Kvaszová. č. výška č. výška 89 5 90 7 57 8 5 58 5 8 9 58 0 8 0 8 8 9 8 8 95 70 70 8 85 70 5 70 80 70 7 50 7 87 7 88 7 7 5 7 5 7 7 9 5 8 75 8 5 7 9 5 9 7 9 8 7 7 77 9 7 5 80 8 7 97 85 Varačí rozpětí R = ma m = 85-5 = bod Kvatly % % % 5 50 75 = = 7 = 7 bod

Sturgesovo pravdlo, podle kterého by měl být počet skup (tervalů) k přblžě k = +, log v ašem případě k = +, log =,8. Vytvoříme tedy tervalů. Pomocí varačího rozpětí určíme velkost tervalů: / = 5,7, použjeme 5cm, protože rozpětí je ovlvěo odlehlým hodotam a obou kocích ašch dat.. terval do 57. terval 58. terval 7 bod. terval 8 7 5. terval 7 77. terval 78 a více Za represetatví výšku budeme brát střed tervalu. U krajích tervalů uvažujeme, jako by škála pokračovala. Iterval střed tervalu / Σ / do 57 55 0,0 0,0 58-0 5 0,09 0,5-7 5 7 0,70 0,5 8-7 70 0, 0,78 7-77 75 5 8 0,7 0,957 78 a více 80 0,0,000 Σ Polygo kumulatvích absolutích četostí 50 5 0 5 0 5 0 5 0 5 0 5 body

Artmetcký průměr (vážeý pomocí původích hodot) 5+ 57 + 58 + 0 + + + + 5 + 5 5 + + 7 + 5 8 + 5 70 = + 7+ 7 + 7+ 75 + 7 + 77 + 80 + 85 = 7,59 (vážeý pomocí středů tervalů) = k. 55 + 5 0 + 7 5 + 70 + 8 75 + 80 = = 7,7 Použjeme vážeý artmetcký průměr zaokrouhleý a jedu desetu = 7,7 cm. Rozdíly v obou vypočteých průměrech jsou způsobey tím, že jsme za reprezetatví hodotu tervalu vzal střed a kol průměr. Rozptyl, směrodatá odchylka (pomocí středů tervalů) S S S = k ( ). ( ) 55 7,7 + 5 (0 7,7) + 7 (5 7,7) + (70 7,7) = + 8 (75 7,7) + (80 7,7) + =,8 = 5,777 body Směrodatá odchylka ukazuje, jakou výpovědí hodotu má artmetcký průměr. Je-l směrodatá odchylka velká, výpovědí hodota artmetckého průměru je malá a opačě.

Mometové parametry jsou emprcké parametry, které vypočítáme z hodot statstckého zaku v ašem výběrovém souboru. Rozlšujeme: obecé momety, cetrálí momety ormovaé momety. Obecé momety Doplěá tabulka:.... 5 0 0 0 80 7 5 5 59 77 8 9 78 07 5 8 0 00 000 5000 7 59 9 70 O O O O = = = = = = = = =,5 9,89 70 58,7 = = =,5 body Obecý momet prvího řádu O =,5 je vlastě artmetcký průměr vyjádřeý v prvcích škály ( až ). Jedoduše tuto hodotu převedeme a cetmetry. Střed tervalu je 5cm a ještě zbývá 0,5 délky dalšího tervalu (délka tervalu je 5cm), takže 5 + 0,5. 5cm = 7,7 cm. Vdíme, že je to v aprosté shodě s předešlým výpočtem artmetckého průměru, který ám vyšel také = 7,7cm.

Obecý momet prvího řádu O je parametrem polohy. Obecé momety slouží k výpočtu cetrálích mometů. Cetrálí momety ( ) C = = O O = 0 ( ) ( ) ( ) C = = O O =,5 C = = O OO + O = 0,0 C = = O OO + OO O =,8 body Cetrálí momety jsou tedy počítáy vzhledem k cetrálí hodotě (artmetckému průměru). C je tedy vždy = 0. Cetrálí momet druhého řádu C je rozptyl odchylka. V ašem příkladě C =,55. S a je parametrem šířky, C je směrodatá Pro vyjádřeí v cetmetrech tuto hodotu vyásobíme délkou tervalu S =,55. 5cm = 5,777cm. Což je ve shodě s předchozím výpočtem, kdy ám S vyšlo 5,78cm. Cetrálí momety třetího a čtvrtého řádu použjeme k výpočtu dalších emprckých parametrů. Normovaé momety Parametr škmost je určová pomocí ormovaého mometu. řádu a ese pak ázev koefcet škmost. N C = = C C 0,5 5

Je-l koefcet škmost kladý, pak prvky škály ležící vlevo od artmetckého průměru mají vyšší četost (kladě zeškmeé rozděleí četostí větší kocetrace meších prvků škály, meších hodot statstckého zaku) a opačě. V ašem příkladě se jedá o mírě kladě zeškmeé rozděleí, to zameá, že v ašem souboru je více že meších, ež je průměrá výška = 7,7cm. Což s můžeme ověřt v tabulce. Parametr špčatost je ejčastěj určová pomocí ormovaého mometu. řádu a ese pak ázev koefcet špčatost. N C = =,77 C Špčatějšímu rozděleí četostí př daém rozptylu odpovídá vyšší hodota koefcetu špčatost ež rozděleí ploššímu. Používá se rověž velča eces, defovaá vztahem E = N = 0,8 Prametr eces srovává špčatost emprckého rozděleí se špčatostí zámého ormovaého ormálího rozděleí. Je-l eces kladý, je emprcké rozděleí špčatější ež toto rozděleí. V ašem příkladu má soubor meší koefcet ež ormovaé ormálí rozděleí. Výzam směrodaté odchylky pro ormálí rozděleí v tervalu S ; + S leží 8% všech hodot v tervalu S ; + S leží 95% všech hodot body v tervalu S ; + S leží 99% všech hodot V ašem případě v tervalu S ; + S = 5,;79, leží výšky dívek, tj. 9,5%.

Nulová a alteratví hypotéza (vz především: Budský, P. et al. Základy ekoomcké statstky, Eupress, Praha 008, str.-, kde je také jý podobý příklad.) Nulová hypotéza H 0 předpokládá, že ám studovaé emprcké rozděleí lze s praděpodobostí lepší ebo rovou ( - α ).00 % ahradt teoretckým rozděleím. Číslu α říkáme hlada výzamost. Alteratví hypotéza H a předpokládá, tuto áhradu elze provést. Neparametrcké testováí: Naše data podrobíme testu ormalty, tj. že aše výběrová data mohou být vybráa ze statstckého souboru odpovídajícího ormálímu (Gaussovu) rozděleí. Test provedeme a hladě výzamost α = 0,05. K tomuto testu použjeme tzv. umělé rozděleí (hodící se pouze pro testováí) (čt chí kvadrát). S ašm daty provedeme: a) zajstíme, aby v každém tervalu bylo alespoň 5 měřeí (pokud eí, spojíme teto terval se sousedím). Místo tervalů budeme mít. b) trasformac (substtuc) proměých u =, S kde u je proměá ormovaého ormálího rozděleí s dstrbučí fukcí u Φ ( u) = e. π (Fukce Φ ( u) se ěkdy azývá Laplaceova fukce.) V ěkterých tabulkách je ozačováa jako F ( u ).) Vytvoříme ovou tabulku: Pomocí tabelovaých hodot Φ ( u) a použítím pravdla Φ( u) = - ( u) pravděpodobost p odpovídající horím mezím tervalů Φ vypočítáme ( ) ( ) p = Φ u Φ u Nyí můžeme vypočítat ep = ( p ) p ep epermetálí hodotu Teoretckou hodotu teor alezeme opět v jé tabulce a to v řádku v, v udává tzv. počet stupů volost 7

v = k r, kde r je počet parametrů rozděleí, které testujeme (pro Gaussovo rozděleí r = ); tedy v =. Krtcký obor pro áš test je W v α ( ) ) = teor, ; +. Pokud bude ep mmo krtcký obor, bude aše ulová hypotéza potvrzea a příslušé hladě výzamost. terval hor.mez u Φ ( u ) p p ( ) / p p Do 7-0,98 0, 0, 7,0 0,05-7 7 7-0, 0,8 0,87,0,09 8-7 7 0,7 0,770 0,,8 0,58 7 a více 0,000 0,0 0,580 0,08 =,000 ep =, 807 α = 0,05 teor =,8 ep =,807,8; +. Epermetálí hodota statstckého krtera ep je mmo krtcký obor W, lze tedy přjmout ulovou hypotézu H 0 a tedy a hladě výzamost α = 0,05 lze aše data ahradt. body Parametrcké testováí se týká posuzováí vypočteých emprckých parametrů výběrových souborů. 8