SAMOSTATÁ STUDETSKÁ PRÁCE ZE STATISTIKY Váha studentů Kučerová Eliška, Pazdeříková Jana septima červen 005
Zadání: My dvě studentky jsme si vylosovaly zjistit statistickým šetřením v celém ročníku septim našeho gymnázia tělesnou váhu v kg a to pro dívky a chlapce zvlášť. V závěru práce máme otestovat hypotézu, že tělesná váha je na pohlaví nezávislá. Základní údaje: statistický soubor : všechny studentky septim studující ve školním roce 004/005 na G statistický soubor : všichni studenti septim studující ve školním roce 004/005 na G statistická jednotka: jednotliví studenti/studentky statistický znak: tělesná váha v kg Použitý způsob sběru dat: V ročníku septim studuje v roce 004/005 celkem 9 studentů ve třech třídách. Vytvořily jsme tři seznamy studentů po třídách a nechaly je kolovat s prosbou o vyplnění tělesné váhy ke svému jménu. Pokud se vyskytly nejasnosti, vyřešily jsme je operativně o přestávkách. emůžeme si stěžovat na neochotu spolužáků, jen na jejich častou nepřítomnost. akonec se nám podařilo získat potřebné údaje od všech studentů septim ve vymezeném čase. Uvědomujeme si, že kvalitnější výsledky bychom dostaly, kdybychom osobně každého převážily na váze. Tomu bránily nejrůznější překážky a tak jsme se musely spokojit s údaji, které nám jednotlivci sami poskytli. Postup zpracování: Statistické soubory a jsme si mezi sebou rozdělily (Eliška dívky, Jana chlapce) a každá z nás zpracovala soubor samostatně ale stejnou metodikou. Zjistily jsme si rozsah hodnot sledovaného znaku a podle něho stanovily intervaly tříd. Třídy jsme určily společné, pro snazší porovnání obou souborů v grafickém provedení. Získané hodnoty jsme zpracovaly do četnostní tabulky a z ní následně určily všechny potřebné údaje pro výpočet potřebných statistik (modus, medián, aritmetický průměr, směrodatná odchylka, variační koeficient) podle dále uvedených vzorců. Hodnoty jsme zaokrouhlovaly na jedno desetinné místo, přesnější údaje postrádají vzhledem ke způsobu sběru dat smysl. Kromě výpočtu statistik jsme data z četnostních tabulek zobrazily také graficky: sloupkovým a kruhovým diagramem pro jednotlivé soubory a jeden sloupkový k porovnání obou souborů. V závěru jsme se věnovaly ověření hypotézy, že tělesná váha nezávisí na pohlaví.
Použité vzorce a značky: k počet tříd i hodnota znaku (střed třídy) n i absolutní četnost hodnoty znaku i i kumulativní četnost - rozsah souboru f i relativní četnost F i relativní kumulativní četnost k n i i i ni / f ~ - modus, nejčetnější hodnota znaku ˆ - medián, prostřední hodnota - aritmetický průměr k i n i i s - směrodatná odchylka s k i n i i s v - variační koeficient v % v 00 pro testování hypotézy použité veličiny (inde platí pro dívky, pro chlapce), = rozsah, = aritmetický průměr s, s = směrodatná odchylka t testová statistika Studentova rozdělení t s s t 0.5 =,99 - hodnota Studentova rozdělení na hladině významnosti 5 %.
četnost Soubor dívky třída i n i i f i F i n i i n i i 46-50 48 8 8 0,7 0,7 384 843 5-55 53 9 7 0,0 0,37 477 58 56-60 58 5 3 0,3 0,69 870 50460 6-65 63 9 4 0,0 0,89 567 357 66-70 68 3 44 0,07 0,96 04 387 7-75 73 45 0,0 0,98 73 539 76-80 78 46 0,0,00 78 6084 8-85 83 0 46 0,00,00 0 0 součet 46,00 653 5579 modus medián aritmetický průměr směrodatná odchylka 58 kg 65,5 kg 57,7 kg 6,9 kg variační koeficient % váha v kg - dívky 6 4 0 8 6 4 0 46-50 5-55 56-60 6-65 66-70 7-75 76-80 8-85 třídy % 0% % 0% 7% 7% 3% váha v kg - dívky 0% 46-50 5-55 56-60 6-65 66-70 7-75 76-80 8-85
četnost Soubor chlapci třída i n i i f i F i n i i n i i 46-50 48 0 0 0,00 0,00 0 0 5-55 53 0,04 0,04 06 568 56-60 58 3 5 0,06 0,0 74 006 6-65 63 9 4 0, 0,3 567 357 66-70 68 5 9 0, 0,4 340 30 7-75 73 6 5 0,3 0,55 438 3974 76-80 78 36 0,4 0,79 858 6694 8-85 83 9 45 0,,00 747 600 součet 45,00 330 35450 modus medián aritmetický průměr směrodatná odchylka 78 kg 65,5 kg 7,8 kg 9,0 kg variační koeficient % váha v kg - chlapci 0 8 6 4 0 46-50 5-55 56-60 6-65 66-70 7-75 76-80 8-85 třídy 0% 5% 0% 4% 7% 0% % 3% váha v kg - chlapci 46-50 5-55 56-60 6-65 66-70 7-75 76-80 8-85
četnosti Dívky versus chlapci aším úkolem také bylo porovnání dívek a chlapců mezi sebou. Porovnání vypočítaných statistik uvádíme jednak v tabulce hodnot a graficky sloupkovým diagramem. dívky chlapci modus 58 kg 78 kg medián 65,5 kg 65,5 kg aritmetický průměr 57,7 kg 7,8 kg směrodatná odchylka 6,9 kg 9,0 kg variační koeficient % % Kupodivu medián má stejnou hodnotu, ale všechny ostatní hodnoty jsou u chlapců mnohem vyšší. Variační koeficient ukazuje stejnou míru přesnosti sběru dat, odpovídá použité metodice. váha v kg - dívky chlapci 6 4 0 8 6 4 0 46-50 5-55 56-60 6-65 66-70 7-75 76-80 8-85 třídy dívky chlapci aším úkolem také bylo rozhodnout, jestli rozdíly mezi dívkami a chlapci, které naměříme a ve statistikách napočítáme jsou pouze náhodné nebo signifikantní. Graf i tabulka hodnot naznačuje, že to náhoda asi nebude, ale spokojit se asi odhadem nemůžeme. Podle teorie hypotéz formulujeme nulovou hypotézu: Rozdíl mezi dívkami a chlapci je pouze náhodný, neboli výběrový soubor dívek i výběrový soubor chlapců pochází ze stejného souboru (stejná střední hodnota i stejný rozptyl). Pro tento typ hypotéz je vytvořen Studentův test, jehož statistika t = 8,35, což vysoko překračuje limitní hodnotu t 0,05 =,99. Proto musíme zamítnout nulovou hypotézu a prohlásit, že rozdíl mezi pohlavími eistuje: chlapci jsou celkově těžší než dívky a není to náhoda na signifikantní úrovni 5 %. Střední odchylka v obou souborech je hodně velká ( % variační koeficient), jsou tedy značné rozdíly mezi jednotlivci. Proto můžeme odpovědně prohlásit, že dívky septim zdaleka nemají důvod kk držení razantních diet, přestože si to mnohé myslí. Co se týče chlapců, někteří by měli více sportovat, jiní by naopak měli začít více jíst.