Radovan Szurman, szu025. Statistika I Semestrální projekt. Pevné disky
|
|
- Alžběta Novotná
- před 9 lety
- Počet zobrazení:
Transkript
1 Radovan Szurman, szu025 Statistika I Semestrální projekt Pevné disky
2 Úvod V tomto referátu se pokusím s pomocí různých nástrojů statistiky rozebrat situaci na trhu na poli pevných disků a také poukázat na více či méně zřejmé závislosti mezi vybranými parametry těchto počítačových komponent. Popravdě řečeno, data jsou čerpána z ceníku jednoho konkrétního internetového obchodu, tudíž díky svému původu a nepřílišné rozsáhlosti nemohou být závěry brány jako obecně platné. Věřím však, že poznatky z rozboru získaných dat mohou o obecné situaci mnoho napovědět. Toto téma nemusí být pro každého čtenáře zábavné či chytlavé, minimálně však pomůže těm, kteří nacházejí v počítačových komponentách skrytou zálibu nebo těm, kteří se potřebují v aktuální nabídce předních výrobců pevných disků zorientovat např. kvůli plánovanému nákupu. Pro potřeby semestrálního projektu se mi jako dostačující jevilo použít jako zdrojová data specifickou kategorii pevných disků a sice 3,5 SATA pevné disky. Jedná se o kategorii pevných disků, které jsou pro dnešní běžná PC vyžadována nejvíce.
3 1. Výběrový soubor Přehled 3,5" SATA pevných disků Výrobce Model Kapacita Přístupová Vyrovnávací (GB) doba (ms) paměť (MB) Otáčky/min. Cena Samsung HD080HJ 80 8, ,9 Samsung HD160HJ 160 8, ,7 Samsung SP2504C 250 8, ,1 Samsung HD321KJ 320 8, ,4 Samsung HD400LJ 400 8, Samsung HD401LJ 400 8, ,1 Samsung HD501LJ 500 8, ,1 Seagate ST380815AS 80 8, ,6 Seagate ST AS 160 8, ,9 Seagate ST AS 250 8, ,6 Seagate ST NS 250 8, ,6 Seagate ST AS 320 8, ,6 Seagate ST NS 320 8, ,4 Seagate ST AS 400 8, ,3 Seagate ST NS 400 8, ,8 Seagate ST AS 500 8, ,2 Seagate ST NS 500 8, ,3 Seagate ST AS 750 8, ,8 Seagate ST NS 750 8, ,1 Western Digital WD800AAJS 80 8, ,2 Western Digital WD360ADFD 36 5, ,2 Western Digital WD740ADFD 74 5, ,9 Western Digital WD1600YS 160 8, ,5 Western Digital WD1600AAJS 160 8, ,2 Western Digital WD1500ADFD 150 5, ,4 Western Digital WD2500YS 250 8, ,1 Western Digital WD2500AAJS 250 8, ,6 Western Digital WD3200YS 320 8, ,2 Western Digital WD3200AAKS 320 8, ,8 Western Digital WD4000AAKS 400 8, Western Digital WD5000AAKS 500 8, ,4 Western Digital WD7500AAKS 750 8, ,8
4 2. Explorační analýza získaných dat Explorační analýza dat slouží k výpočtu základních statistických charakteristik výběrového souboru. Podle typu dat budeme hledat např. průměr, modus, medián, absolutní i relativní četnost nebo směrodatnou odchylku. Tyto charakteristiky nám mohou o vlastnostech jednotlivých atributů zdrojových dat mnoho napovědět. 2.1 Podíl výrobců na trhu s pevnými disky Histogram, graf č.1, a výsečový graf č.2 nám ukáží, který výrobce je nejproduktivnější, tedy má nejširší nabídku produktů. Barchart for Výrobce Samsung Seagate Western Digital frequency Graf č.1 Výrobce Samsung (7) Seagate (12) Western Digital (13) Piechart for Výrobce 21,88% 40,63% 37,50% Graf č.2 Je zřejmé, že podle výběrového souboru nabízí nejvíce výrobků společnost Western Digital, kterou těsně následuje společnost Seagate. Z výsečového grafu je snadné odečíst jak četnosti pro každého z výrobců, tedy počet výrobků nabízený každým z výrobců, tak relativní četnosti, což je podíl produktů daného výrobce ku počtu všech výrobků všech výrobců vynásoben 100. Statistickou charakteristikou, kterou můžeme u těchto dat určit je i modus, což je název nejčetnější kategorie. V tomto případě jím je tedy výrobce Western Digital.
5 Poznámka: Na tomto místě bych rád ještě upozornil na určitý rušivý element ve výběrovém souboru, který nám při analýze jednotlivých atributů výběrového souboru může pozorování zkreslovat. Jedna se o výjimečně rychlé a drahé pevné disky, které nalezneme pouze v nabídce firmy Western Digital. Jsou to disky s relativně nezvyklými kapacitami 36 GB, 74GB a 150 GB. Kromě nezvyklé kapacity mají tyto modely oproti ostatním i velmi nízkou přístupovou dobu a zároveň mnohem vyšší cenu než ostatní modely srovnatelné či dokonce vyšší kapacity. Je k nim tedy v případě, kdy by docházelo k markantnímu zkreslení výsledků analýzy, přistupovat jako k odlehlým pozorováním nebo minimálně při vyhodnocování k této skutečnosti přihlížet.
6 2.2 Rozbor kapacity pevných disků Zde se zaměříme na to, s jakou kapacitou jsou nejčastěji pevné disky vyráběny, popř. u kterých kapacit nebudeme mít při nákupu příliš na výběr. Barchart for Kapacita [GB] frequency Graf č.3 Kapacita [GB] 36 (1) 74 (1) 80 (3) 150 (1) 160 (4) 250 (5) 320 (5) 400 (5) 500 (4) 750 (3) 12,50% 15,63% Piechart for Kapacita [GB] 3,13% 9,38% 3,13% 9,38% 3,13% 12,50% 15,63% 15,63% Graf č.4 V tomto případě není výsečový graf, graf č.4, dostatečně vypovídající, vzhledem k počtu možných kapacit. Mnohem přehlednější je histogram, graf č. 3, ze kterého snadno usoudíme, že největší výběr je mezi pevnými disky s kapacitami 250 GB, 320 GB a 400 GB. Modus neurčujeme, neboť kategorií s nejvyšší četností je hned několik. Pro úplnost si ještě můžeme uvést průměrnou kapacitu disků, která činí 320 GB.
7 Box-and-Whisker Plot Kapacita [GB] Graf č.5 Pro doplnění je zde uveden i krabicový graf, graf č.5, na kterém je také názorně vidět, s jakou kapacitou nalezneme na pultech obchodů pevné disky nejčastěji.
8 2.3 Rozbor přístupové doby Užitečné může být také zjištění, jaké je v nabídce zastoupení pevných disků z hlediska přístupové doby. Barchart for Přístupová doba [ms] 5,2 8,5 8, frequency Graf č.6 Piechart for Přístupová doba [ms] 9,38% Přístupová doba [ms] 5,2 (3) 8,5 (12) 8,9 (17) 53,13% 37,50% Graf č.7 Z obou grafů je snadno čitelné, že převahu mají disky s přístupovou dobou 8,9 ms. Důvodem je skutečnost, že disky s přístupovou dobou 8,5 ms vyrábí pouze společnost Seagate, zatímco disky s přístupovou dobou 8,9 ms mají v nabídce oba dva ze zbývajících výrobců. Minoritní zastoupení mají naopak disky s přístupovou dobou 5,2 ms, což je dáno již zmíněnou skutečností, že tyto disky jsou specifickým výrobkem firmy Western Digital. Můžeme si také uvést průměrnou přístupovou dobu disků z výběrového souboru, která je přibližně 8,4 ms. Zde je však třeba nezapomenout na to, že tento průměr je ovlivněn odlehlými pozorováními, kterými jsou hodnoty 5,2 ms v poznámce zmíněných disků výrobce Western Digital.
9 2.4 Rozbor vyrovnávací paměti V případě vyrovnávací paměti, máme při analýze jednoduchou pozici. Ve zkoumané kategorii pevných disků se dnes vyskytují pouze modely s vyrovnávací pamětí o velikost 8 MB nebo 16 MB. V pokročilé části referátu si ukážeme, zda souvisí velikost vyrovnávací paměti určitým způsobem závisí na kapacitě disku. Modely o jaké velikosti vyrovnávací paměti jsou tedy častěji k dostání? Piechart for Vyrovnávací paměť [MB] Vyrovnávací paměť [MB] 8 (9) 16 (23) 28,13% 71,88% Graf č.8 K vyhodnocení pozorování nám v tomto případě postačí koláčový graf, graf č.8, na kterém lze zřetelně vidět, že jsou v dnešní době vyráběny převážně pevné disky o velikosti vyrovnávací paměti 16 MB. Modem při pozorování vyrovnávací paměti je tedy hodnota 16 MB. Na tomto místě si dovolím znovu předbíhat a prozradím, že velikost vyrovnávací paměti určitým způsobem narůstá v závislosti na vzrůstající kapacitě. A jak jsme se dozvěděli v kapitole analyzující kapacitu pevných disků, největší zastoupení na trhu mají právě disky s vyššími kapacitami, od 250 GB, které jsou osazovány právě 16 MB vyrovnávací paměti. Z toho tedy plyne převažující zastoupení disků s 16 MB vyrovnávací pamětí nad disky s vyrovnávací pamětí 8 MB. Větší vyrovnávací paměť je také obsažena ve všech výjimečně rychlých modelech Western Digital, kde je toto osazení žádoucí právě z důvodu dosažení maximální rychlosti těchto disků bez ohledu na jejich cenu a nižší kapacitu. 2.5 Rozbor otáček za minutu K rozboru parametru pevných disků, kterým je počet otáček za minutu nepotřebujeme žádný sofistikovaný nástroj statistiky. Postačí nám pohled na zdrojová data, ze kterých i bez hlubších technických znalostí odvodíme, že nebýt ve výběrovém souboru existence tří disků s nestandardními parametry, kterými jsou už mnohokrát zmiňované výkonné disky výrobce Western Digital, mělo by 100% disků shodnou hodnotu počtu otáček za minutu a sice Hodnoty ot./min. jsou zde právě díky přítomnosti zmíněných nestandardních modelů ve zdrojových datech.
10 2.6 Rozbor cen pevných disků Rozbor cen nezávisle na výrobci Při analýze cen se nám situace poněkud znepřehlední, a proto budeme nuceni využít některých zatím nepoužitých grafů, které nám napoví, jaké je rozložení cen v oblasti pevných disků pocházejících od různých výrobců. Jistě bude zajímavé zjisti, jaká je průměrná cena pevného disku a jak jsou ceny kolem této střední hodnoty rozptýleny. Scatterplot (X 1000,0) Cena Graf č.9 Box-and-Whisker Plot (X 1000,0) Cena Graf č.10 Co lze tedy z grafů vyčíst. Z obou grafů, jak bodového tak krabicového, je možné vyčíst, že jako odlehlá pozorování zde působí ceny přesahující 6000 Kč, což jsou většinou ceny modelů s nejvyšší kapacitou. Tato odlehlá pozorování si však pro tento případ nemůžeme dovolit ignorovat či odstranit, neboť se nejedná o žádnou výjimečnou chybu nebo anomálii dat ve
11 výběrovém souboru. Bohužel se však ignorace těchto hodnot v budoucích kapitolách pravděpodobně nevyhneme, neboť právě díky těmto hodnotám bychom nebyli schopni efektivně zjišťovat například závislosti kapacity na ceně pevného disku. Pokud přejdeme ke konkrétním číslům, tak průměrná cena disku ve výběrovém souboru je 2781,90 Kč, čemuž odpovídá zvýraznění střední hodnoty proměnné v krabicovém grafu červeným křížkem. Směrodatná odchylka proměnné činí 1606,50 Kč. Grafy napovídají, jaké je rozložení, rozptyl, cen právě vzhledem k pomyslnému středu proměnné, tedy průměru. Z bodového grafu lze jasně vidět, že největší koncentrace cen je přibližně kolem hodnoty 2000 Kč. Je zde patrný právě vliv odlehlých pozorování, proto je průměrná cena mírně zavádějící a většina hodnot je právě pod hodnotou aritmetického průměrnou. Mnohem větší vypovídající hodnotu má proto v tomto případě hodnota mediánu, která činí 2247,30 Kč. Tato cena už se dá považovat za jakýsi střed výběrového souboru, jak je z rozptylu cen patrné Porovnání cen disků od různých výrobců Zde se pokusíme porovnat ceny výrobků jednotlivých výrobců pomocí průměrné ceny disku každého z výrobců a rozptylu kolem této hodnoty. Statistika nabízí pro tyto účely sofistikovanějších nástrojů, které použijeme v pokročilejší části referátu k odhalení závislosti ceny na výrobci. Pro porovnání cen mezi výrobci použijeme výběrový soubor bez odlehlých pozorování, abychom odstranili výhodu výrobce Samsung, který nenabízí nejdražší disky s kapacitou 750 GB, což by zapříčinilo nižší průměrnou cenu než u obou konkurentů. Výrobce Průměrná cena Směrodatná odchylka Samsung 2046,47 Kč 696,92 Kč Seagate 2432,43 Kč 966,64 Kč Western Digital 2258,10 Kč 911,33 Kč Tabulka č.1 Podle tabulky č. 1 a průměrné ceny můžeme říct, že nejlevnějším výrobcem pevných disků je Samsung následován Western Digital. Tento závěr je však poměrně povrchní a neměl by být brán jako základní argument pro koupi nového disku, neboť nezohledňujeme kvalitu ani další parametry nabízených disků. Nepravdivosti toho tvrzení z hlediska statistiky se budeme věnovat v kapitole Uvedení výběrové směrodatné odchylky zde není bezdůvodné. Čím větší je rozptyl hodnot reprezentovaný právě velikostí směrodatné odchylky, tím menší je schopnost uvedeného průměru reprezentovat celou proměnnou. U výrobce Samsung tedy vidíme, že průměr zde má poměrně slušnou vypovídací hodnotu o celé nabídce produktů. Naopak u výrobců Seagate nebo Western Digital není průměr zrovna reprezentativní hodnotou celého výběru vzhledem k velikosti směrodatné odchylky a tedy rozptýlenosti cen kolem tohoto středu.
12 3. Statistická indukce 3.1 Testování hypotéz Statistická indukce nám dává k dispozici několik metod, jak s určitou jistotou určit, zda vztahy mezi proměnnými platící ve výběrovém souboru o omezené velikosti mohou být aplikovány na celou populaci, ze které výběrový soubor pochází. Základem je stanovení nulové a alternativní hypotézy a následné rozhodnutí, zda zamítáme či nezamítáme nulovou hypotézu. Při testování hypotéz o cenách pevných disků budeme vycházet z výběrového souboru bez odlehlých pozorování. Pokud bychom je neodstranili, výběr by nepocházely z populace s normálním rozdělením což by znemožnilo použití parametrických testů Vyhodnocení nejlevnějšího výrobce pomocí testování hypotéz Pokusíme se tedy pomocí dvouvýběrového testu středních hodnot určit, zda závěr o tom, že výrobce Samsung je podle průměrné ceny z výběrového souboru nejlevnější, který jsem určil v kapitole 2.6.2, může být brán jako obecně platný. Pro úplnost provedeme test pro dvojici výrobců Samsung a Western Digital i pro dvojici Samsung - Seagate. Nejprve je nutné provést test, zda ceny produktů každého z výrobců pocházejí z populace s normálním rozdělením. Výsledkem Kolmogorova-Smirnovova testu je, stejně jako mnoha dalších testů hypotéz, hodnota P-value, která pokud je větší než 0,05, můžeme s 95% spolehlivostí říct, že nezamítáme nulovou hypotézu. Při testování normality je jako nulová hypotéza zvoleno tvrzení, že výběr pochází z normálního rozdělení. Alternativní hypotéza je v tomto případě negací nulové hypotézy. Pro každého z výrobců vyšla hodnota P-value vyšší než 0,05, proto můžeme přistoupit k dvouvýběrovým testům středních hodnot. 1) Porovnání Samsung Western Digital Jako nulovou hypotézu zvolíme, že střední hodnoty cen, tedy průměry, obou populací si jsou rovny. Alternativní hypotézou bude tvrzení, že průměrná cena disků Samsung je nižší než u Western Digital. Výsledkem dvouvýběrového testu středních hodnot je P-value = 0, Nezamítáme tedy nulovou hypotézu, což znamená, že s 95% spolehlivostí můžeme tvrdit, že průměrná cena disků Samsung není menší než disků Western Digital. 2) Porovnání Samsung Seagate Nulovou hypotézu zvolíme stejně jako minule, tedy průměrné ceny obou populaci si jsou rovny. Alternativní hypotézu zvolíme také obdobně, tedy že průměrná cena disků Samsung je nižší než u Seagate. Výsledkem dvouvýběrového testu středních hodnot je P-value = 0, Stejně jako v minulém porovnání tedy můžeme s 95% spolehlivostí tvrdit, že průměrná cena disků Samsung není menší než disků Seagate.
13 Provedené testy nás vyvarovaly omylu, kterého bychom se dopustili, pokud bychom na základě výsledků porovnání průměrných cen disků každého z výrobců vynesli závěr, který byl zmíněn v kapitole 2.6.2, tedy že výrobce Samsung je nejlevnějším výrobcem disků. Aby mohl být takový závěr brán s obecnou platností, musely by být zohledňovány velikosti jednotlivých výběrů, směrodatné odchylky a typ rozdělení, čehož je při testování hypotéz dodrženo. Na základě našeho výběrového souboru tedy nejsme schopni zjisti, který výrobce pevných disků je nejlevnější. 3.2 ANOVA rozpoznávání závislostí mezí jednotlivými kategoriemi Zjišťování závislosti ceny na výrobci Pokud chceme zjisti, zda existuje určitá závislost ceny pevného disku na jeho výrobci, máme k dispozici metodu ANOVA, metodu analýzy rozptylu. Ta nám umožní srovnat více než dvě střední hodnoty nezávislých výběrů. Pokud chceme použít metodu ANOVA, je třeba aby výběry pocházely z normálního rozdělení a měly identické rozptyly. První podmínku jsem otestovali v předchozí kapitole. Výsledkem testů na identické rozptyly byla P-value vždy vyšší než 0,05, proto nezamítáme možnost, že výběry cen pro každého z výrobců mají identické rozptyly. Výsledkem samotného testu je tabulka ANOVA. Zde zjistíme, že hodnota P-value je 0,68, což znamená, že mezi středními hodnotami cen pro každého z výrobců nejsou statisticky významné rozdíly. S 95% spolehlivostí můžeme říct, že cena není závislá na výrobci. Tento závěr koresponduje se závěrem z minulé kapitoly, kdy jsme zjistili, že žádný z výrobců není nejlevnějším, popř. nejdražším. Box-and-Whisker Plot Samsung Výrobce Seagate Western Digital (X 1000,0) Cena Graf č.11 Graf č. 11 pouze podporuje výsledek testu, protože je z vícenásobného krabicového grafu zřejmé, že mezi cenami výrobců nejsou statisticky významné rozdíly.
14 3.2.1 Zjišťování závislosti vyrovnávací paměti na kapacitě disku V kapitole 2.4 jsem se zmínil o odhadu, že velikost vyrovnávací paměti je závislá na celkové kapacitě disku. A protože při laickém pohledu na zdrojová data tato skutečnost nemusí být zřejmá, pokusíme se tuto závislost potvrdit či vyvrátit. Protože nelze kvůli omezené velikosti výběrového souboru ověřit pro každý výběr vyrovnávacích pamětí podle kapacity, zda pocházejí z normálního rozdělení, použijeme ke zjištění závislosti neparametrický Kruskal-Wallisův test. Jeho jedinou podmínkou je, aby výběry měly identické rozptyly, což je v tomto případě splněno. Jeho výsledkem je P-value = 0, , což je hodnota menší než 0,05. Můžeme proto zamítnout nulovou hypotézu, kterou je v tomto testu rovnost mediánů výběrů a zároveň může s 95% spolehlivostí tvrdit, že existuje závislost mezi velikostí vyrovnávací paměti a kapacitou pevného disku. Multiple Range Tests for Vyrovnávací paměť [MB] by Kapacita [GB] Method: 95,0 percent LSD Kapacita [GB] Count Mean Homogeneous Groups ,0 X ,0 XX ,8 XX ,4 X ,0 X ,0 X ,0 X ,0 XX ,0 XX ,0 XX Tabulka č.2 Protože jsem zamítli nulovou hypotézu, provedeme ještě tzv. post-hoc analýzu, která nám ukáže, zda lze některé skupiny sloučit do jedné skupiny, jako by pocházely z jedné populace. Tabulka č.2 uvádí výstup LSD testu, kde nás zajímá sloupec homogenní skupiny. Skupiny, které by mohly pocházet z jedné populace, identifikujeme sledováním sloupců symbolů X. Zde je možné vyčíst, že disky s kapacitami od 320 GB do 750 GB bývají osazovány 16 MB vyrovnávací paměti a mohly by tak z hlediska sledovaného parametru pocházet z jedné populace. Disky s kapacitami 36 GB, 74 GB a 150 GB jsou určitými výjimkami nepotvrzující tuto závislost, ale o této skupině disků již byla řeč dříve. Podle tabulky č. 2 by však do zmíněné populace mohly být zařazeny stejně jako disky s kapacitou 250 GB.
15 Závěr V referátu jsem se pokusil jak prostředky explorační analýzy, tak nástroji statistické indukce zhodnotit a analyzovat zdrojová data, která posloužila jako výběrový soubor pro vlastní rozbor. Pomocí explorační analýzy byl rozebrán každý atribut výběrového souboru a bylo poukázáno na jeho základní vlastnosti. V poslední části bylo použito statistických mechanismů pro testování hypotéz o populaci z níž výběrový soubor pochází, abychom zjistili, zda závěry vynesené na základě dat z výběrového souboru mohou být uplatňovány i obecně na zdrojových populacích.
Vzorová prezentace do předmětu Statistika
Vzorová prezentace do předmětu Statistika Popis situace: U 3 náhodně vybraných osob byly zjišťovány hodnoty těchto proměnných: SEX - muž, žena PUVOD Skandinávie, Středomoří, 3 západní Evropa IQ hodnota
TECHNICKÁ UNIVERZITA V LIBERCI SEMESTRÁLNÍ PRÁCE
TECHNICKÁ UNIVERZITA V LIBERCI Ekonomická fakulta Studentská 2 461 17 Liberec 1 SEMESTRÁLNÍ PRÁCE STATISTICKÝ ROZBOR DAT Z DOTAZNÍKOVÝCH ŠETŘENÍ Gabriela Dlasková, Veronika Bukovinská Sára Kroupová, Dagmar
Jednofaktorová analýza rozptylu
I I.I Jednofaktorová analýza rozptylu Úvod Jednofaktorová analýza rozptylu (ANOVA) se využívá při porovnání několika středních hodnot. Často se využívá ve vědeckých a lékařských experimentech, při kterých
Tabulka 1. Výběr z datové tabulky
1. Zadání domácího úkolu Vyberte si datový soubor obsahující alespoň jednu kvalitativní a jednu kvantitativní proměnnou s alespoň 30 statistickými jednotkami (alespoň 30 jednotlivých údajů). Zdroje dat
DVOUVÝBĚROVÉ A PÁROVÉ TESTY Komentované řešení pomocí programu Statistica
DVOUVÝBĚROVÉ A PÁROVÉ TESTY Komentované řešení pomocí programu Statistica Úloha A) koncentrace glukózy v krvi V této části posoudíme pomocí párového testu, zda nový lék prokazatelně snižuje koncentraci
Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina
Testování hypotéz Analýza dat z dotazníkových šetření Kuranova Pavlina Statistická hypotéza Možné cíle výzkumu Srovnání účinnosti různých metod Srovnání výsledků různých skupin Tzn. prokázání rozdílů mezi
JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica
JEDNOVÝBĚROVÉ TESTY Komentované řešení pomocí programu Statistica Vstupní data Data umístěná v excelovském souboru překopírujeme do tabulky ve Statistice a pojmenujeme proměnné, viz prezentace k tématu
5. Závislost dvou náhodných veličin různých typů (kategoriální a metrická veličina)
5. Závislost dvou náhodných veličin různých typů (kategoriální a metrická veličina) Cílem tématu je správné posouzení a výběr vhodného testu v závislosti na povaze metrické a kategoriální veličiny. V následující
UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 3. 11.
UNIVERZITA OBRANY Fakulta ekonomiky a managementu Aplikace STAT1 Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 Jiří Neubauer, Marek Sedlačík, Oldřich Kříž 3. 11. 2012 Popis a návod k použití aplikace
676 + 4 + 100 + 196 + 0 + 484 + 196 + 324 + 64 + 324 = = 2368
Příklad 1 Je třeba prověřit, zda lze na 5% hladině významnosti pokládat za prokázanou hypotézu, že střední doba výroby výlisku je 30 sekund. Přitom 10 náhodně vybraných výlisků bylo vyráběno celkem 540
Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu
Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu K čemu slouží statistika Popisuje velké soubory dat pomocí charakteristických čísel (popisná statistika). Hledá skryté zákonitosti v souborech
Vysoká škola báňská technická univerzita Ostrava. Fakulta elektrotechniky a informatiky
Vysoká škola báňská technická univerzita Ostrava Fakulta elektrotechniky a informatiky Bankovní účty (semestrální projekt statistika) Tomáš Hejret (hej124) 18.5.2013 Úvod Cílem tohoto projektu, zadaného
Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.
Testování statistických hypotéz Ing. Michal Dorda, Ph.D. Testování normality Př. : Při simulaci provozu na křižovatce byla získána data o mezerách mezi přijíždějícími vozidly v [s]. Otestujte na hladině
RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.
Analýza dat pro Neurovědy RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Jaro 2014 Institut biostatistiky Janoušová, a analýz Dušek: Analýza dat pro neurovědy Blok 3 Jak a kdy použít parametrické a
TECHNICKÁ UNIVERZITA V LIBERCI
TECHNICKÁ UNIVERZITA V LIBERCI Ekonomická fakulta SEMESTRÁLNÍ PRÁCE STATISTICKÝ ROZBOR DAT Z DOTAZNÍKOVÉHO ŠETŘENÍ ANALÝZA VÝSLEDKŮ DOTAZNÍKOVÉHO ŠETŘENÍ (FAKULTNÍ DOTAZNÍK) Datum odevzdání: 13.05.2016
Ústav matematiky Fakulta chemicko inženýrská Vysoká škola chemicko-technologická v Praze
Komentované řešení pomocí programu R Ústav matematiky Fakulta chemicko inženýrská Vysoká škola chemicko-technologická v Praze Popis vstupních dat Vstupní data pro úlohu (A) se nacházejí v souboru "glukoza.csv".
Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1
Testování statistických hypotéz Ing. Michal Dorda, Ph.D. 1 Úvodní poznámky Statistickou hypotézou rozumíme hypotézu o populaci (základním souboru) např.: Střední hodnota základního souboru je rovna 100.
TECHNICKÁ UNIVERZITA V LIBERCI
TECHNICKÁ UNIVERZITA V LIBERCI Ekonomická fakulta Semestrální práce Statistický rozbor dat z dotazníkového šetření Počet stran: 10 Datum odevzdání: 13. 5. 2016 Pavel Kubát Obsah Úvod... 3 1 Charakterizujte
LINEÁRNÍ REGRESE Komentované řešení pomocí programu Statistica
LINEÁRNÍ REGRESE Komentované řešení pomocí programu Statistica Vstupní data Data umístěná v excelovském souboru překopírujeme do tabulky ve Statistice a pojmenujeme proměnné, viz prezentace k tématu Popisná
KORELACE. Komentované řešení pomocí programu Statistica
KORELACE Komentované řešení pomocí programu Statistica Vstupní data I Data umístěná v excelovském souboru překopírujeme do tabulky ve Statistice a pojmenujeme proměnné, viz prezentace k tématu Popisná
PARAMETRICKÉ TESTY. 1) Měření Etalonu. Dataset - mereni_etalonu.sta - 9 měření etalonu srovnáváme s PŘEDPOKLÁDANOU HODNOTOU 10.
PARAMETRICKÉ TESTY Testujeme rovnost průměru - předpokladem normální rozdělení I) Jednovýběrový t-test 1) Měření Etalonu. Dataset - mereni_etalonu.sta - 9 měření etalonu srovnáváme s PŘEDPOKLÁDANOU HODNOTOU
ADDS cviceni. Pavlina Kuranova
ADDS cviceni Pavlina Kuranova Testy pro dva nezávislé výběry Mannův Whitneyho test - Založen na Wilcoxnově statistice W - založen na pořadí jednotlivých pozorování (oba výběry spojeny do jednoho celku)
Jednofaktorová analýza rozptylu
Jednofaktorová analýza rozptylu David Hampel Ústav statistiky a operačního výzkumu, Mendelova univerzita v Brně Kurz pokročilých statistických metod Global Change Research Centre AS CR, 5 7 8 2015 Tato
TECHNICKÁ UNIVERZITA V LIBERCI EKONOMICKÁ FAKULTA
TECHNICKÁ UNIVERZITA V LIBERCI EKONOMICKÁ FAKULTA Semestrální práce Semestrální práce z předmětu Statistický rozbor dat z dotazníkového šetření Vypracoval: Bonaconzová, Bryknarová, Milkovičová, Škrdlová
Statistika. Semestrální projekt
Statistika Semestrální projekt 18.5.2013 Tomáš Jędrzejek, JED0008 Obsah Úvod 3 Analyzovaná data 4 Analýza dat 6 Statistická indukce 12 Závěr 15 1. Úvod Cílem této semestrální práce je aplikovat získané
Lineární regrese. Komentované řešení pomocí MS Excel
Lineární regrese Komentované řešení pomocí MS Excel Vstupní data Tabulka se vstupními daty je umístěna v oblasti A1:B11 (viz. obrázek) na listu cela data Postup Základní výpočty - regrese Výpočet základních
STATISTICA Téma 7. Testy na základě více než 2 výběrů
STATISTICA Téma 7. Testy na základě více než 2 výběrů 1) Test na homoskedasticitu Nalezneme jej v několika submenu. Omezme se na submenu Základní statistiky a tabulky základního menu Statistika. V něm
TECHNICKÁ UNIVERZITA V LIBERCI. Statistický rozbor dat z dotazníkového šetření
TECHNICKÁ UNIVERZITA V LIBERCI Ekonomická fakulta Semestrální práce Statistický rozbor dat z dotazníkového šetření Analýza výsledků dotazníkového šetření - fakultní dotazník Vypracovaly: Klára Habrová,
31. 3. 2014, Brno Hanuš Vavrčík Základy statistiky ve vědě
31. 3. 2014, Brno Hanuš Vavrčík Základy statistiky ve vědě Motto Statistika nuda je, má však cenné údaje. strana 3 Statistické charakteristiky Charakteristiky polohy jsou kolem ní seskupeny ostatní hodnoty
Cvičení 9: Neparametrické úlohy o mediánech
Cvičení 9: Neparametrické úlohy o mediánech Úkol 1.: Párový znaménkový test a párový Wilcoxonův test Při zjišťování kvality jedné složky půdy se používají dvě metody označené A a B. Výsledky: Vzorek 1
Jednostranné intervaly spolehlivosti
Jednostranné intervaly spolehlivosti hledáme jen jednu z obou mezí Princip: dle zadání úlohy hledáme jen dolní či jen horní mez podle oboustranného vzorce s tou změnou, že výraz 1-α/2 ve vzorci nahradíme
4ST201 STATISTIKA CVIČENÍ Č. 7
4ST201 STATISTIKA CVIČENÍ Č. 7 testování hypotéz parametrické testy test hypotézy o střední hodnotě test hypotézy o relativní četnosti test o shodě středních hodnot testování hypotéz v MS Excel neparametrické
You created this PDF from an application that is not licensed to print to novapdf printer (http://www.novapdf.com)
Testování statistických hypotéz Testování statistických hypotéz Princip: Ověřování určitého předpokladu zjišťujeme, zda zkoumaný výběr pochází ze základního souboru, který má určité rozdělení zjišťujeme,
STATISTICKÉ ODHADY Odhady populačních charakteristik
STATISTICKÉ ODHADY Odhady populačních charakteristik Jak stanovit charakteristiky rozložení sledované veličiny v základní populaci? Populaci většinou nemáme celou k dispozici, musíme se spokojit jen s
Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně
Testování hypotéz Nechť,, je náhodný výběr z nějakého rozdělení s neznámými parametry. Máme dvě navzájem si odporující hypotézy o parametrech daného rozdělení: Nulová hypotéza parametry (případně jediný
Charakteristika datového souboru
Zápočtová práce z předmětu Statistika Vypracoval: 10. 11. 2014 Charakteristika datového souboru Zadání: Při kontrole dodržování hygienických norem v kuchyni se prováděl odběr vzduchu a pomocí filtru Pallflex
Cvičení ze statistiky - 8. Filip Děchtěrenko
Cvičení ze statistiky - 8 Filip Děchtěrenko Minule bylo.. Dobrali jsme normální rozdělení Tyhle termíny by měly být známé: Centrální limitní věta Laplaceho věta (+ korekce na spojitost) Konfidenční intervaly
TECHNICKÁ UNIVERZITA V LIBERCI
TECHNICKÁ UNIVERZITA V LIBERCI Ekonomická fakulta Semestrální práce z předmětu Statistický rozbor dat z dotazníkového šetření Jméno: Lucie Krechlerová, Karel Kozma, René Dubský, David Drobík Ročník: 2015/2016
VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky SMAD
VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky JMÉNO STUDENTKY/STUDENTA: OSOBNÍ ČÍSLO: JMÉNO CVIČÍCÍ/CVIČÍCÍHO: SMAD Cvičení Ostrava, AR 2016/2017 Popis datového souboru Pro dlouhodobý
Projekt z předmětu Statistika
Projekt z předmětu Téma: Typologie hráče české nejvyšší hokejové soutěže VŠB-TU Ostrava:Fakulta Elektrotechniky a informatiky jaro 2011 Martin Dočkal doc068 dockal.martin@gmail.com 1 Obsah 2 Zadání...
Program Statistica Base 9. Mgr. Karla Hrbáčková, Ph.D.
Program Statistica Base 9 Mgr. Karla Hrbáčková, Ph.D. OBSAH KURZU obsluha jednotlivých nástrojů, funkce pro import dat z jiných aplikací, práce s popisnou statistikou, vytváření grafů, analýza dat, výstupní
Cvičení ze statistiky - 9. Filip Děchtěrenko
Cvičení ze statistiky - 9 Filip Děchtěrenko Minule bylo.. Dobrali jsme normální rozdělení Tyhle termíny by měly být známé: Inferenční statistika Konfidenční intervaly Z-test Postup při testování hypotéz
Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012. Tutoriál č. 4: Exploratorní analýza. Jan Kracík
Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012 Tutoriál č. 4: Exploratorní analýza Jan Kracík jan.kracik@vsb.cz Statistika věda o získávání znalostí z empirických dat empirická
Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test
Testování hypotéz 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test Testování hypotéz proces, kterým rozhodujeme, zda přijmeme nebo zamítneme nulovou hypotézu
t-test, Studentův párový test Ing. Michael Rost, Ph.D.
Testování hypotéz: dvouvýběrový t-test, Studentův párový test Ing. Michael Rost, Ph.D. Úvod do problému... Již známe jednovýběrový t-test, při kterém jsme měli k dispozici pouze jeden výběr. Můžeme se
NEPARAMETRICKÉ TESTY
NEPARAMETRICKÉ TESTY Neparametrický jednovýběrový Jeden výběr jehož medián srovnáváme s nějakou hodnotou Wilcoxonův jednovýběrový test 1) Máme data z družice Hipparcos pro deklinaci (obdoba zeměpisné šířky)
TECHNICKÁ UNIVERZITA V LIBERCI
TECHNICKÁ UNIVERZITA V LIBERCI Ekonomická fakulta SEMESTRÁLNÍ PRÁCE STATISTICKÝ ROZBOR DAT Z DOTAZNÍKOVÉHO ŠETŘENÍ ANALÝZA VÝSLEDKŮ VYUŢITÍ PROJEKTOVÉHO ŘÍZENÍ V ESN Příjmení a jméno: Hrdá Sabina, Kovalčíková
Úvod do statistické metodologie
Přenos jakékoli části této prezentace mimo účastníky semináře je zakázán bez písemné dohody se StatSoft CR s.r.o. (Dell Software Group). Úvod do statistické metodologie 1. lékařská fakulta Univerzity Karlovy
Statistika, Biostatistika pro kombinované studium. Jan Kracík
Statistika, Biostatistika pro kombinované studium Letní semestr 2014/2015 Tutoriál č. 6: ANOVA Jan Kracík jan.kracik@vsb.cz Obsah: Testování hypotéz opakování ANOVA Testování hypotéz (opakování) Testování
Pravděpodobnost a aplikovaná statistika
Pravděpodobnost a aplikovaná statistika MGR. JANA SEKNIČKOVÁ, PH.D. 8. KAPITOLA STATISTICKÉ TESTOVÁNÍ HYPOTÉZ 22.11.2016 Opakování: CLV příklad 1 Zadání: Před volbami je v populaci státu 52 % příznivců
Stručný úvod do vybraných zredukovaných základů statistické analýzy dat
Stručný úvod do vybraných zredukovaných základů statistické analýzy dat Statistika nuda je, má však cenné údaje. Neklesejme na mysli, ona nám to vyčíslí. Z pohádky Princové jsou na draka Populace (základní
1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.
Testy hypotéz na základě více než 2 výběrů 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Testy hypotéz na základě více než 2 výběrů Na analýzu rozptylu lze pohlížet v podstatě
Testy nezávislosti kardinálních veličin
Testy nezávislosti kardinálních veličin Komentované řešení pomocí programu R Ústav matematiky Fakulta chemicko inženýrská Vysoká škola chemicko-technologická v Praze Načtení vstupních dat Vstupní data
POPISNÁ STATISTIKA Komentované řešení pomocí programu Statistica
POPISNÁ STATISTIKA Komentované řešení pomocí programu Statistica Program Statistica I Statistica je velmi podobná Excelu. Na základní úrovni je to klikací program určený ke statistickému zpracování dat.
VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky
VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky PRAVDĚPODOBNOST A STATISTIKA Zadání 1 JMÉNO STUDENTKY/STUDENTA: OSOBNÍ ČÍSLO: JMÉNO CVIČÍCÍ/CVIČÍCÍHO: DATUM ODEVZDÁNÍ DOMÁCÍ ÚKOL
Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace
Intervalové odhady Interval spolehlivosti pro střední hodnotu v Nµ, σ 2 ) Situace: X 1,..., X n náhodný výběr z Nµ, σ 2 ), kde σ 2 > 0 známe měli jsme: bodové odhady odhadem charakteristiky je číslo) nevyjadřuje
1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.
Testování hypotéz na základě jednoho a dvou výběrů 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/004. Testování hypotéz Pokud nás zajímá zda platí, či neplatí tvrzení o určitém parametru,
Jana Vránová, 3.lékařská fakulta UK, Praha. Hypotézy o populacích
Jana Vránová, 3.lékařská fakulta UK, Praha Hypotézy o populacích Příklad IQ test: Předpokládejme, že z nějakého důvodu ministerstvo školství věří, že studenti absolventi středních škol v Hradci Králové
A 4 9 18 24 26 B 1 5 10 11 16 C 2 3 8 13 15 17 19 22 23 25 D 6 7 12 14 20 21
Příklad 1 Soutěž o nelepší akost výrobků obeslali čtyři výrobci A, B, C, D celkem 26 výrobky. Porota sestavila toto pořadí (uveden pouze původ výrobku od nelepšího k nehoršímu): Pořadí 1 2 3 4 5 6 7 8
VYBRANÉ DVOUVÝBĚROVÉ TESTY. Martina Litschmannová
VYBRANÉ DVOUVÝBĚROVÉ TESTY Martina Litschmannová Obsah přednášky Vybrané dvouvýběrové testy par. hypotéz test o shodě rozptylů (F-test), testy o shodě středních hodnot (t-test, Aspinové-Welchův test),
Stav Svobodný Rozvedený Vdovec. Svobodná 37 10 6. Rozvedená 8 12 8. Vdova 5 8 6
1. Příklad Byly sledovány rodinné stavy nevěst a ženichů při uzavírání sňatků a byla vytvořena následující tabulka četností. Stav Svobodný Rozvedený Vdovec Svobodná 37 10 6 Rozvedená 8 12 8 Vdova 5 8 6
Korelace. Komentované řešení pomocí MS Excel
Korelace Komentované řešení pomocí MS Excel Vstupní data Tabulka se vstupními daty je umístěna v oblasti A2:B84 (viz. obrázek) Prvotní představu o tvaru a síle závislosti docházky a počtu bodů nám poskytne
Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace
Intervalové odhady Interval spolehlivosti pro střední hodnotu v Nµ, σ 2 ) Situace: X 1,..., X n náhodný výběr z Nµ, σ 2 ), kde σ 2 > 0 známe měli jsme: bodové odhady odhadem charakteristiky je číslo) nevyjadřuje
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 010 1.týden (0.09.-4.09. ) Data, typy dat, variabilita, frekvenční analýza
Technická univerzita v Liberci
Technická univerzita v Liberci Ekonomická fakulta Analýza výsledků z dotazníkového šetření Jména studentů: Adam Pavlíček Michal Karlas Tomáš Vávra Anna Votavová Ročník: 2015/2016 Datum odevzdání: 13/05/2016
Zápočtová práce STATISTIKA I
Zápočtová práce STATISTIKA I Obsah: - úvodní stránka - charakteristika dat (původ dat, důvod zpracování,...) - výpis naměřených hodnot (v tabulce) - zpracování dat (buď bodové nebo intervalové, podle charakteru
Popisná statistika. Komentované řešení pomocí MS Excel
Popisná statistika Komentované řešení pomocí MS Excel Vstupní data Máme k dispozici data o počtech bodů z 1. a 2. zápočtového testu z Matematiky I v zimním semestru 2015/2016 a to za všech 762 studentů,
Analýza dat na PC I.
CENTRUM BIOSTATISTIKY A ANALÝZ Lékařská a Přírodovědecká fakulta, Masarykova univerzita Analýza dat na PC I. Popisná analýza v programu Statistica IBA výuka Základní popisná statistika Popisná statistika
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická
Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry
Testování hypotéz Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry Testování hypotéz Obecný postup 1. Určení statistické hypotézy 2. Určení hladiny chyby 3. Výpočet
STATISTICKÉ TESTY VÝZNAMNOSTI
STATISTICKÉ TESTY VÝZNAMNOSTI jsou statistické postupy, pomocí nichž ověřujeme, zda mezi proměnnými existuje vztah (závislost, rozdíl). Pokud je výsledek šetření statisticky významný (signifikantní), znamená
Statistické vyhodnocení průzkumu funkční gramotnosti žáků 4. ročníku ZŠ
Statistické vyhodnocení průzkumu funkční gramotnosti žáků 4. ročníku ZŠ Ing. Dana Trávníčková, PaedDr. Jana Isteníková Funkční gramotnost je používání čtení a psaní v životních situacích. Nejde jen o elementární
Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.
Pravděpodobnost a statistika, Biostatistika pro kombinované studium Letní semestr 2015/2016 Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz Jan Kracík jan.kracik@vsb.cz Obsah: Výběrová rozdělení
Jednovýběrový Wilcoxonův test a jeho asymptotická varianta (neparametrická obdoba jednovýběrového t-testu)
Jednovýběrový Wilcoxonův test a jeho asymptotická varianta (neparametrická obdoba jednovýběrového t-testu) Frank Wilcoxon (1892 1965): Americký statistik a chemik Nechť X 1,..., X n je náhodný výběr ze
Pearsonův korelační koeficient
I I.I Pearsonův korelační koeficient Úvod Předpokládejme, že náhodně vybereme n objektů (nebo osob) ze zkoumané populace. Často se stává, že na každém z objektů měříme ne pouze jednu, ale několik kvantitativních
Dvouvýběrové a párové testy. Komentované řešení pomocí MS Excel
Dvouvýběrové a párové testy Komentované řešení pomocí MS Excel Úloha A) koncentrace glukózy v krvi V této části posoudíme pomocí párového testu, zda nový lék prokazatelně snižuje koncentraci glukózy v
Předpoklad o normalitě rozdělení je zamítnut, protože hodnota testovacího kritéria χ exp je vyšší než tabulkový 2
Na úloze ukážeme postup analýzy velkého výběru s odlehlými prvky pro určení typu rozdělení koncentrace kyseliny močové u 50 dárců krve. Jaká je míra polohy a rozptýlení uvedeného výběru? Z grafických diagnostik
TEST Z TEORIE EXPLORAČNÍ ANALÝZA DAT
EXPLORAČNÍ ANALÝZA DAT TEST Z TEORIE 1. Test ze Statistiky píše velké množství studentů. Představte si, že každý z nich odpoví správně přesně na polovinu otázek. V tomto případě bude směrodatná odchylka
Statistické metody - nástroj poznání a rozhodování anebo zdroj omylů a lží
Statistické metody - nástroj poznání a rozhodování anebo zdroj omylů a lží Zdeněk Karpíšek Jsou tři druhy lží: lži, odsouzeníhodné lži a statistiky. Statistika je logická a přesná metoda, jak nepřesně
Kategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1
Kategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA 2018 4. dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1 Typy proměnných nominální (nominal) o dvou hodnotách lze říci pouze
Nejčastější chyby v explorační analýze
Nejčastější chyby v explorační analýze Obecně doporučuju přečíst přednášku 5: Výběrová šetření, Exploratorní analýza http://homel.vsb.cz/~lit40/sta1/materialy/io.pptx Použití nesprávných charakteristik
Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci
Zpracování dat v edukačních vědách - Testování hypotéz Kamila Fačevicová Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci Obsah seminářů 5.11. Úvod do matematické
PRAVDĚPODOBNOST A STATISTIKA
PRAVDĚPODOBNOST A STATISTIKA Testování hypotéz Nechť X je náhodná proměnná, která má distribuční funkci F(x, ϑ). Předpokládejme, že známe tvar distribuční funkce (víme jaké má rozdělení) a neznáme parametr
SEMESTRÁLNÍ PRÁCE STATISTIKA
SEMESTRÁLNÍ PRÁCE STATISTIKA 2012/2013 ZÝKOVÁ LUCIE 2 39 DUFEK JAKUB 1 Pro semestrální práci z předmětu Statistika jsme si naměřili intenzitu a směr aut v křižovatce Ke Krči x Jiskrova. Měření proběhlo
SOFTWARE STAT1 A R. Literatura 4. kontrolní skupině (viz obr. 4). Proto budeme testovat shodu středních hodnot µ 1 = µ 2 proti alternativní
ŘEŠENÍ PRAKTICKÝCH ÚLOH UŽITÍM SOFTWARE STAT1 A R Obsah 1 Užití software STAT1 1 2 Užití software R 3 Literatura 4 Příklady k procvičení 6 1 Užití software STAT1 Praktické užití aplikace STAT1 si ukažme
Úvod do analýzy rozptylu
Úvod do analýzy rozptylu Párovým t-testem se podařilo prokázat, že úprava režimu stravování a fyzické aktivity ve vybrané škole měla vliv na zlepšené hodnoty HDLcholesterolu u školáků. Pro otestování jsme
Návod na vypracování semestrálního projektu
Návod na vypracování semestrálního projektu Následující dokument má charakter doporučení. Není závazný, je pouze návodem pro studenty, kteří si nejsou jisti výběrem dat, volbou metod a formou zpracování
Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II
Základy biostatistiky II Veřejné zdravotnictví 3.LF UK - II Teoretické rozložení-matematické modely rozložení Naměřená data Výběrové rozložení Teoretické rozložení 1 e 2 x 2 Teoretické rozložení-matematické
Ing. Michael Rost, Ph.D.
Úvod do testování hypotéz, jednovýběrový t-test Ing. Michael Rost, Ph.D. Testovaná hypotéza Pokud nás zajímá zda platí, či neplatí tvrzení o určitém parametru, např. o parametru Θ, pak takovéto tvrzení
Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D.
Zpracování náhodného výběru popisná statistika Ing. Michal Dorda, Ph.D. Základní pojmy Úkolem statistiky je na základě vlastností výběrového souboru usuzovat o vlastnostech celé populace. Populace(základní
Testování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času
Testování hypotéz 1 Jednovýběrové testy 90/ odhad času V podmínkách naprostého odloučení má voák prokázat schopnost orientace v čase. Úkolem voáka e provést odhad časového intervalu 1 hodiny bez hodinek
Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry
Testování hypotéz Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry Testování hypotéz Obecný postup 1. Určení statistické hypotézy 2. Určení hladiny chyby 3. Výpočet
TECHNICKÁ UNIVERZITA V LIBERCI
TECHNICKÁ UNIVERZITA V LIBERCI Ekonomická fakulta Semestrální práce STATISTICKÝ ROZBOR DAT Z DOTAZNÍKOVÉHO ŠETŘENÍ Vypracovaly: Renata Němcová, Andrea Zuzánková, Lenka Vítová, Michaela Ťukalová, Kristýna
TECHNICKÁ UNIVERZITA V LIBERCI. Ekonomická fakulta. Semestrální práce. Statistický rozbor dat z dotazníkového šetření školní zadání
TECHNICKÁ UNIVERZITA V LIBERCI Ekonomická fakulta Semestrální práce Statistický rozbor dat z dotazníkového šetření školní zadání Skupina: 51 Vypracovaly: Pavlína Horná, Nikola Loumová, Petra Mikešová,
SEMESTRÁLNÍ PRÁCE. Leptání plasmou. Ing. Pavel Bouchalík
SEMESTRÁLNÍ PRÁCE Leptání plasmou Ing. Pavel Bouchalík 1. ÚVOD Tato semestrální práce obsahuje písemné vypracování řešení příkladu Leptání plasmou. Jde o praktickou zkoušku znalostí získaných při přednáškách
Cvičení 12: Binární logistická regrese
Cvičení 12: Binární logistická regrese Příklad: V roce 2014 konalo státní závěrečné zkoušky bakalářského studia na jisté fakultě 167 studentů. U každého studenta bylo zaznamenáno jeho pohlaví (0 žena,
Metodologie pro Informační studia a knihovnictví 2
Metodologie pro Informační studia a knihovnictví 2 Modul 9: Úvod do induktivní statistiky Obsah Induktivní statistika... 2 Kdy můžeme zobecňovat?... 2 Logika statistické indukce... 3 Proč nelze jednoduše
Charakteristiky kategoriálních veličin. Absolutní četnosti (FREQUENCY)
Charakteristiky kategoriálních veličin Absolutní četnosti (FREQUENCY) Charakteristiky kategoriálních veličin Relativní četnosti Charakteristiky kategoriálních veličin Relativní četnosti Charakteristiky
ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE
ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE FAKULTA DOPRAVNÍ ÚSTAV APLIKOVANÉ MATEMATIKY STATISTIKA Průzkum skladby cestujících v městské hromadné dopravě a jejich preferencích při volbě dopravního prostředku