VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky SMAD

Podobné dokumenty
VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky

VŠB Technická univerzita Ostrava BIOSTATISTIKA

VŠB Technická univerzita Ostrava

VŠB Technická univerzita Ostrava BIOSTATISTIKA

VŠB Technická univerzita Ostrava

Zaokrouhlování: Směrodatná odchylka se zaokrouhluje nahoru na stanovený počet platných cifer. Míry

Zápočtová práce STATISTIKA I

Pracovní adresář. Nápověda. Instalování a načtení nového balíčku. Importování datového souboru. Práce s datovým souborem

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM

Kurz Biostatistiky pro zaměstnance FNO

Průzkumová analýza dat

Předpoklad o normalitě rozdělení je zamítnut, protože hodnota testovacího kritéria χ exp je vyšší než tabulkový 2

Charakteristika datového souboru

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

Semestrální projekt spočívá v nalezení vhodného datového souboru a jeho statistické analýze s využitím metod probíraných v rámci předmětu.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

VYBRANÉ DVOUVÝBĚROVÉ TESTY. Martina Litschmannová

Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012. Tutoriál č. 4: Exploratorní analýza. Jan Kracík

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Kvantily a písmenové hodnoty E E E E-02

Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie STATISTICKÉ ZPRACOVÁNÍ EXPERIMENTÁLNÍCH DAT

Manuál pro zaokrouhlování

TEST Z TEORIE EXPLORAČNÍ ANALÝZA DAT

Matematika III. 27. listopadu Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

Metodologie pro ISK II

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

, Brno Hanuš Vavrčík Základy statistiky ve vědě

Návod na vypracování semestrálního projektu

Název testu Předpoklady testu Testová statistika Nulové rozdělení. ( ) (p počet odhadovaných parametrů)

UNIVERZITA PARDUBICE

Tabulka 1. Výběr z datové tabulky

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ. FAKULTA STROJNÍHO INŽENÝRSTVÍ Ústav materiálového inženýrství - odbor slévárenství

POPISNÁ STATISTIKA Komentované řešení pomocí programu Statistica

Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D.

STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky)

PRŮZKUMOVÁ ANALÝZA JEDNOROZMĚRNÝCH DAT Exploratory Data Analysis (EDA)

Vysoká škola báňská technická univerzita Ostrava. Fakulta elektrotechniky a informatiky

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Návrhy dalších možností statistického zpracování aktualizovaných dat

Korelační a regresní analýza

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Porovnání dvou výběrů

Vzorová prezentace do předmětu Statistika

Statistická analýza. jednorozměrných dat

S E M E S T R Á L N Í

TECHNICKÁ UNIVERZITA V LIBERCI SEMESTRÁLNÍ PRÁCE

KORELACE. Komentované řešení pomocí programu Statistica

Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D.

Přednáška 9. Testy dobré shody. Grafická analýza pro ověření shody empirického a teoretického rozdělení

MATEMATIKA III V PŘÍKLADECH

Jarqueův a Beryho test normality (Jarque-Bera Test, JB test)

Statistika s Excelem aneb Máme data. A co dál? Martina Litschmannová Katedra aplikované matematiky, FEI, VŠB-TU Ostrava

Odhady parametrů základního souboru. Cvičení 6 Statistické metody a zpracování dat 1 (podzim 2016) Brno, říjen listopad 2016 Ambrožová Klára

Analýza dat s využitím MS Excel

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

Testování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času

Nejčastější chyby v explorační analýze

Testování statistických hypotéz

Dvouvýběrové a párové testy. Komentované řešení pomocí MS Excel

Statistická analýza jednorozměrných dat

Úloha E301 Čistota vody v řece testem BSK 5 ( Statistická analýza jednorozměrných dat )

Grafický a číselný popis rozložení dat 3.1 Způsoby zobrazení dat Metody zobrazení kvalitativních a ordinálních dat Metody zobrazení kvan

Pravděpodobnost a aplikovaná statistika

Statistika. Diskrétní data. Spojitá data. Charakteristiky polohy. Charakteristiky variability

Jednofaktorová analýza rozptylu

Tomáš Karel LS 2012/2013

Tématické okruhy pro státní závěrečné zkoušky. bakalářské studium. studijní obor "Management jakosti"

Národníinformačnístředisko pro podporu jakosti

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina

Statgraphics v. 5.0 STATISTICKÁ INDUKCE PRO JEDNOROZMĚRNÁ DATA. Martina Litschmannová 1. Typ proměnné. Požadovaný typ analýzy

Cvičení 12: Binární logistická regrese

Testy statistických hypotéz

Úvodem Dříve les než stromy 3 Operace s maticemi

Náhodná proměnná. Náhodná proměnná může mít rozdělení diskrétní (x 1. , x 2. ; x 2. spojité (<x 1

UNIVERZITA PARDUBICE CHEMICKO-TECHNOLOGICKÁ FAKULTA KATEDRA ANALYTICKÉ CHEMIE

Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu

Statistické vyhodnocování ankety pilotního projektu Kvalita výuky na Západočeské univerzitě v Plzni

Tématické okruhy pro státní závěrečné zkoušky. bakalářské studium. studijní obor "Management jakosti"

Základy pravděpodobnosti a statistiky. Popisná statistika

ZÁKLADNÍ STATISTICKÉ CHARAKTERISTIKY

DVOUVÝBĚROVÉ A PÁROVÉ TESTY Komentované řešení pomocí programu Statistica

You created this PDF from an application that is not licensed to print to novapdf printer (

Stručný úvod do testování statistických hypotéz

Úvod do kurzu. Moodle kurz. (a) (b) heslo pro hosty: statistika (c) skripta na pravděpodobnost

Přednáška 9. Testy dobré shody. Grafická analýza pro ověření shody empirického a teoretického rozdělení

Test z teorie VÝBĚROVÉ CHARAKTERISTIKY A INTERVALOVÉ ODHADY

Úloha č. 2 - Kvantil a typická hodnota. (bodově tříděná data): (intervalově tříděná data): Zadání úlohy: Zadání úlohy:

Analýza dat na PC I.

MATEMATIKA III V PŘÍKLADECH

a) Základní informace o souboru Statistika: Základní statistika a tabulky: Popisné statistiky: Detaily

ANALÝZA DAT V R 3. POPISNÉ STATISTIKY, NÁHODNÁ VELIČINA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK

4. Zpracování číselných dat

Statistika pro geografy

Statistika, Biostatistika pro kombinované studium. Jan Kracík

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Tématické okruhy pro státní závěrečné zkoušky. bakalářské studium. studijní obor "Management jakosti"

Transkript:

VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky JMÉNO STUDENTKY/STUDENTA: OSOBNÍ ČÍSLO: JMÉNO CVIČÍCÍ/CVIČÍCÍHO: SMAD Cvičení Ostrava, AR 2016/2017

Popis datového souboru Pro dlouhodobý test tužkových NiMH akumulátorů od čtyř různých výrobců (A, B, C, D) bylo od každého výrobce pořízeno 100 akumulátorů. Všechny akumulátory měly deklarovanou kapacitu 2000 mah. Kapacita každého akumulátoru byla změřena nejprve po 5 nabíjecích cyklech a následně po 100 nabíjecích cyklech. V souboru akumulátory.xlsx jsou pro každý z akumulátorů uvedeny následující údaje: číslo akumulátoru, výrobce (A, B, C, D), změřená kapacita po 5 nabíjecích cyklech a změřená kapacita po 100 nabíjecích cyklech. Obecné pokyny: Úkoly zpracujte dle obecně známých typografických pravidel. Všechny tabulky i obrázky musí být opatřeny titulkem. Do úkolů nevkládejte tabulky a obrázky, na něž se v doprovodném textu nebudete odkazovat. Bude-li to potřeba, citujte zdroje dle mezinárodně platné citační normy ČSN ISO 690. 1

Úkol 1 a) Pomocí nástrojů explorační analýzy analyzujte kapacity akumulátorů výrobce A po 5 a po 100 nabíjecích cyklech. Data vhodně graficky prezentujte (krabicový graf, histogram, q-q graf) a doplňte následující tabulky a text. Kapacita akumulátorů, výrobce A Po odstranění odlehlých pozorování po 5 cyklech po 100 cyklech po 5 cyklech po 100 cyklech rozsah souboru Míry polohy minimum dolní kvartil medián průměr horní kvartil maximum Míry variability směrodatná odchylka variační koeficient (%) Míry šikmosti a špičatosti šikmost špičatost Identifikace odlehlých pozorování vnitřní hradby dolní mez horní mez 2

Grafická prezentace (krabicový graf, histogram, q-q graf): 3

Analýza kapacity akumulátorů výrobce A po 5 nabíjecích cyklech Během testu byla měřena kapacita... kusů akumulátorů výrobce A. Naměřená kapacita po 5 nabíjecích cyklech se pohybovala v rozmezí.. až. mah. Kapacity... byly identifikovány jako odlehlá pozorování a nebudou zahrnuty do dalšího zpracování. Možné příčiny vzniku odlehlých pozorování jsou:... / Žádné z měření nebylo identifikováno jako odlehlé pozorování. Dále uvedené výsledky tedy pocházejí z analýzy kapacit kusů akumulátorů. Jejich průměrná kapacita byla.. mah, směrodatná odchylka pak.. mah. U poloviny testovaných akumulátorů kapacita nepřekročila.. mah. V polovině měření se kapacita pohybovala v rozmezí až... mah. Vzhledem k hodnotě variačního koeficientu (.%) lze / nelze analyzovaný soubor považovat za homogenní. Analýza kapacity akumulátorů výrobce A po 100 nabíjecích cyklech Během testu byla měřena kapacita... kusů akumulátorů výrobce A. Naměřená kapacita po 100 nabíjecích cyklech se pohybovala v rozmezí.. až. mah. Kapacity... byly identifikovány jako odlehlá pozorování a nebudou zahrnuty do dalšího zpracování. Možné příčiny vzniku odlehlých pozorování jsou:... / Žádné z měření nebylo identifikováno jako odlehlé pozorování. Dále uvedené výsledky tedy pocházejí z analýzy kapacit kusů akumulátorů. Jejich průměrná kapacita byla.. mah, směrodatná odchylka pak.. mah. U poloviny testovaných akumulátorů kapacita nepřekročila.. mah. V polovině měření se kapacita pohybovala v rozmezí až... mah. Vzhledem k hodnotě variačního koeficientu (.%) lze / nelze analyzovaný soubor považovat za homogenní. Ověření normality kapacity akumulátorů výrobce A po 5 nabíjecích cyklech na základě explorační analýzy Na základě grafického zobrazení (viz..) a výběrové šikmosti a špičatosti (výběrová šikmost i špičatost leží / neleží v intervalu ( 2; 2)) lze / nelze předpokládat, že kapacita akumulátorů výrobce A po 5 nabíjecích cyklech má normální rozdělení. Dle pravidla 3σ / Čebyševovy nerovnosti lze tedy očekávat, že přibližně 95 % / více než 75 % akumulátorů bude mít kapacitu v rozmezí. až.. mah. Ověření normality kapacity akumulátorů výrobce A po 100 nabíjecích cyklech na základě explorační analýzy Na základě grafického zobrazení (viz..) a výběrové šikmosti a špičatosti (výběrová šikmost i špičatost leží / neleží v intervalu ( 2; 2)) lze / nelze předpokládat, že kapacita akumulátorů výrobce A po 100 nabíjecích cyklech má normální rozdělení. Dle pravidla 3σ / Čebyševovy nerovnosti lze tedy očekávat, že přibližně 95 % / více než 75 % akumulátorů bude mít kapacitu v rozmezí.. až.. mah. 4

Úkol 2 Porovnejte poklesy kapacit akumulátorů výrobců A a B po 100 nabíjecích cyklech. Nezapomeňte, že použité metody mohou vyžadovat splnění určitých předpokladů. Pokud tomu tak bude, okomentujte splnění/nesplnění těchto předpokladů jak na základě explorační analýzy (např. s odkazem na histogram apod.), tak exaktně pomocí metod statistické indukce. a) Graficky prezentujte srovnání poklesů kapacit akumulátorů výrobců A a B po 100 nabíjecích cyklech (vícenásobný krabicový graf, histogramy, q-q grafy). b) Určete bodové a 95% intervalové odhady pro střední hodnoty poklesu kapacit po 100 nabíjecích cyklech pro akumulátory výrobců A i B. 5

c) Na hladině významnosti 5 % rozhodněte, zda jsou poklesy kapacit akumulátorů výrobců A a B statisticky významné. d) Určete bodový a 95% intervalový odhad rozdílu středních hodnot poklesů kapacit akumulátorů (po 100 cyklech) výrobců A a B. e) Na hladině významnosti 5% rozhodněte, zda je rozdíl středních hodnot poklesů kapacit akumulátorů (po 100 cyklech) výrobců A a B statisticky významný. 6

Úkol 3 Na hladině významnosti 5 % rozhodněte, zda se kapacity akumulátorů po 100 nabíjecích cyklech liší v závislosti na tom, od kterého výrobce pocházejí. Posouzení proveďte nejprve na základě explorační analýzy a následně pomocí vhodného statistického testu včetně ověření potřebných předpokladů. V případě, že se kapacity statisticky významně liší, určete, čí akumulátory se odlišují od ostatních. a) Daný problém vhodným způsobem graficky prezentujte (vícenásobný krabicový graf, histogramy, q-q grafy). b) Ověřte normalitu kapacit akumulátorů po 100 nabíjecích cyklech všech čtyř výrobců (empiricky i exaktně). c) Ověřte homoskedasticitu (shodu rozptylů) kapacit akumulátorů po 100 nabíjecích cyklech všech čtyř výrobců (empiricky i exaktně). 7

d) Určete bodové a 95% intervalové odhady střední hodnoty (resp. mediánu) kapacit akumulátorů po 100 nabíjecích cyklech pro všechny srovnávané výrobce. (Nezapomeňte na ověření předpokladů pro použití příslušných intervalových odhadů.) e) Čistým testem významnosti ověřte, zda je pozorovaný rozdíl středních hodnot (resp. mediánů) kapacit akumulátorů po 100 nabíjecích cyklech a všech výrobců statisticky významný na hladině významnosti 5%. Pokud ano, zjistěte, zda lze některé skupiny výrobců označit (z hlediska kapacit akumulátorů po 100 cyklech) za homogenní. (Nezapomeňte na ověření předpokladů pro použití zvoleného testu.) 8

Úkol 4 U každého z akumulátorů zjistěte, zda kapacita po 100 nabíjecích cyklech poklesla o více než 10 % původní kapacity (po 5 cyklech). (Definujte si novou dichotomickou proměnnou, která bude nabývat hodnot {ANO, NE}.) a) Srovnejte četnosti poklesu kapacity akumulátorů o více než 10% pro výrobce A, B, C, D. Výsledky prezentujte pomocí kontingenční tabulky, vhodného grafu a vhodné míry kontingence. b) Určete bodový i 95% intervalový odhad pravděpodobnosti poklesu kapacity akumulátorů o více než 10% pro výrobce B. c) Určete bodový i 95% intervalový odhad relativního rizika poklesu kapacity akumulátoru o více než 10% pro nejhoršího výrobce (vzhledem k nejlepšímu výrobci). Výsledky slovně interpretujte. 9

d) Určete bodový i 95% intervalový odhad poměru šancí poklesu kapacity akumulátoru o více než 10% pro nejhoršího výrobce (vzhledem k nejlepšímu výrobci). Výsledky slovně interpretujte. e) Pomocí chí-kvadrát testu nezávislosti rozhodněte, jestli pravděpodobnost poklesu kapacity o více než 10 % závisí statisticky významně na tom, od kterého výrobce akumulátor pochází. 10

Jak identifikovat, zda jsou v datech odlehlá pozorování? Emiprické posouzení: použití vnitřních (vnějších) hradeb, resp. z souřadnice, resp. mediánová suřadnice, vizuální posouzení krabicového grafu. Exaktní posouzení: Grubbsův test (parametrický test - vyžaduje normalitu dat) Deanův - Dixonův test (neparametrický test) Jak naložit s odlehlými hodnotami by měl definovat hlavně zadavatel analýzy (expert na danou problematiku). Jak ověřit normalitu dat? Emiprické posouzení: vizuální posouzení histogramu, vizuální posouzení grafu odhadu hustoty pravděpodobnosti, Q-Q graf, P-P graf, posouzení výběrové šikmosti a výběrové špičatosti. Exaktní posouzení: testy normality (např. Shapirův Wilkův test, Andersonův-Darlingův test, Lillieforsův test, ) Jak ověřit homoskedasticitu (shodu rozptylů)? Emiprické posouzení: poměr největší a nejmenší směrodatné odchylky, vizuální posouzení krabicového grafu. Exaktní posouzení: F test (parametrický dvouvýběrový test), Bartlettův test (parametrický vícevýběrový test), Leveneův test (neparametrický test). 11