VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky

Podobné dokumenty
VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky SMAD

VŠB Technická univerzita Ostrava BIOSTATISTIKA

VŠB Technická univerzita Ostrava

VŠB Technická univerzita Ostrava BIOSTATISTIKA

VŠB Technická univerzita Ostrava

Zaokrouhlování: Směrodatná odchylka se zaokrouhluje nahoru na stanovený počet platných cifer. Míry

Zápočtová práce STATISTIKA I

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM

Pracovní adresář. Nápověda. Instalování a načtení nového balíčku. Importování datového souboru. Práce s datovým souborem

Průzkumová analýza dat

Předpoklad o normalitě rozdělení je zamítnut, protože hodnota testovacího kritéria χ exp je vyšší než tabulkový 2

Kurz Biostatistiky pro zaměstnance FNO

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

Charakteristika datového souboru

Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie STATISTICKÉ ZPRACOVÁNÍ EXPERIMENTÁLNÍCH DAT

S E M E S T R Á L N Í

Semestrální projekt spočívá v nalezení vhodného datového souboru a jeho statistické analýze s využitím metod probíraných v rámci předmětu.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

VYBRANÉ DVOUVÝBĚROVÉ TESTY. Martina Litschmannová

Kvantily a písmenové hodnoty E E E E-02

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice

PRŮZKUMOVÁ ANALÝZA JEDNOROZMĚRNÝCH DAT Exploratory Data Analysis (EDA)

Manuál pro zaokrouhlování

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012. Tutoriál č. 4: Exploratorní analýza. Jan Kracík

, Brno Hanuš Vavrčík Základy statistiky ve vědě

Korelační a regresní analýza

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ. FAKULTA STROJNÍHO INŽENÝRSTVÍ Ústav materiálového inženýrství - odbor slévárenství

Tabulka 1. Výběr z datové tabulky

UNIVERZITA PARDUBICE

TEST Z TEORIE EXPLORAČNÍ ANALÝZA DAT

Návrhy dalších možností statistického zpracování aktualizovaných dat

Návod na vypracování semestrálního projektu

Název testu Předpoklady testu Testová statistika Nulové rozdělení. ( ) (p počet odhadovaných parametrů)

POPISNÁ STATISTIKA Komentované řešení pomocí programu Statistica

Vzorová prezentace do předmětu Statistika

STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky)

Metodologie pro ISK II

Vysoká škola báňská technická univerzita Ostrava. Fakulta elektrotechniky a informatiky

Porovnání dvou výběrů

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Jarqueův a Beryho test normality (Jarque-Bera Test, JB test)

Matematika III. 27. listopadu Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

Úloha E301 Čistota vody v řece testem BSK 5 ( Statistická analýza jednorozměrných dat )

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Statistická analýza. jednorozměrných dat

Testování statistických hypotéz

Statistika s Excelem aneb Máme data. A co dál? Martina Litschmannová Katedra aplikované matematiky, FEI, VŠB-TU Ostrava

KORELACE. Komentované řešení pomocí programu Statistica

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

MATEMATIKA III V PŘÍKLADECH

Pravděpodobnost a aplikovaná statistika

Statistická analýza jednorozměrných dat

Analýza dat s využitím MS Excel

Testování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času

TECHNICKÁ UNIVERZITA V LIBERCI SEMESTRÁLNÍ PRÁCE

Grafický a číselný popis rozložení dat 3.1 Způsoby zobrazení dat Metody zobrazení kvalitativních a ordinálních dat Metody zobrazení kvan

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina

DVOUVÝBĚROVÉ A PÁROVÉ TESTY Komentované řešení pomocí programu Statistica

Dvouvýběrové a párové testy. Komentované řešení pomocí MS Excel

Testy statistických hypotéz

Statgraphics v. 5.0 STATISTICKÁ INDUKCE PRO JEDNOROZMĚRNÁ DATA. Martina Litschmannová 1. Typ proměnné. Požadovaný typ analýzy

Statistika. Diskrétní data. Spojitá data. Charakteristiky polohy. Charakteristiky variability

Jednofaktorová analýza rozptylu

Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu

Přednáška 9. Testy dobré shody. Grafická analýza pro ověření shody empirického a teoretického rozdělení

UNIVERZITA PARDUBICE CHEMICKO-TECHNOLOGICKÁ FAKULTA KATEDRA ANALYTICKÉ CHEMIE

Úvod do kurzu. Moodle kurz. (a) (b) heslo pro hosty: statistika (c) skripta na pravděpodobnost

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Odhady parametrů základního souboru. Cvičení 6 Statistické metody a zpracování dat 1 (podzim 2016) Brno, říjen listopad 2016 Ambrožová Klára

Úvodem Dříve les než stromy 3 Operace s maticemi

Statistika, Biostatistika pro kombinované studium. Jan Kracík

Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D.

Stanovení manganu a míry přesnosti kalibrace ( Lineární kalibrace )

Nejčastější chyby v explorační analýze

Tématické okruhy pro státní závěrečné zkoušky. bakalářské studium. studijní obor "Management jakosti"

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Tématické okruhy pro státní závěrečné zkoušky. bakalářské studium. studijní obor "Management jakosti"

Národníinformačnístředisko pro podporu jakosti

Tomáš Karel LS 2012/2013

Základy pravděpodobnosti a statistiky. Popisná statistika

Test z teorie VÝBĚROVÉ CHARAKTERISTIKY A INTERVALOVÉ ODHADY

Cvičení 12: Binární logistická regrese

4. Zpracování číselných dat

Stručný úvod do testování statistických hypotéz

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D.

ZÁKLADNÍ STATISTICKÉ CHARAKTERISTIKY

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie. Nám. Čs. Legií 565, Pardubice. Semestrální práce ANOVA 2015

Neparametrické metody

Statistika pro geografy

Náhodná proměnná. Náhodná proměnná může mít rozdělení diskrétní (x 1. , x 2. ; x 2. spojité (<x 1

Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie ANOVA. Semestrální práce

P13: Statistické postupy vyhodnocování únavových zkoušek, aplikace normálního, Weibullova rozdělení, apod.

Statistické vyhodnocování ankety pilotního projektu Kvalita výuky na Západočeské univerzitě v Plzni

Analýza dat na PC I.

Statistická analýza jednorozměrných dat

Transkript:

VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky PRAVDĚPODOBNOST A STATISTIKA Zadání 1 JMÉNO STUDENTKY/STUDENTA: OSOBNÍ ČÍSLO: JMÉNO CVIČÍCÍ/CVIČÍCÍHO: DATUM ODEVZDÁNÍ DOMÁCÍ ÚKOL 1: DOMÁCÍ ÚKOL 2: DOMÁCÍ ÚKOL 3: DOMÁCÍ ÚKOL 4: CELKEM: --------------------- HODNOCENÍ Ostrava, AR 2016/2017

Popis datového souboru Pro srovnání kvality LED žárovek byl změřen světelný tok 100 LED žárovek s příkonem 15 W od pěti výrobců (V1,V2,V3,V4,V5). Všechny testované 15 W LED žárovky měly výrobcem garantovaný světelný tok 1 400 lumenů. Světelný tok byl změřen nejprve ihned po zakoupení žárovky a následně po 10 000 h provozu. V souboru zarovky_1.xlsx jsou pro každou LED žárovku uvedeny následující údaje: výrobce (V1,V2,V3,V4,V5), světelný tok LED žárovky změřený po zakoupení a po 10 000 h provozu. Poznámka Všude dále v tomto textu se žárovkou myslí 15 W LED žárovka. Světelný tok (někdy chybně uváděn jako svítivost) žárovky je udáván v lumenech (lm). Jedná se o údaj, který bývá uveden na obalech žárovek. Pro pochopení dané problematiky je možno použít např. odkaz: http://v-tac.cz/content/8-svitivost-svetelny-tok Obecné pokyny: Úkoly zpracujte dle obecně známých typografických pravidel. Všechny tabulky i obrázky musí být opatřeny titulkem. Do úkolů nevkládejte tabulky a obrázky, na něž se v doprovodném textu nebudete odkazovat. Bude-li to potřeba, citujte zdroje dle mezinárodně platné citační normy ČSN ISO 690. 1

Úkol 1 a) Pomocí nástrojů explorační analýzy analyzujte světelné toky LED žárovek od výrobce V1 po zakoupení žárovky a po 10 000 h provozu. Data vhodně graficky prezentujte (krabicový graf, histogram, q-q graf) a doplňte následující tabulky a text. Světelný tok žárovky, výrobce V1 Po odstranění odlehlých pozorování po zakoupení po 10 000 h po zakoupení po 10 000 h rozsah souboru Míry polohy minimum dolní kvartil medián průměr horní kvartil maximum Míry variability směrodatná odchylka variační koeficient (%) Míry šikmosti a špičatosti šikmost špičatost Identifikace odlehlých pozorování vnitřní hradby dolní mez horní mez 2

Grafická prezentace (krabicový graf, histogram, q-q graf): 3

Analýza světelného toku LED žárovek výrobce V1 změřená po zakoupení žárovky Během testu byl změřen světelný tok... kusů žárovek výrobce V1. Změřený světelný tok po zakoupení LED žárovky se pohyboval v rozmezí.. až. lm. Hodnoty světelného toku ležící mimo interval... až... lm (vnitřní hradby) byly identifikovány jako odlehlá pozorování a nebudou zahrnuty do dalšího zpracování. Možné příčiny vzniku odlehlých pozorování jsou:... / Žádné z měření nebylo identifikováno jako odlehlé pozorování. Dále uvedené výsledky tedy pocházejí z analýzy světelných toků kusů žárovek. Jejich průměrný světelný tok byl.. lm, směrodatná odchylka pak.. lm. U poloviny testovaných žárovek světelný tok nepřekročil.. lm. V polovině měření se světelný tok pohyboval v rozmezí až... lm. Vzhledem k hodnotě variačního koeficientu (.%) lze / nelze analyzovaný soubor považovat za homogenní. Analýza světelného toku LED žárovek výrobce V1 změřená po 10 000 h provozu Během testu byl změřen světelný tok... kusů žárovek výrobce V1. Změřený světelný tok po 10 000 h provozu LED žárovky se pohyboval v rozmezí.. až. lm. Hodnoty světelného toku ležící mimo interval... až... lm (vnitřní hradby) byly identifikovány jako odlehlá pozorování a nebudou zahrnuty do dalšího zpracování. Možné příčiny vzniku odlehlých pozorování jsou:... / Žádné z měření nebylo identifikováno jako odlehlé pozorování. Dále uvedené výsledky tedy pocházejí z analýzy světelných toků kusů žárovek. Jejich průměrný světelný tok byl.. lm, směrodatná odchylka pak.. lm. U poloviny testovaných žárovek světelný tok nepřekročil.. lm. V polovině měření se světelný tok pohyboval v rozmezí až... lm. Vzhledem k hodnotě variačního koeficientu (.%) lze / nelze analyzovaný soubor považovat za homogenní. Ověření normality světelného toku LED žárovek výrobce V1 změřeného zakoupení LED žárovky základě explorační analýzy Na základě grafického zobrazení (viz..) a výběrové šikmosti a špičatosti (výběrová šikmost i špičatost leží / neleží v intervalu ( 2; 2)) lze / nelze předpokládat, že světelný tok LED žárovek výrobce V1 změřený po zakoupení má normální rozdělení. Dle pravidla 3σ / Čebyševovy nerovnosti lze tedy očekávat, že přibližně 95 % / více než 75 % žárovek bude mít světelný tok po zakoupení v rozmezí. až.. lm. Ověření normality kapacity akumulátorů výrobce A po 10 000 h provozu na základě explorační analýzy Na základě grafického zobrazení (viz..) a výběrové šikmosti a špičatosti (výběrová šikmost i špičatost leží / neleží v intervalu ( 2; 2)) lze / nelze předpokládat, že světelný tok žárovky výrobce V1 po 10 000 h provozu má normální rozdělení. Dle pravidla 3σ / Čebyševovy nerovnosti lze tedy očekávat, že přibližně 95 % / více než 75 % žárovek po 10 000 h provozu bude mít světelný tok v rozmezí.. až.. lm. 4

Úkol 2 Porovnejte poklesy světelných toků LED žárovek výrobců V1, V2 po 10 000 h provozu (vzhledem k světelnému toku žárovek po zakoupení). Nezapomeňte, že použité metody mohou vyžadovat splnění určitých předpokladů. Pokud tomu tak bude, okomentujte splnění/nesplnění těchto předpokladů jak na základě explorační analýzy (např. s odkazem na histogram apod.), tak exaktně pomocí metod statistické indukce. a) Graficky prezentujte srovnání poklesů světelných toků LED žárovek výrobců V1, V2 změřených po 10 000 h provozu (vícenásobný krabicový graf, histogramy, q-q grafy). b) Určete bodové a 95% intervalové odhady pro střední hodnoty (resp. mediány) poklesů světelných toků žárovek po 10 000 hodin provozu výrobců V1 a V2. 5

c) Na hladině významnosti 5 % rozhodněte, zda jsou poklesy světelných toků žárovek výrobců V1 a V2 statisticky významné. d) Určete bodový a 95% intervalový odhad rozdílu středních hodnot (resp. mediánů) poklesů světelných toků žárovek po 10 000 h provozu výrobců V1 a V2. e) Na hladině významnosti 5% rozhodněte, zda je rozdíl středních hodnot (resp. mediánů) poklesů světelných toků žárovek (po 10 000 h provozu) výrobců V1 a V2 statisticky významný. 6

Úkol 3 Na hladině významnosti 5 % rozhodněte, zda se hodnoty světelného toku LED žárovek po 10 000 h provozu liší v závislosti na tom, od kterého výrobce pocházejí. Posouzení proveďte nejprve na základě explorační analýzy a následně pomocí vhodného statistického testu včetně ověření potřebných předpokladů. V případě, že se kapacity žárovek jednotlivých výrobců statisticky významně liší, určete, které LED žárovky (od kterého výrobce) se odlišují od ostatních. a) Daný problém vhodným způsobem graficky prezentujte (vícenásobný krabicový graf, histogramy, q-q grafy). b) Ověřte normalitu světelných toků po 10 000 h provozu všech pěti výrobců (empiricky i exaktně). c) Ověřte homoskedasticitu (shodu rozptylů) světelných toků výrobců V1 V5 po 10 000 h provozu (empiricky i exaktně). 7

d) Určete bodové a 95% intervalové odhady středních hodnot (resp. mediánů) světelných toků žárovek po 10 000 h provozu pro všechny srovnávané výrobce. (Nezapomeňte na ověření předpokladů pro použití příslušných intervalových odhadů.) e) Čistým testem významnosti ověřte, zda je pozorovaný rozdíl středních hodnot (resp. mediánů) světelných toků žárovek statisticky významný na hladině významnosti 5%. Pokud ano, určete pořadí výrobců podle naměřených hodnot světelných toků testovaných žárovek. (Nezapomeňte na ověření předpokladů pro použití zvoleného testu.) 8

Úkol 4 U každé z žárovek zjistěte, zda světelný tok po 10 000 h provozu poklesl o více než 10 % z původní kapacity (po zakoupení). (Definujte si novou dichotomickou proměnnou (pokles o více než 10 %), která bude nabývat hodnot {ANO, NE}.) a) Analyzujte skladbu žárovek dle toho, zda vykazují nebo nevykazují pokles světelného toku o více než 10 % (pro výrobce V1, V2, V3, V4, V5). Výsledky prezentujte pomocí kontingenční tabulky, vhodného grafu a vhodné míry kontingence. b) Určete bodový i 95% intervalový odhad rizika (pravděpodobnosti) poklesu hodnoty světelného toku žárovek o více než 10 % pro výrobce V3. c) Určete bodový i 95% intervalový odhad relativního rizika poklesu hodnoty světelného toku o více než 10 % pro žárovky od nejhoršího výrobce (vzhledem k žárovkám od nejlepšího výrobce). Výsledky slovně interpretujte. 9

d) Určete bodový i 95% intervalový odhad poměru šancí poklesu hodnoty světelného toku o více než 10 % pro žárovky od nejhoršího výrobce (vzhledem k žárovkám od nejlepšího výrobce). Výsledky slovně interpretujte. e) Pomocí chí-kvadrát testu nezávislosti rozhodněte, jestli pravděpodobnost poklesu světelného toku o více než 10 % závisí statisticky významně na tom, od kterého výrobce žárovka pochází. 10

Jak identifikovat, zda jsou v datech odlehlá pozorování? Emiprické posouzení: použití vnitřních (vnějších) hradeb, resp. ř, resp. á á ř, vizuální posouzení krabicového grafu. Exaktní posouzení: Grubbsův test (parametrický test - vyžaduje normalitu dat) Deanův - Dixonův test (neparametrický test) Jak naložit s odlehlými hodnotami by měl definovat hlavně zadavatel analýzy (expert na danou problematiku). Jak ověřit normalitu dat? Emiprické posouzení: vizuální posouzení histogramu, vizuální posouzení grafu odhadu hustoty pravděpodobnosti, Q-Q graf, P-P graf, posouzení výběrové šikmosti a výběrové špičatosti. Exaktní posouzení: testy normality (např. Shapirův Wilkův test, Andersonův-Darlingův test, Lillieforsův test, ) Jak ověřit homoskedasticitu (shodu rozptylů)? Emiprické posouzení: poměr největší a nejmenší směrodatné odchylky, vizuální posouzení krabicového grafu. Exaktní posouzení: F test (parametrický dvouvýběrový test), Bartlettův test (parametrický vícevýběrový test), Leveneův test (neparametrický test). 11