VŠB Technická univerzita Ostrava



Podobné dokumenty
VŠB Technická univerzita Ostrava BIOSTATISTIKA

VŠB Technická univerzita Ostrava BIOSTATISTIKA

VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky SMAD

VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky

VŠB Technická univerzita Ostrava

Zaokrouhlování: Směrodatná odchylka se zaokrouhluje nahoru na stanovený počet platných cifer. Míry

Zápočtová práce STATISTIKA I

a) Základní informace o souboru Statistika: Základní statistika a tabulky: Popisné statistiky: Detaily

Kurz Biostatistiky pro zaměstnance FNO

Průzkumová analýza dat

Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012. Tutoriál č. 4: Exploratorní analýza. Jan Kracík

Návrhy dalších možností statistického zpracování aktualizovaných dat

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Semestrální projekt. do předmětu Statistika. Vypracoval: Adam Mlejnek Oponenti: Patrik Novotný Jakub Nováček Click here to buy 2

Statistika. Program R. popisná (deskriptivní) statistika popis konkrétních dat. induktivní (konfirmatorní) statistika. popisná statistika

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ. FAKULTA STROJNÍHO INŽENÝRSTVÍ Ústav materiálového inženýrství - odbor slévárenství

VYBRANÉ DVOUVÝBĚROVÉ TESTY. Martina Litschmannová

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Dynamické metody pro predikci rizika

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Přednáška 5. Výběrová šetření, Exploratorní analýza

Pracovní adresář. Nápověda. Instalování a načtení nového balíčku. Importování datového souboru. Práce s datovým souborem

Matematická statistika

12. TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ

Analýza dat s využitím MS Excel

Tématické okruhy pro státní závěrečné zkoušky. bakalářské studium. studijní obor "Management jakosti"

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

SYSTÉM TECHNICKO-EKONOMICKÉ ANALÝZY VÝROBY TEKUTÉHO KOVU - CESTA KE SNIŽOVÁNÍ NÁKLADŮ

Tématické okruhy pro státní závěrečné zkoušky. bakalářské studium. studijní obor "Management jakosti"

STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky)

Korelační a regresní analýza

Kvantily a písmenové hodnoty E E E E-02

Analýza rozptylu dvojného třídění

Statgraphics v. 5.0 STATISTICKÁ INDUKCE PRO JEDNOROZMĚRNÁ DATA. Martina Litschmannová 1. Typ proměnné. Požadovaný typ analýzy

Úvod do kurzu. Moodle kurz. (a) (b) heslo pro hosty: statistika (c) skripta na pravděpodobnost

KOMBINATORIKA, PRAVDĚPODOBNOST, STATISTIKA. Charakteristiky variability. Mgr. Jakub Němec. VY_32_INOVACE_M4r0120

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Návrh a vyhodnocení experimentu

Semestrální projekt spočívá v nalezení vhodného datového souboru a jeho statistické analýze s využitím metod probíraných v rámci předmětu.

Název testu Předpoklady testu Testová statistika Nulové rozdělení. ( ) (p počet odhadovaných parametrů)

POPISNÁ STATISTIKA Komentované řešení pomocí programu Statistica

MSI LS 2006/2007 Ing. Pavla Hošková, Ph.D., 2. test

Vysoká škola báňská technická univerzita Ostrava. Fakulta elektrotechniky a informatiky

MATEMATIKA III V PŘÍKLADECH

S E M E S T R Á L N Í

Porovnání dvou výběrů

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Testování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času

Organizační pokyny k přednášce. Matematická statistika. Přehled témat. Co je statistika?

Návrh a vyhodnocení experimentu

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie STATISTICKÉ ZPRACOVÁNÍ EXPERIMENTÁLNÍCH DAT

Národníinformačnístředisko pro podporu jakosti

Dvouvýběrové a párové testy. Komentované řešení pomocí MS Excel

4ST201 STATISTIKA CVIČENÍ Č. 8

ÚKOL ,77 5,00 5 2,531,003,056 -,869,113

Za hranice nejistoty(2)

ZNALOSTI A DOVEDNOSTI ČESKÝCH MUŽŮ V OBLASTI INFORMAČNÍ BEZPEČNOSTI - VÝSLEDKY STATISTICKÉ ANALÝZY

PRŮZKUMOVÁ ANALÝZA JEDNOROZMĚRNÝCH DAT Exploratory Data Analysis (EDA)

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

Robust ledna 5. února 2010, Králíky

ZNALOSTI A DOVEDNOSTI ČESKÝCH ŽEN V OBLASTI INFORMAČNÍ BEZPEČNOSTI - VÝSLEDKY STATISTICKÉ ANALÝZY

Předpoklad o normalitě rozdělení je zamítnut, protože hodnota testovacího kritéria χ exp je vyšší než tabulkový 2

Charakteristika datového souboru

Analýza rozptylu. Statistika II. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel

Analýza rozptylu. Přednáška STATISTIKA II - EKONOMETRIE. Jiří Neubauer

NĚKTERÉ ZÁVĚRY Z ÚVODNÍ NÁKLADOVÉ ANALÝZY VÝROBY TEKUTÉHO KOVU V ŠESTI SLÉVÁRNÁCH. Václav Figala a Sylvie Žitníková b Václav Kafka c

Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D.

SEMESTRÁ LNÍ PRÁ CE. Licenč ní studium STATISTICKÉZPRACOVÁ NÍ DAT PŘ I KONTROLE A Ř ÍZENÍ JAKOSTI

Biostatistika a matematické metody epidemiologie- stručné studijní texty

Analýza dat na PC I.

Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D.

Poznámky k předmětu Aplikovaná statistika, 9.téma

Jednofaktorová analýza rozptylu

Distribuční funkce je funkcí neklesající, tj. pro všechna

VADÍ - NEVADÍ ANEB STATISTIKA KOLEM NÁS

Simulace. Simulace dat. Parametry

Odhady parametrů základního souboru. Cvičení 6 Statistické metody a zpracování dat 1 (podzim 2016) Brno, říjen listopad 2016 Ambrožová Klára

UNIVERZITA PARDUBICE CHEMICKO-TECHNOLOGICKÁ FAKULTA KATEDRA ANALYTICKÉ CHEMIE

Přednáška 9. Testy dobré shody. Grafická analýza pro ověření shody empirického a teoretického rozdělení

Test z teorie VÝBĚROVÉ CHARAKTERISTIKY A INTERVALOVÉ ODHADY

Statistika. Diskrétní data. Spojitá data. Charakteristiky polohy. Charakteristiky variability

Tématické okruhy pro státní závěrečné zkoušky. bakalářské studium. studijní obor "Management jakosti"

Pracovní list - Laboratorní práce č. 6 Jméno: Třída: Skupina:

Statistická analýza. jednorozměrných dat

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Základy teorie pravděpodobnosti

Test z teorie VÝBĚROVÉ CHARAKTERISTIKY A INTERVALOVÉ ODHADY

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice

Statistika. cílem je zjednodušit nějaká data tak, abychom se v nich lépe vyznali důsledkem je ztráta informací!

MATEMATICKO STATISTICKÉ PARAMETRY ANALYTICKÝCH VÝSLEDKŮ

Manuál pro zaokrouhlování

Statistika II. Jiří Neubauer

, Brno Hanuš Vavrčík Základy statistiky ve vědě

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Vysoká škola báňská Technická univerzita Ostrava TEORIE ÚDRŽBY. učební text. Jan Famfulík. Jana Míková. Radek Krzyžanek

Transkript:

VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky JMÉNO STUDENTKY/STUDENTA: OSOBNÍ ČÍSLO: JMÉNO CVIČÍCÍ/CVIČÍCÍHO: PRAVDĚPODOBNOST A STATISTIKA Domácí úkoly Zadání 21 DATUM ODEVZDÁNÍ DOMÁCÍ ÚKOL 1: DOMÁCÍ ÚKOL 2: DOMÁCÍ ÚKOL 3: DOMÁCÍ ÚKOL 4: CELKEM: --------------------- HODNOCENÍ Ostrava, AR 2015/2016

Popis datového souboru V datovém souboru pripojeni_21.xlsx najdete výsledky měření rychlosti internetového připojení u zákazníků, kteří si vyžádali servisní prohlídku. U každého servisního zásahu jsou uvedeny rychlosti připojení (Mb/s) před příchodem technika a rychlosti připojení po servisním zásahu. Také je uvedeno o jaký typ připojení se jednalo (ADSL/KABEL/OPTIKA) a geografické zařazení (město-centrum/městookraj/venkov). Obecné pokyny: Portfolio domácích úkolů budete odevzdávat postupně. Tj. nejdříve odevzdáte titulní stránku + úkol 1, následně doplníte úkol 2, atd. Jednotlivé domácí úkoly odevzdávejte vždy v termínu, který určil váš cvičící. Domácí úkoly zpracujte dle obecně známých typografických pravidel. Všechny tabulky i obrázky musí být opatřeny titulkem. Do domácích úkolů nevkládejte tabulky a obrázky, na něž se v doprovodném textu nebudete odkazovat. Bude-li to potřeba, citujte zdroje dle mezinárodně platné citační normy ČSN ISO 690. 1

Úkol 1 a) Prezentujte strukturu datového souboru, tj. strukturu měření rychlosti dle typu připojení (ADSL/KABEL/OPTIKA) a geografické polohy (město-centrum/město-okraj/venkov). V obou případech použijte tabulku četností a výsledky vhodným způsobem vizualizujte. b) Srovnejte rychlost připojení před zásahem servisního technika v Mb/s daných typů připojení na základě explorační analýzy, data graficky prezentujte (histogram, vícenásobný krabicový graf) a doplňte následující tabulky a text. Tab. 1: Výběrové charakteristiky rychlosti připojení před zásahem servisního technika pro typy připojení: ADSL, KABEL, OPTIKA Rychlost připojení (Mb/s) počet pacientů Míry polohy minimum dolní kvartil medián průměr horní kvartil maximum Míry variability směrodatná odchylka variační koeficient (%) Míry šikmosti a špičatosti šikmost špičatost po odstranění odlehlých pozorování ADSL KABEL OPTIKA ADSL KABEL OPTIKA Identifikace odlehlých pozorování vnitřní hradby dolní mez horní mez 2

Grafická prezentace sledovaného statistického znaku (vícenásobný krabicový graf + histogramy, resp. odhady hustoty pravděpodobnosti): Připojení typu ADSL před zásahem servisního technika Byly analyzovány záznamy servisního technika rychlosti připojení před jeho zásahem u. zákazníků s připojením typu ADSL (viz Tab. 1). Hodnoty rychlosti připojení se pohybovaly v rozmezí až. Mb/s. Hodnoty rychlosti připojení ležící mimo interval až.. Mb/s byly identifikovány jako odlehlá pozorování a příslušná měření byla z dalšího zpracování vyřazena. Níže uvedené výsledky pocházejí z analýzy datového souboru o rozsahu. měření. Průměrná hodnota rychlosti připojení byla.. Mb/s, směrodatná odchylka.. Mb/s. Polovině zákazníků byla zjištěna rychlost připojení nižší než.. Mb/s. (Podrobněji: U čtvrtiny zákazníků s připojením ADSL byla zjištěna rychlost připojení nižší než Mb/s, u čtvrtiny zákazníků rychlost připojení vyšší než Mb/s.) Vzhledem k hodnotě variačního koeficientu (.%) lze / nelze analyzovaný soubor považovat za homogenní. Ověření normality rychlosti připojení zákazníků s připojením ADSL na základě explorační analýzy Na základě grafického zobrazení (viz..) a výběrové šikmosti a špičatosti (viz Tab. 1, výběrová šikmost i špičatost leží / neleží v intervalu 2; 2 ) lze / nelze předpokládat, že rychlost připojení zákazníků s připojením ADSL má normální rozdělení. Dle pravidla 3σ / Čebyševovy nerovnosti lze tedy očekávat, že 95% / více než 75% zákazníků s připojením ADSL bude mít hodnotu rychlosti připojení v rozmezí... až.. Mb/s. 3

Obdobně lze popsat výsledky analýzy rychlosti připojení zákazníků s připojením typu KABEL a OPTIKA. 4

Úkol 2 Srovnejte zvýšení rychlosti připojení po zásahu servisního technika pro připojení typu KABEL a OPTIKA. a) Nárůst rychlosti připojení u obou skupin zákazníků vhodným způsobem graficky prezentujte. b) Určete 95% intervalové odhady středního nárůstu rychlosti připojení (resp. mediánu nárůstu rychlosti připojení) pro obě skupiny zákazníků (KABEL a OPTIKA). (Nezapomeňte na empirické i exaktní ověření předpokladů pro použití příslušných intervalových odhadů.) 5

c) Čistým testem významnosti ověřte, zda je pozorovaný nárůst rychlosti připojení statisticky významný na hladině významnosti 5%. Test proveďte pro skupiny zákazníků s připojením typu KABEL a OPTIKA. (Nezapomeňte na empirické i exaktní ověření předpokladů vybraného testu.) d) Pokud je to možno, určete 95% intervalový odhad rozdílu středních hodnot nárůstu rychlosti připojení u zákazníků s připojením typu KABEL a OPTIKA. (Nezapomeňte na empirické i exaktní ověření předpokladů pro použití příslušného intervalového odhadu.) e) Čistým testem významnosti ověřte, zda je pozorovaný rozdíl středních hodnot (resp. mediánů) nárůstu rychlosti připojení u zákazníků s připojením typu KABEL a OPTIKA statisticky významný na hladině významnosti 5%. (Nezapomeňte na empirické i exaktní ověření předpokladů vybraného testu.) 6

7

Úkol 3 Srovnejte rychlost připojení před zásahem servisního technika v závislosti na typu připojení: ADSL, KABEL a OPTIKA pomocí exaktních metod statistické indukce. a) Ověřte normalitu rychlosti připojení ve všech třech regionech (empiricky i exaktně). b) Ověřte homoskedasticitu (shodu rozptylů) rychlosti připojení pro všechny typy připojení (empiricky i exaktně). c) Určete 95% intervalové odhady střední hodnoty (resp. mediánu) rychlosti připojení pro zákazníky s připojením typu ADSL, KABEL a OPTIKA. (Nezapomeňte na ověření předpokladů pro použití příslušných intervalových odhadů.) 8

d) Čistým testem významnosti ověřte, zda je pozorovaný rozdíl středních hodnot (resp. mediánů) rychlosti připojení (před zásahem servisního technika) pro jednotlivé typy připojení statisticky významný na hladině významnosti 5%. Pokud ano, zjistěte, zda lze některé typy připojení označit (z hlediska jejich rychlosti připojení) za homogenní. (Nezapomeňte na ověření předpokladů pro použití zvoleného testu.) 9

Úkol 4 Analyzujte vliv městské části (centrum/okraj) na výskyt vysokorychlostního připojení (KABEL/OPTIKA). a) Pomocí vhodné asociační tabulky prezentujte vliv městské části na typ vysokorychlostního připojení. Tabulku doplňte o řádkové relativní četnosti. b) Analyzovanou závislost prezentujte pomocí vhodného grafu. c) Určete alespoň jednu míru kontingence. Na základě posouzení vizualizace analyzované závislosti a nalezené míry kontingence posuďte míru analyzované závislosti. d) Určete šanci, že náhodně vybraný zákazník s vysokorychlostním internetem z města-centrum, nebo města-okraj má připojení typu OPTIKA, tj. šance, že zákazník s vysokorychlostním internetem z města-centrum má připojení typu OPTIKA a šance, že zákazník s vysokorychlostním internetem z města-okraj má připojení typu OPTIKA. (Komentujte.) 10

e) Určete relativní šanci, že zákazník s vysokorychlostním internetem z města-centrum má připojení typu OPTIKA (včetně 95% intervalového odhadu). Na základě svého zjištění určete, zda lze vliv místa připojení považovat za statisticky významný na hladině významnosti 5%. f) Servisní technik se znalostí pouze připojení typu ADSL a KABEL jede k zákazníkovi s vysokorychlostním připojením do oblasti město-centrum. Určete relativní riziko, že nebude schopen závadu opravit (tedy, že zákazník má připojení typu OPTIKA). Na základě svého zjištění určete, zda lze vliv bydliště zákazníka (město-centrum/město-okraj) považovat za statisticky významný na hladině významnosti 5%. g) Ověřte, zda existuje závislost mezi výskytem typu připojení (ADSL/KABEL/OPTIKA) a bydlištěm zákazníka (město-centrum/město-okraj/venkov) pomocí Chí-kvadrát testu nezávislosti. Nezapomeňte ověřit předpoklady pro použití testu. 11

Biostatistika nápověda k domácím úkolům Jak identifikovat, zda jsou v datech odlehlá pozorování? Emiprické posouzení: použití vnitřních (vnějších) hradeb, resp. z souřadnice, resp. mediánová suřadnice, vizuální posouzení krabicového grafu. Exaktní posouzení: Grubbsův test (parametrický test - vyžaduje normalitu dat) Deanův - Dixonův test (neparametrický test) Jak naložit s odlehlými hodnotami by měl definovat hlavně zadavatel analýzy (expert na danou problematiku). Jak ověřit normalitu dat? Emiprické posouzení: vizuální posouzení histogramu, vizuální posouzení grafu odhadu hustoty pravděpodobnosti, Q-Q graf, P-P graf, posouzení výběrové šikmosti a výběrové špičatosti. Exaktní posouzení: testy normality (např. Shapirův Wilkův test, Andersonův-Darlingův test, Lillieforsův test, ) Jak ověřit homoskedasticitu (shodu rozptylů)? Emiprické posouzení: poměr největší a nejmenší směrodatné odchylky, vizuální posouzení krabicového grafu. Exaktní posouzení: F test (parametrický dvouvýběrový test), Bartlettův test (parametrický vícevýběrový test), Leveneův test (neparametrický test).