Vzdálenost k nejbližší benzinové čerpací stanici χ 2 -test dobré shody
|
|
- Mária Sedláková
- před 9 lety
- Počet zobrazení:
Transkript
1 České vysoké učení technické v Praze Fakulta elektrotechnická Katedra matematiky Semestrální práce z předmětu X01MVT Matematika pro výpočetní techniku Vzdálenost k nejbližší benzinové čerpací stanici χ 2 -test dobré shody Jan Skalický leden 2008
2 Obsah 1. Zadání Získání dat Sběr a vyčiště ní dat Stručné charakteristiky dat Testovaná hypotéza Test dobré shody rozdě lení Realizace testu Test na normální rozdě lení Rezerva paliva Závě r Zdroje Seznam tabulek Tabulka 2.1: Histogram zastoupení navštívených firem...4 Tabulka 4.1: Hodnoty testu...6 Tabulka 4.2: Hodnoty testu pro jinou diskretizaci...6 Tabulka 4.3: Hodnoty testu původních dat na normální rozdě lení...7 Seznam obrázků Obrázek 2.1: filtrace pro 500 bodů...3 Obrázek 2.2: filtrace pro 1000 bodů...3 Obrázek 2.3: filtrace pro 2000 bodů...3 Obrázek 2.4: filtrace pro bodů...3 2
3 1. Zadání Otestujte hypotézu, že nejkratší vzdálenost po silnici z náhodn ě zvoleného bodu v ČR k nejbližší benzinové čerpací stanici má logaritmicko-normální rozdě lení. Stanovte jaký minimální dojezdový rádius by si měl ř idič nechávat jako rezervu, aby mu i při neznalosti místních poměr ů zůstala statistická pravděpodobnost alespo ň 90 % na dojetí k čerpadlu pro doplnění paliva. Předpokladem je, že řidič se po mapě pohybuje rovnoměrn ě. 2. Získání dat Bylo třeba získat data s délkou trasy z náhodn ě zvoleného bodu na silniční síti ČR k nejbližší čerpací stanici. Za tímto účelen byl vytvořen program, který po př edložení obrázku s šablonou mapy území filtruje vstup geografických souř adnic na body ležící uvnit ř obrysu. Program provádí lineární korekci souř adnic na sférickém povrchu. Vzhledem k tomu a k rozlišení použitého obrázku mapy (1921*1102 pix) jsme obdrželi přesnost rozhodnutí o hranici lepší než cca 1.5 km, což pln ě postačuje našemu účelu. Pomocí generátoru v linuxovém souboru /dev/random byly vygenerovány náhodné souřadnice bod ů z obdélníka opsaného obrysu mapy ČR a ty následn ě filtrovány výše zmíněným programem (pro velký počet je to cca 57.7 % bod ů z použitého intervalu o rozmě rech cca 484*279 km, tozn. pokud bychom takto metodou Monte Carlo integrovali plochu ČR, obdrželi bychom výsledek cca 77.9 tis. km 2 ). Vizualizaci výsledk ů této filtrace ukazují obrázky 2.1 až 2.4. Obrázek 2.1: filtrace pro 500 bodů Obrázek 2.2: filtrace pro 1000 bodů Obrázek 2.3: filtrace pro 2000 bodů Obrázek 2.4: filtrace pro bodů 3
4 2.1 Sběr a vyčištění dat Pro sběr vzdáleností byl použit soubor 2000 bod ů, z nichž 1145 leželo uvnit ř ČR. Vlastní vzdálenosti byly získány z veřejného navigačního portálu na Plánovač trasy mě l nastaven atribut použití nejkratší cesty a klíčem k vyhledání cílových bod ů byl řetě zec benzinová čerpací stanice. V některých př ípadech byly nalezeny kombinované stanice LPG. Ačkoliv bylo snahou proces sbě ru co nejvíce automatizovat, bylo nutné provést manuální vyčiště ní datového souboru, a sice korekce nepřesn ě nalezených cest v důsledku velké vzdálenosti počátk ů k nejbližšímu bodu na silnici (nejbližší čerpací stanice se vybírá podle přímé vzdálenosti) v důsledku jednosměrnosti dálnic a granularity jejich křížení s jinými cestami vyřazení počátk ů na území vojenských újezdů 2.2 Stručné charakteristiky dat Získaná a vyčištěná data obsahují vzdálenosti od 0.1 km do 33.8 km. Po vyř azení počátk ů ve vojenských újezdech jsou největší vzdálenosti způ sobeny počátky v horách (zejm. Beskydy, Orlické hory) a nap ř. za př ehradou Lipno, kterou je nutno celou objet. Vzdáleností přesahujících 20 km je celkem 14. Z 1145 návštěv bylo 661 stanic rů zných a 384 z nich bylo navštíveno pouze jednou. 21 stanic bylo navštívenou více než 4x, z toho 2 nejvíckrát navštívené byly 9x a 8x. Histogram zastoupení jednotlivých firem provozujících veř ejné čerpací stanice je v tabulce 2.1. Název firmy Benzina, s.r.o. 224 Čepro, a.s. 214 PAP Oil čerpací stanice, s.r.o. 91 Shell Czech Republic, a.s. 64 Robin Oil, s.r.o. 60 OMV Česká republika, s.r.o. 54 Agip Česká republika, s.r.o. 25 KM - PRONA, a.s. 21 Hunsgas, s.r.o. 16 Svam CS, s.r.o. 14 Inteko Konice, a.s. 13 Počet návštěv ostatní (179 subjek ů, mén ě než 10 návštev) 349 (z toho 105 subjekt ů práv ě 1x) Tabulka 2.1: Histogram zastoupení navštívených firem Podle zběžného porovnání histogramu z tab. 2.1 se zprávou o síti čerpacích stanic PHM v ČR za 1. pololetí 2007, obsahující výsledky statistického zjišť ování odboru surovinové a energetické politiky ministerstva prů myslu a obchodu, se zdá, že sesbíraná data jsou v souladu se skutečností. 4
5 3. Testovaná hypotéza Nulovou hypotézu, kterou chceme testovat formulujeme takto: Nasbíraná data mají logaritmicko-normální rozdělení. Alternativní hypotéza toto rozdělení popírá. Požadujeme test s hladinou významnosti To je max. pravdě podobnost chyby 1. druhu toho, že hypotézu neoprávněn ě zamítneme, ačkoliv bude platit. 4. Test dobré shody rozdělení O neplatnosti testované hypotézy se pokusíme rozhodnout provedením χ 2 -testu dobré shody. Testujeme na logaritmicko-normální rozdě lení, které odpovídá zobrazení náhodné veličiny s normálním rozdě lením exponenciální funkcí. Parametry normálního rozdělení můžeme jednoduše odhadnout z realizace výbě ru, a proto budeme testovat logaritmus původních dat na normální rozdě lení. Za účelem snadné modifikovatelnosti a získání přesných výsledk ů byl celý test naprogramován v matematickém systému Maple 9.5 Z dat (n = 1145), již zlogaritmovaných (základ logaritmu není podstatný, protože má pouze vliv multiplikativní konstanty na rozptyl výsledného rozdě lení a byl použit 10 10, takže nová data dostala význam dbkm), spočítáme výběrový průmě r a výběrový rozptyl pro odhad parametr ů odpovídajícího normálního rozdělení: n = x = 1 x n i = i =1 n 2 =s 2 x = 1 x n 1 i x 2 = i =1 = 2 = Test pracuje s diskrétními hodnotami, a tak rozdělíme data do disjunktních tř íd s blízkými významy. Všechny teoretické četnosti musí být velké a nejlépe podobné. Ke zvoleným intervalům <a, b) spočítáme teoretické pravdě podobnosti pro testované rozdělení z jeho distribuční funkce a jim odpovídající očekávané četnosti: p i =F N, 2 b F N, 2 a np i =p i n Testovacím kritériem je statistika T: k T = i=1 k n t i = i np i 2 i =1 np i a testujeme ji proti zvolenému (1 0.01) kvantilu χ 2 rozdě lení s tolika stupni volnosti, kolik je interval ů diskretizace 1 (poslední je doplň kem do celku) 2 (2 neznámé parametry rozdělení jsme odhadovali s použitím stejného souboru dat). q k = pro k =9; pro k =5; pro k =7 Aktuáln ě dosažený koeficient spolehlivosti testu lze vyjádřit jako: F k 1 2 T 5
6 4.1 Realizace testu Tabulka 4.1 obsahuje hodnoty testu pro zvolenou diskretizaci dat. Vidíme, že hodnota kritéria je větší než zvolený kvantil ( > ), a proto mů žeme na zvolené hladin ě významnosti 0.01 zamítnout nulovou hypotézu a př ijmout hypotézu alternativní. Po naprogramování testu, včetn ě dělení do interval ů, nám nečiní potíže vyzkoušet i jinou diskretizaci dat, s důrazem na podobnost teoretických četností, viz tabulku 4.2. Zde rovněž zamítáme (pro > 9.210). i Interval [dbkm] n i p i np i t i 1 (-..3) <3..5) <5..6) <6..7) <7..8) <8..9) <9..10) <10..11) <11..+ ) Tabulka 4.1: Hodnoty testu i Interval [dbkm] n i p i np i t i 1 (-..4.5) < ) < ) < ) < ) Tabulka 4.2: Hodnoty testu pro jinou diskretizaci Z obou výsledk ů je patrné, že rozdě lení se liší zejm. v oblasti nedaleko za odhadnutou stř ední hodnotou, a to tak, že hustota klesá rychleji, než podle logaritmicko-normálního rozdělení. Můžeme tedy vyzkoušet ješt ě test proti normálnímu rozdělení (tozn. pů vodní data nebudeme logaritmovat a bude nutné přepočítat odhady parametr ů rozdě lení EX= a DX=21.708) v domně ní, že záporné výsledky, které data neobsahují, budou mít nízký vliv na příspě vek do testované statistiky. Takovou situaci, pro 7 interval ů dělení zachycuje tabulka Test na normální rozdělení V testu shody původních dat na normální rozdělení vidíme opačný trend př ebytek dat pod střední hodnotou a jejich nedostatek v jisté vzdálenosti nad ní. Celkově 6
7 zamítáme (porovnávaný kvantil je ), ale k výraznému zhoršení oproti předchozím testům nedošlo. Toto pozorování m ě vede k podezř ení, že naše data mají rozdělení blízké nějaké směsi normálního a logaritmicko-normálního rozdě lení. Takové rozdělení by mělo 5 stup ňů volnosti a tudíž by bylo vhodné ho testovat při vě tším počtu interval ů dělení. i Interval [dbkm] n i p i np i t i 1 (-..2.3) < ) < ) < ) < ) < ) < ) Tabulka 4.3: Hodnoty testu původních dat na normální rozdělení 5. Rezerva paliva Pro stanovení minimálního dojezdu jako rezervy, aby řidiči zů stala statistická pravděpodobnost alespo ň 90 % na dojetí k benzinovému čerpadlu, potř ebujeme znát rozdělení použité náhodné veličiny. My jsme však ověřovaná rozdě lení zamítli, takže musíme vystačit s empirickým rozdělením z realizace výbě ru. Jeho 0.9-kvantil nám odpovídá hodnotou 13.7 km. Pro zajímavost můžeme zkusit vyčíslit tento kvantil i z ověřovaných rozdě lení. Pro normální rozdělení se zjištěnými parametry činí cca 13.2 km. Pro pů vodní logaritmicko-normální je to 12 dbkm a pro obdržení vzdálenosti musíme provést zpětnou transformaci delogaritmováním a vyjde cca 15.8 km. Je zde opět vidě t stejný trend jako v příspě vcích k testovací statistice a i tato statistika nám napovídá, že lépe odpovídající rozdělení bude někde mezi těmito dvěma. Praktická rada je tedy rezervovat si palivo na dojezd cca 15 km k dosažení více než 90 % pravděpodobnosti, že budeme schopni ho kdekoliv doplnit. 6. Závěr Hypotéza, že nejkratší vzdálenost po silnici z náhodn ě zvoleného bodu v ČR k nejbližší benzinové čerpací stanici má logaritmicko-normální rozdě lení, byla na hladin ě významnosti < 1 % zamítnuta. Rovněž normální rozdě lení této veličiny bylo s touto hladinou zamítnuto. Je zde domněnka, že rozdělení by lépe odpovídalo smě si těchto 2. Byla vyslovena praktická rada, nechávat si rezervu paliva na dojetí 15 km. 7. Zdroje [1] Webová stránka podpory výuky: [2] Mirko Navara Matematika pro výpočetní techniku (přednášky předmětu) [3] Vladimír Rogalewicz Pravděpodobnost a statistika pro inženýry,
Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel
Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Statistickou hypotézou se rozumí určité tvrzení o parametrech rozdělení zkoumané náhodné veličiny (µ, σ 2, π,
You created this PDF from an application that is not licensed to print to novapdf printer (http://www.novapdf.com)
Testování statistických hypotéz Testování statistických hypotéz Princip: Ověřování určitého předpokladu zjišťujeme, zda zkoumaný výběr pochází ze základního souboru, který má určité rozdělení zjišťujeme,
4ST201 STATISTIKA CVIČENÍ Č. 7
4ST201 STATISTIKA CVIČENÍ Č. 7 testování hypotéz parametrické testy test hypotézy o střední hodnotě test hypotézy o relativní četnosti test o shodě středních hodnot testování hypotéz v MS Excel neparametrické
676 + 4 + 100 + 196 + 0 + 484 + 196 + 324 + 64 + 324 = = 2368
Příklad 1 Je třeba prověřit, zda lze na 5% hladině významnosti pokládat za prokázanou hypotézu, že střední doba výroby výlisku je 30 sekund. Přitom 10 náhodně vybraných výlisků bylo vyráběno celkem 540
Cvi ení 7. Docházka a testík - 15 min. Distfun 10 min. Úloha 1
Cvi ení 7 Úkol: generování dat dle rozd lení, vykreslení rozd lení psti, odhad rozd lení dle dat, bodový odhad parametr, centrální limitní v ta, balí ek Distfun, normalizace Docházka a testík - 15 min.
Normální (Gaussovo) rozdělení
Normální (Gaussovo) rozdělení f x = 1 2 exp x 2 2 2 f(x) je funkce hustoty pravděpodobnosti, symetrická vůči poloze maxima x = μ μ střední hodnota σ směrodatná odchylka (tzv. pološířka křivky mezi inflexními
12. cvičení z PST. 20. prosince 2017
1 cvičení z PST 0 prosince 017 11 test rozptylu normálního rozdělení Do laboratoře bylo odesláno n = 5 stejných vzorků krve ke stanovení obsahu alkoholu X v promilích alkoholu Výsledkem byla realizace
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 2010 1.týden (20.09.-24.09. ) Data, typy dat, variabilita, frekvenční analýza
Normální (Gaussovo) rozdělení
Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení popisuje vlastnosti náhodné spojité veličiny, která vzniká složením různých náhodných vlivů, které jsou navzájem nezávislé, kterých je velký
PRAVDĚPODOBNOST A STATISTIKA
PRAVDĚPODOBNOST A STATISTIKA Testování hypotéz Nechť X je náhodná proměnná, která má distribuční funkci F(x, ϑ). Předpokládejme, že známe tvar distribuční funkce (víme jaké má rozdělení) a neznáme parametr
Příklad 1. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 11
Příklad 1 Vyhláška Ministerstva zdravotnictví předpokládala, že doba dojezdu k pacientovi od nahlášení požadavku nepřekročí 17 minut. Hodnoty deseti náhodně vybraných dob příjezdu sanitky k nemocnému byly:
11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.
11 cvičení z PSI 12-16 prosince 2016 111 (Test dobré shody - geometrické rozdělení Realizací náhodné veličiny X jsme dostali následující četnosti výsledků: hodnota 0 1 2 3 4 5 6 pozorovaná četnost 29 15
Stručný úvod do testování statistických hypotéz
Stručný úvod do testování statistických hypotéz 1. Formulujeme hypotézu (předpokládáme, že pozorovaný jev je pouze náhodný). 2. Zvolíme hladinu významnosti testu a, tj. riziko, s nímž jsme ochotni se smířit.
Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)
Lékařská biofyzika, výpočetní technika I Biostatistika Josef Tvrdík (doc. Ing. CSc.) Přírodovědecká fakulta, katedra informatiky josef.tvrdik@osu.cz konzultace úterý 14.10 až 15.40 hod. http://www1.osu.cz/~tvrdik
Semestrální práce z předmětu Matematika 6F
vypracoval: Jaroslav Nušl dne: 17.6.24 email: nusl@cvut.org Semestrální práce z předmětu Matematika 6F Zádání: Cílem semestrální práce z matematiky 6F bylo zkoumání hudebního signálu. Pluginem ve Winampu
Testování statistických hypotéz
Testování statistických hypotéz Michal Fusek Ústav matematiky FEKT VUT, fusekmi@feec.vutbr.cz 11. přednáška z ESMAT Michal Fusek (fusekmi@feec.vutbr.cz) 1 / 27 Obsah 1 Testování statistických hypotéz 2
Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.
Testování statistických hypotéz Ing. Michal Dorda, Ph.D. Testování normality Př. : Při simulaci provozu na křižovatce byla získána data o mezerách mezi přijíždějícími vozidly v [s]. Otestujte na hladině
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická
Testování hypotéz. 4. přednáška 6. 3. 2010
Testování hypotéz 4. přednáška 6. 3. 2010 Základní pojmy Statistická hypotéza Je tvrzení o vlastnostech základního souboru, o jehož pravdivosti se chceme přesvědčit. Předem nevíme, zda je pravdivé nebo
Testování statistických hypotéz
Testování statistických hypotéz Na základě náhodného výběru, který je reprezentativním vzorkem základního souboru (který přesně neznáme, k němuž se ale daná statistická hypotéza váže), potřebujeme ověřit,
JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica
JEDNOVÝBĚROVÉ TESTY Komentované řešení pomocí programu Statistica Vstupní data Data umístěná v excelovském souboru překopírujeme do tabulky ve Statistice a pojmenujeme proměnné, viz prezentace k tématu
Test dobré shody v KONTINGENČNÍCH TABULKÁCH
Test dobré shody v KONTINGENČNÍCH TABULKÁCH Opakování: Mějme náhodné veličiny X a Y uspořádané do kontingenční tabulky. Řekli jsme, že nulovou hypotézu H 0 : veličiny X, Y jsou nezávislé zamítneme, když
y = 0, ,19716x.
Grafické ověřování a testování vybraných modelů 1 Grafické ověřování empirického rozdělení Při grafické analýze empirického rozdělení vycházíme z empirické distribuční funkce F n (x) příslušné k náhodnému
Testy. Pavel Provinský. 19. listopadu 2013
Testy Pavel Provinský 19. listopadu 2013 Test a intervalový odhad Testy a intervalové odhady - jsou vlastně to samé. Jiný je jen úhel pohledu. Lze přecházet od jednoho k druhému. Například: Při odvozování
Pearsonůvχ 2 test dobré shody. Ing. Michal Dorda, Ph.D.
Ing. Michal Dorda, Ph.D. Př. : Ve vjezdové skupině kolejí byly sledovány počty přijíždějících vlaků za hodinu. Za 5 dní (tedy 360 hodin) přijelo celkem 87 vlaků. Výsledky sledování jsou uvedeny v tabulce.
NÁHODNÁ ČÍSLA. F(x) = 1 pro x 1. Náhodná čísla lze generovat některým z následujících generátorů náhodných čísel:
NÁHODNÁ ČÍSLA TYPY GENERÁTORŮ, LINEÁRNÍ KONGRUENČNÍ GENERÁTORY, TESTY NÁHODNOSTI, VYUŽITÍ HODNOT NÁHODNÝCH VELIČIN V SIMULACI CO JE TO NÁHODNÉ ČÍSLO? Náhodné číslo definujeme jako nezávislé hodnoty z rovnoměrného
Semestrální práce z předmětu Pravděpodobnost, statistika a teorie informace
České vysoké učení technické v Praze Fakulta elektrotechnická Semestrální práce z předmětu Pravděpodobnost, statistika a teorie informace Životnost LED diod Autor: Joel Matějka Praha, 2012 Obsah 1 Úvod
Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1
Testování statistických hypotéz Ing. Michal Dorda, Ph.D. 1 Úvodní poznámky Statistickou hypotézou rozumíme hypotézu o populaci (základním souboru) např.: Střední hodnota základního souboru je rovna 100.
TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY
TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY Statistická hypotéza je určitá domněnka (předpoklad) o vlastnostech ZÁKLADNÍHO SOUBORU. Test statistické hypotézy je pravidlo (kritérium), které na základě
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 010 1.týden (0.09.-4.09. ) Data, typy dat, variabilita, frekvenční analýza
Pravděpodobnost a aplikovaná statistika
Pravděpodobnost a aplikovaná statistika MGR. JANA SEKNIČKOVÁ, PH.D. 8. KAPITOLA STATISTICKÉ TESTOVÁNÍ HYPOTÉZ 22.11.2016 Opakování: CLV příklad 1 Zadání: Před volbami je v populaci státu 52 % příznivců
6. Testování statistických hypotéz. KGG/STG Zimní semestr 6. Testování statistických hypotéz
6. Testování statistických Testování statistických Princip: Ověř ěřování určit itého předpokladu p zjišťujeme, zda zkoumaný výběr r pochází ze základnz kladního souboru, který mám určit ité rozdělen lení
Tomáš Karel LS 2012/2013
Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není
15. T e s t o v á n í h y p o t é z
15. T e s t o v á n í h y p o t é z Na základě hodnot náhodného výběru činíme rozhodnutí o platnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlastnostech. Rozeznáváme dva základní typy testů:
Testování statistických hypotéz
Testování statistických hypotéz 1 Testování statistických hypotéz 1 Statistická hypotéza a její test V praxi jsme nuceni rozhodnout, zda nějaké tvrzeni o parametrech náhodných veličin nebo o veličině samotné
Testování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času
Testování hypotéz 1 Jednovýběrové testy 90/ odhad času V podmínkách naprostého odloučení má voák prokázat schopnost orientace v čase. Úkolem voáka e provést odhad časového intervalu 1 hodiny bez hodinek
Přednáška 9. Testy dobré shody. Grafická analýza pro ověření shody empirického a teoretického rozdělení
Přednáška 9 Testy dobré shody Grafická analýza pro ověření shody empirického a teoretického rozdělení χ 2 test dobré shody ověření, zda jsou relativní četnosti jednotlivých variant rovny číslům π 01 ;
Epidemiologické ukazatele. lních dat. analýza kategoriáln. Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat. a I E
Testování statistických hypotéz z a analýza kategoriáln lních dat Prof. RNDr. Jana Zvárová, DrSc. Epidemiologické ukazatele Rizikový faktor Populace Přítomen Nepřítomen Celkem Nemocní a b a+b Kontroly
Návrh a vyhodnocení experimentu
Návrh a vyhodnocení experimentu Návrh a vyhodnocení experimentů v procesech vývoje a řízení kvality vozidel Ing. Bohumil Kovář, Ph.D. FD ČVUT Ústav aplikované matematiky kovar@utia.cas.cz Mladá Boleslav
analýza kategoriáln lních dat Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat Epidemiologické ukazatele
Testování statistických hypotéz z a analýza kategoriáln lních dat Prof. RNDr. Jana Zvárová, DrSc. 1 Záznam epidemiologických dat Rizikový faktor Populace Přítomen Nepřítomen Celkem Nemocní a b a+b Kontroly
Porovnání dvou výběrů
Porovnání dvou výběrů Menu: QCExpert Porovnání dvou výběrů Tento modul je určen pro podrobnou analýzu dvou datových souborů (výběrů). Modul poskytuje dva postupy analýzy: porovnání dvou nezávislých výběrů
STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky)
STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky) 1) Význam a využití statistiky v biologických vědách a veterinárním lékařství ) Rozdělení znaků (veličin) ve statistice 3) Základní a
Lineární regrese. Komentované řešení pomocí MS Excel
Lineární regrese Komentované řešení pomocí MS Excel Vstupní data Tabulka se vstupními daty je umístěna v oblasti A1:B11 (viz. obrázek) na listu cela data Postup Základní výpočty - regrese Výpočet základních
Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.
1 Statistické odhady Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru. Odhad lze provést jako: Bodový odhad o Jedna číselná hodnota Intervalový
15. T e s t o v á n í h y p o t é z
15. T e s t o v á n í h y p o t é z Na základě hodnot náhodného výběru činíme rozhodnutí o platnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlastnostech. Rozeznáváme dva základní typy testů:
UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 3. 11.
UNIVERZITA OBRANY Fakulta ekonomiky a managementu Aplikace STAT1 Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 Jiří Neubauer, Marek Sedlačík, Oldřich Kříž 3. 11. 2012 Popis a návod k použití aplikace
1. (18 bod ) Náhodná veli ina X je po et rub p i 400 nezávislých hodech mincí. a) Pomocí ƒeby²evovy nerovnosti odhadn te pravd podobnost
(8 bod ) Náhodná veli ina X je po et rub p i nezávislých hodech mincí a) Pomocí ƒeby²evovy nerovnosti odhadn te pravd podobnost P ( X EX < ) (9 bod ) b) Formulujte centrální limitní v tu a pomocí ní vypo
Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II
Základy biostatistiky II Veřejné zdravotnictví 3.LF UK - II Teoretické rozložení-matematické modely rozložení Naměřená data Výběrové rozložení Teoretické rozložení 1 e 2 x 2 Teoretické rozložení-matematické
Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)
Lékařská biofyzika, výpočetní technika I Biostatistika Josef Tvrdík (doc. Ing. CSc.) Přírodovědecká fakulta, katedra informatiky josef.tvrdik@osu.cz konzultace úterý 4. až 5.4 hod. http://www.osu.cz/~tvrdik
Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina
Testování hypotéz Analýza dat z dotazníkových šetření Kuranova Pavlina Statistická hypotéza Možné cíle výzkumu Srovnání účinnosti různých metod Srovnání výsledků různých skupin Tzn. prokázání rozdílů mezi
prosince oboustranný symetrický 95% interval spolehlivosti pro střední hodnotu životnosti τ. X i. X = 1 n.. Podle CLV má veličina
10 cvičení z PSI 5-9 prosince 016 101 intervalový odhad Veličina X, představující životnost žárovky, má exponenciální rozdělení s parametrem τ Průměrná životnost n = 64 náhodně vybraných žárovek je x =
Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.
Pravděpodobnost a statistika, Biostatistika pro kombinované studium Letní semestr 2015/2016 Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz Jan Kracík jan.kracik@vsb.cz Obsah: Výběrová rozdělení
Ing. Michael Rost, Ph.D.
Úvod do testování hypotéz, jednovýběrový t-test Ing. Michael Rost, Ph.D. Testovaná hypotéza Pokud nás zajímá zda platí, či neplatí tvrzení o určitém parametru, např. o parametru Θ, pak takovéto tvrzení
Cvičení ze statistiky - 8. Filip Děchtěrenko
Cvičení ze statistiky - 8 Filip Děchtěrenko Minule bylo.. Dobrali jsme normální rozdělení Tyhle termíny by měly být známé: Centrální limitní věta Laplaceho věta (+ korekce na spojitost) Konfidenční intervaly
2 ) 4, Φ 1 (1 0,005)
Příklad 1 Ze zásilky velkého rozsahu byl náhodně vybrán soubor obsahující 1000 kusů. V tomto souboru bylo zjištěno 26 kusů nekvalitních. Rozhodněte, zda je možné s 99% jistotou tvrdit, že zásilka obsahuje
Testy statistických hypotéz
Testy statistických hypotéz Statistická hypotéza je jakýkoliv předpoklad o rozdělení pravděpodobnosti jedné nebo několika náhodných veličin. Na základě náhodného výběru, který je reprezentativním vzorkem
Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry
Testování hypotéz Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry Testování hypotéz Obecný postup 1. Určení statistické hypotézy 2. Určení hladiny chyby 3. Výpočet
PRAVDĚPODOBNOST A STATISTIKA. Testování hypotéz o rozdělení
PRAVDĚPODOBNOST A STATISTIKA Testování hypotéz o rozdělení Testování hypotéz o rozdělení Nechť X e náhodná proměnná, která má distribuční funkci F(x, ϑ). Předpokládeme, že neznáme tvar distribuční funkce
ÚSTAV MATEMATIKY A DESKRIPTIVNÍ GEOMETRIE. Matematika 0A4. Cvičení, letní semestr DOMÁCÍ ÚLOHY. Jan Šafařík
Vysoké učení technické v Brně Stavební fakulta ÚSTAV MATEMATIKY A DESKRIPTIVNÍ GEOMETRIE Matematika 0A4 Cvičení, letní semestr DOMÁCÍ ÚLOHY Jan Šafařík Brno c 200 (1) 120 krát jsme házeli hrací kostkou.
4EK211 Základy ekonometrie
4EK211 Základy ekonometrie ZS 2015/16 Cvičení 7: Časově řady, autokorelace LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE 1. Časové řady Data: HDP.wf1
Testování hypotéz Biolog Statistik: Matematik: Informatik:
Testování hypotéz Biolog, Statistik, Matematik a Informatik na safari. Zastaví džíp a pozorují dalekohledem. Biolog "Podívejte se! Stádo zeber! A mezi nimi bílá zebra! To je fantastické! " "Existují bílé
Odhad parametrů N(µ, σ 2 )
Odhad parametrů N(µ, σ 2 ) Mějme statistický soubor x 1, x 2,, x n modelovaný jako realizaci náhodného výběru z normálního rozdělení N(µ, σ 2 ) s neznámými parametry µ a σ. Jaký je maximální věrohodný
TECHNICKÁ UNIVERZITA V LIBERCI. Statistický rozbor dat z dotazníkového šetření
TECHNICKÁ UNIVERZITA V LIBERCI Ekonomická fakulta Semestrální práce Statistický rozbor dat z dotazníkového šetření Analýza výsledků dotazníkového šetření - fakultní dotazník Vypracovaly: Klára Habrová,
Pravděpodobnost a matematická statistika
Pravděpodobnost a matematická statistika Příklady k přijímacím zkouškám na doktorské studium 1 Popisná statistika Určete aritmetický průměr dat, zadaných tabulkou hodnot x i a četností n i x i 1 2 3 n
10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.
0 cvičení z PST 5 prosince 208 0 (intervalový odhad pro rozptyl) Soubor (70, 84, 89, 70, 74, 70) je náhodným výběrem z normálního rozdělení N(µ, σ 2 ) Určete oboustranný symetrický 95% interval spolehlivosti
Testování hypotéz. testujeme (většinou) tvrzení o parametru populace. tvrzení je nutno předem zformulovat
Testování hypotéz testujeme (většinou) tvrzení o parametru populace tvrzení je nutno předem zformulovat najít odpovídající test, podle kterého se na základě informace z výběrového souboru rozhodneme, zda
Přednáška X. Testování hypotéz o kvantitativních proměnných
Přednáška X. Testování hypotéz o kvantitativních proměnných Testování hypotéz o podílech Kontingenční tabulka, čtyřpolní tabulka Testy nezávislosti, Fisherůvexaktní test, McNemarůvtest Testy dobré shody
Testování hypotéz o parametrech regresního modelu
Testování hypotéz o parametrech regresního modelu Ekonometrie Jiří Neubauer Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra UO
PRAVDĚPODOBNOST A STATISTIKA. Neparametrické testy hypotéz čast 1
PRAVDĚPODOBNOST A STATISTIKA Neparametrické testy hypotéz čast 1 Neparametrické testy hypotéz - úvod Neparametrické testy statistických hypotéz se používají v případech, kdy neznáme rozdělení pozorované
Národníinformačnístředisko pro podporu jakosti
Národníinformačnístředisko pro podporu jakosti OVĚŘOVÁNÍ PŘEDPOKLADU NORMALITY Doc. Ing. Eva Jarošová, CSc. Ing. Jan Král Používané metody statistické testy: Chí-kvadrát test dobré shody Kolmogorov -Smirnov
12. prosince n pro n = n = 30 = S X
11 cvičení z PSI 1 prosince 018 111 test střední hodnoty normálního rozdělení při známém rozptylu Teploměrem o jehož chybě předpokládáme že má normální rozdělení se směrodatnou odchylkou σ = 3 jsme provedli
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 2010 1.týden (20.09.-24.09. ) Data, typy dat, variabilita, frekvenční analýza
Testování hypotéz o parametrech regresního modelu
Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Lineární regresní model kde Y = Xβ + e, y 1 e 1 β y 2 Y =., e = e 2 x 11 x 1 1k., X =....... β 2,
Statistika. Testování hypotéz statistická indukce Úvod do problému. Roman Biskup
Statistika Testování hypotéz statistická indukce Úvod do problému Roman Biskup (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at)email.cz 21. února 2012 Statistika by Birom
Jednofaktorová analýza rozptylu
Jednofaktorová analýza rozptylu David Hampel Ústav statistiky a operačního výzkumu, Mendelova univerzita v Brně Kurz pokročilých statistických metod Global Change Research Centre AS CR, 5 7 8 2015 Tato
5. T e s t o v á n í h y p o t é z
5. T e s t o v á n í h y p o t é z Na základě hodnot náhodného výběru činíme rozhodnutí o platnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlastnostech. Rozeznáváme dva základní typy testů:
Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci
Zpracování dat v edukačních vědách - Testování hypotéz Kamila Fačevicová Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci Obsah seminářů 5.11. Úvod do matematické
Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze
Dobývání znalostí Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze Dobývání znalostí Pravděpodobnost a učení Doc. RNDr. Iveta Mrázová,
STATISTICKÉ HYPOTÉZY
STATISTICKÉ HYPOTÉZY ZÁKLADNÍ POJMY Bodové/intervalové odhady Maruška řešila hodnoty parametrů (průměr, rozptyl atd.) Zde bude Maruška dělat hypotézy (předpoklady) ohledně parametrů Z.S. Výsledek nebude
Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, TESTY DOBRÉ SHODY (angl. goodness-of-fit tests)
Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, např. hmotnost a pohlaví narozených dětí. Běžný statistický postup pro ověření závislosti dvou veličin je zamítnutí jejich
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 2010 1.týden (20.09.-24.09. ) Data, typy dat, variabilita, frekvenční analýza
χ 2 testy. Test nekorelovanosti.
χ 2 testy. Test neorelovanosti. Petr Poší Části doumentu jsou převzaty (i doslovně) z Miro Navara: Pravděpodobnost a matematicá statistia, https://cw.fel.cvut.cz/lib/exe/fetch.php/courses/a6m33ssl/pms_print.pdf
PSY117/454 Statistická analýza dat v psychologii seminář 9. Statistické testování hypotéz
PSY117/454 Statistická analýza dat v psychologii seminář 9 Statistické testování hypotéz Základní výzkumné otázky/hypotézy 1. Stanovení hodnoty parametru =stanovení intervalu spolehlivosti na μ, σ, ρ,
UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie
UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Licenční studium Pythagoras Statistické zpracování experimentálních dat Semestrální práce ANOVA vypracoval: Ing. David Dušek
Zápočtová práce STATISTIKA I
Zápočtová práce STATISTIKA I Obsah: - úvodní stránka - charakteristika dat (původ dat, důvod zpracování,...) - výpis naměřených hodnot (v tabulce) - zpracování dat (buď bodové nebo intervalové, podle charakteru
České vysoké učení technické v Praze Fakulta dopravní Ústav aplikované matematiky, K611. Semestrální práce ze Statistiky (SIS)
České vysoké učení technické v Praze Fakulta dopravní Ústav aplikované matematiky, K611 Semestrální práce ze Statistiky (SIS) Petr Procházka, Jakub Feninec Skupina: 97 Akademický rok: 01/013 Úvod V naší
TECHNICKÁ UNIVERZITA V LIBERCI. Ekonomická fakulta. Semestrální práce. Statistický rozbor dat z dotazníkového šetření školní zadání
TECHNICKÁ UNIVERZITA V LIBERCI Ekonomická fakulta Semestrální práce Statistický rozbor dat z dotazníkového šetření školní zadání Skupina: 51 Vypracovaly: Pavlína Horná, Nikola Loumová, Petra Mikešová,
12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem)
cvičení z PSI 0-4 prosince 06 Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem) Z realizací náhodných veličin X a Y s normálním rozdělením) jsme z výběrů daného rozsahu obdrželi
DVOUVÝBĚROVÉ A PÁROVÉ TESTY Komentované řešení pomocí programu Statistica
DVOUVÝBĚROVÉ A PÁROVÉ TESTY Komentované řešení pomocí programu Statistica Úloha A) koncentrace glukózy v krvi V této části posoudíme pomocí párového testu, zda nový lék prokazatelně snižuje koncentraci
Náhodné veličiny, náhodné chyby
Náhodné veličiny, náhodné chyby Máme náhodnou veličinu X, jejíž vlastnosti zkoumáme. Pokud známe její rozložení (např. z nějaké dřívější studie) nebo alespoň předpokládáme znalost rozložení, můžeme ji
Testování statistických hypotéz. Obecný postup
poznámky k MIII, Tomečková I., poslední aktualizace 9. listopadu 016 9 Testování statistických hypotéz Obecný postup (I) Vyslovení hypotézy O datech vyslovíme doměnku, kterou chceme ověřit statistickým
Chyby měření 210DPSM
Chyby měření 210DPSM Jan Zatloukal Stručný přehled Zdroje a druhy chyb Systematické chyby měření Náhodné chyby měření Spojité a diskrétní náhodné veličiny Normální rozdělení a jeho vlastnosti Odhad parametrů
Název testu Předpoklady testu Testová statistika Nulové rozdělení. ( ) (p počet odhadovaných parametrů)
VYBRANÉ TESTY NEPARAMETRICKÝCH HYPOTÉZ TESTY DOBRÉ SHODY Název testu Předpoklady testu Testová statistika Nulové rozdělení test dobré shody Očekávané četnosti, alespoň 80% očekávaných četností >5 ( ) (p
Cvičení ze statistiky - 9. Filip Děchtěrenko
Cvičení ze statistiky - 9 Filip Děchtěrenko Minule bylo.. Dobrali jsme normální rozdělení Tyhle termíny by měly být známé: Inferenční statistika Konfidenční intervaly Z-test Postup při testování hypotéz
Tomáš Karel LS 2012/2013
Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není
STATISTICKÉ TESTY VÝZNAMNOSTI
STATISTICKÉ TESTY VÝZNAMNOSTI jsou statistické postupy, pomocí nichž ověřujeme, zda mezi proměnnými existuje vztah (závislost, rozdíl). Pokud je výsledek šetření statisticky významný (signifikantní), znamená
STATISTICKÉ TESTY VÝZNAMNOSTI
STATISTICKÉ TESTY VÝZNAMNOSTI jsou statistické postupy, pomocí nichž ověřujeme, zda mezi proměnnými existuje vztah (závislost, rozdíl). Pokud je výsledek šetření statisticky významný (signifikantní), znamená
VYUŽITÍ PRAVDĚPODOBNOSTNÍ METODY MONTE CARLO V SOUDNÍM INŽENÝRSTVÍ
VYUŽITÍ PRAVDĚPODOBNOSTNÍ METODY MONTE CARLO V SOUDNÍM INŽENÝRSTVÍ Michal Kořenář 1 Abstrakt Rozvoj výpočetní techniky v poslední době umožnil také rozvoj výpočetních metod, které nejsou založeny na bázi