Cvičení 10. Přednášející: Mgr. Rudolf B. Blažek, Ph.D. prof. RNDr. Roman Kotecký, DrSc.

Podobné dokumenty
Intervalové Odhady Parametrů II Testování Hypotéz

Intervalové Odhady Parametrů

Mgr. Rudolf Blažek, Ph.D. prof. RNDr. Roman Kotecký Dr.Sc.

Cvičení 11. Přednášející: Mgr. Rudolf B. Blažek, Ph.D. prof. RNDr. Roman Kotecký, DrSc.

Cvičení 5. Přednášející: Mgr. Rudolf B. Blažek, Ph.D. prof. RNDr. Roman Kotecký, DrSc.

Odhady Parametrů Lineární Regrese

Cvičení ze statistiky - 8. Filip Děchtěrenko

prof. RNDr. Roman Kotecký DrSc., Dr. Rudolf Blažek, PhD Pravděpodobnost a statistika Katedra teoretické informatiky Fakulta informačních technologií

Cvičení 1. Přednášející: Mgr. Rudolf B. Blažek, Ph.D. prof. RNDr. Roman Kotecký, DrSc.

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze

Cvičení 3. Přednášející: Mgr. Rudolf B. Blažek, Ph.D. prof. RNDr. Roman Kotecký, DrSc.

Všechno, co jste chtěli vědět z teorie pravděpodobnosti, z teorie informace a

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci

12. cvičení z PST. 20. prosince 2017

Výběrové charakteristiky a jejich rozdělení

Příklady na testy hypotéz o parametrech normálního rozdělení

4EK211 Základy ekonometrie

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Pravděpodobnost a statistika (BI-PST) Cvičení č. 4

Cvičení ze statistiky - 9. Filip Děchtěrenko

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

Pravděpodobnost a statistika (BI-PST) Cvičení č. 7

Pravděpodobnost a statistika (BI-PST) Cvičení č. 2

ROZDĚLENÍ SPOJITÝCH NÁHODNÝCH VELIČIN

12. prosince n pro n = n = 30 = S X

PRAVDĚPODOBNOST A STATISTIKA

PSY117/454 Statistická analýza dat v psychologii přednáška 8. Statistické usuzování, odhady

Úvod do teorie odhadu. Ing. Michael Rost, Ph.D.

Testování hypotéz. testujeme (většinou) tvrzení o parametru populace. tvrzení je nutno předem zformulovat

ÚVOD DO TEORIE ODHADU. Martina Litschmannová

Charakterizují kvantitativně vlastnosti předmětů a jevů.

KGG/STG Statistika pro geografy

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B

Normální (Gaussovo) rozdělení

Cvičení ze statistiky - 7. Filip Děchtěrenko

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

populace soubor jednotek, o jejichž vlastnostech bychom chtěli vypovídat letní semestr Definice subjektech.

Matematická statistika Zimní semestr Testy o proporci

Statistická analýza dat v psychologii. Věci, které můžeme přímo pozorovat, jsou téměř vždy pouze vzorky. Alfred North Whitehead

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D.

Testy. Pavel Provinský. 19. listopadu 2013

Pravděpodobnost a statistika (BI-PST) Cvičení č. 9

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

Testování statistických hypotéz. Obecný postup

PRAVDĚPODOBNOST A STATISTIKA

Pravděpodobnost a statistika

Přednáška. Další rozdělení SNP. Limitní věty. Speciální typy rozdělení. Další rozdělení SNP Limitní věty Speciální typy rozdělení

Statistika. Teorie odhadu statistická indukce. Roman Biskup. (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at) .

1. Klasická pravděpodobnost

prosince oboustranný symetrický 95% interval spolehlivosti pro střední hodnotu životnosti τ. X i. X = 1 n.. Podle CLV má veličina

Testování statistických hypotéz

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.

LIMITNÍ VĚTY DALŠÍ SPOJITÁ ROZDĚLENÍ PR. 8. cvičení

7. Analýza rozptylu.

Waldovy testy, vlastnosti a Operační charakteristika

Charakteristika datového souboru

Minikurz aplikované statistiky. Minikurz aplikované statistiky p.1

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

Pravděpodobnost a aplikovaná statistika

Statistika. Testování hypotéz statistická indukce Úvod do problému. Roman Biskup

Statistika, Biostatistika pro kombinované studium. Jan Kracík

Náhodné (statistické) chyby přímých měření

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Testování hypotéz o parametrech regresního modelu

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika t-test

Vybraná rozdělení náhodné veličiny

Testování hypotéz o parametrech regresního modelu

1 Klasická pravděpodobnost. Bayesův vzorec. Poslední změna (oprava): 11. května 2018 ( 6 4)( 43 2 ) ( 49 6 ) 3. = (a) 1 1 2! + 1 3!

Tomáš Karel LS 2012/2013

KGG/STG Statistika pro geografy

2 ) 4, Φ 1 (1 0,005)

Bootstrap - konfidenční intervaly a testy

BAYESOVSKÉ ODHADY. Michal Friesl V NĚKTERÝCH MODELECH. Katedra matematiky Fakulta aplikovaných věd Západočeská univerzita v Plzni

Pravděpodobnost a statistika (BI-PST) Cvičení č. 1

Testování statistických hypotéz

Normální (Gaussovo) rozdělení

MATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci

5 Parametrické testy hypotéz

Statistika II. Jiří Neubauer

12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem)

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

KMA/P506 Pravděpodobnost a statistika KMA/P507 Statistika na PC

z Matematické statistiky 1 1 Konvergence posloupnosti náhodných veličin

Návrh a vyhodnocení experimentu

Pravděpodobnost, náhoda, kostky

Příklad datového souboru. Pravděpodobnost vs. statistika. Formální definice. Teorie odhadu

Vlastnosti odhadů ukazatelů způsobilosti

Aproximace binomického rozdělení normálním

Statistická analýza jednorozměrných dat

15. T e s t o v á n í h y p o t é z

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika

Transkript:

10 Přednášející: Mgr. Rudolf B. Blažek, Ph.D. prof. RNDr. Roman Kotecký, DrSc. Katedra počítačových systémů Katedra teoretické informatiky Fakulta informačních technologií České vysoké učení technické v Praze Rudolf Blažek 2011 Pravděpodobnost a statistika BI-PST, LS 2010/11 Evropský sociální fond Praha & EU: Investujeme do vaší budoucnos@

Testování Hypotéz 2

Testování hypotézy: je mince vyvážená? Otestujte, zda mince je vyvážená: P(H)=1/2 Hodíme si mincí opakovaně... n krát Spočítáme, kolikrát padla panna (Head) Odhadneme P(H) jako proporci panen pn = #Heads / n Pokud pn je blízko 1/2, uvěříme, že mince je vyvážená 3

Co to znamená? Pokud pn je blízko 1/2, uvěříme, že mince je vyvážená? Jak blízko? Jak jsme si jisti? 4

Statistical Aspects of Intrusion Detection Review of Hypothesis Testing Silný zákon velkých čísel pro minci Definujme X jako indikátor panny (Head) Xi = 0 pokud i-tý hod je orel T Xi = 1 pokud i-tý hod je panna H Střední hodnota je konečná µ = E(Xi) = 1 P(H) + 0 P(T) = P(H) SLLN: Proporce panen v n hodech bude konvergovat X n = 1 n (X 1 + X 2 + + X n )! µ = P (H) pro n!1 Silný zákon funguje pro každý experiment (s pravděp. 1) Statistics for Informatics MI-SPI, ZS 2010/11 5

Silný zákon velkých čísel pro minci 0.75 0.25 0 20 40 60 80 100 6

Testování hypotézy: je mince vyvážená? pn = proporce panen v n hodech Pokud pn je blízko 1/2, uvěříme, že mince je vyvážená Jak blízko? SLLN: pn se časem přiblíží P(H) (pro každý experiment) Takže blízkost k 1/2 opravdu naznačuje vyváženost mince Jak jisti jsme si, že mince není falešná? Daleko od 1/2 = nezvykle daleko od 1/2 Proto potřebujeme informace od rozdělení pn 7

Centrální limitní věta Uvažujme náhodné veličiny X1, X2, X3,..., které jsou nezávislé a stejně rozdělené (i.i.d.) mají konečnou střední hodnotu µ = E Xi a konečný rozptyl σ 2 = Var Xi Pak výběrové průměry mají přibližně normální (Gaussovo) rozdělení: X n = 1 n (X 1 + X 2 + + X n ) N(µ, ) n přibližně pro dostatečně velké n. Podobně P n * * * * * * * * * * * * * * pro velké n. i=1 X approx. i N(n µ, n 2 ) 2 Rudolf Blažek, Ph.D. (ČVUT) Pravděpodobnost a statistika BI-PST, LS2010/11 8

Vyvážená mince: n=2 0.5 0.4 0.3 0.2 0.1 90% 0.2 0.4 0.6 0.8 1.0 9

Vyvážená mince: n=5 0.30 0.25 0.20 0.15 0.10 0.05 90% 0.2 0.4 0.6 0.8 1.0 10

Vyvážená mince: n=10 0.25 0.20 Nezvykle daleko 0.15 0.10 0.05 90% 0.2 0.4 0.6 0.8 1.0 11

Vyvážená mince: n=20 0.15 Nezvykle daleko Nezvykle daleko 0.10 0.05 90% 0.2 0.4 0.6 0.8 1.0 12

Vyvážená mince: n=30 0.14 0.12 0.10 Nezvykle daleko Nezvykle daleko 0.08 0.06 0.04 0.02 90% 0.2 0.4 0.6 0.8 1.0 13

Vyvážená mince: n=1000 0.025 0.020 0.015 Nezvykle daleko Nezvykle daleko 0.010 0.005 90% 0.2 0.4 0.6 0.8 1.0 14

Testování hypotézy: je mince vyvážená? Hypotéza: *P(H) = 1/2 Alternativa: * P(H) 1/2 Test: Spočteme výběrový průměr pn (u mince proporce panen) Zamítneme hypotézu P(H) = 1/2 pokud pn je mimo 90% oblast ve středu příslušné Normalní hustoty Pravděpodobnost chyby 10% (časté volby: 5% či 1%) Jinak P(H) = 1/2 nemůžeme zamítnout Pravděpodobnost chyby je neznámá!! (Ale nejmenší možná Neyman-Pearson Lemma) 15

Rozdělení výběrového průměru Přibližné rozdělení je známo pomocí CLV Z = X n µ / p n N(0, 1) α/2 1 α α/2 0-2 2 -zα/2 zα/2 Rudolf Blažek, Ph.D. (ČVUT) Pravděpodobnost a statistika BI-PST, LS2010/11 16

Vzorce pro test Hypotéza: *µ = µ0 (1/2 pro vyváženou minci:) CLT: p n = X n = 1 n (X 1 + X 2 + + X n ) N(µ 0, přibližně pro velké n 2 n ) Alternativa: * µ µ0 (1-α)100% oblast pro X n (nebo pn): µ 0 ± z /2 p n 99.73%:*zα/2 = 3* (tzv. six-sigma v průmyslu) 99%: * zα/2 = 2.58 95%: * zα/2 = 1.96 17

Testování hypotéz Bezpečnostní senzor pravidelně monitoruje počítačovou učebnu. Pokud se v učebně nikdo nepohybuje, senzor vrací signál X = W, kde W je normálně rozdělená veličina se střední hodnotou 0 a rozptylem 2 = 2.3. V případě pohybu zařízení vrací signál X = W +, kde > 0 je neznámá konstanta. Rudolf Blažek, Ph.D. (ČVUT) Pravděpodobnost a statistika BI-PST, LS2010/11 18

Testování hypotéz Na základě n = 35 nezávislých pozorování jsme spočetli konfidenční intervaly pro µ = EX takto: 90% interval A: (0.405456, 5.394544) 95% interval B: ( 0.07243255, 5.87243255) 1. Otestujte hypotézu H 0 : µ = 0 proti alternativě H A : µ>0 pomocítěchto intervalů, tak aby pravděpodobnost chyby prvního druhu (tedy chybné zamítnutí H 0 ) byla 5%. 2. Použili jste intervalu A nebo B. Proč? Rada: Jedná se o jednostrannou alternativu. Rudolf Blažek, Ph.D. (ČVUT) Pravděpodobnost a statistika BI-PST, LS2010/11 19

Testování hypotéz Před bouřkou se obvykle zvýší rozptyl naměřených hodnot síly větru. Pokud se blíží bouřka, rozptyl 2 překročí 4.5 m/s. Na základě n = 200 nezávislých měření jsme spočetli následující konfidenční intervaly pro 2 = Var X: 99% interval A: (2.64, 4.43) 98% interval B: (2.7, 4.31) 1. Blíží se bouřka? Otestujte hypotézu H 0 : 2 apple 4.5 versus alternativa H A : 2 > 4.5 tak, aby pravděpodobnost chyby prvního druhu 1%. 2. Použili jste intervalu A nebo B. Proč? Rudolf Blažek, Ph.D. (ČVUT) Pravděpodobnost a statistika BI-PST, LS2010/11 20