10 Přednášející: Mgr. Rudolf B. Blažek, Ph.D. prof. RNDr. Roman Kotecký, DrSc. Katedra počítačových systémů Katedra teoretické informatiky Fakulta informačních technologií České vysoké učení technické v Praze Rudolf Blažek 2011 Pravděpodobnost a statistika BI-PST, LS 2010/11 Evropský sociální fond Praha & EU: Investujeme do vaší budoucnos@
Testování Hypotéz 2
Testování hypotézy: je mince vyvážená? Otestujte, zda mince je vyvážená: P(H)=1/2 Hodíme si mincí opakovaně... n krát Spočítáme, kolikrát padla panna (Head) Odhadneme P(H) jako proporci panen pn = #Heads / n Pokud pn je blízko 1/2, uvěříme, že mince je vyvážená 3
Co to znamená? Pokud pn je blízko 1/2, uvěříme, že mince je vyvážená? Jak blízko? Jak jsme si jisti? 4
Statistical Aspects of Intrusion Detection Review of Hypothesis Testing Silný zákon velkých čísel pro minci Definujme X jako indikátor panny (Head) Xi = 0 pokud i-tý hod je orel T Xi = 1 pokud i-tý hod je panna H Střední hodnota je konečná µ = E(Xi) = 1 P(H) + 0 P(T) = P(H) SLLN: Proporce panen v n hodech bude konvergovat X n = 1 n (X 1 + X 2 + + X n )! µ = P (H) pro n!1 Silný zákon funguje pro každý experiment (s pravděp. 1) Statistics for Informatics MI-SPI, ZS 2010/11 5
Silný zákon velkých čísel pro minci 0.75 0.25 0 20 40 60 80 100 6
Testování hypotézy: je mince vyvážená? pn = proporce panen v n hodech Pokud pn je blízko 1/2, uvěříme, že mince je vyvážená Jak blízko? SLLN: pn se časem přiblíží P(H) (pro každý experiment) Takže blízkost k 1/2 opravdu naznačuje vyváženost mince Jak jisti jsme si, že mince není falešná? Daleko od 1/2 = nezvykle daleko od 1/2 Proto potřebujeme informace od rozdělení pn 7
Centrální limitní věta Uvažujme náhodné veličiny X1, X2, X3,..., které jsou nezávislé a stejně rozdělené (i.i.d.) mají konečnou střední hodnotu µ = E Xi a konečný rozptyl σ 2 = Var Xi Pak výběrové průměry mají přibližně normální (Gaussovo) rozdělení: X n = 1 n (X 1 + X 2 + + X n ) N(µ, ) n přibližně pro dostatečně velké n. Podobně P n * * * * * * * * * * * * * * pro velké n. i=1 X approx. i N(n µ, n 2 ) 2 Rudolf Blažek, Ph.D. (ČVUT) Pravděpodobnost a statistika BI-PST, LS2010/11 8
Vyvážená mince: n=2 0.5 0.4 0.3 0.2 0.1 90% 0.2 0.4 0.6 0.8 1.0 9
Vyvážená mince: n=5 0.30 0.25 0.20 0.15 0.10 0.05 90% 0.2 0.4 0.6 0.8 1.0 10
Vyvážená mince: n=10 0.25 0.20 Nezvykle daleko 0.15 0.10 0.05 90% 0.2 0.4 0.6 0.8 1.0 11
Vyvážená mince: n=20 0.15 Nezvykle daleko Nezvykle daleko 0.10 0.05 90% 0.2 0.4 0.6 0.8 1.0 12
Vyvážená mince: n=30 0.14 0.12 0.10 Nezvykle daleko Nezvykle daleko 0.08 0.06 0.04 0.02 90% 0.2 0.4 0.6 0.8 1.0 13
Vyvážená mince: n=1000 0.025 0.020 0.015 Nezvykle daleko Nezvykle daleko 0.010 0.005 90% 0.2 0.4 0.6 0.8 1.0 14
Testování hypotézy: je mince vyvážená? Hypotéza: *P(H) = 1/2 Alternativa: * P(H) 1/2 Test: Spočteme výběrový průměr pn (u mince proporce panen) Zamítneme hypotézu P(H) = 1/2 pokud pn je mimo 90% oblast ve středu příslušné Normalní hustoty Pravděpodobnost chyby 10% (časté volby: 5% či 1%) Jinak P(H) = 1/2 nemůžeme zamítnout Pravděpodobnost chyby je neznámá!! (Ale nejmenší možná Neyman-Pearson Lemma) 15
Rozdělení výběrového průměru Přibližné rozdělení je známo pomocí CLV Z = X n µ / p n N(0, 1) α/2 1 α α/2 0-2 2 -zα/2 zα/2 Rudolf Blažek, Ph.D. (ČVUT) Pravděpodobnost a statistika BI-PST, LS2010/11 16
Vzorce pro test Hypotéza: *µ = µ0 (1/2 pro vyváženou minci:) CLT: p n = X n = 1 n (X 1 + X 2 + + X n ) N(µ 0, přibližně pro velké n 2 n ) Alternativa: * µ µ0 (1-α)100% oblast pro X n (nebo pn): µ 0 ± z /2 p n 99.73%:*zα/2 = 3* (tzv. six-sigma v průmyslu) 99%: * zα/2 = 2.58 95%: * zα/2 = 1.96 17
Testování hypotéz Bezpečnostní senzor pravidelně monitoruje počítačovou učebnu. Pokud se v učebně nikdo nepohybuje, senzor vrací signál X = W, kde W je normálně rozdělená veličina se střední hodnotou 0 a rozptylem 2 = 2.3. V případě pohybu zařízení vrací signál X = W +, kde > 0 je neznámá konstanta. Rudolf Blažek, Ph.D. (ČVUT) Pravděpodobnost a statistika BI-PST, LS2010/11 18
Testování hypotéz Na základě n = 35 nezávislých pozorování jsme spočetli konfidenční intervaly pro µ = EX takto: 90% interval A: (0.405456, 5.394544) 95% interval B: ( 0.07243255, 5.87243255) 1. Otestujte hypotézu H 0 : µ = 0 proti alternativě H A : µ>0 pomocítěchto intervalů, tak aby pravděpodobnost chyby prvního druhu (tedy chybné zamítnutí H 0 ) byla 5%. 2. Použili jste intervalu A nebo B. Proč? Rada: Jedná se o jednostrannou alternativu. Rudolf Blažek, Ph.D. (ČVUT) Pravděpodobnost a statistika BI-PST, LS2010/11 19
Testování hypotéz Před bouřkou se obvykle zvýší rozptyl naměřených hodnot síly větru. Pokud se blíží bouřka, rozptyl 2 překročí 4.5 m/s. Na základě n = 200 nezávislých měření jsme spočetli následující konfidenční intervaly pro 2 = Var X: 99% interval A: (2.64, 4.43) 98% interval B: (2.7, 4.31) 1. Blíží se bouřka? Otestujte hypotézu H 0 : 2 apple 4.5 versus alternativa H A : 2 > 4.5 tak, aby pravděpodobnost chyby prvního druhu 1%. 2. Použili jste intervalu A nebo B. Proč? Rudolf Blažek, Ph.D. (ČVUT) Pravděpodobnost a statistika BI-PST, LS2010/11 20