Základní statistické metody v rizikovém inženýrství

Podobné dokumenty
Co je to statistika? Úvod statistické myšlení. Základy statistického hodnocení výsledků zkoušek. Petr Misák

PRAVDĚPODOBNOST A STATISTIKA

Testování statistických hypotéz

Statistické metody - nástroj poznání a rozhodování anebo zdroj omylů a lží

Charakteristika datového souboru

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

, Brno Hanuš Vavrčík Základy statistiky ve vědě

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Testování statistických hypotéz

STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky)

Pravděpodobnost a aplikovaná statistika

Regresní analýza 1. Regresní analýza

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

Náhodná veličina a rozdělení pravděpodobnosti

Testy statistických hypotéz

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY

Zápočtová práce STATISTIKA I

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

VYBRANÉ DVOUVÝBĚROVÉ TESTY. Martina Litschmannová

Statistická analýza jednorozměrných dat

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D.

4ST201 STATISTIKA CVIČENÍ Č. 7

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

Testování hypotéz. 4. přednáška

Jednofaktorová analýza rozptylu

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika

Chyby měření 210DPSM

12. cvičení z PST. 20. prosince 2017

Normální (Gaussovo) rozdělení

Jednofaktorová analýza rozptylu

Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012. Tutoriál č. 4: Exploratorní analýza. Jan Kracík

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B

Normální (Gaussovo) rozdělení

Me neˇ nezˇ minimum ze statistiky Michaela S ˇ edova KPMS MFF UK Principy medicı ny zalozˇene na du kazech a za klady veˇdecke prˇı pravy 1 / 33

TECHNICKÁ UNIVERZITA V LIBERCI. Ekonomická fakulta. Semestrální práce. Statistický rozbor dat z dotazníkového šetření školní zadání

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Statistika, Biostatistika pro kombinované studium. Jan Kracík

Porovnání dvou výběrů

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Jednovýběrový Wilcoxonův test a jeho asymptotická varianta (neparametrická obdoba jednovýběrového t-testu)

Návrh a vyhodnocení experimentu

Vybraná rozdělení náhodné veličiny

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

Ing. Michael Rost, Ph.D.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

= = 2368

PRAVDĚPODOBNOST A STATISTIKA. Neparametrické testy hypotéz čast 1

Stručný úvod do testování statistických hypotéz

Tomáš Karel LS 2012/2013

Testování statistických hypotéz. Obecný postup

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně

Úvod do teorie odhadu. Ing. Michael Rost, Ph.D.

Přednáška IX. Analýza rozptylu (ANOVA)

DVOUVÝBĚROVÉ A PÁROVÉ TESTY Komentované řešení pomocí programu Statistica

PSY117/454 Statistická analýza dat v psychologii seminář 9. Statistické testování hypotéz

P13: Statistické postupy vyhodnocování únavových zkoušek, aplikace normálního, Weibullova rozdělení, apod.

Testování statistických hypotéz

Regresní a korelační analýza

Praktická statistika. Petr Ponížil Eva Kutálková

Přednáška 9. Testy dobré shody. Grafická analýza pro ověření shody empirického a teoretického rozdělení

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

Aproximace binomického rozdělení normálním

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci

Cvičení ze statistiky - 9. Filip Děchtěrenko

Tomáš Karel LS 2012/2013

15. T e s t o v á n í h y p o t é z

MÍRY ZÁVISLOSTI (KORELACE A REGRESE)

E(X) = np D(X) = np(1 p) 1 2p np(1 p) (n + 1)p 1 ˆx (n + 1)p. A 3 (X) =

Statistika. Testování hypotéz statistická indukce Úvod do problému. Roman Biskup

VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky

11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.

8. Normální rozdělení

MATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci

Cvičení ze statistiky - 8. Filip Děchtěrenko

ROZDĚLENÍ NÁHODNÝCH VELIČIN

Tomáš Karel LS 2012/2013

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

Téma 22. Ondřej Nývlt

STATISTICKÉ ODHADY Odhady populačních charakteristik

Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie STATISTICKÉ ZPRACOVÁNÍ EXPERIMENTÁLNÍCH DAT

INDUKTIVNÍ STATISTIKA

Všechno, co jste chtěli vědět z teorie pravděpodobnosti, z teorie informace a

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

Inovace bakalářského studijního oboru Aplikovaná chemie

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test

Regresní a korelační analýza

Přednáška 9. Testy dobré shody. Grafická analýza pro ověření shody empirického a teoretického rozdělení

Transkript:

Základní statistické metody v rizikovém inženýrství Petr Misák Ústav stavebního zkušebnictví Fakulta stavební, VUT v Brně misak.p@fce.vutbr.cz

Základní pojmy Jev souhrn skutečností zobrazujících ucelenou nebo uceleně popsanou část objektivní reality. Každý jev má svou podstatu. Děj Jev závislý na čase Realizace jevu jedno z opakování nebo jedna z podob jevu Popis jevu Analytický Empirický

Základní pojmy Událost Výskyt realizace jevu, popř. výskyt jednotlivých realizací několika jevů současně nebo v témže místě prostoru. Může být definována: bodem Intervalem Pravděpodobnost míra nastoupení realizace jevu nebo události Jistota Všechny skutečnosti jsou jednoznačné a výsledek činnosti, o níž se rozhodovalo, se nemůže od předpokladu nijak odchýlit.

Rizikologie věda o nejistotách Nejistota nepoznané známé Neurčitost nepoznané neznámé Základní pojmy Nejistoty a neurčitosti vedou k tomu, že se v rizikologii zcela programově při všech operacích a na všech úrovních s odhady.

Co je to statistika? Statistika je jako bikiny. Odhalí téměř vše, ale to nejdůležitější nám zůstane skryto. (autor neznámý) Statistika nuda je, má však cenné údaje.. (Zdeněk Svěrák) Statistika je nauka, která nám říká jak získat přesné informace z nepřesných čísel. (Jan Hendl) Nevěřím statistice, kterou jsem sám nezfalšoval. (Podvržený výrok Winstona Churchilla rozšířil Joseph Goebbels.) Statistiky už máme natolik sofistikované, že z nich lze doložit prakticky cokoliv. (Jan Keller) Statistické myšlení bude jednoho dne pro zdatného občana právě tak nezbytné, jako je schopnost číst a psát. (H. G. Wells)

Úvod statistické myšlení Jasné vymezení problému, který má být řešen. Stanovení rozhodující veličiny jakostní vlastnosti a způsobu jejího zjišťování. Zabezpečení stálých podmínek při jejím zjišťování. Uvědomění si, že výsledky měření vykazují jistou (často jen částečně odstranitelnou) variabilitu. Vytváření podskupin homogenních výsledků, zahrnujících pouze náhodnou proměnlivost. Respektovat náhodné odebírání jednotek do náhodných výběrů, tak aby každá jednotka v souboru měla stejnou pravděpodobnost, že může být vybrána do výběru.

Úvod statistické myšlení Studium nejen celkové variability, ale i variability uvnitř podskupin a variability mezi podskupinami (v čase). Provádění dostatečného počtu pozorování. Vážení rizik chybných závěrů, činěných na základě neúplné informace z náhodných výběrů. Prezentování dat přehledně, ve zhuštěné formě číselně, nebo graficky. Charakterizování dat číselně, udáním polohy na číselné ose a míry proměnlivosti variability. Uvědomění si nejen variability studované náhodné veličiny, ale i z ní odvozené variability vypočítaných statistik výběrových charakteristik.

Úvod statistické myšlení 45 40 35 30 25 20 15 10 5 0 A B

Popisná statistika Informace obsažené ve velkém počtu dat se jeví lidskému pozorovateli jako nepřehledné. Úkolem popisné statistiky je tuto informaci zhustit do snadněji vnímatelné formy různých tabulek, grafů, číselných a jiných charakteristik.

sběr údajů, jejich popis a analýzu rozšíření platnosti závěrů z malého počtu vzorků na soubor, z něhož vzorky pocházejí zpracování a vyhodnocování informací o realitě, která není známá

Věrohodnost závěrů analýzy vyžaduje, aby: výrobní dávky byly vyrobeny za stejných podmínek, podmínky pokusu byly specifikovány předem a byly dodržovány během celého pokusu, vzorky byly odebrány náhodně a byly reprezentativní pro soubor, z něhož jsou odebrány.

Náhodný pokus je takový pokus, který může dávat různé výsledky i při dodržení stejných podmínek Náhodný jev je tvrzení o výsledku náhodného pokusu, o kterém lze po jeho uskutečnění jednoznačně rozhodnout, zda je či není pravdivé. Pravděpodobnost míra nastoupení náhodného jevu

Výsledky náhodného pokusu (realizace náhodné veličiny) tedy ani realizace náhodného jevu nelze s jistotou předpovědět. Náhodná veličina X je reálná proměnná, která nabývá náhodně reálných číselných hodnot x. spojitá diskrétní

Náhodná veličina je jednoznačně určena svou distribuční funkcí: F ( x ) P ( X x ) Distribuční funkce určuje tzv. rozdělení pravděpodobnosti náhodné veličiny spojitá náhodná veličina spojité rozdělení pravděpodobnosti diskrétní náhodná veličina diskrétní rozdělení pravděpodobnosti

Spojitá náhodná veličina: 1. 2. hustota pravděpodobnosti Vlastnosti: f ( x ) d x 1 f ( x ) F `( x ) F ( x ) f ( t ) d t x 3. 4. P ( a X b ) P ( a X b ) P ( a X b ) P ( a X b ) b f ( x ) d x F ( b ) F ( a ) a P ( X c ) 0

Diskrétní rozdělení pravděpodobnosti Binomické rozdělení náhodný výběr s vracením Hypergeometrické rozdělení náhodný výběr bez vracení Poissonovo rozdělení Spojité rozdělení pravděpodobnosti Rovnoměrné rozdělení Normální rozdělení funkční charakteristiky: střední hodnota µ směrodatná odchylka σ Studentovo rozdělení (t rozdělení)

hustota pravděpodobnosti

distribuční funkce F ( x ) f ( t ) d t x

Kvantil je hodnota, která rozděluje soubor hodnot určitého statistického znaku na dvě části, jedna obsahuje ty hodnoty, které jsou menší (nebo stejné) než tento kvantil, a druha část naopak obsahuje hodnoty, které jsou větší (nebo stejné) než kvantil. X spojitá náhodná veličina s distribuční funkcí F(x) její P-kvantil (P*100% kvantil) je číslo x P, pro které platí: P = F(x P )

Používají se tyto kvantily: medián (prostřední kvantil): x 0,5 dolní kvartil: x 0,25 horní kvartil: x 0,75 decily: x 0,1, x 0,2, percentily: x 0,01, x 0,02,

Náhodný výběr statistický soubor (x 1,, x n ) získáme n-krát opakováním náhodného pokusu > pozorování náhodné veličiny = pozorovaná hodnota náhodného výběru (X 1,, X n ) Realizací náhodného výběru získáme obecně různé statistické soubory. Statistika (výběrová charakteristika) = funkce náhodného výběru T(X 1,, X n )

odhady parametrů rozdělení Skutečnou hodnotu parametrů rozdělení pravděpodobnosti náhodné veličiny obvykle neznáme. Odhadujeme ji pomocí statistického souboru Odhad: Nestranný Stranný (vychýlený) Bodový odhad parametru je pozorovaná hodnota t = T(x 1,,x n ) na statistickém souboru (x 1,,x n )

odhady parametrů rozdělení Bodové odhady: Střední hodnota aritmetický průměr Směrodatná odchylka výběrová směrodatná odchylka Rozptyl druhá mocnina výběrové směrodatné odchylky

odhady parametrů rozdělení Intervalový odhad (interval spolehlivosti, konfidenční interval) pro parametr ε se spolehlivostí 1 α, kde 0;1 je interval <t 1; t 2 >, kde hodnoty t 1 a t 2 jsou dané statistickým souborem Spolehlivost 1 α volíme 0,95 nebo 0,99 Intervalový odhad střední hodnoty normálního rozdělení: s s x t ; x t 1 / 2 1 / 2 n 1 n 1

Testování statistických hypotéz Při sledování náhodných veličin jsme často nuceni ověřit určité předpoklady či domněnky o jejich vlastnostech pomocí jejích pozorovaných hodnot. Statistická hypotéza H je tvrzení o vlastnostech rozdělení pravděpodobnosti pozorované náhodné veličiny X.

Testování statistických hypotéz Postup jímž ověřujeme danou hypotézu, se nazývá test statistické hypotézy. H: η = η 0 nulová hypotéza H A : η η 0 alternativní hypotéza volíme dle požadavků úlohy Hypotéza: Dvoustranná Jednostranná

Testování statistických hypotéz Pro testování hypotézy H: η = η 0 proti nějaké zvolené alternativní hypotéze se konstruuje vhodné testovací kritérium T(X 1,,X n ). Obor hodnot testovacího kritéria T se za předpokladu, že platí hypotéza H, rozdělí na dvě podmnožiny: Kritický obor W α Obor nezamítnutí W α Hladina významnosti α pravděpodobnost toho, že testovací kritérium nabude hodnotu z kritického oboru.

Testování statistických hypotéz Rozhodnutí o hypotéze Jestliže pozorovaná hodnota testovacího kritéria t = T(x 1,,x n ) na statistické souboru (x 1,,x n ) padne do kritického oboru, zamítáme hypotézu H současně nezamítáme alternativní hypotézu H A. Chyby Chyba prvního druhu hypotéza H platí a my ji zamítáme. Pravděpodobnost této chyby je hladina významnosti α. Chyba druhého druhu Hypotéza H neplatí a my ji nezamítáme. Pravděpodobnost této chyby se nazývá síla testu.

Testování statistických hypotéz Obvyklým výstupem většiny softwarů, které umožňují testovaní statistických hypotéz, není přímo zamítnutí či nezamítnutí hypotézy, ale tzv. P - hodnota. P - hodnota udává mezní hladinu významnosti, při které bychom danou hypotézu ještě zamítali. Hypotézu H zamítáme na hladině významnosti, jestliže P - hodnota je menší než α.

Testování statistických hypotéz Studentův t-test Hypotézy: zda normální rozdělení, z něhož pochází náhodný výběr, má určitou konkrétní střední hodnotu, přičemž rozptyl je neznámý; Zda dvě normální rozdělení se stejným (třeba i neznámým) rozptylem, z nichž pocházejí dva nezávislé náhodné výběry mají stejné střední hodnoty (případně lišící se o určitou hodnotu).

Testování statistických hypotéz Studentův t-test Jednovýběrový H 0 : µ = µ 0 Párový testuje se rozdíl středních hodnot, stejný rozsah Dvouvýběrový dva výběry, různý rozsah

Studentův t-test Testování statistických hypotéz

Testování statistických hypotéz Studentův t-test

Studentův t-test Testování statistických hypotéz

Testování statistických hypotéz ANOVA (Analysis Of Variance) Srovnáváme, zda rychlost prostupu ultrazvukových vln je ve třech různých částech ŽB konstrukce stejná. Obecně srovnáváme 2 a více skupin Proč nesrovnat po dvojicích? -> roste šance, že uděláme chybu prvního druhu. => je výhodnější testovat pouze jednu hypotézu

Testování statistických hypotéz ANOVA (Analysis Of Variance) Hypotéza: H 0 : 1 = 2 = 3 =... = k. Předpoklad homogenity variance (a normality). H A : není pravda, že jsou všechny střední hodnoty stejné (tedy alespoň jedna se liší od ostatních)

Testování statistických hypotéz ANOVA (Analysis Of Variance) Nejjednodušší varianta: Single Factor ANOVA Model: X ij = μ + α i + ε ij náhodná variabilita N(0,σ 2 ) Společná střední hodnota posunutí i-té skupiny proti společnému průměru H 0 je tedy možné vyjádřit α i = 0 pro všechna i (jinými slovy - posunutí mezi skupinami není, je tam jen náhodná variabilita)

Testování statistických hypotéz ANOVA (Analysis Of Variance) příklad : Porovnání tří částí konstrukce rychlost šíření ultrazvukových vln

Testování statistických hypotéz

Testování statistických hypotéz

Testování statistických hypotéz

Testy dobré shody Testování a fitování rozdělení pravděpodobnosti

Testy dobré shody Testování a fitování rozdělení pravděpodobnosti Anderson Darling Ryan Joiner (Shapiro Wilk) Kolmogorov - Smirnov

Regresní analýza Hledání a zkoumání závislostí proměnných, jejichž hodnoty získáme při realizaci experimentu. např.: vztah mezi nepřímou a přímou metodou zkoušení y Proložení bodového diagramu x

Regresní analýza Závislost mezi veličinami X a Y vyjadřuje regresní funkce: y = ϕ(x; β), kde β = (β 1,, β m ) jsou regresní koeficienty

Regresní analýza Pro určení neznámých regresních koeficientů β = (β 1,, β m ) minimalizujeme tzv. reziduální součet čtverců: S * y x, i i i 1 => Metoda nejmenších čtverců n 2 Lineární regresní funkce: m y f x j j j 1

Dotazy? Děkuji za pozornost! Petr Misák misak.p@fce.vutbr.cz