} kvantitativní znaky. korelace, regrese. Prof. RNDr. Jana Zvárov. Obecné principy

Podobné dokumenty
} kvantitativní znaky

Odhady parametrů 1. Odhady parametrů

K čemu slouží regrese?

8. Analýza rozptylu.

Závislost slovních znaků

Odhady parametrů polohy a rozptýlení pro často se vyskytující rozdělení dat v laboratoři se vyčíslují podle následujících vztahů:

PRAVDĚPODOBNOST A STATISTIKA

Pravděpodobnost a aplikovaná statistika

EKONOMETRIE 9. přednáška Zobecněný lineární regresní model

STATISTIKA. Statistika se těší pochybnému vyznamenání tím, že je nejvíce nepochopeným vědním oborem. H. Levinson

Lekce 2 Jednoduchý lineární regresní model

P2: Statistické zpracování dat

Cvičení 6.: Výpočet střední hodnoty a rozptylu, bodové a intervalové odhady střední hodnoty a rozptylu

9. Měření závislostí ve statistice Pevná a volná závislost

Cvičení 6.: Bodové a intervalové odhady střední hodnoty, rozptylu a koeficientu korelace, test hypotézy o střední hodnotě při známém rozptylu

6 Intervalové odhady. spočteme aritmetický průměr, pak tyto průměry se budou chovat jako by pocházely z normálního. nekonečna.

Testujeme hypotézu: proti alternativě. Jednoduché třídění:

Náhodný výběr 1. Náhodný výběr

i 1 n 1 výběrový rozptyl, pro libovolné, ale pevně dané x Roznačme n 1 Téma 6.: Základní pojmy matematické statistiky

12. N á h o d n ý v ý b ě r

Základy statistiky. Zpracování pokusných dat Praktické příklady. Kristina Somerlíková

vají statistické metody v biomedicíně

vají statistické metody v biomedicíně Literatura Statistika v biomedicínsk nském výzkumu a ve zdravotnictví

Pro statistické šetření si zvolte si statistický soubor např. všichni žáci třídy (několika tříd, školy apod.).

Mezní stavy konstrukcí a jejich porušov. Hru IV. Milan RůžR. zbynek.hruby.

1. Základy počtu pravděpodobnosti:

PRAVDĚPODOBNOST A STATISTIKA

Intervalové odhady parametrů

L A B O R A T O R N Í C V I Č E N Í Z F Y Z I K Y

Tento projekt je spolufinancován Evropským sociálním fondem a Státním rozpočtem ČR InoBio CZ.1.07/2.2.00/

Popisná statistika. Zdeněk Janák 9. prosince 2007

Pravděpodobnostní model doby setrvání ministra školství ve funkci

Popisná statistika - zavedení pojmů. 1 Jednorozměrný statistický soubor s kvantitativním znakem

MÍRY ZÁVISLOSTI (KORELACE A REGRESE)

Statistické metody ve veřejné správě ŘEŠENÉ PŘÍKLADY

Kontingenční tabulky, korelační koeficienty

Pravděpodobnost a aplikovaná statistika

INDUKTIVNÍ STATISTIKA

Přednáška II. Lukáš Frýd

PRAVDĚPODOBNOST A STATISTIKA. Bodové a intervalové odhady

VYSOCE PŘESNÉ METODY OBRÁBĚNÍ

Pravděpodobnost a aplikovaná statistika

V. Normální rozdělení

Číselné charakteristiky náhodných veličin

You created this PDF from an application that is not licensed to print to novapdf printer (

Deskriptivní statistika 1

ZÁKLADNÍ STATISTICKÉ VÝPOČTY (S VYUŽITÍM EXCELU)

Regresní a korelační analýza

Pravděpodobnost vs. statistika. Data. Teorie pravděpodobnosti pracuje s jednou nebo více teoretickými náhodnými

1 POPISNÁ STATISTIKA V PROGRAMU MS EXCEL

Statistika (KMI/PSTAT)

Regresní a korelační analýza

PRAVDĚPODOBNOST A STATISTIKA

Přednáška VIII. Testování hypotéz o kvantitativních proměnných

Měření závislosti statistických dat

13 Popisná statistika

REGRESNÍ DIAGNOSTIKA. Regresní diagnostika

Odhady parametrů základního souboru. Ing. Michal Dorda, Ph.D.

Metody zkoumání závislosti numerických proměnných

MĚŘENÍ STATISTICKÝCH ZÁVISLOSTÍ

3. Lineární diferenciální rovnice úvod do teorie

14. B o d o v é o d h a d y p a r a m e t r ů

Kontingenční tabulky, korelační koeficienty

Interval spolehlivosti pro podíl

Při sledování a studiu vlastností náhodných výsledků poznáme charakter. podmínek různé výsledky. Ty odpovídají hodnotám jednotlivých realizací

Regresní analýza 1. Regresní analýza

8. Odhady parametrů rozdělení pravděpodobnosti

Odhad parametru p binomického rozdělení a test hypotézy o tomto parametru. Test hypotézy o parametru p binomického rozdělení

Odhady parametrů základního. Ing. Michal Dorda, Ph.D.

základním prvkem teorie křivek v počítačové grafice křivky polynomiální n

Přednáška VI. Intervalové odhady. Motivace Směrodatná odchylka a směrodatná chyba Centrální limitní věta Intervaly spolehlivosti

Statistika. Regresní a korelační analýza Úvod do problému. Roman Biskup

Přijímací řízení akademický rok 2013/2014 NavMg. studium Kompletní znění testových otázek matematika a statistika

veličiny má stejný řád jako je řád poslední číslice nejistoty. Nejistotu píšeme obvykle jenom jednou

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

Co je to statistika? Statistické hodnocení výsledků zkoušek. Úvod statistické myšlení. Úvod statistické myšlení. Popisná statistika

KGG/STG Statistika pro geografy

Národní informační středisko pro podporu jakosti

Statistika. Statistické funkce v tabulkových kalkulátorech MSO Excel a OO.o Calc

Lineární a adaptivní zpracování dat. 9. Modely časových řad II.

odpovídá jedna a jen jedna hodnota jiných

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

Úloha III.S... limitní

Přednáška I. Lukáš Frýd

, jsou naměřené a vypočtené hodnoty závisle

Regresní a korelační analýza

FITOVÁNÍ ROZDĚLENÍ PRAVDĚPODOBNOSTI PRO APLIKACE

Tomáš Karel LS 2012/2013

Regresní a korelační analýza

Úvod do korelační a regresní analýzy

Náhodné veličiny jsou nekorelované, neexistuje mezi nimi korelační vztah. Když jsou X; Y nekorelované, nemusí být nezávislé.

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ Fakulta strojního inženýrství. Matematika IV. Semestrální práce

1. Základy měření neelektrických veličin

Statistika je vědní obor zabývající se zkoumáním jevů, které mají hromadný charakter.

UNIVERZITA PARDUBICE. 4.4 Aproximace křivek a vyhlazování křivek

17. Statistické hypotézy parametrické testy

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

odhady parametrů. Jednostranné a oboustranné odhady. Intervalový odhad střední hodnoty, rozptylu, relativní četnosti.

Úloha II.S... odhadnutelná

KVALIMETRIE. 16. Statistické metody v metrologii a analytické chemii. Miloslav Suchánek. Řešené příklady na CD-ROM v Excelu.

Transkript:

Měřeí statistické závislosti, korelace, regrese Prof. RNDr. Jaa Zvárov rová,, DrSc. MĚŘENÍZÁVISLOSTI Cílem statistické aalýzy vepidemiologii bývá eje staovit, zda oemocěí závisí a výskytu rizikového faktoru, ale rověž vyjádřit STUPEŇ ZÁVISLOSTI. Stupeň závislosti však staovujeme imezi přízaky aemocí či mezi přízaky samotými. STUPEŇ ZÁVISLOSTI(KORELACI) vyjadřujeme pomocí růzých MĚR STATISTICKÉZÁVISLOSTI, ke kterým patří i KORELAČNÍ KOEFICIENTY. Obecě požadujeme: 0 < míra statistické závislosti < = = NEZÁVISLOST FUNKČNÍZÁVISLOST Obecé pricipy závislost vzájemá souvislost měřeých zaků fukčí závislost x statistická závislost ástroje pro měřeí závislosti lieár rí regrese korelace } kvatitativí zaky 3

Korelace a regrese síla (těsost) závislosti z dvou áhodých veliči: i: korelace symetrický vztah obou veliči i eslouží k předpovp edpovědidi způsob (tvar) závislosti z áhod hodé veličiy iy a jié veliči iě: regrese možost předpovp edpovědidi příklad: výška otce, výška jeho sya (v dospělosti) korelace: jak těst sě spolu souvisejí? populace - všechy dvojice (otec, sy) regrese: : lze z výšky otce odhadout výšku sya? řada populací - syové otců vysokých 70 cm, 7 cm... 4 Korelace -kvatifikace síly lieárí závislosti mezi dvěma kvatitativímu veličiami (Pearsoův) korelačí koeficiet: r = s xy s s x y = ( xi x)( yi y) ( xi x) ( yi y) důležité je zaméko a velikost korelačího koeficietu korelace ezameá příčiost. hodoty posuzujte kriticky 5 Příklady r=-0,8 r=0,45 mortality 00 0 40 60 80 00 0 hmotost 6000 7000 8000 9000 0000 30 35 40 45 latitude 65 70 75 delka 6

Měřeí závislosti pro kvatitativí zaky Kromě stupě závislosti,, který vyjadřuje korelačí koeficiet, se často sažíme zjistit i typ závislostiz vislosti. Orietačě můžeme typ závislostiz posoudit z bodového grafu. Typ závislosti z určuje uje křivka,, kterou můžm ůžeme empirickými body proložit. 7 Korelace 8 Pearsoův korelačí koeficiet měří sílu lieár rí závislosti spojitých veliči i vždy platí: - ρ X,Y v případp padě ormál lího rozděle leí platí: ezávislost X, Y ρ X,Y = 0 odhad pomocí ( xi x )( yi y) rx, Y = ( xi x ) ( y i y) ezávislost zamítáme, me, pokud t t -α/ (-), kde r t = r X, Y 9 3

Grafy 0 Lieár rí regrese -kvalifikace lieárího vztahu mezi dvěma kvatitativímu veličiami Př.: Aalyzujeme data o počtu pracovích hodi za měsíc v aesteziologické službě v závislosti a velikosti spádové oblasti. Nemocice Počet pracovích hodi Spádová populace (v tis.) 304,37 5,50 66,3 94,30 3 39, 83,70 4 85,43 30,70 5 43,77 9,80 6 555,68 80,80 7 383,78 43,40 8 74,7 65,0 9 845,30 74,30 0 5,8 60,80 346,60 39,0 368,33 376,0 Lieár rí regrese - motivačí příklad 4

Lieár rí regrese - regresí přímka Regresí přímka: yi = α + β xi + εi, i =,..., a absolutí čle (itercept) b směrice (slope) e áhodá chyba Př. (pokr.): pracoví doba = α + β velikost populace + ε 3 Lieár rí regrese - odhad parametrů Odhady hodot parametrů α a β se určují metodou ejmeších čtverců. Pricip metody ejmeších čtverců: Za odhad parametrů α a β se berou taková čísla a a b, pro která výraz Se = ( yi ŷi) abývá miimálí hodoty. Zde ŷ i = a + b x i je vyhlazeá hodota y i. Rozdíl y ŷ i i se azývá i-té reziduum. Tzv. reziduálí rozptyl je pak zavede jako Se s = 4 Lieár rí regrese - výpočet odhadů α a β Odhady parametrů a a b: s a = y b x b = s xy x Pomocé výpočty x = x i y = y i s = ( ) xi x s = ( ) yi y x y sxy = ( xi x)( yi y) (s xy je odhad kovariace veliči X a Y) 5 5

Lieár rí regrese - iterpretace výsledků Př.: Obdrželi jsme rovici pracoví doba = 80,658 + 9,49 * velikost populace -výsledek je třeba iterpretovat pouze v rozsahu pozorovaých dat -odhaduté parametry závisejí a použitých datech -můžeme zjistit itervalové odhady skutečých parametrů 6 Graf odhaduté regresí přímky 7 Koeficiet determiace Koeficiet determiace: R = r - měřeí síly závislosti mezi proměými X a Y - míra vhodosti modelu - určuje část variability Y vysvětleou pomocí modelu lieárí regrese! (-R ) 00 % variability Y elze vysvětlit variabilitou X 8 6