Měření závislostí. Statistická závislost číselných znaků

Podobné dokumenty
1.1 Rozdělení pravděpodobnosti dvousložkového náhodného vektoru

Metody zkoumání závislosti numerických proměnných

PRAVDĚPODOBNOST A STATISTIKA

, jsou naměřené a vypočtené hodnoty závisle

Úvod do korelační a regresní analýzy

4.1 Regresní úloha a regresní funkce

PRAVDĚPODOBNOST A STATISTIKA. Neparametrické testy hypotéz čast 2

9. Měření závislostí ve statistice Pevná a volná závislost

Optimalizace portfolia

Lineární regrese ( ) 2

Regresní a korelační analýza

jsou varianty znaku) b) při intervalovém třídění (hodnoty x

a další charakteristikou je četnost výběrového souboru n.

11. Časové řady Pojem a klasifikace časových řad

Odhady parametrů základního. Ing. Michal Dorda, Ph.D.

S1P Popisná statistika. Popisná statistika. Libor Žák

Model poptávky po železniční osobní dopravě Českých drah, a. s. na tuzemském přepravním trhu

Úvod do zpracování měření

Testování statistických hypotéz

Tento odhad má rozptyl ( ) σ 2 /, kde σ 2 je rozptyl souboru, ze kterého výběr pochází. Má-li každý prvek i. σ 2 ( i. ( i

Ilustrativní příklad ke zkoušce z B_PS_A léto 2014.

Generování dvojrozměrných rozdělení pomocí copulí

Přednáška č. 10 Analýza rozptylu při jednoduchém třídění

Interpolační křivky. Interpolace pomocí spline křivky. f 1. f 2. f n. x... x 2

1. Základy měření neelektrických veličin

8 NELINEÁRNÍ REGRESNÍ MODELY

Regrese. Aproximace metodou nejmenších čtverců ( ) 1 ( ) v n. v i. v 1. v 2. y i. y n. y 1 y 2. x 1 x 2 x i. x n

Ilustrativní příklad ke zkoušce z B_PS_A léto 2013.

11. Regresní analýza. Čas ke studiu kapitoly: 60 minut. Cíl VÝKLAD Úvod

Spolehlivost a diagnostika

1 Měření závislosti statistických znaků. 1.1 Dvourozměrný statistický soubor

Statistika je vědní obor zabývající se zkoumáním jevů, které mají hromadný charakter.

Odhady parametrů základního souboru. Ing. Michal Dorda, Ph.D.

ZPRACOVÁNÍ VÝSLEDKŮ MĚŘENÍ

Odhady parametrů 1. Odhady parametrů

EKONOMETRIE 9. přednáška Zobecněný lineární regresní model

PRAVDĚPODOBNOST A STATISTIKA

8. Zákony velkých čísel

Nejistoty měření. Aritmetický průměr. Odhad směrodatné odchylky výběrového průměru = nejistota typu A

PRAVDĚPODOBNOST A STATISTIKA. Náhodný vektor

6 Intervalové odhady. spočteme aritmetický průměr, pak tyto průměry se budou chovat jako by pocházely z normálního. nekonečna.

Odhady a testy hypotéz o regresních přímkách

3. Hodnocení přesnosti měření a vytyčování. Odchylky a tolerance ve výstavbě.

11. Popisná statistika

Deskriptivní statistika 1

VYSOCE PŘESNÉ METODY OBRÁBĚNÍ

PRAVDĚPODOBNOST A STATISTIKA

Závislost slovních znaků

PRAVDĚPODOBNOST A STATISTIKA. Náhodný vektor

v. Úkolem regrese (vyrovnání) argumentu y je nalézt vhodnou regresní funkci Y f (x)

PRAVDĚPODOBNOST A STATISTIKA

12. N á h o d n ý v ý b ě r

KVALITA REGRESNÍHO MODELU Radek Fajfr

Téma 5: Analýza závislostí

Doc. Ing. Dagmar Blatná, CSc.

P1: Úvod do experimentálních metod

Chyby přímých měření. Úvod

STATISTICKÉ MINIMUM PRO STUDENTY BAKALÁŘSKÉHO STUDIA NA TECHNICKÝCH OBORECH BOHUMIL MINAŘÍK

4.2 Elementární statistické zpracování Rozdělení četností

U. Jestliže lineární zobrazení Df x n n

Mendelova univerzita v Brně Statistika projekt

14. Korelace Teoretické základy korelace Způsoby měření závislostí pro různé typy dat

5.5. KOMPLEXNÍ ODMOCNINA A ŘEŠENÍ KVADRATICKÝCH A BINOMICKÝCH ROVNIC

[ jednotky ] Chyby měření

Intervalové odhady parametrů některých rozdělení.

Jednoduchá lineární regrese

Téma 6: Indexy a diference

Metody statistické analýzy. doc. Ing. Dagmar Blatná, CSc.

K čemu slouží regrese?

Základy statistiky. Zpracování pokusných dat Praktické příklady. Kristina Somerlíková

III. METODY MĚŘENÍ A ZPRACOVÁNÍ MĚŘENÍ

METHOD OF THE URBAN MASS TRANSPORTATION QUALITY EVALUATION

Pravděpodobnostní model doby setrvání ministra školství ve funkci

9.3.5 Korelace. Předpoklady: 9304

NEPARAMETRICKÉ METODY

8. Analýza rozptylu.

Náhodný výběr 1. Náhodný výběr

Statistická analýza dat

6. FUNKCE A POSLOUPNOSTI

Úvod do teorie měření

LABORATORNÍ CVIČENÍ Z FYZIKY. Měření objemu tuhých těles přímou metodou

PRAVDĚPODOBNOST A STATISTIKA

} kvantitativní znaky

Pravděpodobnost a aplikovaná statistika

Interpolace a aproximace. Interpolace algebraickým polynomem a aproximace metodou nejmenších čtverců

Hartre-Fock method (HF)

Pravděpodobnost a aplikovaná statistika

Test dobré shody se používá nejčastěji pro ověřování těchto hypotéz:

Statistika. Jednotlivé prvky této množiny se nazývají prvky statistického souboru (statistické jednotky).

Statistika - vícerozměrné metody

IV. MKP vynucené kmitání

UČEBNÍ TEXTY OSTRAVSKÉ UNIVERZITY. Přírodovědecká fakulta ANALÝZA DAT. 2. upravené vydání. Josef Tvrdík

T e c h n i c k á z p r á v a. Pokyn pro vyhodnocení nejistoty měření výsledků kvantitativních zkoušek. Technická zpráva č.

Téma 1: Pravděpodobnost

ANALÝZA A KLASIFIKACE DAT

Odhady parametrů polohy a rozptýlení pro často se vyskytující rozdělení dat v laboratoři se vyčíslují podle následujících vztahů:

Základní požadavky a pravidla měření

V. Normální rozdělení

PRAVDĚPODOBNOST A STATISTIKA. Bodové a intervalové odhady

Náhodné jevy, jevové pole, pravděpodobnost

Transkript:

Měřeí závslostí Statstcká závslost číselých zaků - závslost dvou velč lze vádřt ako ech fukčí vztah vzorcem, taulkou hodot příslušé fukce eo grafck; - mez zak zkoumaých evů zšťueme estec příčé (kauzálí závslost v kladém případě ak změ hodot edoho zaku ovlví hodot zaku druhého Závslost zdálvá (ahodlá, epodstatá malý počet pozorováí, eoratost práce s dat (asolutí relatví vádřeí velč, příčá - edostraá, ooustraá (reálá příča úček - pevá (fukčí, determstcká, volá (statstcká, stochastcká stačí ede případ čím více případů tím přesěší Stochastcká závslost: proevue se ako opakovatelá tedece realzuící se v růzém místě a čase v růzé podoě, charakterstcká e varaltou dvduálích případů, proevue se pod vlvem růzě půsoících faktorů Výsledc půsoeí faktorů začíme ako áhodu (elze stalzovat podmík pozorováí Jedostraá závslost: edozačé pomeováí příč a účku Rostoucí příem domácost má úček v rostoucích úsporách domácost Ooustraá závslost: elze edozačě pomeovat příču a úček Spotřea hovězího masa a úkor masu vepřovému Jedostraá závslost - vsthue průěh závslost hodot zaku Y a zaku X X ezávsle proměá, vsvětluící proměá (eda eo více vícerozměrá velča, příča; Y závsle proměá, vsvětlovaá proměá, úček korelace, kotgece

Měřeí závslostí Párová edoduchá mohoásoá víceásoá dílčí (parcálí Grafckou prezetací dat e odový dagram (korelačí, který umožňue vzuálě posoudt: - edá se o edoduchý rový graf, od odpovídaící edotlvým pozorováím tvoří korelačí pole; - průěh závslost (rostoucí, klesaící, střídavý a tvar (přímočará, křvočará; - sílu (těsost, teztu závslost; - defekt v datech heterogeta (dva souor v edom, vlvé od edotlvé hodot vočuící z oecého pravdla; Or Korelačí dagram 8 4 6 3 4 4 6 8 4 6 8 Or Defekt v datech

Měřeí závslostí Tříděí a měřeí závslostí Komačí tříděí komačí taulka korelačí taulka (v případě číselých zaků Korelačí taulka Statstcká závslost se v korelačí taulce proevue tak, že podmíěá rozděleí četostí edoho zaku závsí a tom, aké hodot al druhý z oou zaků Příklad č Tříděí domácostí podle výdaů za potrav a počtu oso Zak Y Výdae za potrav za měsíc v ts Kč Součet Zak X do,5,5,5,5 3,5 3,5 a více 4 5 - Počet čleů 6 5 3 6 domácost 3 5 6 3 4 3 6 7 7 5-8 9 9 Součet 9 3 5 86 Komace odového a skupového tříděí Podmíěé četost: čísla uvtř taulk (ak se chová zak Y za podmík, že zak X al určté kokrétí hodot Podmíěá rozděleí četostí: edotlvé sloupce a řádk Nepodmíěá, margálí rozděleí četostí: četost v posledím sloupc a řádku Každé rozděleí má své vlastost měřeé statstckým charakterstkam, které sou rověž podmíěým charakterstkam: podmíěá charakterstka úrově podmíěý artmetcký průměr umožňue charakterzovat průěh závslost (závsle proměé Y, pro -té podmíěé rozděleí: m m, kde e střed -té tříd zaku Y, e četost a průsečíku -tého řádku a -tého sloupce korelačí taulk

Měřeí závslostí Mez zkoumaým zak e korelačí závslost, estlže se změou hodot ezávsle proměého zaku dochází k sstematcké změě úrově podmíěých rozděleí závsle proměého zaku čára podmíěých průměrů Výpočet podmíěých průměrů Výdae za potrav Počet oso,, 3, 4, Podmíěý průměr 4 5 -,8 6 5 3,6 3 5 6,9 4 3 6 7 3, 5-8 9 3,4 Čára podmíěých průměrů 5 výdae a potrav 4 3 3 4 5 6 počet oso Čára podmíěých průměrů grafck vadřue průěh rostoucí závslost mez počtem čleů domácost a výda a potrav Hodot ležící a čáře podmíěých průměrů umožňuí odhadovat průměré výdae skup domácostí s určtým průměrým počtem čleů domácost podmíěá charakterstka varalt podmíěý rozptl umožňue změřt sílu závslost - průměrý rozptl uvtř podmíěých rozděleí (tím meší, čím dokoale e varalta závsle proměé oasěá růzostí hodot ezávsle proměé; - rozptl podmíěých průměrů kolem společého průměru závsle proměé (chová se přesě opačě;

Měřeí závslostí Poměr determace ukazatel založeý a poměru rozptlu podmíěých průměrů (oasěá varalta závsle proměé ku rozptlu epodmíěého rozděleí četostí závsle proměé (veškerá varalta závsle proměé Rozdílem mez oěma rozptl e eoasěá, áhodá, rezduálí varalta udává relatví podíl oasěé varalt závsle proměé a eí celkové varaltě Rozptl závsle proměé Y vpočteme z epodmíěého rozděleí četostí a dostaeme eho hodotu s,93 ( ( ( ( *9 + * + 3*3 + 4* 5 (,84 ; 86 ( *9 + ( * + ( 3 *3 + ( 4 * 5,84, 93 s 86 Rozptl podmíěých průměrů kolem celkového průměru,84 [ts Kč] e rove s k,33 ( s [(,8 + (,6 6 + (,9 3 + ( 3, 7 + ( 3,4 9 ],84, 33 86,33 Poměr determace e pak rove,35 * 35 % Na vru růzého počtu oso,93 v domácostech přpadá 35 % varalt výdaů za potrav Zývaící část tvoří evsvětleá (rezduálí varalta Můžeme mluvt o epřílš slé závslost Korelačí poměr - druhá odmoca poměru determace - vadřue také těsost závslost - ezrozměrá charakterstka lze srovávat sílu závslost u více souorů - ormovaý a tervalu <, > Korelačí poměr pro áš příklad e rove, 35,59

Měřeí závslostí Teto uvedeý způso měřeí korelačí závslost má spoustu omezeí: - souor musí mít dostatečý rozsah, a mohl ýt roztřídě do korelačí taulk vlouče souor malého rozsahu; - maí-l ýt kostruováa podmíěá rozděleí četostí zaku Y, musí zak X aývat e ěkolka málo celočíselých hodot; - čára podmíěých průměrů může ýt vádřea pouze taulkou eo grafck (elze vádřt vzorcem Charakterstk statstcké závslost Průěh závslost pomocí statstcké charakterstk regresí fukce, která co elépe vsthue průěh závslost metoda emeších čtverců Leárí regresí fukce fukce edé ezávsle proměé, grafem e regresí přímka měřeí průěhu poztví eo egatví přímočaré závslost Regresí kvadratcká fukce měřeí křvočaré závslost s kokávím eo koveím průěhem a edým etrémem tpu mama eo mma regresí paraola Regresí lomeá fukce asmptotck se přlžue shora eo zdola k určté hodotě regresí hperola Ide korelace charakterstka tezt závslost, ezrozměrá, v uzavřeém tervalu od ul do edé

Regresí aalýza Regrese a regresí fukce Regresí úloha: - úloha o edostraé závslost, edozačě e detfkovaá závslá a ezávslá proměá - úloha s ezávslou proměou maící charakter řízeé proměé (může mít pravdelě odstupňovaé hodot a závslou proměou, která má charakter pozorovaé proměé Jedé hodotě ezávsle proměé odpovídá mmálě eda, často dokoce ěkolk (pro elmac vlvu áhodých ch pozorovaých hodot závsle proměé Měřeí průěhu statstcké závslost číselých zaků prokládáím spotých fukcí regresí fukce: f ( Regresí úloha alezeí kokrétího tpu a rovce fukce Jde o ahrazeí skutečé (aměřeé hodot hodotou teoretckou (vpočteou ležící a spoté regresí fukc Tp regresích fukcí Podle proměých Leárí Neleárí Podle parametrů Leárí + + + + + log LINEÁRNÍ REGRESE NELINEÁRNÍ Neleárí X REGRESE PŘÍMOČARÁ KŘIVOČARÁ REGRESE REGRESE Emprcká hodota - aměřeá, skutečá Teoretcká hodota - vpočteá a základě rovce určté fukce zámé, předem zvoleé hodot zaku X Staoveí kokrétího tpu regresí fukce pomocí odového dagramu zkušeostí, zalostí používaých fukcí f (,,, m

Regresí aalýza Předpoklad: fukce e leárí v parametrech: f (, (,,,, m m f ( + + m f m ( f ( f m ( regresor m regresí parametr určueme METODOU NEJMENŠÍCH ČTVERCŮ Regresor: takové fukce ezávsle proměé X, které eosahuí další ezámé parametr Prví regresor: f (, rovce regresí fukce osahue asolutí čle Další regresor: f (,,, log, s,, log, e, atd Nesou regresor:,,, atd osahuící další ezámé parametr Budeme pracovat pouze s fukcem, které sou leárí v parametrech, popř e lze learzovat (logartmckou trasformací, popř vužtím převráceé hodot závsle proměé Př fukce lze learzovat logartmckou trasformací log log + log Metoda emeších čtverců Uverzálí metoda alezeí parametrů lovolé regresí fukce edé eo více proměých leárí v parametrech leárí regrese závsle proměá průměr záv prom ezávsle Proložeí regresí fukce korelačím polem vede k ahrazeí každé z pozorovaých hodot závslé proměé hodotou ležící a regresí fukc, tuto vpočteou hodotu udeme ozačovat a regresí fukc smolem

Regresí aalýza Odchlk od průměru ( ( / ( / součet rozdílů emprckých a teoretckých hodot MNČ hledá takový průěh regresí fukce zvoleého tpu, která mmalzue součet čtverců odchlek pozorovaých a vpočteých hodot závsle proměé, t ( / m krtérum emeších čtverců Regresí fukce e ted fukcí m+ ezámých parametrů,,, m, eíž hodot musíme alézt tak, a lo splěo krtérum emeších čtverců: m ( Etrém této fukce ademe tak, že ademe prví parcálí dervace postupě podle všech m+ ezámých parametrů, položíme e rov ule a vzklou soustavu leárí ormálích rovc řešíme Pro vhutí se dervováí vužeme pravdla, defuícího -tou ormálí rovc ako m f f f ( ( ( f f (, ( + + +

Regresí aalýza Příklad č Př sledováí závslost vlastích ákladů a edotku produkce ( a oemu produkce v ks ( l zště ásleduící údae, které sou uvede v taulce: 58 69 89 78 3 46 455 75 98 99 468 4986 6 893 498 95 74 4 8 84 7 4588 Sestrote odový dagram Zvolte vhodý tp fukce, určete eí rovc a základě MNČ,68573,,77, 7,3664 4588 -,68573 7, 3664,68573,77 4588,77,68573 7,3664,77,68573,4 7,3664 4588,68573,77,68573 3,8 Rovce regresí hperol má ted tvar: 3,8 4 +

Regresí aalýza Lomeá fukce svým zakřveím vsthue průěh závslost Matcové vádřeí MNČ Soustava leárích rovc se dá přepsat do matcové smolk: g A kde g e sloupcový vektor m + zámých koefcetů, A e čtvercová smetrcká matce zámých koefcetů řádu m, e sloupcový vektor m + ezámých parametrů regresí fukce, e ulový vektor o délce m + Pro aš lomeou fukc, která má soustavu leárích rovc: ude g A, kde g X T

Regresí aalýza A X X T kde e vektor hodot závsle proměé a matce X e matcí regresorů Úpravou dodeme k vádřeí: ( m T T X X X g A Traspozce záměa původě sloupcového vektoru vektorem řádkovým a aopak a záměa sloupců a řádků matce 4588 -,68573 7, 3664,68573,77 Převedeo z EXCELU g 4588 7,3664 A,68573,68573,77 Iverzí matce A,4366-8, -8, 99,59-9,37598 Souč matc 3886,4 (verzí matce krát vektor

Regresí aalýza Ide determace Z metod emeších čtverců vplývá, že pro edotlvá pozorováí závsle proměé velč Y lze sestrot tř součt čtverců odchlek: součet čtverců odchlek skutečých hodot od ech artmetckého průměru; součet čtverců odchlek vpočteých hodot kolem ech artmetckého průměru (artm průměru skutečých hodot; součet čtverců odchlek skutečých hodot kolem hodot teoretckých (zároveň představue krtérum emeších čtverců Rovce rozkladu součtu čtverců: ( ( + ( Po vděleí součtů čtverců rozsahem souoru dostaeme odpovídaící rozptl, pro které opět platí: s s + s( celková varalta závslé proměé e součtem varalt vsvětleé regresí a rezduálí varalt s I [%] s Ide determace měří podíl vsvětleé varalt závsle proměé a eí celkové varaltě I + Ide korelace - druhá odmoca deu determace; - vadřue sílu závslost; - ezrozměrý, aývá hodot z tervalu <, >; - př záměě závsle a ezávsle proměé se hodota deu korelace většou změí; - závsí a tpu zvoleé regresí fukce, ízká hodota může ýt způsoea evhodě zvoleým tpem regresí fukce

Regresí aalýza I I Převedeo z EXCELU / 58 4986 85,9655 48696 69 6 37,8557 68544 89 893,6966 3583449 498 3,375 444 78 5,63596 3 95 3,39867 8375 46 74,74784 55564 455 4,95495 69744 75 8,34895 4754 98 84,87755 33856 99 7,97768 69 468 4588 7,3664 46736 průměr 36,8 průměr ^ 758758 čtatel zlomku meovatel zlomku -9,37598 3886,4 Ide determace,8845835 Ide korelace,9453 Ide korelace vpovídá o vsoké závslost a zároveň ted o vhodě zvoleém tpu fukce