1 Měření závislosti statistických znaků. 1.1 Dvourozměrný statistický soubor

Podobné dokumenty
Statistické metody ve veřejné správě ŘEŠENÉ PŘÍKLADY

Odhady a testy hypotéz o regresních přímkách

1.1 Rozdělení pravděpodobnosti dvousložkového náhodného vektoru

} kvantitativní znaky

- metody, kterými lze z napozorovaných hodnot NV získat co nejlepší odhady neznámých parametrů jejího rozdělení.

Metody zkoumání závislosti numerických proměnných

Úvod do korelační a regresní analýzy

9. Měření závislostí ve statistice Pevná a volná závislost

Aktivita 1 Seminář základů statistiky a workshop (Prof. Ing. Milan Palát, CSc., Ing. Kristina Somerlíková, Ph.D.)

4.2 Elementární statistické zpracování Rozdělení četností

1. Základy měření neelektrických veličin

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA

Poznámky k tématu Korelace a jednoduchá lineární regrese (Téma není ve skriptech)

Generování dvojrozměrných rozdělení pomocí copulí

, jsou naměřené a vypočtené hodnoty závisle

Interval spolehlivosti pro podíl

Momenty a momentové charakteristiky

jsou varianty znaku) b) při intervalovém třídění (hodnoty x

Tento odhad má rozptyl ( ) σ 2 /, kde σ 2 je rozptyl souboru, ze kterého výběr pochází. Má-li každý prvek i. σ 2 ( i. ( i

Statistické charakteristiky (míry)

Téma 5: Analýza závislostí

Mendelova univerzita v Brně Statistika projekt

Soustava momentů. k s. Je-li tedy ve vzorci obecného momentu s = 1, získáme vzorec aritmetického průměru.

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ Fakulta strojního inženýrství. Matematika IV. Semestrální práce

3. cvičení 4ST201 - řešení

5.5. KOMPLEXNÍ ODMOCNINA A ŘEŠENÍ KVADRATICKÝCH A BINOMICKÝCH ROVNIC

Charakteristiky úrovně

1. Rozdělení četností a grafické znázornění Předpokládejme, že při statistickém šetření nás zajímá jediný statistický znak x, který nabývá

8 DALŠÍ SPOJITÁ ROZDĚLENÍ PRAVDĚPODOBNOSTI

11. Časové řady Pojem a klasifikace časových řad

APLIKOVANÁ STATISTIKA

Lineární regrese ( ) 2

9. REGRESNÍ A KORELAČNÍ ANALÝZA

3. cvičení 4ST201. Míry variability

Jednoduchá lineární regrese

6 Intervalové odhady. spočteme aritmetický průměr, pak tyto průměry se budou chovat jako by pocházely z normálního. nekonečna.

14. Korelace Teoretické základy korelace Způsoby měření závislostí pro různé typy dat

Deskriptivní statistika 1

Jednoduchá lineární závislost

Regrese. Aproximace metodou nejmenších čtverců ( ) 1 ( ) v n. v i. v 1. v 2. y i. y n. y 1 y 2. x 1 x 2 x i. x n

Popis datového souboru

Odhady parametrů 1. Odhady parametrů

Testování statistických hypotéz

9.3.5 Korelace. Předpoklady: 9304

Ilustrativní příklad ke zkoušce z B_PS_A léto 2014.

Univerzita Karlova v Praze Pedagogická fakulta

Odhady parametrů základního. Ing. Michal Dorda, Ph.D.

Úvod do zpracování měření

1 POPISNÁ STATISTIKA V PROGRAMU MS EXCEL

Téma 4: Výběrová šetření

Regresní a korelační analýza

a) Hypotézy o parametru jedné populace (o stední hodnot, mediánu, rozptylu, relativní

Obr. DI-1. K principu reverzibility (obrácení chodu paprsků).

Pro statistické šetření si zvolte si statistický soubor např. všichni žáci třídy (několika tříd, školy apod.).

Statistika. Jednotlivé prvky této množiny se nazývají prvky statistického souboru (statistické jednotky).

Nejistoty měření. Aritmetický průměr. Odhad směrodatné odchylky výběrového průměru = nejistota typu A

Měření závislostí. Statistická závislost číselných znaků

Ilustrativní příklad ke zkoušce z B_PS_A léto 2013.

1 STATISTICKÁ ŠETŘENÍ

SOUKROMÁ VYSOKÁ ŠKOLA EKONOMICKÁ ZNOJMO. Statistika I. distanční studijní opora. Milan Křápek

Dvourozměrná tabulka rozdělení četností

Optimalizace portfolia

Úvod do teorie měření

Pravděpodobnost a aplikovaná statistika

L A B O R A T O R N Í C V I Č E N Í Z F Y Z I K Y

MATICOVÉ HRY MATICOVÝCH HER

S1P Popisná statistika. Popisná statistika. Libor Žák

v. Úkolem regrese (vyrovnání) argumentu y je nalézt vhodnou regresní funkci Y f (x)

1 Popis statistických dat. 1.1 Popis nominálních a ordinálních znaků

Interpolace a aproximace. Interpolace algebraickým polynomem a aproximace metodou nejmenších čtverců

Spolehlivost a diagnostika

Náhodné jevy, jevové pole, pravděpodobnost

Chyby přímých měření. Úvod

Závislost slovních znaků

LABORATORNÍ CVIČENÍ Z FYZIKY. Měření objemu tuhých těles přímou metodou

P1: Úvod do experimentálních metod

Odhady parametrů základního souboru. Ing. Michal Dorda, Ph.D.

VY_52_INOVACE_J 05 01

Směrnice 1/2011 Statistické vyhodnocování dat, verze 4 Verze 4 je shodná se Směrnicí 1/2011 verze 3, pouze byla rozšířena o robustní analýzu

Zá k l a d y k v a n t i t a t i v n í g e n e t i k y

1.3. ORTOGONÁLNÍ A ORTONORMÁLNÍ BÁZE

Interpolační křivky. Interpolace pomocí spline křivky. f 1. f 2. f n. x... x 2

STATISTIKA. Statistika se těší pochybnému vyznamenání tím, že je nejvíce nepochopeným vědním oborem. H. Levinson

} kvantitativní znaky. korelace, regrese. Prof. RNDr. Jana Zvárov. Obecné principy

III. METODY MĚŘENÍ A ZPRACOVÁNÍ MĚŘENÍ

Téma 3: Popisná statistika

KVALITA REGRESNÍHO MODELU Radek Fajfr

Test dobré shody se používá nejčastěji pro ověřování těchto hypotéz:

Spojité (kontinuální) - nap. podle vykázaného zisku, tržeb, náklad Nespojité (diskrétní) - nap. podle potu len v rodin

12. N á h o d n ý v ý b ě r

Přednáška č. 10 Analýza rozptylu při jednoduchém třídění

ZÁKLADY PRAVDĚPODOBNOSTI A STATISTIKY

8. Analýza rozptylu.

Doc. Ing. Dagmar Blatná, CSc.

STUDIUM MAXWELLOVA ZÁKONA ROZDĚLENÍ RYCHLSOTÍ MOLEKUL POMOCÍ DERIVE 6

[ jednotky ] Chyby měření

Popisné (deskriptivní) metody. Statistické metody a zpracování dat. II. Popisné statistické metody. Rozdělení četností. Skupinové rozdělení četností

11. Popisná statistika

Odhady parametrů polohy a rozptýlení pro často se vyskytující rozdělení dat v laboratoři se vyčíslují podle následujících vztahů:

Transkript:

1 Měřeí závlot tattckých zaků 1.1 Dvourozměrý tattcký oubor Př aalýze ekoomckých kutečotí á čato ezajímají jedotlvé velč jako takové, ale vztah mez m. Ptáme e, jak záví poptávka a ceě produktu, plat zamětaců a věku, vzděláí rodčů a dětí apod. V takových případech etačí zkoumat je jede tattcký zak, ale oučaě ledovat zaků více. Doud jme e v tomto modulu zabýval tzv. jedorozměrým tattckým ouborem. U každé tattcké jedotk á vžd zajímal pouze jede zak, který jme dále aalzoval etrojl jme tabulku a graf četotí, počítal tředí hodotu ebo měrodatou odchlku. Pokud zkoumáme vztah dvou ebo více zaků v rámc jedoho ouboru, mluvíme o vícerozměrém tattckém ouboru (dvourozměrém, třírozměrém, ). U vícerozměrého ouboru budeme zkoumat vzájemé vztah ledovaých tattckých zaků. Chceme-l zobrazt rozložeí hodot dvou kategorálích zaků (ebo číelých zaků malým počtem obmě) v rámc vícerozměrého tattckého ouboru, můžeme etrojt tzv. kotgečí tabulku. Kotgečí tabulka je vlatě dvourozměrou aalogí tabulk rozděleí četotí, kterou záte jž z předcházející kaptol. Její obecý tvar předtavuje obrázek 3.1. Y 1 Y Y S CELKEM X 1 11 1 1 1 X 1 X R r1 r r r CELKEM 1 Obr. 3.1 Kotgečí tabulka pro dva kategorálí zak Četot 11 (čteme e jeda jeda ), 1,, r v kotgečí tabulce jou četotm kombací hodot obou tattckých zaků (apř. X a Y) a azývají e družeé četot. Jejch oučtem je počet prvků ouboru.

11 1 r r 1 j 1 Dva mbol um v předcházejícím vzorc zameají, že čítáme všech družeé četot pře řádk loupce. Řádkové a loupcové oučt tabulk v poledím loupc, rep. řádku tabulk, e azývají margálí (ebol okrajové) četot předtavují vlatí jedorozměrá rozděleí obou amotatých proměých X a Y. Také pro margálí četot platí: r 1 j 1 j Kotgečí tabulku lze vtvořt v Ecelu jedoduše pomocí tejojmeého átroje Kotgečí tabulka. Jako vtup přtom louží jedoduchá datová tabulka, jejíž prví řádek obahuje ázv zaků a otatí řádk přílušá data. Kromě abolutích četotí můžeme v kotgečí tabulce uvádět také relatví četot p přepočteé a celkový rozah ouboru. Relatví četot počítáme obdobě jako u jedorozměrého rozděleí četotí: p Z praktckých důvodů e ěkd uvádí kotgečí tabulka relatvích četotí, jejíž řádkové (ebo loupcové) oučt jou rov 1. Tto četot zíkáme jako podíl družeých četotí a odpovídajících řádkových četotí (ebo loupcových četotí j ). Tto četot azýváme podmíěé řádkové (loupcové) relatví četot a louží k porováí rozděleí hodot v jedotlvých řádcích (ebo loupcích) tabulk. Ukázku tabulk podmíěým loupcovým četotm vdíte a obrázku 3.. Z tabulk je možé apříklad včít, že ve ledovaé kupě oob muž ledují více kaál ČT ež že, zatímco že e dívají čatěj a Novu ež muž. 3

MUŽI ŽENY ČT1 4% 5% ČT 0% 15% NOVA 38% 4% PRIMA 18% 18% celkem 100% 100% Obr. 3. Kotgečí tabulka podmíěým loupcovým četotm Dvourozměré rozděleí četotí lze zázort také grafck pomocí loupcového grafu ebol htogramu. K tomu však potřebujeme trojrozměrý ouřadcový tém, kde a dvě o vášíme hodot obou zaků, a třetí ou jejch četot ve formě loupců. Obr. 3.3 Htogram 3D pro dvě proměé Takový třírozměrý graf (3D htogram) půobí ce efektě, ale má řadu evýhod. Například pokud budou v popředí hodot větším četotm, zakrjí žší loupce grafu odpovídající hodotám žším četotm. Proto e v pra používá píše tzv. kupový loupcový graf (htogram), který zobrazuje rozděleí hodot jedoho zaku pro všech obmě zaku druhého. 4

Y 45% 40% 35% 30% 5% 0% 15% 10% 5% 0% muž že ČT1 ČT Nova Prma Obr. 3.4 Skupový htogram pro dvě proměé Pokud jou oba zak ve dvourozměrém ouboru číelé (kvattatví, metrcké), lze oubor grafck zobrazt pomocí bodového dagramu (dot plot ebo XY plot), kde každé dvojc hodot [ ; j ] v ouboru odpovídá bod o těchto ouřadcích v dvourozměré outavě ouřadc. Teto tp grafu e však přílš ehodí pro oubor, kde e jedotlvé kombace hodot zaků X a Y opakují, protože všech takové dvojce e v XY grafu zobrazí jako jedý bod. Bodový dagram 105 100 95 90 85 80 75 70 65 60 174 176 178 180 18 184 186 188 190 19 X Obr. 3.5 Ukázka bodového dagramu pro dvě proměé 1. Číelé charaktertk dvourozměrého ouboru Jou-l obě proměé v dvourozměrém ouboru číelé, lze je popat obdobým číelým charaktertkam jako u ouboru jedorozměrého. 5

U jedotlvých zaků lze počítat mír poloh a varablt podle tejých vzorců jako pro jedorozměrý tattcký oubor. Tto charaktertk vjadřují vlatot každé proměé zvlášť, azýváme je obdobě jako u kotgečí tabulk margálí charaktertk. Je-l oubor zadaý pomocí upořádaých dvojc hodot [ ; ], můžeme tředí hodot obou proměých X a Y vpočítat podle vzorců: 1 1 Obdobě můžeme počítat (výběrové) rozptl obou zkoumaých tattckých zaků: 1 1 1 Vzájemé vztah mez oběma zak vjadřují charaktertk, které e azývají družeé. Do této kup charaktertk patří kovarace a korelačí koefcet. Míru vzájemého vztahu zaků X a Y vjadřuje charaktertka, která e azývá kovarace (ěkd též vzájemý rozptl). Spočítá e obdobě jako rozptl jedé proměé podle vzorce: 1 1 Na rozdíl od rozptlu může mít kovarace kladou záporou hodotu, zaméko kovarace určuje měr (oretac) závlot mez oběma proměým. Platí přtom: pokud je kovarace kladá ( > 0), je mez oběma zak přímá (poztví) závlot e zvšující e hodotou jedoho zaku e hodota druhého zaku také píše zvšuje pokud je kovarace záporá ( < 0), je mez oběma zak epřímá (egatví) závlot e zvšující e hodotou jedoho zaku e hodota druhého zaku píše žuje jetl je kovarace rova ule ( = 0), eí mez oběma zak závlot zak jou ezávlé Čím větší má kovarace abolutí hodotu, tím je závlot mez oběma zak lější. Ab blo možé určt míru závlot mez oběma zak, případě porovat dvě růzé závlot mez ebou, zavádí e takzvaý korelačí koefcet. Te e určuje podle vzorce: 1 6

r Korelačí koefcet abývá hodot vžd z tervalu -1 až +1. Je ted relatví charaktertkou vjadřující ílu vztahu mez dvěma zak v témže tattckém ouboru. Zaméko korelačího koefcetu určuje tejě jako u kovarace měr závlot, abolutí hodota korelace teztu (ílu) závlot. 0,0 ŽÁDNÁ ZÁVISLOST 0,0-0,1 velm labá závlot 0,1 0,3 labá závlot 0,3 0,7 tředí závlot 0,7 0,9 lá závlot 0,9 1,0 velm lá závlot 1,0 abolutí závlot Obr. 3.6 Korelačí koefcet a íla závlot V programu Ecel louží k výpočtu korelačího koefcetu fukce CORREL. Parametr fukce jou obě proměé. Př abolutí závlot dvou číelých zaků X a Y (r = 1 ebo r = -1) lze vztah mez hodotam obou zaků vjádřt pomocí leárí fukce: b b 0 1 V takovém případě všech bod v bodovém dagramu leží v přímce. Proto také říkáme, že korelačí koefcet měří ílu leárí závlot. 1.3 Jedoduchá leárí regree Ideálí leárí závlot mez dvěma číelým zak eí v pra obvklá. Přeto však v takovém případě můžeme vztah mez dvěma tattckým proměým vjádřt pomocí leárí regreí fukce: Y b0 b1 Koefcet b 0 a b 1 volíme tak, ab vzklá přímka co ejlépe vthovala daý tattcký oubor vz obrázek 3.7. 7

Obr. 3.7 Dvourozměrý oubor a leárí regreí fukce V regreím modelu bude každé pozorovaé hodotě ezávlé proměé odpovídat jedak kutečá (emprcká) hodota závlé proměé, jedak teoretcká (modelová, vpočteá) hodota Y, která leží a regreí přímce. Ze všech přímek v rově volíme jako ejlepší tu, u které je oučet druhých moc (čtverců) odchlek teoretckých hodot závlé proměé Y od emprckých mmálí odtud ázev metoda ejmeších čtverců. Obrázek 3.8 ukazuje čtverce odchlek a kokrétím příkladu. Obr. 3.8 Metoda ejmeších čtverců prcp Bez odvozeí a důkazu í uvedeme, že koefcet b 1 rovce regreí přímk plňující podmíku metod ejmeších čtverců má hodotu: 8

b 1 Teto koefcet e azývá regreí koefcet a ěkd e také začí b. V Ecelu ho můžeme počítat jedoduše pomocí fukce SLOPE. Parametr fukce e udávají v pořadí závle proměá Y, ezávle proměá X. Výzam regreího koefcetu je: a) měrce regreí přímk b) průměrý přírůtek závle proměé Y, pokud e ezávlá proměá X změí o jedotku Obdobě koefcet b 0 e dá zjtt ze vztahu: b0 b1 Teto koefcet vjadřuje odhad závle proměé Y př ulové hodotě X (pokud je taková terpretace mluplá). V Ecelu jej počítáme pomocí fukce INTERCEPT. Zajímavou vlatotí regreí přímk je, že prochází průečíkem tředích hodot obou proměých, ted bodem o ouřadcích ;. Teto bod e také azývá těžště (dvourozměrého) tattckého ouboru. Koefcet regreí fukce mají čato terpretac, která záví a kokrétích datech. Například v obecé ekoom vjadřujeme vztah mez potřebou domácotí C a jejch příjmem (důchodem) Y rovcí: C C0 c Y kde C 0 je takzvaá autoomí potřeba a c mezí klo ke potřebě. Kvaltu daé leárí regreí fukce vjadřuje ukazatel R, který e azývá de determace (ebo determačí koefcet) a počítá e podle vzorce: R Y kde: Y teoretcký rozptl (rozptl teoretckých hodot Y) emprcký rozptl (rozptl aměřeých hodot ) Teoretcký rozptl počítáme jako rozptl hodot Y zíkaých doazeím jedotlvých hodot ezávlé proměé do regreí rovce. Emprcký rozptl je pak ormálí rozptl hodot závlé proměé. 9

Ide determace R abývá hodot od 0 do 1 (od 0 do 100%) a určuje, jakou čát varablt závlé proměé Y lze vvětlt vlvem ezávlé proměé X. Čím všší je tato hodota, tím lépe vthuje regreí přímka kutečou závlot mez X a Y. Pro leárí regre platí mez deem determace R r jedoduchý a jedozačý vztah: R r 1.4 Závlot zaků v kotgečí tabulce a korelačím koefcetem Podobě jako mez číelým zak můžeme vjadřovat ílu závlot také mez dvěma kategorálím zak X a Y v kotgečí tabulce. Závlot mez kvaltatvím zak e azývá také aocace. Tím je vjádřea rozdílot od závlot číelých zaků, které říkáme korelace. Pokud b bl zak X a Y v kotgečí tabulce kutečě ezávlé, muel b mez družeou relatví četotí a margálím relatvím četotm platt vztah: p p p j Teto vztah b platl pro lbovolou dvojc deů a j, rep. dvojc hodot a j. Neboť v pra mohem čatěj ežl relatvím četotm pracujeme četotm abolutím, lze výše uvedeý vztah vjádřt ve tvaru: e j Hodota e e azývá očekávaá četot (z agl. epected = očekávaý). Takovou hodotu b měla družeá četot v případě, že b zak X a Y bl kutečě ezávlé. Z hodot očekávaých četotí e lze etavt aalog kotgečí tabulk tzv. tabulku očekávaých četotí. Potom platí, že pokud e kutečá kotgečí tabulka a tabulka očekávaých četotí hodují, jou ledovaé zak X a Y ezávlé. Čím větší jou aopak rozdíl mez oběma tabulkam, tím větší je mez oběma zak X a Y v kotgečí tabulce závlot. Na ledováí této rozdílot lze proto potavt mír aocace. Základím dvduálím ukazatelem je tzv. dvduálí ch-kvadrát (χ ) míra aocace: G e e 10

Pokud je hodota G větší ež 5, můžeme v kotgečí tabulce -tý řádek a j-tý loupec považovat za závlé. Celková -míra aocace e vpočte jako oučet všech dvduálích hodot G pře celou tabulku, tj. pře všech kombace a j : G r r G 1 j 1 1 j 1 e e Stattka G abývá hodot z tervalu 0 až h, kde je počet jedotek ouboru a h je meší z hodot r - 1, - 1. Vjadřuje v podtatě rozptl mez kutečým a očekávaým četotm v kotgečí tabulce. Ab blo možé rovávat mír závlot ze dvou růzých kotgečích tabulek, bla zavedea relatví míra aocace, tzv. Cramerův kotgečí koefcet V: V G h Hodota Cramerova koefcetu kotgece e pohbuje mez 0 a 1, přčemž platí, že čím všší je hodota V, tím je závlot mez oběma zak lější. Hodota V = 0 vjadřuje tattck ezávlé zak X a Y. Až a zaméko je ted výzam koefcetu kotgece rovatelý korelačím koefcetem. V Ecelu emáme žádé pecálí fukce a átroje pro měřeí aocace v kotgečí tabulce. Nejjedodušší je dodržet áledující potup: 1. určt kotgečí tabulku emprckých (abolutích) četotí ;. počítat tabulku očekávaých četotí e ; 3. pomocí předcházejících tabulek vjádřt tabulku dvduálích ch-kvadrátů G. Součet všech hodot v tabulce dvduálích ch-kvadrátů je celková míra aocace G. Z í lze jž jedoduše podle výše uvedeého vzorce počítat Cramerův koefcet kotgece V. 11

Vzkoušejte am 1. U patáct vbraých domácotí bla zjštěa obtá plocha a ájemé: čílo plocha (m ) ájemé (Kč) čílo plocha (m ) ájemé (Kč) 1 8,6 970 9 66,1 1600 57,3 795 10 93,0 830 3 70,4 1400 11 5,6 5 4 65,0 00 1 70,0 135 5 48,4 390 13 84, 1900 6 103,8 30 14 55,0 615 7 73,6 1010 15 81,3 560 8 43,5 80 a) Vpočítejte charaktertk obou zaků a pomocí korelačího koefcetu určete, zda je mez oběma proměým závlot. b) Vjádřete tuto závlot pomocí leárí regreí fukce a dále zkute odhadout výš ájmu v btě rozlohou 90 m.. V průzkumu ázorových potojů tudetů bl zjšťová odpověd a otázku Jte pro zavedeí školého a vokých školách? (zak X) možým odpověďm: ao evím e. Součaě bla zjšťováa poltcká oretace tudetů (zak Y) možým varatam levce třed pravce. Do průzkumu blo zařazeo 80 tudetů, výledk zobrazuje tabulka: X \ Y LEVICE STŘED PRAVICE ANO 11 0 8 NEVÍM 3 53 NE 43 5 19 a) Doplňte tabulku o margálí četot zaků X a Y. Z tabulk odečtěte, kolk tudetů odpovědělo evím. b) Změřte ílu závlot potoje tudetů k zavedeí školého a vokých školách a jejch poltcké oretac pomocí Cramerova kotgečího koefcetu. 1