Závislost slovních znaků

Podobné dokumenty
9. Měření závislostí ve statistice Pevná a volná závislost

P2: Statistické zpracování dat

} kvantitativní znaky. korelace, regrese. Prof. RNDr. Jana Zvárov. Obecné principy

Deskriptivní statistika 1

12. N á h o d n ý v ý b ě r

Odhady parametrů polohy a rozptýlení pro často se vyskytující rozdělení dat v laboratoři se vyčíslují podle následujících vztahů:

STATISTIKA. Statistika se těší pochybnému vyznamenání tím, že je nejvíce nepochopeným vědním oborem. H. Levinson

1. Základy počtu pravděpodobnosti:

Základy statistiky. Zpracování pokusných dat Praktické příklady. Kristina Somerlíková

Cvičení 6.: Výpočet střední hodnoty a rozptylu, bodové a intervalové odhady střední hodnoty a rozptylu

Pro statistické šetření si zvolte si statistický soubor např. všichni žáci třídy (několika tříd, školy apod.).

Pravděpodobnost a aplikovaná statistika

6 Intervalové odhady. spočteme aritmetický průměr, pak tyto průměry se budou chovat jako by pocházely z normálního. nekonečna.

Odhady parametrů 1. Odhady parametrů

Intervalové odhady parametrů některých rozdělení.

1 POPISNÁ STATISTIKA V PROGRAMU MS EXCEL

Intervalové odhady parametrů

Náhodný výběr 1. Náhodný výběr

i 1 n 1 výběrový rozptyl, pro libovolné, ale pevně dané x Roznačme n 1 Téma 6.: Základní pojmy matematické statistiky

Mezní stavy konstrukcí a jejich porušov. Hru IV. Milan RůžR. zbynek.hruby.

Statistika je vědní obor zabývající se zkoumáním jevů, které mají hromadný charakter.

Pravděpodobnost a aplikovaná statistika

8. Analýza rozptylu.

Cvičení 6.: Bodové a intervalové odhady střední hodnoty, rozptylu a koeficientu korelace, test hypotézy o střední hodnotě při známém rozptylu

odhady parametrů. Jednostranné a oboustranné odhady. Intervalový odhad střední hodnoty, rozptylu, relativní četnosti.

(Teorie statistiky a aplikace v programovacím jazyce Visual Basic for Applications)

VYSOCE PŘESNÉ METODY OBRÁBĚNÍ

Popisná statistika - zavedení pojmů. 1 Jednorozměrný statistický soubor s kvantitativním znakem

Katedra pravděpodobnosti a matematické statistiky. χ 2 test nezávislosti

Odhad parametru p binomického rozdělení a test hypotézy o tomto parametru. Test hypotézy o parametru p binomického rozdělení

1.3. POLYNOMY. V této kapitole se dozvíte:

f x a x DSM2 Cv 9 Vytvořující funkce Vytvořující funkcí nekonečné posloupnosti a0, a1,, a n , reálných čísel míníme formální nekonečnou řadu ( )

PRAVDĚPODOBNOST A STATISTIKA

K čemu slouží regrese?

Permutace s opakováním

Statistické metody ve veřejné správě ŘEŠENÉ PŘÍKLADY

veličiny má stejný řád jako je řád poslední číslice nejistoty. Nejistotu píšeme obvykle jenom jednou

4.2 Elementární statistické zpracování Rozdělení četností

Testujeme hypotézu: proti alternativě. Jednoduché třídění:

17. Statistické hypotézy parametrické testy

Permutace s opakováním

8. Základy statistiky. 8.1 Statistický soubor

1. JEV JISTÝ a. je jev, který nikdy nenastane b. je jev, jehož pravděpodobnost = ½ c. je jev, jehož pravděpodobnost = 0 d.

13 Popisná statistika

III/2 Inovace a zkvalitnění výuky prostřednictvím ICT

Pravděpodobnost a statistika - absolutní minumum

2 IDENTIFIKACE H-MATICE POPISUJÍCÍ VEDENÍ Z NAMĚŘENÝCH HODNOT

Z mých cvičení dostalo jedničku 6 studentů, dvojku 8 studentů, trojku 16 studentů a čtyřku nebo omluveno 10 studentů.

Statistika. Statistické funkce v tabulkových kalkulátorech MSO Excel a OO.o Calc

1. ZÁKLADY VEKTOROVÉ ALGEBRY 1.1. VEKTOROVÝ PROSTOR A JEHO BÁZE

Číselné charakteristiky náhodných veličin

POLYNOM. 1) Základní pojmy. Polynomem stupně n nazveme funkci tvaru. a se nazývají koeficienty polynomu. 0, n N. Čísla. kde

vají statistické metody v biomedicíně

ZÁKLADNÍ STATISTICKÉ VÝPOČTY (S VYUŽITÍM EXCELU)

8. cvičení 4ST201-řešení

IAJCE Přednáška č. 12

2. Znát definici kombinačního čísla a základní vlastnosti kombinačních čísel. Ovládat jednoduché operace s kombinačními čísly.

ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE

4 DOPADY ZPŮSOBŮ FINANCOVÁNÍ NA INVESTIČNÍ ROZHODOVÁNÍ

České vysoké učení technické v Praze. Fakulta dopravní. Semestrální práce. Statistika

Pravděpodobnost a aplikovaná statistika

UPLATNĚNÍ ZKOUŠEK PŘI PROHLÍDKÁCH MOSTŮ

11. přednáška 16. prosince Úvod do komplexní analýzy.

Pevnost a životnost - Hru III 1. PEVNOST a ŽIVOTNOST. Hru III. Milan Růžička, Josef Jurenka, Zbyněk Hrubý.

1. Číselné obory, dělitelnost, výrazy

Doc. Ing. Dagmar Blatná, CSc.

PRAVDĚPODOBNOST A STATISTIKA

vají statistické metody v biomedicíně Literatura Statistika v biomedicínsk nském výzkumu a ve zdravotnictví

pravděpodobnostn podobnostní jazykový model

Komplexní čísla. Definice komplexních čísel

Ilustrativní příklad ke zkoušce z B_PS_A léto 2014.

Matematika přehled vzorců pro maturanty (zpracoval T. Jánský) Úpravy výrazů. Binomická věta

Zhodnocení přesnosti měření

10.3 GEOMERTICKÝ PRŮMĚR

Pravděpodobnostní model doby setrvání ministra školství ve funkci

REGRESNÍ DIAGNOSTIKA. Regresní diagnostika

V. Normální rozdělení

Užití binomické věty

2. Náhodná veličina. je konečná nebo spočetná množina;

1. Nakreslete všechny kostry následujících grafů: nemá žádnou kostru, roven. roven n,

PRAVDĚPODOBNOST A STATISTIKA

BAKALÁŘSKÁ STA I. + II.

Obsah. 1 Mocninné řady Definice a vlastnosti mocninných řad Rozvoj funkce do mocninné řady Aplikace mocninných řad...

3. Lineární diferenciální rovnice úvod do teorie

2 STEJNORODOST BETONU KONSTRUKCE

Náhodné jevy a pravděpodobnost

Intervalový odhad. nazveme levostranným intervalem pro odhad parametru Θ. Statistiku. , kde číslo α je blízké nule, nazveme horním

Vzorový příklad na rozhodování BPH_ZMAN

Elementární zpracování statistického souboru

jako konstanta nula. Obsahem centrálních limitních vět je tvrzení, že distribuční funkce i=1 X i konvergují za určitých

Při sledování a studiu vlastností náhodných výsledků poznáme charakter. podmínek různé výsledky. Ty odpovídají hodnotám jednotlivých realizací

Tento projekt je spolufinancován Evropským sociálním fondem a Státním rozpočtem ČR InoBio CZ.1.07/2.2.00/

NEPARAMETRICKÉ METODY

1. Základy měření neelektrických veličin

1 PSE Definice základních pojmů. (ω je elementární jev: A ω (A ω) nebo (A );

1. K o m b i n a t o r i k a

3. Charakteristiky a parametry náhodných veličin

Petr Šedivý Šedivá matematika

Matematika I, část II

Přednášky část 7 Statistické metody vyhodnocování dat

Transkript:

Závislost slovích zaků Závislost slovích (kvalitativích) zaků Obměy slovího zaku Alterativí zaky Možé zaky Tříděí věcé sloví řady: seřazeí obmě je subjektiví záležitostí (podle abecedy), možé i objektiví uspořádáí (výše dosažeého vzděláí) Kombiačí tříděí kotigečí tabulka (alespoň jede zak je možý) asociačí tabulka (oba zaky jsou alterativí) Jediá iformace číselého charakteru četost aalýza slovích zaků je založea a operacích s četostmi Charakteristiky založeé a četostech: Úroveň modus, mediá (tak kde lze staovit objektiví pořadí jejich obmě) Promělivost (epoužívá se slovo variabilita) mutabilita m i 1 Koeficiet mutability ( 1) k i Nabývá hodoty od uly do jedé, je-li k (počet možých obmě zaku je rove rozsahu souboru) Je-li > k, pak se jeho maximálí možá hodota s rostoucím blíží k hodotě jakékoli > 1) ( k 1) ( 1)k (je-li dělitelé k beze zbytku, abývá této hodoty pro Mutabilita je tím meší, čím více se četosti jedotlivých obmě vzájemě liší

Závislost slovích zaků Aalýza kotigečí tabulky Příklad č 14 Naším úkolem je zjistit, zda existuje závislost (popř jak je silá) mezi dvěma otázkami z marketigového výzkumu Možosti sportovího vyžití studetů v Brě A Na které vysoké škole studujete? 1 Masarykova uiverzita Vysoké učeí techické 3 Medelova uiverzita 4 Uiverzita obray 5 Veteriárí a farmaceutická uiverzita B Využíváte sportoví předměty v rámci svojí školy? 1 ao e Schéma kotigečí tabulky A B B 1 B B j B s j A 1 1 1j 1s 1 A 1 j s A i i1 i ij is i A r r1 r rj rs r i 1 j s Na základě odpovědí respodetů (absolvetů aší fakulty) byla sestavea kotigečí tabulka (vziká kombiačím tříděím podle dvou slovích zaků, z ichž aspoň jede je možý):

Závislost slovích zaků 6 VYUŽITÍ ANO NE SOUČET ŘÁDKU ŠKOLA MU 43 3 46 VUT 9 18 47 MENDELU 13 30 43 UO 41 3 44 VFU 37 6 43 Součet sloupce 163 60 3 Kde zak A (otázka č 1) abývá obmě a 1 až a 5 a můžeme jej považovat apř za ezávisle proměý zak, a zak B (otázka č ) abývá obmě b 1 až b a půjde o závisle proměý zak K výpočtu ukazatele potřebujeme zát kromě skutečých četostí (zjištěých průzkumem) i četosti teoretické (vypočítaé za předpokladu ezávislosti obou zaků), u kterých platí, že čím více se budou lišit od těch skutečých tím silější bude závislost obou zaků i j ij, kde i, j jsou příslušé okrajové četosti a je rozsah souboru Na základě tohoto vztahu vypočítáme teoretické četosti pro všechy četosti skutečé Očekávaé ao e četosti MU 33,633 1,37668 VUT 34,3546 1,64574 MENDELU 31,43049,56951 UO 3,16143,83857 VFU 31,43049,56951 CELKEM 163 60

Závislost slovích zaků Míru itezity vzájemé závislosti dvou slovích zaků v kotigečí tabulce měří Čtvercová kotigece χ,614916 7,103856 0,834485,67017 10,80744 9,360,49003 6,59879 0,98691,6835 17,6776 48,0 65,68377 χ r s ( ij ij ) i 1 j 1 ij Čtvercová kotigece může abývat libovolých ezáporých hodot, ejsme schopi určit pomocí této míry sílu závislosti, proto kostruujeme růzé míry kotigece, které z í vycházejí: Průměrá čtvercová kotigece Φ : Maximálí možá hodota je opět růzá Φ χ Přejdeme a charakteristiky itezity závislosti, oproštěé i od vlivu velikosti tabulky koeficiety kotigece Pearsoův koeficiet kotigece P: P Φ χ 1+ Φ χ + Nabývá hodot z itervalu <0, 1), hodoty jeda emůže ikdy dosáhout Hodota je závislá a rozměrech tabulky Čuprovův koeficiet kotigece T: T Φ ( r 1)( s 1) Je z itervalu <0, 1> pouze pro čtvercové kotigečí tabulky (r s) Cramérův koeficiet kotigece C: C mi Φ { r 1; s 1} Je z itervalu 0 C 1 bez ohledu a velikost tabulky

Závislost slovích zaků Vypočítejte uvedeé míry kotigece pro aši tabulku a vyjádřete se o síle závislosti mezi otázkami Statistika Chí-kvadrát 65,6838 Stupě volosti 4,0000 Pravostraá pravděpodobost 0,0000 Fí 0,547 Cramerovo V 0,547 Pearsoův koeficiet kotigece 0,4770

Závislost slovích zaků Měřeí asociace zvláští případ kotigečí závislosti pro r s, zvláští případ korelačí závislosti dvou zaků, z ichž každý abývá pouze dvou hodot ula a jeda Asociačí tabulka Zak B ANO NE Celkem Zak A y 1 y 0 ANO 10 1* x 1 NE 01 00 0* x 0 Celkem *1 *0 Itezita asociačí závislosti se měří koeficietem asociace, kdy jde o jedostraou sdružeost kvalitativího zaku s jiým kvalitativím zakem Koeficiet asociace je vlastě koeficietem korelace v případě ula-jedičkových veliči Vzorec koeficietu korelace zaků X, Y: x y x y x ( x) ][ y ( y) ] s r sx s y [ Vycházíme-li z tohoto koeficietu, potom pro koeficiet asociace platí vztahy: V x y, x 1, y 1* 1 *1 1* 0* *1 *0, atd Potom koeficiet asociace má tvar: Hodoceí koeficietu asociace je idetické jako u klasického koeficietu korelace kvatitativích zaků, hodoty se pohybují v rozmezí od 1 do +1 Kromě itezity závislosti tedy zahruje iformaci i o směru závislosti v asociačí tabulce Příklad č 13: V ovocém sadu byl provede postřik ovocých stromů proti červivosti ovoce Ze 450 stromů jich bylo postřikem ošetřeo 335, eošetřeo zůstalo 5 V asociačí tabulce jsou uvedey výsledky ošetřeí stromů vzhledem k červivosti ovoce

Závislost slovích zaků Červivost ANO NE Součet Postřik y 1 y 0 ANO x 1 1 10 33 1* 335 NE x 0 01 53 00 6 0* 5 Součet *1 65 *0 385 450 Kde * v idexu říká, že četosti jsou sčítáy přes idex zaku, který je ahraze hvězdičkou V 450 1 335 65 335 65 5 385 0,57 Na základě výsledku můžeme mluvit o egativí středí závislosti mezi postřikem a červivostí ovoce Příklad č 14 Byl zjišťová vztah mezi odpověďmi a otázky Sportujete? vs Myslíte si, že máte dostatek pohybu? Dost pohybu Sportujete ANO y 1 NE y 0 Součet ANO x 1 107 10 15 1* 3 NE x 0 01 10 00 34 0* 44 Součet *1 7 *0 159 76 V 76 107 3 7 3 7 44 159 0,1733 Výsledá hodota koeficietu asociace překvapivě vypovídá o velice ízké kladé závislosti

Regrese alterativích zaků Závislost slovích zaků Při asociačí závislosti můžeme čiit i regresí odhady teoretické relativí četosti jedoho zaku v souboru při zámé teoretické relativí četosti druhého zaku Je-li zámá relativí četosti zaku x 1 rova relativí četost výskytu zaku y 1 1 A, 1 + B 1 je její lieárí fukcí: 1, pak vypočteá (teoretická) kde A, B jsou parametry přímky Absolutí čle udává teoretickou relativí četost výskytu jedotek y 1 při žádém výskytu jedotek x 1 Směrice přímky udává změu relativí četosti těchto jedotek při jedotkové relativí změě výskytu jedotek x 1 Výpočet obou parametrů se provádí podle vzorců: A 01 0 B 1 A V případě oboustraé závislosti alterativích zaků lze aalogicky (záměou proměých) určit i sdružeou přímku Příklad - Sportujete Parametry regresí přímky určíme jako: A 01 0 10 44 0,7 B A 1 107 3 0,7 0,34 x Přímka má pak rovici p y 1 0,7 + 0, 34p 1 Horší sloví kometář ízká závislost

Závislost slovích zaků Příklad - Červivost A 01 0 5 0,461 B A 1 1 335 0,461 0,45 p y 1 0,461 0, 45px 1 Při 30 % podílu ošetřeých stromů by byla očekávaá relativí červivost 33,3 % Například při 90 % ošetřeých stromů se síží a 7,85 %