Závislost slovích zaků Závislost slovích (kvalitativích) zaků Obměy slovího zaku Alterativí zaky Možé zaky Tříděí věcé sloví řady: seřazeí obmě je subjektiví záležitostí (podle abecedy), možé i objektiví uspořádáí (výše dosažeého vzděláí) Kombiačí tříděí kotigečí tabulka (alespoň jede zak je možý) asociačí tabulka (oba zaky jsou alterativí) Jediá iformace číselého charakteru četost aalýza slovích zaků je založea a operacích s četostmi Charakteristiky založeé a četostech: Úroveň modus, mediá (tak kde lze staovit objektiví pořadí jejich obmě) Promělivost (epoužívá se slovo variabilita) mutabilita m i 1 Koeficiet mutability ( 1) k i Nabývá hodoty od uly do jedé, je-li k (počet možých obmě zaku je rove rozsahu souboru) Je-li > k, pak se jeho maximálí možá hodota s rostoucím blíží k hodotě jakékoli > 1) ( k 1) ( 1)k (je-li dělitelé k beze zbytku, abývá této hodoty pro Mutabilita je tím meší, čím více se četosti jedotlivých obmě vzájemě liší
Závislost slovích zaků Aalýza kotigečí tabulky Příklad č 14 Naším úkolem je zjistit, zda existuje závislost (popř jak je silá) mezi dvěma otázkami z marketigového výzkumu Možosti sportovího vyžití studetů v Brě A Na které vysoké škole studujete? 1 Masarykova uiverzita Vysoké učeí techické 3 Medelova uiverzita 4 Uiverzita obray 5 Veteriárí a farmaceutická uiverzita B Využíváte sportoví předměty v rámci svojí školy? 1 ao e Schéma kotigečí tabulky A B B 1 B B j B s j A 1 1 1j 1s 1 A 1 j s A i i1 i ij is i A r r1 r rj rs r i 1 j s Na základě odpovědí respodetů (absolvetů aší fakulty) byla sestavea kotigečí tabulka (vziká kombiačím tříděím podle dvou slovích zaků, z ichž aspoň jede je možý):
Závislost slovích zaků 6 VYUŽITÍ ANO NE SOUČET ŘÁDKU ŠKOLA MU 43 3 46 VUT 9 18 47 MENDELU 13 30 43 UO 41 3 44 VFU 37 6 43 Součet sloupce 163 60 3 Kde zak A (otázka č 1) abývá obmě a 1 až a 5 a můžeme jej považovat apř za ezávisle proměý zak, a zak B (otázka č ) abývá obmě b 1 až b a půjde o závisle proměý zak K výpočtu ukazatele potřebujeme zát kromě skutečých četostí (zjištěých průzkumem) i četosti teoretické (vypočítaé za předpokladu ezávislosti obou zaků), u kterých platí, že čím více se budou lišit od těch skutečých tím silější bude závislost obou zaků i j ij, kde i, j jsou příslušé okrajové četosti a je rozsah souboru Na základě tohoto vztahu vypočítáme teoretické četosti pro všechy četosti skutečé Očekávaé ao e četosti MU 33,633 1,37668 VUT 34,3546 1,64574 MENDELU 31,43049,56951 UO 3,16143,83857 VFU 31,43049,56951 CELKEM 163 60
Závislost slovích zaků Míru itezity vzájemé závislosti dvou slovích zaků v kotigečí tabulce měří Čtvercová kotigece χ,614916 7,103856 0,834485,67017 10,80744 9,360,49003 6,59879 0,98691,6835 17,6776 48,0 65,68377 χ r s ( ij ij ) i 1 j 1 ij Čtvercová kotigece může abývat libovolých ezáporých hodot, ejsme schopi určit pomocí této míry sílu závislosti, proto kostruujeme růzé míry kotigece, které z í vycházejí: Průměrá čtvercová kotigece Φ : Maximálí možá hodota je opět růzá Φ χ Přejdeme a charakteristiky itezity závislosti, oproštěé i od vlivu velikosti tabulky koeficiety kotigece Pearsoův koeficiet kotigece P: P Φ χ 1+ Φ χ + Nabývá hodot z itervalu <0, 1), hodoty jeda emůže ikdy dosáhout Hodota je závislá a rozměrech tabulky Čuprovův koeficiet kotigece T: T Φ ( r 1)( s 1) Je z itervalu <0, 1> pouze pro čtvercové kotigečí tabulky (r s) Cramérův koeficiet kotigece C: C mi Φ { r 1; s 1} Je z itervalu 0 C 1 bez ohledu a velikost tabulky
Závislost slovích zaků Vypočítejte uvedeé míry kotigece pro aši tabulku a vyjádřete se o síle závislosti mezi otázkami Statistika Chí-kvadrát 65,6838 Stupě volosti 4,0000 Pravostraá pravděpodobost 0,0000 Fí 0,547 Cramerovo V 0,547 Pearsoův koeficiet kotigece 0,4770
Závislost slovích zaků Měřeí asociace zvláští případ kotigečí závislosti pro r s, zvláští případ korelačí závislosti dvou zaků, z ichž každý abývá pouze dvou hodot ula a jeda Asociačí tabulka Zak B ANO NE Celkem Zak A y 1 y 0 ANO 10 1* x 1 NE 01 00 0* x 0 Celkem *1 *0 Itezita asociačí závislosti se měří koeficietem asociace, kdy jde o jedostraou sdružeost kvalitativího zaku s jiým kvalitativím zakem Koeficiet asociace je vlastě koeficietem korelace v případě ula-jedičkových veliči Vzorec koeficietu korelace zaků X, Y: x y x y x ( x) ][ y ( y) ] s r sx s y [ Vycházíme-li z tohoto koeficietu, potom pro koeficiet asociace platí vztahy: V x y, x 1, y 1* 1 *1 1* 0* *1 *0, atd Potom koeficiet asociace má tvar: Hodoceí koeficietu asociace je idetické jako u klasického koeficietu korelace kvatitativích zaků, hodoty se pohybují v rozmezí od 1 do +1 Kromě itezity závislosti tedy zahruje iformaci i o směru závislosti v asociačí tabulce Příklad č 13: V ovocém sadu byl provede postřik ovocých stromů proti červivosti ovoce Ze 450 stromů jich bylo postřikem ošetřeo 335, eošetřeo zůstalo 5 V asociačí tabulce jsou uvedey výsledky ošetřeí stromů vzhledem k červivosti ovoce
Závislost slovích zaků Červivost ANO NE Součet Postřik y 1 y 0 ANO x 1 1 10 33 1* 335 NE x 0 01 53 00 6 0* 5 Součet *1 65 *0 385 450 Kde * v idexu říká, že četosti jsou sčítáy přes idex zaku, který je ahraze hvězdičkou V 450 1 335 65 335 65 5 385 0,57 Na základě výsledku můžeme mluvit o egativí středí závislosti mezi postřikem a červivostí ovoce Příklad č 14 Byl zjišťová vztah mezi odpověďmi a otázky Sportujete? vs Myslíte si, že máte dostatek pohybu? Dost pohybu Sportujete ANO y 1 NE y 0 Součet ANO x 1 107 10 15 1* 3 NE x 0 01 10 00 34 0* 44 Součet *1 7 *0 159 76 V 76 107 3 7 3 7 44 159 0,1733 Výsledá hodota koeficietu asociace překvapivě vypovídá o velice ízké kladé závislosti
Regrese alterativích zaků Závislost slovích zaků Při asociačí závislosti můžeme čiit i regresí odhady teoretické relativí četosti jedoho zaku v souboru při zámé teoretické relativí četosti druhého zaku Je-li zámá relativí četosti zaku x 1 rova relativí četost výskytu zaku y 1 1 A, 1 + B 1 je její lieárí fukcí: 1, pak vypočteá (teoretická) kde A, B jsou parametry přímky Absolutí čle udává teoretickou relativí četost výskytu jedotek y 1 při žádém výskytu jedotek x 1 Směrice přímky udává změu relativí četosti těchto jedotek při jedotkové relativí změě výskytu jedotek x 1 Výpočet obou parametrů se provádí podle vzorců: A 01 0 B 1 A V případě oboustraé závislosti alterativích zaků lze aalogicky (záměou proměých) určit i sdružeou přímku Příklad - Sportujete Parametry regresí přímky určíme jako: A 01 0 10 44 0,7 B A 1 107 3 0,7 0,34 x Přímka má pak rovici p y 1 0,7 + 0, 34p 1 Horší sloví kometář ízká závislost
Závislost slovích zaků Příklad - Červivost A 01 0 5 0,461 B A 1 1 335 0,461 0,45 p y 1 0,461 0, 45px 1 Při 30 % podílu ošetřeých stromů by byla očekávaá relativí červivost 33,3 % Například při 90 % ošetřeých stromů se síží a 7,85 %