LEKCE 5 STATISTICKÁ INFERENCE ANEB ZOBECŇOVÁNÍ VÝSLEDKŮ Z VÝBĚROVÉHO NA ZÁKLADNÍ SOUBOR
|
|
- Matěj Veselý
- před 6 lety
- Počet zobrazení:
Transkript
1 LEKCE 5 STATISTICKÁ INFERENCE ANEB ZOBECŇOVÁNÍ VÝSLEDKŮ Z VÝBĚROVÉHO NA ZÁKLADNÍ SOUBOR Empirický výzkum v sociálních vědách je velmi často založen na tom, že získává údaje jenom o části subjektů, tyto údaje analyzuje a poté je generalizuje (zobecňuje) na příslušnou populaci, z níž byly tyto subjekty vybrány. Hovoříme-li o generalizaci, mějme na paměti, že existují dva hlavní způsoby generalizace: generalizace statistická a teoretická (de Vaus 2002). Teoretická generalizace Tato generalizace znamená zobecňování z empirických dat do teorie. Využívá se hlavně v takových výzkumných designech jako experiment nebo případová studie, neboť oba tyto výzkumné postupy nejsou obvykle založeny na práci s reprezentativními vzorky případů, takže statistická generalizace zde nemá smysl. teoretická generalizace je založena hlavně na replikaci (opakování) nalezneme-li stejné výsledky, kdykoliv je experiment opakován, naše důvěra v jeho výsledky se stále zvyšuje. Pokud jsou výsledky experimentu navíc opakovaně nalézány i za různých podmínek a na různých souborech, naše důvěra se zvyšuje ještě více. Pak jsme schopni naše výsledky zobecnit a včlenit je do existující teorie. Jelikož předmětem našeho kursu je statistická analýza dat, je zřejmé, že dále se budeme zabývat pouze možnostmi generalizace statistické. Statistická generalizace znamená zobecňování výsledků z výběrového souboru (vzorku) na soubor základní (populaci). Říká se jí také statistická inference (statistické usuzování). 1 Jelikož je založena na teorii pravděpodobnosti, je základní podmínkou statistické generalizace to, že výběrový soubor, z něhož chceme zobecňovat, musí být pravděpodobnostním výběrem, tedy výběrem založeným na pravděpodobnostních (náhodných) postupech. Součástí statistické generalizace je zjišťování, s jakou pravděpodobností výběrové výsledky odrážejí skutečné vlastnosti základního souboru. To nám umožňují inferenční statistiky. Ty jsou dvojího druhu: a) bodové a intervalové odhady a b) testy statistické významnosti. Bodové a intervalové odhady Problematiku bodových a intervalových odhadů naleznete detailně popsánu na jiném místě. 2 Zde proto postačí sdělit, že ačkoliv ve výběrovém souboru jsme schopni vypočítat přesné statistické údaje např. o průměrném příjmu souboru, o jeho průměrné inteligenci, o korelaci mezi mírou tolerance a vzděláním, pro základní soubor musíme tyto veličiny (parametry) pouze odhadovat, neboť víme, že naše výběrové výsledky jsou vždy zatíženy (větší či menší) výběrovou chybou. Proto pro jejich stanovení vypočítáváme směrodatnou chybu a intervaly spolehlivosti. Testy statistické významnosti Tyto testy umožňují odhadnout, jak je pravděpodobné, že výsledky nalezené ve výběrovém souboru jsou způsobeny výběrovou chybou, jak je pravděpodobné, že např. zjistíme poměrně silnou korelaci ve výběrovém souboru, byť v souboru základním vůbec neexistuje. Statistická generalizace má bohužel ale své limity. Postupy statistické inference lze použít pouze v případě, že: 1 O statistické inferenci se lze česky dočíst např. v Hendl, Jan Přehled statistických metod zpracování dat. Portál, Praha, str Řehák, Jan Poznámky k analýze sociologických dat. Sociologický časopis, (4), str
2 SOC108 LEKCE 5: STATISTICKÁ INFERENCE 2 výběrový soubor má charakter je dobrým reprezentantem populace, tato populace je náležitě definována, byl použit adekvátní pravděpodobnostní výběrový postup, míra neuskutečněných rozhovorů je nízká (počet odmítnutých rozhovorů byl nízký), takže tzv. response rate je vysoký. Postupy statistické inference nemá smyslu používat, když: výběrový soubor je vybrán prostřednictvím nepravděpodobnostních metod; míra uskutečněných rozvorů je nižší než 85 % (Blaikie 2003). 3 Vysoká míra odmítnutých rozhovorů snižuje reprezentativitu souboru a zvyšuje tak pravděpodobnost, že náš výběr bude nespolehlivý pro generalizaci výsledků. Sociální vědy se ovšem s problémem odmítnutých rozhovorů setkávají dnes poměrně často. Co s tím? Mnoho se dělat nedá, lidé mají právo účast na výzkumném rozhovoru odmítnou. Jistým kompromisem je, že snažíme od těch, kdo odmítnou zjistit alespoň základní socio-demografické charakteristiky. Pokud socio-demografický profil odmítnutých je podobný těm, kdo se výzkumu neodmítli zúčastnit, můžeme výsledky generalizovat. Pokud jsou ale jejich charakteristiky odlišné, jsme ztraceni, neboť to je signálem, že určitá část vytipovaných respondentů systematicky odmítla se rozhovorů zúčastnit, takže nás výběrový soubor je určitým způsobem systematicky vychýlen. když pracujeme s celou populací (jakkoliv definovanou pro účely našeho výzkumu) Populace a výběry Každý sociálně vědní výzkum stojí před rozhodnutím, jakým způsobem získat dat pro své analýzy. Pokud je pro analýzu nezbytné získat o velkém množství jedinců, sociálních jednotek nebo sociálních artefaktů, pak se musíme vždy rozhodnout, zdali budeme sbírat data od celé populace těchto jedinců, jednotek nebo artefaktů, nebo zda provedeme sběr dat jenom od nějaké části z této populace, zda tedy provedeme výběr. Sociální vědy většinou pracují s výběry (výběrovými soubory) práce s celou populací není příliš častá (samozřejmě záleží zde na tom, jak je definovaná populace našich analytických jednotek). Ukazuje se, že počet jednotek je obvykle dost velký na to, aby přinesl adekvátní informaci o jakékoliv populaci. Za to, že pracujeme s výběry a ne s celou populací a že si tedy ulehčujeme situaci, se ovšem platí jistá cena (ostatně nic není na tomto světě zadarmo): 1. Nikdy si nemůžeme být absolutně jisti, že to, co se ukazuje v našem vzorku (výběru), existuje také v populaci (v základním souboru); 2. práce s výběry velmi komplikuje analýzu Populace (základní soubor) Populace je vždy definována pro potřeby výzkumu, v souvislosti s problémem, který řešíme. Populace může být velká (obyvatelé ČR), ale také malá (studenti prvního roku na FSS), a nemusí to být populace osob. Příklady: obyvatelé ČR VŠ studenti ČR Studenti prvního roku studia na brněnských VŠ předplatitelé novin MF Dnes Senioři v Jihomoravském kraji Výrobní podniky s počtem zaměstnanců do 200 osob na Moravě Všechna čísla Lidových novin v roce 2002 Pouze sobotní vydání Lidových novin v roce U tohoto pravidla ale pozor: pokud je tato míra nižší, ale my víme, že charakteristiky výběrového souboru odpovídají souboru základnímu, pak toto pravidlo neplatí.
3 SOC108 LEKCE 5: STATISTICKÁ INFERENCE 3 Články v Lidových novinách týkající se homosexuality Pokud v našem výzkumu pracujeme s celou populací, provádíme census a statistická inference zde pak nemá žádný smysl. Pokud pracujeme s výběry, je ideálem získat takový soubor, který věrně odráží charakteristiky populace. Tohoto ideálu se v praxi dosahuje jen stěží. Existuje jediný postup, jak získat reprezentativní výběrový soubor: pravděpodobnostní (náhodný) výběr ten je založen na tom, že každá jednotka populace má stejnou pravděpodobnost býti vybrána do souboru výběrového. Jakýkoliv jiný postup výběru 4 nevede k reprezentativnímu souboru a aplikace inferenční analýzy není možná. Jelikož naším cílem je vypovídat o populaci, musíme na základě statistické analýzy odhadovat charakteristiky populace nebo vzorce vztahů v populaci z charakteristik a vztahů nalezených ve vzorku. Ve statistické terminologii tomu říkáme odhad populačních parametrů z výběrových statistik a činíme tak prostřednictvím inferenční statistiky. Výběr nemá většinou charakter ideálního reprezentanta populace. Pokud by byl ideálním reprezentantem, to je byl by pouze zmenšenou replikou populace, nebylo by třeba používat inferenční statistiku. Jelikož tomu tak většinou není, musíme počítat s tím, že vždy existuje výběrová chyba, kterou se snažíme určit. Velikost výběru Velikost výběrového souboru (vzorku) je důležitá pro přesnost odhadu populačních parametrů, tedy údajů o populaci získaných na základě statistik zjištěných ve výběrovém souboru. Na otázku, jak velký by měl být výběrový soubor, existuje jednoduchá, ale poněkud vágní odpověď: čím větší, tím lepší. Ale ono čím více má své jasné praktické limity. Přesnost odhadu se nezvyšuje lineárně. Zpočátku se velmi zvyšuje, od určité velikost výběru však roste již jen zvolna a v jistém bodě nastává moment, kdy náklady spojené se zvyšováním velikosti výběru jsou již vyšší než výnosy to je zvyšování přesnosti odhadu populačních parametrů. Proto platí již výše řečené: velikost výběru mezi jedním až dvěma tisíci jednotek je obvykle plně dostačující. A jaká je minimální velikost výběrového souboru? Na tuto otázku neexistuje jasná odpověď, naše zkušenost říká (a je podepřena jinými), že 300 jednotek by mohlo být adekvátní, ovšem 500 je lepší a 1000 je ještě lepší. Při stanovování velikosti výběru jsou ovšem ještě i další faktory ve hře, o nichž je třeba vědět. Rozhodnutí o velikosti výběrového souboru nemá nic do činění s poměrem velikosti výběru a populace. Mezi výzkumníky se traduje, že výběr by měl představovat přibližně 10% populace. Takové pravidlo ovšem neexistuje. Rozhodnutí o velikosti výběru závisí na tom, jak důležitá je přesnost odhadu, jak velkou výběrovou chybu si můžeme dovolit tolerovat. Musíme-li mít malou výběrovou chybu (např. při testování nového léku), musíme mít velký výběrový soubor. Velikost vorku závisí také na postupech analýz a na typu dat, s nimiž pracujeme. Obecně platí, že nominální data vyžadují větší soubory než data ordinální a že data kardinální potřebují menší soubory než data ostatní. Proč? Obecné pravidlo říká, že při analýze nominálních dat, kdy hlavním způsobem práce jsou třídění, by v políčku tabulky mělo být v průměru 10 případů. Pak velikost z tohoto technického hlediska se dá odhadnout tak, že vezmeme v úvahu dvě proměnné s nejvyšším počtem kategorií. Např. pokud máme v datech proměnnou s šesti kategoriemi a proměnnou s pěti kategoriemi, je počet polí v tabulce vytvořené z těchto dvou znaků 30 (5 x 6) a velikost souboru by měla být 300 (5 x 6 x 10). Pokud předpokládáme třídění třetího stupně (to je tabulku se třemi proměnnými), tento počet musí být dále násoben počtem kategorií třetí proměnné. Pokud ta má, řekněme, také pět kategorií, měla by být velikost souboru Při plánovaném třídění ještě vyšších stupňů (a teprve třídění vyšších stupňů mnohdy odhalí v datech vztahy, které jsou výzkumně zajímavé a netriviální) se velikost vzorku samozřejmě dále zvyšuje. Jelikož v sociologických výzkumech pracujeme velmi často s nominálními proměnnými, leží zde odpo- 4 Výběrové postupy nejsou předmětem tohoto textu.
4 SOC108 LEKCE 5: STATISTICKÁ INFERENCE 4 věď na případnou otázku, proč některé výběry jsou vskutku velké a mají nezřídka velikost pohybující se kolem 4000 až 5000 jednotek. Při práci s kardinálními proměnnými se uvádí jako nejnižší možná velikost souboru z tohoto technického hlediska 30 jednotek. Velikost výběrové chyby však není ovlivněna pouze velikostí souboru. Má na ni vliv také to, jak heterogenní je populace v parametru, který se snažíme generalizovat. Pokud je relativně homogenní (extrémním případem by mohla být její naprostá uniformita např. v postoji k trestu smrti. Pak by stačilo udělat výběr o jednom jediném prvku a my bychom z něj mohli směle svůj výsledek zobecnit), je výběrová chyba nižší, pokud je velmi heterogenní, míra výběrové chyby se zvyšuje. Potíž je ale v tom, že my v převážných případech heterogenitu populace neznáme (a proto je předmětem našeho výzkumu). Vychýlený výběr a co s tím Pro statistické generalizace je nesmírně důležité vědět, zdali náš výběrový soubor je či není vychýlen a pokud je vychýlen, tak jak mnoho. Vychýlenost výběru je relativním konceptem, vztahuje se totiž vždycky pouze k definici našeho základního souboru. Výběrový soubor je vychýlen tehdy, když je např. starší než soubor základní (máme v něm vyšší zastoupení seniorů než je v námi definované populaci) nebo vzdělanější (což se stává poměrně často proč asi?) apod. Vychýlenost výběrového souboru zjistíme tak, že srovnáme některé jeho charakteristiky s údaji, které již máme o populaci z jiných zdrojů. Např. je-li náš vzorek reprezentantem celé dospělé populace ČR, pak můžeme srovnat jeho demografické charakteristiky se základním souborem, neboť ty o něm známe z výsledků sčítání lidu. Bohužel ne vždy máme takovouto informaci o základním souboru k dispozici. Týká se to především situace, kdy předmětem našeho výzkumného zájmu je nějaká specifická populace (např. nedobrovolně bezdětné páry), jejíž parametry nejsou známy. V takovém případě je stanovení vychýlenosti obtížné. 5 Zjistíme-li, na základě srovnání příslušných charakteristik, že jsme získali vychýlený výběr, můžeme tuto situaci napravit tzv. vážením souboru. Vážení souboru ve statistice znamená, že kategorie, které jsou ve výběrovém souboru podreprezentovány, budeme počítat vícekrát a naopak kategorie, které jsou nadreprezentovány, budeme počítat méněkrát. Když např. zjistíme, že máme v souboru více respondentů s vysokoškolským vzděláním a méně respondentů se vzděláním základním, musíme pro každý výpočet každého respondenta se základním vzděláním započítat více než jedenkrát a každého respondenta s VŠ vzděláním započítat méněkrát než jednou. Toto lze zařídit statisticky tak, že pro každou relevantní proměnnou (většinou se zajímáme o pohlaví, věk, vzdělání, popř. velikost místo bydliště a geografickou lokaci), v níž se náš výběrový soubor odchyluje od základního, stanovíme příslušné váhy a těmito vahami jednotky násobíme. Tím vážíme soubor. Vážení souboru závisí na tom, zdali jej vážíme pouze podle jedné proměnné, nebo podle několika proměnných. Vážení souboru podle jedné proměnné Vážení souboru podle jedné probíhá následovně. 1. Nejdříve získáme rozložení příslušné proměnné jak ve vzorku, tak v populaci. Dejme tomu, že ve vzorku byl poměr mužů a žen 40 : 60, zatímco v populaci, jak jsme zjistili z jiných zdrojů byl tento poměr 50 : 50. V tabulce (viz tab. 5.1) to tedy vypadá takto: 5 Mimochodem, v tomto případě bychom měli již problémy se samotným stanovením výběrového postupu, neboť náš základní soubor (naše populace) je sice jednoduše definovatelný (nedobrovolně bezdětní), avšak velmi obtížně bychom zde získávali oporu výběru, tedy seznam jednotek (a nejlépe ještě s jejich adresami), z nichž by bylo možné provést pravděpodobnostní výběr. Řešením by snad bylo, samozřejmě pouze v případě, pokud by neexistovalo lékařské tajemství a neplatil by zákon o ochraně osobních údajů, zkompilovat takový seznam od všech pracovišť v ČR, která léčí neplodnost.
5 SOC108 LEKCE 5: STATISTICKÁ INFERENCE 5 Tab. 5.1: Podíl mužů a žen (v %) ve vzorku a v populaci Výběrový soubor Populace Muži 40 % 50 % Ženy 60 % 50 % Muži byli ve vzorku podreprezentováni, žene naopak nadreprezentovány. Náš vzorek tedy musíme upravit (zvážit) tak, aby jeho proporce v proměnné pohlaví odpovídaly proporci mužů a žen v populaci. Příslušné váhy stanovíme podle jednoduchého vzorce: váha = populace(%) vzorek(%) (1) Pro muže bude váha: 50 / 40 = 1,25, pro ženy 50 / 60 = 0,83 Nyní musíme v SPSS vytvořit novou proměnnou, která bude tyto váhy obsahovat a pak mu dát příkaz, aby tyto váhy při každém výpočtu použil. Váhovou proměnnou nazvěme vaha_1. Vytvoříme prostřednictvím příkazu Compute, proměnná pohlaví nechť má v našem souboru jméno pohl, muži nechť mají hodnotu 1, ženy 2. Doporučuji pracovat v režimu syntaxe. Nejdříve si otevřeme editor pro syntaktické příkazy: File New Syntax Syntax bude mít podobu: COMPUTE VAHA_1 = 0. IF (POHL = 1) VAHA_1 = IF (POHL = 2) VAHA_1 = Pozn. Když vytváříte novou váhovou proměnnou příkazem Compute, je dobré nastavit počáteční hodnotu na 0. Další dva řádky tuto hodnotu změní buď na 1,25 (pokud to bude muž) nebo na 0,83 (pokud to bude žena). Těm, u nichž nemáme záznam o pohlaví, zůstane nula a při vážení zmizí ze souboru. A pozor, desetinnou čárku je třeba v SPSS psát jako desetinnou tečku! Spustíme syntaktický příkaz, čímž vytvoříme váhovou proměnnou. Váhy poté zapneme tak, že spustíme proceduru: Data Weight cases a v dialogovém okně klikneme na příkaz Weight cases by. Do okénka Frequency variable vložíme váhovou proměnnou vaha_1 a klikneme na O.K. Tím jsme zapnuli váhy, které při jakémkoliv výpočtu budou jednotky započítávat s příslušnou hodnotou. Všimněte si, že zapnutí vah je indikováno v pravém dolním rohu datového spreadsheetu nápisem Weight On.
6 SOC108 LEKCE 5: STATISTICKÁ INFERENCE 6 Obvykle ale musíme soubor vážit nejenom podle jedné proměnné, ale podle více proměnných. Postup, jak to uděláme je podobný, pouze syntaktický příkaz bude poněkud delší a komplikovanější. Vážení souboru podle více proměnných Pro jednoduchost předpokládejme, že musíme náš soubor upravit váhami podle tří proměnných: podle pohlaví (pohl), národnosti (narod) a vzdělání (vzdel). Pro jednoduchost příkladu předpokládejme, že jsme národnost měli pouze dichotomickou (1. Češi, 2. Slováci) a rovněž vzdělání že jsme měřili dichotomicky (1. nižší, 2. vyšší.). Nejdříve tedy musíme zjistit, jaké byly proporce jednotlivých proměnných a jejich kategorií ve vzorku a v populaci. To uvádí tabulka 5.2. Tab. 5.2: Podíl kategorií pohlaví, národnost a vzdělání (v %) ve vzorku a v populaci (A) Výběrový soubor Muži Ženy Češi Slováci Češi Slováci Nižší vzdělání Vyšší vzdělání (B) Populace Muži Ženy Češi Slováci Češi Slováci Nižší vzdělání Vyšší vzdělání Pozn.: Procentuální podíly jsou v každé tabulce vypočteny z celkového N. Součet tedy musí dávat 100% Váhy se vypočtou podle stejného vzorce, jako v případě, kdy jsme vážili soubor podle jedné proměnné (viz rovnici 1). Vycházejí následovně (viz tab. 5.3) Tab. 5.3: Váhy založené na proměnných pohlaví, národnost a vzdělání 1. Muž 2. Žena 1. Češi 2. Slováci 1. Češi 2. Slováci 1. Nižší vzdělání 1,25 1,0 1,33 0,50 2. Vyšší vzdělání 2,00 0,33 1,00 0,50 Syntax pro nastavení jednotlivých hodnot nové váhy, nazvané vaha_2: COMPUTE VAHA_2 = 0. IF ((POHL = 1) AND (NAROD = 1) AND (VZDEL = 1)) VAHA_2 = IF ((POHL = 1) AND (NAROD = 1) AND (VZDEL = 2)) VAHA_2 = IF ((POHL = 1) AND (NAROD = 2) AND (VZDEL = 1)) VAHA_2 = IF ((POHL = 1) AND (NAROD = 2) AND (VZDEL = 2)) VAHA_2 = IF ((POHL = 2) AND (NAROD = 1) AND (VZDEL = 1)) VAHA_2 = IF ((POHL = 2) AND (NAROD = 1) AND (VZDEL = 2)) VAHA_2 = IF ((POHL = 2) AND (NAROD = 2) AND (VZDEL = 1)) VAHA_2 = IF ((POHL = 2) AND (NAROD = 2) AND (VZDEL = 2)) VAHA_2 = Tento příkaz pak je třeba nechat proběhnout v SPSS a nastavit váhy tak, aby soubor převažovaly podle proměnné vahy_2. Máme-li náš soubor ošetřen tak, že je relativně dobrým reprezentantem populace, můžeme začít se statistickými generalizacemi. Podívejme se nejdříve, jak se pracuje s intervalovým odhadem, to je jak se určují intervaly spolehlivosti.
7 SOC108 LEKCE 5: STATISTICKÁ INFERENCE 7 Intervaly spolehlivosti Nyní již víme, že ať pracujeme se sebelepším výběrovým souborem, nikdy si nemůžeme být jisti, že charakteristika vypočtená ze vzorku bude mít tutéž hodnotu také v souboru základním, neboť naše výběrové hodnoty jsou zatíženy výběrovou chybou. Nemá proto valného smyslu očekávat, že když např. náš výběrový soubor v otázce na předvolebních stranické preference ukáže, že ODS by získala 32 % hlasů a ČSSD 17 %, bude přesně taková proporce i v populaci. Je mnohem lepší strategií náš výběrový výsledek (výběrový odhad se tomu také říká) vzít jako základ pro odhad příslušného populačního výsledku (populačního parametru). Tento populační parametr nestanovujeme jedním číslem (bodovým odhadem), ale intervalově (intervalovým odhadem), to je vypočtením pravděpodobné dolní a horní hodnoty tohoto parametru. Pak si můžeme být docela jisti, že náš interval je spolehlivým rámcem, v němž se bude hodnota populačního parametru. Proto se tomuto intervalu říká interval spolehlivosti. Pro velikost intervalu spolehlivosti jsou důležité tři věci: 1) velikost výběrového souboru, 2. velikost rozptylu v základním souboru a 3) míra jistoty (míra spolehlivosti), kterou chceme mít, že naše výběrová statistika se bude v tomto intervalu pohybovat. Ve statistice je obvyklé, že tato úroveň spolehlivosti je stanovena na 95 %. Což znamená, že pokud bychom např. v našem výše uvedeném příkladu předvolebních preferencí vypočítali, že interval spolehlivosti pro preference ODS je s 95 % jistotou %, věděli bychom, že když provedeme 100 různých výběrů, pouze v pěti z nich by skutečný podíl preferencí ODS byl mimo tento interval. Pro výpočet intervalu spolehlivosti musíme: 1. znát výběrovou charakteristiku (může jí být průměr, procento, procentuální rozdíl mezi skupinami, mohou to být ale i korelační koeficienty nebo regresní koeficienty; tu získáme výpočtem z dat výběrového souboru. 2. Vypočítat směrodatnou chybu, která měří velikost výběrové chyby. 3. Se rozhodnout, jak velkou úroveň spolehlivosti požadujeme. Obvykle pro sociální vědy nám stačí jistota 95 %, ale někdy požadujeme i úroveň 99 %, popř. 99,9 % (s tak vysokou jistotou pracují především v biologii a medicíně). Ukažme si vše prakticky. Příklad P5.1: Z příkladu P2.3, kde jsme z dat EVS spočítali, jaká je průměrná hodnota postoje k důležitosti Boha v životě českých respondentů (na desetibodové stupnici byl průměr 3,63) chceme nyní stanovit interval spolehlivosti (confidence interval, CI) pro základní soubor. Jelikož výběrový soubor je reprezentativní pro populaci ČR starší 18 let k tomu viz článek Jana Řeháka v časopise Sociální studia 6 z roku 2001, str. 16 má toto úsilí smysl. Zjišťujeme tedy, jaké hodnoty průměru můžeme očekávat v celé dospělé populaci České republiky. Intervaly spolehlivosti pro hodnotu průměru vypočítá SPSS v proceduře Analyze Descriptive Statistics Explore pro proměnnou q33. Výsledek: Case Processing Summary Q33 Bůh - důležitost v životě Cases Valid Missing Total N Percent N Percent N Percent ,8% 62 3,2% ,0%
8 SOC108 LEKCE 5: STATISTICKÁ INFERENCE 8 Descriptives Q33 Bůh - důležitost v životě Mean 95% Confidence Interval for Mean Lower Bound Upper Bound Std. Statistic Error 3,63,07 3,49 3,77 5% Trimmed Mean 3,43 Median Variance Std. Deviation Minimum Maximum Range Interquartile Range 2,00 9,345 3, ,00 Skewness Kurtosis,858,057 -,614,114 Vzhledem k tomu, že chceme mít poměrně velkou jistotu o hodnotě průměru základního souboru, je v SPSS nastavena standardně úroveň spolehlivosti na 95 %. V tabulce Desciptives vidíme, že dolní hranice intervalu spolehlivosti je 3,49 (lower bound v zeleném rámečku) a jeho horní hranice 3,77 (upper bound). Tato čísla tedy říkají, že s 95% jistotou můžeme očekávat, že průměrná hodnota odpovědí na otázku o důležitosti Boha v našem životě by se v celé české populaci pohybovala mezi 3,49 3,77. Jedna důležitá poznámka.:všimněte si hodnoty směrodatné chyby Std. Error = 0,07. Násobte tuto hodnotu dvěma 6 a postupně ji odečtěte a přičtěte k hodnotě průměru. Jaký bude výsledek? No přesně takový, jaký vypočítal SPSS. Interval spolehlivosti se tedy, pokud znáte směrodatnou chybu, dá lehce spočítat i ručně. A jak vypočítáme směrodatnou chybu? I tu lze lehce spočítat a to tak, že podělíme směrodatnou odchylku druhou odmocninou velikosti výběrového souboru (N). Zkontrolujme si: velikost výběrového souboru je, jak vidíme z tabulky Case Processing Summary, 1846 je třeba pracovat pouze s údajem o platných odpovědích, ti, kdo na tuto otázku neodpověděli, nebyli do výpočtu průměru zahrnuti. Druhá odmocnina tohoto čísla je 42,96. Směrodatná odchylka (Std. Deviation v tab. Desciptives) je 3,06, pak 3,06/42,96 = 0,07, což je hodnota směrodatné chyby. Pokud bychom chtěli mít interval spolehlivosti stanoven s jistotou 99 %, nastavíme v dialogovém okně v proceduře Explore Statistics hodnotu intervalu spolehlivosti na 99 %. Lze ji ovšem vypočítat i ručně. Ruční výpočet je nesmírně jednoduchý. Hodnotu směrodatné chyby násobíme třemi (viz poznámku 6) a výsledek přičteme a odečteme od hodnoty průměru. Takže v našem případě: 0,07 * 3 = 0,21. 3,63 + 0,21 = 3,84 3,63 0,21 = 3,42 99% interval spolehlivosti je tedy 3,42 3,84. Zkontrolujme výsledek z výpočtu v SPSS: 6 Dvěma násobíme proto, že víme, do dvou směrodatných odchylek na každou stranu od průměru v normálním rozložení leží 95 % případů. A 95 % je přesně ta jistota, kterou požadujeme. Do tří směrodatných odchylek na každou stranu pak leží 99 % případů, takže pokud bychom chtěli jistotu 99 %, násobili bychom průměr 3x.
9 SOC108 LEKCE 5: STATISTICKÁ INFERENCE 9 Descriptives Q33 Bůh - důležitost v životě Mean 99% Confidence Interval for Mean Lower Bound Upper Bound Std. Statistic Error 3,63,07 3,45 3,82 5% Trimmed Mean 3,43 Median Variance Std. Deviation Minimum Maximum Range Interquartile Range 2,00 9,345 3, ,00 Skewness Kurtosis,858,057 -,614,114 Výsledek se nepatrně liší. Rozdíl vznikl tím, že náš ruční výpočet je méně přesný, neboť při požadavku 99 % spolehlivosti je třeba násobit směrodatnou chybu ne třemi, nýbrž konstantou 2,85. Pro praktické sociologické účely a ruční výpočty ovšem tato malá nepřesnost není podstatná. Srovnejme nyní 95% interval spolehlivosti (3,49 3,77) s jeho 99% bratrancem (3,42 3,84). 99% jistota 3,42 3,84 3,49 3,77 95% jistota Vidíme, že daní za větší jistotu je širší interval spolehlivosti, z něhož paradoxně vyplývá určitá vyšší nevědomost : mám 99 % jistotu, že průměr české populace v tomto postoji leží někde mezi hodnotou 3,42 až 3,84. 95% spolehlivost je v sociálních vědách obvykle dobrou hranicí jistoty, takže se v SPSS s implicitně zabudovaným vzorcem pro výpočet intervalu spolehlivosti můžeme spokojit. * * * Interval spolehlivosti se stanovuje nejenom pro hodnotu průměru, ale také pro hodnotu nějakého podílu (%). Víme-li např. z výzkumu veřejného mínění, že 75 % respondentů v reprezentativním souboru souhlasí s názorem, že schopní lidé by měli hodně vydělávat, musí nás zajímat otázka, v jakém intervalu se bude tento podíl pohybovat v celé populaci ČR. V případě, že stanovujeme interval spolehlivosti pro podíl (procento) a ne pro průměr, nemůžeme žel plně využít SPSS, neboť tento software kupodivu nemá tuto proceduru zabudovanou ve svých paměťových vzorcích. Proto si musíme u kategorizovaných znaků, u nichž nelze počítat průměr, pomoci prostřednictvím drobných triků. Na tomto místě bych rád upřímně poděkoval kolegovi Janu Řehákovi,
10 SOC108 LEKCE 5: STATISTICKÁ INFERENCE 10 který mně tyto triky poradil. Záleží přitom na tom, zdali hledáme interval spolehlivosti pro proměnnou, která je dichotomická (má jenom dvě varianty znaku, např. muž žena, je spokojen je nespokojen atd.), nebo polytomická (má více variant znaku). Na rozdíl od průměru, kdy stanovujeme interval spolehlivosti pouze k jedné jediné hodnotě), u výpočtu intervalu spolehlivosti pro procenta to je jiné. Zde musíme intervaly spolehlivosti vypočítávat pro jednotlivé varianty kategorické proměnné zvlášť. Příklad P5.2: Interval spolehlivosti pro dichotomické proměnné. Trik spočívá v tom, že hodnoty dichotomie (ať byly kódovány jako 0 a 1, nebo jako 1 a 2) převedeme (rekódujeme procedurou Recode) na hodnoty 0 a 100. Pro takto upravenou proměnnou pak již v proceduře Explore spočteme normální průměr (t.j. procento) a jeho interval spolehlivosti, který je v dané situaci hledaným intervalem spolehlivosti pro procenta. Ukázka výpočtu. Chceme zjistit, jaký je v souboru EVS-ČR1999 interval spolehlivosti pro rozložení odpovědí na otázku q42: Myslíte si, že žena musí mít děti, aby se splnilo její poslání, nebo to není nutné? Jelikož je to dichotomická proměnná, můžeme uplatnit Řehákův trik. Nejdříve tedy musíme rekódovat původní hodnoty 1 a 2 na hodnoty 0 a100. Proveďme: Původní proměnná: Tab. A Q42 Žena musí mít děti, aby splnila poslání Valid 1 ano 2 není to nutné Total Valid Cumulative Frequency Percent Percent Percent ,7 44,1 44, ,8 55,9 100, ,5 100,0 Rekódovaná proměnná: RECODE q42 (1=0)(2=100). EXECUTE. Tab. B Q42 Žena musí mít děti, aby splnila poslání Valid Total Valid Cumulative Frequency Percent Percent Percent ,7 44,1 44, ,8 55,9 100, ,5 100,0 Tab. C
11 SOC108 LEKCE 5: STATISTICKÁ INFERENCE 11 Descriptives Q42 Žena musí mít děti, aby splnila poslání Mean 95% Confidence Interval for Mean Lower Bound Upper Bound Std. Statistic Error 55,87 1,17 53,58 58,17 5% Trimmed Mean 56,52 Median Variance Std. Deviation Minimum Maximum Range Interquartile Range 100, ,89 49, ,00 Skewness Kurtosis -,237,058-1,946,115 Vidíme, že vypočítaný průměr 55,87 odpovídá podílu respondentů, kteří se domnívají, že není nutné, aby žena měla děti (55,9 ve sloupci Valid Percent v tab. A nebo B). Proto pro tento údaj můžeme údaje o horní a dolní hranici 95% intervalu spolehlivosti pro průměr (v tabulce C) chápat jako údaje o horní a dolní hranici intervalu spolehlivosti pro toto procento. Tudíž v základním souboru, to je mezi dospělou populací ČR, se pohybuje podíl lidí, kteří si myslí, že není nutné, aby žena měla děti k naplnění jejího poslání, mezi 53,6 a 58,2 %. Pro výpočet intervalu spolehlivosti pro podíl lidí, zastávají názor, že žena musí mít děti k naplnění poslání, již musíme použít kalkulačky stačí ale pouze hodnoty intervalů spolehlivosti odečíst od 100: ,58 = 46,42 a ,17 = 41,83. Podíl respondentů s tímto postojem se bude tak v základním souboru pohybovat mezi 41,8 a 46,2 %. Příklad P5.3: Interval spolehlivosti pro polytomické proměnné. U vícehodnotového znaku se postupuje, pokud nechceme interval spolehlivosti počítat ručně, jinak. Tabulku, kterou v SPSS dostaneme z Frequencies, zkopírujme (prostřednictvím příkazu Copy) a vložme ji do Excelu. V něm si připravíme příslušný vzorec pro výpočet směrodatné chyby pro procento: p ( 100 p) N a pak už jen dosazujeme příslušná data. A pokud si tento excelovský soubor uložíme jako matrici, můžeme se k němu opakovaně vrátit a vypočítat velmi rychle interval spolehlivosti pro jakoukoliv polytomickou proměnnou. Ukázka: V příkladu P2.1 jsme se zajímali o rozložení proměnné q46_3. Vypočítejme pro jednotlivá procenta intervaly spolehlivosti. Nejdříve si tedy v SPSS udělejme znovu třídění prvního stupně této proměnné a použijme k tomu proceduru Frequencies. Vypočtený výsledek zkopírujeme a vložíme do tabulkového procesoru Excel. Bude to vypadat takto:
12 SOC108 LEKCE 5: STATISTICKÁ INFERENCE 12
13 SOC108 LEKCE 5: STATISTICKÁ INFERENCE 13 Nyní si vložme příslušné vzorce pro výpočet intervalu spolehlivosti (jeho matematickou podobu jsme jen pro připomenutí přidali do volného prostoru). Vidíte, že jsme si v nové tabulce zkopírovali údaje o absolutních četnostech (Frequency), z nichž ovšem pro výpočet použijeme, jak říká vzorec, pouze jeden údaj, jímž je celková velikost souboru (1 780). To je ve vzorci ono N. Dále jsme si zkopírovali údaje o platných procentech (Valid Percent), neboť to jsou hodnoty p ve vzorci. Přidali jsme tři nové sloupce. Do sloupce Std. error 95 jsme za použití excelovské syntaxe vepsali celý vzorec pro výpočet směrodatné chyby, kterou stanovujeme pro 95% jistotu. Tento vzorec je vepsán do buňky D16 a způsob zápisu je zobrazen v dialogovém okně. Další dva přidané odstavce jsou již přímo hodnoty dolního a horního intervalu spolehlivosti. Pod údajem 10,4 je vzorec = C14-D14 a pod údajem 13,5 je vzorec = C14+D14, tedy operace, kdy od 12 % těch, kdo rozhodně souhlasí s výrokem, že Většina žen touží po domově a dětech, nejdříve odečítáme velikost směrodatné chyby (1,5) a pak ji k 12 % přičítáme. Tím získáváme interval spolehlivosti (10 14 %) pro podíl obyvatel ČR, kteří rozhodně souhlasí s tímto výrokem. Vidíme, že směrodatná chyba je v každém řádku jiná a je to pochopitelné. Pro 1,3 % musí být menší než pro 60,1 %. Proto uvádějí-li někdy agentury pro výzkum veřejného mínění velikost výběrové chyby (což je samo o sobě velmi chvályhodný fakt) a tvrdí, že např. velikost výběrové chyby je 2 %, není to informace tak úplně přesná (proč?). Máte-li takto připravenou matrici, pak při výpočtu dalších intervalů spolehlivosti z jiných výpočtů SPSS stačí přepsat údaje o velikosti vzorku (buňka B18) a do buněk C14 C17 dosadit příslušná validní procenta. Excel (a v tom je jeho kouzlo), okamžitě přepočítá nově dosazené údaje a vy máte k dispozici nové intervaly spolehlivosti. 7 Pokud bude vaše nová proměnná mít vyšší počet variant než 7 Tuto matrici naleznete jako samostatný soubor pod názvem int-spol.xls na dokumentovém serveru informačního systému MU.
14 SOC108 LEKCE 5: STATISTICKÁ INFERENCE 14 4, budete si muset přidat příslušný počet řádků, do nichž vepíšete patřičné vzorce (dávejte přitom velký pozor, abyste pokud budete vzorce kopírovat v nich měli správně označeny všechny odkazy na buňky). Tento postup je, jak jistě uznáte, poněkud krkolomný. Proto kolega Řehák sepsal v rámci jazyka SPSS malý prográmek (v jazyce SPSS se mu říká script), který intervaly spolehlivosti doplňuje přímo do tabulky z Frequencies. Postup je následující: 1. Necháte si spočítat Frequencies příslušné proměnné. 2. V Outputu SPSS na tuto tabulku 1x kliknete a tím ji označíte (viz malou šipku u tabulky na obrázku). 3. Klikněte na tlačítko Utilities a v něm na příkaz Run Script. 4. V dialogovém okně naveďte SPSS tam, kde máte uložen script pro intervaly spolehlivosti.
15 SOC108 LEKCE 5: STATISTICKÁ INFERENCE 15 Když si kliknete na jméno tohoto scriptu (jmenuje se Intervaly spolehlivosti pro četnosti ), vkopíruje se do okénka Název souboru a v okně vpravo nazvaném Description se objeví popis procedury. Klikněte na příkaz Run. Objeví se nová tabulka, která uvádí příslušné horní a dolní meze intervalu spolehlivosti pro jednotlivé varianty znaku (viz tab. 5.4, kterou jsme editovali tak, že jsme odmazali sloupce pro intervaly spolehlivosti kumulovaných četností). Tab. 5.4: Intervaly spolehlivosti vypočtené z Řehákova scriptu Četnostní tabulka s intervaly spolehlivosti proměnné Q46_3 Většina žen touží po domově a dětech : Platné Vynechané Hodnoty 1 rozhodně souhlasí 2 souhlasí 3 nesouhlasí 4 rozhodně nesouhlasí Celkem -2 neodpověděl/a Četnost Relativní četnost Dolní mez a Statistiky Horní mez a ,18% 9,77% 12,60% 11,99% 10,48% 13,50% ,09% 53,86% 58,31% 60,11% 57,84% 62,39% ,86% 22,92% 26,80% 26,65% 24,59% 28,70% 22 1,17%,69% 1,65% 1,25%,73% 1,77% ,30% 92,18% 94,42% 100,00% 8,43%,14%,73% Rel. četnost platných hodnot Dolní Horní mez a mez a Celkem -1 neví Celkem 120 6,27% 5,18% 7,35% 128 6,70% 5,58% 7,82% ,00% a. 95%ní interval spolehlivosti. K výpočtu je použita asymptotická metoda, která předpokládá, že celkový počet pozorování je větší než 30 a v každé kategorii se vyskytuje alespoň 5 případů. V této tabulce nás zajímají sloupce pro validní četnosti (sloupce platných hodnot), které jsou vyznačeny žlutě. Když tyto intervaly spolehlivosti zkontrolujete s intervaly, které jsme vypočítali v excelovské tabulce výše, uvidíte, že jsou totožné. Literatura de Vaus, David Analyzing Social Science Data. SAGE Publications, London, str ,
LEKCE03 PŘÍKLAD NORMALITA ROZLOŽENÍ A Z SKÓRY; ZOBECŇOVÁNÍ VÝBĚROVÝCH VÝSLEDKŮ NA ZÁKLADNÍ SOUBOR 95 % 68 %
LEKCE 5: NORMÁLNÍ ROZLOŽENÍ A ZÁKLADY TESTOVÁNÍ HYPOTÉZ. 1 LEKCE03 PŘÍKLAD NORMALITA ROZLOŽENÍ A Z SKÓRY; ZOBECŇOVÁNÍ VÝBĚROVÝCH VÝSLEDKŮ NA ZÁKLADNÍ SOUBOR V předchozích lekcích jsme si ukázali, že před
ÚKOL 2 1886 22 5,77 5,00 5 2,531,003,056 -,869,113
ÚKOL 2 Jméno a příjmení: UČO: Imatrik. ročník: Úkol 2.1: V souboru EVS99_cvicny.sav zjistěte, zdali rozložení názoru na to, kdo by měl být odpovědný za zajištění bydlení (proměnná q54h), je normální. Řešte
LEKCE 5 STATISTICKÁ INFERENCE ANEB ZOBECŇOVÁNÍ VÝSLEDKŮ Z VÝBĚROVÉHO NA ZÁKLADNÍ SOUBOR
LEKCE 5 STATISTICKÁ INFERENCE ANEB ZOBECŇOVÁNÍ VÝSLEDKŮ Z VÝBĚROVÉHO NA ZÁKLADNÍ SOUBOR Ve většině případů pracujeme s výběrovým souborem a výběrové výsledky zobecňujeme na základní soubor. Smysluplné
LEKCE02a ANALÝZA ROZLOŽENÍ KATEGORIZOVANÝCH DAT vzorový výsledek cvičení
SOC1/ LEKCE : ANALÝZA ROZLOŽENÍ KATEGORIZOVANÝCH A SPOJITÝCH DAT: LEKCEa ANALÝZA ROZLOŽENÍ KATEGORIZOVANÝCH DAT vzorový výsledek cvičení CVIČENÍ.1: Je česká populace věřící, nebo nevěřící? Tuto otázku
STATISTICKÉ ODHADY Odhady populačních charakteristik
STATISTICKÉ ODHADY Odhady populačních charakteristik Jak stanovit charakteristiky rozložení sledované veličiny v základní populaci? Populaci většinou nemáme celou k dispozici, musíme se spokojit jen s
Metodologie pro Informační studia a knihovnictví 2
Metodologie pro Informační studia a knihovnictví 2 Modul 9: Úvod do induktivní statistiky Obsah Induktivní statistika... 2 Kdy můžeme zobecňovat?... 2 Logika statistické indukce... 3 Proč nelze jednoduše
PSY117/454 Statistická analýza dat v psychologii přednáška 8. Statistické usuzování, odhady
PSY117/454 Statistická analýza dat v psychologii přednáška 8 Statistické usuzování, odhady Výběr od deskripce k indukci Deskripce dat, odhad parametrů Usuzování = inference = indukce Počítá se s náhodným
Obsah Úvod Kapitola 1 Než začneme Kapitola 2 Práce s hromadnými daty před analýzou
Úvod.................................................................. 11 Kapitola 1 Než začneme.................................................................. 17 1.1 Logika kvantitativního výzkumu...........................................
Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test
Testování hypotéz 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test Testování hypotéz proces, kterým rozhodujeme, zda přijmeme nebo zamítneme nulovou hypotézu
Analýza dat na PC I.
CENTRUM BIOSTATISTIKY A ANALÝZ Lékařská a Přírodovědecká fakulta, Masarykova univerzita Analýza dat na PC I. Popisná analýza v programu Statistica IBA výuka Základní popisná statistika Popisná statistika
Spokojenost se životem
SEMINÁRNÍ PRÁCE Spokojenost se životem (sekundárních analýza dat sociologického výzkumu Naše společnost 2007 ) Předmět: Analýza kvantitativních revize Šafr dat I. Jiří (18/2/2012) Vypracoval: ANONYMIZOVÁNO
Statistická analýza dat v psychologii. Věci, které můžeme přímo pozorovat, jsou téměř vždy pouze vzorky. Alfred North Whitehead
PSY117/454 Statistická analýza dat v psychologii Přednáška 8 Statistické usuzování, odhady Věci, které můžeme přímo pozorovat, jsou téměř vždy pouze vzorky. Alfred North Whitehead Barevná srdíčka kolegyně
Vzorce. StatSoft. Vzorce. Kde všude se dá zadat vzorec
StatSoft Vzorce Jistě se Vám již stalo, že data, která máte přímo k dispozici, sama o sobě nestačí potřebujete je nějak upravit, vypočítat z nich nějaké další proměnné, provést nějaké transformace, Jinak
Návod pro práci s SPSS
Návod pro práci s SPSS Návody pro práci s programem SPSS pro kurz Metodologie pro Informační studia a knihovnictví 2 (jaro 2013) Ladislava Zbiejczuk Suchá Instalace programu SPSS najdete v INETu. Po přihlášení
Metodologie pro Informační studia a knihovnictví 2
Metodologie pro Informační studia a knihovnictví 2 Modul 5: Popis nekategorizovaných dat Co se dozvíte v tomto modulu? Kdy používat modus, průměr a medián. Co je to směrodatná odchylka. Jak popsat distribuci
Jana Vránová, 3.lékařská fakulta UK, Praha. Hypotézy o populacích
Jana Vránová, 3.lékařská fakulta UK, Praha Hypotézy o populacích Příklad IQ test: Předpokládejme, že z nějakého důvodu ministerstvo školství věří, že studenti absolventi středních škol v Hradci Králové
JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica
JEDNOVÝBĚROVÉ TESTY Komentované řešení pomocí programu Statistica Vstupní data Data umístěná v excelovském souboru překopírujeme do tabulky ve Statistice a pojmenujeme proměnné, viz prezentace k tématu
Kategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1
Kategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA 2018 4. dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1 Typy proměnných nominální (nominal) o dvou hodnotách lze říci pouze
Opakování: Nominální proměnná více hodnotová odpověď.
Analýza dat z dotazníkových šetření Cvičení 4. - Zobecňování výběru na populaci Zdrojová data: dotazník http://www.vyplnto.cz/realizovane-pruzkumy/37771/ - Seznamte se s dotazníkem a strukturou otázek,
Metodologie pro Informační studia a knihovnictví 2
Metodologie pro Informační studia a knihovnictví 2 Modul V: Nekategorizovaná data Metodologie pro ISK 2, jaro 2014. Ladislava Z. Suchá Metodologie pro Informační studia a knihovnictví 2 Modul 5: Popis
Deskriptivní statistika (kategorizované proměnné)
Deskriptivní statistika (kategorizované proměnné) Nejprve malé opakování: - Deskriptivní statistika se zabývá popisem dat, jejich sumarizaci a prezentací. - Kategorizované proměnné jsou všechny proměnné,
Základní vzorce a funkce v tabulkovém procesoru
Základní vzorce a funkce v tabulkovém procesoru Na tabulkovém programu je asi nejzajímavější práce se vzorci a funkcemi. Když jednou nastavíte, jak se mají dané údaje zpracovávat (některé buňky sečíst,
Analýza dat z dotazníkových šetření. Zdrojová data: dotazník http://www.vyplnto.cz/realizovane-pruzkumy/konzumace-ryb-a-rybich-vyrob/
Analýza dat z dotazníkových šetření Cvičení 3. - Jednorozměrné třídění Zdrojová data: dotazník http://www.vyplnto.cz/realizovane-pruzkumy/konzumace-ryb-a-rybich-vyrob/ - Seznamte se s dotazníkem a strukturou
Zpracování studie týkající se průzkumu vlastností statistických proměnných a vztahů mezi nimi.
SEMINÁRNÍ PRÁCE Zadání: Data: Statistické metody: Zpracování studie týkající se průzkumu vlastností statistických proměnných a vztahů mezi nimi. Minimálně 6 proměnných o 30 pozorováních (z toho 2 proměnné
Metodologie pro ISK II
Metodologie pro ISK II Všechny hodnoty z daného intervalu Zjišťujeme: Centrální míry Variabilitu Šikmost, špičatost Percentily (decily, kvantily ) Zobrazení: histogram MODUS je hodnota, která se v datech
Metodologie pro Informační studia a knihovnictví 2
Metodologie pro Informační studia a knihovnictví 2 Modul 7: Třídění druhého stupně. Kontingenční tabulky Co se dozvíte v tomto modulu? Co je třídění druhého stupně Jak vytvořit a interpretovat kontingenční
Inferenční statistika - úvod. z-skóry normální rozdělení pravděpodobnost rozdělení výběrových průměrů
Inferenční statistika - úvod z-skóry normální rozdělení pravděpodobnost rozdělení výběrových průměrů Pravděpodobnost postupy induktivní statistiky vycházejí z teorie pravděpodobnosti pravděpodobnost, že
Metodologie pro Informační studia a knihovnictví 2
Metodologie pro Informační studia a knihovnictví 2 Modul 4: Kódování a rekódování. Deskriptivní statistika popis dat I Co se dozvíte v tomto modulu? Co zjišťujeme u nominálních proměnných? Co zjišťujeme
POPISNÁ STATISTIKA Komentované řešení pomocí programu Statistica
POPISNÁ STATISTIKA Komentované řešení pomocí programu Statistica Program Statistica I Statistica je velmi podobná Excelu. Na základní úrovni je to klikací program určený ke statistickému zpracování dat.
Zadání Máme data hdp.wf1, která najdete zde: Bodová předpověď: Intervalová předpověď:
Predikce Text o predikci pro upřesnění pro ty, které zajímá, kde se v EViews všechna ta čísla berou. Ruční výpočty u průběžného testu nebudou potřeba. Co bude v závěrečném testu, to nevím. Ale přečíst
Testování hypotéz a měření asociace mezi proměnnými
Testování hypotéz a měření asociace mezi proměnnými Testování hypotéz Nulová a alternativní hypotéza většina statistických analýz zahrnuje různá porovnání, hledání vztahů, efektů Tvrzení, že efekt je nulový,
ANALÝZA DAT V R 3. POPISNÉ STATISTIKY, NÁHODNÁ VELIČINA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK
ANALÝZA DAT V R 3. POPISNÉ STATISTIKY, NÁHODNÁ VELIČINA Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK www.biostatisticka.cz POPISNÉ STATISTIKY - OPAKOVÁNÍ jedna kvalitativní
Odhady parametrů základního souboru. Cvičení 6 Statistické metody a zpracování dat 1 (podzim 2016) Brno, říjen listopad 2016 Ambrožová Klára
Odhady parametrů základního souboru Cvičení 6 Statistické metody a zpracování dat 1 (podzim 2016) Brno, říjen listopad 2016 Ambrožová Klára Motivační příklad Mám průměrné roční teploty vzduchu z 8 stanic
VYHODNOCOVÁNÍ KVANTITATIVNÍCH DAT (ÚVOD DO PROBLEMATIKY) Metodologie pro ISK
VYHODNOCOVÁNÍ KVANTITATIVNÍCH DAT (ÚVOD DO PROBLEMATIKY) Metodologie pro ISK 14. 11. 2014 NENÍ STATISTIKA JAKO STATISTIKA Deskriptivní statistika Výzkumné otázky, ne hypotézy (případně deskriptivní hypotézy)
Základy popisné statistiky
Základy popisné statistiky Michal Fusek Ústav matematiky FEKT VUT, fusekmi@feec.vutbr.cz 8. přednáška z ESMAT Michal Fusek (fusekmi@feec.vutbr.cz) 1 / 26 Obsah 1 Základy statistického zpracování dat 2
LEKCE 02a UNIVARIAČNÍ ANALÝZA KATEGORIZOVANÝCH DAT
LEKCE 02a UNIVARIAČNÍ ANALÝZA KATEGORIZOVANÝCH DAT 1 Základní statistickou úlohou je popis stavu základního souboru Východiskem je většinou výběrový soubor (odvozujeme popis základního souboru z popisu
TECHNICKÁ UNIVERZITA V LIBERCI
TECHNICKÁ UNIVERZITA V LIBERCI Ekonomická fakulta SEMESTRÁLNÍ PRÁCE STATISTICKÝ ROZBOR DAT Z DOTAZNÍKOVÉHO ŠETŘENÍ ANALÝZA VÝSLEDKŮ VYUŢITÍ PROJEKTOVÉHO ŘÍZENÍ V ESN Příjmení a jméno: Hrdá Sabina, Kovalčíková
Lekce 2 ZÁKLADY UNIVARIAČNÍ ANALÝZY A) ROZLOŽENÍ KATEGORIZOVANÝCH DAT
SOC108 LEKCE 2: ZÁKLADY UNIVARIAČNÍ ANALÝZY 1 Petr Mareš a Ladislav Rabušic 2003 I. Čištění dat Lekce 2 ZÁKLADY UNIVARIAČNÍ ANALÝZY A) ROZLOŽENÍ KATEGORIZOVANÝCH DAT Prvním krokem, který musíme udělat
Pearsonův korelační koeficient
I I.I Pearsonův korelační koeficient Úvod Předpokládejme, že náhodně vybereme n objektů (nebo osob) ze zkoumané populace. Často se stává, že na každém z objektů měříme ne pouze jednu, ale několik kvantitativních
Obr. P1.1 Zadání úlohy v MS Excel
Přílohy Příloha 1 Řešení úlohy lineárního programování v MS Excel V této příloze si ukážeme, jak lze řešit úlohy lineárního programování pomocí tabulkového procesoru MS Excel. Výpočet budeme demonstrovat
Přílohy. Příloha 1. Obr. P1.1 Zadání úlohy v MS Excel
Přílohy Příloha 1 Řešení úlohy lineárního programování v MS Excel V této příloze si ukážeme, jak lze řešit úlohy lineárního programování pomocí tabulkového procesoru MS Excel 2007. Výpočet budeme demonstrovat
Biostatistika Cvičení 7
TEST Z TEORIE 1. Střední hodnota pevně zvolené náhodné veličiny je a) náhodná veličina, b) konstanta, c) náhodný jev, d) výběrová charakteristika. 2. Výběrový průměr je a) náhodná veličina, b) konstanta,
Test z teorie VÝBĚROVÉ CHARAKTERISTIKY A INTERVALOVÉ ODHADY
VÝBĚROVÉ CHARAKTERISTIKY A INTERVALOVÉ ODHADY Test z teorie 1. Střední hodnota pevně zvolené náhodné veličiny je a) náhodná veličina, b) konstanta, c) náhodný jev, d) výběrová charakteristika. 2. Výběrový
Odhad parametrů N(µ, σ 2 )
Odhad parametrů N(µ, σ 2 ) Mějme statistický soubor x 1, x 2,, x n modelovaný jako realizaci náhodného výběru z normálního rozdělení N(µ, σ 2 ) s neznámými parametry µ a σ. Jaký je maximální věrohodný
Jednofaktorová analýza rozptylu
I I.I Jednofaktorová analýza rozptylu Úvod Jednofaktorová analýza rozptylu (ANOVA) se využívá při porovnání několika středních hodnot. Často se využívá ve vědeckých a lékařských experimentech, při kterých
ZÁKLADY STATISTICKÉHO ZPRACOVÁNÍ ÚDAJŮ 5. hodina , zapsala Veronika Vinklátová Revize zápisu Martin Holub,
ZÁKLADY STATISTICKÉHO ZPRACOVÁNÍ ÚDAJŮ 5. hodina - 22. 3. 2018, zapsala Revize zápisu Martin Holub, 27. 3. 2018 I. Frekvenční tabulky opakování z minulé hodiny Frekvenční tabulka je nejzákladnější nástroj
VYUŽITÍ PRAVDĚPODOBNOSTNÍ METODY MONTE CARLO V SOUDNÍM INŽENÝRSTVÍ
VYUŽITÍ PRAVDĚPODOBNOSTNÍ METODY MONTE CARLO V SOUDNÍM INŽENÝRSTVÍ Michal Kořenář 1 Abstrakt Rozvoj výpočetní techniky v poslední době umožnil také rozvoj výpočetních metod, které nejsou založeny na bázi
676 + 4 + 100 + 196 + 0 + 484 + 196 + 324 + 64 + 324 = = 2368
Příklad 1 Je třeba prověřit, zda lze na 5% hladině významnosti pokládat za prokázanou hypotézu, že střední doba výroby výlisku je 30 sekund. Přitom 10 náhodně vybraných výlisků bylo vyráběno celkem 540
Otázky k měření centrální tendence. 1. Je dáno rozložení, ve kterém průměr = medián. Co musí být pravdivé o tvaru tohoto rozložení?
Otázky k měření centrální tendence 1. Je dáno rozložení, ve kterém průměr = medián. Co musí být pravdivé o tvaru tohoto rozložení? 2. Určete průměr, medián a modus u prvních čtyř rozložení (sad dat): a.
Kontrola: Sečteme-li sloupec,,četnost výskytu musí nám vyjít hodnota rozsahu souboru (našich 20 žáků)
Základní výpočty pro MPPZ Teorie Aritmetický průměr = součet hodnot znaku zjištěných u všech jednotek souboru, dělený počtem všech jednotek souboru Modus = hodnota souboru s nejvyšší četností Medián =
Návod na statistický software PSPP část 2. Kontingenční tabulky
Návod na statistický software PSPP část 2. Kontingenční tabulky Jiří Šafr FHS UK poslední revize 31. srpna 2010 Logika kontingenčních tabulek... 2 Postup vytváření kontingenčních tabulek v PSPP (SPSS)....
Intervalový odhad. Interval spolehlivosti = intervalový odhad nějakého parametru s danou pravděpodobností = konfidenční interval pro daný parametr
StatSoft Intervalový odhad Dnes se budeme zabývat neodmyslitelnou součástí statistiky a to intervaly v nejrůznějších podobách. Toto téma je také úzce spojeno s tématem testování hypotéz, a tedy plynule
KORELACE. Komentované řešení pomocí programu Statistica
KORELACE Komentované řešení pomocí programu Statistica Vstupní data I Data umístěná v excelovském souboru překopírujeme do tabulky ve Statistice a pojmenujeme proměnné, viz prezentace k tématu Popisná
Pojem a úkoly statistiky
Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Pojem a úkoly statistiky Statistika je věda, která se zabývá získáváním, zpracováním a analýzou dat pro potřeby
4EK211 Základy ekonometrie
4EK211 Základy ekonometrie ZS 2015/16 Cvičení 7: Časově řady, autokorelace LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE 1. Časové řady Data: HDP.wf1
Protokol č. 1. Tloušťková struktura. Zadání:
Protokol č. 1 Tloušťková struktura Zadání: Pro zadané výčetní tloušťky (v cm) vypočítejte statistické charakteristiky a slovně interpretujte základní statistické vlastnosti tohoto souboru tloušťek. Dále
Test z teorie VÝBĚROVÉ CHARAKTERISTIKY A INTERVALOVÉ ODHADY
VÝBĚROVÉ CHARAKTERISTIKY A INTERVALOVÉ ODHADY Test z teorie 1. Střední hodnota pevně zvolené náhodné veličiny je a) náhodná veličina, b) konstanta, c) náhodný jev, d) výběrová charakteristika. 2. Výběrový
VÝBĚR A JEHO REPREZENTATIVNOST
VÝBĚR A JEHO REPREZENTATIVNOST Induktivní, analytická statistika se snaží odhadnout charakteristiky populace pomocí malého vzorku, který se nazývá VÝBĚR neboli VÝBĚROVÝ SOUBOR. REPREZENTATIVNOST VÝBĚRU:
Korelační a regresní analýza. 1. Pearsonův korelační koeficient 2. jednoduchá regresní analýza 3. vícenásobná regresní analýza
Korelační a regresní analýza 1. Pearsonův korelační koeficient 2. jednoduchá regresní analýza 3. vícenásobná regresní analýza Pearsonův korelační koeficient u intervalových a poměrových dat můžeme jako
STATISTICA Téma 1. Práce s datovým souborem
STATISTICA Téma 1. Práce s datovým souborem 1) Otevření datového souboru Program Statistika.cz otevíráme z ikony Start, nabídka Programy, podnabídka Statistika Cz 6. Ze dvou nabídnutých možností vybereme
STATISTICKÉ ZJIŠŤOVÁNÍ
STATISTICKÉ ZJIŠŤOVÁNÍ ÚVOD Základní soubor Všechny ryby v rybníce, všechny holky/kluci na škole Cílem určit charakteristiky, pravděpodobnosti Průměr, rozptyl, pravděpodobnost, že Maruška kápne na toho
Stěžejní funkce MS Excel 2007/2010, jejich ovládání a možnosti využití
Stěžejní funkce MS Excel 2007/2010, jejich ovládání a možnosti využití Proč Excel? Práce s Excelem obnáší množství operací s tabulkami a jejich obsahem. Jejich jednotlivé buňky jsou uspořádány do sloupců
Testování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času
Testování hypotéz 1 Jednovýběrové testy 90/ odhad času V podmínkách naprostého odloučení má voák prokázat schopnost orientace v čase. Úkolem voáka e provést odhad časového intervalu 1 hodiny bez hodinek
Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.
Testování statistických hypotéz Ing. Michal Dorda, Ph.D. Testování normality Př. : Při simulaci provozu na křižovatce byla získána data o mezerách mezi přijíždějícími vozidly v [s]. Otestujte na hladině
Regresní analýza 1. Regresní analýza
Regresní analýza 1 1 Regresní funkce Regresní analýza Důležitou statistickou úlohou je hledání a zkoumání závislostí proměnných, jejichž hodnoty získáme při realizaci experimentů Vzhledem k jejich náhodnému
2. Numerické výpočty. 1. Numerická derivace funkce
2. Numerické výpočty Excel je poměrně pohodlný nástroj na provádění různých numerických výpočtů. V příkladu si ukážeme možnosti výpočtu a zobrazení diferenciálních charakteristik analytické funkce, přičemž
Metodologie pro ISK 2, jaro Ladislava Z. Suchá
Metodologie pro ISK 2, jaro 2014. Ladislava Z. Suchá Metodologie pro Informační studia a knihovnictví 2 Modul 7: Třídění druhého stupně. Kontingenční tabulky Co se dozvíte v tomto modulu? Co je třídění
STATISTICKÝ SOUBOR. je množina sledovaných objektů - statistických jednotek, které mají z hlediska statistického zkoumání společné vlastnosti
ZÁKLADNÍ STATISTICKÉ POJMY HROMADNÝ JEV Statistika pracuje s tzv. HROMADNÝMI JEVY cílem statistického zpracování dat je podání informace o vlastnostech a zákonitostech hromadných jevů: velkého počtu jedinců
StatSoft Jak poznat vliv faktorů vizuálně
StatSoft Jak poznat vliv faktorů vizuálně V tomto článku bychom se rádi věnovali otázce, jak poznat již z grafického náhledu vztahy a závislosti v analýze rozptylu. Pomocí následujících grafických zobrazení
Kontingenční tabulky, korelační koeficienty
Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel 973 442029 email:jirineubauer@unobcz Budeme předpokládat, že X a Y jsou kvalitativní náhodné veličiny, obor hodnot X obsahuje r hodnot (kategorií,
Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu
Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu K čemu slouží statistika Popisuje velké soubory dat pomocí charakteristických čísel (popisná statistika). Hledá skryté zákonitosti v souborech
INDUKTIVNÍ STATISTIKA
10. SEMINÁŘ INDUKTIVNÍ STATISTIKA 3. HODNOCENÍ ZÁVISLOSTÍ HODNOCENÍ ZÁVISLOSTÍ KVALITATIVNÍ VELIČINY - Vychází se z kombinační (kontingenční) tabulky, která je výsledkem třídění druhého stupně KVANTITATIVNÍ
Seminář 6 statistické testy
Seminář 6 statistické testy Část I. Volba správného testu Chceme zjistit, zda se Ježkovy a Širůčkovy seminární skupiny liší ve výsledcích v. průběžné písemce ze statistiky. Chceme zjistit, zda 1. průběžná
Časové řady - Cvičení
Časové řady - Cvičení Příklad 2: Zobrazte měsíční časovou řadu míry nezaměstnanosti v obci Rybitví za roky 2005-2010. Příslušná data naleznete v souboru cas_rada.xlsx. Řešení: 1. Pro transformaci dat do
Cvičení ze statistiky - 8. Filip Děchtěrenko
Cvičení ze statistiky - 8 Filip Děchtěrenko Minule bylo.. Dobrali jsme normální rozdělení Tyhle termíny by měly být známé: Centrální limitní věta Laplaceho věta (+ korekce na spojitost) Konfidenční intervaly
Program Statistica Base 9. Mgr. Karla Hrbáčková, Ph.D.
Program Statistica Base 9 Mgr. Karla Hrbáčková, Ph.D. OBSAH KURZU obsluha jednotlivých nástrojů, funkce pro import dat z jiných aplikací, práce s popisnou statistikou, vytváření grafů, analýza dat, výstupní
SAMOSTATNÁ STUDENTSKÁ PRÁCE ZE STATISTIKY
SAMOSTATÁ STUDETSKÁ PRÁCE ZE STATISTIKY Váha studentů Kučerová Eliška, Pazdeříková Jana septima červen 005 Zadání: My dvě studentky jsme si vylosovaly zjistit statistickým šetřením v celém ročníku septim
LEKCE 6 ZÁKLADY TESTOVÁNÍ HYPOTÉZ
1 LEKCE 6 ZÁKLADY TESTOVÁNÍ HYPOTÉZ STATISTICKÉ HYPOTÉZY neboli formální výroky o: neznámých parametrech základního souboru, o tvaru rozložení četností, o statistických vztazích mezi soubory či proměnnými
MÍRY ZÁVISLOSTI (KORELACE A REGRESE)
zhanel@fsps.muni.cz MÍRY ZÁVISLOSTI (KORELACE A REGRESE) 2.5 MÍRY ZÁVISLOSTI 2.5.1 ZÁVISLOST PEVNÁ, VOLNÁ, STATISTICKÁ A KORELAČNÍ Jednorozměrné soubory - charakterizovány jednotlivými statistickými znaky
Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry
Testování hypotéz Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry Testování hypotéz Obecný postup 1. Určení statistické hypotézy 2. Určení hladiny chyby 3. Výpočet
Vymezení důležitých pojmů. nulová hypotéza, alternativní hypotéza testování hypotézy hladina významnosti (alfa) chyba I. druhu, chyba II.
Testování hypotéz 1. vymezení důležitých pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test 4. t-test pro nezávislé výběry 5. t-test pro závislé výběry Vymezení důležitých pojmů nulová
ZX510 Pokročilé statistické metody geografického výzkumu. Téma: Měření síly asociace mezi proměnnými (korelační analýza)
ZX510 Pokročilé statistické metody geografického výzkumu Téma: Měření síly asociace mezi proměnnými (korelační analýza) Měření síly asociace (korelace) mezi proměnnými Vztah mezi dvěma proměnnými existuje,
EXPERIMENTÁLNÍ MECHANIKA 2 Přednáška 5 - Chyby a nejistoty měření. Jan Krystek
EXPERIMENTÁLNÍ MECHANIKA 2 Přednáška 5 - Chyby a nejistoty měření Jan Krystek 9. května 2019 CHYBY A NEJISTOTY MĚŘENÍ Každé měření je zatíženo určitou nepřesností způsobenou nejrůznějšími negativními vlivy,
LEKCE 5: UMĚLÉ PROMĚNNÉ
LEKCE 5 UMĚLÉ PROMĚNNÉ TRANSFORMACE PROMĚNNÝCH RECODE COMPUTE CATEGORIZE VARIABLES COUNT RANK CASES 2 RECODE Vytváří z variant nominální proměnné či ordinální proměnné obecnější kategorie (kolapsuje obor
Popisná statistika. Komentované řešení pomocí MS Excel
Popisná statistika Komentované řešení pomocí MS Excel Vstupní data Máme k dispozici data o počtech bodů z 1. a 2. zápočtového testu z Matematiky I v zimním semestru 2015/2016 a to za všech 762 studentů,
Náhodné chyby přímých měření
Náhodné chyby přímých měření Hodnoty náhodných chyb se nedají stanovit předem, ale na základě počtu pravděpodobnosti lze zjistit, která z možných naměřených hodnot je více a která je méně pravděpodobná.
2. popis prostředí, nastavení pracovní plochy
(c) mise 2013 1 2 1. úvod Tabulkový procesor program pro organizaci a správu dat pomocí tabulek určen pro zpracování dat převážně číselného charakteru Využití tabulkových procesorů přehledná prezentace
1. Přednáška. Ing. Miroslav Šulai, MBA
N_OFI_2 1. Přednáška Počet pravděpodobnosti Statistický aparát používaný ve financích Ing. Miroslav Šulai, MBA 1 Počet pravděpodobnosti -náhodné veličiny 2 Počet pravděpodobnosti -náhodné veličiny 3 Jevy
Ranní úvahy o statistice
Ranní úvahy o statistice Neúplný návod ke čtení statistických výsledků Dušan Merta květen 2016 Co nás čeká 1 Základní pojmy 2 Testování hypotéz 3 Confidence interval 4 Odds ratio 2 / 26 Základní pojmy
Tabulka 1. Výběr z datové tabulky
1. Zadání domácího úkolu Vyberte si datový soubor obsahující alespoň jednu kvalitativní a jednu kvantitativní proměnnou s alespoň 30 statistickými jednotkami (alespoň 30 jednotlivých údajů). Zdroje dat
Charakteristika datového souboru
Zápočtová práce z předmětu Statistika Vypracoval: 10. 11. 2014 Charakteristika datového souboru Zadání: Při kontrole dodržování hygienických norem v kuchyni se prováděl odběr vzduchu a pomocí filtru Pallflex
Role statistiky ve výzkumu
Statistika - úvod vymezení statistiky úloha statistiky v psychologickém výzkumu základní pojmy - měření, proměnné; popisná a induktivní statistika; populace a vzorek příprava dat před analýzou Definice
P ílohy. P íloha 1. ešení úlohy lineárního programování v MS Excel
P ílohy P íloha 1 ešení úlohy lineárního programování v MS Excel V této p íloze si ukážeme, jak lze ešit úlohy lineárního programování pomocí tabulkového procesoru MS Excel 2007. Výpočet budeme demonstrovat
Statistická teorie učení
Statistická teorie učení Petr Havel Marek Myslivec přednáška z 9. týdne 1 Úvod Představme si situaci výrobce a zákazníka, který si u výrobce objednal algoritmus rozpoznávání. Zákazník dodal experimentální
Korelace. Komentované řešení pomocí MS Excel
Korelace Komentované řešení pomocí MS Excel Vstupní data Tabulka se vstupními daty je umístěna v oblasti A2:B84 (viz. obrázek) Prvotní představu o tvaru a síle závislosti docházky a počtu bodů nám poskytne
Úvod do teorie odhadu. Ing. Michael Rost, Ph.D.
Úvod do teorie odhadu Ing. Michael Rost, Ph.D. Náhodný výběr Náhodným výběrem ze základního souboru populace, která je popsána prostřednictvím hustoty pravděpodobnosti f(x, θ), budeme nazývat posloupnost
KGG/STG Statistika pro geografy
KGG/STG Statistika pro geografy 5. Odhady parametrů základního souboru Mgr. David Fiedor 16. března 2015 Vztahy mezi výběrovým a základním souborem Osnova 1 Úvod, pojmy Vztahy mezi výběrovým a základním
Bodové odhady parametrů a výstupů
Bodové odhady parametrů a výstupů 26. listopadu 2013 Máme rozdělení s neznámými parametry a chceme odhadnout jeden nebo několik příštích výstupů. Již víme, že úplnou informaci v této situaci nese sdružené
Metodologie pro Informační studia a knihovnictví
Metodologie pro Informační studia a knihovnictví Transformace proměnných Co se dozvíte v tomto modulu? Jak vytvořit novou proměnnou pomocí rekódování? Jak vytvořit novou proměnnou pomocí aritmetických