Manuál pro analýzu dat v softwaru STATISTICA
|
|
- Silvie Klára Brožová
- před 8 lety
- Počet zobrazení:
Transkript
1 Manuál pro analýzu dat v softwaru STATISTICA Software STATISTICA je produkt StatSoft, Inc. ( STATISTICA je dostupná v rámci MU z (login stejný jako do seznam dostupných softwarů lze najít v oddílu Provozní služby). Načtení datového souboru Soubor -> Otevřít -> vybrat datový soubor -> Otevřít -> Importovat vybraný list do tabulky -> vybrat list Excelovského souboru -> OK -> nechat zatržené 1. řádek jako názvy proměnných -> OK -> Importovat jako textové popisky Uložení datového souboru Soubor -> Uložit -> zadáme název souboru -> Uložit Zapnutí automatického filtru Označit všechny sloupce (např. pomocí CTRL+A nebo kliknutím do levého horního rohu tabulky) -> Data -> Automatický filtr -> Automatický filtr 1. Vizualizace dat Vytváření grafů pomocí záložky Grafy. Koláčový graf Grafy -> 2D grafy -> Výsečové grafy -> zvolit proměnnou (např. Gender) (v záložce Detaily je možné zvolit, jakou legendu, typ a tvar grafu chceme (Legenda, Typ, Tvar) -> OK Po dvojím kliknutí na graf se nám ukáže okno Možnosti grafu, kde lze libovolně měnit barvu grafu i typ a tvar grafu a další parametry Sloupcový graf (na ose y počty lidí) Grafy -> Histogramy -> Proměnné -> zvolit proměnnou (např. Group) -> OK -> zrušit zatržení Typ proložení: Normální -> na záložce Detaily zatrhnout Mezery mezi sloupci -> OK Sloupcový graf (na ose y procenta) Grafy -> Histogramy -> Proměnné -> zvolit proměnnou (např. Group) -> OK -> zrušit zatržení Typ proložení: Normální -> na záložce Detaily zatrhnout Mezery mezi sloupci -> na záložce Detaily změnit u Osa Y hodnotu N na % -> OK Histogram (na ose y procenta) Grafy -> Histogramy -> Proměnné -> zvolit proměnnou (např. Age) -> OK -> na záložce Detaily změnit u Osa Y hodnotu N na % (lze např. si vypsat i základní popisnou statistiku zatrhnutím Popisné statistiky) -> OK Krabicový graf (s vykreslením odlehlých hodnot) Grafy -> 2D grafy -> Krabicové grafy... -> Proměnné -> zvolit proměnnou (např. Age) jako Závislé prom. -> OK -> OK Krabicový graf (s minimem a maximem) Grafy -> 2D Grafy -> Krabicové grafy... -> Proměnné -> zvolit proměnnou (např. Age) jako Závislé prom. -> OK -> na záložce Detaily -> u Svorka zvolit Min-Max -> u Odl. hodn. & extrémy zvolit Vyp. -> OK 1
2 2. Příprava dat pro analýzu Nastavení formátu u MMSE na double Dvakrát kliknout na šedé políčko s názvem proměnné -> nastavit Typ na Double -> nastavit Formát zobrazení na Číslo -> OK Nastavení formátu u scan_date na datum Dvakrát kliknout na šedé políčko s názvem proměnné -> nastavit Formát zobrazení na Datum -> vybrat formát 17/03/10 -> OK Identifikace a odstranění duplikací Data -> Filtrování dat/překódování -> Filtrovat duplicitní případy -> Vstup: Proměnné -> ID -> OK -> u Output zatrhnout Vytvořit tabulku duplicit -> OK Je patrné, že se vždy zachová první záznam a druhý záznam je vyřazen bez ohledu na datum pořízení skenu. Pokud chceme, aby byl vždy odstraněn záznam se starším datem, je nejprve nutné data seřadit podle data pořízení skenu (sestupně) pomocí: Data -> Setřídit -> označit 1-ID -> Přidat prom. -> označit 30-scan_date -> Přidat prom. -> Sestupně -> OK -> Zahrnout formátování Nový datový soubor bez duplikací uložit. Odstranění chybějících a chybných hodnot Data -> Podmnožina -> Případy -> zatrhnout Povolit podmínky výběru zapnout filtr -> do Zadané výrazem napsat v4="" OR v4>110 OR v7="" -> OK -> OK Nový datový soubor bez chybějících a chybných hodnot uložit. Rekódování proměnné Gender, aby obsahovala pouze hodnoty F a M 1. způsob ručně: Vyfiltrovat si řádek s hodnotou FF a hodnotu FF přepsat na F 2. způsob vytvořením nové proměnné: Označit proměnnou za proměnnou Gender -> Vložit -> Přidat proměnné -> Jméno -> zadat název nové proměnné (např. Gender_rek) -> do kolonky Dlouhé jméno napsat =iif(v3="ff","f",v3) -> OK Rekódování proměnné Group, aby obsahovala pouze hodnoty 1 (CN), 2 (MCI) a 3 (AD) Označit proměnnou za proměnnou Group -> Vložit -> Přidat proměnné -> Jméno -> zadat název nové proměnné (např. Group_3kat) -> do kolonky Dlouhé jméno napsat =iif(v2=3;2;iif(v2=4;3;v2)) -> OK Jiný způsob pomocí Data -> Překódovat... Vytvoření textových popisků u kvalitativní proměnné Dvakrát kliknout na šedé políčko s názvem proměnné -> Textové hodnoty -> zadat textové popisky a jejich příslušné číselné hodnoty -> OK -> OK 3. Popisná sumarizace dat Popisná sumarizace dat pomocí Statistiky -> Základní statistiky/tabulky. Obecný popis dialogového okna pro sumarizaci dat, vizualizace a další analýzy je uveden na Obr. 1. Popisná sumarizace kvalitativních dat frekvenční tabulka Statistiky -> Základní statistiky/tabulky -> Tabulky četností -> Proměnné -> zvolit proměnnou (např. Group) -> OK -> Výpočet Popisná sumarizace kvantitativních dat Statistiky -> Základní statistiky/tabulky -> Popisné statistiky -> Proměnné -> zvolit proměnnou (např. Age) -> OK -> na záložce Detailní výsledky zatrhnout Medián, Variační koeficient, Dolní & horní kvartily -> Výpočet 2
3 Výběr dat pro analýzu/graf Záložky možností nebo nastavení analýzy/grafu Nastavení Vážení dat Selekce dat Detailní nastavení analýzy/grafu Způsob zpracování chybějících hodnot Obr. 1. Popis dialogového okna sloužícího pro sumarizaci, vizualizaci a další analýzy dat. Popisná sumarizace kvantitativních dat zapnutí filtru (vyfiltrování posledních 20 pacientů) Statistiky -> Základní statistiky/tabulky -> Popisné statistiky -> Proměnné -> zvolit proměnnou (např. Height a Height_cor) -> OK -> Select Cases -> Zapnout filtr -> některé, vybrané: -> do nebo čísly případů zadat > OK -> na záložce Detailní výsledky zatrhnout Medián -> Výpočet 4. Transformace dat Logaritmická transformace Označit proměnnou za proměnnou, kterou chceme logaritmovat -> Vložit -> Přidat proměnné -> Jméno -> zadat název nové proměnné (např. Weight_log) -> do kolonky Dlouhé jméno napsat =Log(v9) (Pozor, v softwaru STATISTICA je přirozený logaritmus označen jako Log(x) místo Ln(x)!) -> OK Standardizace dat Označit proměnnou za proměnnou, kterou chceme standardizovat -> Vložit -> Přidat proměnné -> Jméno -> zadat název nové proměnné (např. Age_st) -> do kolonky Dlouhé jméno napsat =v6 -> OK - > Data -> Standardizovat... -> OK 3
4 Centrování dat Označit proměnnou za proměnnou, kterou chceme centrovat-> Vložit -> Přidat proměnné -> Jméno -> zadat název nové proměnné (např. Height_centr) -> do kolonky Dlouhé jméno napsat =v (průměr vypočítaný pomocí Popisné statistiky) -> OK Kategorizace Označit proměnnou za proměnnou, kterou chceme kategorizovat -> Vložit -> Přidat proměnné -> Jméno -> zadat název nové proměnné (např. Age_kat) -> OK -> Data -> Překódovat... (zkontrolovat si, že v záhlaví je správný název proměnné, jinak vybrat správnou proměnnou pomocí tlačítka Proměnná...) -> zadat podmínky a nové hodnoty (viz Obr. 2) -> OK Obr. 2. Ukázka kategorizace věku. 5. Intervaly spolehlivosti Výpočet intervalu spolehlivosti a střední chyby průměru (standard error) Statistiky -> Základní statistiky/tabulky -> Popisné statistiky -> Proměnné -> zvolit proměnnou (např. Age) -> OK -> na záložce Detailní výsledky zatrhnout Meze spolehl. prům. a Sm. chyba průměru -> Výpočet Výpočet kvantilů Studentova rozložení Statistiky -> Pravděpodobnostní kalkulátor -> Rozdělení... -> t (Studentovo) -> zatrhnout Inverze -> jako p zadat > jako sv (počet stupňů volnosti) zadat 832 -> Výpočet (vypočítá nám to hodnotu t) 6. Užitečná nastavení Vypnutí automatického překreslování grafů Soubor -> Správce výstupů -> Grafy -> Nastavení -> Aktualizace dat přepnout na Uzamčen -> zrušit zatržení u Aktualizace stavů případů v tabulce -> OK 4
5 7. Výpočet velikosti vzorku a power analýza Autor: RNDr. Eva Janoušová Výpočet velikosti vzorku Statistiky -> Analýza síly testu -> Výpočet velikosti vzorku -> zvolit typ výpočtu podle typu našeho experimentu, který budeme chtít provést (např. Dva průměry, t-test, nezáv. vzorky) -> OK -> nastavit parametry a zvolit typ hypotézy (např. viz Obr. 3 Pozor! Zadáváme typ nulové hypotézy, tedy zadáváme opak toho, co chceme prokázat!) -> OK -> Vypočítat N Obr. 3. Ukázka nastavení parametrů u výpočtu velikosti vzorku. Power analýza Statistiky -> Analýza síly testu -> Výpočet síly testu -> zvolit typ výpočtu podle typu našeho experimentu, který budeme chtít provést (např. Dva průměry, t-test, nezáv. vzorky) -> OK -> nastavit parametry a zvolit typ hypotézy (např. viz Obr. 4 Pozor! Zadáváme typ nulové hypotézy, tedy zadáváme opak toho, co chceme prokázat!) -> OK -> Vypočítat sílu Obr. 4. Ukázka nastavení parametrů u power analýzy. 5
6 8. Statistické testy pro kvantitativní data parametrické testy Jednovýběrový t-test Statistiky -> Základní statistiky/tabulky -> t-test, samost. vzorek -> OK -> zvolit proměnnou (např. Hippocampus_volume (mm3)) -> OK -> Test všech průměrů vůči: > na záložce Možnosti zatrhnout Výpočet mezí spolehl. -> Výpočet Párový t-test Statistiky -> Základní statistiky/tabulky -> t-test, závislé vzorky -> OK -> zvolit proměnné (např. Hippocampus_volume (mm3) jako 1. seznam proměnných a Hippocampus_volume_24 (mm3) jako 2. seznam proměnných) -> OK -> Výpočet Dvouvýběrový t-test Statistiky -> Základní statistiky/tabulky -> t-test, nezávislé, dle skupin -> OK -> zvolit proměnné (např. Putamen_volume (mm3) jako Závislé proměnné a Gender_rek jako Grupovací proměnná) -> na záložce Možnosti lze zvolit Levenův test (test homogenity rozptylů) a Meze spol. pro odhady -> Výpočet Analýza rozptylu (ANOVA) a post-hoc testy 1. způsob Statistiky -> Základní statistiky/tabulky -> Rozklad & jednofakt. ANOVA -> OK -> zvolit proměnné (např. Hippocampus_volume (mm3) jako Závislé proměnné a Group_3kat jako Grupovací proměnné) -> OK -> OK -> na záložce ANOVA & testy kliknout na Analýza rozptylu (vypíše ANOVA tabulku); dále lze vypsat i výsledky testů homogenity rozptylů: Leveneovy testy, Brown-Forsytheho testy -> na záložce Post-hoc kliknout na Tukeyův HSD (v případě vyrovnaných počtů subjektů ve skupinách), Tukey HSD - nestejná N (v případě nestejných počtů subjektů ve skupinách) nebo Schefféův test (pro stejné i nestejné počty subjektů ve skupinách) Analýza rozptylu (ANOVA) a post-hoc testy 2. způsob Statistiky -> ANOVA -> Jednofaktorová ANOVA -> OK -> zvolit proměnné (např. Hippocampus_volume (mm3) jako Seznam závislých proměnných a Group_3kat jako Kategor. nezávislá proměnná (faktor)) -> OK -> OK -> Všechny efekty (vypíše ANOVA tabulku; prvního řádku s interceptem si nevšímáme) -> Více výsledků -> na záložce Post-hoc kliknout na Tukeyův HSD (pro stejné počty subjektů ve skupinách), HSD nestejné N (pro nestejné počty subjektů ve skupinách) nebo Schefféův (pro stejné i nestejné počty subjektů) 9. Statistické testy pro kvantitativní data neparametrické testy Wilcoxonův test jednovýběrový STATISTICA neumožňuje počítat jednovýběrový Wilcoxonův test přímo. Je nutné nejprve vytvořit novou proměnnou, která bude mít ve všech řádcích hodnotu, se kterou chceme srovnávat naše data: Vložit -> Přidat proměnné -> Jméno -> zadat název nové proměnné (např. mmse_konst) -> do kolonky Dlouhé jméno napsat =27,5 (hodnota konstanty, se kterou chceme srovnávat) -> OK Poté můžeme použít pro výpočet párový Wilcoxonův test: Statistiky -> Neparametrická statistika -> Porovnání dvou závislých vzorků (proměnné) -> OK -> zvolit proměnné (např. MMSE jako 1. seznam proměnných a mmse_konst jako 2. seznam proměnných) -> OK -> Wilcoxonův párový test (Je možné vypočítat i Znaménkový test, který je též neparametrickou alternativou párového t-testu.) Wilcoxonův test párový Statistiky -> Neparametrická statistika -> Porovnání dvou závislých vzorků (proměnné) -> OK -> zvolit proměnné (např. MMSE jako 1. seznam proměnných a MMSE_24 jako 2. seznam proměnných) -> OK -> Wilcoxonův párový test 6
7 (Je možné vypočítat i Znaménkový test, který je též neparametrickou alternativou párového t-testu.) Mannův-Whitneyův test Statistiky -> Neparametrická statistika -> Porovnání dvou nezávislých vzorků (skupiny) -> OK -> zvolit proměnné (např. Hippocampus_volume (mm3) jako Seznam závislých proměnných a Gender_rek jako Nezáv. (groupov.) proměnná) -> OK -> M-W U test Kruskalův-Wallisův test Statistiky -> Neparametrická statistika -> Porovnání více nezávislých vzorků (skupiny) -> OK -> zvolit proměnné (např. MMSE jako Seznam závislých proměnných a Group_3kat jako Nezáv. (groupov.) proměnná) -> OK -> Výpočet (vypíše výsledky Kruskalova-Wallisova testu) -> Vícenás. porovnání průměrného pořadí pro vš. sk. (vypíše výsledky post hoc analýzy) 10. Ověření předpokladů statistických testů Vykreslení Q-Q grafu pro jednotlivé skupiny Grafy -> 2D grafy -> Normální pravděpodobnostní grafy... -> zvolit proměnnou (např. Hippocampus_volume (mm3)) -> Anal. skup. -> Skup. proměnná(é) -> vybrat proměnnou (např. Gender_rek) -> OK -> zatrhnout Výstup do jediné složky -> přepnout Uspořádání skupin na Sestupně -> OK -> lze zatrhnout Shapiro-Wilksův test (test normality dat) -> OK Ověření normality pomocí Základní statistiky/tabulky pro jednotlivé skupiny Statistiky -> Základní statistiky/tabulky -> Popisné statistiky -> Proměnné -> zvolit proměnnou (např. Hippocampus_volume (mm3)) -> OK -> na záložce Detailní výsledky zatrhnout Medián (to teď není nutné) -> Anal. skup. -> Skup. proměnná(é) -> vybrat proměnnou (např. Gender_rek) -> OK -> zatrhnout Výstup do jediné složky a Sloučit tabulkové výsledky v jedné tabulce -> OK -> přepnout Uspořádání skupin na Sestupně -> OK -> na záložce Normalita zatrhnout Shapiro-Wilkův W test -> Tabulky četností -> na záložce Pravd. & bod. grafy lze nechat vykreslit Normální pravděpod. graf (tzn. Q-Q graf) -> na záložce Normalita lze nechat vykreslit Histogramy Ověření normality pomocí Histogramy... pro jednotlivé skupiny Grafy -> Histogramy -> Proměnné -> zvolit proměnnou (např. Hippocampus_volume (mm3)) -> OK -> na záložce Detaily změnit u Osa Y hodnotu N na %, zatrhnout Shapiro-Wilksův test a Kolmogorov- Smirnovův test -> Anal. skup. -> Skup. proměnná(é) -> vybrat proměnnou (např. Gender_rek) -> OK -> zatrhnout Výstup do jediné složky a Sloučit tabulkové výsledky v jedné tabulce -> OK -> přepnout Uspořádání skupin na Sestupně -> OK -> OK 11. Další užitečné příkazy Vykreslení tečkového grafu Grafy -> Bodové grafy -> zvolit proměnné (např. Hippocampus_volume (mm3) jako X a Hippocampus_volume_24 (mm3) jako Y -> na záložce Detaily můžeme zatrhnout Korelace a p (lin. prolož.) -> OK Popisná sumarizace kvantitativní proměnné podle kategorií kvalitativní proměnné Statistiky -> Základní statistiky/tabulky -> Popisné statistiky -> Proměnné -> zvolit proměnnou (např. Hippocampus_volume (mm3)) -> OK -> na záložce Detailní výsledky zatrhnout Medián -> Anal. skup. -> Skup. proměnná(é) -> vybrat proměnnou (např. Gender_rek) -> OK -> zatrhnout Výstup do jediné složky a Sloučit tabulkové výsledky v jedné tabulce -> OK -> přepnout Uspořádání skupin na Sestupně -> OK -> Výpočet 7
8 Vytvoření šablony grafů Upravit si graf do finální podoby -> 2x kliknout do grafu -> Styly... -> Více -> 2x kliknout na Graf (aby se celý ten strom zavřel) -> kliknout na tlačítko s třemi tečkami -> Uložit jako -> pojmenovat graf -> Uložit -> Zavřít -> OK Úprava grafu podle šablony 2x kliknout do grafu -> Styly... -> Více -> 2x kliknout na Graf (aby se celý ten strom zavřel) -> otevřít rozbalovací nabídku s typy grafů -> zvolit šablonu -> Upravit -> Zavřít -> OK 12. Analýza kontingenčních tabulek Kontingenční tabulka absolutních četností proměn.) (např. Group_3kat do List 1 a Age_kat do List 2)-> OK -> OK -> Výpočet Kontingenční tabulka procent proměn.) (např. Group_3kat do List 1 a Age_kat do List 2)-> OK -> OK -> na záložce Možnosti zatrhnout Procenta z počtu v řádku, Procenta z počtu ve sloupci nebo Procenta celkového počtu -> Výpočet Kontingenční tabulka očekávané četnosti proměn.) (např. Group_3kat do List 1 a Age_kat do List 2)-> OK -> OK -> na záložce Možnosti zatrhnout Očekávané četnosti -> Výpočet Pearsonův chí-kvadrát test proměn.) (např. Group_3kat do List 1 a Age_kat do List 2)-> OK -> OK -> na záložce Možnosti zatrhnout Pearsonův & M-V chí-kvadrát -> na záložce Detailní výsledky kliknout na Detailní 2-rozm. tabulky Fisherův exaktní test proměn.) (např. Gender do List 1 a mmse_kat do List 2)-> OK -> OK -> na záložce Možnosti zatrhnout Fisher exakt., Yates, McNemar (2 x 2) -> na záložce Detailní výsledky kliknout na Detailní 2-rozm. tabulky McNemarův test proměn.) (např. mmse_kat do List 1 a mmse24_kat do List 2) -> OK -> OK -> na záložce Možnosti zatrhnout Fisher exact, Yates, McNemar (2 x 2) -> na záložce Detailní výsledky kliknout na Detailní 2-rozm. tabulky 8
9 13. Testy binomických dat Jednovýběrový binomický test Příklad: Mezi 50 pacienty s Alzheimerovou chorobou je 12 pacientů s MMSE skóre nižším než daná hranice. Ověřte, zda podíl pacientů s nižším skóre je stejný jako v běžné populaci (v běžné populaci uvažujte, že 5% lidí má hodnoty nižší než hranice). Statistiky -> Základní statistiky/tabulky -> Testy rozdílů: r, %, průměry -> Rozdíl mezi dvěma poměry -> zadat pravděpodobnosti a počty subjektů (viz Obr. 5 vlevo) -> Oboustr. -> Výpočet (dostaneme p-hodnotu) Co největší N2 Vypočtená p-hodnota Vypočtená p-hodnota Obr. 5. Ukázka zadávání parametrů v jednovýběrovém (vlevo) a dvouvýběrovém binomickém testu (vpravo). Dvouvýběrový binomický test Příklad: Mezi 42 pacienty s Alzheimerovou chorobou (AD) je 11 pacientů s MMSE skóre nižším než daná hranice. Mezi 18 pacienty s mírnou kognitivní poruchou (MCI) je 6 pacientů s MMSE skóre nižším než daná hranice. Ověřte, zda se podíly pacientů s nižším skóre u pacientů s AD a MCI liší. p 1 =11/42=0,262 a p 2 =6/18=0,333 Statistiky -> Základní statistiky/tabulky -> Testy rozdílů: r, %, průměry -> Rozdíl mezi dvěma poměry -> zadat pravděpodobnosti a počty subjektů (viz Obr. 5 vpravo) -> Oboustr. -> Výpočet (dostaneme p-hodnotu) 14. ROC analýza I. Vytvoření proměnné mmse_neg (mmse_neg=-mmse), protože je nutné, aby hodnoty skóre pro kontrolní subjekty byly menší než hodnoty pro pacienty. II. Statistiky -> Pokročilé lineární/nelineární modely -> Zobecněné lineární/nelineární modely -> Logitový model -> OK -> zvolit proměnné (group_01_cnmci jako Závislá proměnná a mmse_neg jako Spojité nezáv. prom. -> zvolit Odezv. kódy (zadat hodnoty: 1 0 (je nutné to mít v tomto pořadí, aby byla správně vypočítaná senzitivita a specificita; 1 značí rizikovou skupinu, 0 kontrolní skupinu)) -> OK -> OK -> na záložce Rezid. 1 kliknout na ROC křivka (vykreslí se graf s ROC křivkou a AUC) III. Pro zjištění cut-off (nejlepšího dělícího bodu) je nutné nejdříve vypsat frekvenční tabulku hodnot spojité proměnné: Statistiky -> Základní statistiky/tabulky -> Tabulky četností -> zvolit proměnnou (např. mmse_neg) -> Výpočet IV. Výslednou tabulku je nutné zkopírovat do Excelu: kliknout na levý horní roh tabulky (tím se celá tabulka označí) -> kliknout do tabulky pravým tlačítkem myši -> Kopírovat se záhlavími -> vložit do Excelu -> seřadit podle hodnot prvního sloupce sestupně 9
10 V. Do Excelu za tuto tabulku přikopírovat tabulku, která byla vytvořena jako výsledek ROC analýzy VI. V Excelu spočítat specificitu (tzn. udělat 1-(sloupeček s 1-Specificita)) a pak spočítat součet senzitivity a specificity -> vybrat řádek s největší hodnotou součtu senzitivity a specificity VII. Vytvoření kategorizovaného MMSE skóre s využitím cut-off: Vložit -> Přidat proměnné -> pojmenovat novou proměnnou (např. mmse_kat) a do kolonky Dlouhé jméno napsat =iif(v14< -28;0;1) -> OK VIII. Ověření vypočítané senzitivity a specificity: Statistiky -> Základní statistiky/tabulky -> Kontingenční tabulky -> OK -> Specif. tabulky (vyberte proměn.) (např. mmse_kat do List 1 a group_01_cnmci do List 2)-> OK -> OK -> na záložce Možnosti zatrhnout Procenta z počtu ve sloupci -> Výpočet (senzitivita je tady procento v pravém dolním rohu, specificita je procento v levém horním rohu záleží ale na nakódování dat a v Listu 1 musí být výsledek diagnostického testu a v Listu 2 skutečnost) 15. Korelační analýza Bodový graf ( Scatterplot ) Grafy -> Bodové grafy... -> zvolit proměnné (např. Putamen_volume (mm3) jako X a Amygdala_volume (mm3) jako Y -> OK -> na záložce Detaily lze zatrhnout Korelace a p (lin. prolož.) (vypočítá Pearsonův korelační koeficient a p-hodnotu) a R kvadrát -> OK Výpočet Pearsonova korelačního koeficientu Statistiky -> Základní statistiky/tabulky -> Korelační matice -> OK -> 1 seznam proměn. -> zvolit proměnné (např. Amygdala_volume (mm3) a Putamen_volume (mm3)) -> na záložce Možnosti zvolit Zobrazit r, p-hodnoty a N -> Výpočet Srovnání dvou korelačních koeficientů Statistiky -> Základní statistiky/tabulky -> Testy rozdílů: r, %, průměry -> OK -> zadáme hodnoty korelačního koeficientu a počet subjektů obou výběrů -> Výpočet (spočítá nám to p-hodnotu) Výpočet Spearmanova korelačního koeficientu (výpočet čtvercové korelační matice) Statistiky -> Neparametrická statistika -> Korelace (Spearman, Kendallovo tau, gama) -> OK -> zvolit proměnné (např. MMSE a Hippocampus_volume (mm3)) -> OK -> Spearmanův koef. R Výpočet Spearmanova korelačního koeficientu (výpočet detailní tabulky) Statistiky -> Neparametrická statistika -> Korelace (Spearman, Kendallovo tau, gama) -> OK -> zvolit Detailní report (místo Čtvercová matice) -> zvolit proměnné (např. MMSE do 1. seznam proměnných a Hippocampus_volume (mm3) do 2. seznam proměnných) -> OK -> Spearmanův koef. R 16. Regresní analýza Lineární regrese a odstranění vlivu kovariát Statistiky -> Vícenásobná regrese -> zvolit proměnné (např. Nucl_caud_volume (mm3) jako Závislá prom., Age a gender_01,... jako Seznam nezáv. proměnných) -> OK -> OK -> Výpočet: Výsledky regrese (vypíše regresní koeficienty a p-hodnoty) -> OK - Vykreslení Q-Q grafu pro rezidua: kliknout na Normální p-graf reziduí - Vykreslení histogramu reziduí: na záložce Rezidua kliknout na Histogram reziduí (vpravo lze zvolit, zda chceme vykreslit histogram reziduí či standardizovaných reziduí) - Vykreslení bodového grafu predikovaných hodnot a reziduí: na záložce Bodové grafy kliknout na Předpovědi vs. rezidua - Uložení reziduí: na záložce Uložit kliknout na Uložit rezidua & předpovědi -> zvolit proměnné, které bude nově vytvořená tabulka dále obsahovat -> OK 10
11 17. Analýza přežití Kaplanův-Meierův odhad funkce přežití pro jeden výběr Statistiky -> Pokročilé lineární/nelineární modely -> Analýza přežívání -> Kaplan-Meierova metoda -> OK -> zvolit proměnné (např. cas jako Časy přežívání a umrti jako Indikátor cenzorov.) -> OK -> Kódy pro ukončené: 1 -> Kód pro cenzorované: 0 -> OK - Vykreslení křivky přežití: kliknout na Časy přežívání vs. kum. podíly přežív. - Vypsání tabulky pro výpočet x-letého přežití: kliknout na Výsledky: analýza přežívání - Vypsání tabulky s mediánem přežití: na záložce Detaily kliknout na Kvantily funkce přežívání Kaplanův-Meierův odhad funkce přežití pro dva výběry Statistiky -> Pokročilé lineární/nelineární modely -> Analýza přežívání -> Porovnání dvou vzorků -> OK -> zvolit proměnné (např. cas jako Přežívání, umrti jako Cenzor. prom., Skupina jako Grupovací prom.) -> OK -> Kódy pro ukončené: 1 -> Kód pro cenzorované: 0 -> zkontrolovat, jestli kategorie grupovací proměnné jsou v pořadí, jaké chceme -> OK - Vykreslení křivek přežití: na záložce Grafy funkcí kliknout na Kum. podíl přežív. dle skupin (Kaplan Meier) - Výpočet testu na srovnání přežití ve skupinách: na záložce Základní výsledky kliknout na Gehanův Wilcoxonův test nebo Ln-pořadový test (p-hodnota je v záhlaví tabulky) - Vypsání tabulky pro výpočet x-letého přežití: na záložce Dvouvýběrové testy kliknout na Podíly přežív. dle skupin (nevypisuje se ale střední chyba nutná pro výpočet intervalů spolehlivosti a nevypočítá se medián přežití je nutné tyto údaje počítat pro každou křivku zvlášť pomocí Kaplanova-Meierova odhadu funkce přežití pro jeden výběr (postup viz výše)) Kaplanův-Meierův odhad funkce přežití pro tři a více výběrů Statistiky -> Pokročilé lineární/nelineární modely -> Analýza přežívání -> Porovnání více vzorků -> OK -> zvolit proměnné (např. cas jako Přežívání, umrti jako Cenzor. prom., Skupina jako Grupovací prom.) -> OK -> Kódy pro ukončené: 1 -> Kód pro cenzorované: 0 -> Kódy (skupin) -> Vše (kdyžtak změnit pořadí kategorií podle toho, jak potřebujeme) -> OK -> OK - Vykreslení křivek přežití: kliknout na Kumul. podíl přežív. (Kaplan-Meier) dle skupin - Výpočet testu na srovnání přežití ve skupinách: kliknout na Výpočet: časy přežívání & skóre (p-hodnota je v záhlaví tabulky) - Vypsání tabulky pro výpočet x-letého přežití: na záložce Detaily kliknout na Procenta přežív. dle skup. (nevypisuje se ale střední chyba nutná pro výpočet intervalů spolehlivosti a nevypočítá se medián přežití je nutné tyto údaje počítat pro každou křivku zvlášť pomocí Kaplanova-Meierova odhadu funkce přežití pro jeden výběr (postup viz výše)) Coxův model proporcionálních rizik Statistiky -> Pokročilé lineární/nelineární modely -> Coxovy modely proporcionálního rizika -> zvolit proměnné (např. OS_doba_mesice jako Doby přežití, ECOG1 jako Kovariáty, Umrti jako Censorovací proměnná) -> OK -> Kód pro výskyt události: 1 -> Kód pro censorovaná data: 0 -> OK -> Parametrické odhady Poděkování Příprava výukových materiálů předmětu DSAN01 Analýza dat pro Neurovědy byla finančně podporována prostředky projektu FRVŠ č. 942/2013 Inovace materiálů pro interaktivní výuku a samostudium předmětu Analýza dat pro Neurovědy. 11
RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.
Analýza dat pro Neurovědy RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Jaro 2014 Institut biostatistiky Janoušová, a analýz Dušek: Analýza dat pro neurovědy Blok 7 Jak hodnotit vztah spojitých proměnných
RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.
Analýza dat pro Neurovědy RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Jaro 2014 Institut biostatistiky Janoušová, a analýz Dušek: Analýza dat pro neurovědy Blok 3 Jak a kdy použít parametrické a
JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica
JEDNOVÝBĚROVÉ TESTY Komentované řešení pomocí programu Statistica Vstupní data Data umístěná v excelovském souboru překopírujeme do tabulky ve Statistice a pojmenujeme proměnné, viz prezentace k tématu
UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 3. 11.
UNIVERZITA OBRANY Fakulta ekonomiky a managementu Aplikace STAT1 Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 Jiří Neubauer, Marek Sedlačík, Oldřich Kříž 3. 11. 2012 Popis a návod k použití aplikace
RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.
Analýza dat pro Neurovědy RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Jaro 2014 Institut biostatistiky Janoušová, a analýz Dušek: Analýza dat pro neurovědy Blok 4 Jak a kdy použít parametrické a
STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky)
STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky) 1) Význam a využití statistiky v biologických vědách a veterinárním lékařství ) Rozdělení znaků (veličin) ve statistice 3) Základní a
POPISNÁ STATISTIKA Komentované řešení pomocí programu Statistica
POPISNÁ STATISTIKA Komentované řešení pomocí programu Statistica Program Statistica I Statistica je velmi podobná Excelu. Na základní úrovni je to klikací program určený ke statistickému zpracování dat.
DVOUVÝBĚROVÉ A PÁROVÉ TESTY Komentované řešení pomocí programu Statistica
DVOUVÝBĚROVÉ A PÁROVÉ TESTY Komentované řešení pomocí programu Statistica Úloha A) koncentrace glukózy v krvi V této části posoudíme pomocí párového testu, zda nový lék prokazatelně snižuje koncentraci
Grafický a číselný popis rozložení dat 3.1 Způsoby zobrazení dat Metody zobrazení kvalitativních a ordinálních dat Metody zobrazení kvan
1 Úvod 1.1 Empirický výzkum a jeho etapy 1.2 Význam teorie pro výzkum 1.2.1 Konstrukty a jejich operacionalizace 1.2.2 Role teorie ve výzkumu 1.2.3 Proces ověření hypotéz a teorií 1.3 Etika vědecké práce
KORELACE. Komentované řešení pomocí programu Statistica
KORELACE Komentované řešení pomocí programu Statistica Vstupní data I Data umístěná v excelovském souboru překopírujeme do tabulky ve Statistice a pojmenujeme proměnné, viz prezentace k tématu Popisná
Program Statistica Base 9. Mgr. Karla Hrbáčková, Ph.D.
Program Statistica Base 9 Mgr. Karla Hrbáčková, Ph.D. OBSAH KURZU obsluha jednotlivých nástrojů, funkce pro import dat z jiných aplikací, práce s popisnou statistikou, vytváření grafů, analýza dat, výstupní
Manuál pro analýzu dat v softwaru SPSS
Manuál pro analýzu dat v softwaru SPSS Software SPSS je produkt IBM (http://www.ibm.com/analytics/us/en/technology/spss/). SPSS je dostupné v rámci MU z https://inet.muni.cz/auth/login (login stejný jako
Popisná statistika. Komentované řešení pomocí MS Excel
Popisná statistika Komentované řešení pomocí MS Excel Vstupní data Máme k dispozici data o počtech bodů z 1. a 2. zápočtového testu z Matematiky I v zimním semestru 2015/2016 a to za všech 762 studentů,
5. Závislost dvou náhodných veličin různých typů (kategoriální a metrická veličina)
5. Závislost dvou náhodných veličin různých typů (kategoriální a metrická veličina) Cílem tématu je správné posouzení a výběr vhodného testu v závislosti na povaze metrické a kategoriální veličiny. V následující
4. Zpracování číselných dat
4. Zpracování číselných dat 4.1 Jednoduché hodnocení dat 4.2 Začlenění dat do písemné práce Zásady zpracování vědecké práce pro obory BOZO, PÚPN, LS 2011 4.1 Hodnocení číselných dat Popisná data: střední
Zdokonalování gramotnosti v oblasti ICT. Kurz MS Excel kurz 6. Inovace a modernizace studijních oborů FSpS (IMPACT) CZ.1.07/2.2.00/28.
Zdokonalování gramotnosti v oblasti ICT Kurz MS Excel kurz 6 1 Obsah Kontingenční tabulky... 3 Zdroj dat... 3 Příprava dat... 3 Vytvoření kontingenční tabulky... 3 Možnosti v poli Hodnoty... 7 Aktualizace
Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu
Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu K čemu slouží statistika Popisuje velké soubory dat pomocí charakteristických čísel (popisná statistika). Hledá skryté zákonitosti v souborech
LINEÁRNÍ REGRESE Komentované řešení pomocí programu Statistica
LINEÁRNÍ REGRESE Komentované řešení pomocí programu Statistica Vstupní data Data umístěná v excelovském souboru překopírujeme do tabulky ve Statistice a pojmenujeme proměnné, viz prezentace k tématu Popisná
Analýza dat na PC I.
CENTRUM BIOSTATISTIKY A ANALÝZ Lékařská a Přírodovědecká fakulta, Masarykova univerzita Analýza dat na PC I. Popisná analýza v programu Statistica IBA výuka Základní popisná statistika Popisná statistika
IBM SPSS Exact Tests. Přesné analýzy malých datových souborů. Nejdůležitější. IBM SPSS Statistics
IBM Software IBM SPSS Exact Tests Přesné analýzy malých datových souborů Při rozhodování o existenci vztahu mezi proměnnými v kontingenčních tabulkách a při používání neparametrických ů analytici zpravidla
Pracovní adresář. Nápověda. Instalování a načtení nového balíčku. Importování datového souboru. Práce s datovým souborem
Pracovní adresář getwd() # výpis pracovního adresáře setwd("c:/moje/pracovni") # nastavení pracovního adresáře setwd("c:\\moje\\pracovni") # nastavení pracovního adresáře Nápověda?funkce # nápověda pro
Cvičení 12: Binární logistická regrese
Cvičení 12: Binární logistická regrese Příklad: V roce 2014 konalo státní závěrečné zkoušky bakalářského studia na jisté fakultě 167 studentů. U každého studenta bylo zaznamenáno jeho pohlaví (0 žena,
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická
Obsah Úvod Kapitola 1 Než začneme Kapitola 2 Práce s hromadnými daty před analýzou
Úvod.................................................................. 11 Kapitola 1 Než začneme.................................................................. 17 1.1 Logika kvantitativního výzkumu...........................................
TESTOVÁNÍ KVALITATIVNÍCH ZNAKŮ V PROGRAMU
TESTOVÁNÍ KVALITATIVNÍCH ZNAKŮ V PROGRAMU Copyright StatSoft CR s.r.o. 2014 Dell Information Management Group, Dell Software Ringhofferova 115/1 155 21 Praha 5 Zličín tel.: +420 233 325 006 fax: +420 233
STATISTICA Téma 7. Testy na základě více než 2 výběrů
STATISTICA Téma 7. Testy na základě více než 2 výběrů 1) Test na homoskedasticitu Nalezneme jej v několika submenu. Omezme se na submenu Základní statistiky a tabulky základního menu Statistika. V něm
Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1
Logistická regrese Menu: QCExpert Regrese Logistická Modul Logistická regrese umožňuje analýzu dat, kdy odezva je binární, nebo frekvenční veličina vyjádřená hodnotami 0 nebo 1, případně poměry v intervalu
RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.
Analýza dat pro Neurovědy RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Jaro 2014 Institut biostatistiky Janoušová, a analýz Dušek: Analýza dat pro neurovědy Blok 8 Jak analyzovat přežití pacientů.
Úvodem Dříve les než stromy 3 Operace s maticemi
Obsah 1 Úvodem 13 2 Dříve les než stromy 17 2.1 Nejednoznačnost terminologie 17 2.2 Volba metody analýzy dat 23 2.3 Přehled vybraných vícerozměrných metod 25 2.3.1 Metoda hlavních komponent 26 2.3.2 Faktorová
Úvod do programu STATISTICA. Mgr. Pavel Zahradníček
Úvod do programu STATISTICA Mgr. Pavel Zahradníček 1 Dostupnost, instalace a spuštění programu 1.1 Dostupnost MU vlastní multilicenci, každý student může pořídit vlastní instalaci (za symbolický manipulační
Zpracování chybějících dat a dat mimo rozsah
StatSoft Zpracování chybějících dat a dat mimo rozsah V tomto článku si představíme jeden z možných postupů, jak se rychle a snadno vypořádat s detekcí chybějících dat a dat mimo stanovený rozsah. Načtení
Tomáš Karel LS 2012/2013
Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není
Lineární regrese. Komentované řešení pomocí MS Excel
Lineární regrese Komentované řešení pomocí MS Excel Vstupní data Tabulka se vstupními daty je umístěna v oblasti A1:B11 (viz. obrázek) na listu cela data Postup Základní výpočty - regrese Výpočet základních
KGG/STG Statistika pro geografy
KGG/STG Statistika pro geografy 9. Korelační analýza Mgr. David Fiedor 20. dubna 2015 Analýza závislostí v řadě geografických disciplín studujeme jevy, u kterých vyšetřujeme nikoliv pouze jednu vlastnost
Statistické testování hypotéz II
PSY117/454 Statistická analýza dat v psychologii Přednáška 9 Statistické testování hypotéz II Přehled testů, rozdíly průměrů, velikost účinku, síla testu Základní výzkumné otázky/hypotézy 1. Stanovení
5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza
5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza 5.1 Vícerozměrná data a vícerozměrná rozdělení Při zpracování vícerozměrných dat se hledají souvislosti mezi dvěma, případně
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 010 1.týden (0.09.-4.09. ) Data, typy dat, variabilita, frekvenční analýza
ANALÝZA DAT V R 7. KONTINGENČNÍ TABULKA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.
ANALÝZA DAT V R 7. KONTINGENČNÍ TABULKA Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK www.biostatisticka.cz PŘEHLED TESTŮ rozdělení normální spojité alternativní / diskrétní
Mann-Whitney U-test. Znaménkový test. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek
10. Neparametrické y Mann-Whitney U- Wilcoxonův Znaménkový Shrnutí statistických ů Typ srovnání Nulová hypotéza Parametrický Neparametrický 1 skupina dat vs. etalon Střední hodnota je rovna hodnotě etalonu.
STATISTICA Téma 6. Testy na základě jednoho a dvou výběrů
STATISTICA Téma 6. Testy na základě jednoho a dvou výběrů 1) Test na velikost rozptylu Test na velikost rozptylu STATISTICA nemá. 2) Test na velikost střední hodnoty V menu Statistika zvolíme nabídku Základní
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 2010 1.týden (20.09.-24.09. ) Data, typy dat, variabilita, frekvenční analýza
1. Číselné posloupnosti - Definice posloupnosti, základní vlastnosti, operace s posloupnostmi, limita posloupnosti, vlastnosti limit posloupností,
KMA/SZZS1 Matematika 1. Číselné posloupnosti - Definice posloupnosti, základní vlastnosti, operace s posloupnostmi, limita posloupnosti, vlastnosti limit posloupností, operace s limitami. 2. Limita funkce
INDUKTIVNÍ STATISTIKA
10. SEMINÁŘ INDUKTIVNÍ STATISTIKA 3. HODNOCENÍ ZÁVISLOSTÍ HODNOCENÍ ZÁVISLOSTÍ KVALITATIVNÍ VELIČINY - Vychází se z kombinační (kontingenční) tabulky, která je výsledkem třídění druhého stupně KVANTITATIVNÍ
Statgraphics v. 5.0 STATISTICKÁ INDUKCE PRO JEDNOROZMĚRNÁ DATA. Martina Litschmannová 1. Typ proměnné. Požadovaný typ analýzy
Dichotomická proměnná (0-1) Spojitá proměnná STATISTICKÁ INDUKCE PRO JEDNOROZMĚRNÁ DATA Typ proměnné Požadovaný typ analýzy Ověření variability Předpoklady Testy, resp. intervalové odhad Test o rozptylu
Excel tabulkový procesor
Pozice aktivní buňky Excel tabulkový procesor Označená aktivní buňka Řádek vzorců zobrazuje úplný a skutečný obsah buňky Typ buňky řetězec, číslo, vzorec, datum Oprava obsahu buňky F2 nebo v řádku vzorců,
STATISTICA Téma 1. Práce s datovým souborem
STATISTICA Téma 1. Práce s datovým souborem 1) Otevření datového souboru Program Statistika.cz otevíráme z ikony Start, nabídka Programy, podnabídka Statistika Cz 6. Ze dvou nabídnutých možností vybereme
Přednáška XI. Asociace ve čtyřpolní tabulce a základy korelační analýzy
Přednáška XI. Asociace ve čtyřpolní tabulce a základy korelační analýzy Relativní riziko a poměr šancí Princip korelace dvou náhodných veličin Korelační koeficienty Pearsonůva Spearmanův Korelace a kauzalita
Pořízení licencí statistického SW
Pořízení licencí statistického SW Zadavatel: Česká školní inspekce, Fráni Šrámka 37, 150 21 Praha 5 IČO: 00638994 Jednající: Mgr. Tomáš Zatloukal Předpokládaná (a maximální cena): 1.200.000 vč. DPH Typ
KAPITOLA 11 - POKROČILÁ PRÁCE S TABULKOVÝM PROCESOREM
KAPITOLA 11 - POKROČILÁ PRÁCE S TABULKOVÝM PROCESOREM FILTROVÁNÍ DAT Po filtrování dat jsou zobrazeny pouze řádky, které splňují zadaná kritéria, a řádky, které nechcete zobrazit, jsou skryty. Filtrovat
31. 3. 2014, Brno Hanuš Vavrčík Základy statistiky ve vědě
31. 3. 2014, Brno Hanuš Vavrčík Základy statistiky ve vědě Motto Statistika nuda je, má však cenné údaje. strana 3 Statistické charakteristiky Charakteristiky polohy jsou kolem ní seskupeny ostatní hodnoty
PARAMETRICKÉ TESTY. 1) Měření Etalonu. Dataset - mereni_etalonu.sta - 9 měření etalonu srovnáváme s PŘEDPOKLÁDANOU HODNOTOU 10.
PARAMETRICKÉ TESTY Testujeme rovnost průměru - předpokladem normální rozdělení I) Jednovýběrový t-test 1) Měření Etalonu. Dataset - mereni_etalonu.sta - 9 měření etalonu srovnáváme s PŘEDPOKLÁDANOU HODNOTOU
SEMESTRÁLNÍ PRÁCE. Leptání plasmou. Ing. Pavel Bouchalík
SEMESTRÁLNÍ PRÁCE Leptání plasmou Ing. Pavel Bouchalík 1. ÚVOD Tato semestrální práce obsahuje písemné vypracování řešení příkladu Leptání plasmou. Jde o praktickou zkoušku znalostí získaných při přednáškách
a) Základní informace o souboru Statistika: Základní statistika a tabulky: Popisné statistiky: Detaily
Testování hypotéz Testování hypotéz jsou klasické statistické úsudky založené na nějakém apriorním předpokladu. Vyslovíme-li předpoklad o hodnotě neznámého parametru nebo o zákonu rozdělení sledované náhodné
Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek, M. Cvanová. 5. Statistica
Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek, M. Cvanová 5. Statistica StatSoft, Inc., http://www.statsoft.com, http://www.statsoft.cz. Verze pro Mac i PC, dostupná
RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.
Analýza dat pro Neurovědy RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Jaro 014 Institut biostatistiky Janoušová, a analýz Dušek: Analýza dat pro neurovědy Blok 5 Jak analyzovat kategoriální a binární
VYBRANÉ DVOUVÝBĚROVÉ TESTY. Martina Litschmannová
VYBRANÉ DVOUVÝBĚROVÉ TESTY Martina Litschmannová Obsah přednášky Vybrané dvouvýběrové testy par. hypotéz test o shodě rozptylů (F-test), testy o shodě středních hodnot (t-test, Aspinové-Welchův test),
Popisná statistika kvantitativní veličiny
StatSoft Popisná statistika kvantitativní veličiny Protože nám surová data obvykle žádnou smysluplnou informaci neposkytnou, je žádoucí vyjádřit tyto ve zhuštěnější formě. V předchozím dílu jsme začali
Zápočtová práce STATISTIKA I
Zápočtová práce STATISTIKA I Obsah: - úvodní stránka - charakteristika dat (původ dat, důvod zpracování,...) - výpis naměřených hodnot (v tabulce) - zpracování dat (buď bodové nebo intervalové, podle charakteru
Soutěž: Nejméně kliknutí
Soutěž: Nejméně kliknutí Newsletter Statistica ACADEMY Téma: Možnosti softwaru Typ článku: Soutěž Dnes si připomeneme jedno z našich nejoblíbenějších zadaní a to, na co nejméně kliků se Vám povede provést
Příprava dat a) Kontrola dat
Příprava dat a) Kontrola dat 2 Sběr data? Příprava dat Předpoklady o datech Software obsahuje nástroje pro: Detekci chybějících dat a dat mimo stanovených rozsah Detekci odlehlých a extrémních hodnot Překodování
Cvičení 9: Neparametrické úlohy o mediánech
Cvičení 9: Neparametrické úlohy o mediánech Úkol 1.: Párový znaménkový test a párový Wilcoxonův test Při zjišťování kvality jedné složky půdy se používají dvě metody označené A a B. Výsledky: Vzorek 1
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 2010 1.týden (20.09.-24.09. ) Data, typy dat, variabilita, frekvenční analýza
StatSoft Jak poznat vliv faktorů vizuálně
StatSoft Jak poznat vliv faktorů vizuálně V tomto článku bychom se rádi věnovali otázce, jak poznat již z grafického náhledu vztahy a závislosti v analýze rozptylu. Pomocí následujících grafických zobrazení
Návod na vypracování semestrálního projektu
Návod na vypracování semestrálního projektu Následující dokument má charakter doporučení. Není závazný, je pouze návodem pro studenty, kteří si nejsou jisti výběrem dat, volbou metod a formou zpracování
RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.
Analýza dat pro Neurovědy RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Jaro 2014 Institut biostatistiky Janoušová, a analýz Dušek: Analýza dat pro neurovědy Blok 6 Jak analyzovat kategoriální a binární
Tomáš Karel LS 2012/2013
Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není
Vysoká škola báňská technická univerzita Ostrava. Fakulta elektrotechniky a informatiky
Vysoká škola báňská technická univerzita Ostrava Fakulta elektrotechniky a informatiky Bankovní účty (semestrální projekt statistika) Tomáš Hejret (hej124) 18.5.2013 Úvod Cílem tohoto projektu, zadaného
Analýza rozptylu dvojného třídění
StatSoft Analýza rozptylu dvojného třídění V tomto příspěvku si ukážeme konkrétní práci v softwaru STATISTICA a to sice při detekci vlivu jednotlivých faktorů na chování laboratorních krys v bludišti.
Ovládání Open Office.org Calc Ukládání dokumentu : Levým tlačítkem myši kliknete v menu na Soubor a pak na Uložit jako.
Ukládání dokumentu : Levým tlačítkem myši kliknete v menu na Soubor a pak na Uložit jako. Otevře se tabulka, v které si najdete místo adresář, pomocí malé šedočerné šipky (jako na obrázku), do kterého
PSY117/454 Statistická analýza dat v psychologii seminář 9. Statistické testování hypotéz
PSY117/454 Statistická analýza dat v psychologii seminář 9 Statistické testování hypotéz Základní výzkumné otázky/hypotézy 1. Stanovení hodnoty parametru =stanovení intervalu spolehlivosti na μ, σ, ρ,
ANALÝZA DAT V R 3. POPISNÉ STATISTIKY, NÁHODNÁ VELIČINA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK
ANALÝZA DAT V R 3. POPISNÉ STATISTIKY, NÁHODNÁ VELIČINA Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK www.biostatisticka.cz POPISNÉ STATISTIKY - OPAKOVÁNÍ jedna kvalitativní
Ilustrační příklad odhadu LRM v SW Gretl
Ilustrační příklad odhadu LRM v SW Gretl Podkladové údaje Korelační matice Odhad lineárního regresního modelu (LRM) Verifikace modelu PEF ČZU Praha Určeno pro posluchače předmětu Ekonometrie Needitovaná
Kontingenční tabulky v MS Excel 2010
Kontingenční tabulky v MS Excel 2010 Autor: RNDr. Milan Myšák e-mail: milan.mysak@konero.cz Obsah 1 Vytvoření KT... 3 1.1 Data pro KT... 3 1.2 Tvorba KT... 3 2 Tvorba KT z dalších zdrojů dat... 5 2.1 Data
Plánování experimentu
Fakulta chemicko technologická Katedra analytické chemie licenční studium Management systému jakosti Autor: Ing. Radek Růčka Přednášející: Prof. Ing. Jiří Militký, CSc. 1. LEPTÁNÍ PLAZMOU 1.1 Zadání Proces
Obsah. Několik slov o Excelu 2007 a 2010 9. Operace při otvírání a ukládání sešitu 15. Operace s okny 27. Kapitola 1
Obsah Kapitola 1 Několik slov o Excelu 2007 a 2010 9 Nové uživatelské rozhraní 9 Pás karet 10 Panel nástrojů Rychlý přístup 11 Tlačítko Office 11 Pracovní plocha 12 Nápověda 13 Kapitola 2 Operace při otvírání
ANALÝZA DAT V R 5. ZÁKLADNÍ STATISTICKÉ TESTY. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.
ANALÝZA DAT V R 5. ZÁKLADNÍ STATISTICKÉ TESTY Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK www.biostatisticka.cz PRINCIPY STATISTICKÉ INFERENCE identifikace závisle proměnné
Porovnání dvou výběrů
Porovnání dvou výběrů Menu: QCExpert Porovnání dvou výběrů Tento modul je určen pro podrobnou analýzu dvou datových souborů (výběrů). Modul poskytuje dva postupy analýzy: porovnání dvou nezávislých výběrů
Kategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1
Kategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA 2018 4. dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1 Typy proměnných nominální (nominal) o dvou hodnotách lze říci pouze
5 Tabulky a seznamy dat Příklad 3 Excel 2010
TÉMA: Jednoduchá a rozšířená filtrace dat Ne vždy potřebujeme při běžné práci s tabulkami pracovat se všemi záznamy. Sekretářka společnosti Naše zahrada zpracovává seznamy prodejců, zaměstnanců a zboží
Úkol 1.: Testování nezávislosti nominálních veličin V roce 1950 zkoumali Yule a Kendall barvu očí a vlasů u 6800 mužů.
Téma 10: Analýza závislosti dvou nominálních veličin Úkol 1.: Testování nezávislosti nominálních veličin V roce 1950 zkoumali Yule a Kendall barvu očí a vlasů u 6800 mužů. barva očí barva vlasů světlá
Pracovní sešit MS Word pokročilý
Veškerá reprodukce v částečné i úplné formě je bez autorského souhlasu protizákonná. Strana 0 MS Excel pokročilý 2013 Přehled novinek Rychlý přehled Šablony, statistické funkce a další nové nástroje Spolupráce
Gymnázium Vysoké Mýto nám. Vaňorného 163, 566 01 Vysoké Mýto
Gymnázium Vysoké Mýto nám. Vaňorného 163, 566 01 Vysoké Mýto Registrační číslo projektu Šablona Autor Název materiálu / Druh CZ.1.07/1.5.00/34.0951 III/2 INOVACE A ZKVALITNĚNÍ VÝUKY PROSTŘEDNICTVÍM ICT
Návod pro práci s aplikací
Návod pro práci s aplikací NASTAVENÍ FAKTURACÍ...1 NASTAVENÍ FAKTURAČNÍCH ÚDA JŮ...1 Texty - doklady...1 Fakturační řady Ostatní volby...1 Logo Razítko dokladu...2 NASTAVENÍ DALŠÍCH ÚDA JŮ (SEZNAMŮ HODNOT)...2
Statistika, Biostatistika pro kombinované studium. Jan Kracík
Statistika, Biostatistika pro kombinované studium Letní semestr 2014/2015 Tutoriál č. 6: ANOVA Jan Kracík jan.kracik@vsb.cz Obsah: Testování hypotéz opakování ANOVA Testování hypotéz (opakování) Testování
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 2010 1.týden (20.09.-24.09. ) Data, typy dat, variabilita, frekvenční analýza
Analýza a prezentace dat. Název Data analysis and presentation Způsob ukončení * přednášek týdně 2 hod.
Identifikační karta modulu Kód modulu modulu povinný Jazyk výuky čeština v jazyce výuky Analýza a prezentace dat česky Analýza a prezentace dat anglicky Data analysis and presentation Způsob ukončení *
Vzorce. StatSoft. Vzorce. Kde všude se dá zadat vzorec
StatSoft Vzorce Jistě se Vám již stalo, že data, která máte přímo k dispozici, sama o sobě nestačí potřebujete je nějak upravit, vypočítat z nich nějaké další proměnné, provést nějaké transformace, Jinak
PSY117/454 Statistická analýza dat v psychologii Přednáška 10
PSY117/454 Statistická analýza dat v psychologii Přednáška 10 TESTY PRO NOMINÁLNÍ A ORDINÁLNÍ PROMĚNNÉ NEPARAMETRICKÉ METODY... a to mělo, jak sám vidíte, nedozírné následky. Smrť Analýza četností hodnot
Jednostranné intervaly spolehlivosti
Jednostranné intervaly spolehlivosti hledáme jen jednu z obou mezí Princip: dle zadání úlohy hledáme jen dolní či jen horní mez podle oboustranného vzorce s tou změnou, že výraz 1-α/2 ve vzorci nahradíme
Analýza dat s využitím MS Excel
Analýza dat s využitím MS Excel Seminář aplikované statistiky Martina Litschmannová Několik fíglů na úvod Absolutní vs. relativní adresování změna pomocí F4 =$H$20 =H$20 =$H20 =H20 Posun po souvislé oblasti
Cvičení ze statistiky - 3. Filip Děchtěrenko
Cvičení ze statistiky - 3 Filip Děchtěrenko Minule bylo.. Dokončili jsme základní statistiky, typy proměnných a začali analýzu kvalitativních dat Tyhle termíny by měly být známé: Histogram, krabicový graf
Jeden z mírně náročnějších příkladů, zaměřený na úpravu formátu buňky a především na detailnější práci s grafem (a jeho modifikacemi).
Příklad zahrnuje Textová editace buněk Základní vzorce Vložené kliparty Propojené listy Grafi cká úprava buněk Složitější vzorce Vložené externí obrázky Formuláře Úprava formátu Vysoce speciální funkce
Excel - pokračování. Př. Porovnání cestovních kanceláří ohraničení tabulky, úprava šířky sloupců, sestrojení grafu
Excel - pokračování Př. Porovnání cestovních kanceláří ohraničení tabulky, úprava šířky sloupců, sestrojení grafu Př. Analýza prodeje CD základní jednoduché vzorce karta Domů Př. Skoky do dálky - funkce
Tvar dat a nástroj přeskupování
StatSoft Tvar dat a nástroj přeskupování Chtěli jste někdy použít data v jistém tvaru a STATISTICA Vám to nedovolila? Jistě se najde někdo, kdo se v této situaci již ocitl. Není ale potřeba propadat panice,
KGG/STG Statistika pro geografy
KGG/STG Statistika pro geografy 8. Analýza rozptylu Mgr. David Fiedor 13. dubna 2015 Motivace dosud - maximálně dva výběry (jednovýběrové a dvouvýběrové testy) Příklad Na dané hladině významnosti α = 0,05
Testování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času
Testování hypotéz 1 Jednovýběrové testy 90/ odhad času V podmínkách naprostého odloučení má voák prokázat schopnost orientace v čase. Úkolem voáka e provést odhad časového intervalu 1 hodiny bez hodinek
STATISTICKÉ PROGRAMY
Slezská univerzita v Opavě Obchodně podnikatelská fakulta v Karviné STATISTICKÉ PROGRAMY VYUŽITÍ EXCELU A SPSS PRO VĚDECKO-VÝZKUMNOU ČINNOST Elena Mielcová, Radmila Stoklasová a Jaroslav Ramík Karviná
VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky SMAD
VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky JMÉNO STUDENTKY/STUDENTA: OSOBNÍ ČÍSLO: JMÉNO CVIČÍCÍ/CVIČÍCÍHO: SMAD Cvičení Ostrava, AR 2016/2017 Popis datového souboru Pro dlouhodobý
Téma 9: Vícenásobná regrese
Téma 9: Vícenásobná regrese 1) Vytvoření modelu V menu Statistika zvolíme nabídku Vícerozměrná regrese. Aktivujeme kartu Detailní nastavení viz obr.1. Nastavíme Proměnné tak, že v příslušném okně viz.
Simulace. Simulace dat. Parametry
Simulace Simulace dat Menu: QCExpert Simulace Simulace dat Tento modul je určen pro generování pseudonáhodných dat s danými statistickými vlastnostmi. Nabízí čtyři typy rozdělení: normální, logaritmicko-normální,