Biostatistika základní kurz

Rozměr: px
Začít zobrazení ze stránky:

Download "Biostatistika základní kurz"

Transkript

1 Lékařská a Přírodovědecká fakulta, Masarykova univerzita Biostatistika základní kurz

2 BioStatistika na Přf a LF MU

3 Centrum biostatistiky a analýz Pracoviště specializované na analýzu biologických dat Výuka analýzy biologických dat řada kurzů Kontakt: Ladislav Dušek dusek@cbamunicz Jiří Jarkovský jarkovsky@cbamunicz

4 Kurz biostatistiky Sada přednášek pokrývajících základní oblasti analýzy biologických dat, zejména z praktického hlediska: Způsoby ukládání dat, typy dat a jejich statistický popis Hypotézy o datech a jejich testování Vztahy proměnných a jejich statistické hodnocení Predikce a příčinné vztahy proměnných Grafické zobrazení dat a výsledků analýz Příklady aplikace na reálných datech Přehled základních statistických SW Složitější metody statistické analýzy přehled metod Cyklus přednášek ukončen zkouškou Písemná zkouška příklady Zaměřeno na postup řešení, číselný výsledek méně významný

5 1 Data a informace

6 BIOSTATISTIKA - BIOMETRIKA Věda zabývající se hodnocením biologických dat = záznamů o biologických systémech a jejich chování Malá data Velká data Obrovská data Umění prodat Umění pochopit Umění uchopit

7 Opakování DATA ukázka uspořádání datového souboru Parametry (znaky) p Pacient Clovek aleu aty% ase% aneu% aly% aty ase aneu aly ahtc aclsk aclneus acloz cell1 6 / % % % % cell1 6 / cell1 6 / cell1 6 / cell1 6 / % mvs1 3 mvs1 3 mvs , ,6 4,4 5, 1, ,1 2,1 2,2 1, , ,3 3,6 3,9 2, , ,2 5,9 6,1, , ,9 3,3 4,1 1, ,4 6, 7,4, , ,3 6,9 7,2 2, ,6 4, 4,6 1, , ,1 1,8 2, 1, , ,4 2,3 2,7 1, , ,1 4,9 5, 1, , ,1 3,9 3,9 2, , ,6 5,7 6,3 2, , ,7 5,3 6, 3, , ,2 1,2 1,5, , ,3 7,7 8,, ,1 4, 4,1, , , 6,3 7,3 1, , , ,2 6,1 6,3 2, , , ,7 8,3 9,, , , ,1 7,2 7,3 2, , , ,1 5,6 5,8 1, , , ,1 5,9 6, 2, , , ,1 8,8 8,9, , , ,1 3,7 3,8 1, , , ,1 6,1 6,2 5, , , ,2 3,8 4, 2, , , ,9 5,4 9,3, , , ,6 6,4 9, 1, , , ,2 13,9 14,1 2, , , ,8 7,2 8,, , 52 aclneuo mvs ,9 12,2 9 16,9 1,9 9,6 12,6 8,5 8,4 15,5 11,4 7 8,4 6,5

8 p BIOSTATISTIKA - BIOMETRIKA Pacient Clovek aleu aty% ase% aneu% aly% aty ase aneu aly ahtc aclsk aclneus acloz aclneuo cell1 6 / % % % % cell1 6 / cell1 6 / cell1 6 / cell1 6 / % mvs1 3 mvs1 3 mvs1 3 mvs , ,6 4,4 5, 1, ,1 2,1 2,2 1, , ,3 3,6 3,9 2, , ,2 5,9 6,1, , ,9 3,3 4,1 1, ,4 6, 7,4, , ,3 6,9 7,2 2, ,6 4, 4,6 1, , ,1 1,8 2, 1, , ,4 2,3 2,7 1, , ,1 4,9 5, 1, , ,1 3,9 3,9 2, , ,6 5,7 6,3 2, , ,7 5,3 6, 3, , Data 34,2 1,2 1,5, , ,3 7,7 8,, ,1 4, 4,1, , , 6,3 7,3 1, , , , ,2 6,1 6,3 2, , , , ,7 8,3 9,, , , ,1 7,2 7,3 2, , , , ,1 5,6 5,8 1, ,8 63 1, , ,1 5,9 6, 2, ,9 57 9, , ,1 8,8 8,9, , , , ,1 3,7 3,8 1, ,1 32 8, , ,1 6,1 6,2 5, ,4 52 8, , ,2 3,8 4, 2, , , , ,9 5,4 9,3, , , , ,6 6,4 9, 1, , , ,2 13,9 14,1 2, , , , ,8 7,2 8,, , 52 6, Schopnost: vidět data komunikovat interpretovat - prodávat

9 BIOSTATISTIKA - BIOMETRIKA Věda zabývající se variabilitou Variabilita opakovaných měřm ěření Variabilita znaku v populaci chyba Data 2,1 2,8 3,2 1,2 5,2 2,9 165 cm 14 cm 182 cm 163 cm rozptyl znaku, přirozená variabilita Variabilita modelovaných dat Variabilita časových řad Variabilita ve skladbě biologických ch společenstev enstev y y DRUH 1 DRUH 2 DRUH 3 DRUH chyba = nepřesnost modelu x čas fluktuace, časová proměnlivost biodiverzita

10 Pojem VARIABILITA má mnoho významů a ty určují přístup k jejímu hodnocení Maskování a minimalizace vlivu Respektování a odhadování vlivu Přímé využití k predikcím chování systému

11 Variabilita = základ biologického principu neurčitosti existuje pravděpodobnost výskytu jevů (nedeterministické závěry) vše je možné : pouze jev s pravděpodobností nikdy nenastane pravděpodobnost lze zkoumat retrospektivně i prospektivně pravděpodobnost výskytu ϕ(x) plocha = pravděpodobnost výskytu x počet chlapců v rodině s X dětmi výška postavy x

12 BIOSTATISTIKA - BIOMETRIKA Věda přinášející novou kvalitu Popisná analýza dat ( exploratorní analýzy) Data mining ( investigativní analýzy) Srovnávací analýzy, testy hypotéz Experimentální plány ( experimental design ) QA/QC Stochastické modelování, hodnocení prognóz Vícerozměrné analýzy, pattern recognition Analýza biodiverzity (species community associations, ) Analýza časových řad, analýzy trendů Analýza biomedicínských dat

13 Experimentální design: nezbytná výbava biologa Účel analýzy: Popisný cílová populace? Reprezentativnost Spolehlivost výběr dle optimálního plánu VÝSLEDKY reprezentativní vzorek n jedinců (faktor F) měření znaku variabilita hodnot ve výběrovém souboru ZÁVĚRY (reprezentativnost, spolehlivost)? Přesnost analyzovaný znak cílové populace (X) jiný významný faktor charakterizující cílovou populaci (F)

14 Experimentální design: nezbytná výbava biologa Účel analýzy: Srovnávací (2 ramena) cílová populace výběr subjektů pro vstup do hodnocení / studie RANDOMIZACE vzájemně srovnatelné vzorky (faktor F) rameno A variabilita hodnot X v rameni A měření znaku X VÝSLEDKY rameno B variabilita hodnot X v rameni B ZÁVĚRY (rozlišovací schopnost, rozdíl ramen A x B, srovnatelnost ramen, reprezentativnost)? analyzovaný znak cílové populace (X) jiný významný faktor charakterizující cílovou populaci (F)? Srovnatelnost Spolehlivost Přesnost

15 Stochastické modelování: predikce neurčitých jevů Prospektivně modelově - postihuje chování jevů při respektování variability

16 Stochastické modelování: predikce neurčitých jevů 1, 1, Age = 55 years Osa Y Predikovaná pravděpodobnost podobnost,8,6,4,2,8,6,4,2 P =8 P =4, -4, -2,, 2, 4,, Osa X Parametr nebo kombinace parametrů Data konkrétn tních pacientů (subjektů) k přímému p mu hodnocení

17 Pravděpodobnostní prediktivní modely Maligní lymfomy: Pravděpodobnost časného relapsu Stádium I - II Stádium III - IV Estimated probability of early relapse M/(A+5) =1 P = Ratio M / (A + 5) Regression 95% confid M/(A+5) =15 Index Mitosis / (Apoptosis + 5) P =5 Grade = 2 Grade = 1 Regression 95% confid Schopnost: vytvářet prakticky využitelné nástroje

18 Vícerozměrné vnímání skutečnosti nová kvalita analýzy dat x1 x2 x1 skupina 1 skupina 2 Vícerozměrný rný systém x2 n x1 x2 Klasická jednorozměrn rná analýza skup 1 skup 2 skup 1 skup 2

19 Biologové analýzou dat proti variabilitě nebojují! VARIABILITA? CHYBA INFORMACE

20 Běžná sumarizace dat likviduje individualitu jedince? Průměr ± SE BĚŽNÁ STATISTICKÁ SUMARIZACE Zpřehlednění dat Neodliší původní měření

21 Vícerozměrné hodnocení s ohledem na individualitu! X 2 X 3 X p X 3 X p W X 3 X p X 1 X 2 X 2 X 1 X 1

22 Vícerozměrné hodnocení nová kvalita Pouze kombinované parametry mají odpovídaj dající informační sílu X 2 B B B B B B B B B A B B B B A B B B A A A A B B B B A A A B A A B A A A A A A A A A X 1 příklad: X1 =

23 Vícerozměrné hodnocení vychází z jednoduchých principů X 2 příklad: vícerozmv cerozměrná vzdálenost měřm ěření mezi dvěma objekty (body) X 22 2 c = a 2 + b 2 2 b = x 22 -x 21 = d 2 X 21 1 a = x 12 -x 11 = d 1 X 1 X 11 X 12

24 Vícerozměrné modelování je strategickou disciplínou X 1 X n technické parametry automobilu X n+1 X p řidičovy schopnosti a jeho stav X p+1 X 2 rychlost, povrch, situace X 1 X 2 X 3 X 4 X 5 X p

25 2 Data a jejich prezentace základ statistické analýzy

26 Zásady pro ukládání dat Správné a přehledné uložení dat je základem jejich pozdější analýzy Je vhodné rozmyslet si předem jak budou data ukládána Pro počítačové zpracování dat je nezbytné ukládat data v tabulární formě Nejvhodnějším způsobem je uložení dat ve formě databázové tabulky Každý sloupec obsahuje pouze jediný typ dat, identifikovaný hlavičkou sloupce (např rozepsané taxonomické zařazení, abundance, místo a vlastnosti odběru atd) Taxon Abundance Lokalita etc Takto uspořádaná data je v tabulkových nebo databázových programech možné převést na libovolnou výstupní tabulku

27 Grafická prezentace dat - umění komunikace 1 Výskyt kategorií (1, 2, 3,) Koláčový (výsečový) graf Absolutní počty Sloupcový graf Řada2 2 Vývoj hodnot (v čase) Y vs X (t) % Sloupcový graf Řada2 4% 3% 1 2 3% % 3% 3% Spojnicový graf Řada Bodový graf Řada Plošný graf Řada2 3 Y Y Y X X X

28 Grafická prezentace dat umění komunikace 3 Vztahy mezi proměnnými - korelace Bodový - korelační diagram Bodový - korelační diagram X1 3 Řada2 X1 3 Řada2 AGE LN_CRP X X2 CD56 X1 3 Řada2 X1 3 Řada2 CD CD X X2

29 Grafická prezentace dat umění komunikace 4 Kvantitativní hodnoty parametru(ů) - X - v rámci kategorií A, B, C Krabicový graf Sloupcový graf X 4 Řada2 X 1 Řada2 X 1 Řada A B C A B C A B C 5 Histogram

30 Grafická prezentace dat - umění komunikace 6 Zviditelnění primárních dat x 1 x 2 x 3 n

31 Grafická prezentace dat umění komunikace 7 Vztahy mezi proměnnými - interakce dvou parametrů, reakční plochy

32 Grafická prezentace dat umění komunikace 8 Grafické zviditelnění má nekonečně mnoho možností BUNKY2 BUNKY1 ENZYM2-1 BUNKY2 BUNKY1 ENZYM ENZYM1 Case 1 Case 2 Case 3 Case 4 Case 5 Case 6 Case 7 Case 8 Case 9 Case 1 Case 11 Case 12 Case 13 Case 14 Case 15 Case 16 Case 17 Case 18 Case 19 Case 2 Case 21 Case 22 Case 23 Case 24 Case 25 Case 26 Case 27 Case 28 Case 29 Case 3 Case 1 Case 2 Case 3 Case 4 Case 5 Case 6 Case 7 Case 8 Case 9 Case 1 Case 11 Case 12 Case 13 Case 14 Case 15 Case 16 Case 17 Case 18 Case 19 Case 2 Case 21 Case 22 Case 23 Case 24 Case 25 Case 26 Case 27 Case 28 Case 29 Case 3 ENZYM Case 1 Case 11 Case 12 Case 13 Case 14 Case 15 Case 16 Case 17 Case 18 Case 19 Case 2 Case 21 Case 9 Case 8Case Case Case 22 Case 23Case 24 Case 25 Case Case 4 7 Case 26 Case 3 8 Case 27 Case 2 9 Case 28 Case 1 Case 3 Case 29 BUNKY2 BUNKY1 ENZYM2 Case 1 Case 11 Case 12 Case 13 Case 14 Case 15 Case 16 Case 17 Case 18 Case 19 Case 2 Case 21 Case 9 Case 8Case 7 Case 6 Case 5 Case 4 Case 3 Case Case 22 Case 23Case 24 Case 25 Case 26 Case 27 Case 28 Case 1 Case 3 Case 29 BUNKY2 BUNKY1 ENZYM2 BUNKY2 BUNKY1 ENZYM Stacked Plot (DISKRIMSTA 7v*3c) Case 1 Case 2 Case 3 Case 4 Case 5 Case 6 Case 7 Case 8 Case 9 Case 1 Case 11 Case 12 Case 13 Case 14 Case 15 Case 16 Case 17 Case 18 Case 19 Case 2 Case 21 Case 22 Case 23 Case 24 Case 25 Case 26 Case 27 Case 28 Case 29 Case 3

33 Nesprávné užití grafů - problém rozsahu číselné osy

34 Nesprávné užitígrafů - grafické zastírání trendu

35 Nesprávné užitígrafů - problém standardizace hodnot

36 Grafy zaměřené na vícerozměrné soubory dokáží zviditelnit i veliké soubory dat

37 3 JAK vznikají informace

38 Primárním důvodem analýzy dat je získání nezkreslené a přehledné INFORMACE Ukázka uspořádaného datového souboru cislo stadium vek tran1_3 tran1_4 tran1_5 tran1_6 alb_pbsct ldh_vstup sternum typ_myel IgG IgG IgG IgG B-J IgA IgG IgG IgG Primární data IgG B-J IgG IgG B-J B-J B-J IgG B-J IgA Sumarizace v jedné skupině ( one-sample ) ve dvou skupinách ( two-sample ) ve více skupinách ( multiple sample )

39 JAK vznikají informace? základní pojmy Skutečnost Náhoda (vybere jednu z možností pokusu) Jev podmnožina všech možných výsledků pokusu/děje, o které lze říct, zda nastala nebo ne Pozorovatel Rozliší, co nastalo a) podle možností b) podle toho, jak potřebuje Jevové pole třída všech jevů, které jsme se rozhodli nebo jsme schopni sledovat Skutečnost + Jevové pole = Měřitelný prostor Experimentální jednotka - objekt, na kterém se provádí šetření Populace - soubor experimentálních jednotek Znak - vlastnost sledovaná na objektu Sledovaná veličina - číselná hodnota vyjadřující výsledek náhodného experimentu Znak se stává náhodnou veličinou, pokud se jeho hodnota zjišťuje vylosováním objektu ze základního souboru Výběr - výběrová populace - cílová populace Náhodný výběr Reprezentativnost

40 JAK vznikají informace? Empirical approach Classical approach Empirický postup f n 3 n = 1 f n 3 n = 5 f n 3 n = možné jevy: čísla 1 6 n počet hodů (opakování) U složitých stochastických systémů se pravda získá až po odvedení značného množství experimentální práce: musíme dát systému šanci se projevit

41 JAK vznikají informace? Empirický postup f n 3 n = 1 f n 3 n = 5 f n 3 n = možné jevy: čísla 1 6 n počet hodů (opakování) Při realizaci náhodného experimentu roste se zvyšujícím se počtem opakování pravdivá znalost systému (výsledky se stávají stabilnější) diskutabilní je ale ovšem míra zobecnění konkrétního experimentu

42 Empirický zákon velkých čísel Při opětovné nezávislé realizaci téhož náhodného experimentu se podíl výskytů sledovaného jevu mezi všemi dosud provedenými realizacemi zpravidla ustaluje kolem konstanty Pravděpodobnost je libovolná reálná funkce definovaná na jevovém poli A, která každému jevu A přiřadí nezáporné reálné číslo P(A) z intervalu - 1 A C B Ḋ P(A) A 1 P (A) = 1 jev jistý P (A) = jev nemožný P (A B) = P (A) P (B) nezávislé jevy P (A B) = P (A) P (B/A) závislé jevy Z praktického hlediska je pravděpodobnost idealizovaná relativní četnost P (A / B) = P (A B) / P (B) podmíněná pravděpodobnost

43 4 Základní typy dat

44 Jak vznikají informace? různé typy dat znamenají různou informaci Data poměrová Kolikrát t? Data intervalová Data ordinální Data nominální O kolik? Větší,, menší? Rovná se? Spojitá data Kategoriální otázky Diskrétní data Otázky Ano/Ne Podíl hodnot větší/menší než specifikovaná hodnota? Procenta odvozené hodnoty Samotná znalost typu dat ale na dosažení informace nestačí

45 Jak vznikají informace? různé typy dat znamenají různou informaci Statistika středu Data poměrová Data intervalová PRŮMĚR Spojitá data Y = f Data ordinální MEDIÁN Data nominální MODUS Diskrétní data X

46 JAK vznikají informace? - opakovaná měření informují rozložením hodnot Y: frekvence - absolutní / relativní KOLIK se naměřilo y y A B C D E x I II III IV V x CO se naměřilo X: měřený znak Diskrétní data Spojitá data

47 Odvozená data Pozor na odvozené indexy Příklad I: Příklad II: Znak X: Hmotnost Znak Y: Plocha X: Průměrný počet výrobků v prodejně Y: Odhad prostoru průměrně nabízeného k vystavení výrobku průměr : (min - max) X: 1,2 : (1,15-1,24) + / - 3,8 % Y: 1,8 : (1,75-1,84) + / - 2,5 % X/Y =,667 : 1,15 1,84 1,24 1,75 ( - ) + / - 6,2 % Nová veličina má jinou šířku rozpětí než ty, ze kterých je odvozená

48 Jak vznikají informace? -frekvenční tabulka jako základní nástroj popisu DISKRÉTNÍ DATA Počty epizod pro n = 1 hemofiliků Primární data n = 1 Frekvenční sumarizace N: 1 dětí (hemofiliků) x: znak: počet krvácivých epizod za měsíc x n(x) p(x) N(x) F(x) 2,2 2,2 1 1,1 3,3 2 3,3 6,6 3 4,4 1 1, n(x) absolutní četnost x p(x) relativní četnost; p(x) = n(x) / n N(x) kumulativní četnost hodnot nepřevyšujících x; N(x) = Σ n(t) t x F(x) kumulativní relativní četnost hodnot nepřevyšujících x; F(x) = N(x) / n

49 Jak vznikají informace? -frekvenční sumarizace diskrétních dat Grafické výstupy z frekvenční tabulky n(x) p(x) x x N(x) F(x) x x

50 Jak vznikají informace? -frekvenční tabulka jako základní nástroj popisu SPOJITÁ DATA Příklad: x: koncentrace látky v krvi n = 1 pacientů Hodnoty pro n = 1 osob Primární data 1,21 1,48 1,56,31 1,21 1,33,33,21 1,32 1,11 n = 1 Frekvenční sumarizace n = 1 opakovaných měření (1 pacientů) x: koncentrace sledované látky v krvi (2 1 jednotek) interv d(l) n(l) n(l)/n N(x ) F(x ) <2, 4) 2 2,2 2 <4, 6) 2 1,1 3,3 <6, 8) 2 4,4 7,7 <8, 1) 2 3,3 1 1, d(l) šířka intervalu n(l) absolutní četnost n(l) / n intervalová relativní četnost N(x ) intervalová kumulativní četnost do horní hranice X F(x ) intervalová relativní kumulativní četnost do horní hranice X,2

51 Jak vznikají informace? -frekvenční sumarizace spojitých dat Histogram Výběrová distribuční funkce Plocha: n(l) / n x x f(x)= n(l) / n d(l) Intervalová hustota četnosti F(x) Intervalová relativní kumulativní četnost

52 Histogram = standardní nástroj zviditelnění spojitých dat Data X: 14,1; 8,4; 12,1; 18,2; 2,4; n Setřídění dat podle velikosti Kategorizace hodnot X - vytvoření intervalů Frekvenční tabulka 5 Histogram "Absolute frequency histogram" f(x) = n(i) d(i) "Relative frequency histogram" f(x) = n(i) / n d(i)

53 Spojitá data postup frekvenčních analýz Aktivita enzymu (X) I Utřídit podle velikosti II Rozdělit do intervalů o rozumné šířce III Vyhodnotit počty hodnot v jednotlivých intervalech - absolutní četnosti IV Vyhodnotit podíly (relativní četnosti) hodnot v jednotlivých intervalech V Grafické znázornění - histogram f(x) Aktivita Počet intervalů X: dán daty a hodnotitelem Šířka intervalů: pokud možno stejná

54 Počet zvolených tříd a velikost souboru určují kvalitu výstupu k = 1 tříd k = 5 tříd 1,5 2, 2,5 3, 3,5 4, 4,5 5, k = 2 tříd 2 1 1, 2, 3, 4, 5,

55 Histogram vyjadřuje tvar výběrového rozložení f(x) f(x) f(x) x f(x) x f(x) x x x

56 Příklad: věk účastníků vážných dopravních nehod Frekvence Frekvence po roce věku Správný histogram? Věk (roky) Správný histogram? Věk > 6 Věk (roky) f

57 Pojem ROZLOŽENÍ - příklad spojitých dat ϕ(x) Rozložení F(x) x Distribuční funkce Je - li dána distribuční funkce, je dáno rozložení x

58 Výběrové rozložení hodnot lze modelově popsat a definovat tak pravděpodobnost výskytu X f(x) ϕ(x) f(x) x ϕ(x) f(x) x ϕ(x) x

59 Distribuční funkce jako užitečný nástroj pro práci s rozložením ϕ(x) Plocha = relativní četnost x ϕ(x) d(x) = 1 F(x): Pravděpodobnost, že se X vyskytuje v intervalu M 1, F(x) P(X x) = Φ(x) = F(x") M x Φ(x) distribuční funkce P(X x) = ϕ(x) d(x) M Známe-li distribuční funkci, pak známe rozložení sledované veličiny Pro jakoukoli množinu hodnot (M) lze určit P, že X do této množiny patří

60 Jak vznikají informace? -frekvenční sumarizace spojitých dat Grafické výstupy z frekvenční tabulky spojitá data f(x) x Uspořádání čísel podle velikosti a konstrukce rozložení umožňuje pravděpodobnostní zařazení každé jednotlivé hodnoty 1 F(x) KVANTIL x X 1 ; X 9 ; X 5 ; X θ

61 Otázka: Jak velké musí být X, aby 5 % všech hodnot bylo nad ním? θ =,95 Pravděpodobnost x θ = (x,95) =? j(x) Hledáme: P(X x θ ) =,95 = θ 5 % F (xθ ) = θ X,95 x,95 Φ(x) Kvantil je číslo, jehož hodnota distribuční funkce je rovna P, pro kterou je kvantil definován Jakékoliv číslo na ose x je kvantilem

2. Základní typy dat Spojitá a kategoriální data Základní popisné statistiky Frekvenční tabulky Grafický popis dat

2. Základní typy dat Spojitá a kategoriální data Základní popisné statistiky Frekvenční tabulky Grafický popis dat 2. Základní typy dat Spojitá a kategoriální data Základní popisné statistiky Frekvenční tabulky Grafický popis dat Anotace Realitu můžeme popisovat různými typy dat, každý z nich se specifickými vlastnostmi,

Více

1. Statistická analýza dat Jak vznikají informace Rozložení dat

1. Statistická analýza dat Jak vznikají informace Rozložení dat 1. Statistická analýza dat Jak vznikají informace Rozložení dat J. Jarkovský, L. Dušek, S. Littnerová, J. Kalina Význam statistické analýzy dat Sběr a vyhodnocování dat je způsobem k uchopení a pochopení

Více

Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012. Tutoriál č. 4: Exploratorní analýza. Jan Kracík

Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012. Tutoriál č. 4: Exploratorní analýza. Jan Kracík Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012 Tutoriál č. 4: Exploratorní analýza Jan Kracík jan.kracik@vsb.cz Statistika věda o získávání znalostí z empirických dat empirická

Více

Kontingenční tabulky v Excelu. Představení programu Statistica

Kontingenční tabulky v Excelu. Představení programu Statistica ASTAc/01 Biostatistika 2. cvičení Kontingenční tabulky v Excelu Základní popisné statistiky Představení programu Statistica Import a základní popis dat ve Statistice, M. Cvanová I. Kontingenční tabulky

Více

Analýza dat na PC I.

Analýza dat na PC I. CENTRUM BIOSTATISTIKY A ANALÝZ Lékařská a Přírodovědecká fakulta, Masarykova univerzita Analýza dat na PC I. Popisná analýza v programu Statistica IBA výuka Základní popisná statistika Popisná statistika

Více

7. Rozdělení pravděpodobnosti ve statistice

7. Rozdělení pravděpodobnosti ve statistice 7. Rozdělení pravděpodobnosti ve statistice Statistika nuda je, má však cenné údaje, neklesejte na mysli, ona nám to vyčíslí Jednou z úloh statistiky je odhad (výpočet) hodnot statistického znaku x i,

Více

Pojem a úkoly statistiky

Pojem a úkoly statistiky Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Pojem a úkoly statistiky Statistika je věda, která se zabývá získáváním, zpracováním a analýzou dat pro potřeby

Více

Mnohorozměrná statistická data

Mnohorozměrná statistická data Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Statistický znak, statistický soubor Jednotlivé objekty nebo subjekty, které jsou při statistickém

Více

Základy teorie pravděpodobnosti

Základy teorie pravděpodobnosti Základy teorie pravděpodobnosti Náhodná veličina Roman Biskup (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at)email.cz 12. února 2012 Statistika by Birom Základy teorie

Více

Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D.

Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D. Zpracování náhodného výběru popisná statistika Ing. Michal Dorda, Ph.D. Základní pojmy Úkolem statistiky je na základě vlastností výběrového souboru usuzovat o vlastnostech celé populace. Populace(základní

Více

Popisná statistika. Statistika pro sociology

Popisná statistika. Statistika pro sociology Popisná statistika Jitka Kühnová Statistika pro sociology 24. září 2014 Jitka Kühnová (GSTAT) Popisná statistika 24. září 2014 1 / 31 Outline 1 Základní pojmy 2 Typy statistických dat 3 Výběrové charakteristiky

Více

Základy popisné statistiky. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

Základy popisné statistiky. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Základy popisné statistiky Anotace Realitu můžeme popisovat různými typy dat, každý z nich se specifickými vlastnostmi, výhodami, nevýhodami a vlastní sadou využitelných statistických metod -od binárních

Více

Náhodná veličina a rozdělení pravděpodobnosti

Náhodná veličina a rozdělení pravděpodobnosti 3.2 Náhodná veličina a rozdělení pravděpodobnosti Bůh hraje se světem hru v kostky. Jsou to ale falešné kostky. Naším hlavním úkolem je zjistit, podle jakých pravidel byly označeny, a pak toho využít pro

Více

Matematika III. 27. listopadu Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

Matematika III. 27. listopadu Vysoká škola báňská - Technická univerzita Ostrava. Matematika III Vysoká škola báňská - Technická univerzita Ostrava 27. listopadu 2017 Typy statistických znaků (proměnných) Typy proměnných: Kvalitativní proměnná (kategoriální, slovní,... ) Kvantitativní proměnná (numerická,

Více

23. Matematická statistika

23. Matematická statistika Projekt: Inovace oboru Mechatronik pro Zlínský kraj Registrační číslo: CZ.1.07/1.1.08/03.0009 23. Matematická statistika Statistika je věda, která se snaží zkoumat reálná data a s pomocí teorii pravděpodobnosti

Více

Základy pravděpodobnosti a statistiky. Popisná statistika

Základy pravděpodobnosti a statistiky. Popisná statistika Základy pravděpodobnosti a statistiky Popisná statistika Josef Tvrdík Přírodovědecká fakulta, katedra informatiky josef.tvrdik@osu.cz konzultace v úterý 14.10 až 15.40 hod. Příklad ze života Cimrman, Smoljak/Svěrák,

Více

analýzy dat v oboru Matematická biologie

analýzy dat v oboru Matematická biologie INSTITUT BIOSTATISTIKY A ANALÝZ Lékařská a Přírodovědecká fakulta, Masarykova univerzita Komplexní přístup k výuce analýzy dat v oboru Matematická biologie Tomáš Pavlík, Daniel Schwarz, Jiří Jarkovský,

Více

Přednáška III. Data, jejich popis a vizualizace. Náhodný výběr, cílová a výběrová populace Typy dat Vizualizace různých typů dat Popisné statistiky

Přednáška III. Data, jejich popis a vizualizace. Náhodný výběr, cílová a výběrová populace Typy dat Vizualizace různých typů dat Popisné statistiky Přednáška III. Data, jejich popis a vizualizace Náhodný výběr, cílová a výběrová populace Typy dat Vizualizace různých typů dat Popisné statistiky Opakování podmíněná pravděpodobnost Ω A A B B Jak můžu

Více

Praktická statistika. Petr Ponížil Eva Kutálková

Praktická statistika. Petr Ponížil Eva Kutálková Praktická statistika Petr Ponížil Eva Kutálková Zápis výsledků měření Předpokládejme, že známe hodnotu napětí U = 238,9 V i její chybu 3,3 V. Hodnotu veličiny zapíšeme na tolik míst, aby až poslední bylo

Více

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 3. 11.

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 3. 11. UNIVERZITA OBRANY Fakulta ekonomiky a managementu Aplikace STAT1 Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 Jiří Neubauer, Marek Sedlačík, Oldřich Kříž 3. 11. 2012 Popis a návod k použití aplikace

Více

Škály podle informace v datech:

Škály podle informace v datech: Škály podle informace v datech: Různé typy dat znamenají různou informaci, resp. různé množství informace Data nominální Rovná se? x 1 = x 2 Data ordinální Větší, menší? x 1 < x 2 Data intervalová O kolik?

Více

Mnohorozměrná statistická data

Mnohorozměrná statistická data Mnohorozměrná statistická data Ekonometrie Jiří Neubauer Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra ekonometrie UO Brno) Mnohorozměrná

Více

Základy biostatistiky

Základy biostatistiky Základy biostatistiky Veřejné zdravotnictví 3.LF UK Viktor Hynčica Úvod se statistikou se setkáváme denně ankety proč se statistika začala používat ve zdravotnictví skupinový přístup k léčení celé populace

Více

Statistické metody - nástroj poznání a rozhodování anebo zdroj omylů a lží

Statistické metody - nástroj poznání a rozhodování anebo zdroj omylů a lží Statistické metody - nástroj poznání a rozhodování anebo zdroj omylů a lží Zdeněk Karpíšek Jsou tři druhy lží: lži, odsouzeníhodné lži a statistiky. Statistika je logická a přesná metoda, jak nepřesně

Více

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II Základy biostatistiky II Veřejné zdravotnictví 3.LF UK - II Teoretické rozložení-matematické modely rozložení Naměřená data Výběrové rozložení Teoretické rozložení 1 e 2 x 2 Teoretické rozložení-matematické

Více

Náhodná proměnná. Náhodná proměnná může mít rozdělení diskrétní (x 1. , x 2. ; x 2. spojité (<x 1

Náhodná proměnná. Náhodná proměnná může mít rozdělení diskrétní (x 1. , x 2. ; x 2. spojité (<x 1 Náhodná proměnná Náhodná proměnná může mít rozdělení diskrétní (x 1, x 2,,x n ) spojité () Poznámky: 1. Fyzikální veličiny jsou zpravidla spojité, ale změřené hodnoty jsou diskrétní. 2. Pokud

Více

Co je to statistika? Úvod statistické myšlení. Základy statistického hodnocení výsledků zkoušek. Petr Misák

Co je to statistika? Úvod statistické myšlení. Základy statistického hodnocení výsledků zkoušek. Petr Misák Základy statistického hodnocení výsledků zkoušek Petr Misák misak.p@fce.vutbr.cz Co je to statistika? Statistika je jako bikiny. Odhalí téměř vše, ale to nejdůležitější nám zůstane skryto. (autor neznámý)

Více

Metody sociálních výzkumů. Velmi skromný úvod do statistiky. Motto: Jsou tři druhy lži-lež prostá, lež odsouzeníhodná a statistika.

Metody sociálních výzkumů. Velmi skromný úvod do statistiky. Motto: Jsou tři druhy lži-lež prostá, lež odsouzeníhodná a statistika. Metody sociálních výzkumů Velmi skromný úvod do statistiky. Motto: Jsou tři druhy lži-lež prostá, lež odsouzeníhodná a statistika. Statistika Význam slova-vychází ze slova stát, s jeho administrativou

Více

MATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci

MATEMATICKÁ STATISTIKA.   Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci MATEMATICKÁ STATISTIKA Dana Černá http://www.fp.tul.cz/kmd/ Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci Matematická statistika Matematická statistika se zabývá matematickým

Více

Me neˇ nezˇ minimum ze statistiky Michaela S ˇ edova KPMS MFF UK Principy medicı ny zalozˇene na du kazech a za klady veˇdecke prˇı pravy 1 / 33

Me neˇ nezˇ minimum ze statistiky Michaela S ˇ edova KPMS MFF UK Principy medicı ny zalozˇene na du kazech a za klady veˇdecke prˇı pravy 1 / 33 1 / 33 Méně než minimum ze statistiky Michaela Šedová KPMS MFF UK Principy medicíny založené na důkazech a základy vědecké přípravy Příklad Studie syndromu náhodného úmrtí dětí. Dvě skupiny: Děti, které

Více

Základy popisné statistiky

Základy popisné statistiky Základy popisné statistiky Michal Fusek Ústav matematiky FEKT VUT, fusekmi@feec.vutbr.cz 8. přednáška z ESMAT Michal Fusek (fusekmi@feec.vutbr.cz) 1 / 26 Obsah 1 Základy statistického zpracování dat 2

Více

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.) Lékařská biofyzika, výpočetní technika I Biostatistika Josef Tvrdík (doc. Ing. CSc.) Přírodovědecká fakulta, katedra informatiky josef.tvrdik@osu.cz konzultace úterý 14.10 až 15.40 hod. http://www1.osu.cz/~tvrdik

Více

Třídění statistických dat

Třídění statistických dat 2.1 Třídění statistických dat Všechny muže ve městě rozdělíme na 2 skupiny: A) muži, kteří chodí k holiči B) muži, kteří se holí sami Do které skupiny zařadíme holiče? prof. Raymond M. Smullyan, Dr. Math.

Více

5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza

5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza 5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza 5.1 Vícerozměrná data a vícerozměrná rozdělení Při zpracování vícerozměrných dat se hledají souvislosti mezi dvěma, případně

Více

a způsoby jejího popisu Ing. Michael Rost, Ph.D.

a způsoby jejího popisu Ing. Michael Rost, Ph.D. Podmíněná pravděpodobnost, náhodná veličina a způsoby jejího popisu Ing. Michael Rost, Ph.D. Podmíněná pravděpodobnost Pokud je jev A vázán na uskutečnění jevu B, pak tento jev nazýváme jevem podmíněným

Více

Renáta Bednárová STATISTIKA PRO EKONOMY

Renáta Bednárová STATISTIKA PRO EKONOMY Renáta Bednárová STATISTIKA PRO EKONOMY ZÁKLADNÍ STATISTICKÉ POJMY Statistika Statistický soubor Statistická jednotky Statistický znak STATISTIKA Vědní obor, který se zabývá hromadnými jevy Hromadné jevy

Více

Tomáš Karel LS 2012/2013

Tomáš Karel LS 2012/2013 Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není

Více

KGG/STG Statistika pro geografy

KGG/STG Statistika pro geografy KGG/STG Statistika pro geografy 4. Teoretická rozdělení Mgr. David Fiedor 9. března 2015 Osnova Úvod 1 Úvod 2 3 4 5 Vybraná rozdělení náhodných proměnných normální rozdělení normované normální rozdělení

Více

Statistika. Diskrétní data. Spojitá data. Charakteristiky polohy. Charakteristiky variability

Statistika. Diskrétní data. Spojitá data. Charakteristiky polohy. Charakteristiky variability I Přednáška Statistika Diskrétní data Spojitá data Charakteristiky polohy Charakteristiky variability Statistika deskriptivní statistika ˆ induktivní statistika populace (základní soubor) ˆ výběr parametry

Více

Statistika pro geografy

Statistika pro geografy Statistika pro geografy 2. Popisná statistika Mgr. David Fiedor 23. února 2015 Osnova 1 2 3 Pojmy - Bodové rozdělení četností Absolutní četnost Absolutní četností hodnoty x j znaku x rozumíme počet statistických

Více

ANALÝZA DAT V R 3. POPISNÉ STATISTIKY, NÁHODNÁ VELIČINA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK

ANALÝZA DAT V R 3. POPISNÉ STATISTIKY, NÁHODNÁ VELIČINA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK ANALÝZA DAT V R 3. POPISNÉ STATISTIKY, NÁHODNÁ VELIČINA Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK www.biostatisticka.cz POPISNÉ STATISTIKY - OPAKOVÁNÍ jedna kvalitativní

Více

Vybraná rozdělení náhodné veličiny

Vybraná rozdělení náhodné veličiny 3.3 Vybraná rozdělení náhodné veličiny 0,16 0,14 0,12 0,1 0,08 0,06 0,04 0,02 0 Rozdělení Z 3 4 5 6 7 8 9 10 11 12 13 14 15 Život je umění vytvářet uspokojivé závěry na základě nedostatečných předpokladů.

Více

Inženýrská statistika pak představuje soubor postupů a aplikací teoretických principů v oblasti inženýrské činnosti.

Inženýrská statistika pak představuje soubor postupů a aplikací teoretických principů v oblasti inženýrské činnosti. Přednáška č. 1 Úvod do statistiky a počtu pravděpodobnosti Statistika Statistika je věda a postup jak rozvíjet lidské znalosti použitím empirických dat. Je založena na matematické statistice, která je

Více

Charakterizace rozdělení

Charakterizace rozdělení Charakterizace rozdělení Momenty f(x) f(x) f(x) μ >μ 1 σ 1 σ >σ 1 g 1 g σ μ 1 μ x μ x x N K MK = x f( x) dx 1 M K = x N CK = ( x M ) f( x) dx ( xi M 1 C = 1 K 1) N i= 1 K i K N i= 1 K μ = E ( X ) = xf

Více

Střední hodnota a rozptyl náhodné. kvantilu. Ing. Michael Rost, Ph.D.

Střední hodnota a rozptyl náhodné. kvantilu. Ing. Michael Rost, Ph.D. Střední hodnota a rozptyl náhodné veličiny, vybraná rozdělení diskrétních a spojitých náhodných veličin, pojem kvantilu Ing. Michael Rost, Ph.D. Príklad Předpokládejme že máme náhodnou veličinu X která

Více

Číselné charakteristiky

Číselné charakteristiky . Číselné charakteristiky statistických dat Průměrný statistik se během svého života ožení s 1,75 ženami, které se ho snaží vytáhnout večer do společnosti,5 x týdně, ale pouze s 50% úspěchem. W. F. Miksch

Více

AVDAT Náhodný vektor, mnohorozměrné rozdělení

AVDAT Náhodný vektor, mnohorozměrné rozdělení AVDAT Náhodný vektor, mnohorozměrné rozdělení Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Opakování, náhodná veličina, rozdělení Náhodná veličina zobrazuje elementární

Více

PRŮZKUMOVÁ ANALÝZA JEDNOROZMĚRNÝCH DAT Exploratory Data Analysis (EDA)

PRŮZKUMOVÁ ANALÝZA JEDNOROZMĚRNÝCH DAT Exploratory Data Analysis (EDA) PRŮZKUMOVÁ ANALÝZA JEDNOROZMĚRNÝCH DAT Exploratory Data Analysis (EDA) Reprezentativní náhodný výběr: 1. Prvky výběru x i jsou vzájemně nezávislé. 2. Výběr je homogenní, tj. všechna x i jsou ze stejného

Více

7. SEMINÁŘ DESKRIPTIVNÍ STATISTIKA

7. SEMINÁŘ DESKRIPTIVNÍ STATISTIKA 7. SEMINÁŘ DESKRIPTIVNÍ STATISTIKA Oblasti využití statistiky v medicíně Zvládání variability Variabilita: biologická, podmínek, měřících přístrojů - hodnocení variability, variabilita náhodná x nenáhodná

Více

Počet pravděpodobnosti

Počet pravděpodobnosti PSY117/454 Statistická analýza dat v psychologii Přednáška 4 Počet pravděpodobnosti Je známo, že když muž použije jeden z okrajových pisoárů, sníží se pravděpodobnost, že bude pomočen o 50%. anonym Pravděpodobnost

Více

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Analýza dat pro Neurovědy RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Jaro 2014 Institut biostatistiky Janoušová, a analýz Dušek: Analýza dat pro neurovědy Blok 7 Jak hodnotit vztah spojitých proměnných

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 2010 1.týden (20.09.-24.09. ) Data, typy dat, variabilita, frekvenční analýza

Více

Někdy lze výsledek pokusu popsat jediným číslem, které označíme X (nebo jiným velkým písmenem). Hodíme dvěma kostkami jaký padl součet?

Někdy lze výsledek pokusu popsat jediným číslem, které označíme X (nebo jiným velkým písmenem). Hodíme dvěma kostkami jaký padl součet? Náhodné veličiny Náhodné veličiny Někdy lze výsledek pokusu popsat jediným číslem, které označíme X (nebo jiným velkým písmenem). Příklad Vytáhneme tři karty z balíčku zajímá nás, kolik je mezi nimi es.

Více

Úvodem Dříve les než stromy 3 Operace s maticemi

Úvodem Dříve les než stromy 3 Operace s maticemi Obsah 1 Úvodem 13 2 Dříve les než stromy 17 2.1 Nejednoznačnost terminologie 17 2.2 Volba metody analýzy dat 23 2.3 Přehled vybraných vícerozměrných metod 25 2.3.1 Metoda hlavních komponent 26 2.3.2 Faktorová

Více

Statistika. cílem je zjednodušit nějaká data tak, abychom se v nich lépe vyznali důsledkem je ztráta informací!

Statistika. cílem je zjednodušit nějaká data tak, abychom se v nich lépe vyznali důsledkem je ztráta informací! Statistika aneb známe tři druhy lži: úmyslná neúmyslná statistika Statistika je metoda, jak vyjádřit nejistá data s přesností na setinu procenta. den..00..00 3..00..00..00..00..00..00..00..00..00..00 3..00..00..00..00..00..00..00

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 2010 1.týden (20.09.-24.09. ) Data, typy dat, variabilita, frekvenční analýza

Více

NÁHODNÁ VELIČINA. 3. cvičení

NÁHODNÁ VELIČINA. 3. cvičení NÁHODNÁ VELIČINA 3. cvičení Náhodná veličina Náhodná veličina funkce, která každému výsledku náhodného pokusu přiřadí reálné číslo. Je to matematický model popisující více či méně dobře realitu, který

Více

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA PRAVDĚPODOBNOST A STATISTIKA Náhodná proměnná Náhodná veličina slouží k popisu výsledku pokusu. Před provedením pokusu jeho výsledek a tedy ani sledovanou hodnotu neznáme. Přesto bychom chtěli tento pokus

Více

STATISTICKÉ METODY; ZÍSKÁVÁNÍ INFORMACÍ Z DRUHOVÝCH A ENVIRONMENTÁLNÍCH DAT

STATISTICKÉ METODY; ZÍSKÁVÁNÍ INFORMACÍ Z DRUHOVÝCH A ENVIRONMENTÁLNÍCH DAT STATISTICKÉ METODY; ZÍSKÁVÁNÍ INFORMACÍ Z DRUHOVÝCH A ENVIRONMENTÁLNÍCH DAT (NE)VÝHODY STATISTIKY OTÁZKY si klást ještě před odběrem a podle nich naplánovat design, metodiku odběru (experimentální vs.

Více

Návrh a vyhodnocení experimentu

Návrh a vyhodnocení experimentu Návrh a vyhodnocení experimentu Návrh a vyhodnocení experimentů v procesech vývoje a řízení kvality vozidel Ing. Bohumil Kovář, Ph.D. FD ČVUT Ústav aplikované matematiky kovar@utia.cas.cz Mladá Boleslav

Více

Tomáš Karel LS 2012/2013

Tomáš Karel LS 2012/2013 Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není

Více

Grafický a číselný popis rozložení dat 3.1 Způsoby zobrazení dat Metody zobrazení kvalitativních a ordinálních dat Metody zobrazení kvan

Grafický a číselný popis rozložení dat 3.1 Způsoby zobrazení dat Metody zobrazení kvalitativních a ordinálních dat Metody zobrazení kvan 1 Úvod 1.1 Empirický výzkum a jeho etapy 1.2 Význam teorie pro výzkum 1.2.1 Konstrukty a jejich operacionalizace 1.2.2 Role teorie ve výzkumu 1.2.3 Proces ověření hypotéz a teorií 1.3 Etika vědecké práce

Více

marek.pomp@vsb.cz http://homel.vsb.cz/~pom68

marek.pomp@vsb.cz http://homel.vsb.cz/~pom68 Statistika B (151-0303) Marek Pomp ZS 2014 marek.pomp@vsb.cz http://homel.vsb.cz/~pom68 Cvičení: Pavlína Kuráňová & Marek Pomp Podmínky pro úspěšné ukončení zápočet 45 bodů, min. 23 bodů, dvě zápočtové

Více

Všechno, co jste chtěli vědět z teorie pravděpodobnosti, z teorie informace a

Všechno, co jste chtěli vědět z teorie pravděpodobnosti, z teorie informace a Všechno, co jste chtěli vědět z teorie pravděpodobnosti, z teorie informace a báli jste se zeptat Jedinečnou funkcí statistiky je, že umožňuje vědci číselně vyjádřit nejistotu v jeho závěrech. (G. W. Snedecor)

Více

Tématické okruhy pro státní závěrečné zkoušky. bakalářské studium. studijní obor "Management jakosti"

Tématické okruhy pro státní závěrečné zkoušky. bakalářské studium. studijní obor Management jakosti Tématické okruhy pro státní závěrečné zkoušky bakalářské studium studijní obor "Management jakosti" školní rok 2013/2014 Management jakosti A 1. Pojem jakosti a význam managementu jakosti v současném období.

Více

Tématické okruhy pro státní závěrečné zkoušky. bakalářské studium. studijní obor "Management jakosti"

Tématické okruhy pro státní závěrečné zkoušky. bakalářské studium. studijní obor Management jakosti Tématické okruhy pro státní závěrečné zkoušky bakalářské studium studijní obor "Management jakosti" školní rok 2010/2011 Management jakosti A 1. Pojem jakosti a význam managementu jakosti v současném období.

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 2010 1.týden (20.09.-24.09. ) Data, typy dat, variabilita, frekvenční analýza

Více

Téma 22. Ondřej Nývlt

Téma 22. Ondřej Nývlt Téma 22 Ondřej Nývlt nyvlto1@fel.cvut.cz Náhodná veličina a náhodný vektor. Distribuční funkce, hustota a pravděpodobnostní funkce náhodné veličiny. Střední hodnota a rozptyl náhodné veličiny. Sdružené

Více

PSY117/454 Statistická analýza dat v psychologii Přednáška 10

PSY117/454 Statistická analýza dat v psychologii Přednáška 10 PSY117/454 Statistická analýza dat v psychologii Přednáška 10 TESTY PRO NOMINÁLNÍ A ORDINÁLNÍ PROMĚNNÉ NEPARAMETRICKÉ METODY... a to mělo, jak sám vidíte, nedozírné následky. Smrť Analýza četností hodnot

Více

Statistika. Základní pojmy a cíle statistiky. Roman Biskup. (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at) .

Statistika. Základní pojmy a cíle statistiky. Roman Biskup. (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at) . Statistika Základní pojmy a cíle statistiky Roman Biskup (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at)email.cz 12. února 2012 Statistika by Birom Statistika Pojmy a cíle

Více

STATISTIKA 1. RNDr. K. Hrach, Ph.D. Zápočet: odevzdání seminární práce (úkoly na PC) Zkouška: písemná (bez kalkulačky, bez vzorců)

STATISTIKA 1. RNDr. K. Hrach, Ph.D. Zápočet: odevzdání seminární práce (úkoly na PC) Zkouška: písemná (bez kalkulačky, bez vzorců) STATISTIKA 1 RNDr. K. Hrach, Ph.D. Zápočet: odevzdání seminární práce (úkoly na PC) Zkouška: písemná (bez kalkulačky, bez vzorců) STATISTIKA Činnost vedoucí k získávání dat Instituce zajišťující tuto činnost

Více

Návrh a vyhodnocení experimentu

Návrh a vyhodnocení experimentu Návrh a vyhodnocení experimentu Návrh a vyhodnocení experimentů v procesech vývoje a řízení kvality vozidel Ing. Bohumil Kovář, Ph.D. FD ČVUT Ústav aplikované matematiky kovar@utia.cas.cz Mladá Boleslav

Více

5EN306 Aplikované kvantitativní metody I

5EN306 Aplikované kvantitativní metody I 5EN306 Aplikované kvantitativní metody I Přednáška 3 Zuzana Dlouhá Předmět a struktura kurzu 1. Úvod: struktura empirických výzkumů 2. Tvorba ekonomických modelů: teorie 3. Data: zdroje a typy dat, význam

Více

Inovace bakalářského studijního oboru Aplikovaná chemie

Inovace bakalářského studijního oboru Aplikovaná chemie http://aplchem.upol.cz CZ.1.07/2.2.00/15.0247 Tento projekt je spolufinancován Evropským sociálním fondem a státním rozpočtem České republiky. Základy zpracování dat chemometrie, statistika Doporučenáliteratura

Více

III. Úplná pravděpodobnost. Nezávislé pokusy se dvěma výsledky. Úplná pravděpodobnost Nezávislé pokusy se dvěma výsledky Náhodná veličina

III. Úplná pravděpodobnost. Nezávislé pokusy se dvěma výsledky. Úplná pravděpodobnost Nezávislé pokusy se dvěma výsledky Náhodná veličina III Přednáška Úplná pravděpodobnost Nezávislé pokusy se dvěma výsledky Náhodná veličina Pravděpodobnost při existenci neslučitelných hypotéz Věta Mějme jev. Pokud H 1,H 2, : : :,H n tvoří úplnou skupinu

Více

Úvod do statistické metodologie

Úvod do statistické metodologie Přenos jakékoli části této prezentace mimo účastníky semináře je zakázán bez písemné dohody se StatSoft CR s.r.o. (Dell Software Group). Úvod do statistické metodologie 1. lékařská fakulta Univerzity Karlovy

Více

Organizační pokyny k přednášce. Matematická statistika. Přehled témat. Co je statistika?

Organizační pokyny k přednášce. Matematická statistika. Přehled témat. Co je statistika? Organizační pokyny k přednášce Matematická statistika 2012 2013 Šárka Hudecová Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta UK hudecova@karlin.mff.cuni.cz http://www.karlin.mff.cuni.cz/

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická

Více

Pravděpodobnost a aplikovaná statistika

Pravděpodobnost a aplikovaná statistika Pravděpodobnost a aplikovaná statistika MGR. JANA SEKNIČKOVÁ, PH.D. 2. KAPITOLA PODMÍNĚNÁ PRAVDĚPODOBNOST 3. KAPITOLA NÁHODNÁ VELIČINA 9.11.2017 Opakování Uveďte příklad aplikace geometrické definice pravděpodobnosti

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 010 1.týden (0.09.-4.09. ) Data, typy dat, variabilita, frekvenční analýza

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 2010 1.týden (20.09.-24.09. ) Data, typy dat, variabilita, frekvenční analýza

Více

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze Dobývání znalostí Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze Dobývání znalostí Pravděpodobnost a učení Doc. RNDr. Iveta Mrázová,

Více

TECHNICKÁ UNIVERZITA V LIBERCI SEMESTRÁLNÍ PRÁCE

TECHNICKÁ UNIVERZITA V LIBERCI SEMESTRÁLNÍ PRÁCE TECHNICKÁ UNIVERZITA V LIBERCI Ekonomická fakulta Studentská 2 461 17 Liberec 1 SEMESTRÁLNÍ PRÁCE STATISTICKÝ ROZBOR DAT Z DOTAZNÍKOVÝCH ŠETŘENÍ Gabriela Dlasková, Veronika Bukovinská Sára Kroupová, Dagmar

Více

Přednáška. Diskrétní náhodná proměnná. Charakteristiky DNP. Základní rozdělení DNP

Přednáška. Diskrétní náhodná proměnná. Charakteristiky DNP. Základní rozdělení DNP IV Přednáška Diskrétní náhodná proměnná Charakteristiky DNP Základní rozdělení DNP Diskrétní náhodná veličina Funkce definovaná na Ω, přiřazující každému elementárnímu jevu E prvky X(E) D R kde D je posloupnost

Více

Náhodná veličina a její charakteristiky. Před provedením pokusu jeho výsledek a tedy ani sledovanou hodnotu neznáte. Proto je proměnná, která

Náhodná veličina a její charakteristiky. Před provedením pokusu jeho výsledek a tedy ani sledovanou hodnotu neznáte. Proto je proměnná, která Náhodná veličina a její charakteristiky Náhodná veličina a její charakteristiky Představte si, že provádíte náhodný pokus, jehož výsledek jste schopni ohodnotit nějakým číslem. Před provedením pokusu jeho

Více

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Analýza dat pro Neurovědy RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Jaro 2014 Institut biostatistiky Janoušová, a analýz Dušek: Analýza dat pro neurovědy Blok 3 Jak a kdy použít parametrické a

Více

Charakteristika datového souboru

Charakteristika datového souboru Zápočtová práce z předmětu Statistika Vypracoval: 10. 11. 2014 Charakteristika datového souboru Zadání: Při kontrole dodržování hygienických norem v kuchyni se prováděl odběr vzduchu a pomocí filtru Pallflex

Více

Tématické okruhy pro státní závěrečné zkoušky. bakalářské studium. studijní obor "Management jakosti"

Tématické okruhy pro státní závěrečné zkoušky. bakalářské studium. studijní obor Management jakosti Tématické okruhy pro státní závěrečné zkoušky bakalářské studium studijní obor "Management jakosti" školní rok 2009/2010 Management jakosti A 1. Pojem jakosti a význam managementu jakosti v současném období.

Více

P13: Statistické postupy vyhodnocování únavových zkoušek, aplikace normálního, Weibullova rozdělení, apod.

P13: Statistické postupy vyhodnocování únavových zkoušek, aplikace normálního, Weibullova rozdělení, apod. P13: Statistické postupy vyhodnocování únavových zkoušek, aplikace normálního, Weibullova rozdělení, apod. Matematický přístup k výsledkům únavových zkoušek Náhodnost výsledků únavových zkoušek. Únavové

Více

Otázky k měření centrální tendence. 1. Je dáno rozložení, ve kterém průměr = medián. Co musí být pravdivé o tvaru tohoto rozložení?

Otázky k měření centrální tendence. 1. Je dáno rozložení, ve kterém průměr = medián. Co musí být pravdivé o tvaru tohoto rozložení? Otázky k měření centrální tendence 1. Je dáno rozložení, ve kterém průměr = medián. Co musí být pravdivé o tvaru tohoto rozložení? 2. Určete průměr, medián a modus u prvních čtyř rozložení (sad dat): a.

Více

ANALÝZA DAT V R 7. KONTINGENČNÍ TABULKA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.

ANALÝZA DAT V R 7. KONTINGENČNÍ TABULKA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK. ANALÝZA DAT V R 7. KONTINGENČNÍ TABULKA Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK www.biostatisticka.cz PŘEHLED TESTŮ rozdělení normální spojité alternativní / diskrétní

Více

Design of Experiment (DOE) Petr Misák. Brno 2017

Design of Experiment (DOE) Petr Misák. Brno 2017 Navrhování experimentů Design of Experiment (DOE) Petr Misák Vysoké učení technické v Brně, Fakulta stavební, Ústav stavebního zkušebnictví Brno 2017 Úvod - Experiment jako nástroj hledání slavné vynálezy

Více

Pravděpodobnost a matematická statistika

Pravděpodobnost a matematická statistika Pravděpodobnost a matematická statistika Příklady k přijímacím zkouškám na doktorské studium 1 Popisná statistika Určete aritmetický průměr dat, zadaných tabulkou hodnot x i a četností n i x i 1 2 3 n

Více

STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky)

STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky) STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky) 1) Význam a využití statistiky v biologických vědách a veterinárním lékařství ) Rozdělení znaků (veličin) ve statistice 3) Základní a

Více

I. Příprava dat Klíčový význam korektního uložení získaných dat Pravidla pro ukládání dat Čištění dat před analýzou

I. Příprava dat Klíčový význam korektního uložení získaných dat Pravidla pro ukládání dat Čištění dat před analýzou I. Příprava dat Klíčový význam korektního uložení získaných dat Pravidla pro ukládání dat Čištění dat před analýzou Anotace Současná statistická analýza se neobejde bez zpracování dat pomocí statistických

Více

TECHNICKÁ UNIVERZITA V LIBERCI

TECHNICKÁ UNIVERZITA V LIBERCI TECHNICKÁ UNIVERZITA V LIBERCI Fakulta mechatroniky, informatiky a mezioborových studií Základní pojmy diagnostiky a statistických metod vyhodnocení Učební text Ivan Jaksch Liberec 2012 Materiál vznikl

Více

Popisná statistika kvantitativní veličiny

Popisná statistika kvantitativní veličiny StatSoft Popisná statistika kvantitativní veličiny Protože nám surová data obvykle žádnou smysluplnou informaci neposkytnou, je žádoucí vyjádřit tyto ve zhuštěnější formě. V předchozím dílu jsme začali

Více

Téma 2: Pravděpodobnostní vyjádření náhodných veličin

Téma 2: Pravděpodobnostní vyjádření náhodných veličin 0.025 0.02 0.015 0.01 0.005 Nominální napětí v pásnici Std Mean 140 160 180 200 220 240 260 Std Téma 2: Pravděpodobnostní vyjádření náhodných veličin Přednáška z předmětu: Pravděpodobnostní posuzování

Více