Klasifikace pomocí shlukové analýzy. Hana Řezanková

Rozměr: px
Začít zobrazení ze stránky:

Download "Klasifikace pomocí shlukové analýzy. Hana Řezanková"

Transkript

1 Klasifikace pomocí shlukové analýzy Hana Řezanková Vysoká škola ekonomická v Praze

2 Cíle klasifikace a shlukové analýzy Cílem klasifikace je zařadit adit buď některé z objektů nebo všechny v objekty do skupin. Shlukování: nemáme me žádné informace o existenci skupin a chceme klasifikovat všechny v sledované objekty (chceme vytvořit shluky). Shluková analýza je postup formulovaný jako procedura, pomocí níž objektivně seskupujeme jedince do skupin na základz kladě jejich podobnosti a odlišnosti (zkrácen ceně R. C. Tryon,, 939). 2

3 Statistické metody pro shlukování Shluková analýza Faktorová analýza Optimáln lní škálování (kategoriáln lní data) Vícerozměrné škálování Korespondenční analýza 3

4 Shluková analýza nejvýznamnější literatura JARDINE, N., SIBSON, R.: Mathematical Taxonomy.. John Wiley & Sons, New York 97. SNEATH, P. H. A., SOKAL, R. R.: Numerical Taxonomy.. W. H. Freeman & Company, San Francisco,, 973. HARTIGAN, J.A.: Clustering Algorithms.. John Wiley & Sons, New York, 975. GORDON, A. D.: Classification, 2nd ed. Chapman & Hall/CRC, London,

5 Shluková analýza česká literatura LUKASOVÁ,, A., ŠARMANOVÁ,, M.: Metody shlukové analýzy.. SNTL, Praha 985. HEBÁK, P., HUSTOPECKÝ J.: Vícerozměrné statistické metody s aplikacemi,, SNTL/ALFA, Praha, 987. KAHOUNOVÁ,, J.: Měření podobnosti struktur.. Skripta. VŠE, V Praha,

6 Struktura dat pro statistickou analýzu () Příklad vstupní datové matice o rozsahu n x p (objekty x proměnné) Termy Dokumenty abnormalita pacient tlak D D

7 Metody shlukové analýzy předměty shlukování: objekty (dokumenty), proměnn nné (termy), objekty i proměnn nné současn asně, kategorie určit ité proměnn nné na základz kladě dvourozměrn rné tabulky četností, kategorie dvou proměnných současn asně. 7

8 Struktura dat pro statistickou analýzu (2) Příklad dvourozměrné tabulky četností o rozsahu r x c Počet bodů Typ školy gymnázium obchodní akademie SPŠ SOU

9 Struktura dat pro statistickou analýzu (3) Příklad matice podobností proměnných o rozsahu p x p (obdobně: matice nepodobností (odlišností) objektů o rozsahu n x n, matice podobností objektů o rozsahu n x n, matice nepodobností kategorií o rozsahu r x r nebo c x c). Termy Termy abnormalita pacient tlak abnormalita 0,2 0,5 pacient 0,2 0,3 tlak 0,5 0,3 9

10 Metody shlukové analýzy klasifikace: hierarchický přístupp stup: aglomerativní polytetický přístup, divizivní monotetický přístup, divizivní polytetický přístup, dvourozměrn rné aglomerativní shlukování; nehierarchický přístup: algoritmus k průměrů (iterativní relokační), fuzzy shluková analýza. 0

11 Typy výstupů shlukové analýzy Grafické (např. dendrogram), číselné (přiřazen azení čísla shluku každému objektu), a to jako text (číslo( objektu a číslo shluku) nebo nový sloupec v datovém m editoru se vstupními údaji (pouze pro objekty), příp. p p. hodnoty ve speciáln lním m tabulkovém m editoru.

12 Zjišťov ování podobností a odlišnost ností () Volba míry m (ne)podobnosti závisz visí na typu proměnných nných,, rozlišujeme proměnn nné nomináln lní (profese, typ školy), ordináln lní (hodnocení výrobku), poměrov rové (počet členů domácnosti), intervalové (teplota ve o C), binárn rní (symetrické a asymetrické). 2

13 Zjišťov ování podobností a odlišnost ností (2) Klasifikace proměnných 3

14 Zjišťov ování podobností a odlišnost ností (3) Míry podobnosti, nepodobnosti a vzdálenosti; pro vzdálenosti mezi objekty x i, x j, x m platí: d ij 0 d ii = 0 d ij = d ji d ij + d jm d im i, j, m <; n>. 4

15 Vzdálenosti mezi objekty () 5

16 Vzdálenosti mezi objekty (2) 6

17 Míry vzdálenosti (pro kvantitativní data) Euclidean(x i, x j ): p l = ( x il - x jl 2 ) Power(x i, x j, q, r): r p x il - x jl l= q Minkowského metrika (r = q), Hemmingova vzdálenost (r = q = ), euklidovská vzdálenost (r = q = 2), Čebyševova vzdálenost (r = q ). 7

18 Míry vzdálenosti x2 obvod vnitřního čtverce Hemmingova vzdálenost (manhattanská metrika, m. městských bloků), kružnice euklidovská vzdálenost, obvod vnějšího čtverce Čebyševova vzdálenost. x 8

19 Míry podobnosti pro kvantitativní data () Korelační koeficient (podobnost proměnných) s kl = s lk ;s ll = r kl = n ( x i= ik xk )( x il n 2 n ( x i= ik x k ) i= ( x x il l ) x l ) 2 Kosinová míra (podobnost objektů) p 2 ( ) p x ( ) il x jl Využívána např. pro zjišťování podobnosti dokumentů D = [ ] D2 = [ ] l= p l= x il x jl l= 2 9

20 Kosinová míra grafické znázorn zornění 20

21 Míry podobnosti pro kvantitativní data (2) Jaccardův koeficient Diceův koeficient Czekanowského koeficient p l= p p p 2 2 ( xil ) + ( x jl ) l= l= l= 2 p l= x x il x p p 2 ( xil ) + ( x jl ) il x l= l= 2 l p = p l = min( ( x il jl x il + x, x jl jl ) 2 jl ) x il x jl 2

22 Převod měr m r podobnosti na míry m nepodobnosti Pro korelační koeficient dva přístupy p (podle interpretace hodnoty ): jestliže e hodnota reprezentuje maximáln lní nesouhlas, platí vztah d kl = r kl ; pokud jsou hodnoty a uvažov ovány ekvivalentně 2 jako maximáln lní souhlas, pak d kl = r kl, případnp padně d kl = r kl. Podle první varianty můžm ůžeme převp evést kosinovou míru m sledující podobnost dvou objektů,, tj. d ij = Cosine(x i, x ), j stejně jako Jaccardův, Diceův či Czekanowského koeficient. 22

23 23 23 Standardizace dat Standardizace dat l l il il s x x z - = l il il s x z = ) ( min ) ( max il i il i il il x x x z = Z-skóry ) ( max il i il il x x z = ) ( min ) ( max ) ( min - il i il i il i il il x x x x z = = = n i il il il x x z

24 Míry podobnosti pro binárn rní data () Označení četností v kontingenční (asociační) tabulce pro dva objekty Kat. objektu x i 0 Kategorie objektu x j 0 a b c d 24

25 Míry podobnosti pro binárn rní data (2) míry pro symetrické a asymetrické proměnn nné, míry podobnosti, nepodobnosti a vzdálenosti, koeficienty shody, podmíněné pravděpodobnosti, podobnosti, míry m pro hodnocení předpovědí a ostatní, míry, které jsou funkcemi poměru šancí,, míry, m které jsou funkcemi korelačního koeficientu, a ostatní. 25

26 Míry podobnosti pro binárn rní data (3) Koeficient souhlasu (pro symetrická binární data) a a + b + + d c + d Jaccardův koeficient (pro asymetrická binární data) a a + b + c Diceův (Czekanowského) koeficient (pro asymetrická binární data) 2a 2a + b + c 26

27 Míry podobnosti pro binárn rní data (4) funkce poměru šancí Poměr šancí α kl = ad bc = a / b c / d Odvození: a /( a + b) c /( c + d ) : b d /( a /( a + + b) b) = ad bc Yuleovo Q Q kl = ad ad + bc bc = ad ad / / bc bc + = α α kl kl + Yuleův koeficient vazby Y kl = ad ad + bc bc = α α kl kl + 27

28 Míry podobnosti pro binárn rní data (5) míra pro hodnocení předpovědí Goodmanova a Kruskalova lambda t t2 2( a + b + c + d ) t 2 t = max(a, b) + max(c, d) + max(a, c) + max(b, d) t 2 = max(a + c, b + d) + max(a + b, c + d) 28

29 Míry podobnosti pro binárn rní data (6) odvození koeficientu lambda Kat. objektu x k 0 Kategorie objektu x l 0 a b c d a + c b + d a + b c + d n = a + b + c + d 2 možné případy: (i) x l je statisticky nezávislá na x k nebo (ii) x l je funkcí x k obdobně pro závislost x k na x l, (iii) a (iv) λ lk = ((n max(a+c, b+d)) (n (max(a, b) + max(c, d)))) / (n max(a+c, b+d)) = (max(a, b) + max(c, d) max(a+c, b+d)) / (n max(a+c, b+d)) λ kl = ((n max(a+b, c+d)) (n (max(a, c) + max(b, d)))) / (n max(a+b, c+d)) = (max(a, c) + max(b, d) max(a+b, c+d)) / (n max(a+b, c+d)) 29

30 Míry podobnosti pro binárn rní data (7) funkce měr m r pro ordináln lní proměnn nné Sledování dvou proměnných u všech dvojic objektů: a) u. objektu obě hodnoty větší než u 2. objektu konkordantní pár b) u. objektu jedna hodnota větší a jedna menší diskordantní pár c) hodnoty u první proměnné stejné, u druhé různé vázaný pár ke k-té proměnné d) hodnoty u první proměnné různé, u druhé stejné vázaný pár k l-té proměnné Symbol P Q T k T l Význam počet konkordantních párůp počet diskordantních párů počet párůp vázaných ke k počet párůp vázaných k l Výpočet pro 2 x 2 ad bc ab + cd ac + bd 30

31 Míry podobnosti pro binárn rní data (8) funkce měr m r pro ordináln lní proměnn nné x k 0 0 x l 0 0 n ij a b c d 3

32 Míry podobnosti pro binárn rní data (9) funkce měr m r pro ordináln lní proměnn nné Goodman-Kruskalova gama Kendallovo tau-b τ b kl = γ = P Q P + Q = ad ad bc + bc = kl Q kl P Q ad bc = ( P + Q + T )( P + Q + T ) ( ad + bc + ab + cd )( ad + bc + ac + bd k l ) Koeficient asociace (korelační koeficient) ad bc r kl = ( a + b)( a + c)( b + d )( c + d ) τb kl = r kl 32

33 Míry nepodobnosti a vzdálenosti pro binárn rní data Binární Lanceova a Williamsova nemetrická míra nepodobnosti b + c 2a + b + c Euklidovská vzdálenost Binární čtvercová euklidovská vzdálenost = Hammingova vzdálenost b + c b + c 33

34 Míra podobnosti pro nomináln lní data Koeficient souhlasu s ij p = l = p g ijl g ijl = x il = x jl a g ijl = 0 v ostatních případech Koeficient nesouhlasu (míra nepodobnosti) d ij = s ij 34

35 Převedení nomináln lních a ordináln lních proměnných na skupinu pomocných binárn rních proměnných Škola P P2 P3 OA 0 0 SPŠ 0 0 SOU 0 0 Odezva P P2 P3 žádná slabá 0 0 střední 0 silná 35

36 Míry pro data různých r typů d ij p l = = p w l = Váha w ijl nabývá hodnot 0 (jestliže hodnota x il nebo x jl chybí nebo jsou obě tyto hodnoty rovny nule a l-tá proměnná je asymetrická binární) nebo (jinak). Míra nepodobnosti d ijl závisí na typu l-té proměnné: x l je binární nebo nominální: d ijl = 0 x il = x jl d ijl = v ostatních případech; x l je měřena na intervalové škále, pak je absolutní hodnota z rozdílu hodnot dělena variačním rozpětím l-té proměnné; x l je ordinální nebo je měřena na poměrové škále, pak jsou hodnoty nahrazeny pořadím, které je převedeno do <0;>. ijl w d ijl ijl 36

37 Analýza v případp padě výskytu chybějících údajů Vynechání páru hodnot (je třeba t použít váhy, viz předchozp edchozí snímek pro data různých typů), vynechání řádku,, kde chybí údaj, nahrazení chybějícího ho údaje aritmetickým průměrem rem (v případp padě kvantitativních dat), vypočítaným nejlépe z blízkých objektů. 37

38 Míry nepodobnosti kódůk kategoriáln lní proměnn nné Chí-kvadrát míra d( a, b) = ( n E( n E( n ) m ac ac m + c= c= ac )) 2 ( n bc E( n E( n ) bc bc )) 2 E( n ac ) ( ) m n ( n + n ) = c= ac ac m n + = m c ac c= n bc bc E( n bc ) ( ) m n ( n + n ) = c= bc ac m n + = m c ac c= n bc bc m m Koeficient fí φ = d( a, b) / ( n + ) c= ac n c= bc 38

39 Monotetická shluková analýza () Míra asociace χ 2 kl = 2 ( akldkl bklckl ) ( akl + bkl + ckl + dkl ) ( a + b )( c + d )( a + c )( b + d ) kl kl kl kl kl kl kl kl Pro l-tou proměnnou: χ l = χl + χl2 + + χl, l + χl, l χlp 2 Jestliže maxχ l 2 l χ 2 0,95 ( p ) pak podle proměnné, pro níž je hodnota největší, rozdělíme skupinu objektů do dvou podskupin. 39

40 Monotetická shluková analýza (2) Termy M M2 M3 M4 M5 M6 M7 M8 M9 M0 M M2 M3 M4 x.j abnormalities age behavior blood close culture depressed discharged disease fast generation oestrogen patients pressure rats respect rise study

41 Monotetická shluková analýza (3) graf ze systému S-PLUSS M M2 M8 M9 M3 M4 M5 M6 M7 M M0 M2 M3 M4 fast culture rats discharged close abnormalities generation age abnormalities behavior blood patients depressed Separation step 4

42 Aglomerativní hierarchická shluková analýza Aglomerativní algoritmy pro zjišťov ování (ne)podobností mezi shluky (v každém m kroku se spojují 2 shluky, které jsou nejpodobnější ší): metoda průměrn rné vazby pro mezishlukové vzdálenosti, metoda průměrn rné vazby pro vnitroshlukové vzdálenosti, metoda nejbližší šího souseda (prosté vazby), metoda nejvzdálen lenějšího souseda (úplné vazby), centroidní metoda, mediánov nová metoda (vážen ená centroidní), Wardova metoda (spojují se shluky, u nichž je přírůstek p celkového vnitroskupinového součtu čtverců odchylek jednotlivých hodnot od shlukového ho průměru ru minimáln lní). 42

43 Aglomerativní hierarchická shluková analýza Metoda nejbližší šího souseda: v. kroku: d(c, i C ) j = d ij ve 2. a další ších krocích: ch: d(c i U C, j C m ) = min(d(c, i C m ), d(c, j C m )) 43

44 Hierarchická shluková analýza Objekt Objekt Převzato: A.D.Gordon, Classification. 44

45 Hierarchická shluková analýza podobnost objektů (dokumentů) Dendrogram (systém STATISTICA) 45

46 Hierarchická shluková analýza podobnost kategorií Počet bodů Typ školy gymnázium obchodní akademie SPŠ SOU

47 Hierarchická shluková analýza podobnost kategorií Dendrogram (výstup z programového systému SPSS) 47

48 Metoda k-průměrů Objekty jsou rozděleny do k shluků (k nutno zadat) náhodně nebo na základz kladě nějaké další informace, pro každý shluk je vypočítán centroid, zkoumají se postupně všechny objekty: pokud mám zkoumaný objekt nejblíže e k vlastnímu centroidu,, je ponechán n v původním m shluku, v opačném m případp padě je přemístěn n do shluku, k jehož centroidu má nejblíže, e, pro nově vytvořen ené shluky opět t vypočítáme centroidy, celý postup je opakován n tak dlouho, dokud dochází k přesunům. 48

49 Metoda k-průměrů graf ze systému STATGRAPHICS 49

50 Fuzzy shluková analýza Metoda vychází z matice nepodobností, pro každý objekt x i a shluk v je počítána míra m u iv. Míra příslup slušnosti musí vyhovovat následujn sledujícím m podmínk nkám:. u iv 0 pro všechna v i =,, n a všechna v v =,, k, k 2. = u = v iv pro všechna i =,, n, Míry u iv definovány ny pomocí minimalizace účelové funkce f: f = k v= n 2 u i, j= iv n j= 2 u u 2 jv 2 jv d ij 50

51 Fuzzy shluková analýza ukázka výstupu ze systému S-PLUSS Membership coefficients: [,] [,2] [,3] [,4]

52 Fuzzy shluková analýza interpretace výstupu Group : abnormalities,, age, blood,, close, disease, respect Group 2: 2 behavior, depressed,, generation, oestrogen,, rise, study Group 3: close, disease, fast,, generation, pressure, rats,, rise Group 4: age, culture, discharged, patients, study 52

53 Dvourozměrn rná shluková analýza Příklad: tři t i proměnn nné,, přičemp emž dvě z nich jsou kategoriáln lní.. Pro každou kombinaci jejich kódůk známe pouze jednu hodnotu třett etí proměnn nné,, jejíž hodnoty jsou pouze 0 a. Vychází se z toho, že e na počátku je každý řádek i každý sloupec samostatným shlukem. Nejprve je pro každý pár p řádků vypočítána vzdálenost (b + c) / (a + b + c + d), obdobně pro sloupce. Je spojen pár p r nejpodobnější ších řádků nebo sloupců. Proces pokračuje do stavu, kdy je výsledkem pouze jeden řádek a jeden sloupec. Matice musí být uspořádána tak, aby shluky byly reprezentovány ny jako spojité bloky. 53

54 Dvourozměrn rná shluková analýza graf ze systému STATISTICA Výsledky dvojrozměrného spojování BLOOD AGE BEHAVIOR DISEASE FAST RISE CULTURE DEPRESSE PATIENTS M M4 M3 M2 M8 M5 M6 M0 M2 M7 M M3 M4 M9 54

55 Příklad. () Podobnost objektů (dokumentů) 55

56 Příklad. (2) Podobnost objektů (dokumentů) Vícerozměrné škálování (systém STATISTICA) 56

57 Příklad 2. () Shlukování binárn rních proměnných Datový soubor tv-survey.sav (systém SPSS) Name any bored critics peers writers director cast Label Any reason There are no other popular shows on at that time The critics still give the show good reviews Other people still watch the show The original screen writers stay with the show The original directors stay with the show The original cast stays with the show 57

58 Příklad 2. (2) Použit ití faktorové analýzy (SPSS) Rotated Component Matrix a Any reason There are no other popular shows on at that time The critics still give the show good reviews Other people still watch the show The original screenwriters stay with the show The original directors stay with the show The original cast stays with the show Extraction Method: Principal Component Analysis. Rotation Method: Varimax with Kaiser Normalization. Component 2 0, , , ,250 0, , , , , , , , ,7079 0, a Rotation converged in 3 iterations. 58

59 Příklad 2. (3) Použit ití shlukové analýzy (SPSS) Míra podobnosti = korelační koeficient 59

60 Příklad 2. (4) Použit ití shlukové analýzy (SPSS) Míra podobnosti = Lance-and-Williams Nonmetric Measure 60

61 Příklad 2. (5) Použit ití vícerozměrného škálování () 6

62 Příklad 2. (6) Použit ití vícerozměrného škálování (2) 62

63 Příklad 3. () Shlukování proměnných Datový soubor GSS93 subset.sav (systém SPSS) Proměnn nná Bigband Blugrass Country Blues Musicals Classicl Folk Jazz Opera Rap Hvymetal Význam Bigband Music Bluegrass Music Country Western Music Blues or R & B Music Broadway Musicals Classical Music Folk Music Jazz Music Opera Rap Music Heavy Metal Music 63

64 Příklad 3. (2) Shluková analýza (STATISTICA) 64

65 Příklad 3. (3) Vícerozměrné škálování (SPSS) 65

66 Příklad 3. (4) Vícerozměrné škálování (SPSS) 66

67 Příklad 3. (5) Kategoriáln lní analýza hlavních komponent (SPSS) 67

68 Příklad 3. (6) Korespondenční analýza (SPSS) 68

69 Příklad 4. () Údaje o dokumentech (Berry( Berry) Termy M M2 M3 M4 M5 M6 M7 M8 M9 M0 M M2 M3 M4 x.j abnormalities age behavior blood close culture depressed discharged disease fast generation oestrogen patients pressure rats respect rise study

70 Příklad 4. (2) výsledek faktorové analýzy 70

71 Příklad 4. (3) Fuzzy shluková analýza (S-PLUS) Membership coefficients: [,] [,2] [,3] [,4]

72 Příklad 4. (4) Fuzzy shluková analýza (S-PLUS) Group : abnormalities,, age, blood,, close, disease, respect Group 2: 2 behavior, depressed,, generation, oestrogen,, rise, study Group 3: close, disease, fast,, generation, pressure, rats,, rise Group 4: age, culture, discharged, patients, study 72

73 Příklad 4. (5) Vícerozměrné škálování (STATISTICA) Dimenze 2,6,4,2,0 0,8 0,6 0,4 0,2 0,0-0,2-0,4-0,6-0,8 -,0 -,2 RISE Bodový graf 2D Konečná konfigurace, dimenze vs. dimenze 2 OESTROGE DEPRESSE RATS FAST STUDY PRESSURE CLOSE PATIENTS CULTURE DISCHARG DISEASE AGE BLOOD BEHAVIOR GENERATI ABNORMAL RESPECT -,4-2,0 -,5 -,0-0,5 0,0 0,5,0,5 Dimenze 73

Úvodem Dříve les než stromy 3 Operace s maticemi

Úvodem Dříve les než stromy 3 Operace s maticemi Obsah 1 Úvodem 13 2 Dříve les než stromy 17 2.1 Nejednoznačnost terminologie 17 2.2 Volba metody analýzy dat 23 2.3 Přehled vybraných vícerozměrných metod 25 2.3.1 Metoda hlavních komponent 26 2.3.2 Faktorová

Více

SHLUKOVÁ ANALÝZA KATEGORIÁLNÍCH DAT

SHLUKOVÁ ANALÝZA KATEGORIÁLNÍCH DAT SHLUKOVÁ ANALÝZA KATEGORIÁLNÍCH DAT Hana Řezanková Vysoká škola ekonomická v Praze htt://nb.vse.cz/~rezanka Analýza dat 27/II Obsah Metody shlukové analýzy Shlukování objektů Shlukování roměnných Shlukování

Více

Vícerozměrné statistické metody

Vícerozměrné statistické metody Vícerozměrné statistické metody Shluková analýza Jiří Jarkovský, Simona Littnerová FSTA: Pokročilé statistické metody Typy shlukových analýz Shluková analýza: cíle a postupy Shluková analýza se snaží o

Více

Vícerozměrné statistické metody

Vícerozměrné statistické metody Vícerozměrné statistické metody Podobnosti a vzdálenosti ve vícerozměrném prostoru, asociační matice II Jiří Jarkovský, Simona Littnerová Vícerozměrné statistické metody Práce s asociační maticí Vzdálenosti

Více

Cvičná bakalářská zkouška, 1. varianta

Cvičná bakalářská zkouška, 1. varianta jméno: studijní obor: PřF BIMAT počet listů(včetně tohoto): 1 2 3 4 5 celkem Cvičná bakalářská zkouška, 1. varianta 1. Matematická analýza Najdětelokálníextrémyfunkce f(x,y)=e 4(x y) x2 y 2. 2. Lineární

Více

5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza

5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza 5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza 5.1 Vícerozměrná data a vícerozměrná rozdělení Při zpracování vícerozměrných dat se hledají souvislosti mezi dvěma, případně

Více

Testování hypotéz a měření asociace mezi proměnnými

Testování hypotéz a měření asociace mezi proměnnými Testování hypotéz a měření asociace mezi proměnnými Testování hypotéz Nulová a alternativní hypotéza většina statistických analýz zahrnuje různá porovnání, hledání vztahů, efektů Tvrzení, že efekt je nulový,

Více

Obsah Úvod Kapitola 1 Než začneme Kapitola 2 Práce s hromadnými daty před analýzou

Obsah Úvod Kapitola 1 Než začneme Kapitola 2 Práce s hromadnými daty před analýzou Úvod.................................................................. 11 Kapitola 1 Než začneme.................................................................. 17 1.1 Logika kvantitativního výzkumu...........................................

Více

NADSTAVBOVÝ MODUL MOHSA V1

NADSTAVBOVÝ MODUL MOHSA V1 NADSTAVBOVÝ MODUL MOHSA V1 Nadstavbový modul pro hierarchické shlukování se jmenuje Mod_Sh_Hier (MOHSA V1) je součástí souboru Shluk_Hier.xls. Tento soubor je přístupný na http://jonasova.upce.cz, a je

Více

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY FAKULTA ELEKTROTECHNIKY A KOMUNIKAČNÍCH TECHNOLOGIÍ ÚSTAV AUTOMATIZACE A MĚŘÍCÍ TECHNIKY FACULTY OF ELECTRICAL ENGINEERING AND COMMUNICATION

Více

Shluková analýza. Jiří Militky. Analýza experimentálních dat V. Červeně označené slide jsou jen pro doplnění informací a nezkouší se.

Shluková analýza. Jiří Militky. Analýza experimentálních dat V. Červeně označené slide jsou jen pro doplnění informací a nezkouší se. Červeně označené slide jsou jen pro doplnění informací a nezkouší se. Shluková analýza Jiří Militky Analýza experimentálních dat V Klasifikace objektů Rozdělení objektů do shluků dle jejich podobnosti

Více

Pojem a úkoly statistiky

Pojem a úkoly statistiky Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Pojem a úkoly statistiky Statistika je věda, která se zabývá získáváním, zpracováním a analýzou dat pro potřeby

Více

PSY117/454 Statistická analýza dat v psychologii Přednáška 10

PSY117/454 Statistická analýza dat v psychologii Přednáška 10 PSY117/454 Statistická analýza dat v psychologii Přednáška 10 TESTY PRO NOMINÁLNÍ A ORDINÁLNÍ PROMĚNNÉ NEPARAMETRICKÉ METODY... a to mělo, jak sám vidíte, nedozírné následky. Smrť Analýza četností hodnot

Více

Profilování vzorků heroinu s využitím vícerozměrné statistické analýzy

Profilování vzorků heroinu s využitím vícerozměrné statistické analýzy Profilování vzorků heroinu s využitím vícerozměrné statistické analýzy Autor práce : RNDr. Ivo Beroun,CSc. Vedoucí práce: prof. RNDr. Milan Meloun, DrSc. PROFILOVÁNÍ Profilování = klasifikace a rozlišování

Více

Grafický a číselný popis rozložení dat 3.1 Způsoby zobrazení dat Metody zobrazení kvalitativních a ordinálních dat Metody zobrazení kvan

Grafický a číselný popis rozložení dat 3.1 Způsoby zobrazení dat Metody zobrazení kvalitativních a ordinálních dat Metody zobrazení kvan 1 Úvod 1.1 Empirický výzkum a jeho etapy 1.2 Význam teorie pro výzkum 1.2.1 Konstrukty a jejich operacionalizace 1.2.2 Role teorie ve výzkumu 1.2.3 Proces ověření hypotéz a teorií 1.3 Etika vědecké práce

Více

SHLUKOVÁ ANALÝZA KRAJŮ ČESKÉ REPUBLIKY DLE VYBRANÝCH CHARAKTERISTIK ZEMĚDĚLSTVÍ V PROGRAMU STATISTICA

SHLUKOVÁ ANALÝZA KRAJŮ ČESKÉ REPUBLIKY DLE VYBRANÝCH CHARAKTERISTIK ZEMĚDĚLSTVÍ V PROGRAMU STATISTICA SHLUKOVÁ ANALÝZA KRAJŮ ČESKÉ REPUBLIKY DLE VYBRANÝCH CHARAKTERISTIK ZEMĚDĚLSTVÍ V PROGRAMU STATISTICA CLUSTER ANALYSIS OF REGIONS OF CZECH REPUBLIC BY SELECTED CHARACTERISTICS OF AGRICULTURE IN PROGRAM

Více

Vícerozměrné metody. PSY117/454 Statistická analýza dat v psychologii Přednáška 12. Schematický úvod

Vícerozměrné metody. PSY117/454 Statistická analýza dat v psychologii Přednáška 12. Schematický úvod PSY117/454 Statistická analýza dat v psychologii Přednáška 12 Vícerozměrné metody Schematický úvod Co je na slově statistika tak divného, že jeho vyslovení tak často způsobuje napjaté ticho? William Kruskal

Více

Základy pravděpodobnosti a statistiky. Popisná statistika

Základy pravděpodobnosti a statistiky. Popisná statistika Základy pravděpodobnosti a statistiky Popisná statistika Josef Tvrdík Přírodovědecká fakulta, katedra informatiky josef.tvrdik@osu.cz konzultace v úterý 14.10 až 15.40 hod. Příklad ze života Cimrman, Smoljak/Svěrák,

Více

6. Testování statistických hypotéz. KGG/STG Zimní semestr 6. Testování statistických hypotéz

6. Testování statistických hypotéz. KGG/STG Zimní semestr 6. Testování statistických hypotéz 6. Testování statistických Testování statistických Princip: Ověř ěřování určit itého předpokladu p zjišťujeme, zda zkoumaný výběr r pochází ze základnz kladního souboru, který mám určit ité rozdělen lení

Více

ZX510 Pokročilé statistické metody geografického výzkumu. Téma: Měření síly asociace mezi proměnnými (korelační analýza)

ZX510 Pokročilé statistické metody geografického výzkumu. Téma: Měření síly asociace mezi proměnnými (korelační analýza) ZX510 Pokročilé statistické metody geografického výzkumu Téma: Měření síly asociace mezi proměnnými (korelační analýza) Měření síly asociace (korelace) mezi proměnnými Vztah mezi dvěma proměnnými existuje,

Více

AVDAT Mnohorozměrné metody, metody klasifikace Shluková analýza

AVDAT Mnohorozměrné metody, metody klasifikace Shluková analýza AVDAT Mnohorozměrné metody, metody klasifikace Shluková analýza Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Shluková analýza Cílem shlukové analýzy je nalézt v datech podmnožiny

Více

Renáta Bednárová STATISTIKA PRO EKONOMY

Renáta Bednárová STATISTIKA PRO EKONOMY Renáta Bednárová STATISTIKA PRO EKONOMY ZÁKLADNÍ STATISTICKÉ POJMY Statistika Statistický soubor Statistická jednotky Statistický znak STATISTIKA Vědní obor, který se zabývá hromadnými jevy Hromadné jevy

Více

Zpracování podkladů pro praktickou část distanční opory pro předmět KZMSA - část hierarchické shlukování Jan Míčka

Zpracování podkladů pro praktickou část distanční opory pro předmět KZMSA - část hierarchické shlukování Jan Míčka Univerzita Pardubice Fakulta ekonomicko-správní Zpracování podkladů pro praktickou část distanční opory pro předmět KZMSA - část hierarchické shlukování Jan Míčka Bakalářská práce 009 Tuto práci jsem

Více

ZX510 Pokročilé statistické metody geografického výzkumu

ZX510 Pokročilé statistické metody geografického výzkumu ZX510 Pokročilé statistické metody geografického výzkumu Téma: Explorační faktorová analýza (analýza hlavních komponent) Smysl a princip faktorové analýzy v explorační verzi není faktorová analýza určena

Více

ANALÝZA A KLASIFIKACE DAT. Institut biostatistiky a analýz

ANALÝZA A KLASIFIKACE DAT. Institut biostatistiky a analýz ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík,, CSc. VII. VOLBA A VÝBĚR PŘÍZNAKŮ ZAČÍNÁME kolik a jaké příznaky? málo příznaků možná chyba klasifikace; moc příznaků možná nepřiměřená pracnost, vysoké

Více

Kontingenční tabulky, korelační koeficienty

Kontingenční tabulky, korelační koeficienty Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Mějme kategoriální proměnné X a Y. Vytvoříme tzv. kontingenční tabulku. Budeme tedy testovat hypotézu

Více

Popisná statistika. Komentované řešení pomocí MS Excel

Popisná statistika. Komentované řešení pomocí MS Excel Popisná statistika Komentované řešení pomocí MS Excel Vstupní data Máme k dispozici data o počtech bodů z 1. a 2. zápočtového testu z Matematiky I v zimním semestru 2015/2016 a to za všech 762 studentů,

Více

Třídění statistických dat

Třídění statistických dat 2.1 Třídění statistických dat Všechny muže ve městě rozdělíme na 2 skupiny: A) muži, kteří chodí k holiči B) muži, kteří se holí sami Do které skupiny zařadíme holiče? prof. Raymond M. Smullyan, Dr. Math.

Více

Statistické metody v ekonomii. Ing. Michael Rost, Ph.D.

Statistické metody v ekonomii. Ing. Michael Rost, Ph.D. Statistické metody v ekonomii Ing. Michael Rost, Ph.D. Jihočeská univerzita v Českých Budějovicích Shluková analýza Shluková analýza je souhrnným názvem pro celou řadu výpočetních algoritmů, jejichž cílem

Více

Stručný úvod do vybraných zredukovaných základů statistické analýzy dat

Stručný úvod do vybraných zredukovaných základů statistické analýzy dat Stručný úvod do vybraných zredukovaných základů statistické analýzy dat Statistika nuda je, má však cenné údaje. Neklesejme na mysli, ona nám to vyčíslí. Z pohádky Princové jsou na draka Populace (základní

Více

Analýza dat na PC I.

Analýza dat na PC I. CENTRUM BIOSTATISTIKY A ANALÝZ Lékařská a Přírodovědecká fakulta, Masarykova univerzita Analýza dat na PC I. Popisná analýza v programu Statistica IBA výuka Základní popisná statistika Popisná statistika

Více

Popisná statistika kvantitativní veličiny

Popisná statistika kvantitativní veličiny StatSoft Popisná statistika kvantitativní veličiny Protože nám surová data obvykle žádnou smysluplnou informaci neposkytnou, je žádoucí vyjádřit tyto ve zhuštěnější formě. V předchozím dílu jsme začali

Více

5. Odhady parametrů. KGG/STG Zimní semestr

5. Odhady parametrů. KGG/STG Zimní semestr Základní soubor Výběr, výběrový (statistický) soubor Náhodný výběr Princip Odhad neznámých parametrů základního souboru na základz kladě charakteristik výběru. Přecházíme z části na celek, zevšeobec eobecňujeme

Více

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1 Logistická regrese Menu: QCExpert Regrese Logistická Modul Logistická regrese umožňuje analýzu dat, kdy odezva je binární, nebo frekvenční veličina vyjádřená hodnotami 0 nebo 1, případně poměry v intervalu

Více

Příklad 2: Určení cihlářských surovin na základě chemické silikátové analýzy

Příklad 2: Určení cihlářských surovin na základě chemické silikátové analýzy Příklad 2: Určení cihlářských surovin na základě chemické silikátové analýzy Zadání: Deponie nadložních jílových sedimentů SHP byla testována za účelem využití v cihlářské výrobě. Z deponie bylo odebráno

Více

MĚŘENÍ STATISTICKÝCH ZÁVISLOSTÍ

MĚŘENÍ STATISTICKÝCH ZÁVISLOSTÍ MĚŘENÍ STATISTICKÝCH ZÁVISLOSTÍ v praxi u jednoho prvku souboru se často zkoumá více veličin, které mohou na sobě různě záviset jednorozměrný výběrový soubor VSS X vícerozměrným výběrovým souborem VSS

Více

Cronbachův koeficient α nová adaptovaná metoda uvedení vlastností položkové analýzy deskriptivní induktivní parametrické

Cronbachův koeficient α nová adaptovaná metoda uvedení vlastností položkové analýzy deskriptivní induktivní parametrické Československá psychologie 0009-062X Metodologické požadavky na výzkumné studie METODOLOGICKÉ POŽADAVKY NA VÝZKUMNÉ STUDIE Výzkumné studie mají přinášet nová konkrétní zjištění získaná specifickými výzkumnými

Více

Matematika pro ekonomiku

Matematika pro ekonomiku Pojistná matematika 14.10.2011 1 I. POJISTNÁ MATEMATIKA Pojistná matematika 2 Základní odvětví: životní pojištění, do něhož spadá výplata předem sjednané částky v případě smrti nebo dožití se určitého

Více

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II Základy biostatistiky II Veřejné zdravotnictví 3.LF UK - II Teoretické rozložení-matematické modely rozložení Naměřená data Výběrové rozložení Teoretické rozložení 1 e 2 x 2 Teoretické rozložení-matematické

Více

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 3. 11.

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 3. 11. UNIVERZITA OBRANY Fakulta ekonomiky a managementu Aplikace STAT1 Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 Jiří Neubauer, Marek Sedlačík, Oldřich Kříž 3. 11. 2012 Popis a návod k použití aplikace

Více

ZÁKLADNÍ STATISTICKÉ CHARAKTERISTIKY

ZÁKLADNÍ STATISTICKÉ CHARAKTERISTIKY zhanel@fsps.muni.cz ZÁKLADNÍ STATISTICKÉ CHARAKTERISTIKY METODY DESKRIPTIVNÍ STATISTIKY 1. URČENÍ TYPU ŠKÁLY (nominální, ordinální, metrické) a) nominální + ordinální neparametrické stat. metody b) metrické

Více

Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012. Tutoriál č. 4: Exploratorní analýza. Jan Kracík

Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012. Tutoriál č. 4: Exploratorní analýza. Jan Kracík Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012 Tutoriál č. 4: Exploratorní analýza Jan Kracík jan.kracik@vsb.cz Statistika věda o získávání znalostí z empirických dat empirická

Více

Statistická analýza jednorozměrných dat

Statistická analýza jednorozměrných dat Statistická analýza jednorozměrných dat Prof. RNDr. Milan Meloun, DrSc. Univerzita Pardubice, Pardubice 31.ledna 2011 Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem

Více

Popisná statistika. Statistika pro sociology

Popisná statistika. Statistika pro sociology Popisná statistika Jitka Kühnová Statistika pro sociology 24. září 2014 Jitka Kühnová (GSTAT) Popisná statistika 24. září 2014 1 / 31 Outline 1 Základní pojmy 2 Typy statistických dat 3 Výběrové charakteristiky

Více

Kontingenční tabulky. (Analýza kategoriálních dat)

Kontingenční tabulky. (Analýza kategoriálních dat) Kontingenční tabulky (Analýza kategoriálních dat) Agenda Standardní analýzy dat v kontingenčních tabulkách úvod, KT, míry diverzity nominálních veličin, některá rozdělení chí kvadrát testy, analýza reziduí,

Více

charakteristiky KGG/STG Zimní semestr Základní statistické charakteristiky, Teoretická rozdělení 1

charakteristiky KGG/STG Zimní semestr Základní statistické charakteristiky, Teoretická rozdělení 1 3. ZákladnZ kladní statistické charakteristiky rozdělení 1 charakteristiky Dva hlavní druhy základnz kladních charakteristik statistického souboru: charakteristiky úrovně,, polohy (středn ední hodnoty)

Více

Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu

Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu K čemu slouží statistika Popisuje velké soubory dat pomocí charakteristických čísel (popisná statistika). Hledá skryté zákonitosti v souborech

Více

Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D.

Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D. Zpracování náhodného výběru popisná statistika Ing. Michal Dorda, Ph.D. Základní pojmy Úkolem statistiky je na základě vlastností výběrového souboru usuzovat o vlastnostech celé populace. Populace(základní

Více

2. Statistická terminologie a vyjadřovací prostředky. 2.1. Statistická terminologie. Statistická jednotka

2. Statistická terminologie a vyjadřovací prostředky. 2.1. Statistická terminologie. Statistická jednotka 2. Statistická terminologie a vyjadřovací prostředky 2.1. Statistická terminologie Statistická jednotka Statistická jednotka = nositel statistické informace, elementární prvek hromadného jevu. Příklady:

Více

Univerzita Pardubice. Fakulta ekonomicko-správní

Univerzita Pardubice. Fakulta ekonomicko-správní Univerzita Pardubice Fakulta ekonomicko-správní Nadstavbový modul v MS Excel pro metody hierarchického shlukování. Jaroslav Lohynský Diplomová práce 2011 Prohlašuji: Tuto práci jsem vypracoval samostatně.

Více

Spokojenost se životem

Spokojenost se životem SEMINÁRNÍ PRÁCE Spokojenost se životem (sekundárních analýza dat sociologického výzkumu Naše společnost 2007 ) Předmět: Analýza kvantitativních revize Šafr dat I. Jiří (18/2/2012) Vypracoval: ANONYMIZOVÁNO

Více

6. Lineární regresní modely

6. Lineární regresní modely 6. Lineární regresní modely 6.1 Jednoduchá regrese a validace 6.2 Testy hypotéz v lineární regresi 6.3 Kritika dat v regresním tripletu 6.4 Multikolinearita a polynomy 6.5 Kritika modelu v regresním tripletu

Více

Název testu Předpoklady testu Testová statistika Nulové rozdělení. ( ) (p počet odhadovaných parametrů)

Název testu Předpoklady testu Testová statistika Nulové rozdělení. ( ) (p počet odhadovaných parametrů) VYBRANÉ TESTY NEPARAMETRICKÝCH HYPOTÉZ TESTY DOBRÉ SHODY Název testu Předpoklady testu Testová statistika Nulové rozdělení test dobré shody Očekávané četnosti, alespoň 80% očekávaných četností >5 ( ) (p

Více

Úkol 1.: Testování nezávislosti nominálních veličin V roce 1950 zkoumali Yule a Kendall barvu očí a vlasů u 6800 mužů.

Úkol 1.: Testování nezávislosti nominálních veličin V roce 1950 zkoumali Yule a Kendall barvu očí a vlasů u 6800 mužů. Téma 10: Analýza závislosti dvou nominálních veličin Úkol 1.: Testování nezávislosti nominálních veličin V roce 1950 zkoumali Yule a Kendall barvu očí a vlasů u 6800 mužů. barva očí barva vlasů světlá

Více

Fakulta chemicko technologická Katedra analytické chemie

Fakulta chemicko technologická Katedra analytické chemie Fakulta chemicko technologická Katedra analytické chemie Licenční studium statistické zpracování dat Analýza vícerozměrných dat Ing. Pavel Valášek Školní rok OBSAH ÚVOD DATA EDA EXPLORATORÍ AALÝZA 4 PCA

Více

Shluková analýza. 1 Úvod Formulace úlohy Typy metod shlukové analýzy... 2

Shluková analýza. 1 Úvod Formulace úlohy Typy metod shlukové analýzy... 2 Shluková analýza Jan Kelbel David Šilhán Obsah 1 Úvod 1 1.1 Formulace úlohy................................. 1 1.2 Typy metod shlukové analýzy.......................... 2 2 Objekty a znaky 2 2.1 Typy znaků....................................

Více

Cíl Vyhodnotit současný stav migračně prostorové diferenciace území ČR a migrační tendence na základě údajů za obce ČR

Cíl Vyhodnotit současný stav migračně prostorové diferenciace území ČR a migrační tendence na základě údajů za obce ČR Cíl Vyhodnotit současný stav migračně prostorové diferenciace území ČR a migrační tendence na základě údajů za obce ČR Data Obce ČR 2011 (Veřejná databáze ČSÚ) SPSS IBM, ArcGIS Proměnné: intenzita migračního

Více

STATISTIKA. Inovace předmětu. Obsah. 1. Inovace předmětu STATISTIKA... 2 2. Sylabus pro předmět STATISTIKA... 3 3. Pomůcky... 7

STATISTIKA. Inovace předmětu. Obsah. 1. Inovace předmětu STATISTIKA... 2 2. Sylabus pro předmět STATISTIKA... 3 3. Pomůcky... 7 Inovace předmětu STATISTIKA Obsah 1. Inovace předmětu STATISTIKA... 2 2. Sylabus pro předmět STATISTIKA... 3 3. Pomůcky... 7 1 1. Inovace předmětu STATISTIKA Předmět Statistika se na bakalářském oboru

Více

EKOLOGICKÁ PODOBNOST (ECOLOGICAL RESEMBLANCE) David Zelený Zpracování dat v ekologii společenstev

EKOLOGICKÁ PODOBNOST (ECOLOGICAL RESEMBLANCE) David Zelený Zpracování dat v ekologii společenstev EKOLOGICKÁ PODOBNOST (ECOLOGICAL RESEMBLANCE) EKOLOGICKÁ PODOBNOST Q VS R ANALÝZA Vzorky Druhy druh 1 druh 2 druh 3 vzorek 1 0 1 1 vzorek 2 1 0 0 vzorek 3 0 4 4 vztahy mezi vzorky Q analýza vztahy mezi

Více

Zpracování vícerozměrných dat pomocí analýzy shluků Multidimensional Data Processing by Cluster Analysis

Zpracování vícerozměrných dat pomocí analýzy shluků Multidimensional Data Processing by Cluster Analysis Zpracování vícerozměrných dat pomocí analýzy shluků Multidimensional Data Processing by Cluster Analysis Ing. Jitka Svobodová Ing. Jana Pružinová Abstrakt Příspěvek diskutuje možnosti zpracování velkých

Více

Program Statistica Base 9. Mgr. Karla Hrbáčková, Ph.D.

Program Statistica Base 9. Mgr. Karla Hrbáčková, Ph.D. Program Statistica Base 9 Mgr. Karla Hrbáčková, Ph.D. OBSAH KURZU obsluha jednotlivých nástrojů, funkce pro import dat z jiných aplikací, práce s popisnou statistikou, vytváření grafů, analýza dat, výstupní

Více

Statistické vyhodnocování ankety pilotního projektu Kvalita výuky na Západočeské univerzitě v Plzni

Statistické vyhodnocování ankety pilotního projektu Kvalita výuky na Západočeské univerzitě v Plzni Statistické vyhodnocování ankety pilotního projektu Kvalita výuky na Západočeské univerzitě v Plzni Kvantifikace dat Pro potřeby statistického zpracování byly odpovědi převedeny na kardinální intervalovou

Více

Kartografické stupnice. Přednáška z předmětu Tematická kartografie (KMA/TKA) Otakar Čerba Západočeská univerzita

Kartografické stupnice. Přednáška z předmětu Tematická kartografie (KMA/TKA) Otakar Čerba Západočeská univerzita Kartografické stupnice Přednáška z předmětu Tematická kartografie (KMA/TKA) Otakar Čerba Západočeská univerzita Datum vytvoření dokumentu: 20. 9. 2004 Datum poslední aktualizace: 16. 10. 2012 Stupnice

Více

Navrhování experimentů a jejich analýza. Eva Jarošová

Navrhování experimentů a jejich analýza. Eva Jarošová Navrhování experimentů a jejich analýza Eva Jarošová Obsah Základní techniky Vyhodnocení výsledků Experimenty s jedním zkoumaným faktorem Faktoriální experimenty úplné 2 N dílčí 2 N-p Experimenty pro studium

Více

Jana Vránová, 3. lékařská fakulta UK

Jana Vránová, 3. lékařská fakulta UK Jana Vránová, 3. lékařská fakulta UK Vznikají při zkoumání vztahů kvalitativních resp. diskrétních znaků Jedná se o analogii s korelační analýzou spojitých znaků Přitom předpokládáme, že každý prvek populace

Více

Epidemiologické ukazatele. lních dat. analýza kategoriáln. Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat. a I E

Epidemiologické ukazatele. lních dat. analýza kategoriáln. Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat. a I E Testování statistických hypotéz z a analýza kategoriáln lních dat Prof. RNDr. Jana Zvárová, DrSc. Epidemiologické ukazatele Rizikový faktor Populace Přítomen Nepřítomen Celkem Nemocní a b a+b Kontroly

Více

7. Rozdělení pravděpodobnosti ve statistice

7. Rozdělení pravděpodobnosti ve statistice 7. Rozdělení pravděpodobnosti ve statistice Statistika nuda je, má však cenné údaje, neklesejte na mysli, ona nám to vyčíslí Jednou z úloh statistiky je odhad (výpočet) hodnot statistického znaku x i,

Více

Číselné charakteristiky

Číselné charakteristiky . Číselné charakteristiky statistických dat Průměrný statistik se během svého života ožení s 1,75 ženami, které se ho snaží vytáhnout večer do společnosti,5 x týdně, ale pouze s 50% úspěchem. W. F. Miksch

Více

Statistické metody uţívané při ověřování platnosti hypotéz

Statistické metody uţívané při ověřování platnosti hypotéz Statistické metody uţívané při ověřování platnosti hypotéz Hypotéza Domněnka, předpoklad Nejčastěji o rozdělení, středních hodnotách, závislostech, Hypotézy ve vědeckém výzkumu pracovní, věcné hypotézy

Více

Metody sociálních výzkumů. Velmi skromný úvod do statistiky. Motto: Jsou tři druhy lži-lež prostá, lež odsouzeníhodná a statistika.

Metody sociálních výzkumů. Velmi skromný úvod do statistiky. Motto: Jsou tři druhy lži-lež prostá, lež odsouzeníhodná a statistika. Metody sociálních výzkumů Velmi skromný úvod do statistiky. Motto: Jsou tři druhy lži-lež prostá, lež odsouzeníhodná a statistika. Statistika Význam slova-vychází ze slova stát, s jeho administrativou

Více

KGG/STG Statistika pro geografy

KGG/STG Statistika pro geografy KGG/STG Statistika pro geografy 9. Korelační analýza Mgr. David Fiedor 20. dubna 2015 Analýza závislostí v řadě geografických disciplín studujeme jevy, u kterých vyšetřujeme nikoliv pouze jednu vlastnost

Více

Zápočtová práce STATISTIKA I

Zápočtová práce STATISTIKA I Zápočtová práce STATISTIKA I Obsah: - úvodní stránka - charakteristika dat (původ dat, důvod zpracování,...) - výpis naměřených hodnot (v tabulce) - zpracování dat (buď bodové nebo intervalové, podle charakteru

Více

Test dobré shody v KONTINGENČNÍCH TABULKÁCH

Test dobré shody v KONTINGENČNÍCH TABULKÁCH Test dobré shody v KONTINGENČNÍCH TABULKÁCH Opakování: Mějme náhodné veličiny X a Y uspořádané do kontingenční tabulky. Řekli jsme, že nulovou hypotézu H 0 : veličiny X, Y jsou nezávislé zamítneme, když

Více

Pearsonův korelační koeficient

Pearsonův korelační koeficient I I.I Pearsonův korelační koeficient Úvod Předpokládejme, že náhodně vybereme n objektů (nebo osob) ze zkoumané populace. Často se stává, že na každém z objektů měříme ne pouze jednu, ale několik kvantitativních

Více

Vysoká škola báňská technická univerzita Ostrava. Fakulta elektrotechniky a informatiky

Vysoká škola báňská technická univerzita Ostrava. Fakulta elektrotechniky a informatiky Vysoká škola báňská technická univerzita Ostrava Fakulta elektrotechniky a informatiky Bankovní účty (semestrální projekt statistika) Tomáš Hejret (hej124) 18.5.2013 Úvod Cílem tohoto projektu, zadaného

Více

Automatická analýza signálu EKG

Automatická analýza signálu EKG Rok / Year: Svazek / Volume: Číslo / Issue: 2013 15 5 Automatická analýza signálu EKG Automatic ECG signal analysis David Pospíšil 1, Martin Klimek 2, Jiří Kozumplík 2 david.pospisil@fnbrno.cz, xklime23@stud.feec.vutbr.cz,

Více

Kombinatorika, pravděpodobnost a statistika, Posloupnosti a řady

Kombinatorika, pravděpodobnost a statistika, Posloupnosti a řady Předmět: Náplň: Třída: Počet hodin: Pomůcky: Matematika Kombinatorika, pravděpodobnost a statistika, Posloupnosti a řady 4. ročník 3 hodiny týdně PC a dataprojektor Kombinatorika Řeší jednoduché úlohy

Více

ANALÝZA DAT V R 3. POPISNÉ STATISTIKY, NÁHODNÁ VELIČINA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK

ANALÝZA DAT V R 3. POPISNÉ STATISTIKY, NÁHODNÁ VELIČINA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK ANALÝZA DAT V R 3. POPISNÉ STATISTIKY, NÁHODNÁ VELIČINA Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK www.biostatisticka.cz POPISNÉ STATISTIKY - OPAKOVÁNÍ jedna kvalitativní

Více

Řešení příkladu - klasifikace testovacího subjektu podle minimální vzdálenosti:

Řešení příkladu - klasifikace testovacího subjektu podle minimální vzdálenosti: Řešení příkladu - klasifikace testovacího subjektu podle minimální vzdálenosti: Postup: I) zvolení metriky pro výpočet vzdáleností dvou bodů II) zvolení metriky pro určení vzdálenosti mezi dvěma množinami

Více

ANALÝZA KATEGORIZOVANÝCH DAT V SOCIOLOGII

ANALÝZA KATEGORIZOVANÝCH DAT V SOCIOLOGII ANALÝZA KATEGORIZOVANÝCH DAT V SOCIOLOGII Tomáš Katrňák Fakulta sociálních studií Masarykova univerzita Brno SOCIOLOGIE A STATISTIKA nadindividuální společenské struktury podmiňují lidské chování (Durkheim)

Více

analýza kategoriáln lních dat Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat Epidemiologické ukazatele

analýza kategoriáln lních dat Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat Epidemiologické ukazatele Testování statistických hypotéz z a analýza kategoriáln lních dat Prof. RNDr. Jana Zvárová, DrSc. 1 Záznam epidemiologických dat Rizikový faktor Populace Přítomen Nepřítomen Celkem Nemocní a b a+b Kontroly

Více

STATISTIKA 1. Adam Čabla Katedra statistiky a pravděpodobnosti VŠE

STATISTIKA 1. Adam Čabla Katedra statistiky a pravděpodobnosti VŠE STATISTIKA 1 Adam Čabla Katedra statistiky a pravděpodobnosti VŠE KONTAKTY WWW: sites.google.com/site/adamcabla E-mail: adam.cabla@vse.cz Telefon: 777 701 783 NB367 na VŠE, konzultační hodiny: Pondělí

Více

Shluková analýza. shlukovací metodě

Shluková analýza. shlukovací metodě Shluková analýza (Cluster analysis, numerická taxonomie,... ) Cíle shlukové analýzy : ne testovací, ale popisné: klasifikace objektů (Q-technika) nebo znaků (R-technika) nalezení typů generování hypotéz

Více

SEMESTRÁLNÍ PRÁCE 3.5 Klasifikace analýzou vícerozměrných dat

SEMESTRÁLNÍ PRÁCE 3.5 Klasifikace analýzou vícerozměrných dat UNIVERZITA PARDUBICE FAKULTA CHEMICKO-TECHNOLOGICKÁ KATEDRA ANALYTICKÉ CHEMIE LICENČNÍ STUDIUM - STATISTICKÉ ZPRACOVÁNÍ DAT SEMESTRÁLNÍ PRÁCE Ing. Věra Fialová BIOPHARM VÝZKUMNÝ ÚSTAV BIOFARMACIE A VETERINÁRNÍCH

Více

LEKCE12 FAKTOROVÁ ANALÝZA vzorový výsledek cvičení

LEKCE12 FAKTOROVÁ ANALÝZA vzorový výsledek cvičení 1 LEKCE12 FAKTOROVÁ ANALÝZA vzorový výsledek cvičení 12.1 Pokuste se najít v položkách na nichž respondenti oceňovali jednotlivé prvky vybavenosti AQUAPARKU příbuznost voleb. Identifikujte v položkách

Více

Shluková analýza příklad

Shluková analýza příklad Shluková analýza příklad K dispozici jsou údaje o složení vybraných přírodních a minerálních vod. Pracujeme s následujícím seznamem proměnných: Dané hodnoty vznikly tak, že byl zjištěn u všech vod celkový

Více

Předmluva S o u h rn... 89

Předmluva S o u h rn... 89 Obsah Předmluva... 17 1 Ú v o d... 2 1 1.1 Empirický výzkum a jeho etap y... 23 1.2 Význam teorie pro v ý zk u m... 27 1.2.1 Konstrukty a jejich operacionalizace... 27 1.2.2 Role teorie ve v ý zk u m u...

Více

Vícerozměrné statistické metody

Vícerozměrné statistické metody Vícerozměrné statistické metody Vícerozměrné statistické rozdělení a testy, operace s vektory a maticemi Jiří Jarkovský, Simona Littnerová FSTA: Pokročilé statistické metody Vícerozměrné statistické rozdělení

Více

Cvičení 12: Binární logistická regrese

Cvičení 12: Binární logistická regrese Cvičení 12: Binární logistická regrese Příklad: V roce 2014 konalo státní závěrečné zkoušky bakalářského studia na jisté fakultě 167 studentů. U každého studenta bylo zaznamenáno jeho pohlaví (0 žena,

Více

Rosenblattův perceptron

Rosenblattův perceptron Perceptron Přenosové funkce Rosenblattův perceptron Rosenblatt r. 1958. Inspirace lidským okem Podle fyziologického vzoru je třívrstvá: Vstupní vrstva rozvětvovací jejím úkolem je mapování dvourozměrného

Více

veličin, deskriptivní statistika Ing. Michael Rost, Ph.D.

veličin, deskriptivní statistika Ing. Michael Rost, Ph.D. Vybraná rozdělení spojitých náhodných veličin, deskriptivní statistika Ing. Michael Rost, Ph.D. Třídění Základním zpracováním dat je jejich třídění. Jde o uspořádání získaných dat, kde volba třídícího

Více

Pravděpodobnost a statistika

Pravděpodobnost a statistika Pravděpodobnost a statistika Teorie pravděpodobnosti popisuje vznik náhodných dat, zatímco matematická statistika usuzuje z dat na charakter procesů, jimiž data vznikla. NÁHODNOST - forma existence látky,

Více

Informační technologie a statistika 1

Informační technologie a statistika 1 Informační technologie a statistika 1 přednášející: konzul. hodiny: e-mail: Martin Schindler KAP, tel. 48 535 2836, budova G po dohodě martin.schindler@tul.cz naposledy upraveno: 21. září 2015, 1/33 Požadavek

Více

Shluková analýza vícerozměrných dat v programu R

Shluková analýza vícerozměrných dat v programu R Shluková analýza vícerozměrných dat v programu R - příklad použití metod PAM, CLARA a fuzzy shlukové analýzy http://data.tulipany.cz Úvodní poznámky a popis dat Pro analýzu vícerozměrných dat existují

Více

marek.pomp@vsb.cz http://homel.vsb.cz/~pom68

marek.pomp@vsb.cz http://homel.vsb.cz/~pom68 Statistika B (151-0303) Marek Pomp ZS 2014 marek.pomp@vsb.cz http://homel.vsb.cz/~pom68 Cvičení: Pavlína Kuráňová & Marek Pomp Podmínky pro úspěšné ukončení zápočet 45 bodů, min. 23 bodů, dvě zápočtové

Více

Tomáš Karel LS 2012/2013

Tomáš Karel LS 2012/2013 Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není

Více

Neuronové časové řady (ANN-TS)

Neuronové časové řady (ANN-TS) Neuronové časové řady (ANN-TS) Menu: QCExpert Prediktivní metody Neuronové časové řady Tento modul (Artificial Neural Network Time Series ANN-TS) využívá modelovacího potenciálu neuronové sítě k predikci

Více

Stav Svobodný Rozvedený Vdovec. Svobodná 37 10 6. Rozvedená 8 12 8. Vdova 5 8 6

Stav Svobodný Rozvedený Vdovec. Svobodná 37 10 6. Rozvedená 8 12 8. Vdova 5 8 6 1. Příklad Byly sledovány rodinné stavy nevěst a ženichů při uzavírání sňatků a byla vytvořena následující tabulka četností. Stav Svobodný Rozvedený Vdovec Svobodná 37 10 6 Rozvedená 8 12 8 Vdova 5 8 6

Více

Hranová konzistence. Arc consistency AC. Nejprve se zabýváme binárními CSP. podmínka odpovídá hraně v grafu podmínek

Hranová konzistence. Arc consistency AC. Nejprve se zabýváme binárními CSP. podmínka odpovídá hraně v grafu podmínek Hranová konzistence Arc consistency AC Nejprve se zabýváme binárními CSP podmínka odpovídá hraně v grafu podmínek Hrana (V i, V j ) je hranově konzistentní, právě když pro každou hodnotu x z aktuální domény

Více