VYSOKÁ ŠKOLA POLYTECHNICKÁ JIHLAVA

Rozměr: px
Začít zobrazení ze stránky:

Download "VYSOKÁ ŠKOLA POLYTECHNICKÁ JIHLAVA"

Transkript

1 VYSOKÁ ŠKOLA POLYTECHNICKÁ JIHLAVA Katedra matematiky STATISTIKA V SPSS Jana Borůvková, Petra Horáčková, Miroslav Hanáček 2014

2 Jana Borůvková, Petra Horáčková, Miroslav Hanáček STATISTIKA V SPSS 1. vydání ISBN Vydala Vysoká škola polytechnická Jihlava, Tolstého 16, Jihlava, 2014 Tisk Ediční oddělení VŠPJ, Tolstého 16, Jihlava Za jazykovou a věcnou správnost obsahu díla odpovídá autor. Text neprošel jazykovou ani redakční úpravou. Jana Borůvková, Petra Horáčková, Miroslav Hanáček,

3 Vážení čtenáři, dostává se vám do ruky studijní text primárně určený studentům katedry zdravotnických studií, jehož obsahem je popis základních statistických metod a jejich aplikace s využitím statistického softwaru IBM SPSS. Text je rozdělen do tří stejně strukturovaných částí. V první teoretické, části lze nalézt stručný popis základních statistických metod a způsob jejich využití při analýze dat. Na tuto část navazují Řešené příklady softwarem IBM SPSS, ve které naleznete podrobný popis postupu při zpracování dat včetně interpretací výsledků spočítaných tímto softwarem. Studijní text je završen krátkou sbírkou úkolů a příkladů určených k samostatnému řešení, aby bylo čtenáři umožněno ověřit si, že studovanou problematiku pochopil a umí ji v praxi aplikovat. Jak již bylo řečeno, všechny tři části obsahují shodná témata. Jedná se o popisnou statistiku (třídění dat a výpočet příslušných charakteristik), grafickou prezentaci dat, korelační analýzu, regresní analýzu a testování hypotéz (t-testy, neparametrické testy a chí-kvadrát test o nezávislosti). Tento studijní text pokrývá jednosemestrovou výuku statistiky s hodinovou dotací 0/1, takže si v žádném případě neklade za cíl úplný a vyčerpávající popis studované tématiky ani do hloubky ani do šířky. Cílem autorů bylo vytvořit studijní text, který bude prvním průvodcem studentům i vyučujícím VŠPJ v případě, že se rozhodnou zpracovat svá data získaná pro seminární práce, bakalářské práce nebo odborné články s využitím softwaru IBM SPSS, který je na VŠPJ dostupný jak studentům, tak i vyučujícím. kolektiv autorů Jihlava, únor

4 Obsah Teoreticka c a st 1 Popisná statistika Základní statistické pojmy Typy dat Základní zpracování statistických údajů Charakteristiky polohy (úrovně) Charakteristiky variability Charakteristiky šikmosti a špičatosti Grafická prezentace dat Grafické znázornění dat tříděných bodovým tříděním Grafické znázornění dat tříděných intervalovým tříděním Grafické znázornění závislosti dvou proměnných bodový graf Grafické znázornění časové řady spojnicový graf Korelační analýza Regresní analýza Testování hypotéz Postup při testování hypotéz Chyba I. a II. druhu Rozdělení statistických testů Kontingenční tabulky Neparametrické testy T-testy

5 R es ene pr ı klady softwarem SPSS 1 Sběr dat a jejich příprava pro import do softwaru SPSS Vytvoření datové matice v MS Excel Import dat do softwaru SPSS Příprava datové matice Popisná statistika Grafická prezentace dat Grafická prezentace kategoriálních dat Kategorizované grafy Spojitá proměnná Závislost proměnných bodový graf Spojnicový graf Korelační analýza Pearsonova korelační analýza Pořadová korelace Lineární regrese Jedna nezávislá proměnná Více nezávislých proměnných Testování hypotéz Neparametrické testy Parametrické testy

6 Pr ı klady k procvic enı 1 Popisná statistika Otázky k datovému souboru Spánek.xlsx Otázky k datovému souboru Zaměstnanec.xlsx Otázky k datovému souboru Náročnost povolání zdravotní sestry.xlsx Grafické zpracování dat Otázky k datovému souboru Spánek.xlsx Otázky k datovému souboru Zaměstnanec.xlsx Otázky k datovému souboru Náročnost povolání zdravotní sestry.xlsx Korelační analýza Otázky k souboru Korelace a regrese.xlxs Otázky k souboru Spánek.xlsx Otázky k souboru Zaměstnanec.xlsx Otázky k souboru Náročnost povolání.xlsx Regresní analýza Otázky k souboru Korelace a regrese.xlsx Otázky k souboru Náročnost povolání.xlsx Otázky k souboru Spánek.xlsx Testování hypotéz Neparametrické testy Parametrické testy

7 Teoreticka c a st 7

8 1 Popisná statistika Se statistickým zpracováním dat se setkáváme už od starověku. Tehdy se jednalo o soupisy obyvatel, nejčastěji pro daňové účely. V dnešní době už neexistuje vědní obor, ve kterém by se nepracovalo s hromadnými daty a k jejich vyhodnocení by se nevyužilo statistických metod. Údajů, které získáváme, je často mnoho, proto je musíme zpracovat, zpřehlednit. Pokud takto učiníme např. pomocí tabulek rozdělení četností, grafickou vizualizací dat nebo pomocí některých charakteristik popisné statistiky (průměr, střední hodnoty, extrémní hodnoty, ) jsme na začátku statistického zpracování dat, protože zatím jde jen o prvotní popis resp. o přiblížení se podstatě věci. V dnešní době bychom se také těžko obešli bez zpracování dat pomocí některého statistického softwaru, jako je např. Statistica, SPSS, případně statistických funkcí v běžném MS Excel nebo OpenOffice. 1.1 Základní statistické pojmy Většinou současně analyzujeme více objektů, událostí, procesů, skutečností. Ty samy o sobě ještě netvoří statistiku. Statistika se tedy zabývá zpracováním a zkoumáním hromadných jevů. Množina zkoumaných objektů se ve statistice nazývá statistický soubor. Počet prvků této množiny nazýváme rozsah souboru a značíme ho. Základní prvky statistického pozorování se nazývají statistické jednotky. Celý statistický soubor se nazývá populace nebo základní soubor. Pokud z populace vybereme podle předem stanovených pravidel množinu statistických jednotek, nazýváme ji výběrový soubor nebo vzorek. Je to část základního souboru, kterou zkoumáme, a pokud jsme data získali v souladu s teorií pravděpodobnosti, můžeme získané výsledky zobecnit na celou populaci. Statistické jednotky mají řadu různých vlastností, které potom dál analyzujeme. Nazýváme je proměnné (případy, statistické znaky). Hodnoty, které proměnná nabývá, nazýváme obměna statistického znaku. 1.2 Typy dat Z hlediska základního zpracování dat dělíme proměnné na dva základní typy: 1. kategoriální, 2. spojité. Kategoriální proměnné dále dělíme na: a. nominální (vždy slovní), 8

9 b. ordinální slovní, c. ordinální číselné. Kategoriální proměnné jsou ty, u kterých je počet obměn statistického znaku rozumný. Nelze přesně říci, co ještě považujeme za rozumný počet, protože to závisí i na rozsahu souboru. Zpravidla budeme počet obměn považovat za rozumný, bude-li menší než 10. Ale máme-li soubor velkého rozsahu (několik tisíc statistických jednotek), může být za rozumný počet obměn považováno i 20 či 25 obměn statistického znaku. Nominální proměnné jsou vždy slovní. Je pro ně typické to, že obměny této proměnné nemají žádné přirozené pořadí. Příkladem může být používaný dopravní prostředek pro cestu do školy/práce. Pořadí, v jakém vyjmenováváme obměny statistického znaku, se řídí jejich významností, tedy četností, s jakou se v datech vyskytují. Ordinální proměnné mohou být jak slovní, tak i číselné. Obměny statistického znaku mají vždy přirozené pořadí, které je nutné respektovat. Například nejvyšší dosažené vzdělání je smysluplné uvádět v pořadí: základní, středoškolské bez maturity, středoškolské s maturitou, bakalářské, magisterské, doktorské. Spojité proměnné jsou vždy číselné a vykazují se vysokým počtem obměn statistického znaku. Počet obměn je tak vysoký, že jejich vyjmenování nepřináší již lépe vypovídající pohled na data, jak je tomu v případě kategoriální proměnné. Proto u této proměnné nestačí obměny vyjmenovat, ale je nutné je seskupit do intervalů a nadále prezentovat jako intervaly, případně jako středy těchto intervalů. 1.3 Základní zpracování statistických údajů Výsledkem statistického šetření je zpravidla databáze s mnoha řádky a sloupci a ani zkušený pracovník z nich mnoho nevyčte. Informace musíme zpřehlednit, abychom jednoduše viděli, jakých hodnot daná proměnná nabývá a kolikrát se obměny vyskytují, tzv. četnosti. Tuto činnost nazýváme třídění dat a pro každou proměnnou vytvoříme tabulku rozdělení četností (frekvenční tabulku) Bodové třídění Bodové třídění používáme pro kategoriální proměnné (nominální a ordinální) s rozumným počtem obměn (zpravidla do 10, ale pro soubory s velkým rozsahem třeba i 15 nebo 20). 9

10 Takto můžeme třídit počet narozených dětí, známky ve škole, pohlaví, kraje, míru souhlasu s výrokem vyjádřenou např. na škále 1 7, Tabulka rozdělení četností obsahuje: pořadové číslo obměny (nemusí být uvedeno), hodnotu znaku, absolutní četnost, relativní četnost, můžeme uvádět v % (100 %), kumulativní relativní četnost, můžeme uvádět v % (100 %). Kumulativní relativní četnost u nominálních dat nemá smysl (neexistuje přirozené pořadí dat). Pro absolutní četnost platí ( je rozsah souboru, j je počet tříd). Pro relativní četnost platí. Pro kumulativní relativní četnost platí. Ukázka bodového třídění nominálního (tedy slovního) znaku je v tabulce 1-1. Obměny jsou seřazeny podle absolutní četnosti sestupně. Tabulka1-1: Příklad tabulky rozdělení četností pro nominální znak Počet bytů v osobním vlastnictví Jihlava ,236 Havl. Brod ,214 Žďár nad Sázavou ,193 Třebíč ,180 Pelhřimov ,178 Celkem ,000 10

11 V tabulce 1-2 je ukázka bodového třídění ordinálního znaku. Obměny jsou seřazeny podle přirozeného pořadí. Tabulka 1-2: Počet dětí v rodině, příklad tabulky rozdělení četností diskrétní ordinální proměnné ,063 0, ,281 0, ,463 0, ,162 0, ,029 0, ,002 1,000 Celkem ,000 x Intervalové třídění Intervalové třídění používáme pro číselnou proměnnou, která má velké množství obměn, takže by potom bodové třídění nemělo smysl. Hodnoty znaků sdružujeme do intervalů, které mají obvykle (pro jednoduchost) stejnou šířku, značíme ji. Hledaný počet intervalů zpravidla závisí na počtu pozorování a můžeme ho vyjádřit např. pomocí Sturgesova pravidla 13,3log, kde je počet intervalů a rozsah souboru. Intervaly volíme tak, aby se nepřekrývaly a těsně na sebe navazovaly. Pro odlehlé hodnoty nevytváříme samostatný interval, ale zahrneme je do prvního nebo posledního intervalu. Tabulka rozdělení četností obsahuje: pořadové číslo obměny (nemusí být uvedeno), značíme, intervaly, středy intervalů, absolutní četnost, relativní četnost, můžeme uvádět v procentech (100 %), kumulativní relativní četnost, můžeme uvádět v procentech (100 %). 11

12 Vzorce pro absolutní četnost, relativní četnost a kumulativní relativní četnost jsou stejné jako u bodového třídění. Tabulka 1-3 je ukázkou tabulky rozdělení četností při intervalovém třídění dat. Tabulka 1-3: Hmotnost dívek, příklad tabulky rozdělení četností pro spojitý číselný znak intervaly 1 (40 46> ,030 0,030 2 (46 52> ,131 0,161 3 (52 58> ,303 0,464 4 (58 64> ,281 0,745 5 (64 70> ,180 0,925 6 (70 76> ,045 0,970 7 (76 82> ,030 1,000 Celkem x x 267 1,000 x 1.4 Charakteristiky polohy (úrovně) K základním charakteristikám polohy patří: Extrémy minimum, resp. Maximum je nejmenší, resp. největší hodnota v datovém souboru. Aritmetický průměr. Jedná se o nejznámější, a proto nejpoužívanější charakteristiku polohy. Ne vždy však je vhodná pro popis datového souboru. Máme-li datový soubor zešikmený, je aritmetický průměr nevhodnou charakteristikou. Vyplývá to ze způsobu výpočtu (n je rozsah souboru): 12 Použití tohoto vzorce předpokládá, že máme k dispozici všechny naměřené hodnoty, tedy data netříděná. Takto vypočítaný aritmetický průměr nazýváme prostý aritmetický průměr. V praxi však máme velmi často k dispozici pouze tříděná data a musíme tedy pro výpočet aritmetického průměru použít jiný vztah (j je počet tříd):..

13 Takto vypočítaný aritmetický průměr nazýváme vážený aritmetický průměr. Máme-li data tříděná bodovým tříděním, vychází prostý aritmetický průměr i vážený aritmetický průměr stejně. V případě intervalového třídění jsou data charakterizovaná pouze středem intervalu, tříděním dochází ke ztrátě původních hodnot, a proto i prostý aritmetický průměr z původních dat se zpravidla nepatrně liší od váženého aritmetického průměru. Medián. Střední hodnota. Pokud datový soubor není symetrický nebo obsahuje odlehlou hodnotu, je lepší charakteristikou než aritmetický průměr. Medián dělí soubor na dvě poloviny. Při lichém počtu hodnot n je medián prostřední hodnota seřazených dat, při sudém počtu hodnot je medián průměr dvou prostředních hodnot seřazených dat 2. Dolní kvartil,, horní kvartil,. Dolní kvartil udává hodnotu 25 % nejnižších hodnot, horní kvartil 75 % nejnižších hodnot. Percentil (-kvantil) odděluje % nejnižších hodnot souboru. Modus. Nejčetnější hodnota. Problém této charakteristiky je, že při intervalovém třídění se může velmi lišit od hodnoty určené z původních dat. Některé soubory mohou mít i více modů. Pro číselné proměnné můžeme počítat všechny výše vyjmenované charakteristiky polohy. Pro ordinální slovní znaky lze určit pouze modus a kvantily (zejména medián, případně kvartily). Občas však interpretace trochu pokulhává (např. prostřední hodnotou nejvyššího vzdělání u zkoumaného vzorku může být něco mezi ZŠ a SŠ). U nominálních proměnných má smysl určit pouze modus. 13

14 1.5 Charakteristiky variability Často se setkáváme se situací, že dva nebo více souborů bude mít stejné charakteristiky polohy (průměr, medián, ), ale jinak se budou od sebe výrazně lišit. Proto je potřeba charakteristiky polohy doplnit charakteristikami variability. Základní charakteristiky variability: Variační rozpětí. Uvádí škálu (šířku intervalu), ve které se pohybují všechny hodnoty souboru, tzn. rozdíl největší a nejmenší hodnoty znaku. Jeho předností je snadnost a rychlost výpočtu, nevýhodou je, pokud v souboru máme odlehlé hodnoty, jeho malá vypovídací schopnost.. Mezikvartilové rozpětí. Rozdíl mezi horním a dolním kvartilem. Udává, jak je široký interval, ve kterém je 50 % prostředních hodnot. Tato míra variability už není ovlivněná extrémními hodnotami proměnné, takže vypovídací schopnost je vyšší než u rozpětí.,,. Rozptyl. Nejčastější charakteristika variability, která se počítá jako průměrná kvadratická odchylka od průměru. Rozptyl má interpretační nevýhodu, že není ve stejných jednotkách jako původní hodnoty Směrodatná odchylka. Odmocnina rozptylu, která má stejnou vypovídací schopnost jako rozptyl a je ve stejných jednotkách jako původní data.. Variační koeficient. Směrodatná odchylka a rozptyl jsou vhodné k porovnání variability souborů, které mají stejné průměry. Pokud se průměry porovnávaných souborů liší je potřeba spočítat variační koeficient, který je většinou uváděn v procentech.. 14

15 1.6 Charakteristiky šikmosti a špičatosti Koeficient šikmosti. Symetrii uspořádání dat kolem aritmetického průměru si můžeme vyjádřit pomocí koeficientu šikmosti. Nulová hodnota znamená symetrii, pokud nám koeficient šikmosti vyjde záporný, mluvíme o pravostranné asymetrii, resp. vyjde-li kladný, jedná se o levostrannou asymetrii. 1. Koeficient špičatosti. Zjišťujeme koncentraci hodnot souboru kolem průměru. Zápornou hodnotu interpretujeme jako podnormální špičatost, kladnou hodnotu interpretujeme jako nadnormální špičatost. 2 Grafická prezentace dat Grafické znázornění dat tříděných bodovým tříděním Pro prezentaci jednotlivých proměnných je nutné volit vhodné typy grafů, které mají vysokou vypovídací schopnost a nejsou pro příjemce informací zavádějící. Pokud máme data zpracovaná bodovým tříděním, je nejvhodnějším typem grafu graf výsečový, který znázorňuje strukturu proměnné a jakou část tvoří jednotlivé obměny. Pokud chceme porovnávat absolutní četnosti připadající na jednotlivé obměny, je vhodnějším typem graf sloupcový. Okrajově lze použít i graf skládaný pruhový, který má podobnou vypovídací schopnost jako graf výsečový. Příklady jednotlivých typů grafů a jejich použití je na obrázcích 2-1, 2-2 a

16 Pelhřimov; 341 Jihlava; 758 Třebíč; 541 Havlíčkův Brod; 561 Žďár nad Sázavou; 598 Obrázek 2-1: Výsečový graf pro proměnnou počet nemocničních lůžek v kraji Vysočina k Zatímco grafy uvedené na obrázcích 2-1 a 2-2 jsou vhodné jak pro nominální tak i pro ordinální proměnnou, je graf na obrázku 2-3 vhodný pouze pro ordinální proměnnou. Dále je nutné, aby pořadí obměn znaku v grafu bylo stejné jako ve frekvenční tabulce tedy pro ordinální proměnnou existuje nějaké přirozené pořadí obměn a pro nominální proměnnou pořadí obměn určuje absolutní četnost. U všech grafů musíme dbát na to, aby bylo jasné, co který graf obsahuje. Je tedy nutné volit vhodné popisky os a výstižný titulek, případně název grafu. Z každého grafu by mělo být na první pohled jasné, jakou situaci popisuje. Graf by měl mít vyšší vypovídací schopnost než samotná frekvenční tabulka. 16

17 Jihlava Žďár nad Sázavou Havlíčkův Brod Třebíč Pelhřimov Obrázek 2-2: Sloupcový graf pro proměnnou počet nemocničních lůžek v kraji Vysočina k počty odpovědí zcela souhlasím spíš souhlasím spíš nesouhlasím zcela nesouhlasím bez odpovědi Obrázek 2-3: Skládaný pruhový graf pro proměnnou míra souhlasu s daným výrokem 17

18 2.2 Grafické znázornění dat tříděných intervalovým tříděním Intervalové třídění používáme tehdy, chceme-li vytvořit frekvenční tabulku pro spojitou číselnou proměnnou, např. výška člověka v cm. V tomto případě je obměn statistického znaku obrovské množství a bodové třídění by nepřineslo to, co od frekvenční tabulky očekáváme tedy zjednodušený pohled na data, protože frekvenční tabulka by mohla mít i stovky řádků. Proto hodnoty neuvádíme jednotlivě, ale sdružíme je do intervalů. Poznamenejme, že zatímco při bodovém třídění zůstanou zachovány všechny informace, které databáze obsahuje, při intervalovém třídění dojde k jejich částečné ztrátě. Ta je způsobena tím, že již nemáme přesné informace o hodnotách, víme jen, jaké jsou četnosti výskytů v jednotlivých intervalech. Příklad frekvenční tabulky pořízené intervalovým tříděním dat je uveden v tabulce 2-1. Tabulka 2-1: Příklad frekvenční tabulky pro spojitý číselný znak výška 300 chlapců i intervaly x i n i p i kp i ,3 % 3,3 % ,7 % 17,0 % ,0 % 44,0 % ,7 % 76,7 % ,0 % 96,7 % ,3 % 100,0 % x celkem x ,0 % x Histogram Pro grafické znázornění proměnné, která je tříděná intervalovým tříděním, používáme histogram. Jedná se o sloupcový graf, ve kterém je velikost mezery mezi sloupci nulová. Histogram pro data uvedená v tabulce 2-1 je znázorněn na obrázku 2-4. U tohoto typu grafu je nutné popsat osy (na vodorovnou osu vynášíme intervaly, na svislou osu absolutní četnosti) a uvést do titulku nebo do názvu grafu, o jaká data se jedná, aby byl graf dobře čitelný a srozumitelný všem čtenářům. 18

19 četnosti výška v cm Obrázek 2-4: Histogram výška chlapců Krabicový graf Krabicový graf je jednou z dalších možností, jak graficky zobrazit datový soubor číselné proměnné (výjimečně jej lze použít i pro ordinální proměnnou). Krabicový graf zobrazuje rozpětí a rozložení dat kolem číselné osy. V praxi se používá celá řada variant tohoto grafu. Ve své nejjednodušší podobě graf zachycuje polohu pěti významných hodnot mediánu, obou kvartilů a obou extrémů (minima a maxima) viz obrázek 2-5. Obrázek 2-5: Krabicový graf Nevýhodou tohoto poměrně snadno interpretovatelného grafu je jeho nedostupnost v Excelu. Tento graf je sice možné v Excelu zkonstruovat, ale vyžaduje to značné úsilí a pokročilou znalost Excelu. V dnes běžně používaných statistických programech (jakým je například 19

20 SPSS, Statistica) však lze krabicové grafy konstruovat jednoduše. Tyto softwary dokážou též detekovat tzv. odlehlé a extrémní hodnoty a v grafu je vyznačit. V tom případě nevynášíme do grafu minimum a maximum, ale kromě mediánu a kvartilů vynášíme tzv. horní a dolní vnitřní hradbu a horní a dolní vnější hradbu. Jejich poloha se odvozuje od mezikvartilového rozpětí Q: horní vnější hradba x 0,75 + 3Q horní vnitřní hradba x 0,75 + 1,5Q horní kvartil x 0,75 medián x 0,5 dolní kvartil x 0,25 dolní vnitřní hradba x 0,25 1,5Q dolní vnější hradba x 0,25 3Q Hodnoty, které leží mezi vnitřní a vnější hradbou (dolní nebo horní) se nazývají odlehlé a zpravidla se vyznačují kroužkem, hodnoty ležící za vnějšími hradbami se nazývají extrémní a vyznačují se hvězdičkou. Příklad krabicového grafu je uveden na obrázku 2-6 Krabice vyznačuje oblast mezi kvartily a vousy vnitřní hradby. V datech jsou 3 odlehlé hodnoty, extrémní hodnoty se v datovém souboru nevyskytly. Obrázek 2-6: Krabicový graf s odlehlými hodnotami Pokud se data řídí normálním rozdělením, je možné do krabicových grafů použít místo mediánu průměr a směrodatnou odchylku nebo směrodatnou chybu místo Q. 20

21 Krabicové grafy však častěji než k prezentaci rozložení hodnot kolem číselné osy používáme k porovnání dvou nebo i více souborů dat. Může se jednat o více číselných proměnných nebo o jednu kategorizovanou proměnnou, jak je ukázáno na obrázku 2-7. Zde jsou dva krabicové grafy, které porovnávají výši platů mužů a žen v jistém zdravotnickém zařízení. Proměnná je zde plat. Proměnná pohlaví, která obsahuje dvě kategorie muž a žena, slouží ke kategorizování hodnot proměnné plat. Spodní vodorovná čárka vyznačuje minimální mzdu (muži Kč, ženy Kč), horní vodorovná čárka maximální mzdu (muži Kč, ženy Kč). Dno krabice vyznačuje dolní kvartil, víko krabice horní kvartil a vodorovná bílá čára medián. Z tohoto grafu je na první pohled zřejmé, nejen že se platy žen v tomto zdravotnickém zařízení pohybují níže než platy mužů, ale je vidět i to, že maximální mzda žen je nižší než medián mzdy mužů Muž Žena Obrázek 2-7: Krabicový graf porovnání příjmů mužů a žen ve sledovaném zdravotnickém zařízení Krabicové grafy je možné umístit svisle, jako je tomu na obrázcích 2-6 a 2-7, ale i vodorovně (viz obrázek 2-5), kdy je možné kombinovat krabicový graf s histogramem. 2.3 Grafické znázornění závislosti dvou proměnných bodový graf Máme-li v datech dvě proměnné, u kterých lze předpokládat příčinný vztah, je možné tento vztah znázornit graficky pomocí bodového grafu. Např. pokud máme informace o výšce 21

22 a váze respondentů, můžeme pomocí bodového grafu zjistit, jestli je mezi těmito dvěma proměnnými závislost. Bodový graf zobrazuje body roviny, jejichž x-ová souřadnice je hodnota jedné (nezávislé) proměnné a y-ová souřadnice je hodnota druhé (závislé) proměnné. Každý bod tedy představuje jednu statistickou jednotku. Na obrázku 2-8 je bodový graf znázorňující závislost váhy na výšce deseti náhodně vybraných studentek VŠPJ. V připojené tabulce jsou uvedeny též zjištěné výšky a váhy, které byly použity pro konstrukci grafu a pro bližší představu o tělesné konstituci jednotlivce je dopočítáno BMI. výška váha BMI , , , , , , , ,4 váha v kg výška v cm , ,0 Obrázek 2-8: Bodový graf závislosti váhy na výšce Graf konstruujeme zejména proto, abychom zodpověděli otázku, zda jsou naše data vhodná pro analýzu závislosti dvou proměnných. Největší problém by způsobily odlehlé hodnoty (jeden nebo několik bodů ležících mimo oblast většiny bodů) nebo dva samostatné shluky bodů, které by svědčily o tom, že statistické jednotky tvoří dvě skupiny s odlišnými vztahy mezi proměnnými (například pokud bychom do analýzy zahrnuli nejen dívky, ale i chlapce). Dále je nutné zkontrolovat, zda je vhodné proložit body rostoucí nebo klesající přímku (zda by nebylo vhodnější proložit body nějakou složitější křivku). Z tohoto pohledu se jeví data v pořádku, je tedy možné přistoupit ke korelační a regresní analýze. 22

23 2.4 Grafické znázornění časové řady spojnicový graf Další z typů grafů, které nabízí MS Excel, je spojnicový graf, který se používá zejména pro analýzu časových řad. Jejich princip spočívá v zakreslení jednotlivých hodnot časové řady do souřadných os, na kterých jsou vyznačeny příslušné stupnice. Na vodorovnou osu x se vynáší časová proměnná t a na svislou osu hodnoty časové řady (obrázek 2-9). Do grafu můžeme zakreslit i více časových řad (obrázek 2-10). V případě, že zobrazujeme dvě časové řady lišící se měřítkem, můžeme použít kromě levé i pravou svislou osu. V obou níže uvedených grafech jsou spojnice splajny, čehož lze docílit volbou hladká čára při formátování grafu. Obrázek 2-9: Spojnicový graf časová řada Obrázek 2-10: Spojnicový graf více časových řad 23

24 3 Korelační analýza Korelační analýzu používáme k popisu vzájemného vztahu dvou kardinálních (spojitých číselných) nebo ordinálních proměnných. Pomocí korelačních koeficientů měříme směr a intenzitu (sílu) závislosti. Pokud je mezi proměnnými jiný typ závislosti než lineární, není vhodné korelační koeficient použít. Korelační koeficient nabývá hodnot od 1 do 1. Znaménko určuje směr závislosti, tzn. pro kladné hodnoty korelačního koeficientu se jedná o pozitivní korelaci (pokud roste jedna proměnná, roste i druhá proměnná, resp. pokud klesá jedna, klesá i druhá proměnná), pro záporné hodnoty mluvíme o negativní korelaci (roste-li jedna proměnná, klesá druhá nebo naopak). Intenzita korelace se vztahuje k samotné hodnotě korelačního koeficientu (nezávisí na znaménku, to určuje pouze směr). Pokud je korelační koeficient roven 0, mezi proměnnými není žádný lineární vztah. Je třeba však zdůraznit, že koeficient korelace, který se blíží nule, nemusí nutně znamenat slabou závislost. Proměnné mohou být silně závislé, ale ne lineárně. Blíží-li se korelační koeficient ±1, mluvíme o silnější závislosti proměnných. V mezních případech, kdy je korelační koeficient roven 1 nebo 1, jde o úplnou funkční závislost (v bodovém grafu by všechny body ležely na přímce). Interpretace intenzity hodnot korelačního koeficientu (bez znaménka, které reprezentuje pouze směr) se v různých oborech liší, můžeme použít např. následující: Koeficient korelace Síla závislosti 0,1 0,3 Slabá závislost 0,3 0,7 Středně silná závislost 0,7 0,9 Silná závislost > 0,9 Velmi silná závislost Pro porovnávání vztahu mezi ordinálními proměnnými, daty s odlehlými hodnotami a daty, která nemají normální rozdělení, používáme neparametrický Spearmanův korelační koeficient (ró). Např. závislost počtu dioptrií a vzdělání. Pokud hledáme lineární závislost dvou číselných proměnných (např. výška dítěte ve dvou letech a v dospělosti), můžeme použít parametrický Pearsonův korelační koeficient r, jehož použití má následující předpoklady: 24

25 lineární vztah mezi proměnnými, neexistence odlehlých hodnot, normální rozdělení dat (pro proměnné rozdělené pomocí grupovací proměnné je nutný předpoklad normality v jednotlivých skupinách, např. výška žen, výška mužů). Tyto předpoklady ověřujeme zpravidla pomocí bodového grafu. Všechny body by měly ležet uvnitř pomyslné elipsy, bez odlehlých hodnot. Pozn.: Pokud bychom získali bodový graf, jako je na obrázku 3-1, musíme jednotlivé skupiny analyzovat odděleně. Obrázek 3-1: Heterogenita v datech 25

26 Obrázek 3-2 ukazuje různé hodnoty koeficientů korelace pro různé typy bodových grafů. Obrázek 3-2: Korelační koeficienty vybraných bodových grafů Zdroj: wikipedia.org Obrázky 3-3 a 3-4 ukazují vliv odlehlých hodnot na korelační koeficient. Odlehlá hodnota, která leží na regresní přímce, zvyšuje Pearsonův korelační koeficient. Pokud budeme mít ve stejném grafu odlehlou hodnotu, která leží mimo regresní přímku, velikost korelačního koeficientu je podstatně nižší. Vliv odlehlých hodnot závisí na velikosti zkoumaného vzorku, v naší ukázce máme 100 pozorování, takže odlehlá hodnota výsledek tolik neovlivňuje jako v případě malého rozsahu vzorku. V praxi to znamená, že výzkumník musí sám rozhodnout, zda do datového souboru odlehlé hodnoty zahrne, případně zda použije Spearmanův korelační koeficient. Obrázek 3-3: Odlehlý bod původní korelační koeficient (0,77) zvýšil, r = 0,81 26

27 Obrázek 3-4: Odlehlý bod původní korelační koeficient (0,77) snížil, r = 0,537 Pro posouzení úrovně statistické významnosti Pearsonova i Spearmanova korelačního koeficientu používáme tzv. -hodnotu, která je zobrazena či naznačena ve výstupech statistických programů. Jedná se o p-hodnotu k testu 1, který testuje nulovou hypotézu Korelační koeficient je nulový. Pokud je 0,05, je korelační koeficient statisticky nevýznamný a je nutné jej považovat za nulový. Je potřeba zdůraznit, že p-hodnota neukazuje na intenzitu závislosti mezi proměnnými (ta je dána přímo korelačním koeficientem), ale říká nám, zda je korelační koeficient možné považovat za nenulový. Statistická významnost korelačního koeficientu je kromě vlastního lineárního vztahu mezi proměnnými také ovlivněná velikostí vzorku, např. pro malé vzorky ( 30) nemusí být korelační koeficient 0,4 (středně silná závislost) statisticky významný (nepotvrdili jsme, že mezi proměnnými je nějaký vztah) a naopak pro velké vzorky (např. n > 100) může být statisticky významná i slabá závislost, kdy je korelační koeficient např. 0,2. 4 Regresní analýza Hlavním úkolem regresní analýzy je najít nejvhodnější regresní funkci, pomocí které můžeme odhadnout hodnoty závislé proměnné na základě zvolených hodnot nezávislé proměnné. Např. odhad váhy na základě výšky, odhad střední hodnoty očekávané doby přežití pacienta s rakovinou na základě jeho zdravotního stavu, odhad doby zmírnění bolesti po aplikaci určitého množství léku apod. 1 Podrobně je metoda testování hypotéz popsána v kapitole 5. 27

VYSOKÁ ŠKOLA POLYTECHNICKÁ JIHLAVA. Katedra matematiky STATISTICA ÚVOD DO ZPRACOVÁNÍ DAT. Jana Borůvková, Petra Horáčková, Miroslav Hanáček

VYSOKÁ ŠKOLA POLYTECHNICKÁ JIHLAVA. Katedra matematiky STATISTICA ÚVOD DO ZPRACOVÁNÍ DAT. Jana Borůvková, Petra Horáčková, Miroslav Hanáček VYSOKÁ ŠKOLA POLYTECHNICKÁ JIHLAVA Katedra matematiky STATISTICA ÚVOD DO ZPRACOVÁNÍ DAT Jana Borůvková, Petra Horáčková, Miroslav Hanáček 2013 Jana Borůvková, Petra Horáčková, Miroslav Hanáček STATISTICA

Více

Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu

Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu K čemu slouží statistika Popisuje velké soubory dat pomocí charakteristických čísel (popisná statistika). Hledá skryté zákonitosti v souborech

Více

veličin, deskriptivní statistika Ing. Michael Rost, Ph.D.

veličin, deskriptivní statistika Ing. Michael Rost, Ph.D. Vybraná rozdělení spojitých náhodných veličin, deskriptivní statistika Ing. Michael Rost, Ph.D. Třídění Základním zpracováním dat je jejich třídění. Jde o uspořádání získaných dat, kde volba třídícího

Více

Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D.

Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D. Zpracování náhodného výběru popisná statistika Ing. Michal Dorda, Ph.D. Základní pojmy Úkolem statistiky je na základě vlastností výběrového souboru usuzovat o vlastnostech celé populace. Populace(základní

Více

4ST201 STATISTIKA CVIČENÍ Č. 7

4ST201 STATISTIKA CVIČENÍ Č. 7 4ST201 STATISTIKA CVIČENÍ Č. 7 testování hypotéz parametrické testy test hypotézy o střední hodnotě test hypotézy o relativní četnosti test o shodě středních hodnot testování hypotéz v MS Excel neparametrické

Více

Program Statistica Base 9. Mgr. Karla Hrbáčková, Ph.D.

Program Statistica Base 9. Mgr. Karla Hrbáčková, Ph.D. Program Statistica Base 9 Mgr. Karla Hrbáčková, Ph.D. OBSAH KURZU obsluha jednotlivých nástrojů, funkce pro import dat z jiných aplikací, práce s popisnou statistikou, vytváření grafů, analýza dat, výstupní

Více

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 3. 11.

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 3. 11. UNIVERZITA OBRANY Fakulta ekonomiky a managementu Aplikace STAT1 Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 Jiří Neubauer, Marek Sedlačík, Oldřich Kříž 3. 11. 2012 Popis a návod k použití aplikace

Více

31. 3. 2014, Brno Hanuš Vavrčík Základy statistiky ve vědě

31. 3. 2014, Brno Hanuš Vavrčík Základy statistiky ve vědě 31. 3. 2014, Brno Hanuš Vavrčík Základy statistiky ve vědě Motto Statistika nuda je, má však cenné údaje. strana 3 Statistické charakteristiky Charakteristiky polohy jsou kolem ní seskupeny ostatní hodnoty

Více

Porovnání dvou výběrů

Porovnání dvou výběrů Porovnání dvou výběrů Menu: QCExpert Porovnání dvou výběrů Tento modul je určen pro podrobnou analýzu dvou datových souborů (výběrů). Modul poskytuje dva postupy analýzy: porovnání dvou nezávislých výběrů

Více

Tomáš Karel LS 2012/2013

Tomáš Karel LS 2012/2013 Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není

Více

Metodologie pro Informační studia a knihovnictví 2

Metodologie pro Informační studia a knihovnictví 2 Metodologie pro Informační studia a knihovnictví 2 Modul 5: Popis nekategorizovaných dat Co se dozvíte v tomto modulu? Kdy používat modus, průměr a medián. Co je to směrodatná odchylka. Jak popsat distribuci

Více

Korelační a regresní analýza

Korelační a regresní analýza Korelační a regresní analýza Analýza závislosti v normálním rozdělení Pearsonův (výběrový) korelační koeficient: r = s XY s X s Y, kde s XY = 1 n (x n 1 i=0 i x )(y i y ), s X (s Y ) je výběrová směrodatná

Více

Tomáš Karel LS 2012/2013

Tomáš Karel LS 2012/2013 Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není

Více

Popisná statistika kvantitativní veličiny

Popisná statistika kvantitativní veličiny StatSoft Popisná statistika kvantitativní veličiny Protože nám surová data obvykle žádnou smysluplnou informaci neposkytnou, je žádoucí vyjádřit tyto ve zhuštěnější formě. V předchozím dílu jsme začali

Více

Stručný úvod do vybraných zredukovaných základů statistické analýzy dat

Stručný úvod do vybraných zredukovaných základů statistické analýzy dat Stručný úvod do vybraných zredukovaných základů statistické analýzy dat Statistika nuda je, má však cenné údaje. Neklesejme na mysli, ona nám to vyčíslí. Z pohádky Princové jsou na draka Populace (základní

Více

5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza

5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza 5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza 5.1 Vícerozměrná data a vícerozměrná rozdělení Při zpracování vícerozměrných dat se hledají souvislosti mezi dvěma, případně

Více

Statistické metody uţívané při ověřování platnosti hypotéz

Statistické metody uţívané při ověřování platnosti hypotéz Statistické metody uţívané při ověřování platnosti hypotéz Hypotéza Domněnka, předpoklad Nejčastěji o rozdělení, středních hodnotách, závislostech, Hypotézy ve vědeckém výzkumu pracovní, věcné hypotézy

Více

Testování hypotéz a měření asociace mezi proměnnými

Testování hypotéz a měření asociace mezi proměnnými Testování hypotéz a měření asociace mezi proměnnými Testování hypotéz Nulová a alternativní hypotéza většina statistických analýz zahrnuje různá porovnání, hledání vztahů, efektů Tvrzení, že efekt je nulový,

Více

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina Testování hypotéz Analýza dat z dotazníkových šetření Kuranova Pavlina Statistická hypotéza Možné cíle výzkumu Srovnání účinnosti různých metod Srovnání výsledků různých skupin Tzn. prokázání rozdílů mezi

Více

{ } ( 2) Příklad: Test nezávislosti kategoriálních znaků

{ } ( 2) Příklad: Test nezávislosti kategoriálních znaků Příklad: Test nezávislosti kategoriálních znaků Určete na hladině významnosti 5 % na základě dat zjištěných v rámci dotazníkového šetření ve Šluknově, zda existuje závislost mezi pohlavím respondenta a

Více

Vysoká škola báňská technická univerzita Ostrava. Fakulta elektrotechniky a informatiky

Vysoká škola báňská technická univerzita Ostrava. Fakulta elektrotechniky a informatiky Vysoká škola báňská technická univerzita Ostrava Fakulta elektrotechniky a informatiky Bankovní účty (semestrální projekt statistika) Tomáš Hejret (hej124) 18.5.2013 Úvod Cílem tohoto projektu, zadaného

Více

Praktická statistika. Petr Ponížil Eva Kutálková

Praktická statistika. Petr Ponížil Eva Kutálková Praktická statistika Petr Ponížil Eva Kutálková Zápis výsledků měření Předpokládejme, že známe hodnotu napětí U = 238,9 V i její chybu 3,3 V. Hodnotu veličiny zapíšeme na tolik míst, aby až poslední bylo

Více

Normální (Gaussovo) rozdělení

Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení popisuje vlastnosti náhodné spojité veličiny, která vzniká složením různých náhodných vlivů, které jsou navzájem nezávislé, kterých je velký

Více

Kontingenční tabulky, korelační koeficienty

Kontingenční tabulky, korelační koeficienty Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Mějme kategoriální proměnné X a Y. Vytvoříme tzv. kontingenční tabulku. Budeme tedy testovat hypotézu

Více

676 + 4 + 100 + 196 + 0 + 484 + 196 + 324 + 64 + 324 = = 2368

676 + 4 + 100 + 196 + 0 + 484 + 196 + 324 + 64 + 324 = = 2368 Příklad 1 Je třeba prověřit, zda lze na 5% hladině významnosti pokládat za prokázanou hypotézu, že střední doba výroby výlisku je 30 sekund. Přitom 10 náhodně vybraných výlisků bylo vyráběno celkem 540

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická

Více

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1 Logistická regrese Menu: QCExpert Regrese Logistická Modul Logistická regrese umožňuje analýzu dat, kdy odezva je binární, nebo frekvenční veličina vyjádřená hodnotami 0 nebo 1, případně poměry v intervalu

Více

Statistické testování hypotéz II

Statistické testování hypotéz II PSY117/454 Statistická analýza dat v psychologii Přednáška 9 Statistické testování hypotéz II Přehled testů, rozdíly průměrů, velikost účinku, síla testu Základní výzkumné otázky/hypotézy 1. Stanovení

Více

Intervalový odhad. Interval spolehlivosti = intervalový odhad nějakého parametru s danou pravděpodobností = konfidenční interval pro daný parametr

Intervalový odhad. Interval spolehlivosti = intervalový odhad nějakého parametru s danou pravděpodobností = konfidenční interval pro daný parametr StatSoft Intervalový odhad Dnes se budeme zabývat neodmyslitelnou součástí statistiky a to intervaly v nejrůznějších podobách. Toto téma je také úzce spojeno s tématem testování hypotéz, a tedy plynule

Více

STATISTICKÉ TESTY VÝZNAMNOSTI

STATISTICKÉ TESTY VÝZNAMNOSTI STATISTICKÉ TESTY VÝZNAMNOSTI jsou statistické postupy, pomocí nichž ověřujeme, zda mezi proměnnými existuje vztah (závislost, rozdíl). Pokud je výsledek šetření statisticky významný (signifikantní), znamená

Více

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. Testování statistických hypotéz Ing. Michal Dorda, Ph.D. Testování normality Př. : Při simulaci provozu na křižovatce byla získána data o mezerách mezi přijíždějícími vozidly v [s]. Otestujte na hladině

Více

Průzkumová analýza dat

Průzkumová analýza dat Průzkumová analýza dat Proč zkoumat data? Základ průzkumové analýzy dat položil John Tukey ve svém díle Exploratory Data Analysis (odtud zkratka EDA). Často se stává, že data, se kterými pracujeme, se

Více

Ilustrační příklad odhadu LRM v SW Gretl

Ilustrační příklad odhadu LRM v SW Gretl Ilustrační příklad odhadu LRM v SW Gretl Podkladové údaje Korelační matice Odhad lineárního regresního modelu (LRM) Verifikace modelu PEF ČZU Praha Určeno pro posluchače předmětu Ekonometrie Needitovaná

Více

Testování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času

Testování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času Testování hypotéz 1 Jednovýběrové testy 90/ odhad času V podmínkách naprostého odloučení má voák prokázat schopnost orientace v čase. Úkolem voáka e provést odhad časového intervalu 1 hodiny bez hodinek

Více

Číselné charakteristiky a jejich výpočet

Číselné charakteristiky a jejich výpočet Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz charakteristiky polohy charakteristiky variability charakteristiky koncetrace charakteristiky polohy charakteristiky

Více

Pojem a úkoly statistiky

Pojem a úkoly statistiky Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Pojem a úkoly statistiky Statistika je věda, která se zabývá získáváním, zpracováním a analýzou dat pro potřeby

Více

Tomáš Karel LS 2012/2013

Tomáš Karel LS 2012/2013 Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení ze 4ST201. Na případné faktické chyby v této prezentaci mě prosím upozorněte. Děkuji Tyto slidy berte pouze jako doplňkový materiál není v nich obsaženo

Více

Informační technologie a statistika 1

Informační technologie a statistika 1 Informační technologie a statistika 1 přednášející: konzul. hodiny: e-mail: Martin Schindler KAP, tel. 48 535 2836, budova G po dohodě martin.schindler@tul.cz naposledy upraveno: 21. září 2015, 1/33 Požadavek

Více

STATISTIKA. Inovace předmětu. Obsah. 1. Inovace předmětu STATISTIKA... 2 2. Sylabus pro předmět STATISTIKA... 3 3. Pomůcky... 7

STATISTIKA. Inovace předmětu. Obsah. 1. Inovace předmětu STATISTIKA... 2 2. Sylabus pro předmět STATISTIKA... 3 3. Pomůcky... 7 Inovace předmětu STATISTIKA Obsah 1. Inovace předmětu STATISTIKA... 2 2. Sylabus pro předmět STATISTIKA... 3 3. Pomůcky... 7 1 1. Inovace předmětu STATISTIKA Předmět Statistika se na bakalářském oboru

Více

PSY117/454 Statistická analýza dat v psychologii Přednáška 10

PSY117/454 Statistická analýza dat v psychologii Přednáška 10 PSY117/454 Statistická analýza dat v psychologii Přednáška 10 TESTY PRO NOMINÁLNÍ A ORDINÁLNÍ PROMĚNNÉ NEPARAMETRICKÉ METODY... a to mělo, jak sám vidíte, nedozírné následky. Smrť Analýza četností hodnot

Více

Obsah. Statistika Zpracování informací ze statistického šetření Charakteristiky úrovně, variability a koncentrace kvantitativního znaku

Obsah. Statistika Zpracování informací ze statistického šetření Charakteristiky úrovně, variability a koncentrace kvantitativního znaku Obsah Statistika Zpracování informací ze statistického šetření Charakteristiky úrovně, variability a koncentrace kvantitativního znaku Roman Biskup (zapálený) statistik ve výslužbě, aktuálně analytik v

Více

marek.pomp@vsb.cz http://homel.vsb.cz/~pom68

marek.pomp@vsb.cz http://homel.vsb.cz/~pom68 Statistika B (151-0303) Marek Pomp ZS 2014 marek.pomp@vsb.cz http://homel.vsb.cz/~pom68 Cvičení: Pavlína Kuráňová & Marek Pomp Podmínky pro úspěšné ukončení zápočet 45 bodů, min. 23 bodů, dvě zápočtové

Více

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13 Příklad 1 Máme k dispozici výsledky prvního a druhého testu deseti sportovců. Na hladině významnosti 0,05 prověřte, zda jsou výsledky testů kladně korelované. 1.test : 7, 8, 10, 4, 14, 9, 6, 2, 13, 5 2.test

Více

ZX510 Pokročilé statistické metody geografického výzkumu. Téma: Měření síly asociace mezi proměnnými (korelační analýza)

ZX510 Pokročilé statistické metody geografického výzkumu. Téma: Měření síly asociace mezi proměnnými (korelační analýza) ZX510 Pokročilé statistické metody geografického výzkumu Téma: Měření síly asociace mezi proměnnými (korelační analýza) Měření síly asociace (korelace) mezi proměnnými Vztah mezi dvěma proměnnými existuje,

Více

Cvičení ze statistiky - 3. Filip Děchtěrenko

Cvičení ze statistiky - 3. Filip Děchtěrenko Cvičení ze statistiky - 3 Filip Děchtěrenko Minule bylo.. Dokončili jsme základní statistiky, typy proměnných a začali analýzu kvalitativních dat Tyhle termíny by měly být známé: Histogram, krabicový graf

Více

Předpoklad o normalitě rozdělení je zamítnut, protože hodnota testovacího kritéria χ exp je vyšší než tabulkový 2

Předpoklad o normalitě rozdělení je zamítnut, protože hodnota testovacího kritéria χ exp je vyšší než tabulkový 2 Na úloze ukážeme postup analýzy velkého výběru s odlehlými prvky pro určení typu rozdělení koncentrace kyseliny močové u 50 dárců krve. Jaká je míra polohy a rozptýlení uvedeného výběru? Z grafických diagnostik

Více

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1 Testování statistických hypotéz Ing. Michal Dorda, Ph.D. 1 Úvodní poznámky Statistickou hypotézou rozumíme hypotézu o populaci (základním souboru) např.: Střední hodnota základního souboru je rovna 100.

Více

SAMOSTATNÁ STUDENTSKÁ PRÁCE ZE STATISTIKY

SAMOSTATNÁ STUDENTSKÁ PRÁCE ZE STATISTIKY SAMOSTATÁ STUDETSKÁ PRÁCE ZE STATISTIKY Váha studentů Kučerová Eliška, Pazdeříková Jana septima červen 005 Zadání: My dvě studentky jsme si vylosovaly zjistit statistickým šetřením v celém ročníku septim

Více

Úvodem Dříve les než stromy 3 Operace s maticemi

Úvodem Dříve les než stromy 3 Operace s maticemi Obsah 1 Úvodem 13 2 Dříve les než stromy 17 2.1 Nejednoznačnost terminologie 17 2.2 Volba metody analýzy dat 23 2.3 Přehled vybraných vícerozměrných metod 25 2.3.1 Metoda hlavních komponent 26 2.3.2 Faktorová

Více

2 Zpracování naměřených dat. 2.1 Gaussův zákon chyb. 2.2 Náhodná veličina a její rozdělení

2 Zpracování naměřených dat. 2.1 Gaussův zákon chyb. 2.2 Náhodná veličina a její rozdělení 2 Zpracování naměřených dat Důležitou součástí každé experimentální práce je statistické zpracování naměřených dat. V této krátké kapitole se budeme věnovat určení intervalů spolehlivosti získaných výsledků

Více

přesné jako tabulky, ale rychle a lépe mohou poskytnou názornou představu o důležitých tendencích a souvislostech.

přesné jako tabulky, ale rychle a lépe mohou poskytnou názornou představu o důležitých tendencích a souvislostech. 3 Grafické zpracování dat Grafické znázorňování je velmi účinný způsob, jak prezentovat statistické údaje. Grafy nejsou tak přesné jako tabulky, ale rychle a lépe mohou poskytnou názornou představu o důležitých

Více

Statistika. Regresní a korelační analýza Úvod do problému. Roman Biskup

Statistika. Regresní a korelační analýza Úvod do problému. Roman Biskup Statistika Regresní a korelační analýza Úvod do problému Roman Biskup Jihočeská univerzita v Českých Budějovicích Ekonomická fakulta (Zemědělská fakulta) Katedra aplikované matematiky a informatiky 2008/2009

Více

Cvičení ze statistiky - 9. Filip Děchtěrenko

Cvičení ze statistiky - 9. Filip Děchtěrenko Cvičení ze statistiky - 9 Filip Děchtěrenko Minule bylo.. Dobrali jsme normální rozdělení Tyhle termíny by měly být známé: Inferenční statistika Konfidenční intervaly Z-test Postup při testování hypotéz

Více

Statistické metody v ekonomii. Ing. Michael Rost, Ph.D.

Statistické metody v ekonomii. Ing. Michael Rost, Ph.D. Statistické metody v ekonomii Ing. Michael Rost, Ph.D. Jihočeská univerzita v Českých Budějovicích Test χ 2 v kontingenční tabulce typu 2 2 Jde vlastně o speciální případ χ 2 testu pro čtyřpolní tabulku.

Více

Simulace. Simulace dat. Parametry

Simulace. Simulace dat. Parametry Simulace Simulace dat Menu: QCExpert Simulace Simulace dat Tento modul je určen pro generování pseudonáhodných dat s danými statistickými vlastnostmi. Nabízí čtyři typy rozdělení: normální, logaritmicko-normální,

Více

NÁHODNÁ ČÍSLA. F(x) = 1 pro x 1. Náhodná čísla lze generovat některým z následujících generátorů náhodných čísel:

NÁHODNÁ ČÍSLA. F(x) = 1 pro x 1. Náhodná čísla lze generovat některým z následujících generátorů náhodných čísel: NÁHODNÁ ČÍSLA TYPY GENERÁTORŮ, LINEÁRNÍ KONGRUENČNÍ GENERÁTORY, TESTY NÁHODNOSTI, VYUŽITÍ HODNOT NÁHODNÝCH VELIČIN V SIMULACI CO JE TO NÁHODNÉ ČÍSLO? Náhodné číslo definujeme jako nezávislé hodnoty z rovnoměrného

Více

t-test, Studentův párový test Ing. Michael Rost, Ph.D.

t-test, Studentův párový test Ing. Michael Rost, Ph.D. Testování hypotéz: dvouvýběrový t-test, Studentův párový test Ing. Michael Rost, Ph.D. Úvod do problému... Již známe jednovýběrový t-test, při kterém jsme měli k dispozici pouze jeden výběr. Můžeme se

Více

MĚŘENÍ STATISTICKÝCH ZÁVISLOSTÍ

MĚŘENÍ STATISTICKÝCH ZÁVISLOSTÍ MĚŘENÍ STATISTICKÝCH ZÁVISLOSTÍ v praxi u jednoho prvku souboru se často zkoumá více veličin, které mohou na sobě různě záviset jednorozměrný výběrový soubor VSS X vícerozměrným výběrovým souborem VSS

Více

You created this PDF from an application that is not licensed to print to novapdf printer (http://www.novapdf.com)

You created this PDF from an application that is not licensed to print to novapdf printer (http://www.novapdf.com) Závislost náhodných veličin Úvod Předchozí přednášky: - statistické charakteristiky jednoho výběrového nebo základního souboru - vztahy mezi výběrovým a základním souborem - vztahy statistických charakteristik

Více

Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie STATISTICKÉ ZPRACOVÁNÍ EXPERIMENTÁLNÍCH DAT

Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie STATISTICKÉ ZPRACOVÁNÍ EXPERIMENTÁLNÍCH DAT Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie STATISTICKÉ ZPRACOVÁNÍ EXPERIMENTÁLNÍCH DAT STATISTICKÁ ANALÝZA JEDNOROZMĚRNÝCH DAT Seminární práce 1 Brno, 2002 Ing. Pavel

Více

Analýza dat s využitím MS Excel

Analýza dat s využitím MS Excel Analýza dat s využitím MS Excel Seminář aplikované statistiky Martina Litschmannová Několik fíglů na úvod Absolutní vs. relativní adresování změna pomocí F4 =$H$20 =H$20 =$H20 =H20 Posun po souvislé oblasti

Více

KVANTITATIVNÍ METODY V PEDAGOGICKÉM VÝZKUMU

KVANTITATIVNÍ METODY V PEDAGOGICKÉM VÝZKUMU KVANTITATIVNÍ METODY V PEDAGOGICKÉM VÝZKUMU RADEK KRPEC CZ.1.07/2.2.00/29.0006 OSTRAVA, ČERVEN 2013 Studijní opora je jedním z výstupu projektu ESF OP VK. Číslo Prioritní osy: 7.2 Oblast podpory: 7.2.2

Více

Třídění statistických dat

Třídění statistických dat 2.1 Třídění statistických dat Všechny muže ve městě rozdělíme na 2 skupiny: A) muži, kteří chodí k holiči B) muži, kteří se holí sami Do které skupiny zařadíme holiče? prof. Raymond M. Smullyan, Dr. Math.

Více

6. Lineární regresní modely

6. Lineární regresní modely 6. Lineární regresní modely 6.1 Jednoduchá regrese a validace 6.2 Testy hypotéz v lineární regresi 6.3 Kritika dat v regresním tripletu 6.4 Multikolinearita a polynomy 6.5 Kritika modelu v regresním tripletu

Více

Inferenční statistika - úvod. z-skóry normální rozdělení pravděpodobnost rozdělení výběrových průměrů

Inferenční statistika - úvod. z-skóry normální rozdělení pravděpodobnost rozdělení výběrových průměrů Inferenční statistika - úvod z-skóry normální rozdělení pravděpodobnost rozdělení výběrových průměrů Pravděpodobnost postupy induktivní statistiky vycházejí z teorie pravděpodobnosti pravděpodobnost, že

Více

LINEÁRNÍ REGRESE. Lineární regresní model

LINEÁRNÍ REGRESE. Lineární regresní model LINEÁRNÍ REGRESE Chemometrie I, David MILDE Lineární regresní model 1 Typy závislosti 2 proměnných FUNKČNÍ VZTAH: 2 závisle proměnné: určité hodnotě x odpovídá jediná hodnota y. KORELACE: 2 náhodné (nezávislé)

Více

IBM SPSS Exact Tests. Přesné analýzy malých datových souborů. Nejdůležitější. IBM SPSS Statistics

IBM SPSS Exact Tests. Přesné analýzy malých datových souborů. Nejdůležitější. IBM SPSS Statistics IBM Software IBM SPSS Exact Tests Přesné analýzy malých datových souborů Při rozhodování o existenci vztahu mezi proměnnými v kontingenčních tabulkách a při používání neparametrických ů analytici zpravidla

Více

Aplikovaná statistika pro učitele a žáky v hodinách zeměpisu aneb jak využít MS Excel v praxi. Geografický seminář 30. března 2011 Pavel Bednář

Aplikovaná statistika pro učitele a žáky v hodinách zeměpisu aneb jak využít MS Excel v praxi. Geografický seminář 30. března 2011 Pavel Bednář Aplikovaná statistika pro učitele a žáky v hodinách zeměpisu aneb jak využít MS Excel v praxi Geografický seminář 30. března 2011 Pavel Bednář Výchozí stav Sebehodnocení práce s MS Excel studujícími oboru

Více

EKONOMETRIE 7. přednáška Fáze ekonometrické analýzy

EKONOMETRIE 7. přednáška Fáze ekonometrické analýzy EKONOMETRIE 7. přednáška Fáze ekonometrické analýzy Ekonometrická analýza proces, skládající se z následujících fází: a) specifikace b) kvantifikace c) verifikace d) aplikace Postupné zpřesňování jednotlivých

Více

pracovní list studenta Kombinatorika, pravděpodobnost, základy statistiky Jak jsou vysocí? Mirek Kubera

pracovní list studenta Kombinatorika, pravděpodobnost, základy statistiky Jak jsou vysocí? Mirek Kubera Výstup RVP: Klíčová slova: pracovní list studenta Kombinatorika, pravděpodobnost, základy statistiky Mirek Kubera žák diskutuje a kriticky zhodnotí statistické informace a daná statistická sdělení, volí

Více

Analýza rozptylu. Podle počtu analyzovaných faktorů rozlišujeme jednofaktorovou, dvoufaktorovou a vícefaktorovou analýzu rozptylu.

Analýza rozptylu. Podle počtu analyzovaných faktorů rozlišujeme jednofaktorovou, dvoufaktorovou a vícefaktorovou analýzu rozptylu. Analýza rozptylu Analýza rozptylu umožňuje ověřit významnost rozdílu mezi výběrovými průměry většího počtu náhodných výběrů, umožňuje posoudit vliv různých faktorů. Podle počtu analyzovaných faktorů rozlišujeme

Více

Testování hypotéz Biolog Statistik: Matematik: Informatik:

Testování hypotéz Biolog Statistik: Matematik: Informatik: Testování hypotéz Biolog, Statistik, Matematik a Informatik na safari. Zastaví džíp a pozorují dalekohledem. Biolog "Podívejte se! Stádo zeber! A mezi nimi bílá zebra! To je fantastické! " "Existují bílé

Více

Testování hypotéz. 4. přednáška 6. 3. 2010

Testování hypotéz. 4. přednáška 6. 3. 2010 Testování hypotéz 4. přednáška 6. 3. 2010 Základní pojmy Statistická hypotéza Je tvrzení o vlastnostech základního souboru, o jehož pravdivosti se chceme přesvědčit. Předem nevíme, zda je pravdivé nebo

Více

10. Předpovídání - aplikace regresní úlohy

10. Předpovídání - aplikace regresní úlohy 10. Předpovídání - aplikace regresní úlohy Regresní úloha (analýza) je označení pro statistickou metodu, pomocí nichž odhadujeme hodnotu náhodné veličiny (tzv. závislé proměnné, cílové proměnné, regresandu

Více

Obsah. Funkce grafu Zdrojová data pro graf Typ grafu Formátování prvků grafu Doporučení pro tvorbu grafů Zdroje

Obsah. Funkce grafu Zdrojová data pro graf Typ grafu Formátování prvků grafu Doporučení pro tvorbu grafů Zdroje Grafy v MS Excel Obsah Funkce grafu Zdrojová data pro graf Typ grafu Formátování prvků grafu Doporučení pro tvorbu grafů Zdroje Funkce grafu Je nejčastěji vizualizací při zpracování dat z různých statistik

Více

Měření závislosti statistických dat

Měření závislosti statistických dat 5.1 Měření závislosti statistických dat Každý pořádný astronom je schopen vám předpovědět, kde se bude nacházet daná hvězda půl hodiny před půlnocí. Ne každý je však téhož schopen předpovědět v případě

Více

2. Statistická terminologie a vyjadřovací prostředky. 2.1. Statistická terminologie. Statistická jednotka

2. Statistická terminologie a vyjadřovací prostředky. 2.1. Statistická terminologie. Statistická jednotka 2. Statistická terminologie a vyjadřovací prostředky 2.1. Statistická terminologie Statistická jednotka Statistická jednotka = nositel statistické informace, elementární prvek hromadného jevu. Příklady:

Více

Neuronové časové řady (ANN-TS)

Neuronové časové řady (ANN-TS) Neuronové časové řady (ANN-TS) Menu: QCExpert Prediktivní metody Neuronové časové řady Tento modul (Artificial Neural Network Time Series ANN-TS) využívá modelovacího potenciálu neuronové sítě k predikci

Více

Analýza dat z dotazníkových šetření

Analýza dat z dotazníkových šetření Analýza dat z dotazníkových šetření Cvičení 6. Rozsah výběru Př. Určete minimální rozsah výběru pro proměnnou věk v souboru dovolena, jestliže 95% interval spolehlivost průměru proměnné nemá být širší

Více

Cvičení 9: Neparametrické úlohy o mediánech

Cvičení 9: Neparametrické úlohy o mediánech Cvičení 9: Neparametrické úlohy o mediánech Úkol 1.: Párový znaménkový test a párový Wilcoxonův test Při zjišťování kvality jedné složky půdy se používají dvě metody označené A a B. Výsledky: Vzorek 1

Více

Zdokonalování gramotnosti v oblasti ICT. Kurz MS Excel kurz 6. Inovace a modernizace studijních oborů FSpS (IMPACT) CZ.1.07/2.2.00/28.

Zdokonalování gramotnosti v oblasti ICT. Kurz MS Excel kurz 6. Inovace a modernizace studijních oborů FSpS (IMPACT) CZ.1.07/2.2.00/28. Zdokonalování gramotnosti v oblasti ICT Kurz MS Excel kurz 6 1 Obsah Kontingenční tabulky... 3 Zdroj dat... 3 Příprava dat... 3 Vytvoření kontingenční tabulky... 3 Možnosti v poli Hodnoty... 7 Aktualizace

Více

Organizační pokyny k přednášce. Matematická statistika. Přehled témat. Co je statistika?

Organizační pokyny k přednášce. Matematická statistika. Přehled témat. Co je statistika? Organizační pokyny k přednášce Matematická statistika 2012 2013 Šárka Hudecová Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta UK hudecova@karlin.mff.cuni.cz http://www.karlin.mff.cuni.cz/

Více

Excel - pokračování. Př. Porovnání cestovních kanceláří ohraničení tabulky, úprava šířky sloupců, sestrojení grafu

Excel - pokračování. Př. Porovnání cestovních kanceláří ohraničení tabulky, úprava šířky sloupců, sestrojení grafu Excel - pokračování Př. Porovnání cestovních kanceláří ohraničení tabulky, úprava šířky sloupců, sestrojení grafu Př. Analýza prodeje CD základní jednoduché vzorce karta Domů Př. Skoky do dálky - funkce

Více

Výsledný graf ukazuje následující obrázek.

Výsledný graf ukazuje následující obrázek. Úvod do problematiky GRAFY - SPOJNICOVÝ GRAF A XY A. Spojnicový graf Spojnicový graf používáme především v případě, kdy chceme graficky znázornit trend některé veličiny ve zvoleném časovém intervalu. V

Více

KAPITOLA 12 - POKROČILÁ PRÁCE S TABULKOVÝM PROCESOREM

KAPITOLA 12 - POKROČILÁ PRÁCE S TABULKOVÝM PROCESOREM KAPITOLA 12 - POKROČILÁ PRÁCE S TABULKOVÝM PROCESOREM KONTINGENČNÍ TABULKA FILTROVÁNÍ DAT Kontingenční tabulka nám dává jednoduchý filtr jako čtvrté pole v podokně Pole kontingenční tabulky. Do pole Filtry

Více

Spokojenost se životem

Spokojenost se životem SEMINÁRNÍ PRÁCE Spokojenost se životem (sekundárních analýza dat sociologického výzkumu Naše společnost 2007 ) Předmět: Analýza kvantitativních revize Šafr dat I. Jiří (18/2/2012) Vypracoval: ANONYMIZOVÁNO

Více

Národníinformačnístředisko pro podporu jakosti

Národníinformačnístředisko pro podporu jakosti Národníinformačnístředisko pro podporu jakosti OVĚŘOVÁNÍ PŘEDPOKLADU NORMALITY Doc. Ing. Eva Jarošová, CSc. Ing. Jan Král Používané metody statistické testy: Chí-kvadrát test dobré shody Kolmogorov -Smirnov

Více

Statistika jako obor. Statistika. Popisná statistika. Matematická statistika TEORIE K MV2

Statistika jako obor. Statistika. Popisná statistika. Matematická statistika TEORIE K MV2 Statistika jako obor Statistika Statistika je vědní obor zabývající se zkoumáním jevů hromadného charakteru. Tím se myslí to, že zkoumaný jev musí příslušet určité části velkého množství objektů (lidí,

Více

4ST201 STATISTIKA CVIČENÍ Č. 10

4ST201 STATISTIKA CVIČENÍ Č. 10 4ST201 STATISTIKA CVIČENÍ Č. 10 regresní analýza - vícenásobná lineární regrese korelační analýza Př. 10.1 Máte zadaný výstup regresní analýzy závislosti závisle proměnné Y na nezávisle proměnné X. Doplňte

Více

Excel tabulkový procesor

Excel tabulkový procesor Pozice aktivní buňky Excel tabulkový procesor Označená aktivní buňka Řádek vzorců zobrazuje úplný a skutečný obsah buňky Typ buňky řetězec, číslo, vzorec, datum Oprava obsahu buňky F2 nebo v řádku vzorců,

Více

STATISTICA Téma 1. Práce s datovým souborem

STATISTICA Téma 1. Práce s datovým souborem STATISTICA Téma 1. Práce s datovým souborem 1) Otevření datového souboru Program Statistika.cz otevíráme z ikony Start, nabídka Programy, podnabídka Statistika Cz 6. Ze dvou nabídnutých možností vybereme

Více

Kurz SPSS: Jednoduchá analýza dat. Jiří Šafr

Kurz SPSS: Jednoduchá analýza dat. Jiří Šafr Kurz SPSS: Jednoduchá analýza dat Jiří Šafr vytvořeno 29. 6. 2009 Dva základní typy statistiky 1. Popisná statistika: metody pro zjišťování a sumarizaci informací grfy, tabulky, popisné chrakteristiky

Více

Modul Základní statistika

Modul Základní statistika Modul Základní statistika Menu: QCExpert Základní statistika Základní statistika slouží k předběžné analýze a diagnostice dat, testování předpokladů (vlastností dat), jejichž splnění je nutné pro použití

Více

Cvičení ze statistiky. Filip Děchtěrenko ZS 2012/2013

Cvičení ze statistiky. Filip Děchtěrenko ZS 2012/2013 Cvičení ze statistiky Filip Děchtěrenko ZS 2012/2013 Cvičení ze statistiky Pondělí 16:40, C328 http://www.ms.mff.cuni.cz/~dechf7am Praktické zaměření Proč potřebuji statistiku, když chci dělat (doplň)?

Více

Statistická analýza dat podzemních vod. Statistical analysis of ground water data. Vladimír Sosna 1

Statistická analýza dat podzemních vod. Statistical analysis of ground water data. Vladimír Sosna 1 Statistická analýza dat podzemních vod. Statistical analysis of ground water data. Vladimír Sosna 1 1 ČHMÚ, OPZV, Na Šabatce 17, 143 06 Praha 4 - Komořany sosna@chmi.cz, tel. 377 256 617 Abstrakt: Referát

Více

Základní analýza dat. Úvod

Základní analýza dat. Úvod Základní analýza dat literatura: Hendl, J. 2006: Přehled statistických metod zpracování dat. Analýza a metaanalýza dat. Praha: Portál. Macháček, J. 2001: Studie k velkomoravské keramice. Metody, analýzy

Více

Excel mini úvod do kontingenčních tabulek

Excel mini úvod do kontingenčních tabulek UK FHS Řízení a supervize v sociálních a zdravotnických organizacích (ZS 2005+) Kvantitativní metody výzkumu v praxi Excel mini úvod do kontingenčních tabulek (nepovinnáčást pro KMVP) Jiří Šafr jiri.safratseznam.cz

Více

Charakteristiky kategoriálních veličin. Absolutní četnosti (FREQUENCY)

Charakteristiky kategoriálních veličin. Absolutní četnosti (FREQUENCY) Charakteristiky kategoriálních veličin Absolutní četnosti (FREQUENCY) Charakteristiky kategoriálních veličin Relativní četnosti Charakteristiky kategoriálních veličin Relativní četnosti Charakteristiky

Více

Matematické modelování dopravního proudu

Matematické modelování dopravního proudu Matematické modelování dopravního proudu Ondřej Lanč, Alena Girglová, Kateřina Papežová, Lucie Obšilová Gymnázium Otokara Březiny a SOŠ Telč lancondrej@centrum.cz Abstrakt: Cílem projektu bylo seznámení

Více