Statistika aneb známe tři druhy lži: úmyslná neúmyslná statistika Statistika je metoda, jak vyjádřit nejistá data s přesností na setinu procenta. den..00..00 3..00..00..00..00..00..00..00..00..00..00 3..00..00..00..00..00..00..00 0..00..00..00 3..00..00..00..00..00 teplota 3 cílem je zjednodušit nějaká data tak, abychom se v nich lépe vyznali důsledkem je ztráta informací! průměrná teplota:. C minimum: C maximum: C rozsah: C modus: C medián: C rozptyl:. C směrodatná odchylka:.3 C samotná data (; ; ; ; ; ) = základní soubor N = počet prvků základního souboru = 30 (prvek = pozorování) X i = hodnota i-tého prvku (X =; X =3; )
Statistika je činnost, která se zabývá sběrem, zaznamenáváním, zpracováním a následně rozborem a vyhodnocováním dat získaných při sociálních průzkumech, vědeckých experimentech a klinických zkouškách STATISTICKÝ ZNAK je společnou vlastností prvků statistického souboru, jejíž proměnnost je předmětem zkoumání Např. věk, rodinný stav, bydliště, zaměstnání nebo u věcí účel, stáří těžce zranění, vliv alkoholu, vzniklá škoda, známky
Hodnota statistického znaku jsou jednotlivé údaje statistického znaku. Diskrétní (je možné je spočítat) Nominální - kategorie Ordinární lze je seřadit a přiřadit jim číslo, tj. určit pořadí. Spojité (údaje, které lze měřit -přečíst na stupnici) Určete typ dat: věk člověka, stáří budovy, počet podlaží, teplota, rozloha, pohlaví, rodinný stav, zaměstnání, účel budovy, barva očí, státní příslušnost, hustota provozu, Příklad: Určete z následujn sledující tabulky průměrný rný počet aut, čekající na odbavení Čas (min) 0 0 0 počet aut 0 3 Čas (min) 0 0 0 počet aut 0 3 Ti.Ni 0 0 0 0 0 3 33,3 3
Geometrický a harmonický průměr Vhodnější míra polohy pro poměrné znaky. Je často používán v ekonomii a biologii (např. pro výpočet průměrného růstu). Jsou-li hodnoty znaku nerovnoměrně rozloženy kolem aritmetického průměru, nebo když jsou hodnoty extrémně nízké či vysoké základní popisné statistiky průměr aritmetický geometrický harmonický µ N i= = N Xi N N Xi i = N N i= X i základní soubor:,,,, + + + + 3 = = = = =, = =,0 + + + +
Charakteristiky polohy Cíl je jedním číslem charakterizovat velikost všech číselných hodnot ve statistickém souboru. Charakteristiky polohy nám umožňují srovnávat úroveň zkoumaného jevu u dvou nebo více souborů. aritmetický průměr medián modus. základní popisné statistiky modus nejčastěji se vyskytující hodnota min. modus =, max. modus = N může jich být víc odpovídá vrcholu histogramu četností medián polovina pozorování menší než medián, polovina větší střed uspořádaného základního souboru další kvantily kvartily, percentily apod. (% percentilříká, že % prvků leží pod touto hodnotou a % nad ní) i pro pouze seřazená data (na ordinální stupnici) např. jídlo je vynikající (), dobré (), ucházející (3), bez chuti (), nic moc (), hnusné (), vyvolávající zvracení () Beaufortova stupnice síly větru, Mohsova stupnice tvrdosti apod. v případě ulítlé hodnoty lepší vypovídající hodnota než průměr
základní popisné statistiky rozptyl (variance) průměrná hodnota druhé mocniny odchylky od průměru směrodatná odchylka odmocnina z rozptylu čím menší, tím nižší variabilita dat variační koeficient porovnává variabilitu nestejně velkých objektů (myš a slon) bezrozměrné číslo σ CV = X σ N i= = základní soubor:,,,, průměr = ( X i µ ) N ( ) + ( ) + ( ) + ( ) + ( ) σ = = + + + + = = σ = =,3 směrodatná odchylka empirické pravidlo: většina hodnot se neodlišuje od průměru o více než jednu směrodatnou odchylku a skoro všechny hodnoty jsou v pásmu do dvou směrodatných odchylek od průměru. normální rozdělení: Darwin (0 - ) byl prvním člověkem, který evoluci vnímal jako proces v první řadě statistický.
Histogram Č etnost 0 Další Třídy Četnost Histogram 3 Č e t n o s t 0 Další Četnost Č e t n o s t 0 Třídy Histogram Další Četnost průměr sm. odchylka modus medián sm. odchylka výběru. 0.0 0.3...3. 0.3 0.0 vždy uvádějte: n, průměr, sm. odchylku ostatní podle potřeby Třídy n
grafy vynikající prostředek pro zpřehlednění dat také pro klamání čtenáře Histogram 0 Další histogram četností četnost četnost zajímá nás rozložení dané proměnné v celém souboru Třídy teplota vývoj proměnné zajímá nás vývojový trend proměnné.0.0.0.0.0.0.0.0 0.0 teplota..00..00..00..00..00
Prezentace grafem Histogram (sloupcový diagram)
Normáln lní rozdělen lení D e n s i t y 0. 0. 0 0.0. 3.0..0..0. stariauta 3
Box and Whisker Box and Whisker v e k p o j i s t e n 0 0 30 3 stariauta
Scatterplot correlation coefficient Matrix plot Zobrazuje vzájemné závislosti výběrů z vícerozměrného rozdělení (na obrázku 3-rozměrného) Na diagonále - histogramy jednotlivých složek Mimo diagonálu - scatterplot
Třídění statistických dat. stanovíme si třídící znak. určíme si hodnoty třídícího znaku 3. vyjádříme četnosti. Simulace systému hromadné obsluhy Nejčast astější chyby v semestráln lních pracích ch
Prezentace výsledků Při tisícinásobném opakování se výsledky drží na konstantní hodnotě. Zčehož se dá vyvodit statistický závěr a to, že simulační přepážka je schopna obsloužit průměrně lidí za den Chybí statistické zhodnocení naměř ěřených výsledků
Špatně zvolená grafická prezentace výsledků Špatně zvolená grafická prezentace výsledků
Špatně zvolená grafická prezentace výsledků Prezentace výsledků