Statistika. cílem je zjednodušit nějaká data tak, abychom se v nich lépe vyznali důsledkem je ztráta informací!

Podobné dokumenty
Matematika III. 27. listopadu Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012. Tutoriál č. 4: Exploratorní analýza. Jan Kracík

Základy popisné statistiky. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

Popisná statistika. Statistika pro sociology

Náhoda při hře. Náhoda při hře

veličin, deskriptivní statistika Ing. Michael Rost, Ph.D.

Základy popisné statistiky

Náhoda při hře. Náhoda při hře

Analýza dat na PC I.

Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D.

Metodologie pro ISK II

Statistika. Diskrétní data. Spojitá data. Charakteristiky polohy. Charakteristiky variability

Statistika pro geografy

ZÁKLADNÍ STATISTICKÉ CHARAKTERISTIKY

Výrobní produkce divizí Ice Cream Po lo ha plane t Rozložený výse ový 3D graf Bublinový graf Histogram t s tn e ídy

Číselné charakteristiky

Metody sociálních výzkumů. Velmi skromný úvod do statistiky. Motto: Jsou tři druhy lži-lež prostá, lež odsouzeníhodná a statistika.

Základy pravděpodobnosti a statistiky. Popisná statistika

TECHNICKÁ UNIVERZITA V LIBERCI SEMESTRÁLNÍ PRÁCE

TECHNICKÁ UNIVERZITA V LIBERCI. Ekonomická fakulta. Semestrální práce. Statistický rozbor dat z dotazníkového šetření školní zadání

Nejčastější chyby v explorační analýze

Jevy a náhodná veličina

Popisná statistika kvantitativní veličiny

Informační technologie a statistika 1

Renáta Bednárová STATISTIKA PRO EKONOMY

Základní statistické charakteristiky

Matematika III. 29. října Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

STATISTICKÉ CHARAKTERISTIKY

Základy popisné statistiky

Statistika s Excelem aneb Máme data. A co dál? Martina Litschmannová Katedra aplikované matematiky, FEI, VŠB-TU Ostrava

MATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci

Zápočtová práce STATISTIKA I


Otázky k měření centrální tendence. 1. Je dáno rozložení, ve kterém průměr = medián. Co musí být pravdivé o tvaru tohoto rozložení?

Číselné charakteristiky a jejich výpočet

Kontingenční tabulky v Excelu. Představení programu Statistica

Základy biostatistiky

Úvod do kurzu. Moodle kurz. (a) (b) heslo pro hosty: statistika (c) skripta na pravděpodobnost

Statistické metody. Martin Schindler KAP, tel , budova G. naposledy upraveno: 9.

Popisná statistika. úvod rozdělení hodnot míry centrální tendence míry variability míry šikmosti a špičatosti grafy

POPISNÁ STATISTIKA Komentované řešení pomocí programu Statistica

Praktická statistika. Petr Ponížil Eva Kutálková

Náhodná veličina a rozdělení pravděpodobnosti

Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D.

Charakteristika datového souboru

Statistické metody - nástroj poznání a rozhodování anebo zdroj omylů a lží

PSY117/454 Statistická analýza dat v psychologii Přednáška 5 ZOBRAZENÍ DVOUROZMĚRNÝCH DAT KORELAČNÍ KOEFICIENT. Všichni žijeme v matrixu.

TECHNICKÁ UNIVERZITA V LIBERCI Ekonomická fakulta

MATEMATIKA III V PŘÍKLADECH

23. Matematická statistika

STATISTIKA 1. Adam Čabla Katedra statistiky a pravděpodobnosti VŠE

Aplikovaná statistika v R

Popisná statistika. úvod rozdělení hodnot míry centrální tendence míry variability míry šikmosti a špičatosti grafy

Základní statistické pojmy

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ. FAKULTA STROJNÍHO INŽENÝRSTVÍ Ústav materiálového inženýrství - odbor slévárenství

Mnohorozměrná statistická data

Úloha č. 2 - Kvantil a typická hodnota. (bodově tříděná data): (intervalově tříděná data): Zadání úlohy: Zadání úlohy:

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

Jak nelhat se statistikou? Martina Litschmannová Katedra aplikované matematiky, FEI, VŠB-TU Ostrava

TECHNICKÁ UNIVERZITA V LIBERCI

Obsah. Statistika Zpracování informací ze statistického šetření Charakteristiky úrovně, variability a koncentrace kvantitativního znaku

Náhodná proměnná. Náhodná proměnná může mít rozdělení diskrétní (x 1. , x 2. ; x 2. spojité (<x 1

mezi studenty. Dále bychom rádi posoudili, zda dobrý výsledek v prvním testu bývá doprovázen dobrým výsledkem i v druhém testu.

3. Základní statistické charakteristiky. KGG/STG Zimní semestr Základní statistické charakteristiky 1

Příloha podrobný výklad vybraných pojmů

ANALÝZA DAT V R 2. POPISNÉ STATISTIKY. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.

Semestrální projekt. do předmětu Statistika. Vypracoval: Adam Mlejnek Oponenti: Patrik Novotný Jakub Nováček Click here to buy 2

Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu

4. Zpracování číselných dat

Metodologie pro Informační studia a knihovnictví 2

7. SEMINÁŘ DESKRIPTIVNÍ STATISTIKA

Me neˇ nezˇ minimum ze statistiky Michaela S ˇ edova KPMS MFF UK Principy medicı ny zalozˇene na du kazech a za klady veˇdecke prˇı pravy 1 / 33

7. Rozdělení pravděpodobnosti ve statistice

Mnohorozměrná statistická data

Co je to statistika? Úvod statistické myšlení. Základy statistického hodnocení výsledků zkoušek. Petr Misák

Statistika. Program R. popisná (deskriptivní) statistika popis konkrétních dat. induktivní (konfirmatorní) statistika. popisná statistika

Organizační pokyny k přednášce. Matematická statistika. Přehled témat. Co je statistika?

Popisná statistika. Jaroslav MAREK. Univerzita Palackého

Popisná statistika. Komentované řešení pomocí MS Excel

PSY117/454 Statistická analýza dat v psychologii. Zobrazení dvojrozměrných dat Bodový graf - Scatterplot Korelační koeficient

2. Základní typy dat Spojitá a kategoriální data Základní popisné statistiky Frekvenční tabulky Grafický popis dat

Statistika - charakteristiky variability

Metodologie pro Informační studia a knihovnictví 2

Předmět studia: Ekonomická statistika a analytické metody I, II

Průzkumová analýza dat

Zaokrouhlování: Směrodatná odchylka se zaokrouhluje nahoru na stanovený počet platných cifer. Míry

TECHNICKÁ UNIVERZITA V LIBERCI EKONOMICKÁ FAKULTA

Matematická statistika

METODOLOGIE I - METODOLOGIE KVANTITATIVNÍHO VÝZKUMU

ANALÝZA DAT V R 3. POPISNÉ STATISTIKY, NÁHODNÁ VELIČINA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK

Statistika jako obor. Statistika. Popisná statistika. Matematická statistika TEORIE K MV2

Charakterizace rozdělení

Statistika v současnosti

přesné jako tabulky, ale rychle a lépe mohou poskytnou názornou představu o důležitých tendencích a souvislostech.

Statistika pro gymnázia

Cvičení ze statistiky. Filip Děchtěrenko ZS 2012/2013

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Transkript:

Statistika aneb známe tři druhy lži: úmyslná neúmyslná statistika Statistika je metoda, jak vyjádřit nejistá data s přesností na setinu procenta. den..00..00 3..00..00..00..00..00..00..00..00..00..00 3..00..00..00..00..00..00..00 0..00..00..00 3..00..00..00..00..00 teplota 3 cílem je zjednodušit nějaká data tak, abychom se v nich lépe vyznali důsledkem je ztráta informací! průměrná teplota:. C minimum: C maximum: C rozsah: C modus: C medián: C rozptyl:. C směrodatná odchylka:.3 C samotná data (; ; ; ; ; ) = základní soubor N = počet prvků základního souboru = 30 (prvek = pozorování) X i = hodnota i-tého prvku (X =; X =3; )

Statistika je činnost, která se zabývá sběrem, zaznamenáváním, zpracováním a následně rozborem a vyhodnocováním dat získaných při sociálních průzkumech, vědeckých experimentech a klinických zkouškách STATISTICKÝ ZNAK je společnou vlastností prvků statistického souboru, jejíž proměnnost je předmětem zkoumání Např. věk, rodinný stav, bydliště, zaměstnání nebo u věcí účel, stáří těžce zranění, vliv alkoholu, vzniklá škoda, známky

Hodnota statistického znaku jsou jednotlivé údaje statistického znaku. Diskrétní (je možné je spočítat) Nominální - kategorie Ordinární lze je seřadit a přiřadit jim číslo, tj. určit pořadí. Spojité (údaje, které lze měřit -přečíst na stupnici) Určete typ dat: věk člověka, stáří budovy, počet podlaží, teplota, rozloha, pohlaví, rodinný stav, zaměstnání, účel budovy, barva očí, státní příslušnost, hustota provozu, Příklad: Určete z následujn sledující tabulky průměrný rný počet aut, čekající na odbavení Čas (min) 0 0 0 počet aut 0 3 Čas (min) 0 0 0 počet aut 0 3 Ti.Ni 0 0 0 0 0 3 33,3 3

Geometrický a harmonický průměr Vhodnější míra polohy pro poměrné znaky. Je často používán v ekonomii a biologii (např. pro výpočet průměrného růstu). Jsou-li hodnoty znaku nerovnoměrně rozloženy kolem aritmetického průměru, nebo když jsou hodnoty extrémně nízké či vysoké základní popisné statistiky průměr aritmetický geometrický harmonický µ N i= = N Xi N N Xi i = N N i= X i základní soubor:,,,, + + + + 3 = = = = =, = =,0 + + + +

Charakteristiky polohy Cíl je jedním číslem charakterizovat velikost všech číselných hodnot ve statistickém souboru. Charakteristiky polohy nám umožňují srovnávat úroveň zkoumaného jevu u dvou nebo více souborů. aritmetický průměr medián modus. základní popisné statistiky modus nejčastěji se vyskytující hodnota min. modus =, max. modus = N může jich být víc odpovídá vrcholu histogramu četností medián polovina pozorování menší než medián, polovina větší střed uspořádaného základního souboru další kvantily kvartily, percentily apod. (% percentilříká, že % prvků leží pod touto hodnotou a % nad ní) i pro pouze seřazená data (na ordinální stupnici) např. jídlo je vynikající (), dobré (), ucházející (3), bez chuti (), nic moc (), hnusné (), vyvolávající zvracení () Beaufortova stupnice síly větru, Mohsova stupnice tvrdosti apod. v případě ulítlé hodnoty lepší vypovídající hodnota než průměr

základní popisné statistiky rozptyl (variance) průměrná hodnota druhé mocniny odchylky od průměru směrodatná odchylka odmocnina z rozptylu čím menší, tím nižší variabilita dat variační koeficient porovnává variabilitu nestejně velkých objektů (myš a slon) bezrozměrné číslo σ CV = X σ N i= = základní soubor:,,,, průměr = ( X i µ ) N ( ) + ( ) + ( ) + ( ) + ( ) σ = = + + + + = = σ = =,3 směrodatná odchylka empirické pravidlo: většina hodnot se neodlišuje od průměru o více než jednu směrodatnou odchylku a skoro všechny hodnoty jsou v pásmu do dvou směrodatných odchylek od průměru. normální rozdělení: Darwin (0 - ) byl prvním člověkem, který evoluci vnímal jako proces v první řadě statistický.

Histogram Č etnost 0 Další Třídy Četnost Histogram 3 Č e t n o s t 0 Další Četnost Č e t n o s t 0 Třídy Histogram Další Četnost průměr sm. odchylka modus medián sm. odchylka výběru. 0.0 0.3...3. 0.3 0.0 vždy uvádějte: n, průměr, sm. odchylku ostatní podle potřeby Třídy n

grafy vynikající prostředek pro zpřehlednění dat také pro klamání čtenáře Histogram 0 Další histogram četností četnost četnost zajímá nás rozložení dané proměnné v celém souboru Třídy teplota vývoj proměnné zajímá nás vývojový trend proměnné.0.0.0.0.0.0.0.0 0.0 teplota..00..00..00..00..00

Prezentace grafem Histogram (sloupcový diagram)

Normáln lní rozdělen lení D e n s i t y 0. 0. 0 0.0. 3.0..0..0. stariauta 3

Box and Whisker Box and Whisker v e k p o j i s t e n 0 0 30 3 stariauta

Scatterplot correlation coefficient Matrix plot Zobrazuje vzájemné závislosti výběrů z vícerozměrného rozdělení (na obrázku 3-rozměrného) Na diagonále - histogramy jednotlivých složek Mimo diagonálu - scatterplot

Třídění statistických dat. stanovíme si třídící znak. určíme si hodnoty třídícího znaku 3. vyjádříme četnosti. Simulace systému hromadné obsluhy Nejčast astější chyby v semestráln lních pracích ch

Prezentace výsledků Při tisícinásobném opakování se výsledky drží na konstantní hodnotě. Zčehož se dá vyvodit statistický závěr a to, že simulační přepážka je schopna obsloužit průměrně lidí za den Chybí statistické zhodnocení naměř ěřených výsledků

Špatně zvolená grafická prezentace výsledků Špatně zvolená grafická prezentace výsledků

Špatně zvolená grafická prezentace výsledků Prezentace výsledků