P2: Statistické zpracování dat

Podobné dokumenty
Deskriptivní statistika 1

Statistika je vědní obor zabývající se zkoumáním jevů, které mají hromadný charakter.

Pro statistické šetření si zvolte si statistický soubor např. všichni žáci třídy (několika tříd, školy apod.).

Pravděpodobnost a aplikovaná statistika

Statistika. Statistické funkce v tabulkových kalkulátorech MSO Excel a OO.o Calc

STATISTIKA. Statistika se těší pochybnému vyznamenání tím, že je nejvíce nepochopeným vědním oborem. H. Levinson

6 Intervalové odhady. spočteme aritmetický průměr, pak tyto průměry se budou chovat jako by pocházely z normálního. nekonečna.

6. P o p i s n á s t a t i s t i k a

odhady parametrů. Jednostranné a oboustranné odhady. Intervalový odhad střední hodnoty, rozptylu, relativní četnosti.

Odhady parametrů 1. Odhady parametrů

1 POPISNÁ STATISTIKA V PROGRAMU MS EXCEL

Popisná statistika - zavedení pojmů. 1 Jednorozměrný statistický soubor s kvantitativním znakem

13 Popisná statistika

ZÁKLADNÍ STATISTICKÉ VÝPOČTY (S VYUŽITÍM EXCELU)

12. N á h o d n ý v ý b ě r

Elementární zpracování statistického souboru

České vysoké učení technické v Praze. Fakulta dopravní. Semestrální práce. Statistika

III/2 Inovace a zkvalitnění výuky prostřednictvím ICT

11. P o p i s n á s t a t i s t i k a

vají statistické metody v biomedicíně

vají statistické metody v biomedicíně Literatura Statistika v biomedicínsk nském výzkumu a ve zdravotnictví

Náhodný výběr 1. Náhodný výběr

Základy statistiky. Zpracování pokusných dat Praktické příklady. Kristina Somerlíková

veličiny má stejný řád jako je řád poslední číslice nejistoty. Nejistotu píšeme obvykle jenom jednou

7. P o p i s n á s t a t i s t i k a

Závislost slovních znaků

Mezní stavy konstrukcí a jejich porušov. Hru IV. Milan RůžR. zbynek.hruby.

Popisná statistika. Zdeněk Janák 9. prosince 2007

Doc. Ing. Dagmar Blatná, CSc.

Odhady parametrů polohy a rozptýlení pro často se vyskytující rozdělení dat v laboratoři se vyčíslují podle následujících vztahů:

Parametr populace (populační charakteristika) je číselná charakteristika sledované vlastnosti

MOŽNOSTI STATISTICKÉHO POSOUZENÍ KVANTITATIVNÍCH VÝSLEDKŮ POŽÁRNÍCH ZKOUŠEK PRO POTŘEBY CERTIFIKACE A POSUZOVÁNÍ SHODY VÝROBKŮ

Mendelova univerzita v Brně Statistika projekt

Náhodu bychom mohli definovat jako součet velkého počtu drobných nepoznaných vlivů.

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ Fakulta strojního inženýrství. Matematika IV. Semestrální práce

STATISTIKA. Základní pojmy

8. Základy statistiky. 8.1 Statistický soubor

17. Statistické hypotézy parametrické testy

(Teorie statistiky a aplikace v programovacím jazyce Visual Basic for Applications)

PRAVDĚPODOBNOST A STATISTIKA

i 1 n 1 výběrový rozptyl, pro libovolné, ale pevně dané x Roznačme n 1 Téma 6.: Základní pojmy matematické statistiky

Statistika pro metrologii

Pevnost a životnost - Hru III 1. PEVNOST a ŽIVOTNOST. Hru III. Milan Růžička, Josef Jurenka, Zbyněk Hrubý.

2 STEJNORODOST BETONU KONSTRUKCE

1. Základy měření neelektrických veličin

Cvičení 6.: Výpočet střední hodnoty a rozptylu, bodové a intervalové odhady střední hodnoty a rozptylu

Při sledování a studiu vlastností náhodných výsledků poznáme charakter. podmínek různé výsledky. Ty odpovídají hodnotám jednotlivých realizací

VYSOCE PŘESNÉ METODY OBRÁBĚNÍ

Pravděpodobnostní model doby setrvání ministra školství ve funkci

} kvantitativní znaky. korelace, regrese. Prof. RNDr. Jana Zvárov. Obecné principy

Cvičení 6.: Bodové a intervalové odhady střední hodnoty, rozptylu a koeficientu korelace, test hypotézy o střední hodnotě při známém rozptylu

2 EXPLORATORNÍ ANALÝZA

1 ROVNOMĚRNOST BETONU KONSTRUKCE

Pravděpodobnost a statistika - absolutní minumum

Tento projekt je spolufinancován Evropským sociálním fondem a Státním rozpočtem ČR InoBio CZ.1.07/2.2.00/

Intervalové odhady parametrů

Co je to statistika? Statistické hodnocení výsledků zkoušek. Úvod statistické myšlení. Úvod statistické myšlení. Popisná statistika

1. Rozdělení četností a grafické znázornění Předpokládejme, že při statistickém šetření nás zajímá jediný statistický znak x, který nabývá

STATISTIKA PRO EKONOMY

Dynamická pevnost a životnost Statistika

jako konstanta nula. Obsahem centrálních limitních vět je tvrzení, že distribuční funkce i=1 X i konvergují za určitých

2. Znát definici kombinačního čísla a základní vlastnosti kombinačních čísel. Ovládat jednoduché operace s kombinačními čísly.

7. Odhady populačních průměrů a ostatních parametrů populace

Zhodnocení přesnosti měření

Přednášky část 7 Statistické metody vyhodnocování dat

Pravděpodobnost vs. statistika. Data. Teorie pravděpodobnosti pracuje s jednou nebo více teoretickými náhodnými

Úloha II.S... odhadnutelná

Základní požadavky a pravidla měření

Národní informační středisko pro podporu jakosti

2.4. INVERZNÍ MATICE

Cvičení 3 - teorie. Teorie pravděpodobnosti vychází ze studia náhodných pokusů.

1. Základy počtu pravděpodobnosti:

Úloha III.S... limitní

z možností, jak tuto veličinu charakterizovat, je určit součet

Odhady parametrů základního souboru. Ing. Michal Dorda, Ph.D.

Intervalové odhady parametrů některých rozdělení.

n-rozměrné normální rozdělení pravděpodobnosti

3. Charakteristiky a parametry náhodných veličin

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

BAKALÁŘSKÁ STA I. + II.

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ

Tento odhad má rozptyl ( ) σ 2 /, kde σ 2 je rozptyl souboru, ze kterého výběr pochází. Má-li každý prvek i. σ 2 ( i. ( i

Pravděpodobnost a aplikovaná statistika

Analýza a zpracování signálů. 3. Číselné řady, jejich vlastnosti a základní operace, náhodné signály

Přednáška VI. Intervalové odhady. Motivace Směrodatná odchylka a směrodatná chyba Centrální limitní věta Intervaly spolehlivosti

Ilustrativní příklad ke zkoušce z B_PS_A léto 2013.

P1: Úvod do experimentálních metod

Tržní ceny odrážejí a zahrnují veškeré informace předpokládá se efektivní trh, pro cenu c t tedy platí c t = c t + ε t.

Matematika přehled vzorců pro maturanty (zpracoval T. Jánský) Úpravy výrazů. Binomická věta

2. Náhodná veličina. je konečná nebo spočetná množina;

Příklad statistické zpracování dat z dotazníku

4. Základní statistické pojmy.

PE 301 Podniková ekonomika 2. Garant: Eva KISLINGEROVÁ. Téma Metody mezipodnikového srovnávání. Téma 12. Eva Kislingerová

Ilustrativní příklad ke zkoušce z B_PS_A léto 2014.

Statistika. Jednotlivé prvky této množiny se nazývají prvky statistického souboru (statistické jednotky).

4. B o d o v é o d h a d y p a r a m e t r ů

ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE

1. ZÁKLADY VEKTOROVÉ ALGEBRY 1.1. VEKTOROVÝ PROSTOR A JEHO BÁZE

8. Odhady parametrů rozdělení pravděpodobnosti

Přednáška VIII. Testování hypotéz o kvantitativních proměnných

Transkript:

P: Statistické zpracováí dat

Úvodem - Statistika: věda, zabývající se shromažďováím, tříděím a ásledým popisem velkých datových souborů. - Základem statistiky je teorie pravděpodobosti, založeá a popisu zákoitostí týkajících se jevů, které mohou a emusí astat. Základí pojmy Statistická jedotka (Statistical uit) zkoumaý objekt Statistický zak (Statistical property) vlastost statistické jedotky. Statistický zak může být dvojího typu, a to kvatitativí a kvalitativí. Kvatitativí zak je možé defiovat prostředictvím číselé hodoty a je možé jej dále rozdělit a spojitý ebo diskrétí. Kvalitativí zak je aproti tomu vlastost, která je popsáa slově.

Základí pojmy Statistický soubor (Statistical dataset) možia zahrující všechy statistické jedotky. V závislosti a tom, kolik zaků u statistické jedotky zjišťujeme, defiujeme -rozměrý statistický soubor. Zjišťujeme-li pouze jede zak (apř. barvu karoserie u automobilu), pak hovoříme o jedorozměrém souboru. Zjišťujeme-li dva zaky, hovoříme o dvourozměrém souboru atd. Základí soubor (Statistical populatio) (hovoříme o populaci) obsahuje všechy statistické jedotky Výběrový soubor (Statistical subpopulatio) (hovoříme o výběru) obsahuje pouze ěkteré statistické jedotky

Rozděleí četostí Absolutí četost (Absolute frequecy) Absolutí četost hodoty zaku i vyjadřuje počet statistických jedotek, kterým přísluší stejá hodota zaku i pro i=,,3,, h. Pro absolutí četost platí: Relativí četost (Relative frequecy) Relativí četost hodoty zaku i je defiováa jako podíl absolutí četosti i hodoty zaku i a rozsahu souboru. Platí: Pro relativí četost f i platí: f h i i i i h i f i

Rozděleí četostí V případě, že pracujeme se spojitými zaky, popřípadě se zaky sice diskrétími, ale s velkým počtem možých variat, je a místě použití itervalového rozděleí četostí, u ěhož staovujeme počet výskytů hodot zaku, které áleží do předem defiovaých itervalů. - Počet itervalů s optimálě v rozmezí 8 0. Možosti určeí s:. Sturgesovo pravidlo: s log kde vyjadřuje počet statistických jedotek.. s 8 00 ma mi 3. s kde vyjadřuje počet statistických jedotek. Délka itervalu je poté rova: h = ma mi k

Charakteristiky statistického souboru charakteristiky polohy (Measures of positio) Mezi charakteristiky polohy řadíme aritmetický průměr, modus, mediá, harmoický a geometrický průměr Aritmetický průměr hodot kvatitativího zaku,,, (Arithmetic mea)... E( ) i V ěkterých případech se rověž používá tz. vážeý aritmetický průměr, kdy každou hodotu zaku ásobíme koeficietem, který většiou reprezetuje počet výskytů daé hodoty (četost):... i i Geometrický průměr hodot kvatitativího zaku,,, (Geometric mea) G

Charakteristiky statistického souboru charakteristiky polohy V prai se rověž používá průměré tempo růstu (average growth rate) jedá se o geometrický průměr podílů hodot za dvě po sobě jdoucí (časová) období: Harmoický průměr hodot kvatitativího zaku,,, (Harmoic mea) Defiová jako podíl rozsahu souboru a součtu převráceých hodot zaku statistického souboru: Harmoický průměr se využívá v případě erovoměrého rozložeí zaku kolem aritmetického průměru ebo v případě etrémě ízkých či vysokých hodot. ń ń G 0 0 i H...

Charakteristiky statistického souboru charakteristiky polohy Modus zaku statistického souboru (Mode of statistical dataset) Modus zaku statistického souboru představuje hodotu, která se v souboru vyskytuje ejčastěji. V případě itervalového rozděleí četostí staovujeme tzv. modálí iterval. Mediá ˆ ~ zaku statistického souboru Mediá zaku statistického souboru představuje prostředí hodotu ze souboru uspořádaého podle velikosti. Jiými slovy, mediá rozděluje statistický soubor a dvě stejě velké části. Kvatily (Quatiles) Kvatily jsou čísla, která dělí soubor seřazeých hodot a ěkolik (zhruba) stejě velkých částí. Kvatil tedy představuje míru polohy rozděleí pravděpodobosti áhodé veličiy. (viz apř. Mediá)

Charakteristiky statistického souboru charakteristiky variability (measures of variability) - Charakteristiky variability ám dávají iformaci o míře odlišosti zaků prvků statistického souboru od zvoleé charakteristiky polohy (středí hodoty), popřípadě od sebe avzájem. - Mezi charakteristiky variability patří variačí rozpětí, rozptyl, směrodatá odchylka, variačí koeficiet a koeficiet korelace Variačí rozpětí (Rage) Variačí rozpětí je ejjedodušší ale zároveň i ejhrubší mírou variability. Je defiováo jako rozdíl mezi ejmeší a ejvětší hodotou zaku: R ma mi Rozptyl a směrodatá odchylka (Variace ad stadard deviatio) Rozptyl a směrodatá odchylka patří mezi míry variability, které jsou, a rozdíl od variačího rozpětí, závislé a všech hodotách statistického souboru. Rozptyl, jiými slovy průměrá kvadratická odchylka a směrodatá odchylka jsou defiováy ásledově (jako přesý parametr populace): i i

Charakteristiky statistického souboru charakteristiky variability Nahlížíme-li a daý soubor jako a výběrový, mluvíme o tzv. výběrovém rozptylu σ resp. výběrové směrodaté odchylce. Pomocí výrazu (-) místo čleu docílíme přesějšího odhadu skutečé hodoty populačího rozptylu, především při výpočtu a základě malých výběrových souborů: i Z obou výpočtů je zřejmé, že rozdíl mezi rozptylem a jedé straě a výběrovým rozptylem a druhé straě je při velkém rozsahu souboru ( > 30) prakticky zaedbatelý. V případě, že statistický zak abývá hodot,,, s četostmi,,,, popřípadě relativími četostmi f i, pak lze rozptyl vypočítat ásledově: i i i i f i

Charakteristiky statistického souboru charakteristiky variability Variačí koeficiet (Coefficiet of variatio) Variačí koeficiet je defiová jako podíl směrodaté odchylky a aritmetického průměru sledovaého zaku : Variačí koeficiet vyjadřuje míru kvality průměru. Koeficiet korelace (Correlatio coefficiet) Koeficiet korelace popisuje míru závislosti dvou zaků a y. Platí: k r y kde k i yi y Aby defiice měla smysl, musí být směrodaté odchylky růzé od uly (platí v případě, že zaky a y ejsou kostatí).

Literatura [] Litschmaová, M.: Úvod od Statistiky, elektroický učebí tet dostupý a adrese: http://mi.vsb.cz/sites/mi.vsb.cz/files/uit/uvod_do_statistiky.pdf [] Fajom, B.: Úvod do statistiky, elektroický učebí tet dostupý a adrese: http://www.rozhovor.cz/ma+fy/statistika.pdf [3] Wikipedie - https://cs.wikipedia.org/wiki/chyby_typu_i_a_ii#chyba_typu_i [4] http://www.george.eu/matematika/claky/rozptyl.pdf [5] http://www.ef.jcu.cz/~birom/stat/predasky/09.pdf [6] https://cit.vfu.cz/stat/fvl/teorie/pred/variabil.htm Study materials i Eglish https://www.csu.edu/crsc/evets/ugw06/presetatios/scheywar/fialudergrad.pdf http://www.mv.helsiki.fi/home/jmisotal/bos.pdf https://www.khaacademy.org/math/probability