Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Podobné dokumenty
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM

STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky)

Zápočtová práce STATISTIKA I

Tématické okruhy pro státní závěrečné zkoušky. bakalářské studium. studijní obor "Management jakosti"

Tématické okruhy pro státní závěrečné zkoušky. bakalářské studium. studijní obor "Management jakosti"

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Grafický a číselný popis rozložení dat 3.1 Způsoby zobrazení dat Metody zobrazení kvalitativních a ordinálních dat Metody zobrazení kvan

Tématické okruhy pro státní závěrečné zkoušky. bakalářské studium. studijní obor "Management jakosti"

ANALÝZA DAT V R 3. POPISNÉ STATISTIKY, NÁHODNÁ VELIČINA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK

VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky SMAD

STATISTIKA. Inovace předmětu. Obsah. 1. Inovace předmětu STATISTIKA Sylabus pro předmět STATISTIKA Pomůcky... 7

VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky

Úvodem Dříve les než stromy 3 Operace s maticemi

Číselné charakteristiky

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ. FAKULTA STROJNÍHO INŽENÝRSTVÍ Ústav materiálového inženýrství - odbor slévárenství

VŠB Technická univerzita Ostrava BIOSTATISTIKA

Simulace. Simulace dat. Parametry

Náhodná proměnná. Náhodná proměnná může mít rozdělení diskrétní (x 1. , x 2. ; x 2. spojité (<x 1

Mnohorozměrná statistická data

TECHNICKÁ UNIVERZITA V LIBERCI SEMESTRÁLNÍ PRÁCE

Charakteristika datového souboru

, Brno Hanuš Vavrčík Základy statistiky ve vědě

Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie STATISTICKÉ ZPRACOVÁNÍ EXPERIMENTÁLNÍCH DAT

1. Číselné posloupnosti - Definice posloupnosti, základní vlastnosti, operace s posloupnostmi, limita posloupnosti, vlastnosti limit posloupností,

TEST Z TEORIE EXPLORAČNÍ ANALÝZA DAT

Statistická analýza jednorozměrných dat

Pracovní adresář. Nápověda. Instalování a načtení nového balíčku. Importování datového souboru. Práce s datovým souborem

Statistické metody - nástroj poznání a rozhodování anebo zdroj omylů a lží

Tématické okruhy pro státní závěrečné zkoušky. magisterské studium

Praktická statistika. Petr Ponížil Eva Kutálková

Charakterizace rozdělení

Analýza dat na PC I.

veličin, deskriptivní statistika Ing. Michael Rost, Ph.D.

Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012. Tutoriál č. 4: Exploratorní analýza. Jan Kracík

Porovnání dvou výběrů

pravděpodobnosti, popisné statistiky

Statistika. Diskrétní data. Spojitá data. Charakteristiky polohy. Charakteristiky variability

Kvantily a písmenové hodnoty E E E E-02

Náhodná veličina a rozdělení pravděpodobnosti

Testování statistických hypotéz

Popisná statistika. Komentované řešení pomocí MS Excel

MĚŘENÍ STATISTICKÝCH ZÁVISLOSTÍ

Vzorová prezentace do předmětu Statistika

Mnohorozměrná statistická data

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice

PRŮZKUMOVÁ ANALÝZA JEDNOROZMĚRNÝCH DAT Exploratory Data Analysis (EDA)

POPISNÁ STATISTIKA Komentované řešení pomocí programu Statistica

Vysoká škola báňská technická univerzita Ostrava. Fakulta elektrotechniky a informatiky

Obsah. Statistika Zpracování informací ze statistického šetření Charakteristiky úrovně, variability a koncentrace kvantitativního znaku

Bakalářské studium na MFF UK v Praze Obecná matematika Zaměření: Stochastika. 1 Úvodní poznámky. Verze: 13. června 2013

hl d STATISTICKÝCH METOD zpraeování dat portál Analýza a metaanalýzadat

Matematika III. 27. listopadu Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

Průzkumová analýza dat

Tomáš Karel LS 2012/2013

Regresní analýza 1. Regresní analýza

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie. Nám. Čs. Legií 565, Pardubice. Semestrální práce ANOVA 2015


Pravděpodobnost a aplikovaná statistika

VYSOKÁ ŠKOLA BÁŇSKÁ TECHNICKÁ UNIVERZITA OSTRAVA FAKULTA METALURGIE A MATERIÁLOVÉHO INŽENÝRSTVÍ KATEDRA KONTROLY A ŘÍZENÍ JAKOSTI

Přednáška. Diskrétní náhodná proměnná. Charakteristiky DNP. Základní rozdělení DNP

Nadstavba pro statistické výpočty Statistics ToolBox obsahuje více než 200 m-souborů které podporují výpočty v následujících oblastech.

Tomáš Karel LS 2012/2013

Základní statistické metody v rizikovém inženýrství

Předpoklad o normalitě rozdělení je zamítnut, protože hodnota testovacího kritéria χ exp je vyšší než tabulkový 2

Přednáška XI. Asociace ve čtyřpolní tabulce a základy korelační analýzy

Informační technologie a statistika 1

Co je to statistika? Úvod statistické myšlení. Základy statistického hodnocení výsledků zkoušek. Petr Misák

KORELACE. Komentované řešení pomocí programu Statistica

Úvod do kurzu. Moodle kurz. (a) (b) heslo pro hosty: statistika (c) skripta na pravděpodobnost

UNIVERZITA PARDUBICE

PRAVDĚPODOBNOST A STATISTIKA 1 Metodický list č 1.

VŠB Technická univerzita Ostrava

Úloha č. 2 - Kvantil a typická hodnota. (bodově tříděná data): (intervalově tříděná data): Zadání úlohy: Zadání úlohy:

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

S E M E S T R Á L N Í

Testy statistických hypotéz

Popisná statistika. Jaroslav MAREK. Univerzita Palackého

Pravděpodobnost a statistika I KMA/K413

15. T e s t o v á n í h y p o t é z

UNIVERZITA PARDUBICE CHEMICKO-TECHNOLOGICKÁ FAKULTA KATEDRA ANALYTICKÉ CHEMIE

Inovace bakalářského studijního oboru Aplikovaná chemie

Modul Základní statistika

Normy ČSN a ČSN ISO z oblasti aplikované statistiky (stav aktualizovaný k )

Popisná statistika. Statistika pro sociology

Statistická analýza jednorozměrných dat

VŠB Technická univerzita Ostrava

MÍRY ZÁVISLOSTI (KORELACE A REGRESE)

Návrh a vyhodnocení experimentu

Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu

z Matematické statistiky 1 1 Konvergence posloupnosti náhodných veličin

Transkript:

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Pravděpodobnost a matematická statistika 2010 1.týden (20.09.-24.09. ) Data, typy dat, variabilita, frekvenční analýza (histogramy, četnosti absolutní, relativní, prosté, kumulativní), základní statistické charakteristiky (průměr, výběr.rozptyl, minimum, maximum, medián, kvartily, boxplot), sešikmenná rozdělení (vzájemná poloha mediánu a střední hodnoty), chvosty, kvantily 2. týden (27.09.-01.10.) Princip statistické indukce, výběr, vlastnosti výběru, experiment. Náhodná veličina, rozdělení pravděpodobnosti a jeho souvislost s histogramem. Pravděpodobnost, pravidla pro počítání s pravděpodobností, podmíněná pravděpodobnost, závislost náhodných veličin. 3.týden (04.10.-08.10.) 4.týden (11.10.-15.10.) Rozdělení chyb měření - normální rozdělení a počítání s ním. Odhady parametrů normálního rozdělení. Intervaly spolehlivosti pro normální data. Jednovýběrové testy o střední hodnotě 5.týden (18.10.-24.10.) Výběrový poměr jako odhad pravděpodobnosti sledovaného jevu. Alternativní rozdělení, binomické rozdělení. Intervalový odhad výběrového poměru. Výběry s vracením a bez vracení (binomické a hypergeometrické rozdělení) 6.týden (25.10.-29.10.) odpadá 7.týden (01.11.-05.11.) Poruchy v čase (Poissonův proces). Poissonovo rozdělení, exponenciální rozdělení, jeho výhody a nevýhody, modelování doby do poruchy pomocí Weibullova rozdělení, lognormálního rozdělení, případně useknuté normální rozdělení. 8.týden (08.11.-12.11.) Testy dobré shody, Q-Q graf (pouze vysvětlení), testy normality. Některé neparametrické testy 9.týden (15.11.-19.11.) Dvě náhodné veličiny - srovnání dvou výběrů (dvouvýběrové testy) 10. týden (22.11.-26.11.) Dvě náhodné veličiny. Dvourozměrné četnosti jako odhad dvourozměrného rozdělení, frekvenční tabulka. Marginální rozdělení (vše pouze diskrétně s tabulkou) 11. týden (29.11.-03.12.) Závislost náhodných veličin, míry závislosti (kovariance, korelace), test významnosti korelačního koeficientu 12. týden (06.12.-10.12.) Regrese, lineární regresní model (přímková, kvadratická, polynomická regrese), analýza reziduí, pásy spolehlivosti 13. týden (13.12.-17.12.) Více výběrů, jednoduché třídění, ANOVA. 14. týden (20.12.-22.12.) Rezerva, opakování, testy normality (náhrada za 28.10.)

Pravděpodobnost a matematická statistika Semestrální práce: 1. Popis experimentu a. Co chci zjistit? b. Jak to zjistím? c. Jak pořídím data? Formulace v jazyce experta daného oboru (technika) Formulace v jazyce statistika (popis náhodných veličin, stratistických metod 2. Analýza dat a) Základní charakteristiky b) Grafické zobrazení dat 3. Vyhodnocení experimentu 1. Popis metody a. Výpočet b. Závěry (interpretace výsledku) 5-Tukey, průměr, výběr. rozptyl, šikmost, špičatost histogram, kruhový graf, x-y graf, krabicový graf, empirická d.f. (t-test, chí-kvagrát test, regrese, ANOVA) Formulace v jazyce statistika 4. Celkové shrnutí. Formulace v jazyce experta

Pravděpodobnost a matematická statistika Semestrální práce: 1. Popis experimentu a. Co chci zjistit? b. Jak to zjistím? c. Jak pořídím data? 2. Analýza dat a) Základní charakteristiky b) Grafické zobrazení dat 3. Vyhodnocení experimentu 1. Popis metody a. Výpočet b. Závěry (interpretace výsledku) Formulace v jazyce experta daného oboru (technika) Formulace v jazyce statistika (popis náhodných veličin, stratistických metod 5-Tukey, průměr, výběr. rozptyl, šikmost, špičatost histogram, kruhový graf, x-y graf, krabicový graf, empirická d.f. (t-test, chí-kvagrát test, regrese, ANOVA) Formulace v jazyce statistika 4.Celkové shrnutí. Formulace v jazyce experta

V jedné malé rozvinuté zemi, na kraji Evropské unie, přišel mladý podnikatel do realitní kanceláře a řekl: Chtěl bych pozemek na venkově, s lesem, loukami, ne příliš daleko od města, v pěkné krajině, za kterou by se člověk nemusel stydět. Samozřejmě že cenově výhodný. Zprostředkovatel po chvíli přemýšlení odpověděl: Zbohatlíkov na Malém Nadutci! To je přesně to, co hledáte. Zájemce ohrnul nos: Nedávno jsem tím místem projížděl a vypadá dost chudě. Zprostředkovatel zavrtěl hlavou: To se musíte mýlit! Zde mám nejnovější údaje: Helmut Swoboda: Moderní statistika, Nakl. Svoboda, Praha 1977

Zprostředkovatel tvrdí: Průměrný roční příjem ve Zbohatlíkově činí 82.320 tolarů. Kupec zašel za známým ředitelem banky: roční příjem více než poloviny obyvatel je 29.000 tolarů a více. To je podivné! Co řekne okresní úřad?: Dosti chudé místo, průměrný příjem je kolem 29.000 tolarů. Vrátil se k řediteli banky pro nové informace: Nejsilněji zastoupená příjmová kategorie je od 12.000 do 24.000 tolarů Nejčetnější příjem je poměrně přesně 18.000 tolarů. Rozhněvaný kupec jede za učitelem Počtářem, kam ho poslali. Ten tvrdí, že situace je neutěšená: Dvě třetiny rodin mají méně než 30.000 tolarů. Příjem na hlavu není u většiny lidí ani 7.500 tolarů ročně. 80% obyvatel má ročně méně než 25.000 tolarů Kdo z nich lže?

Údaje o ročním příjmu 25 rodin ze Zbohatlíkova, n je počet členů domácnosti: roční příjem n roční příjem n roční příjem n 1,200.000 3 60.000 1 45.000 2 29.000 3 150.000 5 51.000 3 42.000 2 26.000 4 86.000 4 49.000 4 38.000 4 24.000 4 37.000 3 20.000 7 14.000 1 18.000 4 35.000 5 18.000 3 13.000 4 16.000 3 32.000 3 18.000 8 11.000 1 16.000 2 10.000 2 Zkusíme stem&leaf diagram: Nic moc!

... a co Box&Whiskers diagram? Evidentně odlehlé pozorování. To to zkresluje. Nicméně, medián je opravdu 29.000

stejně dopadne i histogram: To nám nic neukáže. Evidentně odlehlé pozorování. To to zkresluje.

Údaje o ročním příjmu 25 rodin ze Zbohatlíkova, n je počet členů domácnosti: roční příjem n roční příjem n roční příjem n 1,200.000 3 60.000 1 45.000 2 29.000 3 150.000 5 51.000 3 42.000 2 26.000 4 86.000 4 49.000 4 38.000 4 24.000 4 37.000 3 20.000 7 14.000 1 18.000 4 35.000 5 18.000 3 13.000 4 16.000 3 32.000 3 18.000 8 11.000 1 16.000 2 10.000 2 Odstraníme na chvíli extrémní (odlehlou) hodnotu : To už je trochu lepší!

Odstraníme na chvíli extrémní (odlehlou) hodnotu : Xmed = 29.000

Odstraníme na chvíli extrémní (odlehlou) hodnotu :

Údaje o ročním příjmu 25 rodin ze Zbohatlíkova, n je počet členů domácnosti: roční příjem n roční příjem n roční příjem n 1,200.000 3 60.000 1 45.000 2 29.000 3 150.000 5 51.000 3 42.000 2 26.000 4 86.000 4 49.000 4 38.000 4 24.000 4 37.000 3 20.000 7 14.000 1 18.000 4 35.000 5 18.000 3 13.000 4 16.000 3 32.000 3 18.000 8 11.000 1 16.000 2 10.000 2 Odstraníme na chvíli dvě extrémní (odlehlé) hodnoty : Nejčetnější hodnota je 18.000 tolarů

Odstraníme na chvíli dvě extrémní (odlehlé) hodnoty: Nejsilněji zastoupená třída je od 10.000 do 20.000 tolarů

Příjmy na hlavu (83): 400.000, 400.000, 400.000, 30.000, 30.000, 30.000, 30.000, 30.000, 21.500, 1.500, 21.500, 21.500, 12.333, 12.333, 12.333, 7.000, 7.000, 7.000, 7.000, 7.000, 10.666, 10.666, 10.666, 9.666, 9.666, 9.666, 6.500, 6.500, 6.500, 6.500, 6.000, 6.000, 6.000, 6.000, 60.000, 17.000, 12.250, 12.250, 12.250,12.250, 2.857, 2.857, 2.857, 2.857, 2.857, 2.857, 2.857, 6.000, 6.000, 6.000, 2.250, 2.250, 2.250, 2.250, 2.250, 2.250, 2.250, 2.250, 4.500, 4.500, 4.500, 4.500, 5.333, 5.333, 5.333, 8.000, 8.000, 22.500, 22.500,21.000, 21.000, 9.500, 9.500, 9.500, 9.500, 14.000, 3.250, 3.250, 3.250, 3.250, 11.000, 5.000, 5.000 Uspořádané příjmy na hlavu: 80% je 66,4 lidí 2.250 2.250 2.250 2.250 2.250 2.250 2.250 2.250 2.857 2.857 2.857 2.857 2.857 2.857 2.857 3.250 3.250 3.250 3.250 4.500 4.500 4.500 4.500 5.000 5.000 5.333 5.333 5.333 6.000 6.000 6.000 6.000 6.000 6.000 6.000 6.500 6.500 6.500 6.500 7.000 7.000 7.000 7.000 7.000 8.000 8.000 9.500 9.500 9.500 9.500 9.666 9.666 9.666 10.666 10.666 10.666 11.000 12.250 12.250 12.250 12.250 12.333 12.333 12.333 14.000 17.000 21.000 21.000 21.500 21.500 21.500 21.500 22.500 22.500 30.000 30.000 30.000 30.000 30.000 60.000 400.000 400.000 400.000 80% lidí má menší roční příjem než 20.000 tolarů

Empirická distribuční funkce: 21.000

Lhal tedy zprostředkovatel? Nelhal, neboť: Aritmetický průměr X = 1 n nx X i = 1 25 i=1 X25 i=1 X i = 82.320 V případě příjmů je však lépe použít: Geometrický průměr ˆX = n Y i=1 X i 1 n = 32.730 (Neboť mzdy mají zpravidla silně sešikmené rozdělení)