MATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci

Podobné dokumenty
Mnohorozměrná statistická data

Základy popisné statistiky

Statistika. Diskrétní data. Spojitá data. Charakteristiky polohy. Charakteristiky variability

Charakterizace rozdělení

Popisná statistika. Jaroslav MAREK. Univerzita Palackého

Charakteristika datového souboru

Mnohorozměrná statistická data

Pravděpodobnost a statistika (BI-PST) Cvičení č. 9

Statistika pro geografy

Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D.

Statistika II. Jiří Neubauer

Výběrové charakteristiky a jejich rozdělení

Praktická statistika. Petr Ponížil Eva Kutálková

Číselné charakteristiky a jejich výpočet

TECHNICKÁ UNIVERZITA V LIBERCI. Ekonomická fakulta. Semestrální práce. Statistický rozbor dat z dotazníkového šetření školní zadání

Zápočtová práce STATISTIKA I

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Jan Kracík

veličin, deskriptivní statistika Ing. Michael Rost, Ph.D.

Matematika III. 27. listopadu Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

MATEMATIKA III V PŘÍKLADECH

Pravděpodobnost a aplikovaná statistika

MATEMATICKÁ STATISTIKA - XP01MST

Pravděpodobnost a statistika

23. Matematická statistika

Matematika III 10. týden Číselné charakteristiky střední hodnota, rozptyl, kovariance, korelace


STATISTICKÉ CHARAKTERISTIKY

Pojmy z kombinatoriky, pravděpodobnosti, znalosti z kapitoly náhodná veličina, znalost parciálních derivací, dvojného integrálu.

AVDAT Náhodný vektor, mnohorozměrné rozdělení

Úloha č. 2 - Kvantil a typická hodnota. (bodově tříděná data): (intervalově tříděná data): Zadání úlohy: Zadání úlohy:

Základní statistické charakteristiky

Náhodná proměnná. Náhodná proměnná může mít rozdělení diskrétní (x 1. , x 2. ; x 2. spojité (<x 1

Téma 22. Ondřej Nývlt

Informační technologie a statistika 1

Výrobní produkce divizí Ice Cream Po lo ha plane t Rozložený výse ový 3D graf Bublinový graf Histogram t s tn e ídy

, Brno Hanuš Vavrčík Základy statistiky ve vědě

I. D i s k r é t n í r o z d ě l e n í

Pravděpodobnost a matematická statistika

p(x) = P (X = x), x R,

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

Úvod do teorie odhadu. Ing. Michael Rost, Ph.D.

3. Základní statistické charakteristiky. KGG/STG Zimní semestr Základní statistické charakteristiky 1

Pravděpodobnost a statistika (BI-PST) Cvičení č. 7

Kombinatorika, pravděpodobnost a statistika, Posloupnosti a řady

Popisná statistika kvantitativní veličiny

TECHNICKÁ UNIVERZITA V LIBERCI

PRAVDĚPODOBNOST A STATISTIKA

Statistické metody. Martin Schindler KAP, tel , budova G. naposledy upraveno: 9.

Číselné charakteristiky

Jevy a náhodná veličina

letní semestr Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika vektory

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

1. Přednáška. Ing. Miroslav Šulai, MBA

Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012. Tutoriál č. 4: Exploratorní analýza. Jan Kracík

letní semestr Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika

STANOVENÍ SPOLEHLIVOSTI GEOTECHNICKÝCH KONSTRUKCÍ. J. Pruška, T. Parák

Popisná statistika. Statistika pro sociology

TECHNICKÁ UNIVERZITA V LIBERCI SEMESTRÁLNÍ PRÁCE

Komplexní čísla, Kombinatorika, pravděpodobnost a statistika, Posloupnosti a řady

Úvod do kurzu. Moodle kurz. (a) (b) heslo pro hosty: statistika (c) skripta na pravděpodobnost

2. Základní typy dat Spojitá a kategoriální data Základní popisné statistiky Frekvenční tabulky Grafický popis dat

PRAVDĚPODOBNOST A STATISTIKA. Bayesovské odhady

Odhady Parametrů Lineární Regrese

Statistická analýza jednorozměrných dat

Náhodné vektory a matice

z Matematické statistiky 1 1 Konvergence posloupnosti náhodných veličin

Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

X = x, y = h(x) Y = y. hodnotám x a jedné hodnotě y. Dostaneme tabulku hodnot pravděpodobnostní

Deskriptivní statistické metody II. Míry polohy Míry variability

Náhodný vektor. Náhodný vektor. Hustota náhodného vektoru. Hustota náhodného vektoru. Náhodný vektor je dvojice náhodných veličin (X, Y ) T = ( X

NÁHODNÁ VELIČINA. 3. cvičení

Základní statistické pojmy

Minikurz aplikované statistiky. Minikurz aplikované statistiky p.1

a způsoby jejího popisu Ing. Michael Rost, Ph.D.

Základy teorie odhadu parametrů bodový odhad

PRAVDĚPODOBNOST A STATISTIKA

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Renáta Bednárová STATISTIKA PRO EKONOMY

STATISTIKA 1. Adam Čabla Katedra statistiky a pravděpodobnosti VŠE

n = 2 Sdružená distribuční funkce (joint d.f.) n. vektoru F (x, y) = P (X x, Y y)

Co je to statistika? Úvod statistické myšlení. Základy statistického hodnocení výsledků zkoušek. Petr Misák

Náhodný vektor a jeho charakteristiky

Pravděpodobnost a statistika I KMA/K413

Matematika III. 29. října Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

Chyby měření 210DPSM

PRAVDĚPODOBNOST A STATISTIKA aneb Krátký průvodce skripty [1] a [2]

Všechno, co jste chtěli vědět z teorie pravděpodobnosti, z teorie informace a

Normální (Gaussovo) rozdělení

Náhodná veličina a její charakteristiky. Před provedením pokusu jeho výsledek a tedy ani sledovanou hodnotu neznáte. Proto je proměnná, která

Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D.

Náhodné veličiny jsou nekorelované, neexistuje mezi nimi korelační vztah. Když jsou X; Y nekorelované, nemusí být nezávislé.

mezi studenty. Dále bychom rádi posoudili, zda dobrý výsledek v prvním testu bývá doprovázen dobrým výsledkem i v druhém testu.

Zákon velkých čísel stanovení empirické pravděpodobnosti

Diskrétní náhodná veličina

MÍRY ZÁVISLOSTI (KORELACE A REGRESE)

Náhodné (statistické) chyby přímých měření

PRAVDĚPODOBNOST A STATISTIKA

Poznámky k předmětu Aplikovaná statistika, 4. téma

Transkript:

MATEMATICKÁ STATISTIKA Dana Černá http://www.fp.tul.cz/kmd/ Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci

Matematická statistika Matematická statistika se zabývá matematickým zpracováním dat a rozborem získaných výsledků. Data chápeme jako realizace náhodných veličin. Statistický soubor je množina všech sledovaných objektů, jednotlivé objekty nazýváme statistické jednotky. Počet všech prvků souboru se nazývá rozsah souboru. Rozlišujeme statistický soubor základní - množina všech objektů se sledovanou vlastností výběrový - je podmnožinou základního souboru, obsahuje objekty, ke kterým známe hodnoty sledovaných vlastností Sledovanou vlastnost nazýváme statistický znak. Rozlišujeme statistický znak kvantitativní - je vyjádřen číslem kvalitativní - není vyjádřen číslem

(Absolutní) četnost znaku je definována jako počet statistických jednotek se stejnou hodnotou znaku. Označme absolutní četnost hodnoty ξ i symbolem n i, platí m n i = n, kde n je rozsah souboru a m je počet všech hodnot. Relativní četnost hodnoty ξ i je definována vztahem v i = n i n. Platí m v i = 1. Pokud statistický znak nabývá příliš mnoha hodnot, rozděĺıme hodnoty do intervalů a potom používáme intervalové rozdělení četnosti. Intervaly mají zpravidla stejnou délku. Jejich počet určíme pomocí Sturgesova vzorce k = 1 + 3, 3log 10 n, kde k značí počet intervalů a n označuje rozsah souboru. Daný interval potom zpravidla reprezentuje jeho střed.

Charakteristiky statistického souboru Budeme rozlišovat charakteristiky polohy, charakteristiky variability, charakteristiky statistické závislosti. Značení: Data budeme označovat x 1, x 2,..., x n. Hodnoty znaku x budeme značit ξ 1, ξ 2,..., ξ m a jejich četnosti označíme n 1, n 2,..., n m. Vzestupně uspořádaná data označíme x (1), x (2),..., x (n).

Charakteristiky polohy 1. Aritmetický průměr x = 1 n x i nebo x = 1 n n i ξ i. 2. Harmonický průměr x H = n n 1 x i nebo x H = n n n i ξ i. Například průměrná rychlost je harmonickým průměrem rychlostí na jednotlivých úsecích. 3. Geometrický průměr x G = n x 1 x 2... x n = n ξ n 1 1 ξn 2 2... ξnm m. Používá se k výpočtu průměrné inflace, průměrného úroku, průměrného růstu výroby, HDP apod.

4. Medián je prostřední hodnota mezi uspořádanými daty. Med = x ( n+1 2 ), pokud n je liché. x ( n Med = 2) + x ( n 2 +1), pokud n je sudé. 2 5. Modus je hodnota s největší četností. 6. Dolní kvartil x ([ n x 0,25 = 4]) + x ([ n 4]+1), kde [ ] označuje celou část. 2 7. Horní kvartil x ([ 3n 4 ]) + x ([ 3n 4 ]+1) x 0,75 = 2

Charakteristiky variability 1. Rozsah souboru R = x (n) x (1). 2. Mezikvartilové rozpětí Q = x 0,75 x 0,25. 3. Výběrový rozptyl s 2 1 = = 1 n 1 1 n 1 (x i x) 2 = 1 n 1 n i (ξ i x) 2 = 1 n 1 xi 2 n n 1 x 2 n i ξi 2 n n 1 x 2

s 2 2 = 1 n = 1 n (x i x) 2 = 1 n xi 2 x 2 n i (ξ i x) 2 = 1 n 4. Výběrová směrodatná odchylka 5. Variační koeficient s 1 = s 2 1, nebo s 2 = n i ξi 2 x 2 v = s 1 x, nebo v = s 2 x s 2 2

Charakteristky statistické závislosti U každého objektu budeme sledovat znak x a znak y. Potom jsou data dána ve dvojicích, dvojice (x i, y i ) určuje zjištěné hodnoty pro i-tý objekt, nebo jsou data zadána pomocí hodnot (ξ i, η i ) a jejich četností n i. Výběrová kovariance cov (x, y) = 1 n = 1 n (x i x) (y i ȳ) = 1 n x i y i xȳ n i (ξ i x) (η i ȳ) = 1 n n i ξ i η i xȳ

Výběrový korelační koeficient ρ (x, y) = cov (x, y) s x s y, kde s x = s y = 1 n 1 n (x i x) 2 = 1 n (y i ȳ) 2 = 1 n n i (ξ i x) 2, n i (η i ȳ) 2

O znacích x a y řekneme, že jsou nezávislé, jestliže náhodné veličiny reprezentující tyto znaky jsou nezávislé. Jestliže jsou znaky nezávislé, potom ρ (x, y) 0. Jestliže ρ (x, y) není přibližně nulový, potom znaky x a y nejsou nezávislé. Jestliže ρ (x, y) 1, potom y závisí lineárně na x, tj. existují konstanty a a b takové, že y = ax + b.

Bodový odhad Jestliže X 1, X 2,... X n jsou nezávislé stejně rozdělené náhodné veličiny, řekneme, že X 1, X 2,... X n je náhodný výběr. Realizace těchto náhodných veličin x 1, x 2,... x n nazýváme realizovaný náhodný výběr. Předpokládejme, že X 1, X 2,... X n je náhodný výběr z rozdělení, které závisí na parametru θ M. Libovolné ˆθ M se nazývá bodový odhad parametru θ. ˆθ M se nestranný odhad parametru θ, jestliže E ˆθ = θ.

VĚTA: Jestliže X 1, X 2,... X n je náhodný výběr a EX i = µ R, potom X = 1 n n X i je nestranný odhad parametru µ. Důkaz: E X = E 1 n n X i = 1 n n EX i = 1 n n µ = µ. VĚTA: Jestliže X 1, X 2,... X n je náhodný výběr a var X i = σ 2 R, potom s 2 = 1 n ( n 1 Xi X ) 2 je nestranný odhad parametru σ 2.

Maximálně věrohodný odhad Předpokládejme, že X = (X 1, X 2,... X n ) je náhodný výběr z rozdělení, které závisí na parametru θ M, x = (x 1, x 2,... x n ) je realizace tohoto náhodného výběru. Definujme věrohodnostní funkci předpisem L θ (x) = P θ (X 1 = x 1, X 2 = x 2,..., X n = x n ), pokud X i mají diskrétní rozdělení pravděpodobnosti P θ, a předpisem L θ (x) = Π n f θ (x i ), kde f θ je hustota X i, pokud X i mají spojité rozdělení pravděpodobnosti s parametrem θ. Maximálně věrohodný odhad parametru θ je definován: ˆθ = argmax θ M L θ (x) = argmax θ M ln L θ (x).