Náhodným vektorem rozumíme sloupcový vektor složený z náhodných veličin X = (X 1, X 2,

Podobné dokumenty
ANALÝZA VZTAHU DVOU SPOJITÝCH VELIČIN

NÁHODNÝ VEKTOR. 4. cvičení

REGRESNÍ ANALÝZA. 13. cvičení

4 NÁHODNÝ VEKTOR. Čas ke studiu kapitoly: 60 minut. Cíl: Po prostudování této kapitoly budete umět

Regresní a korelační analýza

Teoretické modely diskrétních náhodných veličin

Teoretické modely diskrétních náhodných veličin

Náhodný vektor. Náhodný vektor. Hustota náhodného vektoru. Hustota náhodného vektoru. Náhodný vektor je dvojice náhodných veličin (X, Y ) T = ( X

9. cvičení 4ST201. Obsah: Jednoduchá lineární regrese Vícenásobná lineární regrese Korelační analýza. Jednoduchá lineární regrese

8. STATISTICKÝ SOUBOR SE DVĚMA ARGUMENTY

2. Definice pravděpodobnosti

Statistická šetření a zpracování dat.

PRAVDĚPODOBNOST A STATISTIKA

3 VYBRANÉ MODELY NÁHODNÝCH VELIČIN. 3.1 Náhodná veličina

9. T r a n s f o r m a c e n á h o d n é v e l i č i n y

Podmíněná pravděpodobnost, spolehlivost soustav

Pojmy z kombinatoriky, pravděpodobnosti, znalosti z kapitoly náhodná veličina, znalost parciálních derivací, dvojného integrálu.

Téma 5: Parametrická rozdělení pravděpodobnosti spojité náhodné veličiny

Neparametrické metody

Vzorová písemka č. 1 (rok 2015/2016) - řešení

Čísla přiřazená elementárním jevům tvoří obor hodnot M proměnné, kterou nazýváme náhodná veličina (označujeme X, Y, Z,...)

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Jan Kracík

Přednáška č. 11 Analýza rozptylu při dvojném třídění

ina ina Diskrétn tní náhodná veličina může nabývat pouze spočetně mnoha hodnot (počet aut v náhodně vybraná domácnost, výsledek hodu kostkou)

Komplexní čísla. Pojem komplexní číslo zavedeme při řešení rovnice: x = 0

Matematika I A ukázkový test 1 pro 2018/2019

10. N á h o d n ý v e k t o r

1. Náhodný vektor (X, Y ) má diskrétní rozdělení s pravděpodobnostní funkcí p, kde. p(x, y) = a(x + y + 1), x, y {0, 1, 2}.

Náhodný vektor a jeho charakteristiky

Výsledný graf ukazuje následující obrázek.

Test dobré shody se používá nejčastěji pro ověřování těchto hypotéz:

Numerická matematika 1. t = D u. x 2 (1) tato rovnice určuje chování funkce u(t, x), která závisí na dvou proměnných. První

Čísla a aritmetika. Řádová čárka = místo, které odděluje celou část čísla od zlomkové.

PRAVDĚPODOBNOST A STATISTIKA

Zpracování náhodného vektoru. Ing. Michal Dorda, Ph.D.

Obr. P1.1 Zadání úlohy v MS Excel

Diskrétní náhodná veličina

Korelační energie. Celkovou elektronovou energii molekuly lze experimentálně určit ze vztahu. E vib. = E at. = 39,856, E d

1 Úvod. 2 Teorie. verze 1.0

6. Demonstrační simulační projekt generátory vstupních proudů simulačního modelu

1 Řešení soustav lineárních rovnic

Odhady - Sdružené rozdělení pravděpodobnosti

a počtem sloupců druhé matice. Spočítejme součin A.B. Označme matici A.B = M, pro její prvky platí:

4.4 Exploratorní analýza struktury objektů (EDA)

Přílohy. Příloha 1. Obr. P1.1 Zadání úlohy v MS Excel

Regresní analýza 1. Regresní analýza

Střední hodnota a rozptyl náhodné. kvantilu. Ing. Michael Rost, Ph.D.

2. DVOJROZMĚRNÝ (DVOJNÝ) INTEGRÁL

Příklady z přednášek Statistické srovnávání

P ílohy. P íloha 1. ešení úlohy lineárního programování v MS Excel

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test

KGG/STG Statistika pro geografy

STATISTIKA PRO NELÉKAŘSKÉ ZDRAVOTNICKÉ OBORY

2 TESTOVÁNÍ HYPOTÉZ. RYCHLÝ NÁHLED KAPITOLY Neříkej: Objevil jsem pravdu! ale raději: Objevil jsem jednu z pravd! Chalil Gibran

+ 2y. a y = 1 x 2. du x = nxn 1 f(u) 2x n 3 yf (u)

9.3.5 Korelace. Předpoklady: 9304

Numerická matematika A

podle typu regresní funkce na lineární nebo nelineární model Jednoduchá lineární regrese se dá vyjádřit vztahem y

vyjádřete ve tvaru lineární kombinace čtverců (lineární kombinace druhých mocnin). Rozhodněte o definitnosti kvadratické formy κ(x).

, 4. skupina (16:15-17:45) Jméno: se. Postup je třeba odůvodnit (okomentovat) nebo uvést výpočet. Výsledek bez uvedení jakéhokoliv

1. Úvod do základních pojmů teorie pravděpodobnosti

Raoultův zákon, podle kterého je při zvolené teplotě T parciální tlak i-té složky nad roztokem

( ) ( ) Binomické rozdělení. Předpoklady: 9209

2. Najděte funkce, které vedou s těmto soustavám normálních rovnic

Náhodný vektor. Náhodný vektor. Hustota náhodného vektoru. Hustota náhodného vektoru. Náhodný vektor je dvojice náhodných veličin (X, Y ) T = ( X

SOUSTAVY LINEÁRNÍCH ALGEBRAICKÝCH ROVNIC

POROVNÁNÍ MEZI SKUPINAMI

CHYBY MĚŘENÍ. uvádíme ve tvaru x = x ± δ.

Statika soustavy těles v rovině

Analýza závislosti veličin sledovaných v rámci TBD

[ ] Goniometrický tvar komplexních čísel I. Předpoklady: 4207, 4209, 6201

Parametrické programování

PRAVDĚPODOBNOST A STATISTIKA. Bayesovské odhady

Obsah přednášky 1. Bayesův teorém 6. Naivní Bayesovský klasifikátor (NBK)

( ) ( ) Binomické rozdělení. Předpoklady: 9209

1. DIFERENCIÁLNÍ POČET FUNKCE DVOU PROMĚNNÝCH

Téma 9: Vícenásobná regrese

Osově namáhaný prut základní veličiny

Dále budeme předpokládat, že daný Markovův řetězec je homogenní. p i1 i 2

KGG/STG Statistika pro geografy

1 Soustavy lineárních rovnic

POTENCIÁL ELEKTRICKÉHO POLE ELEKTRICKÉ NAPĚTÍ

Mechatronické systémy s elektronicky komutovanými motory

2. Bodové a intervalové rozložení četností

9. T r a n s f o r m a c e n á h o d n é v e l i č i n y

Porovnání GUM a metody Monte Carlo

Západočeská univerzita v Plzni Fakulta aplikovaných věd Katedra matematiky. Bakalářská práce. Zpracování výsledků vstupních testů z matematiky

Energie elektrického pole

n = 2 Sdružená distribuční funkce (joint d.f.) n. vektoru F (x, y) = P (X x, Y y)

( + ) ( ) f x x f x. x bude zmenšovat nekonečně přesný. = derivace funkce f v bodě x. nazýváme ji derivací funkce f v bodě x. - náš základní zápis

Tepelná kapacita = T. Ē = 1 2 hν + hν. 1 = 1 e x. ln dx. Einsteinův výpočet (1907): Soustava N nezávislých oscilátorů se stejnou vlastní frekvencí má

4. Třídění statistických dat pořádek v datech

ANALÝZA A KLASIFIKACE DAT

6 LINEÁRNÍ REGRESNÍ MODELY

Náhodná veličina Číselné charakteristiky diskrétních náhodných veličin Spojitá náhodná veličina. Pravděpodobnost

CVIČNÝ TEST 15. OBSAH I. Cvičný test 2. Mgr. Tomáš Kotler. II. Autorské řešení 6 III. Klíč 15 IV. Záznamový list 17

Vyrovnání měření přímých stejné přesnosti

Stavový model a Kalmanův filtr

a způsoby jejího popisu Ing. Michael Rost, Ph.D.

PRAVDĚPODOBNOST A STATISTIKA

Transkript:

Statstka I cvčení - 54-5 NÁHODNÝ VEKTOR Náhodným vektorem rozumíme sloupcový vektor složený z náhodných velčn = n který je charakterzován sdruženou smultánní dstrbuční unkcí ; F náhodný vektor s dskrétním rozdělením: j j j F náhodném vektoru se spojtým rozdělením: d d F F e sdruženého rozdělení náhodného vektoru můžeme snadno najít margnální rozdělení pravděpodobnost jednotlvých náhodných velčn z nchž je vektor sestaven Margnální dstrbuční unkce dvousložkového náhodného vektoru denujeme takto: lm lm F F F F náhodný vektor s dskrétním rozdělením - margnální pravděpodobnost: jj j náhodném vektoru se spojtým rozdělením - margnální hustot pravděpodobnost: d d odmíněné rozdělení pak chápeme jako podíl sdruženého a margnálního rozdělení pravděpodobnost má-l tento podíl smsl v souladu s dencí podmíněné pravděpodobnost náhodný vektor s dskrétním rozdělením - podmíněná pravděpodobnostní unkce: pro náhodný vektor se spojtým rozdělením - podmíněná hustota pravděpodobnost:

Statstka I cvčení pro Nezávslost náhodných velčn se projevuje tím že jejch sdružená dstrbuční unkce sdružená pravděpodobnostní unkce resp sdružená hustota pravděpodobnost se dá matematck vjádřt jako součn margnálních dstrbučních unkcí margnálních pravděpodobnost resp margnálních hustot pravděpodobnost jednotlvých náhodných velčn latí že složk náhodného vektoru jsou nezávslé právě kdž platí: náhodný vektor s dskrétním rozdělením: j j náhodný vektor se spojtým rozdělením: Mez nejvýznamnější smíšené moment náhodného vektoru patří kovarance Cov E E E V pra se čato setkáváme s reprezentací centrálních momentů řádu ve ormě tzv kovaranční matce: D Cov Cov D Mírou lneární závslost je korelační koecent Cov D D D D 5 ředstavme s že budeme třkrát opakovat pokus u nějž známe pravděpodobnost úspěchu např hod mncí p = 5 volme tto náhodné velčn: Náhodný vektor = počet pokusů do prvního úspěchu počet po sobě jdoucích úspěchů a Určete margnální pravděpodobnostní unkce z b Sestavte sdruženou pravděpodobnostní unkc = =z c Určete zda jsou náhodné velčn nezávslé d Určete střední hodnot a rozptl složek e Určete kovaranční matc Určete jednoduchý korelační koecent g Určete podmíněné pravděpodobnostní unkce a = =z =z = - 55 -

Statstka I cvčení Řešení: Vpšme s všechn možné kombnace k nmž b mohlo dojít S - úspěch F - neúspěch: { FFF; SFS; SSF; FSS; FSF; FFS; SFF; SSS } A uvažujme že pravděpodobnost úspěchu S = p pravděpodobnost neúspěchu F = -p Jedná se o dskrétní dvourozměrný náhodný vektor přčemž: složka může nabývat hodnot: 3 složka může nabývat hodnot: 3 ojmenujme s všechn elementární jev základního prostoru a určeme pravděpodobnost jejch výsktu pro výpočet jednotlvých pravděpodobností vužjeme poznatku že jev F a S jsou nezávslé A FFF A - p 3 = 5 A SFS A p - p = 5 A3 SSF A3 p - p = 5 A4 FSS A4 p - p = 5 A5 FSF A5 p - p = 5 A6 FFS A6 p - p = 5 A SFF A p - p = 5 A8 SSS A8 p 3 = 5 ada apšme s nní do pomocných tabulek které jev vhovují daným hodnotám náhodných velčn a počet pokusů do prvního úspěchu 3 A A3 A A8 A4 A5 A6 A počet po sobě jdoucích úspěchů 3 A A A5 A6 A A3 A4 A8 protože jev A A8 jsou neslučtelné můžeme margnální pravděpodobnostní unkce jednoduše určt Např = A + A3 + A + A8 = 5 + 5 + 5 + 5 = =5 počet pokusů do prvního úspěchu 3 5 5 5 5 počet po sobě jdoucích úspěchů 3 5 5 5 5-56 -

Statstka I cvčení V našem případě máme určovat zároveň sdruženou pravděpodobnostní unkc b blo rchlejší pro určen margnálních pravděpodobnostních unkcí vužít korelační tabulku kterou budeme vtvářet pro záps sdružené pravděpodobnost adb konstruujeme korelační tabulku nejdříve s do ní vpíšeme jev které vhovují příslušným podmínkám a poté na základě jejch neslučtelnost určíme pravděpodobnost výsktu příslušných skupn jevů 3 - A A A3 A8 - A5 A4 - - A6 - - 3 A8 - - - Tabulka sdružené pravděpodobnostní unkce 3 5 5 5 5 5 5 3 5 Např = = = 5; = = = 5 Chceme-l získat korelační tabulku v klasckém tvaru tj včetně margnálních pravděpodobnost stačí sečíst příslušné řádk sloupce 3 5 5 5 5 5 5 5 5 5 3 5 5 z 5 5 5 5 ro srovnání s porovnejte takto získané margnální pravděpodobnost s margnálním pravděpodobnostm získaným v ada adc ro náhodný vektor s dskrétním rozdělením platí že složk náhodného vektoru jsou nezávslé právě kdž platí: z j z j Tento předpoklad v našem případě splněn není např Ý ; 5 55 toho plne že náhodné velčn nejsou nezávslé - 5 -

Statstka I cvčení add Střední hodnot a rozptl získáme z denčních vztahů pomocí margnálních pravděpodobnostních unkcí: 4 E 5 5 5 35 E 4 8 85 5 5 5 3 5 85 D E E 85 85 9 64 4 E z z 5 5 5 35 35 8 E 4 z D E z 5 5 5 3 5 65 E 65 35 ade Kovaranční matce má obecný tvar: 4 34 64 D Cov Cov D ro její záps musíme určt kovaranc Cov E E E z j z j j 8 8 5 5 3 5 8 8 8 8 8 8 5 5 5 8 8 8 8 8 8 96 3 5 58 8 8 5 Kovaranční matce má tvar: 9 58 58 34 ad Jednoduchý korelační koecent určíme z denčního vztahu: Cov D D 58 934 64-58 -

Statstka I cvčení Na základě této hodnot korelačního koecentu můžeme říc že mez náhodným velčnam a estuje středně slná negatvní korelace tj že pravděpodobně s růstem bude klesat lneárně adg odmíněné pravděpodobnost budeme opět zapsovat do tabulk a jejch hodnot určíme z dence: z z z Tabulka podmíněné pravděpodobnostní unkce = = z 3 /5 5/5 5/5 5/5 /5 5/5 5/5 /5 /5 5/5 /5 /5 3 5/5 /5 /5 /5 3 5 5 5 5 5 3 Např = = = 5 z Tabulka podmíněné pravděpodobnostní unkce = z = 3 /5 5/5 5/5 5/5 /5 5/5 5/5 /5 /5 5/5 /5 /5 3 5/5 /5 /5 /5 3 5 5 5 5 5 3 Např = = = 5-59 -

Statstka I cvčení 5 Student z jedné studjní skupn bl na zkoušce z matematk a zk s těmto výsledk první hodnota v uspořádané dvojc označuje výsledek studenta z matematk druhá z zk: 3 3 3 3 3 33 33 33 33 33 34 34 43 43 44 44 44 a Vtvořte pravděpodobnostní tabulku náhodného vektoru jehož složka bude znamenat výsledk u zkoušk z matematk a složka bude znamenat výsledk u zkoušk z zk b Určete jeho margnální pravděpodobnostní unkce c Určete jeho dstrbuční unkc F d jstěte jeho podmíněné pravděpodobnost =/= Řešení: ada Tabulka sdružených četností: 3 4 3 5 4 3 Celkem: Tabulka sdružených pravděpodobností: 3 4 5 5 5 5 3 5 4 5 Hodnot v prvním řádku a prvním sloupc jsou hodnot kterých mohou nabývat náhodné velčn Ostatní čísla v tabulce jsou pravděpodobnost výsktu všech možných dvojc např ; 5 adb 3 4 5 5 5 5 5 5 3 5 45 4 5 5 5 5 5-6 -

Statstka I cvčení Hodnot margnální pravděpodobnostní unkce jsou vžd součt všech pravděpodobností v daném řádku např: 3 = + + 5 + = 45 Obdobně nalezneme ve sloupcích hodnot výrazněné číslo musí být vžd rovno jedné je to součet všech hodnot nebo ted vlastně součet všech sdružených pravděpodobností náhodného vektoru adc F: 3 4 5 5 5 5 3 5 5 3 3 4 5 5 65 5 5 5 5 5 postup př výpočtu: např: F33 = <3<3 = + + + = 5 Všmněte s že hodnot v posledním sloupc odpovídají hodnotám margnální dstrbuční unkce F a hodnot v posledním řádku hodnotám F add 3 4 5 5 3 5 5 4 4 6 např: 3 3 5 3 3 5 3 5-6 -

Statstka I cvčení 53 Sdružená hustota pravděpodobnost dvousložkového náhodného vektoru je denována jako: pro ; ; jnde Určete: a Margnální hustot pravděpodobnost b Margnální dstrbuční unkce F F c Střední hodnot a rozptl složek d Hodnotu jednoduchého korelačního koecentu výsledek dejte do souvslost s mírou lneární závslost Řešení: ada Jde o spojtý náhodný vektor proto: d pro ; jnde e smetre sdružené pravděpodobnostní unkce vplývá obdobný tvar pro ; jnde adb Margnální dstrbuční unkce jednotlvých složek určíme z margnálních hustot pravděpodobnost: F dt dt dt t t t dt t dt dt ze smetre můžeme opět odvodt: pro ; pro ; pro ; F pro ; pro ; pro ; adc Střední hodnot a rozptl jednotlvých složek určíme pomocí margnálních hustot pravděpodobnost na základě znalost denčních vztahů pro oba moment: - 6 -

Statstka I cvčení - 63-4 3 3 d d E 5 6 4 3 4 d d E 44 44 49 6 5 E E D Opět vužjeme smetre sdružené hustot pravděpodobnost a můžeme tvrdt že: 44 D ; E add ro výpočet jednoduchého korelačního koecentu potřebujeme znát hodnotu kovarance a proto začneme jejím výpočtem: dd E E E Cov 3 4 3 d dd 44 3 4 4 3 d Dále jž stačí jen dosadt do denčního vztahu pro jednoduchý korelační koecent: 9 44 44 44 D D Cov velkost korelačního koecentu můžeme usuzovat na to že mez a pravděpodobně neestuje lneární závslost tj a jsou nekorelované náhodné velčn

Statstka I cvčení - 64-54 Vpočtěte střední hodnotu náhodné velčn náhodného vektoru který je určen hustotou pravděpodobnost: 5sn pro jnde Řešení: d E kde d : ; sn d d d d d E ro vřešení tohoto ntegrálu použjeme metodu per partes: ' ' sn - sn sn - sn sn sn sn - sn sn -sn u d v v u d E 4

Statstka I cvčení odobným způsobem b se dal vpočítat zblé číselné charakterstk: rozptl kovarance a koecent korelace Na závěr cvčení s ukážeme jak můžeme vužít Statgraphcs př zpracování dskrétního dvourozměrného vektoru 55 Student z jedné studjní skupn bl na zkoušce z matematk a zk s těmto výsledk první hodnota v uspořádané dvojc označuje výsledek studenta z matematk druhá z zk: 3 3 3 3 3 33 33 33 33 33 34 34 43 43 44 44 44 volme tto náhodné velčn: Náhodný vektor = omocí Statgraphcsu: známka z matematk známka z zk a Sestavte sdruženou pravděpodobnostní unkc = =z b Určete margnální pravděpodobnost c Určete zda jsou náhodné velčn nezávslé d Určete kovaranční matc e Určete jednoduchý korelační koecent Řešení: pracování dvourozměrného dskrétního náhodného vektoru ve Statgraphcsu zahájíme tím že do tohoto sotwaru zadáme data adání dvourozměrné proměnné provedeme buď v tzv standardním datovém ormátu nebo ve ormě tabulk sdružených četností kontngenční tabulk od pojmem standardní datový ormát s představme klascké zadání dat denujeme dvě proměnné známka z matematk známka z zk a zadáme všechn kombnace obou proměnných - 65 -

Statstka I cvčení Kontngenční tabulka tj v podstatě tabulka sdružených četnost námka z matematk F F F3 F4 jsou numercké proměnné F označuje jednčku z zk F dvojku z zk apod adaadb Sdruženou pravděpodobnostní unkc získáme jako tetový výstup př zpracování kategorální proměnné: Máme-l data zadána ve standardním datovém ormátu pak použjeme: Menu Descrbe \ Categorcal Data \ Crosstabulaton proměnné Výnos V okně Crosstabulaton označíme jednu proměnnou námka z matematk jako Row Varables a druhou námka z zk jako Column Varables okud mez proměnným estuje příčnná souvslost pak za řádkovou proměnnou Row Varable volíme proměnnou která je příčnou změn proměnné kterou označíme za sloupcovou Column varable např Množství hnojva je příčnou změn Máme-l data zadána ve ormě kontngenční tabulk pak použjeme: Menu Descrbe \ Categorcal Data \ Contngenc Tables - 66 -

Statstka I cvčení V okně Contngenc Tables označíme F F F3 F4 jako Columns sloupce a námku z matematk jako Labels Dále pokračujeme v obou případech stejně: Označíme OK a pomocí kon Tabular Optons žlutá kona s jako požadovaný tetový výstu zvolíme tabulku četností Frequenc Tables Označíme OK a jako výstup se nám objeví tabulka v níž jsou uveden jak sdružené četnost tak sdružené pravděpodobnost v procentech a na okrajích tabulk najdeme margnální pravděpodobnost % - 6 -

Statstka I cvčení adc Grackou obdobou kontngenční tabulk je mozakový gra Tento gra se skládá z obdélníků jejchž stran jsou úměrné příslušným margnálním relatvním četnostem Statgraphcs konstruuje mozakový gra tak že na svslou osu vnáší nezávsle proměnnou příčna a na vodorovnou osu závsle proměnnou důsledek okud b bl mozakový gra v tomto případě tvořen svslým pruh jednotlvé obdélník stejných barev b měl stejné vodorovné rozměr znamenalo b to že sledované proměnné jsou nezávslé Obdobné vhodnocení provedeme v případě kd statstcký sotware vnáší nezávsle proměnnou na vodorovnou osu např JM-IN ak je v případě nezávslost proměnných mozakový gra tvořen vodorovným pás V našem případě nedokážeme určt která náhodná velčna ovlvňuje kterou a proto nezáleží na tom kterou budeme vnášet na osu a kterou na osu grau je zřejmé že se jedná o závslé náhodné velčn Toto je pouze závěr eplorační popsné statstk add Chceme-l získat kovaranční matc musíme mít dat zadána ve standardním datovém ormátu oužjeme menu: Menu Descrbe \ Numerc Data \ Multple Varable Analss V okně Multple Varable analss zadáme dané proměnné jako Data a zvolíme OK - 68 -

Statstka I cvčení Kovaranční matc získáme zaškrtnutím pole Covarances v okně Tabular Optons které se nám objeví po klknutí na konu Tabular Optons žlutá kona ade Jednoduchý korelační koecent získáme obdobně jako kovaranční matc ouze v okně Tabular opton žlutá kona zaškrtneme pole Correlatons - 69 -

Statstka I cvčení V tetovém výstupu najdeme hodnotu korelačního koecentu 65 počet hodnot proměnných a hodnotu p-value budeme se jí zabývat př testování hpotéz která nám říká zda se korelační koecent odlšuje od nulové hodnot natolk abchom data mohl považovat za lneárně závslá Je-l p-value menší než pak data považujeme za lneárně závslá ř této analýze získáme rovněž gracký výstup ve ormě bodových graů ukazujících ormu závslost mez proměnným grau je lneární závslost proměnných zcela zřejmá Tomu odpovídá hodnota korelačního koecentu 65 která ukazuje na slnou poztvní korelac což je potvrzeno hodnotou p-value 34 <<< - -