12. cvičení z PST. 20. prosince 2017
|
|
- Dana Bednářová
- před 6 lety
- Počet zobrazení:
Transkript
1 1 cvičení z PST 0 prosince test rozptylu normálního rozdělení Do laboratoře bylo odesláno n = 5 stejných vzorků krve ke stanovení obsahu alkoholu X v promilích alkoholu Výsledkem byla realizace x = Posud te na hladině významnosti α = 005 zda směrodatná odchylka měření je nejvýše σ 0 = 01 promile alkoholu Předpokládejte že obsah alkoholu X má normální rozdělení a jednotlivá měření jsou nezávislá Naše veličina X udávající obsah alkoholu v krvi v promilích má normální rozdělení Nµ σ Místo testu směrodatné odchylky σ budeme ekvivalentně testovat rozptyl σ a sice nulovou hypotézu tvaru H 0 : σ 01 = σ 0 proti alternativní hypotéze: H 1 : σ > 01 na hladině významnosti α = 005 Tentokrát budeme používat statistiku T = n 1 S X σ 0 která má pro případ σ = σ 0 tzv χ -rozdělení s n 1 stupni volnosti Obecněji teprve veličina σ 0 σ T bude mít χ -rozdělení Za předpokladu nulové hypotézy tj pro 0 σ σ 0 budou očekávané hodnoty statistiky T především v intervalu 1 ve skutečnosti to bude jen interval 0 1 protože T je nezáporná veličina Kritický obor tak bude W : q χ n 11 α a kritérium pro ZAMÍTNUTÍ proto bude tvaru t > q χ n 1 1 α zamítáme H 0 na dané hladině α Dosadíme opět konkrétní hodnoty: s x = 1 n 1 x = Realizace testovací statistiky je = 47 5 = 094 x i x = = = 0088 t = n 1 s x σ 0 = = 35
2 a hodnota kvantilu je q χ n 1 1 α = q χ 4095 = 949 t = = q χ 4095 nulovou hypotézu ZAMÍTÁME Zdůvodnění tvaru kritického oboru: Opět si vyznačme závislost X a T na parametru σ jako Kritický obor má být tvaru T σ = n 1S X σ σ 0 W : u 1 kde požadujeme aby u 1 R bylo nejmenší takové aby chyba 1 druhu byla nejvýše α tj 0 σ σ 0 P T σ W = P u 1 < T σ α Opět případ σ = σ 0 je za předpokladu H 0 ten nejhorší možný jak je vidět z následujícího: σ σ 0 T σ = σ σ 0 }{{} 1 P u 1 < T σ P u 1 < n 1S X σ n 1S X σ σ n 1S X σ σ }{{ } χ rozdělení = 1 F χ n 1 u 1 = P u 1 < T σ0 σ Vidíme tedy že P u 1 < T σ P u 1 < T σ0 a hledané u 1 tak musí splňovat P u 1 < T σ0 = α tedy a kritický obor je tak skutečně tvaru W : u 1 = q χ n 11 α q χ n 1 1 α 1 test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem Z realizací náhodných veličin X a Y s normálním rozdělením jsme z výběrů daného rozsahu obdrželi tyto realizace odhadů: X Y m = 11 n = 1 x = 10 y = 1 s x = s y = 3 Posud te na hladině významnosti α = 005 hypotézu že střední hodnoty náhodných veličin X a Y jsou stejné Současně zkontrolujte zda je možné použít potřebné předpoklady Abychom mohli použít test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem měli bychom nejdříve otestovat zda obě veličiny stejný rozptyl skutečně mají Test stejného rozptylu: Předpokládáme že veličiny X a Y jsou nezávislé s normálními rozděleními po řadě Nµ 1 σ 1 s Nµ σ Jednotlivá měření pro X a Y považujeme všechna navzájem za nezávislá Page
3 Budeme testovat nulovou hypotézu o rovnosti rozptylů H 0 : σ1 = σ proti alternativní hypotéze H 1 : σ1 σ Testovací statistika je T = S X S Y a má za předpokladu σ 1 = σ tzv Fisherovo-Snedecorovo F m 1 n 1 - rozdělení s m 1 a n 1 stupni volnosti v tomto pořadí! Za předpokladu nulové hypotézy H 0 je očekávaná hodnota statistiky T rovna 1 a kritický obor tak podobně jako v některých předchozích příkladech bude W : α q F m 1n 1 q F m 1n 1 1 α Kritérium pro ZAMÍTNUTÍ je proto tvaru [ α t < q F m 1n 1 nebo q F m 1n 1 1 α ] < t zamítáme H 0 na dané hladině α Realizace testovací statistiky je t = s x s y = 4 9 = a hodnoty kvantilů jsou α q F m 1n 1 = q F = 1 q F = 1 34 = 094 a q F m 1n 1 1 α = q F = 77 t = hypotézu H 0 že X a Y mají stejný rozptyl NEZAMÍTÁME Test rovnosti středních hodnot se stejným neznámým rozptylem: Předpokládáme že veličiny X a Y jsou nezávislé s normálními rozděleními po řadě Nµ 1 σ s Nµ σ Tento předpoklad je podložen předchozím testem rovnosti rozptylů který jsme nezamítli Jednotlivá měření pro X a Y považujeme opět všechna navzájem za nezávislá Budeme testovat nulovou hypotézu o rovnosti středních hodnot H 0 : µ 1 = µ proti alternativní hypotéze H 1 : µ 1 µ Page 3
4 Testovací statistika je kde T = X Y S 1/m + 1/n S = m 1 m + n S X + n 1 m + n S Y je vážený odhad rozptylu Za předpokladu nulové hypotézy H 0 tj µ 1 = µ má statistika T Studentovo tm + n -rozděleni s m + n stupni volnosti Kritérium pro ZAMÍTNUTÍ bude proto očekávatelně tvaru t > q tm+n 1 α zamítáme H 0 na dané hladině α a Po dosazení máme Hodnota kvantilu je s = m 1s x + n 1s y m + n x y t = s 1/m + 1/n = = = 3 = = 1984 q tm+n 1 α = q t = 04 t = = q tm+n 1 α hypotézu H 0 ze X a Y mají stejnou střední hodnotu také NEZAMÍTÁME 13 párový pokus U n = 8 praváků jsme změřili délku prostředníčku na pravé a levé ruce hodnoty v milimetrech uvádí tabulka Levá Pravá Na hladině významnosti α = 5% posud te hypotézu že praváci mají delší prostředníček na levé ruce a uved te předpoklady Označme si jako veličinu X délku prostředníčku na levé ruce a jako veličinu Y délku prostředníčku na pravé ruce u téhož člověka zde navíc praváka Pokud na jednom subjektu provádíme měření více veličin zde X a Y pak už jejich vzájemné hodnoty nemůžeme považovat za nezávislé Za nezávislá ovšem samozřejmě považujeme měření dvojice veličin X Y tj náhodného vektoru u různých lidí U veličiny := X Y která představuje rozdíly mezi veličinami můžeme přirozeně předpokládat normální rozdělení Nµ σ nebot jde o odchylky které obvykle tuto vlastnost mají Máme tedy nezávislá měření s hodnotami δ = x 1 y 1 x n y n a naše původní hypotéza EX EY lze ekvivalentně vyjádřit pomocí 0 EX EY = E = µ jako nulová hypotéza Page 4
5 H 0 : µ 0 kterou otestujeme proti alternativní hypotéze H 1 : µ < 0 na hladině významnosti α = 5% Půjde tedy o obvyklý test střední hodnoty veličiny s normálním rozdělením při neznámém rozptylu Použijeme tudíž statistiku T = S n a kritérium pro ZAMÍTNUTÍ bude tvaru t < q tn 1 α zamítáme H 0 na dané hladině α Určíme si hodnoty realizace δ veličiny = X Y x y δ = x y Spočteme její výběrový průměr a rozptyl pro n = 8: δ = 7 8 = 0875 s δ = 1 n 1 15 δ i δ = = určíme realizaci statistiky t = δ s δ n = = 163 a příslušný kvantil q tn 1 α = q tn 1 1 α = q t7 095 = 1895 t = = q t7 005 nulovou hypotézu že praváci mají delší levý prostředníček než pravý NEZAMÍTÁME 14 test nekorelovanosti dvou výběrů z normálních rozdělení Pro realizace X Y náhodných výběrů z veličin X Y testujte na hladině významnosti α = 5 % jejich korelovanost Testujeme hypotézu o koeficientu korelace ϱx Y mezi náhodnými veličinami X a Y H 0 : ϱx Y = 0 tj náhodné veličiny X a Y jsou nekorelované proti alternativní hypotéze Page 5
6 H 1 : ϱx Y 0 tj náhodné veličiny X a Y jsou korelované K testování použijeme výběrový koeficient korelace RX Y a testovou statistiku T = RX Y n 1 R X Y která má Studentovo rozdělení tn kde n je rozsah výběrů Realizaci rx y výběrového koeficientu korelace RX Y vypočteme ze vzorce n n x i y i x i y i rx y = n n x i x i n n yi y i Za předpokladu nulové hypotézy H 0 tj ϱx Y = 0 je očekávaná hodnota statistiky T rovna 0 Kritérium pro ZAMÍTNUTÍ proto podobně jako pro některé předchozí testy bude tvaru t > q tn 1 α zamítáme H 0 na dané hladině α Je n = 5 x i = 13 y i = 36 x i = yi = 80 x i y i = 890 Po dosazení hodnot dostaneme rx y = = = t = rx y n r x y = = Z tabulek nalezneme kvantil q tn 1 α = q t = 318 t = = q t hypotézu H 0 NEZAMÍTÁME 15 test dobré shody - geometrické rozdělení Realizací náhodné veličiny X jsme dostali následující četnosti výsledků: hodnota pozorovaná četnost Posud te na hladině významnosti α = 005 hypotézu že náhodná veličina X má geometrické rozdělení s parametrem q = 1/ tj pravděpodobnostní funkce je p X i = q i 1 q i N 0 Page 6
7 Veličina s geometrickým rozdělením nabývá nekonečně mnoha hodnot Test dobré shody je ale možné dělat jen s veličinou s konečně mnoha hodnotami Proto musíme některé hodnoty sloučit do jediné skupiny Zde se přirozeně nabízí udělat to pro hodnoty 6 a výše Pravděpodobnost pro tuto skupinu je pak součet pravděpodobností jednotlivých hodnot v této skupině V našem případě je P X 6 = 1 P X < 6 = 1 5 i=0 1 p X i = = Při testu dobré shody porovnáváme naměřené četnosti s očekávanými četnostmi Rozsah souboru tj počet měření je N = = 64 Naší tabulku tedy zpřesníme a doplníme o teoretické pravděpodobnosti p i a teoretické tj očekávané četnosti N p i : položka i pozorovaná četnost n i teoretická pravděpodobnost p i 1/ 1/4 1/8 1/16 1/3 1/64 1/64 teoretická četnost N p i Další podmínkou pro test dobré shody je to aby jednotlivé položky měly TEORETICKÉ četnosti N p i 5 Pokud tomu tak není je potřeba položky vhodně sloučit tak abychom této hranice dosáhli Zde se opět nabízí udělat to pro hodnoty i 3 Původní veličinu X tedy nakonec nahradíme veličinou X popsanou následující tabulkou: položka i pozorovaná četnost n i teoretická pravděpodobnost p i 1/ 1/4 1/8 1/8 teoretická četnost N p i Nyní už můžeme zformulovat naši nulovou hypotézu H 0 : pro pravděpodobnosti hodnot veličiny X platí p 0 p 1 p p 3 = kterou budeme testovat proti alternativní hypotéze: H 1 : pro pravděpodobnosti hodnot veličiny X platí p 0 p 1 p p Pro test dobré shody používáme určitou statistiku T jejíž realizace t se počítá vzorcem t = i K n i N p i N p i kde K je množina položek veličiny X a k = K je jejich počet Rozdělení statistiky T se pro N blíží k χ k 1-rozdělení s k 1 stupni volnosti právě kvůli přibližnosti jsme také potřebovali teoretické četnosti 5 Kritérium pro ZAMÍTNUTÍ bude podobné jako u jednostranného testu rozptylu protože jde opět o χ -rozdělení Je tedy tvaru t > q χ k 1 1 α zamítáme H 0 na dané hladině α Page 7
8 Zdůvodnění tvaru zamítacího kritéria: Máme-li správné rozdělení měly by být odchylky teoretických a naměřených četností malé a proto i hodnota statistiky T bude spíše menší Jako kritický obor si tudíž volíme opět W : u 1 kde má platit že P u 1 < T = α Dostaneme tak že u 1 = q χ k 1 1 α protože předpokládáme že T má přibližně χ -rozdělení V našem případě máme k = 4 Hodnota statistiky je t = a hodnota kvantilu je q χk 1 1 α = q χ3 095 = 7815 t = = q χ3 095 = nulovou hypotézu H 0 pro veličinu X NEZAMÍTÁME Tento výsledek interpretujeme tak že hypotézu X má geometrické rozdělení s parametrem q = 1/ rovněž NEZAMÍTÁME 16 test dobré shody - rovnoměrné rozdělení Účastníci konference budou ubytováni ve čtyřpatrovém penziónu se 1 pokoji v každém patře jsou tři pokoje se dvěma lůžky Každý z N = 0 účastníků poslal organizátorům nezávisle svůj požadavek čísla pokoje kde by chtěl být ubytovaný Čísla byla následující Otestujte na hladině významnosti α = 005 hypotézu H 0 : rozdělení účastníků do pater je rovnoměrné proti alternativě H 1 : rozdělení účastníků do pater není rovnoměrné patro čísla pokojů Veličina X která přiřazuje účastníkovi patro ve kterém bude bydlet má 4 položky Požadavek rovnoměrného rozdělení znamená že pravděpodobnosti p i těchto položek tj patra očíslovaná pomocí i = 1 4 budou p 1 p p p 4 = Hypotézu tedy vyjádříme konkrétně: H 0 : pro pravděpodobnosti hodnot veličiny X platí p 1 p p p 4 = a alternativní hypotéza bude: H 1 : pro pravděpodobnosti hodnot veličiny X platí p 1 p p p K rozhodování použijeme χ -test dobré shody Setřídíme data do skupin a vypočteme empirické četnosti n i které zapíšeme spolu s teoretickými četnostmi N p i do tabulky Ze zadání máme N = 0 počet dat k = 4 počet tříd a p i = i 4 pro rovnoměrné rozdělení Page 8
9 číslo patra i čísla pokojů n i N p i Podmínka na teoretické četnosti 5 je splněna takže položky nemusíme slučovat Dosadíme do vzorce pro realizaci t statistiky T která má v tomto případě rozdělení přibližně χ k 1 = χ 3 t = a porovnáme ji s kvantilem 4 n i N p i N p i = = 16 q χ k 11 α = q χ 3095 = 7815 t = = q χ3 095 nulovou hypotézu H 0 že rozdělení účastníků do pater je rovnoměrné NEZAMÍTÁME 17 test dobré shody - nezávislost veličin Na N = 100 lidech byla pozorována barva očí a vlasů Data jsou shrnuta v tabulce Na hladině α = 5% testujte hypotézu o nezávislosti barvy očí a vlasů Vlasy Oči tmavé světlé modré 10 0 šedé hnědé Označme si X veličinu která přiřazuje danému člověku barvu očí a Y veličinu která přiřazuje témuž člověku barvu vlasů Budeme testovat hypotézu: H 0 : rozdělení veličin X a Y jsou nezávislá proti alternativní hypotéze: H 1 : rozdělení veličin X a Y jsou závislá na hladině významnosti α = 5% Označme si ještě pro jednoduchost obor hodnot veličiny X jako A = {modré šedé hnědé} a obor veličiny Y jako B = {tmavé světlé} Četnosti pro i j A B z tabulky označme jako n ij Rozdělení veličin X ani Y neznáme a proto je odhadneme jako p X i = n i N kde n i = j B p Y j = n j N n ij a n j = i A n ij Page 9
10 jsou marginální četnosti n ij X = i Y = j tmavé světlé n i modré šedé hnědé n j Za předpokladu nezávislosti veličin X a Y máme p XY i j = p X i p Y j Hypotézu o nezávislosti tedy můžeme přeformulovat takto H 0 : p XY i j = p X i p Y i pro všechna i j A B a alternativní hypotézu jako H 1 : p XY i j p X i p Y i pro alespoň jedno i j A B Otestování hypotézy H 0 tak bude TÉMĚŘ odpovídat obvyklému testu dobré shody s předepsaným rozdělením tentokrát pracujeme s diskrétním náhodným vektorem X Y ale s tím rozdílem že počet stupňů volnosti bude kvůli odhadu marginálních pravděpodobností JINÝ než by tomu bylo u obvyklého testu dobré shody se 6 položkami Počet stupňů volnosti je v tomto případě A 1 B 1 = = Za předpokladu H 0 pro očekávané četnosti pro jednotlivé hodnoty i j náhodného vektoru X Y pak bude platit že N p XY i j = N p X i p Y j = n i n j N Tabulka pro pro tyto četnosti bude: N p XY i j X = i Y = j tmavé světlé n i modré 100 = = šedé 100 = = hnědé 100 = = 0 50 n j Podmínka na teoretické tj očekávané četnosti 5 je splněna takže položky nemusíme slučovat Pro realizaci testovací statistiky dostaneme t = ij n ij N p XY i j N p XY i j = = = = Page 10
11 a porovnáme ji s hodnotou kvantilu χ pro = stupňů volnosti q χ 1 α = q χ 095 = 599 t = > 599 = q χ 095 hypotézu o nezávislosti proto ZAMÍTÁME Page 11
11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.
11 cvičení z PSI 12-16 prosince 2016 111 (Test dobré shody - geometrické rozdělení Realizací náhodné veličiny X jsme dostali následující četnosti výsledků: hodnota 0 1 2 3 4 5 6 pozorovaná četnost 29 15
12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem)
cvičení z PSI 0-4 prosince 06 Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem) Z realizací náhodných veličin X a Y s normálním rozdělením) jsme z výběrů daného rozsahu obdrželi
12. prosince n pro n = n = 30 = S X
11 cvičení z PSI 1 prosince 018 111 test střední hodnoty normálního rozdělení při známém rozptylu Teploměrem o jehož chybě předpokládáme že má normální rozdělení se směrodatnou odchylkou σ = 3 jsme provedli
10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.
0 cvičení z PST 5 prosince 208 0 (intervalový odhad pro rozptyl) Soubor (70, 84, 89, 70, 74, 70) je náhodným výběrem z normálního rozdělení N(µ, σ 2 ) Určete oboustranný symetrický 95% interval spolehlivosti
676 + 4 + 100 + 196 + 0 + 484 + 196 + 324 + 64 + 324 = = 2368
Příklad 1 Je třeba prověřit, zda lze na 5% hladině významnosti pokládat za prokázanou hypotézu, že střední doba výroby výlisku je 30 sekund. Přitom 10 náhodně vybraných výlisků bylo vyráběno celkem 540
prosince oboustranný symetrický 95% interval spolehlivosti pro střední hodnotu životnosti τ. X i. X = 1 n.. Podle CLV má veličina
10 cvičení z PSI 5-9 prosince 016 101 intervalový odhad Veličina X, představující životnost žárovky, má exponenciální rozdělení s parametrem τ Průměrná životnost n = 64 náhodně vybraných žárovek je x =
PRAVDĚPODOBNOST A STATISTIKA
PRAVDĚPODOBNOST A STATISTIKA Testování hypotéz Nechť X je náhodná proměnná, která má distribuční funkci F(x, ϑ). Předpokládejme, že známe tvar distribuční funkce (víme jaké má rozdělení) a neznáme parametr
Testy. Pavel Provinský. 19. listopadu 2013
Testy Pavel Provinský 19. listopadu 2013 Test a intervalový odhad Testy a intervalové odhady - jsou vlastně to samé. Jiný je jen úhel pohledu. Lze přecházet od jednoho k druhému. Například: Při odvozování
Testování statistických hypotéz
Testování statistických hypotéz 1 Testování statistických hypotéz 1 Statistická hypotéza a její test V praxi jsme nuceni rozhodnout, zda nějaké tvrzeni o parametrech náhodných veličin nebo o veličině samotné
15. T e s t o v á n í h y p o t é z
15. T e s t o v á n í h y p o t é z Na základě hodnot náhodného výběru činíme rozhodnutí o platnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlastnostech. Rozeznáváme dva základní typy testů:
5. T e s t o v á n í h y p o t é z
5. T e s t o v á n í h y p o t é z Na základě hodnot náhodného výběru činíme rozhodnutí o platnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlastnostech. Rozeznáváme dva základní typy testů:
Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace
Intervalové odhady Interval spolehlivosti pro střední hodnotu v Nµ, σ 2 ) Situace: X 1,..., X n náhodný výběr z Nµ, σ 2 ), kde σ 2 > 0 známe měli jsme: bodové odhady odhadem charakteristiky je číslo) nevyjadřuje
Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace
Intervalové odhady Interval spolehlivosti pro střední hodnotu v Nµ, σ 2 ) Situace: X 1,..., X n náhodný výběr z Nµ, σ 2 ), kde σ 2 > 0 známe měli jsme: bodové odhady odhadem charakteristiky je číslo) nevyjadřuje
Příklady na testy hypotéz o parametrech normálního rozdělení
Příklady na testy hypotéz o parametrech normálního rozdělení. O životnosti 75W žárovky (v hodinách) je známo, že má normální rozdělení s = 5h. Pro náhodný výběr 0 žárovek byla stanovena průměrná životnost
15. T e s t o v á n í h y p o t é z
15. T e s t o v á n í h y p o t é z Na základě hodnot náhodného výběru činíme rozhodnutí o platnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlastnostech. Rozeznáváme dva základní typy testů:
Normální (Gaussovo) rozdělení
Normální (Gaussovo) rozdělení f x = 1 2 exp x 2 2 2 f(x) je funkce hustoty pravděpodobnosti, symetrická vůči poloze maxima x = μ μ střední hodnota σ směrodatná odchylka (tzv. pološířka křivky mezi inflexními
4ST201 STATISTIKA CVIČENÍ Č. 7
4ST201 STATISTIKA CVIČENÍ Č. 7 testování hypotéz parametrické testy test hypotézy o střední hodnotě test hypotézy o relativní četnosti test o shodě středních hodnot testování hypotéz v MS Excel neparametrické
TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B
TESTOVÁNÍ HYPOTÉZ Od statistického šetření neočekáváme pouze elementární informace o velikosti některých statistických ukazatelů. Používáme je i k ověřování našich očekávání o výsledcích nějakého procesu,
7. Analýza rozptylu.
7. Analýza rozptylu. Uvedeme obecnou ideu, která je založena na minimalizaci chyby metodou nejmenších čtverců. Nejdříve uvedeme několik základních tvrzení. Uvažujeme náhodný vektor Y = (Y, Y,..., Y n a
Normální (Gaussovo) rozdělení
Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení popisuje vlastnosti náhodné spojité veličiny, která vzniká složením různých náhodných vlivů, které jsou navzájem nezávislé, kterých je velký
Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.
Testování statistických hypotéz Ing. Michal Dorda, Ph.D. Testování normality Př. : Při simulaci provozu na křižovatce byla získána data o mezerách mezi přijíždějícími vozidly v [s]. Otestujte na hladině
Testování hypotéz o parametrech regresního modelu
Testování hypotéz o parametrech regresního modelu Ekonometrie Jiří Neubauer Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra UO
Testování hypotéz o parametrech regresního modelu
Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Lineární regresní model kde Y = Xβ + e, y 1 e 1 β y 2 Y =., e = e 2 x 11 x 1 1k., X =....... β 2,
Cvičení ze statistiky - 8. Filip Děchtěrenko
Cvičení ze statistiky - 8 Filip Děchtěrenko Minule bylo.. Dobrali jsme normální rozdělení Tyhle termíny by měly být známé: Centrální limitní věta Laplaceho věta (+ korekce na spojitost) Konfidenční intervaly
Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13
Příklad 1 Máme k dispozici výsledky prvního a druhého testu deseti sportovců. Na hladině významnosti 0,05 prověřte, zda jsou výsledky testů kladně korelované. 1.test : 7, 8, 10, 4, 14, 9, 6, 2, 13, 5 2.test
Zpracování náhodného vektoru. Ing. Michal Dorda, Ph.D.
Ing. Michal Dorda, Ph.D. 1 Př. 1: Cestující na vybraném spoji linky MHD byli dotazováni za účelem zjištění spokojenosti s kvalitou MHD. Legenda 1 Velmi spokojen Spokojen 3 Nespokojen 4 Velmi nespokojen
Statistika, Biostatistika pro kombinované studium. Jan Kracík
Statistika, Biostatistika pro kombinované studium Letní semestr 2014/2015 Tutoriál č. 6: ANOVA Jan Kracík jan.kracik@vsb.cz Obsah: Testování hypotéz opakování ANOVA Testování hypotéz (opakování) Testování
4EK211 Základy ekonometrie
4EK211 Základy ekonometrie ZS 2015/16 Cvičení 1: Opakování ze statistiky LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE Z čeho studovat 1) Z KNIHY Krkošková,
You created this PDF from an application that is not licensed to print to novapdf printer (http://www.novapdf.com)
Testování statistických hypotéz Testování statistických hypotéz Princip: Ověřování určitého předpokladu zjišťujeme, zda zkoumaný výběr pochází ze základního souboru, který má určité rozdělení zjišťujeme,
Regresní analýza 1. Regresní analýza
Regresní analýza 1 1 Regresní funkce Regresní analýza Důležitou statistickou úlohou je hledání a zkoumání závislostí proměnných, jejichž hodnoty získáme při realizaci experimentů Vzhledem k jejich náhodnému
II. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal
Základy navrhování průmyslových experimentů DOE II. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal! Testování statistických hypotéz kvalitativní odezva kvantitativní chí-kvadrát test homogenity,
Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.
Pravděpodobnost a statistika, Biostatistika pro kombinované studium Letní semestr 2015/2016 Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz Jan Kracík jan.kracik@vsb.cz Obsah: Výběrová rozdělení
JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica
JEDNOVÝBĚROVÉ TESTY Komentované řešení pomocí programu Statistica Vstupní data Data umístěná v excelovském souboru překopírujeme do tabulky ve Statistice a pojmenujeme proměnné, viz prezentace k tématu
Náhodné veličiny jsou nekorelované, neexistuje mezi nimi korelační vztah. Když jsou X; Y nekorelované, nemusí být nezávislé.
1. Korelační analýza V životě většinou nesledujeme pouze jeden statistický znak. Sledujeme více statistických znaků zároveň. Kromě vlastností statistických znaků nás zajímá také jejich těsnost (velikost,
Aproximace binomického rozdělení normálním
Aproximace binomického rozdělení normálním Aproximace binomického rozdělení normálním Příklad Sybilla a Kassandra tvrdí, že mají telepatické schopnosti, a chtějí to dokázat následujícím pokusem: V jedné
Charakteristika datového souboru
Zápočtová práce z předmětu Statistika Vypracoval: 10. 11. 2014 Charakteristika datového souboru Zadání: Při kontrole dodržování hygienických norem v kuchyni se prováděl odběr vzduchu a pomocí filtru Pallflex
Pearsonůvχ 2 test dobré shody. Ing. Michal Dorda, Ph.D.
Ing. Michal Dorda, Ph.D. Př. : Ve vjezdové skupině kolejí byly sledovány počty přijíždějících vlaků za hodinu. Za 5 dní (tedy 360 hodin) přijelo celkem 87 vlaků. Výsledky sledování jsou uvedeny v tabulce.
Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, TESTY DOBRÉ SHODY (angl. goodness-of-fit tests)
Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, např. hmotnost a pohlaví narozených dětí. Běžný statistický postup pro ověření závislosti dvou veličin je zamítnutí jejich
Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci
Zpracování dat v edukačních vědách - Testování hypotéz Kamila Fačevicová Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci Obsah seminářů 5.11. Úvod do matematické
Testování statistických hypotéz. Obecný postup
poznámky k MIII, Tomečková I., poslední aktualizace 9. listopadu 016 9 Testování statistických hypotéz Obecný postup (I) Vyslovení hypotézy O datech vyslovíme doměnku, kterou chceme ověřit statistickým
Testování statistických hypotéz
Testování statistických hypotéz Michal Fusek Ústav matematiky FEKT VUT, fusekmi@feec.vutbr.cz 11. přednáška z ESMAT Michal Fusek (fusekmi@feec.vutbr.cz) 1 / 27 Obsah 1 Testování statistických hypotéz 2
STATISTICKÉ TESTY VÝZNAMNOSTI
STATISTICKÉ TESTY VÝZNAMNOSTI jsou statistické postupy, pomocí nichž ověřujeme, zda mezi proměnnými existuje vztah (závislost, rozdíl). Pokud je výsledek šetření statisticky významný (signifikantní), znamená
Příklad 1. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 11
Příklad 1 Vyhláška Ministerstva zdravotnictví předpokládala, že doba dojezdu k pacientovi od nahlášení požadavku nepřekročí 17 minut. Hodnoty deseti náhodně vybraných dob příjezdu sanitky k nemocnému byly:
Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel
Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Statistickou hypotézou se rozumí určité tvrzení o parametrech rozdělení zkoumané náhodné veličiny (µ, σ 2, π,
Jana Vránová, 3. lékařská fakulta UK
Jana Vránová, 3. lékařská fakulta UK Vznikají při zkoumání vztahů kvalitativních resp. diskrétních znaků Jedná se o analogii s korelační analýzou spojitých znaků Přitom předpokládáme, že každý prvek populace
Testování statistických hypotéz
Testování statistických hypotéz Na základě náhodného výběru, který je reprezentativním vzorkem základního souboru (který přesně neznáme, k němuž se ale daná statistická hypotéza váže), potřebujeme ověřit,
Stručný úvod do testování statistických hypotéz
Stručný úvod do testování statistických hypotéz 1. Formulujeme hypotézu (předpokládáme, že pozorovaný jev je pouze náhodný). 2. Zvolíme hladinu významnosti testu a, tj. riziko, s nímž jsme ochotni se smířit.
X = x, y = h(x) Y = y. hodnotám x a jedné hodnotě y. Dostaneme tabulku hodnot pravděpodobnostní
..08 8cv7.tex 7. cvičení - transformace náhodné veličiny Definice pojmů a základní vzorce Je-li X náhodná veličina a h : R R je měřitelná funkce, pak náhodnou veličinu Y, která je definovaná vztahem X
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 010 1.týden (0.09.-4.09. ) Data, typy dat, variabilita, frekvenční analýza
t-test, Studentův párový test Ing. Michael Rost, Ph.D.
Testování hypotéz: dvouvýběrový t-test, Studentův párový test Ing. Michael Rost, Ph.D. Úvod do problému... Již známe jednovýběrový t-test, při kterém jsme měli k dispozici pouze jeden výběr. Můžeme se
Téma 22. Ondřej Nývlt
Téma 22 Ondřej Nývlt nyvlto1@fel.cvut.cz Náhodná veličina a náhodný vektor. Distribuční funkce, hustota a pravděpodobnostní funkce náhodné veličiny. Střední hodnota a rozptyl náhodné veličiny. Sdružené
Cvičení ze statistiky - 9. Filip Děchtěrenko
Cvičení ze statistiky - 9 Filip Děchtěrenko Minule bylo.. Dobrali jsme normální rozdělení Tyhle termíny by měly být známé: Inferenční statistika Konfidenční intervaly Z-test Postup při testování hypotéz
ADDS cviceni. Pavlina Kuranova
ADDS cviceni Pavlina Kuranova Testy pro dva nezávislé výběry Mannův Whitneyho test - Založen na Wilcoxnově statistice W - založen na pořadí jednotlivých pozorování (oba výběry spojeny do jednoho celku)
Testy statistických hypotéz
Testy statistických hypotéz Statistická hypotéza je jakýkoliv předpoklad o rozdělení pravděpodobnosti jedné nebo několika náhodných veličin. Na základě náhodného výběru, který je reprezentativním vzorkem
5 Parametrické testy hypotéz
5 Parametrické testy hypotéz 5.1 Pojem parametrického testu (Skripta str. 95-96) Na základě výběru srovnáváme dvě tvrzení o hodnotě určitého parametru θ rozdělení f(x, θ). První tvrzení (které většinou
Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D.
Problematika analýzy rozptylu Ing. Michael Rost, Ph.D. Úvod do problému Již umíte testovat shodu dvou středních hodnot prostřednictvím t-testů. Otázka: Jaké předpoklady musí být splněny, abyste mohli použít
2 ) 4, Φ 1 (1 0,005)
Příklad 1 Ze zásilky velkého rozsahu byl náhodně vybrán soubor obsahující 1000 kusů. V tomto souboru bylo zjištěno 26 kusů nekvalitních. Rozhodněte, zda je možné s 99% jistotou tvrdit, že zásilka obsahuje
Poznámky k předmětu Aplikovaná statistika, 11. téma
Poznámky k předmětu Aplikovaná statistika, 11. téma Testy založené na χ 2 rozdělení V přehledu významných rozdělení jsme si uvedli, že Poissonovým rozdělením se modeluje počet událostí, které nastanou
Přednáška X. Testování hypotéz o kvantitativních proměnných
Přednáška X. Testování hypotéz o kvantitativních proměnných Testování hypotéz o podílech Kontingenční tabulka, čtyřpolní tabulka Testy nezávislosti, Fisherůvexaktní test, McNemarůvtest Testy dobré shody
letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika t-test
Párový Šárka Hudecová Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy letní semestr 2012 motivační příklad Párový Příklad (Platová diskriminace) firma
Úvod do analýzy rozptylu
Úvod do analýzy rozptylu Párovým t-testem se podařilo prokázat, že úprava režimu stravování a fyzické aktivity ve vybrané škole měla vliv na zlepšené hodnoty HDLcholesterolu u školáků. Pro otestování jsme
Tomáš Karel LS 2012/2013
Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není
Jednofaktorová analýza rozptylu
Jednofaktorová analýza rozptylu David Hampel Ústav statistiky a operačního výzkumu, Mendelova univerzita v Brně Kurz pokročilých statistických metod Global Change Research Centre AS CR, 5 7 8 2015 Tato
Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin
Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin EuroMISE Centrum Kontakt: Literatura: Obecné informace Zvárová, J.: Základy statistiky pro biomedicínskéobory I. Vydavatelství
Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin
Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin EuroMISE Centrum I. ÚVOD vv této přednášce budeme hovořit o jednovýběrových a dvouvýběrových testech týkajících se střední hodnoty
KGG/STG Statistika pro geografy
KGG/STG Statistika pro geografy 9. Korelační analýza Mgr. David Fiedor 20. dubna 2015 Analýza závislostí v řadě geografických disciplín studujeme jevy, u kterých vyšetřujeme nikoliv pouze jednu vlastnost
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická
Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně
Testování hypotéz Nechť,, je náhodný výběr z nějakého rozdělení s neznámými parametry. Máme dvě navzájem si odporující hypotézy o parametrech daného rozdělení: Nulová hypotéza parametry (případně jediný
Pravděpodobnost a matematická statistika
Pravděpodobnost a matematická statistika Příklady k přijímacím zkouškám na doktorské studium 1 Popisná statistika Určete aritmetický průměr dat, zadaných tabulkou hodnot x i a četností n i x i 1 2 3 n
Výběrové charakteristiky a jejich rozdělení
Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Statistické šetření úplné (vyčerpávající) neúplné (výběrové) U výběrového šetření se snažíme o to, aby výběrový
Tomáš Karel LS 2012/2013
Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není
Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test
Testování hypotéz 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test Testování hypotéz proces, kterým rozhodujeme, zda přijmeme nebo zamítneme nulovou hypotézu
1. Náhodný vektor (X, Y ) má diskrétní rozdělení s pravděpodobnostní funkcí p, kde. p(x, y) = a(x + y + 1), x, y {0, 1, 2}.
VIII. Náhodný vektor. Náhodný vektor (X, Y má diskrétní rozdělení s pravděpodobnostní funkcí p, kde p(x, y a(x + y +, x, y {,, }. a Určete číslo a a napište tabulku pravděpodobnostní funkce p. Řešení:
Jana Vránová, 3.lékařská fakulta UK, Praha. Hypotézy o populacích
Jana Vránová, 3.lékařská fakulta UK, Praha Hypotézy o populacích Příklad IQ test: Předpokládejme, že z nějakého důvodu ministerstvo školství věří, že studenti absolventi středních škol v Hradci Králové
Matematické modelování Náhled do ekonometrie. Lukáš Frýd
Matematické modelování Náhled do ekonometrie Lukáš Frýd Výnos akcie vs. Výnos celého trhu - CAPM model r it = r ft + β 1. (r mt r ft ) r it r ft = α 0 + β 1. (r mt r ft ) + ε it Ekonomický (finanční model)
Testování hypotéz. 4. přednáška 6. 3. 2010
Testování hypotéz 4. přednáška 6. 3. 2010 Základní pojmy Statistická hypotéza Je tvrzení o vlastnostech základního souboru, o jehož pravdivosti se chceme přesvědčit. Předem nevíme, zda je pravdivé nebo
TECHNICKÁ UNIVERZITA V LIBERCI
TECHNICKÁ UNIVERZITA V LIBERCI Ekonomická fakulta Semestrální práce z předmětu Statistický rozbor dat z dotazníkového šetření Jméno: Lucie Krechlerová, Karel Kozma, René Dubský, David Drobík Ročník: 2015/2016
STATISTICKÉ TESTY VÝZNAMNOSTI
STATISTICKÉ TESTY VÝZNAMNOSTI jsou statistické postupy, pomocí nichž ověřujeme, zda mezi proměnnými existuje vztah (závislost, rozdíl). Pokud je výsledek šetření statisticky významný (signifikantní), znamená
6. T e s t o v á n í h y p o t é z
6. T e s t o v á n í h y p o t é z Na základě hodnot z realizace náhodného výběru činíme rozhodnutí o platnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlastnostech. Používáme k tomu vhodně
Neparametrické metody
Neparametrické metody Dosud jsme se zabývali statistickými metodami, které zahrnovaly předpoklady o rozdělení dat. Zpravidla jsme předpokládali normální rozdělení. Např. Grubbsův test odlehlých hodnot
Vybrané partie z biostatistiky
1 Úvod Vybrané partie z biostatistiky 10.7.2017, Běstvina Marie Turčičová (turcic@karlin.mff.cuni.cz), MFF UK Pracovat budeme v programu R a jeho nástavbě RStudio, které si můžete bezplatně stáhnout zde:
Analýza rozptylu. Ekonometrie. Jiří Neubauer. Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel
Analýza rozptylu Ekonometrie Jiří Neubauer Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra UO Brno) Analýza rozptylu 1 / 30 Analýza
Náhodné veličiny, náhodné chyby
Náhodné veličiny, náhodné chyby Máme náhodnou veličinu X, jejíž vlastnosti zkoumáme. Pokud známe její rozložení (např. z nějaké dřívější studie) nebo alespoň předpokládáme znalost rozložení, můžeme ji
TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY
TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY Statistická hypotéza je určitá domněnka (předpoklad) o vlastnostech ZÁKLADNÍHO SOUBORU. Test statistické hypotézy je pravidlo (kritérium), které na základě
McNemarův test, Stuartův test, Test symetrie
Tereza Burgetová McNemarův test, Stuartův test, Test symetrie 11. prosince 2017 McNemarův test - motivace Analýza kontingenčních tabulek, kdy není cílem provést klasický test nezávislosti. Příklad: Před
Úvod do teorie odhadu. Ing. Michael Rost, Ph.D.
Úvod do teorie odhadu Ing. Michael Rost, Ph.D. Náhodný výběr Náhodným výběrem ze základního souboru populace, která je popsána prostřednictvím hustoty pravděpodobnosti f(x, θ), budeme nazývat posloupnost
1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.
Testy hypotéz na základě více než 2 výběrů 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Testy hypotéz na základě více než 2 výběrů Na analýzu rozptylu lze pohlížet v podstatě
jevu, čas vyjmutí ze sledování byl T j, T j < X j a T j je náhodná veličina.
Parametrické metody odhadů z neúplných výběrů 2 1 Metoda maximální věrohodnosti pro cenzorované výběry 11 Náhodné cenzorování Při sledování složitých reálných systémů často nemáme možnost uspořádat experiment
Kontingenční tabulky, korelační koeficienty
Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel 973 442029 email:jirineubauer@unobcz Budeme předpokládat, že X a Y jsou kvalitativní náhodné veličiny, obor hodnot X obsahuje r hodnot (kategorií,
Zápočtová práce STATISTIKA I
Zápočtová práce STATISTIKA I Obsah: - úvodní stránka - charakteristika dat (původ dat, důvod zpracování,...) - výpis naměřených hodnot (v tabulce) - zpracování dat (buď bodové nebo intervalové, podle charakteru
Testování hypotéz. testujeme (většinou) tvrzení o parametru populace. tvrzení je nutno předem zformulovat
Testování hypotéz testujeme (většinou) tvrzení o parametru populace tvrzení je nutno předem zformulovat najít odpovídající test, podle kterého se na základě informace z výběrového souboru rozhodneme, zda
Statistické metody uţívané při ověřování platnosti hypotéz
Statistické metody uţívané při ověřování platnosti hypotéz Hypotéza Domněnka, předpoklad Nejčastěji o rozdělení, středních hodnotách, závislostech, Hypotézy ve vědeckém výzkumu pracovní, věcné hypotézy
Ing. Michael Rost, Ph.D.
Úvod do testování hypotéz, jednovýběrový t-test Ing. Michael Rost, Ph.D. Testovaná hypotéza Pokud nás zajímá zda platí, či neplatí tvrzení o určitém parametru, např. o parametru Θ, pak takovéto tvrzení
Jarqueův a Beryho test normality (Jarque-Bera Test, JB test)
Jarqueův a Beryho test normality (Jarque-Bera Test, JB test) Autoři: Carlos M. Jarque and Anil K. Bera Předpoklady: - Výběrová data mohou obsahovat chybějící pozorování (chybějící hodnoty) vhodné zejména
PRAVDĚPODOBNOST A STATISTIKA. Neparametrické testy hypotéz čast 1
PRAVDĚPODOBNOST A STATISTIKA Neparametrické testy hypotéz čast 1 Neparametrické testy hypotéz - úvod Neparametrické testy statistických hypotéz se používají v případech, kdy neznáme rozdělení pozorované
Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1
Testování statistických hypotéz Ing. Michal Dorda, Ph.D. 1 Úvodní poznámky Statistickou hypotézou rozumíme hypotézu o populaci (základním souboru) např.: Střední hodnota základního souboru je rovna 100.
STATISTICKÉ HYPOTÉZY
STATISTICKÉ HYPOTÉZY ZÁKLADNÍ POJMY Bodové/intervalové odhady Maruška řešila hodnoty parametrů (průměr, rozptyl atd.) Zde bude Maruška dělat hypotézy (předpoklady) ohledně parametrů Z.S. Výsledek nebude
KGG/STG Statistika pro geografy
KGG/STG Statistika pro geografy 7. Testování statistických hypotéz Mgr. David Fiedor 30. března 2015 Osnova 1 2 3 Dělení testů parametrické - o parametrech rozdělení základního souboru (průměr, rozptyl,