statistické kontroly jakosti

Rozměr: px
Začít zobrazení ze stránky:

Download "statistické kontroly jakosti"

Transkript

1 Univerzita Karlova v Praze Matematicko-fyzikální fakulta DIPLOMOVÁ PRÁCE Petr Klášterecký Některé problémy statistické kontroly jakosti Katedra pravděpodobnosti a matematické statistiky Vedoucí diplomové práce: Prof. RNDr. Marie Hušková, DrSc. Studijní program: Matematika, Matematická statistika

2 Poděkování Rád bych na tomto místě poděkoval především vedoucí své diplomové práce Prof. Marii Huškové za cenné rady, návrhy a připomínky, jež významně přispěly k vylepšení konečné podoby textu. Poděkování patří také všem ostatním členům katedry pravděpodobnosti a matematické statistiky MFF UK v Praze, a mým rodičům, kteří mi studium umožnili. Prohlašuji, že jsem svou diplomovou práci napsal samostatně a výhradně s použitím citovaných pramenů. Souhlasím se zapůjčováním práce. V Praze dne 7. dubna 2003 Petr Klášterecký

3 Obsah Abstrakt/Abstract v Úvod 1 Výzkum v oblasti statistické kontroly jakosti Terminologie a značení Zaměření této práce Standartní procedury SKJ Shewhartova procedura Shewhartova procedura pro normální rozdělení CUSUM procedura CUSUM procedura pro normální rozdělení EWMA procedura Monotónně vzrůstající střední hodnota 10 3 Střední hodnota omezená stanovenou hranicí Odvození testové statistiky pro normální rozdělení při známém rozptylu σ Kritické hodnoty pro statistiky {Q n } N n= Simulované kritické hodnoty Vlastnosti statistiky Q n Modifikace Q n Kritické hodnoty pro statistiky {Q n,g } N n= Kritické hodnoty pro statistiky {Q simp n,g } N n= Úprava pro jinou formulaci hypotéz Modifikace předpokladů Normálně rozdělená data s neznámým rozptylem Data s jiným než normálním rozdělením iii

4 OBSAH iv 4 Simulace zpoždění detekce změn Vhodná volba okénka G Porovnání zpoždění detekce změn u různých testových statistik Porovnání se statistikou M n A Vybrané limitní věty 42 B Zdrojové kódy programů 44 Literatura 51

5 Abstrakt/Abstract v Abstrakt Název práce: Některé problémy statistické kontroly jakosti Autor: Petr Klášterecký Katedra: Katedra pravděpodobnosti a matematické statistiky Vedoucí diplomové práce: Prof. RNDr. Marie Hušková, DrSc. vedoucího: huskova@karlin.mff.cuni.cz Abstrakt: Pro posloupnosti nezávislých, stejně rozdělených náhodných veličin jsou v odborné literatuře poměrně podrobně popsány metody pro detekci změn ve střední hodnotě těchto náhodných veličin z jedné konstantní hodnoty na jinou. Méně pozornosti se doposud věnovalo situacím, kdy je třeba kontrolovat, zda střední hodnota nepřesáhla stanovenou úroveň, tzv. prahovou hodnotu. Po úvodním stručném shrnutí standartních procedur se práce věnuje právě této problematice. Jsou definovány různé testové statistiky pro odhalení změny, která nastala v neznámém čase m, a zkoumány jejich vlastnosti. Na chování sledované střední hodnoty do času m přitom nejsou kladeny žádné požadavky jako např. konstantnost, monotónnost a podobně. Závěrečná simulační studie porovnává vhodnost použití jednotlivých testových statistik v různých situacích. Klíčová slova: Statistická kontrola jakosti, testování hypotéz, test poměrem věrohodností. Abstract Title: Some Problems in Statistical Quality Control Author: Petr Klášterecký Department: Dept. of Probability and Mathematical Statistics Supervisor: Prof. RNDr. Marie Hušková, DrSc. Supervisor s address: huskova@karlin.mff.cuni.cz Abstract: Currently there are many scientific papers and monographs published on detection of changes in the mean of a sequence of iid random variables, if the change is from one constant value to another. Only few are, however, concerned with a more general situation, where the mean is allowed to change in any way until it crosses some predetermined threshold value. After a brief summary of the standard SPC procedures this thesis explores various test statistics for detecting a change, which occured in an unknown time point m in the past, and their properties. No restrictions like constancy, monotonicity etc. are required for the mean sequence until the time point m occurs. Using a simulation study, suggested procedures are compared by means of their delay in the change detection. Keywords: Statistical process control, testing of statistical hypotheses, generalized likelihood ratio test.

6 Úvod Z praktického hlediska je statistická kontrola jakosti (SKJ) v moderní době významným nástrojem pro zlepšování kvality výrobků a služeb, který přináší užitek spotřebitelům v podobě větší jistoty při nákupu i výrobcům v podobě větší důvěryhodnosti jejich produktů na trhu. Z hlediska teoretického jde o rychle a dynamicky se rozvíjející oblast matematické statistiky s mnoha otevřenými problémy a se stále probíhajícím výzkumem na mnoha univerzitních i vědeckých institucích po celém světě. Praktický problém detekce změn v nějaké kvalitativní charakteristice produktu se pro statistické účely převádí na problém detekce změn v parametrech pravděpodobnostního rozdělení, které pro sledovanou charakteristiku předpokládáme jako výchozí. Obvykle se proto nejvíce pozornosti věnuje různým posunům ve střední hodnotě, což odpovídá změně v úrovni sledované charakteristiky, a změnám v rozptylu daného rozdělení. Zatímco někteří autoři řadí pod obor statistická kontrola jakosti například i teorii navrhování experimentů jako nástroj pro určování faktorů, jež významně ovlivňují kvalitu zkoumaných produktů či postupů, ryzí statistickou kontrolu jakosti lze v podstatě rozdělit do dvou směrů buď se již v průběhu výroby odebírají a vyhodnocují kontrolní vzorky a v případě zjištění závad se výrobní proces okamžitě zastaví, nebo se taková kontrola provádí až při přejímce zboží, tedy po vyrobení a distribuci celé dávky (šarže) daného produktu. Současným celosvětovým trendem je z důvodu efektivity zapracovávat statistiku a statistické metody do výrobního procesu co nejdříve, nejlépe již ve fázi navrhování kontrolovaných experimentů, neboť jejich pozdní využití bývá často nesrovnatelně nákladnější. Proto je v poslední době výzkum zaměřen spíše na problémy spojené s první skupinou tzv. on-line kontrolních mechanismů a některým z nich se budeme věnovat i v této práci. Výzkum v oblasti statistické kontroly jakosti Základní stavební kameny statistické kontroly jakosti byly položeny Walterem Shewhartem (Shewhartova X procedura pro detekci skokové změny ve 1

7 Úvod 2 střední hodnotě) ve 20. a 30. letech dvacátého století, tedy již před více než 80 lety. Přestože se od té doby objevilo několik dalších detekčních postupů (mimo jiné umožňujících urychlení detekce využitím více než jednoho posledního pozorování, např. CUSUM, EWMA) a došlo k mnoha vylepšením a modifikacím Shewhartovy procedury (zavedení pomocných varovných mezí atd.), výzkum v této oblasti poměrně dlouho nebyl v porovnání s jinými oblastmi statistiky nijak intenzívní a oživení přišlo až v období kolem roku Woodall a Montgomery [Woodall, Montgomery 1999] jej připisují především zvýšenému tlaku na kvalitu výrobků ze strany spotřebitelů a konkurenčnímu boji na jedné straně a potřebou vědeckých institucí nalézat nová odvětví výzkumu (a prostoru k publikaci) na straně druhé. S tím bohužel souvisí fakt, že je dnes v podstatě nemožné sledovat vývoj výzkumu v nějaké ucelené podobě, jelikož se nové články objevují s rostoucí frekvencí v mnoha různých odborných technických časopisech. Jiným zlomovým bodem bylo nepochybně masívní rozšíření moderní výpočetní techniky v poslední době; zatímco zpočátku se kontrolní vzorky odebíraly v relativně dlouhých časových intervalech a bylo poměrně obtížné vůbec získat kvalitní data, natož je potom efektivně analyzovat, v dnešní době nejsou výjimkou měření opakovaná každých několik minut či dokonce sekund. To samozřejmě klade zcela jiné nároky na metody pro analýzu těchto měření, neboť obzvláště u rozsáhlých datových souborů je nutno brát v úvahu také časovou náročnost prováděných výpočtů. Terminologie a značení Předpokládejme, že sledujeme proces produkující posloupnost (konečnou nebo nekonečnou) x 1, x 2,... a tato posloupnost je (zpočátku) pod kontrolou, tj. spokojíme se s pouhým zaznamenáním pozorovaných hodnot. Taková situace je v praxi naprosto běžná, zmíněný proces může být například sériová výroba součástek a podobně. Pod kontrolou potom znamená, že stroj je správně seřízen a sledované hodnoty (např. průměr šroubku, síla izolace atd.) jsou v předem stanovené toleranci (ta je zpravidla určena podnikovou, státní nebo přímo mezinárodní normou). Předpokládejme dále, že v čase m dojde ke změně, která sledovaný proces vychýlí natolik, že pozorované hodnoty x m1, x m2,... již nesplňují kritéria nutná k tomu, aby byl proces pod kontrolou. Říkáme, že proces je mimo kontrolu. Ve zmíněném příkladu s výrobou šroubků může taková situace nastat například z důvodu opotřebení soustruhu, chybou obsluhujícího dělníka atd. Okamžik m zpravidla (s výjimkou cvičných, testovacích procesů) neznáme, k dispozici jsou pouze pozorovaná data. Cílem tedy je na jedné straně odhalit nežádoucí změnu ve sledovaném

8 Úvod 3 procesu co nejdříve po jejím výskytu, ale na druhé straně zároveň nezastavovat zbytečně proces, který je pod kontrolou (tedy minimalizovat výskyt tzv. falešných poplachů. Pro účely statistického modelování budeme předpokládat, že pozorované hodnoty x 1, x 2,... jsou realizacemi nezávislých náhodných veličin X 1, X 2,..., kde X i má pravděpodobnostní rozdělení s distribuční funkcí F (x i, θ i ), znač. X i F (x i, θ i ). θ i je obecně vektor parametrů, na nichž toto rozdělení závisí. Některé z těchto parametrů mohou být tzv. rušivé, tedy takové, které nás nezajímají kvůli samotnému řešení problému, ale nelze je ignorovat. Naopak některé (nebo všechny) parametry svými hodnotami přímo nebo nepřímo udávají, zda je sledovaný proces pod kontrolou či nikoli. Naší snahou proto bude učinit o těchto parametrech nějaký závěr na základě pozorovaných hodnot x 1, x 2,..., zpravidla pomocí statistického testování hypotéz. Pro úplnost ještě dodejme, že symbolem R budeme v textu označovat množinu všech reálných čísel, symbolem R množinu kladných reálných čísel. Pro označení konce (např. důkazu) budeme používat symbol. ARL versus chyby I. a II. druhu Jelikož jednotlivá pozorování přicházejí postupně v čase a nejsou tedy k dispozici všechna najednou, nabízí se použít pro statistickou analýzu sekvenční metody, zejména pak sekvenční testování hypotéz. Nejprve je však nutno nějakým způsobem definovat a případně vyvážit včasnost detekce nastalé změny a závažnost chybného zastavení procesu pod kontrolou (falešného poplachu), neboť shora uvedené cíle jsou evidentně naprosto protichůdné. Jednou z možností je využití střední doby trvání 1 (ARL). ARL se obvykle definuje jako střední hodnota času (počtu pozorování) potřebného k odhalení změny od jejího výskytu nebo jako střední doba mezi falešnými poplachy (MTBFR) 2. ARL je funkce, která závisí na velikosti, eventuálně na orientaci změny, a má obdobný význam jako silofunkce v klasické teorii testování hypotéz. Při tomto postupu zpravidla stanovíme požadovanou střední dobu mezi falešnými poplachy (tedy jak dlouho by měl vydržet bez zastavení běh procesu, v němž nedošlo ke změně), a základě této hodnoty potom určíme pravidla pro zastavení procesu. Druhé kritérium pro určení zastavovacího pravidla (pravidel) je bližší klasické problematice statistického testování hypotéz požadavek na MTBFR 1 Střední doba trvání je pravděpodobně korektní překlad anglického termínu Average Run Length, zkráceně ARL. Tato zkratka je však již natolik zakotvená v odborné literatuře, že považuji za vhodné používat ji namísto českého SDT i v tomto textu. 2 Opět se zde přikláním k používání zavedené anglické zkratky pro Mean Time Between False Reactions namísto českého SDMFP.

9 Úvod 4 je zde nahrazen požadavkem, aby k chybnému zastavení procesu, který je v pořádku, došlo s pravděpodobností (nejvýše) rovnou zvolené hladině α. Při volbě mezi dostupnými testy (procedurami) se stejnou MTBFR nebo hladinou významnosti α se poté zpravidla volí na základě střední doby zpoždění nebo obdobných charakteristik. V této práci budeme kritéria pro zastavení procesu určovat podle hladiny významnosti α a v následné simulační studii potom budeme zkoumat vhodnost použití jednotlivých procedur pomocí kritéria rychlosti (zpoždění) detekce změn. Zaměření této práce Stručný přehled postupů, které se v dnešní době běžně používají pro detekci změn ve střední hodnotě z jedné konstantní hladiny na jinou, je uveden v kapitole 1. Kromě toho je v praxi často potřeba detekovat za mnoha různých výchozích podmínek změny v situaci, kdy není určena žádná konkrétní hodnota, ale pouze rozmezí, v němž by se hodnoty sledovaných parametrů měly pohybovat. Chang a Fricker [Chang, Fricker 1999] se například zabývali situací, kdy sledovaná střední hodnota monotónně vzrůstá až do překročení stanovené hranice (bod změny), a s použitím isotonické regrese odvodili test poměrem věrohodností speciálně pro tento případ. Stručné shrnutí jejich výsledků obsahuje 2. kapitola této práce. Od kapitoly 3 dále se potom zaměříme na poněkud obecnější problém z hlediska formulace nulové a alternativní hypotézy: budeme předpokládat, že X 1,..., X n jsou nezávislé náhodné veličiny, E(X i ) = µ i a za platnosti H 0 je sledovaná střední hodnota pod určitou předem stanovenou hranicí pro všechna X i, zatímco za platnosti H 1 existuje takový čas (bod) m, že střední hodnoty všech veličin od tohoto bodu dále (X m1, X m2,...) danou mez překračují. Matematicky zapsáno předpokládáme situaci, kdy H 1 : µ i δ, i = 1... m, H 0 : µ i δ, i = 1... n µ i > δ, i = m 1... n a hodnotu δ známe. Odvodíme test poměrem věrohodností pro normálně rozdělená data a v následné simulační studii budeme zkoumat chování (především včasnost detekce změn) takto odvozené testové statistiky a jejích modifikací. Stručně pojednáme i o zobecnění celé situace vyjmutím předpokladu normálního rozdělení dat. Problém lze také jednoduchou úpravou převést na oboustranný, případně změnit směr sledovaného posunu dolů.

10 Kapitola 1 Standartní procedury SKJ Tato kapitola podává přehled nejpoužívanějších postupů pro detekci posunu ve střední hodnotě při tzv. on-line statistické kontrole jakosti. Všechny vztahy jsou uvedeny pro zachycení posunu směrem nahoru, tedy nová střední hodnota je větší než původní. Oboustranné a opačně orientované testy lze získat jednoduchou úpravou. Podrobnější odvození jednotlivých testových statistik a některé příklady lze nalézt například v textu [Antoch, Jarušková 2002]. V celé kapitole budeme předpokládat následující: X 1, X 2,... jsou nezávislé náhodné veličiny X 1, X 2,... F 0 (x) za platnosti H 0 X 1,..., X m F 0 (x) a X m1, X m2,... F 1 (x), F 0 ( ) F 1 ( ) za platnosti H 1. Teoreticky mohou být F 0 i F 1 libovolné distribuční funkce, tedy i distribuční funkce diskrétních rozdělení. Zde se však omezíme pouze na rozdělení absolutně spojitá. Označme tedy dále f 0 hustotu odpovídající distribuční funkci F 0 a podobně označme f 1 hustotu odpovídající distribuční funkci F 1. Zatímco skutečné rozdělení po změně (F 1 a f 1 ) zpravidla neznáme, distribuční funkci F 0 (hustotu f 0 ) předpokládáme známou. Poslední předpoklad je logický vzhledem k tomu, že toto rozdělení je rozdělením výchozím, které by v ideálním případě mělo zůstat zachováno stále. Ještě je nutno specifikovat pojmy čas, časový okamžik a podobně. V problematice SKJ se klasický čas velmi často zaměňuje s počtem pozorování, která uskutečníme před zastavením procesu. Tím je v podstatě umožněno používat stejné postupy pro celou škálu situací a procesů s různou rychlostí produkce. Hlavním cílem všech uvedených postupů je najít vhodný časový okamžik (počet pozorování), řekněme τ, kdy se proces zastaví. Ačkoli 5

11 1. Standartní procedury SKJ 6 by bylo ideální nechat proces, který je pod kontrolou, pokračovat bez zastavení, není to možné. Bylo dokázáno, že nutná podmínka k tomu, aby střední doba do odhalení změny byla konečná, je právě konečnost střední doby do zastavení procesu, který je v pořádku. Poznámka 1.1: Z důvodu redukce variability se níže popsané postupy někdy uplatňují místo původních veličin X 1, X 2,... na skupinové průměry typu k(l1) X i, případně i na průměry vypočtené z posloupností nestejných délek. 1 k i=kl1 1.1 Shewhartova procedura Pravidlo pro zastavení procesu: Proces se zastaví, pokud po n-tém kroku poprvé platí log f 1(X n ) f 0 (X n ) h 1 (1.1) pro nějaké h 1. Konstantu h 1 nelze samozřejmě volit zcela libovolně, naopak její hodnota závisí na požadované hladině testu nebo MTBFR. Obecně neznámou hustotu f 1 je nutno v alternativní hypotéze vhodně zvolit, například na základě předchozích zkušeností. Ze vzorce (1.1) plyne, že Shewhartova procedura nijak nevyužívá historii procesu, rozhodování je založeno pouze na poslední pozorované hodnotě. Důsledkem je značná nerobustnost tohoto postupu vůči odlehlým pozorováním, což lze částečně napravit použitím průměrovaných hodnot namísto původních měření (viz poznámka 1.1) Shewhartova procedura pro normální rozdělení Důležitým speciálním případem je situace, kdy jsou obě rozdělení (původní i po změně) normální se shodným rozptylem σ 2 a liší se pouze střední hodnoty µ 0 µ 1. V souladu s úvodem této kapitoly budeme předpokládat µ 0 < µ 1 a bez újmy na obecnosti můžeme položit µ 0 = 0. Dosazením do vztahu (1.1) a úpravou získáme následující podmínku pro zastavení procesu po n krocích: X n h 1σ 2 µ 1 µ 1 2 := b (1.2) Konstanta b je evidentně přímo úměrná původní konstantě h 1 a v praktických aplikacích se nejčastěji užívá b = 3σ. Tato hodnota je však odvozena pro pevně stanovenou hodnotu MTBFR (konkrétně MTBFR = 740 pozorování) a neměla by proto být zneužívána jako univerzální konstanta. Tabulky

12 1. Standartní procedury SKJ 7 a grafy ARL funkcí pro tento i pro oboustranný problém lze opět nalézt v [Antoch, Jarušková 2002]. Poznámka 1.2: Existuje několik modifikací původního Shewhartova postupu, nejpoužívanější z nich spočívá v zavedení tzv. varovné meze b 1 < b. Rozhodování o zastavení procesu po n-tém kroku je poté založeno na tom, zda X n < b 1 (proces se nezastaví), X n > b (proces se zastaví okamžitě), nebo b 1 X n b (proces se zastaví, je-li tato nerovnost splněna opakovaně). Přidáním dalších podmínek lze samozřejmě rozhodovací pravidla dále pozměňovat (a zpravidla komplikovat). 1.2 CUSUM procedura Pravidlo pro zastavení procesu: Proces se zastaví, pokud po n-tém kroku poprvé platí S n min S j h 2 (1.3) 0 j n pro nějaké vhodné h 2, kde S n = i=1 log f 1(X i ) f 0 (X i ), S 0 = 0. Název CUSUM vznikl zkrácením anglického termínu CUmulative SUMs (postupné součty) a celá procedura je založena na následující myšlence předpokládejme, že máme v daný okamžik k dispozici právě n pozorování x 1,..., x n, že známe čas m, m < n, kdy mělo dojít ke změně a navíc že známe i hustotu nového rozdělení f 1 ( ). V takovém případě má statistika testu poměrem věrohodností tvar S n S m 1 = i=m log f 1(X i ) f 0 (X i ). (1.4) Nulovou hypotézu tvrdící, že ke změně nedošlo, zamítneme při velké hodnotě statistiky (1.4). Jelikož okamžik m předem neznáme, je nutno (1.4) poopravit a počítat s nejnepříznivější možnou variantou, tedy s největší možnou hodnotou statistiky (1.4): max (S n S j ), což je ekvivalentní se vzorcem v (1.3). 0 j n Rovněž je nutno v alternativní hypotéze specifikovat neznámou hustotu f 1. Poznámka 1.3: Zatímco Shewhartova procedura je v každém okamžiku založena pouze na poslední pozorované hodnotě, procedura CUSUM využívá všech dostupných měření. Přímým důsledkem této skutečnosti je jednak její větší robustnost k odlehlým pozorováním a jednak i schopnost daleko dříve

13 1. Standartní procedury SKJ 8 detekovat kumulované, pozvolné změny (posuny). Naopak, jednorázová skoková změna může být vyvážena předchozími pozorováními a odhalena později než při použití Shewhartova testu CUSUM procedura pro normální rozdělení Pro stejnou speciální situaci jako v případě Shewhartovy procedury, kdy jsou obě rozdělení (původní i po změně) normální se shodným rozptylem σ 2 a liší se pouze střední hodnoty 0 = µ 0 < µ 1, získáme a tedy S n = ( i=1 X i µ 1 2 max (S µ 1 n S j ) = max 0 j n 0 j n σ 2 ) µ1 σ 2 (1.5) ( X i µ ) 1 i=j1 2 (1.6) Proces se zastaví, pokud je hodnota výrazu (1.6), nebo ekvivalentně hodnota výrazu ( max X i µ ) 1 (1.7) 0 j n 2 i=j1 větší než vhodná konstanta, řekněme h. V [Antoch, Jarušková 2002] je mimo jiné uvedena zajímavá geometrická interpretace problému, tabulky hodnot ARL funkce a metodika (integrální rovnice) pro jejich výpočet. Tentýž text obsahuje zobecnění výpočtů provedených pro normální rozdělení na rozdělení exponenciálního typu (Koopmanovy Darmoisovy rodiny) a Lordenovu modifikaci procedury CUSUM. 1.3 EWMA procedura Pravidlo pro zastavení procesu: Proces se zastaví, pokud po n-tém kroku poprvé platí X EW MA (n) h 3 (1.8) pro nějaké vhodné h 3, kde X EW MA (n) = (1 λ) X EW MA (n 1) λx n, 0 < λ < 1. Ze vztahu (1.8) je patrné, že procedura EWMA (zkratka z anglického Exponentially Weighted Moving Average klouzavé průměry s exponenciálními

14 1. Standartní procedury SKJ 9 vahami) závisí na parametru λ. Pro λ = 1 bychom zřejmě získali Shewhartovu proceduru, naopak pro malé hodnoty λ se EWMA statistika (1.8) podobá statistice CUSUM (1.3). EWMA procedura tedy v závislosti na volbě λ může být citlivější ke skokovým i postupným změnám. Z tohoto důvodu se její použití doporučuje zejména v situacích, kdy nemáme žádnou informaci o velikosti a typu možné změny a neumíme tedy rozhodnout mezi Shewhartovým a CUSUM testem.

15 Kapitola 2 Monotónně vzrůstající střední hodnota Cílem této práce je, jak již je zmíněno v Úvodu, sestavit statistický test pro detekci změny v úrovni střední hodnoty sledovaných náhodných veličin za poměrně obecných podmínek. Standartní procedury shrnuté v kapitole 1 byly původně navrženy pro odhalení jednorázových skokových změn z µ 0 na µ 1 nebo změn, které mají charakter lineárního trendu. Tato kapitola je věnována situaci, kdy střední hodnoty sledovaných náhodných veličin monotónně vzrůstají a v určitém okamžiku překročí stanovenou hranici, řekněme δ. To je poměrně zásadní odlišnost od klasických podob formulace problému, neboť tam jde zpravidla o rozpoznání stavu, kdy se sledovaná střední hodnota µ odchýlí od dané cílové hodnoty µ 0. Hranici δ je tedy nutno chápat jako maximální tolerovatelnou mez, jejíž překročení nechceme dovolit. Naopak pojem cílová hodnota zde ztrácí smysl, jelikož všechny hodnoty µ δ jsou v pořádku (přijatelné). Pro jednoduchost se omezíme pouze na pozorování pocházející z normálního rozdělení se známým rozptylem: budeme předpokládat, že X 1, X 2,..., X n je posloupnost nezávislých náhodných veličin s normálním rozdělením s rozptylem σ 2 = 1 (bez újmy na obecnosti), E(X i ) = µ i a pro střední hodnoty platí µ 1 µ 2... µ n, jinými slovy střední hodnoty tvoří monotónní neklesající posloupnost. Nulovou a alternativní hypotézu potom zformulujeme H 0 : µ 1 µ 2... µ n δ (2.1) H 1 : m {1,..., n 1} takové, že µ 1 µ 2... µ m δ µ m1... µ n. Proces chceme samozřejmě zastavit co nejdříve po překročení hranice δ, a naopak jej chceme nechat běžet co nejdéle, v ideálním případě stále, pokud k překročení hraniční hodnoty δ nedojde. 10

16 2. Monotónně vzrůstající střední hodnota 11 Test poměrem věrohodností (viz například [Dupač, Hušková 2001], kapitola 6) má tvar max {log f(x µ)} max{log f(x µ)} = µ H 0 H A µ H 0 { } 1 = min (X i µ i ) 2 min µ 1... µ n δ 2 i=1 µ 1... µ n { 1 2 } (X i µ i ) 2. (2.2) i=1 Minimalizační problém v (2.2), tedy nalezení maximálně věrohodných odhadů středních hodnot µ i, je v literatuře znám pod názvem isotonická regrese (viz například [Robertson a kol. 1988], kapitola 1). Jelikož je zapotřebí minimalizovat jeden výraz dvakrát za různých podmínek, zahrnuje výpočet hodnoty testové statistiky (2.2) vlastně počítání dvou isotonických regresí: Z 1,..., Z n pro růst omezený hodnotou δ a Y 1,..., Y n pro hodnoty rostoucí bez omezení. Při znalosti Z n 1 a Y n 1 určených z pozorování x 1,..., x n 1 lze výpočet Z n a Y n provést podle následujícího algoritmu s použitím nového pozorování x n (PAVA algoritmus): 1. Položme A n = x n a k = Dokud platí Y n k > A n k1 : Položme A n k = 1 k1 (ka n k1 Y n k ) a Položme k = k Položme Y n = Y n 1 =... = Y n k1 = A n k1. 4. Položme Z i = min(y i, δ) pro všechna i = 1,..., n. Testová statistika (2.2) je potom pro n = 1... N (viz dále) ekvivalentní výrazu M n = = (X i Z i ) 2 (X i Y i ) 2 i=1 i=1 0 pro Y n δ (X i δ) 2 n (X i Y i ) 2 pro Y n > δ, i=j i=j (2.3) kde J = min{i : Y i > δ}. Nulovou hypotézu zamítneme, jakmile M n > h pro nějaké vhodné h a pro první takové n proceduru zastavíme. Proceduru lze také použít na části původních dat za pomoci okénka dané šířky, které se po datech posouvá. V textu [Chang, Fricker 1999] jsou hodnoty h určeny

17 2. Monotónně vzrůstající střední hodnota 12 pomocí simulací, nejsou však nikde tabelovány. Navíc byly pro stejnou posloupnost statistik {M n } N n=1 simulovány různé kritické hodnoty pro různé chování posloupnosti středních hodnot µ 1, µ 2,..., µ n, což je poměrně neobvyklý postup. Pro účely porovnání detekčních schopností statistiky M n se statistikami sestavenými v kapitole 3 byly kritické hodnoty určeny pomocí simulací jako empirické kvantily rozdělení veličiny max M n, kde N představuje nejvyšší možný počet pozorování během nějakého časového intervalu 1, a 1 n N hodnoty x i potřebné k výpočtu M n byly simulovány z normálního rozdělení N(δ, 1). Kvůli časové náročnosti výpočtu bylo nutno omezit počet opakování simulace na a hodnotu N na N = 100. Výsledné simulované kritické hodnoty jsou pro vybraná α uvedeny v tabulce 2.1. Tabulka 2.1: Simulované kritické hodnoty pro posloupnost statistik {M n } N n=1, zaokrouhlené na tři desetinná místa. α N 0,10 0,05 0, ,862 8,209 12, ,387 16,147 20,260 V další části práce zobecníme právě popsanou situaci vyjmutím předpokladu monotónnosti. Pomocí simulací pak porovnáme rychlost detekce překročení hraniční hodnoty pro různá výchozí nastavení jak při testování statistikou M n (2.3), tak i při použití statistik odvozených pro obecný případ v kapitole 3. 1 Komplexnější a podrobnější pojednání o určování a simulacích kritických hodnot je obsaženo v části 3.2.

18 Kapitola 3 Střední hodnota omezená stanovenou hranicí V této kapitole se z hlediska formulace a testování statistických hypotéz podrobněji zaměříme na obecnější problém nastíněný v úvodu práce. Nulové hypotéze H 0 bude odpovídat situace, kdy je střední hodnota každé z náhodných veličin X i, i = 1,..., n pod stanovenou hranicí δ. Za platnosti alternativní hypotézy H 1 potom existuje bod (okamžik) m, v němž sledovaná střední hodnota hranici δ překročí a setrvá nad ní až do zastavení procesu. Formálně zapsáno H 0 : E(X i ) = µ i δ i = 1,..., n (3.1) H 1 : m {1,..., n 1} takové, že E(X i ) = µ i δ pro i = 1,..., m E(X i ) = µ i > δ pro i = m 1,..., n. Rozhodování založíme na testu poměrem věrohodností. Testovou statistiku, označme ji například Q n, odvodíme pro normálně rozdělená data a budeme zkoumat její vlastnosti. 3.1 Odvození testové statistiky pro normální rozdělení při známém rozptylu σ 2 Předpokládáme, že X 1,..., X n jsou nezávislé náhodné veličiny s normálním rozdělením s obecně různými středními hodnotami, ale se stejným a známým rozptylem σ 2 : X i N(µ i, σ 2 ). Předpoklad známého rozptylu lze odůvodnit například zkušenostmi z podobných výrobních procesů nebo z minulosti. 13

19 3. Střední hodnota omezená stanovenou hranicí 14 V závěru této kapitoly rozebereme také složitější situaci, kdy rozptyl σ 2 neznáme a musíme jej odhadnout z naměřených hodnot. Rozdělení každé z veličin X i tedy lze popsat hustotou f(x i, µ i ) = 1 2πσ exp { (x i µ i ) 2 2σ 2 }, < x i <. (3.2) Podle hodnoty parametru µ i budeme v dalším textu podle potřeby přidávat index j, j = 0, 1. Hustota f 0 (x i, µ i ) potom bude znamenat hustotu X i za platnosti nulové hypotézy pro i-té pozorování, tj. µ i δ, a podobně f 1 (x i, µ i ) bude značit hustotu X i pokud µ i > δ. Pro větší přehlednost zápisu definujme dále k prvkům vektoru µ A m,n = = (µ 1,..., µ n ) množinu A m,n takto: { } µ µ 1,..., µ m δ µ m1,..., µ n > δ. (3.3) A m,n je tedy množina všech vektorů µ, které ve formulaci (3.1) splňují alternativní hypotézu H 1, pokud m < n. Pro m = n ovšem A n,n označuje naopak všechny vektory µ splňující v (3.1) nulovou hypotézu H 0. Předpokládejme na okamžik, že známe bod změny m a buď m = k. V tom případě by testová statistika testu poměrem věrohodností měla (logaritmický) tvar [ n ] [ ] k n sup f 1 (x i, µ i ) sup f 0 (x i, µ i ) f 1 (x i, µ i ) µ A k,n i=1 µ A k,n i=1 i=k1 Λ k = log [ n ] = log [ n ] sup f 0 (x i, µ i ) sup f 0 (x i, µ i ) µ A n,n i=1 µ A n,n i=1 [ ] n sup exp( (x i µ i ) 2 ) 2σ µ = log i > δ i=k1 2 ] = sup sup µ i δ [ n µ i > δ i=k1 exp( (x i µ i ) 2 ) 2σ i=k1 2 ( (x i µ i ) 2 ) sup 2σ 2 µ i δ i=k1 ( (x i µ i ) 2 2σ 2 ). (3.4) Suprema nabývají oba výrazy ve vztahu (3.4) tehdy a jen tehdy, pokud skutečné hodnoty parametrů µ i nahradíme jejich odhady získanými metodou maximální věrohodnosti. Vzhledem k tomu, že máme jediné pozorování pro každou z náhodných veličin X i, má věrohodnostní funkce pro odhad i-té střední hodnoty µ i tvar L(µ i, x i ) = 1 2πσ exp { (x i µ i ) 2 2σ 2 }, (3.5)

20 3. Střední hodnota omezená stanovenou hranicí 15 případně po zlogaritmování l(µ i, x i ) = log L(µ i, x i ) = log ( ) 1 (x i µ i ) 2. (3.6) 2πσ 2σ 2 Výraz (3.6) je nutno maximalizovat vzhledem k neznámé střední hodnotě µ i, ovšem s omezeními vyplývajícími z obou hypotéz. Za platnosti H 0 tak hledáme [ a za platnosti H 1 arg max µ i δ arg max µ i >δ [ log log ( ) 1 (x i µ i ) 2 ] 2πσ 2σ 2 (3.7) ( ) 1 (x i µ i ) 2 ]. (3.8) 2πσ 2σ 2 Standartním výpočtem s použitím grafu funkce g(µ i ) = (x i µ i ) 2 potom získáme následující podmíněné maximálně věrohodné odhady: { δ pro xi δ > 0 µ i µi δ = x i pro x i δ 0, { xi pro x µ i µi >δ = i δ > 0 δ pro x i δ 0, neboli µ i µi δ = min(x i, δ), (3.9) µ i µi >δ = max(x i, δ). (3.10) Právě vypočtené maximálně věrohodné odhady můžeme nyní použít místo neznámých parametrů µ i v testové statistice (3.4). Dosazením výsledků (3.9) a (3.10) do (3.4) získáme Λ k = = = sup µ i > δ i=k1 i=k1 i=k1 ( (x i µ i ) 2 2σ 2 ) sup µ i δ i=k1 ( (x i µ i ) 2 2σ 2 (x i max(x i, δ)) 2 (x i min(x i, δ)) 2 2σ 2 2σ 2 (x i δ) 2 ) 2σ 2 sign(x i δ). (3.11) Statistiku (3.11) jsme odvodili za předpokladu m = k, tj. pro známý čas změny m, tedy vlastně pro obyčejný dvouvýběrový problém. Pokud m neznáme, musíme jej zahrnout do výpočtu jako další neznámý parametr a počítat v (3.4) navíc ještě supremum přes m. V podstatě se jedná o to, že statistiku (3.11) je nutno modifikovat tak, abychom nulovou hypotézu zamítli,

21 3. Střední hodnota omezená stanovenou hranicí 16 pokud by ji zamítla jakákoli ze statistik Λ m, m < n. Výpočtem dostáváme [ ] m max sup n f 0 (x i, µ i ) f 1 (x i, µ i ) Λ 0 m<n µ A m,n i=1 i=m1 m,n = log [ n ] sup f 0 (x i, µ i ) µ A n,n i=1 (x i δ) 2 = max sign(x 0 m<n 2σ 2 i δ). (3.12) i=m1 Definujeme tedy pro n = 1... N Q n := max Λ 1 m = max 0 m<n 0 m<n 2σ 2 i=m1 (X i δ) 2 sign(x i δ). (3.13) Hodnota N udává maximální možný počet pozorovaní v daném časovém intervalu, typicky volíme jako časový interval jeden výrobní cyklus (den, pracovní týden a podobně). N potom zpravidla představuje předpokládaný počet kusů vyrobených během jednoho cyklu. Ještě jednou zopakujme, že statistika (3.13) byla odvozena pro normální rozdělení náhodných veličin X i a za předpokladu známé hodnoty rozptylu σ 2. Zobecnění problému pro neznámý rozptyl a/nebo pro náhodné veličiny s jiným než normálním rozdělením je obsahem závěru této kapitoly, konkrétně části 3.6. Test poměrem věrohodností v podobě, v jaké byl definován v (3.4), bude zamítat nulovou hypotézu ve prospěch alternativy, bude li testová statistika Q n dostatečně velká, tj. Q n > c pro nějakou vhodnou konstantu (kritickou hodnotu) c. Volba kritických hodnot je v tomto případě poměrně netriviální problém, kterému se budeme věnovat v části 3.2. Již nyní ale zavedeme dvě standardizované verze statistiky (3.13), které mohou být určitým způsobem přínosné. Definujme pro n = 1... N Q nn := 1 Q n = 1 1 max N N 0 m<n 2σ 2 Q nn := 1 Q n = 1 1 max n n 0 m<n 2σ 2 i=m1 i=m1 (X i δ) 2 sign(x i δ),(3.14) (X i δ) 2 sign(x i δ). (3.15) Kritické hodnoty pro posloupnost testových statistik (3.13) závisí na hodnotě N, viz část 3.2. Jedním ze smyslů standardizace (3.14) je tuto závislost odstranit, standardizace (3.15) by mohla urychlit detekci brzkých změn. Kritický obor statistik (3.15) totiž odpovídá kritickému oboru statistik (3.14) zakřivenému podle funkce n. Obě standardizace potom podle věty A.3 umožňují aproximaci součtu Wienerovým procesem, což lze využít například při simulaci kritických hodnot.

22 3. Střední hodnota omezená stanovenou hranicí Kritické hodnoty pro statistiky {Q n } N n=1 Testová statistika Q n (3.13), založená na n pozorováních, zamítne nulovou hypotézu v případě, že její hodnota bude větší než jisté číslo c. Pokud ovšem Q n c pro dané n, procedura pokračuje a testujeme znovu s použitím statistiky Q n1 až do dosažení předem stanoveného maximálního počtu pozorování N v daném časovém intervalu. Pokud i Q N c, ukončíme proceduru s konstatováním, že pozorované hodnoty nejsou v rozporu s tvrzením H 0. Pro pravděpodobnost chyby I. druhu požadujeme, aby pravděpodobnost P (zamítneme H 0 H 0 platí) byla nejvýše rovna zvolené hodnotě α, přičemž H 0 můžeme zamítnout pro jakoukoli ze statistik Q n, n = 1... N. První možnost určení kritických hodnot vychází ze vztahu ( N ) P H0 {Q n > c N, α } α, (3.16) n=1 který je však pro praktické použití kvůli své složitosti nevhodný. Jistou aproximaci ( poskytují ) kritické hodnoty získané použitím Bonferroniho nerovnosti N P A n N P (A n ), zde pro {A n } = {Q n > c N, α }, tato aproximace je n=1 n=1 ovšem zpravidla velmi hrubá a kritické hodnoty značně konzervativní. Výpočet kritických hodnot proto založíme na vztahu ( ) P H0 max Q n c N, α = 1 α. (3.17) 1 n N Pro jednoznačnost zápisu budeme do indexu přidávat faktory, na nichž číslo c závisí. Kritickou hodnotu pro test na hladině významnosti α založený na nejvýše N pozorováních tedy označíme c N, α. Poznámka 3.1: Z výše uvedených úvah je zřejmé, že číslo N musí být konečné, aby bylo vůbec možno kritické hodnoty stanovit. K výpočtu přesných kritických hodnot bychom potřebovali znát pravděpodobnostní rozdělení statistiky max Q n za platnosti nulové hypotézy; 1 n N zde však narazíme hned na několik problémů. Především je nutno si uvědomit, že nulová hypotéza je v tomto případě složená, a rozhodnout, pro jakou konfiguraci budeme kritické hodnoty požadovat. Standartní postup spočívá ve výpočtu kritických hodnot pro nejnepříznivější možnou situaci, která ještě neodporuje tvrzení nulové hypotézy. Zde to odpovídá situaci, kdy jsou všechny střední hodnoty µ i rovny prahové hranici δ. Teoreticky lze sice určit rozdělení členů Z i = 1 2σ 2 (X i δ) 2 sign(x i δ) (podle tvrzení (3.2), viz část 3.3) a dalším výpočtem by bylo možné určit i rozdělení jejich součtu,

23 3. Střední hodnota omezená stanovenou hranicí 18 rozdělení maxima maxima takových součtů však již je neúměrně komplikované, nebo dokonce nespočítatelné. V současné době není známo ani žádné asymptotické rozdělení statistik tohoto typu. Kritické hodnoty proto určíme pomocí simulací Simulované kritické hodnoty K získání kritických hodnot generujme N-tici x 1,..., x N jako realizaci náhodného výběru o rozsahu N z rozdělení N(δ, σ 2 ) a spočítejme hodnotu max Q n pro n = 1,..., N. První simulovaná hodnota x 1 přitom bude použita celkem N krát k výpočtu Q 1,..., Q N, zatímco poslední x N pouze jednou k výpočtu Q N. Tímto způsobem se zároveň simuluje sekvenční povaha testu v každém kroku se k dosavadním pozorováním pouze přidá jedno nové. Bez újmy na obecnosti lze zvolit hodnoty δ = 0 a σ 2 = 1. Celý postup se několikrát opakuje. Kritické hodnoty c sim N, α po vícenásobném opakování simulace určíme jako kvantily empirického rozdělení statistiky max Q n. Zde bylo použito n N opakování a kritické hodnoty pro test na hladinách α = 0,10, 0,05 a 0,01 tedy opovídají pořadovým statistikám (max Q n) (z) pro z = 9 000, a n N Nulovou hypotézu potom zamítneme, jakmile Q n > c sim N, α pro nějaké n N. Uvedený postup použijeme i pro posloupnosti standardizovaných statistik {Q nn } N n=1 a {Q nn } N n=1. Pro ty lze navíc (po znormování) použít i aproximaci založenou na větě A.3. V tom případě se sčítance Z i nahradí hodnotami X i generovanými z rozdělení N(0, 1). Simulované kritické hodnoty c sim N, α pro statistiky {Q n } N n=1 (3.13), zaokrouhlené na 3 desetinná místa, jsou pro vybraná α a N 1 uvedeny v tabulce 3.1. V tabulce 3.2 vlevo jsou uvedeny simulované kritické hodnoty c sim N,N, α pro standardizované statistiky {Q nn } N n=1 (3.14) a tyto simulované kritické hodnoty potvrzují jisté vyloučení vlivu hodnoty N. Vpravo jsou pak simulované kritické hodnoty c sim N,n, α pro standardizované statistiky {Q nn } N n=1 (3.15). K výpočtu byl použit program R, verze pro Windows. Zdrojové kódy všech použitých programů jsou připojeny v příloze B. 1 Omezení do N = 1000 je vynuceno časovou náročností výpočtů. Protože ale N představuje teoretický maximální počet pozorování v určitém časovém intervalu, lze v případě potřeby použít hodnoty vypočtené pro N = 1000 a upravit (zkrátit) tento časový interval.

24 3. Střední hodnota omezená stanovenou hranicí 19 Tabulka 3.1: Simulované kritické hodnoty c sim N, α pro posloupnost testových statistik {Q n } N n=1. α N ,01 7,387 23,241 75,612 0,05 5,254 17,995 59,724 0,10 4,225 15,666 51,722 Tabulka 3.2: Simulované kritické hodnoty c sim N,N, α pro standardizovanou verzi {Q nn } N n=1 (vlevo) a c sim N,n, α pro standardizovanou verzi {Q nn } N n=1 (vpravo). α N ,01 2,336 2,324 2,391 0,05 1,661 1,800 1,889 0,10 1,340 1,567 1,636 α N ,01 3,260 3,416 3,544 0,05 2,221 2,560 2,715 0,10 1,776 2,202 2, Vlastnosti statistiky Q n V této části shrneme některé další vlastnosti statistiky Q n (3.13). Tvrzení 3.1: Po přidání dalšího pozorování X n1 pro statistiku (3.13) platí rekurentní vztah Q n1 = max{q n, 0} 1 2σ 2 (X n1 δ) 2 sign(x n1 δ). (3.18) Důkaz: Důkaz provedeme přímým výpočtem. Platí Q n1 = max 0 m<n1 1 2σ 2 = max 1 m<n1 2σ 2 = max 1 m<n1 2σ 2 n1 i=m1 i=m1 (X i δ) 2 sign(x i δ) (X i δ) 2 sign(x i δ) (X n1 δ) 2 sign(x n1 δ) 2σ 2 (X i δ) 2 sign(x i δ) (X n1 δ) 2 sign(x n1 δ), 2σ 2 i=m1 (3.19)

25 3. Střední hodnota omezená stanovenou hranicí 20 neboť poslední člen nezávisí na parametru m. Dále je max 1 (X m<n1 2σ 2 i δ) 2 sign(x i δ) = i=m1 = max max 1 (X m<n 2σ 2 i δ) 2 1 sign(x i δ), (X i=m1 2σ 2 i δ) 2 sign(x i δ) i=n1 = max (Q n, 0). Dosazením do (3.19) získáme požadovaný vztah (3.18). Ze vzorce (3.13) vyplývá, že statistika Q n je funkcí součtů nezávislých náhodných veličin. Vskutku, náhodné veličiny X i jsou navzájem nezávislé a tudíž i jejich měřitelné funkce (X i δ) 2 sign(x i δ) jsou navzájem nezávislé náhodné veličiny (viz [Anděl 1985], strana 29) a známe dokonce i jejich rozdělení. Tvrzení 3.2: Nechť náhodná veličina X má spojité rozdělení s hustotou f(x) pro všechna x R. Pak náhodná veličina T = (X δ) 2 sign(x δ), kde δ je známá konstanta, má rozdělení s hustotou g(t) = f(δ sign(t) t ), t R. (3.20) 2 t Důkaz: Důkaz tvrzení je přímou aplikací věty o transformaci náhodných veličin ([Anděl 1985], věta 5, str. 47). Tvrzení 3.2 nám teoreticky dává nástroj ke zkoumání vlastností náhodných veličin, které tvoří sčítance v (3.13), pro libovolné výchozí rozdělení X i. Pro praktické počítání se však v kombinaci s hustotami f( ) většiny známých rozdělení příliš nehodí. Například jen počítání momentů by zde byla velmi obtížná integrace a právě střední hodnota jednotlivých sčítanců nám může poskytnout intuitivní představu o vhodnosti statistiky Q n pro testování (3.1). Tvrzení 3.3: Nechť X N(µ, σ 2 ). Pak platí E[(X δ) 2 sign(x δ)] = ( ( ( )) (δ µ) 2 σ 2) δ µ 1 2Φ σ { } (δ µ)σ (δ µ)2 2 exp, (3.21) 2π 2σ 2 kde Φ(z) značí distribuční funkci standartního normálního rozdělení a δ je stanovená hraniční hodnota.

26 3. Střední hodnota omezená stanovenou hranicí 21 Důkaz: Důkaz provedeme přímým výpočtem. Platí E[(X δ) 2 sign(x δ)] = = = = δ µ δ µ { } (x δ) 2 1 (x µ)2 sign(x δ) exp dx 2πσ 2σ 2 { } (x (δ µ)) 2 1 sign(x (δ µ)) exp x2 dx 2πσ 2σ 2 (x (δ µ)) 2 1 2πσ exp { } x2 2σ 2 dx { } (x (δ µ)) 2 1 exp x2 dx. (3.22) 2πσ 2σ 2 Rozepsáním členu (x (δ µ)) 2 a integrací metodou per partes získáme v první části vzorce (3.22) δ µ δ µ δ µ x 2 1 2πσ exp = 2(δ µ) 2πσ { (δ µ)σ 2π { x exp } x2 2σ 2 2(δ µ)σ = exp 2π { } (δ µ)2 2πσ exp dx = { } ( ) (δ µ)2 δ µ exp σ 2 Φ, (3.23) 2σ 2 σ } x2 dx = 2σ 2 x2 2σ 2 { } (δ µ)2, 2σ 2 (3.24) ( ) δ µ dx = (δ µ) 2 Φ. σ (3.25) Podobně rozepsáním druhého integrálu v (3.22) dostaneme δ µ { } x 2 1 exp x2 dx = 2πσ 2σ 2 = (δ µ)σ 2π exp { } ( (δ µ)2 σ 2 1 Φ 2σ 2 ( )) δ µ, (3.26) σ

27 3. Střední hodnota omezená stanovenou hranicí 22 { } 2(δ µ) x exp x2 dx = 2πσ 2σ 2 δ µ { } 2(δ µ)σ (δ µ)2 = exp, (3.27) 2π 2σ 2 a konečně δ µ (δ µ) 2 2πσ exp { } x2 2σ 2 ( )) δ µ dx = (δ µ) (1 2 Φ. (3.28) σ Sečtením výsledků dílčích integrálů (3.23) až (3.28) získáme požadovaný vztah (3.21). Podívejme se nyní poněkud intuitivně na chování právě vypočtené střední hodnoty jednotlivých sčítanců při různých vztazích mezi hranicí δ a střední hodnotou µ (pro přehlednost značení je vynechán index i). Pro přibližnou rovnost µ δ je 2 (δ µ)σ 2π exp { } (δ µ)2 2σ 0 a zároveň 2 Φ ( ) δ µ σ 1/2. Celkem tedy E[(X δ) 2 sign(x δ)] 0. Při výrazné nerovnosti µ << δ vychází 2 (δ µ)σ 2π exp { } (δ µ)2 2σ 0 a 2 Φ ( ) δ µ σ 1. Celkem tedy E[(X δ) 2 sign(x δ)] k, k R dostatečně velké. Při výrazné nerovnosti µ >> δ je opět 2 (δ µ)σ 2π exp { } (δ µ)2 2σ 0 a 2 Φ ( ) δ µ σ 0. Celkem E[(X δ) 2 sign(x δ)] k, k R dostatečně velké. Výsledky jsou ve shodě s logickým očekáváním test zamítne nulovou hypotézu pokud Q n > c, čehož lze nejsnáze (podle střední hodnoty) dosáhnout pro µ >> δ. Naopak takovou situaci nelze příliš očekávat, pokud µ << δ. Poznámka 3.2: Obecněji lze právě popsanou vlastnost nahlédnout takto: Označíme li Z i (δ) = (X i δ) 2 sign(x 2σ 2 i δ), pak E(Z i (δ)) je neklesající funkce střední hodnoty E(X i ), jelikož funkce g(t) = t 2 sign(t) je lichá a rostoucí v t (viz [Hušková a kol. 2003]). Poznámka 3.3: Statistika definovaná v (3.13) je v podstatě zobecněná statistika typu CUSUM (viz část 1.2). Pokud bychom použili vždy jen poslední pozorování X n, získali bychom věrohodnostním poměrem testovou statistiku Z n jako analogii klasického Shewhartova testu (část 1.1).

28 3. Střední hodnota omezená stanovenou hranicí 23 Poznámka 3.4: Statistika (3.13) byla odvozena za předpokladu normálního rozdělení. Pro data s jiným rozdělením lze příslušný test odvodit stejnou metodou nebo použít vhodné zobecnění statistiky (3.13). Definujme Z i (δ, ρ) = ρ(x i δ) sign(x i δ), (3.29) kde ρ( ) je nezáporná, symetrická, ryze konvexní funkce a ρ(0) = 0. Zobecněná statistika Q n,ρ potom bude mít tvar Q n,ρ = max 0 m<n i=m1 Z i (δ, ρ). (3.30) Speciální volbou ρ(t) = t 2 získáme potom přímo statistiku (3.13), volba ρ(t) = t by například odpovídala testu poměrem věrohodností pro data s Laplaceovým rozdělením. 3.4 Modifikace Q n V některých případech, zejména pokud byly hodnoty µ i výrazně (nebo velmi dlouho) menší než hraniční úroveň δ, se může stát, že statistika Q n nebude na případné překročení mezní hranice reagovat dostatečně pružně. Proto byly navrženy její modifikace, které využívají pouze několik posledních pozorování. Definujeme pro n = 1... N Q n,g := 1 G Q simp n,g := 1 G 1 2σ 2 max n G m<n 1 2σ 2 i=n G1 i=m1 (X i δ) 2 sign(x i δ), (3.31) (X i δ) 2 sign(x i δ). (3.32) Statistika (3.32) je vlastně jakousi zjednodušenou verzí (3.31). Okénko G je potřeba v obou případech volit velmi opatrně, typicky se používá malý zlomek maximálního počtu pozorování N v rozmezí G = 0,01N až G = 0,2N. Konkrétní hodnota zpravidla závisí na očekávaném chování procesu do času změny. Poznámka 3.5: Faktor 1 G slouží ke standardizaci, která je nutná k existenci limitního rozdělení (za dosti obecných předpokladů). Možnost použít asymptotické výsledky, především pak asymptotické kritické hodnoty, je ostatně dalším důvodem pro zavedení modifikace (3.32).

29 3. Střední hodnota omezená stanovenou hranicí Kritické hodnoty pro statistiky {Q n,g } N n=1 Pro posloupnost statistik {Q n,g } N n=1 definovanou v (3.31) platí naprosto stejné úvahy jako v předchozí části pro statistiky {Q n } N n=1. Pokud je Q n,g menší než příslušná kritická hodnota c, pokračujeme v testování se statistikou Q n1,g až dokud nedosáhneme maximálního počtu N pozorování v daném časovém intervalu. I zde se tedy jedná o sekvenční postup s nejvýše N pozorováními a ze stejných důvodů jako výše i zde založíme určení kritických hodnot c N,G, α na vztahu ( ) P H0 max Q n,g c N,G, α = 1 α. (3.33) 1 n N Oproti předchozí části je tu však podstatný rozdíl; díky větě A.1 a důsledku A.2 známe limitní rozdělení statistiky max Q n,g a kromě simulací 1 n N tak můžeme použít asymptotické kritické hodnoty. Tabulka 3.3 obsahuje kritické hodnoty c sim N,G, α určené pomocí simulací, hodnota G byla pro simulace volena postupně G = 0,2N, G = 0,15N, G = 0,1N a G = 0,05N, maximální počet N potom 10, 100 a 1000 pozorování. 2 Tabulka 3.4 potom obsahuje vybrané asymptotické kritické hodnoty. 3 Způsob provedení simulací byl stejný jako u statistiky Q n v části 3.2.1, opět s použitím opakování. Tabulka 3.3: Simulované kritické hodnoty c sim N,G, α pro statistiky {Q n,g } N n=1. α G = 0,2N, N: ,01 3,853 3,274 3,090 0,05 2,731 2,642 2,663 0,10 2,181 2,351 2,433 α G = 0,1N, N: ,01 4,839 3,672 3,360 0,05 3,281 2,988 2,900 0,10 2,688 2,680 2,667 α G = 0,15N, N: ,01-3,422 3,270 0,05-2,769 2,786 0,10-2,473 2,552 α G = 0,05N, N: ,01-4,320 3,623 0,05-3,456 3,115 0,10-3,055 2,882 2 Opět z důvodu velké časové náročnosti výpočtu, také zde lze v případě potřeby upravit (zkrátit) daný časový interval a použít hodnoty vypočtené pro N = Členy Z i ve statistice Q n,g nemají jednotkový rozptyl, a proto nelze přímo aplikovat větu A.1. Statistiku Q n,g by bylo třeba přenásobit normující konstantou 2 3. Pro možnost porovnání se simulovanými hodnotami však byl ponechán původní tvar (3.31) a naopak kritické hodnoty jsou upraveny přenásobeny konstantou 3 2. Pro N = 10 by zde okénko vyšlo 1,5, resp. 0,5 pozorování. Tuto kombinaci tedy nelze použít.

30 3. Střední hodnota omezená stanovenou hranicí 25 Tabulka 3.4: Asymptotické kritické hodnoty c as N,G, α pro statistiky {Q n,g } N n=1. α G 0,01N 0,05N 0,1N 0,15N 0,2N 0,01 3,996 3,739 3,652 3,620 3,613 0,05 3,530 3,162 2,994 2,895 2,826 0,10 3,325 2,908 2,704 2,575 2, Kritické hodnoty pro statistiky {Q simp n,g } N n=1 Testová statistika Q simp n,g (3.32) je z výpočetního hlediska jednodušší než původní modifikace Q n,g (3.31) a zároveň je založena na stejné myšlence jako (3.31). V kapitole 4 proto mimo jiné pomocí simulací zjistíme, zda má také podobné detekční vlastnosti. Simulované kritické hodnoty c sim N,G, α pro posloupnost statistik {Q simp n,g } N n=1, získané stejnou metodou jako v případě posloupností {Q n } N n=1 a {Q n,g } N n=1, jsou uvedeny v tabulce 3.5. Tabulka 3.5: Simulované kritické hodnoty c sim N,G, α pro statistiky {Q simp n,g } N n=1. α G = 0,2N, N: ,01 3,853 3,226 3,038 0,05 2,712 2,593 2,585 0,10 2,160 2,290 2,346 α G = 0,1N, N: ,01 4,839 3,642 3,299 0,05 3,281 2,952 2,838 0,10 2,688 2,633 2,602 α G = 0,15N, N: ,01-3,384 3,210 0,05-2,709 2,727 0,10-2,417 2,470 α G = 0,05N, N: ,01-4,295 3,574 0,05-3,426 3,071 0,10-3,032 2, Úprava pro jinou formulaci hypotéz Pro opačně formulované hypotézy v (3.1), tj. H 0 : E(X i ) = µ i δ i = 1,..., n (3.34) H 1 : m {1,..., n 1} takové, že E(X i ) = µ i δ pro i = 1,..., m E(X i ) = µ i < δ pro i = m 1,..., n

31 3. Střední hodnota omezená stanovenou hranicí 26 je odvození statistiky testu poměrem věrohodností zcela analogické. Pouze výraz (3.4) se změní na ( Λ op k = sup (x i µ i ) 2 ) ( sup (x i µ i ) 2 ) (3.35) µ i <δ 2σ 2 µ i δ 2σ 2 i=k1 i=k1 a po dosazení maximálně věrohodných odhadů µ i, které jsou i nadále určeny vztahy (3.9) a (3.10), získáme namísto (3.11) Λ op k = n i=k1 (x i δ) 2 2σ 2 sign(x i δ). (3.36) Podobně se změna ve znění hypotéz projeví i v (3.12). Při požadavku, aby nulovou hypotézu zamítala kterákoli ze statistik (3.36) pro k < n, získáme pro n = 1... N obdobu Q n jako Q op n = min 0 m<n 1 2σ 2 i=m1 (X i δ) 2 sign(x i δ) (3.37) a nulovou hypotézu test zamítne pro malé hodnoty testové statistiky Q op n. Při oboustranné alternativě máme obecně situaci H 0 : E(X i ) = δ 1 µ i δ 2 i = 1,..., n (3.38) H 1 : m {1,..., n 1} takové, že δ 1 E(X i ) = µ i δ 2 pro i = 1,..., m E(X i ) = µ i > δ 2 nebo µ i < δ 1 pro i = m 1,..., n a pro normálně rozdělená data se známým rozptylem σ 2 má testová statistika testu poměrem věrohodností tvar ( Q ob 1 n =max m<n 2σ 2 X i δ ( )) 1 δ 2 ( 2 i=m1 2 δ2 δ 1 sign 2 X i δ ) 1 δ 2 2 δ 2, (3.39) opět pro n = 1... N. Postup odvození je obdobný jako u jednostranných alternativ, pouze je nutno určit příslušné maximálně věrohodné odhady středních hodnot µ i podle nových omezení vyplývajících z H 0 a H 1. Tyto odhady mají nyní tvar δ 2 pro δ 1 δ 2 x i µ i δ1 µ i δ 2 = x i pro δ 1 x i δ 2 (3.40) δ 1 pro x i δ 1 δ 2,

32 3. Střední hodnota omezená stanovenou hranicí 27 x i pro δ 1 δ 2 x i nebo x i δ 1 δ 2 µ i µi <δ 1 nebo µ i >δ 2 = δ 1 pro δ 1 x i δ 1δ 2 2 (3.41) δ 2 pro δ 1δ 2 2 x i δ 2. Po dosazení do obecného vzorce (3.4) (s indexem suprema upraveným podle nového znění hypotéz) a několika standartního úpravách získáme statistiku Q ob n definovanou vztahem (3.39). Nulovou hypotézu test zamítne pro velké hodnoty testové statistiky Q ob n. Poznámka 3.6: Pro speciální případ δ 1 = δ 2 = δ > 0 se (3.39) redukuje na Q ob 1 n = max ( X m<n 2σ 2 i δ) 2 sign( X i δ), (3.42) i=m1 tedy tvar velmi blízký původní jednostranné statistice (3.13). 3.6 Modifikace předpokladů V celém předcházejícím textu jsme se zabývali situací, kdy sledované náhodné veličiny X 1,..., X n měly normální rozdělení a rozptyl tohoto rozdělení byl známý (například z dřívější zkušenosti) natolik dobře, že jeho hodnotu bylo možno určit bez znalosti konkrétních měření. Teoreticky je taková situace nejsnazší, v praxi jsou však normalita pozorovaných veličin nebo znalost rozptylu často příliš silné předpoklady. V této části jsou uvedena detailní odvození a vzorce, které platí za změněných předpokladů, pro původní znění hypotéz (3.1). Postup v případě jiné formulace problému by však byl zcela analogický Normálně rozdělená data s neznámým rozptylem Obecný tvar testu poměrem věrohodností je i nadále vyjádřen vzorcem (3.4) s tím rozdílem, že v indexu suprema se objeví ještě nový parametr σ 2 a skutečná hodnota tohoto parametru bude nahrazena hodnotou jeho odhadu. Podmíněné maximálně věrohodné odhady parametrů µ i jsou stále určeny

Odhad parametrů N(µ, σ 2 )

Odhad parametrů N(µ, σ 2 ) Odhad parametrů N(µ, σ 2 ) Mějme statistický soubor x 1, x 2,, x n modelovaný jako realizaci náhodného výběru z normálního rozdělení N(µ, σ 2 ) s neznámými parametry µ a σ. Jaký je maximální věrohodný

Více

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457. 0 cvičení z PST 5 prosince 208 0 (intervalový odhad pro rozptyl) Soubor (70, 84, 89, 70, 74, 70) je náhodným výběrem z normálního rozdělení N(µ, σ 2 ) Určete oboustranný symetrický 95% interval spolehlivosti

Více

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. Testování statistických hypotéz Ing. Michal Dorda, Ph.D. Testování normality Př. : Při simulaci provozu na křižovatce byla získána data o mezerách mezi přijíždějícími vozidly v [s]. Otestujte na hladině

Více

jevu, čas vyjmutí ze sledování byl T j, T j < X j a T j je náhodná veličina.

jevu, čas vyjmutí ze sledování byl T j, T j < X j a T j je náhodná veličina. Parametrické metody odhadů z neúplných výběrů 2 1 Metoda maximální věrohodnosti pro cenzorované výběry 11 Náhodné cenzorování Při sledování složitých reálných systémů často nemáme možnost uspořádat experiment

Více

Normální (Gaussovo) rozdělení

Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení popisuje vlastnosti náhodné spojité veličiny, která vzniká složením různých náhodných vlivů, které jsou navzájem nezávislé, kterých je velký

Více

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Statistickou hypotézou se rozumí určité tvrzení o parametrech rozdělení zkoumané náhodné veličiny (µ, σ 2, π,

Více

15. T e s t o v á n í h y p o t é z

15. T e s t o v á n í h y p o t é z 15. T e s t o v á n í h y p o t é z Na základě hodnot náhodného výběru činíme rozhodnutí o platnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlastnostech. Rozeznáváme dva základní typy testů:

Více

Statistika, Biostatistika pro kombinované studium. Jan Kracík

Statistika, Biostatistika pro kombinované studium. Jan Kracík Statistika, Biostatistika pro kombinované studium Letní semestr 2014/2015 Tutoriál č. 6: ANOVA Jan Kracík jan.kracik@vsb.cz Obsah: Testování hypotéz opakování ANOVA Testování hypotéz (opakování) Testování

Více

Charakterizace rozdělení

Charakterizace rozdělení Charakterizace rozdělení Momenty f(x) f(x) f(x) μ >μ 1 σ 1 σ >σ 1 g 1 g σ μ 1 μ x μ x x N K MK = x f( x) dx 1 M K = x N CK = ( x M ) f( x) dx ( xi M 1 C = 1 K 1) N i= 1 K i K N i= 1 K μ = E ( X ) = xf

Více

y = 0, ,19716x.

y = 0, ,19716x. Grafické ověřování a testování vybraných modelů 1 Grafické ověřování empirického rozdělení Při grafické analýze empirického rozdělení vycházíme z empirické distribuční funkce F n (x) příslušné k náhodnému

Více

12. cvičení z PST. 20. prosince 2017

12. cvičení z PST. 20. prosince 2017 1 cvičení z PST 0 prosince 017 11 test rozptylu normálního rozdělení Do laboratoře bylo odesláno n = 5 stejných vzorků krve ke stanovení obsahu alkoholu X v promilích alkoholu Výsledkem byla realizace

Více

Výběrové charakteristiky a jejich rozdělení

Výběrové charakteristiky a jejich rozdělení Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Statistické šetření úplné (vyčerpávající) neúplné (výběrové) U výběrového šetření se snažíme o to, aby výběrový

Více

Náhodné chyby přímých měření

Náhodné chyby přímých měření Náhodné chyby přímých měření Hodnoty náhodných chyb se nedají stanovit předem, ale na základě počtu pravděpodobnosti lze zjistit, která z možných naměřených hodnot je více a která je méně pravděpodobná.

Více

Náhodné (statistické) chyby přímých měření

Náhodné (statistické) chyby přímých měření Náhodné (statistické) chyby přímých měření Hodnoty náhodných chyb se nedají stanovit předem, ale na základě počtu pravděpodobnosti lze zjistit, která z možných naměřených hodnot je více a která je méně

Více

15. T e s t o v á n í h y p o t é z

15. T e s t o v á n í h y p o t é z 15. T e s t o v á n í h y p o t é z Na základě hodnot náhodného výběru činíme rozhodnutí o platnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlastnostech. Rozeznáváme dva základní typy testů:

Více

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace Intervalové odhady Interval spolehlivosti pro střední hodnotu v Nµ, σ 2 ) Situace: X 1,..., X n náhodný výběr z Nµ, σ 2 ), kde σ 2 > 0 známe měli jsme: bodové odhady odhadem charakteristiky je číslo) nevyjadřuje

Více

Přijímací zkouška na navazující magisterské studium 2014

Přijímací zkouška na navazující magisterské studium 2014 Přijímací zkouška na navazující magisterské studium 24 Příklad (25 bodů) Spočtěte Studijní program: Studijní obor: Matematika Finanční a pojistná matematika Varianta A M x 2 dxdy, kde M = {(x, y) R 2 ;

Více

Odhad parametrů N(µ, σ 2 )

Odhad parametrů N(µ, σ 2 ) Odhad parametrů N(µ, σ 2 ) Mějme statistický soubor x 1, x 2,, x n modelovaný jako realizaci náhodného výběru z normálního rozdělení N(µ, σ 2 ) s neznámými parametry µ a σ. Jaký je maximální věrohodný

Více

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace Intervalové odhady Interval spolehlivosti pro střední hodnotu v Nµ, σ 2 ) Situace: X 1,..., X n náhodný výběr z Nµ, σ 2 ), kde σ 2 > 0 známe měli jsme: bodové odhady odhadem charakteristiky je číslo) nevyjadřuje

Více

MATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci

MATEMATICKÁ STATISTIKA.   Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci MATEMATICKÁ STATISTIKA Dana Černá http://www.fp.tul.cz/kmd/ Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci Matematická statistika Matematická statistika se zabývá matematickým

Více

676 + 4 + 100 + 196 + 0 + 484 + 196 + 324 + 64 + 324 = = 2368

676 + 4 + 100 + 196 + 0 + 484 + 196 + 324 + 64 + 324 = = 2368 Příklad 1 Je třeba prověřit, zda lze na 5% hladině významnosti pokládat za prokázanou hypotézu, že střední doba výroby výlisku je 30 sekund. Přitom 10 náhodně vybraných výlisků bylo vyráběno celkem 540

Více

Normální (Gaussovo) rozdělení

Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení f x = 1 2 exp x 2 2 2 f(x) je funkce hustoty pravděpodobnosti, symetrická vůči poloze maxima x = μ μ střední hodnota σ směrodatná odchylka (tzv. pološířka křivky mezi inflexními

Více

KGG/STG Statistika pro geografy

KGG/STG Statistika pro geografy KGG/STG Statistika pro geografy 4. Teoretická rozdělení Mgr. David Fiedor 9. března 2015 Osnova Úvod 1 Úvod 2 3 4 5 Vybraná rozdělení náhodných proměnných normální rozdělení normované normální rozdělení

Více

Intervalová data a výpočet některých statistik

Intervalová data a výpočet některých statistik Intervalová data a výpočet některých statistik Milan Hladík 1 Michal Černý 2 1 Katedra aplikované matematiky Matematicko-fyzikální fakulta Univerzita Karlova 2 Katedra ekonometrie Fakulta informatiky a

Více

Intervalové Odhady Parametrů

Intervalové Odhady Parametrů Parametrů Mgr. Rudolf B. Blažek, Ph.D. prof. RNDr. Roman Kotecký, DrSc. Katedra počítačových systémů Katedra teoretické informatiky Fakulta informačních technologií České vysoké učení technické v Praze

Více

Cvičení ze statistiky - 8. Filip Děchtěrenko

Cvičení ze statistiky - 8. Filip Děchtěrenko Cvičení ze statistiky - 8 Filip Děchtěrenko Minule bylo.. Dobrali jsme normální rozdělení Tyhle termíny by měly být známé: Centrální limitní věta Laplaceho věta (+ korekce na spojitost) Konfidenční intervaly

Více

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze Dobývání znalostí Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze Dobývání znalostí Pravděpodobnost a učení Doc. RNDr. Iveta Mrázová,

Více

9. T r a n s f o r m a c e n á h o d n é v e l i č i n y

9. T r a n s f o r m a c e n á h o d n é v e l i č i n y 9. T r a n s f o r m a c e n á h o d n é v e l i č i n y Při popisu procesů zpracováváme vstupní údaj, hodnotu x tak, že výstupní hodnota y závisí nějakým způsobem na vstupní, je její funkcí y = f(x).

Více

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Testy hypotéz na základě více než 2 výběrů 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Testy hypotéz na základě více než 2 výběrů Na analýzu rozptylu lze pohlížet v podstatě

Více

1. Náhodný vektor (X, Y ) má diskrétní rozdělení s pravděpodobnostní funkcí p, kde. p(x, y) = a(x + y + 1), x, y {0, 1, 2}.

1. Náhodný vektor (X, Y ) má diskrétní rozdělení s pravděpodobnostní funkcí p, kde. p(x, y) = a(x + y + 1), x, y {0, 1, 2}. VIII. Náhodný vektor. Náhodný vektor (X, Y má diskrétní rozdělení s pravděpodobnostní funkcí p, kde p(x, y a(x + y +, x, y {,, }. a Určete číslo a a napište tabulku pravděpodobnostní funkce p. Řešení:

Více

X = x, y = h(x) Y = y. hodnotám x a jedné hodnotě y. Dostaneme tabulku hodnot pravděpodobnostní

X = x, y = h(x) Y = y. hodnotám x a jedné hodnotě y. Dostaneme tabulku hodnot pravděpodobnostní ..08 8cv7.tex 7. cvičení - transformace náhodné veličiny Definice pojmů a základní vzorce Je-li X náhodná veličina a h : R R je měřitelná funkce, pak náhodnou veličinu Y, která je definovaná vztahem X

Více

Ekonomické aspekty statistické regulace pro vysoce způsobilé procesy. Kateřina Brodecká

Ekonomické aspekty statistické regulace pro vysoce způsobilé procesy. Kateřina Brodecká Ekonomické aspekty statistické regulace pro vysoce způsobilé procesy Kateřina Brodecká Vysoce způsobilé procesy s rozvojem technologií a důrazem kladeným na aktivity neustálého zlepšování a zeštíhlování

Více

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA PRAVDĚPODOBNOST A STATISTIKA Testování hypotéz Nechť X je náhodná proměnná, která má distribuční funkci F(x, ϑ). Předpokládejme, že známe tvar distribuční funkce (víme jaké má rozdělení) a neznáme parametr

Více

Chyby měření 210DPSM

Chyby měření 210DPSM Chyby měření 210DPSM Jan Zatloukal Stručný přehled Zdroje a druhy chyb Systematické chyby měření Náhodné chyby měření Spojité a diskrétní náhodné veličiny Normální rozdělení a jeho vlastnosti Odhad parametrů

Více

Národní informační středisko pro podporu jakosti

Národní informační středisko pro podporu jakosti Národní informační středisko pro podporu jakosti 1 METODA KUMULOVANÝCH SOUČTŮ C U S U M metoda: tabulkový (lineární) CUSUM RNDr. Jiří Michálek, CSc., Ing. Antonie Poskočilová 2 Základem SPC jsou Shewhartovy

Více

Jednofaktorová analýza rozptylu

Jednofaktorová analýza rozptylu I I.I Jednofaktorová analýza rozptylu Úvod Jednofaktorová analýza rozptylu (ANOVA) se využívá při porovnání několika středních hodnot. Často se využívá ve vědeckých a lékařských experimentech, při kterých

Více

Regresní analýza 1. Regresní analýza

Regresní analýza 1. Regresní analýza Regresní analýza 1 1 Regresní funkce Regresní analýza Důležitou statistickou úlohou je hledání a zkoumání závislostí proměnných, jejichž hodnoty získáme při realizaci experimentů Vzhledem k jejich náhodnému

Více

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně Testování hypotéz Nechť,, je náhodný výběr z nějakého rozdělení s neznámými parametry. Máme dvě navzájem si odporující hypotézy o parametrech daného rozdělení: Nulová hypotéza parametry (případně jediný

Více

STATISTICKÉ ODHADY Odhady populačních charakteristik

STATISTICKÉ ODHADY Odhady populačních charakteristik STATISTICKÉ ODHADY Odhady populačních charakteristik Jak stanovit charakteristiky rozložení sledované veličiny v základní populaci? Populaci většinou nemáme celou k dispozici, musíme se spokojit jen s

Více

Nestranný odhad Statistické vyhodnocování exp. dat M. Čada

Nestranný odhad Statistické vyhodnocování exp. dat M. Čada Nestranný odhad 1 Parametr θ Máme statistický (výběrový) soubor, který je realizací náhodného výběru 1, 2, 3,, n z pravděpodobnostní distribuce, která je kompletně stanovena jedním nebo více parametry

Více

7. Rozdělení pravděpodobnosti ve statistice

7. Rozdělení pravděpodobnosti ve statistice 7. Rozdělení pravděpodobnosti ve statistice Statistika nuda je, má však cenné údaje, neklesejte na mysli, ona nám to vyčíslí Jednou z úloh statistiky je odhad (výpočet) hodnot statistického znaku x i,

Více

5 Parametrické testy hypotéz

5 Parametrické testy hypotéz 5 Parametrické testy hypotéz 5.1 Pojem parametrického testu (Skripta str. 95-96) Na základě výběru srovnáváme dvě tvrzení o hodnotě určitého parametru θ rozdělení f(x, θ). První tvrzení (které většinou

Více

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci Zpracování dat v edukačních vědách - Testování hypotéz Kamila Fačevicová Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci Obsah seminářů 5.11. Úvod do matematické

Více

3 Bodové odhady a jejich vlastnosti

3 Bodové odhady a jejich vlastnosti 3 Bodové odhady a jejich vlastnosti 3.1 Statistika (Skripta str. 77) Výběr pořizujeme proto, abychom se (více) dověděli o souboru, ze kterého jsme výběr pořídili. Zde se soustředíme na situaci, kdy známe

Více

MATEMATICKÁ STATISTIKA - XP01MST

MATEMATICKÁ STATISTIKA - XP01MST MATEMATICKÁ STATISTIKA - XP01MST 1. Úvod. Matematická statistika (statistics) se zabývá vyšetřováním zákonitostí, které v sobě obsahují prvek náhody. Zpracováním hodnot, které jsou výstupem sledovaného

Více

I. D i s k r é t n í r o z d ě l e n í

I. D i s k r é t n í r o z d ě l e n í 6. T y p y r o z d ě l e n í Poznámka: V odst. 5.5-5.10 jsme uvedli příklady náhodných veličin a jejich distribučních funkcí. Poznali jsme, že se od sebe liší svým typem. V příkladech 5.5, 5.6 a 5.8 jsme

Více

Pravděpodobnost, náhoda, kostky

Pravděpodobnost, náhoda, kostky Pravděpodobnost, náhoda, kostky Radek Pelánek IV122 Výhled pravděpodobnost náhodná čísla lineární regrese detekce shluků Dnes lehce nesourodá směs úloh souvisejících s pravděpodobností připomenutí, souvislosti

Více

Limitní věty teorie pravděpodobnosti. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Limitní věty teorie pravděpodobnosti. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jestliže opakujeme nezávisle nějaký pokus, můžeme z pozorovaných hodnot sestavit rozdělení relativních četností

Více

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina Testování hypotéz Analýza dat z dotazníkových šetření Kuranova Pavlina Statistická hypotéza Možné cíle výzkumu Srovnání účinnosti různých metod Srovnání výsledků různých skupin Tzn. prokázání rozdílů mezi

Více

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D.

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D. Problematika analýzy rozptylu Ing. Michael Rost, Ph.D. Úvod do problému Již umíte testovat shodu dvou středních hodnot prostřednictvím t-testů. Otázka: Jaké předpoklady musí být splněny, abyste mohli použít

Více

Odhady - Sdružené rozdělení pravděpodobnosti

Odhady - Sdružené rozdělení pravděpodobnosti Odhady - Sdružené rozdělení pravděpodobnosti 4. listopadu 203 Kdybych chtěl znát maximum informací o náhodné veličině, musel bych znát všechny hodnoty, které mohou padnout, a jejich pravděpodobnosti. Tedy

Více

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru. 1 Statistické odhady Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru. Odhad lze provést jako: Bodový odhad o Jedna číselná hodnota Intervalový

Více

2 ) 4, Φ 1 (1 0,005)

2 ) 4, Φ 1 (1 0,005) Příklad 1 Ze zásilky velkého rozsahu byl náhodně vybrán soubor obsahující 1000 kusů. V tomto souboru bylo zjištěno 26 kusů nekvalitních. Rozhodněte, zda je možné s 99% jistotou tvrdit, že zásilka obsahuje

Více

Pravděpodobnost a matematická statistika

Pravděpodobnost a matematická statistika Pravděpodobnost a matematická statistika Příklady k přijímacím zkouškám na doktorské studium 1 Popisná statistika Určete aritmetický průměr dat, zadaných tabulkou hodnot x i a četností n i x i 1 2 3 n

Více

p(x) = P (X = x), x R,

p(x) = P (X = x), x R, 6. T y p y r o z d ě l e n í Poznámka: V odst. 5.5-5.10 jsme uvedli příklady náhodných veličin a jejich distribučních funkcí. Poznali jsme, že se od sebe liší svým typem. V příkladech 5.5, 5.6 a 5.8 jsme

Více

Testování statistických hypotéz

Testování statistických hypotéz Testování statistických hypotéz 1 Testování statistických hypotéz 1 Statistická hypotéza a její test V praxi jsme nuceni rozhodnout, zda nějaké tvrzeni o parametrech náhodných veličin nebo o veličině samotné

Více

Téma 22. Ondřej Nývlt

Téma 22. Ondřej Nývlt Téma 22 Ondřej Nývlt nyvlto1@fel.cvut.cz Náhodná veličina a náhodný vektor. Distribuční funkce, hustota a pravděpodobnostní funkce náhodné veličiny. Střední hodnota a rozptyl náhodné veličiny. Sdružené

Více

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica JEDNOVÝBĚROVÉ TESTY Komentované řešení pomocí programu Statistica Vstupní data Data umístěná v excelovském souboru překopírujeme do tabulky ve Statistice a pojmenujeme proměnné, viz prezentace k tématu

Více

11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.

11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0. 11 cvičení z PSI 12-16 prosince 2016 111 (Test dobré shody - geometrické rozdělení Realizací náhodné veličiny X jsme dostali následující četnosti výsledků: hodnota 0 1 2 3 4 5 6 pozorovaná četnost 29 15

Více

Úvod do teorie odhadu. Ing. Michael Rost, Ph.D.

Úvod do teorie odhadu. Ing. Michael Rost, Ph.D. Úvod do teorie odhadu Ing. Michael Rost, Ph.D. Náhodný výběr Náhodným výběrem ze základního souboru populace, která je popsána prostřednictvím hustoty pravděpodobnosti f(x, θ), budeme nazývat posloupnost

Více

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test Testování hypotéz 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test Testování hypotéz proces, kterým rozhodujeme, zda přijmeme nebo zamítneme nulovou hypotézu

Více

Statistika a spolehlivost v lékařství Charakteristiky spolehlivosti prvků I

Statistika a spolehlivost v lékařství Charakteristiky spolehlivosti prvků I Statistika a spolehlivost v lékařství Charakteristiky spolehlivosti prvků I Příklad Tahová síla papíru používaného pro výrobu potravinových sáčků je důležitá charakteristika kvality. Je známo, že síla

Více

6. T e s t o v á n í h y p o t é z

6. T e s t o v á n í h y p o t é z 6. T e s t o v á n í h y p o t é z Na základě hodnot z realizace náhodného výběru činíme rozhodnutí o platnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlastnostech. Používáme k tomu vhodně

Více

5. T e s t o v á n í h y p o t é z

5. T e s t o v á n í h y p o t é z 5. T e s t o v á n í h y p o t é z Na základě hodnot náhodného výběru činíme rozhodnutí o platnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlastnostech. Rozeznáváme dva základní typy testů:

Více

časovém horizontu na rozdíl od experimentu lépe odhalit chybné poznání reality.

časovém horizontu na rozdíl od experimentu lépe odhalit chybné poznání reality. Modelování dynamických systémů Matematické modelování dynamických systémů se využívá v různých oborech přírodních, technických, ekonomických a sociálních věd. Použití matematického modelu umožňuje popsat

Více

z Matematické statistiky 1 1 Konvergence posloupnosti náhodných veličin

z Matematické statistiky 1 1 Konvergence posloupnosti náhodných veličin Příklady k procvičení z Matematické statistiky Poslední úprava. listopadu 207. Konvergence posloupnosti náhodných veličin. Necht X, X 2... jsou nezávislé veličiny s rovnoměrným rozdělením na [0, ]. Definujme

Více

Základy teorie pravděpodobnosti

Základy teorie pravděpodobnosti Základy teorie pravděpodobnosti Náhodná veličina Roman Biskup (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at)email.cz 12. února 2012 Statistika by Birom Základy teorie

Více

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA PRAVDĚPODOBNOST A STATISTIKA Definice lineárního normálního regresního modelu Lineární normální regresní model Y β ε Matice n,k je matice realizací. Předpoklad: n > k, h() k - tj. matice je plné hodnosti

Více

Jednofaktorová analýza rozptylu

Jednofaktorová analýza rozptylu Jednofaktorová analýza rozptylu David Hampel Ústav statistiky a operačního výzkumu, Mendelova univerzita v Brně Kurz pokročilých statistických metod Global Change Research Centre AS CR, 5 7 8 2015 Tato

Více

Aproximace binomického rozdělení normálním

Aproximace binomického rozdělení normálním Aproximace binomického rozdělení normálním Aproximace binomického rozdělení normálním Příklad Sybilla a Kassandra tvrdí, že mají telepatické schopnosti, a chtějí to dokázat následujícím pokusem: V jedné

Více

9. T r a n s f o r m a c e n á h o d n é v e l i č i n y

9. T r a n s f o r m a c e n á h o d n é v e l i č i n y 9. T r a n s f o r m a c e n á h o d n é v e l i č i n Při popisu procesů zpracováváme vstupní údaj, hodnotu x tak, že výstupní hodnota závisí nějakým způsobem na vstupní, je její funkcí = f(x). Pokud

Více

Rozdíl rizik zbytečného signálu v regulačním diagramu (I,MR) a (xbar,r)

Rozdíl rizik zbytečného signálu v regulačním diagramu (I,MR) a (xbar,r) Rozdíl rizik zbytečného signálu v regulačním diagramu (I,MR) a (xbar,r) Bohumil Maroš 1. Úvod Regulační diagram je nejefektivnější nástroj pro identifikaci stability, resp. nestability procesu. Vhodně

Více

Vlastnosti odhadů ukazatelů způsobilosti

Vlastnosti odhadů ukazatelů způsobilosti Vlastnosti odhadů ukazatelů způsobilosti Jiří Michálek CQR při Ústavu teorie informace a automatizace AV ČR v Praze Úvod Ve výzkumné zprávě č 06 Odhady koeficientů způsobilosti a jejich vlastnosti viz

Více

1. Přednáška. Ing. Miroslav Šulai, MBA

1. Přednáška. Ing. Miroslav Šulai, MBA N_OFI_2 1. Přednáška Počet pravděpodobnosti Statistický aparát používaný ve financích Ing. Miroslav Šulai, MBA 1 Počet pravděpodobnosti -náhodné veličiny 2 Počet pravděpodobnosti -náhodné veličiny 3 Jevy

Více

Pravděpodobnost a aplikovaná statistika

Pravděpodobnost a aplikovaná statistika Pravděpodobnost a aplikovaná statistika MGR. JANA SEKNIČKOVÁ, PH.D. 8. KAPITOLA STATISTICKÉ TESTOVÁNÍ HYPOTÉZ 22.11.2016 Opakování: CLV příklad 1 Zadání: Před volbami je v populaci státu 52 % příznivců

Více

12. prosince n pro n = n = 30 = S X

12. prosince n pro n = n = 30 = S X 11 cvičení z PSI 1 prosince 018 111 test střední hodnoty normálního rozdělení při známém rozptylu Teploměrem o jehož chybě předpokládáme že má normální rozdělení se směrodatnou odchylkou σ = 3 jsme provedli

Více

Ing. Michael Rost, Ph.D.

Ing. Michael Rost, Ph.D. Úvod do testování hypotéz, jednovýběrový t-test Ing. Michael Rost, Ph.D. Testovaná hypotéza Pokud nás zajímá zda platí, či neplatí tvrzení o určitém parametru, např. o parametru Θ, pak takovéto tvrzení

Více

8.1. Definice: Normální (Gaussovo) rozdělení N(µ, σ 2 ) s parametry µ a. ( ) ϕ(x) = 1. označovat písmenem U. Její hustota je pak.

8.1. Definice: Normální (Gaussovo) rozdělení N(µ, σ 2 ) s parametry µ a. ( ) ϕ(x) = 1. označovat písmenem U. Její hustota je pak. 8. Normální rozdělení 8.. Definice: Normální (Gaussovo) rozdělení N(µ, ) s parametry µ a > 0 je rozdělení určené hustotou ( ) f(x) = (x µ) e, x (, ). Rozdělení N(0; ) s parametry µ = 0 a = se nazývá normované

Více

2 Hlavní charakteristiky v analýze přežití

2 Hlavní charakteristiky v analýze přežití 2 Hlavní charakteristiky v analýze přežití Předpokládané výstupy z výuky: 1. Student umí definovat funkci přežití, rizikovou funkci a kumulativní rizikovou funkci a zná funkční vazby mezi nimi 2. Student

Více

Testování statistických hypotéz

Testování statistických hypotéz Testování statistických hypotéz Michal Fusek Ústav matematiky FEKT VUT, fusekmi@feec.vutbr.cz 11. přednáška z ESMAT Michal Fusek (fusekmi@feec.vutbr.cz) 1 / 27 Obsah 1 Testování statistických hypotéz 2

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 010 1.týden (0.09.-4.09. ) Data, typy dat, variabilita, frekvenční analýza

Více

Přijímací zkouška na navazující magisterské studium 2017

Přijímací zkouška na navazující magisterské studium 2017 Přijímací zkouška na navazující magisterské studium 27 Studijní program: Studijní obor: Matematika Finanční a pojistná matematika Varianta A Řešení příkladů pečlivě odůvodněte. Věnujte pozornost ověření

Více

12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem)

12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem) cvičení z PSI 0-4 prosince 06 Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem) Z realizací náhodných veličin X a Y s normálním rozdělením) jsme z výběrů daného rozsahu obdrželi

Více

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz. Pravděpodobnost a statistika, Biostatistika pro kombinované studium Letní semestr 2015/2016 Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz Jan Kracík jan.kracik@vsb.cz Obsah: Výběrová rozdělení

Více

Riemannův určitý integrál

Riemannův určitý integrál Riemannův určitý integrál 1. Motivační příklad Příklad (Motivační příklad pro zavedení Riemannova integrálu). Nechť,. Vypočtěme obsah vybarvené oblasti ohraničené grafem funkce, osou a svislými přímkami

Více

KORELACE. Komentované řešení pomocí programu Statistica

KORELACE. Komentované řešení pomocí programu Statistica KORELACE Komentované řešení pomocí programu Statistica Vstupní data I Data umístěná v excelovském souboru překopírujeme do tabulky ve Statistice a pojmenujeme proměnné, viz prezentace k tématu Popisná

Více

Základy počtu pravděpodobnosti a metod matematické statistiky

Základy počtu pravděpodobnosti a metod matematické statistiky Errata ke skriptu Základy počtu pravděpodobnosti a metod matematické statistiky K. Hron a P. Kunderová Autoři prosí čtenáře uvedeného studijního textu, aby případné další odhalené chyby nad rámec tohoto

Více

Jana Vránová, 3. lékařská fakulta UK

Jana Vránová, 3. lékařská fakulta UK Jana Vránová, 3. lékařská fakulta UK Vznikají při zkoumání vztahů kvalitativních resp. diskrétních znaků Jedná se o analogii s korelační analýzou spojitých znaků Přitom předpokládáme, že každý prvek populace

Více

You created this PDF from an application that is not licensed to print to novapdf printer (http://www.novapdf.com)

You created this PDF from an application that is not licensed to print to novapdf printer (http://www.novapdf.com) Testování statistických hypotéz Testování statistických hypotéz Princip: Ověřování určitého předpokladu zjišťujeme, zda zkoumaný výběr pochází ze základního souboru, který má určité rozdělení zjišťujeme,

Více

P13: Statistické postupy vyhodnocování únavových zkoušek, aplikace normálního, Weibullova rozdělení, apod.

P13: Statistické postupy vyhodnocování únavových zkoušek, aplikace normálního, Weibullova rozdělení, apod. P13: Statistické postupy vyhodnocování únavových zkoušek, aplikace normálního, Weibullova rozdělení, apod. Matematický přístup k výsledkům únavových zkoušek Náhodnost výsledků únavových zkoušek. Únavové

Více

KVADRATICKÁ KALIBRACE

KVADRATICKÁ KALIBRACE Petra Širůčková, prof. RNDr. Gejza Wimmer, DrSc. Finanční matematika v praxi III. a Matematické modely a aplikace 4. 9. 2013 Osnova Kalibrace 1 Kalibrace Pojem kalibrace Cíle kalibrace Předpoklady 2 3

Více

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika Šárka Hudecová Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy letní semestr 2012 Opakování t- vs. neparametrické Wilcoxonův jednovýběrový test Opakování

Více

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Prostá regresní a korelační analýza 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Problematika závislosti V podstatě lze rozlišovat mezi závislostí nepodstatnou, čili náhodnou

Více

NÁHODNÁ ČÍSLA. F(x) = 1 pro x 1. Náhodná čísla lze generovat některým z následujících generátorů náhodných čísel:

NÁHODNÁ ČÍSLA. F(x) = 1 pro x 1. Náhodná čísla lze generovat některým z následujících generátorů náhodných čísel: NÁHODNÁ ČÍSLA TYPY GENERÁTORŮ, LINEÁRNÍ KONGRUENČNÍ GENERÁTORY, TESTY NÁHODNOSTI, VYUŽITÍ HODNOT NÁHODNÝCH VELIČIN V SIMULACI CO JE TO NÁHODNÉ ČÍSLO? Náhodné číslo definujeme jako nezávislé hodnoty z rovnoměrného

Více

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY Statistická hypotéza je určitá domněnka (předpoklad) o vlastnostech ZÁKLADNÍHO SOUBORU. Test statistické hypotézy je pravidlo (kritérium), které na základě

Více

Bakalářské studium na MFF UK v Praze Obecná matematika Zaměření: Stochastika. 1 Úvodní poznámky. Verze: 13. června 2013

Bakalářské studium na MFF UK v Praze Obecná matematika Zaměření: Stochastika. 1 Úvodní poznámky. Verze: 13. června 2013 Bakalářské studium na MFF UK v Praze Obecná matematika Zaměření: Stochastika Podrobnější rozpis okruhů otázek pro třetí část SZZ Verze: 13. června 2013 1 Úvodní poznámky 6 Smyslem SZZ by nemělo být toliko

Více

Náhodná veličina a její charakteristiky. Před provedením pokusu jeho výsledek a tedy ani sledovanou hodnotu neznáte. Proto je proměnná, která

Náhodná veličina a její charakteristiky. Před provedením pokusu jeho výsledek a tedy ani sledovanou hodnotu neznáte. Proto je proměnná, která Náhodná veličina a její charakteristiky Náhodná veličina a její charakteristiky Představte si, že provádíte náhodný pokus, jehož výsledek jste schopni ohodnotit nějakým číslem. Před provedením pokusu jeho

Více

Vybraná rozdělení náhodné veličiny

Vybraná rozdělení náhodné veličiny 3.3 Vybraná rozdělení náhodné veličiny 0,16 0,14 0,12 0,1 0,08 0,06 0,04 0,02 0 Rozdělení Z 3 4 5 6 7 8 9 10 11 12 13 14 15 Život je umění vytvářet uspokojivé závěry na základě nedostatečných předpokladů.

Více