Pravděpodobnostní rozdělení v MS Excel



Podobné dokumenty
6.1 Normální (Gaussovo) rozdělení

ROZDĚLENÍ NÁHODNÝCH VELIČIN

NÁHODNÉ VELIČINY JAK SE NÁHODNÁ ČÍSLA PŘEVEDOU NA HODNOTY NÁHODNÝCH VELIČIN?

Vybraná rozdělení náhodné veličiny

E(X) = np D(X) = np(1 p) 1 2p np(1 p) (n + 1)p 1 ˆx (n + 1)p. A 3 (X) =

Náhodná veličina a rozdělení pravděpodobnosti

Střední hodnota a rozptyl náhodné. kvantilu. Ing. Michael Rost, Ph.D.

Téma 2: Pravděpodobnostní vyjádření náhodných veličin

Inovace bakalářského studijního oboru Aplikovaná chemie

Téma 2: Pravděpodobnostní vyjádření náhodných veličin

Abstrakt. Klíčová slova. Statistika v Excelu, analýza dat, soubor, Excel. Abstract

9. T r a n s f o r m a c e n á h o d n é v e l i č i n y

Praktická statistika. Petr Ponížil Eva Kutálková

P13: Statistické postupy vyhodnocování únavových zkoušek, aplikace normálního, Weibullova rozdělení, apod.

I. D i s k r é t n í r o z d ě l e n í

p(x) = P (X = x), x R,

ROZDĚLENÍ SPOJITÝCH NÁHODNÝCH VELIČIN

Základy teorie pravděpodobnosti

9. T r a n s f o r m a c e n á h o d n é v e l i č i n y

VYUŽITÍ PRAVDĚPODOBNOSTNÍ METODY MONTE CARLO V SOUDNÍM INŽENÝRSTVÍ

Pracovní adresář. Nápověda. Instalování a načtení nového balíčku. Importování datového souboru. Práce s datovým souborem

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM

KMA/P506 Pravděpodobnost a statistika KMA/P507 Statistika na PC

Pravděpodobnost a aplikovaná statistika

ÚVOD. Rozdělení slouží: K přesnému popisu pravděpodobnostního chování NV Střední hodnota, rozptyl, korelace atd.

Náhodná veličina X má Poissonovo rozdělení se střední hodnotou lambda. Poissonovo rozdělení je definováno jako. P(X=k) = 0,036

Výběrové charakteristiky a jejich rozdělení

Pravděpodobnost a statistika I KMA/K413

Diskrétní náhodná veličina

Design Experimentu a Statistika - AGA46E

1. Přednáška. Ing. Miroslav Šulai, MBA

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

Definice spojité náhodné veličiny zjednodušená verze

MATEMATIKA III V PŘÍKLADECH

Téma 22. Ondřej Nývlt

X = x, y = h(x) Y = y. hodnotám x a jedné hodnotě y. Dostaneme tabulku hodnot pravděpodobnostní

PRAVDĚPODOBNOST A STATISTIKA aneb Krátký průvodce skripty [1] a [2]

NÁHODNÁ ČÍSLA. F(x) = 1 pro x 1. Náhodná čísla lze generovat některým z následujících generátorů náhodných čísel:

Diskrétní náhodná veličina. November 12, 2008

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

MATEMATICKÁ STATISTIKA - XP01MST

Počet pravděpodobnosti

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY

GENEROVÁNÍ NÁHODNÝCH ČÍSEL PSEUDONÁHODNÁ ČÍSLA

Poznámky k předmětu Aplikovaná statistika, 5.téma

Přednáška. Diskrétní náhodná proměnná. Charakteristiky DNP. Základní rozdělení DNP

Normální (Gaussovo) rozdělení

Základy teorie pravděpodobnosti

pravděpodobnosti, popisné statistiky

Příklad 1. Řešení 1a. Řešení 1b. Řešení 1c ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 7

Analýza dat na PC I.

MATEMATICKÁ STATISTIKA

Výpočet pravděpodobností

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Základní typy pravděpodobnostních rozdělení

Normální (Gaussovo) rozdělení

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

PRAVDĚPODOBNOST A STATISTIKA

Určete zákon rozložení náhodné veličiny, která značí součet ok při hodu a) jednou kostkou, b) dvěma kostkami, c) třemi kostkami.

Národníinformačnístředisko pro podporu jakosti

Lineární regrese. Komentované řešení pomocí MS Excel

Pravděpodobnostní rozdělení

PSY117/454 Statistická analýza dat v psychologii přednáška 8. Statistické usuzování, odhady

15. T e s t o v á n í h y p o t é z

Fyzikální korespondenční seminář MFF UK

Náhodná veličina Číselné charakteristiky diskrétních náhodných veličin Spojitá náhodná veličina. Pravděpodobnost

Číselné charakteristiky a jejich výpočet

Charakterizace rozdělení

KGG/STG Statistika pro geografy

, 1. skupina (16:15-17:45) Jméno: se. Postup je třeba odůvodnit (okomentovat) nebo uvést výpočet. Výsledek bez uvedení jakéhokoliv

Náhodná veličina. Michal Fusek. 10. přednáška z ESMAT. Ústav matematiky FEKT VUT, Michal Fusek

PRAVDĚPODOBNOST A STATISTIKA

HODNOCENÍ VÝKONNOSTI ATRIBUTIVNÍCH ZNAKŮ JAKOSTI. Josef Křepela, Jiří Michálek. OSSM při ČSJ

Náhodné (statistické) chyby přímých měření

Protokol č. 1. Tloušťková struktura. Zadání:

Minikurz aplikované statistiky. Minikurz aplikované statistiky p.1

Někdy lze výsledek pokusu popsat jediným číslem, které označíme X (nebo jiným velkým písmenem). Hodíme dvěma kostkami jaký padl součet?

Tomáš Karel LS 2012/2013

8 Střední hodnota a rozptyl

Pomůcka pro cvičení: 3. semestr Bc studia

Stochastické signály (opáčko)

a způsoby jejího popisu Ing. Michael Rost, Ph.D.

Statistická analýza dat v psychologii. Věci, které můžeme přímo pozorovat, jsou téměř vždy pouze vzorky. Alfred North Whitehead

Náhodná proměnná. Náhodná proměnná může mít rozdělení diskrétní (x 1. , x 2. ; x 2. spojité (<x 1

Jednofaktorová analýza rozptylu

Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

1 Náhodný výběr a normální rozdělení 1.1 Teoretická a statistická pravděpodobnost

Na Katedře aplikované matematiky, FEI, VŠB-TU Ostrava se, zejména v souvislosti

Bayesovské metody. Mnohorozměrná analýza dat

Průzkumová analýza dat

KGG/STG Statistika pro geografy

STATISTICKÉ ZJIŠŤOVÁNÍ

8.1. Definice: Normální (Gaussovo) rozdělení N(µ, σ 2 ) s parametry µ a. ( ) ϕ(x) = 1. označovat písmenem U. Její hustota je pak.

Regresní analýza 1. Regresní analýza

8. Normální rozdělení

Vzorová písemka č. 1 (rok 2015/2016) - řešení

Všechno, co jste chtěli vědět z teorie pravděpodobnosti, z teorie informace a

Transkript:

Pravděpodobnostní rozdělení v MS Excel Luboš Marek Vysoká škola ekonomická v Praze, Praha Konzultace 1 Úvod Mezi statistickou obcí se často diskutuje, který statistický program je nejlepší, přičemž se tyto programy posuzují z různých hledisek Každý, kdo někdy pracoval s několika různými programy, ví, že na tuto jednoduchou otázku není jednoznačná odpověď Každý z programů má totiž některé slabší a některé silnější stránky, a tak asi nikoho nepřekvapí, když uvedeme, že statistický program si často vybíráme až na základě úlohy, kterou chceme zpracovat Podmínkou pochopitelně je, aby bylo z čeho vybírat Mezi programy, které by asi málokdo zařadil mezi statistické, patří i statistiky často odmítaný MS Excel Přitom, pokud pomineme nekvalitní, místy až zoufalý překlad z angličtiny v oblasti statistiky, se jedná o program, který umožňuje kvalitní aplikaci různých procedur, mnohdy na úrovni srovnatelné s procedurami ve specializovaných (a také daleko dražších) statistických programech Umožňuje např velmi snadnou aplikaci statistických funkcí z nejrůznějších oblastí Nesmíme totiž zapomínat, že právě jednoduché ovládání a dostupnost (tento tabulkový procesor je dnes instalován téměř na každém počítači) je velkou devizou tohoto programu V tomto článku bychom chtěli zhodnotit MS Excel z hlediska pravděpodobnostních rozdělení V první řadě zhodnotíme nabídku pravděpodobnostních rozdělení v tomto programu U každého rozdělení popíšeme možnosti výpočtů hodnot distribuční funkce a kvantilů a syntaxi příslušných funkcí U každého spojitého rozdělení uvedeme obrázek s ukázkou průběhu hustoty pravděpodobnosti pro konkrétní parametry (je ovšem třeba ihned poznamenat, že při jiné volbě parametrů bychom obdrželi jiný tvar hustoty) V závěru rovněž zhodnotíme možnosti generování náhodných hodnot z pravděpodobnostních rozdělení 2 Diskrétní rozdělení V oblasti diskrétních (nespojitých) rozdělení obsahuje MS Excel následující rozdělení, u kterých zároveň uvádíme název příslušné funkce: Jedná se tedy o naprosto základní typy rozdělení, navíc ne vždy je možné spočítat distribuční funkci a kvantily To ale není žádné neštěstí, neboť oboje jsme schopni poměrně snad- 6/2OO6 497

no spočítat z hodnot pravděpodobnostní funkce Podívejme se nyní na jednotlivá rozdělení podrobněji 21 Binomické rozdělení Náhodná veličina X má binomické rozdělení s parametry n a π, jestliže její pravděpodobnostní funkce má tvar Střední hodnota a rozptyl mají tvar V Excelu se jak pro distribuční funkci i pro pravděpodobnostní funkci používá funkce BINOMDIST Její argumenty mají následující význam: Úspěch x (počet úspěchů) Hodnota, ve které počítáme F(x) či P(x) Pokusy n (počet pokusů) Prst_úspěchu π Pravděpodobnost úspěchu Počet NEPRAVDA pro hodnotu pravděpodobnostní funkce P(x), PRAVDA pro hodnotu distribuční funkce F(x) 498

Jako pro jediné z nespojitých rozdělení je v Excelu uvedena i funkce pro výpočet kvantilů: CRITBINOM Její argumenty mají obdobný význam, jako u funkce BINOMDIST Pokusy n (počet pokusů) Prst_s π Pravděpodobnost úspěchu Alfa pravděpodobnost P pro hodnotu kvantilu x P 22 Negativně binomické rozdělení Náhodná veličina X má negativně binomické rozdělení s parametry n a π, jestliže její pravděpodobnostní funkce má pro n celočíselné tvar Připomeňme, že pro přirozená n můžeme náhodnou veličinu X chápat jako počet neúspěchů před n-tým úspěchem Úmyslně uvádíme pravděpodobnostní funkci ve zjednodušeném tvaru, neboť takto je chápána v Excelu Střední hodnota a rozptyl mají tvar 6/2OO6 499

V Excelu se pro pravděpodobnostní funkci používá funkce NEGBINOMDIST Její argumenty mají následující význam: Číslo_f x (počet neúspěchů před n-tým úspěchem) Hodnota, ve které počítáme F(x) či P(x) Číslo_s n (počet pokusů) Prst_s π Pravděpodobnost úspěchu Hodnoty distribuční funkce je nutné napočítat z hodnoty pravděpodobnostní funkce, stejně tak i hodnoty kvantilů Speciálním případem negativně binomického rozdělení je rozdělení geometrické Toto rozdělení obdržíme velmi snadno, pokud v negativně binomickém rozdělení položíme n=1 Potom se předchozí pravděpodobnostní funkce zjednoduší do tvaru Náhodnou veličinu X lze potom chápat jako počet neúspěchů před prvním úspěchem Pro střední hodnotu a rozptyl obdržíme V Excelu použijeme funkci NEGBINOMDIST, ve které položíme Číslo_s = 1 23 Poissonovo rozdělení Náhodná veličina X má Poissonovo rozdělení s parametrem λ, jestliže její pravděpodobnostní funkce má tvar 500

Střední hodnota a rozptyl mají tvar V Excelu se pro distribuční funkci i pro pravděpodobnostní funkci používá funkce POISSON Její argumenty mají následující význam: X x Hodnota, ve které počítáme F(x) či P(x) Střední λ Parametr a zároveň střední hodnota rozdělení Součet NEPRAVDA pro hodnotu pravděpodobnostní funkce P(x), PRAVDA pro hodnotu distribuční funkce F(x) 24 Hypergeometrické rozdělení Náhodná veličina X má hypergeometrické rozdělení s parametry N, M a n, jestliže její pravděpodobnostní funkce má tvar Přitom N, M a n jsou přirozená čísla, Střední hodnota a rozptyl mají tvar 6/2OO6 501

V Excelu se pro pravděpodobnostní funkci používá funkce HYPGEOMDIST Její argumenty mají následující význam: Úspěch x Hodnota, ve které počítáme P(x) Celkem n (rozsah výběru) Základ_úspěch M Počet prvků s vlastností M Základ_celkem N (rozsah základního souboru) 3 Spojitá rozdělení V oblasti spojitých rozdělení obsahuje MS Excel řadu rozdělení, u kterých opět uvádíme název příslušné funkce pro výpočet distribuční funkce, hustoty a kvantilu: Je tedy zřejmé, že nabídka spojitých rozdělení je podstatně širší, než je tomu u rozdělení nespojitých Pouze čtyři rozdělení však mají uveden vzorec pro výpočet hustoty, což v ostatních případech pochopitelně bude komplikovat její výpočet a případné grafické zobrazení V takových případech bude nutné zadat vzorec hustoty pravděpodobnosti ručně dle tvaru příslušné funkce 502

31 Normální rozdělení Náhodná veličina X má normální rozdělení s parametry µ a σ 2, jestliže její hustota pravděpodobnosti má tvar Střední hodnota a rozptyl mají tvar V Excelu se pro distribuční funkci a hustotu používá funkce NORMDIST Její argumenty mají následující význam: X x Hodnota, ve které počítáme F(x), resp f(x) Střed_hodn µ Parametr rozdělení a zároveň střední hodnota Sm_odch σ Parametr rozdělení a zároveň odmocnina z rozptylu (tedy směrodatná odchylka) Součet NEPRAVDA pro hodnotu hustoty f(x), PRAVDA pro hodnotu distribuční funkce F(x) 6/2OO6 503

Funkce pro výpočet kvantilů normálního rozdělení má v Excelu název NORMINV Jedná se skutečně o kvantilovou funkci F(x p ) = P, která má následující argumenty: Prst pravděpodobnost P pro hodnotu kvantilu x p Střední µ Parametr rozdělení a zároveň střední hodnota Sm_odch σ Parametr rozdělení a zároveň odmocnina z rozptylu (tedy směrodatná odchylka) Kromě normálního rozdělení s obecnými parametry µ a σ 2 nabízí Excel i normované normální rozdělení, tedy rozdělení s parametry µ = 0 a σ 2 = 1 32 Normované normální rozdělení Náhodná veličina U má normální rozdělení s parametry 0 a 1, jestliže její hustota pravděpodobnosti má tvar Střední hodnota a rozptyl mají tvar 504

V Excelu se pro distribuční funkci používá funkce NORMSDIST Tato funkce má jediný argument: Z u Hodnota, ve které počítáme F(u) Graf hustoty pravděpodobnosti pro normované normální rozdělení vytvořený v Excelu vidíme na následujícím obrázku Hodnoty hustoty pomocí funkce NORMSDIST počítat nelze, je třeba je napočítat z obecného normálního rozdělení při vhodné volbě parametrů To ostatně platí i pro hodnoty kvantilů 33 Logaritmicko normální rozdělení Náhodná veličina X má logaritmicko normální rozdělení s parametry µ a σ 2, jestliže její hustota pravděpodobnosti má tvar 6/2OO6 505

Střední hodnota a rozptyl mají tvar Připomeňme, že náhodná veličina Y = 1n(X), má potom normální rozdělení s parametry µ a σ 2 tedy přirozený logaritmus náhodné veličiny s logaritmicko normálním rozdělením má normální rozdělení se stejnými parametry µ a σ 2 V Excelu se pro výpočet hodnot distribuční funkce používá funkce LOGNORMDIST Její argumenty mají následující význam: X x Hodnota, ve které počítáme F(x) Střední µ Parametr rozdělení Pozor, nejedná se o střední hodnotu X, nýbrž o střední hodnotu ln(x) Sm_odchylka σ Parametr rozdělení Opět se nejedná o směrodatnou odchylku X, nýbrž o směrodatnou odchylku hodnoty ln(x) 506

Funkce pro výpočet kvantilů logaritmicko normálního rozdělení má v Excelu název LOGINV Jedná se o kvantilovou funkci F(x p ) = P, která má následující argumenty: Prst pravděpodobnost P pro hodnotu kvantilu x p Stř_hodn µ Parametr rozdělení a zároveň střední hodnota veličiny ln(x) Sm_odch σ Parametr rozdělení, odmocnina ze σ 2 Zároveň směrodatná odchylka veličiny ln(x) 34 Exponenciální rozdělení Náhodná veličina X má exponenciální normální rozdělení s parametrem λ, jestliže její hustota pravděpodobnosti má tvar 6/2OO6 507

Pokud položíme λ = 1 δ, dostali bychom tvar rozdělení, v jakém je obvykle uváděn v literatuře Tento tvar je prezentován pro hodnoty x > 0, neuvažujeme tedy možné posunutí A Střední hodnota a rozptyl mají tvar V Excelu se pro výpočet hodnot distribuční funkce a hustoty používá funkce EXPONDIST Její argumenty mají následující význam: X x Hodnota, ve které počítáme F(x), resp f(x) Lambda λ Parametr rozdělení Součet NEPRAVDA pro hodnotu hustoty f(x), PRAVDA pro hodnotu distribuční funkce F(x) Funkce pro výpočet kvantilů tohoto rozdělení není k dispozici S jejím výpočtem si však snadno poradíme, neboť pro 100P% kvantil exponenciálního rozdělení platí vztah 508

35 Weibullovo rozdělení Náhodná veličina X má Weibullovo rozdělení s parametry δ a c, jestliže její hustota pravděpodobnosti má tvar Střední hodnota a rozptyl mají tvar vyjádřený pomocí gama funkce Speciálním případem Weibullova rozdělení je pro c = 1 exponenciální rozdělení 6/2OO6 509

V Excelu se pro výpočet hodnot distribuční funkce a hustoty používá funkce WEIBULL Její argumenty mají následující význam: X x Hodnota, ve které počítáme F(x), resp f(x) Alfa c Parametr rozdělení Beta δ Parametr rozdělení Typ NEPRAVDA pro hodnotu hustoty f(x), PRAVDA pro hodnotu distribuční funkce F(x) Funkce pro výpočet kvantilů tohoto rozdělení není v Excelu k dispozici Pro výpočet 100P% kvantilu Weibullova rozdělení můžeme použít vztah 510

36 Studentovo rozdělení (t-rozdělení) Náhodná veličina X má Studentovo rozdělení s parametrem n (počet stupňů volnosti), jestliže její hustota pravděpodobnosti má tvar Střední hodnota existuje, pokud n > 1 a je rovna E(X) = 0 Rozptyl existuje, pokud n > 2 a je roven V Excelu se pro výpočet hodnot distribuční funkce používá funkce TDIST Pozor Excel nepočítá přímo hodnotu distribuční funkce, ale počítá P(X > x), tedy výraz 1 F(x)! Navíc není možné za x dosadit záporné číslo pro záporná x je tedy nutné využít symetrie Studentova rozdělení kolem nuly (F( x) = 1 F(x)) Argumenty funkce TDIST mají následující význam: X x Hodnota, ve které počítáme výraz 1 F(x) Volnost n Parametr rozdělení, počet stupňů volnosti Strany lze dosadit hodnoty 1 a 2 Pro 1 se počítá výraz 1 F(x), pro 2 se počítá pravděpodobnost 2*(1 F(x)), tj 1 P( x < X < x) = P( X > x) 6/2OO6 511

Funkce pro výpočet kvantilů Studentova rozdělení má v Excelu název TINV Výpočet kvantilů se přitom vymyká postupům u předchozích rozdělení Nepočítá se totiž kvantilová funkce, počítá se funkce kritických hodnot F (x p ) = P( X > x p ) = P Pro výpočet kvantilu tedy platí, že pro zadanou pravděpodobnost P počítá funkce TINV kvantil x 1 p/2 a pozor, nerespektuje se znaménko u kvantilu! Znaménko tedy musí uživatel doplnit sám tak, že od 0 do 50 % kvantilu přiřadí znaménko záporné, od 50 % do 100 % znaménko kladné Funkce TINV je tedy inverzní funkcí k TDIST pro hodnotu argumentu Strany = 2 a má následující argumenty: Prst pravděpodobnost P pro hodnotu kvantilu x 1 p/2 (až na znaménko) Volnost n Parametr rozdělení, počet stupňů volnosti 512

37 Fischer-Schnedecorovo rozdělení (F rozdělení) Náhodná veličina X má Fischer-Schnedecorovo rozdělení s parametry n a m (počty stupňů volnosti), jestliže její hustota pravděpodobnosti má tvar Střední hodnota existuje, pokud m > 2 a je rovna Rozptyl existuje, pokud M > 4 a je roven V Excelu se pro výpočet hodnot distribuční funkce používá funkce FDIST Pozor Excel nepočítá přímo hodnotu distribuční funkce, ale počítá P(X > x), tedy výraz 1 F(x)! Argumenty funkce FDIST mají následující význam: X x Hodnota, ve které počítáme výraz 1 F(x) Volnost1 n Parametr rozdělení, počet stupňů volnosti Volnost2 m Parametr rozdělení, počet stupňů volnosti 6/2OO6 513

Funkce pro výpočet kvantilů Fischer-Schnedecorova rozdělení má v Excelu název FINV Název je opět zavádějící, protože se nejedná o kvantilovou funkci, nýbrž o funkci kritických hodnot F (x p ) = P(X > x p ) = P Pro zadanou pravděpodobnost P se tedy počítá kvantil x 1 p! Funkce FINV má následující argumenty: Prst pravděpodobnost P pro hodnotu kvantilu x 1 p Volnost1 n Parametr rozdělení, počet stupňů volnosti Volnost2 m Parametr rozdělení, počet stupňů volnosti Při výpočtu kvantilů Fischer-Schnedecorova rozdělení můžeme využít vztah 514

38 Chí kvadrát rozdělení (χ 2 rozdělení) Náhodná veličina X má chí-kvadrát rozdělení s parametrem n (počet stupňů volnosti), jestliže její hustota pravděpodobnosti má tvar Střední hodnota a rozptyl mají tvar V Excelu se pro výpočet hodnot distribuční funkce používá funkce CHIDIST Pozor Excel nepočítá přímo hodnotu distribuční funkce, ale počítá P(X > x, tedy výraz 1 F(x)! Argumenty funkce CHIDIST mají následující význam: X x Hodnota, ve které počítáme výraz 1 F(x) Volnost n Parametr rozdělení, počet stupňů volnosti 6/2OO6 515

Funkce pro výpočet kvantilů chí-kvadrát rozdělení má v Excelu název CHINV Opět platí, že název je zavádějící, protože se nejedná o kvantilovou funkci, nýbrž o funkci kritických hodnot F (x p ) = P(X > x p ) = P Pro zadanou pravděpodobnost P se tedy počítá kvantil x 1 p! Funkce CHINV má následující argumenty: Prst pravděpodobnost P pro hodnotu kvantilu x 1 p Volnost n Parametr rozdělení, počet stupňů volnosti 39 Beta rozdělení (4 parametrické) Náhodná veličina X má Beta rozdělení s parametry a, b, α, β, jestliže její hustota pravděpodobnosti má tvar 516

Připomeňme, že B(α, β) je Beta funkce, definovaná jako Střední hodnota a rozptyl mají tvar Pokud bychom položili a = 0 a b = 1, obdržíme klasické dvouparametrické Beta rozdělení ve tvaru V Excelu se pro výpočet hodnot distribuční funkce používá funkce BETADIST Argumenty funkce BETADIST mají následující význam: X x Hodnota, ve které počítáme hodnotu distribuční funkce F(x) Alfa α, parametr rozdělení Beta β, parametr rozdělení A a, parametr rozdělení, dolní mez pro hodnoty x Jedná se o nepovinný argument B b, parametr rozdělení, horní mez pro hodnoty x Jedná se o nepovinný argument Pokud nejsou argumenty A a B zadány, automaticky platí A = 0 a B = 1 6/2OO6 517

Funkce pro výpočet kvantilů Beta rozdělení má v Excelu název BETAINV Jedná se o kvantilovou funkci F(x p ) = P(X < x p ) = P, která má následující argumenty: Prst pravděpodobnost P pro hodnotu kvantilu x p Alfa α, parametr rozdělení Beta β, parametr rozdělení A a, parametr rozdělení, dolní mez pro hodnoty x Jedná se o nepovinný argument B b, parametr rozdělení, horní mez pro hodnoty x Jedná se o nepovinný argument Pokud nejsou argumenty A a B zadány, automaticky platí A = 0 a B = 1 310 Gama rozdělení Náhodná veličina X má Gama rozdělení s parametry α, β, jestliže její hustota pravděpodobnosti má tvar 518

Připomeňme, že Γ(α) je Gama funkce, definovaná jako Střední hodnota a rozptyl mají tvar Excel nemá přímo funkci, která by počítala hodnoty funkce Gama Obsahuje však funkci GAMMALN, která vrací hodnotu přirozeného logaritmu funkce Gama Hodnotu Gama funkce v bodě α pak snadno získáme složením funkce EXP agammaln ve tvaru EXP (GAMMALN (α)) V Excelu rovněž není funkce Beta (viz předchozí rozdělení) Pro její výpočet je možné využít vztah Pro výpočet hodnot distribuční funkce rozdělení gama se v Excelu používá funkce GAMMADIST Argumenty funkce GAMMADIST mají následující význam: X x Hodnota, ve které počítáme hodnotu distribuční funkce F(x) Alfa α, parametr rozdělení Beta β, parametr rozdělení Součet NEPRAVDA pro hodnotu hustoty f(x), PRAVDA pro hodnotu distribuční funkce F(x) 6/2OO6 519

Funkce pro výpočet kvantilů Gama rozdělení má v Excelu název GAMMAINV Jedná se o kvantilovou funkci F(x p ) = P(X < x p ) = P, která má následující argumenty: Prst pravděpodobnost P pro hodnotu kvantilu x p Alfa α, parametr rozdělení Beta β, parametr rozdělení Pokud položíme parametr α = 1, obdržíme exponenciální rozdělení (λ = 1 / β) 4 Generování hodnot z pravděpodobnostních rozdělení Co se týče generování náhodných čísel (přesněji řečeno pseudonáhodných čísel), obsahuje MS Excel pouze jedinou funkci pro generování Jedná se o funkci NÁHČÍSLO, která 520

generuje hodnoty ze spojitého rovnoměrného rozdělení na intervalu (0,1) Hodnoty z dalších pravděpodobnostních rozdělení získáme vhodnou transformací Funkce NÁHČÍSLO má velmi jednoduchou syntaxi nemá totiž žádný argument Není tudíž bohužel ani možné nastavit počáteční hodnotu generátoru Navíc je potřeba počítat s tím, že hodnota této funkce se neustále přepočítává při každé editaci libovolné buňky (samozřejmě pokud je nastaven automatický přepočet tabulky, což je ale standardní nastavení) Chceme-li tedy generovat hodnoty z jiných pravděpodobnostních rozdělení, nezbývá než vyhledat vhodnou literaturu a aplikovat příslušné vzorce 5 Další pravděpodobnostní rozdělení Mohlo by se zdát, že nabídka pravděpodobnostních rozdělení v Excelu je proti statistickým programům chudá Nicméně je třeba si uvědomit, že není žádný problém zadat vhodným vzorcem výpočet pravděpodobnostní funkce či distribuční funkce pro libovolné nespojité rozdělení Poněkud složitější je situace u spojitých rozdělení I zde sice platí, že poměrně snadno spočítáme hustotu pravděpodobnosti pro libovolné rozdělení (tak ostatně byly konstruovány grafy hustot u rozdělení, u kterých Excel vzorec pro výpočet hustoty neobsahuje), horší je to však již při výpočtu distribuční funkce a příslušných kvantilů To však platí pouze v případě, že neznáme tvar distribuční funkce Tato situace je pak pro běžného uživatele (nestatistika) obtížně řešitelná V takovém případě nezbývá, než vyhledat tvar příslušné distribuční funkce v literatuře a zadat ho do Excelu ve formě vzorce (stejně jako při výpočtu hustoty) Bohužel však daleko častěji než vzorec distribuční funkce bývá publikován vzorec hustoty pravděpodobnosti 6 Přesnost výpočtů Na závěr je třeba uvést, že všechna uvedená pravděpodobnostní rozdělení byla v Excelu podrobně prozkoumána a přepočítána Dosažené výsledky (hodnoty pravděpodobnostní funkce, distribuční funkce, hustoty pravděpodobnosti, kvantilů) byly porovnávány s programem Statgraphics Centurion (trial verze) Tento program nám velmi pomohl, neboť v nápovědě obsahuje popis všech obsažených pravděpodobnostních rozdělení a hlavně ke 6/2OO6 521

každému rozdělení uvádí vzorec pravděpodobnostní funkce nebo hustoty pravděpodobnosti Srovnání dopadlo pro Excel velmi uspokojivě, neboť jsme nezaznamenali žádné výrazné rozdíly v obou programech Lze tedy konstatovat, že MS Excel (verze 2003) je, co se týče popsaných pravděpodobnostních rozdělení, zcela srovnatelný s tímto statistickým programem (ten má pochopitelně mnohem širší nabídku pravděpodobnostních rozdělení) Pokud se vyskytly nějaké rozdíly, byly většinou způsobeny tvarem parametrů rozdělení (Excel např počítá s převrácenou hodnotou parametru oproti Statgraphicsu apod) Pokud jsme však respektovali tyto odlišnosti, vycházely výsledky stejně Literatura [1] Nápověda k programu MS Excel [2] Nápověda k programu Statgraphics Centurion Luboš Marek, Katedra statistiky a pravděpodobnosti Vysoké školy ekonomické v Praze, nám W Churchilla 4, 130 67 Praha 3 - Žižkov, e-mail: marek@vsecz Abstract The aim of this article is to evaluate the offer of probability distributions in MS Excel Each division is firstly described theoretically (including formulas for the mean value and variance), further the way of calculating the values of probability or distribution function including their syntax is practically described as well Attention is also given to possibilities of calculating values of probability density in continuous distribution and quantiles In each continuous distribution a picture is given, showing the course of density probability for concrete parameters In the end a possibility of generating random values from continuous uniform distribution in the interval (01) is shown Key words: MS Excel, probability distribution, probability function, distribution function, probability density, quantile, critical value 522