MATEMATICKÉ METODY VYHODNOCOVÁNÍ EXPERIMENTŮ

Rozměr: px
Začít zobrazení ze stránky:

Download "MATEMATICKÉ METODY VYHODNOCOVÁNÍ EXPERIMENTŮ"

Transkript

1 MATEMATICKÉ METODY VYHODNOCOVÁNÍ EXPERIMENTŮ Miroslav Pokorný Moravská vysoká škola Olomouc, o. p. s. Olomouc 2010

2 Projekt Aplikovatelný systém dalšího vzdělávání ve VaV (dále jen APSYS) OP VK č. CZ.1.07/2.3.00/ je spolufinancován Evropským sociálním fondem a státním rozpočtem České republiky. Text neprošel jazykovou úpravou. Moravská vysoká škola Olomouc, o. p. s. Autor: Recenzovali: prof. Dr. Ing. Miroslav POKORNÝ prof. Dr. Zdeněk SOUČEK, DrSc. Mgr. Antonín SEDLÁČEK Olomouc 2010 ISBN

3 Obsah Úvod Matematická statistika... 7 Cíl Statistika a pravděpodobnost Náhodná veličina Funkční charakteristiky náhodné veličiny Číselné charakteristiky náhodné veličiny Shrnutí kapitoly Literatura ke kapitole Vlastnosti datových souborů Cíl Statistické datové soubory Vlastnosti reprezentativního datového souboru Shrnutí kapitoly Literatura ke kapitole Průzkumová analýza naměřených dat Cíl Ověření vlastností výběrového souboru Grafy identifikace vlastností výběrového souboru Histogram Ověření předpokladů o datech Shrnutí kapitoly Literatura ke kapitole Statistická analýza naměřených dat Cíl Cíle statistické analýzy Bodové odhady parametrů náhodné veličiny Intervalové odhady parametrů náhodné veličiny Vybrané typy funkcí rozloţení hustoty pravděpodobnosti Shrnutí kapitoly Literatura ke kapitole Testování statistických hypotéz Cíl Metoda statistických testů Testy o reprezentativnosti výběrového souboru Testy hypotéz o statistických parametrech jednoho souboru... 37

4 5.4 Testy hypotéz o statistických parametrech dvou souborů Shrnutí kapitoly Literatura ke kapitole Robustní metody statistické analýzy Cíl Robustní odhady parametrů Vyhodnocení malých výběrů Shrnutí kapitoly Literatura ke kapitole Zkoumání statistických závislostí Cíl Závislost náhodných veličin Shrnutí kapitoly Literatura ke kapitole Ekonomická statistika Cíl Statistika a ekonomie Statistické ukazatele a šetření Organizace statistických a šetření Shrnutí kapitoly Literatura ke kapitole Literatura Seznam obrázků Seznam tabulek... 58

5 Úvod Od odborných pracovníků (zvláště pak manaţerů) se stále více očekává, ţe budou rozhodovat především na základě logických úvah a důkladných analýz, nikoliv pouze intuitivně na základě svých zkušeností. Právě metody pro vyhodnocení statistických šetření jsou pro analýzu řešených problémů a následné rozhodování často pouţívány. Patří mezi tzv. kvantitativní metody a jsou určeny pro zdokonalení řešení našich profesních problémů a úloh. Můţeme říci, ţe slouţí podpoře a zdokonalení našeho profesního rozhodování. Pro úspěšné řešení všech rozhodovacích úloh jsou kromě odborných znalostí nutné také kvalitní informace, týkající se daného problému. Informace získáváme shromáţděním a analýzou nejrůznějších údajů. Údaje jsou obvykle číselná data nebo mají formu, kterou lze na číselná data převést. Údaje jsou přitom získávána různými metodami od pouţití měřicích přístrojů () aţ po akce hromadných průzkumů (šetření). O problematice vlastností ekonomických údajů a problematice jejich získávání pojednává kapitola 8. V této souvislosti je třeba poznamenat, ţe současná (superturbulentní) doba je v oblasti společenské a ekonomické charakterizována existencí silně nestacionárních jevů a procesů. Jejich modelování výlučně konvenčními matematicko-statistickými metodami je stále obtíţnější a výsledky, které jsou získány simulacemi pomocí takových modelů (např. predikce s vyuţitím extrapolací, trendů a řad) jsou často velmi odlišné od skutečnosti. Stoupá význam znalostí a metod, které jsou schopny je do procesu modelování a simulací zahrnout. To platí zvláště v oblasti taktického a strategického rozhodování. V praxi jsou veškerá měření zatíţena řadou vlivů, které způsobují chyby odchylky velikosti hodnot naměřených od jejich hodnot skutečných. Vlivy, které tyto odchylky způsobují, nelze ve většině případů exaktně popsat ani předvídat jsou nahodilé, náhodné. Měřené hodnoty tak získávají charakter náhodné veličiny (charakter nahodilý, stochastický). Charakteristickou vlastností je skutečnost, ţe velikost takové náhodné veličiny nelze zjistit naprosto přesně - lze jen vypočítat odhad velikosti takové hodnoty a stanovit interval, v němž se bude její přesná hodnota nacházet (vţdy ale pouze s určitou pravděpodobností). Náhodné veličiny jsou ve své podstatě sloţitější, neţ veličiny nenáhodné (deterministické). Proto je problematika jejich měření a vyhodnocování rovněţ sloţitější. Veškerá vyhodnocení vycházejí ze zpracování souborů dat, naměřených na studovaných objektech. Podmínky, za kterých jsou soubory dat pořizovány, mají rozhodující vliv na kvalitu vyhodnocených výsledků. Cílem statistického vyhodnocení datových souborů je pak získání grafických nebo numerických charakteristik, které kvantitativně vyjadřují základní vlastnosti těchto souborů a tím i náhodných veličin, které tyto soubory reprezentují. Zdůrazněme znovu, ţe kvalita výsledků, získaných aplikací metod statistické analýzy na konkrétních souborech naměřených dat, je přímo závislá na vlastnostech těchto souborů. V případě nevhodných vlastností datových souborů je pouţití mnohých metod (tak jak se často stává) nekorektní výsledky, které dostaneme, neodpovídají skutečnosti. Vlastnosti datových souborů jsou přitom dány způsobem, jakým jsou data získána. Učební látka zahrnuje vysvětlení metody správného měření (získávání datových souborů) a metod zpracování naměřených dat (statistických analýz). Důraz je kladen na vysvětlení významu tzv. průzkumových (předsledných, exploratorních) analýz, které mají za úkol poskytnout předběţné - 5 -

6 informace o kvalitě souborů před jejich vlastním statistickým zpracováním. Text seznamuje s moţnostmi nápravy nevhodných vlastností souborů a způsobem výběru takových metod statistické analýzy, které zajistí i v případech ne zcela vhodných datových souborů maximální moţnou správnost výsledků. V textu je uvedena řada odkazů na odbornou literaturu, v nichţ lze nalézt podrobnější informace. Velkým přínosem pro kvalitu výsledků statistického zpracování dat znamenalo rozšíření počítačů, které přineslo moţnost vyuţití specializovaných programů. I kdyţ úkolem našeho kurzu není dokonalé zvládnutí takových programů, je třeba se o nich zmínit. Dovolují nejen rychlé provádění komplikovaných výpočtů, ale umoţňují hlavně zvolit z velkého počtu různých statistických metod metodu vhodnou, a to podle vlastností datového souboru a podle toho, jakou informaci z něj pro naši další práci máme získat. Pro podporu statistických výpočtů mají dnes odborníci k dispozici nabídku řady specializovaných interaktivních programových balíků (STATGRAPHIC, ADSTAT, MATLAB- Statistics Toolbox, S-PLUS). Pro naši potřebu můţe být zajímavý statistický paket NCSS (Number Cruncher Statistical Systems) jako universální soubor statistických procedur, doporučovaný zejména uţivatelům nestatistikům. Pokud jsou obrázky, uvedené v textech jednotlivých kapitol, vytištěny z počítačové předlohy, byl k jejich vytvoření pouţit Statistic Tool Box systému MATLAB. Vyuţitím programových paketů se statistické výpočty zpracování dat stávají zcela rutinními procedurami a záleţí pouze na jejich uţivatelích, aby byly správně pouţívány, aby výsledky statistických analýz byly korektní a efektivní pro správné rozhodování. Neţ se začneme věnovat obsahu dalších kapitol, ujasníme si problém jejich pochopení z hlediska našich dosavadních znalostí zvláště znalostí matematiky. Statistické metody jsou metodami exaktními, jejich vysvětlení a popis není proto moţný bez pouţití matematického formálního aparátu (matematické výrazy, rovnice, nerovnosti a relace). Texty kapitol musí být doprovázeny matematickými vztahy. Kvůli úplnosti a praktické použitelnosti textu jsou do nezbytné hloubky vysvětleny. Nemusíme se jich obávat. Matematická statistika však (aţ na výjimky) nevyuţívá aparátu vyšší matematiky a proto jsou pouţité vztahy jednoduché. V textech (aţ na výjimku) nebylo třeba pouţít vztahů, vyuţívajících diferenciálního a integrálního počtu. Vztahy, pouţité pro vysvětlení principů, jsou jednoduché a dobře pochopitelné i se znalostí středoškolské matematiky. Jiné, sloţitější, jsou prezentovány z důvodů komplexnosti a homogenity látky, pro orientaci těch čtenářů, kteří se statistikou zabývají nebo budou zabývat prakticky. Nejsou v ţádném případě určeny k učení nazpaměť. Systematicky se texty odvolávají na odbornou literaturu, uvedenou v seznamu. V těchto pramenech naleznou rovněž zájemci bližší vysvětlení původu hodnot řady empirických číselných konstant, které jsou pro řadu statistických vztahů charakteristické. Kapitoly také (z důvodu omezeného rozsahu) nezahrnují ţádné řešené příklady a není v nich ani zařazena příloha se statistickými tabulkami (které jsou pro řešení statistických úloh nezbytné). Příklady praktického použití všech v textu uvedených metod a statistických tabulek budou hlavní náplní tutoriálů, které jsou součástí kurzů. Učební látka představuje pouze základy matematické statistiky a její aplikace v ekonomii, prohloubení znalostí je věcí dalšího studia odborné literatury nebo dalších specializovaných kurzů

7 1 Matematická statistika CÍL Po prostudování budete umět: charakterizovat teorie pravděpodobnosti a matematickou statistiku, definovat náhodnou veličinu a její charakteristiky, vyjmenovat a popsat charakteristiku funkční a praktické vyuţití charakteristik číselných. KLÍČOVÁ SLOVA Matematická pravděpodobnost, matematická statistika, náhodná veličina, funkční charakteristiky, funkce rozloţení hustoty pravděpodobnosti, číselné charakteristiky, charakteristiky polohy, charakteristiky rozptýlení, charakteristiky tvaru. 1.1 Statistika a pravděpodobnost Pojmem statistiky můţe být chápán v několika svých významech, které však spolu v praxi úzce souvisí [1]: Statistiku tedy chápeme jako: údaj nebo souhrn údajů (datový soubor), který byl získán sběrem nebo dalším zpracováním. praktickou činnost, spočívající ve sběru, zpracování a vyhodnocování číselných údajů. vědní disciplínu, která se zabývá metodami sběru, zpracování a vyhodnocování číselných údajů. V souvislosti se statistikou vznikla a byla široce rozpracována jiná matematická disciplína teorie pravděpodobnosti. Zjednodušeně lze říci, ţe statistika zkoumá hromadné jevy, kdeţto teorie pravděpodobnosti zkoumá jevy individuální, jedinečné. Pravděpodobnost, jak uvidíme dále, je přitom chápána jako šance, zda daný jev nastane nebo nikoliv. Statistika a teorie pravděpodobnosti spolu velmi úzce souvisí, neboť představují dva pohledy na stejný problém. Kaţdý hromadný jev je totiţ tvořen jednotlivými jevy individuálními a naopak opakováním individuálního jevu získáme jev hromadný. V současné době nelze teorii pravděpodobnosti a statistiku od sebe oddělit teorie pravděpodobnosti je povaţována za součást moderní statistiky a tvoří její teoretický základ. Původní, tzv. popisná (deskriptivní) statistika byla rozvinuta do statistiky matematické. Matematická statistika na základě teorie pravděpodobnosti umoţňuje - 7 -

8 získat kvalifikované závěry (odhady) o sledovaném jevu i z menšího počtu dat (údajů). Nové statistické postupy otevřely moţnosti pro průzkumy veřejného mínění, namátkové testy a další postupy, ve kterých z vlastností části usuzujeme na chování celku. Statistika byla zpočátku vyuţívána spíše ve vědách přírodních a technických, dnes však zaznamenává rozvoj svých aplikací v disciplínách humanitního charakteru, například v psychologii, sociologii a ekonomii. 1.2 Náhodná veličina Jak jiţ bylo řečeno, praktická měření jsou zatíţena řadou vlivů, které způsobují chyby - odchylky velikosti hodnot naměřených od jejich hodnot skutečných (okolní teplota, únava pozorovatele, nálada respondenta apod.). Důsledky těchto vlivů nelze exaktně popsat ani predikovat. Měřené hodnoty pak získávají charakter náhodné veličiny, u níţ nelze určit její velikost a lze jen stanovit odhady jejích charakteristik a intervaly, v němţ se budou skutečné hodnoty charakteristik nacházet s určitou pravděpodobností. Seznámíme se nyní se základními pojmy teorie náhodných veličin [3], [1]. Uvaţujme jev A, který můţe být výsledkem daného pokusu (respondent odpoví ano ). Předpokládejme, ţe jsme pokus opakovali n-krát a ţe v sérii těchto n pokusů jev A nastal k-krát. Pravděpodobnost jevu A označíme. Rovnice 1.1 Jestliţe pak vykonáme za určitých, a to nezměněných (reprodukovatelných) podmínek, velké mnoţství pokusů (přičemţ v kaţdém z nich jev A nastat můţe nebo nemusí), pak pravděpodobnost P(A) bude konvergovat k určité konstantní hodnotě, kterou označíme p(a) a nazveme ji statistickou pravděpodobností jevu A, přičemţ hodnota odpovídá velikosti vypočítané v případě nekonečně mnoha pokusů. Rovnice 1.2 Problémem matematické statistiky je skutečnost, ţe nekonečného počtu pokusů nelze dosáhnout. Dále budeme proto pracovat s pravděpodobností. Počet pokusů n jak uvidíme dále by měl být vţdy co největší. Pro velikost pravděpodobnosti jevu A pak platí, ţe: Rovnice 1.3 kdy pravděpodobnost jevu jistého je nemoţného je P(A) = 0. a pravděpodobnost jevu - 8 -

9 1.3 Funkční charakteristiky náhodné veličiny Náhodná veličina je definována svými charakteristikami. Základní charakteristikou je charakteristika funkční. Pokud známe její tvar (nebo analytické vyjádření), pak známe náhodnou veličinu dokonale. Diskrétní náhodná veličina můţe nabývat pouze určitých hodnot. Uvaţujme diskrétní náhodnou veličinu X a mnoţinu jejích hodnot Rovnice 1.4 Kaţdá z hodnot x i je moţná, ale není jistá, náhodná proměnná X jí můţe nabýt pouze s určitou pravděpodobností, kterou označíme. Označme dále: Rovnice 1.5 Funkce p(x) se nazývá se funkce rozloţení pravděpodobnosti náhodné veličiny X. Uvaţujme nyní náhodnou veličinu X, která můţe nabývat nekonečně mnoha hodnot z intervalu reálných čísel (je definována na intervalu, ). Taková náhodná veličina je nazývána spojitou náhodnou veličinou. Její funkční charakteristika se nazývá funkce rozloţení hustoty pravděpodobnosti (někdy zkráceně hustota pravděpodobnosti). Tato funkce má následující vlastnosti: pravděpodobnost, ţe náhodná veličina nabude hodnot z intervalu a, b je rovna ploše pod křivkou f(x) omezenou hodnotami a,b, coţ lze matematicky vyjádřit velikostí integrálu Rovnice 1.6 celková plocha pod křivkou je rovna jedné, neboť pravděpodobnost, ţe náhodná veličina X nabude některé z hodnot intervalu ( je rovna 1 (jistota). Rovnice 1.7 Tyto vlastnosti funkce jsou znázorněny na obrázku 1.1a b, kde je nakreslen moţný příklad jejího tvaru. Tvar křivky můţe být různý závisí na vlastnostech (neboli typu) konkrétní náhodné veličiny. S některými typy se seznámíme v kap

10 Vlastnosti funkce rozložení hustoty pravděpodobnosti Obrázek 1.1 Funkce rozloţení hustoty pravděpodobnosti náhodné veličiny f(x) je nositelem úplné informace o vlastnostech náhodné veličiny X. Problémem je, ţe získat její tvar (případně analytické vyjádření) můţe být velmi obtíţné. V praxi se (naštěstí) bez této funkce obejdeme, známe-li alespoň její vybrané parametry. Tyto parametry nazýváme číselnými charakteristikami náhodné veličiny. 1.4 Číselné charakteristiky náhodné veličiny Funkční charakteristiky jsou obtíţně dosaţitelné a navíc mnohdy i málo přehledné. Pro lepší představu o chování náhodné veličiny proto hledáme častěji její číselné charakteristiky, které jsou významnými parametry křivky. Číselné charakteristiky náhodné veličiny (často nazývané jejími momenty), dělíme do tří skupin: charakteristiky polohy nás informují o střední hodnotě (středu) rozloţení. Kromě střední hodnoty patří mezi charakteristiky polohy i tzv. medián, modus a kvantily. Střední hodnota náhodné veličiny vţdy odpovídá poloze maxima na křivce a udává, jak je poloha křivky posunuta ve směru vodorovné osy souřadnic. charakteristiky rozptýlení (variability) udávají, v jak velké míře kolísají (jsou rozptýleny) hodnoty náhodné veličiny kolem své střední hodnoty. Patří sem disperze (rozptyl) a směrodatná odchylka. Čím má náhodná veličina větší rozptyl, tím je křivka širší a niţší. charakteristiky tvaru, tedy šikmosti které udávají nesouměrnost křivky vzhledem k její střední hodnotě - a špičatosti, které hodnotí, jak dalece je křivka funkce rozloţení hustoty pravděpodobnosti f(x) ve střední hodnotě špičatá. Patři sem koeficient šikmosti (asymetrie) resp. koeficient špičatosti (excesu) Jak vidíme, číselné charakteristiky reprezentují tvar funkční charakteristiky a jsou schopny zastoupit celý její průběh. Jako čísla mají ten význam, ţe je můţeme pouţít dále ve všech výpočtech

11 V tomto místě jsme uvedli pouze vysvětlení významu charakteristik náhodné veličiny pro pochopení látky v kapitole následující. V této souvislosti bylo třeba pouţít některé pouze částečně a jen kvalitativně vysvětlené pojmy (charakteristiky polohy, rozptýlení a tvaru). Vztahy pro výpočet velikosti odpovídajících číselných charakteristik závisí na typu náhodné veličiny a budou uvedeny v kap. 4. SHRNUTÍ KAPITOLY Teorie pravděpodobnosti a matematická statistika se jako vědní obory zabývají studiem vlastností a vyhodnocováním charakteristik náhodných veličin. Náhodná veličina je zatíţena řadou vlivů, které způsobují takové změny její velikosti, které nelze predikovat. Měřené hodnoty náhodné veličiny mají stochastický charakter. Přesné charakteristiky náhodné veličiny určit nelze, lze jen stanovit intervaly, v nichţ se budou hodnoty těchto charakteristik nacházet s určitou pravděpodobností. Nejdůleţitější funkční charakteristikou náhodné veličiny je funkce rozloţení její hustoty pravděpodobnosti. Prakticky významné jsou číselné charakteristiky, které představují relevantní parametry funkce rozloţení. Nejdůleţitější číselné charakteristiky náhodné veličiny jsou její střední hodnota a rozptyl. Tyto parametry pouţíváme pro reprezentaci náhodné veličiny při jejím pouţití ve výpočtech. ÚKOLY 1. Vysvětlete oblasti zájmu vědních oborů teorie pravděpodobnosti a matematické statistiky! 2. Jak vypočítáte pravděpodobnost náhodného jevu? 3. Jaký praktický význam má funkce rozloţení hustoty pravděpodobnosti náhodné veličiny? 4. Popište vzájemnou souvislost mezi funkcí rozloţení hustoty pravděpodobnosti, střední hodnotou a rozptylem náhodné veličiny! LITERATURA KE KAPITOLE Základní literatura: [1] HÁJOVSKÝ, R., POKORNÝ, M., KOZUB, R. Statistické zpracování měřených dat I. Ostrava: FEI VŠB-TUO, [2] FRIEDRICH, V. Statistika pro ekonomy Ekonomické ukazatele a statistické zjišťování [on line]. [cit ]. Dostupný z WWW: <moodle.vsb.cz/statistika/01.pdf>

12 Doporučená literatura: [3] LIKEŠ, J., MACHEK, J. Matematická statistika. Praha: SNTL,

13 2 Vlastnosti datových souborů CÍL Po prostudování budete umět: vysvětlit poţadavky na vlastnosti výběrového souboru, vyjmenovat základní výsledky statistické analýzy souboru, porozumět principu vyhodnocení vlastností náhodné veličiny. KLÍČOVÁ SLOVA Náhodný výběr hodnot, výběrový soubor prvků, reprezentativnost souboru, rozsah výběrového souboru, střední hodnota, rozptyl. 2.1 Statistické datové soubory Jedním ze základních předpokladů pouţití matematické statistiky pro potlačení chyb měření, vzniklých působením náhodných vlivů, je moţnost pořízení souboru dostatečného počtu pozorovaných (měřených) hodnot sledované veličiny za reprodukovatelných podmínek. Tento poţadavek můţe být hlavním problémem při realizaci konkrétních měření. Nesplnitelnost předpokladů vede k v praktických případech k pořízení datových souborů, jejichţ vlastnosti nezaručují korektnost pouţití metod statistické analýzy a vedou k získání výsledků, které jsou v rozporu se skutečností. V etapě získávání dat (měření) vytváříme náhodný výběr dat, jehoţ prvky (jednotlivá měření, pozorování) náhodnou veličinu reprezentují. Podstatné je získat tzv. reprezentativní náhodný výběr, který je základním předpokladem korektnosti pouţití statistických metod pro vyhodnocení výsledků měření. Úplným (případně základním) souborem rozumíme mnoţinu všech moţných (někdy i nekonečně mnoha) hodnot náhodné veličiny. Všechny hodnoty však mnohdy získat nemůţeme a proto omezeným měřením získáme soubor výběrový vlastně náhodný výběr hodnot z úplného souboru. Aby výsledky statistické analýzy takového náhodného výběru byly správné - odpovídaly parametrům souboru úplného musí mít výběrový soubor určité vlastnosti musí být reprezentativní [1], [2]. 2.2 Vlastnosti reprezentativního datového souboru Statistickým vyhodnocením úplného (základního) souboru dat bychom obdrţeli přesné (deterministické) hodnoty parametrů náhodné veličiny. Jelikoţ však máme

14 k dispozici pouze výběrový soubor - konečnou mnoţinu dat, výběr z mnoţiny úplné (někdy nekonečné) - nemůţeme jeho statistickým vyhodnocením získat parametry deterministické, nýbrţ opět jen stochastické (které mají opět charakter náhodných veličin!). Tyto parametry musíme povaţovat pouze za odhady skutečných hodnot parametrů. Jde nyní o to, aby tyto odhady (statistické odhady) byly co nejbliţší hodnotám skutečným, abychom se nedopustili nepřípustných chyb. Prvním předpokladem kvality statistických odhadů je jak jsme jiţ uvedli - pořízení reprezentativního výběrového souboru. Znaky takového reprezentativního výběru jsou: vzájemná nezávislost jednotlivých prvků výběru velikost jednoho prvku nesmí být ovlivněna velikosti prvku jiného (např. předcházejícího), homogenita výběru - podmíněná tím, ţe všechny prvky výběru pocházejí ze stejného druhu rozloţení hustoty pravděpodobnosti výběrový soubor nesmí být sloţen z více podsouborů odlišných náhodných veličin, stejná pravděpodobnost všech prvků ţe budou do výběru zařazeny, ţádná hodnota nesmí být upřednostněna před ostatními. Významnou podmínkou korektnosti výběrového souboru je, aby všechna měření byla provedena za stejných podmínek (podmínka reprodukovatelnosti podmínek měření). Prvotním úkolem pracovníka, který organizuje etapu získání dat (etapu měření viz kap.8), je vyloučení vlivů, které by mohly reprezentativnost budoucího souboru porušit. Prvotním úkolem pracovníka, který pak přistupuje ke statistické analýze výběrového souboru, musí být ověření vlastností tohoto souboru a potvrzení jeho reprezentativnosti. Základním výsledkem statistické analýzy jsou odhady charakteristik vyhodnocované náhodné veličiny. Jsou to obvykle typ funkce rozloţení hustoty pravděpodobnosti měřené náhodné veličiny. střední (nejpravděpodobnější) hodnota náhodné veličiny disperze (rozptyl) - rozptýlení hodnot náhodné veličiny kolem této střední hodnoty Základním předpokladem správnosti získaných výsledků je poţadavek, aby parametry náhodné veličiny, získané analýzou výběrového souboru jako jejich odhady, se co nejméně odlišovaly od parametrů skutečných, tedy takových, které bychom získali analýzou úplného souboru (kdybychom jej měli k dispozici). Jak ukáţeme dále, jsou vlastnosti souboru velice významně ovlivněny jeho rozsahem počtem naměřených hodnot n. Lze říci, ţe čím je rozsah souboru větší, tím přesnější odhady velikostí parametrů náhodné veličiny (střední hodnota, rozptyl) jsme schopni získat. Platí, ţe přesnost a spolehlivost všech statistických výpočtů je přímo úměrná rozsahu výběrového souboru

15 V mnohých případech není moţné dostatečně velký počet měření získat (důvody časové, ekonomické, věcné). V takových případech se musíme spokojit s malým rozsahem souboru a k analýze musíme pouţít speciální metody (metody robustní viz kap. 6). Jak uvidíme, lze stanovit minimální nutný počet měření, potřebný k dosaţení předem stanovené (poţadované) přesnosti výpočtů. Problematika získávání datových souborů v ekonomii je uvedena v kap. 8. SHRNUTÍ KAPITOLY Vlastnosti náhodné veličiny vyšetřujeme prostřednictvím výběrového souboru jejích naměřených dat. Výběrový soubor musí splňovat podmínky reprezentativnosti. Vyhodnocením náhodného výběru hodnot získáme pouze odhady charakteristik náhodné veličiny, skutečné hodnoty bychom mohli získat ze souboru základního. Ten obsahuje všechny moţné hodnoty náhodné veličiny a není proto prakticky dostupný. ÚKOLY 1. Definujte základní a výběrový soubor hodnot náhodné veličiny! 2. Jaké jsou vlastnosti reprezentativního náhodného výběru? 3. Jmenujte náhodnou veličinu, u níţ lze získat základní soubor jejích hodnot! LITERATURA KE KAPITOLE Základní literatura: [1] HÁJOVSKÝ, R., POKORNÝ, M., KOZUB, R. Statistické zpracování měřených dat I. Ostrava: FEI VŠB-TUO, Doporučená literatura: [2] LIKEŠ, J., MACHEK, J. Matematická statistika. Praha: SNTL,

16 3 Průzkumová analýza naměřených dat CÍL Po prostudování budete umět: vyjmenovat základní metody průzkumové analýzy, charakterizovat grafy identifikace vlastností souboru a pouţít je v praxi, ověřit předpoklady o naměřených datech, porozumět významu průzkumové analýzy statistického souboru dat. KLÍČOVÁ SLOVA Průzkumová analýza, kvantil, diagram rozptýlení, krabicový graf, histogram, předpoklady o vlastnostech naměřených dat, vybočující data. 3.1 Ověření vlastností výběrového souboru Ověření vlastností výběrového souboru provádíme pomocí metod, které jsou zahrnuty do tzv. průzkumové analýzy, kterou nesmíme nikdy vynechat. Průzkumová analýza poskytuje také mnohé moţnosti ke zlepšení vlastností výběrového datového souboru, coţ vede k získání lepších výsledků statistické analýzy [1]. Úkolem průzkumové analýzy dat je prvotní zhodnocení jejich vlastností s cílem stanovení předpokladů pro jejich následné statistické zpracování. Jejím cílem je především nalezení zvláštností statistického chování dat. Jako metody průzkumné analýzy pouţíváme pouze takové, které nejsou ovlivněny typem vyšetřované náhodné veličiny. Pro pochopení konstrukce a významu nástrojů průzkumové analýzy je nutno vysvětlit pojem tzv. kvantilů. Kvantily jsou zvláštním druhem číselných charakteristik polohy. Označujeme je jako P-kvantily. Jsou to vybrané hodnoty výběrového souboru studované náhodné veličiny. Kvantily P-procentní kvantil je taková hodnota náhodné veličiny x, která má tu vlastnost, ţe pod ní leţí p% procent prvků náhodného výběrového souboru. Tak např. 100procentní kvantil je největší prvek souboru (všechny ostatní leţí velikostí pod ním), 60procentní kvantil je takový prvek, pod ním svojí velikostí leţí 60% zbývajících prvků souboru apod. Význam kvantilů ve statistice bude vysvětlen v dalších podkapitolách a kapitolách

17 3.2 Grafy identifikace vlastností výběrového souboru Jednou z nejjednodušších metod průzkumové analýzy výběrového souboru je konstrukce identifikačních grafů. Jednotlivé grafy identifikace poskytují informace o velmi důleţitých statistických rysech výběru, jako je stupeň symetrie výběru, stupeň rozptylu výběru, lokální koncentrace (shluky) dat přítomnost abnormálních (vybočujících) dat. Tyto rysy jsou velice důleţitými informacemi, které nám umoţňují na jedné straně předběţně odhadnout tvar funkce rozdělení hustoty pravděpodobnosti výběrového souboru, odhalit nehomogenity souboru a upozornit na existenci takových dat, které se od hodnot ostatních hrubě odlišují a mohou, jak bude ukázáno dále, reprezentativnost výběrového souboru významně poškodit. Uvaţujme výběrový soubor sloţený z n jednotlivých prvků (naměřených hodnot). Seřaďme hodnoty podle velikosti (od nejmenší po největší 3.1). ) a vynesme je podle velikosti do řady na vodorovnou osu (obrázek Diagram rozptýlení Diagram rozptýlení Obrázek 3.1 Získáme tzv. graf rozptýlení (hodnot náhodné veličiny ve výběrovém souboru). Je to sice primitivní graf, odhalí však okamţitě lokální koncentrace dat (je-li jich více neţ jedna, svědčí to o nehomogenitě výběrového souboru data nepatří pouze jedné náhodné veličině, nebyly dodrţeny poţadavky opakovatelnosti podmínek měření) a velmi nebezpečné abnormální (vybočující) hodnoty měření. Náhodná veličina s grafem rozptýlení na Obrázku 3.1 má zřejmě symetrickou funkci, výběrový soubor je homogenní (pouze jeden shluk přibliţně uprostřed grafu) a neobsahuje zřejmě vybočující data. Jestliţe koncentrace dat v určitých úsecích diagramu znepřehledňuje obraz, použijeme rozmítnutého diagramu rozptýlení (vychýlením některých hodnot ve směru svislé osy) podle Obrázku

18 Rozmítnutý diagram rozptýlení Obrázek 3.2 Krabicový graf Pro lepší informaci o vlastnostech výběrového souboru vyuţijeme tzv. krabicového grafu, který umoţňuje určení mediánu M jako charakteristiky polohy (střední hodnoty) identifikaci odlehlých dat. Krabicový graf (Obrázku 3.3) je konstruován jako obdélník o délce Rovnice 3.1 souboru. kde je 75procentní (horní) a 25procentní (dolní) kvantil výběrového V místě mediánu je obdélník rozdělen vertikální čarou. Od obou protilehlých stran obdélníku pokračují úsečky, které jsou ukončeny tzv. přilehlými hodnotami a. Tyto hodnoty leţí uvnitř tzv. vnitřních hradeb nejblíţe k jejich hranicím a : Rovnice 3.2 Rovnice 3.3 Významné je, ţe prvky výběrového souboru, leţící mimo vnitřní hradby, jsou povaţovány za podezřelé a jako takové mohou být ze souboru vyloučeny jako hodnoty vybočující (odlehlé). Na Obrázku 3.3 jsou vybočující data jsou označena kříţky. Tvar grafu svědčí o mírné nesymetrii křivky. Krabicový graf Obrázek

19 Obdobou krabicového grafu je vrubový krabicový graf, který umoţňuje posoudit navíc variabilitu (rozptyl) mediánu. Ta je vyjádřena intervalem, pro jehoţ meze platí vztahy: Rovnice 3.4 Rovnice 3.5 Interval rozptylu mediánu je na obrázku 3.4 vyznačen tečkovanými čarami, vybočující data jsou opět označena kříţky. Vrubový krabicový graf Obrázek 3.4 Krabicové grafy se pouţívají také často k porovnání dvou výběrů. Dobře indikují asymetrii rozdělení a podezřelá měření. 3.3 Histogram Histogram je jedna z nejstarších metod odhadu tvaru funkce rozloţení hustoty pravděpodobnosti. Jde o obrys sloupcového grafu, kde jsou na ose x vyneseny tzv. třídy definující počet (a tedy i šířku) sloupců, přičemţ výšky sloupců odpovídají empiricky zjištěným hustotám pravděpodobnosti jako četnosti výskytu hodnot v jednotlivých třídách. Setřídění dat do tříd předpokládá určení počtu tříd L, který kvalitu histogramu značně ovlivňuje. Pro přibliţně symetrická rozloţení výběru volíme Rovnice 3.6 nebo empiricky pro široké rozmezí velikosti výběru n Pro rozloţení, u nichţ předpokládáme přibliţnou symetrii, volíme délku třídních intervalů konstantní. Rovnice

20 Na Obrázku 3.5 je nakreslen příklad histogramu, které naznačuje moţný typ funkce f(x) odpovídající funkci Gaussova rozloţení hustoty pravděpodobnosti. Histogram homogenního souboru s Gaussovým rozložením Obrázek 3.5 Histogramy jsou velmi důleţitou metodou průzkumové analýzy, protoţe dovolují předběţně posoudit nejen velikost číselných charakteristik, ale i tvar funkce rozloţení hustoty pravděpodobnosti tedy typu analyzované náhodné veličiny. Histogram známe např. jako grafickou metodu posouzení kvality snímku (rozdělení jasů) digitálního fotoaparátu. 3.4 Ověření předpokladů o datech V minulé podkapitole jsme uvedli ty metody průzkumové analýzy, které umoţňují získat rychle a spolehlivě základní informace o typu rozloţení náhodné veličiny a o homogenitě souboru. Nyní si ukáţeme, jak lze ověřit, zda rozsah výběrového souboru je pro naše potřeby dostatečný, zda neobsahuje vybočující data a zda můţeme předpokládat, ţe náhodná veličina má normální rozloţení hustoty pravděpodobnost. Ověření minimální velikosti výběru Jak jiţ bylo řečeno a bude ukázáno i dále, počet naměřených hodnot (tzv. rozsah) výběru n je pro kvalitu statistické analýzy velmi významný. U velmi malých výběrů se stává, ţe přesnost výsledků statistických výpočtů jsou více ovlivněny hodnotou velikosti výběru n neţ variabilitou dat!

Normální (Gaussovo) rozdělení

Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení popisuje vlastnosti náhodné spojité veličiny, která vzniká složením různých náhodných vlivů, které jsou navzájem nezávislé, kterých je velký

Více

Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012. Tutoriál č. 4: Exploratorní analýza. Jan Kracík

Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012. Tutoriál č. 4: Exploratorní analýza. Jan Kracík Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012 Tutoriál č. 4: Exploratorní analýza Jan Kracík jan.kracik@vsb.cz Statistika věda o získávání znalostí z empirických dat empirická

Více

Předpoklad o normalitě rozdělení je zamítnut, protože hodnota testovacího kritéria χ exp je vyšší než tabulkový 2

Předpoklad o normalitě rozdělení je zamítnut, protože hodnota testovacího kritéria χ exp je vyšší než tabulkový 2 Na úloze ukážeme postup analýzy velkého výběru s odlehlými prvky pro určení typu rozdělení koncentrace kyseliny močové u 50 dárců krve. Jaká je míra polohy a rozptýlení uvedeného výběru? Z grafických diagnostik

Více

2 Zpracování naměřených dat. 2.1 Gaussův zákon chyb. 2.2 Náhodná veličina a její rozdělení

2 Zpracování naměřených dat. 2.1 Gaussův zákon chyb. 2.2 Náhodná veličina a její rozdělení 2 Zpracování naměřených dat Důležitou součástí každé experimentální práce je statistické zpracování naměřených dat. V této krátké kapitole se budeme věnovat určení intervalů spolehlivosti získaných výsledků

Více

Průzkumová analýza dat

Průzkumová analýza dat Průzkumová analýza dat Proč zkoumat data? Základ průzkumové analýzy dat položil John Tukey ve svém díle Exploratory Data Analysis (odtud zkratka EDA). Často se stává, že data, se kterými pracujeme, se

Více

Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D.

Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D. Zpracování náhodného výběru popisná statistika Ing. Michal Dorda, Ph.D. Základní pojmy Úkolem statistiky je na základě vlastností výběrového souboru usuzovat o vlastnostech celé populace. Populace(základní

Více

676 + 4 + 100 + 196 + 0 + 484 + 196 + 324 + 64 + 324 = = 2368

676 + 4 + 100 + 196 + 0 + 484 + 196 + 324 + 64 + 324 = = 2368 Příklad 1 Je třeba prověřit, zda lze na 5% hladině významnosti pokládat za prokázanou hypotézu, že střední doba výroby výlisku je 30 sekund. Přitom 10 náhodně vybraných výlisků bylo vyráběno celkem 540

Více

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru. 1 Statistické odhady Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru. Odhad lze provést jako: Bodový odhad o Jedna číselná hodnota Intervalový

Více

Návrh a vyhodnocení experimentu

Návrh a vyhodnocení experimentu Návrh a vyhodnocení experimentu Návrh a vyhodnocení experimentů v procesech vývoje a řízení kvality vozidel Ing. Bohumil Kovář, Ph.D. FD ČVUT Ústav aplikované matematiky kovar@utia.cas.cz Mladá Boleslav

Více

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, 532 10 Pardubice 10. licenční studium chemometrie STATISTICKÉ ZPRACOVÁNÍ DAT Semestrální práce STATISTICKÁ

Více

Testování statistických hypotéz

Testování statistických hypotéz Testování statistických hypotéz Na základě náhodného výběru, který je reprezentativním vzorkem základního souboru (který přesně neznáme, k němuž se ale daná statistická hypotéza váže), potřebujeme ověřit,

Více

Porovnání dvou výběrů

Porovnání dvou výběrů Porovnání dvou výběrů Menu: QCExpert Porovnání dvou výběrů Tento modul je určen pro podrobnou analýzu dvou datových souborů (výběrů). Modul poskytuje dva postupy analýzy: porovnání dvou nezávislých výběrů

Více

Jana Vránová, 3. lékařská fakulta UK

Jana Vránová, 3. lékařská fakulta UK Jana Vránová, 3. lékařská fakulta UK Vznikají při zkoumání vztahů kvalitativních resp. diskrétních znaků Jedná se o analogii s korelační analýzou spojitých znaků Přitom předpokládáme, že každý prvek populace

Více

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Statistickou hypotézou se rozumí určité tvrzení o parametrech rozdělení zkoumané náhodné veličiny (µ, σ 2, π,

Více

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 3. 11.

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 3. 11. UNIVERZITA OBRANY Fakulta ekonomiky a managementu Aplikace STAT1 Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 Jiří Neubauer, Marek Sedlačík, Oldřich Kříž 3. 11. 2012 Popis a návod k použití aplikace

Více

Intervalový odhad. Interval spolehlivosti = intervalový odhad nějakého parametru s danou pravděpodobností = konfidenční interval pro daný parametr

Intervalový odhad. Interval spolehlivosti = intervalový odhad nějakého parametru s danou pravděpodobností = konfidenční interval pro daný parametr StatSoft Intervalový odhad Dnes se budeme zabývat neodmyslitelnou součástí statistiky a to intervaly v nejrůznějších podobách. Toto téma je také úzce spojeno s tématem testování hypotéz, a tedy plynule

Více

STATISTICKÉ CHARAKTERISTIKY

STATISTICKÉ CHARAKTERISTIKY STATISTICKÉ CHARAKTERISTIKY 1 Vytvořeno s podporou projektu Průřezová inovace studijních programů Lesnické a dřevařské fakulty MENDELU v Brně (LDF) s ohledem na discipliny společného základu (reg. č. CZ.1.07/2.2.00/28.0021)

Více

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. Testování statistických hypotéz Ing. Michal Dorda, Ph.D. Testování normality Př. : Při simulaci provozu na křižovatce byla získána data o mezerách mezi přijíždějícími vozidly v [s]. Otestujte na hladině

Více

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně Testování hypotéz Nechť,, je náhodný výběr z nějakého rozdělení s neznámými parametry. Máme dvě navzájem si odporující hypotézy o parametrech daného rozdělení: Nulová hypotéza parametry (případně jediný

Více

Rozdělení náhodné veličiny

Rozdělení náhodné veličiny Rozdělení náhodné veličiny Náhodná proměnná může mít - diskrétní rozdělení (nabývá jen určitých číselných hodnot) - spojité rozdělení (nabývá libovolných hodnot z určitého intervalu) Fyzikální veličiny

Více

Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie STATISTICKÉ ZPRACOVÁNÍ EXPERIMENTÁLNÍCH DAT

Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie STATISTICKÉ ZPRACOVÁNÍ EXPERIMENTÁLNÍCH DAT Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie STATISTICKÉ ZPRACOVÁNÍ EXPERIMENTÁLNÍCH DAT STATISTICKÁ ANALÝZA JEDNOROZMĚRNÝCH DAT Seminární práce 1 Brno, 2002 Ing. Pavel

Více

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II Základy biostatistiky II Veřejné zdravotnictví 3.LF UK - II Teoretické rozložení-matematické modely rozložení Naměřená data Výběrové rozložení Teoretické rozložení 1 e 2 x 2 Teoretické rozložení-matematické

Více

KGG/STG Statistika pro geografy

KGG/STG Statistika pro geografy KGG/STG Statistika pro geografy 4. Teoretická rozdělení Mgr. David Fiedor 9. března 2015 Osnova Úvod 1 Úvod 2 3 4 5 Vybraná rozdělení náhodných proměnných normální rozdělení normované normální rozdělení

Více

Zápočtová práce STATISTIKA I

Zápočtová práce STATISTIKA I Zápočtová práce STATISTIKA I Obsah: - úvodní stránka - charakteristika dat (původ dat, důvod zpracování,...) - výpis naměřených hodnot (v tabulce) - zpracování dat (buď bodové nebo intervalové, podle charakteru

Více

7. Rozdělení pravděpodobnosti ve statistice

7. Rozdělení pravděpodobnosti ve statistice 7. Rozdělení pravděpodobnosti ve statistice Statistika nuda je, má však cenné údaje, neklesejte na mysli, ona nám to vyčíslí Jednou z úloh statistiky je odhad (výpočet) hodnot statistického znaku x i,

Více

Inferenční statistika - úvod. z-skóry normální rozdělení pravděpodobnost rozdělení výběrových průměrů

Inferenční statistika - úvod. z-skóry normální rozdělení pravděpodobnost rozdělení výběrových průměrů Inferenční statistika - úvod z-skóry normální rozdělení pravděpodobnost rozdělení výběrových průměrů Pravděpodobnost postupy induktivní statistiky vycházejí z teorie pravděpodobnosti pravděpodobnost, že

Více

Úloha E301 Čistota vody v řece testem BSK 5 ( Statistická analýza jednorozměrných dat )

Úloha E301 Čistota vody v řece testem BSK 5 ( Statistická analýza jednorozměrných dat ) Úloha E301 Čistota vody v řece testem BSK 5 ( Statistická analýza jednorozměrných dat ) Zadání : Čistota vody v řece byla denně sledována v průběhu 10 dní dle biologické spotřeby kyslíku BSK 5. Jsou v

Více

MATEMATICKO STATISTICKÉ PARAMETRY ANALYTICKÝCH VÝSLEDKŮ

MATEMATICKO STATISTICKÉ PARAMETRY ANALYTICKÝCH VÝSLEDKŮ MATEMATICKO STATISTICKÉ PARAMETRY ANALYTICKÝCH VÝSLEDKŮ Má-li analytický výsledek objektivně vypovídat o chemickém složení vzorku, musí splňovat určitá kriteria: Mezinárodní metrologický slovník (VIM 3),

Více

Stručný úvod do testování statistických hypotéz

Stručný úvod do testování statistických hypotéz Stručný úvod do testování statistických hypotéz 1. Formulujeme hypotézu (předpokládáme, že pozorovaný jev je pouze náhodný). 2. Zvolíme hladinu významnosti testu a, tj. riziko, s nímž jsme ochotni se smířit.

Více

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B TESTOVÁNÍ HYPOTÉZ Od statistického šetření neočekáváme pouze elementární informace o velikosti některých statistických ukazatelů. Používáme je i k ověřování našich očekávání o výsledcích nějakého procesu,

Více

Testování statistických hypotéz

Testování statistických hypotéz Testování statistických hypotéz 1 Testování statistických hypotéz 1 Statistická hypotéza a její test V praxi jsme nuceni rozhodnout, zda nějaké tvrzeni o parametrech náhodných veličin nebo o veličině samotné

Více

Popisná statistika. Komentované řešení pomocí MS Excel

Popisná statistika. Komentované řešení pomocí MS Excel Popisná statistika Komentované řešení pomocí MS Excel Vstupní data Máme k dispozici data o počtech bodů z 1. a 2. zápočtového testu z Matematiky I v zimním semestru 2015/2016 a to za všech 762 studentů,

Více

veličin, deskriptivní statistika Ing. Michael Rost, Ph.D.

veličin, deskriptivní statistika Ing. Michael Rost, Ph.D. Vybraná rozdělení spojitých náhodných veličin, deskriptivní statistika Ing. Michael Rost, Ph.D. Třídění Základním zpracováním dat je jejich třídění. Jde o uspořádání získaných dat, kde volba třídícího

Více

Praktická statistika. Petr Ponížil Eva Kutálková

Praktická statistika. Petr Ponížil Eva Kutálková Praktická statistika Petr Ponížil Eva Kutálková Zápis výsledků měření Předpokládejme, že známe hodnotu napětí U = 238,9 V i její chybu 3,3 V. Hodnotu veličiny zapíšeme na tolik míst, aby až poslední bylo

Více

Statistická analýza jednorozměrných dat

Statistická analýza jednorozměrných dat Statistická analýza jednorozměrných dat Prof. RNDr. Milan Meloun, DrSc. Univerzita Pardubice, Pardubice 31.ledna 2011 Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem

Více

ROZDĚLENÍ NÁHODNÝCH VELIČIN

ROZDĚLENÍ NÁHODNÝCH VELIČIN ROZDĚLENÍ NÁHODNÝCH VELIČIN 1 Vytvořeno s podporou projektu Průřezová inovace studijních programů Lesnické a dřevařské fakulty MENDELU v Brně (LDF) s ohledem na discipliny společného základu (reg. č. CZ.1.07/2.2.00/28.0021)

Více

4ST201 STATISTIKA CVIČENÍ Č. 7

4ST201 STATISTIKA CVIČENÍ Č. 7 4ST201 STATISTIKA CVIČENÍ Č. 7 testování hypotéz parametrické testy test hypotézy o střední hodnotě test hypotézy o relativní četnosti test o shodě středních hodnot testování hypotéz v MS Excel neparametrické

Více

Regresní analýza 1. Regresní analýza

Regresní analýza 1. Regresní analýza Regresní analýza 1 1 Regresní funkce Regresní analýza Důležitou statistickou úlohou je hledání a zkoumání závislostí proměnných, jejichž hodnoty získáme při realizaci experimentů Vzhledem k jejich náhodnému

Více

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY Statistická hypotéza je určitá domněnka (předpoklad) o vlastnostech ZÁKLADNÍHO SOUBORU. Test statistické hypotézy je pravidlo (kritérium), které na základě

Více

Jednofaktorová analýza rozptylu

Jednofaktorová analýza rozptylu I I.I Jednofaktorová analýza rozptylu Úvod Jednofaktorová analýza rozptylu (ANOVA) se využívá při porovnání několika středních hodnot. Často se využívá ve vědeckých a lékařských experimentech, při kterých

Více

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1 Logistická regrese Menu: QCExpert Regrese Logistická Modul Logistická regrese umožňuje analýzu dat, kdy odezva je binární, nebo frekvenční veličina vyjádřená hodnotami 0 nebo 1, případně poměry v intervalu

Více

ANALÝZA DAT V R 3. POPISNÉ STATISTIKY, NÁHODNÁ VELIČINA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK

ANALÝZA DAT V R 3. POPISNÉ STATISTIKY, NÁHODNÁ VELIČINA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK ANALÝZA DAT V R 3. POPISNÉ STATISTIKY, NÁHODNÁ VELIČINA Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK www.biostatisticka.cz POPISNÉ STATISTIKY - OPAKOVÁNÍ jedna kvalitativní

Více

Statistika. Základní pojmy a cíle statistiky. Roman Biskup. (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at) .

Statistika. Základní pojmy a cíle statistiky. Roman Biskup. (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at) . Statistika Základní pojmy a cíle statistiky Roman Biskup (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at)email.cz 12. února 2012 Statistika by Birom Statistika Pojmy a cíle

Více

Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Výsledky některých náhodných pokusů jsou přímo vyjádřeny číselně (např. při hodu kostkou padne 6). Náhodnou veličinou

Více

1. Číselné posloupnosti - Definice posloupnosti, základní vlastnosti, operace s posloupnostmi, limita posloupnosti, vlastnosti limit posloupností,

1. Číselné posloupnosti - Definice posloupnosti, základní vlastnosti, operace s posloupnostmi, limita posloupnosti, vlastnosti limit posloupností, KMA/SZZS1 Matematika 1. Číselné posloupnosti - Definice posloupnosti, základní vlastnosti, operace s posloupnostmi, limita posloupnosti, vlastnosti limit posloupností, operace s limitami. 2. Limita funkce

Více

23. Matematická statistika

23. Matematická statistika Projekt: Inovace oboru Mechatronik pro Zlínský kraj Registrační číslo: CZ.1.07/1.1.08/03.0009 23. Matematická statistika Statistika je věda, která se snaží zkoumat reálná data a s pomocí teorii pravděpodobnosti

Více

E(X) = np D(X) = np(1 p) 1 2p np(1 p) (n + 1)p 1 ˆx (n + 1)p. A 3 (X) =

E(X) = np D(X) = np(1 p) 1 2p np(1 p) (n + 1)p 1 ˆx (n + 1)p. A 3 (X) = Základní rozdělení pravděpodobnosti Diskrétní rozdělení pravděpodobnosti. Pojem Náhodná veličina s Binomickým rozdělením Bi(n, p), kde n je přirozené číslo, p je reálné číslo, < p < má pravděpodobnostní

Více

Úvod do analýzy rozptylu

Úvod do analýzy rozptylu Úvod do analýzy rozptylu Párovým t-testem se podařilo prokázat, že úprava režimu stravování a fyzické aktivity ve vybrané škole měla vliv na zlepšené hodnoty HDLcholesterolu u školáků. Pro otestování jsme

Více

Porovnání dvou reaktorů

Porovnání dvou reaktorů Porovnání dvou reaktorů Zadání: Chemické reakce při kontinuální výrobě probíhají ve dvou identických reaktorech. Konstanty potřebné pro regulaci průběhu reakce jsou nastaveny pro každý reaktor samostatně.

Více

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13 Příklad 1 Máme k dispozici výsledky prvního a druhého testu deseti sportovců. Na hladině významnosti 0,05 prověřte, zda jsou výsledky testů kladně korelované. 1.test : 7, 8, 10, 4, 14, 9, 6, 2, 13, 5 2.test

Více

Úvod do teorie odhadu. Ing. Michael Rost, Ph.D.

Úvod do teorie odhadu. Ing. Michael Rost, Ph.D. Úvod do teorie odhadu Ing. Michael Rost, Ph.D. Náhodný výběr Náhodným výběrem ze základního souboru populace, která je popsána prostřednictvím hustoty pravděpodobnosti f(x, θ), budeme nazývat posloupnost

Více

NÁHODNÁ ČÍSLA. F(x) = 1 pro x 1. Náhodná čísla lze generovat některým z následujících generátorů náhodných čísel:

NÁHODNÁ ČÍSLA. F(x) = 1 pro x 1. Náhodná čísla lze generovat některým z následujících generátorů náhodných čísel: NÁHODNÁ ČÍSLA TYPY GENERÁTORŮ, LINEÁRNÍ KONGRUENČNÍ GENERÁTORY, TESTY NÁHODNOSTI, VYUŽITÍ HODNOT NÁHODNÝCH VELIČIN V SIMULACI CO JE TO NÁHODNÉ ČÍSLO? Náhodné číslo definujeme jako nezávislé hodnoty z rovnoměrného

Více

Pojem a úkoly statistiky

Pojem a úkoly statistiky Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Pojem a úkoly statistiky Statistika je věda, která se zabývá získáváním, zpracováním a analýzou dat pro potřeby

Více

S E M E S T R Á L N Í

S E M E S T R Á L N Í Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie S E M E S T R Á L N Í P R Á C E Licenční studium Statistické zpracování dat při managementu jakosti Předmět Statistická analýza

Více

Testování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času

Testování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času Testování hypotéz 1 Jednovýběrové testy 90/ odhad času V podmínkách naprostého odloučení má voák prokázat schopnost orientace v čase. Úkolem voáka e provést odhad časového intervalu 1 hodiny bez hodinek

Více

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Prostá regresní a korelační analýza 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Problematika závislosti V podstatě lze rozlišovat mezi závislostí nepodstatnou, čili náhodnou

Více

I. D i s k r é t n í r o z d ě l e n í

I. D i s k r é t n í r o z d ě l e n í 6. T y p y r o z d ě l e n í Poznámka: V odst. 5.5-5.10 jsme uvedli příklady náhodných veličin a jejich distribučních funkcí. Poznali jsme, že se od sebe liší svým typem. V příkladech 5.5, 5.6 a 5.8 jsme

Více

4. Zpracování číselných dat

4. Zpracování číselných dat 4. Zpracování číselných dat 4.1 Jednoduché hodnocení dat 4.2 Začlenění dat do písemné práce Zásady zpracování vědecké práce pro obory BOZO, PÚPN, LS 2011 4.1 Hodnocení číselných dat Popisná data: střední

Více

Číselné charakteristiky

Číselné charakteristiky . Číselné charakteristiky statistických dat Průměrný statistik se během svého života ožení s 1,75 ženami, které se ho snaží vytáhnout večer do společnosti,5 x týdně, ale pouze s 50% úspěchem. W. F. Miksch

Více

Regresní a korelační analýza

Regresní a korelační analýza Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).

Více

Tématické okruhy pro státní závěrečné zkoušky. bakalářské studium. studijní obor "Management jakosti"

Tématické okruhy pro státní závěrečné zkoušky. bakalářské studium. studijní obor Management jakosti Tématické okruhy pro státní závěrečné zkoušky bakalářské studium studijní obor "Management jakosti" školní rok 2013/2014 Management jakosti A 1. Pojem jakosti a význam managementu jakosti v současném období.

Více

31. 3. 2014, Brno Hanuš Vavrčík Základy statistiky ve vědě

31. 3. 2014, Brno Hanuš Vavrčík Základy statistiky ve vědě 31. 3. 2014, Brno Hanuš Vavrčík Základy statistiky ve vědě Motto Statistika nuda je, má však cenné údaje. strana 3 Statistické charakteristiky Charakteristiky polohy jsou kolem ní seskupeny ostatní hodnoty

Více

Diskrétní náhodná veličina

Diskrétní náhodná veličina Lekce Diskrétní náhodná veličina Výsledek náhodného pokusu může být vyjádřen slovně to vede k zavedení pojmu náhodného jevu Výsledek náhodného pokusu můžeme někdy vyjádřit i číselně, což vede k pojmu náhodné

Více

Me neˇ nezˇ minimum ze statistiky Michaela S ˇ edova KPMS MFF UK Principy medicı ny zalozˇene na du kazech a za klady veˇdecke prˇı pravy 1 / 33

Me neˇ nezˇ minimum ze statistiky Michaela S ˇ edova KPMS MFF UK Principy medicı ny zalozˇene na du kazech a za klady veˇdecke prˇı pravy 1 / 33 1 / 33 Méně než minimum ze statistiky Michaela Šedová KPMS MFF UK Principy medicíny založené na důkazech a základy vědecké přípravy Příklad Studie syndromu náhodného úmrtí dětí. Dvě skupiny: Děti, které

Více

Popisná statistika kvantitativní veličiny

Popisná statistika kvantitativní veličiny StatSoft Popisná statistika kvantitativní veličiny Protože nám surová data obvykle žádnou smysluplnou informaci neposkytnou, je žádoucí vyjádřit tyto ve zhuštěnější formě. V předchozím dílu jsme začali

Více

Střední hodnota a rozptyl náhodné. kvantilu. Ing. Michael Rost, Ph.D.

Střední hodnota a rozptyl náhodné. kvantilu. Ing. Michael Rost, Ph.D. Střední hodnota a rozptyl náhodné veličiny, vybraná rozdělení diskrétních a spojitých náhodných veličin, pojem kvantilu Ing. Michael Rost, Ph.D. Príklad Předpokládejme že máme náhodnou veličinu X která

Více

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D.

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D. Problematika analýzy rozptylu Ing. Michael Rost, Ph.D. Úvod do problému Již umíte testovat shodu dvou středních hodnot prostřednictvím t-testů. Otázka: Jaké předpoklady musí být splněny, abyste mohli použít

Více

15. T e s t o v á n í h y p o t é z

15. T e s t o v á n í h y p o t é z 15. T e s t o v á n í h y p o t é z Na základě hodnot náhodného výběru činíme rozhodnutí o platnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlastnostech. Rozeznáváme dva základní typy testů:

Více

p(x) = P (X = x), x R,

p(x) = P (X = x), x R, 6. T y p y r o z d ě l e n í Poznámka: V odst. 5.5-5.10 jsme uvedli příklady náhodných veličin a jejich distribučních funkcí. Poznali jsme, že se od sebe liší svým typem. V příkladech 5.5, 5.6 a 5.8 jsme

Více

1. Přednáška. Ing. Miroslav Šulai, MBA

1. Přednáška. Ing. Miroslav Šulai, MBA N_OFI_2 1. Přednáška Počet pravděpodobnosti Statistický aparát používaný ve financích Ing. Miroslav Šulai, MBA 1 Počet pravděpodobnosti -náhodné veličiny 2 Počet pravděpodobnosti -náhodné veličiny 3 Jevy

Více

Jednofaktorová analýza rozptylu

Jednofaktorová analýza rozptylu Jednofaktorová analýza rozptylu David Hampel Ústav statistiky a operačního výzkumu, Mendelova univerzita v Brně Kurz pokročilých statistických metod Global Change Research Centre AS CR, 5 7 8 2015 Tato

Více

Teorie měření a regulace

Teorie měření a regulace Ústav technologie, mechanizace a řízení staveb CW01 Teorie měření a regulace Praxe názvy 1. ZS 2015/2016 2015 - Ing. Václav Rada, CSc. OBECNÝ ÚVOD - praxe Elektrotechnická měření mohou probíhat pouze při

Více

8.1. Definice: Normální (Gaussovo) rozdělení N(µ, σ 2 ) s parametry µ a. ( ) ϕ(x) = 1. označovat písmenem U. Její hustota je pak.

8.1. Definice: Normální (Gaussovo) rozdělení N(µ, σ 2 ) s parametry µ a. ( ) ϕ(x) = 1. označovat písmenem U. Její hustota je pak. 8. Normální rozdělení 8.. Definice: Normální (Gaussovo) rozdělení N(µ, ) s parametry µ a > 0 je rozdělení určené hustotou ( ) f(x) = (x µ) e, x (, ). Rozdělení N(0; ) s parametry µ = 0 a = se nazývá normované

Více

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.) Lékařská biofyzika, výpočetní technika I Biostatistika Josef Tvrdík (doc. Ing. CSc.) Přírodovědecká fakulta, katedra informatiky josef.tvrdik@osu.cz konzultace úterý 14.10 až 15.40 hod. http://www1.osu.cz/~tvrdik

Více

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1 Testování statistických hypotéz Ing. Michal Dorda, Ph.D. 1 Úvodní poznámky Statistickou hypotézou rozumíme hypotézu o populaci (základním souboru) např.: Střední hodnota základního souboru je rovna 100.

Více

Simulace. Simulace dat. Parametry

Simulace. Simulace dat. Parametry Simulace Simulace dat Menu: QCExpert Simulace Simulace dat Tento modul je určen pro generování pseudonáhodných dat s danými statistickými vlastnostmi. Nabízí čtyři typy rozdělení: normální, logaritmicko-normální,

Více

Kapitola Hlavička. 3.2 Teoretický základ měření

Kapitola Hlavička. 3.2 Teoretický základ měření 23 Kapitola 3 Protokol o měření Protokol o měření musí obsahovat všechny potřebné údaje o provedeném měření, tak aby bylo možné podle něj měření kdykoliv zopakovat. Proto protokol musí obsahovat všechny

Více

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz. Pravděpodobnost a statistika, Biostatistika pro kombinované studium Letní semestr 2015/2016 Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz Jan Kracík jan.kracik@vsb.cz Obsah: Výběrová rozdělení

Více

Induktivní statistika. z-skóry pravděpodobnost

Induktivní statistika. z-skóry pravděpodobnost Induktivní statistika z-skóry pravděpodobnost normální rozdělení Z-skóry umožňují najít a popsat pozici každé hodnoty v rámci rozdělení hodnot a také srovnávání hodnot pocházejících z měření na rozdílných

Více

Statistické vyhodnocování ankety pilotního projektu Kvalita výuky na Západočeské univerzitě v Plzni

Statistické vyhodnocování ankety pilotního projektu Kvalita výuky na Západočeské univerzitě v Plzni Statistické vyhodnocování ankety pilotního projektu Kvalita výuky na Západočeské univerzitě v Plzni Kvantifikace dat Pro potřeby statistického zpracování byly odpovědi převedeny na kardinální intervalovou

Více

2 ) 4, Φ 1 (1 0,005)

2 ) 4, Φ 1 (1 0,005) Příklad 1 Ze zásilky velkého rozsahu byl náhodně vybrán soubor obsahující 1000 kusů. V tomto souboru bylo zjištěno 26 kusů nekvalitních. Rozhodněte, zda je možné s 99% jistotou tvrdit, že zásilka obsahuje

Více

Dva případy chybného rozhodnutí při testování: a) Testační statistika padne mimo obor přijetí nulové H hypotézy O, tj.

Dva případy chybného rozhodnutí při testování: a) Testační statistika padne mimo obor přijetí nulové H hypotézy O, tj. Uvedeme obecný postup statistického testování:. Formulace nulové H 0a alternativní hpotéz H A.. Volba hladin významnosti α.. Volba testační statistik např... Určení kritického oboru testové charakteristik.

Více

Jana Vránová, 3.lékařská fakulta UK, Praha. Hypotézy o populacích

Jana Vránová, 3.lékařská fakulta UK, Praha. Hypotézy o populacích Jana Vránová, 3.lékařská fakulta UK, Praha Hypotézy o populacích Příklad IQ test: Předpokládejme, že z nějakého důvodu ministerstvo školství věří, že studenti absolventi středních škol v Hradci Králové

Více

MATEMATIKA III V PŘÍKLADECH

MATEMATIKA III V PŘÍKLADECH VYSOKÁ ŠKOLA BÁŇSKÁ TECHNICKÁ UNIVERZITA OSTRAVA FAKULTA STROJNÍ MATEMATIKA III V PŘÍKLADECH Cvičení 12 Testování hypotéz Mgr. Petr Otipka Ostrava 2013 Mgr. Petr Otipka Vysoká škola báňská Technická univerzita

Více

Inovace bakalářského studijního oboru Aplikovaná chemie http://aplchem.upol.cz

Inovace bakalářského studijního oboru Aplikovaná chemie http://aplchem.upol.cz http://aplchem.upol.cz CZ.1.07/2.2.00/15.0247 Tento projekt je spolufinancován Evropským sociálním fondem a státním rozpočtem České republiky. Sedm základních nástrojů řízení kvality Doc. RNDr. Jiří Šimek,

Více

Národní informační středisko pro podporu kvality

Národní informační středisko pro podporu kvality Národní informační středisko pro podporu kvality Využití metody bootstrapping při analýze dat II.část Doc. Ing. Olga TŮMOVÁ, CSc. Obsah Klasické procedury a statistické SW - metody výpočtů konfidenčních

Více

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze Dobývání znalostí Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze Dobývání znalostí Pravděpodobnost a učení Doc. RNDr. Iveta Mrázová,

Více

Tématické okruhy pro státní závěrečné zkoušky. bakalářské studium. studijní obor "Management jakosti"

Tématické okruhy pro státní závěrečné zkoušky. bakalářské studium. studijní obor Management jakosti Tématické okruhy pro státní závěrečné zkoušky bakalářské studium studijní obor "Management jakosti" školní rok 2009/2010 Management jakosti A 1. Pojem jakosti a význam managementu jakosti v současném období.

Více

Korelační a regresní analýza

Korelační a regresní analýza Korelační a regresní analýza Analýza závislosti v normálním rozdělení Pearsonův (výběrový) korelační koeficient: r = s XY s X s Y, kde s XY = 1 n (x n 1 i=0 i x )(y i y ), s X (s Y ) je výběrová směrodatná

Více

Zákony hromadění chyb.

Zákony hromadění chyb. Zákony hromadění chyb. Zákon hromadění skutečných chyb. Zákon hromadění středních chyb. Tomáš Bayer bayertom@natur.cuni.cz Přírodovědecká fakulta Univerzity Karlovy v Praze, Katedra aplikované geoinformatiky

Více

Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu

Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu K čemu slouží statistika Popisuje velké soubory dat pomocí charakteristických čísel (popisná statistika). Hledá skryté zákonitosti v souborech

Více

Vybraná rozdělení náhodné veličiny

Vybraná rozdělení náhodné veličiny 3.3 Vybraná rozdělení náhodné veličiny 0,16 0,14 0,12 0,1 0,08 0,06 0,04 0,02 0 Rozdělení Z 3 4 5 6 7 8 9 10 11 12 13 14 15 Život je umění vytvářet uspokojivé závěry na základě nedostatečných předpokladů.

Více

Modul Základní statistika

Modul Základní statistika Modul Základní statistika Menu: QCExpert Základní statistika Základní statistika slouží k předběžné analýze a diagnostice dat, testování předpokladů (vlastností dat), jejichž splnění je nutné pro použití

Více

Pravděpodobnost a aplikovaná statistika

Pravděpodobnost a aplikovaná statistika Pravděpodobnost a aplikovaná statistika MGR. JANA SEKNIČKOVÁ, PH.D. 8. KAPITOLA STATISTICKÉ TESTOVÁNÍ HYPOTÉZ 22.11.2016 Opakování: CLV příklad 1 Zadání: Před volbami je v populaci státu 52 % příznivců

Více

Rozdělení náhodné veličiny. Distribuční funkce. Vlastnosti distribuční funkce

Rozdělení náhodné veličiny. Distribuční funkce. Vlastnosti distribuční funkce Náhodná veličina motivace Náhodná veličina Často lze výsledek náhodného pokusu vyjádřit číslem: číslo, které padlo na kostce, výška náhodně vybraného studenta, čas strávený čekáním na metro, délka života

Více

STATISTICKÉ ZJIŠŤOVÁNÍ

STATISTICKÉ ZJIŠŤOVÁNÍ STATISTICKÉ ZJIŠŤOVÁNÍ ÚVOD Základní soubor Všechny ryby v rybníce, všechny holky/kluci na škole Cílem určit charakteristiky, pravděpodobnosti Průměr, rozptyl, pravděpodobnost, že Maruška kápne na toho

Více

Výrobní produkce divizí Ice Cream Po lo ha plane t Rozložený výse ový 3D graf Bublinový graf Histogram t s tn e ídy

Výrobní produkce divizí Ice Cream Po lo ha plane t Rozložený výse ový 3D graf Bublinový graf Histogram t s tn e ídy Výrobní produkce divizí Ice Cream Polo ha planet Rozložený výsečový 3D graf Bublinový graf Ice Cream 1 15% Ice Cream 2 12% Ice Cream 3 18% Ice Cream 4 20% Statistika 40 30 20 Ice Cream 6 19% Ice Cream

Více

Rovnoměrné rozdělení

Rovnoměrné rozdělení Rovnoměrné rozdělení Nejjednodušší pravděpodobnostní rozdělení pro diskrétní náhodnou veličinu. V literatuře se také nazývá jako klasické rozdělení pravděpodobnosti. Náhodná veličina může nabývat n hodnot

Více

Odhad parametrů N(µ, σ 2 )

Odhad parametrů N(µ, σ 2 ) Odhad parametrů N(µ, σ 2 ) Mějme statistický soubor x 1, x 2,, x n modelovaný jako realizaci náhodného výběru z normálního rozdělení N(µ, σ 2 ) s neznámými parametry µ a σ. Jaký je maximální věrohodný

Více