Simulace. Simulace dat. Parametry



Podobné dokumenty
VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ. FAKULTA STROJNÍHO INŽENÝRSTVÍ Ústav materiálového inženýrství - odbor slévárenství

Porovnání dvou výběrů

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Zápočtová práce STATISTIKA I

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1

Modul Základní statistika

ANALÝZA DAT V R 3. POPISNÉ STATISTIKY, NÁHODNÁ VELIČINA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK

STANOVENÍ SPOLEHLIVOSTI GEOTECHNICKÝCH KONSTRUKCÍ. J. Pruška, T. Parák

POPISNÁ STATISTIKA Komentované řešení pomocí programu Statistica

Metoda Monte Carlo a její aplikace v problematice oceňování technologií. Manuál k programu

Analýza dat na PC I.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

E(X) = np D(X) = np(1 p) 1 2p np(1 p) (n + 1)p 1 ˆx (n + 1)p. A 3 (X) =

Charakterizace rozdělení

Úloha č. 2 - Kvantil a typická hodnota. (bodově tříděná data): (intervalově tříděná data): Zadání úlohy: Zadání úlohy:

Tabulka 1 Příklad dat pro kalibraci

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky)

2 Zpracování naměřených dat. 2.1 Gaussův zákon chyb. 2.2 Náhodná veličina a její rozdělení

Rozšířené regulační diagramy

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

Charakteristika datového souboru

Popisná statistika. Komentované řešení pomocí MS Excel

Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie STATISTICKÉ ZPRACOVÁNÍ EXPERIMENTÁLNÍCH DAT

Nový způsob práce s průběžnou klasifikací lze nastavit pouze tehdy, je-li průběžná klasifikace v evidenčním pololetí a školním roce prázdná.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

LINEÁRNÍ REGRESE. Lineární regresní model

Náhodná proměnná. Náhodná proměnná může mít rozdělení diskrétní (x 1. , x 2. ; x 2. spojité (<x 1

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika

Statistická analýza jednorozměrných dat

Systém rizikové analýzy při sta4ckém návrhu podzemního díla. Jan Pruška

STATISTICA Téma 8. Regresní a korelační analýza, regrese prostá

VYUŽITÍ PRAVDĚPODOBNOSTNÍ METODY MONTE CARLO V SOUDNÍM INŽENÝRSTVÍ

Číselné charakteristiky a jejich výpočet

Kvantily a písmenové hodnoty E E E E-02

KGG/STG Statistika pro geografy

Lineární regrese. Komentované řešení pomocí MS Excel

Téma 9: Vícenásobná regrese

Praktická statistika. Petr Ponížil Eva Kutálková

Průzkumová analýza dat

PRŮZKUMOVÁ ANALÝZA JEDNOROZMĚRNÝCH DAT Exploratory Data Analysis (EDA)

Testování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie. Nám. Čs. Legií 565, Pardubice. Semestrální práce ANOVA 2015

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice

Stanovení manganu a míry přesnosti kalibrace ( Lineární kalibrace )

Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012. Tutoriál č. 4: Exploratorní analýza. Jan Kracík

7. Rozdělení pravděpodobnosti ve statistice

Statistika pro geografy

UNIVERZITA PARDUBICE CHEMICKO-TECHNOLOGICKÁ FAKULTA KATEDRA ANALYTICKÉ CHEMIE

Úloha E301 Čistota vody v řece testem BSK 5 ( Statistická analýza jednorozměrných dat )

Odhady parametrů základního souboru. Cvičení 6 Statistické metody a zpracování dat 1 (podzim 2016) Brno, říjen listopad 2016 Ambrožová Klára

Neuronové časové řady (ANN-TS)

STATISTIKA. Inovace předmětu. Obsah. 1. Inovace předmětu STATISTIKA Sylabus pro předmět STATISTIKA Pomůcky... 7

SOLVER UŽIVATELSKÁ PŘÍRUČKA. Kamil Šamaj, František Vižďa Univerzita obrany, Brno, 2008 Výzkumný záměr MO0 FVT

Chyby měření 210DPSM

Úvodem Dříve les než stromy 3 Operace s maticemi

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

4. Na obrázku je rozdělovací funkce (hustota pravděpodobnosti) náhodné veličiny X. Jakou hodnotu musí mít parametr k?

Výběrové charakteristiky a jejich rozdělení

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

MATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci

Grafický a číselný popis rozložení dat 3.1 Způsoby zobrazení dat Metody zobrazení kvalitativních a ordinálních dat Metody zobrazení kvan

Analýza dat s využitím MS Excel

Matematika III. 27. listopadu Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

Manuál pro zaokrouhlování

Pravděpodobnost a aplikovaná statistika

TECHNICKÁ UNIVERZITA V LIBERCI SEMESTRÁLNÍ PRÁCE

Národní informační středisko pro podporu kvality

Předpoklad o normalitě rozdělení je zamítnut, protože hodnota testovacího kritéria χ exp je vyšší než tabulkový 2

Tvorba nelineárních regresních modelů v analýze dat

S E M E S T R Á L N Í

PRŮZKUM VÝŽIVY LESA NA ÚZEMÍ ČESKÉ REPUBLIKY

Statistická analýza jednorozměrných dat

PRAVDĚPODOBNOST A STATISTIKA

Ilustrační příklad odhadu LRM v SW Gretl

1. Číselné posloupnosti - Definice posloupnosti, základní vlastnosti, operace s posloupnostmi, limita posloupnosti, vlastnosti limit posloupností,

UNIVERZITA PARDUBICE

Statistická analýza dat podzemních vod. Statistical analysis of ground water data. Vladimír Sosna 1

BALISTICKÝ MĚŘICÍ SYSTÉM

P13: Statistické postupy vyhodnocování únavových zkoušek, aplikace normálního, Weibullova rozdělení, apod.

Nejčastější chyby v explorační analýze

ZÁKLADNÍ STATISTICKÉ CHARAKTERISTIKY

veličin, deskriptivní statistika Ing. Michael Rost, Ph.D.

Statistika. Regresní a korelační analýza Úvod do problému. Roman Biskup

Testování statistických hypotéz

STATISTICKÉ CHARAKTERISTIKY

Statistická analýza. jednorozměrných dat

MATEMATIKA III V PŘÍKLADECH

Číselné charakteristiky

Statistická analýza jednorozměrných dat

MÍRY ZÁVISLOSTI (KORELACE A REGRESE)

Internetový přístup do databáze FADN CZ - uživatelská příručka Modul FADN BASIC

VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky SMAD

Tvorba nelineárních regresních

Transkript:

Simulace Simulace dat Menu: QCExpert Simulace Simulace dat Tento modul je určen pro generování pseudonáhodných dat s danými statistickými vlastnostmi. Nabízí čtyři typy rozdělení: normální, logaritmicko-normální, rovnoměrné a obecné rozdělení lambda. Pro každé rozdělení je možné zadat hodnoty parametrů jako střední hodnota, rozptyl, šikmost. Navíc je možné simulovat náhodný výskyt vybočujících hodnot s pravděpodobností 0 až 1 a autokorelaci dat prvního řádu s autokorelačním koeficientem -1 až 1. Vygenerovaná data lze použít pro simulaci reálných procesů a ověření postupů analýzy předem, bez nutnosti disponovat dostatkem dat. Dat s rovnoměrným rozdělením lze použít jako tabulku náhodných čísel pro výběr vzorků při kontrole nebo statistické přejímce s vracením. Parametry Tato metoda nemá vstupní data. Parametry pro jednotlivá rozdělení se zadávají v panelu Simulace dat, Obrázek 1. Pro některá rozdělení lze zadat jen určité parametry, jak uvádí následující tabulka: Tabulka 1 Použitelnost parametrů pro jednotlivá rozdělení Normální Lognormální Rovnoměrné Lambda Střední hodnota Směrodatná odchylka kladná kladná kladná kladná Šikmost Práh Autokorelační koeficient -1 až 1-1 až 1-1 až 1-1 až 1 Četnost vybočujících bodů 0 až 1 0 až 1 0 až 1 0 až 1 - parametr nelze použít - parametr lze použít s případným omezením Vygenerovaná data jsou náhodná a mohou splňovat nastavené parametry pouze přibližně. Nenulová šikmost u rovnoměrného rozdělení způsobí jeho změnu na rozdělení lichoběžníkové. Směrodatná odchylka u rovnoměrného rozdělení má význam rozpětí. Zadání nenulového autokorelačního koeficientu ovlivní výsledné parametry rozdělení (například zvýší směrodatnou odchylku).

Obrázek 1 Panel pro zadání parametrů simulace dat Šíření chyb Menu: QCExpert Simulace Šíření chyb Tento modul je určen pro případy, kdy je třeba znát statistické chování veličiny, kterou neměříme přímo, ale počítáme ji z jiných naměřených hodnot, nebo z hodnot, jejichž statistické chování známe. Pomocí tohoto modulu lze určit rozsah výsledných hodnot, střední hodnotu, interval spolehlivosti a také absolutní a relativní příspěvky jednotlivých proměnných k celkové variabilitě. Použitá metoda se někdy nazývá také výpočet nejistot, nebo propagace chyb. K výpočtu vlastností dané funkce náhodných proměnných je použito jednak metody Monte Carlo, jednak Taylorova rozvoje do druhého stupně. Data a parametry Základním vstupem této metody jsou náhodné proměnné a jejich funkce. Náhodné proměnné mohou být zadány: a) Pomocí střední hodnoty a směrodatné odchylky. Taková proměnná je považována za proměnnou s normálním rozdělením a při simulaci se používá generátoru náhodných čísel s normálním rozdělením. Tyto proměnné jsou v programu označovány symbolem X nebo x (x 1, x 2, atd.). b) Pomocí vzorku skutečných naměřených dat. U takové proměnné je při simulaci respektováno její skutečné rozdělení, které nemusí být normální. Je použito techniky vzorkování (resamplingu) podle empirické (výběrové) distribuční funkce. Tento způsob zadání proměnné se doporučuje tehdy, máme-li k dispozici dostatečný počet (alespoň 20) reálných dat, zvláště nejsme-li si jisti jejich rozdělením. Tyto proměnné jsou v programu označovány symbolem Y nebo y (y 1, y 2, atd.) a jsou zadány obvyklým způsobem ve sloupcích. Oba typy proměnných lze libovolně kombinovat. Maximální počet proměnných X a Y je 20 (10+10). V dialogovém panelu se proměnné (parametry) x i definují pomocí průměru a směrodatné odchylky (je nutno zadat obojí), proměnné y i se definují pomocí příslušného sloupce dat v aktuálním listu. Do okénka Rovnice se zapíše matematický pomocí proměnných x 1, x 2,..., y 1, y 2,... a obvyklé syntaxe. Například 5*x1*(1-x2)/log(3.124*y1). Dále je před výpočtem možno zadat párové korelační koeficienty mezi proměnnými x i a x j, popř. x i a y j, jsou-li známy. Párové korelace mezi proměnnými y i a y j se vypočítají automaticky z dat. Hodnota korelačních koeficientů může značně ovlivnit odhady střední hodnoty, rozptylu, intervalů spolehlivosti a kvantilů metodou Taylorova rozvoje. Tlačítko Inicializuj v panelu pro zadání korelací vynuluje všechny koeficienty. Pokud se

korelace nezadají, jsou považovány za nulové. Hodnoty korelačních koeficientů musí být v intervalu ( 1, 1). Doporučený počet simulací je pro většinu úloh 100 až 1000. Zaškrtnuté položky výstupů budou zahrnuty do protokolu. Simulovaná data (jsou-li požadována) se uloží do zvláštního listu v okně Protokol. Těchto dat lze využít k podrobnější analýze předpokládaného rozdělení výsledné veličiny pomocí modulu Základní statistika. Obrázek 2 Zadání podmínek výpočtu pro šíření chyb Obrázek 3 Zadání předpokládaných korelací pro šíření chyb Protokol Funkce Zadaný tvar vztahu pro výslednou proměnnou. Vstupní veličiny Charakteristiky proměnných X zadaných pomocí střední hodnoty a směrodatné odchylky. Střední hodnota Zadaná střední hodnota. Sm. odchylka Zadaná směrodatná odchylka. 95% interval Vypočítaný 2,5% a 97,5% kvantil dat.

+-3sigma Interval, v němž je 99,73% dat. Vstupní data Charakteristiky proměnných Y zadaných pomocí dat. Střední hodnota Aritmetický průměr dat, odhad střední hodnoty. Sm. odchylka Vypočítaná směrodatná odchylka. 95% interval Vypočítaný 2,5% a 97,5% kvantil dat. +-3sigma Interval, v němž je 99,73% dat. Výsledná hodnota Charakteristiky výsledné proměnné získané simulací Monte Carlo. Medián Medián je spolehlivějším odhadem střední hodnoty než aritmetický průměr u asymetrických dat, nebo dat s velkou špičatostí. Střední hodnota Odhad střední hodnoty aritmetickým průměrem. Sm. odchylka Odhad směrodatné odchylky. 95% interval 2,5% a 97,5% kvantil simulovaných dat. +-3sigma Interval, v němž je 99,73% dat. Interval Nejmenší a největší výsledná hodnota vygenerovaná metodou Monte Carlo. výsledných hodnot Citlivostní analýza Absolutní citlivost Absolutní vliv jednotlivých proměnných na výslednou veličinu. Počítá se jako parciální derivace dané funkce podle každé proměnné v bodě jejího průměru. Je to tedy citlivost výsledné veličiny na (malou) jednotkovou změnu dané proměnné. Z hlediska variability lze interpretovat jako očekávané zvýšení směrodatné odchylky výsledné veličiny při jednotkové změně směrodatné odchylky dané proměnné. Relativní citlivost Vliv jednotlivých proměnných na výslednou veličinu vzhledem k jejich skutečné variabilitě. Počítá se jako absolutní citlivost násobená směrodatnou odchylkou příslušné proměnné. Je-li relativní citlivost pro určitou proměnnou nízká proti ostatním, nemá příliš smysl se snažit o snížení její variability, resp. její statistickou regulaci. Je-li naopak vysoká, přinese regulace, nebo snížení variability příslušné proměnné výrazné snížení variability výsledné veličiny Aproximace metodou Taylorova rozvoje Alternativní metoda výpočtu pomocí analytického Taylorova rozvoje do druhého řádu. Tato metoda bere v úvahu i kovariance (resp. korelace) mezi proměnnými. Prostý průměr Nesprávná (!) střední hodnota získaná pouhým dosazením středních hodnot proměnných do funkce. Opravený průměr Odhad střední hodnoty metodou Taylorova rozvoje bez uvažování kovariančního členu. Průměr s kovariancí Odhad střední hodnoty metodou Taylorova rozvoje s uvažováním kovariančního členu. Opravená sm. Odhad směrodatné odchylky metodou Taylorova rozvoje bez uvažování odchylka kovariančního členu. Sm. Odch. s Odhad směrodatné odchylky metodou Taylorova rozvoje s uvažováním kovariancí kovariančního členu. 95% interval 95% interval dat, tedy 2.5% a 97.5% kvantil. Vypočítaný za předpokladu normality rozdělení výsledné veličiny! Interval +-3sigma ca. 99.73% interval dat, tedy asi 0.135% a 99.865% kvantil. Vypočítaný za předpokladu normality rozdělení výsledné veličiny! Simulovaná data Ukládají se do zvláštního listu. Data představují simulaci očekávaných hodnot výsledné veličiny.

Grafy Grafy jsou generovány pouze v případě použití kvadratické metody. Graf hustoty pravděpodobnosti Porovnání předpokládaného skutečného rozdělení dat (červeně) s rozdělením normálním (zeleně). Zřetelný rozdíl upozorňuje na porušení normality. Absolutní vliv % Procentové vyjádření absolutní citlivosti, viz Protokol. Relativní vliv Relativní citlivost, viz Protokol. Relativní vliv % Relativní citlivost vyjádřená v procentech viz Protokol. Grafická simulace dat Menu: QCExpert Simulace Grafická simulace dat Tento modul umožňuje interaktivní simulaci dat pomocí myši přímo do prázdného grafu se souřadnicemi x, y. Data umístěná do grafu se pak přenesou do určených sloupců v datové tabulce. Grafická simulace je účinný způsob rychlého získání dat předem známého charakteru, která pak mohou být například použita k ověření statistických postupů na nečisto apod.

Parametry V dialogovém okně (Obrázek 4) se v polích Minimum a Maximum nastaví rozsah osy X a osy Y v grafu, může se zvolit název záhlaví sloupce v datové tabulce v polích Popis. V položce Sloupec se vybere sloupec v datové tabulce, kam se zadaná data vloží. Data se vkládají do tabulky vždy od prvního sloupce, eventuální obsah sloupců se přepíše. Stiskem tlačítka OK se otevře okno s prázdným grafem s vyznačenými osami X a Y. Obrázek 4 Dialogové okno pro grafickou simulaci V prázdném grafu (Obrázek 5 A) lze myší zadávat body, například předpokládané naměřené hodnoty veličin, časové průběhy, závislosti, a podobně (Obrázek 5 B). Pro lepší orientaci lze v grafu zobrazit síť. Stiskem tlačítka Vyčistit lze data smazat a začít znova. Po stisku OK se zadaná data přenesou do zvolených sloupců datové tabulky. V pravé dolní části grafického okna se zobrazují aktuální souřadnice polohy ukazatele myši v grafu a počet dosud zadaných bodů. Obrázek 5 Okno pro zadání dat: prázdné (A) a se zadanými body (B)

Obrázek 6 Příklad zpracování zadaných dat lineární regresí Digitalizace obrazu: Tlačítkem Vložit obrázek lze na plochu se souřadnicemi umístit bitovou mapu (v grafickém formátu GIF, JPG, BMP, ICO, EMF, nebo WMF) a tvary (např. trajektorie, profily, okraje, průhyby, konstrukční prvky, fotokopie záznamů ze zapisovačů, oskenované grafy, atd.) převést pomocí myši na body v souřadnicové síti. Po vložení lze obrázek posouvat a měnit jeho vlikost kliknutím pravým tlačítkem myši. Po nastavení pozice a velikosti obrázku přejdeme k zadávání bodů kliknutím levým tlačítkem myši v okně grafu mimo obrázek. Obrázek 7 Digitalizace bitového obrazu