ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE FAKULTA ELEKTROTECHNICKÁ BAKALÁŘSKÁ PRÁCE. Jakub Klíma



Podobné dokumenty
Statistika ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE FAKULTA DOPRAVNÍ. Jiří Volf, Adam Kratochvíl, Kateřina Žáková. Semestrální práce - 0 -

Skupina Testování obsahuje následující moduly: Síla a rozsah výběru, Testy a Kontingenční tabulka.

Modul Řízení objednávek.

Příprava na 1. čtvrtletní písemku pro třídu 1EB

Poukázky v obálkách. MOJESODEXO.CZ - Poukázky v obálkách Uživatelská příručka MOJESODEXO.CZ. Uživatelská příručka. Strana 1 / 1. Verze aplikace: 1.4.

Algoritmizace a programování

29 Evidence smluv. Popis modulu. Záložka Evidence smluv

Manuál Kentico CMSDesk pro KDU-ČSL

NÁVRHOVÝ PROGRAM VÝMĚNÍKŮ TEPLA FIRMY SECESPOL CAIRO PŘÍRUČKA UŽIVATELE

1 - Prostředí programu WORD 2007

Žáci mají k dispozici pracovní list. Formou kolektivní diskuze a výkladu si osvojí grafickou minimalizaci zápisu logické funkce

ZATÍŽENÍ SNĚHEM A VĚTREM

WEBDISPEČINK NA MOBILNÍCH ZAŘÍZENÍCH PŘÍRUČKA PRO WD MOBILE

Příloha č. 54. Specifikace hromadné aktualizace SMS-KLAS

1.11 Vliv intenzity záření na výkon fotovoltaických článků

I. Objemové tíhy, vlastní tíha a užitná zatížení pozemních staveb

Uživatelská dokumentace

Národní informační středisko pro podporu kvality Tůmová

téma: Formuláře v MS Access

Programový komplet pro evidence provozu jídelny v modul Sklad Sviták Bechyně Ladislav Sviták hotline: 608/

TECHNICKÉ KRESLENÍ A CAD

Osvětlovací modely v počítačové grafice

TRANSFORMACE. Verze 4.0

STANOVISKO č. STAN/1/2006 ze dne

ČESKÁ ZEMĚDĚLSKÁ UNIVERZITA V PRAZE

ČÁST PÁTÁ POZEMKY V KATASTRU NEMOVITOSTÍ

Makroekonomie I. Přednáška 2. Ekonomický růst. Osnova přednášky: Shrnutí výpočtu výdajové metody HDP. Presentace výpočtu přidané hodnoty na příkladě

SYLABUS PŘEDNÁŠKY 6b Z INŽENÝRSKÉ GEODÉZIE (Polohové vytyčování) 4. ročník bakalářského studia studijní program G studijní obor G

Zadávání tiskových zakázek prostřednictvím JDF a Adobe Acrobat Professional

PRINCIPY ŠLECHTĚNÍ KONÍ

Návod k použití aplikace MARKETINGOVÉ PRŮZKUMY.CZ

Měření změny objemu vody při tuhnutí

Oblastní stavební bytové družstvo, Jeronýmova 425/15, Děčín IV

INTERNETOVÝ TRH S POHLEDÁVKAMI. Uživatelská příručka

Společné stanovisko GFŘ a MZ ke změně sazeb DPH na zdravotnické prostředky od

Vyvažování tuhého rotoru v jedné rovině přístrojem Adash Vibrio

Manuál uživatele čipové karty s certifikátem

PŘIJÍMACÍ ŘÍZENÍ. Strana

MMEE cv Stanovení množství obchodovatelného zboží mezi zákazníkem a dodavatelem

Tel/fax: IČO:

Město Mariánské Lázně

Analýza variance (ANOVA) - jednocestná; faktor s pevným efektem; mnohonásobná srovnání

Technická hodnota věcí a zařízení

ZADÁVACÍ DOKUMENTACE

Analýza oběžného kola

3 nadbytek. 4 bez starostí

Moderní technologie ve studiu aplikované fyziky CZ.1.07/2.2.00/ Reálná čísla

NEJČASTĚJŠÍ POCHYBENÍ PŘI PODÁNÍ ŽÁDOSTI O PODPORU V RÁMCI INTEGROVANÉHO REGIONÁLNÍHO OPERAČNÍHO PROGRAMU, SC 2.5, VÝZVA Č

DYNAMICKÉ VÝPOČTY PROGRAMEM ESA PT

Úprava fotografií hledání detailu, zvětšování (pracovní list)

170/2010 Sb. VYHLÁŠKA. ze dne 21. května 2010

Zadávací dokumentace k veřejné zakázce

STP097 STATISTIKA CVIČENÍ EMPIRICKÁ DISTRIBUČNÍ FUNKCE, JEDNOVÝBĚROVÉ TESTY

269/2015 Sb. VYHLÁŠKA

Průzkum veřejného mínění věcné hodnocení

MODELOVÁNÍ CENOVÉ ELASTICITY POPTÁVKY PO VJEZDU NA AUTOBUSOVÉ NÁDRAŽÍ MODELLING OF PRICE DEMAND ELASTICITY FOR ENTRY TO BUS TERMINAL

Aktivity s GPS 3. Měření některých fyzikálních veličin

Příloha CD: Testování hypotéz 1

Zadávací dokumentace

Seriál: Management projektů 7. rámcového programu

Rozšířená nastavení. Kapitola 4

VÝZVA. Česká republika-ministerstvo školství, mládeže a tělovýchovy (dále jen zadavatel) se sídlem Karmelitská 7, Praha 1, IČ

ZEMNÍ ODPOR ZEMNIČE REZISTIVITA PŮDY

Data v počítači EIS MIS TPS. Informační systémy 2. Spojení: jan.skrbek@tul.cz tel.: Konzultace: úterý

ZADÁVACÍ DOKUMENTACE

Výběrové řízení zakázka na dodávku ZADÁVACÍ DOKUMENTACE

VYUŽITÍ NEURONOVÝCH SÍTÍ PROSTŘEDÍ MATLAB K PREDIKCI HODNOT NÁKLADŮ PRO ELEKTRICKÉ OBLOUKOVÉ PECE

FAKULTA INFORMATIKY A MANAGEMENTU UNIVERZITA HRADEC KRÁLOVÉ SEMESTRÁLNÍ PRÁCE. Modely operačního výzkumu 1. Studijní obor:

1.3 Druhy a metody měření

Ústavní sociální služby pro osoby s postižením v Moravskoslezském kraji

10 je 0,1; nebo taky, že 256

Pokyny k instalaci FRIATRACE Verze 5.3

DATABÁZE DŮLEŽITÉ: Před načtením nové databáze do vaší databáze si prosím přečtěte následující informace, které vám umožní:

Podrobný postup pro doplnění Žádosti o dotaci prostřednictvím Portálu Farmáře. 1. kolo příjmu žádostí Programu rozvoje venkova ( )

funkční na dual-sim telefonech možnost přesměrovat příchozí hovory možnost nastavení více telefonních čísel pro případ, že je jedno nedostupné

Směrnice pro zadávání veřejných zakázek malého rozsahu města Poděbrady

Odůvodnění veřejné zakázky dle 156 zákona. Odůvodnění účelnosti veřejné zakázky dle 156 odst. 1 písm. a) zákona; 2 Vyhlášky 232/2012 Sb.

1.2.5 Reálná čísla I. Předpoklady:

-1- N á v r h ČÁST PRVNÍ OBECNÁ USTANOVENÍ. 1 Předmět úpravy

Pokyny České pošty pro označování Doporučených zásilek čárovými kódy

1. DÁLNIČNÍ A SILNIČNÍ SÍŤ V OKRESECH ČR

EXPERTNÍ POSUDEK Doc. RNDr. Martin Ouředníček, Ph.D. Stručný výtah z posudku.

Algoritmizace a programování

Výzva k podání nabídek (zadávací dokumentace)

Z OBRAZOVÉHO ZÁZNAMU. Jan HAVLÍK. Katedra teorie obvodů, Fakulta elektrotechnická

PRAVIDLA PROVOZOVÁNÍ LOKÁLNÍ DISTRIBUČNÍ SOUSTAVY. Forum Liberec s.r.o.

ZADÁVACÍ DOKUMENTACE K VEŘEJNÉ ZAKÁZCE ZADÁVANÉ DLE ZÁKONA Č. 137/2006 SB., O VEŘEJNÝCH ZAKÁZKÁCH, VE ZNĚNÍ POZDĚJŠÍCH PŘEDPISŮ (DÁLE JEN ZÁKON )

Metodika kontroly naplněnosti pracovních míst

Seznámení žáků s pojmem makra, možnosti využití, praktické vytvoření makra.

obecně závazné vyhlášky o vedení technické mapy obce A. OBECNÁ ČÁST Vysvětlení navrhované právní úpravy a jejích hlavních principů

účetních informací státu při přenosu účetního záznamu,

KVALIFIKAČNÍ DOKUMENTACE k veřejné zakázce zadávané podle zákona č. 137/2006 Sb., o veřejných zakázkách, ve znění pozdějších předpisů

Zadávací dokumentace pro podlimitní veřejnou zakázku na dodávky

Matematický model malířského robota

Česká zemědělská univerzita v Praze Fakulta provozně ekonomická. Obor veřejná správa a regionální rozvoj. Diplomová práce

Zadávací dokumentace. Programátorské práce na rozšíření systému pro digitalizaci knihovních dokumentů. ve zjednodušeném podlimitním řízení

Novinky verzí SKLADNÍK 4.24 a 4.25

A. PODÍL JEDNOTLIVÝCH DRUHŮ DOPRAVY NA DĚLBĚ PŘEPRAVNÍ PRÁCE A VLIV DÉLKY VYKONANÉ CESTY NA POUŽITÍ DOPRAVNÍHO PROSTŘEDKU

STŘEDOŠKOLSKÁ ODBORNÁ ČINNOST. Chemické výpočty. Aleš Kajzar Martin Honka

Aktualizace softwaru Uživatelská příručka

Transkript:

ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE FAKULTA ELEKTROTECHNICKÁ BAKALÁŘSKÁ PRÁCE Jakub Klíma 2008

ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE Fakulta elektrotechnická Katedra měření STATISTICKÉ ZPRACOVÁNÍ VÝSLEDKŮ MĚŘENÍ STATISTICAL EVALUATION OF MEASUREMENT RESULTS Vedoucí páce Ing. Radek Sedláček, Ph.D. Praha 2008 Autor Jakub Klíma

PROHLÁŠENÍ Prohlašuji, že jsem svou bakalářskou práci vypracoval samostatně pod vedením Ing. Radka Sedláčka, Ph.D. a použil jsem pouze podklady (literaturu, projekty, SW atd.) uvedené v přiloženém seznamu. Nemám závažný důvod proti užití tohoto školního díla ve smyslu 60 Zákona č.121/2000 Sb., o právu autorském, o právech souvisejících s právem autorským a o změně některých zákonů (autorský zákon). V Praze dne.. podpis 1

ANOTACE Ve své bakalářské práci se budu věnovat popisu programu pro statistické zpracování výsledků měření, který jsem naprogramoval. K vytvoření programu jsem použil prostředí Microsoft Visual Studio 2008 a programovací jazyk C#. Program umožňuje načtení experimentálních dat z externího textového souboru. Vlastní zpracování údajů zahrnuje posouzení odlehlých výsledků pozorování, ověření naměřených dat z hlediska normality (histogram, test, Kolmogorov- Smirnovův test), dále určení konfidenčních mezí náhodné a nevyloučené systematické chyby a v neposlední řadě též stanovuje celkovou krajní chybu měření. KLÍČOVÁ SLOVA: Statistické zpracování, C#, normální (Gaussovo) rozložení, histogram, testy normality, konfidenční meze. 2

ANNOTATION In my baccalaureate work I will attend to a description of a programme for the statistical evaluation of measurement results. To make this programme up I used the software called Microsoft Visual Studio 2008 and the programming language C#. My programme enables to unload experimental data from an external text file. The own processing of data includes examination of the remote results of sighting, checking of the measured data in term of normality (histogram, χ 2 -test, Kolmogorov-Smirnov test), than determination of the confidence bound of random and non-eliminated systematic error. Not least the programme determinates the total extreme measurement error. KEY WORDS: Statistical processing, C#, Normal distribution (Gaussian distribution), Histogram, Test of the normality, Confidence bound. 3

OBSAH Anotace... 2 Annotation... 3 1 Úvod... 6 2 Teoretický úvod do použitých statistických metod... 8 2.1 Grubbsův test... 8 2.2 Absolutní chyba... 8 2.3 Relativní chyba... 9 2.4 Histogram... 9 2.5 Aritmetický průměr... 9 2.6 Medián... 10 2.7 Směrodatná odchylka... 10 2.8 Směrodatná odchylka výsledku jednoho pozorování... 10 2.9 Střední kvadratická chyba aritmetického průměru... 10 2.10 Pravděpodobná chyba aritmetického průměru... 11 2.11 Krajní chyba měření... 11 2.12 Distribuční funkce... 11 2.13 Test dobré shody kritérium 1... 12 2.14 Test dobré shody kritérium 2... 13 2.15 Chí kvadrát test... 13 2.16 Kolmogorov-Smirnovův test... 13 2.17 Konfidenční meze náhodné chyby výsledku měření... 15 2.18 Směrodatná odchylka nevyloučené systematické chyby... 15 2.19 Konfidenční meze nevyloučené systematické chyby... 15 2.20 Konfidenční meze celkové chyby měření... 16 3 Zvolená metoda zpracování a cíl práce... 17 3.1 Volba jazyka C#... 17 3.2 Požadavky kladené na program... 17 3.3 Úskalí C#... 17 3.4 Budoucí upgrade... 18 3.5 Přínos bakalářské práce... 18 4 Jádro práce: popis programu... 19 4.1 Grafika... 19 4

4.2 Celkový vzhled programu... 20 4.3 Hlavní lišta... 20 4.4 Rozbor záložek... 22 4.5 Naměřená data... 22 4.6 Základní zpracování... 23 4.7 Histogram... 25 4.8 Chyby měření... 27 4.9 Distribuční funkce... 28 4.10 Testy dobré shody... 30 4.11 Konfidenční meze... 35 5 Výsledky práce (experimentální část)... 37 5.1 Experimentální data... 37 5.2 Zobrazení naměřených dat... 38 5.3 Porovnání hodnot základního zpracování... 38 5.4 Zobrazení histogramu... 40 5.5 Porovnání vypočtených chyb měření... 41 5.6 Zobrazení distribuční funkce... 41 5.7 Srovnání testů dobré shody... 42 5.8 Porovnání konfidenčních mezí... 43 5.9 Další testování... 43 6 Závěr... 45 7 Poděkování... 47 8 Citovaná literatura... 48 9 Bibliografie... 49 10 Přílohy... 50 10.1 Seznam tvarů vývojového diagramu... 50 5

1 ÚVOD Předmětem mé bakalářské práce bylo vytvoření programu, který lze využít ke statistickému zpracování výsledků měření. Dosud byla k dispozici pro řešení obdobných problémů pouze starší verze programu tohoto charakteru. Bylo však zapotřebí jej značně obnovit- zejména pro nemožnost načtení většího množství dat z externího datového souboru. Další nevýhodou byla nutnost vlastnit software Matlab, neboť v něm byl původní program, resp. pouze skript, vytvořen. V neposlední řadě byl stávající program znevýhodněn též z důvodu nepoužitelnosti při vlastnění nekompatibilní verze prostředí Matlab. Motivací k výběru zadání bakalářské práce byla zejména má osobní snaha naučit se zacházet s programovacím jazykem C#, jehož prostřednictvím jsem zadání realizoval. Dalším impulzem pro volbu byla také potřeba rozšíření si vlastních vědomostí v oblasti statistických funkcí využívaných v mém studijním oboru. Součástí mé bakalářské práce je nejen vytvoření samotného programu, ale také tento doprovodný text, v němž se budu věnovat jeho popisu. Může proto také posloužit potenciálnímu uživateli- a to jednak jako návod k použití a na druhou stranu také pochopitelně jako prostředek pro bližší poznání možností a vlastností programu Při vytváření softwaru jsem se pohyboval ve vývojovém prostředí Microsoft Visual Studio 2008 a jako programovací nástroj jsem zvolil jazyk C#. Ohlédnu-li se zpět, považuji tento výběr za šťastný. Nicméně bych na tomto místě rád dodal, že jsem na druhou stranu touto volbou sám sebe znevýhodnil tím, že všechny kódy pro statistické testy jsem musel osobně implementovat. Výsledkem úsilí se stal jak předpokládám- uživatelsky intuitivní program. Jeho prostřednictvím lze načíst velké množství hodnot uložených v externím datovém souboru. Po načtení dat lze snadno přistoupit k samotnému zpracování. To zahrnuje: posouzení odlehlých výsledků pozorování ověření naměřených dat z hlediska normality (histogram, test, Kolmogorov-Smirnovův test (KS test)) určení konfidenčních mezí náhodné a nevyloučené systematické chyby stanovení celkové krajní chyby měření vykreslení diskrétní distribuční funkce Množství dat k vyhodnocení může být velmi rozsáhlé (při testování se mi podařilo zpracovat až 500 000 hodnot; toto množství je výrazně závislé na výkonu konkrétního počítače a zejména na velikosti jeho operační paměti). Předpokládám, že program může být využit studenty jako učební pomůcka k zpracování výsledků jejich vlastního měření. Má naznačit postup při zpracování a ukázat, jestli data z měření, resp. jakákoli jiná data, mají normální rozložení a jsou dále použitelná k samotnému zpracování. Je zřejmé, že program může být využíván nejen studenty, ale i kterýmkoli z pedagogů a jiných akademických pracovníků ČVUT. 6

Kupování licencí pro statistické programy je značně drahé, proto za přínos pro fakultu také považuji prakticky nulovou ekonomickou nákladnost při získání mnou vytvořeného programu. 7

2 TEORETICKÝ ÚVOD DO POUŽITÝCH STATISTICKÝCH METOD STATISTIKA je matematická věda a zároveň z původního pohledu postup, jak rozvíjet lidské znalosti použitím empiricky získaných dat. Tato věda je větví aplikované matematiky. Pomocí teorie pravděpodobnosti jsou v teorii statistiky modelovány náhodnost a neurčitost. TEORIE PRAVDĚPODOBNOSTI je dnes základním teoretickým oborem pro matematickou statistiku. V této teorii na základě znalosti chování určité náhodné veličiny (tedy na základě zákona rozdělení pravděpodobnosti) určujeme pravděpodobnost určitého chování systému v dané situaci (tzn. určujeme výsledek náhodného pokusu). V matematické statistice je tomu naopak, tzn. na základě určitých dat (tzv. náhodného výběru) hledáme obecný model chování náhodné veličiny (obvykle charakteristiky rozdělení). Tento postup, tzn. hledání rozdělovacího zákona nebo charakteristik rozdělení, se označuje jako STATISTICKÁ INDUKCE. STATISTICKÁ ANALÝZA DAT nabývá na stále větším významu a zároveň se stává jedním ze základních přístupů v celé řadě technicky, přírodovědně, lékařsky a sociálně zaměřených věd. Výhodou počítačové analýzy může být zpracování souborů obsahujících např. řádově až statisíce hodnot. VE SVÉM PROGRAMU sloužícím ke statistické analýze dat získaných praktickým měřením, využívám (dle zadání bakalářské práce) následujících statistických testů a metod: 2.1 GRUBBSŮV TEST V případě, že se v získané skupině výsledků pozorování jeden nebo dva výsledky výrazně odlišují od všech ostatních, je nutné otestovat, zda tyto výsledky nejsou zatíženy hrubými chybami a není je tudíž nutno vyloučit ze skupiny. Jako nejvhodnější statistickou metodu pro použití k těmto účelům jsem zvolil metodu F. E. Grubbse- tzv. Grubbsův test. [1] Testujeme-li hodnoty, zda nejsou zatížené hrubou chybou měření, vypočteme poměr následně nalezneme v tabulce hodnotu odpovídající zvolené hladině významnosti a počtu pozorování. [1] Zjistíme-li, že, výsledek x i je zatížen hrubou chybou a je vhodné jej vyškrtnout ze souboru naměřených hodnot. [1] 2.2 ABSOLUTNÍ CHYBA V matematice je chybou aproximace označována odchylka přibližné (aproximované) hodnoty od skutečné (přesné) hodnoty. Je-li a přibližná (aproximovaná) hodnota veličiny a b její přesná (skutečná) hodnota. [2] 8

2.3 RELATIVNÍ CHYBA Relativní chyba se často uvádí v procentech a udává odchylku od skutečné (přesné) hodnoty v procentech. [2] 2.4 HISTOGRAM Provedeme-li náhodný výběr o rozsahu n, mohou se některé hodnoty opakovat vícekrát. Počet výskytů n i hodnoty x i označujeme jako (absolutní) četnost pozorování hodnoty x i. Poměr nazýváme poměrnou (relativní) četností pozorování x i. Platí Tedy součet četností je roven rozsahu n. Podobně tak je součet relativních četností roven 1. [3] Součet četností všech pozorování, která nepřevyšují hodnotu x i, označujeme jako kumulativní četnost pozorování x i. Součet poměrných četností všech pozorování, která nepřevyšují hodnotu x i, se nazývá kumulativní poměrnou (relativní) četností pozorování x i. [3] Při velkém rozsahu n náhodného výběru rozdělujeme hodnoty do tzv. tříd (třídních intervalů). Celý obor hodnot je pak rozdělen na třídní intervaly, přičemž daná pozorovaná hodnota spadá vždy do jedné třídy. Počet tříd k lze volit podle potřeby. Obvykle se k pohybuje mezi 5 a 20, nebo se volí tzv. Sturgesovo pravidlo. [3] Pozorování spadající do jedné třídy, jsou považována za ekvivalentní. Hodnoty všech pozorování spadajících do jedné třídy nahrazujeme jednou hodnotou, obvykle středem třídního intervalu. Počty pozorování v jednotlivých třídách nazýváme třídní četností. Poměr třídních četností k celkovému počtu pozorování n pak nazýváme poměrnou (nebo také relativní) třídní četností. [3] Četnosti, resp. poměrné četnosti, zaznamenáváme obvykle do tzv. četnostní tabulky, ve které jsou uvedeny zaznamenané hodnoty x i a jim odpovídající četnosti, resp. poměrné četnosti. Četnostní tabulky se sestavují i pro kumulativní a třídní četnosti. [3] Známe-li poměrné třídní četnosti, můžeme sestrojit tzv. histogram, což je sloupcový graf, v němž každé třídě přiřadíme její četnost. [3] 2.5 ARITMETICKÝ PRŮMĚR Aritmetický průměr je statistická veličina, která v jistém smyslu vyjadřuje typickou hodnotu popisující soubor mnoha hodnot. Aritmetický průměr se obvykle značí vodorovným pruhem nad názvem proměnné, popř. řeckým písmenem μ (které také označuje střední hodnotu souboru). Definice aritmetického průměru je 9

tzn. součet všech hodnot vydělený jejich počtem. V běžné řeči se obvykle obecným slovem průměr myslí právě aritmetický průměr. [4] 2.6 MEDIÁN Medián (označován Me nebo ) je hodnota, jež dělí řadu podle velikosti seřazených výsledků na dvě stejně početné poloviny. Ve statistice patří mezi míry centrální tendence. Platí, že nejméně 50 % hodnot je menších nebo rovných a nejméně 50 % hodnot je větších nebo rovných mediánu. [5] 2.7 SMĚRODATNÁ ODCHYLKA Směrodatná odchylka je v teorii pravděpodobnosti a statistice často používanou mírou statistické disperze. Jedná se o kvadratický průměr odchylek hodnot znaku od jejich aritmetického průměru. [6] Zhruba řečeno vypovídá o tom, jak moc se od sebe navzájem liší typické případy v souboru zkoumaných čísel. Je-li malá, jsou si prvky souboru většinou navzájem podobné, a naopak velká směrodatná odchylka signalizuje velké vzájemné odlišnosti. Pomocí pravidel 1σ a 2σ lze přibližně určit, jak daleko jsou čísla v souboru vzdálená od průměru, resp. hodnoty náhodné veličiny vzdálené od střední hodnoty. Směrodatná odchylka je nejpoužívanější míra variability. [6] 2.8 SMĚRODATNÁ ODCHYLKA VÝSLEDKU JEDNOHO POZOROVÁNÍ [6] 2.9 STŘEDNÍ KVADRATICKÁ CHYBA ARITMETICKÉHO PRŮMĚRU 10

Střední kvadratická chyba aritmetického průměru vyjadřuje nejistotu, s jakou přesností jsme aritmetickým průměrem určili měřenou veličinu. Chybu můžeme odhadnout právě pomocí střední kvadratické chyby aritmetického průměru. [7] 2.10 PRAVDĚPODOBNÁ CHYBA ARITMETICKÉHO PRŮMĚRU Pravděpodobná chyba aritmetického průměru udává takovou hodnotu chyby, při které je 50% pravděpodobnost, že se přesná hodnota neliší od aritmetického průměru více, než o tuto hodnotu. Má dvojí značení: a. [7] 2.11 KRAJNÍ CHYBA MĚŘENÍ Krajní chyba měření je taková chyba, v jejímž rozmezí se nachází správná hodnota s pravděpodobností 99,73%. [7] 2.12 DISTRIBUČNÍ FUNKCE 2.12.1 ROZDĚLENÍ PRAVDĚPODOBNOSTI Rozdělení pravděpodobnosti náhodné veličiny je pravidlo, kterým každému jevu popisovanému touto veličinou přiřazujeme určitou pravděpodobnost. Rozdělení pravděpodobnosti náhodné veličiny tedy získáme, pokud každé hodnotě diskrétní náhodné veličiny, popř. intervalu hodnot spojité náhodné veličiny, přiřadíme pravděpodobnost. [8] Rozdělení pravděpodobnosti lze také chápat jako zobrazení, které každému elementárnímu jevu přiřazuje určité reálné číslo, které charakterizuje pravděpodobnost tohoto jevu. [8] Pravděpodobnost, že diskrétní náhodná veličina X bude mít po provedení náhodného pokusu hodnotu x, značíme P(X = x), P[X = x] nebo stručně P(x). [8] Výsledkem jednoho náhodného pokusu je to, že náhodná veličina bude mít právě jednu hodnotu. Všechny hodnoty definičního oboru náhodné veličiny tedy představují úplný systém neslučitelných jevů, což znamená, že součet pravděpodobností všech možných hodnot x diskrétní náhodné proměnné X je roven 1. [8] 11

Rozdělení pravděpodobnosti diskrétní náhodné veličiny tedy vyjádříme tak, že určíme pravděpodobnost P(x) pro všechna x definičního oboru veličiny X. Pravděpodobnost výskytu jedné hodnoty je právě Pravděpodobnosti jednotlivých hodnot x jsou tedy vyjádřeny funkcí P(x), kterou označujeme jako pravděpodobnostní funkci. [8] Pomocí pravděpodobnostní funkce můžeme zavést tzv. distribuční funkci. [8] 2.12.2 DISTRIBUČNÍ FUNKCE Distribuční funkce je neklesající a je spojitá zleva. Hodnoty distribuční funkce leží v rozsahu. Pro diskrétní náhodnou veličinu X lze pro libovolné reálné číslo x vyjádřit distribuční funkci vztahem jestliže hodnoty náhodné veličiny leží v intervalu, pak F(a) = 0 a F(b) = 1. [8] Distribuční funkci lze, podobně jako pravděpodobnostní funkci, použít k výpočtu pravděpodobnosti. [8] 2.13 TEST DOBRÉ SHODY KRITÉRIUM 1 Z výsledku pozorování x 1,..,x n se vypočte hodnota podle vztahu pro zvolenou hladinu významnosti α 1 se v tabulce 2.1 naleznou odpovídající hodnoty Hypotéza o normalitě vyšetřovaného souboru výsledků pozorování se podle kritéria 1 nezamítá v případě, že platí [1] Počet pozorování n α 1 /2 [%] (1 - α 1 /2) [%] 1 5 10 90 95 99 11 0,9359 0,9073 0,8899 0,7409 0,7153 0,6675 16 0,9137 0,8884 0,8733 0,7452 0,7236 0,6829 21 0,9001 0,8768 0,8631 0,7495 0,7304 0,6950 26 0,8901 0,8686 0,8570 0,7530 0,7360 0,7040 31 0,8827 0,8625 0,8511 0,7559 0,7404 0,7110 36 0,8769 0,8578 0,8468 0,7583 0,7440 0,7167 12

41 0,8722 0,8540 0,8436 0,7604 0,7470 0,7216 46 0,8682 0,8508 0,8409 0,7621 0,7496 0,7216 51 0,8648 0,8481 0,8385 0,7636 0,7518 0,7291 TABULKA 2.1 (HODNOTY PRO KRITÉRIUM 1) 2.14 TEST DOBRÉ SHODY KRITÉRIUM 2 Podle tohoto kritéria se hypotéza o normalitě nezamítá v případě, že vztah neplatí pro více než m hodnot x i. [1] 2.15 CHÍ KVADRÁT TEST Test dobré shody je založen na tom, že náhodnou veličinu s multinomickým rozdělením lze transformovat na veličinu mající přibližně rozdělení chí kvadrát. [9] POSTUP PŘI TESTU DOBRÉ SHODY 1. Obor všech možných hodnot náhodné veličiny se rozdělí na k nepřekrývajících se částí. 2. Pro každou část se stanoví pravděpodobnost p i, že náhodná veličina nabude hodnoty z i-té části. 3. Provede se N pokusů a zjistí se, kolikrát z těchto pokusů nabyla náhodná veličina hodnoty z 1., 2., k-té části. Tyto četnosti se označí X 1,X 2,...,X k. Porovnají se očekávané četnosti v jednotlivých částech (Np i ) se skutečnými četnostmi (X i ). [9] Pokud má testovaná náhodná veličina předpokládané rozdělení, má náhodná veličina χ 2 přibližně rozdělení chí kvadrát. Jestliže bylo rozdělení dáno včetně všech parametrů, je počet stupňů volnosti k-1; jestliže byl některý parametr rozdělení neznámý, snižuje se počet stupňů volnosti za každý neznámý parametr (bylo jej nutno nejprve z dat odhadnout a pak teprve stanovit pravděpodobnosti p i ). [9] Hodnotu veličiny χ 2 porovnáme s kritickou hodnotou příslušného rozdělení chí kvadrát na požadované hladině významnosti. Test lze použít za předpokladu, že všechny hodnoty Np i jsou alespoň 5. [9] 2.16 KOLMOGOROV-SMIRNOVŮV TEST Kolmogorov-Smirnovův test dobré shody používá k testování hypotézy o tvaru rozdělení zkoumané náhodné veličiny X přímo jednotlivé její naměřené hodnoty x 1,,x n (předpokládáme zde, že jsou všechny navzájem různé), zatímco v χ 2 testu dobré shody se 13

tyto naměřené hodnoty nejprve zařadily do jednotlivých tříd a pak se již používaly pouze četnosti těchto tříd. [10] Kolmogorov-Smirnovův test dobré shody je možné použít i v případě malých náhodných výběrů, což u χ 2 testu dobré shody nešlo, protože by třídy byly velmi málo četné, nebo by jich bylo extrémně málo. [10] Zde budeme předpokládat, že hypotetické rozdělení, které se testuje, je rozdělení spojité a navíc že jsou v nulové hypotéze zadány i všechny jeho parametry. Jsou ale vyvinuty i obecnější varianty Kolmogorov-Smirnovova testu pro případy, kdy tyto předpoklady neplatí. [10] Pro popis hypotetického rozdělení veličiny X se použije jeho distribuční funkce je tzv. hypotetická distribuční funkce. Při Kolmogorov-Smirnovově testu jde tedy o test nulové hypotézy H 0 : rozdělení veličiny X je dáno distribuční funkcí proti alternativě H 1 : rozdělení veličiny X je dáno jinou distribuční funkcí než Při testu postupujeme tak, že nejprve z naměřených hodnot x 1,,x n určíme tzv. výběrovou distribuční funkci (je to jistý odhad skutečné (neznámé) distribuční funkce veličiny X). Tato výběrová distribuční funkce je definována vztahy přitom x 1,,x n je tzv. uspořádaný náhodný výběr, což jsou hodnoty z náhodného výběru x 1,,x n, ale uspořádané podle velikosti od nejmenšího do největšího. [10] Další postup spočívá v tom, že porovnáme zjištěnou výběrovou distribuční funkci s hypotetickou distribuční funkcí. Nulovou hypotézu H 0 pak zamítneme zhruba řečeno tehdy, je-li maximální rozdíl mezi hodnotami těchto dvou funkcí hodně veliký. Přesněji řečeno zamítáme H 0, je-li kde je kritická hodnota uvedené testovací statistiky R. Dá se ukázat, že se (vzhledem k výše uvedené definici výběrové distribuční funkce ) dá testovací statistika R spočítat ze vztahu Kritické hodnoty jsou uvedeny v tabulkách kritických hodnot. [10] 14

Kolmogorov-Smirnovův test dobré shody (test o rozdělení náhodné veličiny) je popsán v následující tabulce. [10] H 0 H 1 Testovací statistika R Kritický obor Rozdělení X má Rozdělení X nemá distribuční fci distribuční fci TABULKA 2.2 (KOLMOGOROV-SMIRNOVŮV TEST) Poznámka kritická hodnota pro Kolmogorov-Smirnovův test 2.17 KONFIDENČNÍ MEZE NÁHODNÉ CHYBY VÝSLEDKU MĚŘENÍ Důležitou součástí statistického zpracováni výsledků pozorování je stanovení intervalu spolehlivosti (konfidenčního intervalu) pro skutečnou hodnotu měřené veličiny x S. 100(1 - α) % intervalem spolehlivosti pro hodnotu x S se rozumí náhodný interval, který hodnotu x S pokrývá s pravděpodobností (1 - α) (tato pravděpodobnost se nazývá konfidenčním koeficientem příslušným k uvažovanému konfidenčnímu intervalu). [1] Pro konkrétně naměřené hodnoty x 1,...,x n se odpovídající hodnoty 100(1 - α)% konfidenčních mezí náhodné chyby výsledku měření vypočítá podle vztahu [1] K vyjádření 100(1 - α)% intervalu spolehlivosti pro μ lze použít vztah [1] 2.18 SMĚRODATNÁ ODCHYLKA NEVYLOUČENÉ SYSTEMATICKÉ CHY- BY V případě, že počet složek ξ je vysoký (m -> ), se rozdělení veličiny ξ blíží normálnímu rozdělení s nulovou střední hodnotou a se směrodatnou odchylkou. [1] 2.19 KONFIDENČNÍ MEZE NEVYLOUČENÉ SYSTEMATICKÉ CHYBY V případě menšího poctu složek nevyloučené systematické chyby jsou konfidenční meze této chyby úměrné druhé odmocnině ze součtu kvadrátů hodnot 15

Ukazuje se, že pro konfidenční koeficienty menší než 0,99 hodnota součinitele K jen málo závisí na počtu složek nevyloučené systematické chyby. Např. pro (1 - α) = 0,95 se doporučuje volit K = 1,1, pro (1 - α) = 0,99 a m > 4 se volí K = 1,45. [1] Při velmi malém počtu složek nevyloučené systematické chyby (m = 2 3) je vždy třeba provést kontrolu, zda pro vypočtenou hodnotu. [1] Pokud tato podmínka není splněna, hodnotu je třeba počítat ze vztahu [1] 2.20 KONFIDENČNÍ MEZE CELKOVÉ CHYBY MĚŘENÍ Při určování konfidenčních mezí ze vztahu celkové chyby výsledku měření se vychází hodnoty obou sčítanců v čitateli se určují pro tentýž konfidenční koeficient. [1] Interval spolehlivosti lze vyjádřit pomocí vztahu [1] 16

3 ZVOLENÁ METODA ZPRACOVÁNÍ A CÍL PRÁCE Cílem tohoto textu je uvedení do problematiky a nastínění možností využití mnou vytvořeného programu Statistické zpracování výsledků měření. Doporučeným vývojovým prostředím k vytvoření programu bylo prostředí Matlab. Zvolil jsem však jinou variantu, a tedy prostředí Microsoft Visual Studio 2008 a jazyk C#. 3.1 VOLBA JAZYKA C# DŮVODEM VÝBĚRU JAZYKA C# (po dohodě s vedoucím bakalářské práce Ing. Radkem Sedláčkem) byla: výhoda pro uživatele, že pro jeho počítač není nutné vlastnit licenci softwaru Matlab hrozící nekompatibilita různých verzí vývojového prostředí Matlab s mým programem z mého pohledu nekomfortní vývojové prostředí Matlab PROČ JSEM ZVOLIL JAZYK C#? lepší přenositelnost mého programu na platformě Windows k práci není třeba žádného dalšího speciálního softwaru (pouze NET Framework 3.5, o kterém předpokládám, že bude v blízké budoucnosti standardním softwarovým vybavením) NET Framework 3.5 je již dnes ke stažení zdarma C# je dnes nejvíce se rozvíjejícím programovacím jazykem v mém osobním zájmu je rozvíjet své programátorské schopnosti v tomto jazyce 3.2 POŽADAVKY KLADENÉ NA PROGRAM POŽADAVKY K MNOU VYTVÁŘENÉMU PROGRAMU: program umožní načtení konkrétních externích dat z textového souboru vlastní zpracování údajů bude zahrnovat posouzení odlehlých výsledků pozorování bude existovat možnost ověření naměřených dat z hlediska normalit: histogram a testy dobré shody určení konfidenčních mezí náhodné a nevyloučené systematické chyby program umožní stanovení celkové krajní chyby měření 3.3 ÚSKALÍ C# S JAKÝMI OBTÍŽEMI JSEM SE PŘI PROGRAMOVÁNÍ V C# POTÝKAL? Hlavní výhodou vývojového prostředí Matlab jsou předem definované statistické funkce, s čímž není možné při programování v C# počítat. Tato skutečnost se pro 17

mě stala problematickou. Definování všech statistických funkcí bylo časově nejnáročnější a mnohdy i velmi obtížné. Složitější také bylo kreslení grafů, to jsem musel naprogramovat bod od bodu. A taky tato část programu skrývá největší nedostatky. Nakonec se mi však podařilo implementovat všechny požadované funkce. 3.4 BUDOUCÍ UPGRADE Stejně jako každý software, ani můj program není dokonalý a v budoucnu jej tedy bude možné vylepšit a upravit. Domnívám se, že hlavní změny a úpravy by se rámcově mohly týkat následujících bodů: Co se týče programové části, zde by se hlavní upgrade mohl vztahovat k oblasti kreslení grafů pomocí GDI. V současné- první- verzi jsem použil základní vykreslování. Jeho nedokonalost tkví v tom, že při překreslení graf blikne (překreslení je viditelné), navíc při velkém počtu zobrazovaných dat (asi nad 5000) hrozí, že se program stane nestabilním. Pro budoucí vylepšení bych doporučil použít alespoň dvojitého bufrování. Další vylepšení by se potenciálně mohlo týkat naprogramování dalších statistických funkcí. 3.5 PŘÍNOS BAKALÁŘSKÉ PRÁCE Největší přínos této práce vidím v možném praktickém využití studenty, a to na jakémkoli počítači s operačním systémem Windows. Další výhoda tkví ve skutečnosti, že program oproti starším verzím dokáže načíst úctyhodné množství dat, asi okolo půl milionu. Toto číslo nelze určit přesně, záleží na výkonu daného počítače. 18

4 JÁDRO PRÁCE: POPIS PROGRAMU V následujících bodech se budu věnovat konkrétnímu rozboru jednotlivých částí programu. V první řadě nastíním postup a důvod volby způsobu tvorby grafické stránky programu. Následně objasním význam a funkci jednotlivých položek, které jsou součástí hlavní lišty. Nakonec rozeberu funkčnost záložek, které se v programu nacházejí pod hlavní lištou. Vlastní zdrojový kód nebudu vypisovat, neboť- podle mého názoru- nemá takový popisný charakter a navíc by zaujal podstatnou část práce. Z těchto důvodů jsem se rozhodl u funkcí, které mi nepřipadají tak zásadní, vytvořit vývojové diagramy, které mají velmi názorný a vysvětlující charakter. Pro objasnění všech tvarů vyskytujících se ve vývojovém diagramu jsem do přílohy vložil jejich seznam 10.1. 4.1 GRAFIKA Ke grafické stránce svého programu jsem obrátil zvláštní pozornost, proto mi její řešení zabralo velkou část času, který jsem vytváření programu věnoval. Mým cílem bylo vytvořit program esteticky zajímavý, uživatelsky intuitivní, přehledný a snadno ovladatelný. Z tohoto důvodu jsem zvolil především specifické ikony, které jsou velké, schopné upoutat, a proto je jejich užívání snadné a přehledné. Z důvodu větší přehlednosti jsem vynechal klasické menu. K členění jednotlivých statistických funkcí jsem využil záložky. Jejich jednotlivé funkce podrobně rozeberu níže. OBRÁZEK 4.1 (ÚVODNÍ OKNO) 19

4.2 CELKOVÝ VZHLED PROGRAMU OBRÁZEK 4.2 (VLASTNÍ PROGRAM) 4.3 HLAVNÍ LIŠTA Hlavní lišta je základní ovládací prvek programu, slouží ke všem důležitým operacím. Nabídka START slouží k základnímu ovládání programu. Obsahuje položky jako Nový, Načíst data, Exportovat do.txt a.xlsx, Konec. Podrobnější popis viz níže. Položka NAČÍST obsahuje dvě ikony: Nový vytvoří nový textový soubor, do kterého je možné zadat data pro statistickou analýzu. Načíst data zobrazí otevírací dialog a vyzve uživatele k vybrání textového souboru, ze kterého se budou načítat data. Funkce je zajímavá tím, že vytvoří nový podproces a v něm načítá data. Toto řešení jsem zvolil s ohledem na to, že při načítání velkého počtu dat hlavní vlákno není stále zaneprázdněno a tudíž program nezamrzne. Ve vývojovém diagramu 4.1 jsem se snažil nastínit operace pragramu. 20

Hlavní proces Načti data Jméno souboru Vytvoř podproces Větvení Inicializace souboru Uspi hlavní vlákno na danou dobu Načti řádek a uprav Ne Ne Načteno? Vše? Ano Ano Zobraz data Ulož do programu Zpřístupni výpočet Ukonči podproces VÝVOJOVÝ DIAGRAM 4.1 (NAČÍST DATA) Položka EXPORTOVAT nabídne dvě možnosti formátu exportovaného souboru: Nejjednodušeji můžeme exportovat do textového souboru varianta, která je spustitelná na každém počítači, avšak méně pohodlná a přehledná. Další možností je exportovat data do aplikace Excel. Načtená data s výpočty se vloží do nového sešitu aplikace Excel a jsou připravena k případnému dalšímu zpracování. Další položkou je NASTAVENÍ, které obsahuje dvě ikony: Kalkulačka spustí kalkulačku systému Windows. Nastavení zobrazí možné nastavení aplikace. Lze nastavit minimální počet dat vstupního souboru. Pokud tato podmínka není splněna, program ohlásí chybu a nepovolí prácí s daty. Další volbou je nastavení zobrazovaných dat. Vzhledem k použité metodě zobrazení v grafech tohoto programu není vhodné, nikoli však nemožné, vykreslovat větší počet dat a to hlavně kvůli stabilitě programu. Optimální počet vykreslených dat by se měl pohybovat do 2000. Jako poslední možnou volbu jsem vytvořil nastavení jména nápovědy. To umožní uživateli nastavit jméno a typ formátu nápovědy. Podporovány jsou všechny formáty aplikace Microsoft Word. 21

RUN je zcela zásadní ikona. Po načtení dat začne blikat, čímž vybízí ke stisku. Po něm se rozběhnou všechny výpočty aplikace. Po jejich dokončení již není možné znovu na ikonu kliknout. Metoda zinicializuje a spustí všechny konstruktory a metody. Vypočtené hodnoty zobrazí do vlastní aplikace. PANEL JAZYKŮ umožňuje nastavit uživateli jazyk. Základním jazykem je čeština, dále je možné zvolit angličtinu. Položka NÁPOVĚDA: otevře nápovědu, při stisku trojúhelníčku se zobrazí ikony Nápověda a O aplikaci. 4.4 ROZBOR ZÁLOŽEK Nyní se pokusím vyložit vlastnosti a vlastní programové zpracování jednotlivých záložek. 4.5 NAMĚŘENÁ DATA V této záložce (Obrázek 4.3) se vykreslí naměřená data. Je možné zobrazit Křížky, Kroužky a Křivku, dále můžeme data Seřadit podle velikosti. Vlastní programování zde není tak zajímavé. Na tomto místě bych pouze rád poznamenal, že z jednoduchého důvodu, že C# je relativně mladý programovací jazyk, zatím nemá významnou knihovní podporu. Proto jsem knihovny pro kreslení grafů nenašel. Tudíž jsem veškeré vykreslování grafů musel psát ručně, a to nejen u naměřených dat, ale i u histogramu a distribuční funkce. Vlastnosti grafu mají celkem čtyři možnosti. Ikona Křížky vykreslí křížky na souřadnicích naměřených dat, podobně je tomu i při užití ikony Kroužky. Křivka spojí jednotlivé body. Poslední Ikona Seřadit seřadí hodnoty dle velikosti. Tyto možnosti jsou prakticky totožné (až na možnost seřadit) i na záložce Distribuční funkce. 22

OBRÁZEK 4.3 (NAMĚŘENÁ DATA) 4.6 ZÁKLADNÍ ZPRACOVÁNÍ Záložka ZÁKLADNÍ ZPRACOVÁNÍ obsahuje již zmiňované statistické výpočty. Domnívám se, že z programové části je pravděpodobně nejzajímavější vyložit výpočet Grubbsova testu. Zde jsem se setkal s problémem omezené znalosti kritických hodnot Va pro jednotlivé významnosti a velikosti souboru. Tuto obtíž jsem vyřešil tak, že jsem vyhledal výpočet kritických hodnot, ovšem pro studentovo T rozdělení. Toto rozdělení by do výpočtu sice vnášelo jakousi chybu, ovšem díky vlastnosti, že při vyšším počtu dat přechází do normálního rozdělení, je tuto implementaci možné použít. Vlastní programové zpracování jsem názorně vyjádřil v níže uvedeném vývojovém diagramu. 23

Vytvoření konstruktoru Grubbs test Metoda Grubbsův test Vytvoření dynamické ho listu Výpočet průměru a směr. odchylky i<51 Množství dat i>50 Rozřazení dle významnosti Vypočti kritickou tabulkovou hodnotu Va Výpočet kritické hodnoty pro danou hodnotu Výpočet kritické hodnoty pro danou hodnotu V<Va Porovnání s tabulkovou hodnotou Va<V V<Va Porovnání s tabulkovou hodnotou Va<V Ne Ulož hodnotu do dynamickéh o listu Přeskoč hodnotu Ulož hodnotu do dynamickéh o listu Přeskoč hodnotu Ne Všechny data? Všechny data? Ulož nová data Ukonči metodu VÝVOJOVÝ DIAGRAM 4.2 (GRUBBSŮV TEST) 24

OBRÁZEK 4.4 (ZÁKLADNÍ ZPRACOVÁNÍ) 4.7 HISTOGRAM Záložka HISTOGRAM zobrazí histogram načtených dat. V možnostech nastavení je zobrazení POPISKŮ DAT a možnost nastavení POČTU SLOUPCŮ. Dále jsou na pravé straně zobrazeny MEZE HISTOGRAMU a VÝSKYT DAT V DANÝCH MEZÍCH. Výpočet histogramu není nikterak složitý, skládá se ze dvou základních částí. Nejprve se stanový maximální interval hodnot z načtených dat. Poté se tento interval dle počtu hodnot rozdělí na určitý počet sloupců a to podle vzorce 2.5. Výpočet podle vzorce 2.5 se provede pouze tehdy, když uživatel nenastaví vlastní počet sloupců. Druhá část algoritmu spočívá v tom, že každé číslo je zařazeno do odpovídajícího sloupce. 25

Vytvoření konstruktoru Histogram Srovnej data podle velikosti Po dokončení výpočtu mezí Metoda spočti meze Metoda urči výskyt dat v daných mezích Ne Nastav počet sloupců na 5 Sloupců > 5? Vytvoř pole o k + 1 prvcích Vytvoř pole o k prvcích Nastav meze Nastav min, max a spočti krok Vyber data Ne Ne Dopočítej všechny meze Všechny data v mezích? Ano Všechny data? Ano Ukonči metodu VÝVOJOVÝ DIAGRAM 4.3 (HISTOGRAM) 26

OBRÁZEK 4.5 (HISTOGRAM) 4.8 CHYBY MĚŘENÍ Záložka CHYBY MĚŘENÍ obsahuje shrnutí základních informací o naměřených datech. Všechny vypisované hodnoty jsou dynamicky zaokrouhlovány na šest desetinných míst. Tento výpis je kompatibilní s MICROSOFT EXCEL, při používání české desetinné čárky ve výpisu se bohužel zbavujeme možnosti kompatibility s výpočetním programem MATLAB. K programovému zpracování není mnoho co říci, v této části programu jsou používány pouze základní operace jako sčítání, odčítání, suma atd. Jedná se o přesné vyjádření vzorců, které jsou popsány jak v úvodní teoretické části, tak i na samotné záložce. 27

OBRÁZEK 4.6 (CHYBY MĚŘENÍ) 4.9 DISTRIBUČNÍ FUNKCE Záložka DISTRIBUČNÍ FUNKCE umožňuje stejné nastavení, které jsem již popsal výše u popisu záložky NAMĚŘENÁ DATA. Hlavní úskalí při programování distribuční funkce tkvělo v tom, že hodnoty normálního rozložení nemohu výpočtem generovat, a proto jsem je musel vygenerovat předem a pevně uložit do programu. Uloženou ideální distribuční funkci N, která má rozmezí hodnot od -3,999 do 3,999 s krokem 0,001 a počtem hodnot 7983, jsem musel aproximovat na ideální distribuční funkci U podle střední hodnoty a směrodatné odchylky. Výpočet distribuční funkce pro daná data je nastíněn v kapitole 2.12. 28

Vytvoření konstruktoru Distribuční funkce Výpočet hustoty pravděpod obnosti Metoda pro aproximaci distribuční fce N(0,1) Metoda pro výpočet distribuční funkce Ne Načti ideální hodnotu a aproximuj Vše? Ano Ulož novou ideální distribuční fci Vytvoř pole o k prvcích Spočti nultou hodnotu jako P0/2 Spočti hodnotu distribuční funkce daného prvku Ne Vše? Ano Ulož distribuční fci a ukonči metodu VÝVOJOVÝ DIAGRAM 4.4 (DISTRIBUČNÍ FUNKCE) 29

OBRÁZEK 4.7 (DISTRIBUČNÍ FUNKCE) 4.10 TESTY DOBRÉ SHODY Testy dobré shody jsou jedny z nejdůležitějších algoritmů v celé aplikaci. Dělí se na dvě základní skupiny (podle množství vstupních dat): 1. Použitelné do 50 dat 2. Vhodné nad 50 dat Toto dělení je zavedeno z toho důvodu, že pro malé a velké množství dat není vhodné používat stejné testy (zejména v zájmu zachování přesnosti). 1. Soubory s počtem dat do 50 Tato skupina testů zahrnuje dvě kritéria. První kritérium, které je počítáno podle vzorce 2.17 a 2.18, je označeno nadpisem Kritérium 1. Obsahuje základní vzorec, možnost nastavení hladiny významnosti, vypočítané kritérium d, horní, dolní mez a má grafický výstup v podobě ikony. 30

Vytvoření konstruktoru Testy dobré shody Spočti Sumu ze vzorce 2.17 Vypočítej kritickou hodnotu pro načtená data Zařaď podle počtu dat =11+i*5 =10 <11+i*5 Rozřaď dle významnosti Rozřaď dle významnosti Rozřaď dle významnosti Vyber dle významnosti horní a dolní mez kritéria Vyber dle významnosti horní a dolní mez kritéria Spočti horní a dolní mez kritéria Ulož dolní a horní mez kritéria VÝVOJOVÝ DIAGRAM 4.5 (KRITÉRIUM 1) Další je Kritérium 2. Obsahuje základní vzorec, možnost nastavení hladiny významnosti. Počet hodnot, pro které nebylo kritérium splněno. Má také grafický výstup v podobě ikony. 31

Vytvoření konstruktoru Testy dobré shody Nastavení základních konstant Vypočítej kritickou hodnotu pro načtená data Rozděl dle významnosti Nastav kritickou hodnotu pro danou významnost 1% 2% Nastav kritickou hodnotu pro danou významnost 3% Nastav kritickou hodnotu pro danou významnost Vyber hodnotu z načtených dat Ano Počítej počet hodnot, které nesplňují kritérium Splňuje kritérium? Ne Vše Ukonči metodu 2. Soubory s počtem dat nad 50 VÝVOJOVÝ DIAGRAM 4.6 (KRITÉRIUM 2) Nyní se přesuneme k testům dobré shody pro množství vstupních dat větší než 50. a. Chí kvadrát test- obsahuje: základní vzorec, možnost nastavení hladiny významnosti, vypočítaný příslušný chí kvadrát (ten musí být větší než vypočítaná kritická hodnota pro načtená data). Dále zobrazuje, zda byla splněna podmínka, aby každá z hodnot Npi obsahovala alespoň 5 prvků (pokud tato podmínka není splněna, test ztrácí na významnosti, stále však má určitou výpovědní hodnotu). Chí kvadrát test má grafický výstup v podobě ikony. Samotný algoritmus je řešen následujícím způsobem: nejprve se načtená data musí rozdělit do několika sloupců. Počet sloupců je generován buď automaticky (podle vzorce 2.5), nebo je na uživateli aby zvolil vlastní počet sloupců. Do těchto sloupců je automaticky vygenerováno nejmenší možné množství hodnot podle vzorce pro ideální hustotu pravděpodobnosti. Množství těchto hodnot je plošně přenásobeno konstantou, poté se množství sečtou a porovnají s načtenými daty. Pokud je součet ideálních dat a načtených dat shodný, algoritmus začne 32

porovnávat dle vzorce 2.20. Pokud výsledek odpovídá kritériu, můžeme prohlásit, že načtená data mají normální rozdělení. Vytvoření konstruktoru Chí kvadrát test Výpočet mezí histogram u Použití metody Histogram Naplnění daných sloupců histogram u Metoda pro výpočet ideální hustoty pravděpodobnosti Funkce pro zrychlení naplnění ideálního histigramu Násobení ideálního histogramu konstantou Ne Součet prvků ideálního histogramu Jsou si součty rovny? Ano Spočti kritické hodnoty Chí kvadrát testu Ověř podmínku minima sloupců Ulož hodnoty a ukonči metodu VÝVOJOVÝ DIAGRAM 4.7 (CHÍ KVADRÁT TEST) b. Kolmogorov-Smirnovův test- je posledním testem, který se nachází na této záložce. Skládá se ze dvou hlavních součástí: 1) z určení maximální odchylky distribučních funkcí 2) ze samotného určení KS testu (určení nulové hypotézy a procentuální shody naměřených dat s normálním rozdělením) 1) Nejprve bych se zmínil o určení maximální odchylky distribučních funkcí. Tato metoda pracuje s již dříve vypočtenou aproximovanou ideální distribuční funkcí. Protože hodnoty ideální distribuční funkce jsou v programu dané tabulkou (po kroku jedné tisíciny), není zaručena stoprocentní shoda hodnot. Z tohoto důvodu se hledá nejbližší 33

možná hodnota. Po jejím nalezení se odečtou hodnoty pravděpodobností obou distribučních funkcí. Takto se otestují všechny hodnoty v souboru a je nalezena maximální odchylka. 2) Druhá část je již samotná implementace KS testu. Nejprve je spočtena hypotéza H0. Ta je následně rozdělena do dvou částí: pro počet hodnot menších než 20, kde je kritická hodnota nalezena v tabulce počet hodnot větších než 20, kde se kritická hodnota spočítá Dále se v závislosti na maximální odchylce spočítá odpovídající pravděpodobnost, která říká, na kolik procent se načtená data shodují s normálním rozdělením. Vytvoření konstruktoru KS test Výpočet KS testu Metoda pro zjištění maximální odchylky Metoda pro výpočet KS testu Nastav počáteční nulové hodnoty N<20 Počet hodnot n N>20 Spočti vzdálen aproximované a vypočtené distribuční funkce Ne Nalezení kritické tabulkové hodnoty Výpočet kritické hodnoty Vše? Ne Je tato vzdálenost nejmenší možná Ne Test hypotézy H0 Test hypotézy H0 Ano Ukonči metodu Ano Odečti hodnoty pravděpodobnosti v daném bodě Výpočet shody s normálním rozložením Je největší Ulož distribuční fci a ukonči metodu Ano Ulož tuto hodnotu VÝVOJOVÝ DIAGRAM 4.8 (KOLMOGOROV-SMIRNOVŮV TEST) 34

OBRÁZEK 4.8 (TESTY DOBRÉ SHODY) 4.11 KONFIDENČNÍ MEZE Záložka KONFIDENČNÍ MEZE umožňuje spočítat konfidenční meze náhodné chyby výsledku měření, konfidenční meze nevyloučené systematické chyby výsledku měření a konfidenční meze celkové chyby výsledku měření. Všechny výpočty jsou doprovázeny grafickým vzorcem. Konfidenční meze nevyloučené systematické chyby výsledku měření se zadávají do levého sloupce. Při zadání alespoň 5 hodnot je umožněno zadat 99% interval spolehlivosti. 35

OBRÁZEK 4.9 (KONFIDENČNÍ MEZE) 36

5 VÝSLEDKY PRÁCE (EXPERIMENTÁLNÍ ČÁST) Praktické testování zadaných funkcí je obtížné (zejména protože statistického softwaru je velmi málo). Pokud by nějaký software vyhovoval mému zadání, je placený. K porovnání vlastních výsledků měření jsem proto použil starší verzi používaného programu STAT, vytvořenou Petrem Pfeifrem, program MICROSOFT EXCEL a také v neposlední řadě matematický program MATLAB. Microsoft Excel jsem zvolil z důvodu nemožnosti exportování dat ze starší verze programu STAT. Matlab, který je velmi mocným matematickým nástrojem, obsahuje většinu funkcí, které jsem implementoval. Výpočty, které nebyly v programu Stat, Matlab nebo Microsoft Excel implementovány nějakou vlastní metodou, jsem nesrovnával. Zejména z toho důvodu, aby srovnání s mým programem mělo co největší váhu a já se nedopustil dvakrát nějaké chyby implementace. Porovnával jsem: zobrazení naměřených dat základní zpracování (Grubbsův test, krajní chyba měření, absolutní chyba, relativní chyba, poměr V/Va, kumulativní distribuční funkce a odchylka od ideální kumulativní distribuční funkce) histogram chyby měření (střední hodnota souboru, směrodatná odchylka, chyba) distribuční funkce testy dobré shody konfidenční meze 5.1 EXPERIMENTÁLNÍ DATA Pokusil jsem se vygenerovat data například při měření 1000 Ω odporu. Z důvodu maximálního počtu dat ve starší verzi programu STAT jsem vygeneroval pouze 45 hodnot k porovnávání. i 1 2 3 4 5 6 7 data 999.0701 1000.7419 1001.4566 1004.2243 997.2854 997.9548 1002.0757 i 8 9 10 11 12 13 14 data 999.2204 997.2375 1000.6311 1003.1065 1001.4158 1003.9148 1001.0091 i 15 16 17 18 19 20 21 data 1003.7291 999.3204 997.7204 999.5778 1002.3805 997.7676 1001.2705 i 22 23 24 25 26 27 28 data 998.7972 1001.1024 997.8003 1000.172 995.9909 999.0138 1000.9241 i 29 30 31 32 33 34 35 data 999.358 1002.4731 998.7374 995.3496 997.5367 1002.1113 999.7736 i 36 37 38 39 40 41 42 data 1000.7584 1001.8884 995.7591 998.7106 998.5914 997.9637 999.6358 i 43 44 45 data 1003.042 999.9231 1002.4549 TABULKA 5.1 (EXPERIMENTÁLNÍ DATA) 37

5.2 ZOBRAZENÍ NAMĚŘENÝCH DAT STATISTIKA STAT OBRÁZEK 5.1 (NAMĚŘENÁ DATA, PROGRAM STATISTIKA) OBRÁZEK 5.2 (NAMĚŘENÁ DATA, PROGRAM STAT) 5.3 POROVNÁNÍ HODNOT ZÁKLADNÍHO ZPRACOVÁNÍ 38

K porovnání hodnot ze základního zpracování (absolutní, relativní odchylka a hodnoty kumulativní distribuční funkce) jsem použil program Microsoft EXCEL (z důvodu nemožnosti exportování, ale i jakéhokoli zkopírování dat ze starší verze programu). Jak je možné vyčíst z tabulky 5.3-1, hodnoty vypočtené mým programem a programem EXCEL se naprosto shodují. Hodnoty Grubbsova testu jsem zkontroloval se starší verzí programu. Data KS testu vyjadřují odchylku distribuční funkce od ideální distribuční funkce v každém bodě. Toto je pouze ukázková hodnota; pro bod s největší odchylkou se počítá právě procento shody s normálním rozložením. Tato hodnota se liší od původního programu v řádu desítitisícin. To je způsobeno použitou programovou metodou. i Hodnota Grubbsův test 3σ* Absolutní odchylka Absolutní odchylka EXCEL Relativní odchylka Relativní odchylka EXCEL Distribuční funkce Distribuční funkce EXCEL 1 995,3496 OK OK 4,6277 4,6277 0,4628 0,4628 0,0000 0,0111 0,0175 2 995,7591 OK OK 4,2182 4,2182 0,4218 0,4218 0,0222 0,0333 0,0052 3 995,9909 OK OK 3,9864 3,9864 0,3986 0,3986 0,0444 0,0556 0,0097 4 997,2375 OK OK 2,7398 2,7398 0,2740 0,2740 0,0667 0,0778 0,0393 5 997,2854 OK OK 2,6919 2,6919 0,2692 0,2692 0,0889 0,1000 0,0212 6 997,5367 OK OK 2,4406 2,4406 0,2441 0,2441 0,1111 0,1222 0,0220 7 997,7204 OK OK 2,2569 2,2569 0,2257 0,2257 0,1333 0,1444 0,0187 8 997,7676 OK OK 2,2097 2,2097 0,2210 0,2210 0,1556 0,1667 0,0016 9 997,8003 OK OK 2,1770 2,1770 0,2177 0,2177 0,1778 0,1889 0,0170 10 997,9548 OK OK 2,0225 2,0225 0,2023 0,2023 0,2000 0,2111 0,0215 11 997,9637 OK OK 2,0136 2,0136 0,2014 0,2014 0,2222 0,2333 0,0426 12 998,5914 OK OK 1,3859 1,3859 0,1386 0,1386 0,2444 0,2556 0,0196 13 998,7106 OK OK 1,2667 1,2667 0,1267 0,1267 0,2667 0,2778 0,0153 14 998,7374 OK OK 1,2399 1,2399 0,1240 0,1240 0,2889 0,3000 0,0029 15 998,7972 OK OK 1,1801 1,1801 0,1180 0,1180 0,3111 0,3222 0,0155 16 999,0138 OK OK 0,9635 0,9635 0,0964 0,0964 0,3333 0,3444 0,0030 17 999,0701 OK OK 0,9072 0,9072 0,0907 0,0907 0,3556 0,3667 0,0158 18 999,2204 OK OK 0,7569 0,7569 0,0757 0,0757 0,3778 0,3889 0,0128 19 999,3204 OK OK 0,6569 0,6569 0,0657 0,0657 0,4000 0,4111 0,0175 20 999,3580 OK OK 0,6193 0,6193 0,0619 0,0619 0,4222 0,4333 0,0332 21 999,5778 OK OK 0,3995 0,3995 0,0400 0,0400 0,4444 0,4556 0,0166 22 999,6358 OK OK 0,3415 0,3415 0,0341 0,0341 0,4667 0,4778 0,0287 23 999,7736 OK OK 0,2037 0,2037 0,0204 0,0204 0,4889 0,5000 0,0259 24 999,9231 OK OK 0,0542 0,0542 0,0054 0,0054 0,5111 0,5222 0,0211 25 1000,1720 OK OK 0,1947 0,1947 0,0195 0,0195 0,5333 0,5444 0,0022 26 1000,6311 OK OK 0,6538 0,6538 0,0654 0,0654 0,5556 0,5667 0,0615 27 1000,7419 OK OK 0,7646 0,7646 0,0765 0,0765 0,5778 0,5889 0,0583 28 1000,7584 OK OK 0,7811 0,7811 0,0781 0,0781 0,6000 0,6111 0,0391 29 1000,9241 OK OK 0,9468 0,9468 0,0947 0,0947 0,6222 0,6333 0,0446 30 1001,0091 OK OK 1,0318 1,0318 0,1032 0,1032 0,6444 0,6556 0,0364 31 1001,1024 OK OK 1,1251 1,1251 0,1125 0,1125 0,6667 0,6778 0,0290 32 1001,2705 OK OK 1,2932 1,2932 0,1293 0,1293 0,6889 0,7000 0,0332 33 1001,4158 OK OK 1,4385 1,4385 0,1439 0,1439 0,7111 0,7222 0,0327 34 1001,4566 OK OK 1,4793 1,4793 0,1479 0,1479 0,7333 0,7444 0,0165 35 1001,8884 OK OK 1,9111 1,9111 0,1911 0,1911 0,7556 0,7667 0,0522 36 1002,0757 OK OK 2,0984 2,0984 0,2098 0,2098 0,7778 0,7889 0,0527 37 1002,1113 OK OK 2,1340 2,1340 0,2134 0,2134 0,8000 0,8111 0,0345 38 1002,3805 OK OK 2,4032 2,4032 0,2403 0,2403 0,8222 0,8333 0,0408 39 1002,4549 OK OK 2,4776 2,4776 0,2478 0,2478 0,8444 0,8556 0,0259 40 1002,4731 OK OK 2,4958 2,4958 0,2496 0,2496 0,8667 0,8778 0,0055 41 1003,0420 OK OK 3,0647 3,0647 0,3065 0,3065 0,8889 0,9000 0,0297 42 1003,1065 OK OK 3,1292 3,1292 0,3129 0,3129 0,9111 0,9222 0,0118 43 1003,7291 OK OK 3,7518 3,7518 0,3752 0,3752 0,9333 0,9444 0,0230 KS - test 39

44 1003,9148 OK OK 3,9375 3,9375 0,3938 0,3938 0,9556 0,9667 0,0079 45 1004,2243 OK OK 4,2470 4,2470 0,4247 0,4247 0,9778 0,9889 0,0044 TABULKA 5.2 (ZÁKLADNÍ ZPRACOVÁNÍ) 5.4 ZOBRAZENÍ HISTOGRAMU STATISTIKA STAT OBRÁZEK 5.3 (HISTOGRAM, PROGRAM STATISTIKA) OBRÁZEK 5.4 (HISTOGRAM, PROGRAM STAT) 40

5.5 POROVNÁNÍ VYPOČTENÝCH CHYB MĚŘENÍ Statistika Excel Stat Matlab Střední hodnota souboru Aritmetický průměr 999,9773 999,9773 999,9773 999,9773 Medián 999,7736 999,7736-999,7736 Směrodatná odchylka Směrodatná odchylka 2,1957 2,1957 2,1957 2,1957 Směrodatná odchylka jednoho pozorování 2,2205 2,2205 2,2205 2,2205 Střední kvadratická chyba aritmetického průměru 0,3310 0,3310 0,3310 0,3310 Chyba Pravděpodobná chyba aritmetického průměru 0,2207 0,2207 - - Krajní chyba měření 6,5872 6,5872 - - TABULKA 5.3 (CHYBY MĚŘENÍ) 5.6 ZOBRAZENÍ DISTRIBUČNÍ FUNKCE STATISTIKA STAT OBRÁZEK 5.5 (DISTRIBUČNÍ FUNKCE, PROGRAM STATISTIKA) 41

OBRÁZEK 5.6 (DISTRIBUČNÍ FUNKCE, PROGRAM STAT) 5.7 SROVNÁNÍ TESTŮ DOBRÉ SHODY KRITÉRIUM 1 Kritérium 1 je statistický test určený pro počet hodnot menší než 50. Tento test jsem nenašel implementovaný v Matlabu, proto jsem jej Matlabem netestoval. Statistika Stat Splněno pro hladinu významnosti 1, 5 i 10 % Splněno pro hladinu významnosti 2 % TABULKA 5.4 (KRITÉRIUM 1) KRITÉRIUM 2 Kritérium 2 je- stejně jako Kritérium 1- určeno pro méně než 50 hodnot. Taktéž není implementováno Matlabem. Statistika Stat Splněno pro hladinu významnosti 1, 2 i 5 % Splněno pro hladinu významnosti 2 % TABULKA 5.5 (KRITÉRIUM 2) KOLMOGOROV SMIRNOVŮV TEST Statistika Stat Matlab Odpovídající hladina spolehlivosti 67,72% a maximální odchylka 0,0538 Odpovídající interval spolehlivosti je 99,43 % a maximální odchylka 0,0615 CHÍ KVADRÁT TEST TABULKA 5.6 (KOLMOGOROV-SMIRNOVŮV TEST) Statistika Stat Matlab Splněno pro hladinu významnosti 1 i 5 % - TABULKA 5.7 (CHÍ KVADRÁT TEST) Odpovídající interval spolehlivosti je 98,92 % a maximální odchylka 0.0649 Kritérium se nezamítá, odpovídající interval spolehlivosti je 49,29 % 42

5.8 POROVNÁNÍ KONFIDENČNÍCH MEZÍ Zvolené konfidenční meze 995 997 1003 1005 Vypočítané konfidenční meze Statistika Stat Stanovení konfidenčních mezí náhodné chyby výsledku měření Konfidenční meze náhodné chyby výsledku měření 0,6671 0,6671 Odpovídající interval spolehlivosti ( 999,31 ; 1000,64 ) ( 999,31 ; 1000,64 ) Stanovení konfidenčních mezí nevyloučené systematické chyby výsledku měření Počet složek nevyloučené systematické chyby 4 4 Směrodatná odchylka nevyloučené systematické chyby 1154,7104 1154,7104 Konfidenční meze nevyloučené systematické chyby 2200,0187 2200,0187 Stanovení konfidenčních mezí celkové chyby výsledku měření Konfidenční meze celkové chyby měření 2200,0552 2200,0552 Odpovídající interval spolehlivosti ( -1200,08 ; 3200,03 ) ( -1200,08 ; 3200,03) TABULKA 5.8 (KONFIDENČNÍ MEZE) 5.9 DALŠÍ TESTOVÁNÍ V následující tabulce 5.9 jsem vygeneroval 21 souborů s daty s různými parametry. Zde jsem testoval jen testy dobré shody vhodné pro n > 50 a pro nejlepší srovnání jsem je porovnával se statistickými funkcemi vypočtenými v Matlabu. Sloupec Jméno souboru obsahuje názvy souborů s vygenerovanými daty, které se nacházejí na přiloženém CD. 43

TABULKA 5.9 (TESTOVÁNÍ KS TESTU A CHÍ KVADRÁT TESTU) 44

6 ZÁVĚR Nyní bych chtěl zhodnotit a konfrontovat svou práci se zadáním. Zadání bakalářské práce jsem splnil v celém jejím rozsahu, navíc jsem přidal jeden test dobré shody, a to Chí kvadrát test. Jako vývojové prostředí byl doporučen software Matlab, již z výše uvedených důvodů jsem se rozhodl pro vývojové prostředí Microsoft Visual Studio a jazyk C#. Do programu jsem vložil mnoho vlastního nastavení, jako různé zobrazení grafů, možnost mazaní a obnovy dat, nastavení různých hladin významnosti (Grubbsův test, Kritérium 1, Kritérium 2, Kolmogorov-Smirnovův test, Chí kvadrát test a Konfidenční meze), nastavení počtu sloupců u histogramu a Chí kvadrát testu, výpis mezí a četností histogramu. Mým cílem bylo vytvořit program esteticky zajímavý, uživatelsky intuitivní, přehledný a snadno ovladatelný. V kapitole 5 (Výsledky práce (experimentální část)) jsem se snažil dokázat správnost svých výpočtů, resp. implementovaných algoritmů. Pokusím se tedy postupně zhodnotit jednotlivé body kapitoly, porovnat výsledky se starší verzí programu Stat, Matlabem a Microsoft Excelem. Data jsem vygeneroval pomocí Matlabu a funkce random (Tabulka 5.1). Budu postupovat postupně podle pořadí záložek mého programu. Začnu s naměřenými daty (Obrázek 5.1). Ty se shodují přesně jak s programem Stat (Obrázek 5.2), Matlabem, tak i s Excelem. Všechny grafy neuvádím z důvodu malé významnosti. Tabulka 5.2- základní zpracování. Zde jsem porovnával absolutní a relativní chybu s Excelem, hodnoty se shodují 100%. Dále pak výsledek Grubbsova testu se Stat, tyto hodnoty se také shodují na 100%. Zobrazení histogramu (Obrázek 5.3)- opět úplná shoda jak s programem Stat (obrázek 5.4), tak i s Matlabem. Vypočtené chyby měření mají 100% shodu se všemi výše uvedenými programy. Zobrazení distribuční funkce (Obrázek 5.5) jsem srovnával pouze se Stat (Obrázek 5.6). Zde jsou již odlišnosti patrné. Mnou vypočtená distribuční funkce začíná od nuly a nabývá jedničky, je schodovitá. Další bod jsou testy dobré shody. Ty- jak jsem již uvedl dříve- se dělí podle počtu hodnot. S testy dobré shody pro n malé (do n < 50) není problém (Tabulka 5.4, 5.5), ty se shodují. V podstatě se jedná o snadný výpočet a nalezení příslušné hodnoty v tabulce. Naopak testy pro n velké (n > 50) jsou již rozdíly měřitelné. V tabulkách 5.6, 5.7 a 5.9 jsou uvedeny významné hodnoty. Neboť Kolmogorov-Smirnovův test a Chí kvadrát test se ne vždy shodovaly, vytvořil jsem 21 souborů s vygenerovanými hodnotami a s různými parametry a porovnával jsem je se svým programem. Při použití dat v tabulce 5.1 se hodnoty procentuální shody distribučních funkcí KS testu liší o 31,71% u programu Stat a o 0,51% od Matlabu. Proto jsem vytvořil tabulku 5.9 a porovnával hodnoty KS testu a Chí kvadrát testu. Jak je patrné z této tabulky, průměrná maximální 45