Rozdělení přenosové rychlosti disku

Podobné dokumenty
Jarqueův a Beryho test normality (Jarque-Bera Test, JB test)

KGG/STG Statistika pro geografy

Charakteristika datového souboru

Zápočtová práce STATISTIKA I

y = 0, ,19716x.

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Semestrální práce z předmětu Matematika 6F

TECHNICKÁ UNIVERZITA V LIBERCI. Statistický rozbor dat z dotazníkového šetření

Testy. Pavel Provinský. 19. listopadu 2013

PRAVDĚPODOBNOST A STATISTIKA

Definice spojité náhodné veličiny zjednodušená verze

STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky)

Testování statistických hypotéz

Předpoklad o normalitě rozdělení je zamítnut, protože hodnota testovacího kritéria χ exp je vyšší než tabulkový 2

Tomáš Karel LS 2012/2013

X = x, y = h(x) Y = y. hodnotám x a jedné hodnotě y. Dostaneme tabulku hodnot pravděpodobnostní

Vybraná rozdělení náhodné veličiny

TECHNICKÁ UNIVERZITA V LIBERCI. Ekonomická fakulta. Semestrální práce. Statistický rozbor dat z dotazníkového šetření školní zadání

Pearsonůvχ 2 test dobré shody. Ing. Michal Dorda, Ph.D.

Národníinformačnístředisko pro podporu jakosti

12. cvičení z PST. 20. prosince 2017

KGG/STG Statistika pro geografy

Pravděpodobnost a matematická statistika

Testování statistických hypotéz. Obecný postup

HODNOCENÍ VÝKONNOSTI ATRIBUTIVNÍCH ZNAKŮ JAKOSTI. Josef Křepela, Jiří Michálek. OSSM při ČSJ

15. T e s t o v á n í h y p o t é z

Aproximace binomického rozdělení normálním

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

Statistika. Teorie odhadu statistická indukce. Roman Biskup. (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at) .

You created this PDF from an application that is not licensed to print to novapdf printer (

Mann-Whitney U-test. Znaménkový test. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze

Regresní analýza 1. Regresní analýza

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

ÚVOD DO TEORIE ODHADU. Martina Litschmannová

Návrh a vyhodnocení experimentu

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

Dva případy chybného rozhodnutí při testování: a) Testační statistika padne mimo obor přijetí nulové H hypotézy O, tj.

= = 2368

Přednáška 9. Testy dobré shody. Grafická analýza pro ověření shody empirického a teoretického rozdělení

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Přednáška X. Testování hypotéz o kvantitativních proměnných

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.

LIMITNÍ VĚTY DALŠÍ SPOJITÁ ROZDĚLENÍ PR. 8. cvičení

8. Normální rozdělení

Náhodná veličina a rozdělení pravděpodobnosti

SEMESTRÁLNÍ PRÁCE. Leptání plasmou. Ing. Pavel Bouchalík

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM

STATISTICKÉ ZJIŠŤOVÁNÍ

Pravděpodobnost a aplikovaná statistika

2 ) 4, Φ 1 (1 0,005)

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie. Nám. Čs. Legií 565, Pardubice. Semestrální práce ANOVA 2015

Inovace bakalářského studijního oboru Aplikovaná chemie

Příklady na testy hypotéz o parametrech normálního rozdělení

11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.

Pravdepodobnosť. Rozdelenia pravdepodobnosti

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D.

Výběrové charakteristiky a jejich rozdělení

Jednofaktorová analýza rozptylu

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13

Cvičení ze statistiky - 8. Filip Děchtěrenko

Pravděpodobnost, náhoda, kostky

Chyby měření 210DPSM

8.1. Definice: Normální (Gaussovo) rozdělení N(µ, σ 2 ) s parametry µ a. ( ) ϕ(x) = 1. označovat písmenem U. Její hustota je pak.

ANOVA. Semestrální práce UNIVERZITA PARDUBICE. Fakulta chemicko-technologická Katedra analytické chemie

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

15. T e s t o v á n í h y p o t é z

ÚSTAV MATEMATIKY A DESKRIPTIVNÍ GEOMETRIE. Matematika 0A4. Cvičení, letní semestr DOMÁCÍ ÚLOHY. Jan Šafařík

Limitní věty teorie pravděpodobnosti. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Příklad 1. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 11

Plánování experimentu

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ. FAKULTA STROJNÍHO INŽENÝRSTVÍ Ústav materiálového inženýrství - odbor slévárenství

MATEMATICKO STATISTICKÉ PARAMETRY ANALYTICKÝCH VÝSLEDKŮ

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Manuál pro zaokrouhlování

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1

Normální (Gaussovo) rozdělení

Intervalové Odhady Parametrů

Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie STATISTICKÉ ZPRACOVÁNÍ EXPERIMENTÁLNÍCH DAT

Testování statistických hypotéz

1. (18 bod ) Náhodná veli ina X je po et rub p i 400 nezávislých hodech mincí. a) Pomocí ƒeby²evovy nerovnosti odhadn te pravd podobnost

Testování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času

Me neˇ nezˇ minimum ze statistiky Michaela S ˇ edova KPMS MFF UK Principy medicı ny zalozˇene na du kazech a za klady veˇdecke prˇı pravy 1 / 33

Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium chemometrie

Statistika pro každého. Párový test Test shody dvou rozptylů Dvouvýběrový t-test Porovnání středních hodnot při nestejných rozptylech

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Univerzita Pardubice. Fakulta chemicko-technologická Katedra analytické chemie. Licenční studium Statistické zpracování dat

TLOUŠŤKOVÁ A VÝŠKOVÁ STRUKTURA A JEJÍ MODELOVÁNÍ

VYUŽITÍ PRAVDĚPODOBNOSTNÍ METODY MONTE CARLO V SOUDNÍM INŽENÝRSTVÍ

12. prosince n pro n = n = 30 = S X

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

Stručný úvod do testování statistických hypotéz

Semestrální práce z předmětu Pravděpodobnost, statistika a teorie informace

TECHNICKÁ UNIVERZITA V LIBERCI

Úvod do teorie odhadu. Ing. Michael Rost, Ph.D.

České vysoké učení technické v Praze Fakulta dopravní Ústav aplikované matematiky, K611. Semestrální práce ze Statistiky (SIS)

PSY117/454 Statistická analýza dat v psychologii přednáška 8. Statistické usuzování, odhady

Transkript:

Rozdělení přenosové rychlosti disku Vladimír Třebický 10. května 2006 Pevné disky osobního počítače nepracují vždy stejně rychle. Rozdíly v rychlosti sekvenčního přístupu mají několik důvodů, důležitá je však vždy hladina redukce, pomocí které se na problém pohlíží. V této práci se snažím podat informaci o statistických vlastnostech několika měřeních jednoho disku pomoci unixové utility hdparm 1, která může mj. sloužit k měření rychlosti sekvenčního čtení. Tato po svém spuštění zamkne disk tak, aby nebylo možné k němu jinak přistupovat a zařídí si tak výhradní přístup. Takto pokryjeme nejvyšší hladinu redukce a totiž rozdíl v rychlosti díky sdílení čtecích hlav. V nižších vrstvách redukce můžeme narazit např. na počáteční polohu čtecí hlavy, optimalizace přístupu k disku jádrem, nebo třeba NCQ 2. Ty ale již nechám vesele ovlivňovat svoje data. Koneckonců, běžný uživatel toho z výše uvedeného může ovlivnit pouze minimum; proto mu bude níže uvedené spíš prospěšné. Data K účelu sběru dat jsem napsal jednoduchý skript, který s prodlevou 10 s opakovaně spouští hdparm -t /dev/sda a ukládá výslednou rychlost sekvenčního čtení. Naměřené hodnoty jsou součástí přílohy [1]. Grafické znázornění rozložení najdete na Obr. 1. Jedná se o tisíc vzorků odebraných v době mezi 15:00 a 20:00. Čáry jsou interpolacemi četností výskytu v daném intervalu. Hodnoty použité pro vytvoření toho obrázku jsou potom v Tab. 1. Hypotéza Pro účely semestrální práce vyjádřím hypotézu: Naměřená data se řídí normálním rozdělením. H 0 H 1 Naměřená data se neřídí normálním rozdělením. Testování Porovnám naměřené hodnoty s odpovídajícím normálním rozdělením. Pomocí χ 2 testu dobré shody na hladině významnosti 5% se pokusím hypotézu vyvrátit. Postup volím následující: 1 Viz. http://sourceforge.net/projects/hdparm/ 2 Native Command Queueing technologie umožňující nelineární načítání dat z pevného disku, což může šetřit čas, který by byl ztracen při pohybech čtecí hlavy. 1

250 Obrázek 1: Rozdělení nameřených dat 200 Četnost výskytu na interval 1 MB/s 150 100 50 0 54 56 58 60 62 64 66 Rychlost sekvenčního čtení disku v MB/s 2

Tabulka 1: Histogram. i Střed ξ i Četnost i Střed ξ i Četnost 1 54 1 7 60 65 2 55 2 8 61 142 3 56 5 9 62 176 4 57 12 10 63 224 5 58 13 11 64 219 6 59 32 12 65 109 1. Vypočítám odpovídající hranice intervalů z histogramu o granularitě 1 MB/s. Vzhledem k tomu, že výše uvedené rychlosti jsou zaokrouhlením přenosových rychlostí disku na celá čísla, jsou hranice intervalu vždy: (ξ i 0.5; ξ i + 0.5 Kde ξ i je střed intervalu i. Tedy: h i = ξ i 0.5 h i+1 = ξ i + 0.5 = ξ i+1 0.5 Kde h i je dolní hranice intervalu se středem ξ i a h i+1 je jeho horní hranice. Je to taktéž dolní hranice intervalu ξ i+1, pokud takový interval existuje. 2. Určím parametry µ a σ 2 normálního rozdělení metodou maximální věrohodnosti: n ˆµ = 1 N i=1 ξ i p i ˆσ 2 = 1 N n p i (ξ i ˆµ) 2 i=1 Kde N je počet meření (1000), n je počet intervalů (12), ξ i je střed intervalu i a p i je jeho četnost. Pro svoje data obdržím ˆµ = 62.46 a ˆσ 2 = 3.41. 3. Ze získaných hodnot vypočtu pravděpodobnosti a normalizuji počtem měření. T i = p i N 3

Pravděpodobnost p i je hodnota normálního rozdělení N(µ, σ 2 ) pro interval i. K jeho získání nám nejlépe poslouží distribuční funkce normálního rozdělení. Konkrétně po jednoduchých úpravách: ( ) ( ) hi+1 ˆµ hi ˆµ p i = Φ Φ ˆσ ˆσ Kde Φ je funkce normovaného normálního rozdělení a h i je hranice intervalu. 4. Ze získaných hodnot určím hodnotu χ 2 : 5. Určím odpovídající stupeň volnosti: n χ 2 (n i T i ) 2 = = 362.58 i=1 T i ν = n 1 q Pro n = 12 počet intervalů a q = 2 odhadovaných parametrů je: ν = 12 1 2 = 9 6. Podle hladiny významnosti α = 5% a stupně volnosti ν = 9 najdu odpovídající kvantil: χ 2 1 α(ν) = χ 2 0.95(9) = 16.92 Podle zamítacího pravidla χ 2 testu dobré shody na hladině významnosti α = 5% a podle obdržené hodnoty χ 2 = 362.58 zamítám hypotézu H 0 a přecházím k hypotéze H 1 : χ 2 1 α(ν) < χ 2 16.92 < 362.58 Závěr Na základě naměřených dat, jejichž vypovídací hodnota je nastíněna v úvodu, a na základě χ 2 testu dobré shody na hladině významnosti 5% zamítám hypotézu H 0 a prohlašuji, že rozdělení přenosových rychlostí sekvenčního čtení disku se neřídí normálním rozdělením. Mezivýpočty jsou součástí Tab. 2 a Tab. 3. 4

Tabulka 2: Výpočet střední hodnoty a rozptylu. ξ i n i ξ i n i (ξ i ˆµ) 2 (ξ i ˆµ) 2 n i 54 1 54 71,52 71,52 55 2 110 55,60 111,21 56 5 280 41,69 208,46 57 12 684 29,77 357,34 58 13 754 19,86 258,24 59 32 1888 11,95 382,42 60 65 3900 6,03 392,39 61 142 8662 2,12 301,44 62 176 10912 0,20 36,75 63 224 14112 0,29 66,04 64 219 14016 2,38 521,40 65 109 7085 6,46 704,88 ˆµ = 1 1000 = 62.45 ˆσ = 1 1000 = 3.41 Tabulka 3: Výpočet teoretické pravděpodobnosti a χ 2. ξ i n i Φ ( ) h i ˆµ (n p ˆσ i T i = n p i T i ) 2 i T i 54 1 0,00426 0,00563 5,63 3,80 55 2 0,00989 0,01078 10,78 7,15 56 5 0,02067 0,01938 19,38 10,66 57 12 0,04005 0,03347 33,47 13,77 58 13 0,07352 0,04949 49,49 26,90 59 32 0,12302 0,06913 69,13 19,94 60 65 0,19215 0,09219 92,19 8,01 61 142 0,28434 0,10540 105,40 12,70 62 176 0,38974 0,11425 114,25 33,37 63 224 0,50399 0,11392 113,92 106,36 64 219 0,61791 0,10784 107,84 114,58 65 109 0,72575 0,08752 87,52 5,27 = 362.58 5

Reference [1] Příloha: Naměřená data. [2] Tabulky normálního rozložení: http://www.fp.vslib.cz/kap/picek/tabks.pdf [3] Kvantily χ 2 : http://www.pef.zcu.cz/ /pef/kmt/person/kohout/info soubory/letnisem/ruzne/tabchi.htm [4] M. Bradáč: Domácí úloha z předmětu M6F: http://cmp.felk.cvut.cz/ navara/mvt/m6f xbradac domaci prace v2.pdf 6