JAK OPTIMÁLN VYUŽÍT STATISTIKY P I ZPRACOVÁNÍ DAT

Podobné dokumenty

TESTOVÁNÍ NEPARAMETRICKÝCH HYPOTÉZ. 11. cvičení

Aplikovaná statistika 2007 program přednášek pro 2. ročník denního studia

Výrazy lze též zavést v nečíselných oborech, pak konstanty označuji jeden určitý prvek a obor proměnné není množina čísel.

SPOLEHLIVOST KONSTRUKCÍ & TEORIE SPOLEHLIVOSTI část 2: Statistika a pravděpodobnost

Numerická integrace. 6. listopadu 2012

Škola: Střední škola obchodní, České Budějovice, Husova 9 Projekt MŠMT ČR: EU PENÍZE ŠKOLÁM

Semestrální práce 1.2 Statistika jednorozměrných dat 1.4 ANOVA

SEMESTRÁ LNÍ PRÁ CE. Licenč ní studium STATISTICKÉZPRACOVÁ NÍ DAT PŘ I KONTROLE A Ř ÍZENÍ JAKOSTI

Modul pro testování elektrických obvodů

Statistika ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE FAKULTA DOPRAVNÍ. Jiří Volf, Adam Kratochvíl, Kateřina Žáková. Semestrální práce - 0 -

B Kvantitativní test. Semestrální práce TUR. Novotný Michal

Střední průmyslová škola a Vyšší odborná škola technická Brno, Sokolská 1. Podpora digitalizace a využití ICT na SPŠ CZ.1.07/1.5.00/34.

Lineární algebra. Vektorové prostory

Software spolehlivost, jakost a optimalizace

ČESKÁ ZEMĚDĚLSKÁ UNIVERZITA V PRAZE

Funkce Vypracovala: Mgr. Zuzana Kopečková

Je statisticky dokázáno. Martina Litschmannová Katedra aplikované matematiky, FEI, VŠB-TU Ostrava

SITEMAP / STRUKTURA. VÝVOJ ONLINE PREZENTACE / ETAPA I. CLIENT / DHL Global Forwarding THEQ ALL GOOD THINGS

ZATÍŽENÍ SNĚHEM A VĚTREM

ZPRÁVA o stavebně technickém průzkumu železobetonové konstrukce v areálu Kolejí 17. listopadu UK, Pátkova ul., Praha 8 - Libeň

Profilová část maturitní zkoušky 2015/2016

Abstrakt. Klíčová slova. Statistika v Excelu, analýza dat, soubor, Excel. Abstract

Rostislav Horčík. 13. října 2006

Digitální učební materiál

5EN306 Aplikované kvantitativní metody I

Lineární Regrese Hašovací Funkce

Zpráva o průběhu magisterského přijímacího řízení pro akademický rok 2014/15 na Fakultě stavební ČVUT v Praze

Národní informační středisko pro podporu kvality Tůmová

Ekonomika Společnost s ručením omezeným

Gymnázium, Praha 10, Voděradská 2 Projekt OBZORY

MODEL MOSTU. Ing.Jiřina Strnadová. Evropský sociální fond Praha a EU Investujeme do vaší budoucnosti. Předmět:Fyzika

VYUŽITÍ NEURONOVÝCH SÍTÍ PROSTŘEDÍ MATLAB K PREDIKCI HODNOT NÁKLADŮ PRO ELEKTRICKÉ OBLOUKOVÉ PECE

Skupina Testování obsahuje následující moduly: Síla a rozsah výběru, Testy a Kontingenční tabulka.

Zpracování studie týkající se průzkumu vlastností statistických proměnných a vztahů mezi nimi.

2.6.4 Lineární lomené funkce s absolutní hodnotou

Tvorba trendové funkce a extrapolace pro roční časové řady

České vysoké učení technické v Praze Fakulta jaderná a fyzikálně inženýrská OKRUHY. ke státním závěrečným zkouškám MAGISTERSKÉ STUDIUM

LÉKAŘI ČR A KOUŘENÍ SOUČASNOSTI

ECB-PUBLIC ROZHODNUTÍ EVROPSKÉ CENTRÁLNÍ BANKY (EU) 2015/[XX*] ze dne 10. dubna 2015 (ECB/2015/17)

2.1. Pojem funkce a její vlastnosti. Reálná funkce f jedné reálné proměnné x je taková

PRAVIDLA PROVOZOVÁNÍ LOKÁLNÍ DISTRIBUČNÍ SOUSTAVY. Forum Liberec s.r.o.

ÚKOL ,77 5,00 5 2,531,003,056 -,869,113

Asymptoty grafu funkce

POKUS O STATISTICKOU PŘEDPOVĚD ZNEČIŠTĚNÍ OVZDUŠÍ. Josef Keder. ČHMÚ ÚOČO, Observatoř Tušimice, keder@chmi.cz

EXPERTNÍ POSUDEK Doc. RNDr. Martin Ouředníček, Ph.D. Stručný výtah z posudku.

(k 1)x k + 1. pro k 1 a x = 0 pro k = 1.

POŽADAVKY KE STÁTNÍ ZÁVĚREČNÉ ZKOUŠCE MAGISTERSKÉ STUDIUM POČÍTAČOVÉ MODELOVÁNÍ VE VĚDĚ A TECHNICE (NAVAZUJÍCÍ STUDIUM I DOBÍHAJÍCÍ 5-LETÉ STUDIUM)

STP097 STATISTIKA CVIČENÍ EMPIRICKÁ DISTRIBUČNÍ FUNKCE, JEDNOVÝBĚROVÉ TESTY

3. Restrukturalizace nebo manipulace s údaji - práce s rastrovými daty

Použití GIS v práci krajské hygienické stanice

Česká zemědělská univerzita v Praze Fakulta provozně ekonomická. Obor veřejná správa a regionální rozvoj. Diplomová práce

ANOVA ANALÝZA ROZPTYLU. 12. cvičení

STÍRÁNÍ NEČISTOT, OLEJŮ A EMULZÍ Z KOVOVÝCH PÁSŮ VE VÁLCOVNÁCH ZA STUDENA

Analýza variance (ANOVA) - jednocestná; faktor s pevným efektem; mnohonásobná srovnání

AMU1 Monitorování bezpečného života letounu (RYCHLÝ PŘEHLED)

MATERIÁL PRO JEDNÁNÍ RADY MĚSTA PÍSKU DNE

ČESKÁ ZEMĚDĚLSKÁ UNIVERZITA V PRAZE

Protokol o výběru dodavatele

Pokusy s kolem na hřídeli (experimenty s výpočty)

Ozobot aktivita lov velikonočních vajíček

1 Měření kapacity kondenzátorů

Metody hodnocení rizik

ROMOVÉ V LETECH PRACOVNÍ LIST

M-10. AU = astronomická jednotka = vzdálenost Země-Slunce = přibližně 150 mil. km. V následující tabulce je závislost doby

Data v počítači EIS MIS TPS. Informační systémy 2. Spojení: jan.skrbek@tul.cz tel.: Konzultace: úterý

Miroslav Čepek

Matematika pro 9. ročník základní školy

Příkaz ředitele č. 4 ze dne 9. května 2016 II. KOLO PŘIJÍMACÍHO ŘÍZENÍ PRO ŠKOLNI ROK 2016/2017

I. Objemové tíhy, vlastní tíha a užitná zatížení pozemních staveb

Úvod. Analýza závislostí. Přednáška STATISTIKA II - EKONOMETRIE. Jiří Neubauer

JIŠTĚNÍ OBVODŮ POJISTKY 2

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Statistika. Program R. popisná (deskriptivní) statistika popis konkrétních dat. induktivní (konfirmatorní) statistika. popisná statistika

téma: Formuláře v MS Access

III/2 Inovace a zkvalitnění výuky prostřednictvím ICT

Digitální učební materiál

Střední škola pedagogická, hotelnictví a služeb, Litoměříce, příspěvková organizace

OBEC PŘIBYSLAVICE. Zastupitelstvo obce Přibyslavice. Obecně závazná vyhláška. Obce Přibyslavice Č. 1/2015

Úprava notifikací současného školního informačního systému

VY_62_INOVACE_VK53. Datum (období), ve kterém byl VM vytvořen Květen 2012 Ročník, pro který je VM určen

5 1 BITY A SADY BITŮ

Jan Březina. Technical University of Liberec. 17. března 2015

Druhá mocnina. Druhá odmocnina Druhá odmocnina. Předpoklady: V této hodině jsou kalkulačky zakázány.

Studie proveditelnosti. Marketingová analýza trhu

7. Stropní chlazení, Sálavé panely a pasy - 1. část

METODY ASTROFYZIKÁLNÍHO VÝZKUMU. B. Úhel, pod kterým pozorujeme z hvězdy kolmo na směr paprsků poloměr dráhy Země kolem Slunce,

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1

Klasifikace ekonomických rizik, metody jejich odhadu a zásady prevence a minimalizace

Makroekonomie I. Přednáška 2. Ekonomický růst. Osnova přednášky: Shrnutí výpočtu výdajové metody HDP. Presentace výpočtu přidané hodnoty na příkladě

Téma: Zemní práce III POS 1

Statistické metody - nástroj poznání a rozhodování anebo zdroj omylů a lží

Faremní systémy podle zadání PS LFA s účastí nevládních organizací

3. Slimák lezl na strom 10m vysoký. Přes den vylezl 4m ale v noci vždycky sklouzl o 3m. Za kolik dní dosáhl vrcholu stromu?

Jak udělat simulační studii z minulého čísla?

Odůvodnění veřejné zakázky dle 156 zákona. Odůvodnění účelnosti veřejné zakázky dle 156 odst. 1 písm. a) zákona; 2 Vyhlášky 232/2012 Sb.

Pokusné ověřování Hodina pohybu navíc. Často kladené otázky

UNIVERZITA V PLZNI. Model ALADIN A08N0205P MAN/MA

Transkript:

JAK OPTIMÁLN VYUŽÍT STATISTIKY P I ZPRACOVÁNÍ DAT PREZENTACE PRO KURZ ZÁKLAD V DECKÉ PRÁCE V AKADEMII V D R Doc. RNDr. Zden k Karpíšek, CSc. Centrum pro jakost a spolehlivost výroby (CQR) MŠMT R (www.cqr.cz) Odbor statistiky a optimalizace, Ústav matematiky Fakulta strojního inženýrství, Vysoké u ení technické v Brn (www.mat.fme.vutbr.cz/home/karpisek) Katedra aplikovaných disciplín, Akademie Sting v Brn E-mail: karpisek@fme.vutbr.cz, karpisek@sting.cz

POPISNÁ STATISTIKA (DESKRIPTIVNÍ STATISTIKA): Základní atribut: prvky pozorovaného statistického souboru nemají náhodný charakter Popis soubor : 1. Grafy 2. íselné charakteristiky Nedostatek: neúplné informace o pozorovaných statistických znacích vyvozené záv ry mají subjektivní charakter TEORIE PRAVD PODOBNOSTI = matematický model náhody 1. Náhodné jevy 2. Pravd podobnost náhodných jev, podmín ná pst, nezávislé náhodné jevy 3. Náhodné veli iny, jejich funk ní a íselné charakteristiky 4. Náhodné vektory, jejich funk ní a íselné charakteristiky 5. Rozd lení psti pro aplikace 6. Náhodné procesy 7. Teorie spolehlivosti 8. Teorie hromadné obsluhy a další

MATEMATICKÁ STATISTIKA (INDUK NÍ STATISTIKA, INFEREN NÍ METODY): Základní atribut: prvky pozorovaného statistického souboru mají náhodný charakter popis vychází ze spojení metod popisné statistiky a teorie pravd podobnosti model je založen na pojmu a vlastnostech tzv. náhodného výb ru Úlohy matematické statistiky: 1. Odhady: (a) parametr rozd lení pravd podobnosti bodové a intervalové (b) rozd lení pravd podobnosti 2. Testování hypotéz: (a) o parametrech a vlastnostech rozd lení pravd podobnosti (b) o rozd lení pravd podobnosti Odhady a testy se dle pot eby a požadavk provád jí sou asn : regresní analýza, ANOVA, kategoriální analýza aj. Pr zkumová (exploratorní) analýza = spojení vybraných metod popisné a induk ní statistiky Data mining = hledání hodnotných informací ve velkých objemech dat

Obecný statistický model: základní soubor (populace) = souhrn statistických jednotek statistické jednotky statistické znaky hodnoty Statistické znaky Kvantitativní Kvalitativní Diskrétní Spojité Ordinální Nominální Statistické znaky Jednorozm rné Vícerozm rné Stochastický model: diskrétní kvantitativní znak diskrétní náhodná veli ina a její rozd lení psti spojitý kvantitativní znak spojitá náhodná veli ina a její rozd lení psti ordinální kvalitativní (kategoriální) znak multinomické rozd lení psti etností nominální kvalitativní (kategoriální) znak multinomické rozd lení psti etností jednorozm rný statistický znak náhodná veli ina vícerozm rný statistický znak náhodný vektor

Základní soubor výb rový soubor, rozsah Výb ry podle rozsahu: velmi malé (do cca 20) malé (obvykle do cca 30 až 50) velké ( ádov stovky) velmi velké ( ádov tisíce a více) Požadavky na výb r: reprezentativní (informace bez omezení) homogenní (bez vlivu dalších faktor ) --------------------------------------------------------- náhodný Neur itost výb ru = zkreslení informací o základním souboru Druhy výb r : bez opakování, s opakováním, zám rný, oblastní (stratifikovaný), mechanický a další Statistický soubor = soubor pozorovaných hodnot (x 1, x 2,, x n ) znaku, resp. náhodné veli iny X na vybraných statistických jednotkách, resp. z jednotlivých pozorování (analogicky pro náhodný vektor)

POPISNÁ STATISTIKA Zpracování statistického souboru = p íprava + grafické znázorn ní + výpo et íselných charakteristik Rozt íd ný soubor: (x 1 *, f 1 ),,(x m *, f m ) t ídy, st ed a etnost Uspo ádaný statistický soubor: (x (1),,x (n) ), x (i) x (i+1) Grafy = vizuální informace o poloze, variabilit, symetrii, modalit, : krabicový graf, histogram, sloupcový graf, výse ový graf, íselné (empirické) charakteristiky = íselné informace o poloze, variabilit, symetrii, modalit, : 1. Pr m r (aritmetický, geometrický, ), kvantily (medián, kvartily, ), modus, polosuma, u ezaný pr m r, 2. Rozptyl, sm rodatná odchylka, rozp tí, mezikvartilová odchylka, mutabilita, entropie, 3. Koeficient šikmosti (asymetrie), koeficient špi atosti (excesu), 4. Kovariance, korela ní koeficient, po adové korela ní koeficienty, koeficienty asociace, a další

N které vlastnosti aritmetického pr m ru: pom rn citlivý na zm nu hodnot souboru citlivý na extrémn odchýlené hodnoty u kladn (záporn ) asymetrických soubor je pr m r v tší (menší) než medián konvergence s rostoucím rozsahem souboru k pr m ru celé populace obvykle rychlá konvergence rozd lení pravd podobnosti pr m ru k normálnímu rozd lení Poznámky k íselným charakteristikám: geometrický pr m r nelze nahradit aritmetickým pr m rem míry variability se v aplikacích bohužel asto opomíjí nezjiš uje se asymetrie souboru netestují se extrémn odchýlené hodnoty koeficient korelace je pouze mírou linearity vztahu mezi X a Y r = 0 nemusí znamenat nezávislost X a Y r 0 neprokazuje kauzalitu regresní analýza = "jemn jší" vyjád ení závislosti mezi X a Y a umož uje predikci

TEORIE PRAVD PODOBNOSTI Pravd podobnost P(A) je teoretická míra možnosti nastoupení náhodného jevu A. Klasická definice: P(A) = m/n m = po et p íznivých p ípad jevu A n = po et všech možných p ípad Axiomatická definice - založená na teorii množin Náhodná veli ina (prom nná): Funk ní charakteristiky Rozd lení pravd podobnosti íselné charakteristiky Funk ní charakteristiky: distribu ní funkce, hustota aj. íselné charakteristiky: st ední hodnota, rozptyl aj. Rozd lení pravd podobnosti pro modelování reálných jev : binomické, hypergeometrické, Poissonovo, rovnom rné, normální (Gaussovo), exponenciální, Weibullovo aj., aj.

Bernoulli v zákon velkých ísel - asymptotické chování relativní etnosti Normální rozd lení - významné postavení p i modelování reálného sv ta:

MATEMATICKÁ STATISTIKA Principy matematické statistiky: hodnoty získané výb rem ze základního souboru jsou náhodné získaný statistický soubor je hodnotou náhodného výb ru Statistická indukce: Náhodná veli ina X Teoretická charakteristika Náhodný výb r (X 1,,X n ) Výb rová charakteristika T(X 1,,X n ) Statistický soubor (x 1,,x n ) Empirická charakteristika t = T(x 1,,x n ) St ední hodnota výb rového pr m ru = st ední hodnota pozorované veli iny ("pr m ru" populace) a rozptyl výb rového pr m ru 0 pro n, takže pro dostate n velké n je tak ka jist pr m r souboru blízký neznámé st ední hodnot ; avšak tento rozptyl 0 s rychlostí n 1/2. Velmi asto však rozd lení výb rového pr m ru konverguje k rozd lení normálnímu.

ODHADY PARAMETR Odhad parametru = výb rová charakteristika T(X 1,,X n ) Bodové Odhady Bodový odhad : t = T(x 1,..,x n ) Intervalové Intervalový odhad se spolehlivostí 1 - : konfiden ní interval <T 1 ;T 2 > <t 1 ;t 2 > Spolehlivost 1 - = pst úsp šnosti odhadu, konvence 0,95 a 0,99 Riziko chybného odhadu =

P íklad: P i pr zkumu názoru z dotázaných n osob eklo "ano" x osob. Pro spolehlivost 0,95: n x Bodový odhad (%) Intervalový odhad (%) Od Do 400 80 20 16,08 23,92 1600 320 20 18,04 21,96 6400 1280 20 19,02 20,98

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ Statistické hypotéza = tvrzení o vlastnostech pozorované náhodné veli iny (vektoru) Nulová hypotéza H 0 Alternativní hypotéza H A Druhy hypotéz: parametrické a neparametrické jednoduché a složené jednostranné a oboustranné sdružené Algoritmus testování hypotézy pomocí statistického souboru: 1. Stanovení hypotéz H 0 a H A. 2. Volba testového kritéria T(X 1,,X n ). 3. Výpo et hodnoty testového kritéria t = T(x 1,..,x n ). 4. Stanovení hladiny významnosti a kritického oboru W. 5. Rozhodnutí o hypotézách H 0 a H A. Hladina významnosti: = obvykle 5% anebo 1%

Rozhodnutí: t W H 0 zamítáme a H A nezamítáme t W H 0 nezamítáme a H A zamítáme H 0 PLATÍ NEPLATÍ ZAMÍTÁME CHYBA 1. DRUHU ------- NEZAMÍTÁME ------- CHYBA 2. DRUHU Rizika: pravd podobnost chyby 1. druhu = hladina významnosti pravd podobnost chyby 2. druhu snižujeme (stanovujeme) zvýšením rozsahu n

Aspekty: nezamítnutí hypotézy neznamená vždy její p ijetí zv tšíme rozsah výb ru a znovu testujeme nezamítnutí nebo p ijetí hypotézy není potvrzení její platnosti Aplikace P-hodnoty a intervalových odhad

DOPORU ENÝ POSTUP APLIKACE STATISTICKÝCH METOD VE VÝZKUMU: 1. Stanovení úkolu a pracovních hypotéz. 2. Vytvo ení rigorózního a realizovatelného plánu experimentu, pozorování, pr zkumu apod. 3. Realizace bodu 2, tj. získání statistických soubor. 4. Verifikace statistických soubor v rámci dané v dní disciplíny. 5. Výb r adekvátních statistických metod pro ešení. 6. Realizace statistických výpo t pomocí modul adekvátního profesionálního softwaru (Statistica, Minitab, Statgraphics, Systat, QCExpert,, Excel aj.). 7. Analýza získaných výsledk a jejich aplikace pro ešení stanovených úkol a ov ení pracovních hypotéz. 8. Dle pot eb a nutností návrat k p edcházejícím bod m uvedeného algoritmu. 9. Publikace nezbytných informací a výsledk získaných statistickou analýzou. 10.???

UKÁZKA APLIKACE STATISTICKÝCH METOD. 1 ROZD LENÍ PRAVD PODOBNOSTI KONCENTRACE LEGOVACÍHO PRVKU Ni Rozd lení koncentrace X [% hmotnostního obsahu] legovacího (p ísadového) prvku ve struktu e oceli má ur ující vliv na její materiálové vlastnosti: pevnost, tažnost, tvrdost aj. Hodnoty obsahu jednotlivých prvk v oceli byly získány energiov RTG mikroanalýzou na lineárním úseku v délce 1000 m. Vzhledem k náhodnému charakteru obsahu a zp sobu jeho m ení je vhodné modelovat koncentraci X jako spojitou náhodnou veli inu. Pro statistické zpracování byl vybrán prvek Ni. Nam ené hodnoty obsahu tvo í statistický soubor a naším úkolem je: zpracovat tento soubor metodami popisné statistiky, stanovit tvar pozorovaného rozd lení pravd podobnosti, ur it bodové a intervalové odhady jeho parametr a charakteristik. V materiálovém inženýrství se nej ast ji používá normální (Gaussovo) rozd lení N, 2 pravd podobnosti s hustotou pravd podobnosti x 2 1 f x exp, x (, ), 2 2 2 a základními íselnými charakteristikami E( X) x 2 0,5 xˆ, D( X),

kde je st ední hodnota, x 0,5 je medián, ˆx je modus, 2 je rozptyl a je sm rodatná odchylka. Pro statistické výpo ty byl použit profesionální software Statgraphics Centurion XV.I. Zpracováním statistického souboru 100 nam ených hodnot koncentrace p ísadového prvku Ni v nízkolegované oceli byly získány následující íselné a grafické výsledky. Summary Statistics for Ni POPISNÉ CHARAKTERISTIKY Count = 100 Average = 0,645077 Median = 0,626583 Variance = 0,0287817 Standard deviation = 0,169652 Minimum = 0,284121 Maximum = 1,00947 Range = 0,725349 Lower quartile = 0,542912 Upper quartile = 0,756923 Interquartile range = 0,214011 Skewness = 0,165103 Stnd. skewness = 0,674032 Kurtosis = 0,52586 Stnd. kurtosis = 1,07341 Coeff. of variation = 26,2994%

KRABICOVÝ GRAF

EMPIRICKÝ ODHAD NORMÁLNÍHO ROZD LENÍ PRAVD PODOBNOSTI

ZÁV R: Z grafu odhadujeme, že jde o normální rozd lení. TEST NORMÁLNÍHO ROZD LENÍ PRAVD PODOBNOSTI Goodness-of-Fit Tests for Ni Chi-Square Test ------------------------------------------------------------------------------------------------- Lower Upper Observed Expected Limit Limit Frequency Frequency Chisquare ------------------------------------------------------------------------------------------------- at or below 0,45 14 12,51 0,18 0,45 0,6 31 27,01 0,59 0,6 0,75 29 33,66 0,65 0,75 0,9 16 20,17 0,86 above 0,9 10 6,65 1,69 ------------------------------------------------------------------------------------------------- Chi-Square = 3,96445 with 2 d.f. P-Value = 0,137762 Estimated Kolmogorov statistic DPLUS = 0,0698738 Estimated Kolmogorov statistic DMINUS = 0,0579959 Estimated overall statistic DN = 0,0698738 Approximate P-Value = 0,713335 ZÁV R: Na základ obou test nezamítáme hypotézu o normálním rozd lení na hladin významnosti 0,05.

HISTOGRAM A HUSTOTA PRAVD PODOBNOSTI

DISTRIBU NÍ FUNKCE

BODOVÉ A INTERVALOVÉ ODHADY Estimate of mean: 0,645077 Estimate of standard deviation: 0,169652 95,0 % confidence interval for mean: 0,645077 +/ 0,0336626 [0,611415;0,67874] 95,0 % confidence interval for standard deviation: [0,148955;0,19708] ************************************************************************************************************ CELKOVÉ ZÍSKANÉ VÝSLEDKY obsah Ni v dané oceli má normální rozd lení pravd podobnosti bodový odhad st edního obsahu Ni je 0,645 % a bodový odhad sm rodatné odchylky obsahu Ni je 0,1687 % se spolehlivostí 95 % je st ední obsah Ni od 0,611 % do 0,679 % a sm rodatná odchylka obsahu Ni od 0,1490 % do 0,1971 %

UKÁZKA APLIKACE STATISTICKÝCH METOD. 2 Šokující zjišt ní: Ženy jsou opravdu chyt ejší než muži! (Super.cz --- 24. 2. 2010) A jakže se na tuto p evratnou pravdu p išlo? Jednoduše - z v domostního internetového souboje milion muž a žen z národ devíti r zných jazyk. Výsledky hovo ily jasn - ženy si prost vedly lépe než pánové tvorstva! Pr zkum probíhal na internetu a v jeho rámci padlo celkem patnáct milion otázek! Testování probíhalo od íjna minulého roku a bylo od po átku velmi vyrovnané. V záv ru ale p ece jen se slabou p evahou zvít zily ženy. Ty p itom odpov d ly správn na 4 088 139 otázek a muži na 4 077 596 otázek. Dotazy byly kladeny z n kolika oblastí, p i emž nejoblíben jším byl obor showbyznysu a zábavy, následovaný v dou, sportem, historií a um ním. Poslední byla kategorie lidé a místa. Ženy nejlépe odpovídaly práv v kategorii showbyznys + zábava a muži zase v kategorii v da + p íroda. Internetová bitva pohlaví nalákala obrovské množství lidi z celého sv ta, p iznala jedna z autorek výzkumu Katreena Linesová. Jak vidno, boj mezi pohlavími je opravdu v ným tématem...

Pracovní hypotéza: Ženy jsou chyt ejší než muži. Statistická nulová hypotéza H 0 : p 1 = p 2 alternativní hypotéza H A : p 1 > p 2 Test statistické hypotézy: Po et otázek: n 1 = n 2 = 15 000 000 Po et správných odpov dí: ženy... x = 4 088 139, muži... y = 4 077 596 f_bar = 0,272191167 n_bar = 7500000 t = 4,324719102 u 0,95 = 1,644853 (P jednostr. = 7,64197E-06) Záv r: Hypotézu H 0 zamítáme a hypotézu H A nezamítáme, resp. p ijímáme. P ijímáme pracovní hypotézu, že ženy jsou chyt ejší než muži! Opravdu?

D KUJI ZA POZORNOST!