PŘÍSPĚVEK K ANALÝZE ROZDĚLENÍ PŘÍJMŮ DOMÁCNOSTÍ V ČR
|
|
- Zuzana Fišerová
- před 9 lety
- Počet zobrazení:
Transkript
1 ROBUST 2004 c JČMF 2004 PŘÍSPĚVEK K ANALÝZE ROZDĚLENÍ PŘÍJMŮ DOMÁCNOSTÍ V ČR Jitka Bartošová Klíčová slova: Příjmové rozdělení, teoretický model, test odlehlosti. Abstrakt: Pro správné ohodnocení příjmové stránky životní úrovně obyvatelstva i pro správné rozhodování ohledně opatření v této oblasti je nezbytné znát úplné rozdělení příjmů daného období, tj. znát obsazení ve všech příjmových skupinách. Vzhledem k probíhající transformaci hospodářství z plánované formy na tržní dochází ke změnám ve složení příjmů obyvatelstva. Aktuálním úkolem současnosti je ověření platnosti dosud používaného statistického modelu rozdělení ročních příjmů domácností v ČR. Tento příspěvek se zabývá ověřováním platnosti dosud používaného statistického modelu rozdělení příjmů domácností získaných z výběrového šetření ČSÚ Mikrocensus Důvody zkoumání příjmových rozdělení Modely příjmových rozdělení umožňují zhodnocení životní úrovně všech obyvatel státu bez rozdílu, stejně jako srovnání životní úrovně příslušníků různých společenských skupin nebo obyvatel různých regionů. Jsou rovněž ukazatelem relativní životní úrovně obyvatelstva vybraného státu ve srovnání s dalšími státy. Pro správnou kvantifikaci té složky životní úrovně obyvatelstva, která přímo závisí na příjmech, je potřeba vystihnout úroveň, strukturu a vývojový trend příjmů obyvatelstva komplexně, tj. nalézt vhodné statistické modely příjmových rozdělení pro jednotlivé sociální skupiny i pro obyvatelstvo jako celek, bez ohledu na sociální skupinu. 2 Statistický model příjmových rozdělení 2.1 Volba teoretického modelu Základním úkolem při konstrukci statického modelu rozdělení ročních příjmů domácností je nalezení takové teoretické distribuční funkce, která maximálně odpovídá empirickému rozdělení četností. Dosud používaným statistickým modelem příjmových rozdělení bylo logaritmicko normální rozdělení se dvěma(popřípaděsetřemiparametry) LN(µ, σ 2 )(popřípadě LN(µ, σ 2, γ), kde parametr γ je teoretické minimum náhodné veličiny X). Logaritmicko - normální rozdělení(především jeho varianta se třemi parametry) zatím představovalo dobrou aproximaci příjmových rozdělení pro většinu sociálních skupin. Různost zdrojů, ze kterých příjmy pocházejí, a současný proces diferenciace mezd, který probíhá v některých skupinách velmi bouřlivě, může mít za následek jednak nesourodost příjmových rozdělení jednotlivých sociálních skupin a jednak vysokou variabilitu uvnitř těchto skupin. Empirické
2 452 Jitka Bartošová rozdělení četností příjmů v některých sociálních skupinách by proto mohlo být lépe vystiženo některým jiným modelem(např. normálním, Weibullovým, nebo Γ-rozdělením atd.). Odchylky empirického rozdělení ročních příjmů domácností od předpokládaného teoretického modelu mohou být zapříčiněny rovněž přítomností odlehlých hodnot, popřípadě heterogenitou dat, odpovídající např. směsi několika navzájem posunutých logaritmicko- normálních křivek, popřípadě směsi logaritmicko- normálního rozdělení s některým jiným rozdělením, např. normálním apod. S tímto problémem se můžeme setkat nejenom u rozdělení příjmů všech obyvatel bez rozdílu sociální skupiny, ale i u rozdělení příjmů v některých jednotlivých sociálních skupinách. Testováníshodyempirickéateoretickédistribučnífunkce F E (x)af T (x) můžeme provádět buď početně, pomocí testovacích statistik, nebo graficky. Často používanou početní metodou pro testování nulové hypotézy o shodě výběrového příjmového rozdělení s předpokládaným teoretickým modelem je (n i nπ i) 2 nπ i, χ 2 -testdobréshody([1]),kterýpracujesestatistikou χ 2 = k i=1 kde n i a nπ i (π i )jsouabsolutníempirickéaabsolutní(relativní)teoretické četnosti, k je počet tříd, n je rozsah výběru. Dalšími měrami shody empirického a teoretického rozdělení jsou např. suma čtverců(popřípadě suma absolutních hodnot) odchylek empirického rozdělení od teoretického, reprezentovanástatistikou MSE= k i=1 (p i π i ) 2 (popřípadě MAE= k i=1 p i π i ), kde p i = ni n a π ijsourelativníčetnostiempirickéhoateoretickéhorozdělení. Nahodnotyempirickédistribučnífunkce F E (x),atedyinahodnotyuvedenétestovacístatistiky χ 2,mávlivvolbavelikostitřídníchintervalů hpři seskupovánídat,kteráurčujepočettříd k xmax xmin h. Odhad počtu tříd podlesturgessovapravidla,kterýjedánvztahemˆk 1+3,3log 10 n,kde nje rozsah výběru, je vhodný pro pouze menší výběry. Pro velké výběry je toto dělenípříliš hrubé.vtakovémpřípadějevhodnějšípoužítkodhadušířky intervalů h a tedy i k určení počtu tříd k Scottovo pravidlo([10]), popřípadě robustní Freedmanovo-Diaconisovo pravidlo. 2.2 Identifikace odlehlých hodnot Problém vzrůstu variability příjmů celkem i uvnitř jednotlivých sociálních skupin je způsoben především vznikem skupin obyvatel s extrémně nízkými popřípadě extrémně vysokými příjmy. Tyto hodnoty příjmů, které můžeme z hlediska zvoleného modelu považovat za odlehlá pozorování, způsobují narušení vybraného teoretického modelu a snižují jeho shodu s empirickým rozdělením četností. Proto v případě, že v příjmech některé sociální skupiny byla detekována odlehlá pozorování, je vhodné omezit vliv těchto hodnot na odhad parametrů modelu buď jejich úplným vyloučením nebo použitím některé z robustních metod odhadu([2],[8],[4],[5]). Tímto způsobem můžeme v dosáhnout výrazného zvýšení shody teoretického modelu s empirickým rozdělením příjmů u většiny sociálních skupin. Identifikaci odlehlých hodnot lze realizovat opět buď graficky(např. s vy-
3 Příspěvek k analýze rozdělení příjmů domácností 453 užitím krabicových diagramů) nebo početně(pomocí vhodných testů odlehlosti). Testové metody identifikace odlehlých pozorování jsou propracovány především pro soubory s normálním rozdělením, dále pak pro soubory s exponenciálním a rovnoměrným rozdělením. Pokud je rozdělení souboru jiného typu, lze v mnoha případech vhodnou transformaci docílit toho, aby transformovanádata y=f(x)mělaněkterézvýšeuvedenýchrozdělení.(např. transformace na normální rozdělení je pro data s logaritmicko- normálním rozdělenímdánavztahy y = ln(x), y = ln(x γ)nebo y = ln x γ δ x,kde γ, δ jsou hodnoty teoretického minima a maxima, atd.) Vzhledem k tomu, že předpokládaným statistickým modelem příjmových rozdělení je ve většině případů logaritmicko- normální rozdělení, můžeme po transformaci dat použít některou z metod identifikace odlehlých pozorování založené na předpokladu normality výběru. K nejčastěji používaným inkluzivním testům existence jednoho nebo dvou odlehlých pozorování v datovém souboru s normálním rozdělením patří test založený na modifikovaném studentizovaném reziduu. Např. test odlehlosti maxima x (n) pracujesestatistikou T 1 = x (n) x 1 ˆσ 1,kde x 1 aˆσ 1 jsouodhady průměru a směrodatné odchylky získané z redukovaného výběru, tj. z výběru, kterývzniknevypuštěnímhodnoty x (n),kde x (n) je n-tápořádkovástatistika. H 0 zamítámenahladiněvýznamnosti α,pokudjesplněnanerovnost T 1 > n n 2 t 1 α(n 2),kde t 1 α(n 2)je100(1 α n n n )%-níkvantilstudentovarozdělenís(n 2)stupnivolnosti.Suvedenýmtestemúzcesouvisítest založený na klasickém studentizovaném reziduu a exkluzivní test Grubbsův. Velmi dobré vlastnosti mají také Dixonovy r-statistiky, které jsou založeny na porovnávání různých vzdáleností mezi pořádkovými statistikami. Potřebné kvantily lze pro uvedené testovací statistiky nalézt např. v[3]. Pro maximalizaci shody empirického rozdělení s teoretickým v případě kontaminovaného modelu je důležitý odhad stupně kontaminace ˆε. Vzhledem k tomu, že rozdělení příjmů je téměř ve všech skupinách asymetrické, lze očekávat, že i kontaminace bude mít asymetrický charakter a hodnoty optimálníchuseknutídatˆα d aˆα h,kteréodpovídajístupnikontaminacezdolaˆε d ashoraˆε k,budoumítrůznouvelikost.kodhadustupněkontaminacejenezbytné použít některou z metod detekce většího počtu odlehlých pozorování. K tomuto problému můžeme přistupovat dvěma způsoby. Buď můžeme testovathypotézu H 0 : Vevýběruneexistujíodlehlápozorování protialternativě H 1 : Vevýběrujeprávě rodlehlýchpozorování -tj.prováděttzv. blokovétestyodlehlosti,nebomůžemetestovathypotézu H 0 : Vevýběruje méněnež kodlehlýchpozorování protialternativě H 1 : Vevýběrujeprávě kodlehlýchpozorování,kde knabývápostupněhodnot r, r 1, r 2,...,1 a testovací statistiky se určují z příslušných podmnožin výběru tj. provádět tzv. sekvenční testy odlehlosti. V případě správného určení hodnoty r mají blokové testy optimální vlastnosti. V praxi jsou však častěji používány sekvenční testy, které nevyžadují velkou přesnost při odhadu předpokládaného počtu odlehlých pozorování r.
4 454 Jitka Bartošová Mezi nejznámější sekvenční testy patří ESD test, který pracuje s tzv. extrémní studentizovanou odchylkou. Při určování příslušné testovací statistiky vycházímezposloupnostipodmnožinvýběru {A 0, A 1,..., A r 1 },kdeprvní členposloupnostijetvořencelýmvýběrem,tj. A 0 = {x (1), x (2),..., x (n) }, akaždýnásledujícíčlenposloupnostijedánrekurzivněvztahem A i+1 = A i {x(a i )},kde x(a i )jenejvzdálenějšíprvekodprůměru x(a i )namnožině A i.toznamená,žeprotutohodnotumusíplatit x(a i ) x(a i ) =max x j A i x j x(a i ), kde x(a i )jeprůměrnapodmnožině A i, i=0,1,...,r 1. Extrémnístudentizovanáodchylkanapodmnožině A i,tj.veličina ESD i+1, je dána vztahem ESD i+1 = max x j A i x j x(a i ), s(a i ) kde s(a i )jesměrodatnáodchylkanapodmnožině A i, i=0,1,..., r 1. H 0 zamítámenahladiněvýznamnosti α,pokudjesplněnanerovnost ESD i+1 > L i+1, kde příslušné kvantily jsou stanovené aproximativně v [9]. Při detekci odlehlých pozorování sekvenční metodou postupujeme iterativně, tzv. zpětnýmkrokováním.toznamená,žeporovnánívypočtenýchhodnotprovádíme od poslední (nejmenší) vytvořenépodmnožiny A i, i = r. Pokud ESD i+1 > L i+1,pak i=r,toznamená,ževevýběrubyloidentifikováno r odlehlých pozorování. Sekvenční identifikační procesy jsou vhodné pro počítačové zpracování například pomocí softwarových produktů Matlab, Matematika, MS-Excel apod. Další skupinu testů, užívaných k detekci většího počtu odlehlých hodnot, tvoří tzv. jednokrokové procedury. Jedná se o postup, kdy procházíme celým souborem(krok za krokem) a testujeme postupně všechny jeho prvky. K rozhodnutí o odlehlosti přitom používáme některou ze statistik vhodných pro identifikaci jedné odlehlé hodnoty. Pokud je model příjmového rozdělení kontaminován odlehlými pozorováními, projeví se vliv těchto výrazně odlišných hodnot snížením shody empirického rozdělení s předpokládaným teoretickým logaritmicko- normálním modelem. Opětného zvyšování této shody můžeme docílit v tomto případě vhodnýmuseknutímvýběrovéhosouboru.odhadystupňůuseknutídatzdolaˆα d ashoraˆα h bymělyzároveňtvořithorníhraniceproodhadnutéstupněkontaminaceˆε d aˆε h,abybylysplněnynerovnosti(α d ε d ) (α h ε h ).Odhad horní hranice kontaminace příjmových rozdělení může být tedy v jednotlivých sociálních skupinách získán odhadem optimální hodnoty useknutí dat. Takovýto odhad lze realizovat např. prostřednictvím dvojrozměrné numerické maximalizace shody empirického rozdělení ročních příjmů domácností s teoretickým modelem. K určení aktuální useknuté hodnoty může být v iteračním kroku použita výše popsaná metoda identifikace nejvzdálenějšíhoprvkuodprůměru.odhadoptimálníchhodnotuseknutíˆα d aˆα h,
5 Příspěvek k analýze rozdělení příjmů domácností 455 odpovídající maximální dosažitelné shodě empirického a teoretického rozdělení, lze provést např. pomocí numerické minimalizace testovací statistiky χ 2 = k (n i nπ i) 2 i=1 nπ i,popřípadě MSE= k i=1 (p i π i ) 2 apod.odhadnuté hodnoty optimálních useknutí budou vždy závislé nejenom na konkrétním výběrovémsouborupříjmůanajehorozdělenídotříd,aletakénavolběteoretického modelu, na počtu parametrů modelu a na metodě použité k jejich odhadu. 3 Některé dílčí výsledky analýzy příjmových rozdělení 3.1 Použité metody a dosažené výsledky Zkoumaný datový soubor příjmů domácností pochází z celostátního statistického šetření Mikrocensus Obsahuje jednak hodnoty ročních příjmů domácností, počty členů domácností a zařazení domácnosti do sociální skupiny podle typu zaměstnání osoby v čele domácnosti. K účelům zkoumání rozdělení ročních příjmů obyvatelstva byly vybrány následující ukazatele:(a) Sociální skupinaosobyvčeledomácnosti(1-dělník,2-samostatněčinný(mimozemědělství), 3- zaměstnanec, 4- samostatně hospodařící rolník, 5- družstevní rolník, 6- důchodce v domácnosti s ekonomicky aktivními členy, 7- důchodce v domácnosti bez ekonomicky aktivních členů, 8- nezaměstnaný, 0- ostatní), (b) Počet členů domácnosti,(c) Čistý peněžní příjem domácnosti(v Kč za rok). Bez újmy na obecnosti se zde můžeme soustředit např. pouze na analýzu souborů dat ročních peněžních příjmů na domácnost. Vizualizací datových souborů(pomocíhistogramůap-pgrafů)bylyvytipovány problémové soubory, které vykazovaly odlišnosti od předpokládaného teoretického modelu logaritmicko-normálnírozdělenísedvěmaparametry LN(µ, σ 2 )(popřípadě setřemiparametry LN(µ, σ 2, γ).jednáseovýběrovésouboryročníchpříjmů domácnostíbezohledunasociálnískupinuaskupin1,3a7([6]). Po grafickém průzkumu byl v celém datovém souboru i v každé sociální skupiněproveden χ 2 testshodyempirickéhorozdělníspříslušnýmlogaritmicko- normálním modelem. Vzhledem k tomu, že shoda empirického rozdělení četností příjmů na domácnost s teoretickým model byla prokázány pouze usociálníchskupin5,6,8a0,byloprovedenouseknutídatovýchsouborůodpovídající stupni kontaminace odhadnutému pomocí jednokrokové procedury využívající klasický t-test standardizovaných reziduí na 5%-ní hladině významnosti(viz tab. 1). K významnému zvýšení shody empirického rozdělení steoretickýmmodelempouseknutídošlopouzeuskupin0,2a4.naproti tomuuskupin6a8došlokesníženíoprotipůvodnísituaciauskupinyč.5 došlo ke zvýšení pouze u dat seskupených do tříd podle Sturgesova pravidla. Skutečnost, že podle dalších použitých pravidel seskupování došlo ke snížení, můžebýtzapříčiněnazměnoupočtutřídpřivýpočtech χ 2 statistikzcelých výběrů(v programu MS Excel) a z useknutých výběrů(v programu StatgraphicsforWindows).([6]).
6 456 Jitka Bartošová Sociální Stupeň kontaminace skupina ε d ε h všechny 0% 3,055% 1 3,817% 0% 2 0% 3,261% 3 0% 3,210% 4 0% 3,053% 5 0% 5,128% 6 0% 3,374% 7 0% 1,676% 8 0% 2,692% 0 0% 3,390% Tabulka 1: Odhad stupně kontaminace zdola a shora rozdělení příjmů na domácnost t-testem standardizovaných reziduí(α = 0,05). Sociální Stupeňuseknutí χ 2 test skupina α d α h p-value 0 1% 9% 0, % 2% 0, ,5% 1,5% 0, % 4% 0, % 1% 0, % 1% 0, Tabulka 2: Odhad optimálního stupně useknutí zdola a shora v souborech příjmůnadomácnostpomocínumerickéminimalizace χ 2 statistiky. Z důvodu nejednotnosti vlivu useknutí podle výše odhadnutého stupně kontaminace na shodu empirického rozdělení četností s logaritmicko- normálnímmodelembylaprovedenaúpravaodhadustupněuseknutízdolaˆα d ashora ˆα h pomocínumerickéminimalizace χ 2 statistiky(viztab.2).odhady byly realizovány v programu MS Excel. Z tabulky vyplývá, že bylo dosaženo výrazného zvýšení shody empirického rozdělení s teoretickým, a proto můžeme považovat logaritmicko- normální rozdělení za vhodný model pro většinu sociálních skupin. Další odhad stupně kontaminace příjmových rozdělení v jednotlivých sociálníchskupinách,tj.počtůhodnotodlehlýchzdola r d ashora r h,bylrealizován prostřednictvím dvou sekvenčních testů klasické a modifikované veze ESD testu. Modifikace ESD testu spočívala v tom, že procesy identifikaceaktuální podezřelé hodnotyajejíhotestovánínaodlehlostprobíhají současně v témž iteračním kroku. Metoda vychází ze skutečnosti, že nadhodnocení předpokládaného počtu odlehlých pozorování r má na efektivnost
7 Příspěvek k analýze rozdělení příjmů domácností 457 Sociální Rozsah Klas. ESD Modif. ESD Num. optimalizace skupina n r d r h r d r h r d r h Tabulka 3: Odhady počtu odlehlých hodnot příjmů na domácnost určené sekvenčními testy a odhady jejich horních hranic určené numerickou optimalizací. použitého testu minimální vliv([7]) a zároveň musí být splněna nerovnost r [ n 4 ].Přirealizacimodifikovanéverze ESDtestujesetříděnýsouborpříjmů na domácnost nejprve symetricky maximálně redukován, tzn. že z každé stranyjeuseknuto[ n 4 ]hodnot,takžeprvnímčlenemposloupnostipodmnožin výběru {A r, A r 1,...,A 0 }jemnožina A r = {x ([ n 4 ]+1),...x (n [ n 4 ]) },každý následujícíčlenpakodpovídárekurzivnímuvztahu A i 1 = A i + {x(a i )}. Iteračníkrokspočívávevyhledáníaotestováníodlehlosti nejbližší useknutéhodnoty x(a i ),kterámáodprůměruaktuálníhoredukovanéhosouboru x(a i )minimálnívzdálenost.prokaždouhodnotu x(a i )jeurčenastatistika ESD i+1,kterájeporovnánashodnotoupříslušnéhokvantilu L i+1.pokudje splněnanerovnost ESD i+1 > L i+1,iteračnícykluskončíar=r d + r h = i. Rozdíl mezi klasickou a modifikovanou formou testu je především ve startovacímbodětestovacíhoprocesuavurčeníhodnoty x(a i ).Iteračníprocedura obou sekvenčních testů byla realizována v programu MS Excel. Kodhadupočtuhodnotvhodnýchkuseknutízdola r d ashora r h prostřednictvím numerické optimalizace shody empirického rozdělení s dvouparametrickým logaritmicko- normálním modelem byla použita statistika MSE= k i=1 (p i π i ) 2.Optimalizačníprocedurabylarealizovánavprogramu Matlab. Výsledky(viz tab. 3) ukazují, že počty identifikovaných odlehlých hodnot příjmů na domácnost, získané prostřednictvím obou sekvenčních testů, jsou ve všech sociálních skupinách srovnatelné, nezávislé na rozsahu souborůarelativněvelmimalé(0 r d 5),(0 r h 4).Naprotitomupři numerické optimalizaci bylo ve většině sociálních skupin dosaženo maximální shody empirického rozdělení s teoretickým modelem až po useknutí většího počtuhodnotpříjmů(0 r d 36),(3 r h 36).Anizdenebylaprokázána závislost optimálního počtu useknutých hodnot na rozsahu souboru. Vyjádříme-lisiprocentuálnívelikostikontaminace ε d = r d n, ε h = r h n aprocentuálnívelikostioptimálníchuseknutí α d = r d n, α h = r h n,zjistíme,ževevšech sociálníchskupináchjezachovánaplatnostvztahu(ε d α d ) (ε h α h ), to znamená, že odhady useknutí lze ve všech případech považovat za horní hranice odhadů kontaminace.
8 458 Jitka Bartošová 3.2 Závěry Probíhající transformace hospodářství České Republiky z plánované formy natržní,kterábylazahájenapředvíceneždesetilety,seprojevilavúrovni a struktuře čistých ročních peněžních příjmů domácností získaných z Mikrocensu 1996 pouze částečně. Došlo především k výrazné diferenciaci příjmů, tj. ke vzniku(malého počtu) domácností s výrazně vysokými a s výrazně nízkými příjmy, které způsobují narušení teoretického modelu a snižují jeho statistickou významnost. Naproti tomu uvedená analýza rozdělení ročních příjmů domácností získaných z Mikrocensu 1996 prokázala u většiny sociálních skupin platnost logaritmicko- normálního modelu, kontaminovaného malým podílem odlehlých hodnot. Pro nalezení optimálního statistického modelu rozdělení příjmů je proto vhodné nejprve provést v každé sociální skupině detekci odlehlých pozorování, popřípadě optimalizaci stupně useknutí souboru. K odhadu charakteristik modelu je z výše zmíněných důvodů vhodné použít některou z robustních metod odhadu. Reference [1] Anděl J. (2002). Základy matematické statistiky. Preprint MFF UK, Praha. [2] Antoch J., Vorlíčková D.(2004). Vybrané metody statistické analýzy dat. ACADEMIA, Praha. [3] Barnett V., Lewis T.(1978). Outliers in statistical data. 1st edn. John Wiley, Chichester [4] Bartošová J.(2003). Robustní metody odhadů. Oeconomica, Praha, [5] Bartošová J.(2003). Příjmové modely. Výpočtová štatistika, SŠDS, Bratislava,7 11. [6] Bartošová J.(2004) [7]JainR.B.,PingelL.A.(1981).Aprocedureforestimatingthenumber of outliers. Commun. Statist. Theor. Meth. 10, [8] Jurečková J.(2001). Robustní statistické metody. Karolinum, Praha. [9] Militký J., Militká D.(1985). Moderní matematicko-statistické metody v hutnictví. Základní statistické metody III. Dvůr Králové. [10] Scott, D. W.(1992). Multivariate density estimation. Theory, practice and visualization. J. Willey, New York. Adresa: J. Bartošová, Vysoká škola ekonomická, Fakulta managementu, katedra managementu informací, Jarošovská 1117/II, Jindřichův Hradec, ČR barto-ji@fm.vse.cz
Předpoklad o normalitě rozdělení je zamítnut, protože hodnota testovacího kritéria χ exp je vyšší než tabulkový 2
Na úloze ukážeme postup analýzy velkého výběru s odlehlými prvky pro určení typu rozdělení koncentrace kyseliny močové u 50 dárců krve. Jaká je míra polohy a rozptýlení uvedeného výběru? Z grafických diagnostik
Průzkumová analýza dat
Průzkumová analýza dat Proč zkoumat data? Základ průzkumové analýzy dat položil John Tukey ve svém díle Exploratory Data Analysis (odtud zkratka EDA). Často se stává, že data, se kterými pracujeme, se
STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky)
STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky) 1) Význam a využití statistiky v biologických vědách a veterinárním lékařství ) Rozdělení znaků (veličin) ve statistice 3) Základní a
UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 3. 11.
UNIVERZITA OBRANY Fakulta ekonomiky a managementu Aplikace STAT1 Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 Jiří Neubauer, Marek Sedlačík, Oldřich Kříž 3. 11. 2012 Popis a návod k použití aplikace
31. 3. 2014, Brno Hanuš Vavrčík Základy statistiky ve vědě
31. 3. 2014, Brno Hanuš Vavrčík Základy statistiky ve vědě Motto Statistika nuda je, má však cenné údaje. strana 3 Statistické charakteristiky Charakteristiky polohy jsou kolem ní seskupeny ostatní hodnoty
Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina
Testování hypotéz Analýza dat z dotazníkových šetření Kuranova Pavlina Statistická hypotéza Možné cíle výzkumu Srovnání účinnosti různých metod Srovnání výsledků různých skupin Tzn. prokázání rozdílů mezi
UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice
UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, 532 10 Pardubice 10. licenční studium chemometrie STATISTICKÉ ZPRACOVÁNÍ DAT Semestrální práce STATISTICKÁ
PRŮZKUMOVÁ ANALÝZA JEDNOROZMĚRNÝCH DAT Exploratory Data Analysis (EDA)
PRŮZKUMOVÁ ANALÝZA JEDNOROZMĚRNÝCH DAT Exploratory Data Analysis (EDA) Reprezentativní náhodný výběr: 1. Prvky výběru x i jsou vzájemně nezávislé. 2. Výběr je homogenní, tj. všechna x i jsou ze stejného
Testování statistických hypotéz
Testování statistických hypotéz Na základě náhodného výběru, který je reprezentativním vzorkem základního souboru (který přesně neznáme, k němuž se ale daná statistická hypotéza váže), potřebujeme ověřit,
Stručný úvod do testování statistických hypotéz
Stručný úvod do testování statistických hypotéz 1. Formulujeme hypotézu (předpokládáme, že pozorovaný jev je pouze náhodný). 2. Zvolíme hladinu významnosti testu a, tj. riziko, s nímž jsme ochotni se smířit.
Testy statistických hypotéz
Testy statistických hypotéz Statistická hypotéza je jakýkoliv předpoklad o rozdělení pravděpodobnosti jedné nebo několika náhodných veličin. Na základě náhodného výběru, který je reprezentativním vzorkem
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická
You created this PDF from an application that is not licensed to print to novapdf printer (http://www.novapdf.com)
Testování statistických hypotéz Testování statistických hypotéz Princip: Ověřování určitého předpokladu zjišťujeme, zda zkoumaný výběr pochází ze základního souboru, který má určité rozdělení zjišťujeme,
Charakteristika datového souboru
Zápočtová práce z předmětu Statistika Vypracoval: 10. 11. 2014 Charakteristika datového souboru Zadání: Při kontrole dodržování hygienických norem v kuchyni se prováděl odběr vzduchu a pomocí filtru Pallflex
Normální (Gaussovo) rozdělení
Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení popisuje vlastnosti náhodné spojité veličiny, která vzniká složením různých náhodných vlivů, které jsou navzájem nezávislé, kterých je velký
UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice
UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, 532 10 Pardubice 10. licenční studium chemometrie STATISTICKÉ ZPRACOVÁNÍ DAT Semestrální práce ANALÝZA
Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel
Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Statistickou hypotézou se rozumí určité tvrzení o parametrech rozdělení zkoumané náhodné veličiny (µ, σ 2, π,
VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky SMAD
VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky JMÉNO STUDENTKY/STUDENTA: OSOBNÍ ČÍSLO: JMÉNO CVIČÍCÍ/CVIČÍCÍHO: SMAD Cvičení Ostrava, AR 2016/2017 Popis datového souboru Pro dlouhodobý
4ST201 STATISTIKA CVIČENÍ Č. 7
4ST201 STATISTIKA CVIČENÍ Č. 7 testování hypotéz parametrické testy test hypotézy o střední hodnotě test hypotézy o relativní četnosti test o shodě středních hodnot testování hypotéz v MS Excel neparametrické
Statistická analýza jednorozměrných dat
Univerzita Pardubice Fakulta chemicko-technologická, Katedra analytické chemie Licenční studium GALILEO Interaktivní statistická analýza dat Semestrální práce z předmětu Statistická analýza jednorozměrných
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 2010 1.týden (20.09.-24.09. ) Data, typy dat, variabilita, frekvenční analýza
JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica
JEDNOVÝBĚROVÉ TESTY Komentované řešení pomocí programu Statistica Vstupní data Data umístěná v excelovském souboru překopírujeme do tabulky ve Statistice a pojmenujeme proměnné, viz prezentace k tématu
Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.
Testování statistických hypotéz Ing. Michal Dorda, Ph.D. Testování normality Př. : Při simulaci provozu na křižovatce byla získána data o mezerách mezi přijíždějícími vozidly v [s]. Otestujte na hladině
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 010 1.týden (0.09.-4.09. ) Data, typy dat, variabilita, frekvenční analýza
Dvouvýběrové a párové testy. Komentované řešení pomocí MS Excel
Dvouvýběrové a párové testy Komentované řešení pomocí MS Excel Úloha A) koncentrace glukózy v krvi V této části posoudíme pomocí párového testu, zda nový lék prokazatelně snižuje koncentraci glukózy v
ANOVA. Semestrální práce UNIVERZITA PARDUBICE. Fakulta chemicko-technologická Katedra analytické chemie
UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie ANOVA Semestrální práce Licenční studium Galileo Interaktivní statistická analýza dat Brno 2015 Ing. Petra Hlaváčková, Ph.D.
Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012. Tutoriál č. 4: Exploratorní analýza. Jan Kracík
Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012 Tutoriál č. 4: Exploratorní analýza Jan Kracík jan.kracik@vsb.cz Statistika věda o získávání znalostí z empirických dat empirická
PRAVDĚPODOBNOST A STATISTIKA
PRAVDĚPODOBNOST A STATISTIKA Definice lineárního normálního regresního modelu Lineární normální regresní model Y β ε Matice n,k je matice realizací. Předpoklad: n > k, h() k - tj. matice je plné hodnosti
VYUŽITÍ MATLAB WEB SERVERU PRO INTERNETOVOU VÝUKU ANALÝZY DAT A ŘÍZENÍ JAKOSTI
VYUŽITÍ MATLAB WEB SERVERU PRO INTERNETOVOU VÝUKU ANALÝZY DAT A ŘÍZENÍ JAKOSTI Aleš Linka 1, Petr Volf 2 1 Katedra textilních materiálů, FT TUL, 2 Katedra aplikované matematiky, FP TUL ABSTRAKT. Internetové
Úloha E301 Čistota vody v řece testem BSK 5 ( Statistická analýza jednorozměrných dat )
Úloha E301 Čistota vody v řece testem BSK 5 ( Statistická analýza jednorozměrných dat ) Zadání : Čistota vody v řece byla denně sledována v průběhu 10 dní dle biologické spotřeby kyslíku BSK 5. Jsou v
Zápočtová práce STATISTIKA I
Zápočtová práce STATISTIKA I Obsah: - úvodní stránka - charakteristika dat (původ dat, důvod zpracování,...) - výpis naměřených hodnot (v tabulce) - zpracování dat (buď bodové nebo intervalové, podle charakteru
Úvodem Dříve les než stromy 3 Operace s maticemi
Obsah 1 Úvodem 13 2 Dříve les než stromy 17 2.1 Nejednoznačnost terminologie 17 2.2 Volba metody analýzy dat 23 2.3 Přehled vybraných vícerozměrných metod 25 2.3.1 Metoda hlavních komponent 26 2.3.2 Faktorová
VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky
VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky PRAVDĚPODOBNOST A STATISTIKA Zadání 1 JMÉNO STUDENTKY/STUDENTA: OSOBNÍ ČÍSLO: JMÉNO CVIČÍCÍ/CVIČÍCÍHO: DATUM ODEVZDÁNÍ DOMÁCÍ ÚKOL
Normální (Gaussovo) rozdělení
Normální (Gaussovo) rozdělení f x = 1 2 exp x 2 2 2 f(x) je funkce hustoty pravděpodobnosti, symetrická vůči poloze maxima x = μ μ střední hodnota σ směrodatná odchylka (tzv. pološířka křivky mezi inflexními
Kvantily a písmenové hodnoty E E E E-02
Na úloze ukážeme postup průzkumové analýzy dat. Při výrobě calciferolu se provádí kontrola meziproduktu 3,5 DNB esteru calciferolu metodou HPLC. Sleduje se také obsah přítomného ergosterinu jako nečistoty,
UNIVERZITA PARDUBICE CHEMICKO-TECHNOLOGICKÁ FAKULTA KATEDRA ANALYTICKÉ CHEMIE
UNIVERZITA PARDUBICE CHEMICKO-TECHNOLOGICKÁ FAKULTA KATEDRA ANALYTICKÉ CHEMIE STATISTICKÁ ANALÝZA JEDNOROZMĚRNÝCH DAT V OSTRAVĚ 20.3.2006 MAREK MOČKOŘ PŘÍKLAD Č.1 : ANALÝZA VELKÝCH VÝBĚRŮ Zadání: Pro kontrolu
676 + 4 + 100 + 196 + 0 + 484 + 196 + 324 + 64 + 324 = = 2368
Příklad 1 Je třeba prověřit, zda lze na 5% hladině významnosti pokládat za prokázanou hypotézu, že střední doba výroby výlisku je 30 sekund. Přitom 10 náhodně vybraných výlisků bylo vyráběno celkem 540
Národníinformačnístředisko pro podporu jakosti
Národníinformačnístředisko pro podporu jakosti OVĚŘOVÁNÍ PŘEDPOKLADU NORMALITY Doc. Ing. Eva Jarošová, CSc. Ing. Jan Král Používané metody statistické testy: Chí-kvadrát test dobré shody Kolmogorov -Smirnov
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 2010 1.týden (20.09.-24.09. ) Data, typy dat, variabilita, frekvenční analýza
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 2010 1.týden (20.09.-24.09. ) Data, typy dat, variabilita, frekvenční analýza
Úloha 1: Lineární kalibrace
Úloha 1: Lineární kalibrace U pacientů s podezřením na rakovinu prostaty byl metodou GC/MS měřen obsah sarkosinu v moči. Pro kvantitativní stanovení bylo nutné změřit řadu kalibračních roztoků o různé
Jednofaktorová analýza rozptylu
Jednofaktorová analýza rozptylu David Hampel Ústav statistiky a operačního výzkumu, Mendelova univerzita v Brně Kurz pokročilých statistických metod Global Change Research Centre AS CR, 5 7 8 2015 Tato
Neparametrické metody
Neparametrické metody Dosud jsme se zabývali statistickými metodami, které zahrnovaly předpoklady o rozdělení dat. Zpravidla jsme předpokládali normální rozdělení. Např. Grubbsův test odlehlých hodnot
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 2010 1.týden (20.09.-24.09. ) Data, typy dat, variabilita, frekvenční analýza
Statistika. Testování hypotéz - statistická indukce Parametrické testy. Roman Biskup
Statistika Testování hypotéz - statistická indukce Parametrické testy Roman Biskup (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at)email.cz 1. února 01 Statistika by Birom
Statistické vyhodnocení průzkumu funkční gramotnosti žáků 4. ročníku ZŠ
Statistické vyhodnocení průzkumu funkční gramotnosti žáků 4. ročníku ZŠ Ing. Dana Trávníčková, PaedDr. Jana Isteníková Funkční gramotnost je používání čtení a psaní v životních situacích. Nejde jen o elementární
VŠB Technická univerzita Ostrava BIOSTATISTIKA
VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky JMÉNO STUDENTKY/STUDENTA: OSOBNÍ ČÍSLO: JMÉNO CVIČÍCÍ/CVIČÍCÍHO: BIOSTATISTIKA Domácí úkoly Zadání 5 DATUM ODEVZDÁNÍ DOMÁCÍ ÚKOL 1:
Porovnání dvou výběrů
Porovnání dvou výběrů Menu: QCExpert Porovnání dvou výběrů Tento modul je určen pro podrobnou analýzu dvou datových souborů (výběrů). Modul poskytuje dva postupy analýzy: porovnání dvou nezávislých výběrů
Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie STATISTICKÉ ZPRACOVÁNÍ EXPERIMENTÁLNÍCH DAT
Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie STATISTICKÉ ZPRACOVÁNÍ EXPERIMENTÁLNÍCH DAT STATISTICKÁ ANALÝZA JEDNOROZMĚRNÝCH DAT Seminární práce 1 Brno, 2002 Ing. Pavel
Stanovení manganu a míry přesnosti kalibrace ( Lineární kalibrace )
Příklad č. 1 Stanovení manganu a míry přesnosti kalibrace ( Lineární kalibrace ) Zadání : Stanovení manganu ve vodách se provádí oxidací jodistanem v kyselém prostředí až na manganistan. (1) Sestrojte
ZNALOSTI A DOVEDNOSTI ČESKÝCH MUŽŮ V OBLASTI INFORMAČNÍ BEZPEČNOSTI - VÝSLEDKY STATISTICKÉ ANALÝZY
ZNALOSTI A DOVEDNOSTI ČESKÝCH MUŽŮ V OBLASTI INFORMAČNÍ BEZPEČNOSTI - VÝSLEDKY STATISTICKÉ ANALÝZY Knowledge and skills of Czech men in the field of information security - the results of statistical analysis
Pojem a úkoly statistiky
Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Pojem a úkoly statistiky Statistika je věda, která se zabývá získáváním, zpracováním a analýzou dat pro potřeby
1. Přednáška. Ing. Miroslav Šulai, MBA
N_OFI_2 1. Přednáška Počet pravděpodobnosti Statistický aparát používaný ve financích Ing. Miroslav Šulai, MBA 1 Počet pravděpodobnosti -náhodné veličiny 2 Počet pravděpodobnosti -náhodné veličiny 3 Jevy
Statistická analýza jednorozměrných dat
Statistická analýza jednorozměrných dat Prof. RNDr. Milan Meloun, DrSc. Univerzita Pardubice, Pardubice 31.ledna 2011 Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem
Statistická analýza jednorozměrných dat
Statistická analýza jednorozměrných dat Prof. RNDr. Milan Meloun, DrSc. Univerzita Pardubice, Pardubice 31.ledna 2011 Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem
IDENTIFIKACE BIMODALITY V DATECH
IDETIFIKACE BIMODALITY V DATECH Jiří Militky Technická universita v Liberci e- mail: jiri.miliky@vslib.cz Milan Meloun Universita Pardubice, Pardubice Motto: Je normální předpokládat normální data? Zvláštnosti
Plánování experimentu
Fakulta chemicko technologická Katedra analytické chemie licenční studium Management systému jakosti Autor: Ing. Radek Růčka Přednášející: Prof. Ing. Jiří Militký, CSc. 1. LEPTÁNÍ PLAZMOU 1.1 Zadání Proces
VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ. FAKULTA STROJNÍHO INŽENÝRSTVÍ Ústav materiálového inženýrství - odbor slévárenství
1 PŘÍLOHA KE KAPITOLE 11 2 Seznam příloh ke kapitole 11 Podkapitola 11.2. Přilité tyče: Graf 1 Graf 2 Graf 3 Graf 4 Graf 5 Graf 6 Graf 7 Graf 8 Graf 9 Graf 1 Graf 11 Rychlost šíření ultrazvuku vs. pořadí
MĚŘENÍ STATISTICKÝCH ZÁVISLOSTÍ
MĚŘENÍ STATISTICKÝCH ZÁVISLOSTÍ v praxi u jednoho prvku souboru se často zkoumá více veličin, které mohou na sobě různě záviset jednorozměrný výběrový soubor VSS X vícerozměrným výběrovým souborem VSS
Tomáš Karel LS 2012/2013
Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není
UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie
UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Licenční studium Pythagoras Statistické zpracování experimentálních dat Semestrální práce ANOVA vypracoval: Ing. David Dušek
EKONOMETRIE 7. přednáška Fáze ekonometrické analýzy
EKONOMETRIE 7. přednáška Fáze ekonometrické analýzy Ekonometrická analýza proces, skládající se z následujících fází: a) specifikace b) kvantifikace c) verifikace d) aplikace Postupné zpřesňování jednotlivých
Tabulka 1. Výběr z datové tabulky
1. Zadání domácího úkolu Vyberte si datový soubor obsahující alespoň jednu kvalitativní a jednu kvantitativní proměnnou s alespoň 30 statistickými jednotkami (alespoň 30 jednotlivých údajů). Zdroje dat
Statistická analýza. jednorozměrných dat
Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie icenční studium chemometrie Statistické zpracování dat Statistická analýza jednorozměrných dat Zdravotní ústav se sídlem v
VYBRANÉ DVOUVÝBĚROVÉ TESTY. Martina Litschmannová
VYBRANÉ DVOUVÝBĚROVÉ TESTY Martina Litschmannová Obsah přednášky Vybrané dvouvýběrové testy par. hypotéz test o shodě rozptylů (F-test), testy o shodě středních hodnot (t-test, Aspinové-Welchův test),
Technická univerzita v Liberci
Technická univerzita v Liberci Ekonomická fakulta Analýza výsledků z dotazníkového šetření Jména studentů: Adam Pavlíček Michal Karlas Tomáš Vávra Anna Votavová Ročník: 2015/2016 Datum odevzdání: 13/05/2016
Dva případy chybného rozhodnutí při testování: a) Testační statistika padne mimo obor přijetí nulové H hypotézy O, tj.
Uvedeme obecný postup statistického testování:. Formulace nulové H 0a alternativní hpotéz H A.. Volba hladin významnosti α.. Volba testační statistik např... Určení kritického oboru testové charakteristik.
ANALÝZA DAT V R 3. POPISNÉ STATISTIKY, NÁHODNÁ VELIČINA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK
ANALÝZA DAT V R 3. POPISNÉ STATISTIKY, NÁHODNÁ VELIČINA Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK www.biostatisticka.cz POPISNÉ STATISTIKY - OPAKOVÁNÍ jedna kvalitativní
MATEMATICKO STATISTICKÉ PARAMETRY ANALYTICKÝCH VÝSLEDKŮ
MATEMATICKO STATISTICKÉ PARAMETRY ANALYTICKÝCH VÝSLEDKŮ Má-li analytický výsledek objektivně vypovídat o chemickém složení vzorku, musí splňovat určitá kriteria: Mezinárodní metrologický slovník (VIM 3),
ZNALOSTI A DOVEDNOSTI ČESKÝCH ŽEN V OBLASTI INFORMAČNÍ BEZPEČNOSTI - VÝSLEDKY STATISTICKÉ ANALÝZY
ZNALOSTI A DOVEDNOSTI ČESKÝCH ŽEN V OBLASTI INFORMAČNÍ BEZPEČNOSTI - VÝSLEDKY STATISTICKÉ ANALÝZY Knowledge and skills of Czech women in the field of information security - the results of statistical analysis
Návrh a vyhodnocení experimentu
Návrh a vyhodnocení experimentu Návrh a vyhodnocení experimentů v procesech vývoje a řízení kvality vozidel Ing. Bohumil Kovář, Ph.D. FD ČVUT Ústav aplikované matematiky kovar@utia.cas.cz Mladá Boleslav
Závislost obsahu lipoproteinu v krevním séru na třech faktorech ( Lineární regresní modely )
Úloha M608 Závislost obsahu lipoproteinu v krevním séru na třech faktorech ( Lineární regresní modely ) Zadání : Při kvantitativní analýze lidského krevního séra ovlivňují hodnotu obsahu vysokohustotního
Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D.
Problematika analýzy rozptylu Ing. Michael Rost, Ph.D. Úvod do problému Již umíte testovat shodu dvou středních hodnot prostřednictvím t-testů. Otázka: Jaké předpoklady musí být splněny, abyste mohli použít
Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1
Logistická regrese Menu: QCExpert Regrese Logistická Modul Logistická regrese umožňuje analýzu dat, kdy odezva je binární, nebo frekvenční veličina vyjádřená hodnotami 0 nebo 1, případně poměry v intervalu
Vzorová prezentace do předmětu Statistika
Vzorová prezentace do předmětu Statistika Popis situace: U 3 náhodně vybraných osob byly zjišťovány hodnoty těchto proměnných: SEX - muž, žena PUVOD Skandinávie, Středomoří, 3 západní Evropa IQ hodnota
TLOUŠŤKOVÁ A VÝŠKOVÁ STRUKTURA A JEJÍ MODELOVÁNÍ
TLOUŠŤKOVÁ A VÝŠKOVÁ STRUKTURA A JEJÍ MODELOVÁNÍ 1 Vlastnosti tloušťkové struktury porostu tloušťky mají vyšší variabilitu než výšky světlomilné dřeviny mají křivku početností tlouštěk špičatější a s menší
1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.
Prostá regresní a korelační analýza 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Problematika závislosti V podstatě lze rozlišovat mezi závislostí nepodstatnou, čili náhodnou
KGG/STG Statistika pro geografy
KGG/STG Statistika pro geografy 5. Odhady parametrů základního souboru Mgr. David Fiedor 16. března 2015 Vztahy mezi výběrovým a základním souborem Osnova 1 Úvod, pojmy Vztahy mezi výběrovým a základním
Zaokrouhlování: Směrodatná odchylka se zaokrouhluje nahoru na stanovený počet platných cifer. Míry
Červenou barvou jsou poznámky, věci na které máte při vypracovávání úkolu myslet. Úkol 1 a) Pomocí nástrojů explorační analýzy analyzujte kapacity akumulátorů výrobce A po 5 a po 100 nabíjecích cyklech.
Chyby měření 210DPSM
Chyby měření 210DPSM Jan Zatloukal Stručný přehled Zdroje a druhy chyb Systematické chyby měření Náhodné chyby měření Spojité a diskrétní náhodné veličiny Normální rozdělení a jeho vlastnosti Odhad parametrů
Statistika. Teorie odhadu statistická indukce. Roman Biskup. (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at) .
Statistika Teorie odhadu statistická indukce Intervalový odhad µ, σ 2 a π Roman Biskup (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at)email.cz 21. února 2012 Statistika
Náhodná proměnná. Náhodná proměnná může mít rozdělení diskrétní (x 1. , x 2. ; x 2. spojité (<x 1
Náhodná proměnná Náhodná proměnná může mít rozdělení diskrétní (x 1, x 2,,x n ) spojité () Poznámky: 1. Fyzikální veličiny jsou zpravidla spojité, ale změřené hodnoty jsou diskrétní. 2. Pokud
VÝVOJ INDEXŮ SPOTŘEBITELSKÝCH CEN
ČESKÁ ZEMĚDĚLSKÁ UNIVERZITA V PRAZE Fakulta provozně ekonomická Katedra statistiky Studijní obor: Veřejná správa a regionální rozvoj Teze k diplomové práci VÝVOJ INDEXŮ SPOTŘEBITELSKÝCH CEN Vypracovala:
y = 0, ,19716x.
Grafické ověřování a testování vybraných modelů 1 Grafické ověřování empirického rozdělení Při grafické analýze empirického rozdělení vycházíme z empirické distribuční funkce F n (x) příslušné k náhodnému
POPISNÁ STATISTIKA Komentované řešení pomocí programu Statistica
POPISNÁ STATISTIKA Komentované řešení pomocí programu Statistica Program Statistica I Statistica je velmi podobná Excelu. Na základní úrovni je to klikací program určený ke statistickému zpracování dat.
Univerzita Pardubice. Fakulta chemicko-technologická Katedra analytické chemie. Licenční studium Statistické zpracování dat
Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie Licenční studium Statistické zpracování dat Semestrální práce Interpolace, aproximace a spline 2007 Jindřich Freisleben Obsah
Analýza rozptylu ANOVA
Licenční studium Galileo: Statistické zpracování dat ANOVA ANOVA B ANOVA P Analýza rozptylu ANOVA Semestrální práce Lenka Husáková Pardubice 05 Obsah Jednofaktorová ANOVA... 3. Zadání... 3. Data... 3.3
MÍRY ZÁVISLOSTI (KORELACE A REGRESE)
zhanel@fsps.muni.cz MÍRY ZÁVISLOSTI (KORELACE A REGRESE) 2.5 MÍRY ZÁVISLOSTI 2.5.1 ZÁVISLOST PEVNÁ, VOLNÁ, STATISTICKÁ A KORELAČNÍ Jednorozměrné soubory - charakterizovány jednotlivými statistickými znaky
letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika
Šárka Hudecová Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy letní semestr 2012 Opakování t- vs. neparametrické Wilcoxonův jednovýběrový test Opakování
Neparametrické testy
Neparametrické testy Dosud jsme se zabývali statistickými metodami, které zahrnovaly předpoklady o rozdělení dat. Zpravidla jsme předpokládali normální (Gaussovo) rozdělení. Například: Grubbsův test odlehlých
S E M E S T R Á L N Í
Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie S E M E S T R Á L N Í P R Á C E Licenční studium Statistické zpracování dat při managementu jakosti Předmět ANOVA analýza rozptylu
PRAVDĚPODOBNOST A STATISTIKA
PRAVDĚPODOBNOST A STATISTIKA Definice lineárního normálního regresního modelu Lineární normální regresní model Y Xβ ε Předpoklady: Matice X X n,k je matice realizací. Předpoklad: n > k, h(x) k - tj. matice
Národní informační středisko pro podporu kvality
Národní informační středisko pro podporu kvality STATISTICKÁ REGULACE POMOCÍ VÝBĚROVÝCH PRŮMĚRŮ Z NENORMÁLNĚ ROZDĚLENÝCH DAT Ing. Jan Král, RNDr. Jiří Michálek, CSc., Ing. Josef Křepela Duben, 20 Co je
Statistika. Regresní a korelační analýza Úvod do problému. Roman Biskup
Statistika Regresní a korelační analýza Úvod do problému Roman Biskup Jihočeská univerzita v Českých Budějovicích Ekonomická fakulta (Zemědělská fakulta) Katedra aplikované matematiky a informatiky 2008/2009
1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.
Testy hypotéz na základě více než 2 výběrů 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Testy hypotéz na základě více než 2 výběrů Na analýzu rozptylu lze pohlížet v podstatě
UNIVERZITA PARDUBICE
UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Vedoucí studia a odborný garant: Prof. RNDr. Milan Meloun, DrSc. Vyučující: Prof. RNDr. Milan Meloun, DrSc. Autor práce: ANDRII
Název testu Předpoklady testu Testová statistika Nulové rozdělení. ( ) (p počet odhadovaných parametrů)
VYBRANÉ TESTY NEPARAMETRICKÝCH HYPOTÉZ TESTY DOBRÉ SHODY Název testu Předpoklady testu Testová statistika Nulové rozdělení test dobré shody Očekávané četnosti, alespoň 80% očekávaných četností >5 ( ) (p
Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium chemometrie
Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium chemometrie Statistické zpracování dat ANOVA Zdravotní ústav se sídlem v Ostravě Odbor hygienických laboratoří