MĚŘENÍ PODOBNOSTI OBJEKTŮ A SHLUKŮ PŘI SHLUKOVÉ ANALÝZE S KVALITATIVNÍMI PROMĚNNÝMI A PROMĚNNÝMI RŮZNÝCH TYPŮ
|
|
- Magdalena Žáková
- před 7 lety
- Počet zobrazení:
Transkript
1 MĚŘENÍ PODOBNOSTI OBJEKTŮ A SLUKŮ PŘI SLUKOVÉ ANALÝZE S KVALITATIVNÍMI PROMĚNNÝMI A PROMĚNNÝMI RŮZNÝC TYPŮ Toáš Löster Abstrakt Sluková analýza je vícerozěrná statistická etoda, jejíž cíle je vytvářet nožiny objektů, tzv. sluky, v ráci kterýc by si objekty (vícerozěrná pozorování carakterizovaná řadou vlastností) ěly být co nejvíce podobné z lediska vnitroslukové struktury a co nejéně podobné z lediska ezislukové struktury. Slukovat lze také proěnné, případně kategorie noinálníc proěnnýc, případně objekty i proěnné současně. Sluková analýza je využívána v řadě vědníc oborů, j. v deografii. Klíčovou úlou ve slukové analýze zaujíá stanovení podobnosti objektů, přičež je potřeba rozlišit, jakýi typy proěnnýc jsou vlastnosti jednotlivýc objektů carakterizovány. Moou to být proěnné kvantitativní, kvalitativní (noinální nebo ordinální), nebo proěnné různýc typů (kobinace kvantitativníc a kvalitativníc proěnnýc). Cíle tooto příspěvku je popsat ožnosti ěření podobnosti objektů a sluků v případě, jsou-li objekty carakterizovány proěnnýi různýc typů. Klíčová slova: Sluková analýza, podobnost objektů, podobnost sluků JEL Code: C3, C38, C40 Úvod Klíčovou úlou ve slukové analýze zaujíá stanovení podobnosti objektů a sluků, přičež je potřeba rozlišit, jakýi typy proěnnýc jsou vlastnosti jednotlivýc objektů carakterizovány. Moou to být proěnné kvantitativní, kvalitativní (noinální nebo ordinální), nebo proěnné různýc typů. Zvláštní případe jsou dicotoické proěnné, které nabývají pouze dvou odnot. Obvykle jsou to odnoty 0 a a proěnné se označují jako binární. V případě, že jsou objekty carakterizovány pouze kvantitativníi proěnnýi, v současné literatuře existuje noo koeficientů, které vycází předevší z ěr vzdáleností, viz např. []. Mezi tyto íry patří například Euklidovská či Manattanská vzdálenost.
2 Měření podobnosti objektů V případě, že jsou objekty carakterizovány poocí proěnnýc různýc typů, pak je při ěření podobnosti dvou objektů využíván Gowerův koeficient podobnosti, viz [4], který je definován jako w A t = AGW =, () w t = kde w nabývá odnot 0 (jestliže odnota t-té proěnné u i-téo nebo j-téo objektu cybí nebo jsou obě tyto odnoty rovny nule a t-tá proěnná je binární), nebo (v ostatníc případec). Míra podobnosti A závisí na typu t-té proěnné. V případě, že t-tá proěnná je binární nebo noinální, pak A = pro x it = x jt, () A = 0 jinak. (3) V případě, že t-tá proěnná je kvantitativní pak xit x jt A = Rt, (4) kde R t je variační rozpětí t-té proěnné určené na základě celéo souboru. Dva objekty jsou si nejpodobnější v případě, že sluk z nic vytvořený vykazuje nejenší variabilitu. K ěření variability lze použít rozptyl v kobinaci s entropií. Variabilitu -téo sluku lze stanovit podle vzorce + st ) + t, (5) kde je počet kvantitativníc (spojitýc) proěnnýc, je počet noinálníc proěnnýc, s t je vyběrový rozptyl t-té proěnné a s t je výběrový rozptyl t-té proěnné v -té sluku, kde íra variability noinální proěnné pro t-tou proěnnou v -té sluku se určí jako t = K t u= n n tu n tu ln, (6) n
3 kde K t je počet kategorií t-té proěnné, je n tu je počet objektů u-té kategorie, t-té proěnné v -té sluku a n je počet objektů v -té sluku. Tento postup je využit ve dvoukrokové slukové analýze v systéu SPSS. Ta je navržena pro slukování velkéo počtu objektů a je založena na algoritu BIRC, v něž jsou objekty uspořádány do podsluků, které jsou carakterizovány poocí slukovacíc vlastností, viz [5]. V případě, že jsou objekty carakterizovány poocí kobinace kvantitativníc a noinálníc proěnnýc, je ožné navrnout íru variability s využití rozptylu a odnot Ginio koeficientu, tedy podle vzorce G + st ) + Gt. (7) Dále pro případ, kdy jsou objekty carakterizovány kvantitativníi a ordinálníi proěnnýi, je navíc ožné navrnout íru variability s využití rozptylu a koeficientu dorvar. Vypočítá se podle vzorce + st ) DK + DK. (8) Pokud by objekty byly carakterizovány pouze kvalitativníi proěnnýi, ze všec výše uvedenýc vzorců by byla vypuštěna ta část, která ěří variabilitu kvantitativníc proěnnýc, tj. výběrový rozptyl. Měření podobnosti sluků t Podobnost sluků se zjišťuje například u agloerativnío ierarcickéo slukování při postupné spojování nejpodobnějšíc sluků pro vytváření enšío počtu sluků. Mezi koeficienty, které vyjadřují vzájený vzta ezi objekty a sluky v případě, že jsou objekty carakterizované proěnnýi různýc typů, je ožné zařadit věroodnostní íru. Tato íra je využívána ve spojení s dvoukrokovou slukovou analýzou v systéu SPSS. Při ěření vzdálenosti D dvou sluků C a C, které jsou carakterizovány současně poocí kvantitativníc a noinálníc proěnnýc, se v toto případě využívá entropie v kobinaci s výběrový rozptyle a postupuje se tak, že se od odnoty variability sluku vznikléo
4 spojení dvou sluků tj. odečte součet odnot variabilit těcto dvou saostatnýc sluků, D ( C, C ) = ( + ). (9) VM V případě, že jsou objekty carakterizovány současně poocí kvantitativníc a noinálníc proěnnýc je ožné navrnout alternativu k postupu (9), tj. ěřit variabilitu poocí kobinace Ginio koeficientu a výběrovéo rozptylu, a tedy postupovat podle vztau D ( C, C ) = G ( G + G ). (0) VMG V případě, že jsou objekty carakterizovány současně poocí kvantitativníc a ordinálníc proěnnýc je ožné analogicky navrnout ěření variability poocí kobinace koeficientu dorvar a výběrovéo rozptylu, tj. postupovat podle vztau D ( C, C ) = DK ( DK + DK ). () VDK Závěr Při vyjadřování podobnosti objektů pro případ, že jsou objekty carakterizovány pouze kvantitativníi proěnnýi existuje v současné literatuře řada ěr. Pro případ, že jsou objekty carakterizovány víceodnotovýi kvalitativníi proěnnýi, existují k ěření podobnosti pouze oezené ožnosti. Vycází se z yšlenky, že dva objekty jsou si nejpodobnější, pokud sluk z nic vytvořený á nejenší variabilitu. K jejíu ěření se v praxi využívá entropie. Nově navržený způsobe je ěřit variabilitu poocí Ginio koeficientu (v případě noinálníc proěnnýc) či poocí koeficientu dorvar, založenéo na kuulativníc relativníc četnostec (v případě ordinálníc proěnnýc). I v případě, že jsou objekty carakterizovány proěnnýi různýc typů, se vycází z yšlenky, že dva objekty jsou si nejpodobnější, pokud sluk z nic vytvořený á nejenší variabilitu. K ěření variability se v praxi používá výběrový rozptyl v kobinaci s entropií. Nový návre je použít pro ěření variability rozptyl v kobinaci s odnotou Ginio koeficientu či odnotou koeficientu dorvar. Při vyjadřování podobnosti sluků obsaující objekty, které jsou carakterizované kvalitativníi proěnnýi, se postupuje tak, že se od odnoty variability sluku vznikléo spojení dvou sluků odečte součet odnot variabilit těcto dvou saostatnýc sluků. V praxi se k tou využívá entropie. Nový návre ěření variability sluků je použití také odnot Ginio koeficientu. Při vyjadřování podobnosti sluků obsaující objekty, které jsou
5 carakterizované proěnnýi různýc typů, se také postupuje tak, že se od odnoty variability sluku vznikléo spojení dvou sluků odečte součet odnot variabilit těcto dvou saostatnýc sluků. V praxi je variabilita sluků odnocena poocí ěr s využití výběrovéo rozptylu a entropie. Nový návre je použít pro ěření variability sluků také kobinaci výběrovéo rozptylu a Ginio koeficientu pro noinální porěnné. Při praktickýc úloác se na vybranýc souborec ukázalo, že použití Ginnio koeficientu při slukování je vodnější, než v praxi používaná entropie, viz [4]. Literatura [] GAN, G., MA C., WU J.: Data Clustering Teory, Algorits, and Applications, ASA, Piladelpia, 007. [] ALKIDI, M., BATISTAKIS, Y., VAZIRGIANNIS, M.: Clustering algorits and validity easures. SSDBM, Atens, 00. [3] ŘEÁK, J., ŘEÁKOVÁ, B.: Analýza kategorizovanýc dat v sociologii, Acadeia, Praa, 986. [4] ŘEZANKOVÁ,., ÚSEK, D., LÖSTER, R.: Clustering wit Mixed Type Variables and Deterination of Cluster Nubers, CNAM and INRIA, Paříž, 00, s [5] ŘEZANKOVÁ,., ÚSEK, D., SNÁŠEL, V.: Sluková analýza dat,. vydání, Professional Publising, Praa, 009. [6] ŘEZANKOVÁ,., ÚSEK, D.: Metods for te deterination of te nuber of clusters in statistical software packages, VŠE KSTP; VŠE KMIE, Praa, 008, s. -6. [7] ŘEZANKOVÁ,., LÖSTER, T., ÚSEK, D.: Evaluation of Categorical Data Clustering. Fribourg In: Advances in Intelligent Web Mastering 3. Berlin : Springer Verlag, 0, s Kontakt Toáš Löster, Ing., P. D. Katedra statistiky a pravděpodobnosti Fakulta inforatiky a statistiky Vysoká škola ekonoická v Praze Ná. W. Curcilla 4, Praa 3 Česká republika Tel.: E-ail: toas.loster@vse.cz
Určení geometrických a fyzikálních parametrů čočky
C Určení geoetrickýc a yzikálníc paraetrů čočky Úkoly :. Určete poloěry křivosti ploc čočky poocí séroetru. Zěřte tloušťku čočky poocí digitálnío posuvnéo ěřítka 3. Zěřte oniskovou vzdálenost spojné čočky
VíceZáklady popisné statistiky. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek
Základy popisné statistiky Anotace Realitu můžeme popisovat různými typy dat, každý z nich se specifickými vlastnostmi, výhodami, nevýhodami a vlastní sadou využitelných statistických metod -od binárních
VíceMATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci
MATEMATICKÁ STATISTIKA Dana Černá http://www.fp.tul.cz/kmd/ Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci Matematická statistika Matematická statistika se zabývá matematickým
Více2. Sestrojte graf závislosti prodloužení pružiny na působící síle y = i(f )
1 Pracovní úkoly 1. Zěřte tuost k pěti pružin etodou statickou. 2. Sestrojte raf závislosti prodloužení pružiny na působící síle y = i(f ) 3. Zěřte tuost k pěti pružin etodou dynaickou. 4. Z doby kitu
Více2. Základní typy dat Spojitá a kategoriální data Základní popisné statistiky Frekvenční tabulky Grafický popis dat
2. Základní typy dat Spojitá a kategoriální data Základní popisné statistiky Frekvenční tabulky Grafický popis dat Anotace Realitu můžeme popisovat různými typy dat, každý z nich se specifickými vlastnostmi,
VíceShluková analýza dat a stanovení počtu shluků
Shluková analýza dat a stanovení počtu shluků Autor: Tomáš Löster Vysoká škola ekonomická v Praze Ostrava, červen 2017 Osnova prezentace Úvod a teorie shlukové analýzy Podrobný popis shlukování na příkladu
VíceMnohorozměrná statistická data
Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Statistický znak, statistický soubor Jednotlivé objekty nebo subjekty, které jsou při statistickém
VíceROBUSTNÍ ŘÍZENÍ DVOUROZMĚROVÉ SOUSTAVY ROBUST CONTROL OF TWO INPUTS -TWO OUTPUTS SYSTEM
ROBUTNÍ ŘÍZENÍ DVOUROZMĚROVÉ OUTAVY ROBUT CONTROL OF TWO INPUT -TWO OUTPUT YTEM Jiří Macháček Anotace: Návrh decentralizovaných regulátorů je založen na podínkách robustní stability a robustní kvality
VícePopisná statistika kvantitativní veličiny
StatSoft Popisná statistika kvantitativní veličiny Protože nám surová data obvykle žádnou smysluplnou informaci neposkytnou, je žádoucí vyjádřit tyto ve zhuštěnější formě. V předchozím dílu jsme začali
VíceObsah. Statistika Zpracování informací ze statistického šetření Charakteristiky úrovně, variability a koncentrace kvantitativního znaku
Obsah Statistika Zpracování informací ze statistického šetření Charakteristiky úrovně, variability a koncentrace kvantitativního znaku Roman Biskup (zapálený) statistik ve výslužbě, aktuálně analytik v
VíceZÁKLADNÍ STATISTICKÉ CHARAKTERISTIKY
zhanel@fsps.muni.cz ZÁKLADNÍ STATISTICKÉ CHARAKTERISTIKY METODY DESKRIPTIVNÍ STATISTIKY 1. URČENÍ TYPU ŠKÁLY (nominální, ordinální, metrické) a) nominální + ordinální neparametrické stat. metody b) metrické
VíceStatistika pro geografy
Statistika pro geografy 2. Popisná statistika Mgr. David Fiedor 23. února 2015 Osnova 1 2 3 Pojmy - Bodové rozdělení četností Absolutní četnost Absolutní četností hodnoty x j znaku x rozumíme počet statistických
VíceNCCI: Zjednodušené přístupy ke stanovení ekvivalentních vodorovných sil pro globální analýzu vyztužených a nevyztužených rámů
NCCI: Zjednodušené přístupy ke stanovení ekvivalentníc vodorovnýc sil pro globální analýzu vyztuženýc a nevyztuženýc ráů Tento NCCI předkládá zjednodušený bezpečný přístup k použití ekvivalentníc vodorovnýc
VíceTestování hypotéz o parametrech regresního modelu
Testování hypotéz o parametrech regresního modelu Ekonometrie Jiří Neubauer Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra UO
VíceTomáš Karel LS 2012/2013
Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení ze 4ST201. Na případné faktické chyby v této prezentaci mě prosím upozorněte. Děkuji Tyto slidy berte pouze jako doplňkový materiál není v nich obsaženo
VíceVliv marketingového dotazování na identifikaci tržních segmentů
Vliv aretingového dotazování na identifiaci tržních segentů Jední z líčových fatorů stanovení optiální aretingové strategie e správně provedená identifiace a následné vyezení tržních segentů cílového trhu.
VíceCharakteristika datového souboru
Zápočtová práce z předmětu Statistika Vypracoval: 10. 11. 2014 Charakteristika datového souboru Zadání: Při kontrole dodržování hygienických norem v kuchyni se prováděl odběr vzduchu a pomocí filtru Pallflex
VíceMnohorozměrná statistická data
Mnohorozměrná statistická data Ekonometrie Jiří Neubauer Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra ekonometrie UO Brno) Mnohorozměrná
VíceČíselné charakteristiky
. Číselné charakteristiky statistických dat Průměrný statistik se během svého života ožení s 1,75 ženami, které se ho snaží vytáhnout večer do společnosti,5 x týdně, ale pouze s 50% úspěchem. W. F. Miksch
VíceČíselné charakteristiky a jejich výpočet
Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz charakteristiky polohy charakteristiky variability charakteristiky koncetrace charakteristiky polohy charakteristiky
VíceTestování hypotéz o parametrech regresního modelu
Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Lineární regresní model kde Y = Xβ + e, y 1 e 1 β y 2 Y =., e = e 2 x 11 x 1 1k., X =....... β 2,
VíceMatematika III. 27. listopadu Vysoká škola báňská - Technická univerzita Ostrava. Matematika III
Vysoká škola báňská - Technická univerzita Ostrava 27. listopadu 2017 Typy statistických znaků (proměnných) Typy proměnných: Kvalitativní proměnná (kategoriální, slovní,... ) Kvantitativní proměnná (numerická,
VícePopisná statistika. Jaroslav MAREK. Univerzita Palackého
Popisná statistika Jaroslav MAREK Univerzita Palackého Přírodovědecká fakulta Katedra matematické analýzy a aplikací matematiky Tomkova 40, 779 00 Olomouc Hejčín tel. 585634606 marek@inf.upol.cz pondělí
Vícebyly přejaty do soustavy českých technických
Č S N E N 1 9 9 1-1 - 3 E u r o k ó d 1 : Z a t í ž e n í k o n s t r u k c í Č á s t 1-3 : O b e c n á z a t í ž e n í Z a t í ž e n í s n ě e m a Z m ě n a Z 3 Č S N 7 3 0 0 3 5 Z a t í ž e n í s t a
Více5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza
5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza 5.1 Vícerozměrná data a vícerozměrná rozdělení Při zpracování vícerozměrných dat se hledají souvislosti mezi dvěma, případně
VícePopisná statistika. Statistika pro sociology
Popisná statistika Jitka Kühnová Statistika pro sociology 24. září 2014 Jitka Kühnová (GSTAT) Popisná statistika 24. září 2014 1 / 31 Outline 1 Základní pojmy 2 Typy statistických dat 3 Výběrové charakteristiky
VíceKapitola 9. Numerické derivování
Kapitola 9 Numerické derivování Definice: Existuje-li pro danou funkci f : R! R vlastní (tj konečná) limita říkáme, že funkce f(x) má v bodě a derivaci Příslušnou limitu značíme f 0 (a) f(a + ) f(a) lim!0
VíceZpracování náhodného výběru. Ing. Michal Dorda, Ph.D.
Zpracování náhodného výběru popisná statistika Ing. Michal Dorda, Ph.D. Základní pojmy Úkolem statistiky je na základě vlastností výběrového souboru usuzovat o vlastnostech celé populace. Populace(základní
VíceFinanční management. Nejefektivnější portfolio (leží na hranici) dle Markowitze: Přímka kapitálového trhu
Finanční anageent Příka kapitálového trhu, odel CAPM, systeatické a nesysteatické riziko Příka kapitálového trhu Čí vyšší e sklon křivky, tí vyšší e nechuť investora riskovat. očekávaný výnos Množina všech
VíceRenáta Bednárová STATISTIKA PRO EKONOMY
Renáta Bednárová STATISTIKA PRO EKONOMY ZÁKLADNÍ STATISTICKÉ POJMY Statistika Statistický soubor Statistická jednotky Statistický znak STATISTIKA Vědní obor, který se zabývá hromadnými jevy Hromadné jevy
Více31. 3. 2014, Brno Hanuš Vavrčík Základy statistiky ve vědě
31. 3. 2014, Brno Hanuš Vavrčík Základy statistiky ve vědě Motto Statistika nuda je, má však cenné údaje. strana 3 Statistické charakteristiky Charakteristiky polohy jsou kolem ní seskupeny ostatní hodnoty
VíceMĚŘENÍ, TYPY VELIČIN a TYPY ŠKÁL
MĚŘENÍ, TYPY VELIČIN a TYPY ŠKÁL Matematika a stejně i matematická statistika a biometrie s námi hovoří řečí čísel. Musíme tedy vlastnosti nebo intenzitu vlastností jedinců změřit kvantifikovat. Měřením
Víceveličin, deskriptivní statistika Ing. Michael Rost, Ph.D.
Vybraná rozdělení spojitých náhodných veličin, deskriptivní statistika Ing. Michael Rost, Ph.D. Třídění Základním zpracováním dat je jejich třídění. Jde o uspořádání získaných dat, kde volba třídícího
VíceStatistika. Diskrétní data. Spojitá data. Charakteristiky polohy. Charakteristiky variability
I Přednáška Statistika Diskrétní data Spojitá data Charakteristiky polohy Charakteristiky variability Statistika deskriptivní statistika ˆ induktivní statistika populace (základní soubor) ˆ výběr parametry
VícePravděpodobnost a statistika
Pravděpodobnost a statistika Teorie pravděpodobnosti popisuje vznik náhodných dat, zatímco matematická statistika usuzuje z dat na charakter procesů, jimiž data vznikla. NÁHODNOST - forma existence látky,
VícePokud není uvedeno jinak, uvedený materiál je z vlastních zdrojů autora
Číslo projektu Číslo materiálu Název školy Autor Název Téma odiny Předmět očník /y/ CZ.1.07/1.5.00/34.0394 Y_32_INOACE_EM_1.02_měření odporu Střední odborná škola a Střední odborné učiliště, Hustopeče,
VíceMgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu
Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu K čemu slouží statistika Popisuje velké soubory dat pomocí charakteristických čísel (popisná statistika). Hledá skryté zákonitosti v souborech
VícePožadavky na konkrétní dovednosti a znalosti z jednotlivých tematických celků
Maturitní zkouška z matematiky 2012 požadované znalosti Zkouška z matematiky ověřuje matematické základy formou didaktického testu. Test obsahuje uzavřené i otevřené úlohy. V uzavřených úlohách je vždy
VíceZápočtová práce STATISTIKA I
Zápočtová práce STATISTIKA I Obsah: - úvodní stránka - charakteristika dat (původ dat, důvod zpracování,...) - výpis naměřených hodnot (v tabulce) - zpracování dat (buď bodové nebo intervalové, podle charakteru
Více6 Součinitel konstrukce c s c d
6 Součinitel konstrukce c s c d Součinitel konstrukce c s c d je součin součinitele velikosti konstrukce (c s 1) a dynamickéo součinitele (c d 1). Součinitel velikosti konstrukce vyjadřuje míru korelace
VíceProblematika analýzy rozptylu. Ing. Michael Rost, Ph.D.
Problematika analýzy rozptylu Ing. Michael Rost, Ph.D. Úvod do problému Již umíte testovat shodu dvou středních hodnot prostřednictvím t-testů. Otázka: Jaké předpoklady musí být splněny, abyste mohli použít
VíceMATEMATIKA Maturitní témata společná část MZ základní úroveň (vychází z Katalogu požadavků MŠMT)
MATEMATIKA Maturitní témata společná část MZ základní úroveň (vychází z Katalogu požadavků MŠMT) 1. Číselné obory 1.1 Přirozená čísla provádět aritmetické operace s přirozenými čísly rozlišit prvočíslo
VícePraktikum 1. Oddělení fyzikálních praktik při Kabinetu výuky obecné fyziky MFF UK. Úloha č...xvi... Název: Studium Brownova pohybu
Oddělení fyzikálních praktik při Kabinetu výuky obecné fyziky MFF UK Praktiku 1 Úloha č...xvi... Název: Studiu Brownova pohybu Pracoval: Jan Kotek stud.sk.: 17 dne: 7.3.2012 Odevzdal dne:... ožný počet
VícePopis fyzikálního chování látek
Popis fyzikálního chování látek pro vysvětlení noha fyzikálních jevů již nevystačíe s pouhý echanický popise Terodynaika oblast fyziky, která kroě echaniky zkouá vlastnosti akroskopických systéů, zejéna
Více3. VÝVRTY: ODBĚR, POPIS A ZKOUŠENÍ V TLAKU
3. VÝVRTY: ODBĚR, POPIS A ZKOUŠENÍ V TLAKU Vývrty jsou válcová zkušební tělesa, získaná z konstrukce poocí dobře chlazeného jádrového vrtáku. Vývrty získané jádrový vrtáke jsou pečlivě vyšetřeny, upraveny
VíceRegresní a korelační analýza
Přednáška STATISTIKA II - EKONOMETRIE Katedra ekonometrie FEM UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Regresní analýza Cíl regresní analýzy: stanovení formy (trendu, tvaru, průběhu)
VíceV praxi pracujeme s daty nominálními (nabývají pouze dvou hodnot), kategoriálními (nabývají více
9 Vícerozměrná data a jejich zpracování 9.1 Vícerozměrná data a vícerozměrná rozdělení Při zpracování vícerozměrných dat, hledáme souvislosti mezi dvěmi, případně více náhodnými veličinami. V praxi pracujeme
VíceRNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.
Analýza dat pro Neurovědy RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Jaro 2014 Institut biostatistiky Janoušová, a analýz Dušek: Analýza dat pro neurovědy Blok 7 Jak hodnotit vztah spojitých proměnných
VíceTEST Z TEORIE EXPLORAČNÍ ANALÝZA DAT
EXPLORAČNÍ ANALÝZA DAT TEST Z TEORIE 1. Test ze Statistiky píše velké množství studentů. Představte si, že každý z nich odpoví správně přesně na polovinu otázek. V tomto případě bude směrodatná odchylka
Více3. PEVNOST V TLAKU BETONU NA VÝVRTECH
3. PEVNOST V TLAKU BETONU NA VÝVRTECH Vývrty jsou válcové zkušební vzorky, získané z konstrukce poocí dobře chlazeného jádrového vrtáku. Vývrty jsou pečlivě vyšetřeny, upraveny buď zabroušení, anebo koncování
Více1 Poznámka k termodynamice: Jednoatomový či dvouatomový plyn?
Kvantová a statistická fyzika (erodynaika a statistická fyzika) 1 Poznáka k terodynaice: Jednoatoový či dvouatoový plyn? Jeden ol jednoatoového plynu o teplotě zaujíá obje V. Plyn však ůže projít cheickou
VíceZpracování náhodného vektoru. Ing. Michal Dorda, Ph.D.
Ing. Michal Dorda, Ph.D. 1 Př. 1: Cestující na vybraném spoji linky MHD byli dotazováni za účelem zjištění spokojenosti s kvalitou MHD. Legenda 1 Velmi spokojen Spokojen 3 Nespokojen 4 Velmi nespokojen
VíceSTATISTICKÉ CHARAKTERISTIKY
STATISTICKÉ CHARAKTERISTIKY 1 Vytvořeno s podporou projektu Průřezová inovace studijních programů Lesnické a dřevařské fakulty MENDELU v Brně (LDF) s ohledem na discipliny společného základu (reg. č. CZ.1.07/2.2.00/28.0021)
VíceAplikovaná statistika v R
Aplikovaná statistika v R Filip Děchtěrenko Matematicko-fyzikální fakulta filip.dechterenko@gmail.com 15.5.2014 Filip Děchtěrenko (MFF UK) Aplikovaná statistika v R 15.5.2014 1 / 15 Co bude náplní našich
VíceZákladní statistické charakteristiky
Základní statistické charakteristiky Základní statistické charakteristiky slouží pro vzájemné porovnávání statistických souborů charakteristiky = čísla, pomocí kterých porovnáváme Základní statistické
VíceČSN EN 1991-1-3 (Eurokód 1): Zatížení konstrukcí Zatížení sněhem. Praha : ČNI, 2003.
ZATÍŽENÍ SNĚHEM ČSN EN 1991-1-3 (Eurokód 1): Zatížení konstrukcí. Praa : ČNI, 2003. OBECNĚ: se považuje za proměnné pevné zatížení a uvažují se trvalé a dočasné návrové situace. Zpravidla se posuzují 2
VíceKorelační a regresní analýza. 1. Pearsonův korelační koeficient 2. jednoduchá regresní analýza 3. vícenásobná regresní analýza
Korelační a regresní analýza 1. Pearsonův korelační koeficient 2. jednoduchá regresní analýza 3. vícenásobná regresní analýza Pearsonův korelační koeficient u intervalových a poměrových dat můžeme jako
VíceSystémy finančních toků a jejich využití v praxi
UNIVERZITA PALACKÉHO V OLOMOUCI PŘÍRODOVĚDECKÁ FAKULTA KATEDRA MATEMATICKÉ ANALÝZY A APLIKACÍ MATEMATIKY BAKALÁŘSKÁ PRÁCE Systéy finančních toků a jejich využití v praxi Vedoucí bakalářské práce: Mgr.
VíceANALÝZA VÍCEROZMĚRNÝCH DAT
ANALÝZA VÍCEROZMĚRNÝCH DAT JIŘÍ MILITKÝ, Katedra textilních ateriálů, Technická universita v Liberci, Hálkova 6 461 17 Liberec, e- ail: jiri.iliky@vslib.cz Motto: Všechno není jinak MILAN MELOUN, Katedra
VíceZobecněná analýza rozptylu, více faktorů a proměnných
Zobecněná analýza rozptylu, více faktorů a proměnných Menu: QCExpert Anova Více faktorů Zobecněná analýza rozptylu (ANalysis Of VAriance, ANOVA) umožňuje posoudit do jaké míry ovlivňují kvalitativní proměnné
VíceVýrobní produkce divizí Ice Cream Po lo ha plane t Rozložený výse ový 3D graf Bublinový graf Histogram t s tn e ídy
Výrobní produkce divizí Ice Cream Polo ha planet Rozložený výsečový 3D graf Bublinový graf Ice Cream 1 15% Ice Cream 2 12% Ice Cream 3 18% Ice Cream 4 20% Statistika 40 30 20 Ice Cream 6 19% Ice Cream
VíceHydrologie (cvičení z hydrometrie)
Univerzita Karlova v Praze Přírodovědecká fakulta Katedra fyzické geografie a geoekologie Hydrologie (cvičení z hydrometrie) Zhodnocení variability odtokového režimu pomocí základních grafických a statistických
VícePříklad 2: Určení cihlářských surovin na základě chemické silikátové analýzy
Příklad 2: Určení cihlářských surovin na základě chemické silikátové analýzy Zadání: Deponie nadložních jílových sedimentů SHP byla testována za účelem využití v cihlářské výrobě. Z deponie bylo odebráno
VíceStatistická analýza jednorozměrných dat
Statistická analýza jednorozměrných dat Prof. RNDr. Milan Meloun, DrSc. Univerzita Pardubice, Pardubice 31.ledna 2011 Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem
VíceVícerozměrné statistické metody
Vícerozměrné statistické metody Shluková analýza Jiří Jarkovský, Simona Littnerová FSTA: Pokročilé statistické metody Typy shlukových analýz Shluková analýza: cíle a postupy Shluková analýza se snaží o
VíceUrčení Planckovy konstanty pomocí fotoelektrického jevu
Určení Planckovy konstanty pomocí fotoelektrickéo jevu Související témata: Externí fotoelektrický jev, výstupní práce elektronu z kovu, absorpce, energie fotonu Princip a úkol: Fotocitlivý prvek - fotonka
VíceVŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky
VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky PRAVDĚPODOBNOST A STATISTIKA Zadání 1 JMÉNO STUDENTKY/STUDENTA: OSOBNÍ ČÍSLO: JMÉNO CVIČÍCÍ/CVIČÍCÍHO: DATUM ODEVZDÁNÍ DOMÁCÍ ÚKOL
VíceStručný úvod do vybraných zredukovaných základů statistické analýzy dat
Stručný úvod do vybraných zredukovaných základů statistické analýzy dat Statistika nuda je, má však cenné údaje. Neklesejme na mysli, ona nám to vyčíslí. Z pohádky Princové jsou na draka Populace (základní
VícePRAVIDLA PROVOZOVÁNÍ LOKÁLNÍ DISTIBUČNÍ SOUSTAVY
PRAVIDLA PROVOZOVÁNÍ LOKÁLNÍ DISTIBUČNÍ SOUSTAVY DTPV Servisní, s.r.o. Příloa 2 Metodika určování nepřetržitosti distribuce elektřiny a spolelivosti prvků distribučníc sítí Scválil: ENERGETICKÝ REGULAČNÍ
VíceFAKULTA STAVEBNÍ VUT V BRNĚ PŘIJÍMACÍ ŘÍZENÍ DO MNSP STAVEBNÍ INŽENÝRSTVÍ PRO AKADEMICKÝ ROK OBOR: GEODÉZIE A KARTOGRAFIE TEST.
FAKULTA STAVEBNÍ VUT V BRNĚ PŘIJÍMACÍ ŘÍZENÍ DO MNSP STAVEBNÍ INŽENÝRSTVÍ PRO AKADEMICKÝ ROK 0 0 OBOR: GEODÉZIE A KARTOGRAFIE Část A TEST A) cos cos b) tg c) ( ) A) cos b) c) cotg cotg cotg A3) Hodnota
VíceSemestrální projekt. do předmětu Statistika. Vypracoval: Adam Mlejnek 2-36. Oponenti: Patrik Novotný 2-36. Jakub Nováček 2-36. Click here to buy 2
Semestrální projekt do předmětu Statistika Vypracoval: Adam Mlejnek 2-36 Oponenti: Patrik Novotný 2-36 Jakub Nováček 2-36 Úvod Pro vypracování projektu do předmětu statistika jsem si zvolil průzkum kvality
VíceINDUKTIVNÍ STATISTIKA
10. SEMINÁŘ INDUKTIVNÍ STATISTIKA 3. HODNOCENÍ ZÁVISLOSTÍ HODNOCENÍ ZÁVISLOSTÍ KVALITATIVNÍ VELIČINY - Vychází se z kombinační (kontingenční) tabulky, která je výsledkem třídění druhého stupně KVANTITATIVNÍ
VícePrognóza poruchovosti vodovodních řadů pomocí aplikace Poissonova rozdělení náhodné veličiny
Prognóza poruchovosti vodovodních řadů pomocí aplikace Poissonova rozdělení náhodné veličiny Ing. Jana Šenkapoulová VODÁRENSKÁ AKCIOVÁ SPOLEČNOST, a.s. Brno, Soběšická 156, 638 1 Brno ÚVOD Každé rekonstrukci
VíceAnalýza rozptylu. Podle počtu analyzovaných faktorů rozlišujeme jednofaktorovou, dvoufaktorovou a vícefaktorovou analýzu rozptylu.
Analýza rozptylu Analýza rozptylu umožňuje ověřit významnost rozdílu mezi výběrovými průměry většího počtu náhodných výběrů, umožňuje posoudit vliv různých faktorů. Podle počtu analyzovaných faktorů rozlišujeme
VíceRegresní analýza 1. Regresní analýza
Regresní analýza 1 1 Regresní funkce Regresní analýza Důležitou statistickou úlohou je hledání a zkoumání závislostí proměnných, jejichž hodnoty získáme při realizaci experimentů Vzhledem k jejich náhodnému
VíceInformační technologie a statistika 1
Informační technologie a statistika 1 přednášející: konzul. hodiny: e-mail: Martin Schindler KAP, tel. 48 535 2836, budova G po dohodě martin.schindler@tul.cz naposledy upraveno: 21. září 2015, 1/33 Požadavek
VíceOrganizační pokyny k přednášce. Matematická statistika. Přehled témat. Co je statistika?
Organizační pokyny k přednášce Matematická statistika 2012 2013 Šárka Hudecová Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta UK hudecova@karlin.mff.cuni.cz http://www.karlin.mff.cuni.cz/
VíceTéma 2: Pravděpodobnostní vyjádření náhodných veličin
0.05 0.0 0.05 0.0 0.005 Nominální napětí v pásnici Std Mean 40 60 80 00 0 40 60 Std Téma : Pravděpodobnostní vyjádření náhodných veličin Přednáška z předmětu: Spolehlivost a bezpečnost staveb 4. ročník
Více7. Rozdělení pravděpodobnosti ve statistice
7. Rozdělení pravděpodobnosti ve statistice Statistika nuda je, má však cenné údaje, neklesejte na mysli, ona nám to vyčíslí Jednou z úloh statistiky je odhad (výpočet) hodnot statistického znaku x i,
VíceNáklady výroby elektrické energie
Náklady výroby elektrické energie Marginální náklady (arginální ezní, přírůstkové) Marginální náklady jsou definovány jako přírůstek nákladů vyvolaných ezní přírůstke poptávky (produkce). MC = dtc dq TC
VíceDiskrétní náhodná veličina
Lekce Diskrétní náhodná veličina Výsledek náhodného pokusu může být vyjádřen slovně to vede k zavedení pojmu náhodného jevu Výsledek náhodného pokusu můžeme někdy vyjádřit i číselně, což vede k pojmu náhodné
VíceUKAZATELÉ VARIABILITY
UKAZATELÉ VARIABILITY VÝZNAM Porovnejte známky dvou studentek ze stejného předmětu: Studentka A: Studentka B: Oba soubory mají stejný rozsah hodnoty, ale liší se známky studentky A jsou vyrovnanější, jsou
VíceStatistika. cílem je zjednodušit nějaká data tak, abychom se v nich lépe vyznali důsledkem je ztráta informací!
Statistika aneb známe tři druhy lži: úmyslná neúmyslná statistika Statistika je metoda, jak vyjádřit nejistá data s přesností na setinu procenta. den..00..00 3..00..00..00..00..00..00..00..00..00..00 3..00..00..00..00..00..00..00
VíceANALÝZA DAT V R 7. KONTINGENČNÍ TABULKA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.
ANALÝZA DAT V R 7. KONTINGENČNÍ TABULKA Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK www.biostatisticka.cz PŘEHLED TESTŮ rozdělení normální spojité alternativní / diskrétní
VícePravděpodobnost a aplikovaná statistika
Pravděpodobnost a aplikovaná statistika MGR. JANA SEKNIČKOVÁ, PH.D. 2. KAPITOLA PODMÍNĚNÁ PRAVDĚPODOBNOST 3. KAPITOLA NÁHODNÁ VELIČINA 9.11.2017 Opakování Uveďte příklad aplikace geometrické definice pravděpodobnosti
VíceCvičná bakalářská zkouška, 1. varianta
jméno: studijní obor: PřF BIMAT počet listů(včetně tohoto): 1 2 3 4 5 celkem Cvičná bakalářská zkouška, 1. varianta 1. Matematická analýza Najdětelokálníextrémyfunkce f(x,y)=e 4(x y) x2 y 2. 2. Lineární
VíceObsah Úvod Kapitola 1 Než začneme Kapitola 2 Práce s hromadnými daty před analýzou
Úvod.................................................................. 11 Kapitola 1 Než začneme.................................................................. 17 1.1 Logika kvantitativního výzkumu...........................................
VíceEXPERIMENTÁLNÍ MECHANIKA 2 Přednáška 5 - Chyby a nejistoty měření. Jan Krystek
EXPERIMENTÁLNÍ MECHANIKA 2 Přednáška 5 - Chyby a nejistoty měření Jan Krystek 9. května 2019 CHYBY A NEJISTOTY MĚŘENÍ Každé měření je zatíženo určitou nepřesností způsobenou nejrůznějšími negativními vlivy,
VíceMetodologie pro Informační studia a knihovnictví 2
Metodologie pro Informační studia a knihovnictví 2 Modul 5: Popis nekategorizovaných dat Co se dozvíte v tomto modulu? Kdy používat modus, průměr a medián. Co je to směrodatná odchylka. Jak popsat distribuci
VíceTestování hypotéz a měření asociace mezi proměnnými
Testování hypotéz a měření asociace mezi proměnnými Testování hypotéz Nulová a alternativní hypotéza většina statistických analýz zahrnuje různá porovnání, hledání vztahů, efektů Tvrzení, že efekt je nulový,
VíceProfilování vzorků heroinu s využitím vícerozměrné statistické analýzy
Profilování vzorků heroinu s využitím vícerozměrné statistické analýzy Autor práce : RNDr. Ivo Beroun,CSc. Vedoucí práce: prof. RNDr. Milan Meloun, DrSc. PROFILOVÁNÍ Profilování = klasifikace a rozlišování
VíceTECHNICKÁ UNIVERZITA V LIBERCI EKONOMICKÁ FAKULTA. VZOR PŘIJÍMACÍ ZKOUŠKY DO NAVAZUJÍCÍHO STUDIA Obor: Manažerská informatika
TECHNICKÁ UNIVERZITA V LIBERCI EKONOMICKÁ FAKULTA VZOR PŘIJÍMACÍ ZKOUŠKY DO NAVAZUJÍCÍHO STUDIA Obor: Manažerská informatika UPOZORNĚNÍ: Všechny potřebné výpočty se provádějí do zadání, používání kalkulaček
VíceMatematika III. 29. října Vysoká škola báňská - Technická univerzita Ostrava. Matematika III
Vysoká škola báňská - Technická univerzita Ostrava 29. října 2018 Statistika Statistika Statistika je jako bikini. Co odhaluje, je zajímavé, co skrývá, je podstatné. Aaron Levenstein Statistika Statistika
VíceKubický spline. Obrázek 1 Proložení dat nezávislými kubickými polynomy bez požadavku spojitosti. T h T 2
Kubický spline Menu: QCExpert Regrese Kubický spline Modul Kubický spline slouží proložení prakticky libovolnýc regresníc křivek naměřenými daty s jednorozměrnou nezávisle proměnnou x a jednorozměrnou
VíceCíl Vyhodnotit současný stav migračně prostorové diferenciace území ČR a migrační tendence na základě údajů za obce ČR
Cíl Vyhodnotit současný stav migračně prostorové diferenciace území ČR a migrační tendence na základě údajů za obce ČR Data Obce ČR 2011 (Veřejná databáze ČSÚ) SPSS IBM, ArcGIS Proměnné: intenzita migračního
Více6. Lineární regresní modely
6. Lineární regresní modely 6.1 Jednoduchá regrese a validace 6.2 Testy hypotéz v lineární regresi 6.3 Kritika dat v regresním tripletu 6.4 Multikolinearita a polynomy 6.5 Kritika modelu v regresním tripletu
Více1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.
Prostá regresní a korelační analýza 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Problematika závislosti V podstatě lze rozlišovat mezi závislostí nepodstatnou, čili náhodnou
VíceANALÝZA A KLASIFIKACE DAT
ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc. INVESTICE Institut DO biostatistiky ROZVOJE VZDĚLÁVÁNÍ a analýz III. PŘÍZNAKOVÁ KLASIFIKACE - ÚVOD PŘÍZNAKOVÝ POPIS Příznakový obraz x zpracovávaných
Více