Pravý soubor

Podobné dokumenty
PYTHAGORAS Statistické zpracování experimentálních dat

Kanonická korelační analýza

SEMESTRÁLNÍ PRÁCE. Určení vnitřní struktury analýzou vícerozměrných dat. Ing. Pavel Bouchalík

Semestrální práce. 3.1 Matematické principy analýzy vícerozměrných dat

Vyhodnocení průměrných denních analýz kalcinátu ananasového typu. ( Metoda hlavních komponent )

SEMESTRÁLNÍ PRÁCE 3.5 Klasifikace analýzou vícerozměrných dat

Tomáš Karel LS 2012/2013

KVALITA GELU HYDRATOVANÉHO OXIDU TITANIČITÉHO Z HLEDISKA KALCINAČNÍHO CHOVÁNÍ

VAKCÍNY PRO PRASATA SUIVAC

Univerzita Pardubice 8. licenční studium chemometrie

Spokojenost se životem

6. Lineární regresní modely

Laboratorní práce č. 4

Cholesterol 2016

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice

V jedné ohradě budou tři a půl ovečky

Univerzita Pardubice Chemicko-technologická fakulta Katedra analytické chemie

Otázky k měření centrální tendence. 1. Je dáno rozložení, ve kterém průměr = medián. Co musí být pravdivé o tvaru tohoto rozložení?

Profilování vzorků heroinu s využitím vícerozměrné statistické analýzy

6. Lineární regresní modely

Analýza rozptylu. ANOVA cvičení

Nadváha a obezita a možnosti nefarmakologického ovlivnění

Výběrové šetření o zdravotním stavu české populace (HIS CR 2002) Platby mimo zdravotní pojištění (XVI. díl)

A7B39TUR - Semestrální práce

ZÁVĚREČNÁ ZPRÁVA Z AKCE DNY ZDRAVÍ. Termín pořádání : Místo: ŘÍČANY STÁTNÍ ZDRAVOTNÍ ÚSTAV

Korelační a regresní analýza. 1. Pearsonův korelační koeficient 2. jednoduchá regresní analýza 3. vícenásobná regresní analýza

{ } ( 2) Příklad: Test nezávislosti kategoriálních znaků

er Jilská 1, Praha 1 Tel.: milan.tucek@soc.cas.cz

DIABETES EPIDEMIE 21. STOLETÍ;

VÝSKYT PROTILÁTEK TŘÍDY IgM PO VAKCINACI PROTI VIROVÉ HEPATITIDĚ A

ZÁVĚREČNÁ ZPRÁVA Z AKCE

Využití a prezentace dat šetření EHIS ČR

Subjektivní přístup obyvatel Ostravy ke zdraví v závislosti na životním stylu, socioekonomickém statusu a vzdělání.

Socioekonomické nerovnosti ve zdraví obyvatel okresů České republiky

RIZIKOVÉ ŽIVINY VE VÝŽIVĚ DĚTÍ ZE STUDIÍ SPOLEČNOSTI PRO VÝŽIVU P.TLÁSKAL

Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium Management systému jakosti

velmi dobře spíše dobře spíše špatně velmi špatně neví

Cvičná bakalářská zkouška, 1. varianta

Civilizační choroby. Jaroslav Havlín

Využití faktorového plánování v oblasti chemických specialit

Proces marketingového výzkumu - jednotlivé fáze, význam, stručná charakteristika. Výběr a formulace výzkumného problému. Vztahy mezi proměnnými.

Výběrové šetření o zdravotním stavu české populace (HIS CR 2002) Užívání léků (XX. díl)

Vzorová prezentace do předmětu Statistika

Ústřední komise Chemické olympiády. 53. ročník 2016/2017. TEST ŠKOLNÍHO KOLA kategorie D. ZADÁNÍ: 70 BODŮ časová náročnost: 120 minut

KOLOSTRÁLNÍ VÝŽIVA TELAT I.

Fyzické tresty Výzkum PR

ZÁVĚREČNÁ ZPRÁVA Z AKCE

Systém monitorování zdravotního stavu obyvatelstva ve vztahu k životnímu prostředí

1. Test: Prostorové struktury

KGG/STG Statistika pro geografy

Cíle korelační studie

Počítačová analýza vícerozměrných dat v oborech přírodních, technických a společenských věd

KVALITA OČIMA PACIENTŮ psychiatrické léčebny - II. díl

časovém horizontu na rozdíl od experimentu lépe odhalit chybné poznání reality.

Nemoci oběhové soustavy v české populaci. Mgr. Michala Lustigová 18. konference Zdraví a životní prostředí, Milovy 2013

RIZIKOVÉ ŽIVINY VE VÝŽIVĚ DĚTÍ ZE STUDIÍ SPOLEČNOSTI PRO VÝŽIVU P.TLÁSKAL

SOUHRN ÚDAJŮ O PŘÍPRAVKU. Vanguard R injekční suspenze pro psy, kočky, skot, prasata, ovce, kozy, koně a fretky

DEMOGRAFICKÁ STUDIE MLADÁ BOLESLAV

Fakulta chemicko-technologická Katedra analytické chemie. 3.2 Metody s latentními proměnnými a klasifikační metody

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

Kontingenční tabulky, korelační koeficienty

ková Jan Smetana,, Roman Chlíbek Fakulta vojenského zdravotnictví Hradec Králov lové

Klasifikace analýzou vícerozměrných dat

Obsah Chemická reakce... 2 PL:

Studie EHES - výsledky. MUDr. Kristýna Žejglicová

Seznam vakcín proti vzteklině schválených v České republice k

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie. Nám. Čs. Legií 565, Pardubice. Semestrální práce ANOVA 2015

Faktorová analýza (FACT)

Ukazatele zdravotního stavu. Martin Horváth Kateřina Ivanová

Datum rozhovoru: Tazatel č.: Křestní jméno respondenta: 50+ v Evropě SHARE. Písemný dotazník. Hlavní studie 2006 / 2007

CHO cvičení, FSv, ČVUT v Praze

Vyšetření citráturie - návod pro pacienta

Porovnání dvou výběrů

SISP - charakteristika výběrového souboru

Ústřední komise Chemické olympiády. 53. ročník 2016/2017. KRAJSKÉ KOLO kategorie C. ZADÁNÍ PRAKTICKÉ ČÁSTI (40 BODŮ) časová náročnost: 120 minut

Náhodný vektor. Náhodný vektor. Hustota náhodného vektoru. Hustota náhodného vektoru. Náhodný vektor je dvojice náhodných veličin (X, Y ) T = ( X

V ČR je 23% obézních mužů a 22% obézních žen, tj. 1,5mil. obyvatel 50% obyvatel má nadváhu nebo je obézní

Život s inzulínem. Výsledky pacientského průzkumu. Červenec, Copyright 2017 QuintilesIMS. All rights reserved.

Zpracoval: Milan Tuček Centrum pro výzkum veřejného mínění, Sociologický ústav AV ČR, v.v.i. Tel.: ,

CK cholesterol chol. HDL chol.

Puppy. Rozšířili jsme řadu vakcín Biocan NOVEL! Nadstandardní řešení problému parvovirózy a psinky štěňat 1/2017

Seznam vakcín proti vzteklině schválených v České republice k

KVALITA OČIMA PACIENTŮ psychiatrické léčebny - III. díl

Metody gravimetrické

PŘÍBALOVÁ INFORMACE K PŘÍPRAVKU CANVAC DHP inj. sicc. ad us. vet.

Inovace bakalářského studijního oboru Aplikovaná chemie CZ.1.07/2.2.00/ Výpočty z chemických vzorců

Cévní mozková příhoda. Petr Včelák

DOTAZNÍK PRO ŽADATELE O OSVOJENÍ DÍTĚTE

Řízení pod vlivem alkoholu a jiných drog

Ekonomické výhody řešení nerovností ve zdraví. Marie Nejedlá Centrum podpory veřejného zdraví Státní zdravotní ústav

NETMONITOR CONSUMER 8. VLNA

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina

Výběrové šetření o zdravotním stavu české populace (HIS CR 2002) Chronická nemocnost (X. díl)

Databáze I. Přednáška 3

Program Statistica Base 9. Mgr. Karla Hrbáčková, Ph.D.

Zpracoval: Milan Tuček Centrum pro výzkum veřejného mínění, Sociologický ústav AV ČR,, v.v.i. Tel.: ;

Měření závislosti statistických dat

7. Hradecké vakcinologické dny,

AUTOMATICKÝ ODVZDUŠŇOVACÍ VENTIL A KVALITA

Statistika (KMI/PSTAT)

Transkript:

Pravý soubor

R = 0,885 (vyjadřuje korelaci mezi U1 a V1), R-kvad = 0,783 (podíl rozptylu zahrnutého do kanonických proměnných) Řádek pro první kanonický kořen. Kanonické zátěže každého znaku vyjadřují korelaci mezi tímto znakem a dotyčnou kanonickou proměnnou: 0,796*0,796 = 0,6336 0,953*0,953 = 0,9082 0,875*0,875 = 0,7656 Průměr sumy 2,3074 : 3 = 0,7691 čili 76,91% 76,91% vyjadřuje průměrný podíl rozptylu vyčíslený ze 3 znaků, který je vysvětlen první kanonickou proměnnou Redundanční index = 0,7691*0,783 = 0,6022 je mírou průměrného podílu rozptylu v pravé skupině znaků, který nebyl zahrnut do souboru znaků levé skupiny. Celková redundance = celková korelace mezi znaky na pravé straně rovnice se vyčíslí: 0,602 (od 1. kořene) + 0,010 (od 2. kořene) + 0,004 (od 3. kořene) = 0,616 čili 61,6% vystihuje značně silný vztah mezi třemi znaky souboru.

Redundanční index = 0,7691*0,783 = 0,6022 je mírou průměrného podílu rozptylu v pravé skupině znaků, který nebyl zahrnut do souboru znaků levé skupiny.

Levý soubor

Nevhodné!

Cvičení v programu STATISTICA

R = 0,885 (vyjadřuje korelaci mezi U1 a V1), R-kvad = 0,783 (podíl rozptylu zahrnutého do kanonických proměnných) Řádek pro první kanonický kořen. Kanonické zátěže každého znaku vyjadřují korelaci mezi tímto znakem a dotyčnou kanonickou proměnnou: 0,796*0,796 = 0,6336 0,953*0,953 = 0,9082 0,875*0,875 = 0,7656 Průměr sumy 2,3074 : 3 = 0,7691 čili 76,91% 76,91% vyjadřuje průměrný podíl rozptylu vyčíslený ze 3 znaků, který je vysvětlen první kanonickou proměnnou Redundanční index = 0,7691*0,783 = 0,6022 je mírou průměrného podílu rozptylu v pravé skupině znaků, který nebyl zahrnut do souboru znaků levé skupiny. Celková redundance = celková korelace mezi znaky na pravé straně rovnice se vyčíslí: 0,602 (od 1. kořene) + 0,010 (od 2. kořene) + 0,004 (od 3. kořene) = 0,616 čili 61,6% vystihuje značně silný vztah mezi třemi znaky souboru.

Přehled kanonické korelační analýzy

Úlohy pro CCA ve software STATISTICA

PŘÍKLAD 6.2 Testy IQ kanonickou korelační analýzou Bylo vyšetřeno 15 respondentů pěti rozličnými testy a vyčíslena hodnota inteligenčního kvocientu IQ. Tím vzniklo dohromady šest znaků zdrojové matice dat. Cílem je posoudit korelaci dvou skupin testů, když je k dispozici 15 dvojic vážených průměrů. Úkol úlohy: vyšetřete skupinu 3 vybraných testů v závislosti na druhé skupině 3 testů a pokuste se popsat závislost (TEST4, TEST5, IQ) = f(test1, TEST2, TEST3). Data: Každý z pěti testů obsahoval 10 bodovaných otázek, hodnocených v rozsahu 0 až 100 bodů. Matice TEST1 až TEST5 a IQ představuje 15 hodnot váženého průměru z 10 odpovědí u každého testu. Objekt Test1 Test2 Test3 Test4 Test5 IQ 1 83 34 65 63 64 106 2 73 19 73 48 82 92 3 54 81 82 65 73 102 4 96 72 91 88 94 121 5 84 53 72 68 82 102 6 86 72 63 79 57 105 7 76 62 64 69 64 97 8 54 49 43 52 84 92 9 37 43 92 39 72 94 10 42 54 96 48 83 112 11 71 63 52 69 42 130 12 63 74 74 71 91 115 13 69 81 82 75 54 98 14 81 89 64 85 62 96 15 50 75 72 64 45 103

PŘÍKLAD 6.3 Ovlivnění subjektivních postojů a názorů žen svým zdravotním stavem V roce 1975 bylo dotazníkem vyšetřeno v San Fernandu Valley na předměstí Los Angeles 465 žen věku od 20 do 59 let. Průzkum byl zaměřen na zdravotní, demografické a subjektivně zbarvené postoje a stavy a odhalit míru znaků osobního postoje, vztaženého ke svým zdravotním charakteristikám. Cíl úlohy: existují ve 9 znacích zdrojové matice dat nějaké skryté vztahy, a to mezi prvními 5 znaky zdravotního stavu ženy a následnými 4 jejími psychologickými znaky? Data: Ve zdrojové matici dat Canon každá z žen odpověděla v dotazníku na 9 otázek. V 1. souboru proměnné U jsou 4 znaky: Postženy značí míru důležitosti postavení ženy, Domin značí míru dominantního postavení v rodině, Manžel je hodnotící postoj ke svému manželství, Sebehod značí míru sebehodnocení. Větší čísla ukazují nepříznivější postoj, zvýšené pocity bezmocnosti ovlivnit něčí osud nebo narůstající nespokojenost se svým manželstvím a stále větší sebepodceňování. V 2. souboru proměnné V je 5 znaků zdravotního stavu: Mental se týká mentální zdraví, Fyzické se týká fyzického zdraví, Lékař vyjadřuje časté návštěvy u lékaře, Léky vyjadřuje oblibu v užívání léků, Drogy značí frekvence užívání psychotropních léků. Vyšší hodnoty bodů vyjadřují horší mentální a fyzické zdraví, častější návštěvy lékaře a větší užívání léků. Znaky s kódem L ve zdrojové matici dat značí transformovaná data. Objekt Lékař Léky Fyzické Mental Sebehod Domin Manžel Drogy Postženy 1 1 8 5 8 16 5 36 3 42 2 3 7 4 6 17 5 21 0 38.. 465 3 8 5 2 16 6 19 4 45

Úloha B69 Účinnost vakcíny Biocan R po vakcinaci a revakcinaci Ověřována imunogenita vakcíny u psů odpovědí po první vakcinaci a revakcinaci (IU v séru). Použito 40 psů věku od 3 do 6 měsíců, obou pohlaví a vakcinováno proti vzteklině 1 ml vakcíny Biocan R intramuskulárně. Odebrány vzorky krve na titr protilátek proti vzteklině stanovením počtu mezinárodních jednotek (IU), a to v rozmezí 3, 6 a 12 měsíců po první vakcinaci. Za rok byli psi revakcinováni Biocanem R v dávce opět 1 ml a krev odebírána opět v intervalu 3, 6 a 12 měsíců. Úkol úlohy: Existuje vazba mezi protektivní imunitou získanou po první vakcinaci a protektivní imunitou získanou po opakované revakcinaci u stejného druhu zvířat? První vakcinace Revakcinace 3 měsíce 6 měsíců 12 měsíců 3 měsíce 6 měsíců 12 měsíců 4.3 4.1 1.95 9.1 8.1 5.3............ 3.5 3.4 1.75 7.8 7.5 4.3

Úloha B72 Kanonická korelační analýza vztahu mezi znaky mozku a tělesných proporcí Willerman et al. (1991) shromáždil výběr 40 pravorukých studentů psychologie, (kde ID jsou Female nebo Male) a podrobil je čtyřem Wechslerovým subjektivním IQ-testům: Subjektivně: Slovní zásoba dle FSIQ testu, Podobnosti a Konstrukce bloků VIQ, Kompletace obrázků PIQ) Objektivně: použita metoda magneticko-rezonančního zobrazování 18 MRI záběrů: MRIcount k určení velikosti mozků studentů v pixelech, hmotnost studenta Weight, výška studenta Height (inch), pohlaví studenta Gender. Úkol: Kanonickou korelační analýzou zjistěte, zdali jsou výsledky těchto testů závislé na velikosti mozku a tělesných proporcích respondentů. Data: Zdrojová data: ID FSIQ VIQ PIQ Weight Height MRIcoun Gender F01 133 132 124 118 64,5 816932 Female................ M20 89 91 89 179 75,5 935863 Male

Úloha C34 Vyšetření vlivu zárodku na vlastnosti hydratovaného oxidu titaničitého Titanové roztoky rozkladem ilmenitu kyselinou sírovou vylučují za varu bílou sraženinu hydratovaného oxidu titaničitého k přípravě pigmentového TiO 2. Operace této hydrolýzy je zároveň dělícím procesem, kdy se s vysokým výtěžkem získá TiO 2 v pevné fázi, zatímco železo a ostatní nečistoty zůstávají v roztoku. K dosažení dobrého výtěžku je nutná přítomnost zárodků dvěma metodami hydrolýzy: zárodková a zřeďovací. Zárodková hydrolýza spočívá v přípravě zárodků mimo hydrolyzační káď a přidání zárodku do roztoku na začátku hydrolýzy. Cílem úlohy je nalézt znaky připravovaného zárodku, na kterých závisí kvalita připravené suspenze TiO 2. Nalezněte závislost mezi znaky zárodku a kvalitou výsledného hydrolyzátu? Data: Popis znaků ve sloupcích: Hydrolyzát (levá strana CCA): Sed je sedimentace, D50 je velikost částic d 50, Část. 1μ je obsah částic do 1 μm, Zárodek (pravá strana CCA): Stab. je stabilita, TiO2 cel je obsah celkového TiO 2, TiO2 ro je obsah rozpustného TiO 2, TiO2 ko je obsah koloidního TiO 2, Na je obsah sodíkových iontů, TiO2/Na je poměr obsahu TiO 2 a sodíkových iontů. i Sed. D50 Část.1µ Stab. TiO2 ce TiO2 ro TiO2 ko Na TiO2/Na 1 123,0 3,2 14,6 115,0 158,2 123,1 22,2 14,4 11,0.................... 17 111,0 4,3 11,3 160,0 155,4 147,4 5,2 18,7 8,3

Úloha S31 Analýza skrytých vztahů mezi znaky civilizačních nemocí ve státech USA Ze zdroje State Master pocházejí výsledky cíleného výzkumu obyvatel jednotlivých států Spojených Států Amerických (State), zaměřené na některé civilizační nemoci na jedné straně jako cukrovka (Diabetes), vysoký tlak (HighPres), vysoká hladina cholesterolu (HighChol), obezita (Obezity) a způsob života (Lifestyle), a na druhé straně jsou fyzické cvičení (PhysExc), vzdělání (Education) a ekonomická úroveň jednotlivých států (Economy) jako druhá skupina znaků. Cílem úlohy: analyzovat vztahy mezi těmito proměnnými. Existují faktory, schopné charakterizovat dané domény? Lze pomocí nich posoudit dané státy v US? Data: Popis znaků ve sloupcích je samoobjasňující. Zdrojová data osahují State Diabetes PhysExc Obesity HighPres HighChol Education Economy Lifestyle Legenda AL 8,9 70,3 61 33,1 36 82,4 16,1 21 Alabama.................... WY 5,1 79,8 54,5 23,8 34,9 91,9 10,3 31,6 Wyoming

Vstup dat: Výsledky CCA:

Úloha S44 Čtyři domény statistik obyvatelstva ovlivňují tři domény pracovní neschopnosti Cílem úlohy: jak čtyři domény statistik obyvatelstva (počet obyvatel, narozených, zemřelých a prům. věk) ovlivňují zbývající tři domény délky pracovní neschopnosti. Data: Popis znaků: data byla získána pro rok 2005: Obyvatel je počet obyvatel k 2005, Narození je počet narozených za rok 2005, Úmrtí je počet zemřelých za rok 2005, Prům.věk je průměrný věk k 2005 (roky), Nemoc je počet dnů pracovní neschopnosti pro nemoc, Prac.úraz je počet dnů prac.neschopnosti pro úraz v práci, Souk.úraz je počet dnů pracovní neschopnosti pro úraz doma. Kraj Obyvatel Narození Úmrtí Prům.věk Nemoc Prac.úraz Souk.úraz Praha 1181600 11966 12673 40,9 14436113 462314 654306................ Pardubický 506000 4925 5168 38,2 4302367 193410 305387

Obyvatel Narození Úmrtí Prům.věk Nemoc, Prac.úraz,Souk.úraz