Analýza textury sonografických obrazů difúzních procesů
|
|
- Bohumil Jelínek
- před 8 lety
- Počet zobrazení:
Transkript
1 Analýza textury sonografických obrazů difúzních procesů parenchymu štítné žlázy Martin Švec, Radim Šára N - CTU CMP listopadu 1999 Lze získat na ftp://cmp.felk.cvut.cz/pub/cmp/articles/sara/svec-tr pdf Projekt podpořen grantem MZ ČR NB : Analýza textury sonografických obrazů endokrinopatií a metabolických onemocnění, zejména difúzních procesů parenchymu štítné žlázy a grantem MŠ ČR VS 96049: Centrum strojového vnímání. Centrum strojového vnímání, Katedra kybernetiky Fakulta elektrotechnická ČVUT Karlovo náměstí 13, Praha 2 fax: (02) , tel: (02) , www:
2
3 Obsah Cíl projektu 1 Použitá terminologie Data použitá pro první experimenty 3 2 Texturní příznaky 4 3 Výběr příznaků Fisherův lineární diskriminant Stabilita klasifikátoru podle minimální vzdálenosti Stav projektu ke dni 12.listopadu Shrnutí Dílčí úkoly během projektu Nejbližší úkoly A Příloha 14 A.1 Fisherův lineární diskriminant A.2 Stabilita A.3 Pořadí k-tic příznaků podle jednotlivých kritérií A.4 Seznam používaných funkcí A.5 Účastníci projektu
4 Cíl projektu Projekt Analýza textury sonografických obrazů endokrinopatií a metabolických onemocnění, zejména difúzních procesů parenchymu štítné žlázy se zabývá podporou diagnózy štítné žlázy pomocí metod automatického rozpoznávání. Odpovědným řešitelem projektu je MuDr. Petr Sucharda z 3. interní kliniky 1. LF UK v Praze. Jména ostatních odborných spolupracovníků včetně jejich ových adres jsou uvedena v příloze A.5. Tříletý projekt je podporován IGA MZ ČR. Tato zpráva shrnuje stav úvodních experimentů provedených v prvním roce řešení tříletého grantového úkolu na katedře kybernetiky FEL ČVUT. Cílem našeho projektu je nalézt klasifikátor vhodný pro klasifikaci sonografických obrazů. Na začátku projektu uvažujeme tři lehce dosažitelné diagnózy: zdravá tkáň, atrofická thyroitida (AT) a lymfocytární thyroitida (LT). Předpokládáme, že během projektu se počet diagnóz zvýší. Data jsou získána digitalizací televizního signálu, což je kopie obrazovky sonografu, kterou sleduje expert při určování diagnózy. V našem případě jde o ultrasonografický přístroj Toshiba ECCOCEE (model SSA-340A, rok výroby 1996). Obrazy jsou snímány za různých podmínek. Jsou jimi zvětšení (4cm nebo 6cm) a tři standardní polohy sondy vzhledem ke štítné žláze (příčně, podélně vlevo nebo podélně vpravo). Podmínky, které jsou pro automatickou klasifikaci nejvhodnější, nemusí být totožné s podmínkami nejlepšími pro vizuální diagnózu. Použitá terminologie Obrazem rozumíme digitalizovaná vstupní data, tak jak jsou znázorněna na obr. 1. Oblast zájmu (zkráceně oblast) je pouze část obrazu, ve které se vyskytuje štítná žláza. Pokud budeme dále hovořit o určité klasifikaci obrázku, bude to zároveň znamenat stejnou klasifikaci oblasti a naopak. Vzorek je část oblasti. Je to čtverec, jehož strana má délku n. Názornou ukázku oblasti zaplněné vzorky můžete vidět na obr. 2. Diagnóza je v našem případě to, co o oblasti prohlásí expert, tedy zda jde o zdravou tkáň, LT či AT tkáň. Třída je označení obrazů provedené klasifikátorem. Oblasti zařazené do jedné třídy by měly mít určitou společnou vlastnost, odlišnou od ob- 1
5 lastí jiných tříd. V některé literatuře se používá pojem indikátor třídy. V našem případě tedy máme zatím 3 třídy: zdravá, LT a AT. Stabilita značí percentuální četnost, se kterou se při náhodném výběru trénovací a testovací množiny projeví kombinace příznaků jako nejúspěšnější (bližší vysvětlení v kapitole 3.2). V dalším textu již budou tyto pojmy uváděny normálním písmem. Cílem této zprávy je vytvořit si názor na vhodnost použitých příznaků a na klasifikátor, který byl zatím v projektu realizován. Příčně Podélně vpravo Podélně vlevo Zdravá martin.0 martin.10 martin.20 LT AT Obrázek 1: Vstupní data sonografické obrázky štítné žlázy (zvětšení 4cm) pro různé diagnózy a polohy sondy. 2
6 (a) Sonografický obraz (b) Vyznačení vzorků v oblastech Obrázek 2: Oblast obrazu pokrytá sítí vzorků Data použitá pro první experimenty Všechny datové množiny sejmuté digitizérem DT3155 jsou rozbalené v podadresářích /data/sono na linuxové síti v CMP FEL. Adresáře jsou uspořádány podle data snímání ve formátu dd-mm-rr. V adresáři jsou pak soubory se jmény typu id.nn, kde id je identifikační označení pacienta (číslo nebo jméno) a nn je číslo obrázku. Jméno každého obrázku je pak dáno zápisem dd-mm-rr/id.nn. Pro experimenty popsané v této zprávě byla použita data těchto pacientů: Zdravá tkáň /martin, /dana, od obou pacientů obrázky číslo LT tkáň / , / , od obou pacientů obrázky číslo Data pro třídu AT zatím nejsou k dispozici. Množství získaných a zpracovaných dat udává tabulka 1. Tabulka 1: Množství dat. Diagnóza Počet obrazů. Počet obrazů označených expertem zdravá tkáň LT AT
7 Podmínky sejmutí pro jednotlivé obrázky jsou: /martin.nn nn poloha sondy pricne, 6 cm nn poloha sondy podelne vpravo, 6 cm nn poloha sondy podelne vlevo, 6 cm nn poloha sondy pricne, 4 cm nn poloha sondy podelne vpravo, 4 cm nn poloha sondy podelne vlevo, 4 cm /dana, / , / stejně jako /martin Zatím se tedy soustředíme na podmínky poloha sondy příčně a zvětšení 4 cm, protože je důležitější zjistit nejprve vhodnou metodiku postupu a tu pak použít i pro ostatní podmínky. 2 Texturní příznaky Z obr. 1 je patrné, že obraz má silně texturní charakter. Určení diagnózy expertem není otázkou rozlišení obrysů, nýbrž rozpoznání odlišné textury. Z textury lze extrahovat velké množství vlastností, ne všechny jsou však významné z hlediska naší klasifikační úlohy. Rozhodli jsme se pro statistické vlastnosti. Jde o 9 Haralickových příznaků 1 počítaných na kookurenční matici (C) vzorku [HS92]. Tuto matici jsme navíc ještě normalizovali (vydělili) součtem všech jejích prvků. Význam kookurenční matice lze zhruba vysvětlit takto: Obraz se skládá z bodů (pixelů), z nichž každý má svou jasovou hodnotu. Každý prvek matice C pak udává kolikrát spolu v celém obraze sousedí dva pixely o jasových hodnotách daných právě indexem tohoto prvku v C. Sousedství dvou pixelů je zde definováno směrem. Například pro pixel o souřadnicích [x, y] a směr [a, b] je určen jeho soused, který má souřadnice [x + a, y + b]. My jsme se rozhodli pracovat s kookurenční maticí vypočtenou 2 pro směr [1 0] (v obrazu svisle, v polárním souřadnicovém systému jde o úhel 90 ), který odpovídá směru šíření zvukové vlny dovnitř tkáně. Neznamená to však, že Haralickovy příznaky vypočtené pro tento směr budou těmi nejlepšími. 1 Výčet funkcí provádějících výpočet jednotlivých příznaků lze obdržet v Matlabu příkazem help Texture. 2 Příkaz v Matlabu C=cooccur(vzorek,[1 0]). 4
8 V jiných směrech mohou být příznaky, které samy nebo v kombinaci s příznaky jiného směru odliší třídy lépe. Jedním z našich dalších úkolů bude tedy vyzkoušet i jiné vhodné směry, například [2 0], [1 1] nebo [0 1]. Příznaky jsou vypočteny ze vzorců uvedených v tabulce č. 2, kde i je řádkový index prvku v matici C, j je sloupcový index prvku v matici C. µ i = ij ic ij µ j = ij jc ij C i = j C ij var(i) = ij (i µ i ) 2 C ij var(j) = ij (j µ j ) 2 C ij Na čísla příznaků uvedená v této tabulce se budeme odkazovat v dalších částech textu. Tabulka 2: Příznaky. Číslo Název Výpočet H1 texture cluster tendency (i µ i + j µ j ) 2 C ij H2 texture entropy C ij log C ij ij H3 texture contrast i j C ij H4 H5 H6 texture correlation texture homogeneity texture inverse difference moment ij ij (i µ i )(j µ j )C ij ij var(i)var(j) ij ij,i j H7 maximum texture probability max H8 texture probability of run length of 2 H9 uniformity of texture energy i C ij 1+ i j ij C ij i j C ij (C i C ii ) 2 C ii C 2 i ij C 2 ij 5
9 Pomocí několika funkcí, které byly v Matlabu vytvořeny 3, jsme získali datovou strukturu vhodnou ke konečným výpočtům či jako vstup do klasifikátoru. Délku strany čtverce jsme vzhledem k velikostem oblastí zvolili 21 (obr. 2) a 31 pixelů a podle dalších výsledků se mezi těmito hodnotami rozhodneme. 3 Výběr příznaků 3.1 Fisherův lineární diskriminant Nejprve se pokusíme seřadit příznaky podle toho, jakou nám poskytují míru informace o vzorcích z hlediska rozdělení vzorků do tříd. K tomu slouží jednoduchá metoda počítání Fisherova lineárního diskriminantu (F). Můžeme si ji snadno představit v příznakovém prostoru. Jsou zde určité shluky bodů (body odpovídají vzorkům), které se mohou různě překrývat. Každý shluk bodů znázorňuje vzorky příslušící k jedné třídě. Ideální stav je ten, kdy příznaky (souřadnice bodů v příznakovém prostoru) jsou vybrány tak, aby shluky odpovídající všem třídám byly navzájem oddělené. My předpokládáme, že shluky mají normální rozdělení hustoty. Potom je můžeme jednoznačně reprezentovat střední hodnotou a rozptylem (pro 1D, ve vícedimenzionálním prostoru počítáme místo rozptylu kovarianční matici). Je zřejmé, že užitečnost příznaků je tím větší, čím menší budou rozptyly uvnitř shluků a čím více budou jednotlivé shluky od sebe vzdáleny (čím větší bude rozptyl mezi shluky). Zajímají nás tedy ty příznaky, pro něž je hodnota poměru rozptyl mezi třídami rozptyl uvnitř tříd větší než pro ostatní. Rozptyl uvnitř jednotlivých tříd může být různý, proto pro zajištění mezního případu použijeme poměr rozptyl mezi třídami větší z rozptylů uvnitř tříd Rozptyl mezi třídami jsme nepočítali jako kovarianci středních hodnot tříd [KBCJ80], ale jako kovarianci všech vzorků, což je v našem případě přesnější. Obecně předpokládejme, že máme data roztříděná do n tříd. Každá třída je reprezentována právě maticí X i, tvořenou po sloupcích příznakovými vektory. 3 Podrobnější popis naleznete v kapitole 4 Seznam používaných funkcí. 6
10 Zaveďme označení: Pak Fisherův lineární diskriminant A = cov([x 1 X 2 X 3... X n ]), (1) B i = cov(x i ), (2) λ i = max(eig(b 1 i A)). (3) F = n min i=1 λ i. (4) Odvození vztahu (4) je uvedeno v příloze A.1. Pro názornější objasnění hodnot, kterých může Fisherův lineární diskriminant nabývat, provedeme následující úvahu. Definujme p = k i, N k j j=1 kde k i je počet vektorů v matici X i, N k j je počet vektorů v [X 1 X 2 X 3... X n ]. j=1 Parametr p nabývá hodnot z intervalu < 0, 1 >. Experimentálně bylo zjištěno: 1. Jestliže třídy jsou dokonale vnořené (mají stejné střední hodnoty a rozptyl jedné ze tříd je nulový), pak F = p. 2. Jestliže třídy jsou identické (mají stejné střední hodnoty a stejný rozptyl (kovarianční matice)), pak F = Jestliže třídy jsou dokonale separovatelné, pak F =. 4. Jestliže třídy jsou pouze vnořené, pak p < F < Jestliže třídy jsou pouze separovatelné, pak 1 < F <. Čím větších hodnot F nabývá, tím lépe jsou separovatelné. Názorný příklad vzájemných poloh tříd ve dvou-dimenzionálním prostoru je uveden na obr. 3. Podle hodnoty Fisherova lineárního diskriminantu pro n = 2 byly seřazeny jednotlivé kombinace příznaků. V tabulce č. 3 je uveden interval, ve 7
11 (a) X 2 = N(0, 1) F = (b) X 2 = N(0, 0.1) F = (c) X 2 = N(0.5, 0.1) F = (d) X 2 = N(3, 0.1) F = Obrázek 3: Základní vzájemné polohy dvou tříd ve 2D prostoru, parametr p = 0.5, k 1 = k 2 = 100, X 1 = N(0, 1) (má normální rozdělení, střední hodnota je nulová, rozptyl je roven jedné). kterém se pohybuje F pro všechny kombinace příznaků vzhledem k parametru N, kde N značí počet příznaků (N = 1 samotné příznaky, N = 2 dvojice příznaků, atd.). Protože se snažíme nalézt klasifikátor, který by pro správnou funkci potřeboval minimální počet příznaků, a protože můžeme snadno zobrazit a vizuálně kontrolovat maximálně 3D prostor, budeme nadále uvažovat pouze kombinace příznaků pro N <= 3. Jejich podrobný výčet je spolu s hodnotou F uveden v příloze A.3 v tabulkách číslo 1, 2, 3. Pro názornost je uveden příznakový prostor pro nejlepší a nejhorší příznaky ve 2D a ve 3D a pro vzorky a (obr. 6 až obr. 9). 8
12 Tabulka 3: Zjištěný interval pro Fisherův lineární diskriminant podle počtu příznaků (N). Vzorky Vzorky N Interval F Interval F , , , , , , , , , , , , , , , , Metoda Fisherova lineárního diskriminantu je vhodnější spíše pro rozhodování mezi dvěma třídami, což nám ale nebrání ji použít i pro více tříd. Pokud se totiž tímto způsobem podaří nalézt takovou množinu příznaků, že všechny dvojice tříd budou vzájemně dobře rozlišitelné, dospějeme k dobrým výsledkům i v klasifikaci. 3.2 Stabilita klasifikátoru podle minimální vzdálenosti Nyní již z předchozího víme, jaké příznaky (kombinace příznaků) by měly být dobré pro naši klasifikaci. Tyto výsledky se pokusíme ověřit na klasifikaci do zatím dostupných tříd, tedy zdravé a LT. Všechny vzorky byly rozděleny náhodně na dvě poloviny na testovací a trénovací množinu, přičemž vzorky z jednoho obrazu se mohly vyskytovat pouze v jedné z množin. Z trénovací množiny jsme určili střední hodnoty obou tříd. Byl naprogramován klasifikátor podle minimální vzdálenosti od těchto středních hodnot. Vzdálenost je euklidovská a není vážena kovarianční maticí. Klasifikátor pracuje v podstatě na dvou úrovních. V první úrovni provádí třídění vzorků a v druhé třídění obrazů. Obrazu je přiřazena taková třída, do které patří většina jeho vzorků (majorita, viz obr. 4). Výstupem je pak úspěšnost daná porovnáním testovací množiny a výsledku druhé úrovně klasifikátoru. Při naprosté shodě klasifikace s testovací množinou by tedy byla úspěšnost 100%. Zjistili jsme, že pro stejně velké trénovací a testovací množiny, do kterých mnohokrát za sebou vybíráme náhodně přibližně stejný počet zdravých 9
13 Vzorky V 1 ω 1 V 2 ω 2 Obraz V ω ω 3 k Majorita ω M V k Obrázek 4: Rozhodování o třídě obrazu podle třídy, do které je přiřazena většina vzorků (ω je označení třídy). i LT vzorků, se úspěšnost klasifikátoru pohybuje mezi 70 % 100 %. Nabízejí se zde tři možné příčiny: 1. Je k dispozici zatím jen malé množství dat. To by znamenalo, že ve třídách je střední hodnota zatím získaných vzorků poměrně hodně vzdálena od střední hodnoty, kterou bychom získali z nekonečného počtu vzorků. 2. V oblasti s určitou diagnózou předpokládáme pouze výskyt vzorků patřících do té samé třídy. Je však možné, že oblast třídy LT obsahuje také vzorky zdravé, a dokonce jich tu může být i většina. Potom při výběru špatných dat do trénovací množiny je možné, že klasifikátor zařadí zdravé vzorky z LT oblasti také do třídy LT. Tím by se v podstatě kompenzovala chyba chybou a je tak vysvětlen i případ, kdy náhodně vyšla úspěšnost klasifikace 100 %. 3. Gausovský model popsaný střední hodnotou a rozptylem (kovarianční maticí) není dostatečný. Vzhledem k tomu, že ani jednu z těchto příčin nelze ihned odstranit, zaměřili jsme se zatím na zjištění nejlepší kombinace tří příznaků (příznakový prostor dimenze 3D). Postupně jsme pro vzorky a provedli 10
14 1000 klasifikací na různých trénovacích a testovacích množinách a to pro všechny kombinace příznaků ve 3D. Zjišťovali jsme, kolikrát se v daném počtu pokusů projeví každá kombinace jako nejúspěšnější. Tuto relativní četnost pak nazýváme stabilitou klasifikátoru vzhledem k testovací množině (zkráceně stabilita) a udáváme ji v procentech (viz terminologie na začátku této zprávy). Její maximální hodnoty jsou uvedeny v tabulce 4. Příznakový prostor pro trojici příznaků s největší stabilitou znázorňuje obr. 10. Podrobnější informace o všech kombinacích lze opět najít v příloze tabulka 4. Zde si můžeme všimnout rozporu mezi pořadím podle Fisherova lineárního diskriminantu a podle stability. Je to dáno tím, že rozložení vzorků uvnitř shluků v příznakovém prostoru nemá gausovský charakter. Kdyby tomu tak bylo, tak by rozptyl velice dobře charakterizoval tento shluk a pořadí příznaků podle Fisherova lineárního diskriminantu by se blížilo pořadí podle stability klasifikátoru. Tabulka 4: Kombinace příznaků s největší stabilitou. Vzorek Kombinace Stabilita [%] H2 H4 H H5 H7 H Pro kombinace z tabulky 4 jsme provedli opět 1000 klasifikací na různých trénovacích a testovacích množinách a zjistili průměrnou úspěšnost. Zaměřili jsme se na jednotlivé obrázky a zjistili, kolikrát byl v daném počtu klasifikací zařazen obrázek do špatné třídy. Tuto relativní četnost, pak nazýváme chybovost klasifikátoru vzhledem k obrázku (zkráceně CH, udáváme ji opět v procentech) a je uvedena v tabulce 5 (symbol je zde označen jako A, jako B). Vidíme, že nejčastěji jsou chybně klasifikovány některé obrázky patřící ke třídě LT, což podporuje hypotézu, že i v těchto obrázcích existují vzorky s diagnózou zdravý. Dokládá to i obr. 11. Ten jsme získali zvětšením příznakového prostoru pro kombinace příznaků z tabulky 5 (srovnejte s obr. 10). Navíc jsou v něm ještě zvýrazněny vzorky obrazu s největší chybností ( / pro obr. 11(a) a / pro obr. 11(b)). V příznakovém prostoru jsou tyto vzorky poměrně náhodně rozmístěny ve shluku jak LT, tak i zdravé třídy. 11
15 Tabulka 5: Chybně klasifikované obrázky. Vzorky Vzorky Kombinace příznaků: H2 H4 H9 Kombinace příznaků: H5 H7 H9 Průměrná úspěšnost = % Průměrná úspěšnost = % Jméno - diagnóza CH [%] Jméno - diagnóza CH [%] A/ LT 52.4 A/ LT 56.4 A/ LT 48.2 A/ LT 49.2 A/ LT 48.1 A/ LT 48.7 A/ LT 46.1 A/ LT 47.8 A/ LT 45.7 A/ LT 14.3 A/ LT 24.5 A/ LT 0.7 A/ LT 13.4 B/martin.37 - zdravý 0.3 A/ LT 2.8 A/ LT 0.2 A/ LT 1.5 B/martin.30 - zdravý 0.1 A/ LT Stav projektu ke dni 12.listopadu 1999 Kombinace příznaků pro příznakový prostor dimenze 1, 2 a 3 byly seřazeny podle velikosti Fisherova lineárního diskriminantu. Byl vyzkoušen klasifikátor podle minimální vzdálenosti od střední hodnoty. 4.1 Shrnutí Z experimentů, které byly dosud provedeny, vyplývají následující závěry: Variabilita třídy LT je větší než variabilita třídy zdravá. Uspořádání příznaků podle Fisherova lineárního diskriminantu a podle stability se liší. Pro větší množiny dat a pro spolehlivější klasifikátory předpokládáme postupné sbližování tohoto pořadí. Separovatelnost tříd v příznakovém prostoru je malá, třídy jsou do sebe vnořené. 4.2 Dílčí úkoly během projektu Je třeba shromáždit co možná největší množství dat, jak zdravých, tak i nemocných tkání. 12
16 Ve všech obrázcích vyznačit oblast zájmu (štítnou žlázu) a tu pro unifikaci dat pokrýt sítí čtverců s jednotnou plochou. Každý čtverec pak bude považován za samostatný vzorek dat. Určit za pomocí experta, zda pro oblast s určitým onemocněním nesou také všechny její čtverce charakteristiku tohoto onemocnění. V případě, že tomu tak není, bude třeba aby expert označil v každém obrázku čtverce s nemocnou tkání. Určitá třída pak bude přiřazena jednomu obrázku podle toho, kolik v něm bude zastoupeno čtverců zdravých, LT či AT. Je třeba určit optimální velikost strany čtverce. Pro každý čtverec vypočítat vhodné příznaky a z nich vybrat takové, pro které vzniknou v příznakovém prostoru pokud možno snadno oddělitelné shluky. Postupně zkoušet klasifikátory od nejjednodušších po složitější. 4.3 Nejbližší úkoly 1. Pokud by se zjistilo, že v jednom obrázku například s diagnózou LT by bylo srovnatelné množství vzorků s vlastnostmi třídy zdravý a třídy LT, pak bude třeba napsat funkci, pomocí které expert tyto čtverce označí. Tím by se s velkou pravděpodobností zvýšila úspěšnost jakéhokoli klasifikátoru. 2. Zpracovat příznaky pro jiný směr v kookurenční matici C. 3. Zkoušet další klasifikátory pro klasifikaci jednotlivých vzorků. 3a. Napsat takovou funkci, která z jednotlivých oklasifikovaných vzorků nejlépe určí příslušnost celého obrázku k jedné z tříd. Reference [HS92] Robert M. Haralick and Linda G. Shapiro. Computer and Robot Vision. Addison-Wesley Publishing Company, [KBCJ80] Zdeněk Kotek, Ivan Brůha, Václav Chalupa, and Jan Jelínek. Adaptivní a učící se systémy. SNTL,
17 A Příloha A.1 Fisherův lineární diskriminant Jak již bylo uvedeno v kapitole 3.1, vycházíme ze vztahů (1) a (2). Rozptylu mezi třídami ve směru určeném vektorem x odpovídá zápis x T Ax, kde x je směrový vektor, pro který platí x > 0. Podobně rozptyl uvnitř třídy můžeme nahradit zápisem x T B i x. Naším cílem je nalézt takový směr daný vektorem x, pro který bude maximální poměr 1. Matice B i je pozitivně definitní a symetrická. Lze ji rozložit na x T Ax x T B i x. (5) B i = B 1 2 i B 1 2 i. (6) 2. Definujme substituci 3. Potom y = B 1 2 i x x = B 1 2 i y. (7) max x x T Ax x T B i x = max x x T Ax x T B 1 2 i B 1 2 i x = max y (B 1 2 i y) T AB 1 2 i y (B 1 2 i y) T B 1 2 i B 1 2 i B 1 2 i y = = max y y T B 1 2 T i AB 1 2 i y y T B 1 2 T i B 1 2 i B 1 2 i B 1 2 i y = max y y T B 1 2 i AB 1 2 i y y T B 1 2 i B 1 2 i B 1 2 i B 1 2 i y = = max y y T B 1 2 i AB 1 2 i y y T y. (8) 4. Výraz (8) je definicí maximálního vlastního čísla matice B 1 2 i AB 1 2 i (označme ho λ i ), takže max x x T Ax x T B i x = 1 max(eig(b 2 i AB 1 2 i )) = λ i. (9) 14
18 5. Vzhledem k tomu, že A i B 1 2 i jsou symetrické a součin symetrických matic je opět symetrická matice, platí AB 1 2 i = (AB 1 2 i ) T = B 1 2 T i A T = B 1 2 i A (10) a vzhledem ke vztahu (6) můžeme zapsat výraz (9) jako λ i = max(eig(b 1 i A)). (11) Pro Fisherův lineární diskriminant platí n F = min λ i. (12) i=1 Výběr minima ze všech vlastních čísel λ i znamená výše uvedené zajištění mezního případu, kdy rozptyly uvnitř shluků nejsou stejné. Fisherův lineární diskriminant je odmocněn, protože kovariance dává druhé mocniny rozptylů. Pro lepší představu součinu B 1 i A ze vztahu (11) uvažujme dva shluky, jejichž vektory středních hodnot označíme x 1 a x 2. Pak z výrazů (1) a (2) lze odvodit, že B 1 1 A = n 1 n 1 + n 2 + n 2 n 1 + n 2 B 1 1 B B 1 1 (x 1 x 2 )(x 1 x 2 ) T, (13) kde n 1, n 2 je počet měření v jednotlivých shlucích (měření je zde reprezentováno vektorem, jehož délku udává počet příznaků). Snadno můžeme odvodit jednoduché případy: 1. Jestliže jsou shluky identické (x 1 = x 2, B 1 = B 2 ), pak B 1 1 A = 1 (neplatí naopak). 2. Jestliže shluky nejsou identické, x 1 = x 2 a B 2 = 0, pak B 1 1 A = n 1 n 1 +n Jestliže B 1, pak B 1 1 A = n 1 n 1 +n Jestliže B 2 0 a rozdíl x 1 x 2 je jedním z bázových vektorů B 1 pak B 1 1 A = n 1 n 1 +n 2. 1, 15
19 Význam směru daného maximálním vlastním číslem je patrný na obr. 5. Úhel α zde určuje takový směr, v němž bude minimum z poměrů { a b 1, a b 2 } maximální. Rozptyl mezi třídami je zde označen a, rozptyly uvnitř tříd b 1, b 2. y a Shluk 1 b 1 Reprezentace shluku 1 a 2 dohromady Shluk 2 b 2 α Obrázek 5: Znázornění rozptylů daných úhlem α ve dvou-dimenzionálním prostoru. x 16
20 0.06 Priznaky cislo "zdrava" trida LT trida 0.04 priznak priznak 1 (a) Vzorky 21 21, kombinace H1 H3 1 Priznaky cislo "zdrava" trida LT trida 0.8 priznak priznak 3 (b) Vzorky 31 31, kombinace H3 H4 Obrázek 6: Příznakový prostor pro nejlepší dvojici příznaků podle Fisherova lineárního diskriminantu. 17
21 14 x 10 3 Priznaky cislo priznak "zdrava" trida LT trida priznak 7 (a) Vzorky 21 21, kombinace H7 H9 10 x 10 3 Priznaky cislo priznak "zdrava" trida LT trida priznak 7 (b) Vzorky 31 31, kombinace H7 H9 Obrázek 7: Příznakový prostor pro nejhorší dvojici příznaků podle Fisherova lineárního diskriminantu. 18
22 Priznaky cislo "zdrava" trida LT trida 65 priznak priznak 3 0 priznak 1 (a) Vzorky 21 21, kombinace H1 H3 H6 Priznaky cislo priznak "zdrava" trida LT trida priznak priznak (b) Vzorky 31 31, kombinace H1 H2 H3 Obrázek 8: Příznakový prostor pro nejlepší trojici příznaků podle Fisherova lineárního diskriminantu. 19
23 Priznaky cislo x "zdrava" trida LT trida priznak priznak priznak (a) Vzorky 21 21, kombinace H1 H7 H9 Priznaky cislo x "zdrava" trida LT trida priznak priznak priznak (b) Vzorky 31 31, kombinace H1 H7 H9 Obrázek 9: Příznakový prostor pro nejhorší trojici příznaků podle Fisherova lineárního diskriminantu. 20
24 A.2 Stabilita x 10 3 Priznaky cislo "zdrava" trida LT trida 10 priznak priznak 4 priznak 2 (a) Vzorky 21 21, kombinace H2 H4 H9 Priznaky cislo x priznak "zdrava" trida LT trida priznak priznak (b) Vzorky 31 31, kombinace H5 H7 H9 Obrázek 10: Příznakový prostor pro trojici příznaků s největší stabilitou (klasifikace podle minimální vzdálenosti). 21
25 "zdrava" trida LT trida Vzorky obrazu s nejvetsi chybovosti (a) Kombinace příznaků H2 H4 H9, vzorky "zdrava" trida LT trida Vzorky obrazu s nejvetsi chybovosti Obrázek 11: Zvětšený příznakový prostor obrázku 10 se zvýrazněnými vzorky obrazu s největší chybovostí. (b) Kombinace příznaků H5 H7 H9, vzorky
26 A.3 Pořadí k-tic příznaků podle jednotlivých kritérií Tabulka 1: Hodnoty F pro samotné příznaky. Vzorky Vzorky Pořadí Příznak F Příznak F 1 H H H H H H H H H H H H H H H H H H
27 Tabulka 2: Hodnoty F pro kombinace 2 příznaků. Vzorky Vzorky Pořadí Příznaky H F Příznaky H F
28 Tabulka 3: Hodnoty F pro kombinace 3 příznaků. První tři kombinace s největší stabilitou jsou v tabulce zvýrazněny. Vzorky Vzorky Pořadí Příznaky H F Příznaky H F Druhá kombinace podle stability, vzorek První kombinace podle stability, vzorek
29 Vzorky Vzorky Pořadí Příznaky H F Příznaky H F Druhá kombinace podle stability, vzorek První kombinace podle stability, vzorek Třetí kombinace podle stability, vzorek
30 Vzorky Vzorky Pořadí Příznaky H F Příznaky H F Třetí kombinace podle stability, vzorek
31 Tabulka 4: Stabilita nejlepších kombinací příznaků ve 3D. Vzorky Vzorky H Stabilita [%] F H Stabilita [%] F
32 A.4 Seznam používaných funkcí Byla napsána funkce (gpolyline), která umožňuje expertovi označit v obrázku hranice štítné žlázy (oblast zájmu). Výstupem funkce je textový soubor, ve kterém je popsaná poloha vyznačené oblasti. Tento soubor je potom použit k pokrytí štítné žlázy sítí nepřekrývajících se čtverců (funkce sonocover1). Funkce sonocover pak pro všechny obrázky se stejnými vlastnostmi (diagnóza, zvětšení, orientace sondy) vytvoří datovou strukturu obsahující odděleně jednotlivé čtverce z těchto oblastí. Do této struktury je pak pomocí funkce calcfeat přidána položka, ve které jsou pro každý čtverec vypočtené hodnoty 9 příznaků. Dále byly implementovány funkce pro výpočet Fisherova lineárního diskriminantu a pro klasifikaci podle minimální vzdálenosti. Funkce fspace umožňuje prohlížení příznakového prostoru. gpolyline Prostředí pro kreslení kontur oblastí. coverroi Pokrytí uzavřených oblastí obrázku sítí nepřekrývajících se čtverců. sonocover1 Aplikování funkce coverroi na sonografický obrázek. sonocover Aplikování funkce sonocover1 na všechny specifikované sonografické obrázky (získání vzorků). calcfeat Výpočet 9 Haralickových příznaků ze vzorků získaných funkcí sonocover nebo sonocover1. fisher Výpočet Fisherova lineárního diskriminantu. combfisher Aplikace funkce fisher na specifikované kombinace 9 Haralickových příznaků. setsim Náhodně vybírá trénovací a testovací množinu z výstupu funkce calcfeat. mindist Klasifikátor podle minimální vzdálenosti (pro 2 třídy vzorků). combmindist Aplikování funkce mindist na specifikované kombinace příznaků. fspace Zobrazuje příznakový prostor pro 2 třídy vzorků. Předchozí seznam můžete vyvolat v Matlabu příkazem help Sono 29
33 A.5 Účastníci projektu Petr Sucharda Daniel Smutek Radim Šára Ladislava Janků Martin Švec 30
Analýza textury. Radim Šára Centrum strojového vnímání FEL ČVUT. DZO, R. Šára
Analýza textury Radim Šára Centrum strojového vnímání FEL ČVUT 1999 DZO, R. Šára DZO, R. Šára 1 Osnova prednášky 1. Co je to textura? 2. Motivační příklady. 3. Jak lze měřit vlastnosti textury? 4. Analytický
Úloha - rozpoznávání číslic
Úloha - rozpoznávání číslic Vojtěch Franc, Tomáš Pajdla a Tomáš Svoboda http://cmp.felk.cvut.cz 27. listopadu 26 Abstrakt Podpůrný text pro cvičení předmětu X33KUI. Vysvětluje tři způsoby rozpoznávání
Implementace Bayesova kasifikátoru
Implementace Bayesova kasifikátoru a diskriminačních funkcí v prostředí Matlab J. Havlík Katedra teorie obvodů Fakulta elektrotechnická České vysoké učení technické v Praze Technická 2, 166 27 Praha 6
Kybernetika a umělá inteligence, cvičení 10/11
Kybernetika a umělá inteligence, cvičení 10/11 Program 1. seminární cvičení: základní typy klasifikátorů a jejich princip 2. počítačové cvičení: procvičení na problému rozpoznávání číslic... body za aktivitu
Maticí typu (m, n), kde m, n jsou přirozená čísla, se rozumí soubor mn veličin a jk zapsaných do m řádků a n sloupců tvaru:
3 Maticový počet 3.1 Zavedení pojmu matice Maticí typu (m, n, kde m, n jsou přirozená čísla, se rozumí soubor mn veličin a jk zapsaných do m řádků a n sloupců tvaru: a 11 a 12... a 1k... a 1n a 21 a 22...
MATEMATICKÁ STATISTIKA - XP01MST
MATEMATICKÁ STATISTIKA - XP01MST 1. Úvod. Matematická statistika (statistics) se zabývá vyšetřováním zákonitostí, které v sobě obsahují prvek náhody. Zpracováním hodnot, které jsou výstupem sledovaného
Obr. 1: Vizualizace dat pacientů, kontrolních subjektů a testovacího subjektu.
Řešení příkladu - klasifikace testovacího subjektu pomocí Bayesova klasifikátoru: ata si vizualizujeme (Obr. ). Objem mozkových komor 9 8 7 6 5 pacienti kontroly testovací subjekt 5 6 Objem hipokampu Obr.
Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze
Dobývání znalostí Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze Dobývání znalostí Pravděpodobnost a učení Doc. RNDr. Iveta Mrázová,
11 Analýza hlavních komponet
11 Analýza hlavních komponet Tato úloha provádí transformaci měřených dat na menší počet tzv. fiktivních dat tak, aby většina informace obsažená v původních datech zůstala zachována. Jedná se tedy o úlohu
Jednofaktorová analýza rozptylu
I I.I Jednofaktorová analýza rozptylu Úvod Jednofaktorová analýza rozptylu (ANOVA) se využívá při porovnání několika středních hodnot. Často se využívá ve vědeckých a lékařských experimentech, při kterých
a počtem sloupců druhé matice. Spočítejme součin A.B. Označme matici A.B = M, pro její prvky platí:
Řešené příklady z lineární algebry - část 1 Typové příklady s řešením Příklady jsou určeny především k zopakování látky před zkouškou, jsou proto řešeny se znalostmi učiva celého semestru. Tento fakt se
(Cramerovo pravidlo, determinanty, inverzní matice)
KMA/MAT1 Přednáška a cvičení, Lineární algebra 2 Řešení soustav lineárních rovnic se čtvercovou maticí soustavy (Cramerovo pravidlo, determinanty, inverzní matice) 16 a 21 října 2014 V dnešní přednášce
Náhodný vektor a jeho charakteristiky
Náhodný vektor a jeho číselné charakteristiky 1 Náhodný vektor a jeho charakteristiky V následující kapitole budeme věnovat pozornost pouze dvourozměřnému náhodnému vektoru, i když uvedené pojmy a jejich
Matematika (CŽV Kadaň) aneb Úvod do lineární algebry Matice a soustavy rovnic
Přednáška třetí (a pravděpodobně i čtvrtá) aneb Úvod do lineární algebry Matice a soustavy rovnic Lineární rovnice o 2 neznámých Lineární rovnice o 2 neznámých Lineární rovnice o dvou neznámých x, y je
MATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci
MATEMATICKÁ STATISTIKA Dana Černá http://www.fp.tul.cz/kmd/ Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci Matematická statistika Matematická statistika se zabývá matematickým
Řešení příkladu - klasifikace testovacího subjektu podle minimální vzdálenosti:
Řešení příkladu - klasifikace testovacího subjektu podle minimální vzdálenosti: Postup: I) zvolení metriky pro výpočet vzdáleností dvou bodů II) zvolení metriky pro určení vzdálenosti mezi dvěma množinami
Obecné, centrální a normované momenty
Obecné, centrální a normované momenty Obsah kapitoly 4. Elementární statistické zpracování - parametrizace vhodnými empirickými parametry Studijní cíle Naučit se počítat centrální a normované momenty pomocí
vyjádřete ve tvaru lineární kombinace čtverců (lineární kombinace druhých mocnin). Rozhodněte o definitnosti kvadratické formy κ(x).
Řešené příklady z lineární algebry - část 6 Typové příklady s řešením Příklad 6.: Kvadratickou formu κ(x) = x x 6x 6x x + 8x x 8x x vyjádřete ve tvaru lineární kombinace čtverců (lineární kombinace druhých
Vektory a matice. Obsah. Aplikovaná matematika I. Carl Friedrich Gauss. Základní pojmy a operace
Vektory a matice Aplikovaná matematika I Dana Říhová Mendelu Brno Obsah 1 Vektory Základní pojmy a operace Lineární závislost a nezávislost vektorů 2 Matice Základní pojmy, druhy matic Operace s maticemi
a způsoby jejího popisu Ing. Michael Rost, Ph.D.
Podmíněná pravděpodobnost, náhodná veličina a způsoby jejího popisu Ing. Michael Rost, Ph.D. Podmíněná pravděpodobnost Pokud je jev A vázán na uskutečnění jevu B, pak tento jev nazýváme jevem podmíněným
1 Linearní prostory nad komplexními čísly
1 Linearní prostory nad komplexními čísly V této přednášce budeme hledat kořeny polynomů, které se dále budou moci vyskytovat jako složky vektorů nebo matic Vzhledem k tomu, že kořeny polynomu (i reálného)
0.1 Úvod do lineární algebry
Matematika KMI/PMATE 1 01 Úvod do lineární algebry 011 Lineární rovnice o 2 neznámých Definice 011 Lineární rovnice o dvou neznámých x, y je rovnice, která může být vyjádřena ve tvaru ax + by = c, kde
Jana Vránová, 3. lékařská fakulta UK
Jana Vránová, 3. lékařská fakulta UK Vznikají při zkoumání vztahů kvalitativních resp. diskrétních znaků Jedná se o analogii s korelační analýzou spojitých znaků Přitom předpokládáme, že každý prvek populace
Pravděpodobnost a aplikovaná statistika
Pravděpodobnost a aplikovaná statistika MGR. JANA SEKNIČKOVÁ, PH.D. 2. KAPITOLA PODMÍNĚNÁ PRAVDĚPODOBNOST 3. KAPITOLA NÁHODNÁ VELIČINA 9.11.2017 Opakování Uveďte příklad aplikace geometrické definice pravděpodobnosti
Rozdělování dat do trénovacích a testovacích množin
Rozdělování dat do trénovacích a testovacích množin Marcel Jiřina Rozpoznávání je důležitou metodou při zpracování reálných úloh. Rozpoznávání je definováno dvěma kroky a to pořízením dat o reálném rozpoznávaném
Statistická analýza jednorozměrných dat
Statistická analýza jednorozměrných dat Prof. RNDr. Milan Meloun, DrSc. Univerzita Pardubice, Pardubice 31.ledna 2011 Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem
VÍCEKRITERIÁLNÍ ROZHODOVANÍ
VÍCEKRITERIÁLNÍ ROZHODOVANÍ 1 Obsah Typy modelů vícekriteriálního rozhodování Základní pojmy Typy informací Cíl modelů Užitek, funkce užitku Grafické zobrazení Metody vícekriteriální analýzy variant 2
Matematika 1 MA1. 2 Determinant. 3 Adjungovaná matice. 4 Cramerovo pravidlo. 11. přednáška ( ) Matematika 1 1 / 29
Matematika 1 11. přednáška MA1 1 Opakování 2 Determinant 3 Adjungovaná matice 4 Cramerovo pravidlo 5 Vlastní čísla a vlastní vektory matic 6 Zkouška; konzultace; výběrová matematika;... 11. přednáška (15.12.2010
Aplikovaná numerická matematika
Aplikovaná numerická matematika 6. Metoda nejmenších čtverců doc. Ing. Róbert Lórencz, CSc. České vysoké učení technické v Praze Fakulta informačních technologií Katedra počítačových systémů Příprava studijních
Vícerozměrné statistické metody
Vícerozměrné statistické metody Vícerozměrné statistické rozdělení a testy, operace s vektory a maticemi Jiří Jarkovský, Simona Littnerová FSTA: Pokročilé statistické metody Vícerozměrné statistické rozdělení
Základy popisné statistiky
Základy popisné statistiky Michal Fusek Ústav matematiky FEKT VUT, fusekmi@feec.vutbr.cz 8. přednáška z ESMAT Michal Fusek (fusekmi@feec.vutbr.cz) 1 / 26 Obsah 1 Základy statistického zpracování dat 2
VI. Maticový počet. VI.1. Základní operace s maticemi. Definice. Tabulku
VI Maticový počet VI1 Základní operace s maticemi Definice Tabulku a 11 a 12 a 1n a 21 a 22 a 2n, a m1 a m2 a mn kde a ij R, i = 1,, m, j = 1,, n, nazýváme maticí typu m n Zkráceně zapisujeme (a ij i=1m
0.1 Úvod do lineární algebry
Matematika KMI/PMATE 1 01 Úvod do lineární algebry 011 Vektory Definice 011 Vektorem aritmetického prostorur n budeme rozumět uspořádanou n-tici reálných čísel x 1, x 2,, x n Definice 012 Definice sčítání
13 Barvy a úpravy rastrového
13 Barvy a úpravy rastrového Studijní cíl Tento blok je věnován základním metodám pro úpravu rastrového obrazu, jako je např. otočení, horizontální a vertikální překlopení. Dále budo vysvětleny různé metody
Testování hypotéz o parametrech regresního modelu
Testování hypotéz o parametrech regresního modelu Ekonometrie Jiří Neubauer Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra UO
Testování hypotéz o parametrech regresního modelu
Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Lineární regresní model kde Y = Xβ + e, y 1 e 1 β y 2 Y =., e = e 2 x 11 x 1 1k., X =....... β 2,
6. Vektorový počet Studijní text. 6. Vektorový počet
6. Vektorový počet Budeme se pohybovat v prostoru R n, což je kartézská mocnina množiny reálných čísel R; R n = R R. Obvykle nám bude stačit omezení na případy n = 1, 2, 3; nicméně teorie je platná obecně.
Momenty setrvačnosti a deviační momenty
Momenty setrvačnosti a deviační momenty Momenty setrvačnosti a deviační momenty charakterizují spolu shmotností a statickými momenty hmoty rozložení hmotnosti tělesa vprostoru. Jako takové se proto vyskytují
V předchozí kapitole jsme podstatným způsobem rozšířili naši představu o tom, co je to číslo. Nadále jsou pro nás důležité především vlastnosti
Kapitola 5 Vektorové prostory V předchozí kapitole jsme podstatným způsobem rozšířili naši představu o tom, co je to číslo. Nadále jsou pro nás důležité především vlastnosti operací sčítání a násobení
Přednáška 13 Redukce dimenzionality
Vytěžování Dat Přednáška 13 Redukce dimenzionality Miroslav Čepek Fakulta Elektrotechnická, ČVUT Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti ČVUT (FEL) Redukce dimenzionality 1 /
DEFINICE Z LINEÁRNÍ ALGEBRY
DEFINICE Z LINEÁRNÍ ALGEBRY Skripta Matematické metody pro statistiku a operační výzkum (Nešetřilová, H., Šařecová, P., 2009). 1. definice Vektorovým prostorem rozumíme neprázdnou množinu prvků V, na které
Klasifikace a rozpoznávání. Lineární klasifikátory
Klasifikace a rozpoznávání Lineární klasifikátory Opakování - Skalární součin x = x1 x 2 w = w T x = w 1 w 2 x 1 x 2 w1 w 2 = w 1 x 1 + w 2 x 2 x. w w T x w Lineární klasifikátor y(x) = w T x + w 0 Vyber
Vícerozměrná rozdělení
Vícerozměrná rozdělení 7. září 0 Učivo: Práce s vícerozměrnými rozděleními. Sdružené, marginální, podmíněné rozdělení pravděpodobnosti. Vektorová střední hodnota. Kovariance, korelace, kovarianční matice.
1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.
Testy hypotéz na základě více než 2 výběrů 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Testy hypotéz na základě více než 2 výběrů Na analýzu rozptylu lze pohlížet v podstatě
Statistická teorie učení
Statistická teorie učení Petr Havel Marek Myslivec přednáška z 9. týdne 1 Úvod Představme si situaci výrobce a zákazníka, který si u výrobce objednal algoritmus rozpoznávání. Zákazník dodal experimentální
Vlastnosti pravděpodobnosti, geometrická pravděpodobnost
Vlastnosti pravděpodobnosti, geometrická pravděpodobnost 1. Přátelé Igor a Dano si domluví schůzku mezi 9.00 a 10.00. Jejich příchody na dané místo jsou náhodné v rámci smluveného časového intervalu. Každý
Reporting. Ukazatele je možno definovat nad libovolnou tabulkou Helios Orange, která je zapsána v nadstavbě firmy SAPERTA v souboru tabulek:
Finanční analýza Pojem finanční analýza Finanční analýza umožňuje načítat data podle dimenzí a tyto součty dlouhodobě vyhodnocovat. Pojem finanční analýza není nejpřesnější, protože ukazatele mohou být
Analýza rozptylu. Ekonometrie. Jiří Neubauer. Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel
Analýza rozptylu Ekonometrie Jiří Neubauer Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra UO Brno) Analýza rozptylu 1 / 30 Analýza
letní semestr Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika vektory
Šárka Hudecová Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy letní semestr 202 Založeno na materiálech doc. Michala Kulicha Náhodný vektor často potřebujeme
2D transformací. červen Odvození transformačního klíče vybraných 2D transformací Metody vyrovnání... 2
Výpočet transformačních koeficinetů vybraných 2D transformací Jan Ježek červen 2008 Obsah Odvození transformačního klíče vybraných 2D transformací 2 Meto vyrovnání 2 2 Obecné vyjádření lineárních 2D transformací
příkladů do cvičení. V textu se objeví i pár detailů, které jsem nestihl (na které jsem zapomněl) a(b u) = (ab) u, u + ( u) = 0 = ( u) + u.
Několik řešených příkladů do Matematiky Vektory V tomto textu je spočteno několik ukázkových příkladů které vám snad pomohou při řešení příkladů do cvičení. V textu se objeví i pár detailů které jsem nestihl
AVDAT Mnohorozměrné metody, metody klasifikace
AVDAT Mnohorozměrné metody, metody klasifikace Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Mnohorozměrné metody Regrese jedna náhodná veličina je vysvětlována pomocí jiných
MATICE. a 11 a 12 a 1n a 21 a 22 a 2n A = = [a ij]
MATICE Matice typu m/n nad tělesem T je soubor m n prvků z tělesa T uspořádaných do m řádků a n sloupců: a 11 a 12 a 1n a 21 a 22 a 2n A = = [a ij] a m1 a m2 a mn Prvek a i,j je prvek matice A na místě
Statistika, Biostatistika pro kombinované studium. Jan Kracík
Statistika, Biostatistika pro kombinované studium Letní semestr 2014/2015 Tutoriál č. 6: ANOVA Jan Kracík jan.kracik@vsb.cz Obsah: Testování hypotéz opakování ANOVA Testování hypotéz (opakování) Testování
1. Náhodný vektor (X, Y ) má diskrétní rozdělení s pravděpodobnostní funkcí p, kde. p(x, y) = a(x + y + 1), x, y {0, 1, 2}.
VIII. Náhodný vektor. Náhodný vektor (X, Y má diskrétní rozdělení s pravděpodobnostní funkcí p, kde p(x, y a(x + y +, x, y {,, }. a Určete číslo a a napište tabulku pravděpodobnostní funkce p. Řešení:
STATISTICKÉ ODHADY Odhady populačních charakteristik
STATISTICKÉ ODHADY Odhady populačních charakteristik Jak stanovit charakteristiky rozložení sledované veličiny v základní populaci? Populaci většinou nemáme celou k dispozici, musíme se spokojit jen s
Teorie náhodných matic aneb tak trochu jiná statistika
Teorie náhodných matic aneb tak trochu jiná statistika B. Vlková 1, M.Berg 2, B. Martínek 3, O. Švec 4, M. Neumann 5 Gymnázium Uničov 1, Gymnázium Václava Hraběte Hořovice 2, Mendelovo gymnázium Opava
MATEMATICKÉ PRINCIPY VÍCEROZMĚRNÉ ANALÝZY DAT
8. licenční studium Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie MATEMATICKÉ PRINCIPY VÍCEROZMĚRNÉ ANALÝZY DAT Příklady: ) Najděte vlastní (charakteristická) čísla a vlastní
Základy teorie pravděpodobnosti
Základy teorie pravděpodobnosti Náhodná veličina Roman Biskup (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at)email.cz 12. února 2012 Statistika by Birom Základy teorie
1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.
Prostá regresní a korelační analýza 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Problematika závislosti V podstatě lze rozlišovat mezi závislostí nepodstatnou, čili náhodnou
Profilování vzorků heroinu s využitím vícerozměrné statistické analýzy
Profilování vzorků heroinu s využitím vícerozměrné statistické analýzy Autor práce : RNDr. Ivo Beroun,CSc. Vedoucí práce: prof. RNDr. Milan Meloun, DrSc. PROFILOVÁNÍ Profilování = klasifikace a rozlišování
AKM CVIČENÍ. Opakování maticové algebry. Mějme matice A, B regulární, potom : ( AB) = B A
AKM - 1-2 CVIČENÍ Opakování maticové algebry Mějme matice A, B regulární, potom : ( AB) = B A 1 1 ( A ) = ( A ) ( A ) = A ( A + B) = A + B 1 1 1 ( AB) = B A, kde A je řádu mxn a B nxk Čtvercová matice
Jana Vránová, 3.lékařská fakulta UK, Praha. Hypotézy o populacích
Jana Vránová, 3.lékařská fakulta UK, Praha Hypotézy o populacích Příklad IQ test: Předpokládejme, že z nějakého důvodu ministerstvo školství věří, že studenti absolventi středních škol v Hradci Králové
Symetrické a kvadratické formy
Symetrické a kvadratické formy Aplikace: klasifikace kvadrik(r 2 ) a kvadratických ploch(r 3 ), optimalizace(mpi) BI-LIN (Symetrické a kvadratické formy) 1 / 20 V celé přednášce uvažujeme číselné těleso
Matice. Je dána matice A R m,n, pak máme zobrazení A : R n R m.
Matice lineárních zobrazení [1] Připomenutí Zobrazení A : L 1 L 2 je lineární, když A( x + y ) = A( x ) + A( y ), A(α x ) = α A( x ). Což je ekvivalentní s principem superpozice: A(α 1 x 1 + + α n x n
Statistika pro geografy
Statistika pro geografy 2. Popisná statistika Mgr. David Fiedor 23. února 2015 Osnova 1 2 3 Pojmy - Bodové rozdělení četností Absolutní četnost Absolutní četností hodnoty x j znaku x rozumíme počet statistických
Necht L je lineární prostor nad R. Operaci : L L R nazýváme
Skalární součin axiomatická definice odvození velikosti vektorů a úhlu mezi vektory geometrická interpretace ortogonalita vlastnosti ortonormálních bázi [1] Definice skalárního součinu Necht L je lineární
Obsah přednášky Jaká asi bude chyba modelu na nových datech?
Obsah přednášky Jaká asi bude chyba modelu na nových datech? Chyba modelu Bootstrap Cross Validation Vapnik-Chervonenkisova dimenze 2 Chyba skutečná a trénovací Máme 30 záznamů, rozhodli jsme se na jejich
Chyby měření 210DPSM
Chyby měření 210DPSM Jan Zatloukal Stručný přehled Zdroje a druhy chyb Systematické chyby měření Náhodné chyby měření Spojité a diskrétní náhodné veličiny Normální rozdělení a jeho vlastnosti Odhad parametrů
2. Určete jádro KerL zobrazení L, tj. nalezněte alespoň jednu jeho bázi a určete jeho dimenzi.
Řešené příklady z lineární algebry - část 3 Typové příklady s řešením Příklad 3.1: Zobrazení L: P 3 R 23 je zobrazení z prostoru P 3 všech polynomů do stupně 3 (včetně nulového polynomu) do prostoru R
EUKLIDOVSKÉ PROSTORY
EUKLIDOVSKÉ PROSTORY Necht L je lineární vektorový prostor nad tělesem reálných čísel R. Zobrazení (.,.) : L L R splňující vlastnosti 1. (x, x) 0 x L, (x, x) = 0 x = 0, 2. (x, y) = (y, x) x, y L, 3. (λx,
Zpracování digitalizovaného obrazu (ZDO) - Popisy III
Zpracování digitalizovaného obrazu (ZDO) - Popisy III Statistické popisy tvaru a vzhledu Ing. Zdeněk Krňoul, Ph.D. Katedra Kybernetiky Fakulta aplikovaných věd Západočeská univerzita v Plzni Zpracování
Úvod do lineární algebry
Úvod do lineární algebry 1 Aritmetické vektory Definice 11 Mějme n N a utvořme kartézský součin R n R R R Každou uspořádanou n tici x 1 x 2 x, x n budeme nazývat n rozměrným aritmetickým vektorem Prvky
Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D.
Problematika analýzy rozptylu Ing. Michael Rost, Ph.D. Úvod do problému Již umíte testovat shodu dvou středních hodnot prostřednictvím t-testů. Otázka: Jaké předpoklady musí být splněny, abyste mohli použít
AVDAT Vektory a matice
AVDAT Vektory a matice Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Vektory x = x 1 x 2. x p y = y 1 y 2. y p Řádkový vektor dostaneme transpozicí sloupcového vektoru x
FP - SEMINÁŘ Z NUMERICKÉ MATEMATIKY. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci
FP - SEMINÁŘ Z NUMERICKÉ MATEMATIKY Dana Černá http://www.fp.tul.cz/kmd/ Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci OBSAH A CÍLE SEMINÁŘE: Opakování a procvičení vybraných
Poznámky k předmětu Aplikovaná statistika, 4. téma
Poznámky k předmětu Aplikovaná statistika, 4. téma 4. Náhodné vektory V praxi se nám může hodit postihnout více vlastností jednoho objektu najednou, např. výšku, váhu a pohlaví člověka; rychlost chemické
Základy maticového počtu Matice, determinant, definitnost
Základy maticového počtu Matice, determinant, definitnost Petr Liška Masarykova univerzita 18.9.2014 Matice a vektory Matice Matice typu m n je pravoúhlé (nebo obdélníkové) schéma, které má m řádků a n
1 Vektorové prostory.
1 Vektorové prostory DefiniceMnožinu V, jejíž prvky budeme označovat a, b, c, z, budeme nazývat vektorovým prostorem právě tehdy, když budou splněny následující podmínky: 1 Je dáno zobrazení V V V, které
7. Analýza rozptylu.
7. Analýza rozptylu. Uvedeme obecnou ideu, která je založena na minimalizaci chyby metodou nejmenších čtverců. Nejdříve uvedeme několik základních tvrzení. Uvažujeme náhodný vektor Y = (Y, Y,..., Y n a
Vytyčení polohy bodu polární metodou
Obsah Vytyčení polohy bodu polární metodou... 2 1 Vliv měření na přesnost souřadnic... 3 2 Vliv měření na polohovou a souřadnicovou směrodatnou odchylku... 4 3 Vliv podkladu na přesnost souřadnic... 5
CVIČNÝ TEST 37. OBSAH I. Cvičný test 2. Mgr. Tomáš Kotler. II. Autorské řešení 5 III. Klíč 13 IV. Záznamový list 15
CVIČNÝ TEST 37 Mgr. Tomáš Kotler OBSAH I. Cvičný test 2 II. Autorské řešení 5 III. Klíč 13 IV. Záznamový list 15 I. CVIČNÝ TEST VÝCHOZÍ TEXT A OBRÁZEK K ÚLOZE 1 Na staré hliněné desce je namalován čtverec
cv3.tex. Vzorec pro úplnou pravděpodobnost
3 cvičení - pravděpodobnost 2102018 18cv3tex n i=1 Vzorec pro úplnou pravděpodobnost Systém náhodných jevů nazýváme úplným, jestliže pro něj platí: B i = 1 a pro i k je B i B k = 0 Jestliže je (Ω, A, P
KGG/STG Statistika pro geografy
KGG/STG Statistika pro geografy 4. Teoretická rozdělení Mgr. David Fiedor 9. března 2015 Osnova Úvod 1 Úvod 2 3 4 5 Vybraná rozdělení náhodných proměnných normální rozdělení normované normální rozdělení
Vektorové podprostory, lineární nezávislost, báze, dimenze a souřadnice
Vektorové podprostory, lineární nezávislost, báze, dimenze a souřadnice Vektorové podprostory K množina reálných nebo komplexních čísel, U vektorový prostor nad K. Lineární kombinace vektorů u 1, u 2,...,u
Náhodný vektor. Náhodný vektor. Hustota náhodného vektoru. Hustota náhodného vektoru. Náhodný vektor je dvojice náhodných veličin (X, Y ) T = ( X
Náhodný vektor Náhodný vektor zatím jsme sledovali jednu náhodnou veličinu, její rozdělení a charakteristiky často potřebujeme vyšetřovat vzájemný vztah několika náhodných veličin musíme sledovat jejich
[1] Determinant. det A = 0 pro singulární matici, det A 0 pro regulární matici
[1] Determinant je číslo jistým způsobem charakterizující čtvercovou matici det A = 0 pro singulární matici, det A 0 pro regulární matici používá se při řešení lineárních soustav... a v mnoha dalších aplikacích
Kontingenční tabulky v MS Excel 2010
Kontingenční tabulky v MS Excel 2010 Autor: RNDr. Milan Myšák e-mail: milan.mysak@konero.cz Obsah 1 Vytvoření KT... 3 1.1 Data pro KT... 3 1.2 Tvorba KT... 3 2 Tvorba KT z dalších zdrojů dat... 5 2.1 Data
veličin, deskriptivní statistika Ing. Michael Rost, Ph.D.
Vybraná rozdělení spojitých náhodných veličin, deskriptivní statistika Ing. Michael Rost, Ph.D. Třídění Základním zpracováním dat je jejich třídění. Jde o uspořádání získaných dat, kde volba třídícího
Náhodná veličina Číselné charakteristiky diskrétních náhodných veličin Spojitá náhodná veličina. Pravděpodobnost
Pravděpodobnost Náhodné veličiny a jejich číselné charakteristiky Petr Liška Masarykova univerzita 19.9.2014 Představme si, že provádíme pokus, jehož výsledek dokážeme ohodnotit číslem. Před provedením
Apriorní rozdělení. Jan Kracík.
Apriorní rozdělení Jan Kracík jan.kracik@vsb.cz Apriorní rozdělení Apriorní rozdělení (spolu s modelem) reprezentuje informaci o neznámém parametru θ, která je dostupná předem, tj. bez informace z dat.
Vytěžování znalostí z dat
Pavel Kordík, Jan Motl (ČVUT FIT) Vytěžování znalostí z dat BI-VZD, 2012, Přednáška 1 1/32 Vytěžování znalostí z dat Pavel Kordík, Jan Motl Department of Computer Systems Faculty of Information Technology
P 1 = P 1 1 = P 1, P 1 2 =
1 Výpočet inverzní matice Věta 1 Necht P U elementární matice vzniklá el úpravou U Pak je P U regulární Důkaz: Protože elementární úprava U je invertovatelná, existuje el úprava U, která vrací změny U
STANOVENÍ SPOLEHLIVOSTI GEOTECHNICKÝCH KONSTRUKCÍ. J. Pruška, T. Parák
STANOVENÍ SPOLEHLIVOSTI GEOTECHNICKÝCH KONSTRUKCÍ J. Pruška, T. Parák OBSAH: 1. Co je to spolehlivost, pravděpodobnost poruchy, riziko. 2. Deterministický a pravděpodobnostní přístup k řešení problémů.
Determinant. Definice determinantu. Permutace. Permutace, vlastnosti. Definice: Necht A = (a i,j ) R n,n je čtvercová matice.
[] Definice determinantu BI-LIN, determinant, 9, P Olšák [2] Determinant je číslo jistým způsobem charakterizující čtvercovou matici det A 0 pro singulární matici, det A 0 pro regulární matici používá
NÁHODNÝ VEKTOR. 4. cvičení
NÁHODNÝ VEKTOR 4. cvičení Náhodný vektor Náhodným vektorem rozumíme sloupcový vektor X=(X, X,, X n ) složený z náhodných veličin X, X,, X n, který je charakterizován sdruženým rozdělením pravděpodobnosti.
Vlastnosti a modelování aditivního
Vlastnosti a modelování aditivního bílého šumu s normálním rozdělením kacmarp@fel.cvut.cz verze: 0090913 1 Bílý šum s normálním rozdělením V této kapitole se budeme zabývat reálným gaussovským šumem n(t),
AVDAT Mnohorozměrné metody metody redukce dimenze
AVDAT Mnohorozměrné metody metody redukce dimenze Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Opakování vlastní čísla a vlastní vektory A je čtvercová matice řádu n. Pak
Základy matematiky pro FEK
Základy matematiky pro FEK 2. přednáška Blanka Šedivá KMA zimní semestr 2016/2017 Blanka Šedivá (KMA) Základy matematiky pro FEK zimní semestr 2016/2017 1 / 20 Co nás dneska čeká... Závislé a nezávislé
Poznámky k předmětu Aplikovaná statistika, 4. téma
Poznámky k předmětu Aplikovaná statistika, 4. téma 4. Náhodné vektory V praxi se nám může hodit postihnout více vlastností jednoho objektu najednou, např. výšku, váhu a pohlaví člověka; rychlost chemické