DZD DPZ 9 Klasifikace. Doc. Dr. Ing. Jiří Horák - Ing. Tomáš Peňáz, Ph.D. Institut geoinformatiky VŠB-TU Ostrava

Podobné dokumenty
Dálkový průzkum Země. Ústav geoinformačních technologií Lesnická a dřevařská fakulta MENDELU

Dálkový průzkum Země. Klasifikace obrazu

Analýza dat v GIS. Dotazy na databáze. Překrytí Overlay Mapová algebra Vzdálenostní funkce. Funkce souvislosti Interpolační funkce Topografické funkce

Kybernetika a umělá inteligence, cvičení 10/11

GIS ANALÝZA VLIVU DÁLNIČNÍ SÍTĚ NA OKOLNÍ KRAJINU. Veronika Berková 1

Jasové transformace. Karel Horák. Rozvrh přednášky:

Metody zvýrazňování obrazu III. Vícepásmová zvýraznění. Spektrální příznaky. Příznakový prostor. Podstata vícepásmových zvýraznění

Algoritmy a struktury neuropočítačů ASN - P11

Úvodem Dříve les než stromy 3 Operace s maticemi

Vícerozměrné statistické metody

POROVNÁNÍ PER-PIXEL KLASIFIKÁTORŮ PRO IDENTIFIKACI ZÁSTAVBY

Možnosti podpory plošné inventarizace kontaminovaných míst interpretací multi- a hyperspektrálního snímkování Jana Petruchová Lenka Jirásková

Grafický a číselný popis rozložení dat 3.1 Způsoby zobrazení dat Metody zobrazení kvalitativních a ordinálních dat Metody zobrazení kvan

Neuronové sítě v DPZ

Č ást 2 Kompozice v nepravých barvách Datové formáty Neřízená klasifikace. Program přednášky

ŘÍZENÁ KLASIFIKACE. verze 1.0. autor listu: Lucie Červená

Vybrané přístupy řešení neurčitosti

Úloha - rozpoznávání číslic

1. Vlastnosti diskretních a číslicových metod zpracování signálů... 15

KVALITA DAT POUŽITÁ APLIKACE. Správnost výsledku použití GIS ovlivňuje:

Usuzování za neurčitosti

Operace s obrazem II

GIS Geografické informační systémy

DZDDPZ8 Fourierova t., spektrální zvýraznění. Doc. Dr. Ing. Jiří Horák - Ing. Tomáš Peňáz, Ph.D. Institut geoinformatiky VŠB-TU Ostrava

Profilování vzorků heroinu s využitím vícerozměrné statistické analýzy

ANALÝZA A KLASIFIKACE DAT

Katedra kybernetiky laboratoř Inteligentní Datové Analýzy (IDA) Katedra počítačů, Computational Intelligence Group

Algoritmy a struktury neuropočítačů ASN - P10. Aplikace UNS v biomedicíně

Využití digitální stereofotogrammetrie jako podpůrných dat pro automatizovanou tvorbu lesnických tematických map

Strojové učení a dolování dat. Vybrané partie dolování dat 2016/17 Jan Šimbera

Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D.

ZÍSKÁVÁNÍ ZNALOSTÍ Z DATABÁZÍ

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze

Obr. 1: Vizualizace dat pacientů, kontrolních subjektů a testovacího subjektu.

Hledání optimální polohy stanic a zastávek na tratích regionálního významu

Přednáška 13 Redukce dimenzionality

Ing. Petr Hájek, Ph.D. Podpora přednášky kurzu Aplikace umělé inteligence

GIS Geografické informační systémy

Pravděpodobnost, náhoda, kostky

ZÍSKÁVÁNÍ ZNALOSTÍ Z DATABÁZÍ

STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky)

verze 1.0 autor listu: Lucie Červená

Shluková analýza dat a stanovení počtu shluků

Pravděpodobnost, náhoda, kostky

Zápočtová práce STATISTIKA I

Statistické metody - nástroj poznání a rozhodování anebo zdroj omylů a lží

DPZ. Program přednášky. Č ást 3 Řízená klasifikace Spektrální indexy. Řízená klasifikace. Spektrální indexy. Aplikace DPZ v geografii

vzorek vzorek

Objektově orientovaná fuzzy klasifikace krajinného pokryvu (land cover) se zaměřením na zemědělskou krajinu

Základy popisné statistiky. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

Stanovení nejistot při výpočtu kontaminace zasaženého území

ELEKTROMAGNETICKÉ SPEKTRUM PRO POTŘEBY DPZ

Automatická detekce anomálií při geofyzikálním průzkumu. Lenka Kosková Třísková NTI TUL Doktorandský seminář,

Regresní analýza 1. Regresní analýza

Požadavky k písemné přijímací zkoušce z matematiky do navazujícího magisterského studia pro neučitelské obory

Algoritmy a struktury neuropočítačů ASN P3

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze

OSA. maximalizace minimalizace 1/22

Rozdělování dat do trénovacích a testovacích množin

Obsah přednášky Jaká asi bude chyba modelu na nových datech?

Bakalářské studium na MFF UK v Praze Obecná matematika Zaměření: Stochastika. 1 Úvodní poznámky. Verze: 13. června 2013

UČENÍ BEZ UČITELE. Václav Hlaváč

Úvod do zpracování signálů

Statistika. Regresní a korelační analýza Úvod do problému. Roman Biskup

Měření dat Filtrace dat, Kalmanův filtr

KALIBRACE. Definice kalibrace: mezinárodní metrologický slovník (VIM 3)

Mann-Whitney U-test. Znaménkový test. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

Kartografické modelování. VIII Modelování vzdálenosti

Klasifikace a rozpoznávání. Bayesovská rozhodovací teorie

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Zpracování digitalizovaného obrazu (ZDO) - Segmentace II

Diskriminační analýza hodnocení rozdílů mezi 2 nebo více skupinami objektů charakterizovanými více znaky

Tématické okruhy pro státní závěrečné zkoušky. bakalářské studium. studijní obor "Management jakosti"

AVDAT Mnohorozměrné metody, metody klasifikace

TECHNICKÁ UNIVERZITA V LIBERCI

Václav Jirchář, ZTGB

Simulace. Simulace dat. Parametry

VÝUKA SYSTÉMU IDRISI NA KATEDŘE GEOINFORMATIKY PŘÍRODOVĚDECKÉ FAKULTY UNIVERZITY PALACKÉHO V OLOMOUCI

Chyby měření 210DPSM

Grafika na počítači. Bc. Veronika Tomsová

Algoritmy a struktury neuropočítačů ASN P9 SVM Support vector machines Support vector networks (Algoritmus podpůrných vektorů)

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.

Metodika vymezení urbánního území na základě klasifikace dat dálkového průzkumu Země MET

U Úvod do modelování a simulace systémů

Systém rizikové analýzy při sta4ckém návrhu podzemního díla. Jan Pruška

Modifikace algoritmu FEKM

1. Číselné posloupnosti - Definice posloupnosti, základní vlastnosti, operace s posloupnostmi, limita posloupnosti, vlastnosti limit posloupností,

Klasifikace lesních porostů na základě kombinace dat z dálkového průzkumu Země

Ing. Alena Šafrová Drášilová, Ph.D.

veličin, deskriptivní statistika Ing. Michael Rost, Ph.D.

Mezinárodní konference Průmyslová ekologie II, Beroun

Regresní a korelační analýza

Analýza dat na PC I.

VYUŽITÍ PRAVDĚPODOBNOSTNÍ METODY MONTE CARLO V SOUDNÍM INŽENÝRSTVÍ

VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky

Tématické okruhy pro státní závěrečné zkoušky. bakalářské studium. studijní obor "Management jakosti"

PRAVDĚPODOBNOST A STATISTIKA

Tématické okruhy pro státní závěrečné zkoušky. bakalářské studium. studijní obor "Management jakosti"

Transkript:

DZD DPZ 9 Klasifikace Doc. Dr. Ing. Jiří Horák - Ing. Tomáš Peňáz, Ph.D. Institut geoinformatiky VŠB-TU Ostrava

Dobrovolný

Klasifikace obrazu proces extrahování tématické informace z kontinuálních dat

Informační třídy využitelná informace získaná zpracováním obrazových dat kategorie druhu zemského povrchu většinou nejsou přímo čitelná v obrazových datech (multispektrální obrazový záznam) získávají se nepřímo - prostřednictvím radiometrických vlastností pixelů/objektů

Dobrovolný

Klasifikátory prostorového chování princip klasifikace objektu nebo jevu na základě vztahu k okolním pixelům příznaky klasifikátorů prostorového chování textura vzájemná vzdálenost (proximity) velikost tvar opakovatelnost kontext

Klasifikátory časového chování princip klasifikace objektu nebo jevu na základě jeho časových změn významné při identifikaci rostlinných druhů (zemědělství a lesnictví) - prostorové a spektrální vlastnosti jsou nestálé využití obrazových záznamů z různých časových řezů

Klasifikátory spektrálního spektrální klasifikace chování princip klasifikace objektu nebo jevu na základě jeho spektrálního chování využití dat jednopásmových multispektrálních

Spektrální klasifikace (spectral classification) definice vzdálenosti v příznakovém prostoru výběr rozhodovacího pravidla výběr prahové hodnoty (viz rozhodovací pravidla)

Klasifikace s využitím jednopásmových dat v případě dostatečné separability spektrálních tříd v jednom pásmu použitelné techniky: prahování hustotní řezy viz radiometrické zvýraznění

Klasifikace s využitím multispektrálních dat spektrální odezva (spectral response)

Landsat TM

Klasifikace s využitím multispektrálních dat multispektrální prostor

Spektrální příznak (spectral signature) specifická kombinace emitovaného, odraženého nebo pohlceného EMG záření různých vlnových délek, která umožňuje jednoznačně určit objekt. charakteristika naměřená nebo vypočtená v určitých intervalech EMG spektra, potřebná pro identifikaci objektu nebo jevu

shluk pixelů (pixels cluster) Spektrální příznak (spectral signature)

Příznakový prostor definován všemi pásmy, v nichž lze naměřit nebo vypočíst určitou charakteristiku

Spektrální variabilita

Rozšíření příznakového prostoru významná etapa klasifikace příprava dat výběr a výpočet nejvhodnějších pásem pro klasifikaci odstranění korelace mezi jednotlivými pásmy (viz analýza a transformace hlavních komponent)

Spektrální třídy nebezpečí záměny s informačními třídami!!! části obrazu homogenní z hlediska spektrálního chování klasifikace - hledání všech tříd spektrálních odpovídajících určité třídě informační

Obr. Spektrální třídy

Klasifikace Bodová (Per-pixel) Objektová řízená (Supervised Classification) neřízená (Unsupervised Classification) hybridní

Bodová klasifikace Využívá klasifikátory spektrálního a časového chování lze využít i klasifikátory prostorového chování přepočet charakteristiky do 1 pixelu (ohniskové funkce) Při procesu klasifikace nevyužívají vlastnosti a příznaky okolních pixelů, pouze hodnoty (i transformované) 1 pixelu

Bodové klasifikátory spektrálního chování Nejvíce využívané nutnost výchozích předpokladů a zjednodušení: konstantní citlivost senzoru pro všechna pásma každý pixel odpovídá přesně definované ploše na zemském povrchu každý pixel představuje homogenní plochu z hlediska spektrálního chování normální rozdělení naměřených dat v každém pásmu příslušnost pixelu k jedné třídě

Objektová klasifikace Viz OBIA Segmentace obrazu Zjištění charakteristických hodnot objektů (segmentů) z hlediska spektrálního, časového či prostorového chování klasifikace

Princip řízené a neřízené klasifikace

Řízená klasifikace Tréninkové stádium Klasifikační stádium Klasifikátor minim. vzdálenosti od průměru Rovnoběžnostěnový (parallelpiped) klasifikátor Maximální pravděpodobnosti (maximum likelihood) K nejbližších bodů

Řízená klasifikace (postup) definování trénovacích ploch výpočet statistických charakteristik (spektrálních příznaků) pro trénovací plochy, editace výběr vhodných pásem pro klasifikaci volba vhodného klasifikátoru pro zařazení všech pixelů obrazu do jednotlivých tříd provedení zatřídění všech pixelů do stanovených tříd úprava, hodnocení a prezentace výsledků klasifikace

Tréninková etapa vymezení trénovacích ploch pro každou třídu Reprezentativní plochy dostatečně velké, homogenní, z více míst (než z 1 plochy), umístění, schopnost identifikovat a ověřit v terénu. Minimální počet px (nejméně n+1, kde n je počet kanálů, ale doporučení je 10n až 100n) Vytvoření trénovací množiny nutnost znalosti území z terénního průzkumu nebo jiných zdrojů dat

Trénovací etapa požadavek kompletnosti a reprezentativnosti kompletnost - určení charakteru všech hledaných tříd reprezentativnost - plochy typické pro danou třídu

Výběr trénovacích ploch manuální automatizovaný Problém smíšených pixelů (Mixed pixels)

Manuální výběr trénovacích ploch úloha zpracovatele určení homogenních skupin pixelů (podobné DN v jednotlivých pásmech) vyloučení smíšené spektrální informace - okrajové pixely mezi plochami

Automatizovaný výběr trénovacích ploch úloha zpracovatele vs. úloha zpracovatelského programu určení úvodního zárodečného pixelu (Seed Pixel Method) - zpracovatel automatizovaný výběr okolních pixelů s podobným spektrálním projevem - program

Počet pixelů v trénovací množině minimální teoretický - umožňuje správně generovat statistické spektrální příznaky Nejmenší teoretický počet pixelů = N + 1 kde N = počet klasifikovaných spektrálních pásem doporučený 10N až 100N co nejlepší statistické vymezení každé třídy ve vícerozměrném prostoru Doporučen výběr více ploch pro jednu třídu

Dobrovolný

Faktory úspěšnosti trénovací etapy dostatečný počet pixelů v každé trénovací ploše vhodná velikost trénovacích ploch vhodná poloha trénovacích ploch umístění trénovacích ploch rozmístění trénovacích ploch pro každou třídu míra homogenity trénovacích ploch z hlediska jejich spektrálního chování

Statistické charakteristiky tříd pro pixely část(i) obrazu v trénovacích plochách (tzv. masky) pro několik pásem multispektrálního obrazu vyjádření charakteristik pomocí průměrového vektoru směrodatné odchylky kovariační matice předpoklad normálního rozdělení

Statistické charakteristiky tříd umožňují posoudit schopnost trénovacích ploch reprezentovat třídy míru separability tříd na základě spektrálního chování

Hodnocení a přizpůsobení vhodnosti trénovacích ploch požadavek normálního rozdělení DN pixelů trénovací plochy práce s histogramem DN pixelů trénovací plochy bimodální rozdělení DN trénovací plochy - rozdělení pixelů do dvou tříd definování nových, maximálních a minimálních DN pixelů zvýšení míry separability transformacemi multispektrálního obrazu

Statistické hodnocení vhodnosti navržených tříd Je třeba posoudit u jednotlivých tříd a vzájemně: Histogram Graf koincidence, Rozptylogram jsou homogenní? neobsahují anomální hodnoty? jsou separovatelné mezi sebou?

Hodnocení trénovací etapy Evaluating Signatures metody hodnocení: alarm kontingenční matice maskování příznakového prostoru do rastrového obrazu příznakové objekty histogramy separabilita podle příznaků statistické zhodnocení

Dobrovolný

Dobrovolný

Dobrovolný

Hodnocení trénovací etapy příznakové objekty angl. signature separability signalizace

angl. alarm Hodnocení trénovací etapy signalizace signalizace jedné nebo více vybraných informačních tříd v obrazu podle trénovací(ch) množin(y) vytvoření přibližné představy zpracovatele o distribuci v prostoru

Ukázka signalizace

Hodnocení trénovací etapy separabilita příznaků angl. signature separability výpočet některé ze statistických vzdáleností euklidovské spektrální vzdálenosti mezi průměrovými vektory Jeffries-Matusitova vzdálenost Divergence Transformovaná divergence

Hodnocení trénovací etapy Transformovaná divergence angl. Transformed divergence teorie: ERDAS Field Guide učebnice statistiky porovnání statistické vzdálenosti mezi trénovacími množinami

Rozhodnutí o výběru pásem Hodnocení divergencí mezi pásmy Výběr vhodných pásem pro klasifikaci

Klasifikační etapa Volba klasifikátoru Provedení klasifikace

Rozhodovací pravidla (předpoklad pro použití) obrazové elementy představující určitou třídu se budou shlukovat v určité části vícerozměrného obrazového prostoru vytváření shluků tendence pixelů jedné třídy vytvořit shluk s určitou variabilitou

Shluky obrazových elementů centroidy (středy) shluků poloha centroidu dána průměrnou hodnotou pixelů v použitých pásmech průměrná hodnota pásem v klasifikaci pro daný shluk - průměrový vektor

Rozhodovací pravidla (princip použití) určují příslušnost nezařazených pixelů k určitému shluku resp. třídě některým pixelům příslušnost ke shluku resp. třídě nenalezena - třída nezařazených pixelů

Rozhodovací pravidla (základní rozdělení) parametrická neparametrická

Parametrická rozhodovací pravidla známé statistické charakteristiky (průměrový vektor, variance, kovariance) posuzování statistické vzdálenosti v příznakovém prostoru

Neparametrická rozhodovací pravidla (ne)linární funkce nebo matematické/geometrické dělení příznakového prostoru posuzování Euklidovské vzdálenosti v příznakovém prostoru

Rozhodovací pravidla (přehled) klasifikátor minimální vzdálenosti od středů shluků (minimum distance) klasifikátor K nejbližších sousedů klasifikátor pravoúhelníků (parallelepipeds) klasifikátor maximální pravděpodobnosti (maximum likelihood) klasifikátor Bayesovský (Bayesian classifier) klasifikátor minimální Mahalanobisovy vzdálenosti (minimal Mahalanobis distance) a další...

Klasifikátor minimální vzdálenosti (od středů shluků) minimum distance to means classification neparametrické pravidlo příslušnost pixelu k třídě určena na základě jeho vzdálenosti od jednotlivých centroidů shluků výhody rychlý výpočet nevýhody malá citlivost na stupeň rozptylu

Dobrovolný

Klasifikátor K nejbližších sousedů K-nearest neighbour classification neparametrické pravidlo modifikace klasifikátoru minimální vzdálenosti od středů shluků příslušnost pixelu k třídě určena na základě jeho vzdálenosti od jednotlivých centroidů shluků početního zastoupení pixelů určité třídy v okolí zpracovávaného pixelu možnost definování určité mezní vzdálenosti

Dobrovolný

Klasifikátor pravoúhelníků, (hyper)kvádrů parallelepiped (box) classification neparametrické pravidlo pravoúhelníky resp. (hyper)kvádry vymezeny: maximálními a minimálními hodnotami násobky směrodatné odchylky příslušnost pixelu k třídě určena svou polohou vůči pravoúhelníkům resp. (hyper)kvádrům výhody nejrychlejší výpočet nevýhody špatné zařazování pixelů s hodnotami ve vzdálených rozích boxů

Dobrovolný

Modifikovaný klasifikátor pravoúhelníků, (hyper)kvádrů definování oblasti v rozptylogramu (ohraničení vektorovou grafikou) např. ERDAS Imagine výhody rychlý výpočet částečné zpřesnění

Normalizovaný klasifikátor minimální vzdálenosti modifikace klasifikátoru minimální vzdálenosti normalizace vzdálenosti - násobky směrodatné odchylky znázornění izoliniemi parametrické pravidlo příslušnost pixelu k třídě určena: na základě vzdálenosti od centroidů shluků s ohledem na stupeň rozptylu shluků výhody rychlý výpočet vylepšená citlivost na stupeň rozptylu

Klasifikátor maximální pravděpodobnosti maximum likelihood classification parametrické pravidlo předpoklad normálního rozdělení sestavení funkce normálního rozdělení na základě průměrového vektoru a kovarianční matice Výpočet pravděpodobnosti příslušnosti ke každé třídě Nejvyšší hodnota -> klasifikovaná třída výhody nejlepší výsledky při použití kvalitních trénovacích dat nevýhody nejpomalejší výpočet

Dobrovolný

Dobrovolný

Bayesovský klasifikátor A priorní pravděpodobnost výskytu tříd. Stanovení s ohledem na váhu různých hledisek (např. plošné zastoupení, nebo jiná apriorní znalost - např. třída písek se vyskytuje méně pravděpodobně než městská zástavba). Pravděpodobnost zařazení do třídy z pravděpodobnostní klasifikace => výsledná pravděpodobnost zařazení do třídy, klasifikace parametrické pravidlo výhody bere v úvahu variabilitu tříd (kovariační matice) dobré výsledky při klasifikaci sporných pixelů (použití v kombinaci s jinými klasifikátory) nevýhody nejpomalejší výpočet

Výsledek zařazení jednotlivých px podle klasifikačního schématu a vytvoření tématické mapy

Neřízená klasifikace Základní postup: 1. Shluková analýza 2. Přiřazení významu shlukům (určování informační hodnoty uměle vytvořených kategorií) 3. reklasifikace (spojení tříd)

Dobrovolný

Neřízená klasifikace shluky

Dobrovolný

Postup při neřízené klasifikaci definování přibližného počtu výsledných shluků generování počáteční polohy centroidu pro každý shluk postupné přiřazení všech pixelů k nejbližšímu shluku výpočet nové polohy centroidu pro každý shluk s nově přiřazenými pixely opakování předchozích dvou kroků do stadia, kdy se přestane výrazně měnit poloha shluků v obrazovém prostoru nebo počet pixelů ve shluku přiřazení konkrétního významu stabilním shlukům vytváření informačních tříd spojováním tříd spektrálních (či jiných)

Volitelné parametry počáteční poloha centroidů po diagonále příznakového prostoru pomocí zakládacího souboru (seed file) definování přibližného počtu výsledných shluků minimální vzdálenost dvou shluků poloha centroidu shluku porovnání mezi dvěma iteracemi celkový počet iterací

Shluková analýza spektrální vzdálenost D n i 1 ( d i e i 2 ) ve dvojrozměrném obrazovém prostoru (n = 2) D 2 d e 2 d e 2 i i j j D = spektrální vzdálenost n = počet pásem i = dílčí pásmo d i = hodnota pixelu d v pásmu i e i = hodnota pixelu e v pásmu i

Algoritmy shlukové analýzy K-Means ISODATA (Iterative Self-Organizing Data Analysis Technique) algoritmus Narendra a Goldberg (PCI) AMOEBA RGB Clustering (ERDAS Imagine)

Dobrovolný

Dobrovolný

Dobrovolný

Dobrovolný

ISODATA algoritmus

ISODATA algoritmus zadává se: počet shluků počet iterací a další podmíněné parametry: kriterium heterogenity - rozdělení heterogenního shluku na dva shluky kriterium vzdálenosti - spojení shluků s blízkými centroidy kriterium počtu min. pixelů - odstranění shluků s podlimitním počtem připojením k okolním shlukům

Algoritmus Narendra a Goldberg neparametrická metoda stanovení hranic mezi shluky podle histogramů zpracovávaných pásem výpočet není iterační neumožňuje zadat požadovaný počet výsledných shluků

Algoritmus AMOEBA parametrická metoda amoeba = měňavka parametrem proměnlivost umístění pixelů v dané spektrální třídě ovlivní se stanovením hodnoty rozptylu nebo směrodatné odchylky

RGB Clustering jednoduchá klasifikační a kompresní technika pro 3 pásma, 8-bitová výpočetně rychlá metoda vykreslení pixelů do 3-rozměrného rozptylogramu histogramy podél os rozptylogramu rozděleny na intervaly vymezení shluků ohraničených kvádry

Hybridní klasifikace Např. výsledky ze shlukové analýzy se použijí pro tréninkové stádium řízené klasifikace Nebo naopak data z tréninkových ploch použita pro vstup do neřízené klasifikace (např. identifikace lineárních objektů)

Klasifikace pomocí neuronových sítí umělá inteligence (expertní systémy, neuronové) neurony vs. umělé neurony schéma neuronové sítě vstupní vrstva skrytá vrstva výstupní vrstva

Neuronové sítě neuron uzel sítě výstup z uzlu (výstupní signál): definován funkcí F(x) generován při nadprahové hodnotě F x i w i x i x i hodnota i-tého vstupu w i váha i-tého vstupu

Neuronové sítě klasifikační proces: řízený neřízený kombinovaný algoritmy implementovány např. v produktech: TOPOL RS MUTISPEC ERDAS Imagine

Neuronové sítě představují dílčí zlepšení výsledků klasifikace možnost kombinace různých typů dat: data z optické části spektra data radarová morfometrická data získaná z DMR možnost přiřazení váhy vstupujícím datům nepracují s matematickým modelem nepožadují normalitu rozdělení dat nepožadují kvalitní a rozsáhlý trénovací proces konečným výstupem informační třída

Klasifikace neuronovou sítí Algoritmus se zpětným postupem (řízená klas.) 2 vrstvy (Kohonenova a Grossbergova), které jsou trénovány odděleně. Kohonenova - neřízená klasifikace na vstupu, Grossbergova řízená klasifikace na výstupu Alg. s obráceným postupem síť tvořena vstupními uzly = pixely. Následuje rozdělení do shluků, postupná agregace až na tolik uzlů, kolik jich má požadovaný výstup.

Rozšíření per-pixel klasifikace Využití informací z okolí po transformaci nová hodnota v pixelu. = předzpracování obrazu Následně některá z klasifikačních metod Využití klasifikátorů prostorového chování např. texturální, prostorově kontextové

Kontextuální klasifikátory snaha o využití dalších vlastností povrchů: textura příčinné vztahy kontext rozpoznávání prostorových příznaků (spatial pattern recognition) zařazování do tříd s ohledem na souvislosti s okolím okolí se nezkoumá pomocí okna, nýbrž v celém rozsahu obrazu využití mapové algebry a operací analytických technik v prostředí GIS

Kontextuální klasifikátory kontext a struktura vlastnosti používané při vizuální interpretaci charakterizovány topologickými charakteristikami: Vzdáleností - hledaný objekt se může nacházet jen v jisté vzdálenosti od jiného objektu směrem příp. orientací - hledaný objekt se může nacházet jen v určitém směru od jiného objektu Konektivitou - 2 objekty mohou / nemusí být spojeny jiným objektem dotykem (sousedství) - 2 objekty se mohou/nemusí dotýkat Vnořením 1 objekt se musí /nesmí vyskytovat uvnitř jiného

Tvrdé vs. měkké metody klasifikace obrazu

Tvrdé klasifikátory tradiční metody klasifikace tvrdé (hard) klasifikátory každá klasifikační jednotka (pixel, segment) patří právě do jedné třídy neřeší problém smíšených pixelů

Měkké klasifikátory alternativní a komplementární metody klasifikace každá klasifikační jednotka (pixel, segment) přísluší k více než jedné třídě řeší problém smíšených pixelů stupeň příslušnosti (membership degree) pixelu ke každé třídě 0;1 vztah k pravděpodobnosti a k důkazům možnost kombinace s vektorovými daty GIS získání dalších informací a důkazů ve finále možnost použití tvrdých klasifikátorů

Hodnocení klasifikace v jejím průběhu vylepšení klasifikace kombinace měkkých a tvrdých klasifikátorů měkké klasifikátory vypovídají o klasifikační nejistotě problémové případy vysoká nejistota vysoká nejistota klasifikace když: se pixely jeví jako směs tříd důvody: špatná tréninková data data nemohou být oddělena smíšený projev na mikroskopické úrovni pixely náleží k neznámým třídám (neznámý spektrální příznak) vytvořit novou třídu získat tréninková data

Tvrdé vs. měkké klasifikátory výstupem klasifikace obraz(y) příslušnosti k třídě (class membership images) jedna (tematická) mapa tvrdé klasifikátory více (tematických) map měkké klasifikátory

Měkké klasifikátory odlišné metriky vyjádření příslušnosti (membership) Idrisi Selva (Taiga) nabízí měkké klasifikátory, založené na: Bayesově teorii (BAYCLASS) Dempster-Shaferově teorii (BELCLASS) Mahalanobisově vzdálenosti teorii fuzzy množin modelu lineárního míchání

Měkké klasifikátory výsledek klasifikace - obraz(y) příslušnosti k třídě v Idrisi uloženy do zásobníku - raster image group file (.rgf) hodnoty obrazu příslušnosti lze získat pomocí dotazů numerických grafických

Měkké klasifikátory obraz klasifikační nejistoty (Classification Uncertainty image) vyjadřuje, do jaké míry je příslušnost daného pixelu k třídám lepší/horší než příslušnost ostatních pixelů kde max = maximum z množiny hodnot příslušnosti k třídám pro daný pixel sum = součet množiny hodnot příslušnosti k třídám pro daný pixel n CU 1 = uvažovaný počet tříd max 1 sum n 1 n

Příklady klasifikační nejistoty příklad ohodnocení 3 tříd následující snímek platí: - hodnoty příslušnosti 0;1, - sum hodnot příslušnosti 1 AND sum hodnot příslušnosti 0;1), význam klasifikační nejistoty: - sběr nových důkazů (dat), je-li nejistota vysoká - získání nových informací

Příklady klasifikační nejistoty CU ) 0,0 0,0 1,0 ( ) 0,05 0,05 0,9 ( ) 0,0 0,1 0,9 ( ) 0,1 0,3 0,6 ( ) 0,0 0,3 0,6 ( ) 0,3 0,3 0,3 ( ) 0,1 0,1 0,1 ( ) 0,1 0,0 0,0 ( ) 0,0 0,0 0,0 ( 0,00 0,15 0,15 0,60 0,55 1,00 1,00 0,90 1,00 CU CU CU CU CU CU CU CU CU

BAYCLASS podobný klasifikátoru maximální pravděpodobnosti (Maximum Likelihood Classifier ) vyjadřují následnou pravděpodobnost (posterior probability) s níž pixel přísluší ke každé třídě podle Bayesovy pravděpodobnostní teorie vyjadřuje vztah mezi pravděpodobností a poměrem šancí předpokládaná pravděpodobnost vychází z existujících znalostí (např. existující tematické mapy)

BAYCLASS kde p h e i p( e p( e h). p( h) h ). p h i i p(h /e) = pravděpodobnost pravdivosti hypotézy dané důkazem (posterior probability) p(e /h) = pravděpodobnost zjištění, že důkaz daný hypotézou je pravdivý p(h) = pravděpodobnost, že je hypotéza pravdivá bez ohledu na důkazy (prior probability)

BAYCLASS p(e /h) - odvozena z kovariační matice tréninkových dat p(h /e) = (posterior probability) pravděpodobnost pravdivosti hypotézy dané důkazem považována za důkaz příslušnosti k třídě předpoklad uvažované třídy jsou jediné možné třídy označuje pixely jako třídy i na základě slabých důkazů, není-li podpora pro přiřazení k jiné třídě sub-pixelová klasifikace - výstupem oddělené obrazy BAYCLASS v Idrisi dobře zjišťuje základní složky smíšených pixelů nedobře zjišťuje správné proporce každé z tříd v mixelech

BELCLASS podobný klasifikátoru maximální pravděpodobnosti Dempster-Shaferova teorie (DST) DST rozvíjí a doplňuje BPT BPT předpokládá, že neexistuje nevědomost nedostatek!!! DST - připouští možnost neúplnosti stávajících informací nedostatek důkazů neznamená důkaz proti této hypotéze

BELCLASS pojmy z DST viz skripta Zpracování dat v GIS

pojmy z DST BELCLASS interval důvěry (belief interval) <Bel(A); Pl(A)> Nejistota míra nejistoty hypotézy nedůvěra není doplňkem domnění!!!

DST BELCLASS vyjadřuje stupeň podpory pro všechny hypotézy, které ne mají průnik s danou hypotézou (viz příklady) umožňuje snadno spojovat důkazy spojované důkazy musí být nezávislé nesmí být redundantní

Příklad pro BPT uvažujme 4 třídy BELCLASS důkazy podporují třídu 1 s mírou 0,3 a všechny ostatní s mírou 0 výsledkem BPT by bylo označení pixelu v třídě 1 s výslednou pravděpodobností 1,0

Příklad 1 pro DST uvažujme 4 třídy důkazy podporují BELCLASS třídu 1 s mírou důvěry 0,3 ostatní třídy (2, 3, 4) s mírou důvěry 0 DST by označila pixel v třídě 1 mírou důvěry = 0,3 mírou uvěřitelnosti = 1 v intervalu důvěry 0,7 DST by označila pixel pro ostatní třídy (2, 3, 4) mírou důvěry = 0 při míře uvěřitelnosti = 0,7

Příklad 2 pro DST uvažujme 4 třídy důkazy podporují třídu 1 s mírou důvěry 0,3 BELCLASS třídu 2 s mírou důvěry 0,6 (nový důkaz!!!) ostatní třídy (3, 4) s mírou důvěry 0 DST by označila pixel v třídě 1 mírou důvěry = 0,3 mírou uvěřitelnosti = 0,4 v intervalu důvěry 0,1 očekávaným efektem při použití nových důkazů je menší míra nejistoty

BELCLASS výstupy z klasifikačního algoritmu BELLCLASS pro každou z tříd je generován obraz: obraz důvěry (image of belief) obraz věrohodnosti (image of plausibility) obraz klasifikační nejistoty (classification uncertainty image) hlavní důvod použití klasifikačního algoritmu BELLCLASS kontrola kvality tréninkových dat (nechybí některá třída?) hodnocení provedeno v průběhu klasifikace při existenci domněnky výskytu neznámých tříd použití třídy ostatní

Porovnání BAYCLASS a BELCLASS použití klasifikačního algoritmu BAYCLASS důvěřuje síle tréninkových množin nepřipouští neznalost některých tréninkových množin použití klasifikačního algoritmu BELLCLASS je rezervovaný vůči významu tréninkových množin připouští neznalost některých tréninkových množin

Postklasifikační úpravy 1. Problémy ve velikosti vytvořených prostorových útvarů 2. Problémy ve správnosti klasifikace Ad 1) A) roztříštěnost výsledných ploch Řešení např. Sieve filtrace B) Pepř a sůl - izolované pixely s odlišnou hodnotou Řešení např. nízkofrekvenční filtr ale s logickým operátorem, kvantilový apod. modus, medián,..

Problémy postklasifikační filtrace klasifikovaný obraz obsahuje kvalitativní charakteristiky nebezpečí vzniku nové informační třídy modální filtr vypočtená hodnota pixelu obsahuje hodnotu nejčastěji obsaženou pro danou polohu filtru (módus) možnost užití: odlišných vah vyloučení některých tříd vícenásobné filtrace kritéria minimální plochy zachování hranic mezi třídami

Vlastnosti postklasifikačních chyb v obrazu chybně klasifikované pixely: souvisí především s určitými třídami se vyskytují především ve skupinách (málokdy izolovaně) mají ve výsledném obrazu určité prostorové uspořádání váží se na typické části klasifikovaných ploch

Detekce klasifikačních chyb rozlehlá vodní plocha na vrcholech a svazích pohoří využití DMR chyba!! pixely klasifikovány nesprávně jedná se o ledovec? lužní les ve značné vzdálenosti od vodních toků využití obalové zóny (buffer)

Odhad přesnosti klasifikace Testovací plochy Kontingenční tabulka Kappa index

Dobrovolný

Dobrovolný

Kappa index Dobrovolný