STATISTICKÁ KLASIFIKACE DAT IMPULSNÍ OSCILOMETRIE POMOCÍ MATLABU



Podobné dokumenty
Úvod. Analýza závislostí. Přednáška STATISTIKA II - EKONOMETRIE. Jiří Neubauer

Pingpongový míček. Petr Školník, Michal Menkina. TECHNICKÁ UNIVERZITA V LIBERCI Fakulta mechatroniky, informatiky a mezioborových studií

( ) Kreslení grafů funkcí metodou dělení definičního oboru I. Předpoklady: 2401, 2208

Dopravní úloha. Jiří Neubauer. Katedra ekonometrie FEM UO Brno

INMED Klasifikační systém DRG 2014

(a) = (a) = 0. x (a) > 0 a 2 ( pak funkce má v bodě a ostré lokální maximum, resp. ostré lokální minimum. Pokud je. x 2 (a) 2 y (a) f.

2.8.9 Parametrické rovnice a nerovnice s absolutní hodnotou

Nerovnice s absolutní hodnotou

Základy. analýzy hlavních komponent a multivariačních regresních metod pro spektrální analýzu

Tvorba trendové funkce a extrapolace pro roční časové řady

3.2.4 Podobnost trojúhelníků II

SPOLEHLIVOST KONSTRUKCÍ & TEORIE SPOLEHLIVOSTI část 2: Statistika a pravděpodobnost

PRAVDĚPODOBNOST A STATISTIKA OPAKOVÁNÍ, pro rozpoznávání

ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE. 1 Zaměření a vyrovnání rovinné sítě

PROGRAMOVÁNÍ SVĚTELNÝCH OZDOB

STEREOMETRIE. Vzdálenost bodu od přímky. Mgr. Jakub Němec. VY_32_INOVACE_M3r0113

Bayesovská klasifikace digitálních obrazů

Matice a maticová algebra, soustavy lineárních rovnic, kořeny polynomu a soustava nelin.rovnic

{ } Kombinace II. Předpoklady: =. Vypiš všechny dvoučlenné kombinace sestavené z těchto pěti prvků. Urči počet kombinací pomocí vzorce.

Semestrální práce NÁVRH ÚZKOPÁSMOVÉHO ZESILOVAČE. Daniel Tureček zadání číslo 18 cvičení: sudý týden 14:30

Aplikované úlohy Solid Edge. SPŠSE a VOŠ Liberec. Ing. Aleš Najman [ÚLOHA 18 TVORBA PLOCH]

Isingův model. H s J s s h s

PROCESY V TECHNICE BUDOV 3

Zvyšování kvality výuky technických oborů

Úlohy 22. ročníku Mezinárodní fyzikální olympiády - Havana, Cuba

Statistika (MD360P03Z, MD360P03U) ak. rok 2007/2008

PŘÍRUČKA K POUŽÍVÁNÍ APLIKACE HELPDESK

Kvadratické rovnice pro učební obory

Testování výškové přesnosti navigační GPS pro účely (cyklo)turistiky

Laboratorní práce č. 3: Měření indukčnosti cívky pomocí střídavého proudu

1.1.1 Kvadratické rovnice (dosazení do vzorce) I

EZB dělí časopisy dle dostupnosti do 4 kategorií označené symboly: - volně dostupné. - předplacené tituly dostupné v rámci knihovny

Praktikum II Elektřina a magnetismus

ELEKTROTECHNICKÁ MĚŘENÍ PRACOVNÍ SEŠIT 2-3

Umělá inteligence. Příklady využití umělé inteligence : I. konstrukce adaptivních systémů pro řízení technologických procesů

KIV/ZI Základy informatiky. MS Excel maticové funkce a souhrny

4.6.6 Složený sériový RLC obvod střídavého proudu

( ) Neúplné kvadratické rovnice. Předpoklady:

2.7.2 Mocninné funkce se záporným celým mocnitelem

STATISTICKÁ PŘEDPOVĚĎ ZNEČIŠTĚNÍ OVZDUŠÍ, NÁVRH A TESTY METODY. Josef Keder. ČHMÚ ÚOČO, Observatoř Tušimice keder@chmi.cz

KVADRATICKÉ ROVNICE A NEROVNICE (včetně řešení v C)

PROCESNÍ INŽENÝRSTVÍ cvičení 4

Tento materiál byl vytvořen v rámci projektu Operačního programu Vzdělávání pro konkurenceschopnost.

Vedoucí bakalářské práce

Podobně, jako letadlo může řídit počítač, mohou nastat ale situace, kdy bez zásahu člověka by nového modelu je potřeba zásah člověka.

Hodnocení způsobilosti procesu. Řízení jakosti

= musíme dát pozor na: jmenovatel 2a, zda je a = 0 výraz pod odmocninou, zda je > 0, < 0, = 0 (pak je jediný kořen)

PŘÍLOHA č. 2B PŘÍRUČKA IS KP14+ PRO OPTP - ŽÁDOST O ZMĚNU

Č e s k ý t e l e k o m u n i k a č n í ú ř a d Odbor kontroly a ochrany spotřebitele Oddělení technické podpory Brno Jurkovičova 1, Brno

Inovace výuky prostřednictvím ICT v SPŠ Zlín, CZ.1.07/1.5.00/ Vzdělávání v informačních a komunikačních technologií

INŽENÝRSKÁ MATEMATIKA LOKÁLNÍ EXTRÉMY

Jakub Kákona,

tel ; fax R e š e r š e (Dokumentografická jednorázová rešerše)

9.2.5 Sčítání pravděpodobností I

Gymnázium Vysoké Mýto nám. Vaňorného 163, Vysoké Mýto

MS WORD 2007 Styly a automatické vytvoření obsahu

Řešení: ( x = (1 + 2t, 2 5t, 2 + 3t, t); X = [1, 2, 2, 0] + t(2, 5, 3, 1), přímka v E 4 ; (1, 2, 2, 0), 0, 9 )

Vzdělávací oblast: Matematika a její aplikace. Obor vzdělávací oblasti: Seminář z matematiky. Ročník: 7. Poznámky

Využití válcových zkušeben při ověřování tachografů. Prezentace pro 45. konferenci ČKS 1. část: metrologické požadavky

2.7.1 Mocninné funkce s přirozeným mocnitelem

1.3.1 Kruhový pohyb. Předpoklady: 1105

Pro vš echny body platí U CC = ± 15 V (pokud není uvedeno jinak). Ke kaž dému bodu nakreslete jednoduché schéma zapojení.

Kapitola 7: Integrál. 1/14

2.3. POLARIZACE VLN, POLARIZAČNÍ KOEFICIENTY A POMĚR E/B

Implementační rozdíly ve vývoji IS při použití bezschémové a relační databáze

Tvorba a využití výukových animací pro praktikum z genetiky

CERTIFIKOVANÉ TESTOVÁNÍ (CT) Výběrové šetření výsledků žáků 2014

F Zdravotnictví. Více informací k tomuto tématu naleznete na: ictvi

Lokální a globální extrémy funkcí jedné reálné proměnné

Střední průmyslová škola strojnická Olomouc, tř.17. listopadu 49

M - Rovnice - lineární a s absolutní hodnotou

1. Cizinci v České republice

Využití EduBase ve výuce 2

výpočtem František Wald České vysoké učení technické v Praze

EXPONENCIÁLNÍ A LOGARITMICKÁ FUNKCE

Systém zvukové signalizace a spouštění motoru na základě stavu světla

Kvantové počítače algoritmy (RSA a faktorizace čísla)

TECHNOLOGICKÁ PLATFORMA SILNIČNÍ DOPRAVA

Startovní úloha Samostatná práce

Sada 2 - MS Office, Excel

Oddělení teplárenství sekce regulace VYHODNOCENÍ CEN TEPELNÉ ENERGIE

Číselné soustavy Ing. M. Kotlíková, Ing. A. Netrvalová Strana 1 (celkem 7) Číselné soustavy

INFORMACE K POKUSNÉMU OVĚŘOVÁNÍ ORGANIZACE PŘIJÍMACÍHO ŘÍZENÍ SŠ S VYUŽITÍM JEDNOTNÝCH TESTŮ

LABORATORNÍ CVIČENÍ Elektrotechnika a elektronika

Zateplovací systémy Baumit. Požární bezpečnost staveb PKO PKO PKO

Statistická analýza výroby a povlakování pístků. Václav Chmelík

Exekutoři. Závěrečná zpráva

Divize Oddělení. Katalog. číslo. IMMULITE 2000/IMMULITE 2000 XPi IGF-I L2KGF *

Úpravy skříní a čelních ploch pro úchopovou lištou

Podpora personálních procesů v HR Vema

VOLBA TYPU REGULÁTORU PRO BĚŽNÉ REGULAČNÍ SMYČKY

Zákonitosti, vztahy a práce s daty

IDEA StatiCa novinky

Využití ICT pro rozvoj klíčových kompetencí CZ.1.07/1.5.00/

Sériově a paralelně řazené rezistory. Tematický celek: Elektrický proud. Úkol:

Zvyšování kvality výuky technických oborů

českém Úvod Obsah balení LC USB adaptér Sweex pro bezdrátovou síť LAN

PREDIKCE DÉLKY KOLONY V KŘIŽOVATCE PREDICTION OF THE LENGTH OF THE COLUMN IN THE INTERSECTION

Úloha č. 6 Stanovení průběhu koncentrace příměsí polovodičů

Operační program Rybářství

Transkript:

STATISTICKÁ KLASIFIKACE DAT IMPULSNÍ OSCILOMETRIE POMOCÍ MATLABU Petr Prášek ČVUT FEL, K331 Katedra teorie obvodů Abstrakt Tento příspěvek popisuje použití bayesovské klasifikace při diagnostice plicních poruch. Analyzovaná data byla naměřena pomocí impulsní oscilometrie (IOS). Cílem popisovaného experimentu bylo nalezení vhodné reprezentace IOS dat a identifikace lidí trpících některou z poruch plicních funkcí. Řešení této úlohy není z důvodu velké variability lidské populace jednoduché. Proto bylo pro testování detektoru vytvořeno pět skupin lidí lišících se stupněm zdravotních problémů. Výsledky bayesovské klasifikace byly srovnány s klasifikací založenou na vyhodnocení euklidovské vzdálenosti. Úvod Klasifikačních metod existuje celá řada, lze je rozdělit na deterministické a statistické. Mezi ty druhé patří i bayesovské techniky. Celý proces má dvě fáze. V prvním kroku se vytvoří modely jednotlivých tříd, ve druhém kroku se provede vlastní klasifikace. Vzhledem k tomu, že IOS je metoda pro měření impedance dýchacích cest, je přirozené použít hodnoty impedance jako parametry pro klasifikaci. Dýchací systém lze modelovat pomocí elektrického obvodu a jeho prvky lze také zahrnout do klasifikace. Bayesovská klasifikace Nejdříve odvodíme Bayesův vzorec. Známý vztah pro násobení pravděpodobností a podmíněných pravděpodobností dvou jevů A a B lze zapsat jako P (B) P (A B) = P (A) P (B A), (1) kde P (A) a P (B) jsou pravděpodobnosti jevů A a B, P (A B) a P (B A) jsou podmíněné pravděpodobnosti jevů A a B za podmínky uskutečnění jevů B a A. Předpokládejme nyní, že máme několik tříd popsaných jejich modely a vzorek naměřených dat. Jev A nyní bude představovat hypotézu h i vzorek patří do i-té třídy. Jev B nahradíme vektorem naměřených dat d. Místo pravděpodobností nyní budou ve vztahu vystupovat hustoty pravděpodobnosti p. Nyní můžeme přepsat rovnici (1) na tzv. Bayesův vztah p(h i d) = p(d h i) P (h i ) p(d) = p(d h i) P (h i ), (2) S p(d h i ) P (h i ) kde p(h i d) ukazuje pravděpodobnost hypotézy, že naměřená data (reprezentovaná parametry d) náleží do i-té třídy. P (h i ) je apriorní pravděpodobnost hypotéz h i, p(d h i ) je pravděpodobnostní mírou hypotézy h i, p(d) je úplnou pravděpodobností a S je počet tříd. i=1

Modely tříd Ze vhodně vybraných dat vytvoříme modely tříd. Pro každou z nich vypočítáme vektor středních hodnot všech parametrů použitého modelu µ i [k] = 1 N d j [k], (3) N j=1 kde i = 1, 2,..., S, k = 1, 2,..., M a N je počet měření v trénovací skupině pro danou třídu; a kovarianční matici kde σ 2 i jsou rozptyly a σ ij korelační koeficienty. Vyhodnocení klasifikace σ 2 1... σ 1M C i =....., (4) σ M1... σm 2 Hypotézy jsou vzájemně disjunktní a pro testovanému vzorku je přiřazena hypotéza s největší pravděpodobností. Pro vyhodnocení je zavedena vícerozměrná diskriminační funkce, používající vícerozměrné Gaussovské rozdělení [1], [7] p(d h i ) = (2π) M 2 Ci 1 2 e (d µ i ) T C 1 (d µ i i ) 2, (5) kde C i je determinant kovarianční matice, µ i je vektor středních hodnot parametrů i-té třídy a d je vektor naměřených dat. Za předpokladu rovnoměrného apriorního rozdělení lze po logaritmování výrazu a zanedbání konstant psát diskriminační funkci v následujícím tvaru g i (d) = ln(p(d h i )) = ln C i (d µ i ) T C 1 i (d µ i ). (6) Diskriminační funkce je vyčíslena pro každou třídu a vzorek je přiřazen do třídy s největší hodnotou g i. Databáze signálů Naměřená data použitá v experimentu pochází z IOS databáze vytvořené ve spolupráci s Nemocnicí Na Homolce v Praze. Celkem je v databázi přes 4 záznamů od 7 osob ve věku od 18 do 89 let. Vzhledem k tomu, že několik osob se účastnilo testu opakovatelnosti IOS měření, jsou v databázi desítky jejich záznamů. Navíc pro řadu pacientů se provádí měření opakovaně a často se provede i více testů v jednom dni. Z těchto důvodů je pro korektní vytvoření modelů tříd nutné vybrat jen některé záznamy. Proto byly do úvahy vzaty nejvýše první dva záznamy od jedné osoby z jednoho dne. Data z dalších dnů byly vypuštěny. Z důvodu velké variability lidské populace bylo pro vytvoření modelu tříd vybráno celkem pět skupin lidí. Výběr by měl vyjadřovat rozdílnou úroveň zdravotních problémů. K rozdělení osob do skupin byla využita teoretická hodnota impedance spočítaná pro každou osobu před IOS testem. Výpočet je založen na pacientově věku, pohlaví, výšce

a hmotnosti [6]. Teoretická hodnota Z(f) je orientační údaj. U lidí s hodnotou R 5Hz větší než 16 % teoretické se předpokládá některá z plicních dysfunkcí. Naopak, osoby s hodnotami menšími než 1 %, 12 %, atd. se považují za zdravé. Tímto způsobem byly vytvořeny první čtyři skupiny lidí (viz tab. 1). V těchto případech je mezi kategoriemi zdravý/nemocný pásmo neurčitosti. U poslední skupiny je hranice pouze jedna, a to 15 % teoretické hodnoty. skupina N zdravý nemocný 1 74 < 1 % 16 % > 2 92 < 12 % 16 % > 3 14 < 13 % 16 % > 4 112 < 14 % 16 % > 5 124 < 15 % 15 % > Tabulka 1: Trénovací skupiny. N představuje počet záznamů v trénovací skupině. Reprezentace klasifikovaných dat Pro klasifikaci bylo použito celkem pět modelů. Jejich parametry představovaly hodnoty R(f) a X(f), kde f {5, 1, 2} Hz (obr. 1), hodnoty sedmi R, L, C prvků modelu plic (obr. 2, podrobnosti lze najít v [6]), kombinace předchozích dvou modelů, pouze jeden parametr, hodnota R 5Hz, koeficienty a i dvou polynomů třetího stupně b(f) = a 1 f 3 + a 2 f 2 + a 3 f + a 4 aproximujících impedanční charakteristiku (b představuje R, X). 25 25 2 195 15 R [Pa/(l/s)] 185 X [Pa/(l/s)] 1 5 175 5 165 5 15 25 35 f [Hz] 1 5 15 25 35 f [Hz] Obrázek 1: Průběhy R(f), X(f). Tečky vyznačují parametry prvního modelu, čárkovaně je naznačena aproximace polynomem.

Cm Cb Rc Lc Cw Rp Cl Obrázek 2: Model plic. Realizace a výsledky Všechny potřebné výpočty byly provedeny s použitím Matlabu verze 5.3 a funkcí Statistics Toolboxu. Výsledky klasifikace byly srovnány s deterministickým přístupem, založeným na výpočtu euklidovské vzdálenosti v v i = M (p i [m] q i [m]) 2, (7) m=1 kde p[m] a q[m] jsou vektory M parametrů modelů jednotlivých tříd a vzorek dat. Výsledky klasifikace jsou v tab. 2. Algoritmus byl testován na stejných datech, která byla použita pro vytvoření modelů tříd, jde tedy o tzv. uzavřený test. Příklad dat je na obr. 3 (skupina 1 a model R(f), X(f)). skupina 1 2 3 4 5 model e Eu [%] e Ba [%] e Eu [%] e Ba [%] e Eu [%] e Ba [%] e Eu [%] e Ba [%] e Eu [%] e Ba [%] R, X 14.9 5.4 11.97 7.6 1.58 9.62 11.61 9.82 12.1 12.1 RLC + R, X 14.9 2.7 4.34 11.97 7.69 1.58 11.61 8.4 12.1 8.6 RLC 16.22 9.46 14.13 9.78 13.46 9.62 13.39 13.39 14.52 12.9 R 5Hz 9.46 12.16 7.61 1.87 9.62 9.62 9.82 11.61 11.29 12.9 R pol, X pol 25.68 4.5 2.65 5.43 19.23 9.62 19.64 1.71 19.35 11.29 Tabulka 2: Chybovost euklidovské (e Eu ) a bayesovské (e Ba ) klasifikace v uzavřeném testu. Závěr Nejlepšího výsledku je dosaženo bayesovským přístupem pro kombinovaný model (impedanční charakteristika a R, L, C prvky). Dobré výsledky dávají také modely tvořené impedanční charakteristikou a její aproximací. Naopak, nejhorší výsledky jsou dosaženy při použití jediného parametru R 5Hz. Při Bayesovské klasifikaci je chybovost menší než u Euklidovské metody, s výjimkou R 5Hz.

Oznámení Příspěvek byl zpracován v rámci výzkumného záměru číslo MSM2112. Autor by rád poděkoval panu Hans-Jürgen Smithovi (Jaeger Company) za jeho pomoc při získání signálů. Literatura [1] Čmejla, R., Sovka, P. Úvod do bayesovské klasifikace dat. Akustické listy, 8(2), 23 [2] Havránek, T. Statistika pro biologické a lékařské vědy. Academia, Praha, 1993 [3] Nucci, G., Polese, G., Rossi, A., Cobelli, C. On-line estimation of respiratory parameters of lung mechanics in different pathologies. Proceedings IEEE-EMBS, Chicago, 1997 [4] Prášek, P. Impulsní oscilometrie: spektrální vzdálenosti. Analýza a zpracování signálů III, Vydavatelství ČVUT Praha, 23 [5] Prášek, P. Lung Disease Diagnostics Using Bayesian Classification Technique. Proceedings of the Polish-Hungarian-Czech Workshop on Circuit Theory, Signal Processing, and Applications. CTU Prague, 23 [6] Vogel, J., Smidt, U.: Impulse oscillometry: analysis of lung mechanics in general practise and clinic, epidemiological and experimental research. pmi Verlagsgruppe GmbH, Frankfurt am Main, 1994 [7] Zvára, K. Biostatistika. Karolinum, Praha, 1998 Kontaktní adresa: Ing. Petr Prášek České vysoké učení technické v Praze, Elektrotechnická fakulta, Katedra teorie obvodů Technická 2, 166 27 Praha 6, Tel.: +42 224 352 286 E-mail: xprasek@feld.cvut.cz

1 R1 5 R2 5 1 5 1 5 1 2 5 1 X1 5 X2 R2 5 1 5 1 5 5 1 5 1 R1 1 X1 5 X2 2 5 1 R1 1 5 1 R1 5 5 1 R1 1 X1 5 X2 2 5 1 R2 1 5 1 R2 5 5 1 R2 X1 5 X2 X2 1 2 1 5 2 1 5 1 5 X1 Obrázek 3: Hodnoty R, X, všechny kombinace dvojic. Nemocní jsou vyznačeni znaky +.