Klasifikace Landau-Kleffnerova syndromu



Podobné dokumenty
Využití algoritmu DTW pro vyhodnocování vad řeči dětí postižených Landau-Kleffnerovým syndromem (LKS)

DTW. Petr Zlatník, Roman Čmejla. Abstrakt: Příspěvek popisuje metodu, která byla vyvinuta pro vyhodnocení

Petr Zlatník, Roman Čmejla. Katedra teorie obvodů, Fakulta elektrotechnická, ČVUT, Praha. Abstrakt

Rozpoznávání izolovaných slov (malý slovník, např. číslovky, povely).

Semestrální práce: Rozpoznání hláskované řeči a převedení na text

ADA Semestrální práce. Harmonické modelování signálů

Úvod do praxe stínového řečníka. Proces vytváření řeči

Zvýrazňování řeči pomocí vícekanálového zpracování

Škola: Střední škola obchodní, České Budějovice, Husova 9. Inovace a zkvalitnění výuky prostřednictvím ICT

Speciální struktury číslicových systémů ASN P12

Nabídky spolupráce pro průmysl

ROZPOZNÁVÁNÍ AKUSTICKÉHO SIGNÁLU ŘEČI S PODPOROU VIZUÁLNÍ INFORMACE

Klasifikace předmětů a jevů

FONETIKA A FONOLOGIE I.

Úloha: Verifikace osoby pomocí dynamického podpisu

Snímání biologických signálů. A6M31LET Lékařská technika Zdeněk Horčík Katedra teorie obvodů

STANOVENÍ CHARAKTERU SEGMENTU ŘEČI S VYUŽITÍM REÁLNÉHO KEPSTRA

ROZPOZNÁNÍ TITULU GRAMOFONOVÉ DESKY PODLE KRÁTKÉ UKÁZKY

JAK LZE VYUŽÍT GRAFICKÉHO ZOBRAZENÍ AKUSTICKÉHO SIGNÁLU PŘI VÝUCE JAZYKA A SPRÁVNÉ VÝSLOVNOSTI

Asistivní technologie

Český jazyk a literatura

Trénování sítě pomocí učení s učitelem

TSO NEBO A INVARIANTNÍ ROZPOZNÁVACÍ SYSTÉMY

Algoritmy a struktury neuropočítačů ASN P8b

Pokročil. Vyučující: Prof. Ing. Jan Nouza, CSc., ITE

Strategie ACE využívající virtuální elektrody v kochleárních implantátech Nucleus 24

Měření dat Filtrace dat, Kalmanův filtr

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ

7 Další. úlohy analýzy řeči i a metody

český jazyk a literatura

Specifické poruchy učení

AKUSTICKÁ ANALÝZA INTENZITY A RYCHLOSTI ŘEČI U PARKINSONOVY NEMOCI

Výstupy z RVP Učivo Ročník Průřezová témata Termín Komunikační a slohová výchova 1. plynule čte s porozuměním texty přiměřeného rozsahu a náročnosti

Úvodem Dříve les než stromy 3 Operace s maticemi

Algoritmy a struktury neuropočítačů ASN - P10. Aplikace UNS v biomedicíně

Zvuková stránka jazyka

Český jazyk a literatura

Hlasové vypínání elektrických přístrojů 1 ÚVOD. 11

SIMULACE ZVUKOVÉHO POLE VÍCE ZDROJŮ

Automatická detekce anomálií při geofyzikálním průzkumu. Lenka Kosková Třísková NTI TUL Doktorandský seminář,

promluvách založených na rychlém opakováni slabik /pa/-/ta/ /ka/

Klasifikace hudebních stylů

TECHNICKÁ UNIVERZITA V LIBERCI

Předmět: Český jazyk. hlasité čtení, praktické čtení. hlasité i tiché čtení s porozuměním

Výukový materiál zpracován v rámci projektu EU peníze školám

Obsah přednášky Jaká asi bude chyba modelu na nových datech?

SYNTÉZA AUDIO SIGNÁLŮ

Iterační výpočty. Dokumentace k projektu č. 2 do IZP. 24. listopadu 2004

Teorie tkaní. Modely vazného bodu. M. Bílek

Matematické modelování dopravního proudu

Neuronové sítě Ladislav Horký Karel Břinda

Řešení příkladu - klasifikace testovacího subjektu podle minimální vzdálenosti:

J. Tatarinov, P. Pollák. Fakulta elektrotechnická. Abstrakt. otestován a zhodnocen na signálech z databáze CAR2CS. Detektor využívající

ANALÝZA A KLASIFIKACE DAT

Jednofaktorová analýza rozptylu

VYUŽITÍ MATLABU PRO PODPORU VÝUKY A PŘI ŘEŠENÍ VÝZKUMNÝCH ÚKOLŮ NA KATEDŘE KOMUNIKAČNÍCH A INFORMAČNÍCH SYSTÉMŮ

KLASIFIKÁTOR MODULACÍ S VYUŽITÍM UMĚLÉ NEURONOVÉ SÍTĚ

Statistické vyhodnocení průzkumu funkční gramotnosti žáků 4. ročníku ZŠ

Algoritmy a struktury neuropočítačů ASN P3

Využití neuronové sítě pro identifikaci realného systému

Komunikace s lidmi, kteří nosí sluchadlo. Rady přispívající k úspěšné komunikaci

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze

Induktivní statistika. z-skóry pravděpodobnost

ZÁKLADNÍ ŠKOLA A MATEŘSKÁ ŠKOLA T. G. MASARYKA BÍLOVEC,

Statistická teorie učení

P. Bartoš a J. Tesař

ZÁKLADY AUTOMATICKÉHO ŘÍZENÍ

STATISTICKÉ CHARAKTERISTIKY

Úloha - rozpoznávání číslic

Kepstrální analýza řečového signálu

Kreslení elipsy Andrej Podzimek 22. prosince 2005

Kybernetika a umělá inteligence, cvičení 10/11

Měření dat Filtrace dat, Kalmanův filtr

České vysoké učení technické v Praze SGS ČVUT 2015 Číslo grantu: SGS15/097/OHK1/1T/15 Číslo FIS: E000. Závěrečná zpráva

Číselné charakteristiky

Epilepsie. Silvia Čillíková FEL ČVUT. 9th May 2006

Metody výběru variant

Fonematický sluch je schopnost rozlišovat sluchem jednotlivé hlásky ve slovech.

NÁPRAVY KOMUNIKAČNÍCH SCHOPNOSTÍ. poruchy učení. PhDr. Miroslava Sedlárová speciální pedagog ZŠ Zlatnická 186, Most

SYNTÉZA ŘEČI. Ústav fotoniky a elektroniky, v.v.i. AV ČR, Praha

VZDĚLÁVÁNÍ ŽÁKŮ SE SPECIFICKÝMI PORUCHAMI UČENÍ A CHOVÁNÍ

ZPRACOVÁNÍ A ANALÝZA EEG. Jan Prokš. Katedra teorie obvodů, Fakulta elektrotechnická, České vysoké učení technické v Praze.

Laboratorní práce (č.10)

Číselné charakteristiky a jejich výpočet

OPTIMÁLNÍ SEGMENTACE DAT

Předmět:: Český jazyk a literatura

Direct Digital Synthesis (DDS)

Testy do hodin - souhrnný test - 6. ročník

Biomedicínské inženýrství na ČVUT FEL

Souhrnné výsledky za školu

Software pro modelování chování systému tlakové kanalizační sítě Popis metodiky a ukázka aplikace

Zpráva pro školu z evaluačního nástroje Strategie učení se cizímu jazyku

Výstupy z RVP Učivo Ročník Průřezová témata Termín Komunikační a slohová výchova 1. plynule čte s porozuměním texty přiměřeného rozsahu a náročnosti

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY

Reranking založený na metadatech

Inferenční statistika - úvod. z-skóry normální rozdělení pravděpodobnost rozdělení výběrových průměrů

BOMAT- SHORT. Bochumský maticový test - krátká verze. HTS Report. Jan Novák ID Datum administrace Forma A 1.

český jazyk a literatura

Tvorba grafů v programu ORIGIN

Vzdělávací obsah vyučovacího předmětu

Transkript:

Klasifikace Landau-Kleffnerova syndromu malých dětí 1. Abstrakt Petr Zlatník ČVUT FEL, K13131 Katedra teorie obvodů Tento příspěvěk pojednává o klasifikaci Landau-Kleffnerova syndromu, který se projevuje u malých dětí. Daný problém je řešen ve spolupráci s Fakultní nemocnicí v Motole, kde jsou nahrávány řečové promluvy od postižených dětí. Syndrom lze detekovat a klasifikovat jednak ze signálu mozkové aktivity (EEG) nebo testováním promluv. Zde je využíváno testování a porovnávání promluv s promluvami od zdravých dětí pomocí principů rozpoznávačů řeči. Do budoucna by měla vzniknout metoda, která bude schopna jednak porovnáním se zdravými dětmi určit jak hodně je dané dítě postižené a měla by být schopna rozlišit, zda se syndrom u postiženého dítěte léčbou lepší či ne. Uvedené algoritmy jsou naprogramovány v Matlabu verze 6.0.0.88. Pro práci s databázema řečových promluv byl využit Cool Edit 2000. 2. Úvod Landau-Kleffnerův syndrom je vzácná nemoc, která se projevuje zřídka u malých dětí mezi třetím až sedmým rokem. Jedná se o náhlou nebo postupnou poruchu té části mozku, která zodpovídá za porozumění a výslovnost řeči. Daný syndrom se tedy projevuje abnormálními stavy v EEG signálu. Pomocí tohoto signálu je skutečně ve většině případů tento syndrom lékaři sledován a klasifikován. Typicky se dané dítě nejprve vyvíjí normálně a okolo třetího roku se začne daný syndrom projevovat neschopností dítěte přesně zopakovat řečené slovo a větu, má problémy s výslovností a může mít problémy s učením. V extrémních případech dítě nerozumí ani svému vlastnímu jménu a tím se jeví na první pohled jako sluchově postižené, není schopné rozeznat okolní zvuky, jako je telefon. S tím souvisí stavy depresí, podrážděnosti a neschopnosti se soustředit.

3. Použité metody klasifikace 3.1. Porovnání délek okluze ve slovech První pokusy při klasifikaci Landau-Kleffnerova syndromu vedly k tomu, že byl předpoklad větší délky okluze vybraných slov nemocných dětí oproti zdravým. Okluze je speciální typ souhlásky. Souhláska obecně je vytvářena vzduchovou turbulencí vznikající třením proudu vzduchu při výdechu o překážku, kterou tvoří artikulační orgány jako například rty, zuby nebo špička jazyka. Pokud je překážka úplná (nazývá se také závěr), vzniká v okamžiku jejího přerušení krátký šum, který se podobá výbuchu, explozi. Souhlásky, které vznikají při využití úplné překážky se nazývají okluze. Mezi ně patří m, n, ň, g, d, d, b, p, t, t, k. Protože nemocné děti mají problémy s vyslovením slova a jejich reakce při opakování daného slova je většinou pomalejší než u zdravých dětí, byl předpoklad, že bude větší délka okluze jednotlivých hlásek ve vybraných slovech než je tomu u zdravých dětí. Daná myšlenka byla testována na slově papír, kde se testovala ve spektrogramu délka okluze p. Průběh je na obrázku 1, kde je daná délka na časové ose vyznačena dvěma svislými čarami. Průběh spektrogramu je z promluvy zdravého dítěte. Obrázek 1: Spektrogram slova papír s vyznačením délky okluze Bohužel délka okluzí nemocných dětí není větší v porovnání se zdravými. Z poslechu jednotlivých promluv bylo zjištěno, že to je dáno tím, že nemocné děti řeknou hlásku p stejně rychle jako zdravé, ale už nejsou schopné vyslovit správně hlásku r na konci slova.

Danou metodu proto nelze využít. 3.2. Využití algoritmu borcení časové osy (DTW) Další možnost pro klasifikaci syndromu bylo využití algoritmu borcení časové osy (DTW, Dynamic Time Warping). Tento algoritmus byl popsán v mnoha publikacích, proto je zde o něm zmíněno stručně, pro tyto účely se vycházelo z [3]. Nejprve bylo nutno natrénovat průměrné modely jednotlivých referenčních slov z promluv od co nejvíce zdravých dětí, bylo jich k dispozici přibližně třicet. Toho se dosáhlo tímto způsobem. Jednotlivé promluvy byly nasegmentovány na časové úseky 10 ms. Každý ze segmentů byl popsán jedenácti LPC koeficienty pomocí Burgova algoritmu, které byly dále převedeny na kepstrální. Protože každé dítě namluví stejné slovo různě rychle, tak se samozřejmě každý model referenčního slova skládal z různého počtu segmentů při dodržení kroku segmentace 10 ms. Proto bylo nutné normovat každý model na průměrný počet segmentů, aby šel vypočítat průměrný model každého slova ze všech dětí. Toho se dosáhlo pomocí vztahů v [3]. Nakonec byl vypočítán průměrný model. Stejným způsobem bylo popsáno slovo od nemocného dítěte včetně výše popsaného průměrování. Potom již bylo možné vypočítat matici kepstrálních vzdáleností, výpočet byl proveden pomocí klasických Euklidovských vzdáleností. Tato matice byla procházena ve směru nejmenší vzdálenosti z jednoho rohu do protějšího (nebývá směr po úhlopříčce, ale po obecné křivce), jak je naznačeno na obrázku 2 a byl vypočítán naakumulovaný součet minimálních kepstrálních vzdáleností S, který lze matematicky popsat jako Obrázek 2: Průchod matice kepstrálních vzdáleností Tento výpočet se provádí v cyklu, tedy po postoupení na další políčko se provádí znovu výpočet součtu kepstrálních vzdáleností pro 3 nebližší okolní políčka (S1, S2, S3) až do průchodu celou maticí, tzn. od roku 1,1 do rohu M, N, kde M, N jsou počty segmentů referenčního a srovnávaného signálu. V mém případě samozřejmě M = N, protože je jak průměrný model tak i testované slovo normováno na průměrný počet segmentů. Byl

předpoklad, že když se budou s průměrným modelem porovnávat jednotlivá slova od zdravých dětí, tak v matici kepstrálních vzdáleností půjde vymezit oblast zdravých dětí a testovat, zda nemocné dítě spadne dovnitř nebo ne. Pokud spadne vně, tak se jedná o nemocné dítě. Bohužel se tato domněnka nepotvrdila. Při porovnání nemocného dítěte s průměrným modelem docházelo k tomu, že průchod maticí byl více po úhlopříčce než při porovnání zdravého dítěte. Při porovnávání nemocných dětí s průměrným modelem však ve většině případů byla podstatně větší celková naakumulovaná vzdálenost S než při porovnávání se zdravými. Proto se bylo ubíráno tímto směrem. Metoda ale nebyla stoprocentně korektní. Algoritmus DTW vykazoval neschopnost rozpoznání například nevyslovení jedné hlásky ve slově. Když zdravé dítě vyslovilo slovo mateřídouška pomaleji než většina dětí z kterých byl počítán průměrný model, tak celková naakumulovaná vzdálenost byla vysoká a algoritmus označil zdravé dítě chybně jako nemocné. Pokud ale nemocné dítě vyslovilo matouška místo mateřídouška, docházelo k tomu, že vzdálenost byla nízká a algoritmus označil chybně naopak nemocné dítě za zdravé. Protože ani tato metoda není příliš spolehlivá, byla vyzkoušena metoda založená na trochu jiném principu. 3.3. Testování odchylek kepstrálních koeficientů Jak již bylo uvedeno výše, algoritmus DTW není spolehlivý. Proto byla vyzkoušena ještě jedna možnost klasifikace vycházející ze základu algoritmu DTW. Jednotlivé promluvy od zdravých i nemocných dětí byly opět segmentovány s délkou časového úseku 10 ms. Každý segment byl popsán jedenácti kepstrálními koeficienty a bylo provedeno normování na průměrný počet segmentů pro jednotlivá slova a mluvčí. Pro testované slovo se z promluv všech zdravých dětí určila nejmenší a největší hodnota každého kepstrálního koeficientu ve všech segmentech a tím vznikly intervaly koeficientů zdravých dětí. Potom bylo porovnáváno, kolik hodnot kepstrálních koeficientů nemocného dítěte přes všechny segmenty spadne mimo intervaly definované zdravými dětmi a kolik dovnitř. Počet hodnot koeficientů padajících mimo je úměrný stupni postižení daného dítěte. Ani tento algoritmus však není schopen spolehlivě rozlišit zdravé dítě od nemocného. Problém je opět v tom, jako u DTW, že pokud většina dětí trénovací databáze namluví určité slovo přibližně stejně rychle, pak při klasifikaci slova od dítěte které ho namluví pomaleji dojde k označení zdravého dítěte za nemocné. Naopak pokud nemocné dítě vypustí ve slově hlásku, občas dochází k tomu, že to algoritmus nezaznamená a naopak klasifikuje nemocné dítě za zdravé. 4. Zhodnocení Na závěr lze konstatovat, že srovnávání délek okluze u zdravých a nemocných dětí nelze

využít. Neprokázalo se, že by byla u nemocných dětí větší délka. Bylo zjištěno, že její délka závisí především na tom, jak rychle dané dítě testované slovo vysloví. Algoritmus DTW je nespolehlivý, pro některá slova více, pro některá méně, neuvažuje se další jeho využití v této podobě pro další práci. Testování odchylek kepstrálních koeficientů opět není spolehlivé. Daný algoritmus byl testován již na rozšířené databázi, jak na delších slovech jako je mateřídouška, televize, tak i na kratších slovech která se obtížně vyslovují jako je krk, ale i na jednotlivých souhláskách a samohláskách. Pro další práci by bylo vhodné rozšířit databázi jak zdravých tak i nemocných dětí a algoritmus otesovat znova. Srovnání úspěšnosti rozlišení všech tří algoritmů zdravých dětí od nemocných v % je v tabulce 1. SLOVO *1 *2 *3 KRK - 96 83 MOTOVIDLO - 83 66 TELEVIZE - 97 83 POPELNICE 35 83 66 MATEŘÍDOUŠKA - 67 66 RŮZNOBAREVNÝ - 67 66 Tabulka 1: Tabulka úspěšnosti v % všech tří algoritmů pozn.: *1 - Úspěšnost srovnávání délek okluze v % pro slovo popelnice pozn.: *2 - Úspěšnost algoritmu DTW pro různá slova v % pozn.: *3 - Úspěšnost testování odchylek kepstrálních koeficientů pro různá slova v % 5. Výhled pro další práci Ve výhledu je počítáno s tím, že bude využit rozpoznávač na principu skrytých Markovových modelů (HMM) s využitím softwaru HTK. Zde je předpoklad, že narozdíl od výše popisovaných algoritmů bude schopen lépe rozlišovat a popisovat jednotlivé hlásky ve slovech a nebude docházet tolik často k tomu, že bude označeno zdravé dítě za nemocné a naopak. 6. Poděkování Tato práce je podporována grantem č. 13131/13/03016 Modelování biologických a řečových signálů a výzkumným záměrem č. 102/03/H085.

7. Literatura [1] P. Sovka, P. Pollák : Vybrané metody číslicového zpracování signálů. Ediční středisko ČVUT Praha, 2001 [2] V. Davídek, P. Sovka : Číslicové zpracování signálů a implementace. Vydavatelství ČVUT Praha, 2002 [3] J. Psutka: Komunikace s počítačem mluvenou řečí. Vydala Academia Praha, 1995, tisk CENTA, spol. s. r. o., Veveří 39, Brno 8. Kontaktní informace Ing. Petr Zlatník České vysoké učení technické v Praze ČVUT FEL K13131, Technická 2, 166 27 Praha 6, Tel.: (+420) 22435 2820 E-mail: zlatnik.petr@seznam.cz Česká republika