promluvách založených na rychlém opakováni slabik /pa/-/ta/ /ka/

Podobné dokumenty
AKUSTICKÁ ANALÝZA INTENZITY A RYCHLOSTI ŘEČI U PARKINSONOVY NEMOCI

ADA Semestrální práce. Harmonické modelování signálů

HODNOCENÍ DŮRAZU, EMOCÍ, RYTMU, ARTIKULAČNÍ RYCHLOSTI A PRAVIDELNOSTI U PARKINSONOVY NEMOCI

SYNTÉZA AUDIO SIGNÁLŮ

Klasifikace Landau-Kleffnerova syndromu

vzorek vzorek

Zvuk. 1. základní kmitání. 2. šíření zvuku

TSO NEBO A INVARIANTNÍ ROZPOZNÁVACÍ SYSTÉMY

POROVNÁNÍ METOD PRO MĚŘENÍ ODLIŠNOSTI SPEKTER SIGNÁLŮ

Komplexní obálka pásmového signálu

Quantization of acoustic low level signals. David Bursík, Miroslav Lukeš

STANOVENÍ CHARAKTERU SEGMENTU ŘEČI S VYUŽITÍM REÁLNÉHO KEPSTRA

3 METODY PRO POTLAČENÍ ŠUMU U ŘE- ČOVÉHO SIGNÁLU

Zvýrazňování řeči pomocí vícekanálového zpracování

Konsonanty. 1. úvod. 2. frikativy. - zúžením v místě artikulace vzniká sloupec vzduchu, směrodatná je délka předního tubusu

Osnova. Idea ASK/FSK/PSK ASK Amplitudové... Strana 1 z 16. Celá obrazovka. Konec Základy radiotechniky

Fyzikální podstata zvuku

Laboratorní úloha č. 8: Elektroencefalogram

Algoritmy a struktury neuropočítačů ASN - P11

Pokročilé operace s obrazem

Fyziologická akustika. fyziologická akustika: jak to funguje psychologická akustika: jak to na nás působí

České akustické společnosti. Obsah

J. Tatarinov, P. Pollák. Fakulta elektrotechnická. Abstrakt. otestován a zhodnocen na signálech z databáze CAR2CS. Detektor využívající

České vysoké učení technické v Praze. Fakulta elektrotechnická Katedra kybernetiky

KTE/TEVS - Rychlá Fourierova transformace. Pavel Karban. Katedra teoretické elektrotechniky Fakulta elektrotechnická Západočeská univerzita v Plzni

ANALÝZA POTLAČOVÁNÍ AKUSTICKÉHO ECHA A DTD DETEKCE V CHYTRÝCH TELEFONECH

Úloha 5: Spektrometrie záření α

2.6. Vlastní čísla a vlastní vektory matice

UNIVERZITA PARDUBICE. 4.4 Aproximace křivek a vyhlazování křivek

MĚŘENÍ ČASOVÉHO ZPOŽDĚNÍ MEZI SIGNÁLY MOZKU: APLIKACE V EPILEPTOLOGII Jan Prokš 1, Přemysl Jiruška 2,3

SEMESTRÁLNÍ PRÁCE X. Aproximace křivek Numerické vyhlazování

Univerzita Pardubice. Fakulta chemicko-technologická Katedra analytické chemie. Licenční studium Statistické zpracování dat

Nabídky spolupráce pro průmysl

FUNKCE PRO DETEKCI ZÁKLADNÍ FREKVENCE

13. Lineární procesy

Algoritmy a struktury neuropočítačů ASN P8b

Realizace algoritmu pro segmentaci promluv pacientů trpících Huntingtonovou nemocí

Efekt rtms na hypokinetickou dysartrii u Parkinsonovy nemoci

AKUSTICKÉ ANALÝZY PORUCH HLASU A ŘEČI U ONEMOCNĚNÍ CENTRÁLNÍ NERVOVÉ SOUSTAVY Roman Čmejla, Jan Rusz

Virtuální elektrody v kochleárních implantátech Nucleus 24

Využití RPS pro potlačování šumu v řečových signálech

Měření na výkonovém zesilovači 1kW/144MHz by OK1GTH

Strategie ACE využívající virtuální elektrody v kochleárních implantátech Nucleus 24

Synth challange 2016

Pooperační objektivní posouzení hlasu

Geometrické transformace

PaedDr. Lenka Dohnalová RNDr. Tomáš Fürst, PhD. Katedra Hv PdF UP Olomouc

Odhad základního tónu řeči s lokalizací hlasivkových pulsů a pitch-synchronní segmentace

1. Vlastnosti diskretních a číslicových metod zpracování signálů... 15

Kepstrální analýza řečového signálu

DETEKCE HRAN V BIOMEDICÍNSKÝCH OBRAZECH

IDENTIFIKACE ŘEČOVÉ AKTIVITY V RUŠENÉM ŘEČOVÉM SIGNÁLU

ODR metody Runge-Kutta

PREDIKCE DÉLKY KOLONY V KŘIŽOVATCE PREDICTION OF THE LENGTH OF THE COLUMN IN THE INTERSECTION

České akustické společnosti. Obsah

Analýza a zpracování digitálního obrazu

VLIV GEOMETRICKÉ DISPERZE

Návrh frekvenčního filtru

METODY DOLOVÁNÍ V DATECH DATOVÉ SKLADY TEREZA HYNČICOVÁ H2IGE1

Čas (s) Model časového průběhu sorpce vyplývá z 2. Fickova zákona a je popsán následující rovnicí

Spektrální analýza a diskrétní Fourierova transformace. Honza Černocký, ÚPGM

MĚŘENÍ PARAMETRŮ FOTOVOLTAICKÉHO ČLÁNKU PŘI ZMĚNĚ SÉRIOVÉHO A PARALELNÍHO ODPORU

Amplitudová a frekvenční modulace

fluktuace jak dob trvání po sobě jdoucích srdečních cyklů, tak hodnot Heart Rate Variability) je jev, který

2. Schurova věta. Petr Tichý. 3. října 2012

Úvod do zpracování signálů

Faculty of Nuclear Sciences and Physical Engineering Czech Technical University in Prague

VYUŽITÍ MATLABU PRO PODPORU VÝUKY A PŘI ŘEŠENÍ VÝZKUMNÝCH ÚKOLŮ NA KATEDŘE KOMUNIKAČNÍCH A INFORMAČNÍCH SYSTÉMŮ

Šum AD24USB a možnosti střídavé modulace

Úloha 1. Napište matici pro případ lineárního regresního spline vyjádřeného přes useknuté

Automatická detekce anomálií při geofyzikálním průzkumu. Lenka Kosková Třísková NTI TUL Doktorandský seminář,

Praha, Pavel Puff

Petr Zlatník, Roman Čmejla. Katedra teorie obvodů, Fakulta elektrotechnická, ČVUT, Praha. Abstrakt

Pro praktické využití jsou důležité tyto parametry: Dosah při nejhorší možné poloze antén Dosah při povolené odchylce 457 khz +-80Hz

INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ. Příklady použití tenkých vrstev Jaromír Křepelka

Detekce nádechů v řečovém signálu

Vyhodnocení 2D rychlostního pole metodou PIV programem Matlab (zpracoval Jan Kolínský, dle programu ing. Jana Novotného)

Stanovení typu pomocného regulátoru v rozvětvených regulačních obvodech

Klasifikace hudebních stylů

K metodám převodu souřadnic mezi ETRS 89 a S-JTSK na území ČR

Fyzikální sekce přírodovědecké fakulty Masarykovy univerzity v Brně FYZIKÁLNÍ PRAKTIKUM. Praktikum z pevných látek (F6390)

Modernizace a inovace výpočetní kapacity laboratoří ITE pro účely strojového učení. Jiří Málek

Srovnávací studie cementovaných a nitridovaných vzorků pomocí analýzy Barkhausenova šumu a RTG difrakce

Protiopatření eliminující proudovou analýzu

1 Zpracování a analýza tlakové vlny

Aleš BARTOŠ. AD Centrum Neurologická klinika, UK 3. LF a FNKV, Praha & Psychiatrické centrum Praha

JAK VZNIKÁ LIDSKÝ HLAS? Univerzita Palackého v Olomouci

Jan Černocký ÚPGM FIT VUT Brno, FIT VUT Brno

Stupnice geomagnetické aktivity

Funkce basálních ganglií: koordinace pohybů Hypokinetické a hyperkinetické syndromy Parkinsonova a Huntingtonova nemoc Motorické poruchy řeči

Detekce kartografického zobrazení z množiny

Číslicové zpracování signálů a Fourierova analýza.

C82,C83,C84,C85 - Ne-Hodgkinův lymfom

31ZZS 9. PŘEDNÁŠKA 24. listopadu 2014

Direct Digital Synthesis (DDS)

ROZPOZNÁVÁNÍ AKUSTICKÉHO SIGNÁLU ŘEČI S PODPOROU VIZUÁLNÍ INFORMACE

7 Další. úlohy analýzy řeči i a metody

Informace ze zdravotnictví Olomouckého kraje

Zpráva k semestrální práci

Funkce basálních ganglií: koordinace pohybů Hypokinetické a hyperkinetické syndromy Parkinsonova a Huntingtonova nemoc Motorické poruchy řeči

Transkript:

Automatické hledání významných pozic v Parkinsonických promluvách založených na rychlém opakováni slabik /pa/-/ta/ /ka/ M. Novotný, J. Rusz, R. Čmejla České vysoké učení v Praze, Fakulta elektrotechnická, Katedra teorie obvodů Abstrakt Práce se zabývá využitím programového prostředí Matlab pro zpracování patologických promluv pacientů trpících Parkinsonovou nemocí (PN). Promluvy založené na rychlém opakování slabik /pa/ /ta/ /ka/, byly postupně segmentovány na jednotlivé slabiky, ve kterých byly poté označeny pozice počátku exploze, vokálu a okluze. Výsledky automatické segmentace byly porovnány s ručně označenými pozicemi. Při zpracování 8 (4 PN; 4 kontrolní skupina (KS)) promluv a celkového počtu 644 slabik (753 PN; 89 KS) bylo s přesností na 5ms dosahováno úspěšností pro explozi rovnou 79,35%, pro vokál rovnou 86,4% a pro okluzi rovnou 53,3%. Úvod Parkinsonova nemoc (PN) je druhým nejrozšířenějším neurodegenerativním onemocněním po Alzheimerově nemoci []. Toto onemocnění postihuje zejména populaci starší 5 let a tento fakt společně s celosvětovým stárnutím populace naznačuje, že četnost Parkinsonovy nemoci se bude zvyšovat []. Jedním z prodromálních, subklinických PN symptomů, který se vyskytuje v 7 9% případů, je hypokinetická dysartrie, jejíž hodnocení by mohlo napomoci včasné diagnóze a hodnocení vývoje onemocnění [2], [3]. Pro potřeby hodnocení hypokinetické dysartrie se mimo jiné využívá i řečová diadochokinetická (DDK) úloha, založená na rychlém opakování slabik /pa/ /ta/ /ka/. Cílem této práce je ukázat možnost využití programu Matlab pro automatické hodnocení těchto promluv. Pro hodnocení kvality promluv je třeba v jednotlivých slabikách označit tři základní pozice. První pozicí je počátek exploze (E), druhou pozicí je počátek vokálu (V) a poslední je počátek okluze (O). 2 Metodika V této sekci bude uvedena informace o databázi a metodách využitých při zpracování jednotlivých signálů. Zároveň, vzhledem k rozdílnému charakteru jednotlivých pozic, bude v každé sekci stručně shrnuta problematika. 2. Databáze Pro návrh algoritmu byla využita část databáze shromážděné pro práci [4], tato část obsahovala pouze nahrávky obsahující promluvy řečové DDK úlohy. Databáze byla tvořena 8 nahrávkami získanými od 46 česky mluvících rodilých mluvčích (24 PN; 22 KS). Skupina PN byla tvořena lidmi s diagnózou raného stádia Parkinsonovy nemoci, bez předchozí medikace. Kontrolní skupina byla vytvořena tak aby věkově odpovídala skupině PN a obsahovala lidi bez neurologické a řečové patologie.

2.2 Hrubá segmentace Tento krok řeší problém s počáteční neznalostí celkového počtu slabik v jedné promluvě tak, že promluvu rozdělí na úseky obsahující jednotlivé slabiky. Tím problém s neznámým počtem pozic v jednom signálu rozdělí na neznámý počet úloh hledání jedné od každé pozice. Hrubá segmentace probíhá pomocí energetické obálky a je založena na předpokladu, že každý vokál obsahuje vyšší energii, a proto je možné podle polohy lokálních maxim v energetické obálce hledat přibližné pozice středů slabik. Jeden segment získaný pomocí hrubé segmentace je zobrazen na obrázku. V tomto obrázku jsou také vyznačeny jednotlivé pozice E, V a O. signal.8.6.4.2.2.4.6.8 slabika /PA/ E V O Znelost 2 4 6 8 2 t(ms) Obrázek : Označená slabika /pa/ zdravého jedince a pacienta s PN 2.3 Detekce exploze Exploze se nachází v přední části signálu, proto prohledáváme pouze část před lokálním maximem. Zároveň je charakteristická prudkým nárůstem šumové energie, která je sice celkově nižší než energie vokálu, nicméně je vybuzena v celé šíři spektra. Z toho důvodu je výhodné přistupovat k řešení ve spektrální oblasti a detekovat E ze spektrogramu. Ke spektrogramu je přistupováno jako k matici P, která ve sloupcích obsahuje spektra jednotlivých časových úseků. Matice P je filtrována pomocí matice T která má předpis T mez (i,j) = w e n Filtrace matice P pak probíhá podle přepisu N P(i,j). () j= P f (i,j) = { P(i,j) P(i,j) Tmez P(i,j) < T mez. (2) Z takto filtrované matice je poté vysčítáním jednotlivých sloupců získána energetická obálka signálu a vysčítáním částí sloupců obsahujících frekvence nad 5Hz je získána energetická obálka vysokofrekvenční části signálu. Vzájemné a absolutní polohy těžiště jednotlivých energetických obálek jsou použity pro vyřazení falešných detekcí. Zároveň je použita celková energetická obálka pro přibližný odhad polohy V, pomocí které je korigována poloha prohledávané oblasti.

Pro detekci E je poté využita obálka signálu filtrovaného podle předpisu P f (i,j) = { P(i,j) Tmez P(i,j) < T mez. (3) Takto filtrovaný signál lépe zohledňuje to, že při explozi je vybuzeno celé spektrum a snižuje vliv vyšších energií na nižších frekvencí obsažených u vokálu. 2.4 Detekce vokálu Jak již bylo uvedeno výše, vokál obsahuje největší energii, která se projevuje zejména na nižších frekvencích a má harmonický charakter. Využitou metodou pro detekci V je Bayesovský skokový detektor (BSCD) [5], který využívá charakteru přechodu mezi šumovou explozívou a znělým vokálem. Výstup z BSCD je zobrazen na obrázku 2. Rucni/referencni pozice V signal 2 3 4 5 6 BSCD.8.6.4.2 Detekovana pozice V 2 3 4 5 6 pocet vzorku Obrázek 2: Postup detekce počátku vokálu V horní části je zobrazen signál v časové oblasti s vyznačenou pozicí V, ve spodní části je pak zobrazen výstup z BSCD. Po získání BSCD výstupu je nutné určit které lokální maximum odpovídá pozici V. Zde vycházíme z předpokladu, že základní perioda vokálu je kratší než celá explozíva. Proto vybíráme maximum následující za nejdelší mezerou. Následující periodicky se opakující peaky odpovídají jednotlivým periodám hlasivkového tónu. 2.5 Detekce okluze Pro detekci se jako nejúčinnější ukázala invertovaná polynomiální mez, která aproximuje energetickou obálku signálu a má tvar Výběr stupně polynomu byl prováděn pomocí automatického algoritmu, který vyhodnocuje chybu aproximace. Výsledná detekce je ilustrována na obrázku 3. mez polynom = n (a i x+b(i))+2 x. (4) i= 2.6 Zpětná vazba Pro zlepšení výsledků detekce byla realizována zpětná vazba, kdy byla porovnána vzdálenost mezi E a V a v případě, že nespadá do fyziologických mezí je nejprve porovnána pozice V s odhadem V z části 2.3.

energie signalu.9.8.7.6.5.4.3.2. detekovana O mez polynom 2 3 4 5 6 7 8 poradi vzorku Obrázek 3: Postup detekce počátku vokálu 2.7 Hodnocení úspěšnosti Pro hodnocení úspěšnosti byly jako referenční hodnoty použity ručně označené pozice E, V a O. Na obrázku 4 je vidět ROC křivka. úspěšnost detekce (%) 9 8 7 6 5 4 3 2 E V O 5 5 2 25 3 35 4 mez (ms) Obrázek 4: ROC křivky pro detekce jednotlivých pozic E, V a O 3 Závěr V práci byl prezentován algoritmus pro automatickou segmentaci řečové DDK úlohy. Tento algoritmus dosahoval při 5ms mezi těchto hodnot E 5ms = 79,4%, V 5ms = 86,4%a O 5ms = 53,3%. Ovšem pro detekci O je vzhledem k jeho charakteru vypovídající spíše ms mez kde O ms = 73,9%. Zároveň je pro PN skupinu dosahováno výsledků E 5ms = 73,6%, V 5ms = 82,6%, O 5ms = 46,6% a O ms = 66,6%. Z uvedených hodnot je vidět, že program funguje robustně i pro detekci u PN. 4 Poděkování Tato práce je podporována z grantů SGS 2/85/OHK4/3T/3 a GAČR 2/2/223.

Reference [] Van Den Eeden, S., K., Tanner, C., M., Bernstein, A., L., Fross, R., D., Leimpeter, A., Bloch, D., A., Nelson, L., M.: Incidence of Parkinson s disease: Variation by age, gender, and race/ethnicity,am. J. Epidemiol.,57,5 22,23. [2] Logemann, A., J., Fisher, H., B., Boshes, B., Blonsky, E., R.: Frequency and coocurrence of vocal tract disfunction in the speech of a large sample of Parkinson patients,j. Speech Hear. Disord.,43,47 57,978. [3] Duffy, J., R.: Motor Speech Disorders: Substrates, Differential Diagnosis and Management, 2nd ed.mosby, New York, NY,25, pp. 592. [4] Rusz, J., Čmejla, R., Růžičková, H., Klempíř, J., Majerová, V., Picmausová, J., Roth, J., Růžička, E.: Acoustic assesment of voice and speech disorders in Parkinson s disease through quick vocal test, Mov. Disord., 26(), 95-952, 2. [5] Čmejla, R., Sovka, P.: Recursive Bayesian Autoregressive Changepoint Detector for Sequential Signal Segmentation,EUSipco Proceedings, Wien(24),245 248. M. Novotný novotm26@fel.cvut.cz J. Rusz ruszjan@fel.cvut.cz R. Čmejla cmejla@fel.cvut.cz