Využití algoritmu DTW pro vyhodnocování vad řeči dětí postižených Landau-Kleffnerovým syndromem (LKS)



Podobné dokumenty
Klasifikace Landau-Kleffnerova syndromu

Petr Zlatník, Roman Čmejla. Katedra teorie obvodů, Fakulta elektrotechnická, ČVUT, Praha. Abstrakt

DTW. Petr Zlatník, Roman Čmejla. Abstrakt: Příspěvek popisuje metodu, která byla vyvinuta pro vyhodnocení

Rozpoznávání izolovaných slov (malý slovník, např. číslovky, povely).

ADA Semestrální práce. Harmonické modelování signálů

Signál v čase a jeho spektrum

Klasifikace hudebních stylů

Kepstrální analýza řečového signálu

1. Vlastnosti diskretních a číslicových metod zpracování signálů... 15

Zvýrazňování řeči pomocí vícekanálového zpracování

Semestrální práce: Rozpoznání hláskované řeči a převedení na text

3 METODY PRO POTLAČENÍ ŠUMU U ŘE- ČOVÉHO SIGNÁLU

A6M33BIO- Biometrie. Biometrické metody založené na rozpoznávání hlasu I

STANOVENÍ CHARAKTERU SEGMENTU ŘEČI S VYUŽITÍM REÁLNÉHO KEPSTRA

KTE/TEVS - Rychlá Fourierova transformace. Pavel Karban. Katedra teoretické elektrotechniky Fakulta elektrotechnická Západočeská univerzita v Plzni

MĚŘENÍ ČASOVÉHO ZPOŽDĚNÍ MEZI SIGNÁLY MOZKU: APLIKACE V EPILEPTOLOGII Jan Prokš 1, Přemysl Jiruška 2,3

SYNTÉZA AUDIO SIGNÁLŮ

Ondřej Drbal. K Katedra teorie obvodů, Fakulta elektrotechnická

Číslicové zpracování signálů a Fourierova analýza.

TSO NEBO A INVARIANTNÍ ROZPOZNÁVACÍ SYSTÉMY

v Praze mezi kanály EEG Ondřej Drbal 5. ročník, stud. sk. 9

MĚŘENÍ A ANALÝZA ELEKTROAKUSTICKÝCH SOUSTAV NA MODELECH. Petr Kopecký ČVUT, Fakulta elektrotechnická, Katedra Radioelektroniky

DETEKCE HRAN V BIOMEDICÍNSKÝCH OBRAZECH

Quantization of acoustic low level signals. David Bursík, Miroslav Lukeš

UŽITÍ KOHERENČNÍ FUNKCE PRO DISTRIBUOVANOU

VYUŽITÍ MATLABU PRO PODPORU VÝUKY A PŘI ŘEŠENÍ VÝZKUMNÝCH ÚKOLŮ NA KATEDŘE KOMUNIKAČNÍCH A INFORMAČNÍCH SYSTÉMŮ

LPC. Jan Černocký ÚPGM FIT VUT Brno, FIT VUT Brno. LPC Jan Černocký, ÚPGM FIT VUT Brno 1/39

Spektrální analýza a diskrétní Fourierova transformace. Honza Černocký, ÚPGM

7 Další. úlohy analýzy řeči i a metody

Algoritmy a struktury neuropočítačů ASN - P10. Aplikace UNS v biomedicíně

A7B31ZZS 4. PŘEDNÁŠKA 13. října 2014

Komprese dat Obsah. Komprese videa. Radim Farana. Podklady pro výuku. Komprese videa a zvuku. Komprese MPEG. Komprese MP3.

1 LPC. Jan Černocký, FIT VUT Brno, 15. května 2007

ANALÝZA POTLAČOVÁNÍ AKUSTICKÉHO ECHA A DTD DETEKCE V CHYTRÝCH TELEFONECH

ROZPOZNÁVÁNÍ AKUSTICKÉHO SIGNÁLU ŘEČI S PODPOROU VIZUÁLNÍ INFORMACE

MATLAB PRO PODPORU VÝUKY KOMUNIKAČNÍCH SYSTÉMŮ

Strategie ACE využívající virtuální elektrody v kochleárních implantátech Nucleus 24

ROZPOZNÁNÍ TITULU GRAMOFONOVÉ DESKY PODLE KRÁTKÉ UKÁZKY

Pokročil. Vyučující: Prof. Ing. Jan Nouza, CSc., ITE

Algoritmy a struktury neuropočítačů ASN - P11

Frekvenční charakteristiky

Direct Digital Synthesis (DDS)

Teorie úlohy: Operační zesilovač je elektronický obvod, který se využívá v měřící, výpočetní a regulační technice. Má napěťové zesílení alespoň A u

Biofyzikální ústav LF MU Brno. jarní semestr 2011

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY

Automatická detekce anomálií při geofyzikálním průzkumu. Lenka Kosková Třísková NTI TUL Doktorandský seminář,

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ

Dolování dat z multimediálních databází. Ing. Igor Szöke Speech group ÚPGM, FIT, VUT

České vysoké učení technické v Praze Fakulta elektrotechnická. Předzpracování řeči s šumovým pozadím pro účely komunikace a rozpoznávání

Úvod do praxe stínového řečníka. Automatické rozpoznávání řeči

základní vlastnosti, používané struktury návrhové prostředky MATLAB problém kvantování koeficientů

Kalkulace závažnosti komorbidit a komplikací pro CZ-DRG

Osnova. Idea ASK/FSK/PSK ASK Amplitudové... Strana 1 z 16. Celá obrazovka. Konec Základy radiotechniky

Speciální struktury číslicových systémů ASN P12

Analýza a zpracování signálů

2D transformací. červen Odvození transformačního klíče vybraných 2D transformací Metody vyrovnání... 2

A/D převodníky - parametry

ROZ1 CVIČENÍ VI. Geometrická registrace (matching) obrazů

Virtuální elektrody v kochleárních implantátech Nucleus 24

GIS ANALÝZA VLIVU DÁLNIČNÍ SÍTĚ NA OKOLNÍ KRAJINU. Veronika Berková 1

Akustika. 3.1 Teorie - spektrum

Měřící přístroje a měření veličin

Nabídky spolupráce pro průmysl

IDENTIFIKACE ŘEČOVÉ AKTIVITY V RUŠENÉM ŘEČOVÉM SIGNÁLU

Projekční algoritmus. Urychlení evolučních algoritmů pomocí regresních stromů a jejich zobecnění. Jan Klíma

Přednáška 13 Redukce dimenzionality

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

Jasové transformace. Karel Horák. Rozvrh přednášky:

CVIČNÝ TEST 5. OBSAH I. Cvičný test 2. Mgr. Václav Zemek. II. Autorské řešení 6 III. Klíč 17 IV. Záznamový list 19

Fourierova transformace

Biomedicínské inženýrství na ČVUT FEL

doc. Dr. Ing. Elias TOMEH Elias Tomeh / Snímek 1

Laboratorní úloha č. 8: Elektroencefalogram

Snímání biologických signálů. A6M31LET Lékařská technika Zdeněk Horčík Katedra teorie obvodů

UNIVERZITA PARDUBICE. 4.4 Aproximace křivek a vyhlazování křivek

31ZZS 9. PŘEDNÁŠKA 24. listopadu 2014

Motivace příklad použití lokace radarového echa Význam korelace Popis náhodných signálů číselné charakteristiky

Harmonizace metod vyhodnocení naměřených dat při zkratových zkouškách

Globální matice konstrukce

doc. Dr. Ing. Elias TOMEH Elias Tomeh / Snímek 1

FOURIEROVA ANAL YZA 2D TER ENN ICH DAT Karel Segeth

ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE

ANALÝZA A KLASIFIKACE DAT

VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky Katedra kybernetiky a biomedicínského inženýrství

B2M31SYN SYNTÉZA AUDIO SIGNÁLŮ

Geometrické transformace

Transformace obrazu Josef Pelikán KSVI MFF UK Praha

Operační zesilovač, jeho vlastnosti a využití:

Modelování systémů a procesů (11MSP) Bohumil Kovář, Jan Přikryl, Miroslav Vlček. 8. přednáška 11MSP pondělí 20. dubna 2015

A2M31RAT Řečový signál a jeho základní charakteristiky Model vzniku řeči. Digitalizace a základní kódovací strategie

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1

Základy a aplikace digitálních. Katedra radioelektroniky (13137), blok B2, místnost 722

ANALÝZA LIDSKÉHO HLASU

Hlasové vypínání elektrických přístrojů 1 ÚVOD. 11

Kmitočtová analýza (AC Analysis) = analýza kmitočtových závislostí obvodových veličin v harmonickém ustáleném stavu (HUS) při první iteraci ano

Úvod do zpracování signálů

J. Tatarinov, P. Pollák. Fakulta elektrotechnická. Abstrakt. otestován a zhodnocen na signálech z databáze CAR2CS. Detektor využívající

Soustavy se spínanými kapacitory - SC. 1. Základní princip:

Využití RPS pro potlačování šumu v řečových signálech

SPM SPECTRUM NOVÁ UNIKÁTNÍ METODA PRO DIAGNOSTIKU LOŽISEK

Transkript:

Využití algoritmu DTW pro vyhodnocování vad řeči dětí postižených Landau-Kleffnerovým syndromem (LKS) Petr Zlatník České vysoké učení technické v Praze, Fakulta elektrotechnická zlatnip@fel.cvut.cz Abstrakt: Tento článek pojednává o jedné z možností klasifikace Landau- Kleffnerova syndromu, který zřídka postihuje malé přeškolní děti. Problém je řešen ve spolupráci s Fakultní nemocnicí v Motole. Tento syndrom je obvykle lékaři klasifikován a sledován pomocí signálů mozkové aktivity (EEG). Zde je využito testování a porovnávání promluv se zdravými dětmi za využití algoritmu (DTW) a více různých charakteristik řeči. Předpokládá se nalezení metody, která bude schopna objektivně určit jednak stupeň postižení daného dítěte a dále by měla být schopna rozpoznat, zda se stav dítěte lepší v průběhu léčby nebo ne. Byly testovány další algoritmy jako např.: využití fonémového rozpoznávače na principu skrytých Markovových modelů (software HTK), ty pracovaly s nedostatečnou přesností a spolehlivostí především v důsledku nedostatku dat pro trénování. 1. Úvod Landau-Kleffnerův syndrom (občas je lékaři nazýván vývojová epileptická afázie) je zřídka se objevující nemoc u dětí, které jsou staré mezi 3 až 10 roky. Projevuje se abnormálními stavy v EEG signálu a jeho diagnóza může být obtížná. Děti mají problémy s opakováním slov, která jsou jim řečena, podle stupně postižení vynechávají nebo natahují hlásky v daných slovech. Nemoc se může jevit jako mentální opoždění, porucha sluchu a schopnosti se učit, dítě může mít problémy soustředit se na určitou věc, může trpět depresí.. Vyhodnocování vad v řeči Pro vyhodnocení vad v řeči je využit algoritmus DTW, který je aplikován na konkrétní promluvy jak od zdravých tak od nemocných dětí a jsou vyhodnoceny rozdíly. Aby posouzení bylo co nejvíc objektivní, je využito více vstupních charakteristik řeči a výsledky jsou průměrovány. Algoritmus DTW byl již testován dříve [6], ale byl zkoušen jen jeden typ parametrizačních koeficientů (kepstrální) a databáze jak zdravých tak i nemocných dětí byla v té době ve špatném technickém stavu. Z těchto důvodů algoritmus pracoval nespolehlivě, docházelo k časté záměně zdravých dětí s nemocnými.

.1. Popis algoritmu DTW Algoritmus DTW (Dynamic Time Warping) [4] byl popsán již v mnoha publikacích a je využíván pro rozpoznávání izolovaných slov. Byla provedena modifikace tak, aby ho bylo možno využít pro porovnávání slov od zdravých a nemocných dětí. Všechna zpracovávaná slova mají vzorkovací frekvenci 16kHz. Jsou segmentována s krokem segmentace 0ms a každý segment je váhován Hammingovým oknem [5]. Dále je proveden popis každého segmentu jednotlivými parametrizacemi, které jsou popsány dále. Potom je vypočítána matice vzdáleností d i,j využitím Euklidovských vzdáleností z parametrických vektorů W 1 (testovací) a W (referenční) z obou slov, kde W 1 = w 11, w 1,..., w 1I aw = w 1, w,..., w I kde I je počet segmentů prvního slova a J je počet segmentů druhého slova, které jsou porovnávány. Euklidova vzdálenost d i,j dvou vektorů w 1i a w j kde i = 1,,..., I, j = 1,,..., J je definována jako d i,j = N (u n v n ), (1) n=1 kde w 1i = u 1, u,..., u N a w j = v 1, v,..., v N, kde v and u jsou složky parametrických vektorů w 1i a w j, které popisují každé slovo. N je počet parametrů, které popisují segment. Matice vzdáleností je potom procházena z počátečního rohu do koncového ve směru nejmenších vzdáleností a je vypočítán součet minimálních vzdáleností S. Cesta průchodu není po přímce, ale po obecné křivce. V počátečním rohu S = d 1,1. Následující hodnota součtu minimálních vzdáleností S = S + min(s1, S, S3), kde S1 = d i+1,j, S = d i+1,j+1 a S3 = d i,j+1, kde i je index řádků a j je index sloupců matice vzdáleností. Tento výpočet je prováděn tak dlouho, dokud se nedosáhne protějšího rohu matice. Tato matice (pokud není provedeno normování na stejný počet segmentů obou slov) nemá stejný počet řádků a sloupců. Je to dáno tím, že každé dítě řekne stejné slovo s různou délkou promluvy. Velikost celkového součtu akumulované vzdálenosti S je mírou podobnosti obou porovnávaných slov. Pokud jsou porovnány dvě totožná slova, potom S = 0... Vybranéř řečové charakteristiky Bylo zjištěno, že každá charakteristika je jinak citlivá například na záměnu hlásky ve slově nebo její nevyslovení. Proto je zvoleno více charakteristik a výsledky jsou porovnávány a průměrovány...1. Koeficienty odrazu (RC) Každý segment je reprezentován koeficienty odrazu [5], které jsou počítány z Burgova algoritmu [5]. Jedná se o jeden z rychlých algoritmů pro výpočet parametrů autoregresního modelu. Jeho výhodou je zaručená stabilita řešení, protože pro koeficicienty odrazu k m lze psát k m < 1, () což je podmínka, která stačí pro zajištění stability syntetizujícího filtru. Pro výpočet koeficientů lze psát následující rovnice. kde k m = N 1 n=m (e (m 1) [n] g (m 1) [n 1]) N 1 n=m (e (m 1) [n]) + N 1 n=m (g (m 1) [n 1]), (3) e (0) [n] = g (0) [n] = s[n] (4)

pro n = 0,..., N 1, kde N je počet vzorků na segment a s[n] je označení vzorků v segmentu. e (m) [n] = e (m 1) [n] + k m g (m 1) [n 1] (5) pro n = m,..., N 1 g (m) [n] = g (m 1) [n 1] + k m e (m 1) [n] (6) pro n = m,..., N 1 kde e (m) [n] je dopředná predikce a g (m) [n] je zpětná predikce.... Koeficienty lineární predikce (LPC) Koeficienty lineární predikce a (m) k lze vypočítat z koeficientů odrazu k m pomocí přímé Levinsonovy rekurze [5]. Tu lze popsat následujícími vztahy. V počátku, m = 1 a (1) 1 = k 1 (7) kde m =, 3,..., p a (m) k a (m) k = k m (8) = a (m 1) k + k m a (m 1) k 1 (9) pro k = 1,..., m 1, kde p je řád analyzujícího filtru autoregresního modelu...3. Kepstrálnáíkoeficienty (CC) Kepstrální koeficienty [5] by měly být robustnější než LPC koeficienty, protože lépe modelují vokální trakt. Můžou být odvozené z diskrétní Fourierovy transformace, ale zde je proveden jejich výpočet z LPC koeficientů a (m) k z následujících vztahů [5], protože tyto koeficienty již byly k dispozici v předchozím kroku. c[n] = a n 1 n c[0] = 1 ln(α) (10) n 1 k=1 (n k)a k c[n k] (11) pro n > 0, a n = 0 pro n > p, α je výkon chyby predikce, p je řád autoregresního modelu, a n jsou LPC koeficienty a c[n] jsou počítané kepstrální koeficienty...4. 1. LPC koeficient (1.LPC) Dále je využíván a testován 1. LPC koeficient. 0. LPC koeficient využít nelze, protože jeho hodnota je vždy 1...5. 0., 1., a. kepstrální koeficienty (0.CC, 1.CC a. CC) Jako další ze zvolených parametrizací jsou zvoleny jednotlivě tyto koeficienty a jejich robustnost a využitelnost bude dále zjišťována...6. Energie chyby predikce (Ep) Energii chyby predikce [5] každého segmentu lze obdržet například při výpočtu autoregresních koeficientů při využití autokorelační metody, kde se ve výpočtu uplatní jednotlivé autokorelační koeficienty a parametry autoregresního modelu. Pro tyto účely bylo testováno, že je E p nutno využít v db podle následujícího vztahu. Potom se jedná o jednouchou, velice efektivní a spolehlivou parametrizaci. E p (db) = 10 log 10 E p (1)

..7. Energie segmentu (En) Dále byla zvolena energie každého segmentu E n [5] jako další parametrizace. Pro efektivnější využití je ji nutno opět převést do db jako chybu predikce podle již uvedeného vztahu. E n = N 1 kde N je počet vzorků na segment a x[n] jsou jednotlivé vzorky...8. Počet průchodů signálu nulou (ZCR) n=0 x [n], (13) Tato parametrizace [7] může být efektivní pro případ, kdy dítě vynechá ve slově neznělou hlásku jako např.: s nebo š. Počet průchodů nulou pro neznělé hlásky je totiž podstatně vyšší než pro znělé. Funkce pro výpočet průchodu signálu nulou Z(n) může být definována jako Z(n) = N 1 n=0 sgn(x[n]) sgn(x[n 1]), (14) kde N je počet vzorků na segment a x[n] jsou jednotlivé vzorky...9. Mel frekvenční kepstrální koeficienty (MFCC) Tyto a následující koeficienty byly převzaty z parametrizací, které využívá software HTK [1,3], který je využíván především pro rozpoznávání řeči a jiné aplikace, využívá skrytých Markovových modelů (HMM). MFCC koeficienty by měly patřit mezi jedny z nejvíce robustních parametrzací, jsou navrženy tak, aby co nejvíce respektovaly parametry vokálního traktu. Nejprve je lineární frekvenční osa převedena na nelineární Mel frekvenční využitím vztahu Mel(f) = 595 log 10 (1 + f ). (15) 700 Dále je využita speciální banka filtrů která má 6 kanálů. Šířka pásma jednotlivých kanálů (dvojnásobek m j ) je zvětšována v souladu s následujícími rovnicemi a každý kanál je váhován trojúhelníkovým oknem s příslušnou šířkou dvojnásobku m j. Okno je posouváno s překryvem kanálů vždy z jednoho bodu m j 1 do následujícího m j+1, kde bod m j je vrchol příslušejícího vrcholu okna. m min = Mel(300) (16) m max = Mel(8000) (17) d = m max m min P + 1 (18) m j = m min + j d, (19) kde j = 1,,..., P, P = 6 (počet kanálů banky), čísla 300 a 8000 znamenají minimální a maximální frekvence v Hz. Nejprve je každý segment popsán amplitudovými spektrálními koeficienty (FFT). Dále jsou tyto koeficienty v jednotlivých frekvenčních pásmech váhovány výše popisovanými trojúhelníkovými okny a v každém oknu je proveden součet amplitud spektrálních koeficientů. Na všech 6 součtů ja potom aplikována Diskrétní kosínová transformace definovaná ve vztahu níže a jsou vypočítány uvažované mel frekvenční kepstrální koeficienty c i. c i = N N j=1 m j cos( πi (j 0, 5)), (0) N

Obrázek 1: Součet sum pořadí pro slova různobarevný a mateřídouška, tmavý průběh je pro nemocné děti kde N = 6 je počet kanálů banky filtrů...10. Delta koeficienty (DC) Delta koeficienty d i [1,3] byly zkoušeny zvlášť i jako pomocné s logaritmickou energií segmentu a akceleračními koeficienty (popis dále) v jednom parametrizačním vektoru. Používají se jako doplněk k mel frekvenčním kepstrálním, mel frekvenčním spektrálním koeficientům a dalším, doplňují tyto základní vektory pro lepší vlastnosti parametrizace. Z těchto základních koeficientů jsou počítány rozdílem podle d i = c i+1 c i 1, (1) kde d i jsou počítané delta koeficienty a c i+1 jsou koeficienty základní, z kterých je vycházeno...11. Akcelerační koeficienty (ACC ) Akcelerační koeficienty a i [1,3] jsou počítány z delta koeficientů d i opět rozdílem z následující rovnice, použity byly opět zvlášť i jako doplňující k zvolené parametrizaci spolu s delta koeficienty a logaritmickou energií segmentu. a i = d i+1 d i 1 ()..1. Koeficienty z lineární mel frekvenční banky filtrů (MELSPEC+) Koeficienty MELSPEC [1] jsou použity jako možná další parametrizace, přidány pomocné delta a akcelerační koeficienty a logaritmus energie segmentu (proto + v názvu)..13. Koeficienty z logaritmické mel frekvenční banky filtrů (FBANK+) Další možná parametrizace [1], opět přidány pomocné delta a akcelerační koeficienty a logaritmus energie segmentu (proto + v názvu)

Obrázek : Součet sum pořadí pro slova televize, popelnice a motovidlo, tmavý průběh je pro nemocné děti 3. Výsledky Všechny parametrizace jsou využity následujícím způsobem [7]. Bylo testováno 9 slov od dvou do pětislabičných. Různobarevný, mateřídouška, televize, popelnice, motovidlo, pohádka, květina, pivo a papír.pro každé slovo bylo vybráno 18 promluv od zdravých a 6 promluv od nemocných dětí. Nejprve byly porovnány pomocí algoritmu DTW všechna slova od zdravých dětí navzájem a byla vypočítána průměrná akumulovaná vzdálenost každého slova zdravého dítěte od všech ostatních. Dále byly porovnány všechny promluvy od nemocných dětí se všemi od zdravých a opět byla vypočítána průměrná akumulovaná vzdálenost každého slova nemocného dítěte od všech zdravých. Potom byla slova seřazena podle průměrné akumulované vzdálenosti a pokud algoritmus správně pracuje, tak posledních 6 pozicí by mělo patřit nemocným dětem. Tento krok byl proveden pro všech 16 uvažovaných parametrizací. Na konec byly provedeny součty všech pořadí pro všechny děti a posledních 6 sum pořadí od nemocných dětí by mělo podstatně převýšit sumy pořadí od zdravých dětí. Pokud dojde k úspěšné léčbě dítěte a vyslovené slovo se začne blížit k průměrným hodnotám akumulovaných vzdáleností zdravých dětí, suma pořadí by měla klesat a promluva by měla splynout se zdravými. Když dojde k tomu že některá z parametrizací selže a zařadí slovo od nemocného dítěte do pořadí zdravých a naopak, nahradí ho ostatní parametrizace které pracují správně a v celkovém součtu by algoritmus měl slovo klasifikovat správně. Z těchto důvodů je využito více vstupních charakteristik řeči, slova jsou hodnocena z více akustických hledisek. Tento postup je proveden pro všech 9 uvažovaných slov. Dále je proveden součet sum pořadí pro dvou, tří, čtyř a pětislabičná slova a tím by mělo dojít ke zvýraznění rozdílu mezi zdravýma a nemocnýma dětma. Výsledek součtu sum pro pětislabičná slova různobarevný a mateřídouška je na obrázku 1. Z obrázku je zřetelně vidět, že dochází k oddělení nemocných dětí od zdravých, sumy pořadí jsou normovány k 1, která tvoří hranici nemocných dětí. Na obrázku je součet sum pořadí pro čtyřslabičná slova televize, popelnice a motovidlo. Opět je vidět odstup slov nemocných dětí od zdravých.

Obrázek 3: Součet sum pořadí pro slova pohádka a květina, tmavý průběh je pro nemocné děti U tří a méněslabičných slov dochází k tomu, že je již některé děti vysloví buďto jako zdravé nebo téměř jako zdravé a v celkovém průměru dochází u některých nemocných dětí z pořadí 19 až 4 ke splynutí se zdravými. Testovat tyto méněslabičná slova má význam jen tehdy, pokud je dítě postiženo natolik, že i tyto slova špatně vyslovuje. Výsledek je vidět na obrázku 3, kde je proveden součet sum pořadí pro tříslabičná slova pohádka a květina. V tabulce 1 je vypočítána průměrná úspěšnost rozlišení zdravý-nemocný všech parametrizací v % počítaná pro čtyř a pětislabičná slova. Pro méněslabičná slova výpočet nemá smysl, protože některé z nich již splývají se zdravými. V tabulce je pořadí přesnosti jednotlivých parametrizací pro rozlišení zdravý-nemocný. Z ní je vidět, že jako nejspolehlivější parametrizace se jeví kepstrální koeficienty, logaritmus energie chyby predikce a koeficienty z logaritmické mel frekvenční banky filtrů. Jako nejméně spolehlivá parametrizace se jeví 1. kepstrální koeficient. CC LPC RC logep ZCR logen 1.LPC 0.CC 100 89 9 100 87 97 90 97 1.CC.CC MFCC delta ACC MFCC+ MELSPEC+ FBANK+ 85 90 98 97 9 98 9 100 Tabulka 1: Průměrná úspěšnost rozlišení zdravý-nemocný všech parametrizací v % počítaná pro čtyř a pětislabičná slova pořadí 1.-3. 4.-5. 6.-8. 9.-11. 1.-13. 14. 15. 16. parametrizace CC,logEp,FBANK MFCC,MFCC+ logen,0.cc,delta RC,ACC,MELSPEC+ 1.LPC,.CC LPC ZCR 1.CC Tabulka : Pořadí přesnosti jednotlivých parametrizací pro rozlišení zdravý-nemocný

4. Závěry Na závěr lze říci, že byl navržen algoritmus, který je schopen rozlišovat zdravé a nemocné děti. Předpokládá se, že pokud se nemocné dítě začne léčit a promluva od něho se začne přibližovat průměru od zdravých dětí, tak začne celkové průměrné pořadí postupně splývat se zdravýma dětma, až bude dítě klasifikováno jako zdravé. Tento předpoklad bude možno testovat později, až budou k dispozici pozdější nahrávky od těchto samých nemocných dětí po několika měsících léčby. Dále budou testovány další parametrizační koeficienty (např.: PLP), budou se hledat korelace mezi jednotlivými parametrizacemi, ty parametrizace které budou vytvářet nejvíce chyb při rozlišení zdravý-nemocný budou pravděpodobně po dalším rozboru vynechány, bude testována robustnost jednotlivých parametrizací na šum. Jako nejvhodnější parametrizace se zatím jeví kepstrální koeficienty, logaritmus energie chyby predikce a koeficienty z logaritmické mel frekvenční banky filtrů. Nejvíce chyb vytváří první kepstrální koeficient. Bude proveden pokus o optimalizace DTW algoritmu z hlediska směru průchodu maticí vzdáleností pro zmenšení chyb a chystá se automatická detekce slov dětí v databázi, pro ulehčení práce s databází. Poděkování Tato práce byla podporována grantem GA ČR - 10/03/H085 Modelování biologických a řečových signálů, IGA MZ ČR - NR 887-3/005 Počítačová analýza řečového projevu a celonočních EEG záznamů u dětí a MSM684077001 Transdisciplinární výzkum v biomedicínckém inženýrství. Reference [1] hkt domovská stránka. http://htk.eng.cam.ac.uk. [] DAVÍDEK, V. SOVKA, P. Číslicové zpracování signálu a implementace. Ediční středisko ČVUT, Praha, 00. [3] NOVOTNÝ, J. Trénování a využití kontextově závislých HMM modelů fonémů. katedra Teorie obvodů, Praha, 00. [4] PSUTKA, J. Komunikace s počítačem mluvenou řečí. Vydala Academia Praha, tisk CENTA, spol. s. r. o., Veveří 39, Brno, 1995. [5] SOVKA, P. POLLÁK, P. Vybrané metody číslicového zpracování signálů. Ediční středisko ČVUT, Praha, 001. [6] ZLATNÍK, P. Classification of Landau-Kleffner syndrome. Digital Technologies 004. Žilina, vol. 1, s. 136-139, Technical University of Žilina, 004. [7] ČMEJLA, R. Vyhodnocování výslovnosti využitím dtw algoritmu. Výzkumná zpráva LK01/005, Praha, srpen 005.