STANOVENÍ CHARAKTERU SEGMENTU ŘEČI S VYUŽITÍM REÁLNÉHO KEPSTRA

Podobné dokumenty
Kepstrální analýza řečového signálu

Algoritmy a struktury neuropočítačů ASN P8b

Úvod do praxe stínového řečníka. Proces vytváření řeči

Quantization of acoustic low level signals. David Bursík, Miroslav Lukeš

Úvod do zpracování signálů

ADA Semestrální práce. Harmonické modelování signálů

9.2. Zkrácená lineární rovnice s konstantními koeficienty

Rozpoznávání izolovaných slov (malý slovník, např. číslovky, povely).

ANALÝZA LIDSKÉHO HLASU

Petr Zlatník, Roman Čmejla. Katedra teorie obvodů, Fakulta elektrotechnická, ČVUT, Praha. Abstrakt

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY

Měření zrychlení volného pádu

Experimentální realizace Buquoyovy úlohy

Operační zesilovač, jeho vlastnosti a využití:

Neuronové časové řady (ANN-TS)

13 Měření na sériovém rezonančním obvodu

3 METODY PRO POTLAČENÍ ŠUMU U ŘE- ČOVÉHO SIGNÁLU

Vyhledávání. doc. Mgr. Jiří Dvorský, Ph.D. Katedra informatiky Fakulta elektrotechniky a informatiky VŠB TU Ostrava. Prezentace ke dni 21.

OHYB (Napjatost) M A M + qc a + b + c ) M A = 2M qc a + b + c )

Necht tedy máme přirozená čísla n, k pod pojmem systém lineárních rovnic rozumíme rovnice ve tvaru

8.3). S ohledem na jednoduchost a názornost je výhodné seznámit se s touto Základní pojmy a vztahy. Definice

Klasifikace hudebních stylů

Lineární regrese. Komentované řešení pomocí MS Excel

Semestrální projekt. Vyhodnocení přesnosti sebelokalizace VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ. Fakulta elektrotechniky a komunikačních technologií

VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky Katedra kybernetiky a biomedicínského inženýrství

Příklad 1. Řešení 1a Máme vyšetřit lichost či sudost funkce ŘEŠENÉ PŘÍKLADY Z M1A ČÁST 3

IDENTIFIKACE ŘEČOVÉ AKTIVITY V RUŠENÉM ŘEČOVÉM SIGNÁLU

KTE/TEVS - Rychlá Fourierova transformace. Pavel Karban. Katedra teoretické elektrotechniky Fakulta elektrotechnická Západočeská univerzita v Plzni

Jasové transformace. Karel Horák. Rozvrh přednášky:

Klasifikace Landau-Kleffnerova syndromu

3.5 Ověření frekvenční závislosti kapacitance a induktance

Měření modulů pružnosti G a E z periody kmitů pružiny

ROZPOZNÁVÁNÍ AKUSTICKÉHO SIGNÁLU ŘEČI S PODPOROU VIZUÁLNÍ INFORMACE

7. Funkce jedné reálné proměnné, základní pojmy

doc. Dr. Ing. Elias TOMEH Elias Tomeh / Snímek 1

31ZZS 9. PŘEDNÁŠKA 24. listopadu 2014

Obsah přednášky Jaká asi bude chyba modelu na nových datech?

10. Předpovídání - aplikace regresní úlohy

SYNTÉZA ŘEČI. Ústav fotoniky a elektroniky, v.v.i. AV ČR, Praha

AKUSTICKÁ ANALÝZA INTENZITY A RYCHLOSTI ŘEČI U PARKINSONOVY NEMOCI

DTW. Petr Zlatník, Roman Čmejla. Abstrakt: Příspěvek popisuje metodu, která byla vyvinuta pro vyhodnocení

Vyhledávání. doc. Mgr. Jiří Dvorský, Ph.D. Katedra informatiky Fakulta elektrotechniky a informatiky VŠB TU Ostrava. Prezentace ke dni 12.

Měření hodnoty g z periody kmitů kyvadla

4EK213 LINEÁRNÍ MODELY

2D transformací. červen Odvození transformačního klíče vybraných 2D transformací Metody vyrovnání... 2

Diferenciální rovnice 3

SIGNÁLY A LINEÁRNÍ SYSTÉMY

Využití algoritmu DTW pro vyhodnocování vad řeči dětí postižených Landau-Kleffnerovým syndromem (LKS)

VOLBA ČASOVÝCH OKEN A PŘEKRYTÍ PRO VÝPOČET SPEKTER ŠIROKOPÁSMOVÝCH SIGNÁLŮ

SIGNÁLY A LINEÁRNÍ SYSTÉMY

Hlasové vypínání elektrických přístrojů 1 ÚVOD. 11

2 Zpracování naměřených dat. 2.1 Gaussův zákon chyb. 2.2 Náhodná veličina a její rozdělení

VYHODNOCENÍ LABORATORNÍCH ZKOUŠEK

Laboratorní úloha č. 8: Elektroencefalogram

Nejdřív spočítáme jeden příklad na variaci konstant pro lineární diferenciální rovnici 2. řádu s kostantními koeficienty. y + y = 4 sin t.

Fyzikální praktikum...

Vliv realizace, vliv přesnosti centrace a určení výšky přístroje a cíle na přesnost určovaných veličin

Numerické řešení proudění stupněm experimentální vzduchové turbíny a budících sil na lopatky

fluktuace jak dob trvání po sobě jdoucích srdečních cyklů, tak hodnot Heart Rate Variability) je jev, který

Statistická teorie učení

1 Modelování systémů 2. řádu

ABSTRAKT KLÍČOVÁ SLOVA ABSTRACT KEYWORDS

Vstupní signál protne zvolenou úroveň. Na základě získaných údajů se dá spočítat perioda signálu a kmitočet. Obrázek č.2

Měření kapacity kondenzátoru a indukčnosti cívky. Ověření frekvenční závislosti kapacitance a induktance pomocí TG nebo SC

základy astronomie 2 praktikum 5 Dynamická paralaxa hvězd

0.1 Úvod do matematické analýzy

Zvuková karta. Zvuk a zvuková zařízení. Vývoj, typy, vlastnosti

Fyzikální sekce přírodovědecké fakulty Masarykovy univerzity v Brně FYZIKÁLNÍ PRAKTIKUM. Praktikum z pevných látek (F6390)

NESTABILITY VYBRANÝCH SYSTÉMŮ. Úvod. Vzpěr prutu. Petr Frantík 1

EXPERIMENTÁLNÍ MECHANIKA 2 Přednáška 5 - Chyby a nejistoty měření. Jan Krystek

Příklad 1 ŘEŠENÉ PŘÍKLADY Z M1A ČÁST 6

Statistická analýza jednorozměrných dat

Strategie ACE využívající virtuální elektrody v kochleárních implantátech Nucleus 24

VYBRANÉ STATĚ Z PROCESNÍHO INŢENÝRSTVÍ cvičení 9

Osnova. Idea ASK/FSK/PSK ASK Amplitudové... Strana 1 z 16. Celá obrazovka. Konec Základy radiotechniky

ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE

TECHNICKÁ UNIVERZITA V LIBERCI SEMESTRÁLNÍ PRÁCE

VYUŽITÍ PRAVDĚPODOBNOSTNÍ METODY MONTE CARLO V SOUDNÍM INŽENÝRSTVÍ

= = 2368

Funkce komplexní proměnné a integrální transformace

Václav Jirchář, ZTGB

Jednofaktorová analýza rozptylu

Úloha D - Signál a šum v RFID

SIGNÁLY A SOUSTAVY, SIGNÁLY A SYSTÉMY

ZPRACOVÁNÍ PROTOKOLU Z ELEKTRICKÝCH MĚŘENÍ. Úvodní strana. Úvodní strana má jednotný vzhled pro všechny skupiny a pro všechny třídy na naší škole.

transmitter Tx - vysílač receiver Rx přijímač (superheterodyn) duplexer umožní použití jedné antény pro Tx i Rx

Dolování dat z multimediálních databází. Ing. Igor Szöke Speech group ÚPGM, FIT, VUT

4EK213 LINEÁRNÍ MODELY

Generování pseudonáhodných. Ing. Michal Dorda, Ph.D.

South Bohemia Mathematical Letters Volume 23, (2015), No. 1, DĚLENÍ KRUHU NA OBLASTI ÚVOD

Matematika I (KMI/PMATE)

. je zlomkem. Ten je smysluplný pro jakýkoli jmenovatel různý od nuly. Musí tedy platit = 0

SPM SPECTRUM NOVÁ UNIKÁTNÍ METODA PRO DIAGNOSTIKU LOŽISEK

Virtuální elektrody v kochleárních implantátech Nucleus 24

5. Pro jednu pružinu změřte závislost stupně vazby na vzdálenosti zavěšení pružiny od uložení

2 Teoretický úvod Základní princip harmonické analýzy Podmínky harmonické analýzy signálů Obdelník Trojúhelník...

Světlo jako elektromagnetické záření

Fyzikální sekce přírodovědecké fakulty Masarykovy univerzity v Brně FYZIKÁLNÍ PRAKTIKUM. Speciální praktikum z abc

Limita funkce. FIT ČVUT v Praze. (FIT) Limita funkce 3.týden 1 / 39

Popisná statistika kvantitativní veličiny

Transkript:

STANOVENÍ CHARAKTERU SEGMENTU ŘEČI S VYUŽITÍM REÁLNÉHO KEPSTRA Oldřich Horák Univerzita Pardubice, Fakulta ekonomicko-správní, Ústav systémového inženýrství a informatiky Abstract: The extraction of the characteristic features of the speech is the important task in the speaker recognition process. One of the basic features is fundamental frequency of speaker s voice, which can be extracted from the voiced segment of the speech signal. This document describes one of the methods providing possibility to distinguish the voiced and surd segments of the voice signal. Keywords: Features Extraction, Fundamental Frequency, Speaker Recognition, Voice Signal 1. Úvod Rozpoznávání mluvčího (angl. speaker recognition) představuje v dnešní době jednu z možností zdokonalení identifikace uživatele informačního systému. Jedná se o biometrickou metodu, kde je rozpoznávacím znakem subjektu stavba jeho hlasového ústrojí přímo ovlivňující charakteristiku jeho hlasu. Zmíněná charakteristika je tvořena několika skupinami příznaků, které se získávají z různých částí řečové promluvy. Některé z nich lze získávat pouze metodami pracujícími s předem daným textem, který je mluvčím vysloven, a jsou tedy závislé na příslušném textu (angl. text dependent methods). To s sebou pochopitelně nese jistá omezení plynoucí z porovnávání charakteru celých slov nebo větných úseků. Metody nezávislé na textu (angl. text independent methods) jsou poněkud náročnější a opírají se ve značné míře jen o porovnávání elementárních charakteristik hlasu mluvčího. Tyto metody obvykle pracují s krátkými řečovými úseky různých typů, které jsou určitým způsobem specifické. Některé charakteristické příznaky lze například získávat z neznělých úseků, které přibližně odpovídají souhláskám. Znělé úseky obvykle odpovídají samohláskám, případně slabikotvorným souhláskám. Na této úrovni jsou získané příznaky využitelné nejen v úlohách rozpoznávání řečníka, ale i pro úlohy zabývající se rozpoznáním řeči ve smyslu jejího významu. [3] 2. Charakter segmentu řeči 2.1 Znělé úseky a základní tón řeči Výběr znělých úseků řečové promluvy je velmi významným krokem několika postupů při rozpoznávání řeči nebo řečníka [2]. Znělé úseky řeči, jak již bylo uvedeno, obsahují některé charakteristické znaky určující vybrané parametry hlasového traktu 56

mluvčího. To umožňuje mimo jiné s odpovídající mírou úspěšnosti rozlišit různé řečníky, případně určit identitu řečníka. Jedním ze znaků, které se vyskytují právě jen ve znělých částech promluvy, je základní tón (základní frekvence, fundamentální frekvence, angl. fundamental frequency). Tato frekvence je do jisté míry charakteristická pro konkrétního řečníka a je v krátkém úseku promluvy konstantní. Pozorováním tohoto znaku v delším úseku řeči lze sledovat melodii promluvy (např. stoupání a klesání hlasu v průběhu věty). Použijeme-li opačný pohled, můžeme z přítomnosti tohoto významného charakteristického znaku usuzovat, zda je daný segment řečové promluvy znělý či neznělý. 2.2 Používané způsoby stanovení charakteru V současné době jsou publikovány různé způsoby, jak určit charakter řečového segmentu. Obvykle je využito nějaké vlastnosti, která se u znělých a neznělých úseků řeči významně odlišuje. Jedním z postupů je sledování poměru energií v jednotlivých kmitočtových pásmech. Kmitočtový rozsah je v závislosti na vzorkovací frekvenci rozdělen do čtyř subpásem, pro něž je vypočtena energie signálu. Porovnáním rozložení energií v těchto úsecích kmitočtového rozsahu je odhadnut charakter segmentu řeči. [1] Jiný postup, který je též částečně založen na rozložení nízkých a vysokých frekvencí v řečovém úseku, využívá vztahu mezi bazální frekvencí (přibližně danou středním počtem průchodů signálu nulovou hodnotou) a krátkodobou energií. [1, 3] 2.3 Přítomnost základního tónu V literatuře (např. [1, 4]) je uváděn postup, jak ze signálů znělých úseků řečové promluvy stanovovat základní tón. Zároveň jsou diskutovány postupy, jak znělost či neznělost segmentu určit nebo alespoň odhadnout. Zvolme tedy opačný postup a odhadujme znělost segmentu podle přítomnosti základního tónu. Tato práce se bude zabývat odhadnutím znělosti řečového segmentu podle výskytu základního tónu, který bude stanoven kepstrální metodou. Následně budou výsledky porovnány s metodou určení charakteru segmentu řeči pomocí krátkodobé energie a počtu průchodů signálu nulou [1]. 3. Příprava záznamu pro zpracování K provedení experimentu je využito záznamů řeči, které byly pořízeny pomocí mikrofonu a aplikace pro záznam zvuku osobním počítačem. Jednotlivé záznamy trvají řádově několik sekund a pro účely dalších výpočtů je nutné je rozdělit na segmenty dané délky. 57

3.1 Značení použitých veličin V dalších odstavcích budeme operovat s veličinami popisujícími vlastnosti řečového signálu, je tedy vhodné zde uvést jejich stručný výčet včetně značení, které bude použito: f vz vzorkovací frekvence F frekvence základního tónu T perioda základního tónu ZCR počet průchodů signálu nulovou hodnotou E krátkodobá energie c R posloupnost koeficientů reálného kepstra Všechny zpracovávané záznamy byly pořízeny se vzorkovací frekvencí f vz = 225 Hz. 3.2 Rozdělení záznamu na segmenty Výpočet reálného kepstra budeme provádět nad segmenty délky 512 vzorků, což při použité vzorkovací frekvenci odpovídá přibližně době trvání 23 ms. To splňuje požadavek, aby byl signál stacionární, tj. aby se po tuto dobu podstatně neměnily parametry hlasového traktu [4]. Ve výpočtu budeme využívat překrytí segmentů o 1/2 délky. Je tedy vhodné rozdělit signál záznamu na půlsegmenty o délce 256 vzorků, jak ukazuje Obr. 1. 256 512 124 1536 Obr. 1: Rozdělení signálu na segmenty a půlsegmenty Každý vyhodnocovaný segment se tedy bude skládat ze dvou sousedních půlsegmentů a postupnou iterací přes tyto půlsegmenty zajistíme požadované překrytí segmentů při výpočtu. Před vlastním výpočtem reálného kepstra aplikujeme na data 58

segmentu Hammingovo okno příslušné délky [4]; Obr. 2 ukazuje původní signál, okno a výsledný signál. Obr. 2: Aplikace Hammingova okna na segment 4. Výpočty parametrů Před vlastním stanovením přítomnosti základního tónu v segmentu řečové promluvy vypočítáme pomocí vztahu (1) koeficienty reálného kepstra ze vzorků signálu daného segmentu. c R { IFFT ( ln FFT ( S ))} = Re (1) [] i [] i Koeficienty c R[i] jsou tedy reálnou složkou inverzní Fourierovy transformace IFFT přirozeného logaritmu z hodnoty modulu Fourierovy transformace FFT vzorků vstupního signálu S [i]. Z indexu kepstrálního koeficientu snadno stanovíme hodnotu odpovídající frekvence a periody. Pro k-tý koeficient platí vztahy (2). f F = vz k k, 1 Tk = (2) F k Je tedy zřejmé, že výpočet je závislý na vzorkovací frekvenci f vz a pořadí k kepstrálního koeficientu. 4.1 Stanovení přítomnosti základního tónu Pro rozlišení charakteru řečového segmentu a stanovení znělosti budeme zkoumat přítomnost základního tónu. Pokud se v reálném kepstru objeví koeficient se znaky základní frekvence, budeme segment považovat za znělý. Kepstrum s vyznačeným maximem je na Obr. 3, přičemž n je pořadí kepstrálního koeficientu a c(n) je jeho hodnota. Maximum odpovídající základnímu tónu je vyznačeno svislou čarou. 59

.8.6.4.2 c(n) -.2 -.4 -.6 -.8 5 1 15 2 25 3 n Obr. 3: Reálné kepstrum znělého segmentu V případě, že přítomnost základního tónu neprokážeme, klasifikujeme segment jako neznělý, Obr. 4..8.6.4.2 c(n) -.2 -.4 -.6 -.8 5 1 15 2 25 3 n Obr. 4: Reálné kepstrum neznělého segmentu Jak bylo výše vysvětleno, budeme hledat výrazné maximum, které by se mělo vyskytovat mezi kepstrálními koeficienty s indexy 5 až 35. To je dáno obvyklou frekvencí základního tónu lidské řeči v rozsahu 6 až 4 Hz [1, 3], se vzorkovací 6

frekvencí f vz = 225 Hz pak podle (2) dostáváme uvedený rozsah sledovaných kepstrálních koeficientů. Vzhledem k tomu, že se počet koeficientů výsledného kepstra podle vztahu (1) rovná počtu vzorků v segmentu a z nich se využívá pouze první (levá) polovina, je třeba segment před výpočtem doplnit zprava nulovými hodnotami na délku 124, čímž dostáváme 512 použitelných koeficientů. Kdybychom tuto úpravu neprovedli, dostali bychom pouze poloviční počet koeficientů a ty by nepokryly celý sledovaný interval. Je zřejmé, že vždy nalezneme nějakou maximální hodnotu. Abychom příslušný koeficient mohli považovat za příznak základního tónu, musí být toto maximum výrazně vyšší, než ostatní hodnoty v příslušném rozsahu koeficientů. Musíme tedy stanovit prahovou hodnotu závislou na průměru ostatních koeficientů v prohledávaném intervalu. Na Obr. 5 jsou složena kepstra segmentů řečového signálu pro sledovaný interval koeficientů..3.2.1 c(n) -.1 -.2 5 1 15 2 25 3 35 n Obr. 5: Maxima koeficientů ve sledovaném intervalu Patrné je především to, že koeficient odpovídající základnímu tónu (pokud takový existuje) má vždy znatelně vyšší hodnotu než koeficienty ostatní. Experimentálně byl práh stanoven na pětinásobek průměrné hodnoty nezáporných koeficientů. 4.2 Výpočet dalších parametrů segmentů Dalšími parametry, které budeme při posouzení charakteru řečových segmentů využívat, jsou počet průchodů signálu nulou ZCR a krátkodobá energie E. [1] 61

Tyto veličiny určíme pomocí vzorců (3) a (4) pro i-tý segment, kde N je počet vzorků v příslušném segmentu a x n je hodnota n-tého vzorku. 2 1 N 2 n= ( x ) sgn( x ) ZCR = sgn (3) i 1 1 N 2 i = ( x n ) N n= n n+ 1 E (4) Obě veličiny jsou vzhledem k dělení signálu na segmenty aditivní, výpočet tedy můžeme zrychlit tak, že hodnoty veličin stanovíme pro jednotlivé půlsegmenty a výsledky pro příslušný segment určíme jako součet hodnot půlsegmentů, z nichž je složen. To lze vyjádřit pomocí vztahů (5) a (6), kde hodnoty označené symbolem vlnovky odpovídají příslušným půlsegmentům. ~ ~ ZCR (5) i = ZCR2i + ZCR2i+ 1 ~ ~ E (6) i = E2i + E2i+ 1 V případě, že se hodnoty počtu průchodů nulou a krátkodobé energie v sousedních půlsegmentech významně liší, můžeme předpokládat, že do daného segmentu spadá řečový předěl, tedy změna povahy signálu ze znělého na neznělý nebo naopak. Pokud chceme pro další experiment vybírat např. pouze čistě znělé části signálu, je vhodné považovat předělový segment automaticky za neznělý. 5. Ověření teorie Nyní ověříme teorii uvedenou v [1], kde se popisuje určení charakteru segmentu pomocí hodnot počtu průchodů signálu nulou ZCR a krátkodobé energie segmentu E. Podle předpokladu se znělé úseky řečového signálu vyznačují větší krátkodobou energií a menším počtem průchodů nulou, než je tomu u neznělých úseků. Vypočítané hodnoty můžeme zobrazit do grafu a zároveň použít odlišné symboly pro segmenty, v nichž jsme našli nebo nenašli příznak přítomnosti základního tónu. Na Obr. 6 až 1 jsou vyneseny hodnoty počtu průchodů signálu nulou a krátkodobé energie pro segmenty slov jedna až pět (základní číslovky, které se například vyžadují jako součásti hesla a především se jako slova od sebe poměrně liší). Segmenty, v nichž byla nalezena frekvence základního tónu (znělé segmenty), jsou znázorněny většími body (v barevné verzi fialově). Neznělé segmenty jsou vyznačeny menšími body (v barevné verzi světle modře). 62

1 8 6 ZCR 4 2.5.1.15.2.25.3 E Obr. 6: Znělé a neznělé segmenty slova jedna 1 8 6 ZCR 4 2.5.1.15.2.25.3 E Obr. 7: Znělé a neznělé segmenty slova dvě 63

1 8 6 ZCR 4 2.5.1.15.2.25.3 E Obr. 8: Znělé a neznělé segmenty slova tři 1 8 6 ZCR 4 2.5.1.15.2.25.3 E Obr. 9: Znělé a neznělé segmenty slova čtyři 64

1 8 6 ZCR 4 2.5.1.15.2.25.3 E Obr. č. 1: Znělé a neznělé segmenty slova pět Z Obr. 6 až 1 je patrné, že segmenty, v nichž byla prokázána přítomnost frekvence, kterou lze považovat za základní tón řeči, jsou ve velké míře shromážděny v jiné oblasti grafu, než ostatní segmenty. Rozložení je velmi podobné, přestože jako příklad byla vybrána slova, která si nejsou příliš podobná. Za povšimnutí stojí i poměrně významná skupina segmentů se ZCR v intervalu od nuly do cca 4 a téměř nulovou krátkodobou energií E, které se vyskytují podél svislé osy. Jedná se o segmenty signálu s vyššími frekvencemi a nízkou změnou amplitudy signálu, které odpovídají šumovým složkám řeči [3]. V těchto segmentech se základní tón nevyskytuje. Podobný graf uvedený v [1] jako obr. 7 zobrazuje rozložení většího počtu segmentů, jejichž charakter byl stanoven experimentálně (patrně prostým poslechem). Rozložení znělých a neznělých segmentů odpovídá výsledkům, které byly stanoveny pomocí přítomnosti základního tónu v segmentu. 6. Závěr V úvodu jsme si položili otázku, zda je možné stanovit charakter segmentu řečové promluvy pomocí přítomnosti základního tónu řeči. Jednotlivé kapitoly se zabývaly přípravou signálu a příslušnými výpočty. Pro stanovení základního tónu byla použita kepstrální metoda, která je rychlá a výpočetně nenáročná v porovnání s jinými postupy, což je vyváženo nižší přesností a menší odolnosti vůči šumu [1]. Pokud by účelem bylo vyloučit neznělé segmenty, případně segmenty, jejichž charakter je obtížné určit, pak je možno tento způsob stanovení charakteru segmentu považovat za dostačující, protože přítomnost základního tónu tímto způsobem lze prokázat, nikoliv vyloučit. 65

Z výsledných grafů je zřejmé, že vhodným omezením oblasti lze vybrat téměř výhradně jen znělé segmenty i za cenu toho, že nebudou vybrány všechny, jak je pomocí lineárního klasifikátoru ukázáno v [1]. Postup, který byl popsán v tomto článku, umožňuje přesnější výběr, je však výpočetně náročnější. Použité zdroje: [1] ATASSI, H. Metody detekce základního tónu řeči. Elektrorevue [online]. 28, 4,[cit. 21-6-8]. Dostupný z WWW: <http://www.elektrorevue.cz/cz/clanky/zpracovani-signalu//metody-detekcezakladniho-tonu-reci/>. ISSN 1213-1539. [2] PSUTKA, J., et al. Mluvíme s počítačem česky. 1. Praha : Academia, 26. Analýza řečového signálu, s. 752. ISBN 8-2-139-1. [3] PSUTKA, J., et al. Mluvíme s počítačem česky. 1. Praha : Academia, 26. Prozodické vlastnosti řeči, s. 752. ISBN 8-2-139-1. [4] VONDRA, M. Kepstrální analýza řečového signálu. Elektrorevue. 21, 48. ISSN 1213-1539. Kontaktní adresa: Ing. Oldřich Horák Univerzita Pardubice Fakulta ekonomicko-správní Ústav systémového inženýrství a informatiky Studentská 84 532 1 Pardubice e-mail: oldrich.horak@upce.cz tel. č.: +42 466 36 38 66