Jan Černocký ÚPGM FIT VUT Brno, cernocky@fit.vutbr.cz. FIT VUT Brno

Podobné dokumenty

LPC. Jan Černocký ÚPGM FIT VUT Brno, FIT VUT Brno. LPC Jan Černocký, ÚPGM FIT VUT Brno 1/39

Kepstrální analýza řečového signálu

STANOVENÍ CHARAKTERU SEGMENTU ŘEČI S VYUŽITÍM REÁLNÉHO KEPSTRA

Číslicové filtry. Honza Černocký, ÚPGM

1 Mnohočleny a algebraické rovnice

ADA Semestrální práce. Harmonické modelování signálů

ÚPGM FIT VUT Brno,

Náhodné signály. Honza Černocký, ÚPGM

1 Mnohočleny a algebraické rovnice

Odhad základního tónu řeči s lokalizací hlasivkových pulsů a pitch-synchronní segmentace

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ

Vstupní signál protne zvolenou úroveň. Na základě získaných údajů se dá spočítat perioda signálu a kmitočet. Obrázek č.2

Nastavení parametrů PID a PSD regulátorů

Úvod do zpracování signálů

Motivace příklad použití lokace radarového echa Význam korelace Popis náhodných signálů číselné charakteristiky

Zvuk včetně komprese. Digitálně = lépe! Je to ale pravda? X36PZA Periferní zařízení

Základní pojmy o signálech

A7B31ZZS 4. PŘEDNÁŠKA 13. října 2014

Úloha č. 2 - Kvantil a typická hodnota. (bodově tříděná data): (intervalově tříděná data): Zadání úlohy: Zadání úlohy:

Spektrální analýza a diskrétní Fourierova transformace. Honza Černocký, ÚPGM

transmitter Tx - vysílač receiver Rx přijímač (superheterodyn) duplexer umožní použití jedné antény pro Tx i Rx

Rádiové rozhraní GSM fáze 1

Lineární a adaptivní zpracování dat. 2. SYSTÉMY a jejich popis v časové doméně a frekvenční doméně

MĚŘENÍ ČASOVÉHO ZPOŽDĚNÍ MEZI SIGNÁLY MOZKU: APLIKACE V EPILEPTOLOGII Jan Prokš 1, Přemysl Jiruška 2,3

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1

Kapitola 1. Signály a systémy. 1.1 Klasifikace signálů

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

Lineární a adaptivní zpracování dat. 3. SYSTÉMY a jejich popis ve frekvenční oblasti

Lineární a adaptivní zpracování dat. 2. SYSTÉMY a jejich popis v časové doméně a frekvenční doméně

filtry FIR zpracování signálů FIR & IIR Tomáš Novák

Cvičení 9 dekompozice časových řad a ARMA procesy

Základy a aplikace digitálních. Katedra radioelektroniky (13137), blok B2, místnost 722

kursu, úvod 2017/18 Igor Szöke a Honza Černocký ÚPGM FIT VUT Brno, FIT VUT Brno

NÁHODNÁ ČÍSLA. F(x) = 1 pro x 1. Náhodná čísla lze generovat některým z následujících generátorů náhodných čísel:

polyfázové filtry (multirate filters) cascaded integrator comb filter (CIC) A0M38SPP - Signálové procesory v praxi - přednáška 8 2

ODR metody Runge-Kutta

VY_32_INOVACE_ENI_2.MA_05_Modulace a Modulátory

Čebyševovy aproximace

9. PRINCIPY VÍCENÁSOBNÉHO VYUŽITÍ PŘENOSOVÝCH CEST

Časová složitost / Time complexity

Algoritmy a struktury neuropočítačů ASN P8b

SIGNÁLY A LINEÁRNÍ SYSTÉMY

Stavový model a Kalmanův filtr

SIGNÁLY A LINEÁRNÍ SYSTÉMY

Polynomy. Mgr. Veronika Švandová a Mgr. Zdeněk Kříž, Ph. D. 1.1 Teorie Zavedení polynomů Operace s polynomy...

a počtem sloupců druhé matice. Spočítejme součin A.B. Označme matici A.B = M, pro její prvky platí:

Při návrhu FIR filtru řešíme obvykle následující problémy:

A/D převodníky - parametry

Rozpoznávání izolovaných slov (malý slovník, např. číslovky, povely).

Robustní odhady statistických parametrů

Lineární a adpativní zpracování dat. 3. Lineární filtrace I: Z-transformace, stabilita

3 METODY PRO POTLAČENÍ ŠUMU U ŘE- ČOVÉHO SIGNÁLU

Aplikovaná numerická matematika

Kombinatorická minimalizace

Komprese dat Obsah. Komprese videa. Radim Farana. Podklady pro výuku. Komprese videa a zvuku. Komprese MPEG. Komprese MP3.

Časové řady, typy trendových funkcí a odhady trendů

KTE/TEVS - Rychlá Fourierova transformace. Pavel Karban. Katedra teoretické elektrotechniky Fakulta elektrotechnická Západočeská univerzita v Plzni

Časové řady, typy trendových funkcí a odhady trendů

Číslicové zpracování signálů a Fourierova analýza.

Zpracování obrazů. Honza Černocký, ÚPGM

Simulace. Simulace dat. Parametry

Úvod do praxe stínového řečníka. Proces vytváření řeči

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY

MATLAB. F. Rund, A. Novák Katedra radioelektroniky, FEL ČVUT v Praze. Abstrakt

Vlastnosti a modelování aditivního

Numerické řešení diferenciálních rovnic

9.3. Úplná lineární rovnice s konstantními koeficienty

Lineární a adaptivní zpracování dat. 1. ÚVOD: SIGNÁLY a SYSTÉMY

Zátěžové hlasové testy

Parametrické programování

Číselné charakteristiky a jejich výpočet

Neuronové časové řady (ANN-TS)

Řešení 1b Máme najít body, v nichž má funkce (, ) vázané extrémy, případně vázané lokální extrémy s podmínkou (, )=0, je-li: (, )= +,

Lineární regrese. Komentované řešení pomocí MS Excel

doc. Dr. Ing. Elias TOMEH Elias Tomeh / Snímek 1

8. Sběr a zpracování technologických proměnných

MĚŘENÍ A ANALÝZA ELEKTROAKUSTICKÝCH SOUSTAV NA MODELECH. Petr Kopecký ČVUT, Fakulta elektrotechnická, Katedra Radioelektroniky

Vyhodnocení 2D rychlostního pole metodou PIV programem Matlab (zpracoval Jan Kolínský, dle programu ing. Jana Novotného)

oddělení Inteligentní Datové Analýzy (IDA)

Popisná statistika kvantitativní veličiny

íta ové sít baseband narrowband broadband

Projekt OPVK - CZ.1.07/1.1.00/ Matematika pro všechny. Univerzita Palackého v Olomouci

3. AMPLITUDOVĚ MODULOVANÉ SIGNÁLY

Věta 12.3 : Věta 12.4 (princip superpozice) : [MA1-18:P12.7] rovnice typu y (n) + p n 1 (x)y (n 1) p 1 (x)y + p 0 (x)y = q(x) (6)

Racionální čísla. teorie řešené úlohy cvičení tipy k maturitě výsledky. Víš, že. Naučíš se

Interpolace pomocí splajnu

Extrémy funkce dvou proměnných

Univerzita Karlova v Praze Pedagogická fakulta

1. Vlastnosti diskretních a číslicových metod zpracování signálů... 15

KONVERZE VZORKOVACÍHO KMITOČTU

ZPRACOVÁNÍ SIGNÁLŮ Z MECHANICKÝCH. Jiří Tůma

VOLBA ČASOVÝCH OKEN A PŘEKRYTÍ PRO VÝPOČET SPEKTER ŠIROKOPÁSMOVÝCH SIGNÁLŮ

Čas (s) Model časového průběhu sorpce vyplývá z 2. Fickova zákona a je popsán následující rovnicí

13 Barvy a úpravy rastrového

Normální (Gaussovo) rozdělení

Diferenciální rovnice 3

Regrese. 28. listopadu Pokud chceme daty proložit vhodnou regresní křivku, musíme obvykle splnit tři úkoly:

1.8. Mechanické vlnění

příkladů do cvičení. V textu se objeví i pár detailů, které jsem nestihl (na které jsem zapomněl) a(b u) = (ab) u, u + ( u) = 0 = ( u) + u.

Transkript:

Určování základního tónu řeči Jan Černocký ÚPGM FIT VUT Brno, cernocky@fit.vutbr.cz FIT VUT Brno Určování základního tónu řeči Jan Černocký, ÚPGM FIT VUT Brno 1/37

Plán Charakteristiky základního tónu Problémy určování. Autokorealční metoda, AMDF, NFFC. Omezení vlivu formantů. Dlouhodobý prediktor Cepstrum Vylepšení odhadu základního tónu. Určování základního tónu řeči Jan Černocký, ÚPGM FIT VUT Brno 2/37

Opakování tvorba řeči a její model Určování základního tónu řeči Jan Černocký, ÚPGM FIT VUT Brno 3/37

Úvod Frekvence základního tónu je základním kmitočtem, na kterém kmitají hlasivky: F, anglický název pitch. Periodu základního tónu (pitch period) spočítáme jako převrácenou hodnotu frekvence: T = 1 F. Jako lag označujeme periodu základního tónu vyjádřenou ve vzorcích: L = T F s, kde F s je vzorkovací frekvence. Určování základního tónu řeči Jan Černocký, ÚPGM FIT VUT Brno 4/37

Využití základního tónu syntezátory řeči generování melodie. kódování v jednoduchém kódování označovaném jako LPC se zmenšení bitového toku dosáhne tak, že se samostatně přenáší parametry artikulačního ústrojí (např. koeficienty predikčního filtru a i nebo odvozené), energie, příznak znělý/neznělý a F. v modernějších kodérech (např. v RPE-LTP nebo ACELP pro mobilní telefony GSM) se využívá dlouhodobého prediktoru LTP (long time predictor). Jedná se o filtr s dlouhou impulsní odezvou, která však obsahuje jen jeden nebo několik nenulových prvků. další bělení signálu. Určování základního tónu řeči Jan Černocký, ÚPGM FIT VUT Brno 5/37

Charakteristiky základního tónu F může nabývat hodnot od 5 Hz (muži) až do 4 Hz (děti), při F s =8 Hz tyto frekvence odpovídají lagům L=16 až 2 vzorků. Je patrné, že při malých hodnotách F se bĺıžíme délkám běžně používaných oken (2 ms, což odpovídá 16 vzorkům). koĺısání u jednoho mluvčího může být až v poměru 2:1. pro různé hlásky mívá základní tón typické průběhy, malé změny po prvním kmitu ( F < 1 Hz) charakterizují mluvčího, ale obtížně se zjišťují. V radiotechnice se těmto malým posuvům říká jitter. F je ovlivněn vším větnou melodíı, náladou, únavou, atd. Velikosti změn F jsou větší (větší modulování hlasu) u profesionálních mluvčích, obyčejní lidé mluví monotónněji. Určování základního tónu řeči Jan Černocký, ÚPGM FIT VUT Brno 6/37

Problémy určování základního tónu ani znělé hlásky nejsou zcela periodické. Čistě periodický může být pouze velmi čistý zpěv. Při generování řeči s F =konst. je výsledná řeč monotónní. nevyskytuje se čistě znělé nebo neznělé buzení. Většinou je buzení smíšené (šum na vyšších frekvencích). při nízké energii signálu je určení znělosti a základního tónu obtížné. vysoký F může být ovlivněn nízkým formantem F 1 (ženy, děti). při přenosu řeči v telefonním pásmu (3 34 Hz) nemáme k dispozici základní harmonickou základního tónu F, pouze násobky (vyšší harmonické). Filtrace za účelem získání F by tedy k ničemu nevedla... Určování základního tónu řeči Jan Černocký, ÚPGM FIT VUT Brno 7/37

Metody pro určování základního tónu autokorelační + NCCF, kterou budeme aplikovat na původní signál, dále na tzv. klipovaný signál a na chybu lineární predikce. využití prediktoru chyby lineární predikce. cepstrální metoda. Určování základního tónu řeči Jan Černocký, ÚPGM FIT VUT Brno 8/37

Autokorelační funkce ACF (Autocorrelation function) R(m) = N 1 m n= S využitím symetrie autokorelačních koeficientů: s(n)s(n + m) (1) R(m) = N 1 n=m s(n)s(n m) (2) Určování základního tónu řeči Jan Černocký, ÚPGM FIT VUT Brno 9/37

Celý signál a jeden rámec 4 x 14 3 2 1 1 2 3 4 2 4 6 8 1 12 2 x 14 1.5 1.5.5 1 1.5 5 1 15 2 25 3 35 Určování základního tónu řeči Jan Černocký, ÚPGM FIT VUT Brno 1/37

Ilustrace posunu x 1 4 1.5 1.5.5 1 5 1 15 2 25 3 35 4 1.5 x 1 4 1.5.5 1 5 1 15 2 25 3 35 4 Určování základního tónu řeči Jan Černocký, ÚPGM FIT VUT Brno 11/37

Vypočtená autokorelační funkce 1 x 1 9 8 6 4 R(m) 2 2 4 6 8 5 1 15 2 25 3 m Určování základního tónu řeči Jan Černocký, ÚPGM FIT VUT Brno 12/37

Výpočet lagu a určení znělosti Lag se z ACF, že hledáme maximum autokorelační funkce: R(m) = N 1 m n= c[s(n)]c[s(n + m)] (3) Znělost rámce můžeme odhadnout porovnáním nalezeného maxima s nultým (maximálním) autokorelačním koeficientem. Konstanta α se musí zvolit experimentálně. R max < αr() neznělý R max αr() znělý (4) Určování základního tónu řeči Jan Černocký, ÚPGM FIT VUT Brno 13/37

Hledání maxima ACF lag (pro uvedený obrázek L=87): x 1 9 1 8 lag max 6 4 R(m) 2 2 4 6 8 2 16 search interval 5 1 15 2 25 3 m Určování základního tónu řeči Jan Černocký, ÚPGM FIT VUT Brno 14/37

AMDF V dávných dobách, kdy bylo násobení náročnější na čas procesoru, se autokorelační funkce nahrazovala funkcí AMDF (Average Magnitude Difference Function): R D (m) = N 1 m n= s(n) s(n + m), (5) kde bylo naopak nutné hledat pro určení lagu minimum. Určování základního tónu řeči Jan Černocký, ÚPGM FIT VUT Brno 15/37

x 1 6 2.5 2 1.5 1.5 5 1 15 2 25 3 Určování základního tónu řeči Jan Černocký, ÚPGM FIT VUT Brno 16/37

Cross-correlation function Navýhoda standardní ACF je postupné zkracování oblasti, ze které autokorelační koeficienty počítáme. Můžeme si dovolit použít celý signál (při reálném zpracování si ho musíme zapamatovat) CCF. Začátek rámce označíme zr: CCF (m) = zr+n 1 n=zr s(n)s(n m) (6) Určování základního tónu řeči Jan Černocký, ÚPGM FIT VUT Brno 17/37

Posunutí pro výpočet NCCF: x 1 4 1.5 1.5.5 1 1.5 5 1 15 2 25 3 35 4 1.5 1.5.5 x 1 4 past signal N 1 1 k=87 5 1 15 2 25 3 35 4 Určování základního tónu řeči Jan Černocký, ÚPGM FIT VUT Brno 18/37

Posunutí pro výpočet NCCF - problém, protože posunutý signál má mnohem větší energii! 3 2 1 1 5 1 15 2 25 3 35 4 3 N 1 2 1 big values! 1 5 1 15 2 25 3 35 4 Určování základního tónu řeči Jan Černocký, ÚPGM FIT VUT Brno 19/37

Normalized cross-correlation function Rozdílnost energíı originálního a posunutého rámce můžeme řešit pomocí normalizace: NCCF zr+n 1 n=zr s(n)s(n m) CCF (m) = (7) E1 E 2 E 1 a E 2 jsou energie originálního a posunutého rámce: E 1 = zr+n 1 n=zr s 2 (n) E 2 = zr+n 1 n=zr s 2 (n m) (8) Určování základního tónu řeči Jan Černocký, ÚPGM FIT VUT Brno 2/37

CCF a NCCF pro dobrý příklad 1 x 1 9 5 5 5 1 15 2 25 3 1.5.5 5 1 15 2 25 3 Určování základního tónu řeči Jan Černocký, ÚPGM FIT VUT Brno 21/37

CCF a NCCF pro špatný příklad x 1 7 1.5 1.5.5 1 1.5 2 5 1 15 2 25 3 1.5.5 5 1 15 2 25 3 Určování základního tónu řeči Jan Černocký, ÚPGM FIT VUT Brno 22/37

Nevýhoda: metody nedostatečně potlačují vliv formantů (to se projeví dalšími maximy v ACF nebo v AMDF). Centrální klipování Center Clipping předzpracovává signál pro ACF, se zajímáme pouze o špičky signálu. Definujeme tzv. klipovací úrověň c L. V první variantě této metody ze signálu vynecháváme interval < c L, +c L >. Ve druhé variantě nahrazujeme hodnotou 1 signál tam, kde je překročena úroveň c L a hodnotou -1 tam, kde signál nedosáhne úrovně c L : s(n) c L pro s(n) > c L c 1 [s(n)] = pro c L s(n) c L (9) s(n) + c L pro s(n) < c L c 2 [s(n)] = +1 pro s(n) > c L pro c L s(n) c L (1) 1 pro s(n) < c L Určování základního tónu řeči Jan Černocký, ÚPGM FIT VUT Brno 23/37

Obrázky ilustrují klipování na rámci řečového signálu pro klipovací úroveň 9562: 2 x 14 1.5 1.5 original.5 1 1.5 5 1 15 2 25 3 35 samples 2 x 14 1.5 1.5 clip 1.5 1 1.5 5 1 15 2 25 3 35 samples 1.8.6.4.2 clip 2.2.4.6.8 1 5 1 15 2 25 3 35 samples Určování základního tónu řeči Jan Černocký, ÚPGM FIT VUT Brno 24/37

Určení klipovací úrovně Vzhledem ke koĺısání signálu s(n) nemůže být konstantní a je nutné ji určovat pro každý rámec, na kterém odhadujeme základní tón. Jednoduchou metodou je určení klipovací úrovně z maximální absolutní hodnoty vzorků v rámci: c L = k max x(n), (11) n=...n 1 kde konstanta k se voĺı od.6 do.8. Sofistikovanější metoda využívá rozdělení rámce na několik mikro-rámců, např. x 1 (n), x 2 (n), x 3 (n) o třetinové délce. Klipovací úroveň je pak určena pomocí nejslabšího maxima z těchto mikro-rámců jako: c L = k min {max x 1 (n), max x 2 (n), max x 3 (n) } (12) Problém: klipování šumu v pauzách, kde může být následně detekován základní tón a znělost. Metodu je vhodné doplnit určením úrovně ticha s L (silence level). Pokud maximum signálu < s L, pak se znělost a lag neurčují. Určování základního tónu řeči Jan Černocký, ÚPGM FIT VUT Brno 25/37

Využití chyby lineární predikce Jedná se o předzpracování nejen pro metodu ACF, ale i pro jiné algoritmy určení základního tónu. Opakování: chybu lineární predikce získáme jako rozdíl skutečného a předpovězeného signálu: e(n) = s(n) ŝ(n) (13) E(Z) = S(z)[1 (1 A(z))] = S(z)A(z) (14) e(n) = P s(n) + a i s(n i) (15) i=1 Signál e(n) již neobsahuje informaci o formantech, proto je k určování základního tónu vhodnější než základní signál. Určení lagu z chybového signálu můžeme provést pomocí ACF apod. (16) Určování základního tónu řeči Jan Černocký, ÚPGM FIT VUT Brno 26/37

Srovnání autokorelačních funkcí Následující obrázek presentuje autokorelační funkce vypočítané ze základního signálu, z klipovaného signálu a z chyby lineární predikce. 1.5 x 11 1.5 R(m).5 1 5 1 15 2 25 3 35 m 8 x 19 6 4 Rcl1(m) 2 2 4 5 1 15 2 25 3 35 m 6 x 18 5 4 3 Re(m) 2 1 1 5 1 15 2 25 3 35 m Určování základního tónu řeči Jan Černocký, ÚPGM FIT VUT Brno 27/37

Dlouhodobý prediktor chyby predikce pro určení základního tónu Snažíme se předpovědět n-tý vzorek signálu ne z P předcházejících vzorků (jako u LPC), ale ze dvou vzorků vzdálených o předpokládaný lag. Pokud určíme posun s minimální energíı chyby predikce, lag jsme nalezli. Predikovanou chybu predikce zapíšeme: Pak je chyba prediktoru chyby predikce dána: ê(n) = β 1 e(n m + 1) β 2 e(n m) (17) ee(n) = e(n) ê(n) = e(n) + β 1 e(n m + 1) + β 2 e(n m) (18) Chceme minimalisovat energii tohoto signálu: min E = min N 1 n= ee 2 (n) (19) Postupujeme podobně jako při výpočtu LPC koeficientů, jako řešení dostáváme pro Určování základního tónu řeči Jan Černocký, ÚPGM FIT VUT Brno 28/37

koeficienty β 1 a β 2 : β 1 = [r e (1)r e (m) r e (m 1)]/[1 r 2 e(1)] β 2 = [r e (1)r e (m 1) r e (m)]/[1 r 2 e(1)], (2) kde r e (m) jsou normované autokorelační koeficienty chybového signálu e(n). Po dosazení těchto koeficientů do vzorce pro energii 19 můžeme tuto energii zapsat v závislosti na posunutí m jako: E(m) = 1 K(m)/[1 r 2 e(1)] (21) kde K(m) = r 2 e(m 1) + r 2 e(m) 2r e (1)r e (m 1)r e (m) (22) Lag nyní můžeme najít buď tak, že vyhledáme minimální energii nebo tak, že najdeme maximální hodnotu funkce K(m) (uvědomme si, že jmenovatel 1 re(1) 2 na m nezávisí). L = arg min E(m) = arg max K(m) (23) m [L min,l max ] m [L min,l max ] Určování základního tónu řeči Jan Černocký, ÚPGM FIT VUT Brno 29/37

Cepstrální analýza pro určení základního tónu Cepstrální koeficienty můžeme získat pomocí tohoto vztahu: c(m) = F 1 [ ln Fs(n) 2] (24) V cepstrálních koeficientech se daří oddělit část koeficientů zodpovědnou za hlasový trakt (nízké indexy) od části zodpovědné za buzení, a tedy i za základné tón (vyšší indexy). Lag je nutné opět nalézt hledáním maxima c(m) v rozsahu povolenách lagů. Určování základního tónu řeči Jan Černocký, ÚPGM FIT VUT Brno 3/37

c is log energy 1.2 1.8 filter excitation.6.4.2 1st multiple of lag 2nd multiple of lag.2.4 2 4 6 8 1 12 14 16 18 2 Určování základního tónu řeči Jan Černocký, ÚPGM FIT VUT Brno 31/37

Zlepšení spolehlivosti určení základního tónu Místo skutečného lagu je často detekován poloviční či několikanásobný lag. Předpokládejme např., že v pěti po sobě jdoucích rámcích byly detekovány tyto lagy: 5, 5, 1, 5, 5. V prostředním rámci se evidentně jedná o chybu: detekci dvojnásobného lagu. Chyby tohoto typu se můžeme snažit opravit několika způsoby. Určování základního tónu řeči Jan Černocký, ÚPGM FIT VUT Brno 32/37

Nelineární filtrace mediánovým filtrem L(i) = med [L(i k), L(i k + 1),..., L(i),..., L(i + k)] (25) Medián seřadí hodnoty podle velikosti a vybere hodnotu, která se nachází uprostřed. Lagy z našeho příkladu tedy budou opraveny na 5, 5, 5, 5, 5. Určování základního tónu řeči Jan Černocký, ÚPGM FIT VUT Brno 33/37

Metoda optimálních cest V předcházejících metodách jsme lag určovali tak, že jsme určili pouze jedno maximum, případně minimum na jeden rámec. Hledání maxima či minima můžeme ovšem rozšířit na několik rámců vedle sebe: nebudeme hledat hodnotu, ale cestičku, která minimalizuje (či maximalizuje) dané kritérium. Příspěvkem ke kritériu může být např. hodnota R(m) R() energie chyby predikce pro daný lag. Dále je potřeba definovat hypotézy o tvaru cesty (cesta se nemůže z jednoho rámce na druhý výrzně změnit... ). Algoritmus má pak tyto kroky: 1. určení možných cest např tak, že rozdíp v hodnotě lagu mezi sousedními rámci nesmí být větší než konstanta L. 2. určení celkového kriteria pro danou cestu. 3. výběr optimální cesty. nebo Určování základního tónu řeči Jan Černocký, ÚPGM FIT VUT Brno 34/37

Určování základního tónu řeči Jan Černocký, ÚPGM FIT VUT Brno 35/37

Desetinné vzorkování Pro zvýšen přesnosti určení F je vhodné signál nadvzorkovat a následně filtrovat. Dosáhneme tak zvýšení vzorkovací frekvence. Tuto operaci není nutné provádět fyzicky ; dá se promítnout přímo do výpočtu autokorelačních koficientů. Nadvzorkování často zamezíme falešné detekci dvojnásobku skutečného lagu. Určování základního tónu řeči Jan Černocký, ÚPGM FIT VUT Brno 36/37

Příklad interpolovaného signálu a interpolačního filtru: 1.4 16 14 1.2 1 12.8 1 8 6.6.4 4.2 2 29 3 31 32 33 34 35 36 37 38.2 5 1 15 2 25 3 35 4 45 5 Určování základního tónu řeči Jan Černocký, ÚPGM FIT VUT Brno 37/37