LPC. Jan Černocký ÚPGM FIT VUT Brno, cernocky@fit.vutbr.cz. FIT VUT Brno. LPC Jan Černocký, ÚPGM FIT VUT Brno 1/39



Podobné dokumenty
Náhodné signály. Honza Černocký, ÚPGM

Jan Černocký ÚPGM FIT VUT Brno, FIT VUT Brno

Stavový model a Kalmanův filtr

1 LPC. Jan Černocký, FIT VUT Brno, 15. května 2007

Úvod do zpracování signálů

Vlastnosti a modelování aditivního

Při návrhu FIR filtru řešíme obvykle následující problémy:

ÚPGM FIT VUT Brno,

Základní pojmy o signálech

A6M33BIO- Biometrie. Biometrické metody založené na rozpoznávání hlasu I


1. Vlastnosti diskretních a číslicových metod zpracování signálů... 15

Zpracování obrazů. Honza Černocký, ÚPGM

Číslicové filtry. Honza Černocký, ÚPGM

14 - Moderní frekvenční metody

kursu, úvod 2017/18 Igor Szöke a Honza Černocký ÚPGM FIT VUT Brno, FIT VUT Brno

Signál v čase a jeho spektrum

MKI Funkce f(z) má singularitu v bodě 0. a) Stanovte oblast, ve které konverguje hlavní část Laurentova rozvoje funkce f(z) v bodě 0.

Při návrhu FIR filtru řešíme obvykle následující problémy:

MĚŘENÍ A ANALÝZA ELEKTROAKUSTICKÝCH SOUSTAV NA MODELECH. Petr Kopecký ČVUT, Fakulta elektrotechnická, Katedra Radioelektroniky

FAKULTA ELEKTROTECHNIKY A KOMUNIKAČNÍCH TECHNOLOGIÍ ÚSTAV TELEKOMUNIKACÍ

základní vlastnosti, používané struktury návrhové prostředky MATLAB problém kvantování koeficientů

0.1 Úvod do lineární algebry

Matematika (CŽV Kadaň) aneb Úvod do lineární algebry Matice a soustavy rovnic

0.1 Úvod do lineární algebry

VYBRANÉ PARTIE Z NUMERICKÉ MATEMATIKY

FOURIEROVA ANAL YZA 2D TER ENN ICH DAT Karel Segeth

Komprese dat Obsah. Komprese videa. Radim Farana. Podklady pro výuku. Komprese videa a zvuku. Komprese MPEG. Komprese MP3.

Úvod do praxe stínového řečníka. Proces vytváření řeči

Časové řady, typy trendových funkcí a odhady trendů

Časové řady, typy trendových funkcí a odhady trendů

SPECIÁLNÍCH PRIMITIVNÍCH FUNKCÍ INTEGRACE RACIONÁLNÍCH FUNKCÍ

SYNTÉZA AUDIO SIGNÁLŮ

doc. Dr. Ing. Elias TOMEH Elias Tomeh / Snímek 1

3 METODY PRO POTLAČENÍ ŠUMU U ŘE- ČOVÉHO SIGNÁLU

10. cvičení - LS 2017

1 Polynomiální interpolace

IDENTIFIKACE ŘEČOVÉ AKTIVITY V RUŠENÉM ŘEČOVÉM SIGNÁLU

5.1 Modelování drátových antén v časové oblasti metodou momentů

Zvuk. 1. základní kmitání. 2. šíření zvuku

Využití algoritmu DTW pro vyhodnocování vad řeči dětí postižených Landau-Kleffnerovým syndromem (LKS)

5 Časové řady. Definice 16 Posloupnost náhodných veličin {X t, t T } nazveme slabě stacionární, pokud

ADA Semestrální práce. Harmonické modelování signálů

Rozpoznávání izolovaných slov (malý slovník, např. číslovky, povely).

Maturitní témata z matematiky

Parametrické přístupy k filtraci ultrazvukových signálů

Spektrální analýza a diskrétní Fourierova transformace. Honza Černocký, ÚPGM

12. Determinanty. 12. Determinanty p. 1/25

Učební texty k státní bakalářské zkoušce Matematika Vlastní čísla a vlastní hodnoty. študenti MFF 15. augusta 2008

SIGNÁLY A SOUSTAVY, SIGNÁLY A SYSTÉMY

2.6. Vlastní čísla a vlastní vektory matice

Kompresní metody první generace

Hledání extrémů funkcí

VOLBA ČASOVÝCH OKEN A PŘEKRYTÍ PRO VÝPOČET SPEKTER ŠIROKOPÁSMOVÝCH SIGNÁLŮ

7. Derivace složené funkce. Budeme uvažovat složenou funkci F = f(g), kde některá z jejich součástí

Aproximace funkcí. x je systém m 1 jednoduchých, LN a dostatečně hladkých funkcí. x c m. g 1. g m. a 1. x a 2. x 2 a k. x k b 1. x b 2.

2D transformací. červen Odvození transformačního klíče vybraných 2D transformací Metody vyrovnání... 2

ZPRACOVÁNÍ SIGNÁLŮ Z MECHANICKÝCH. Jiří Tůma

A7B31ZZS 10. PŘEDNÁŠKA Návrh filtrů 1. prosince 2014

Zvuk včetně komprese. Digitálně = lépe! Je to ale pravda? X36PZA Periferní zařízení

Soustavy lineárních diferenciálních rovnic I. řádu s konstantními koeficienty

Regrese. 28. listopadu Pokud chceme daty proložit vhodnou regresní křivku, musíme obvykle splnit tři úkoly:

11 Analýza hlavních komponet

a vlastních vektorů Příklad: Stanovte taková čísla λ, pro která má homogenní soustava Av = λv nenulové (A λ i I) v = 0.

Osnova. Idea ASK/FSK/PSK ASK Amplitudové... Strana 1 z 16. Celá obrazovka. Konec Základy radiotechniky

Nejdřív spočítáme jeden příklad na variaci konstant pro lineární diferenciální rovnici 2. řádu s kostantními koeficienty. y + y = 4 sin t.

Přenos pasivního dvojbranu RC

Vícerozměrná rozdělení

Cvičení z Numerických metod I - 12.týden

Integrace. Numerické metody 7. května FJFI ČVUT v Praze

Vold-Kalmanova řádová filtrace. JiříTůma

ODR metody Runge-Kutta

Motivace příklad použití lokace radarového echa Význam korelace Popis náhodných signálů číselné charakteristiky

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

AVDAT Klasický lineární model, metoda nejmenších

1 Modelování systémů 2. řádu

Podobnostní transformace

KGG/STG Statistika pro geografy

Soustava m lineárních rovnic o n neznámých je systém

AVDAT Vektory a matice

MATURITNÍ TÉMATA Z MATEMATIKY

doc. Dr. Ing. Elias TOMEH Elias Tomeh / Snímek 1

MĚŘENÍ ČASOVÉHO ZPOŽDĚNÍ MEZI SIGNÁLY MOZKU: APLIKACE V EPILEPTOLOGII Jan Prokš 1, Přemysl Jiruška 2,3

Modelování systémů a procesů (11MSP) Bohumil Kovář, Jan Přikryl, Miroslav Vlček. 8. přednáška 11MSP pondělí 20. dubna 2015

Stochastické signály (opáčko)

Elektromechanický oscilátor

Fourierova transformace

Aplikovaná numerická matematika

filtry FIR zpracování signálů FIR & IIR Tomáš Novák

Semestrální práce: Rozpoznání hláskované řeči a převedení na text

Seznámíte se s principem integrace metodou per partes a se základními typy integrálů, které lze touto metodou vypočítat.

vyjádřete ve tvaru lineární kombinace čtverců (lineární kombinace druhých mocnin). Rozhodněte o definitnosti kvadratické formy κ(x).

Obsah. Aplikovaná matematika I. Gottfried Wilhelm Leibniz. Základní vlastnosti a vzorce

31ZZS 9. PŘEDNÁŠKA 24. listopadu 2014

2. Schurova věta. Petr Tichý. 3. října 2012

1 Mnohočleny a algebraické rovnice

Cvičení 9 dekompozice časových řad a ARMA procesy

Matematika 1 Jiˇr ı Fiˇser 19. z aˇr ı 2016 Jiˇr ı Fiˇser (KMA, PˇrF UP Olomouc) KMA MAT1 19. z aˇr ı / 19

Spektrální analyzátory

Základy a aplikace digitálních. Katedra radioelektroniky (13137), blok B2, místnost 722

Transkript:

LPC Jan Černocký ÚPGM FIT VUT Brno, cernocky@fit.vutbr.cz FIT VUT Brno LPC Jan Černocký, ÚPGM FIT VUT Brno 1/39

Plán signálový model artikulačního traktu. proč lineární predikce. odhad koeficientů filtru (aneb posuňte si své signály!) Levinson-Durbin Spektrální hustota výkonu (PSD) pomocí LPC. Parametry odvozené z LPC. LPC Jan Černocký, ÚPGM FIT VUT Brno 2/39

Opakování tvorba řeči a její model LPC Jan Černocký, ÚPGM FIT VUT Brno 3/39

buzení model hlasivek model hlasového traktu model vyzařování zvuku řeč s(n) Cíl: Chceme odhadnout parametry tohoto modelu. Tato přednáška se bude zabývat filtrem. LPC Jan Černocký, ÚPGM FIT VUT Brno 4/39

Model artikulačního traktu buzení model hlasivek model hlasového traktu model vyzařování zvuku řeč s(n) LPC Jan Černocký, ÚPGM FIT VUT Brno 5/39

Hlasivky dolní propusť 2. řádu, lomová frekvence okolo 100 Hz: G(z) = 1 [1 e ct s z 1 ] 2 (1) LPC Jan Černocký, ÚPGM FIT VUT Brno 6/39

Hlasový trakt kaskáda malých dvojpólových rezonátorů odpovídajících formantům. resonator 1... resonator resonator 2 k Pro k formantů F i s šířkami pásem B i : 1 V (z) = K [1 2e α it s cos β i T s z 1 + e 2α it s z 2 ] i=1 (2) kde parametry α i a β i jsou určeny polohou a šířkou pásma formantů. LPC Jan Černocký, ÚPGM FIT VUT Brno 7/39

Model vyzařování zvuku L(z) = 1 z 1 (3) což je horní propusť. LPC Jan Černocký, ÚPGM FIT VUT Brno 8/39

Dohromady... H(z) = G(z)V (z)l(z) = = 1 z 1 K (1 e ct s z 1 ) 2 [1 2e α it s cos β i T s z 1 + e 2α it s z 2 ] i=1 Člen ct s 0, proto můžeme krátit čitatele i jmenovatele o jeden člen 1 z 1. Celkový model je tedy celopólový (obsahuje jen jmenovatele čistý IIR filtr). Běžný zápis: (4) H(z) = 1 + 1 = P a i z i 1 A(z), (5) i=1 kde polynom A(z) = 1 + a 1 z 1 + a 2 z 2 + + a P z P má řád P = 2k + 1 (k je počet formantů). Za užitečný počet pokládáme k=4 či 5, proto voĺıme často P=10 (pro F s =8 khz). Pro vyšší vzorkovací frekvence voĺıme P vyšší (např. 16), abychom postihli i vf. část spektra. LPC Jan Černocký, ÚPGM FIT VUT Brno 9/39

Určení parametrů modelu pomocí lineární predikce (LP) Tvorba řeči s tímto filtrem: generátor buzení buzení U(z) x H(z)=1/A(z) řeč S(z) G n-tý vzorek řeči je tedy dán: s(n) = Gu(n) P a i s(n i) (6) i=1 Parametry (koeficienty) filtru a i jsou ovšem neznámé a musíme je odhadnout, odborně identifikovat (system identification). LPC Jan Černocký, ÚPGM FIT VUT Brno 10/39

Určení parametrů filtru Můžeme zkonstruovat tzv. inverzní filtr A (z) s koeficienty α i : Gu(n) e(n) * 1/A(z) A (z) neznáme můžeme měnit Ukazuje se, že v případě stacionárního signálu s(n) jsou koeficienty a i identifikovány pomocí koeficientů α i, je-li minimalizována energie signálu na výstupu e(n): E{e 2 (n)}. kroutíme parametry filtru tak dlouho, dokud není energie signálu na výstupu minimální... LPC Jan Černocký, ÚPGM FIT VUT Brno 11/39

Proč lineární predikce? Předpokláme, že E{e 2 (n)} je již minimalizována, tedy že A (z) = A(z) a budeme tedy používat pouze označení koeficientů a i. A(z) můžeme (trochu podivně jako když se levou rukou drbete za pravým uchem...) zapsat jako: A(z) = 1 [1 A(z)] (7) a tedy: s(n) e(n) A(z) = s(n) 1-A(z) + - e(n) + ~ s(n) Signál s(n) je dán lineární kombinací několika předchozích vzorků, považujeme jej za předpověď skutečného vzorku s(n): s(n) = P a i s(n i) (8) i=1 LPC Jan Černocký, ÚPGM FIT VUT Brno 12/39

Chyba predikce je dána jako rozdíl skutečné a předpovězené hodnoty: e(n) = s(n) s(n) = s(n) [ Čím lepší predikce, tím menší chyba. P a i s(n i)] = s(n) + i=1 P a i s(n i). (9) i=1 V rovině z: E(z) = S(z)A(z) (10) Výhody získání parametrů touto metodou: je-li α i = a i, je chyba predikce rovna buzení (můžeme se tedy dostat ke vstupu do hlasového traktu bez skalpelu). určení koeficientů pomocí LP vede k soustavě snadno řešitelných lineárních rovnic. LPC Jan Černocký, ÚPGM FIT VUT Brno 13/39

Řešení V této etapě řešení zatím záměrně nezmiňujeme, kolik vzorků vstupního signálu máme k disposici, sumy jsou tedy zatím bez mezí. Nenormalizovaná energie chyby predikce je dána: E = n e 2 (n) (11) Tento výraz je třeba minimalizovat. Vyjádříme jej pomocí signálu s(n) (známá veličina) a neznámých koeficientů a i. Pro nalezení minima budeme parciálně derivovat podle každého a i, derivace položíme rovny nule: { } δ P [s(n) + a i s(n i)] 2 = 0 (12) δa j n 2[s(n) + n s(n)s(n j) + i=1 P a i s(n i)]s(n j) = 0 (13) i=1 P a i s(n i)s(n j) = 0. (14) n i=1 n (15) LPC Jan Černocký, ÚPGM FIT VUT Brno 14/39

Označíme: s(n i)s(n j) = φ(i, j), (16) n pak P a i φ(i, j) = φ(0, j) pro 1 j P (17) i=1 Což je soustava lineárních rovnic: φ(1, 1)a 1 + φ(2, 1)a 2 + +φ(p, 1)a P = φ(0, 1) φ(1, 2)a 1 + φ(2, 2)a 2 + +φ(p, 2)a P = φ(0, 2). (18) φ(1, P)a 1 + φ(2, P)a 2 + +φ(p, P)a P = φ(0, P), LPC Jan Černocký, ÚPGM FIT VUT Brno 15/39

Výpočet φ(, ) Koeficienty odhadujeme na rámci o délce N vzorků. Dvě metody lišící se v tom, jak nahĺıžíme na signál vně rámce (tedy pro vzorky n < 0 a n > N 1): LPC Jan Černocký, ÚPGM FIT VUT Brno 16/39

Kovarianční metoda: signál vně rámce je neznámý: se vzorky mimo [0, N 1] nemohu počítat, ani když je tam signál zpožděn. 0 i j s[n] s[n i] N 1 forbidden 0 i+2 j+2 s[n] s[n i] N 1 forbidden s[n j] s[n j] overlap for computing overlap for computing φ(i, j) a φ(i + const, j + const) NEJSOU stejné (máme pokaždé jiný počet vzorků) - musí se řešit plná soustava lineárních rovnic. Složité, kovarianční metoda navíc vede k nestabilnímu filtru 1/A(z). LPC Jan Černocký, ÚPGM FIT VUT Brno 17/39

Korelační metoda: signál vně rámce je považován za známý, ale nulový mohu s ním počítat. 0 i j s[n] s[n i] N 1 allowed 0 i+2 j+2 s[n] s[n i] N 1 allowed s[n j] s[n j] overlap for computing overlap for computing φ(i, j) a φ(i + const, j + const) JSOU stejné (pokaždé stejné vzorky) - soustava rovnic se nám bude dobře počítat, protože na diagonálách budou stejné hodnoty: např. φ(2, 1) = φ(3, 2) = φ(4, 3) = LPC Jan Černocký, ÚPGM FIT VUT Brno 18/39

Proč jsou φ autokorelační koeficienty Odhad autokorelačních koeficientů (bez normalizace) pro signál o délce N pro kladné k, viz Signály a systémy, Náhodné procesy II.: http://www.fit.vutbr.cz/~cernocky/sig R(k) = N 1 k n=0 s(n)s(n + k) Korelační koeficienty udávájí podobnost signálu samotného se sebou, když ho posuneme o k vzorků 0 s[n] N 1 k s[n k] N 1 k overlap for computing LPC Jan Černocký, ÚPGM FIT VUT Brno 19/39

Situace pro φ(i, j) a φ(j, i): 0 i j s[n] s[n i] N 1 allowed 0 j i s[n] s[n i] N 1 allowed s[n j] s[n j] overlap for computing overlap for computing pokaždé počítáme se stejnými vzorku oba dva jsou rovny autokorelačnímu koeficientu R( i j ). To je fajn, protože matice bude navíc ještě symetrická. Matici, která je symetrická a má na diagonálách stejné prvky, se říká Töplitzova. LPC Jan Černocký, ÚPGM FIT VUT Brno 20/39

Výsledná soustava rovnic pro koeficienty a 1...a P R(0)a 1 + R(1)a 2 + +R(P 1)a P = R(1) R(1)a 1 + R(0)a 2 + +R(P 2)a P = R(2).. R(P 1)a 1 + R(P 2)a 2 + +R(0)a P = R(P), (19) LPC Jan Černocký, ÚPGM FIT VUT Brno 21/39

Energie chyby predikce Bez odvození... pomocí LPC můžeme dostat i následující vzoreček pro výpočet nenormalizované energie chyby predikce: E = N+P 1 n=0 e 2 (n) = R(0) + P a i R(i) (20) i=1 Pokud má budící signál normovanou energii rovnu 1 např. bílý šum s rozptylem 1 nebo pulsy, kde 1 N 1 u 2 (n) = 1, pak, abychom dostali tutéž energii jako s(n), musíme N n=0 nastavit gain (zesílení) filtru na: G 2 = E N = 1 R(0) + N... bude se nám hodit při kódování. [ ] P a i R(i). (21) i=1 LPC Jan Černocký, ÚPGM FIT VUT Brno 22/39

Levinson Durbin Jelikož je matice R symetrická a Töplitzova (všechny prvky na diagonálách jsou stejné), dá se k řešení soustavy 19 použít rychlý algoritmus Levinsona a Durbina: E (0) = R(0) k i = R(i) + a (i) i = k i a (i) j = a (i 1) j i 1 j=1 a (i 1) (22) j R(i j) /E (i 1) (23) (24) + k i a (i 1) i j pro 1 j i 1 (25) E (i) = (1 k 2 i )E (i 1) (26) LPC Jan Černocký, ÚPGM FIT VUT Brno 23/39

Levinson-Durbin II. Postupně avyšujeme řád prediktoru (sloupce následující tabulky). a (i) j prediktoru řádu i: a (1) 1 a (2) 1 a (3) 1 a (P) 1 a (2) 2 a (3) 2 a (P) 2 a (3) 3 a (P) 3.... je j-tý koeficient (27) a (P) P LPC Jan Černocký, ÚPGM FIT VUT Brno 24/39

podle průběhu energie chyby predikce E(i) v závislosti na řádu prediktoru lze optimalizovat tento řád: E (i) Zvyšování řádu prediktoru nad lom funkce již nepřináší téměř žádné zlepšení energie chyby. P LPC Jan Černocký, ÚPGM FIT VUT Brno 25/39

Odhad spektrální hustoty výkonu (PSD) pomocí modelu LPC Prozatím jsme PSD odhadovali pomocí DFT (obsahovala i jemnou složku způsobenou násobky frekvence základního tónu). PSD se dá ale odhadnout i pomocí frekvenční charakteristiky filtru 1/A(z): 2 Ĝ LPC = G A(z), (28) z=e j2πf kde f je normovaná frekvence f = F F s. Po dosazení: Ĝ LPC = G 2 P 1 + 2 (29) a i e j2πfi i=1 Na této spektrální hustotě výkonu se dají dobře rozeznat formanty, protože je eliminován vliv základního tónu (a tedy jemná struktura spektra, která se opakuje s F 0 ). LPC Jan Černocký, ÚPGM FIT VUT Brno 26/39

Příklad: odhad spek. hustoty získaný pomocí DFT a LPC na znělém a neznělém rámci. 12000 2000 10000 1500 8000 1000 6000 4000 500 voiced 2000 unvoiced 0 0 500 2000 1000 4000 6000 1500 8000 0 20 40 60 80 100 120 140 160 samples 200 2000 0 20 40 60 80 100 120 140 160 samples 160 180 140 160 140 120 PSD voiced 120 PSD unvoiced 100 100 80 80 60 60 40 0 500 1000 1500 2000 2500 3000 3500 4000 frequency [Hz] 40 0 500 1000 1500 2000 2500 3000 3500 4000 frequency [Hz] LPC Jan Černocký, ÚPGM FIT VUT Brno 27/39

Srovnání spektrogramů Dlouhodobý spektrogram specgram(s,256,8000,hamming(256),200); 4000 3500 3000 2500 2000 1500 1000 500 0 0 0.2 0.4 0.6 0.8 1 1.2 LPC Jan Černocký, ÚPGM FIT VUT Brno 28/39

Krátkodobý spektrogram specgram(s,256,8000,hamming(50)); 4000 3500 3000 2500 2000 1500 1000 500 0 0 0.2 0.4 0.6 0.8 1 1.2 LPC Jan Černocký, ÚPGM FIT VUT Brno 29/39

LPC spektrogram 3500 3000 2500 2000 1500 1000 500 0 0 0.2 0.4 0.6 0.8 1 1.2 LPC Jan Černocký, ÚPGM FIT VUT Brno 30/39

Parametry odvozené z LPC koeficientů Proč? Koeficienty filtru a i jsou dobré na filtrování, ale to je tak všechno: Špatně se kvantují (velká citlivost stability filtru na přesnost kvantizace, nejsou omezeny: a i <, + >.) Jsou tvrdě korelovány špatné pro rozpoznávání založené na HMM. Vzdálenost dvou vektorů koeficientů a i nemá nic společného s podobností nebo nepodobností řečových rámců špatné i pro rozpoznávání založené na přímém srovnávání parametrů (DTW) bylo by něco lepšího??? LPC Jan Černocký, ÚPGM FIT VUT Brno 31/39

PARCOR Mezivýsledky Levinsona-Durbina: koeficienty k i = a (i) i se označují jako koeficienty odrazu nebo také koeficienty PARCOR (partial correlation). Platí pro ně: k i < 1, 1 >. Jsou tedy vhodnější pro kódování než a i. Sady koeficientů a i a k i se jedna na druhou dají jednoduše převést. LPC Jan Černocký, ÚPGM FIT VUT Brno 32/39

Válcový model hlasového traktu hlasový trakt můžeme fyzikálně modelovat pomocí válcových sekcí o stejné délce, avšak o různých průměrech (a tím i průřezech): A [cm 2] 0 l [cm] LPC Jan Černocký, ÚPGM FIT VUT Brno 33/39

Vztah válcového modelu s LPC poměr sousedních sekcí: A m 1 = 1 + k m (30) A m 1 k m pro m = P, P 1,...,1. Plocha A P je fiktivní skutečnou velikost neznáme, položíme tedy A P = 1. Hodnoty A m 1 A m logaritmické poměry ploch log area ratios (LAR): jsou pak poměry ploch area ratios (AR). Používanější jsou g m = log A m 1 A m = log 1 + k m 1 k m (31) Výhoda g m oproti k i je v lineární citlivosti spektra na hodnoty. Je možné použít lineární kvantifikátor hodnot g m. U k i je spektrum silně citlivé na hodnoty k i 0. LPC Jan Černocký, ÚPGM FIT VUT Brno 34/39

LSF či LSP Line Spectrum Frequencies (LSF) nebo také Line Spectrum Pairs (LSP), jsou odvozeny z kořenů dvou polynomů: M(z) = A(z) z (P+1) A(z 1 ) Q(z) = A(z) + z (P+1) A(z 1 ). Pomocí kořenů se dají zapsat: M(z) = (1 z 1 ) (1 2z 1 cos ω i + z 2 ) Q(z) = (1 + z 1 ) i=2,4,...,p i=1,3,...,p 1 (1 2z 1 cos ω i + z 2 ). (32) (33) kde ω je normovaná kruhová krekvence ω = 2πf (f je normovaná obyčejná frekvence). Line spectral frequencies f i jsou v intervalu (0,0.5) a jsou seřazeny vzestupně: 0 < f 1 < f 2 <... < f P 1 < f P < 1 2. (34) LPC Jan Černocký, ÚPGM FIT VUT Brno 35/39

Použijeme-li LSFs pro přenos (jsou kvantovány), můžeme v dekodéru otestovat správné dekódování tak, že zkontrolujeme jejich řazení. 25 20 15 10 5 0 0 500 1000 1500 2000 2500 3000 3500 4000 LPC Jan Černocký, ÚPGM FIT VUT Brno 36/39

LPC-cepstrum Cepstrální koeficienty jsme počítali pomocí DFT. Je také možno určit pomocí spektrální hustoty výkonu získané odhadem pomocí LPC: 2 Ĝ LPC (f) = G A(z), (35) z=e j2πf kde G je gain syntezačního filtru a A(z) je polynom řádu P. V tomto případě hovoříme o LPC-cepstru (LPCC): c(n) = F 1 [lnĝlpc(f)] (36) Dají se odvodit následující vlastnosti LPC-cepstrálních koeficientů: c(0) = lng 2. (37) Nultý LPC-cepstrální koeficient tedy nese informaci o energii daného řečového rámce. LPC Jan Černocký, ÚPGM FIT VUT Brno 37/39

Další koeficienty lze vypočítat z LPC koeficientů pomocí rekurentních vztahů: c(n) = a n 1 n c(n) = 1 n n 1 k=1 n 1 k=1 kc k a n k pro 1 n P kc k a n k pro n > P (38) velmi jednoduchý převod. LPC Jan Černocký, ÚPGM FIT VUT Brno 38/39

Použití LPCC koeficientů LPCC koeficienty jsou jednou z parametrisací používaných v rozpoznávačích řeči. Jejich výhodou je, že jednotlivé koeficienty jsou méně korelovány než například LPC koeficienty a i, v rozpoznávačích postavených na skrytých Markovových modelech (hidden Markov models HMM) se obejdeme bez plných kovariančních matic Σ a vystačíme s vektory rozptylů. Více v kapitole o rozpozávání pomocí HMM. pomocí dvou sad LPCC koeficientů můžeme jednoduše spočítat logaritmickou spektrální vzdálenost (logarithmic spectral distance) mezi dvěma řečovými rámci (nepříjemná definice s integrálem přejde na prostou Euklidovu vzdálenost dvou vektorů LPCC). LPC Jan Černocký, ÚPGM FIT VUT Brno 39/39