Jak zpřesnit HMM? Pomocí přesnější výstupní pravděpodobnostní funkce. Až dosud uvažováno klasické gaussovské rozložení

Podobné dokumenty
7 Další. úlohy analýzy řeči i a metody

Plánování směn verze 2.1, revize 03

Sledování provedených změn v programu SAS

4 Datový typ, proměnné, literály, konstanty, výrazy, operátory, příkazy

Generování Homepage ze serveru AReality.sk

Informační ikony v MarushkaDesignu

Tile systém v Marushka Designu

Helios Orange Plugin Zadávání vlastností

Vykreslení obrázku z databázového sloupce na referenční bod geometrie

Eda. Evidence obchodních aktivit. Proces nákupu

Případy užití RSSystems

Změkčovače vody. Testry. Náplně (pryskyřice, sůl) Jednokohoutové Dvoukohoutové Automatické ,

Zpracování multimediálních dat

Podklady k práci s Intranetem - administrátor

Upomínky a kontroly E S O 9 i n t e r n a t i o n a l a. s.

Rádiová odečtová jednotka RFU 40. a odečtová aplikace RADIO READER

Simulátor krizových procesů na úrovni krizového štábu. Systémová dokumentace

ZŠ ÚnO, Bratří Čapků 1332

Přeložit spolupráce s externím serverem Jazyk možnost nastavení jazykové kontroly a výběr jazyka

Eda. Evidence obchodních aktivit. Proces prodejních kontraktů

Autorizace mapového serveru

Instalace a technické informace

Odpisy a opravné položky pohledávek

1/ Kapacita [B] - množství informací, které je možné do paměti uložit.

Porovnání výsledků analytických metod

MS Word pro administrátory projektů Základy

Možnosti připojení WMS služby do Klienta v Marushka Designu

Metoda klíčových ukazatelů pro činnosti zahrnující zvedání, držení, nošení

Naxos MULTIMEDIÁLNÍ ARCHIV

DTM (Digitální technická mapa) v Marushka Designu

Modul pro vyhodnocení ročních výsledků finančních kontrol

Činnost a role Státního zdravotního ústavu v oblasti přípravků na ochranu rostlin. Miroslava HORNYCHOVÁ Státní zdravotní ústav (SZÚ)

Příjmy a výdeje E S O 9 i n t e r n a t i o n a l a. s.

Školení obsluhy PC stručný manuál obsluhy pro používání PC. MS Power Point

v mechanice Využití mikrofonu k

FRONTA. Podobně jako u zásobníku lze prvek z fronty vyjmout pouze za takové podmínky, že je na řadě. Avšak jeho hodnotu můžeme přečíst kdykoliv.

Základní škola Valašské Meziříčí, Vyhlídka 380, okres Vsetín, příspěvková organizace

Možnosti a druhy párování

PEXESO UŽIVATELSKÝ MANUÁL

Lokalizace souřadnic v MarushkaDesignu

Provozní řád služby zálohování CIT

Dotaz typu Common Info v MarushkaDesignu

Výživa a sport, základy fitness

Témata v MarushkaDesignu

Lekis pro DOS. Souhrn změn k a jejich praktické důsledky

Studijní předmět: Základy teorie pravděpodobnosti a matematická statistika Ročník:

Komunikační protokol MODBUS RTU v displejích TDS101 a TDS57

Manuál k vyplnění Monitorovacích listů za rok 2018 (datum podání do )

Změny ve mzdách systému EKONOM od

Oprava měřící ústředny Foma

Vkládání dat do databázové aplikace

Teplota a její měření

F O R M Á L N Í P O Ž AD AV K Y N A B AK AL ÁŘSKÉ PRÁCE

Přístroj na odstraňování akné

Datové formáty grafiky

Operační systém Windows 8.1

a) DOZP Hliňany: b) DOZP Všebořice: c) DOZP Trmice:

Maintenance. Tomáš Krátký. Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti

Mobilní zpravodajská aplikace idnes. A7B39PDA - Principy tvorby mobilních aplikací

Systém RADOM SECURITY pro zabezpečení objektů

Aktuální výsledky výzkumu ZČU v Plzni v oblasti podtitulkování pořadů pro neslyšící

Nastavení funkce pro Elektronickou evidenci tržeb EET v programu Aconto

Vizualizace TIN (trojúhelníková nepravidelná síť) v Marushka Designu

Střední průmyslová škola a Vyšší odborná škola technická Brno, Sokolská 1

Práce s WKT řetězci v MarushkaDesignu

Posouzení oslnění v osvětlovacích soustavách

Uživatelská příručka aplikace Partner24 modul Zaměstnavatelský portál Česká spořitelna penzijní společnost, a.s.

Podklady pro cvičení. Úloha 1 Návrh konstrukčních systémů

Maturitní prací student osvědčuje svou schopnost samostatně pracovat na projektech a aktivně využívat nabyté zkušenosti

Pražské služby, a.s. Analýza ekonomické situace s ohledem na realizaci záměru propachtování části podniku ve prospěch TSK, a.s. - Manažerské shrnutí -

Tvorba elektronického herbáře

UT2004 UTV {CZ}KillerB

[AVG-WEB] Zpř í stupně ní kořpořá tní ho wěbu Semestrální práce z předmětu A4M39NUR

Informační a komunikační technologie základní terminologie

VSTOOLS.KOMJAK Aplikace pro stanovování emisních limitů kombinovaným způsobem

Automatizovaný docházkový systém verze 3.xx DOCHÁZKA. Automatizovaný docházkový a přístupový systém. Verze 3.xx. Uživatelská příručka

VŠB Technická univerzita, Fakulta ekonomická. Katedra regionální a environmentální ekonomiky REGIONÁLNÍ ANALÝZA A PROGRAMOVÁNÍ.

mtransfer Technická dokumentace Varianta Standard

- Aplikace je napsána v C#.NET, je instalována na webovém serveru - Data jsou ukládána v databázi MS-SQL 2005 a vyšší

Databáze 2011/2012. Logický model DB. RNDr.David Hoksza, Ph.D.

Pomocí mobilní aplikace lze snadno přijímat obraz, který je streamován kamerou. Aplikace také poskytuje

Proudový zdroj. Opravy a nové funkce. Firmware Device Configurator LabVIEW driver 1.1.0

Prováděcí předpisy pro soutěžní lezení pro rok 2014

Zpráva z testování 7.ročníků ZŠ v rámci projektu Rozvoj a podpora kvality ve vzdělávání

(grafické vyjádření reliéfu zemského povrchu vrstevnicemi)

Legenda v MarushkaDesignu

VÍŘIVÁ VÝUSŤ EMCO TYPU DAL 358

Vedení projektů, Odhadování, historie. Jiří Mach

Mimořádná účetní uzávěrka

Úspora energie a hotové peníze

Zadávání do VVVS. Petr Novák ( )

Moderní souborový systém - XFS. Jaroslav Velíšek

Čipový terminál verze 3.3

Manuál k vyplnění Monitorovacích listů za rok 2017 (datum podání do )

ZŠ ÚnO, Bratří Čapků 1332

Projekt Geostat 1B a Sčítání lidu, domů a bytů 2011 Konference k projektu ERRAM CZ-AT

Harmonogram instalačních a implementačních prací

Pozn.: v číselníku je často obsaženo více možností k výběru, ale pro program Interreg V-A ČR-Polsko jsou relevantní pouze možnosti výběru zde uvedené.

ZŠ ÚnO, Bratří Čapků 1332

Transkript:

Pkrčilé metdy rzpznávánířeči Přednáška 6 Zpřes esňvání akustickéh mdelu, vyhdncvání úspěšnsti

Jak zpřesnit HMM? Pmcí přesnější výstupní pravděpdbnstní funkce a 11 a 22 a S-1S-1 a SS Q 1 a 12 a 23.... Q S-1 Q 2 a S-1S Q S b 1 b 2 b S-1 b S Až dsud uvažván klasické gaussvské rzlžení bs ( x) = (2π ) 1 P det Σ s.exp[ 1 2 ( x x s ) T Σ 1 s ( x x s )] Nyní h nahradíme vícemdálním gaussvským rzlžením (vážená směs dílčích gaussvských rzlžení) b s M 1 1 T ( x) = csm.exp[ ( x x P sm) 1 2 Σ sm( x xsm)] m= 1 ( 2π ) det Σ sm

Princip vícemdálníh rzlžen ení Data, z nichž se určují parametry gaussvskéh rzlžení (µ a σ), jsu čast uspřádána ve shlucích. Přesnější ppis rzlžení dat pak dstaneme, když každý datvý shluk reprezentujeme vlastní gaussvku a tyt gaussvky pak lineárně zkmbinujeme. Příklad data v dvurzměrném (dvupříznakvém) prstru

HMM s multimdáln lním gauss. rzlžen ením Směs gaussvek se v literatuře čast značuje jak GMM Gaussian Mixture Mdel a pr jedntlivé slžky se pužívá hvrvý termín mixtura. Při trénvání je nvě nutné určvat také c sm b s M 1 1 T ( x) = csm.exp[ ( x x P sm) 1 2 Σ sm( x xsm)] m= 1 ( 2π ) det Σ sm 1-mixture mdel 3-mixture mdel

Trénv nvání HMM s GMM v HTK (1) Všechny trénvací rutiny v HTK umžňují trénvat vícemixturvé HMM. Vhdný pstup: 1. Natrénvat jednmixturvé mdely 2. Zvýšit pčet pžadvaných mixtur na dvjnásbek. 3. Něklika iteracemi natrénvat nvý mdel s daným pčtem mixtur. 4. Pkračvat až d pžadvanéh pčtu mixtur. Pzn. Vhdný pčet mixtur závisí na mnžství trénvacích dat. Při malém mnžství dat nemusí být pžadvaný pčet mixtur u některéh stavu natrénván a zárveň mdely nemusí být lepší.

Trénv nvání HMM s GMM v HTK (2) Knkrétní pstup: Využití prgramu HHEd (editr subrů, zejména label subrů) Příklad: editr vezme stávající mdely v adresáři mn a v adresáři multi/mn2.0 připraví nvé mdely tím, že rzdělí každu stávající mixturu na 2 HHEd -H mn/hmmdefs -M multi/mn2.0 cm2mix mnphnes.lst Subr cm2mix vypadá následvně MU 2 {*.state[2-4].mix} V dalším krku HHEd -H multi/mn2.2/hmmdefs -M multi/mn4.0 cm4mix mnphnes.lst cm4mix MU 4 {*.state[2-4].mix}

Trénv nvání HMM s GMM v HTK (3) Příklad jednduché dávky na trénvání až d 4 mixtur HHEd -H mn/hmmdefs -M multi/mn2.0 cm2mix mnphnes.lst HERest -C cnfig -I lab.mlf -S data.lst -H multi/mn2.0/hmmdefs -M multi/mn2.1 mnphnes.lst HERest -C cnfig -I lab.mlf -S data.lst -H multi/mn2.1/hmmdefs -M multi/mn2.2 mnphnes.lst HHEd -H multi/mn2.2/hmmdefs -M multi/mn4.0 cm4mix mnphnes.lst HERest -C cnfig -I lab.mlf -S data.lst -H multi/mn4.0/hmmdefs -M multi/mn4.1 mnphnes.lst HERest -C cnfig -I lab.mlf -S data.lst -H multi/mn4.1/hmmdefs -M multi/mn4.2 mnphnes.lst U závěrečnéh mdelu se vyplatí prvést pět více iterací.

Vyhdncvání rzpznávánířeči i (1) V případě rzpznávání izlvaných slv je vyhdncvání jednduché: Crrectnes s = H N.100% H. pčet správně rzp. slv, N. pčet všech testvaných slv V případě rzpznávání sekvencí slv je vyhdncvání slžitější: Příklad: řečen: Zavlám k vám zítra dpledne (5 slv) rzpznán Zavlám nám zítra d pledne (5 slv) H D S H I S H. (hit) správně rzpznán, S. (substituce) nesprávně rzpznán D (delece) vynechán, I.. (inzerce) vlžen

Vyhdncvání rzpznávánířeči i (2) Při rzpznávání sekvencí slv se pužívají dvě míry: H Crrectnes s =.100% N H I Accuracy =.100% N Druhá míra je bjektivnější, přísnější a za určitých pdmínek může být < 0. Jak zjistit hdnty H, S, D, I? Metda minimální editační chyby (MEE) bdba DTW hledá se cesta s nejmenší pčtem prav - Levenshteinva vzdálenst - před aplikací metdy MEE je třeba stanvit cenu chyb typu S, D, I (v HTK 10 7 7)

Prgram HResult: Vyhdncvání v HTK (1) Vezme výsledky rzpznávače (nahrávku p nahrávce) a prvná je s referenčními (pžadvanými) přepisy. Příklad výpisu: Uvádí pčet správně rzpznaných vět (věta = sekvence slv v jednm subru) a pčet správně rzpznaných slv (Crrectness a Accuracy)

Pužití prgramu HResult: Vyhdncvání v HTK (2) 1) Nahrají se testvací nahrávky a ke každé se připraví subr s referenčním přepisem (implicitně *.lab) 2) Vytvří se jeden velký referenční subr přes všechny nahrávky ve frmátu MLF (refer.mlf) 3) Prvede se rzpznávání všech testvacích nahrávek pmcí HVite (pmcí S se specifikuje seznam subrů) 4) Výstupní subr z rzpznávání (result.mlf) se prvná s referenčním subrem HResults -C cnfig -I refer.mlf mnphnes result.mlf #!MLF!# test1.lab" nula šest pět. test2.lab" pět tři devět.

Výsledky rzpznávání (slvník k 413k) TEXT: ŘDS připravil nvý plán na dstavbu dálnic ASR: Řada sil připravil nvý plán na dstavbu dálnic. 85.71( 71.43) [H= 6, D= 0, S= 1, I= 1, N= 7, (OOV= 1)] TEXT: Desítky plicistů, dbrvlníků, myslivců i hasičů hledá d sbty 74letu Janu Šlcvu. ASR: Desítky plicistů dbrvlníků myslivců hasičů hledá d sbty sedmdesáti čtyř let Tuš Janu Šulcvu. 75.00( 50.00) [H= 9, D= 1, S= 2, I= 3, N= 12, (OOV= 2) TEXT: titul mladéh génia se utká přes dvacet tisíc zájemců. ASR: O titul mladéh genia se utká přes dvacet tisíc zájemců. 90.00( 90.00) [H= 9, D= 0, S= 1, I= 0, N= 10, (OOV= 1)] TEXT: Skutečně bych rád vyplnil mezeru ve svém vzdělání ASR: Skutečně rád bych vyplnil mezeru ve svém vzdělání. 75.00( 62.50) [H= 6, D= 1, S= 1, I= 1, N= 8, (OOV= 1)]

D příšp íštíh týdne Připravit si: Každý si připraví 40 testvacích nahrávek V každé nahrávce bude libvlná sekvence číslvek 0 až 9. U každé nahrávky bude *.lab subr Dále bude existvat refer.mlf Dma si každý prvede testy s různými mdely (a různým pčtem mixtur, d různých mluvčích)