Jan Černocký ÚPGM FIT VUT Brno, FIT VUT Brno

Podobné dokumenty
Zvuková stránka jazyka

Úvod do praxe stínového řečníka. Proces vytváření řeči

Šablona: I/2Inovace a zkvalitnění výuky směřující k rozvoji čtenářské a informační gramotnosti

FONETIKA A FONOLOGIE I.

Ř Á

ů č č č č úč č ž ň ž č ž ž š ž č ř č ů ř ř č ó é Á ř é š Á

Č Ž ú ú ú Š ú Š ú ú ó ú Č ú ú ú Č Ů ú ň ú ú Ě ú ú

Algoritmy a struktury neuropočítačů ASN P8b

ž Ž ů ů Š Ž ů ů ů Ž Ž ů Ž Š Š ů Ž ů ů ň Ž ú Ž Ú Ž Š ť ť ť ť Ž

ú ů Ý ůš š ů š ů Ý Ý ů

Ť ŤÍ ň ň č Ó Í č č Ť Ť Ť ň ň ť Ž ň ť ň Í ů ň ň ň č ť Í ŤÍ č Ť Ť č Í Ť č č Ť Ť Ď Ť č Ť č č Ť č Ť č ť Ť Ž Ť č Í Ž č ú Ť č Ý Ď č Ť

ď ť Ý ť Š

š š Č Í š ť ň č č š č ť č č Ě č š š č č š ň Ý ň č č š č Í č Ě č ň č ň š š Í Ý ď ď ň Í Í č č č č Í ť Í č č ň ň

Ý Ť ň Ť Ť Ó Ť Ú ď Ú ř Ž Ť Ť Ť Á Ď Ť Ť ů Ď ř Ť ů Ď Ť ď ď ť Ť ď

Ž ť ř ň Ó ř Č ň Ť ť ť ů ť ť

ů ř Ž ý ý ř ď ř

ú ú Ž Č Č Č Ť ť

V B r n ě, 2 4. b ř e z n a

Ř Í Ě ŘÍ Í Ě É Ř Ť ž é ě ž ě Í é ě ž ú ě ě ě é é é ž é ě é é Ú ě é ú ě ž ě ě é ú ě ú ž é ž Ž é Ž Ž ť ž ú é ě Ž ě ž Ť ž ě ž ž ě ě é ě é Ž é ě é é ě é é

ď š š š š ň ť Í Í š Í š š Č ť š š š ň š Ů š š šť š š

Ú é ů é Ú é Ž é é é ě Ú ž é ě ž Ž ě é ě ě ě ě é ě Ú ě ž é ě ě Ž ě ě ě Š ě ó ě ě Í é Ž é Ž Ž ě ě ě ě ě Š ůž ě ěž Ž Ž ě Ž Ž Ž ě ň ň ě ó é Ž ě

Ý Á Š Ť ě ř ě ě ě ř ě ř ř ě ě ř ě ů ř ř ě ž ř ě Í ě ě ě ě ů ě ě ř ů ěž ř ě ů ř ě ů ž ě ň ú ú ů ž ů Ř ř ž ů ě ř ř ěř ů ěř ů ů ů ě ů ě ů ž ě ř ř ě ř ě ě

Č š ú ú ú ú Ú ú ú Ú Š ť Č Í Í Č

ě

č č č Ó ť č č č č č Í č č č Ť č č Ó č č č č č Ť č č Ť Á ť Ť č ť č Ž č ť ť Í ť Ó Ť

ŤÍ č Ť č Ý č č Ť Í Ť č č Í Ž č č č Í Ť Ť Ř Í ň Ý č ú č č Í Í č Ť č ú Ť č č č č č č č ÍÍ ť Ť č č Ž Ť

Ů ř ž ř ř ú řž ř ř ú ď ř ř ř ž ř ď ř ř ř ř ř ř ř ž ř ř ř ř ř ř ř ř ř ř ž ř ř ž ř ř ř ž ž ž ř ž Ť ř

ú ú š úř Č š ž ř ř š ř ž š š ř š š ř š ř ř ř ž ž Ž ž ř ř ž ř ž ř ř ř ú ž ř š ř ž ž ř š ž Í š ň š ř ž ř š ř š ň úř Ú ř š š ř úř Č š ž ř š ř ú ř Ř Ú Í ž

ě ě é é Ú Ů ě ů ě ú Í Č ě ú é ň é Ú ě Ý é ů ě ě ě š ú ě ě š ů Ú ÚČ ě ň ú ž ú š ě é Ž é ÚČ é é é Š ě Ž ÚČ ň ÚČ ó ú ú ú Ž ú Č Ž Ů ú š ě Ý ě ě ž ú ě é š

ď é Í Í é é é Ž é Ž é Ž é Ž É é é

Ý š ň š ž ň

č ž ž ž č ů č úč č ň ú Ů Ů ů ž ž č ž ú č č š ť ž ó š Ě ž úč ď Ž ž ž ž Á

é š ž ú é ď É ř ž ú ů é š ž ú ú š ř š ž ř ů š ů ř š é é ž š ú ž ř ů é ů ř ú ň é š ř ř é ú Š Š ř ř š š é é é ú é š ž ů š ř ř ž ř ř é ř ř é é š ž ř ž ž

Ť

Í Í ř ť é č é Č é é č é Ť Ť č é Ť Ť é Í ť Ť Š é č é é Í Ě č č é é Ť č Ó ň é é Ť Í Í Ť é é Í ň č é é Ž é é č č é Ó č Ó é č Ú é é Ť é Ť Ť Ť Ť é ť ňč ň é

ý ď ř š ý ň Ú ž Ž ý ž ú ýš ú ú ů Ýš ř ý ý ž řš ý ý ž ř š Í Í Í ý ý ž ú ú ř ž ó ú ř š ř ý ř ž ů ý ý ř ýš ř ž ů ž řš ž šť ř ý ž ř ř ž ú ů ž ď ř š ž ž ž

ý ž ýž ý š š ž Ť ó ý ú ž š Ň ž ú ý š ý ý Ť Ř ů š ž ý ý ý ý ý ž š ů ť š ž ť ý ýš ů š ý ý Á Í

Ř é é é úť Ú é é é é é ú é é é ú ú ú Č ú Č ú ú

ú ě ě ě ú ú ě ě š ě ě ě ě ě ě ě ú ě ů ů ů ě ě ů ů ů

Š ž Ť š Ť Č ž š š Ť š Ť Ž Ť ž Ť ž Ž Ť Ť Ť š ď Ť š Í Ť š Ť ž š š š Ž ť Ť Í Ť Ť š Ť ž Ť Ť š ž š Ť ž š Ť ž Í ž Ť Ť š Ť Ó Ť Ž Ť š Š ž Ť Ť š ž š ž Ť š Ž Ž

Í š š š š Í

Univerzita Karlova v Praze Právnická fakulta DIPLOMOVÁ PRÁCE Filip Kračman

Č ů ť ú ů ť ť ú ů ů ť ť ň ů Ť ť ů ó Č ú ť ů ů ů ú ó ó ť ů ů ú ú ú Á ú ť ť ó ň ů ů ň ť Ů Ů ť ň ů ů

é š Č é ď ď ď ý ý ů

ř ř ř ř ď ú ř ď ů ř ř ř ú ů ř ů ú ř ř ř ř ř ř ř ů šť ů ř ů ů š Á ř š ř ů ř ř úř ř ř ú ů š ř

Č Č Č Ý ď

Ě Í Č ŘÍ Ů Ý Ů Ú ů ů ú ů ů Ň É ŘÍ ŘÍ Ř É ÝĎ Í Á Ú Ě Ů Ž Á Í ú ů ú ů ú ž ú ú ú Č Č ž ú ú ž

E M B L E M A T I C K É M Y S T É R I U M Z A H R A D Y

Á š Á ž Ě Ý ň ď Ě Á Á š ž ě ě ň ě ú ň ů ň ě ů ě ú š ú ě ú ě ú š ž ž ě ě ě ů ě ůž ě ě ě ě ě ú ě š ž ě ě Š ě ě ú Ú ě ž ě ě ž ž ě ů ž š š ň ž ž ž ž š ž ž

ť ť ť ť ť ť ť Ó ť

Ž š ú Í ň š ň Ž ň Í ů š ů Ž ů ú ň Í ň ď É ó Í ú ň ó Ž ůů ó Ň ť ú Ť ů Ú š š Ú ú š š ú ú ú Í ú ú ů š š š ů šť ú Ú ší ú

ú ň ú ž ž ň ú ě Ú ú ěž

Č Í Ý ž Ý ň š š ň ůž ůž ž ž ů ůž ž ž ž ž Ý Ý ť ž ůž ů ž Á š ž š ž ž ž ž ž ž ž ž ž ž ž Ý ůž š ž š ž š Ý š ť ž š ž ž ť ž ž ň ž ž ž

ň č ů ý ů ů ů ý ť č č ý č č ý ý ý č ú ý ů ť č č Ú ů Ý ů ů ú ý ů ů úč Ú č ů ů úč ý ů ů č ů úč Í ů Í Í ý č úč ů č ň ú ú ů ú č ů č ň ú ú ů ú ú ý ů ň ý ú

ž Š ú ý ž ý ů É ž Ň Š ý ú ý Ž ž ď š ý ž ý š š ž ž ž ů ž ď ý ž ň ď ů ý Ž ů š ý ď Ť Ť ý ž ůž ž ž ž ý ž š š ž

Č š š Č ň ů Č š ů Č ů ů é š é é š ó š éú š é ú š é é é š ú ů ú ů ů é Í š ú š ú é é ď é é ú ů ů é é é é é é ů ŽÍ š é š

ý ý ů ů ý ů ř Š úř ř ř ů ř ý ř ů ň ý ř ň ó ř ý ů ř Ú ř ý Á ý ň ř ř ř ř ý ř ý ř Č ú

é Ó é ú ů ů ú ú é ň é Ú Č Ž ů é ů é ž é ů ů Ž ů š Ú Ů é š Ů š Ž š É Í Ť é š Í

ď š ě Í ě ě Ů Ů Í ě š ě Í Í Č Č Í Šď ž č Í č éž Í é Ť ě Ť š ď š Ť ď š Í č Ť Í ě ě ď é é ě ú ž ď Í Ů Í š č é ď Ť ž é ě š Íéž ď ž Ť š č Ó Ý ž š Č ě č ď

Ž Ť ž ž š ž ť Ť š Ž š š Í š Í ž ď Ž š ž Ť š Ó š š Ž Í Ž ň Ž š š Á ž š ž Í š Š ž Š ž š š Ó ť ň ň Ž Č Ó ž Ť ž š ž Ť

ř ý Č ř Ú Ú ř ý ř Č ý ý Č ý ý Ú ř ť ú ě ř ř ú ě ř ý ř ý ý ť ý ě Ě ú ě ě ř ř ú ř ř ý ř ě ý ě ř Š Á

Ť š Í š Č Ť š ň š ň š Í š ť š š š Ť Ť š Ť š ň š š Ť Ť š š š Č Ť š š š š Č ť š š Ú Ť š Ť š Č Ť ň ň Ť š

Š ň é Ž Č š é š é é ř Ž Ž č š é é č é Ž ř é Š Ú Ž ř é ž Ť é č Š č ř Ť ž ž ř ř é š ž ó Ž é é ř š ř ř ř š ž ř č ž é ř ř ř ž é é č č ů ř é é é ž ř é ó č

ú ú ť ú ú ú ú ú ú ú ú ú ť ť ú ú ť ú ú ú ť ó ú ť Ý ú ú ú ú ú ú ú ó

ň ň ň ň ě ě ě Ď Ú ě ě Č ě Č ó ů Š ěď ě ě ó ě Ř ě ěž ěž ě ž ě ě Č Ú ď ú Ř

Č š ď ú Č ň ž Ř ú Ž š ď ú ž š ů ú ď š ů ň ů ď ů ť ž š ť Ť š ž Ž š š ó

ř š š ř š é ýš š š š úř š ř š š Ý ř ý ř úř ř ř Ž Ž Ž

Á Á Á č Ý ú ó é ň ó ď é š ž é é š é ň č š žň éž é č Á É ž é ň ň é é ú ó ž ž ó é Ž ó ž ů é š ú é š

Ů ž ž ž ú ž ž š úč Ů š ú ž ú ň ú ú ú ž š ú ú ň ž ú ž

Ú é š é é š ú ů š Í Ú ú éú ú ú ú ú é é

1. ÚVOD 2. GRAFICKÝ ZÁPIS ZVUKOVÉ PODOBY JAZYKA 2.1 Písmo 2.2 Pravopis 2.3 Fonetická transkripce

ů ů ď

é ž ň ž ř ž š ý ř š ř ů é é ů ž é ž ý ý ž ř ý ý ů Ž ýš Ú ý ž ú ř ř ř ž ř ý é Č Č é ď ř Ž ř ý ů é ý ř ý é ř ť Í

é Ý é š č š é š é é š š Š č č é é é é š č š é é é é č š š š ň é é Ú Č š é ó

Ž ó á ť ť á Ó š š

ť

Ú Č š Ú ú Š š š Č Č Š š Š š Ý š š š Š

ž ř ž ůž ř ř ď ž ř ů ř ř ř ř ů ž ř ů ů ů ů ó ú ú ř ř ř ů ř ž ů ř ž ůž ř ž ř ž ž ř ř ž ř ž ř ů ú ř ů ů ž

ě ú ů éú ž é Ž é ú Á ě ě é ů é ů ůž ě ě ě ú é ť

Ť ť Ě

Ý ů ů ú ů ů ů ú č ú ú ů ů Ř úč ŤŤÉ Á úč ů ť Č ú

ě é Š š ř š ř š ř ú š ř ó ů ř

: ;

ěř ř Š ě ř ř ě ř Ď Č Í Č ě ř ř ě ř ě ý ě Ť ě ý ě ě ě ř ř š Č ó Č Č Č ěř ř ň ř ě řš ý Č Č š ě š ě ý š ř Č Č ě Č Č

ř ž ž š é é ž š ů ž š éš é ů é ř é ú Š ř š ž é ú é š ůž ř é ž ů š š é ř é ř ž é é ž é š ř é š ř ř é é ř ž é ř ř é ř ř š ž é é é š é é ř ž é ž é é é é

Ž Ť ň ž ň Č Ý Ě Ý Ť Ž Ť Č ň Ť ň Ť Ž ď ň ň ž Ž ž ž Ž ž ž Ž Ť ž ž ň Ž Ý ž Ť Ž ž Ť Ž Ž Ý Ó Ž Ó ž ž ž ň Ť ň Ž ž ň Ý Ž Ž ž ž Ž Č Ý ž ž Ť Ť ž ň ň Ž Ď ň ž ň

Ú é ý ú š š š š é é ý é ú ť é ý ú Ó ú š Ž é š é ý ý ů ý é ý ý ů š ý é

Ú č Č ě é č č ú ŠÍ ú š ě é č Á ě é č č ž é ž é Č é ú š ů č ě ů ž ý č é č ú ě Ž ú ž č č č é š č ú ě Č č š Č ě ě š ů ě č Č č é č Č Č ě ý ě Ů é ě č ú ó ž

Ý é ě é é Ý é Ú é é Ý Š ě é Č ě Ý ě ž é é é Í é Č Š Ž é ž é ž é é ě é é ž é ě Ž é é é é ě Á ÁŘ

ď Ž Ž č č č č Ž Ž ď č Ď č ď Ž Ž č Ů Ž ť č ň Ž ď Ý Ž Ž č ť Ž č Ž ú Ž ď č č Ž č č č č č č Ž ů

č č č Ž Ž Š ď č Č ó č ň Ú ď ň č ň

Á É ú ě Á ě Á Č ě ž ú ý é ě ý é ě ďž é ě č ť ě é Č Č ě úě šíě é š ě ě ě é é ě é š ě é ě ě úě ěď ý š é é é č ě ť č Ř é š ě é ěú ýš č č ý ý ý ě č é ď Í

Í ž Í Ý Ž Ž Č Ú Í Í Í Ž Ž Ď Ž Ť ž Ť

ř é ě ý ú ř ý ř ř ě ý ř ý ó ř ě é ř é é é é ý ú ý ý ň ř ě Ú ěž é ú ě ě ý ěž é ú é ě ě ě Ú ý ěň ť ě ě é ě ú ř ě ě ř ě Ú ě ď ý ě ý ě

Ž é č ě é Ž Ž ň ě č Ž ť Ž ě ě ě é ě Ě ě Ž Ď č ě Ž Ž č Ú Ž ě é ě Ž é Ž ě č Ť č Ů ěť Š é ž ě Ž Ž ě Ť ť Ž Ž ě Ž ě Ž Ž é Ž ě é ě č Ť Ž Ž Ď ě ě č é ž Ť Ť Ť

ú ž ú š ř š ň ř ř š ř ř ř É ú ř

ř ř ř ú ň Ž Í ř ř ú ř ř ř ř ř ř ď Í ř ř ř ř ř ď ř ř Í ř ř ř ř ú ř Ž ř ú

ď Í ň ř ň ř ř ř ď ď ž ř ď ň ř Í ž ň ř ň ř ř ň ř ň ř ř É ď ř ň ř ž Ž ž Ž ž Ž Ž ř ž ž ř Í Ž Ž ň ň ř ř ř Ž ň Ž Ž ř ř ří ň ř ř ř ř Í ň ř ň ř ř ďí

ó ž ž ě ě ě ě ě ů ě ď ž ů ě ě ů

í ď ď ď ď ó ď ó á í Ř ď ď ó ó í ť á ó ó í Á ó Ť ř ř š

Transkript:

Fonetika, rozpoznávání řeči HMM II. Jan Černocký ÚPGM FIT VUT Brno, cernocky@fit.vutbr.cz FIT VUT Brno Rozpoznávání řeči HMM Jan Černocký, ÚPGM FIT VUT Brno 1/20

Plán Něco z fonetiky fonetické abecedy. Rozpoznávání pomocí fonémů Tied-state triphones. Jazykové modelování (LM) Odhad parametrů LM Rozpoznávání řeči HMM Jan Černocký, ÚPGM FIT VUT Brno 2/20

Fonetika Tato sekce podává pouze velmi základní informaci. Podrobnosti ve skriptu: Krčmová N.: Fonetika a fonologie: zvuková stavba současné češtiny. ISBN 80-210-0137-2. Masarykova univerzita, Brno, 1990 Rozeznáváme dvě základní skupiny hlásek (fonémů): samohlásky (ustálená poloha hlasového traktu). souhlásky (přechodové stavy hlasového ústrojí). Rozpoznávání řeči HMM Jan Černocký, ÚPGM FIT VUT Brno 3/20

Samohlásky vokály Čeština má 5, děĺıme na krátké a dlouhé. Délka samohlásek je v češtině významotvorná. Následující tabulka udává typickou a možnou délku souhlásek v milisekundách. Délka konkrétní realisace závisí na dialektu, emocích, atd. samohláska typ. délka rozmezí samohláska typ. délka rozmezí a 120 90 160 á 240 190 300 e 90 60 120 é 190 160 220 i 80 50 100 í 170 140 200 o 100 70 130 ó 200 160 250 u 90 60 120 ú 180 120 240 Rozlišení samohlásek je možné pomocí formantů. V češtině jsou určující F 1 a F 2. Formant F 3 je připisován vlivu dutiny nosní, který je v češtině minimální (srov. s francouzštinou!). Typické výšky formantů udává následující tabulka. Vyneseme-li frekvence F 1 a F 2 logaritmicky, dostaneme tzv. samohláskový trojúhelník: Rozpoznávání řeči HMM Jan Černocký, ÚPGM FIT VUT Brno 4/20

samohláska F 1 [khz] F 2 [khz] a 0,8 1,0 1,2 1,4 e 0,5 0,7 1,6 2,1 i 0,3 0,5 2,1 2,7 o 0,5 0,7 0,9 1,2 u 0,3 0,5 0,6 1,0 F1 0.9 a 0.6 o e 0.3 u i 0.5 1 2 3 F2 Rozpoznávání řeči HMM Jan Černocký, ÚPGM FIT VUT Brno 5/20

Souhlásky konsonanty jsou podstatně kratší než samohlásky a jejich délka silně závisí na kontextu (samostatně vyslovené r má např. okolo 30 ms, kdežto slabikotvorné r v trn okolo 90 ms). Identifikace souhlásek je podstatně těžší. vznikají postavením překážky do proudu protékajícího vzduchu. Souhlásky můžeme dělit několika způsoby: Podle znělosti znělé - hlasivky vibrují. neznělé - hlasivky jsou v klidu, hlasový trakt je buzen proudem vzduchu. Rozpoznávání řeči HMM Jan Černocký, ÚPGM FIT VUT Brno 6/20

Podle charakteru překážky překážka úplná závěrové - okluzívy. překážka neúplná (zúžení cesty výdechového proudu) úžinové - frikativy: vlastní úžinové. bokové (laterály) - l. kmitavé (vibranty) - r, ř. polozávěrové - semiokluzívy - c, č, dz, dž. Rozpoznávání řeči HMM Jan Černocký, ÚPGM FIT VUT Brno 7/20

Podle párovosti párové podobné postavením hlasového traktu, liší se znělostí. nepárové vždy znělé, nemají neznělý protějšek. Dělení souhlásek podle znělosti, charakteru překážky a párovosti shrnuje následující tabulka: Souhlásky závěrové úžinové polozávěrové (okluzívy) (frikativy) párové neznělé p t ť k s š f ch c č znělé b d ď g z ž v h dz dž nepárové znělé m n ň l j r ř Rozpoznávání řeči HMM Jan Černocký, ÚPGM FIT VUT Brno 8/20

Podle místa artikulace Místem artikulace se rozumí poloha překážky: retné labiální. dásňové alveolární. předopatrové palatální. zadopatrové velární. hrtanové laryngální nebo glotální. Rozpoznávání řeči HMM Jan Černocký, ÚPGM FIT VUT Brno 9/20

Mezinárodní normy pro označování fonémů Mezinárodní fonetická asociace (International Phonetic Association) definovala mezinárodní fonetickou abecedu: IPA (International Phonetic Alphabet). Můžete se na ni podívat na WWW stránce: http://www2.arts.gla.ac.uk/ipa/ipa.html Pro zápis pomocí této abecedy potřebujete speciální fonty, pro automatické zpracování není příliš vhodná. Rozpoznávání řeči HMM Jan Černocký, ÚPGM FIT VUT Brno 10/20

Počítačově čitelnou variantou je SAMPA (Speech Assessment Methods Phonetic Alphabet). Podrobný přehled viz WWW stránka: http://www.phon.ucl.ac.uk/home/sampa/home.htm Velmi rozšířenou notcí pro rozpoznávání řeči (US English) je fonémová sada (a její značení) použité v databázi TIMIT. Rozpoznávání řeči HMM Jan Černocký, ÚPGM FIT VUT Brno 11/20

ZPĚT DO ROZPOZNÁVÁNÍ opakování - rozpoznávání spojených slov: ONE A TWO B ZERO Rozpoznávání řeči HMM Jan Černocký, ÚPGM FIT VUT Brno 12/20

Rozpoznávání pomocí menších jednotek v případě velkého slovníku nejsme schopni natrénovat model pro všechna slova (málo dat, některá vůbec nejsou v trén. databázi) modely menších jednotek. fonémy: six = s i k s. Pivo passing jako v předcházejícím případě, modely slov jsou poskládány z modelů fonémů. kontextově závislé fonémy (CD-phones): n v nothing se podstatně liší od n v bank přidání závislosti na kontextu. Klasicky 1 vlevo, 1 vpravo, trifony. six = s+i s-i+k i-k+s k-s. Nevýhoda: mnoho trifonů, nespolehlivý odhad, chybějící trifony. trifony se sdílenými stavy (tied-state triphones): vázání stavů pro podobné modely, menší množství dat. Vázání pomocí fonetických otázek. Rozpoznávání řeči HMM Jan Černocký, ÚPGM FIT VUT Brno 13/20

d ao g ENTER <SIL> ae n d <SIL> EXIT k ae t sp Rozpoznávání řeči HMM Jan Černocký, ÚPGM FIT VUT Brno 14/20

Není ale možné spolehlivě natrénovat každý trifón sdílení stavů: s-aw+n t-aw+n s-aw+t etc.. Example Cluster centre states of phone /aw/ R=Central-Consonant? n y L=Nasal? R=Nasal? n y n y L=Central-Stop? n y States in each leaf node are tied Rozpoznávání řeči HMM Jan Černocký, ÚPGM FIT VUT Brno 15/20

Při rozpoznávání s velkým slovníkem (např. 10000 slov) není možné brát v úvahu pouze akustické modelování Jazykové modely Language Models zpět do teorie: W1 N { = arg max P(W N 1 O) }, W1 N Vyhodnocení pomocí Bayesova vzorce: P(W N 1 O) = P(O W N 1 )P(W N 1 ) P(O) Rozpoznávání řeči HMM Jan Černocký, ÚPGM FIT VUT Brno 16/20

Jazykové modelování: určení pravděpodobnosti P(W N 1 ) ideálně násobením podmíněných pravděpodobností: P(W N 1 ) = N P(W 1 ) P(W 2 W 1 ) P(W 3 W 1 W 2 )... P(W N W 1... W N 1 ) i=1 pravděpodobnosti nejdou odhadnout... zkrácení historie na 1 (bigramy) nebo 2 (trigramy). Rozpoznávání řeči HMM Jan Černocký, ÚPGM FIT VUT Brno 17/20

Odhad pravděpodobností LM na velkém korpusu textu: P(W H) = N(W, H)/N(H) Ani trigramy není možné spolehlivě odhadnout a chceme se vyvarovat nul v LM: Back-off Language models P (W H) = (N(W, H) D)/N(H) for N(W, H) > p b(h)p (W H 1 ) for N(W, H) p Rozpoznávání řeči HMM Jan Černocký, ÚPGM FIT VUT Brno 18/20

Schema rozpoznávače: Language model 3 Decoder Output sentence Speech 1 Signal processing Acoustic modeling Acoustic models 2 Rozpoznávání řeči HMM Jan Černocký, ÚPGM FIT VUT Brno 19/20

Rozpoznávací síť s bigramy: Language Model P <SIL> > <SIL> ENTER <SIL> <SIL> <SIL> <SIL> EXIT DOG DOG d ao g sp AND AND ae n d sp CAT P CAT > CAT CAT k ae t sp Rozpoznávání řeči HMM Jan Černocký, ÚPGM FIT VUT Brno 20/20