Rozpoznávání hlasových vstupů

Rozměr: px
Začít zobrazení ze stránky:

Download "Rozpoznávání hlasových vstupů"

Transkript

1 XXVIII. ASR '2003 Seminar, Instruments and Control, Ostrava, May 6, Rozpoznávání hlasových vstupů LIČEV, Lačezar 1 & ALMÁSY, Peter 2 1 Doc., Ing., CSc., Katedra informatiky-456, VŠB-TU Ostrava, 17. listopadu, Ostrava-Poruba, lacezar.licev@vsb.cz, 2 Ing., Katedra informatiky-456, VŠB-TU Ostrava, 17. listopadu, Ostrava-Poruba, peter.almasy.st@vsb.cz Abstract: Tématem tohoto příspěvku je analýza řeči prováděná na PC. V první části je představen matematický aparát nezbytný pro zpracování zvukového signálu. Jistý prostor je věnován také několika metodám z oblasti umělé inteligence, které jsou při analýze hlasového projevu často užívány. Druhá část čerpá ze zkušeností získaných během realizace několika systémů pro analýzu řeči. Jsou zde prezentovány výsledky dosažené při identifikaci izolovaných slov, posloupností izolovaně pronášených slov a konečně i využití akusticko-fonetických znalostí při klasifikaci souvislého řečového projevu. Keywords: klasifikace promluvy, identifikace slov v řeči, mikrosegment, neuronová síť 1 Úvod Komunikace člověka s počítačem prostřednictvím mluveném dialogu vyžaduje technické i algoritmické řešení několika úloh, které se týkají zejména zpracování řečového signálu, automatické syntézy a rozpoznávání řeči, včetně porozumění významu rozpoznaných slov a vět. Zřejmě největší problémy v sobě skrývá rozpoznávání plynulé řeči. Komplikace navíc rostou s velikostí rozpoznávaného slovníku, závislostí na hlasu řečníka či rušivým prostředím. Značně omezená je také součinnost procesu klasifikace řečového signálu a procesu porozumění smyslu posloupnosti klasifikovaných slov. Z těchto důvodů jsou systémy hlasového dialogu využívány zatím pouze v omezeném měřítku, a to zejména v jednodušších a úzce problémově zaměřených aplikacích jako jsou např. automatické informační a rezervační systémy. Naopak systémy, které pracují s hlasovou syntézou se již dnes staly nedílnou součástí běžného života, kdy nám např. neživý operátor sděluje výši našeho kreditu na mobilním telefonu či hlásí zpoždění vlaku, který tu měl už dávno být. 2 Řeč 2.1 Informační obsah řeči Informační obsah fonetické formy Nejmenší jednotkou řeči, která může rozlišovat jednotlivá slova se nazývá foném [1]. Počet fonémů v existujících světových jazycích se pohybuje od 12 do 60. V českém jazyce je jich 36, v anglickém 42 a např. v ruském 40. Fonémy se skládají do větších celků slabik. Libovolná promluva je potom vlastně opakování různých slabik.

2 XXVIII. ASR '2003 Seminar, Instruments and Control, Ostrava, May 6, Informační obsah akustické formy Pod pojmem akustická forma si lze představit průběh amplitudy v čase a průběh změn frekvence v čase [1]. Uvažujeme-li, že frekvenční spektrum naší promluvy nebude přesahovat hodnotu F m =16 khz a dynamika řeči bude 50 db při minimálním šumu, byla by pro kvalitní záznam signálu nutná informační rychlost větší než bit/s. Z hlediska sémantiky akustická forma nese informace např. o intonaci a tempo promluvy, charakteristické zabarvení hlasu každého řečníka, dialekt, individuální zvláštnosti a defekty mluvčího apod. Vznik řečového signálu Zdrojem řečových kmitů jsou lidské řečové orgány. Ty se skládají z hlasivek, dutiny hrdelní, ústní a nosní, měkkého a tvrdého patra, zubů a jazyka. K těmto orgánům je však nutno připočíst ještě fundamentální zdroj hlasové energie, tj. plíce a s nimi funkčně spjaté dýchací svaly. Frekvence kmitaní hlasivek je různá a pohybuje se v rozmezí 150 až 400 Hz. Frekvence kmitů hlasivek F 0 charakterizuje základní tón lidského hlasu. A akustická realizace fonému záleží na jeho předcházejícím a následujícím zvuku, tak i na tempu a intonaci řeči. Tato závislost je známa jako koartikulace. Fón označuje minimální fonetickou jednotku identifikující jednotlivé primitivní zvuky. Všechny odlišné fóny určitého fonému se nazývají alofóny. Kupříkladu pro foném [s] existuje množství alofónů [s], závislých na kontextu, jako např. ve slovech sup, eso, osa, srp atd. 3 Akustické zpracování signálu 3.1 Charakteristika akustického signálu Velmi podstatnou věcí při zpracování řečového signálu je jistě druh cílové aplikace. Hlavní hlediska, které lze sledovat, jsou především složitost, rychlost přenosu informace a pružnost. Důležitým předpokladem při zpracovávaní akustického signálu je fakt, že se nám jeho vlastnosti v průběhu času mění pomalu, což umožňuje dále signál zpracovávat pomocí metod krátkodobé analýzy, při níž se úseky řeči vydělují a zpracovávají tak, jako by to byly krátké, na sobě nezávislé zvuky (mikrosegmenty). Délka mikrosegmentu se většinou pohybuje v rozmezí milisekund. Výsledkem analýzy je potom číslo, či vektor čísel, který jistým způsobem charakterizuje daný mikrosegment. 3.2 Kódování tvaru vlny pulsní kódová modulace PCM Informace obsažená v mluvené řeči je obvykle získávána mikrofonem. Pro další zpracování je zapotřebí tyto analogové kmity převést do číslicových údajů. Tento proces se nazývá pulsní kódová modulace nebo též digitalizace a zahrnuje provedení dvou kroků, a to vzorkování a kvantizaci s kódováním. 3.3 Pomocné metody zlepšující zpracování signálu Preemfáze znamená zdůrazňování amplitud spektrálních složek řečového signálu s jejich vzrůstající frekvencí. Důvod tohoto procesu vyplývá z právě opačného chování řečového ústrojí, tj. z poklesu amplitud spektrálních složek řečového signálu na vyšších frekvencích. 3.4 Zpracování v časové oblasti Většinu metod krátkodobé analýzy v časové oblasti lze vyjádřit vztahem: k= Qn = τ ( s( k)) w( n k), (1) kde Q n je krátkodobá charakteristika s(k) je vzorek akustického signálu získaný PCM v čase k τ(.) vyjadřuje příslušnou transformační funkci w(n) je váhová posloupnost neboli tzv. okénko, kterým se váží vzorky s(k).

3 XXVIII. ASR '2003 Seminar, Instruments and Control, Ostrava, May 6, V systémech analýzy řečového signálu se volí obvykle n = Ni-1 při zpracování, kdy mikrosegmenty na sebe navazují, nebo n = [N(i+1)/2]-1 pro mikrosegmenty, které se překrývají o polovinu. Přitom i je pořadí analyzovaného mikrosegmentu a N je počet vzorků mikrosegmentu. Krátkodobá energie Funkci krátkodobé energie signálu lze definovat vztahem: E n = k = [ s( k) w( n k)] kde s(k) je vzorek signálu v čase k w(n) je příslušný typ okénka. 2, (2) Dále se často využívá tzv. krátkodobá intenzita, která je definovaná vztahem: k= k = M = s( k) w( n k) n Hodnoty krátkodobé energie i krátkodobé intenzity mohou být využity například při automatickém oddělování segmentů ticha od segmentů řeči. Lze jich též využít při oddělování znělých a neznělých částí promluvy. Krátkodobá funkce středního počtu průchodu signálu nulou Frekvenci průchodů signálu nulovou úrovní můžeme chápat jako jednoduchou charakteristiku popisující spektrální vlastnosti signálu. Krátkodobou funkci středního počtu průchodu nulou lze definovat jako: kde sgn (s(k)) = 1 pro s(k) 0 sgn (s(k)) = -1 pro s(k) < 0 w(n) je pravoúhlé okénko. Z = sgn[ s( k)] sgn[ s( k 1)] w( n k), n (3) (4) 3.5 Zpracování ve frekvenční oblasti Mluvená řeč může být ve frekvenční oblasti reprezentována jako kompozice spektrální obálky charakterizující vlastnosti hlasového ústrojí a jemné struktury charakterizující buzení. Jak se mění buzení a tvar hlasového ústrojí, vytvářejí se různé zvuky a mění se i spektrum signálu. Nejčastěji používané postupy jsou založeny na aplikaci krátkodobé diskrétní Fourierovy transformace. Fourierova transformace Předpokládejme, že metodou PCM byly získány vzorky s(k) řečového signálu. Krátkodobá Fourierova transformace je pak definována vztahem: kde k = S ( ω, n ) = s ( k ) h ( n k ) e j ω k h(n) je funkce okénka, která vybírá pro zpracování určený úsek signálu s(k) jsou vzorky řečového signálu. (5)

4 XXVIII. ASR '2003 Seminar, Instruments and Control, Ostrava, May 6, Na tuto rovnici lze nahlížet dvěmi různými pohledy. V prvním případě, je signál řeči zpracováván nejčastěji tzv. krátkodobou diskrétní Fourierovou transformací, kde jsou čas i frekvence diskrétní. Ve druhém případě, lze na Fourierovou analýzu pohlížet jako na proces lineární filtrace a je možné vhodnou volbou funkce okénka navrhnout pásmový filtr či soustavu pásmových filtrů. Diskrétní Fourierova transformace DFT se zavádí pro vyjádření spektrálních vlastností jednak periodických posloupností s konstantní periodou N odečtů a jednak posloupností konečné délky N odečtů. Předpokládejme, že x(n) = 0, n = 0,1,2 N-1, je posloupnost N časových odečtů signálu x(t) s konstantní periodou vzorkování T. Pak koeficienty X(k) DFT lze získat ze vztahu: N 1 N 1 2π (6) kn X ( k ) = x ( n ) exp( j kn ) = x ( n ) W N N kde n = 0 k = 0,1,2.N-1. Rychlá Fourierova transformace FFT se zavádí z ryze praktických důvodů. Jedná se o postup, který umožňuje radikální snížení množství operací při výpočtu koeficientů DFT Pásmová filtrace V mnoha aplikacích zpracování řečového signálu je účelné provádět jeho pásmovou filtraci. Vhodným výběrem počtu a šířky pásem lze totiž efektivně detekovat fonetickou strukturu řeči a využít informace obsažené ve výstupních signálech jednotlivých filtrů, např. pro účinnou klasifikaci hlásek či celých slov. Nejčastěji je pro účely pásmové filtrace využívána FFT a polyfázový frekvenční filtr (navržen pro MPEG kompresi zvuku). 4 Rozpoznávání Máme posloupnost příznaků či přesněji vektorů příznaků. Dimenze těchto vektorů je dána počtem měřených koeficientů a délka posloupnosti je úměrná délce slova a je určena počtem mikrosegmentů. Rozpoznávání obrazů slov tedy spočívá v zařazování těchto obrazů do předem definovaných tříd, které většinou reprezentují slova pracovního slovníku. 4.1 Statistický přístup Princip této metody vychází z představy o vytváření řeči. Při generování řeči člověkem, si lze představit, že hlasové ústrojí je během krátkého časového intervalu mikrosegmentu generuje určitý foném. V uvažovaném mikrosegmentu je pak hlasovým ústrojím produkován krátký signál, který závisí na stavu artikulačního ústrojí a může být popsán určitými spektrálními charakteristikami. Budeme předpokládat, že počet spektrálních charakteristik je konečný. Toho lze dosáhnout vektorovou kvantizací, kdy je vytvořena kódová kniha typových spektrálních vzorů a každá spektrální charakteristika je nahrazena indexem nejbližšího typového spektrálního vzoru z kódové knihy. Z představy o vytváření řeči vychází i konstrukce klasifikátoru, založena na modelování řečového signálu pomocí Markovova procesu. 4.2 Vzdálenostní přístup Dynamické programování DTW Klasifikátory slov využívající metodu dynamického programování poskytují rozhodnutí o zařazení neznámého slova do určité třídy nejčastěji na základě minimální vzdálenosti obrazu neznámého slova k některému ze vzorových obrazů této třídy. n = 0

5 XXVIII. ASR '2003 Seminar, Instruments and Control, Ostrava, May 6, Neuronová síť Rozpoznávání probíhá na základě podobnosti si jednotlivých vzorků promluvy. Čím méně se budou jednotlivé hodnoty vektorů lišit, tím větší bude pravděpodobnost zařazení do stejné skupiny neuronů. Jedná se tedy o jakousi vzdálenost mezi porovnávanými vektory. Pro účely zařazování navzájem si podobných vzorků se jeví jako nejvhodnější dvouvrstvá neuronová síť. Spodní vrstva je jakýmsi vstupem sítě. Tam je přivedeno např. celé, právě namluvené slovo. Síť tyto data zpracuje a na horní vrstvě (výstupní), která bude reprezentovat jednotlivé rozpoznané slova, se zobrazí výsledek. Tím je třída slov, kterým se vstup nejvíce podobá. 4.3 Rozpoznávání izolovaných slov Obecné blokové schéma klasifikátoru izolovaných slov je uvedeno na obrázku č. 1. Z tohoto obrázku je patrné, že klasifikátor pracuje ve dvou režimech činnosti. V režimu trénování jsou na základě trénovací množiny vytvářeny a uchovávány referenční obrazy slov slovníku, zatímco v režimu klasifikace dochází k porovnávání testovaného obrazu s referenčními obrazy uloženými ve slovníku s následnou klasifikací obrazu testovaného slova. Zpracování signálu Výběr příznaků Vytvoření obrazu testovaného slova Vytvoření referenčních obrazů slov Porovnání obrazů Rozpoznání neznámého slova Obrázek 1 Blokové schéma klasifikátoru slov. 4.4 Rozpoznávání v kontinuální promluvě Má-li být komunikace s počítačem mluvenou řečí plynulá a přirozená, musí mít uživatel možnost mluvit souvisle, tedy bez pauz mezi slovy. K zabezpečení tohoto požadavku je nezbytné vyřešit celou řadu dodatečných problémů, kterými mohou být například otázky počtu slov v promluvě, lokalizace hranic jednotlivých slov, problematika trénování, resp. klasifikace, na úrovni posloupnosti slov apod. V součastné době existují v oblasti klasifikace kontinuální promluvy čtyři hlavní směry. Rozpoznávání spojených slov Rozpoznávání spojených slov je určitým předstupněm klasifikace souvislé řeči. V systémech rozpoznávání spojených slov se skládá neznámá promluva z řetězce slov, které byly vybrány z omezeného slovníku izolovaných slov a které byly řečníkem vysloveny souvislým způsobem, tj. bez zřetelných pauz mezi slovy. Přitom se obvykle předpokládá, že počet slov ve vysloveném řetězci nemusí být předem přesně znám. Výsledkem klasifikace by mělo být

6 XXVIII. ASR '2003 Seminar, Instruments and Control, Ostrava, May 6, číslo udávající optimální počet slov obsažený v promluvě, konkrétní výčet těchto slov s odpovídajícím pořadím a popřípadě i umístění časových okamžiků hranic mezi slovy. Statistický přístup Tento přístup rozvíjí statistické metody klasifikace založené na skrytých Markovových modelech a přizpůsobuje je souvislé promluvě. Přitom se předpokládá využití především Markovových modelů fonému, jejich zřetězování do modelů slov a posléze spojení této struktury s tzv. jazykovým modelem. Jazykový model přitom poskytuje pro rozhodování klasifikátoru dodatečnou informaci, která se týká statistik výskytu posloupnosti n-tic po sobě jdoucích slov pracovního slovníku. Strukturální přístup Strukturální metody rozpoznávání pracují s obrazy tvořenými souborem nalezených základních popisných elementů primitiv, jejich vlastnostmi a relacemi mezi nimi. Primitiva představují minimální kvalitativní charakteristiky, které lze nalézt v obraze. Každé primitivum je popsáno jistým symbolem, tzv. terminálem. V rozpoznávaném obraze lze mezi primitivy nalézt jisté vztahy, které lze syntakticky popsat jako jisté n-ární relace nebo operace nad odpovídajícími symboly. V případě aplikace rozpoznávání řeči jsou jako primitiva nejčastěji uvažovány fonémy, slabiky, slova apod., jako typická operace nad odpovídajícími terminálními symboly je operace zřetězení. Úloha klasifikace je pak převedena na úlohu rozhodování o tom, ke kterému z jazyků charakterizujících jednotlivé třídy, popis neznámého obrazu patří. Uplatnění znalostního přístupu Základní idea tohoto přístupu spočívá ve formalizaci obecných znalostí (báze znalostí) získaných dlouholetým experimentováním se zpracováním a klasifikací mluvené řeči a jejich oddělení od konkrétních řečových dat (báze dat). Silná motivace pro tento přístup byla vyvolána rozvojem zejména expertních systémů, které naznačily nový způsob, jakým se může na řešení složitého problému efektivně podílet i celá řada nezávislých odborníků. Protože rozpoznávání je charakterizováno těsnou vazbou mezi zpracováním řečového signálu na mnoha hierarchických úrovních, zdá se, že využití expertních znalostí může významně usnadnit řešení celé problematiky. Expertní systémy přistupují k řešení uvedené úlohy prostřednictvím dekompozice složité expertizy do velkého počtu dílčích rozhodnutí podpořených relativně jednoduchými znalostmi, které jsou specifikovány jako tzv. akusticko-fonetické, lexikální, fonologické, prozodické, syntaktické, sémantické a pragmatické zdroje znalosti. 5 Dosažené výsledky Následující text přibližuje výsledky prací [4] a [6], které vznikly na Katedře Informatiky FEI, VŠB TUO. Jedná se o shrnutí zkušeností získaných jak při implementaci klasifikace izolovaných slov, tak i při rozpoznávání kontinuální promluvy. 5.1 Klasifikace izolovaných slov Vzorkování a kvantizace Řeč je do PC převáděna pomocí A/D převodníku zvukové karty. Přestože v [1] se uvádí, že pro kvalitní snímání zvuku je vhodné použít vzorkovací frekvenci mezi khz, ukázala se hodnota 8 khz pro účely detekce izolovaných slov jako dostačující. Podle provedených testů nemělo zvýšení frekvence vzorkování podstatnější vliv na kvalitu detekce, zato však způsobilo citelné zpomalení celého procesu rozpoznávání. Každý vzorek je kvantizován do 256 úrovní. (8 bitový převod).

7 XXVIII. ASR '2003 Seminar, Instruments and Control, Ostrava, May 6, Mikrofon Důležitým krokem je volba mikrofonu. Z několika dostupných druhů byl po testech vybrán jako nejvhodnější mikrofon určený pro internetovou telefonii. Výhodným je zejména proto, že je upevněn k sluchátkům a tudíž si udržuje od zdroje zvuku (úst mluvčího) konstantní vzdálenost. Použitý přistroj byl kondenzátorový, s citlivostí 62 db a frekvenčním rozsahem 50 Hz 16 khz. Zesílení signálu Po zkušenostech s prvními verzemi klasifikátoru bylo na začátek celého procesu detekce přidáno zesílení vstupního signálu. Jedná se o normalizaci nasnímaných hodnot do intervalu <-127, 127>. Dále byla zavedena prahová hodnota velikosti amplitudy, pod kterou je vzorek považován za šum a tudíž není zesilován. Provedené úpravy byly přínosem zejména při určování počátku a konce slova. Preemfáze Preemfáze byla implementována jako číslicový filtr aplikovaný na signál po procesu vzorkování a kvantizace. Vstupní signál je upravován podle vztahu y( n) = x( n) αx( n 1), (7) kde x(n) je vzorek signálu v čase n a hodnota konstanty α byla zvolena 0,92. Použití preemfáze mělo dle očekávání na kvalitu klasifikace pozitivní vliv. Určení hranic promluvy Pro účely stanovení hranic slova byla použita metoda pracující s krátkodobou intenzitou. Aby se zlepšila flexibilita a spolehlivost detekce, umožňuje algoritmus nastavit tzv. délku ticha, což je číslo určující, kolik mikrosegmentů ticha se může celkem v jednom slově vyskytovat. Z provedených testů plyne, že nejlepších výsledků lze dosáhnout pro délku ticha rovnu pěti (tj. při 20ms délce mikrosegmentu je nejdelší pauza uvnitř slova dlouhá nejvýše 100ms). Druhým prvkem majícím vliv na kvalitu určení hranice slova je předpokládaná hladina šumu. Tato hodnota popisuje procentuální intenzitu hluku z okolního prostředí. Vyšší hodnoty způsobují, že za promluvu nebudou považovány vzorky s malou intenzitou. Dalším důsledkem je vyšší citlivost na pauzy uvnitř jednotlivých slov. Příliš nízké hodnoty mohu naopak zapříčinit spojování několika slov v jeden celek. Pásmová filtrace Pásmová filtrace byla implementována dvěma způsoby. Prvním, a jak následně prokázaly testy i úspěšnějším postupem, je využití rychlé Fourierovy transformace pro rozdělení signálu do osmi pásem. Druhou metodou byla aplikace polyfázového filtru. Hlavním problémem tohoto řešení je, že filtr rozdělí vstupní signál do 32 pásem, ale pro další zpracování (rozpoznání pomocí neuronové sítě) je jich zapotřebí pouze osm. Tento nedostatek byl řešen sloučením čtyř sousedních pásem do jednoho. Výsledky získané tímto postupem však nebyly v porovnání s FFT natolik lepší, aby kompenzovaly jeho vysokou výpočetní náročnost Segmentace spektrální stopy Poté co je mikrosegment vstupního signálu rozdělen na osm pásem, je zapotřebí pro každé z nich stanovit charakteristiku. K tomuto účelu byla použita krátkodobá intenzita signálu. Tím je každý mikrosegment popsán vektorem osmi čísel. Problémem je, že klasifikovaná slova mají obecně různou délku a proto je počet mikrosegmentů proměnlivý. Při klasifikaci pomocí

8 XXVIII. ASR '2003 Seminar, Instruments and Control, Ostrava, May 6, neuronové sítě je však nutné, aby měla všechna slova stejně dlouhou reprezentaci. Toho bylo dosaženo použitím metody nazývané segmentace spektrální stopy. Spektrální stopou se nazývá spojnice koncových bodů vektorů příznaků. Protože není znám její skutečný průběh, je spektrální stopa aproximována mezi každými dvěma sousedními body lineárním úsekem. Poté je tato interpolovaná stopa rozdělena na N nových segmentů a je určeno N+1 nových příznakových vektorů, které tvoří nový obraz slova. Podle doporučení v [1] je před vlastní segmentací prováděno vyhlazení dlouhodobého spektra a jeho normalizace. Další pomocnou úpravou je vyhlazení amplitudové obálky. Rozpoznávání pomocí neuronové sítě Zřejmě nejlepších výsledků při klasifikaci je dnes dosahováno aplikací metod založených na skrytých Markovových modelech. Důvodem, proč byla zvolena neuronová siť je zejména relativní jednoduchost implementace a rychlost odezvy. Výhodnou je i možnost ukládat natrénovaný slovník a později jej načítat bez nutnosti nového učení. Pro účely rozpoznávání se jevila jako nejvhodnější dvouvrstvá síť s Kohonenovým učením. Na spodní vrstvu jsou přiváděna data získaná segmentací spektrální stopy. Neurony horní vrstvy tvoří reprezentaci rozpoznávaných slov. 5.2 Kontinuální promluva Na pojem kontinuální promluva lze nahlížet dvěma způsoby. Obvyklejší je za kontinuální považovat řeč ve formě běžného lidského dialogu, ve které nemají jednotlivá slova mezi sebou dostatečně dlouhou pauzu a mohou splývat v celek. Způsob řešení klasifikátoru pracujícího s tímto druhem promluvy je popsán v sekci a základním principem je využití akusticko-fonetické znalosti. Pro některé třídy aplikací lze za kontinuální považovat také posloupnost po sobě jdoucích izolovaných slov. Postup z provádějící rozpoznávání jednotlivých slov oddělených úseky ticha vychází z metody izolovaně za sebou vyslovených slov. Izolovaně vyslovovaná slova Základem klasifikace se stal postup použitý při rozpoznávaní izolovaných slov. Aby bylo zajištěno součastné snímání i zpracování vstupního signálu, pracuje algoritmus ve dvou paralelních vláknech. K dispozici jsou dvě nezávislé vyrovnávací paměti. Do jedné jsou data ukládána a součastně je prováděna klasifikace signálu uloženého v paměti druhé. Dojde-li k zaplnění vstupního bufferu, jsou role obou vyrovnávacích pamětí vzájemně zaměněny. Každému rozpoznávanému slovu je možné během procesu učení přiřadit akci (spuštění externího programu), která bude provedena v případě kladné detekce. Jednotlivým činnostem lze navíc přiřadit i minimální potřebnou míru jistoty, že slovo spojené s danou akcí bylo rozpoznáno správně. Tuto vlastnost je jistě vhodné použít u potenciálně nebezpečných příkazů (např. vymaž, ukonči, ), protože u kontinuální promluvy lze předpokládat, že na vstup klasifikátoru se dostanou i slova, která nejsou obsažena ve slovníku. Využití akusticko-fonetické znalosti Akusticko-fonetická znalost vyjadřuje vztah mezi akustickou informací a fonetickým přepisem vyslovené promluvy. V přístupu založeném na vzdálenosti je například možné nejprve popsat jednotlivé mikrosegmenty řečového signálu akustickými, popř. i fonetickými, příznaky a na jejich základě pak každý mikrosegment klasifikovat do malého počtu akustickofonetických kategorií. Sousední mikrosegmenty stejného typu pak lze spojovat do větších celků, tzv. fonetických segmentů, a tyto segmenty je možné v dalším kroku přesněji identifikovat, například porovnáním se slovníkem vzorových fonetických segmentů.

9 XXVIII. ASR '2003 Seminar, Instruments and Control, Ostrava, May 6, Postup, jenž je zde prezentován není s metodou akusticko-fonetických znalostí zcela totožný, je jí však inspirován. Společnou je oběma postupům snaha zařadit každý mikrosegment do některé z daných kategorií. Detekce počátku a konce slova tak, jak byla použita v případě klasifikace izolovaných slov je v případě kontinuální promluvy nepoužitelná (nedostatečná, respektive žádná pauza mezi slovy; nelze rozlišit energetické pauzy uprostřed slov od skutečných hranic). Proto jsou ze vstupního signálu klasifikovány pouze takové úseky, ve kterých hodnota energie řečového signálu neklesla pod danou úroveň šumu. Ke klasifikaci je opět použita síť s Kohonenovým učením. Množství neuronů výstupní vrstvy odpovídá počtu tříd, do kterých mohou být segmenty zařazeny (při experimentální implementaci bylo použito 50 tříd). Každé slovo je tedy charakterizováno vektorem tříd segmentů. Pro slova s různou délkou však tímto způsobem získáme různě dlouhé vektory tříd u = (u 1,u 2,,u m ) a v = (v 1,v 2,,v n ). To znesnadňuje další porovnávání a tím i celé rozpoznávaní. Jako řešení se nabízí výpočet vzdálenosti těchto vektorů pomocí vztahu d = r i= 1 u i v i, (8) kde r = min(m,n). Aby mělo smysl provádět výpočet vzdálenosti musí navíc platit, že se dimenze m a n obou vektorů nesmí výrazně lišit. Protože ze vstupního signálu nelze jednoznačně stanovit, kolik slov daný úsek promluvy obsahuje, je nutné neznámou promluvu klasifikovat jako řetězec několika referenčních promluv. Jedním ze způsobů, jak to provést, je postupně vybírat z vektoru tříd segmentů neznámé promluvy úseky vhodné délky a porovnávat, který z referenčních vektorů odpovídá danému úseku nejlépe. Menší rozdíly, způsobené kolísáním tempa řeči nebo nepřesným určením počátku a konce promluvy, lze eliminovat posunutím prvků referenčního vektoru doleva či doprava. Je-li k danému úseku nalezeno referenční slovo, aplikuje se stejný postup na nový úsek, který začíná v místě, kde skončilo předchozí porovnávání. 6 Závěr Rozpoznávání izolovaných slov popsané v 5.1 a na něj navazující klasifikaci izolovaně vyslovovaných povelů v kontinuální promluvě z lze podle dosažených výsledků prohlásit za úspěšné. Experimentální aplikace pracuje rychle a s vysokým procentem korektních rozpoznání. K jistému zpoždění dochází pouze tehdy, jsou-li povely vyslovovány rychle za sebou. Výsledky klasifikace kontinuální promluvy dosažené pomocí postupu byly zklamáním a tato metoda musí být ohodnocena jako neúspěšná. Při zpětném prozkoumání se jako chybné jevilo již zařazování mikrosegmentů do tříd pomocí neuronové sítě. Dlouhodobým cílem, jenž je sledován při návrhu a konstrukci systémů identifikace slov, je zabezpečit rozpoznávání jednotlivých slovních povelů bez omezení kladených na rychlost promluvy či intonaci řečníka. Přestože se tento úkol prozatím jeví jako nesplnitelný, nebyl nalezen důvod, který by dosažení tohoto cíle znemožňoval. To otevírá prostor pro další výzkum. Literatura ADVANTECH Co. Ltd. Advantech PC-Labcard User's Manual, Rev.1.10, Taiwan, Feb.,1993. BÁRTA R, KEDROŇ P. Analýza a syntéza zvuku. Diplomový projekt VŠB-TU Ostrava, Ostrava INTERNET. CS-VOICE. WWW stránka firmy FROG Systems s.r.o.

10 XXVIII. ASR '2003 Seminar, Instruments and Control, Ostrava, May 6, INTERNET. FONETIC. WWW stránka Jakuba Dadáka (Cortex Software), LAZZARO J. J. Mluvit stejně jako my. Bajt, 1992, č.4, s MAŘÍK V., ŠTĚPÁNKOVÁ O., LAŽANSKÝ J. a kol. Umělá inteligence. Díl 1. Academia, Praha 1993, 264 s. PSUTKA J. Komunikace s počítačem mluvenou řečí. Academia, Praha 1995, 287 s. REUSCH R., NIEDEN A. Programování zvukových karet, Magazin časopisu CHIP, 2. vydání, červenec SBORNÍK PŘEDNÁŠEK Analýza, syntéza a rozpoznávání řeči. ČSVTS, Praha 1985, 156 s. UHLÍŘ J., VÍCH R. Číslicová analýza a syntéza řeči. Prognostická studie. ČSAV, Praha 1985, 36 s. VONDRÁK, I. Umělá inteligence a neuronové sítě, Skriptum TUO, I.vydání, 1994.

Úvod do praxe stínového řečníka. Proces vytváření řeči

Úvod do praxe stínového řečníka. Proces vytváření řeči Úvod do praxe stínového řečníka Proces vytváření řeči 1 Proces vytváření řeči člověkem Fyzikální podstatou akustického (tedy i řečového) signálu je vlnění elastického prostředí v oboru slyšitelných frekvencí.

Více

Rozpoznávání izolovaných slov (malý slovník, např. číslovky, povely).

Rozpoznávání izolovaných slov (malý slovník, např. číslovky, povely). Rozpoznávání řeči Každý člověk má originální hlasové ústrojí a odlišný způsob artikulace, to se projevuje rozdílnou barvou hlasu, přízvukem, rychlostí řeči atd. I hlas jednoho řečníka je variabilní a závislý

Více

Úvod do zpracování signálů

Úvod do zpracování signálů 1 / 25 Úvod do zpracování signálů Karel Horák Rozvrh přednášky: 1. Spojitý a diskrétní signál. 2. Spektrum signálu. 3. Vzorkovací věta. 4. Konvoluce signálů. 5. Korelace signálů. 2 / 25 Úvod do zpracování

Více

Kepstrální analýza řečového signálu

Kepstrální analýza řečového signálu Semestrální práce Václav Brunnhofer Kepstrální analýza řečového signálu 1. Charakter řečového signálu Lidská řeč je souvislý, časově proměnný proces. Je nositelem určité informace od řečníka k posluchači

Více

Základy a aplikace digitálních. Katedra radioelektroniky (13137), blok B2, místnost 722

Základy a aplikace digitálních. Katedra radioelektroniky (13137), blok B2, místnost 722 Základy a aplikace digitálních modulací Josef Dobeš Katedra radioelektroniky (13137), blok B2, místnost 722 dobes@fel.cvut.cz 6. října 2014 České vysoké učení technické v Praze, Fakulta elektrotechnická

Více

Kapitola 1. Signály a systémy. 1.1 Klasifikace signálů

Kapitola 1. Signály a systémy. 1.1 Klasifikace signálů Kapitola 1 Signály a systémy 1.1 Klasifikace signálů Signál představuje fyzikální vyjádření informace, obvykle ve formě okamžitých hodnot určité fyzikální veličiny, která je funkcí jedné nebo více nezávisle

Více

5. Umělé neuronové sítě. Neuronové sítě

5. Umělé neuronové sítě. Neuronové sítě Neuronové sítě Přesný algoritmus práce přírodních neuronových systémů není doposud znám. Přesto experimentální výsledky na modelech těchto systémů dávají dnes velmi slibné výsledky. Tyto systémy, včetně

Více

SIGNÁLY A LINEÁRNÍ SYSTÉMY

SIGNÁLY A LINEÁRNÍ SYSTÉMY SIGNÁLY A LINEÁRNÍ SYSTÉMY prof. Ing. Jiří Holčík, CSc. holcik@iba.muni.cziba.muni.cz II. SIGNÁLY ZÁKLADNÍ POJMY SIGNÁL - DEFINICE SIGNÁL - DEFINICE Signál je jev fyzikální, chemické, biologické, ekonomické

Více

Osnova. Idea ASK/FSK/PSK ASK Amplitudové... Strana 1 z 16. Celá obrazovka. Konec Základy radiotechniky

Osnova. Idea ASK/FSK/PSK ASK Amplitudové... Strana 1 z 16. Celá obrazovka. Konec Základy radiotechniky Pulsní kódová modulace, amplitudové, frekvenční a fázové kĺıčování Josef Dobeš 24. října 2006 Strana 1 z 16 Základy radiotechniky 1. Pulsní modulace Strana 2 z 16 Pulsní šířková modulace (PWM) PAM, PPM,

Více

Základní komunikační řetězec

Základní komunikační řetězec STŘEDNÍ PRŮMYSLOVÁ ŠKOLA NA PROSEKU EVROPSKÝ SOCIÁLNÍ FOND Základní komunikační řetězec PRAHA & EU INVESTUJEME DO VAŠÍ BUDOUCNOSTI Podpora kvality výuky informačních a telekomunikačních technologií ITTEL

Více

SIGNÁLY A LINEÁRNÍ SYSTÉMY

SIGNÁLY A LINEÁRNÍ SYSTÉMY SIGNÁLY A LINEÁRNÍ SYSTÉMY prof. Ing. Jiří Holčík, CSc. holcik@iba.muni.cz II. SIGNÁLY ZÁKLADNÍ POJMY SIGNÁL - DEFINICE SIGNÁL - DEFINICE Signál je jev fyzikální, chemické, biologické, ekonomické či jiné

Více

Pokročilé operace s obrazem

Pokročilé operace s obrazem Získávání a analýza obrazové informace Pokročilé operace s obrazem Biofyzikální ústav Lékařské fakulty Masarykovy univerzity Brno prezentace je součástí projektu FRVŠ č.2487/2011 (BFÚ LF MU) Získávání

Více

Algoritmy a struktury neuropočítačů ASN P8b

Algoritmy a struktury neuropočítačů ASN P8b Algoritmy a struktury neuropočítačů ASN P8b Úvod - přirozená řeč jako zvukový signál Základní pojmy z fonetiky Charakteristiky mluvené řeči Přirozená řeč jako zvukový signál Řeč (speech) - komplex technických,

Více

31SCS Speciální číslicové systémy Antialiasing

31SCS Speciální číslicové systémy Antialiasing ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE 2006/2007 31SCS Speciální číslicové systémy Antialiasing Vypracoval: Ivo Vágner Email: Vagnei1@seznam.cz 1/7 Převod analogového signálu na digitální Složité operace,

Více

KTE/TEVS - Rychlá Fourierova transformace. Pavel Karban. Katedra teoretické elektrotechniky Fakulta elektrotechnická Západočeská univerzita v Plzni

KTE/TEVS - Rychlá Fourierova transformace. Pavel Karban. Katedra teoretické elektrotechniky Fakulta elektrotechnická Západočeská univerzita v Plzni KTE/TEVS - Rychlá Fourierova transformace Pavel Karban Katedra teoretické elektrotechniky Fakulta elektrotechnická Západočeská univerzita v Plzni 10.11.011 Outline 1 Motivace FT Fourierova transformace

Více

STANOVENÍ CHARAKTERU SEGMENTU ŘEČI S VYUŽITÍM REÁLNÉHO KEPSTRA

STANOVENÍ CHARAKTERU SEGMENTU ŘEČI S VYUŽITÍM REÁLNÉHO KEPSTRA STANOVENÍ CHARAKTERU SEGMENTU ŘEČI S VYUŽITÍM REÁLNÉHO KEPSTRA Oldřich Horák Univerzita Pardubice, Fakulta ekonomicko-správní, Ústav systémového inženýrství a informatiky Abstract: The extraction of the

Více

3 METODY PRO POTLAČENÍ ŠUMU U ŘE- ČOVÉHO SIGNÁLU

3 METODY PRO POTLAČENÍ ŠUMU U ŘE- ČOVÉHO SIGNÁLU 3 METODY PRO POTLAČENÍ ŠUMU U ŘE- ČOVÉHO SIGNÁLU V současné době se pro potlačení šumu u řečového signálu používá mnoho různých metod. Jedná se například o metody spektrálního odečítání, Wienerovy filtrace,

Více

1. Vlastnosti diskretních a číslicových metod zpracování signálů... 15

1. Vlastnosti diskretních a číslicových metod zpracování signálů... 15 Úvodní poznámky... 11 1. Vlastnosti diskretních a číslicových metod zpracování signálů... 15 1.1 Základní pojmy... 15 1.2 Aplikační oblasti a etapy zpracování signálů... 17 1.3 Klasifikace diskretních

Více

A/D převodníky - parametry

A/D převodníky - parametry A/D převodníky - parametry lineární kvantování -(kritériem je jednoduchost kvantovacího obvodu), parametry ADC : statické odstup signálu od kvantizačního šumu SQNR, efektivní počet bitů n ef, dynamický

Více

SIGNÁLY A SOUSTAVY, SIGNÁLY A SYSTÉMY

SIGNÁLY A SOUSTAVY, SIGNÁLY A SYSTÉMY SIGNÁLY A SOUSTAVY, SIGNÁLY A SYSTÉMY TEMATICKÉ OKRUHY Signály se spojitým časem Základní signály se spojitým časem (základní spojité signály) Jednotkový skok σ (t), jednotkový impuls (Diracův impuls)

Více

Komprese dat Obsah. Komprese videa. Radim Farana. Podklady pro výuku. Komprese videa a zvuku. Komprese MPEG. Komprese MP3.

Komprese dat Obsah. Komprese videa. Radim Farana. Podklady pro výuku. Komprese videa a zvuku. Komprese MPEG. Komprese MP3. Komprese dat Radim Farana Podklady pro výuku Obsah Komprese videa a zvuku. Komprese MPEG. Komprese MP3. Komprese videa Velký objem přenášených dat Typický televizní signál - běžná evropská norma pracuje

Více

Trénování sítě pomocí učení s učitelem

Trénování sítě pomocí učení s učitelem Trénování sítě pomocí učení s učitelem! předpokládá se, že máme k dispozici trénovací množinu, tj. množinu P dvojic [vstup x p, požadovaný výstup u p ]! chceme nastavit váhy a prahy sítě tak, aby výstup

Více

ZÁKLADY AUTOMATICKÉHO ŘÍZENÍ

ZÁKLADY AUTOMATICKÉHO ŘÍZENÍ VYSOKÁ ŠKOLA BÁŇSKÁ TECHNICKÁ UNIVERZITA OSTRAVA FAKULTA STROJNÍ ZÁKLADY AUTOMATICKÉHO ŘÍZENÍ 8. týden doc. Ing. Renata WAGNEROVÁ, Ph.D. Ostrava 2013 doc. Ing. Renata WAGNEROVÁ, Ph.D. Vysoká škola báňská

Více

ZÁKLADY PROGRAMOVÁNÍ. Mgr. Vladislav BEDNÁŘ 2014 7.4 13/14

ZÁKLADY PROGRAMOVÁNÍ. Mgr. Vladislav BEDNÁŘ 2014 7.4 13/14 ZÁKLADY PROGRAMOVÁNÍ Mgr. Vladislav BEDNÁŘ 2014 7.4 13/14 Co je vhodné vědět, než si vybereme programovací jazyk a začneme programovat roboty. 1 / 13 0:40 Implementace Umělá inteligence (UI) Umělá inteligence

Více

Úloha - rozpoznávání číslic

Úloha - rozpoznávání číslic Úloha - rozpoznávání číslic Vojtěch Franc, Tomáš Pajdla a Tomáš Svoboda http://cmp.felk.cvut.cz 27. listopadu 26 Abstrakt Podpůrný text pro cvičení předmětu X33KUI. Vysvětluje tři způsoby rozpoznávání

Více

VY_32_INOVACE_ENI_2.MA_05_Modulace a Modulátory

VY_32_INOVACE_ENI_2.MA_05_Modulace a Modulátory Číslo projektu Číslo materiálu CZ.1.07/1.5.00/34.0581 VY_32_INOVACE_ENI_2.MA_05_Modulace a Modulátory Název školy Střední odborná škola a Střední odborné učiliště, Dubno Autor Ing. Miroslav Krýdl Tematická

Více

1. Základy teorie přenosu informací

1. Základy teorie přenosu informací 1. Základy teorie přenosu informací Úvodem citát o pojmu informace Informace je název pro obsah toho, co se vymění s vnějším světem, když se mu přizpůsobujeme a působíme na něj svým přizpůsobováním. N.

Více

Teorie systémů TES 3. Sběr dat, vzorkování

Teorie systémů TES 3. Sběr dat, vzorkování Evropský sociální fond. Praha & EU: Investujeme do vaší budoucnosti. Teorie systémů TES 3. Sběr dat, vzorkování ZS 2011/2012 prof. Ing. Petr Moos, CSc. Ústav informatiky a telekomunikací Fakulta dopravní

Více

Lineární a adaptivní zpracování dat. 2. SYSTÉMY a jejich popis v časové doméně a frekvenční doméně

Lineární a adaptivní zpracování dat. 2. SYSTÉMY a jejich popis v časové doméně a frekvenční doméně Lineární a adaptivní zpracování dat 2. SYSTÉMY a jejich popis v časové doméně a frekvenční doméně Daniel Schwarz Investice do rozvoje vzdělávání Osnova Opakování: signály a systémy Vlastnosti systémů Systémy

Více

MĚŘENÍ A ANALÝZA ELEKTROAKUSTICKÝCH SOUSTAV NA MODELECH. Petr Kopecký ČVUT, Fakulta elektrotechnická, Katedra Radioelektroniky

MĚŘENÍ A ANALÝZA ELEKTROAKUSTICKÝCH SOUSTAV NA MODELECH. Petr Kopecký ČVUT, Fakulta elektrotechnická, Katedra Radioelektroniky MĚŘENÍ A ANALÝZA ELEKTROAKUSTICKÝCH SOUSTAV NA MODELECH Petr Kopecký ČVUT, Fakulta elektrotechnická, Katedra Radioelektroniky Při návrhu elektroakustických soustav, ale i jiných systémů, je vhodné nejprve

Více

Zvuková karta. Zvuk a zvuková zařízení. Vývoj, typy, vlastnosti

Zvuková karta. Zvuk a zvuková zařízení. Vývoj, typy, vlastnosti Zvuk a zvuková zařízení. Vývoj, typy, vlastnosti Zvuková karta Počítač řady PC je ve své standardní konfiguraci vybaven malým reproduktorem označovaným jako PC speaker. Tento reproduktor je součástí skříně

Více

8. Sběr a zpracování technologických proměnných

8. Sběr a zpracování technologických proměnných 8. Sběr a zpracování technologických proměnných Účel: dodat v částečně předzpracovaném a pro další použití vhodném tvaru ucelenou informaci o procesu pro následnou analyzu průběhu procesu a pro rozhodování

Více

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze Dobývání znalostí Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze Dobývání znalostí Pravděpodobnost a učení Doc. RNDr. Iveta Mrázová,

Více

ADA Semestrální práce. Harmonické modelování signálů

ADA Semestrální práce. Harmonické modelování signálů České vysoké učení technické v Praze ADA Semestrální práce Harmonické modelování signálů Jiří Kořínek 31.12.2005 1. Zadání Proveďte rozklad signálu do harmonických komponent (řeč, hudba). Syntetizujte

Více

Analýza a zpracování digitálního obrazu

Analýza a zpracování digitálního obrazu Analýza a zpracování digitálního obrazu Úlohy strojového vidění lze přibližně rozdělit do sekvence čtyř funkčních bloků: Předzpracování veškerých obrazových dat pomocí filtrací (tj. transformací obrazové

Více

ZÁKLADY AUTOMATICKÉHO ŘÍZENÍ

ZÁKLADY AUTOMATICKÉHO ŘÍZENÍ VYSOKÁ ŠKOLA BÁŇSKÁ TECHNICKÁ UNIVERZITA OSTRAVA FAKULTA STROJNÍ ZÁKLADY AUTOMATICKÉHO ŘÍZENÍ 1. týden doc. Ing. Renata WAGNEROVÁ, Ph.D. Ostrava 2013 doc. Ing. Renata WAGNEROVÁ, Ph.D. Vysoká škola báňská

Více

Grafika na počítači. Bc. Veronika Tomsová

Grafika na počítači. Bc. Veronika Tomsová Grafika na počítači Bc. Veronika Tomsová Proces zpracování obrazu Proces zpracování obrazu 1. Snímání obrazu 2. Digitalizace obrazu převod spojitého signálu na matici čísel reprezentující obraz 3. Předzpracování

Více

íta ové sít baseband narrowband broadband

íta ové sít baseband narrowband broadband Každý signál (diskrétní i analogový) vyžaduje pro přenos určitou šířku pásma: základní pásmo baseband pro přenos signálu s jednou frekvencí (není transponován do jiné frekvence) typicky LAN úzké pásmo

Více

Lineární a adaptivní zpracování dat. 2. SYSTÉMY a jejich popis v časové doméně a frekvenční doméně

Lineární a adaptivní zpracování dat. 2. SYSTÉMY a jejich popis v časové doméně a frekvenční doméně Lineární a adaptivní zpracování dat 2. SYSTÉMY a jejich popis v časové doméně a frekvenční doméně Daniel Schwarz Investice do rozvoje vzdělávání Osnova Opakování: signály a systémy Vlastnosti systémů Systémy

Více

9. PRINCIPY VÍCENÁSOBNÉHO VYUŽITÍ PŘENOSOVÝCH CEST

9. PRINCIPY VÍCENÁSOBNÉHO VYUŽITÍ PŘENOSOVÝCH CEST 9. PRINCIPY VÍCENÁSOBNÉHO VYUŽITÍ PŘENOSOVÝCH CEST Modulace tvoří základ bezdrátového přenosu informací na velkou vzdálenost. V minulosti se ji využívalo v telekomunikacích při vícenásobném využití přenosových

Více

TECHNICKÁ UNIVERZITA V LIBERCI

TECHNICKÁ UNIVERZITA V LIBERCI TECHNICKÁ UNIVERZITA V LIBERCI Fakulta mechatroniky, informatiky a mezioborových studií Základní pojmy diagnostiky a statistických metod vyhodnocení Učební text Ivan Jaksch Liberec 2012 Materiál vznikl

Více

Algoritmizace diskrétních. Ing. Michal Dorda, Ph.D.

Algoritmizace diskrétních. Ing. Michal Dorda, Ph.D. Algoritmizace diskrétních simulačních modelů Ing. Michal Dorda, Ph.D. 1 Úvodní poznámky Při programování simulačních modelů lze hlavní dílčí problémy shrnout do následujících bodů: 1) Zachycení statických

Více

Využití neuronové sítě pro identifikaci realného systému

Využití neuronové sítě pro identifikaci realného systému 1 Portál pre odborné publikovanie ISSN 1338-0087 Využití neuronové sítě pro identifikaci realného systému Pišan Radim Elektrotechnika 20.06.2011 Identifikace systémů je proces, kdy z naměřených dat můžeme

Více

Klasifikace Landau-Kleffnerova syndromu

Klasifikace Landau-Kleffnerova syndromu Klasifikace Landau-Kleffnerova syndromu malých dětí 1. Abstrakt Petr Zlatník ČVUT FEL, K13131 Katedra teorie obvodů Tento příspěvěk pojednává o klasifikaci Landau-Kleffnerova syndromu, který se projevuje

Více

Číslicové zpracování signálů a Fourierova analýza.

Číslicové zpracování signálů a Fourierova analýza. Číslicové zpracování signálů a Fourierova analýza www.kme.zcu.cz/kmet/exm 1 Obsah prezentace 1. Úvod a motivace 2. Data v časové a frekvenční oblasti 3. Fourierova analýza teoreticky 4. Fourierova analýza

Více

Semestrální práce: Rozpoznání hláskované řeči a převedení na text

Semestrální práce: Rozpoznání hláskované řeči a převedení na text VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ Fakulta strojního inženýrství Ústav mechaniky těles, mechatroniky a biomechaniky Technická 2, Brno 616 69 RSZ Základy zpracování signálu Semestrální práce: Rozpoznání hláskované

Více

Algoritmy a struktury neuropočítačů ASN - P11

Algoritmy a struktury neuropočítačů ASN - P11 Aplikace UNS při rozpoznání obrazů Základní úloha segmentace obrazu rozdělení obrazu do několika významných oblastí klasifikační úloha, clusterová analýza target Metody Kohonenova metoda KSOM Kohonenova

Více

A2M31RAT Řečový signál a jeho základní charakteristiky Model vzniku řeči. Digitalizace a základní kódovací strategie

A2M31RAT Řečový signál a jeho základní charakteristiky Model vzniku řeči. Digitalizace a základní kódovací strategie A2M31RAT Řečový signál a jeho základní charakteristiky Model vzniku řeči. Digitalizace a základní kódovací strategie Doc. Ing. Petr Pollák, CSc. Míst. 461, email: pollak@fel.cvut.cz http://noel.feld.cvut.cz/vyu/a2m31rat

Více

Hodnocení parametrů signálu AE při únavovém zatěžování tří typů konstrukčních materiálů. Vypracoval: Kolář Lukáš

Hodnocení parametrů signálu AE při únavovém zatěžování tří typů konstrukčních materiálů. Vypracoval: Kolář Lukáš Hodnocení parametrů signálu AE při únavovém zatěžování tří typů konstrukčních materiálů Vypracoval: Kolář Lukáš Cíl práce: Analýza současného stavu testování metodou AE Návrh experimentálního zajištění

Více

Klasifikace předmětů a jevů

Klasifikace předmětů a jevů Klasifikace předmětů a jevů 1. Úvod Rozpoznávání neboli klasifikace je základní znak lidské činnosti. Rozpoznávání (klasifikace) předmětů a jevů spočívá v jejich zařazování do jednotlivých tříd. Třídou

Více

Algoritmy a struktury neuropočítačů ASN - P10. Aplikace UNS v biomedicíně

Algoritmy a struktury neuropočítačů ASN - P10. Aplikace UNS v biomedicíně Aplikace UNS v biomedicíně aplikace v medicíně postup při zpracování úloh Aplikace UNS v medicíně Důvod: nalezení exaktnějších, levnějších a snadnějších metod určování diagnóz pro lékaře nalezení šetrnějších

Více

Rozdělování dat do trénovacích a testovacích množin

Rozdělování dat do trénovacích a testovacích množin Rozdělování dat do trénovacích a testovacích množin Marcel Jiřina Rozpoznávání je důležitou metodou při zpracování reálných úloh. Rozpoznávání je definováno dvěma kroky a to pořízením dat o reálném rozpoznávaném

Více

Direct Digital Synthesis (DDS)

Direct Digital Synthesis (DDS) ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE Fakulta elektrotechnická Ing. Radek Sedláček, Ph.D., katedra měření K13138 Direct Digital Synthesis (DDS) Přímá číslicová syntéza Tyto materiály vznikly za podpory

Více

Signál v čase a jeho spektrum

Signál v čase a jeho spektrum Signál v čase a jeho spektrum Signály v časovém průběhu (tak jak je vidíme na osciloskopu) můžeme dělit na periodické a neperiodické. V obou případech je lze popsat spektrálně určit jaké kmitočty v sobě

Více

Modelování systémů a procesů (11MSP) Bohumil Kovář, Jan Přikryl, Miroslav Vlček. 8. přednáška 11MSP pondělí 20. dubna 2015

Modelování systémů a procesů (11MSP) Bohumil Kovář, Jan Přikryl, Miroslav Vlček. 8. přednáška 11MSP pondělí 20. dubna 2015 Modelování systémů a procesů (11MSP) Bohumil Kovář, Jan Přikryl, Miroslav Vlček Ústav aplikované matematiky ČVUT v Praze, Fakulta dopravní 8. přednáška 11MSP pondělí 20. dubna 2015 verze: 2015-04-14 12:31

Více

Vlastnosti a modelování aditivního

Vlastnosti a modelování aditivního Vlastnosti a modelování aditivního bílého šumu s normálním rozdělením kacmarp@fel.cvut.cz verze: 0090913 1 Bílý šum s normálním rozdělením V této kapitole se budeme zabývat reálným gaussovským šumem n(t),

Více

VY_32_INOVACE_E 15 03

VY_32_INOVACE_E 15 03 Název a adresa školy: Střední škola průmyslová a umělecká, Opava, příspěvková organizace, Praskova 399/8, Opava, 746 01 Název operačního programu: OP Vzdělávání pro konkurenceschopnost, oblast podpory

Více

Základy umělé inteligence

Základy umělé inteligence Základy umělé inteligence Úvod Základy umělé inteligence - úvod. Vlasta Radová, ZČU, katedra kybernetiky 1 Zavedení pojmu umělá inteligence Inteligence je schopnost získávat a aplikovat vědomosti a tedy

Více

Lineární a adaptivní zpracování dat. 3. SYSTÉMY a jejich popis ve frekvenční oblasti

Lineární a adaptivní zpracování dat. 3. SYSTÉMY a jejich popis ve frekvenční oblasti Lineární a adaptivní zpracování dat 3. SYSTÉMY a jejich popis ve frekvenční oblasti Daniel Schwarz Osnova Opakování: systémy a jejich popis v časové oblasti Fourierovy řady Frekvenční charakteristika systémů

Více

Biofyzikální ústav LF MU Brno. jarní semestr 2011

Biofyzikální ústav LF MU Brno. jarní semestr 2011 pro obor Ošetřovatelská péče v gerontologii Biofyzikální ústav LF MU Brno jarní semestr 2011 Obsah letmý dotyk teorie systémů klasifikace a analýza biosignálů Co je signál? Co je biosignál? Co si počít

Více

U Úvod do modelování a simulace systémů

U Úvod do modelování a simulace systémů U Úvod do modelování a simulace systémů Vyšetřování rozsáhlých soustav mnohdy nelze provádět analytickým výpočtem.často je nutné zkoumat chování zařízení v mezních situacích, do kterých se skutečné zařízení

Více

Měření dat Filtrace dat, Kalmanův filtr

Měření dat Filtrace dat, Kalmanův filtr Měření dat Filtrace dat, Matematické metody pro ITS (11MAMY) Jan Přikryl Ústav aplikované matematiky ČVUT v Praze, Fakulta dopravní 3. přednáška 11MAMY čtvrtek 28. února 2018 verze: 2018-03-21 16:45 Obsah

Více

Analogově číslicové převodníky

Analogově číslicové převodníky Verze 1 Analogově číslicové převodníky Doplněná inovovaná přednáška Zpracoval: Vladimír Michna Pracoviště: Katedra textilních a jednoúčelových strojů TUL Tento materiál vznikl jako součást projektu In-TECH

Více

doc. Dr. Ing. Elias TOMEH Elias Tomeh / Snímek 1

doc. Dr. Ing. Elias TOMEH   Elias Tomeh / Snímek 1 doc. Dr. Ing. Elias TOMEH e-mail: elias.tomeh@tul.cz Elias Tomeh / Snímek 1 Frekvenční spektrum Dělení frekvenčního pásma (počet čar) Průměrování Časovou váhovou funkci Elias Tomeh / Snímek 2 Vzorkovací

Více

Jasové transformace. Karel Horák. Rozvrh přednášky:

Jasové transformace. Karel Horák. Rozvrh přednášky: 1 / 23 Jasové transformace Karel Horák Rozvrh přednášky: 1. Úvod. 2. Histogram obrazu. 3. Globální jasová transformace. 4. Lokální jasová transformace. 5. Bodová jasová transformace. 2 / 23 Jasové transformace

Více

Transformace obrazu Josef Pelikán KSVI MFF UK Praha

Transformace obrazu Josef Pelikán KSVI MFF UK Praha Transformace obrazu 99725 Josef Pelikán KSVI MFF UK Praha email: Josef.Pelikan@mff.cuni.cz WWW: http://cgg.ms.mff.cuni.cz/~pepca/ Transformace 2D obrazu dekorelace dat potlačení závislosti jednotlivých

Více

Klasifikace hudebních stylů

Klasifikace hudebních stylů Klasifikace hudebních stylů Martin Šimonovský (mys7@seznam.cz) Rozpoznávání hudby úloha z oblasti DSP klasifikace dle hudebních stylů

Více

Spektrální analýza a diskrétní Fourierova transformace. Honza Černocký, ÚPGM

Spektrální analýza a diskrétní Fourierova transformace. Honza Černocký, ÚPGM Spektrální analýza a diskrétní Fourierova transformace Honza Černocký, ÚPGM Povídání o cosinusovce 2 Argument cosinusovky 0 2p a pak každé 2p perioda 3 Cosinusovka s diskrétním časem Úkol č. 1: vyrobit

Více

A7B31ZZS 4. PŘEDNÁŠKA 13. října 2014

A7B31ZZS 4. PŘEDNÁŠKA 13. října 2014 A7B31ZZS 4. PŘEDNÁŠKA 13. října 214 A-D převod Vzorkování aliasing vzorkovací teorém Kvantování Analýza reálných signálů v časové oblasti řečové signály biologické signály ---> x[n] Analogově-číslicový

Více

Kybernetika a umělá inteligence, cvičení 10/11

Kybernetika a umělá inteligence, cvičení 10/11 Kybernetika a umělá inteligence, cvičení 10/11 Program 1. seminární cvičení: základní typy klasifikátorů a jejich princip 2. počítačové cvičení: procvičení na problému rozpoznávání číslic... body za aktivitu

Více

fluktuace jak dob trvání po sobě jdoucích srdečních cyklů, tak hodnot Heart Rate Variability) je jev, který

fluktuace jak dob trvání po sobě jdoucích srdečních cyklů, tak hodnot Heart Rate Variability) je jev, který BIOLOGICKÉ A LÉKAŘSKÉ SIGNÁLY VI. VARIABILITA SRDEČNÍHO RYTMU VARIABILITA SRDEČNÍHO RYTMU VARIABILITA SRDEČNÍHO RYTMU, tj. fluktuace jak dob trvání po sobě jdoucích srdečních cyklů, tak hodnot okamžité

Více

Umělá inteligence a rozpoznávání

Umělá inteligence a rozpoznávání Václav Matoušek KIV e-mail: matousek@kiv.zcu.cz 0-1 Sylabus předmětu: Datum Náplň přednášky 11. 2. Úvod, historie a vývoj UI, základní problémové oblasti a typy úloh, aplikace UI, příklady inteligentních

Více

Předmět A3B31TES/Př. 13

Předmět A3B31TES/Př. 13 Předmět A3B31TES/Př. 13 PS 1 1 Katedra teorie obvodů, místnost č. 523, blok B2 Přednáška 13: Kvantování, modulace, stavový popis PS Předmět A3B31TES/Př. 13 květen 2015 1 / 28 Obsah 1 Kvantování 2 Modulace

Více

Zvuk a jeho vlastnosti

Zvuk a jeho vlastnosti PEF MZLU v Brně 9. října 2008 Zvuk obecně podélné (nebo příčné) mechanické vlnění v látkovém prostředí, které je schopno vyvolat v lidském uchu sluchový vjem. frekvence leží v rozsahu přibližně 20 Hz až

Více

4.2. Modulátory a směšovače

4.2. Modulátory a směšovače Projekt: Inovace oboru Mechatronik pro Zlínský kraj Registrační číslo: CZ.1.07/1.1.08/03.0009 4.2. Modulátory a směšovače 4.2.1 Modulace V přenosové technice potřebujeme přenést signály na velké vzdálenosti

Více

Úvod do praxe stínového řečníka. Automatické rozpoznávání řeči

Úvod do praxe stínového řečníka. Automatické rozpoznávání řeči Úvod do praxe stínového řečníka Automatické rozpoznávání řeči Systém rozpoznávání řeči Řečník akustický řečový signál Akustická analýza O Akustický model Jazykový model p( O W) PW ( ) Dekodér W^ rozpoznaná

Více

ZPRACOVÁNÍ SIGNÁLŮ Z MECHANICKÝCH. Jiří Tůma

ZPRACOVÁNÍ SIGNÁLŮ Z MECHANICKÝCH. Jiří Tůma ZPRACOVÁNÍ SIGNÁLŮ Z MECHANICKÝCH SYSTÉMŮ UŽITÍM FFT Jiří Tůma Štramberk 1997 ii Anotace Cílem této knihy je systematicky popsat metody analýzy signálů z mechanických systémů a strojních zařízení. Obsahem

Více

Flexibilita jednoduché naprogramování a přeprogramování řídícího systému

Flexibilita jednoduché naprogramování a přeprogramování řídícího systému Téma 40 Jiří Cigler Zadání Číslicové řízení. Digitalizace a tvarování. Diskrétní systémy a jejich vlastnosti. Řízení diskrétních systémů. Diskrétní popis spojité soustavy. Návrh emulací. Nelineární řízení.

Více

Quantization of acoustic low level signals. David Bursík, Miroslav Lukeš

Quantization of acoustic low level signals. David Bursík, Miroslav Lukeš KVANTOVÁNÍ ZVUKOVÝCH SIGNÁLŮ NÍZKÉ ÚROVNĚ Abstrakt Quantization of acoustic low level signals David Bursík, Miroslav Lukeš Při testování kvality A/D převodníků se používají nejrůznější testovací signály.

Více

základní vlastnosti, používané struktury návrhové prostředky MATLAB problém kvantování koeficientů

základní vlastnosti, používané struktury návrhové prostředky MATLAB problém kvantování koeficientů A0M38SPP - Signálové procesory v praxi - přednáška 4 2 Číslicové filtry typu FIR a IIR definice operace filtrace základní rozdělení FIR, IIR základní vlastnosti, používané struktury filtrů návrhové prostředky

Více

Proudové šifry a posuvné registry s lineární zpětnou vazbou

Proudové šifry a posuvné registry s lineární zpětnou vazbou Proudové šifry a posuvné registry s lineární zpětnou vazbou Andrew Kozlík KA MFF UK Proudové šifry Bloková šifra Šifruje velké bloky otevřeného textu. Bloky mají pevnou délku. Velké znamená, že je prakticky

Více

Vyhledávání. doc. Mgr. Jiří Dvorský, Ph.D. Katedra informatiky Fakulta elektrotechniky a informatiky VŠB TU Ostrava. Prezentace ke dni 21.

Vyhledávání. doc. Mgr. Jiří Dvorský, Ph.D. Katedra informatiky Fakulta elektrotechniky a informatiky VŠB TU Ostrava. Prezentace ke dni 21. Vyhledávání doc. Mgr. Jiří Dvorský, Ph.D. Katedra informatiky Fakulta elektrotechniky a informatiky VŠB TU Ostrava Prezentace ke dni 21. září 2018 Jiří Dvorský (VŠB TUO) Vyhledávání 242 / 433 Osnova přednášky

Více

IDENTIFIKACE ŘEČOVÉ AKTIVITY V RUŠENÉM ŘEČOVÉM SIGNÁLU

IDENTIFIKACE ŘEČOVÉ AKTIVITY V RUŠENÉM ŘEČOVÉM SIGNÁLU VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY FAKULTA ELEKTROTECHNIKY A KOMUNIKAČNÍCH TECHNOLOGIÍ ÚSTAV TELEKOMUNIKACÍ FACULTY OF ELECTRICAL ENGINEERING AND COMMUNICATION DEPARTMENT OF TELECOMMUNICATIONS

Více

Motivace příklad použití lokace radarového echa Význam korelace Popis náhodných signálů číselné charakteristiky

Motivace příklad použití lokace radarového echa Význam korelace Popis náhodných signálů číselné charakteristiky A0M38SPP - Signálové procesory v praxi - přednáška 7 2 Motivace příklad použití lokace radarového echa Význam korelace Popis náhodných signálů číselné charakteristiky (momenty) Matematická definice korelační

Více

ANALÝZA A KLASIFIKACE DAT

ANALÝZA A KLASIFIKACE DAT ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc. INVESTICE Institut DO biostatistiky ROZVOJE VZDĚLÁVÁNÍ a analýz LITERATURA Holčík, J.: přednáškové prezentace Holčík, J.: Analýza a klasifikace signálů.

Více

DUM 19 téma: Digitální regulátor výklad

DUM 19 téma: Digitální regulátor výklad DUM 19 téma: Digitální regulátor výklad ze sady: 03 Regulátor ze šablony: 01 Automatizační technika I Určeno pro 4. ročník vzdělávací obor: 26-41-M/01 Elektrotechnika ŠVP automatizační technika Vzdělávací

Více

ANALÝZA A KLASIFIKACE DAT

ANALÝZA A KLASIFIKACE DAT ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc. INVESTICE Institut DO biostatistiky ROZVOJE VZDĚLÁVÁNÍ a analýz III. PŘÍZNAKOVÁ KLASIFIKACE - ÚVOD PŘÍZNAKOVÝ POPIS Příznakový obraz x zpracovávaných

Více

MATLAB PRO PODPORU VÝUKY KOMUNIKAČNÍCH SYSTÉMŮ

MATLAB PRO PODPORU VÝUKY KOMUNIKAČNÍCH SYSTÉMŮ MATLAB PRO PODPORU VÝUKY KOMUNIKAČNÍCH SYSTÉMŮ Aneta Coufalíková, Markéta Smejkalová Mazálková Univerzita obrany Katedra Komunikačních a informačních systémů Matlab ve výuce V rámci modernizace výuky byl

Více

Algoritmy a struktury neuropočítačů ASN P9 SVM Support vector machines Support vector networks (Algoritmus podpůrných vektorů)

Algoritmy a struktury neuropočítačů ASN P9 SVM Support vector machines Support vector networks (Algoritmus podpůrných vektorů) Algoritmy a struktury neuropočítačů ASN P9 SVM Support vector machines Support vector networks (Algoritmus podpůrných vektorů) Autor: Vladimir Vapnik Vapnik, V. The Nature of Statistical Learning Theory.

Více

7 Další. úlohy analýzy řeči i a metody

7 Další. úlohy analýzy řeči i a metody Pokročilé metody rozpoznávánířeči Přednáška 7 Další úlohy analýzy řeči i a metody jejich řešení Výsledky rozpoznávání (slovník k 413k) frantisek_vlas 91.92( 90.18) [H= 796, D= 10, S= 60, I= 15, N=866,

Více

Automatizace je proces při němž je řídicí funkce člověka nahrazována činností

Automatizace je proces při němž je řídicí funkce člověka nahrazována činností Automatizace je proces při němž je řídicí funkce člověka nahrazována činností různých přístrojů a zařízení. (Mechanizace, Automatizace, Komplexní automatizace) Kybernetika je Věda, která zkoumá obecné

Více

Vzorkování. Je-li posloupnost diracových impulzů s periodou T S : Pak časová posloupnost diskrétních vzorků bude:

Vzorkování. Je-li posloupnost diracových impulzů s periodou T S : Pak časová posloupnost diskrétních vzorků bude: Vzorkování Vzorkování je převodem spojitého signálu na diskrétní. Lze si ho představit jako násobení sledu diracových impulzů (impulzů jednotkové plochy a nulové délky) časovým průběhem vzorkovaného signálu.

Více

Analýza a zpracování signálů

Analýza a zpracování signálů Analýza a zpracování ů Digital Signal Processing disciplína, která nám umožňuje nahradit (v případě že nezpracováváme vf y) obvody, dříve složené z rezistorů a kapacitorů, dvěma antialiasingovými filtry,

Více

Algoritmy a struktury neuropočítačů ASN P3

Algoritmy a struktury neuropočítačů ASN P3 Algoritmy a struktury neuropočítačů ASN P3 SOM algoritmus s učitelem i bez učitele U-matice Vektorová kvantizace Samoorganizující se mapy ( Self-Organizing Maps ) PROČ? Základní myšlenka: analogie s činností

Více

7. Rozdělení pravděpodobnosti ve statistice

7. Rozdělení pravděpodobnosti ve statistice 7. Rozdělení pravděpodobnosti ve statistice Statistika nuda je, má však cenné údaje, neklesejte na mysli, ona nám to vyčíslí Jednou z úloh statistiky je odhad (výpočet) hodnot statistického znaku x i,

Více

Hlavní parametry rádiových přijímačů

Hlavní parametry rádiových přijímačů Hlavní parametry rádiových přijímačů Zpracoval: Ing. Jiří Sehnal Pro posouzení základních vlastností rádiových přijímačů jsou zavedena normalizovaná kritéria parametry, podle kterých se rádiové přijímače

Více

Hluk a analýza vibrací stěn krytu klimatizační jednotky

Hluk a analýza vibrací stěn krytu klimatizační jednotky XXVI. ASR '00 Seminar, Instruments and Control, Ostrava, April 6-7, 00 Paper Hluk a analýza vibrací stěn krytu klimatizační jednotky KOČÍ, Petr Ing., Katedra ATŘ-, VŠB-TU Ostrava, 7. listopadu, Ostrava

Více

Funkce komplexní proměnné a integrální transformace

Funkce komplexní proměnné a integrální transformace Funkce komplexní proměnné a integrální transformace Fourierovy řady I. Marek Lampart Text byl vytvořen v rámci realizace projektu Matematika pro inženýry 21. století (reg. č. CZ.1.07/2.2.00/07.0332), na

Více

Automatická detekce anomálií při geofyzikálním průzkumu. Lenka Kosková Třísková NTI TUL Doktorandský seminář, 8. 6. 2011

Automatická detekce anomálií při geofyzikálním průzkumu. Lenka Kosková Třísková NTI TUL Doktorandský seminář, 8. 6. 2011 Automatická detekce anomálií při geofyzikálním průzkumu Lenka Kosková Třísková NTI TUL Doktorandský seminář, 8. 6. 2011 Cíle doktorandské práce Seminář 10. 11. 2010 Najít, implementovat, ověřit a do praxe

Více

UŽITÍ KOHERENČNÍ FUNKCE PRO DISTRIBUOVANOU

UŽITÍ KOHERENČNÍ FUNKCE PRO DISTRIBUOVANOU UŽITÍ KOHERENČNÍ FUNKCE PRO DISTRIBUOVANOU ANALÝZU VÍCEKANÁLOVÝCH SIGNÁLŮ Robert Háva, Aleš Procházka Vysoká škola chemicko-technologická, Abstrakt Ústav počítačové a řídicí techniky Analýza vícekanálových

Více