ROZPOZNÁVÁNÍ AKUSTICKÉHO SIGNÁLU ŘEČI S PODPOROU VIZUÁLNÍ INFORMACE

Save this PDF as:
 WORD  PNG  TXT  JPG

Rozměr: px
Začít zobrazení ze stránky:

Download "ROZPOZNÁVÁNÍ AKUSTICKÉHO SIGNÁLU ŘEČI S PODPOROU VIZUÁLNÍ INFORMACE"

Transkript

1 TECHNICKÁ UNIVERZITA V LIBERCI Fakulta mechatroniky a mezioborových inženýrských studií ROZPOZNÁVÁNÍ AKUSTICKÉHO SIGNÁLU ŘEČI S PODPOROU VIZUÁLNÍ INFORMACE AUTOREFERÁT DISERTAČNÍ PRÁCE 2005 JOSEF CHALOUPKA

2 Rozpoznávání akustického signálu řeči s podporou vizuální informace Autoreferát disertační práce Ing. Josef Chaloupka Studijní program: Studijní obor: Pracoviště: Školitel: 2612V Elektrotechnika a informatika 2612V045 Technická kybernetika Katedra elektrotechniky a zpracování signálů Fakulta mechatroniky a mezioborových inženýrských studií Technická Univerzita v Liberci Hálkova 6, , Liberec Prof. Ing. Jan Nouza, CSc. Oponenti: Prof. Ing. Josef Psutka, CSc. Doc. Ing. Petr Pollák, CSc. Doc. Ing. Jozef Juhár, PhD. (FAV ZČU Plzeň) (FEL ČVUT Praha) (FEI TU Košice) 1

3 S disertační prací je možné se seznámit na děkanátu Fakulty mechatroniky a mezioborových inženýrských studií Technické univerzity v Liberci, Čížkova ulice č. 3, budova B, tel.: Rozsah vlastní disertační práce a příloh: Počet stran: 120 Počet obrázků: 66 Počet tabulek: 20 Počet vzorců: 101 Počet příloh: 7 ROZPOZNÁVÁNÍ AKUSTICKÉHO SIGNÁLU ŘEČI S PODPOROU VIZUÁLNÍ INFORMACE Ing. Josef Chaloupka,

4 Obsah 1 Úvod Současný stav výzkumu problematiky Cíle disertační práce Audio-vizuální rozpoznávání řeči Parametrizace audio-vizuálního signálu řeči Rozpoznávání audio-vizuálního signálu řeči Detekování lidského obličeje v obraze 8 4 Nalezení oblasti rtů v detekované oblasti zájmu 9 5. Vizuální příznaky řeči 9 6 Audio-vizuální databáze 10 7 Experimentální práce testy Úloha rozpoznávání akustického signálu řeči Úloha rozpoznávání vizuálního signálu řeči Rozpoznávání vizuálního signálu s tvarovými příznaky Rozpoznávání vizuálního signálu s DCT příznaky Úloha rozpoznávání audio-vizuálního signálu řeči Jednostreamové audio-vizuální rozpoznávání řeči Dvoustreamové audio-vizuální rozpoznávání řeči Stanovení vah pro dvoustreamové audio-vizuální rozpoznávání řeči Výsledky dvoustreamového audio-vizuálního rozpoznávání řeči Celkové zhodnocení experimentů pro audio-vizuální rozpoznávání řeči Závěr Přínosy disertační práce Aplikační oblasti Náměty na další práci Literatura 25 Vlastní publikované práce Annotation 28 3

5 1 Úvod Audio-vizuální počítačové zpracování a rozpoznávání řeči patří v současné době k intenzivně se rozvíjející aplikační oblasti moderních hlasových technologií. Do nedávné doby stála tato oblast, vzhledem ke zpracování a rozpoznávání samotného akustického signálu řeči, v pozadí zájmu výzkumných týmů. V posledních deseti letech však začaly ve světě vznikat větší výzkumné týmy zabývající se primárně zpracováním a rozpoznáváním vizuální složky řeči. Tento trend byl mimo jiné způsoben nástupem spolehlivých, levných a dostatečně rychlých osobních počítačů. Zpracování a rozpoznávání vizuálního signálu řeči je totiž řádově několikanásobně časově náročnější, než je tomu u zpracování a rozpoznávání akustického signálu řeči. Pro příklad, kdyby akustický signál řeči byl digitalizován vzorkovací frekvencí 8 khz a velikost jednoho vzorku by byla 16 bitů, tak by akustický signál o délce 1s měl bitů, oproti tomu pro příslušný vizuální signál o snímkovací frekvenci 30 snímků za sekundu, kde jeden barevný video snímek by měl velikost 640 x 480 obrazových bodů a obrazovému bodu by příslušela RGB barevná hodnota (24 bitů), tak by jednosekundový vizuální signál řeči měl již bitů, což je 1728 x více vzhledem k akustickému signálu řeči. Oblast audio-vizuálního zpracování a rozpoznávání řeči lze rozdělit na dva směry výzkumu. V první podoblasti výzkumu jsou vytvářeny systémy audio-vizuální syntézy řeči. V těchto systémech je použit modul převodu psaného textu na akustický signál řeči TTS (Text To Speech), ke kterému je připojen modul, nejčastěji reprezentovaný 3D počítačovým modelem mluvící hlavy, u které je při promluvě animována tvář, tj. dochází u tohoto modelu k pohybu čelistí, jazyka, rtů, mimických svalů atd. Vlastní výzkum je v této oblasti zaměřen především na vytvoření kvalitního vizuálního 3D modelu, který by při promluvě co nejvíce odpovídal reálnému mluvčímu. V druhé podoblasti výzkumu jsou vytvářeny metody a algoritmy pro zpracování, parametrizaci a rozpoznávání vizuálního signálu řeči. Tato disertační práce je zaměřena především na tuto druhou podoblast audio-vizuálního zpracování a rozpoznávání řeči. Obě tyto podoblasti výzkumu mají celou řadu aplikačních možností, některé z nich jsou popsány v disertační práci v kapitole 9. Prvním předpokladem pro vytvoření systému pro audio-vizuální rozpoznávání řeči je vytvoření audio-vizuální databáze videonahrávek promluv od různých mluvčích. Tato audio-vizuální databáze musí být navržena pro konkrétní národní jazyk, pro který je následně vytvořen systém automatického rozpoznávání řeči. Vytvořené metody a algoritmy pro předzpracování a parametrizaci vizuálního signálu řeči jsou však využitelné pro jakýkoliv jazyk, obdobně jako je tomu u zpracování a rozpoznávání samostatného akustického signálu řeči. Pro záznam audio-vizuálního signálu řeči se v současné době (2005) nejčastěji používají digitální kamery zaznamenávající barevný obraz a příslušný akustický signál. Akustický signál řeči by bylo možné zaznamenávat i samostatně pomocí mikrofonu, poté by se však musela zajistit synchronizace mezi akustickým a vizuálním signálem, což není úplně triviální úloha, proto se spíše pro záznam akustického signálu využívá mikrofon integrovaný v kameře. 4

6 1.1 Současný stav výzkumu problematiky Výzkum v oblasti audio-vizuálního rozpoznávání řeči je již teoreticky řešen více než 20 let, přesto teprve přibližně v posledních deseti letech vznikaly ve světě větší výzkumné týmy, které se touto oblastí zabývají, a to jak teoreticky, tak i prakticky. Zřejmě nejznámějším týmem je laboratoř IBM - Audio Visual Speech Technologies vedená Dr. Chalapathy Neti. Tato laboratoř se zabývá především audio-vizuálním zpracováním a rozpoznáváním řeči pro anglický jazyk, i když algoritmy navržené touto laboratoří pro parametrizaci a rozpoznávání audio-vizuálního signálu řeči jsou za určitých podmínek použitelné i pro jiné národní jazyky. V poslední době jsou v oblasti audio-vizuálního rozpoznávání řeči dělány pokusy zaměřené na off-line rozpoznávání slov z velkého slovníku [1], rozpoznávání spojité řeči [2] a on-line rozpoznávání slov z malého slovníku [3]. Tento výzkum si však zatím mohou dovolit pouze laboratoře, které mají rozsáhlejší a kvalitní audio-vizuální databázi promluv. Kromě anglického jazyka je vývoj a výzkum v oblasti audio-vizuálního rozpoznávání řešen i pro francouzštinu [4], němčinu [5], japonštinu [6] a další jazyky technologicky vyspělých zemí. V České republice se ve větší míře kromě Laboratoře počítačového zpracování řeči na TUL zabývá problematikou audio-vizuálního zpracování a rozpoznáváním řeči pro český jazyk i tým oddělení umělé inteligence na Katedře kybernetiky Fakulty aplikovaných věd Západočeské univerzity v Plzni. Pro větší přehlednost této práce je další podrobný popis současného stavu v jednotlivých dílčích úlohách audio-vizuálního zpracování a rozpoznávání řeči uveden na začátku jednotlivých kapitol. 1.2 Cíle disertační práce Cíle této disertační práce byly následující: Navrhnout, vytvořit a anotovat dostatečně reprezentativní audio-vizuální databázi videonahrávek promluv pro český jazyk. V této databázi by se měly nacházet nahrávky slov i vět od různých mluvčích. Pro zpracování nahrávek z této databáze vytvořit vhodné nástroje (programy). Navrhnout a vytvořit systém pro parametrizaci vizuálního signálu řeči, který by byl složen z podsystémů pro detekci lidské tváře v obraze, pro nalezení rtů v detekované oblasti zájmu (tváře) a podsystému pro vlastní parametrizaci oblasti rtů. Podsystémy pro detekování obličeje, nalezení rtů a vizuální parametrizaci by měly být pokud možno výpočetně co nejrychlejší. Navrhnout vhodnou fúzi parametrizovaného akustického a vizuálního signálu řeči a provést experimentální otestování audio-vizuálního rozpoznávání izolovaných slov, při srovnání se samostatným rozpoznáváním akustického a vizuálního signálu řeči. Navrhnout, realizovat a experimentálně vyhodnotit test pro audio-vizuální rozpoznávání izolovaných slov v podmínkách proměnného hlučného pozadí. 5

7 2 Audio-vizuální rozpoznávání řeči Úloha rozpoznávání audio-vizuálního signálu řeči se skládá ze dvou částí. V prvním kroku je audio-vizuální signál předzpracován a parametrizován a v druhém kroku probíhá vlastní rozpoznávání. 2.1 Parametrizace audio-vizuálního signálu řeči Pořízený audio-vizuální signál je rozdělen na akustický a vizuální signál a každý z těchto signálu je následně parametrizován. Parametrizace akustického signálu je již v dnešní době poměrně dobře vyřešena. Jako akustické příznaky se nejčastěji používají příznaky získané z kepstra akustického signálu. Obr. 2.1: Princip parametrizace audio-vizuálního signálu Vizuální signál je složen z časového sledu obrazů (2D signálů), ve kterých jsou zaznamenáni obličeje mluvčích. Pro parametrizaci vizuálního signálu se nejčastěji používají tvarové (geometrické) vizuální příznaky získané z nalezeného tvaru rtů nebo vizuální příznaky (DCT, PCA,...) popisující informační obsah oblasti zájmu, ve které se nacházejí rty a jejich bezprostřední okolí. Pro vytvoření vizuálních příznaků je tak nutné nejdříve v obraze nalézt oblast zájmu se rty. Přímé nalezení rtů v obraze by bylo velmi složité, proto je v pořízeném obraze nejdříve detekován obličej mluvčího a z detekovaného obrazu obličeje je separována oblast zájmu se rty, z níž jsou následně extrahovány vizuální příznaky. V některých dříve publikovaných pracích byla snímací kamera zaměřena přímo na oblast rtů mluvčího, nemusely se tak provádět operace pro detekování obličeje a nalezení obrazu oblasti zájmu se rty. Toto zjednodušení je však použitelné pouze v laboratorních podmínkách, kde se mluvčí příliš nepohybuje, a dnes se již příliš nepoužívá. 6

8 2.2 Rozpoznávání audio-vizuálního signálu řeči Rozpoznávání parametrizovaného audio-vizuálního signálu řeči je dnes nejčastěji realizováno pomocí skrytých Markovových modelů (HMM Hidden Markov Models) nebo pomocí umělých neuronových sítí (ANN Artificial Neural Networks). Ve své práci jsem použil metodu HMM s využitím programu HTK [7]. Program HTK mimo jiné umožňuje vytvářet (natrénovat) HM modely a rozpoznávat parametrizované signály za využití těchto HM modelů. Při použití HTK jsou možné dva způsoby rozpoznávání parametrizovaných audio-vizuálních signálů pomocí HM modelů. HM modely jsou vytvořeny (natrénovány) jako jednostreamové nebo dvoustreamové. U jednostreamových HM modelů jsou sloučeny akustické a vizuální příznaky do jednoho příznakového vektoru, pro nějž je poté vytvořen HM model. 3 Detekování lidského obličeje v obraze Prvním dílčím úkolem, pro nalezení rtů v obraze, je nalézt v daném obraze lidský obličej a na základě takto nalezené oblasti obličeje poté vytvořit oblast zájmu (ROI- Region Of Interest), ve které se nacházejí rty. Řešení této úlohy je dosti složité. V obraze se teoreticky může vyskytovat několik osob a tím i obličejů vhodných k detekci. Lidé mohou být v obraze různě natočeni a různě vzdáleni od snímacího zařízení, tím se samozřejmě mění plocha zaznamenaného obličeje v obraze. Navíc se v průběhu snímání scény může měnit i osvětlení. Ve své práci se zabývám především rozpoznáváním obrazů, ve kterých se nachází pouze jeden mluvčí, je čelně natočen ke snímací kameře a osvětlení scény se příliš nemění. Pro tyto účely byla prostudována dostupná literatura a byly zváženy jednotlivé metody a algoritmy pro nalezení lidského obličeje. Nakonec byl navržen vlastní algoritmus založený na principu barevné a tvarové segmentace obrazu [8]. Pro tvarovou segmentaci byly použity metody matematické morfologie, viz obr (a) (b) (c) (d) (e) (f) (g) (h) Obr. 3.1: Originální RGB barevný obraz (a), obraz transformovaný do Cr-barevné složky (b), výsledný binární obraz po segmentaci prahováním (c), binární obraz po použití morfologické operace otevření (d), po uzavření (e), po upravené operaci otevření (f), výsledný obraz, ve kterém je již vybrána pouze oblast s obličejem (g) a původní barevný obraz s vyznačenou detekovanou oblastí (h). U každé morfologické operace byl použit jiný strukturní element, pro (f) byl tento element vybrán automaticky. 7

9 4 Nalezení oblasti rtů v detekované oblasti zájmu Nalézt rty v pořízeném obraze s mluvčím by byla velmi obtížná úloha. Pokud je totiž v obraze celá osoba popřípadě více osob, tak je velikost rtů oproti velikosti celého obrazu velmi malá a tím i hůře detekovatelná. Proto je v obraze nalezen nejdříve lidský obličej a z takto nalezené oblasti je vybrána určitá část oblast zájmu (ROI Region Of Interest), ve které se nacházejí rty. Pro audio-vizuální rozpoznávání řeči se pak používají vizuální příznaky, které byly získány z jednotlivých obrazových bodů z oblasti zájmu nebo geometrické příznaky, pro které je potřeba nalézt oblast rtů z oblasti zájmu. Existuje také několik metod, které využívají pro rozpoznávání kombinaci geometrických příznaků a příznaků získaných z obrazových bodů z ROI [9]. Tato kapitola pojednává o metodách pro nalezení oblasti rtů v pořízené oblasti zájmu ROI. Tak jako u detekování obličeje v obraze existuje v současné době (r. 2005) velké množství metod pro nalezení oblasti rtů. Nejčastěji se používají metody pro segmentaci obrazu prahováním [10, 11] a segmentaci obrazu za pomocí různých barevných statistických modelů [12]. Před vlastní segmentací obrazu se však velmi často vlastní barevný obraz (RGB) převádí do jiného barevného prostoru. Nalezení vhodného barevného prostoru je jedním z nejdůležitějších úkolů, pro následnou dostatečně spolehlivou segmentaci rtů z oblasti zájmu. Byly zkoumány výhody a nevýhody jednotlivých barevných prostorů a nakonec byl vybrán F - barevný prostor, který byl vytvořen pomocí Fisherovy lineární diskriminační analýzy [13]. Pro nalezení objektu rtů při segmentaci obrazu oblasti zájmu bylo potřeba přesněji nalézt práh. Na základě ověřeného předpokladu, že se obrazový histogram získaný z obrazu oblasti zájmu skládá ze dvou normálních rozdělení byl ve spolupráci s Doc. Ing. Vladimírem Kracíkem, CSc., z katedry aplikované matematiky (TUL) vytvořen algoritmus pro automatické nalezení prahu [14]. V tomto algoritmu byla použita gradientní metoda využívající metodu nejmenších čtverců, pomocí které byly odhadnuty parametry µ r, µ k, σ r, σ k a P r, kde µ r je střední hodnota a σ r je směrodatná odchylka z normálního rozdělení N(µ r, σ r 2 ) popisujícího rozdělení barevných hodnot obrazových bodů zobrazujících rty v obraze oblasti zájmu a µ k je střední hodnota a σ k je směrodatná odchylka z normálního rozdělení N(µ k, σ k 2 ) popisujícího rozdělení barevných hodnot obrazových bodů zobrazujících okolí (kůži) v obraze oblasti zájmu. P r je relativní počet obrazových bodů zobrazujících rty. Relativní počet obrazových bodů zobrazujících okolí (kůži) P k = 1 P r. Z těchto parametrů byl poté počítán práh T pro segmentaci dle následujících vztahů: T b + b 2 4. a. c = (4.1) 2. a 2 k 2 r a = σ σ (4.2) 2 2 ( σ µ σ ) b = 2. µ (4.3) r k k r ( 1 P ) σ = + r c µ rσ k µ kσ r 2. σ kσ r.log σ k Pr r (4.4) 8

10 Obr. 4.1: Původní obrazový histogram (černá křivka), Gussova křivka vypočtená z parametrů µ r, σ r a P r (červená křivka) a Gussova křivka vypočtená z parametrů µ k, σ k a P r (modrá křivka) a výsledný vypočtený práh (zobrazen zeleně) Po segmentaci obrazu oblasti zájmu je výsledný binární obraz filtrován pomocí morfologické operace otevření a následně byla použita filtrace drobných objektů (jizvy, akné, vyrážka...) pomocí metody barvení objektů, viz obr (a) (b) (c) (d) (e) (f) (g) Obr. 4.2: Originální RGB barevný obraz oblasti zájmu (a), obraz transformovaný do F- barevné složky (b), výsledný binární obraz po segmentaci prahováním (c), binární obraz po filtraci otevření strukturním elementem (d), obraz s obarvenými oblastmi (e), výsledný binární obraz po odstranění oblastí, které s jistou pravděpodobností netvoří rty (f) a původní barevný obraz s nalezenými okraji rtů (g) 5. Vizuální příznaky řeči Obdobně, jako je tomu pro extrakci akustických příznaků, tak i pro extrakci vizuálních příznaků řeči existuje v dnešní době větší množství metod. Nejčastěji se vizuální příznaky extrahují z obrazů, kde je mluvčí čelně natočen ke snímací kameře, nověji se zkouší i extrakce vizuálních příznaků z aproximovaného 3D prostoru [15, 16]. Aproximovaný 3D prostor je buď vytvořen ze snímků dvou kamer, které snímají mluvčího z dvou různých úhlů, nebo se použije jedna kamera a vhodně umístěné zrcadlo (popř. více zrcadel) a mluvčí je poté zaznamenán v jednom video snímku z dvou (i více) různých úhlů. Vlastní vizuální příznaky pro rozpoznávání řeči lze 9

11 rozdělit do dvou kategorií: Tvarové vizuální příznaky a vizuální příznaky popisující informační obsah obrazu. Jako tvarové příznaky byly v této práci vybrány horizontální h (5.1) a vertikální v (5.2) rozšíření rtů, dále oblast rtů o (5.3) a zaokrouhlení rtů r (5.4), které nabývá největších hodnot při vyslovování fonémů u, o, ř. 1 max M y= 0.. N 1 x= 0 ( x, y) h = f (5.1) 1 max N x= 0.. M 1 y= 0 ( x, y) v = f (5.2) N 1M 1 y= 0 x= 0 ( x, y) o = f (5.3) r = v / h (5.4) kde ( x, y) jsou souřadnice obrazového bodu v binárním obraze nalezené oblasti rtů, f ( x, y) je obrazová funkce binárního obrazu nabývající hodnot 0, 1. M x N jsou rozměry binárního obrazu v obrazových bodech a max je funkce maxima. Obr. 5.1: Binární obraz oblasti rtů s vyznačenými geometrickými příznaky V této práci byly použity i vizuální příznaky popisující informační obsah obrazu, jednalo se o DCT energetické příznaky [17]. Ke všem statickým vizuálním příznakům byly počítány příslušné dynamické příznaky. 6 Audio-vizuální databáze Pořízení kvalitní audio-vizuální databáze je velice důležité pro následné audio-vizuální zpracování a rozpoznávání řeči. Požadavky na vytvoření této databáze jsou obdobné, jako u vytvoření databáze pro akustické zpracování a rozpoznávání signálu řeči [18], tj. v databázi by se měly nacházet kvalitní nahrávky od velkého množství mluvčích a pokrývající co nejvíce jazyk, pro který je databáze vytvářena. V současné době (2005) existuje několik audio-vizuálních databází pro různé národní jazyky, především však pro angličtinu např. XM2VTS [19] nebo AVICAR [20]. V době 10

12 prvních pokusů (2001/02) s audio-vizuálním zpracováním a rozpoznáváním řeči v Laboratoři počítačového zpracování řeči na Technické Univerzitě v Liberci však neexistovala dostupná audio-vizuální databáze pro český jazyk. Proto jsem se rozhodl vytvořit vlastní českou audio-vizuální databázi. Obdobná audio-vizuální databáze vznikla zároveň i v oddělení umělé inteligence na Katedře kybernetiky Fakulty aplikovaných věd Západočeské univerzity v Plzni [21]. Postupem času byly vytvořené dvě audio-vizuální databáze později označené AVDB1cz a AVDB2cz. V první videodatabázi AVDB1cz bylo zaznamenáno 52 mluvčích dvěma kamerami (snímání ze předu a z profilu) při rozlišení 320 x 240 obrazových bodů a při snímkovací frekvenci 30 snímků za sekundu. 35 mluvčích bylo zaznamenáno v databázi AVDB2cz, kde byla použita pouze jedna kamera (čelní snímání) při rozlišení 640 x 480 obrazových bodů a při snímkovací frekvenci 30 snímků za sekundu. Každý mluvčí namluvil 50 slov a 50 foneticky bohatých vět. Každý český foném se v souboru vět nacházel alespoň 6x. 7 Experimentální práce testy V následujících statích jsou popsány testy a jejich výsledky při rozpoznávání izolovaných slov z audio-vizuální databáze AVDB2cz. Pro rozpoznávání byl použit klasifikátor založený na technice skrytých Markovových modelů, pro vlastní natrénování a rozpoznávání celoslovních modelů byl využit program HTK [7]. Celkově bylo v databázi AVDB2cz zaznamenáno 35 mluvčích, kde každý mluvčí namluvil 50 slov (příloha č.3). V trénovací databázi bylo 1500 slov od třiceti mluvčích a v testovací databázi se nacházelo 250 slov od zbylých pěti mluvčích. I při takto relativně nízkém objemu slov bylo automatické zpracování a parametrizace vizuální části této databáze dosti časově náročné. Vlastní zpracovaná databáze AVDB2cz, ve které se po předzpracování nacházely již pouze oblasti zájmu vhodné pro parametrizaci vizuálního signálu zaujímala více než 70 GB diskového prostoru. Zde uvedené experimenty jsou rozděleny do tří skupin. V první části jsou popsány testy rozpoznávání akustického signálu řeči, ve druhé jsou testy vizuálního signálu řeči a ve třetí části je popsáno vlastní rozpoznávání audio-vizuálního signálu řeči a jeho užití v hlučných podmínkách. Všechny experimentální testy jsou provedeny na stejné množině audio-vizuálních dat (1750 slov). 7.1 Úloha rozpoznávání akustického signálu řeči Pro rozpoznávání izolovaných slov byl použit klasifikátor založený na metodě skrytých Markovových modelů. Pro rozpoznávání slov byly předem vytvořeny (natrénovány) spojité celoslovní levo-pravé HM modely. Před vlastním vytvořením těchto modelů bylo potřeba zjistit jaký je minimální počet framů (o délce 33.3 ms) tvořících jednotlivá slova z testovací databáze. Minimální počet framů byl v našich nahrávkách 14. Z tohoto minimálního počtu framů byl stanoven maximální počet stavů HM modelů. V originálních videonahrávkách (v akustickém streamu) z testovací části databáze byla průměrná hodnota SNR 18 db. Pro účely následných testů rozpoznávání slov z akustického signálu byl vytvořen algoritmus, pomocí něhož bylo možné přidávat k akustickým nahrávkám aditivní bílý 11

13 šum. Tento algoritmus byl použit v testu, kde byla zkoumána závislost celkového rozpoznávacího skóre na šumu obsaženém v nahrávkách. V tomto testu byla zjišťována závislost velikosti výsledného rozpoznávacího skóre na počtu stavů použitých (natrénovaných) celoslovních HM modelů při měnícím se SNR v akustickém signálu. Specifikace testu: Klasifikátor založený na celoslovní levo-pravé HM modely Počet příznaků 39 Druh příznaků 13 x (MFCC + delta + akcelerační) Počet stavů HM modelů proměnný (1 14) Délka framu 33.3 ms Průměrná hodnota SNR [db] proměnná (18 (- 2)) Slovník 50 slov Trénovací databáze 30 mluvčích (1500 slov) Testovací databáze 5 mluvčích (250 slov) Výsledné rozpoznávací skóre [%] je vypočteno jako počet správně rozpoznaných slov ku počtu všech slov z testovací části databáze. SNR Počet stavů HM modelů [db] ,8 90,8 97,2 99,2 99,2 99,2 99,2 99,2 99,2 99,2 99,2 99,2 99,2 99, ,4 66,8 81,2 90,0 94,8 97,2 96,8 97,6 98,4 96,8 98,0 98,8 98,4 98, ,6 57,2 68,8 80,8 90,8 93,6 93,6 94,0 94,8 93,2 94,8 97,2 96,8 96, ,8 48,0 56,0 70,0 86,4 87,6 88,0 90,0 90,8 90,0 92,4 93,2 93,6 94, ,4 44,4 47,2 58,4 78,8 82,4 82,0 84,4 85,2 86,4 87,2 87,6 88,8 89, ,8 40,0 42,0 50,8 70,4 77,6 71,2 75,2 78,4 74,4 75,6 80,0 82,0 84, ,2 33,2 34,8 42,8 60,4 65,6 64,0 63,6 65,6 64,8 68,0 69,6 72,4 72, ,8 28,4 28,8 34,4 48,4 59,2 54,4 51,2 56,4 55,6 57,2 62,0 64,0 64, ,4 23,6 23,6 28,0 39,2 46,8 44,4 38,4 46,0 45,6 49,6 55,6 56,8 56,0 9 12,4 20,8 20,4 20,4 30,8 35,6 36,8 28,8 36,4 36,8 39,2 45,2 42,4 46,0 8 11,2 14,8 17,2 16,8 24,8 28,8 29,6 22,8 26,0 26,8 30,8 36,0 35,2 34,4 7 8,8 11,2 12,4 12,4 17,2 22,4 22,8 17,6 20,4 20,4 20,4 26,8 28,0 26,0 6 7,2 7,6 9,6 7,6 13,2 17,6 20,0 10,0 13,2 16,8 14,4 19,2 19,6 18,8 5 7,2 6,0 7,6 6,8 8,8 12,0 14,8 6,4 8,8 7,6 8,8 13,2 13,2 13,6 4 7,2 5,6 8,0 5,2 6,8 9,6 10,0 5,6 5,6 4,8 5,6 10,0 8,4 10,0 3 7,2 5,6 8,0 4,4 4,8 6,0 8,4 3,6 3,2 4,4 4,8 7,2 6,8 6,8 2 7,6 4,0 7,6 4,0 3,6 5,2 7,6 2,8 2,4 3,6 3,6 6,0 4,4 4,8 1 6,8 4,0 6,4 4,0 3,6 4,4 6,0 2,8 2,4 2,4 2,8 5,6 3,2 4,0 0 6,8 3,6 6,8 4,0 3,6 4,0 5,2 2,8 2,4 2,4 2,4 4,8 3,2 3,6-1 6,4 3,2 5,6 4,0 4,0 3,2 4,4 2,8 2,4 2,4 2,4 4,0 3,2 3,2-2 6,0 2,8 4,0 4,0 4,4 3,2 4,4 2,4 2,4 2,4 2,4 3,2 3,2 2,4 Tab. 7.1: Rozpoznávací skóre [%] v závislosti na počtu stavů použitých (natrénovaných) HM modelů při měnícím se SNR v akustickém signálu 12

14 Obr. 7.1: Graf hodnot z tab. 7.1 výsledné rozpoznávací skóre [%] v závislosti na počtu stavů HM modelů při měnícím se SNR v akustickém signálu Z tabulky 7.1 je patrné, že vyšších hodnot rozpoznávacího skóre v prostředí s vysokou hladinou šumu (přibližně do SNR 6dB) lze dosáhnout při použití vícestavových (10 a více) celoslovních HM modelů. 7.2 Úloha rozpoznávání vizuálního signálu řeči V této úloze bylo testováno použití tvarových (geometrických) vizuálních příznaků a vizuální příznaky popisující informační obsah obrazu oblasti zájmu získaných pomocí DCT při automatickém rozpoznávání vizuálního signálu řeči Rozpoznávání vizuálního signálu s tvarovými příznaky Jako tvarové příznaky byly v tomto testu použity vizuální příznaky horizontální (h) a vertikální (v) rozšíření rtů, dále oblast rtů (o) a zaokrouhlení rtů (r). Z těchto příznaků byly vypočteny dynamické a akcelerační příznaky, které jsou také při rozpoznávání akustického signálu řeči uplatněny. V tomto testu bylo zjišťováno rozpoznávací skóre na počtu stavů použitých celoslovních HM modelů, kde pro parametrizaci vizuálního signálu bylo použito sedm různých kombinací statických, dynamických a akceleračních příznaků (1. pouze statické, 2. pouze dynamické, 3. pouze akcelerační, 4. statické + dynamické, 5. dynamické + akcelerační, 6. statické + akcelerační, 7. statické + akcelerační + dynamické). Specifikace testu: Klasifikátor založený na celoslovní levo-pravé HM modely Počet příznaků proměnný 1-12 Druh příznaků (kombinace) h, v, o, r, delta, akcelerační Počet stavů HM modelů proměnný (1 14) Délka framu 33.3 ms Slovník 50 slov Trénovací databáze 30 mluvčích (1500 slov) Testovací databáze 5 mluvčích (250 slov) 13

15 Viz. Počet stavů HM modelů pří s 8,8 11,2 15,6 18,4 18,8 19,2 20,4 22,8 20,4 22,8 23,6 24,8 28,4 27,6 d 5,2 6,0 6,8 8,0 8,0 13,2 11,6 13,2 20,4 18,4 16,8 24,4 18,0 21,2 a 2,8 3,6 2,4 2,4 4,0 4,4 6,0 4,8 9,6 5,6 6,8 6,4 10,4 8,8 s+d 9,2 15,2 18,0 22,0 23,6 24,8 27,6 30,4 28,0 30,8 34,4 32,0 34,8 34,8 d+a 4,0 3,6 6,4 7,2 8,0 5,6 10,4 10,8 12,4 15,2 16,8 15,2 20,0 22,0 s+a 5,2 9,2 14,0 19,6 19,2 21,2 20,0 23,6 23,6 28,0 29,6 29,2 29,6 30,4 s+d+a 6,4 10,0 18,0 20,4 21,6 24,4 26,4 28,0 29,6 30,0 25,6 31,6 32,8 33,2 Tab. 7.2: Rozpoznávací skóre [%] v závislosti na počtu stavů použitých (natrénovaných) HM modelů při využití různých kombinací statických (s), dynamických (d) a akceleračních (a) vizuálních tvarových příznaků Nejlepších výsledků rozpoznávacího skóre (34,8 %) bylo v tomto testu dosaženo při využití kombinace statických a dynamických vizuálních tvarových příznaků, které byly použity pro natrénování celoslovních HM modelů s třinácti (čtrnácti) stavy a následnému rozpoznávání slov klasifikátorem založeným na celoslovních HM modelech. Použití akceleračních příznaků v kombinaci se statickými a dynamickými příznaky nevedlo u našich nahrávek k lepšímu rozpoznávacímu skóre, viz tab Obr. 7.2: Grafy hodnot z tab. 7.2 výsledné rozpoznávací skóre [%] v závislosti na počtu stavů HM modelů při využití různých kombinací statických (s), dynamických (d) a akceleračních (a) vizuálních tvarových příznaků 14

16 7.2.2 Rozpoznávání vizuálního signálu s DCT příznaky Pro vizuální příznaky popisující informační obsah obrazu oblasti zájmu bylo použito prvních N příznaků s největší hodnotou energie z obrazové matice oblasti zájmu transformované pomocí diskrétní kosinové transformace DCT. V prvním testu byl zjišťován vliv počtu stavů celoslovních HM modelů a počtu N energetických příznaků na výsledné rozpoznávací skóre. Počet vizuálních příznaků byl zvětšován o hodnotu 1 v rozsahu 1 až 30 příznaků a dále o hodnotu 10 v intervalu 30 až 60 příznaků. Výsledné tabulky z tohoto testu pro kombinace statických (s), dynamických (d) a akceleračních DCT-energetických vizuálních příznaků jsou dosti rozsáhlé, proto byly umístěny do přílohy č.6. V následující tabulce 7.3 jsou uvedeny nejlepší výsledky rozpoznávacího skóre pro jednotlivé kombinace (s, d, a) energetických DCT vizuálních příznaků. U některých kombinací (pouze dynamické příznaky (d), statické a dynamické příznaky (sd)) vizuálních příznaků byla nejvyšší hodnota rozpoznávacího skóre dosažena pro různé kombinace počtu stavů HM modelu a počtu použitých vizuálních příznaků, proto jsou všechny tyto kombinace v tabulce uvedeny. Kombinace DCT vizuálních příznaků Počet stavů HM modelů Počet příznaků Rozpoznávací skóre [%] s ,4 d ,6 35,6 a ,2 s + d s + 5d 6s + 6d 10s + 10d 44,4 44,4 44,4 d + a 14 16d + 16a 31,6 s + a 14 6s + 6d 40,4 s + d + a 14 5s + 5d +5a 45,2 Tab. 7.3: Vybrané nejvyšší hodnoty rozpoznávacího skóre v závislosti na počtu stavů použitých (natrénovaných) HM modelů a počtu použitých energetických DCT vizuálních příznaků při využitá různých kombinací statických (s), dynamických (d) a akceleračních (a) vizuálních příznaků Nejvyšší hodnota rozpoznávacího skóre (45,2 %) byla dosažena při využití kombinace pěti statických a jím příslušných dynamických a akceleračních vizuálních energetických DCT příznaků, které byly použity pro natrénování čtrnácti stavových celoslovních HM modelů a k následnému rozpoznávání slov klasifikátorem založeným na celoslovních HM modelech. Na obrázku 7.3 je uveden graf průběhu rozpoznávacího skóre v závislosti na počtu použitých energetických DCT příznaků a počtu stavů HM modelů. Počet vybraných nejvyšších hodnot energetických příznaků byl zvětšován o hodnotu 1 v rozsahu 1 až 30 příznaků a o hodnotu 10 v intervalu 30 až 60 příznaků. Tento graf byl vytvořen z hodnot rozpoznávacího skóre při kombinaci statických, dynamických a akceleračních příznaků. 15

17 Obr. 7.3: Graf hodnot výsledného rozpoznávací skóre (z tabulky č.7 v příloze č.6) v závislosti na počtu stavů HM modelů a počtu energetických DCT vizuálních příznaků při kombinaci statických (s), dynamických (d) a akceleračních (a) vizuálních příznaků Jak již bylo uvedeno výše, tak za vizuální příznaky bylo v tomto testu použito prvních N příznaků s největší hodnotou energie z obrazové matice oblasti zájmu o velikosti 128 x 128 obrazových bodů, která byla transformována pomocí diskrétní kosinové transformace. V rámci dalších testů byl zkoumán vliv různě vypočtených vizuálních příznaků z obrazové matice transformované diskrétní kosinovou transformací, kde vizuální příznaky byly vybrány z nejvyšších hodnot energie E, rozptylu R nebo normovaného rozptylu NR z DCT koeficientů. Pro každý z těchto zkoumaných vlivů byl vytvořen kompletní test rozpoznávání řeči v závislosti na počtu stavů použitých (natrénovaných) HM modelů a počtu použitých různě počítaných DCT vizuálních příznaků. Při porovnání těchto testů bylo dosaženo nejlepších výsledků pro energetické DCT vizuální příznaky. Pro názornost jsou v tab. 7.4 uvedeny hodnoty rozpoznávacího skóre pro různé varianty testů, kde byla použita kombinace pěti statických a příslušných dynamických a akceleračních příznaků, tj. konfigurace u které bylo dosaženo nejlepšího rozpoznávacího skóre, viz tab druh Počet stavů HM modelů pří E 5,2 11,2 13,2 19,2 22,8 26,4 30,8 32,4 32,0 34,8 36,8 38,8 37,6 45,2 R 5,2 10,8 12,4 18,8 20,4 26,0 28,8 31,2 32,0 34,0 35,6 36,0 36,8 44,0 NR 4,8 8,0 12,0 12,8 16,8 21,2 24,4 21,6 22,4 24,0 25,2 27,2 28,8 31,6 Tab. 7.4: výsledné rozpoznávací skóre [%] v závislosti na počtu stavů HM modelů pro vizuální příznaky vybrané z nejvyšších hodnot energie E, rozptylu R nebo normovaného rozptylu NR. 7.3 Úloha rozpoznávání audio-vizuálního signálu řeči V této úloze byly provedeny testy pro vlastní audio-vizuální rozpoznávání řeči. Při vlastní fúzi akustických a vizuálních příznaků byly natrénovány čtrnáctistavové jednostreamové (dvoustreamové) celoslovní HM modely, které poté sloužily k vlastnímu rozpoznávání pomocí klasifikátoru založeném na technice HMM. 16

18 7.3.1 Jednostreamové audio-vizuální rozpoznávání řeči V tomto testu byly pro audio-vizuální rozpoznávání řeči použity jednostreamové celoslovní HM modely, pro jejichž natrénování byly sloučeny akustické a vizuální příznaky audio-vizuálního signálu řeči (slova) z trénovací databáze do jednoho příznakového vektoru. Sloučené audio-vizuální příznakové vektory z testovací databáze jsou pak použity pro vlastní audio-vizuální rozpoznávání. Počet stavů HM modelů v tomto testu byl stanoven na 14, jelikož při použití čtrnáctistavových HM modelů bylo dosaženo nejvyššího rozpoznávacího skóre jak u rozpoznávání akustického signálu řeči, tak pro rozpoznávání vizuálního signálu řeči s geometrickými vizuálními příznaky i s DCT energetickými vizuálními příznaky. Jako geometrické vizuální příznaky byly vybrány příznaky h, v, o, r a příslušné delta příznaky a jako DCT energetické příznaky bylo vybráno 5 nejvyšších DCT energetických příznaků s příslušnými delta a akceleračními příznaky. Pro obě tyto kombinace vizuálních příznaků bylo dosaženo nejvyššího rozpoznávacího skóre. Specifikace testu: Klasifikátor založený na jednostreamové celoslovní levo-pravé HM modely Počet příznaků 47 aku. + geometrické (54 aku. + DCT) Druh příznaků (kombinace aku. a viz) 39 aku. 13 x (MFCC + delta + akcelerační) 8 viz h, v, o, r + delta (15 viz 5 x (ene. DCT + delta + akcelerační)) Počet stavů HM modelů 14 Délka framu 33.3 ms Slovník 50 slov Trénovací databáze 30 mluvčích (1500 slov) Testovací databáze 5 mluvčích (250 slov) Obr. 7.4: Výsledné rozpoznávací skóre pro audio-vizuální rozpoznávání řeči s využitím geometrických vizuálních příznaků (vlevo) a DCT energetických vizuálních příznaků (vpravo) ve srovnání s rozpoznáváním samostatného akustického a vizuálního signálu řeči 17

19 Obr. 7.5: Rozdíl výsledného rozpoznávacího skóre mezi audio-vizuálním rozpoznáváním řeči (av) a rozpoznáváním řeči z akustického signálu (a), kde pro audio-vizuální rozpoznávání byly použity geometrické vizuální příznaky (G) nebo DCT energetické vizuální příznaky (DCT) Rozpoznávání SNR audio viz audio-viz av-a viz audio-viz av-a [db] (G) (G) (G) (DCT) (DCT) (DCT) 18 99,2 34,8 99,2 0,0 45,2 98,8-0, ,8 34,8 99,2 0,4 45,2 98,8 0, ,4 34,8 97,6 1,2 45,2 98,0 1, ,4 34,8 95,2 0,8 45,2 96,8 2, ,2 34,8 93,6 4,4 45,2 93,6 4, ,8 34,8 90,8 6,0 45,2 92,0 7, ,8 34,8 83,6 10,8 45,2 88,4 15, ,8 34,8 72,4 7,6 45,2 83,2 18, ,0 34,8 68,0 12,0 45,2 75,6 19,6 9 46,0 34,8 58,4 12,4 45,2 67,2 21,2 8 34,4 34,8 47,6 13,2 45,2 58,8 24,4 7 26,0 34,8 40,0 14,0 45,2 49,2 23,2 6 18,8 34,8 29,6 10,8 45,2 40,4 21,6 5 13,6 34,8 23,2 9,6 45,2 30,4 16,8 4 10,0 34,8 16,0 6,0 45,2 22,4 12,4 3 6,8 34,8 11,6 4,8 45,2 18,0 11,2 2 4,8 34,8 7,6 2,8 45,2 14,0 9,2 1 4,0 34,8 4,8 0,8 45,2 11,2 7,2 0 3,6 34,8 3,6 0,0 45,2 8,4 4,8-1 3,2 34,8 3,6 0,4 45,2 6,8 3,6-2 2,4 34,8 2,8 0,4 45,2 5,2 2,8 Tab. 7.5: Rozpoznávací skóre [%] při měnícím se SNR v akustickém signálu, pro rozpoznávání akustického signálu řeči (audio), vizuálního signálu řeči (viz) nebo pro audio-vizuálním rozpoznávání (audio-viz), kde jako vizuální příznaky byly použity geometrické (G) nebo DCT energetické příznaky (DCT). Zároveň je zde uvedena hodnota rozdílu výsledného rozpoznávacího skóre mezi audio-vizuálním rozpoznáváním řeči a rozpoznáváním řeči z akustického signálu (av-a). 18

20 Z grafů na obr a z příslušné tabulky tab. 7.5 je patrné, že vizuální složka řeči při audio-vizuálním rozpoznávání zlepšuje rozpoznávací skóre oproti samostatnému rozpoznávání akustického signálu řeči. Nejvyššího zlepšení bylo dosaženo u SNR v akustickém signálu v rozmezí 6-9 db. Při použití DCT energetických příznaků bylo u jednostreamového audio-vizuálního rozpoznávání dosaženo v průměru lepších výsledků oproti použití geometrických příznaků Dvoustreamové audio-vizuální rozpoznávání řeči Oproti jednostreamovému audio-vizuálnímu rozpoznávání řeči lze při využití dvoustreamových HM modelů nastavit pro každý stream váhu a tím zvýraznit nebo potlačit informaci nacházející se v akustickém nebo vizuálním signálu řeči. Před vlastním dvoustreamovým a-v rozpoznáváním je potřeba stanovit hodnoty jednotlivých vah výstupní funkce HM modelů Stanovení vah pro dvoustreamové audio-vizuální rozpoznávání řeči Stanovení vah se pro dvoustreamové audio-vizuální rozpoznávání řeči nejčastěji určuje experimentálně. Vzhledem ke stanovené úloze audio-vizuálního rozpoznávání řeči v hlučných podmínkách jsem vytvořil experimentální test, u kterého bylo zjišťováno výsledné rozpoznávací skóre vzhledem k nastavení vah u akustického a vizuálního streamu, kde v akustické části jsou audionahrávky zatížené šumem o průměrném SNR 5 db. Pro možnosti srovnání byl proveden stejný test i při použití originálních akustických nahrávek s průměrným SNR 18 db. (g 1 ) (g 2 ) (g 3 ) (g 4 ) Obr. 7.6: Grafy hodnot výsledného rozpoznávacího skóre v závislosti na použitých vahách akustického a vizuálního streamu při využití geometrických příznaků (g 1 : 5dB SNR, g 2 : 18dB SNR) nebo DCT energetických příznaků (g 3 : 5dB SNR, g 4 : 18dB SNR) pro audio-vizuální rozpoznávání. 19

21 Výsledné hodnoty vah pro akustický a vizuální stream byly stanoveny na základě dvou kritérií, v prvním případě byly vybrány váhy na základě nejvyšší dosažené hodnoty rozpoznávacího skóre, kde byly akustické nahrávky s přidaným šumem o SNR 5dB (grafy g 1, g 3 ). V druhém případě (dle druhého kritéria) byly hodnoty vah vybrány na základě nejvyššího součtu hodnot rozpoznávacího skóre z testů při SNR 5dB a 18dB. vizuální SNR 5 db SNR 5dB vs. 18 db příznaky roz. skóre [%] γ 1 (a) γ 2 (v) roz. skóre [%] γ 1 (a) γ 2 (v) Geometrické 64 0,1 1,8 62,4 (5), 95,2 (18) 0,3 2,8 DCT ene. 64 0,1 1,3 57,6 (5), 97,6 (18) 0,6 2,3 Tab. 7.6: Vybrané hodnoty akustické (γ 1 ) a vizuální (γ 2 ) váhy pro dvoustreamové audiovizuální rozpoznávání řeči, dle prvního a druhého kritéria Výsledky dvoustreamového audio-vizuálního rozpoznávání řeči Po stanovení hodnot akustické a vizuální váhy lze použít klasifikátor pro dvoustreamové audio-vizuální rozpoznávání založený na HMM. Počet stavů HM modelů byl v tomto testu stejný jako u jednostreamového AV-ASR, tj. 14. Stejné byly i použité geometrické a DCT vizuální příznaky. Specifikace testu: Klasifikátor založený na dvoustreamové celoslovní levo-pravé HM modely Počet příznaků 47 aku. + geometrické (54 aku. + DCT) Druh příznaků (kombinace aku. a viz) 39 aku. 13 x (MFCC + delta + akcelerační) 8 viz h, v, o, r + delta (15 viz 5 x (ene. DCT + delta + akcelerační)) Počet stavů HM modelů 14 Délka framu 33.3 ms Slovník 50 slov Trénovací databáze 30 mluvčích (1500 slov) Testovací databáze 5 mluvčích (250 slov) Obr. 7.7: Výsledné rozpoznávací skóre pro audio-vizuální rozpoznávání řeči s využitím geometrických příznaků (vlevo) a DCT energetických příznaků (vpravo) ve srovnání s rozpoznáváním samostatného akustického a vizuálního signálu řeči, kde pro dvoustreamové audio-vizuální rozpoznávání byly využity vybrané váhy z tab. 8.7 a pro porovnání byly navíc použity pro oba streamy stejné váhy 1.0,

22 Rozpoznávání SNR audio viz 1.0 audio av-a 0.1 audio av-a 0.3 audio av-a [db] 1.0 viz 1.8 viz 2.8 viz 18 99,2 34,8 99,2 0,0 88,8-10,4 95,2-4, ,8 34,8 99,2 0,4 86,8-12,0 94,4-4, ,4 34,8 97,6 1,2 85,2-11,2 93,6-2, ,4 34,8 95,2 0,8 84,4-10,0 93,2-1, ,2 34,8 93,6 4,4 83,6-5,6 91,6 2, ,8 34,8 90,8 6,0 82,0-2,8 90,0 5, ,8 34,8 83,6 10,8 80,8 8,0 87,6 14, ,8 34,8 72,4 7,6 79,2 14,4 84,8 20, ,0 34,8 68,0 12,0 76,8 20,8 82,0 26,0 9 46,0 34,8 58,4 12,4 74,8 28,8 78,0 32,0 8 34,4 34,8 47,6 13,2 71,6 37,2 76,0 41,6 7 26,0 34,8 40,0 14,0 69,6 43,6 72,4 46,4 6 18,8 34,8 29,6 10,8 67,6 48,8 65,2 46,4 5 13,6 34,8 23,2 9,6 64,0 50,4 62,4 48,8 4 10,0 34,8 16,0 6,0 59,2 49,2 55,6 45,6 3 6,8 34,8 11,6 4,8 54,8 48,0 47,6 40,8 2 4,8 34,8 7,6 2,8 50,8 46,0 43,2 38,4 1 4,0 34,8 4,8 0,8 48,0 44,0 38,4 34,4 0 3,6 34,8 3,6 0,0 44,8 41,2 34,4 30,8-1 3,2 34,8 3,6 0,4 42,0 38,8 30,4 27,2-2 2,4 34,8 2,8 0,4 40,0 37,6 26,8 24,4 Tab. 7.7: Rozpoznávací skóre [%] při měnícím se SNR v akustickém signálu, pro rozpoznávání akustického signálu řeči (audio), vizuálního signálu řeči (viz) nebo pro audio-vizuálním rozpoznávání (audio-viz), kde jako vizuální příznaky byly použity geometrické příznaky. Zároveň jsou zde uvedeny hodnoty rozdílu výsledného rozpoznávacího skóre mezi audio-vizuálním rozpoznáváním řeči a rozpoznáváním řeči z akustického signálu (av-a) pro různě zvolené váhy akustického a vizuálního streamu. Obr. 7.8: Rozdíl výsledného rozpoznávacího skóre mezi audio-vizuálním rozpoznáváním řeči (av) a rozpoznáváním řeči z akustického signálu (a), kde pro audio-vizuální rozpoznávání byly použity geometrické vizuální příznaky a různě zvolené váhy akustického a vizuálního streamu. 21

23 Rozpoznávání SNR audio viz 1.0 audio av-a 0.1 audio av-a 0.3 audio av-a [db] 1.0 viz 1.8 viz 2.8 viz 18 99,2 45,2 98,8-0,4 83,6-15,6 97,6-1, ,8 45,2 98,8 0,0 81,6-17,2 96,4-2, ,4 45,2 98,0 1,6 80,4-16,0 96,0-0, ,4 45,2 96,8 2,4 80,0-14,4 94,8 0, ,2 45,2 93,6 4,4 77,6-11,6 93,6 4, ,8 45,2 92,0 7,2 76,4-8,4 92,4 7, ,8 45,2 88,4 15,6 75,6 2,8 89,6 16, ,8 45,2 83,2 18,4 72,8 8,0 88,0 23, ,0 45,2 75,6 19,6 70,0 14,0 85,2 29,2 9 46,0 45,2 67,2 21,2 70,0 24,0 77,6 31,6 8 34,4 45,2 58,8 24,4 68,4 34,0 73,6 39,2 7 26,0 45,2 49,2 23,2 67,2 41,2 68,8 42,8 6 18,8 45,2 40,4 21,6 64,0 45,2 63,2 44,4 5 13,6 45,2 30,4 16,8 64,0 50,4 57,6 44,0 4 10,0 45,2 22,4 12,4 60,0 50,0 48,4 38,4 3 6,8 45,2 18,0 11,2 55,2 48,4 43,6 36,8 2 4,8 45,2 14,0 9,2 50,8 46,0 38,0 33,2 1 4,0 45,2 11,2 7,2 47,2 43,2 33,2 29,2 0 3,6 45,2 8,4 4,8 44,8 41,2 25,6 22,0-1 3,2 45,2 6,8 3,6 41,2 38,0 22,0 18,8-2 2,4 45,2 5,2 2,8 37,2 34,8 19,2 16,8 Tab. 7.8: Rozpoznávací skóre [%] při měnícím se SNR v akustickém signálu, pro rozpoznávání akustického signálu řeči (audio), vizuálního signálu řeči (viz) nebo pro audio-vizuálním rozpoznávání (audio-viz), kde jako vizuální příznaky byly použity DCT energetické příznaky. Zároveň jsou zde uvedeny hodnoty rozdílu výsledného rozpoznávacího skóre mezi audio-vizuálním rozpoznáváním řeči a rozpoznáváním řeči z akustického signálu (av-a) pro různě zvolené váhy akustického a vizuálního streamu. Obr. 7.9: Rozdíl výsledného rozpoznávacího skóre mezi audio-vizuálním rozpoznáváním řeči (av) a rozpoznáváním řeči z akustického signálu (a), kde pro audio-vizuální rozpoznávání byly použity DCT energetické vizuální příznaky a různě zvolené váhy akustického a vizuálního streamu. 22

24 Obr. 7.10: Porovnání rozdílu výsledného rozpoznávacího skóre mezi audio-vizuálním rozpoznáváním řeči (av) a rozpoznáváním řeči z akustického signálu (a), kde pro audio-vizuální rozpoznávání byly použity DCT energetické (DCT) nebo geometrické (G) vizuální příznaky a různě zvolené váhy akustického a vizuálního streamu Celkové zhodnocení experimentů pro audio-vizuální rozpoznávání řeči Při dvoustreamovém audio-vizuálním rozpoznávání izolovaných slov (s hodnotami vah streamu dle tab. 7.6) bylo u našich nahrávek z AV databáze AVDB2cz v průměru dosaženo lepších výsledků zvýšení rozpoznávacího skóre než u jednostreamového audio-vizuálního rozpoznávání ve srovnání se samostatným rozpoznáváním akustického signálu. Přičemž hodnoty rozpoznávacího skóre u jednostreamového rozpoznávání jsou dle původního předpokladu shodné jako u dvoustreamového rozpoznávání se shodnými hodnotami vah 1.0 pro akustický i vizuální stream. U vah stanovených dle prvního a druhého kritéria (tab. 7.6) bylo v průměru dosaženo lepších výsledných hodnot rozpoznávacího skóre pro geometrické vizuální příznaky oproti DCT energetickým vizuálním příznakům. U jednostreamového audio-vizuálního rozpoznávání bylo naopak dosaženo v průměru lepších výsledků při použití DCT energetických vizuálních příznaků oproti použití geometrických vizuálních příznaků. 8 Závěr V průběhu posledních třiceti let se z oblasti počítačového zpracování a rozpoznávání řeči vydělila celá řada aplikačních oblastí, jednou z těchto oblastí je i audio-vizuální zpracování a rozpoznávání audio-vizuálního signálu řeči, kterou se zabývá tato práce. Jedním z hlavních důvodů vzniku této práce tak bylo rozšířit oblast počítačového zpracování a rozpoznávání řeči, jejíž vývoj a výzkum probíhá v Laboratoři počítačového zpracování řeči na TU v Liberci pod vedením Prof. Ing. Jana Nouzy, CSc. již více než 10 let. Dalším důvodem bylo, že audio-vizuální rozpoznávání řeči pro český jazyk bylo v době vzniku této práce (2001) v naprostých začátcích a neexistovala tak ani žádná dostupná kvalitní audio-vizuální databáze pro český jazyk. Vývoj a výzkum v oblasti audio-vizuálního rozpoznávání řeči ve světě je veden již více než 20 let a do dnešní doby existuje celá řada publikací věnovaná tomuto tématu. Dostupnou literaturu jsem se snažil pokud možno co nejvíce prostudovat a popsané algoritmy pro zpracování a rozpoznávání vizuálního signálu řeči aplikovat, přesto tyto algoritmy nejsou stoprocentně přenositelné a použitelné, jelikož zpracování obrazového 23

25 signálu je dosti výpočetně náročné a při experimentech se volí různá zjednodušení a dosti také záleží na použité audio-vizuální databázi. Proto většina zde popsaných algoritmů vznikla mou vlastní invencí nebo se jedná o modifikace algoritmů jiných autorů, kteří jsou citování v odkazech této práce. Celá problematika, především zpracování a rozpoznávání vizuálního signálu řeči, musela být v této práci komplexně řešena a zasahuje do celé řady oborů. Všechny stanovené cíle této práce byly i přes velkou časovou náročnost postupně vyřešeny, tj. byly vytvořeny dvě audio-vizuální databáze promluv pro český jazyk. Pro zpracování nahrávek z této databáze byl vytvořen komplexní program. Dále byl vytvořen program pro parametrizaci vizuálního signálu řeči skládající se z detektoru lidské tváře v obraze, systému pro nalezení rtů a vlastního systému pro parametrizaci vizuálního signálu, pomocí kterého jsou vytvářeny tvarové vizuální příznaky a vizuální DCT příznaky popisující informační obsah obrazu. Dále byly řešeny otázky fúze akustických a vizuálních příznaků a byly vytvořeny experimentální testy pro audiovizuálního rozpoznávání izolovaných slov, při srovnání se samostatným rozpoznáváním akustického a vizuálního signálu řeči. Závěrem byly navrženy testy pro audio-vizuální rozpoznávání izolovaných slov v hlučných podmínkách, při kterých se potvrdilo, že vizuální složka řeči může zlepšit rozpoznávací skóre v hlučných podmínkách. V následující tabulce je uveden výběr výsledků z těchto testů na experimentální množině 1750 slov z audio-vizuální databáze AVDB2cz. Odstup signálu od šumu SNR [db] Rozpoznávání akustického signálu řeči [%] Rozpoznávání vízuálního signálu řeči [%] DCT) 45.2( G) 34.8) Jednostreamové audio-vizuální rozpoznávání [%] DCT) 30.4( G) 23.2) Dvoustreamové audio-vizuální rozpoznávání [%] DCT) 64.0( G) 64.0) Tab. 8.1: Vybrané hodnoty rozpoznávacího skóre [%] z experimentálních testů pro rozpoznávání akustického signálu, vizuálního signálu řeči a pro jednostreamové a dvoustreamové audio-vizuální rozpoznávání řeči, kde jako vizuální příznaky byly použity geometrické (G) nebo DCT energetické vizuální příznaky. Z výše uvedené tabulky je patrné, že vizuální složka řeči může výrazně zlepšit rozpoznávací skóre v hlučných podmínkách (zde např. pro 5 db SNR). 8.1 Přínosy disertační práce Nejdůležitější výsledky této disertační práce lze shrnout do následujících bodů: Vytvoření dvou audio-vizuálních databází AVDB1cz, AVDB2cz videonahrávek izolovaných slov i celých vět pro český jazyk. Vytvoření programu pro zpracování nahrávek z této databáze. Navržení a vytvoření systému pro detekování lidského obličeje, založeného na barevné a tvarové segmentaci obrazu a systému pro nalezení rtů v detekované oblasti zájmu. Oba tyto systémy byly navrženy a naprogramovány tak, aby byly co nejspolehlivější a zároveň výpočetně časově rychlé. Jednotlivé části těchto systémů 24

26 byly publikovány na mezinárodních konferencích, například na mezinárodní konferenci ICSLP 2004 pořádané v Jižní Koreji [14]. Vytvoření komplexního systému pro parametrizaci vizuálního signálu, pomocí kterého jsou vytvářeny tvarové vizuální příznaky a vizuální DCT příznaky popisující informační obsah obrazu. Návrh a experimentální ověření možností fúze a rozpoznávání audio-vizuálního signálu řeči v hlučných podmínkách. 8.2 Aplikační oblasti V dnešní době existuje celá řada aplikačních oblastí využití audio-vizuálního zpracování a rozpoznávání řeči, z nichž jmenujme například: vlastní audio-vizuální rozpoznávání řeči, audio-vizuální rozpoznávání řeči v hlučných podmínkách, audio-vizuální detekce mluvčího v prostoru, audio-vizuální identifikace mluvčích, audio-vizuální verifikace mluvčích, audio-vizuální segmentace řeči, audio-vizuální syntéza řeči. Další z možných aplikačních oblastí při využití audio-vizuálního zpracování a rozpoznávání řeči je vytváření pomůcek pro výuku řeči nebo pomůcek pro sluchově nebo pohybově postižené lidi. 8.3 Náměty na další práci Další výzkumná práce nyní směřuje k vývoji a vytvoření audio-vizuálního rozpoznávače řeči založeného na modelech menších stavebních jednotek řeči (fonémy a vizémy). V blízké budoucnosti bych také rád vylepšil svůj počítačový model česky mluvící hlavy, který vznikl v počátcích mé disertační práce (2002) a u kterého by bylo možné nově použít poznatky získané při tvorbě systému pro audio-vizuální rozpoznávání řeči. 9 Literatura [1] POTAMIANOS, G., NETI, C., IYENGAR, G., HELMUTH, E.: Largevocabulary audio-visual speech recognition by machines and humans, In Proc. Eurospeech, Aalborg, [2] POTAMIANOS, G., NETI, C., LUETTIN, J., MATTHEWS, I.: Audio-Visual Automatic Speech Recognition: An Overview. In: Issues in Visual and Audio- Visual Speech Processing, G. Bailly, E. Vatikiotis-Bateson, and P. Perrier (Eds.), MIT Press (In Press), 2004 [3] CONNELL, J., H., HAAS, N., MARCHERET, E., NETI, C., POTAMIANOS, G., VELIPASALAR, S.: A real-time prototype for small-vocabulary audiovisual ASR, In Proc. Int. Conf. Multimedia Expo., vol. II, pp , Baltimore, July 2003 [4] OBRECHT, R., A., JACOB, B., PARLANGEAU, N.: Audio-visual speech recognition and segmentation master slave HMM. In Proc. of Europ. Tut. Works: Audio-Visual Speech Processing, Rhodes, Greece, pp , 1997 [5] KRONE, G., TALLE, B., WICHERT, A., PALM, G.: Neural architectures for sensorfusion in speech recognition. In Proc. of Europ. Tut. Works: Audio-Visual Speech Processing, Rhodes, Greece, pp ,

Klasifikace Landau-Kleffnerova syndromu

Klasifikace Landau-Kleffnerova syndromu Klasifikace Landau-Kleffnerova syndromu malých dětí 1. Abstrakt Petr Zlatník ČVUT FEL, K13131 Katedra teorie obvodů Tento příspěvěk pojednává o klasifikaci Landau-Kleffnerova syndromu, který se projevuje

Více

Využití algoritmu DTW pro vyhodnocování vad řeči dětí postižených Landau-Kleffnerovým syndromem (LKS)

Využití algoritmu DTW pro vyhodnocování vad řeči dětí postižených Landau-Kleffnerovým syndromem (LKS) Využití algoritmu DTW pro vyhodnocování vad řeči dětí postižených Landau-Kleffnerovým syndromem (LKS) Petr Zlatník České vysoké učení technické v Praze, Fakulta elektrotechnická zlatnip@fel.cvut.cz Abstrakt:

Více

vzorek1 0.0033390 0.0047277 0.0062653 0.0077811 0.0090141... vzorek 30 0.0056775 0.0058778 0.0066916 0.0076192 0.0087291

vzorek1 0.0033390 0.0047277 0.0062653 0.0077811 0.0090141... vzorek 30 0.0056775 0.0058778 0.0066916 0.0076192 0.0087291 Vzorová úloha 4.16 Postup vícerozměrné kalibrace Postup vícerozměrné kalibrace ukážeme na úloze C4.10 Vícerozměrný kalibrační model kvality bezolovnatého benzinu. Dle následujících kroků na základě naměřených

Více

Ubytování účastníků na konferenci SANM 05

Ubytování účastníků na konferenci SANM 05 Ubytování účastníků na konferenci SANM 05 Hotel Srní - budova A pokoj C112 Heinrich Voss Německo pokoj C113 Prof. RNDr. Ivo Marek, DrSc. ČVUT FSv 166 29 Praha 6 pokoj C114 Ing. Ivan Hlaváček, DrSc. MÚ

Více

K metodám převodu souřadnic mezi ETRS 89 a S-JTSK na území ČR

K metodám převodu souřadnic mezi ETRS 89 a S-JTSK na území ČR K metodám převodu souřadnic mezi ETRS 89 a S-JTSK na území ČR Vlastimil Kratochvíl * Příspěvek obsahuje popis vlastností některých postupů, využitelných pro transformaci souřadnic mezi geodetickými systémy

Více

Třídění statistických dat

Třídění statistických dat 2.1 Třídění statistických dat Všechny muže ve městě rozdělíme na 2 skupiny: A) muži, kteří chodí k holiči B) muži, kteří se holí sami Do které skupiny zařadíme holiče? prof. Raymond M. Smullyan, Dr. Math.

Více

Přehled vhodných metod georeferencování starých map

Přehled vhodných metod georeferencování starých map Přehled vhodných metod georeferencování starých map ČVUT v Praze, katedra geomatiky 12. 3. 2015 Praha Georeferencování historická mapa vs. stará mapa georeferencování umístění obrazu mapy do referenčního

Více

Semestrální práce z předmětu Matematika 6F

Semestrální práce z předmětu Matematika 6F vypracoval: Jaroslav Nušl dne: 17.6.24 email: nusl@cvut.org Semestrální práce z předmětu Matematika 6F Zádání: Cílem semestrální práce z matematiky 6F bylo zkoumání hudebního signálu. Pluginem ve Winampu

Více

VYUŽITÍ MATLAB WEB SERVERU PRO INTERNETOVOU VÝUKU ANALÝZY DAT A ŘÍZENÍ JAKOSTI

VYUŽITÍ MATLAB WEB SERVERU PRO INTERNETOVOU VÝUKU ANALÝZY DAT A ŘÍZENÍ JAKOSTI VYUŽITÍ MATLAB WEB SERVERU PRO INTERNETOVOU VÝUKU ANALÝZY DAT A ŘÍZENÍ JAKOSTI Aleš Linka 1, Petr Volf 2 1 Katedra textilních materiálů, FT TUL, 2 Katedra aplikované matematiky, FP TUL ABSTRAKT. Internetové

Více

Analýza profilu povrchů pomocí interferometrie nízké koherence

Analýza profilu povrchů pomocí interferometrie nízké koherence Analýza profilu povrchů pomocí interferometrie nízké koherence Vedoucí bakalářské práce Ing. Zdeněk Buchta, Ph.D. Tomáš Pikálek 26. června 214 1 / 11 Cíle práce Cíle práce Cíle práce seznámit se s laserovou

Více

Petr Zlatník, Roman Čmejla. Katedra teorie obvodů, Fakulta elektrotechnická, ČVUT, Praha. Abstrakt

Petr Zlatník, Roman Čmejla. Katedra teorie obvodů, Fakulta elektrotechnická, ČVUT, Praha. Abstrakt Vyhodnocování promluv dětí s poruchami řeči Petr Zlatník, Roman Čmejla Katedra teorie obvodů, Fakulta elektrotechnická, ČVUT, Praha Abstrakt Příspěvek popisuje metodu, která byla vyvinuta pro vyhodnocení

Více

24.11.2009 Václav Jirchář, ZTGB

24.11.2009 Václav Jirchář, ZTGB 24.11.2009 Václav Jirchář, ZTGB Síťová analýza 50.let V souvislosti s potřebou urychlit vývoj a výrobu raket POLARIS v USA při závodech ve zbrojení za studené války se SSSR V roce 1958 se díky aplikaci

Více

Vysoká škola báňská technická univerzita Ostrava. Fakulta elektrotechniky a informatiky

Vysoká škola báňská technická univerzita Ostrava. Fakulta elektrotechniky a informatiky Vysoká škola báňská technická univerzita Ostrava Fakulta elektrotechniky a informatiky Bankovní účty (semestrální projekt statistika) Tomáš Hejret (hej124) 18.5.2013 Úvod Cílem tohoto projektu, zadaného

Více

Projekt IMPLEMENTACE ŠVP. pořadí početních operací, dělitelnost, společný dělitel a násobek, základní početní operace

Projekt IMPLEMENTACE ŠVP. pořadí početních operací, dělitelnost, společný dělitel a násobek, základní početní operace Střední škola umělecká a řemeslná Evropský sociální fond "Praha a EU: Investujeme do vaší budoucnosti" Projekt IMPLEMENTACE ŠVP Evaluace a aktualizace metodiky předmětu Matematika Výrazy Obory nástavbového

Více

Metodika zpracování bakalářských a diplomových prací. Zdeněk Plíva Jindra Drábková Jan Koprnický Leoš Petržílka

Metodika zpracování bakalářských a diplomových prací. Zdeněk Plíva Jindra Drábková Jan Koprnický Leoš Petržílka Metodika zpracování bakalářských a diplomových prací Zdeněk Plíva Jindra Drábková Jan Koprnický Leoš Petržílka Liberec 2014 2 Times New Roman Century Cambria Garamond Myriad Pro Calibri Arial

Více

Experimentáln. lní toků ve VK EMO. XXX. Dny radiační ochrany Liptovský Ján 10.11.-14.11.2008 Petr Okruhlica, Miroslav Mrtvý, Zdenek Kopecký. www.vf.

Experimentáln. lní toků ve VK EMO. XXX. Dny radiační ochrany Liptovský Ján 10.11.-14.11.2008 Petr Okruhlica, Miroslav Mrtvý, Zdenek Kopecký. www.vf. Experimentáln lní měření průtok toků ve VK EMO XXX. Dny radiační ochrany Liptovský Ján 10.11.-14.11.2008 Petr Okruhlica, Miroslav Mrtvý, Zdenek Kopecký Systém měření průtoku EMO Měření ve ventilačním komíně

Více

Neuronové časové řady (ANN-TS)

Neuronové časové řady (ANN-TS) Neuronové časové řady (ANN-TS) Menu: QCExpert Prediktivní metody Neuronové časové řady Tento modul (Artificial Neural Network Time Series ANN-TS) využívá modelovacího potenciálu neuronové sítě k predikci

Více

JAK LZE VYUŽÍT GRAFICKÉHO ZOBRAZENÍ AKUSTICKÉHO SIGNÁLU PŘI VÝUCE JAZYKA A SPRÁVNÉ VÝSLOVNOSTI

JAK LZE VYUŽÍT GRAFICKÉHO ZOBRAZENÍ AKUSTICKÉHO SIGNÁLU PŘI VÝUCE JAZYKA A SPRÁVNÉ VÝSLOVNOSTI JAK LZE VYUŽÍT GRAFICKÉHO ZOBRAZENÍ AKUSTICKÉHO SIGNÁLU PŘI VÝUCE JAZYKA A SPRÁVNÉ VÝSLOVNOSTI Jana Mádlíková - Jan Nouza Laboratoř počítačového zpracování řeči na Technické univerzitě v Liberci se již

Více

VYUŽITÍ GRAFICKÉHO UŽIVATELSKÉHO ROZHRANÍ MATLABU VE VÝZKUMU A VÝUCE MĚŘENÍ

VYUŽITÍ GRAFICKÉHO UŽIVATELSKÉHO ROZHRANÍ MATLABU VE VÝZKUMU A VÝUCE MĚŘENÍ VYUŽITÍ GRAFICKÉHO UŽIVATELSKÉHO ROZHRANÍ MATLABU VE VÝZKUMU A VÝUCE MĚŘENÍ Jan Blaška 1, Michal Krumpholc 2, Miloš Sedláček 2 1 Elektrosystem, spol. s.r.o., Brno 2 České vysoké učení technické v Praze

Více

16 - Pozorovatel a výstupní ZV

16 - Pozorovatel a výstupní ZV 16 - Pozorovatel a výstupní ZV Automatické řízení 2015 14-4-15 Hlavní problém stavové ZV Stavová zpětná vazba se zdá být nejúčinnějším nástrojem řízení, důvodem je síla pojmu stav, který v sobě obsahuje

Více

Technický boroskop zařízení na monitorování spalovacích procesů

Technický boroskop zařízení na monitorování spalovacích procesů Technický boroskop zařízení na monitorování spalovacích procesů Katedra experimentální fyziky PřF UP Olomouc Doc. Ing. Luděk Bartoněk, Ph.D. Zvyšování účinnosti spalovacích procesů v různých odvětvích

Více

KURZ VYSPĚLÉ TECHNOLOGIE (KA 14)

KURZ VYSPĚLÉ TECHNOLOGIE (KA 14) KURZ VYSPĚLÉ TECHNOLOGIE (KA 14) 1. Úvod Cílem kurzu Vyspělé technologie bylo získání uceleného přehledu o současných trendech vývoje vyspělých technologií, které určují zaměření vůdčích světových aktivit

Více

Zápis ze 4. zasedání vědecké rady Fakulty mechatroniky a mezioborových inženýrských studií, konané dne 19. listopadu 2003

Zápis ze 4. zasedání vědecké rady Fakulty mechatroniky a mezioborových inženýrských studií, konané dne 19. listopadu 2003 Děkanát Fakulty mechatroniky a mezioborových inženýrských studií Technické univerzity v Liberci Zápis ze 4. zasedání vědecké rady Fakulty mechatroniky a mezioborových inženýrských studií, konané dne 19.

Více

ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE FAKULTA STAVEBNÍ, OBOR GEODÉZIE A KARTOGRAFIE KATEDRA MAPOVÁNÍ A KARTOGRAFIE

ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE FAKULTA STAVEBNÍ, OBOR GEODÉZIE A KARTOGRAFIE KATEDRA MAPOVÁNÍ A KARTOGRAFIE ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE FAKULTA STAVEBNÍ, OBOR GEODÉZIE A KARTOGRAFIE KATEDRA MAPOVÁNÍ A KARTOGRAFIE název předmětu TOPOGRAFICKÁ A TEMATICKÁ KARTOGRAFIE číslo úlohy název úlohy 2 Tvorba tematických

Více

MATEMATIKA Maturitní témata společná část MZ základní úroveň (vychází z Katalogu požadavků MŠMT)

MATEMATIKA Maturitní témata společná část MZ základní úroveň (vychází z Katalogu požadavků MŠMT) MATEMATIKA Maturitní témata společná část MZ základní úroveň (vychází z Katalogu požadavků MŠMT) 1. Číselné obory 1.1 Přirozená čísla provádět aritmetické operace s přirozenými čísly rozlišit prvočíslo

Více

DTW. Petr Zlatník, Roman Čmejla. zlatnip@fel.cvut.cz, cmejla@fel.cvut.cz. Abstrakt: Příspěvek popisuje metodu, která byla vyvinuta pro vyhodnocení

DTW. Petr Zlatník, Roman Čmejla. zlatnip@fel.cvut.cz, cmejla@fel.cvut.cz. Abstrakt: Příspěvek popisuje metodu, která byla vyvinuta pro vyhodnocení Vyhodnocování vad řeči dětí s využitím algoritmu DTW Petr Zlatník, Roman Čmejla České vysoké učení technické v Praze, Fakulta elektrotechnická zlatnip@fel.cvut.cz, cmejla@fel.cvut.cz Abstrakt: Příspěvek

Více

Dispečink telemetrických dat

Dispečink telemetrických dat CORAL s.r.o., Veverkova 1343, 500 02 Hradec Králové IČO: 46506829 DIČ: 228-46506829 tel.: 498 500 469 fax: 498 500 435 e-mail: coral@coral.cz http://www.coral.cz Dispečink telemetrických dat Oblast použití

Více

TÉMA DIPLOMOVÉ PRÁCE

TÉMA DIPLOMOVÉ PRÁCE ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ FAKULTA STAVEBNÍ KATEDRA ZDRAVOTNÍHO A EKOLOGICKÉHO INŽENÝRSTVÍ TÉMA DIPLOMOVÉ PRÁCE DIPLOMOVÁ PRÁCE JMÉNO a PŘÍJMENÍ Vedoucí diplomové práce: Tituly, jméno příjmení, titul

Více

Požadavky na konkrétní dovednosti a znalosti z jednotlivých tematických celků

Požadavky na konkrétní dovednosti a znalosti z jednotlivých tematických celků Maturitní zkouška z matematiky 2012 požadované znalosti Zkouška z matematiky ověřuje matematické základy formou didaktického testu. Test obsahuje uzavřené i otevřené úlohy. V uzavřených úlohách je vždy

Více

2 Zpracování naměřených dat. 2.1 Gaussův zákon chyb. 2.2 Náhodná veličina a její rozdělení

2 Zpracování naměřených dat. 2.1 Gaussův zákon chyb. 2.2 Náhodná veličina a její rozdělení 2 Zpracování naměřených dat Důležitou součástí každé experimentální práce je statistické zpracování naměřených dat. V této krátké kapitole se budeme věnovat určení intervalů spolehlivosti získaných výsledků

Více

Úloha 1. Napište matici pro případ lineárního regresního spline vyjádřeného přes useknuté

Úloha 1. Napište matici pro případ lineárního regresního spline vyjádřeného přes useknuté Úloha 1. Napište matici pro případ lineárního regresního spline vyjádřeného přes useknuté polynomy pro případ dvou uzlových bodů ξ 1 = 1 a ξ 2 = 4. Experimentální body jsou x = [0.2 0.4 0.6 1.5 2.0 3.0

Více

POPTÁVKA PO VEŘEJNÉ DOPRAVĚ V ZÁVISLOSTI NA ŠKOLSTVÍ V KRAJI TRANSPORT DEMAND DEPENDS ON EDUCATION ON REGIONS

POPTÁVKA PO VEŘEJNÉ DOPRAVĚ V ZÁVISLOSTI NA ŠKOLSTVÍ V KRAJI TRANSPORT DEMAND DEPENDS ON EDUCATION ON REGIONS POPTÁVKA PO VEŘEJNÉ DOPRAVĚ V ZÁVISLOSTI NA ŠKOLSTVÍ V KRAJI TRANSPORT DEMAND DEPENDS ON EDUCATION ON REGIONS Kateřina Pojkarová Anotace:Dopravu vužívají lidé za různým účelem, mimo jiné i ke svým cestám

Více

Základy zpracování obrazu

Základy zpracování obrazu Základy zpracování obrazu Tomáš Mikolov, FIT VUT Brno V tomto cvičení si ukážeme základní techniky používané pro digitální zpracování obrazu. Pro jednoduchost budeme pracovat s obrázky ve stupních šedi

Více

Uživatelská příručka programu CEWE fotosvět profi

Uživatelská příručka programu CEWE fotosvět profi Uživatelská příručka programu CEWE fotosvět profi Program CEWE fotosvět profi Vám umožní pomocí Adobe InDesign objednat CEWE FOTOKNIHU. Abyste vše zvládli správně na první pokus, přečtěte si prosím níže

Více

Přehledy pro Tabulky Hlavním smyslem této nové agendy je jednoduché řazení, filtrování a seskupování dle libovolných sloupců.

Přehledy pro Tabulky Hlavním smyslem této nové agendy je jednoduché řazení, filtrování a seskupování dle libovolných sloupců. Přehledy pro Tabulky V programu CONTACT Professional 5 naleznete u firem, osob a obchodních případů záložku Tabulka. Tuto záložku lze rozmnožit, přejmenovat a sloupce je možné definovat dle vlastních požadavků

Více

Manuál ISES pro laboratorní práce elektřina a magnetismus

Manuál ISES pro laboratorní práce elektřina a magnetismus Manuál ISES pro laboratorní práce elektřina a magnetismus Novinky ISES pro XP: Vzorkovací frekvence může být až 100 000 Hz. Krokový start se provádí klávesou MEZERNÍK a nikoli ENTER. Při každém měření

Více

6.1 Normální (Gaussovo) rozdělení

6.1 Normální (Gaussovo) rozdělení 6 Spojitá rozdělení 6.1 Normální (Gaussovo) rozdělení Ze spojitých rozdělení se v praxi setkáme nejčastěji s normálním rozdělením. Toto rozdělení je typické pro mnoho náhodných veličin z rozmanitých oborů

Více

Reprodukce obrazových předloh

Reprodukce obrazových předloh fialar@kma.zcu.cz Podpořeno z projektu FRVŠ 584/2011 Historie Reprodukční fotografie V reprodukční fotografii se používají různé postupy pro reprodukci pérovek (pouze černá a bílá) jednoduché (viz přednáška

Více

MATEMATIKA MAHZD14C0T01 DIDAKTICKÝ TEST. 2.1 Pokyny k otevřeným úlohám. 1 Základní informace k zadání zkoušky. 2.2 Pokyny k uzavřeným úlohám

MATEMATIKA MAHZD14C0T01 DIDAKTICKÝ TEST. 2.1 Pokyny k otevřeným úlohám. 1 Základní informace k zadání zkoušky. 2.2 Pokyny k uzavřeným úlohám MATEMATIKA DIDAKTICKÝ TEST MAHZD14C0T01 Maximální bodové hodnocení: 50 bodů Hranice úspěšnosti: 33 % 1 Základní informace k zadání zkoušky Didaktický test obsahuje 26 úloh. Časový limit pro řešení didaktického

Více

RÁMCOVÝ VZDĚLÁVACÍ PROGRAM PRO ZÍSKÁNÍ SPECIALIZOVANÉ ZPŮSOBILOSTI. v oboru KLINICKÁ TECHNIKA SE ZAMĚŘENÍM NA ANALÝZU A ZPRACOVÁNÍ BIOSIGNÁLŮ.

RÁMCOVÝ VZDĚLÁVACÍ PROGRAM PRO ZÍSKÁNÍ SPECIALIZOVANÉ ZPŮSOBILOSTI. v oboru KLINICKÁ TECHNIKA SE ZAMĚŘENÍM NA ANALÝZU A ZPRACOVÁNÍ BIOSIGNÁLŮ. RÁMCOVÝ VZDĚLÁVACÍ PROGRAM PRO ZÍSKÁNÍ SPECIALIZOVANÉ ZPŮSOBILOSTI v oboru KLINICKÁ TECHNIKA SE ZAMĚŘENÍM NA ANALÝZU A ZPRACOVÁNÍ BIOSIGNÁLŮ pro BIOMEDICÍNSKÉ TECHNIKY 1. Cíl specializačního vzdělávání

Více

SOLVER UŽIVATELSKÁ PŘÍRUČKA. Kamil Šamaj, František Vižďa Univerzita obrany, Brno, 2008 Výzkumný záměr MO0 FVT0000404

SOLVER UŽIVATELSKÁ PŘÍRUČKA. Kamil Šamaj, František Vižďa Univerzita obrany, Brno, 2008 Výzkumný záměr MO0 FVT0000404 SOLVER UŽIVATELSKÁ PŘÍRUČKA Kamil Šamaj, František Vižďa Univerzita obrany, Brno, 2008 Výzkumný záměr MO0 FVT0000404 1. Solver Program Solver slouží pro vyhodnocení experimentálně naměřených dat. Základem

Více

Úvodem Dříve les než stromy 3 Operace s maticemi

Úvodem Dříve les než stromy 3 Operace s maticemi Obsah 1 Úvodem 13 2 Dříve les než stromy 17 2.1 Nejednoznačnost terminologie 17 2.2 Volba metody analýzy dat 23 2.3 Přehled vybraných vícerozměrných metod 25 2.3.1 Metoda hlavních komponent 26 2.3.2 Faktorová

Více

5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza

5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza 5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza 5.1 Vícerozměrná data a vícerozměrná rozdělení Při zpracování vícerozměrných dat se hledají souvislosti mezi dvěma, případně

Více

Analýza dat s využitím MS Excel

Analýza dat s využitím MS Excel Analýza dat s využitím MS Excel Seminář aplikované statistiky Martina Litschmannová Několik fíglů na úvod Absolutní vs. relativní adresování změna pomocí F4 =$H$20 =H$20 =$H20 =H20 Posun po souvislé oblasti

Více

Simulace. Simulace dat. Parametry

Simulace. Simulace dat. Parametry Simulace Simulace dat Menu: QCExpert Simulace Simulace dat Tento modul je určen pro generování pseudonáhodných dat s danými statistickými vlastnostmi. Nabízí čtyři typy rozdělení: normální, logaritmicko-normální,

Více

Gymnázium Vysoké Mýto nám. Vaňorného 163, 566 01 Vysoké Mýto

Gymnázium Vysoké Mýto nám. Vaňorného 163, 566 01 Vysoké Mýto Gymnázium Vysoké Mýto nám. Vaňorného 163, 566 01 Vysoké Mýto Registrační číslo projektu Šablona Autor Název materiálu / Druh CZ.1.07/1.5.00/34.0951 III/2 INOVACE A ZKVALITNĚNÍ VÝUKY PROSTŘEDNICTVÍM ICT

Více

Termistor. Teorie: Termistor je polovodičová součástka, jejíž odpor závisí na teplotě přibližně podle vzorce

Termistor. Teorie: Termistor je polovodičová součástka, jejíž odpor závisí na teplotě přibližně podle vzorce ermistor Pomůcky: Systém ISES, moduly: teploměr, ohmmetr, termistor, 2 spojovací vodiče, stojan s držáky, azbestová síťka, kádinka, voda, kahan, zápalky, soubor: termistor.imc. Úkoly: ) Proměřit závislost

Více

2.1 Pokyny k otevřeným úlohám. 2.2 Pokyny k uzavřeným úlohám TESTOVÝ SEŠIT NEOTVÍREJTE, POČKEJTE NA POKYN!

2.1 Pokyny k otevřeným úlohám. 2.2 Pokyny k uzavřeným úlohám TESTOVÝ SEŠIT NEOTVÍREJTE, POČKEJTE NA POKYN! MATEMATIKA DIDAKTICKÝ TEST MAIZD15C0T01 Maximální bodové hodnocení: 50 bodů Hranice úspěšnosti: 33 % 1 Základní informace k zadání zkoušky Didaktický test obsahuje 26 úloh. Časový limit pro řešení didaktického

Více

VLIV CEN ROPY NA CENY SILOVÉ ELEKTŘINY V ČR

VLIV CEN ROPY NA CENY SILOVÉ ELEKTŘINY V ČR VLIV CEN ROPY NA CENY SILOVÉ ELEKTŘINY V ČR Nový, F., Hejtmánková, P., Majer, V. Západočeská univerzita v Plzni, Fakulta elektrotechnická Katedra elektroenergetiky a technické ekologie Univerzitní 8, 306

Více

Přílohy. Příloha 1. Obr. P1.1 Zadání úlohy v MS Excel

Přílohy. Příloha 1. Obr. P1.1 Zadání úlohy v MS Excel Přílohy Příloha 1 Řešení úlohy lineárního programování v MS Excel V této příloze si ukážeme, jak lze řešit úlohy lineárního programování pomocí tabulkového procesoru MS Excel 2007. Výpočet budeme demonstrovat

Více

KODEX PŘENOSOVÉ SOUSTAVY

KODEX PŘENOSOVÉ SOUSTAVY Registrační číslo: Úroveň zpracování: Revize12/září 2012 dodatek č.1 Číslo výtisku: KODEX PŘENOSOVÉ SOUSTAVY dodatek č.1 Část II. Podpůrné služby (PpS) Základní podmínky pro užívání přenosové soustavy

Více

Gymnázium a Střední odborná škola, Rokycany, Mládežníků 1115

Gymnázium a Střední odborná škola, Rokycany, Mládežníků 1115 Číslo projektu: Gymnázium a Střední odborná škola, Rokycany, Mládežníků 1115 Číslo šablony: 8 Název materiálu: Ročník: Identifikace materiálu: Jméno autora: Předmět: Tématický celek: Anotace: CZ.1.07/1.5.00/34.0410

Více

MATEMATIKA základní úroveň obtížnosti

MATEMATIKA základní úroveň obtížnosti MATEMATIKA základní úroveň obtížnosti DIDAKTICKÝ TEST Maximální bodové hodnocení: 50 bodů Hranice úspěšnosti: 33 % 1 Základní informace k zadání zkoušky Didaktický test obsahuje 26 úloh. Časový limit pro

Více

Nákup poptávaných zařízení na základě zadání této veřejné zakázky je jediným možným způsobem naplnění potřeby zadavatele.

Nákup poptávaných zařízení na základě zadání této veřejné zakázky je jediným možným způsobem naplnění potřeby zadavatele. Odůvodnění veřejné zakázky Dodávka zařízení pro zkušebnictví v oblasti technologie obrábění, dynamiky a tepla - Kompetenční centrum Kuřim část 1 a 6 dle 156 zákona č. 137/2006, ve znění pozdějších předpisů

Více

VIAKOM. Crystal-za kladní ovla da ní

VIAKOM. Crystal-za kladní ovla da ní VIAKOM Crystal-za kladní ovla da ní Obsah 1. Živý obraz... 2 1.1 Seznam zobrazení... 4 1.2 Seznam obsahu... 4 1.2.1 Zobrazení videa... 4 1.2.2 Nástroje kamery... 4 1.3 PTZ Panel... 5 1.3.1 Popis PTZ ovládání...

Více

0.0001 0.001 0.01 0.1 1 10 100 1000 10000. Čas (s) Model časového průběhu sorpce vyplývá z 2. Fickova zákona a je popsán následující rovnicí

0.0001 0.001 0.01 0.1 1 10 100 1000 10000. Čas (s) Model časového průběhu sorpce vyplývá z 2. Fickova zákona a je popsán následující rovnicí Program Sorpce1.m psaný v prostředí Matlabu slouží k vyhlazování naměřených sorpčních křivek a výpočtu difuzních koeficientů. Kromě standardního Matlabu vyžaduje ještě Matlab Signal Processing Toolbox

Více

METODICKÉ LISTY Z MATEMATIKY pro gymnázia a základní vzdělávání

METODICKÉ LISTY Z MATEMATIKY pro gymnázia a základní vzdělávání METODICKÉ LISTY Z MATEMATIKY pro gymnázia a základní vzdělávání Jaroslav Švrček a kolektiv Rámcový vzdělávací program pro základní vzdělávání Vzdělávací oblast: Matematika a její aplikace Tematický okruh:

Více

OSNOVA ZÁVĚREČNÉ PÍSEMNÉ PRÁCE V RÁMCI STUDIA MBA VE STUDIJNÍM PROGRAMU MANAŽERSKÁ EKONOMIKA

OSNOVA ZÁVĚREČNÉ PÍSEMNÉ PRÁCE V RÁMCI STUDIA MBA VE STUDIJNÍM PROGRAMU MANAŽERSKÁ EKONOMIKA OSNOVA ZÁVĚREČNÉ PÍSEMNÉ PRÁCE V RÁMCI STUDIA MBA VE STUDIJNÍM PROGRAMU MANAŽERSKÁ EKONOMIKA Číslování a názvy hlavních kapitol práce jsou stanoveny osnovou (viz níže) a jejich dodržení v práci je závazné:

Více

Sdílení a poskytování dat KN. Jiří Poláček

Sdílení a poskytování dat KN. Jiří Poláček Sdílení a poskytování dat KN Jiří Poláček Přehled služeb Datové služby Výměnný formát (SPI, SGI) Skenované katastrální mapy Aplikace a webové služby Dálkový přístup do KN (včetně webových služeb) Nahlížení

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická

Více

Úvod. Postup praktického testování

Úvod. Postup praktického testování Testování vzorků kalů odebraných v rámci Doškolovacího semináře Manažerů vzorkování odpadů 21. 10. 2014 v ČOV Liberec, akciové společnosti Severočeské vodovody a kanalizace Úvod Společnost Forsapi, s.r.o.

Více

Videodetekce. 1 Úvod. 2 Popis systému

Videodetekce. 1 Úvod. 2 Popis systému 1 Úvod Videodetekce V tomto dokumentu je popsán software pro videodetekci pracující na otočné či stacionární přehledové kameře. Podstatnou inovací, kterou popisovaný systém nabízí je skutečnost, že umožňuje

Více

Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu

Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu K čemu slouží statistika Popisuje velké soubory dat pomocí charakteristických čísel (popisná statistika). Hledá skryté zákonitosti v souborech

Více

Národníinformačnístředisko pro podporu jakosti

Národníinformačnístředisko pro podporu jakosti Národníinformačnístředisko pro podporu jakosti OVĚŘOVÁNÍ PŘEDPOKLADU NORMALITY Doc. Ing. Eva Jarošová, CSc. Ing. Jan Král Používané metody statistické testy: Chí-kvadrát test dobré shody Kolmogorov -Smirnov

Více

Statistika. Regresní a korelační analýza Úvod do problému. Roman Biskup

Statistika. Regresní a korelační analýza Úvod do problému. Roman Biskup Statistika Regresní a korelační analýza Úvod do problému Roman Biskup Jihočeská univerzita v Českých Budějovicích Ekonomická fakulta (Zemědělská fakulta) Katedra aplikované matematiky a informatiky 2008/2009

Více

10. Předpovídání - aplikace regresní úlohy

10. Předpovídání - aplikace regresní úlohy 10. Předpovídání - aplikace regresní úlohy Regresní úloha (analýza) je označení pro statistickou metodu, pomocí nichž odhadujeme hodnotu náhodné veličiny (tzv. závislé proměnné, cílové proměnné, regresandu

Více

Termovizní měření. 1 Teoretický úvod. Cíl cvičení: Detekce lidské kůže na snímcích z termovizní i klasické kamery

Termovizní měření. 1 Teoretický úvod. Cíl cvičení: Detekce lidské kůže na snímcích z termovizní i klasické kamery Termovizní měření Cíl cvičení: Detekce lidské kůže na snímcích z termovizní i klasické kamery 1 Teoretický úvod Termovizní měření Termovizní kamera je přístroj pro bezkontaktní měření teplotních polí na

Více

Úvod do praxe stínového řečníka. Úvod

Úvod do praxe stínového řečníka. Úvod Úvod do praxe stínového řečníka Úvod 1 Ukázka Kdo je to stínový řečník? Simultánní tlumočník z daného jazyka do téhož jazyka Jeho úkolem je přemlouvat televizní pořady tak, aby výsledná promluva byla vhodná

Více

Měření rychlosti zvuku z Dopplerova jevu

Měření rychlosti zvuku z Dopplerova jevu Měření rychlosti zvuku z Dopplerova jevu Online: http://www.sclpx.eu/lab2r.php?exp=10 Měření rychlosti zvuku z Dopplerova jevu patří k dalším zcela původním a dosud nikým nepublikovaným experimentům, které

Více

E(X) = np D(X) = np(1 p) 1 2p np(1 p) (n + 1)p 1 ˆx (n + 1)p. A 3 (X) =

E(X) = np D(X) = np(1 p) 1 2p np(1 p) (n + 1)p 1 ˆx (n + 1)p. A 3 (X) = Základní rozdělení pravděpodobnosti Diskrétní rozdělení pravděpodobnosti. Pojem Náhodná veličina s Binomickým rozdělením Bi(n, p), kde n je přirozené číslo, p je reálné číslo, < p < má pravděpodobnostní

Více

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. Testování statistických hypotéz Ing. Michal Dorda, Ph.D. Testování normality Př. : Při simulaci provozu na křižovatce byla získána data o mezerách mezi přijíždějícími vozidly v [s]. Otestujte na hladině

Více

Fyzikální sekce přírodovědecké fakulty Masarykovy univerzity v Brně FYZIKÁLNÍ PRAKTIKUM. Praktikum z pevných látek (F6390)

Fyzikální sekce přírodovědecké fakulty Masarykovy univerzity v Brně FYZIKÁLNÍ PRAKTIKUM. Praktikum z pevných látek (F6390) Fyzikální sekce přírodovědecké fakulty Masarykovy univerzity v Brně FYZIKÁLNÍ PRAKTIKUM Praktikum z pevných látek (F6390) Zpracoval: Michal Truhlář Naměřeno: 13. března 2007 Obor: Fyzika Ročník: III Semestr:

Více

Písemná práce k modulu Statistika

Písemná práce k modulu Statistika The Nottingham Trent University B.I.B.S., a. s. Brno BA (Hons) in Business Management Písemná práce k modulu Statistika Číslo zadání: 144 Autor: Zdeněk Fekar Ročník: II., 2005/2006 1 Prohlašuji, že jsem

Více

Biofyzikální laboratorní úlohy ve výuce budoucích učitelů fyziky

Biofyzikální laboratorní úlohy ve výuce budoucích učitelů fyziky Biofyzikální laboratorní úlohy ve výuce budoucích učitelů fyziky MARIE VOLNÁ Katedra experimentální fyziky PřF UP Olomouc Abstrakt Příspěvek se zabývá tématikou mezipředmětových vazeb, které umožňují studentům

Více

GEOTECHNICKÝ MONITORING

GEOTECHNICKÝ MONITORING Inovace studijního oboru Geotechnika reg. č. CZ.1.07/2.2.00/28.0009 GEOTECHNICKÝ MONITORING podklady do cvičení SEIZMICKÁ MĚŘENÍ Ing. Martin Stolárik, Ph.D. Místnost: C 315 Telefon: 597 321 928 E-mail:

Více

Získávání obrázků. Úpravy fotografií. ZPS 10 Home (Office) ZPS 10 Xpress. ZPS 10 Professional ZPS 10. Classic

Získávání obrázků. Úpravy fotografií. ZPS 10 Home (Office) ZPS 10 Xpress. ZPS 10 Professional ZPS 10. Classic Získávání obrázků získávání obrázků z fotoaparátu získávání obrázků skenováním stáhnutí obrázků ze schránky snímání obrazovky stahování obrázků z webu získat z Adobe DNG získat z Canon RAW Úpravy fotografií

Více

Kartometrická analýza starých map část 2

Kartometrická analýza starých map část 2 Podpora tvorby národní sítě kartografie nové generace Kartometrická analýza starých map část 2 Seminář NeoCartoLink, Olomouc, 29. 11. 2012 Tato prezentace je spolufinancována Evropským sociálním fondem

Více

StatSoft Jak poznat vliv faktorů vizuálně

StatSoft Jak poznat vliv faktorů vizuálně StatSoft Jak poznat vliv faktorů vizuálně V tomto článku bychom se rádi věnovali otázce, jak poznat již z grafického náhledu vztahy a závislosti v analýze rozptylu. Pomocí následujících grafických zobrazení

Více

1. Základní údaje. 2. Připojení kamery k počítači. 3. Nastavení kamery. Vnitřní IP kamera WaveRF IPC07IPT Návod k obsluze

1. Základní údaje. 2. Připojení kamery k počítači. 3. Nastavení kamery. Vnitřní IP kamera WaveRF IPC07IPT Návod k obsluze Vnitřní IP kamera WaveRF IPC07IPT Návod k obsluze 1. Základní údaje 1.1 Popis produktu 1.2 Přední strana kamery 1.3 Zadní strana kamery a popis portů 2. Připojení kamery k počítači 3. Nastavení kamery

Více

GIS ANALÝZA VLIVU DÁLNIČNÍ SÍTĚ NA OKOLNÍ KRAJINU. Veronika Berková 1

GIS ANALÝZA VLIVU DÁLNIČNÍ SÍTĚ NA OKOLNÍ KRAJINU. Veronika Berková 1 GIS ANALÝZA VLIVU DÁLNIČNÍ SÍTĚ NA OKOLNÍ KRAJINU Veronika Berková 1 1 Katedra mapování a kartografie, Fakulta stavební, ČVUT, Thákurova 7, 166 29, Praha, ČR veronika.berkova@fsv.cvut.cz Abstrakt. Metody

Více

Derivační spektrofotometrie a rozklad absorpčního spektra

Derivační spektrofotometrie a rozklad absorpčního spektra Derivační spektrofotometrie a rozklad absorpčního spektra Teorie: Derivační spektrofotometrie, využívající derivace absorpční křivky, je obecně používanou metodou pro zvýraznění detailů průběhu záznamu,

Více

BODOVÉ HODNOCENÍ PŘÍPRAVA A ROZVOJ PODNIKATELSKÝCH ZÓN

BODOVÉ HODNOCENÍ PŘÍPRAVA A ROZVOJ PODNIKATELSKÝCH ZÓN BODOVÉ HODNOCENÍ PŘÍPRAVA A ROZVOJ PODNIKATELSKÝCH ZÓN K 1 Úroveň nezaměstnanosti ve spádové oblasti podnikatelské zóny 30% bodů K 1.1 Míra nezaměstnanosti ve spádové oblasti PZ K 1.2 Počet uchazečů o

Více

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie 4EK211 Základy ekonometrie Úvod do předmětu obecné informace Základní pojmy ze statistiky / ekonometrie Úvod do programu EViews, Gretl Některé užitečné funkce v MS Excel Cvičení 1 Zuzana Dlouhá Úvod do

Více

Vyhláška č. 9DV/2011 děkana FEK ZČU v Plzni Přijímání ke studiu na Fakultu ekonomickou ZČU v Plzni pro akademický rok 2012/2013

Vyhláška č. 9DV/2011 děkana FEK ZČU v Plzni Přijímání ke studiu na Fakultu ekonomickou ZČU v Plzni pro akademický rok 2012/2013 Vyhláška č. 9DV/2011 děkana FEK ZČU v Plzni Přijímání ke studiu na Fakultu ekonomickou ZČU v Plzni pro akademický rok 2012/2013 podle zákona o vysokých školách č. 111/1998 Sb. v platném znění, 48 a 49

Více

9 Prostorová grafika a modelování těles

9 Prostorová grafika a modelování těles 9 Prostorová grafika a modelování těles Studijní cíl Tento blok je věnován základům 3D grafiky. Jedná se především o vysvětlení principů vytváření modelů 3D objektů, jejich reprezentace v paměti počítače.

Více

K HISTORII INŽENÝRSKÉHO VZDĚLÁVÁNÍ V PLZNI. (Fakulta elektrotechnická a několik obecnějších poznámek)

K HISTORII INŽENÝRSKÉHO VZDĚLÁVÁNÍ V PLZNI. (Fakulta elektrotechnická a několik obecnějších poznámek) Fakulta elektrotechnická Západočeská univerzita v Plzni K HISTORII INŽENÝRSKÉHO VZDĚLÁVÁNÍ V PLZNI (Fakulta elektrotechnická a několik obecnějších poznámek) 02.04.2014 02.04.2014 www.fel.zcu.cz Prof. Ing.

Více

INFORMATIKA. Jindřich Kaluža. Ludmila Kalužová

INFORMATIKA. Jindřich Kaluža. Ludmila Kalužová INFORMATIKA Jindřich Kaluža Ludmila Kalužová Recenzenti: doc. RNDr. František Koliba, CSc. prof. RNDr. Peter Mikulecký, PhD. Vydání knihy bylo schváleno vědeckou radou nakladatelství. Všechna práva vyhrazena.

Více

MATEMATIKA Tematické okruhy ke státní maturitní zkoušce Obor: mechanik elektronik

MATEMATIKA Tematické okruhy ke státní maturitní zkoušce Obor: mechanik elektronik MATEMATIKA Tematické okruhy ke státní maturitní zkoušce Obor: mechanik elektronik R4 1. ČÍSELNÉ VÝRAZY 1.1. Přirozená čísla počítání s přirozenými čísly, rozlišit prvočíslo a číslo složené, rozložit složené

Více

Střední hodnota a rozptyl náhodné. kvantilu. Ing. Michael Rost, Ph.D.

Střední hodnota a rozptyl náhodné. kvantilu. Ing. Michael Rost, Ph.D. Střední hodnota a rozptyl náhodné veličiny, vybraná rozdělení diskrétních a spojitých náhodných veličin, pojem kvantilu Ing. Michael Rost, Ph.D. Príklad Předpokládejme že máme náhodnou veličinu X která

Více

O nakladatelství. Nakladatelství SOKRATES se specializuje také na odbornou právnickou a ekonomickou literaturu.

O nakladatelství. Nakladatelství SOKRATES se specializuje také na odbornou právnickou a ekonomickou literaturu. Obsah Obsah... 1 O nakladatelství... 2 Nejžádanější publikace z nakladatelství SOKRATES... 3 Kompletní nabídka z edice Přijímací zkoušky na vysoké školy z nakladatelství SOKRATES dle typu VŠ... 4 Právnická

Více

GV-VMS. Specifikace: Video kodek MJPEG, H.264. 16 khz / 16-bit, 32 khz / 16-bit

GV-VMS. Specifikace: Video kodek MJPEG, H.264. 16 khz / 16-bit, 32 khz / 16-bit GV-VMS Specifikace: Video kanálů Audio kanálů Až 64 kanálů Až 64 kanálů Video kodek MJPEG, H.264 Audio kodek Video rozlišení Síť Záznamové jednotky Jazyky 16 khz / 16-bit, 32 khz / 16-bit Od CIF do Megapixel

Více

MATURITNÍ TÉMATA Z MATEMATIKY

MATURITNÍ TÉMATA Z MATEMATIKY MATURITNÍ TÉMATA Z MATEMATIKY 1. Základní poznatky z logiky a teorie množin Pojem konstanty a proměnné. Obor proměnné. Pojem výroku a jeho pravdivostní hodnota. Operace s výroky, složené výroky, logické

Více

Firma příjemce voucheru. ACEMCEE, s. r. o. (www.acemcee.com) U Vodárny 2, 616 00 Brno. Informační a komunikační technologie

Firma příjemce voucheru. ACEMCEE, s. r. o. (www.acemcee.com) U Vodárny 2, 616 00 Brno. Informační a komunikační technologie Firma příjemce voucheru ACEMCEE, s. r. o. (www.acemcee.com) Sídlo Obor Velikost Profil U Vodárny 2, 616 00 Brno Informační a komunikační technologie Drobný podnik ACEMCEE je firma působící v oblastech

Více

Návod k obsluze MPS-1. Monitor PLC signálu

Návod k obsluze MPS-1. Monitor PLC signálu Návod k obsluze MPS-1 Monitor PLC signálu UPOZORNĚNÍ Zařízení tvoří ucelenou sestavu. Pouze tato sestava je bezpečná z hlediska úrazu elektrickým proudem. Proto nepoužívejte jiné napájecí zdroje, ani nepřipojujte

Více

KVALITA ŽIVOTA 2015. Inštitút psychológie, FF Prešovskej univerzity. Vás zvou na česko-slovenskou vědeckou konferenci

KVALITA ŽIVOTA 2015. Inštitút psychológie, FF Prešovskej univerzity. Vás zvou na česko-slovenskou vědeckou konferenci KVALITA ŽIVOTA 2015 (1. cirkulář) Katedra geografie, FP TU v Liberci a spolupracující organizace Inštitút psychológie, FF Prešovskej univerzity Vás zvou na česko-slovenskou vědeckou konferenci KVALITA

Více

Které faktory Vás motivují, nebo by Vás motivovaly, ke studiu technického oboru na SŠ, popř. v budoucnu na VŠ? 10% 41% 18% 33%

Které faktory Vás motivují, nebo by Vás motivovaly, ke studiu technického oboru na SŠ, popř. v budoucnu na VŠ? 10% 41% 18% 33% ANALÝZA POTŘEB ŽÁKŮ STŘEDNÍCH ŠKOL Analýza potřeb žáků SŠ uvádí přehled vyhodnocení vybraných otázek z dotazníkového šetření provedeného u žáků SŠ technického směru a všeobecných gymnázií v Moravskoslezském

Více

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 3. 11.

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 3. 11. UNIVERZITA OBRANY Fakulta ekonomiky a managementu Aplikace STAT1 Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 Jiří Neubauer, Marek Sedlačík, Oldřich Kříž 3. 11. 2012 Popis a návod k použití aplikace

Více

Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D.

Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D. Zpracování náhodného výběru popisná statistika Ing. Michal Dorda, Ph.D. Základní pojmy Úkolem statistiky je na základě vlastností výběrového souboru usuzovat o vlastnostech celé populace. Populace(základní

Více

Proudový model. Transportní model(neovlivněný stav)

Proudový model. Transportní model(neovlivněný stav) Základy technologií a odpadového hospodářství - Počítačovásimulace podzemního proudění a transportu rozpuštěných látek část 2 Jan Šembera, Jaroslav Nosek Technickáuniverzita v Liberci / Technische Universität

Více