Viktoriia Yemchenko. Moderní technologie pro ovládání PC hlasem. Bakalářská práce

Rozměr: px
Začít zobrazení ze stránky:

Download "Viktoriia Yemchenko. Moderní technologie pro ovládání PC hlasem. Bakalářská práce"

Transkript

1 Vysoká škola ekonomická v Praze Fakulta informatiky a statistiky Vyšší odborná škola informačních služeb v Praze Viktoriia Yemchenko Moderní technologie pro ovládání PC hlasem Bakalářská práce 2011

2 PROHLÁŠENÍ Prohlašuji, že jsem bakalářskou práci na téma Moderní technologie ovládání PC hlasem zpracovala samostatně a použila pouze zdrojů, které cituji a uvádím v seznamu použité literatury. V Praze dne Podpis

3 ABSTRAKT Předložená bakalářská práce je zaměřena na porovnání a výběr vhodného programu pro rozpoznávání hlasu v PC, provedení jeho praktického odzkoušení s vybraným počtem uživatelů a následné vyhodnocení použitelností softwaru pro psaní textu a jeho diktování z hlediska rychlosti a přesnosti. Teoretická část práce obsahuje obecný přehled historického vývoje technologií rozpoznávaní řeči a popisuje hlavní oblasti, kde se tyto systémy a technologie používají. Obsah teoretické části tvoří také popis principů rozpoznávání řeči počítačem a klasifikace existujících systémů. Praktická část teto bakalářské práce zahrnuje popis a porovnání dostupných programů pro rozpoznávání řeči a provedení testování pomocí vybraného programu. The following bachelor work is focused on the comparison and following selection of the suitable voice recognition software as well as on its practical test with selected number of users and the subsequent evaluation of its usability for text writing and dictating with regard on speed and accuracy The theoretical part of the work contains a general overview of the historical development of speech recognition technology, describes the main areas where these systems and technologies can be used. The content of the work is a theoretical description of the principles of computer speech recognition and classification of existing programs. The practical part of this thesis is a description and comparison of available programs for speech recognition and execution of testing with the selected program.

4 Obsah 1 Úvod Historie vývoje systémů hlasového ovládání PC První programy Období 60., 70. léta Období 80., 90. léta Moderní komerční programy: Dragon Naturally Speaking Aplikace systémů rozpoznávání řeči Využití systémů rozpoznávání řeči ve zdravotnictví Ozbrojené síly a řečové technologie Battle management a systémy rozpoznávání řeči Popis principu rozpoznávání řeči počítačem Jednotlivé etapy procesu Problémy a překážky při rozpoznávání Klasifikace systémů rozpoznávání řeči Současný stav na trhu technologií pro ovládání PC hlasem Rešerše a popis aplikací pro rozpoznávání hlasu Vícekriteriální rozhodování při výběru programu Vytvoření množiny kriterií hodnocení Stanovení vah kriterií Stanovení etalonů kriterií Výběr nejlepší varianty pomocí metody TOPSIS Popis programu Dictation Průběh praktického testu programu Dictation Výběr vhodného textu

5 8.1.1 Texty Průběh testu Analýza výsledků Závěr Seznam použitých zdrojů

6 1 Úvod Téma bakalářské práce Ovládání počítače hlasem jsem si vybrala z několika důvodů. Podle mého názoru, téma je aktuální a myšlenka rozpoznávání řeči počítačem se stále rozvíjí. Druhým důvodem je můj zájem o technologický pokrok v tomto odvětví. A nakonec, chtěla bych vyzkoušet programy, které by mohly rozšířit nabídku funkcí mého vlastního počítače. Cílem této práce je porovnání a výběr vhodného programu pro rozpoznávání hlasu v PC, provedení jeho praktického odzkoušení s vybraným počtem uživatelů a následné vyhodnocení použitelností softwaru pro psaní textu a jeho diktování z hlediska rychlosti a přesnosti. Za účelem dosažení stanoveného cíle bylo potřeba splnit tyto úkoly: Získání teoretických znalostí v oblasti technologií hlasového ovládání Provedení rešerše dostupných aplikací Výběr nejvhodnějšího programu pomocí metody vícekriteriální analýzy Provedení praktického testování Analýza dosažených výsledků Rozpoznávání řeči počítačem je samozřejmě jeden z důležitých fenoménů dnešní doby. Hledáním způsobů, pomocí kterých by lidé mohli komunikovat s počítačem stejně jako mezi sebou, přičemž tak, aby nebyla potřeba přizpůsobit se úrovni komunikace PC, se již dávno zabývají vědci a inženýři. V poslední době bylo dosaženo hodně úspěchů - již mnoho let jsou hlasové příkazy vnímány jako jedna z alternativ rozšíření softwaru PC. Výskyt funkcí rozpoznávání řeči je samozřejmostí v řadě textových procesorů, systémy rozpoznávání řeči se často vyskytují v informačních servisech a také v bezpečnostních systémech. V procesu dlouholetého výzkumu se zjistilo, že pro řešení problému je potřeba využít znalostí nejen programátorů, ale také lingvistů, rozhlasových techniků, matematiků, biologů a dokonce i psychologů. Pro vytvoření systému rozpoznávání řeči se musí řešit velký počet úloh a úkolů. 7

7 Především je potřeba přeměnit chvění vzduchu do podoby elektrických signálů pomocí mikrofonu, zároveň musí byt odfiltrované interference a hluk. Pak signál musí být převeden do digitální podoby, což dovolí jeho další zpracování pomocí počítače. Práce lingvistů je nezbytná pro lepši porozumění konstrukčním zásadám řeči. Musí byt izolovány takové prvky řeči, které program musí umět rozpoznávat pří vstupním proudu fonémy, morfémy, slabiky, slova atd. Lingvistika studuje takové aspekty řeči, které jsou nezbytné pro vytvoření systémů rozpoznávání a syntézy řeči. Zvuky souvislé řeči obsahují neustále se měnící spektrum harmonických frekvencí a také hluk. Hlasitost a rychlost řeči se také neustále mění. Kromě toho jeden a tentýž výraz, vyslovený různými lidmi, anebo dokonce i stejným člověkem, který se nachází v různých psychických stavech, muže mít odlišné spektrální a časové barvy. Tím se výrazně komplikuje vytvoření universálních systémů rozpoznávání, které by byly schopné rozumět řeči různých lidí. Pro účel oddělení lingvistických struktur z digitalizovaného zvuku se používají různé matematické metody v kombinaci se speciálním počítačovým vybavením. Výzkumy biologů pomáhají ve studii mechanismů formování a rozpoznávání řeči. Psychologové pomáhají při řešení úloh vytvoření příjemného uživatelského rozhraní počítačových systémů. 8

8 2 Historie vývoje systémů hlasového ovládání PC V této kapitole uvádím základní popis historického vývoje programů a systémů, které využívají technologii automatického rozpoznávání řeči. Historie vývoje těchto programů začíná v roce 1952 vytvořením prvního jednoduchého rozpoznávače číslic v laboratoři Bell, a zdokonalení těchto technologií pokračuje dodnes. Níže je uvedená souhrnná tabulka historie vývoje programů: Období Programy Vývojáři Místo vývoje 1952 Systém pro rozpoznávání izolovaných číslic pomocí měření formačních frekvencí Biddulph a Balashek Laboratoř Bell 50. léta Rozpoznávací systém pro 10 samohlásek Systém pro rozpoznávání 10 slabik Olson a Belar Laboratoř MIT Lincoln Laboratoř RCA Systém pro rozpoznávání samohlásek s názvem Suzuki a Nakata Radio Research Lab Rozpoznávač foném Univerzita v Kjotu 60.léta Rozpoznávač číslic Laboratoř NEC Rozpoznávač pro rozpoznávání 4 samohlásek a 9 souhlásek College University První komerční system ASR VIP Tom Martin Threshold Technology Inc. 70. léta Systém Martina rozpoznávání plynulé řeči Výzkumný project APRA Systém Angora Fred Jelínek Společnost IBM 80. léta Systém Harpy CMU, Hearsay II, BBN HWIM Společnost APRA Společnost SUR-DAPRA Systém Dragon Tim Baker 1997 Stem Dragon Naturally Speaking Společnost Dragon Systems Tabulka 2.1: Historie vývoje programů pro rozpoznávání řeči 9

9 2.1 První programy Samozřejmě je jazyková komunikace pro člověka nejpohodlnější a nejpřirozenější. Není divu, že vědci a inženýři již mnoho let řeší problém verbální komunikace mezi člověkem a strojem. Počítače již delší dobu umějí poslouchat uživatele a provádět dešifrace jejich slov. Během procesu integrace počítačů ve všech oblastech společnosti se stalo samozřejmosti, že mnozí lidé mají problémy v komunikaci se strojem. Hlavní důvody vytvoření programů pro rozpoznávání řeči počítačem jsou následující: Uživatele občas nemohou jednoduše vyjádřit, co chtějí, musí se učit nazpaměť zastaralé příkazy nebo další procesy a algoritmy, které vůbec nejsou intuitivní či přírodní. Navíc v procesu této komunikace je nutné použit pomalé a složité zařízení, například myš nebo klávesnici. Je zřejmé, že nový způsob komunikace s počítačem musí byt jednoduchý, rychlý a intuitivní. Systém rozpoznávání hlasu by se měl zajisté přizpůsobit člověku než naopak. Obrovskou výhodou systémů rozpoznávání hlasu by mohlo být to, že mohou fungovat mnohem rychleji než jakékoli jiné typy rozhraní. Například hlasový program elektronické pošty dovoluje zapnout počítač, nadiktovat a odesílat zprávy, přičemž se nemusíte dotýkat ani myši, ani klávesnice. A tedy postižení lidé mohou díky těmto technologiím efektivněji komunikovat s počítačem. První pokusy navrhnout systém pro automatické rozpoznávání řeči byly ve většině případů vedeny akusticko-fonetickou teorií, která popisuje fonetické prvky řeči (základní zvuky jazyka) a snaží se vysvětlit způsob jejich realizace v mluveném projevu. [10] Tyto prvky zahrnují fonémy, a také odpovídající místo a způsob artikulace, který se používá při tvoření zvuků v různých fonetických kontextech. Například je potřeba, aby hlasivky vibrovaly za účelem vytvoření samohlásky a vzduch, který se šíří přes hlasovou plochu, způsobuje tvoření přirozeného zvuku, který je podobný tomu, co se vyskytuje v akustické trubce. Tyto přirozené způsoby rezonance, tzv. formanty a formační frekvence, se projevují jako hlavní oblast koncentrace energie ve spektru řečí. 10

10 Pomocí systému rozpoznávání hlasu nevidomí lidé anebo ti, kteří z jakéhokoliv důvodu nejsou schopni použít klávesnici, mohou komunikovat s počítačem stejně dobře, jako ostatní. Technologie rozpoznávání hlasu mohou byt použitelné také v operativních informačních službách. Počítače pronikají hlouběji do našeho života a potřeba v operativní informatice roste obrovskou rychlostí. Stále rostoucí počet uživatelů se obrací na internetové služby pro nejnovější zprávy, sportovní zprávy, předpověď počasí, pro informace o vstupenkách, objednávkách, cenných papírech, pro provádění výzkumu anebo pro zjišťování programu nejbližšího kina. Řeč je ideální nástroj pro získávání informací. A to vám může zjednodušit komunikaci s počítačem. Pomocí systémů rozpoznávání mluveného jazyka se uživatel a stroj mohou zapojit do přímého dialogu, postupně, krok za krokem, se můžou přiblížit k požadovaným informacím. Například jsou již vyvinuté systémy rozpoznávání řeči určené pro poskytování přístupu k databázím, obsahujícím digitalizované klipy novinek vysílání. Ovládáním prohlížeče hlasem je odstraněna nutnost uživatele využívat pomalé ruční ovládání. [9] Již mnoho let lze na softwarovém trhu najít hlasové systémy, které jsou určené pro představitele určitých profesí, například pro lékaře a právníky. Mnoho představitelů těchto profesí používá systémy rozpoznávání řeči na denní bázi. Velmi populární se staly domácí spotřebiče a příslušenství aktivizující se hlasem. 2.2 Období 60., 70. léta Domnívalo se, že hned potom, co počítače začnou rozumět lidské řeči, se podaří vytvořit umělý intelekt. Vývoj technologií rozpoznávání řeči se začal v roce 1952, když Davis, Biddulph a Balashek vyvinuly v laboratoří Bell systém pro rozpoznávání izolovaných číslic pomocí měření formačních frekvencí (anebo pomocí odhadu v průběhu ozvučení každé číslice). [3] Dalším významným systémem se stal systém Olsona a Belara z laboratoři RCA pro rozpoznávání 10 slabik, vyslovených jedním mluvčím. Ve stejné době v laboratoři MIT Lincoln, Orgie vytvořili rozpoznávací systém pro 10 samohlásek, který byl nezávislý na mluvčím. Ale přesnost systémů rozpoznávání řeči dosáhla největšího úspěchu v roce 2001, a od té doby zůstává na stejné úrovni. V 60. letech několik japonských laboratoří prokázalo svou schopnost vytvořit účelový hardware, který měl za úkol rozpoznávání řeči. Nejpozoruhodnějším se stal systém pro 11

11 rozpoznávání samohlásek s názvem Suzuki a Nakata, vytvořený v laboratoři Radio Research Lab v Tokiu, a také rozpoznávač foném v Sakai a Doshita na univerzitě v Kjotu. Dalším zajímavým programem se stal rozpoznávač číslic z laboratoře NEC. Ve výzkumech Sakai a Doshita byl poprvé použitý řečový segmenter pro analýzu a rozpoznávání řeči v různých částech vstupního projevu. V protikladu izolovaný číslicový rozpoznávač implicitně předpokládal, že neznámý projev obsahuje kompletní číslo (určitě ne žádné jiné zvuky řeči nebo slova), a tudíž neexistovala potřeba v explicitním segmentru. Práce univerzity v Kjotu by mohla být považována za předchůdce kontinuálního systému rozpoznávání řeči.[31] Ve stejné době byl na univerzitě College University v Anglii vytvořený rozpoznávač pro rozpoznávání 4 samohlásek a 9 souhlásek. Pomocí začlenění statistické informace o přípustných fonémových sekvencích v angličtině se zvýšila celková fonémová rozpoznávací přesnost v případě slov, obsahujících dvě či více fonémů. Tato práce označila první použití statistické syntaxe (na úrovní fonémů) v historii automatického rozpoznávání řeči. Alternativou k použití segmentoru řeči se stala představa o přijetí nejednotného časového měřítka pro vyrovnání řečových vzorů. Tento koncept se stal aktuálním v roce 1960 díky práci Toma Martina v laboratoři RCA, a také díky výzkumům Vintsuka v Sovětském Svazu. Martin si během své práce uvědomil potřebu vypořádat se s časovou nerovnoměrností v opakovaných akcích řeči a navrhl řádu řešení, včetně detekce projevů koncových bodů, což výrazně zvýšilo spolehlivost výkonu rozpoznávacího procesu. Vintsuk navrhnul použití dynamického programování pro časové přizpůsobení dvou projevů k odvození smysluplných posouzení jejich podobností. Jeho práce, obecně známá jako Dynamické manipulace z časem, předcházela pracím Sako a Chiba, i když nebyla velmi známá na Západě. [24] V pozdních 60. létech firma Atal a Itakura zformulovala nezávisle základní pojmy lineárního prediktivního kódování (LPC), což značně zjednodušilo odhad reakcí vokálního traktu na řečové křivky. Během této doby také založil Tom Martin (na základě předchozích úspěchů v oblasti sladění řečových projevů) první komerční společnost s názvem Threshold Technology Inc. a vyvinul první skutečný produkt nazvaný ASR VIP-100 systém. Tento systém se 12

12 používal jen v několika jednoduchých aplikacích, které provozovaly televizní společnosti, a také společnost FedEx pro třídění balíčků na běžícím páse. V roce 1970 se začalo vyvíjet rozpoznávání plynulé řeči, které nevyžaduje, aby uživatel dělal pauzy mezi slovy. V roce 1970 vyvinul výzkumný projekt APRA ( při americkém ministerstvu obrany), ovlivněn především systémem Martina, další technologii porozuměni řeči - zejména pomocí uznání toho, že cílem automatického rozpoznávání řeči je její porozumění - nejen porozumění slov. Tato technologie se stala funkční během roku 1980 a stále se rozvíjí a zdokonaluje i dnes. APRA také založila program Speach Understanding Research.[25] Souběžně s výzkumem ARPA v roce 1970 se začaly formovat dva široké směry ve výzkumu rozpoznávání řeči ze strany společnosti IBM a Bell Laboratories. Obě dvě společnosti představují v zásadě dvě různé školy myšlenek, které se týkají použitelnosti automatického rozpoznávání řeči pro komerční využití. Píle a úsilí IBM pod vedením Freda Jelinka byly zaměřené na vytvoření psacího stroje aktivovaného hlasem, jehož hlavní funkcí by byl převod mluvené věty do pořadí písmen a slov, které by se dále uvádělo na displeji, nebo na papíře. Rozpoznávací systém nazývaný Angora byl v podstatě závislý na mluvčím, takže psací stroj vyžadoval školení od jednotlivých uživatelů. Technické zaměření bylo na velikosti slovníku, a také na struktuře jazykového modelu, který byl reprezentován pomocí statistických a syntaktických pravidel, která popisovala pravděpodobnostní sled jazykových symbolů ( fonémů a slov). Soubor statistických, gramatických a syntaktických pravidel tvořil tzv. jazykový model, který definoval pravděpodobnost výskytu uspořádaného pořadí slov. Ačkoli jsou jazykový model a gramatika projevy jednacího jazyka, jejich role byly zásadně odlišné. Jazykový model, který charakterizuje vztahy slov v rámci určitého rozpětí, se stal praktickou a statistickou reprezentací gramatiky.[8] Účinnost jazykového modelu byla prokázaná ve známé slovo-hře Claudia Shannona, která tvoří soutěž mezi člověkem a počítačem. V této hře museli počítač a člověk postupně odhadnout další slovo v libovolné větě. Člověk odhaduje slova na základě svých zkušeností v rodném jazyce, počítač používá nahromaděné statistické údaje. Ukázalo se, že jakmile rozsah slov přesáhnul 3, pravděpodobnost, že počítač vyhraje, se zvyšovala Od konce roku 1970 se stalo dynamické programování nepostradatelnou technikou pro automatické rozpoznávání řeči, hlavně kvůli publikaci Sako a Chiba 13

13 Po roce 1975 byly navrženy společností Itakura a Rabiner Levinson základní myšlenky a technologie pro rozpoznávání řeči, které byly založené na metodě LPC. 2.3 Období 80., 90. léta Mezi systémy vytvořenými společností APRA patří také Harpy systém, který byl schopný rozpoznávat řeč pomocí vestavěného slovníku s obsahem 1011 slov, a přitom s dostatečnou přesností. Systém Harpy přispěl konceptem grafického vyhledávání, kde byl rozpoznávací jazyk reprezentován jako propojená síť z lexikálních reprezentací slov. Systém také zahrnoval syntaktická pravidla slovních hranic. V navrhovaném systému Harpy byla vstupní řeč po procházení parametrickou analýzou rozdělená a rozdělené parametrické sekvence řeči byly pak podrobené odpovídající telefonní šabloně. [1] Systém grafického vyhledávání na základě vyhledávacích algoritmů předpokládal, omezoval, a pak ověřoval uznávané pořadí slov (zvuků), které splňovalo určitá omezení a nejvíce odpovídalo referenčním modelům. Systém Harpy se stal prvním systémem, který využil stavové sítě k efektivnímu určení nejbližšího odpovídajícího řetězce. Podobné metody nevznikly až do počátku roku Další programy v rámci výzkumu společnosti SUR DAPRA jsou CMU, Hearsay II a BBN HWIM. Přístup k rozpoznávání řeči, použitý v Hearsay II, který zahrnuje paralelní asynchronní procesy, se stal průkopnickým konceptem. Systém Hearsay II rozšířil poznatky v oblasti analýzy zvukové identity na vyšší úrovni hypotéz. Systém HWIM, vyvinutý společností BBN, byl naopak známý pro využiti zajímavých nápadů včetně lexikální dekódovací sítě, která začlenila sofistikovaná fonologická pravidla (zaměřená na přesnost rozpoznávání fonémů). Další systém, který stojí za zmínku, je Dragon systém, vyvinutý Timem Bakerem, který pak založil firmu se stejným názvem v Massachusetts se na počátku roku V této době laboratoř Bell se zaměřovala na design systému, který by nebyl závislý na mluvčím, a který by mohl řešit akustickou variabilitu řečových signálů. Tento záměr vedl k vytvoření řady algoritmů pro tvorbu referenčních modelů slov a zvuků (původně šablon, ale nakonec statistických modelů), které by mohly být použité v širokém rozsahu. 14

14 Cílem výzkumného programu Laboratoře Bell bylo poskytnout veřejnosti automatizované telekomunikační služby, jako je hlasové vrtačení, řízení a přesměrování telefonních hovorů. Očekávalo se, že tyto automatizované systémy budou dobře fungovat pro velké populace bez potřeby školení jednotlivých uživatelů. [8] Hlavním úkolem řečového rozhraní je porozumět lidské řeči a adekvátně reagovat na hlasové příkazy. Úkolem je také naučit jednotky rozumět řeči bez prostředníka jazyka, ve kterém lidé komunikují mezi sebou, což znamená, že je potřeba vymyslet algoritmus pro rozpoznání zvukového signálu řeči. Přesně tohle je účelem technologie rozpoznávání řeči. Poprvé se na trhu objevily systémy rozpoznávání příkazů závislé na mluvčím. V takových systémech je zvukový obraz příkazu uložen jako komplexní etalon. Pro porovnání neznámého obsazení a standardního příkazu se používá algoritmus dynamického programování. Tyto systémy dobře pracovaly s rozpoznáváním malých souborů tvořených příkazy a rozuměly příkazům pouze jednoho mluvčího, pro řeč, na kterou byly nakonfigurovány, což znamená, že byly závislé na mluvčím. K tomu, aby se systém rozpoznávání řeči naučil rozumět jedinému slovu, bylo nutné vytvořit slovník, který je mnohem větší - od několika desítek až do stovek tisíc slov. Metody používané ve vyspělých systémech nejsou vhodné pro tento úkol, protože je zkrátka nemožné vytvořit standardy pro tak mnoho slov. Navíc bylo úkolem, aby systém nebyl závislý na mluvčím, a aby byl schopen rozumět řeči jakékoliv osoby. Jedná se o velmi obtížný úkol, protože každý člověk má vlastní styl, který mj. obsahuje rychlost řeči a hlasu, zvláštní výslovnost atd. Tyto rozdíly jsou nazývány variabilitou řeči. Pro to, aby se počítalo s variabilitou řeči, se navrhovaly nové statistické metody, které se odvíjely především od matematického aparátu skrytých Markovových modelů (HMM), nebo umělých neuronových sítí. Namísto vytváření etalonů pro každé slovo se vytvářela měřítka jednotlivých zvuků, které tvoří slova, takzvané akustické modely. Akustické modely se vytvářejí pomoci statistického zpracování velkých řečových databází obsahujících hlasové záznamy stovek lidí.[9] Kromě toho, že bereme v úvahu informace o zvuku, zakořeněného v akustickém modelu, musí se také brát v úvahu informace o jazyku. Mezi slovy ve větě existuje velký počet různých spojení- gramatických, syntaktických a sémantických. K popisu těchto vztahů musí byt vyvinut jazykový model, který má pro každý jazyk svou vlastní strukturu a parametry. Systémy automatického rozpoznávání řeči jsou dnes široce používány v nejrůznějších oblastech lidské činnosti. Zajišťují kvalifikované odhady toho, co bylo 15

15 řečeno. Hraje se o šance. Vytvářejí se statistické modely. Čím více dat je zadáno do systému, tím přesnější bude odhad. V roce 1980 se stal dostupný tzv. Braunův korpus tělo laterálního textu, ve kterém nabídka digitálních slov dosáhla skoro milionu. Braunův korpus se stal základním zdrojem pro vývoj a provoz naprosté většiny jazykových aplikací. K tvůrcům prvního jazykového korpusu patří lingvista českého původu Henry Kučera. S vytvořením tohoto korpusu lingvistika dostala pro svá jednotlivá odvětví novou, kvalitativně i kvantitativně odlišnou materiálovou základnu. Lingvistika získala zcela nové prostředky, jak operativně a efektivně pracovat s materiálovou základnou jazykového korpusu. Pomocí Braunova korpusu se přeměnily s růstem používání internetu v roce 1990 miliony slov na biliony. To vedlo k tomu, že Google opublikoval trilionový lingvistický korpus v roce Přesnost rozpoznávání řeči vzrostla k nebi, ale stejně nebyla dosažená úroveň přesností lidské řeči. [volný překlad: 10] K nejviditelnějšímu používání rozpoznávání plynulé řeči se vztahuje vytvoření automatického přepisu, který může časem nahradit sekretářky při diktování textu dopisů, poznámek v deníku, zpráv aj. V tomto případě se zajišťuje v důsledku snížení nákladů na pracovní sílu nejen ekonomie, ale také se zvyšuje míra soukromí. V současné době jsou tyto systémy více prováděné v angličtině, stále však se spoustou omezení. Systémy rozpoznávání ruské a české řeči se v současné době aktivně vyvíjejí. Na základě rozpoznávání řeči se vyvíjí hlasem kontrolované charaktery pro videohry, slovníky a překladatele, zkrátka komplexní systémy dialogu člověk-počítač. Po dlouhé době očekávání se ve světě technologií rozpoznávání řeči zrodila dvojčata: Aplikovaná Inteligence Kurzweila a její soupeř Dragon Systems. Software Kurzweila mohl k začátku třetího věku porozumět skoro tisíci slov ale jenom v případě, že slova se vyslovují pečlivě a pomalu. O dva roky později, v roce 1987, se slovní zásoba počítače rozšířila do slov, což se vešlo do rozsahu obvyklých lidských slovníků, které obsahuji od do slov. Přesto přesnost rozpoznávání zůstávala na velmi nízké úrovní, a to s 90% neúspěšností v roce Během dalších dvou let se však situace zlepšila. Přesnost rozpoznávání se zvýšila na 50 %. [9] 2.4 Moderní komerční programy: Dragon Naturally Speaking Důležitou etapou v historii rozvoje řečových technologií bylo v roce 1997 uvedení nového produktu firmy Dragon Systems Dragon Naturally Speaking, který byl schopný rozpoznávat normální lidskou řeč. Takže roky snahy rozmluvit se s počítačem se 16

16 zdánlivě vyplatily. Nicméně, základní jazyk strojního zařízení, který od roku 1950 shromažďoval zvuky do celých slov, se nezměnil. Pokrok v technologiích byl způsoben hlavně rychlejšími počítači a zvýšením kvality digitálního textu. Systémy rozpoznávání řeči se staly tak pokročilé a zároveň běžné, že se obchodní a zdravotnické společnosti obracejí na řešení rozpoznávání řeči pro všechny účely, od poskytování telefonické podpory, až po psaní lékařských zpráv. Technologický pokrok způsobil zabezpečování softwarů s použitím funkce rozpoznávání řeči a 90 procent přesnosti. Rozpoznávání řeči se používá v široké škále aplikací pro uspokojování potřeb spotřebitelů a podniků tím, že zjednoduší interakce se zákazníky, zvyšuje účinnost a snižuje provozní náklady. Kromě toho společnost Business Intelligence (IBM) zvyšuje popularitu rozpoznávání řeči, a tím zvětšuje výnosy z 677 milionů dolarů v roce 2002 na 5,3 miliardy dolarů v roce Nedávným pokrokem v softwarech pro rozpoznávání řeči se stalo vytvoření dynamického prostředí. Tato technologie oslovuje opravdu každého, kdo potřebuje mít hands-free přístup k výpočetní technice. Proto pokračuje vytvoření velkých slovníků a rozvoj kontinuálního rozpoznávání řeči, více a více společností se ubírá směrem k technologiím rozpoznávání řeči a vyhledávají zajímavá odvětví, kde by se v oblasti moderních technologií mohly uplatnit. I když k největším pokrokům ve vývoji technologie rozpoznávání hlasu došlo v posledních dvou desetiletích, tato technologie začala opravdu již vynálezem Alexandra Grahama Bella v roce Bellem byl zjištěn proces převedení vlny tlaku vzduchu (zvuku) na elektrické impulsy, tím začal proces odkrývání vědeckého porozumění řeči na matematickém základě.[25] Během posledních dvou desetiletí technologie rozpoznávání hlasu dosáhla v systémech rozpoznávání souvislé řeči bodu real-time, což rozšiřuje možnosti zabezpečení, tvorby obsahu a vyřešení různých úkolů s mimořádně vysokou přesností. 17

17 3 Aplikace systémů rozpoznávání řeči Systémy rozpoznávání hlasu jsou aplikované v různých oblastech lidského života. Nejjednodušší systémy mohou byt použité pro hlasová vytáčení, přesměrování hovorů, ovládání domácích spotřebičů, zadávání jednoduchých dat, ale také pro přípravu strukturovaných dokumentů. V této kapitole jsou popsané následující oblastí využití řečových technologií, a to: Ve zdravotnictví V ozbrojených sílách V Battle managementu 3.1 Využití systémů rozpoznávání řeči ve zdravotnictví Složitější programy se používají pro zpracování textů převod řeči do textu např. ve zdravotnictví a v letectví. Nejnovější výzkumy v oblasti rozpoznávacích technologií znatelně odlehčují převod mluveného slova do elektronického textu. To zabezpečuje velkou výhodu pro pracovníky zdravotní péče, především pro lékaře. Během lékařského transkripčního procesu diktování doktorem se do elektronického souboru konvertuje diktát pomocí člověka, který provádí lékařskou transkripci. Vytvořený soubor se pak odesílá doktorovi, který tento dokument uchovává v počítači pro další použití. Celý tento proces trvá docela dlouho, přičemž v transkripčním odvětví neexistuje žádný všeobecný standard, který by určoval přesný čas zpracování dat, a který by byl měřítkem pro všechny poskytovatele transkripčních služeb. Toto je nejslabší místo lékařského transkripčního procesu, které může být ale jednoduše překonáno pomocí využití technologií rozpoznávání řeči. V současné době existují dva typy softwarů, určených pro výše zmíněné účely. První typ se nazývá Front-End software, druhý Back-End software. Obě dvě zmíněné varianty mají svoje výhody a nedostatky. [10] V případě Front-End softwaru lékař diktuje a upravuje transkripční report, což znamená, že pomoc pracovníka anebo editora, který se zabývá transkripcí, není nutná. Pro lékaře je tento typ softwarové aplikace výhodný, protože může ušetřit čas v jeho plném rozvrhu. Nevýhodou Front-End softwaru je to, že v případě nepřítomnosti transkriptora nebo editora nelze zaručit přesnost vygenerovaného reportu, protože v současné době existující programy nejsou stoprocentně přesné. Kromě toho se 19

18 v případě, že si lékař nevšimne chyby během transkripčního procesu, ovlivní pravděpodobně velmi negativně celá léčba. Co se týče Back-End softwaru, zde musí mluvčí diktovat do digitálního diktovacího systému. Hlasový soubor společně s návrhem se následně odesílá pro editaci k lékařskému transkriptoru. Po úpravě a finalizaci souboru se report posílá zpátky k doktorovi na ověření a podpis. Tím pádem se přesnost, totiž výsledek rozpoznávacího softwaru, zvyšuje pomocí transkriptora, který filtruje a opravuje chyby. Mnozí lékaři preferují tento typ softwaru. Většina pracovníků zdravotnické péče považují za užitečnou integraci programů pro rozpoznávání řeči typu Back-End s transkripčním procesem. Takto se zkracuje doba zpracování dat, a zároveň je úroveň přesnosti stále vysoká. Vyhledávání, dotazy a vyplňování formulářů se dá mnohem rychleji provést hlasem, než pomocí klávesnice. Řešení v oblasti zdravotní péče jsou velmi specifická dle každého státu, nicméně některé firmy se snaží přizpůsobit řešení pro potřeby konkrétního trhu. 3.2 Ozbrojené síly a řečové technologie Technologie rozpoznávání řeči jsou také hodně používané v ozbrojených silách, například ve vysokovýkonných bojových letadlech. Značné úsilí bylo v posledních deseti letech věnované testování a vyhodnocování systémů rozpoznávání řeči pro stíhací letadla. Za zmínku stojí program USA věnovaný rozpoznávání řeči pro pokročilou stíhací integrační technologii pro letadlo typu F-16 VISTA, a také francouzský program pro instalaci systémů rozpoznávání řeči v letadlech Mirage. Také jsou již vyvinuté výjimečné programy ve Velké Británii, zabývající se různými platformy letadel. V těchto programech se úspěšně ukázaly vyvinuté rozpoznávače řeči ve stíhacích letadlech s aplikacemi včetně následujících funkcí: nastavení radiofrekvence, komandního a auto pilotního systému, který je dokonce schopný sledovat bodové souřadnice a parametry uvolnění zbraně, plus také funkci letového displeje. Během práce se Švédskými piloty, létajícími na JAS-39, Englung v roce 2004 zjistil, že rozpoznávání se zhoršuje s růstem G-zatížení. Dalo by se taky očekávat, že úroveň přesnosti rozpoznávání se zhorší kvůli používání nepravopisné angličtiny, ale negativní účinky lámané angličtiny nebyly v tomto případě zjištěné. Je samozřejmosti, že spontánní řečový projev způsoboval problémy při rozpoznávání, což bylo i očekáváno. Nedostatečná slovní zásoba programů a především nesprávná syntaxe podstatně omezují přesnost rozpoznávání řeči. 20

19 V současné době letoun typu Eurofighter Typhoon, jehož výrobcem je britská firma RAF UK, používá systém závislý na mluvčím, což znamená, že je vyžadováno, aby každý pilot vytvořil vlastní šablonu. Tento systém se nedá použít pro kritické, bezpečnostní anebo zbraňové úkoly (např. uvolnění zbraně), ale je použitelný pro celou řadu dalších kabinových funkcí. Hlasové příkazy jsou v tomto případě vždycky potvrzené vizuální, anebo sluchovou zpětnou vazbou. Systém představuje hlavní konstrukční prvek, který vede ke snižování pracovního zatížení pilota, a dokonce umožňuje pilotovi přiřazovat cíle pomocí jednoduchých příkazů. Tyto systémy jsou v současné době také vyvíjené a jsou v procesu testování pro letoun typu F35 Lightning II a Alenia Aermacchi M-346. Úroveň přesností těchto systémů se přibližuje k 98 %. [21] Systémy rozpoznávání řeči se také používají ve vrtulnících. V tomto případě je hlavním problémem pro rozpoznávání hluk. Pilot vrtulníku obvykle nenosí masku, která by mohla snížit hlučnost v mikrofonu. V posledních deseti letech byly provedené důležité zkoušky a hodnocení programů, zejména americkou armádou Avionics, která se zabývá výzkumnou a vývojovou činností, a také se tomu věnuje královský letecký podnik ve Velké Británii. Ve Francii se vyvíjí rozpoznávač řeči pro vrtulník Puma. Poměrně efektivní jsou také výzkumné práce v Kanadě. Ke zkoumaným hlasovým aplikacím patří kontrola rádio-komunikace, navigační systémy a řízení auta pilotního režimu. 3.3 Battle management a systémy rozpoznávání řeči Systémy rozpoznávání řeči jsou také použitelné v tzv. Battle managementu. Battle management řídících středisek zpravidla vyžaduje rychlý přístup k řízení velkých, rychle se měnících informačních databází. Vedoucí a systémový operátor je potřeba, aby byly databáze co nejpohodlnější pro použití a zároveň přehledné, aby se dalo rychle a přesně orientovat v informačním prostředí, které se zobrazuje na displeji. Již byla podniknuta celá řada pokusů o vytvoření komerčního rozpoznávače pro prostředí Battle managementu. Byla také provedena studie rozpoznávacího zařízení, které bylo testováno spolu s integrovaným informačním systémem pro aplikaci v námořní bitvě. Uživatelé byli celkem nadšeni potenciálem systému, i když možnosti tohoto systému jsou stále omezené. Školící program pro řidiče letového provozu (ATC) představuje vynikající aplikace systémů rozpoznávání řeči. Mnoho ATC systémů v současné době vyžaduje, aby uživatel jednal jako pseudo-pilot, zapojil se do hlasového dialogu se zkušebním řidičem, což pomáhá simulovat dialog v reální ATC situaci. 21

20 V současné době se využívají softwary pro rozpoznávání řeči také pro automatický překlad, v automobilním průmyslu, v telematice, v Real Time Voice writing, v hands-free počítačových systémech, pro interaktivní hlasové odpovědi, v oblasti mobilní telefonie, v multimediální interakci a také ve videohrách. 22

21 4 Popis principu rozpoznávání řeči počítačem Rozpoznávání řeči představuje víceúrovňový úkol rozpoznávání obrazů, ve kterém jsou akustické signály analyzovány a strukturovány do hierarchie konstrukčních prvků (např. fonémy, slova, fráze a věty). Každá úroveň hierarchie může poskytnout určitý dočasný konstant, např. možné sekvence slov, nebo známé typy výslovnosti, které snižují počet chyb při rozpoznávání na nižší úrovni. Čím více informací víme o vstupním signálu, tím snadněji dokážeme zpracovat a rozpoznat tuto informaci. 4.1 Jednotlivé etapy procesu Proces rozpoznávání hlasu probíhá v několika fázích. V každé fázi zpracování řečového signálu se používá několik různých metod. Proces rozpoznávání hlasu lze rozdělit do několika hlavních etap. Nyní podrobněji o jednotlivých etapách. (viz obrázek č.4.1.1) Příjem hlasového signálu Analýza signálu Akustické modely Řečový záběr Akustická analýza Mnoho záběrů Korigování času Pořadí slov Testování Segmentace Obrázek 4.1.1: Etapy rozpoznávání [8] 23

22 První etapou je příjem hlasového signálu a předběžné zpracování řeči. Během druhé etapy jde o rozpoznávání fonémů a slov. Třetí závěrečnou etapou je porozumění řeči. Získávání hlasového signálu neboli diskretizace hlasu je definovaná jako proces získávání a zpracování zvukového signálu. Hlas je reprezentován jako změny akustického tlaku v mikrofonu, pro které jsou charakteristické relativně nízkofrekvenční signály v rozsahu od cca 0 až 4 khz. Existují dva typy zvuků: znělé a neznělé. Znělé zvuky se tvoří vibracemi hlasivek při průchodu zvuku. Tento akustický signál je modulován napětím hlasivek. Vibrace rezonují v hlasovém kanálu. Proud vzduchu, který vytváří zvuk, se nazývá vlnou vzniklou v hlasivkách. Tento signál je kvaziperiodický a jeho doba trvání se nazývá dobou trvání základního tónu. Resonanční signál znělých zvuků se obvykle skládá ze čtyř frekvenčních složek tzv. formantů. Formanty jsou hlasovým razítkem pro různé zvuky produkované lidským řečovým aparátem. Neznělé zvuky jsou produkované tak, že vzduch prochází hlasovým kanálem bez vibrací hlasivek. Oba typy zvuků jsou považované za časové řady dat, převzaté z pravidelných časových intervalů. Pro izolaci požadovaného intervalu se používají prostorová okna. Některé funkce okna vypočítávají průměrnou amplitudu, počet nulových přechodů a transformace Fourierova signálu během intervalu. Pro odstranění hluku se používají různé filtrační techniky. Pro rozpoznávání fonémů a skupin fonémů se používají takové metody, jako skrytý Markův model a uměle neuronové sítě, anebo kombinace obojích. Třetí nejsložitější etapou procesu rozpoznávání řeči je porozumění řeči. Rozumět řeči je to nejtěžší. V této fázi musí být pořadí slov ve větě přeměněné na reprezentaci toho, co chtěl mluvčí říct. Je dobře známo, že porozumění řeči je založené na obrovském množství jazykových a kulturních znalostí. Většina systémů pro rozpoznávání hlasu disponuje znalostmi o přirozeném jazyku a konkrétních okolností. 24

23 4.2 Problémy a překážky při rozpoznávání Jedním z hlavních problémů při rozpoznávání hlasu je rozpoznávání mluvčího, tj. proces automatického určování toho, kdo řekl, na základě individuální informace vstupující do řečového signálu. V tomto případě můžeme mluvit o identifikaci nebo ověření reproduktoru. Identifikace je nalezení kontrolních frází v určitém množství, které odpovídá způsobu mluvení reproduktoru. Verifikace mluvčího je zjišťováni identity mluvčího. Technologie rozpoznávání mluvčího umožňuje využívat hlas pro řízení přístupu, např. telefonní přístup k bankovním službám, k databázím, na e-komerce systému, anebo v hlasové poště, a také přístup k tajemnému zařízení. Obě tyto technologie požadují, aby byl uživatel zařazen do systému, takže musí nechat zapsat vzor své řeči, podle kterého systém může vybudovat šablonu. Na cestě rozvoje rozpoznávání řeči stoji několik zásadních překážek. Jednou z nich je nedostatečný objem slovníků. Druhá je vytvoření šablony nepřetržité řeči, třetí překážkou jsou pak různé přízvuky a výslovnost. Toto jsou nejdůležitější překážky pro automatizované systémy rozpoznávání hlasu, ale existuji také i další problémy, jako např. porozumění sémantice řeči aj. Objemy slovníků definují stupeň složitosti, požadavky na výpočetní výkon a spolehlivost systémů rozpoznávání hlasu. Je možné přizpůsobit se k nepřetržitému toku řeči, ale existují také přísná sémantická pravidla, podle kterých je potřeba se řídit, aby byl systém schopen pochopit sémantiku kombinace slov ve větě. Stále je potřeba pokračovat v důkladném výzkumu, což může pomoci se vyrovnat s takovými vlastnostmi řeči, jako je morfologie, důraz, výška zvuku, rychlost, hlasitost, slučování slov, kontext, artikulace, lingvistická informace, synonyma atd. Předpokládá se, že hlavním směrem vývoje se stane modelování jazyků, které by mohlo být použité v systémech pro rozpoznávání řeči. Nebyl dokonce vyřešen problém oddělení řečového signálu od hlukového pozadí. V současné době jsou uživatelé systémů rozpoznávání řeči nuceni buď pracovat v podmínkách minimálního hlukového pozadí, anebo nosit helmu s mikrofonem u úst. Kromě toho musí uživatel informovat počítač o tom, co se právě děje. Samozřejmě, že to není nejlepší varianta uživatelského rozhraní. Řešení těchto problémů již bylo zahájeno, a již byly obdrženy nadějné výsledky. 25

24 Jedním z dlouho očekávaných vývojů v oblasti rozpoznávání hlasu se staly dialogové systémy typu člověk-stroj; výzkumem těchto systémů se zabývají ve mnoha laboratořích a vysokých školách. Tyto systémy jsou schopné pracovat s nepřetržitým řečovým tokem a s neznámými mluvčími, chápat význam fragmentů řeči. Tyto systémy pracují v reálném čase a jsou schopné vykonávat pět funkci: rozpoznávání řeči převod řeči do textu, skládající se z jednotlivých slov; porozumění analýza vět a porozuměni významu; obnova informací získávání dat z operačních zdrojů na základě sémantického významu; generování lingvistické informace budování vět, reprezentujících obdržené údaje, ve vybraném jazyku; syntéza řeči převod vět do syntetizované počítačové řeči. 26

25 5 Klasifikace systémů rozpoznávání řeči Každý sytém pro rozpoznávání řeči má nějaké problémy, které musí řešit, a také komplex přístupů, který je pak aplikován pro řešení určitých úkolů. Podíváme se na hlavní charakteristiky, podle kterých mohou být klasifikované systémy rozpoznávání lidské řeči, a také na to, jak určitá (dis)funkce může ovlivnit výkon celého systému. Jednou z nejdůležitějších charakteristik je velikost slovníku systému. Je zřejmé, že čím větší je obsah slovníku zapsaného do systému rozpoznávání, tím větší je četnost chyb při rozpoznávání slov systémem. Například slovník, který se skládá z 10 číslic, může být rozpoznáván prakticky bezchybně, zatímco četnost chyb při rozpoznávání slovníku velikosti může dosáhnout až 45% chybovosti. Na druhou stranu může rozpoznávání malého slovníku produkovat velké množství chyb, pokud jsou si slova v tomto slovníku navzájem velmi podobné. Dalším bodem ve kvalifikaci systémů je to, zda je systém závislý na mluvčím, anebo není. Podle definice je systém závislý na mluvčím určený pro použiti jedním uživatelem, zatímco systém nezávislý na mluvčím je navržen pro práci s jakýmkoliv uživatelem. Nezávislost na mluvčím těžko dosažitelný cíl, protože během procesu školení systému se systém konfiguruje podle parametrů mluvčího. Četnost chyb rozpoznávání takových systémů je obvykle 3-5 krát vyšší než četnost chyb v systémech, které jsou závislé na mluvčím. Dále se systémy klasifikují podle toho, zda jsou schopné rozpoznávat plynulou řeč, anebo jenom oddělenou. Pokud je v řeči každé slovo oddělené od dalšího chvílí ticha, pak říkáme, že tato řeč je oddělená. Plynulou řečí rozumíme přirozeně vyslovené věty. Rozpoznávání plynulé řeči je mnohem obtížnější vzhledem k tomu, že hranice jednotlivých slov nejsou jasně vymezené a jejich výslovnost je silně narušena rozmazáním vyslovených zvuků. Posledním a velmi důležitým bodem je účel systému rozpoznávání řeči. Účel systému určuje požadovanou úroveň abstrakce, na kterém se bude provádět rozpoznávání řeči. V příkazovém systému (např. hlasové vytáčení v mobilním telefonu) bude pravděpodobně rozpoznávání slov či frází probíhat jako rozpoznávání jediného řečového prvku, přičemž systém diktátu bude vyžadovat velkou přesnost rozpoznávání a s největší pravděpodobností se bude při procesu interpretace vyslovené věty opírat nejen o to, co bylo vyslovené v tuto chvíli, ale také o to, co bylo vyslovené předtím. 26

26 Navíc v systému musí být integrovaný soubor gramatických pravidel. Čím přesnější pravidla jsou, tím snazší je realizovat systém rozpoznávání řeči. Při vytváření systému rozpoznávání řeči je třeba zvolit úroveň abstrakce, která je adekvátní pro konkrétní úkol, dále je také nutné zvolit parametry zvukové vlny, které budou použity pro rozpoznávání, a v neposlední řadě také metody pro zjišťování těchto parametrů. Podíváme se na základní rozdíly ve struktuře a procesu fungování různých systémů rozpoznávání řeči. (viz obrázek 5.1) 27

27 Rozpoznávání řeči Dle spotřebitelských charakteristik Závislé na mluvčím Nezávislé na mluvčím Dle velikostí slovníku Ohraničený počet slov Slovník velkého rozsahu Dle typu řeči Jednotná slova Plynula řeč Příkazové systémy Dle funkce Systémy diktovky Rozpoznávací systémy Dle typu strukturní jednotky Alofon Fonéma Diafon, Trifon Slovo, fráze Dle extrakce příznaků Spektrální analýza Koeficienty lineárního předpokladu Kepstrální analýza Velvetová analýza Dle funkčního mechanizmu Expertní systémy Jednoduché detektory Zpětného úkolu nalezení artikulačních parametrů Pravděpodobnostně-sitové Markovské procesy Dynamické programování Metoda neuronových sítí Obrázek 5.1: Klasifikace systémů pro rozpoznávání řeči 25

28 Programy rozpoznávání řeči se dají rozlišovat podle strukturální jednotky. Během procesu analýzy řeči mohou být jako základní jednotka vybrána jednotlivá slova, anebo jednotlivé časti vysloveného slova, jako jsou fonémy, tritóny a alofóny. Podle toho, jaká strukturní část byla vybrána, se mění struktura, všestrannost a komplexnost slovníku prvků určených pro rozpoznávání. Dále se zkoumané programy liší dle extrakce příznaků. Pořadí počítání tlaku zvukové vlny je příliš nadměrné pro systémy rozpoznávání zvuků a obsahuje spoustu zbytečných informací, které nejsou nutné pro samotný proces rozpoznávání, anebo, dokonce, škodlivé. Pro uznání řečového signálu je z něj potřeba dostat jakékoliv parametry, které dostatečně reprezentují tento signál pro rozpoznávání. Programy se také rozlišují dle mechanismu fungování. V moderních systémech jsou široce používány různé přístupy mechanismů fungování systémů rozpoznávání řeči. Pravděpodobnostní síťový přístup je takový, že se řečový signál rozdělí do určitých částí, potom se provádí pravděpodobnostní odhad toho, ke kterému prvku slovníku se vztahuje určitá část, rozuměj celý vstupní signál. Přístup, který je založený na řešení inverzního problému syntézu zvuku je v tom, že podle vstupního signálu se zjišťuje charakter pohybu artikulátorů řečového traktu a pomocí speciálního slovníku se zjišťují vyslovené fonémy. 32

29 Mlrd. USD 6 Současný stav na trhu technologií pro ovládání PC hlasem O očekávaném výbuchu na trhu řečových technologií svědčí nejenom nekonečné rozhovory o těchto technologiích, ale také bezkompromisní čísla a grafy ve zprávách od předních světových analytických společností. Odborníci, kteří spolupracují s mediální korporací CNN, považují rozpoznávání řeči za jednu z osmi nejperspektivnějších technologií. Růst trhu řečových technologií Rok Obrázek 6.1: Růst trhu řečových technologií v letech [10] 33

30 Rozdělení trhu řečových technologií 1% 3% 96% akustické systémy identifikace hlasu automatické rozpoznávání řeči Obrázek 6.2: Rozdělení trhu řečových technologií Všeobecně se považuje, že se lidstvo nachází na pokraji boomu, průlomu, který povede k vážné redistribuci stávajícího high-tech trhu, a díky tomu se uvolní obrovské finanční prostředky. Boj za obdržení těchto prostředků probíhá jíž dnes, přičemž hlavni bitva se odehrává mezi softwarovými společnostmi v oblasti automatického rozpoznávání řeči. V dnešní době existuje největší poptávka po dvou hlavních druzích těchto systémů: Prvním druhem jsou automatická call-centra, neboli help desky, které jsou schopné odpovědět na jednoduché příchozí otázky. Automatické zpracování telefonních hovorů je provozováno americkým telekomunikačním operátorem AT&T, investiční bankou Charles Schwab & Co, maloobchodní sítí Sears, a také obchodním řetězcem supermarketů Roebuck. I když je v současnosti lídrem tohoto typu podle množství používaných call-center Amerika, výhodu těchto systémů si v poslední době začínají uvědomovat i v Evropě. Například švýcarské železnice již poskytují svým německy mluvicím cestujícím podobné služby, které poskytují United Airways. Automatické call-centrum je dobré řešení, ale velmi náročné a nákladné. Navíc kromě toho, že počet společností, které jsou schopné nainstalovat tyto systémy, je velmi 34

31 omezený, nebude již mít tento segment trhu miliardové obraty, jelikož už nemůže nadále růst. Druhým nejpopulárnějším produktem v naší době, založeném na technologiích rozpoznávání řeči, je specializovaný systém pro diktování. Tyto systémy jsou určeny pro specialisty určitých profesí. Nyní se podíváme na očekávaný růst na trhu řečových technologií. Trh technologií pro rozpoznávání hlasu vzroste podle odhadů o 8,8 % v 2015 v porovnání s rokem Celková velikost trhu v hodnotě 38,4 miliard dolarů v roce 2011 má dosáhnout 58,4 miliard dolarů v roce Trh hardwaru pro přenos signálu a pro snížení okolního hluku dosáhl hodnoty 16,5 miliard dolarů v roce 2010 a odhadovaný růst k roku 2015 činí 9,8 %; (viz. obrázek 6.2). Technologie automatického rozpoznávání řeči a text-to-speach software tvořil 13,6 miliard dolarů v roce 2010, v roce 2015 se pravděpodobně zvýší na 18,9 miliard dolarů. [32] Přehled celosvětového trhu technologií pro hlasové o v lá d á n í Bln. USD Software Hardware Ostatní zařízení Rok Obrázek 6.3: Přehled celosvětového trhu technologií pro hlasové ovládání [32] 35

32 7 Rešerše a popis aplikací pro rozpoznávání hlasu Nejvíce propracovaných programů existuje zatím pro anglický jazyk. Pro češtinu a ruštinu jsou tyto programy složitější převážně kvůli mnohem větším slovníkům, které musí obsahovat všechny možné varianty slov. Problémem vytvoření efektivních programů pro rozpoznávání řeči pro slovanské jazyky je také volné pořadí slov, což je v angličtině více striktní. Využití každé varianty slova ve slovníku programu jako jiného slova vede ke zmenšení procenta přesnosti rozpoznávání, ačkoli se u těchto slov liší většinou jen koncovky. Dalším problémem je průměrná délka slova, která je ve slovanských jazycích mnohem větší něž v angličtině. Po provedení rešerší programů určených pro hlasové ovládání počítače jsem vybrala deset programů, které podporují ovládání v různých jazycích. Zde je uveden seznam a krátký popis těchto programů: MyDictate o Tvůrci tohoto programu brali zřetel zejména na handicapované osoby, které nemůžou používat ruce. o Výhodou je možnost diktování všem osobám schopným dobře vyslovovat a současně očima sledovat dění na monitoru počítače, přičemž jsou diktována jednotlivá slova, mezi kterými je nutné vždy udělat krátkou pauzu. o Diktovat lze do libovolného programu běžícího pod operačním systémem Windows XP CZ, a to do místa, kde je umístěn kurzor. JetVoice. o Program JetVoice je určen pro běžné uživatele počítače. o Nahrávání probíhá pomocí mikrofonu. Program je schopný nahrát řadu příkazů, které budou provedeny po pouhém vyslovení po dokončení nahrávání. o Příkazy mohou být různé, od spouštění nějakého programu, přes zkratkovou klávesu až po otevření CD-ROM. 32

33 Dragon Naturally Speaking. o Tento program uvítají zejména vytížení firemní pracovníci. o Díky Dragon Naturally Speaking programu mohou uživatelé diktovat dokumenty, posílat y či vyhledávat na webu. Diktograf. o Diktograf byl vyvinut cíleně pro běžné uživatele. Umožňuje ovládat některé funkce počítače za pomoci hlasových příkazů, a také je pomocníkem pro diktování textu v libovolném textovém editoru. Simon 0.3. o Běžní uživatelé mohou dále využívat výhod programu Simon 0.3, který se skládá z balíčku akcí pro jednu konkrétní úlohu. Tou může být ovládání myši, Firefoxu, přehrávače hudby apod., navíc tento program zvládá rozpoznat řeč i bez tréninku. Dictation 2005 o Program je vytvořený pro běžné uživatele počítače využívá se pro účely diktování textu do textového redaktoru a hlasového ovládání jiných programů. o Funguje na platformě Windows Speak To Text o Je to jednoduchý detektor. Používá se pro ovládání jiných programů v počítači pomocí hlasových příkazů o Funguje na platformě Windows Tatzi 2.0 o Jednoduchý program pro ovládání počítače hlasem za pomocí anglických příkazů o Funguje na platformě Windows Detailní popis výše zmíněných programů dle jednotlivých kriterií je uveden v následující tabulce: 33

34 Název programu jazyk Cena závislost na mluvčím velikost slovníku typ řeči funkce typ strukturní jednotky funkční mechanizmus rozšíření slovníku uživatelem MyDictate CZ 9.308,- Kč ano velký jednotná slova diktování fonémy expertní systém ano JetVoice AJ Zdarma ano malý jednotná slova jednotlivé příkazy slova jednoduchý detektor ne Dragon Naturally Speaking AJ 3.351,- Kč ne velký plynulá řeč diktování slova, fráze expertní systém ano Diktograf RU Zdarma ano střední plynulá řeč diktování slova, fráze expertní systém ano Simon 0.3 AJ Zdarma ano malý jednotná slova jednotlivé příkazy fonémy jednoduchý detektor ne Dictation 2005 AJ Zdarma ano střední plynulá řeč diktování slova, fráze expertní systém ano SpeakToText AJ Zdarma ano střední jednotná slova diktování slova, fráze jednoduchý detektor ano Tatzi 2.0 AJ Zdarma ano malý jednotná slova jednotlivé příkazy slova jednoduchý detektor ne Perpetum Mobile RU 1.500,- Kč ano velký jednotná slova diktování slova, fráze expertní systém ano Tabulka 7.1: Popis programů 34

35 7.1 Vícekriteriální rozhodování při výběru programu Obecnou součástí vícekriteriálního rozhodování mezi variantami výběru programu je šest relativně samostatných kroků (33): vytvoření účelově orientované množiny kritérií hodnocení stanovení vah kriterií hodnocení stanovení vzorových hodnot vah kriterií (etalonů) hodnocení dosažených výsledků variant posouzení rizika spojeného s případnou realizací variant určení preferenčního pořadí variant a výběr nejlepší varianty Diagram 7.1.1:.Obecný postup vicekriteriálního hodnocení 35

36 7.1.1 Vytvoření množiny kriterií hodnocení Sestavení kritérií hodnocení řečových programů je vůbec základním krokem celého postupu vícekriteriálního hodnocení existujících variant. Jejich špatným zvolením můžeme významně ovlivnit celkový výsledek hodnocení. Prvním bodem pro vhodné zvolení kritérií je dostatečné poznání samotného objektu hodnocení a systémové pochopení jeho struktury a funkcí. Není-li soubor kriterií úplný, může dojit k hrubému zkreslení výsledků hodnocení. V této bakalářské práci jsou objekty vícekriteriálního rozhodování programy pro ovládání PC hlasem. Pro výběr nejvhodnějšího programu jsem stanovila následující kritéria: Jazyk programu Cena programu Závislost na mluvčím Velikost slovníku programu Schopnost programu rozpoznávat plynulou řeč Funkce programu Typ strukturní jednotky Funkční mechanismus programu Možnost rozšíření slovníku uživatelem Stanovení vah kriterií Stanovení vah kriterií je dalším postupem multikriteriálního hodnocení. Úzce závisí na úplnosti soustavy kritérií, které jsou odrazem podstatných vlastností dané varianty. Pro stanovení vah kritérií existuje celá řada různých metod. V daném případě jsem zvolila metodu párového srovnání kriterií, tzv. Fullerovou metodu. Podstatou této metody je zvolit, které ze dvou kritérií je při párovém srovnání důležitější. Dvě kritéria se postupně srovnávají mezi sebou, čili počet porovnání se vypočítá vzorcem: k k 1 N k,2 (Vzorec 1) 2 36

37 Srovnání se provádí v tzv. Fullerově trojúhelníku. Kritéria se pevně očíslují pořadovými čísly 1,2,,k. Dále se vytvoří trojúhelníkové schéma, jehož dvouřádky tvoří dvojice pořadových čísel uspořádaných tak, že se každá dvojice kriterií vyskytne právě jedenkrát. Poté je nutné označit zakroužkováním u každé dvojice to kriterium, které je považované za důležitější. Počet zakroužkování i-tého kritéria označíme n i. Váha i-tého kritéria se pak vypočte dle tohoto vzorce: n i i ; i 1,2,..., k (Vzorec 2) N Fůlleruv trojúhelník má následující schéma: Obrázek : Fullerův trojúhelník (34) Výhodou této metody je jednoduchost vyžadované informace od uživatele. Po úpravách je možno připustit i situaci, že některá kritéria jsou stejně důležitá nebo nesrovnatelná. 37

38 Označíme kritéria z podkapitoly následujícím způsobem: Jazyk programu 1 Cena programu 2 Závislost na mluvčím 3 Velikost slovníku programu 4 Schopnost programu 5 rozpoznávat plynulou řeč Funkce programu 6 Typ strukturní jednotky 7 Funkční mechanismus 8 Možnost rozšíření slovníku uživatelem 9 kriterií: Tabulka : Kritéria Pomocí těchto kritérií můžeme sestavit Füllerův trojúhelník a následně spočítat váhy Obrázek : Výpočet vah kritérií pomocí Füllerova trojúhelníku 38

39 Dle vztahu nyní určíme váhy jednotlivých kritérií, tedy důležitost, jakou jim přisuzujeme: Kritérium kritérium 1 - Jazyk programu 0,083 kritérium 2 - Cena programu 0,194 kritérium 3 - Závislost na mluvčím 0,167 kritérium 4 - Velikost slovníku programu 0,056 i kritérium 5 - Schopnost programu rozpoznávat plynulou řeč 0,194 kritérium 6 - Funkce programu 0,083 kritérium 7 - Typ strukturní jednotky 0 kritérium 8 - Funkční mechanismus programu kritérium 9 Možnost rozšíření slovníku uživatelem 0,140 0,083 Suma vah všech kritérií 1,000 Tabulka : Váhy kritérií vypočtené metodou Füllerova trojúhelníku Nyní můžeme seřadit tato kritéria dle stupně důležitosti: Pořadí Kritérium 1 kritérium 5 - Schopnost programu rozpoznávat plynulou řeč 2 kritérium 2 - Cena programu 3 kritérium 3 - Závislost na mluvčím 4 kritérium 8 - Funkční mechanizmus programu 5 kritérium 6 - Funkce programu 6 kritérium 1 - Jazyk programu 7 kritérium 9 - Možnost rozšíření slovníku uživatelem 8 kritérium 4 - Velikost slovníku programu 9 kritérium 7 - Typ strukturní jednotky Tabulka : Kritéria dle stupně důležitosti 39

40 7.1.3 Stanovení etalonů kriterií Nynějším úkolem je stanovení souboru vzorových hodnot kritérií: Kritérium kritérium 1 - Jazyk programu kritérium 2 - Cena programu kritérium 3 - Závislost na mluvčím kritérium 4 - Velikost slovníku programu kritérium 5 - Schopnost programu rozpoznávat plynulou řeč kritérium 6 - Funkce programu kritérium 7 - Typ strukturní jednotky kritérium 8 - Funkční mechanismus programu kritérium 9 - Možnost rozšíření slovníku uživatelem Vzorová hodnota čeština bezplatný není velký ano diktování slova, fráze expertní systém ano Tabulka : Etalony kriterií 40

41 7.1.4 Výběr nejlepší varianty pomocí metody TOPSIS Pro výběr nejvhodnější varianty v daném případě je vhodné použit jednu z metod, založených na minimalizaci vzdálenosti od ideálního řešení. Tyto metody jsou založeny na posouzení variant podle jejich vzdálenosti od fiktivní varianty, jinak také řečeno ideální či bazální varianty, a na kardinálním hodnoceni variant podle jednotlivých kriterií a jejich vah. V mém případě řešení úlohy o výběru nejlepšího programu jsem se rozhodla použít metodu TOPSIS (Technique for Order Preference by Similarity to Ideal Solution.) Metoda TOPSIS je založena na výběru varianty, která je nejblíže k ideální variantě a současně nejdále od bazální varianty. Ideální varianta ve všech kriteriích nabývá nejlepších hodnot Bazální varianta ve všech kriteriích nabývá nejhorších hodnot Předpokládá se maximalizační a kvantitativní charakter všech kriterií. Převedeme všechna kvalitativní kritéria na kvantitativní (viz tabulka ) 41

42 Název programu jazyk závislost na mluvčím velikost slovníku typ řeči funkce typ strukturní jednotky funkční mechanismus rozšíření slovníku uživatelem MyDictate JetVoice Dragon Naturally Speaking Diktograf Simon Dictation SpeakToText Tatzi Perpetum Mobile Tabulka : Převod kvantitativních kriterií na kvalitativní 42

43 Podruhé je nutné vytvořit normalizovanou kriteriální matici Aij, kde i=1, 2,..., m; j=1, 2,..., n. Normalizované hodnoty kritérií spočítáme dle následujícího vzorce: b ij a m a i1 ij 2 ij (Vzorec 3) 43

44 Varianty řešení Kritéria f1 f2 f3 f4 f5 f6 f7 f8 f9 MyDictate 0,507-0,930 0,169 0,507 0,169 0,338 0,169 0,338 0,338 JetVoice 0, ,169 0,169 0,169 0,169 0,338 0,169 0,169 Dragon N.S. 0,338-0,335 0,338 0,507 0,338 0,338 0,507 0,338 0,338 Diktograf 0, ,169 0,338 0,338 0,338 0,507 0,169 0,338 Simon , ,169 0,169 0,169 0,169 0,169 0,169 0,169 Dictation , ,169 0,338 0,338 0,338 0,507 0,338 0,338 SpeakToText 0, ,169 0,338 0,169 0,338 0,507 0,169 0,338 Tatzi , ,169 0,169 0,169 0,169 0,338 0,169 0,169 Perpetum Mobile 0,169-0,169 0,507 0,169 0,338 0,507 0,338 0,169 0,150 Tabulka : Normalizovaná kritéria 44

45 Ideální a bazální varianty jsou znázorněny v této tabulce: Varianty Kritéria řešení f1 f2 f3 f4 f5 f6 f7 f8 f9 H 0, ,338 0,507 0,338 0,338 0,507 0,338 0,338 D 0,169-0,930 0,169 0,169 0,169 0,169 0,169 0,169 0,169 Tabulka : Ideální a bazální varianty Nyní vypočteme hodnoty užitkové funkce dle následujících matematických vzorců. Vzdálenost od ideální hodnoty: d i v 2 h H v h H 2 v h H 2 1 i1 1 2 i k ik k (Vzorec 4) Vzdálenost d i MyDictate 0,422 JetVoice 0,216 Dragon N.S. 0,155 Diktograf 0,118 Simon ,164 Dictation ,089 SpeakToText 0,134 Tatzi ,161 Perpetum Mobile 0,889 Tabulka : Vzdálenost variant od ideální hodnoty 45

46 Dle výsledků výpočtů je zřejmé, že varianta programu Dictation 2005 je nejméně vzdálená od ideální varianty. 46

47 7.2 Popis programu Dictation 2005 Nejlepší variantou podle vícekriteriálního hodnocení je Dictation Tento program má následující charakteristiky: Podle spotřebitelských charakteristik je tento program Dictation 2005 závislý na mluvčím, ale může byt používán několika uživateli Slovník programu je větší něž střední Program je schopný vnímat a zpracovávat plynulou řeč Dle funkce je tento systém diktovací a rozpoznávací Systém je založený na spektrální analýze a Markovských modelech Jedním z důvodů, proč jsem vybrala přesně tento systém pro zkoumání, je také dostupnost jeho zkušební verze na internetu zdarma. Hlavním problémem při výběru vhodného programu pro účel provedení testování bylo, že většina programů pro rozpoznávání řečí jsou moc drahé a nedostupné pro běžného uživatele. Rozhraní testovaného programu, anglicky interface, je v anglickém jazyce, rozpoznávacím jazykem je také angličtina. Tento fakt nebyl překážkou v provedení testování, jelikož stačilo, aby uživatel uměl anglicky číst. Program má následující požadavky na operační systém: RAM: 32/64 MB Místo na disku: 100 MB Operační systém: Win 98/ NT 4.0/ 2000/ Me/ XP Prohlížeč: Internet Explorer Monitor: rozlišení 800x600 Rychlost procesoru: Pentium Type 100Mhz + WinZip 7.0 Multimedia Industry Standard Souncard a externí reproduktory 47

48 Před použitím je nezbytné provést trénink programu, vývojáři doporučují trénovat program dokonce po dobu dvou měsíců. Program Dictation 2005 má v nabídce funkcí nejenom diktování textů, ale také převedení zvukových souborů do textové podoby, zpracování textů v aplikaci Microsoft Word a funkci Point and Speak. Všechny tyto funkce jsou velmi užitečné pro zpracování běžných souborů, což uživatel pozná zejména po dostatečném natrénování programu. Nabídka Menu programu Dictation 2005 v.5.5.: Obrázek : Nabídka programu Dictation 2005 Při výběru položky Dictation z nabídky Menu se nám zobrazí okno pro diktování a formátování textu. 48

49 Obrázek 7.2.2: Okno pro diktování a formátování textu Aby však program porozuměl textu, který se bude diktovat, je třeba na začátku provést tzv. trénink programu. Před začátkem trénování musíme zaprvé naladit a nakonfigurovat mikrofon. Vzdálenost mikrofonu od uživatele nesmí přesáhovat šedesát centimetrů, jinak nelze zaručit přesnost rozpoznávání. Důležité je také to, aby v místnosti, kde se nachází uživatel a počítač, byl co nejmenší hluk, který by jinak mohl snížit pravděpodobnost správného rozpoznávání slov. Pro správné fungování programu na počítači musí byt nainstalována a zapnuta funkce rozpoznávání řeči v systému Windows. V případě, že mikrofon je nainstalovaný správně, můžeme začít s trénováním. Nejprve musíme vybrat z nabídky menu Dictation, a poté Speaker Training. Následně se objeví okno s nabídkou textů, pomocí kterých můžeme program trénovat. Na výběr máme osm textů, které jsou tvořeny slovy používanými v běžném životě. 49

50 Obrázek : Nabídka textů pro trénování Po výběru textu pro trénování je uživateli nabídnuto přečíst text nahlas. Tím si program uloží do paměti vzory slov vyslovených uživatelem. Podle těchto vzorů bude pak program schopný rozpoznat, co uživatel říká. Problém je v tom, že stejný uživatel může vyslovit stejné slovo pokaždé jinak, proto je požadováno, aby uživatel přečetl co nejvíce textů během trénování, aby si počítač zapamatoval několik vzorů stejného slova a dokázal je v budoucnu rozpoznat. 50

51 V průběhu trénování se každé přečtené slovo zabarví, což znamená, že počítač tomuto slovu porozuměl a program si ho zapsal do paměti: Obrázek č : Průběh trénování Po dokončení tréninku lze začít diktovat libovolný text. Po každém vysloveném slově nebo čísle nabízí program nejen nejvhodnější slovo, ale také několik alternativ, ze kterých si můžeme vybrat v případě, že program slovo neodhadl správně: Obrázek č Nabídka možných slov 51

52 Do slovníku programu lze také přidávat nová slova: Obrázek : Přidání slov do slovníku Součástí programu je také funkce filtrování textu: Obrázek 7.2.7: Filtrace výslovnosti 52

53 Během procesu diktování existuje možnost ovládat editor pomocí určitých příkazů. Program v sobě obsahuje příkazy, pomocí kterých lze: Kapitalizovat písmena a formátovat text Měnit výběr textu Provádět opravy v textu Mazat vybraný text Navigovat kurzor myši Posouvat text Psát interpunkce Vypnout / zapnout poslech atd. Před každým příkazem se musí vyslovit orientační slovo Computer, aby počítač rozpoznal, že jde o příkaz, nikoli o nové slovo. Program Dictation 2005 lze používat i v editoru Microsoft Word: 53

54 Obrázek : Využití programu v Microsoft Word 54

ZÁKLADY PROGRAMOVÁNÍ. Mgr. Vladislav BEDNÁŘ 2014 7.4 13/14

ZÁKLADY PROGRAMOVÁNÍ. Mgr. Vladislav BEDNÁŘ 2014 7.4 13/14 ZÁKLADY PROGRAMOVÁNÍ Mgr. Vladislav BEDNÁŘ 2014 7.4 13/14 Co je vhodné vědět, než si vybereme programovací jazyk a začneme programovat roboty. 1 / 13 0:40 Implementace Umělá inteligence (UI) Umělá inteligence

Více

Pokročilé operace s obrazem

Pokročilé operace s obrazem Získávání a analýza obrazové informace Pokročilé operace s obrazem Biofyzikální ústav Lékařské fakulty Masarykovy univerzity Brno prezentace je součástí projektu FRVŠ č.2487/2011 (BFÚ LF MU) Získávání

Více

NÁRODNÍ TESTOVÁNÍ 2018/2019

NÁRODNÍ TESTOVÁNÍ 2018/2019 průměrný percentil Průměrný celkový percentil po jednotlivých třídách y 6. A 6. B 6. C ZŠ GYM 54 64 53 47 61 51 55 55 55 OSP ČJ MA Graf znázorňuje průměrné celkové percentily všech tříd u vaší školy. Zároveň

Více

1 Úvod 1.1 Vlastnosti programového vybavení (SW)

1 Úvod 1.1 Vlastnosti programového vybavení (SW) 1 Úvod 1.1 Vlastnosti programového vybavení (SW) - dávkové zpracování - omezená distribuce - zakázkový SW - distribuované systémy - vestavěná inteligence - laciný HW - vliv zákazníka 1950 1960 1970 1980

Více

7 Další. úlohy analýzy řeči i a metody

7 Další. úlohy analýzy řeči i a metody Pokročilé metody rozpoznávánířeči Přednáška 7 Další úlohy analýzy řeči i a metody jejich řešení Výsledky rozpoznávání (slovník k 413k) frantisek_vlas 91.92( 90.18) [H= 796, D= 10, S= 60, I= 15, N=866,

Více

NEWTON Technologies a.s. Jaroslava Schmidtová Project manager

NEWTON Technologies a.s. Jaroslava Schmidtová Project manager NEWTON Technologies a.s. Jaroslava Schmidtová Project manager NEWTON Technologies a.s. Budoucnost tvoříme hlasem Jaroslava Schmidtová Project manager NEWTON Technologies, a.s. je česká společnost (založená

Více

NEWTON Technologies a.s.

NEWTON Technologies a.s. NEWTON Technologies a.s. Budoucnost tvoříme hlasem Mgr. Jaroslava Schmidtová Project manager NEWTON Technologies, a.s. je česká společnost (založená v roce 2008), která se specializuje na řešení využívající

Více

NAKI - ČRo archiv - Zpřístupnění archivu Českého rozhlasu pro sofistikované vyhledávání

NAKI - ČRo archiv - Zpřístupnění archivu Českého rozhlasu pro sofistikované vyhledávání NAKI - ČRo archiv - Zpřístupnění archivu Českého rozhlasu pro sofistikované vyhledávání Archiv mluvených pořadů Více Českého informací rozhlasu >>> je právem označován za jeden z klenotů kulturního dědictví

Více

Úvod do zpracování signálů

Úvod do zpracování signálů 1 / 25 Úvod do zpracování signálů Karel Horák Rozvrh přednášky: 1. Spojitý a diskrétní signál. 2. Spektrum signálu. 3. Vzorkovací věta. 4. Konvoluce signálů. 5. Korelace signálů. 2 / 25 Úvod do zpracování

Více

Základní informace: vysoce komfortnímu prostředí je možné se systémem CP Recorder efektivně pracovat prakticky okamžitě po krátké zaškolení.

Základní informace: vysoce komfortnímu prostředí je možné se systémem CP Recorder efektivně pracovat prakticky okamžitě po krátké zaškolení. Základní informace: CP Recorder je v Čechách vyvíjený systém pro sofistikované zaznamenávání telefonních hovorů. V prvé řadě je určen pro optimalizaci služeb, které poskytují u nás stále více populární

Více

Úvod do praxe stínového řečníka. Úvod

Úvod do praxe stínového řečníka. Úvod Úvod do praxe stínového řečníka Úvod 1 Ukázka Kdo je to stínový řečník? Simultánní tlumočník z daného jazyka do téhož jazyka Jeho úkolem je přemlouvat televizní pořady tak, aby výsledná promluva byla vhodná

Více

Ukázka charakteristiky předmětu Český jazyk (pro nedoslýchavé) z pracovní verze ŠVP ZŠ pro sluchově postižené, Liberec.

Ukázka charakteristiky předmětu Český jazyk (pro nedoslýchavé) z pracovní verze ŠVP ZŠ pro sluchově postižené, Liberec. Ukázka charakteristiky předmětu Český jazyk (pro nedoslýchavé) z pracovní verze ŠVP ZŠ pro sluchově postižené, Liberec. ČESKÝ JAZYK (5. ročník Český jazyk a informatika) Obsahové, časové a organizační

Více

Práce v textovém editoru

Práce v textovém editoru Práce v textovém editoru 0) Otevřete NOTEPAD a okopírujte celý tento článek do NOTEPADu. [Můžete použít zkratky Ctrl-A (označit vše) Ctrl+C(kopírovat), Ctrl+V (vložit)] 1) Najděte v tomto textu slovo "myš"

Více

Architektura počítačů

Architektura počítačů Architektura počítačů Studijní materiál pro předmět Architektury počítačů Ing. Petr Olivka katedra informatiky FEI VŠB-TU Ostrava email: petr.olivka@vsb.cz Ostrava, 2010 1 1 Architektura počítačů Pojem

Více

Voice portál. Pavel Cenek OptimSys, s.r.o.

Voice portál. Pavel Cenek OptimSys, s.r.o. Voice portál Pavel Cenek OptimSys, s.r.o. Vývoj software pro telekomunikace automatizace telefonní/hlasové komunikace integrace telefonie do firemních procesů (computer telephony integration, CTI) technologie

Více

Studie webů automobilek

Studie webů automobilek Studie webů automobilek červen 2006 [manažerské shrnutí] Obsah Obsah... 1 Manažerské shrnutí... 2 Kvalita obsahu a použitelnost webu... 3 Základní nedostatky negativně ovlivňují použitelnost většiny webů...

Více

VYUŽITÍ PRAVDĚPODOBNOSTNÍ METODY MONTE CARLO V SOUDNÍM INŽENÝRSTVÍ

VYUŽITÍ PRAVDĚPODOBNOSTNÍ METODY MONTE CARLO V SOUDNÍM INŽENÝRSTVÍ VYUŽITÍ PRAVDĚPODOBNOSTNÍ METODY MONTE CARLO V SOUDNÍM INŽENÝRSTVÍ Michal Kořenář 1 Abstrakt Rozvoj výpočetní techniky v poslední době umožnil také rozvoj výpočetních metod, které nejsou založeny na bázi

Více

Důležité pojmy v letectví a jejich interpretace

Důležité pojmy v letectví a jejich interpretace Důležité pojmy v letectví a jejich interpretace Důležité pojmy v letectví - obecně S ohledem na multidisciplinárnost a nutnost komunikovat mezi různými profesními skupinami s různými mateřskými jazyky

Více

PRODUKTY. Tovek Tools

PRODUKTY. Tovek Tools jsou desktopovou aplikací určenou k vyhledávání informací, tvorbě různých typů analýz a vytváření přehledů a rešerší. Jsou vhodné pro práci i s velkým objemem textových dat z různorodých informačních zdrojů.

Více

Zpráva z evaluačního nástroje Dotazník strategií učení cizímu jazyku

Zpráva z evaluačního nástroje Dotazník strategií učení cizímu jazyku Zpráva z evaluačního nástroje Dotazník strategií učení cizímu jazyku Škola Testovací škola NÚOV, Praha Třída 3. A Předmět Francouzština Učitel pepa novák Vážená paní učitelko, vážený pane učiteli, v této

Více

Efektivní komunikace díky inovativním hlasovým technologiím. Praha, 25.11.2011 Call centrum ve finančních službách

Efektivní komunikace díky inovativním hlasovým technologiím. Praha, 25.11.2011 Call centrum ve finančních službách Efektivní komunikace díky inovativním hlasovým technologiím Praha, 25.11.2011 Call centrum ve finančních službách Agenda Představení společnosti Ovládání hlasových aplikací přirozenou řečí Nové bezpečností

Více

SEMESTRÁLNÍ PRÁCE Z PŘEDMĚTU KVD/GRPR GRAFICKÉ PROJEKTY

SEMESTRÁLNÍ PRÁCE Z PŘEDMĚTU KVD/GRPR GRAFICKÉ PROJEKTY F A K U L T A E K O N O M I C K Á Studijní obor: 6208T086 Podniková ekonomika a management SEMESTRÁLNÍ PRÁCE Z PŘEDMĚTU KVD/GRPR GRAFICKÉ PROJEKTY TÉMA: SYNTÉZA A ROZPOZNÁVÁNÍ ŘEČI TERMÍN: ZS 2006-01-21

Více

Systémy pro podporu rozhodování. Hlubší pohled 2

Systémy pro podporu rozhodování. Hlubší pohled 2 Systémy pro podporu rozhodování Hlubší pohled 2 1 Připomenutí obsahu minulé přednášky Motivační příklad Konfigurace DSS Co to je DSS? definice Charakterizace a možnosti DSS Komponenty DSS Subsystém datového

Více

Automatické rozpoznávání dopravních značek

Automatické rozpoznávání dopravních značek ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE FAKULTA DOPRAVNÍ Jiří Hofman Automatické rozpoznávání dopravních značek Semestrální práce z předmětu ITS 2012 Obsah 1. Automatické rozpoznávání dopravních značek (ATSR)...

Více

Vývoj informačních systémů. Obecně o IS

Vývoj informačních systémů. Obecně o IS Vývoj informačních systémů Obecně o IS Informační systém Informační systém je propojení informačních technologií a lidských aktivit směřující k zajištění podpory procesů v organizaci. V širším slova smyslu

Více

7. Rozdělení pravděpodobnosti ve statistice

7. Rozdělení pravděpodobnosti ve statistice 7. Rozdělení pravděpodobnosti ve statistice Statistika nuda je, má však cenné údaje, neklesejte na mysli, ona nám to vyčíslí Jednou z úloh statistiky je odhad (výpočet) hodnot statistického znaku x i,

Více

Charakteristika předmětu Anglický jazyk

Charakteristika předmětu Anglický jazyk Charakteristika předmětu Anglický jazyk Vyučovací předmět Anglický jazyk se vyučuje jako samostatný předmět s časovou dotací: Ve 3. 5. ročníku 3 hodiny týdně Výuka je vedena od počátečního vybudování si

Více

CS Jednotná v rozmanitosti CS A8-0188/336. Pozměňovací návrh. Thomas Händel za Výbor pro zaměstnanost a sociální věci

CS Jednotná v rozmanitosti CS A8-0188/336. Pozměňovací návrh. Thomas Händel za Výbor pro zaměstnanost a sociální věci 7.9.2017 A8-0188/336 336 Bod odůvodnění 18 (18) Je nezbytné zavést požadavky na přístupnost takovým způsobem, aby představovaly pro hospodářské subjekty a členské státy co nejmenší zátěž, a to zejména

Více

Obsah. Zpracoval:

Obsah. Zpracoval: Zpracoval: houzvjir@fel.cvut.cz 03. Modelem řízený vývoj. Doménový (business), konceptuální (analytický) a logický (návrhový) model. Vize projektu. (A7B36SIN) Obsah Modelem řízený vývoj... 2 Cíl MDD, proč

Více

Úvod do praxe stínového řečníka. Proces vytváření řeči

Úvod do praxe stínového řečníka. Proces vytváření řeči Úvod do praxe stínového řečníka Proces vytváření řeči 1 Proces vytváření řeči člověkem Fyzikální podstatou akustického (tedy i řečového) signálu je vlnění elastického prostředí v oboru slyšitelných frekvencí.

Více

Datová věda (Data Science) akademický navazující magisterský program

Datová věda (Data Science) akademický navazující magisterský program Datová věda () akademický navazující magisterský program Reaguje na potřebu, kterou vyvolala rychle rostoucí produkce komplexních, obvykle rozsáhlých dat ve vědě, v průmyslu a obecně v hospodářských činnostech.

Více

1. Statistická analýza dat Jak vznikají informace Rozložení dat

1. Statistická analýza dat Jak vznikají informace Rozložení dat 1. Statistická analýza dat Jak vznikají informace Rozložení dat J. Jarkovský, L. Dušek, S. Littnerová, J. Kalina Význam statistické analýzy dat Sběr a vyhodnocování dat je způsobem k uchopení a pochopení

Více

Tovek Server. Tovek Server nabízí následující základní a servisní funkce: Bezpečnost Statistiky Locale

Tovek Server. Tovek Server nabízí následující základní a servisní funkce: Bezpečnost Statistiky Locale je serverová aplikace určená pro efektivní zpracování velkého objemu sdílených nestrukturovaných dat. Umožňuje automaticky indexovat data z různých informačních zdrojů, intuitivně vyhledávat informace,

Více

MULTICOM 112. Průvodce programem

MULTICOM 112. Průvodce programem MULTICOM 112 Průvodce programem Cíl Cílem projektu MULTICOM112 CD-ROM je zvýšit a rozšířit základní jazykové schopnosti techniků operačních středisek do takové míry, že budou schopni rozpoznat cizí jazyk

Více

Filozofická fakulta. Compiled Jan 21, :48:06 PM by Document Globe 1

Filozofická fakulta. Compiled Jan 21, :48:06 PM by Document Globe 1 Filozofická fakulta Na této stránce najdete kompletní nabídku Filozofické fakulty Univerzity Karlovy. Pokud máte zájem o kompletní nabídku, navštivte hlavní stránku. Přehled vědeckých týmů Centrum pro

Více

Jednofaktorová analýza rozptylu

Jednofaktorová analýza rozptylu I I.I Jednofaktorová analýza rozptylu Úvod Jednofaktorová analýza rozptylu (ANOVA) se využívá při porovnání několika středních hodnot. Často se využívá ve vědeckých a lékařských experimentech, při kterých

Více

Statistická teorie učení

Statistická teorie učení Statistická teorie učení Petr Havel Marek Myslivec přednáška z 9. týdne 1 Úvod Představme si situaci výrobce a zákazníka, který si u výrobce objednal algoritmus rozpoznávání. Zákazník dodal experimentální

Více

Statistické vyhodnocení průzkumu funkční gramotnosti žáků 4. ročníku ZŠ

Statistické vyhodnocení průzkumu funkční gramotnosti žáků 4. ročníku ZŠ Statistické vyhodnocení průzkumu funkční gramotnosti žáků 4. ročníku ZŠ Ing. Dana Trávníčková, PaedDr. Jana Isteníková Funkční gramotnost je používání čtení a psaní v životních situacích. Nejde jen o elementární

Více

Olga Rudikova 2. ročník APIN

Olga Rudikova 2. ročník APIN Olga Rudikova 2. ročník APIN Redakční (publikační) systém neboli CMS - content management system (systém pro správu obsahu) je software zajišťující správu dokumentů, nejčastěji webového obsahu. (webová

Více

Customer Intelligence, aneb Jak může neoblíbená analýza dat usnadnit práci marketingu

Customer Intelligence, aneb Jak může neoblíbená analýza dat usnadnit práci marketingu Customer Intelligence, aneb Jak může neoblíbená analýza dat usnadnit práci marketingu Filip Trojan Applied Analytics Manager, Deloitte Advisory Listopad 2012 Obsah 1. Představení 2. Marketing versus analýza

Více

KATALOG ŘEŠENÍ ELVAC SOLUTIONS

KATALOG ŘEŠENÍ ELVAC SOLUTIONS SOFTWARE Produkt Optimalizace Proces údržby Řešení Řídicí a monitorovací systémy Řízení a plánování výroby - MES Vizualizace dat, DIGITAL SIGNAGE Řízení a plánování údržby, CMMS/EAM Vývoj software na klíč

Více

SBĚRNICOVÝ SYSTÉM NIKOBUS OVLÁDÁNÍ PROVOZNĚ TECHNICKÝCH FUNKCÍ HLASEM

SBĚRNICOVÝ SYSTÉM NIKOBUS OVLÁDÁNÍ PROVOZNĚ TECHNICKÝCH FUNKCÍ HLASEM Katedra obecné elektrotechniky Fakulta elektrotechniky a elektrotechniky, VŠB TU Ostrava SBĚRNICOVÝ SYSTÉM NIKOBUS OVLÁDÁNÍ PROVOZNĚ TECHNICKÝCH FUNKCÍ HLASEM Návod pro laboratorní úlohu Ing. Jan Vaňuš

Více

Souběžná validita testů SAT a OSP

Souběžná validita testů SAT a OSP Souběžná validita testů SAT a OSP www.scio.cz 15. ledna 2013 Souběžná validita testů SAT a OSP Abstrakt Pro testování obecných studijních dovedností existuje mnoho testů. Některé jsou všeobecně známé a

Více

Zpráva z evaluačního nástroje. Strategie učení se cizímu jazyku Dotazník pro učitele základní školy

Zpráva z evaluačního nástroje. Strategie učení se cizímu jazyku Dotazník pro učitele základní školy Zpráva z evaluačního nástroje Strategie učení se cizímu jazyku Dotazník pro učitele základní školy Škola Základní škola, Třída 6. A Předmět Angličtina Učitel Mgr. Dagmar Vážená paní učitelko, vážený pane

Více

Informační a komunikační technologie

Informační a komunikační technologie Dodatek č. Školního vzdělávacího programu Obchodní akademie Lysá nad Labem, obor 63-4-M/02 Obchodní akademie, platného od. 9. 202 - platnost dodatku je od. 9. 206 Informační a komunikační technologie je

Více

Statistika. Semestrální projekt

Statistika. Semestrální projekt Statistika Semestrální projekt 18.5.2013 Tomáš Jędrzejek, JED0008 Obsah Úvod 3 Analyzovaná data 4 Analýza dat 6 Statistická indukce 12 Závěr 15 1. Úvod Cílem této semestrální práce je aplikovat získané

Více

Automatická detekce anomálií při geofyzikálním průzkumu. Lenka Kosková Třísková NTI TUL Doktorandský seminář, 8. 6. 2011

Automatická detekce anomálií při geofyzikálním průzkumu. Lenka Kosková Třísková NTI TUL Doktorandský seminář, 8. 6. 2011 Automatická detekce anomálií při geofyzikálním průzkumu Lenka Kosková Třísková NTI TUL Doktorandský seminář, 8. 6. 2011 Cíle doktorandské práce Seminář 10. 11. 2010 Najít, implementovat, ověřit a do praxe

Více

Systém Bosch DCN Next Generation Dialog bez hranic...

Systém Bosch DCN Next Generation Dialog bez hranic... Systém Bosch DCN Next Generation Dialog bez hranic... S novou výkonnou softwarovou sadou! 2 Systém DCN Next Generation Osobitý systém Systém Digital Congress Network (DCN) Next Generation od společnosti

Více

5.15 INFORMATIKA A VÝPOČETNÍ TECHNIKA

5.15 INFORMATIKA A VÝPOČETNÍ TECHNIKA 5.15 INFORMATIKA A VÝPOČETNÍ TECHNIKA 5. 15. 1 Charakteristika předmětu A. Obsahové vymezení: IVT se na naší škole vyučuje od tercie, kdy je cílem zvládnutí základů hardwaru, softwaru a operačního systému,

Více

Vize ERRAC do roku 2050 Rail 2050 Vision Ing. Jaroslav Vašátko

Vize ERRAC do roku 2050 Rail 2050 Vision Ing. Jaroslav Vašátko k projektu Foster Rail Vize ERRAC do roku 2050 Rail 2050 Vision Ing. Jaroslav Vašátko Úvod Vize 2050 byla prezentována na plenárním zasedání ERRAC dne 23.11.2017. Jde o vizi budoucího železničního systému

Více

Základní komunikační řetězec

Základní komunikační řetězec STŘEDNÍ PRŮMYSLOVÁ ŠKOLA NA PROSEKU EVROPSKÝ SOCIÁLNÍ FOND Základní komunikační řetězec PRAHA & EU INVESTUJEME DO VAŠÍ BUDOUCNOSTI Podpora kvality výuky informačních a telekomunikačních technologií ITTEL

Více

Neubauer, K. a kol. NEUROGENNÍ PORUCHY KOMUNIKACE U DOSPĚLÝCH (Praha, Portál, r. vydání 2007).

Neubauer, K. a kol. NEUROGENNÍ PORUCHY KOMUNIKACE U DOSPĚLÝCH (Praha, Portál, r. vydání 2007). Neubauer, K. a kol. NEUROGENNÍ PORUCHY KOMUNIKACE U DOSPĚLÝCH (Praha, Portál, r. vydání 2007). Získané neurogenní poruchy komunikace u dospělých osob Terminologie poruchy, které mají svou lingvistickou,

Více

Tovek Tools. Tovek Tools jsou standardně dodávány ve dvou variantách: Tovek Tools Search Pack Tovek Tools Analyst Pack. Připojené informační zdroje

Tovek Tools. Tovek Tools jsou standardně dodávány ve dvou variantách: Tovek Tools Search Pack Tovek Tools Analyst Pack. Připojené informační zdroje jsou souborem klientských desktopových aplikací určených k indexování dat, vyhledávání informací, tvorbě různých typů analýz a vytváření přehledů a rešerší. Jsou vhodné pro práci s velkým objemem textových

Více

1. VYMEZENÍ ODBORNÉ STÁŽE

1. VYMEZENÍ ODBORNÉ STÁŽE 1. VYMEZENÍ ODBORNÉ STÁŽE Šablona stáže představuje základní rámec odborné stáže pro typovou pozici a obsahuje požadavky na obsah a průběh stáže, na stážistu i na poskytovatele stáže. Bílá pole označují

Více

ŘEČOVÉ TECHNOLOGIE v PRAXI

ŘEČOVÉ TECHNOLOGIE v PRAXI ŘEČOVÉ TECHNOLOGIE v PRAXI Josef Psutka, FAV ZČU v Plzni Obsah: 1. Automatické rozpoznávání řeči počítačem 2. Počítačová syntéza řeči 3. Hlasový dialog člověka s počítačem 1.10 2014 1 Automatické rozpoznávání

Více

Itálie Dotazník pro učitele VŠ připravující budoucí učitele cizích jazyků Zpracování údajů

Itálie Dotazník pro učitele VŠ připravující budoucí učitele cizích jazyků Zpracování údajů Itálie Dotazník pro učitele VŠ připravující budoucí učitele cizích jazyků Zpracování údajů O Vás 1. Dotazník vyplnilo sedm vysokoškolských pedagogů připravujících budoucí učitele cizích jazyků. 2. Šest

Více

Úloha - rozpoznávání číslic

Úloha - rozpoznávání číslic Úloha - rozpoznávání číslic Vojtěch Franc, Tomáš Pajdla a Tomáš Svoboda http://cmp.felk.cvut.cz 27. listopadu 26 Abstrakt Podpůrný text pro cvičení předmětu X33KUI. Vysvětluje tři způsoby rozpoznávání

Více

Pavel Cenek, Aleš Horák

Pavel Cenek, Aleš Horák Syntéza a rozpoznávání řeči Pavel Cenek, Aleš Horák E-mail: hales@fi.muni.cz http://nlp.fi.muni.cz/poc_lingv/ Obsah: Rozpoznávání řeči Související technologie Úvod do počítačové lingvistiky 3/11 1 / 20

Více

Překladům čest a rukám pokoj. aneb diktovací software v překladatelské praxi

Překladům čest a rukám pokoj. aneb diktovací software v překladatelské praxi Překladům čest a rukám pokoj aneb diktovací software v překladatelské praxi M A R T I N J A N D A J E R O N Ý M O V Y D N Y 2 0 1 6 Jak rozeznávání hlasu nemá vypadat Pár slov z historie 1932 první pokusy

Více

Metody tvorby ontologií a sémantický web. Martin Malčík, Rostislav Miarka

Metody tvorby ontologií a sémantický web. Martin Malčík, Rostislav Miarka Metody tvorby ontologií a sémantický web Martin Malčík, Rostislav Miarka Obsah Reprezentace znalostí Ontologie a sémantický web Tvorba ontologií Hierarchie znalostí (D.R.Tobin) Data jakékoliv znakové řetězce

Více

VÝUKOVÝ MATERIÁL. Bratislavská 2166, 407 47 Varnsdorf, IČO: 18383874 www.vosassvdf.cz, tel. +420412372632 Číslo projektu

VÝUKOVÝ MATERIÁL. Bratislavská 2166, 407 47 Varnsdorf, IČO: 18383874 www.vosassvdf.cz, tel. +420412372632 Číslo projektu VÝUKOVÝ MATERIÁL Identifikační údaje školy Vyšší odborná škola a Střední škola, Varnsdorf, příspěvková organizace Bratislavská 2166, 407 47 Varnsdorf, IČO: 18383874 www.vosassvdf.cz, tel. +420412372632

Více

Specializace Kognitivní informatika

Specializace Kognitivní informatika Specializace Kognitivní informatika Otevřené dveře specializace Kognitivní informatika, 10.5.2007 V rámci projektu, financovaného Evropským sociálním fondem pod č. 3206 Multi- a transdisciplinární obor

Více

Software pro analýzu energetických dat W1000

Software pro analýzu energetických dat W1000 Software pro analýzu energetických dat W1000 Data pro snadný život vašich zákazníků Manage energy better Mít správné informace ve správný čas je základem úspěchu každého snažení, tedy i řízení spotřeby

Více

Pracovní celky 3.2, 3.3 a 3.4 Sémantická harmonizace - Srovnání a přiřazení datových modelů

Pracovní celky 3.2, 3.3 a 3.4 Sémantická harmonizace - Srovnání a přiřazení datových modelů Pracovní celky 3.2, 3.3 a 3.4 Sémantická harmonizace - Srovnání a datových modelů Obsah Seznam tabulek... 1 Seznam obrázků... 1 1 Úvod... 2 2 Metody sémantické harmonizace... 2 3 Dvojjazyčné katalogy objektů

Více

X36SIN: Softwarové inženýrství. Životní cyklus a plánování

X36SIN: Softwarové inženýrství. Životní cyklus a plánování X36SIN: Softwarové inženýrství Životní cyklus a plánování 1 Kontext Minule jsme si řekli, co to je deklarace záměru, odborný článek, katalog požadavků, seznam aktérů a seznam událostí. Seznam aktérů a

Více

METODICKÝ APARÁT LOGISTIKY

METODICKÝ APARÁT LOGISTIKY METODICKÝ APARÁT LOGISTIKY Metodický aparát logistiky jedná se o metody sloužící k rozhodování při logistických problémech Metodu = použijeme, v případě vzniku problému. Problém = vzniká v okamžiku, když

Více

Digitalizace a oběh dokumentů VUMS LEGEND, spol. s.r.o.

Digitalizace a oběh dokumentů VUMS LEGEND, spol. s.r.o. Digitalizace a oběh dokumentů Automatizace obchodních porcesů Likvidace odběratelských a dodávatelských faktur Efektivita firemních procesů je jedním ze základních pilířů fungování celé společnosti. Některé

Více

Usuzování za neurčitosti

Usuzování za neurčitosti Usuzování za neurčitosti 25.11.2014 8-1 Usuzování za neurčitosti Hypotetické usuzování a zpětná indukce Míry postačitelnosti a nezbytnosti Kombinace důkazů Šíření pravděpodobnosti v inferenčních sítích

Více

Operační systém. Mgr. Renáta Rellová. Výukový materiál zpracován v rámci projektu EU peníze školám

Operační systém. Mgr. Renáta Rellová. Výukový materiál zpracován v rámci projektu EU peníze školám Operační systém Mgr. Renáta Rellová Výukový materiál zpracován v rámci projektu EU peníze školám Autorem materiálu a všech jeho částí, není-li uvedeno jinak, je Mgr. Renáta Rellová. Dostupné z Metodického

Více

Semestrální práce: Rozpoznání hláskované řeči a převedení na text

Semestrální práce: Rozpoznání hláskované řeči a převedení na text VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ Fakulta strojního inženýrství Ústav mechaniky těles, mechatroniky a biomechaniky Technická 2, Brno 616 69 RSZ Základy zpracování signálu Semestrální práce: Rozpoznání hláskované

Více

Diktovací sw NovaVoice zkušenosti. D.Zoubek KZM FN Motol

Diktovací sw NovaVoice zkušenosti. D.Zoubek KZM FN Motol Diktovací sw NovaVoice zkušenosti D.Zoubek KZM FN Motol NovaVoice automatické rozpoznávání řeči Automatic Speech Recognition - ASR je určen k automatickému rozpoznávání souvislé mluvené české řeči je

Více

Algoritmy a algoritmizace

Algoritmy a algoritmizace Otázka 21 Algoritmy a algoritmizace Počítačové programy (neboli software) umožňují počítačům, aby přestaly být pouhou stavebnicí elektronických a jiných součástek a staly se pomocníkem v mnoha lidských

Více

Rozvoj vzdělávání žáků karvinských základních škol v oblasti cizích jazyků Registrační číslo projektu: CZ.1.07/1.1.07/ VZDĚLÁVÁNÍ V EU A ČR

Rozvoj vzdělávání žáků karvinských základních škol v oblasti cizích jazyků Registrační číslo projektu: CZ.1.07/1.1.07/ VZDĚLÁVÁNÍ V EU A ČR Rozvoj vzdělávání žáků karvinských základních škol v oblasti cizích jazyků Registrační číslo projektu: CZ.1.07/1.1.07/02.0162 VZDĚLÁVÁNÍ V EU A ČR 2010 Ing. Andrea Sikorová, Ph.D. 1 Vzdělávání v EU a ČR

Více

český jazyk a literatura

český jazyk a literatura 1 český jazyk a literatura český jazyk a literatura Učivo Praktické čtení - pozorné, plynulé, přiměřeně rychlé, čtení hlasité i tiché, s porozuměním Zdokonalování techniky čtení Porozumění přiměřeným textům

Více

PRVNÍ ELASTICKÝ INFORMAČNÍ SYSTÉM : QI

PRVNÍ ELASTICKÝ INFORMAČNÍ SYSTÉM : QI PRVNÍ ELASTICKÝ INFORMAČNÍ SYSTÉM : QI Cyril Klimeš a) Jan Melzer b) a) Ostravská univerzita, katedra informatiky a počítačů, 30. dubna 22, 701 03 Ostrava, ČR E-mail: cyril.klimes@osu.cz b) DC Concept

Více

Návrh softwarových systémů - architektura softwarových systémů

Návrh softwarových systémů - architektura softwarových systémů Návrh softwarových systémů - architektura softwarových systémů Martin Tomášek, Jiří Šebek Návrh softwarových systémů (B6B36NSS) Převzato z přednášky X36AAS M. Molhanec Co je to architektura Využívá se

Více

PRODUKTY. Tovek Tools

PRODUKTY. Tovek Tools Analyst Pack je desktopovou aplikací určenou k vyhledávání informací, tvorbě různých typů analýz a vytváření přehledů a rešerší. Jsou vhodné pro práci i s velkým objemem textových dat z různorodých informačních

Více

OSA. maximalizace minimalizace 1/22

OSA. maximalizace minimalizace 1/22 OSA Systémová analýza metodika používaná k navrhování a racionalizaci systémů v podmínkách neurčitosti vyšší stupeň operační analýzy Operační analýza (výzkum) soubor metod umožňující řešit rozhodovací,

Více

Vzdělávací obsah vyučovacího předmětu

Vzdělávací obsah vyučovacího předmětu V.9.3. Vzdělávací obsah vyučovacího předmětu Vzdělávací oblast: Inormatika a informační a komunikační technologie Vyučovací předmět: Informatika Ročník: 1. ročník + kvinta chápe a používá základní termíny

Více

Desigo Control Point řešení pro ovládání a monitorování budov siemens.cz/desigo

Desigo Control Point řešení pro ovládání a monitorování budov siemens.cz/desigo Jedna budova. Různí uživatelé. Desigo Control Point řešení pro ovládání a monitorování budov siemens.cz/desigo Desigo Control Point navržen pro zjednodušení správy technologií budov Budovy nejsou jen pouhé

Více

Ing. Mgr. Jiří Svoboda Kurzy

Ing. Mgr. Jiří Svoboda Kurzy Ing. Mgr. Jiří Svoboda Ing. Mgr. Jiří Svoboda Kurzy Soft skills Manažerské a marketingové kurzy Manažerské dovednosti Moderní marketingová komunikace Efektivní komunikace Komunikace se zákazníkem Péče

Více

VYUŽITÍ MATLABU PRO PODPORU VÝUKY A PŘI ŘEŠENÍ VÝZKUMNÝCH ÚKOLŮ NA KATEDŘE KOMUNIKAČNÍCH A INFORMAČNÍCH SYSTÉMŮ

VYUŽITÍ MATLABU PRO PODPORU VÝUKY A PŘI ŘEŠENÍ VÝZKUMNÝCH ÚKOLŮ NA KATEDŘE KOMUNIKAČNÍCH A INFORMAČNÍCH SYSTÉMŮ VYUŽITÍ MATLABU PRO PODPORU VÝUKY A PŘI ŘEŠENÍ VÝZKUMNÝCH ÚKOLŮ NA KATEDŘE KOMUNIKAČNÍCH A INFORMAČNÍCH SYSTÉMŮ Markéta Mazálková Katedra komunikačních a informačních systémů Fakulta vojenských technologií,

Více

9. ročník. -Uvědomuje si rozdíly, výhody a nevýhody podnikání, zaměstnání.orientuje se v různých druzích podnikání.

9. ročník. -Uvědomuje si rozdíly, výhody a nevýhody podnikání, zaměstnání.orientuje se v různých druzích podnikání. Pracovní činnosti 9. ročník -Uvědomuje si rozdíly, výhody a nevýhody podnikání, zaměstnání.orientuje se v různých druzích podnikání. Průřezová témata, přesahy, souvislosti VÝCHOVA DEMOKRATICKÉHO OBČANA

Více

Kritéria hodnocení praktické maturitní zkoušky z databázových systémů

Kritéria hodnocení praktické maturitní zkoušky z databázových systémů Kritéria hodnocení praktické maturitní zkoušky z databázových systémů Otázka č. 1 Datový model 1. Správně navržený ERD model dle zadání max. 40 bodů teoretické znalosti konceptuálního modelování správné

Více

6.1 I.stupeň. Vzdělávací oblast: Cizí jazyk 6.1.2. Vyučovací předmět: ANGLICKÝ JAZYK. Charakteristika vyučovacího předmětu 1.

6.1 I.stupeň. Vzdělávací oblast: Cizí jazyk 6.1.2. Vyučovací předmět: ANGLICKÝ JAZYK. Charakteristika vyučovacího předmětu 1. 6.1 I.stupeň Vzdělávací oblast: Cizí jazyk 6.1.2. Vyučovací předmět: ANGLICKÝ JAZYK Charakteristika vyučovacího předmětu 1. stupeň Anglický jazyk je důležitý cizí jazyk. Přispívá k chápání a objevování

Více

VYSOKÁ ŠKOLA BÁŇSKÁ TECHNICKÁ UNIVERZITA OSTRAVA FAKULTA STROJNÍ DATABÁZOVÉ SYSTÉMY ARCHITEKTURA DATABÁZOVÝCH SYSTÉMŮ. Ing. Lukáš OTTE, Ph.D.

VYSOKÁ ŠKOLA BÁŇSKÁ TECHNICKÁ UNIVERZITA OSTRAVA FAKULTA STROJNÍ DATABÁZOVÉ SYSTÉMY ARCHITEKTURA DATABÁZOVÝCH SYSTÉMŮ. Ing. Lukáš OTTE, Ph.D. VYSOKÁ ŠKOLA BÁŇSKÁ TECHNICKÁ UNIVERZITA OSTRAVA FAKULTA STROJNÍ DATABÁZOVÉ SYSTÉMY ARCHITEKTURA DATABÁZOVÝCH SYSTÉMŮ Ing. Lukáš OTTE, Ph.D. Ostrava 2013 Tento studijní materiál vznikl za finanční podpory

Více

Informační média a služby

Informační média a služby Informační média a služby Výuka informatiky má na Fakultě informatiky a statistiky VŠE v Praze dlouholetou tradici. Ke dvěma již zavedeným oborům ( Aplikovaná informatika a Multimédia v ekonomické praxi

Více

Jednoduchá sdělení představování, poděkování, pozdrav, omluva Základní výslovnostní návyky

Jednoduchá sdělení představování, poděkování, pozdrav, omluva Základní výslovnostní návyky Učební osnovy Ruský jazyk PŘEDMĚT: Ruský jazyk Ročník: 7. třída 1 rozumí jednoduchým pokynům a otázkám učitele, které jsou pronášeny pomalu a s pečlivou výslovností, a reaguje na ně 1p je seznámen se zvukovou

Více

PROPOJENÍ VĚDY, VÝZKUMU, VZDĚLÁVÁNÍ A PODNIKOVÉ PRAXE. PhDr. Dana Pokorná, Ph.D. Mgr. Jiřina Sojková, Státní zámek Sychrov, 21. 23. 5.

PROPOJENÍ VĚDY, VÝZKUMU, VZDĚLÁVÁNÍ A PODNIKOVÉ PRAXE. PhDr. Dana Pokorná, Ph.D. Mgr. Jiřina Sojková, Státní zámek Sychrov, 21. 23. 5. PROPOJENÍ VĚDY, VÝZKUMU, VZDĚLÁVÁNÍ A PODNIKOVÉ PRAXE PhDr. Dana Pokorná, Ph.D. Mgr. Jiřina Sojková, Státní zámek Sychrov, 21. 23. 5. 2012 APSYS Aplikovatelný systém dalšího vzdělávání pracovníků ve vědě

Více

WAMS - zdroj kvalitní ch dat pro analý zý stavu sí tí a pro nové éxpértní sýsté mý

WAMS - zdroj kvalitní ch dat pro analý zý stavu sí tí a pro nové éxpértní sýsté mý WAMS - zdroj kvalitní ch dat pro analý zý stavu sí tí a pro nové éxpértní sýsté mý Daniel Juřík, Antonín Popelka, Petr Marvan AIS spol. s r.o. Brno Wide Area Monitoring Systémy (WAMS) umožňují realizovat

Více

Vývoj Internetu značně pokročil a surfování je dnes možné nejen prostřednictvím počítače, ale také prostřednictvím chytrých telefonů, tabletů a

Vývoj Internetu značně pokročil a surfování je dnes možné nejen prostřednictvím počítače, ale také prostřednictvím chytrých telefonů, tabletů a Vývoj Internetu značně pokročil a surfování je dnes možné nejen prostřednictvím počítače, ale také prostřednictvím chytrých telefonů, tabletů a netbooků. Chytré telefony, nazývané také Smartphony, poskytují

Více

Vzdálená správa v cloudu až pro 250 počítačů

Vzdálená správa v cloudu až pro 250 počítačů Vzdálená správa v cloudu až pro 250 počítačů S pomocí ESET Cloud Administratoru můžete řídit zabezpečení vaší podnikové sítě bez nutnosti nákupu, instalace nebo údržby dalšího hardwaru. Řešení je poskytováno

Více

Internet - základní pojmy

Internet - základní pojmy Název školy: Střední odborná škola stavební Karlovy Vary Sabinovo náměstí 16, 360 09 Karlovy Vary Autor: Ing. Hana Šmídová Název materiálu: VY_32_INOVACE_07_INTERNET_P2 Číslo projektu: CZ 1.07/1.5.00/34.1077

Více

Vlákno (anglicky: thread) v informatice označuje vlákno výpočtu neboli samostatný výpočetní tok, tedy posloupnost po sobě jdoucích operací.

Vlákno (anglicky: thread) v informatice označuje vlákno výpočtu neboli samostatný výpočetní tok, tedy posloupnost po sobě jdoucích operací. Trochu teorie Vlákno (anglicky: thread) v informatice označuje vlákno výpočtu neboli samostatný výpočetní tok, tedy posloupnost po sobě jdoucích operací. Každá spuštěná aplikace má alespoň jeden proces

Více

1. Úvod. Tabulka 1.1. Srovnání množství a výkonů přepraveného zboží v závislosti na druhu dopravy v ČR.

1. Úvod. Tabulka 1.1. Srovnání množství a výkonů přepraveného zboží v závislosti na druhu dopravy v ČR. 1. ÚVOD Česká republika má vzhledem ke své poloze ve středu Evropy důležitou úlohu v mezinárodní dopravě. Rok 2004 pro nás byl zlomový díky našemu vstoupení do EU a v dopravě se to projevilo podle očekávání

Více

SYSTÉMOVÁ METODOLOGIE (VII) Kybernetika. Ak. rok 2011/2012 vbp 1

SYSTÉMOVÁ METODOLOGIE (VII) Kybernetika. Ak. rok 2011/2012 vbp 1 SYSTÉMOVÁ METODOLOGIE (VII) Kybernetika Ak. rok 2011/2012 vbp 1 ZÁKLADNÍ SMĚRY A DISCIPLÍNY Teoretická kybernetika (vědecký aparát a metody ke zkoumání kybernetických systémů; používá abstraktní modely

Více

Inženýrská statistika pak představuje soubor postupů a aplikací teoretických principů v oblasti inženýrské činnosti.

Inženýrská statistika pak představuje soubor postupů a aplikací teoretických principů v oblasti inženýrské činnosti. Přednáška č. 1 Úvod do statistiky a počtu pravděpodobnosti Statistika Statistika je věda a postup jak rozvíjet lidské znalosti použitím empirických dat. Je založena na matematické statistice, která je

Více

Anglický jazyk pro 8. ročník

Anglický jazyk pro 8. ročník Anglický jazyk pro 8. ročník (Předmět je vyučován 3 hodiny týdně.) Vzdělávací obsah Lekce 1 Očekávané výstupy Z RVP ZV - jednoduchým způsobem se domluví v běžných každodenních situacích - stručně reprodukuje

Více

Služby Microsoft Office 365

Služby Microsoft Office 365 Cena: 2000 Kč + DPH Služby Microsoft Office 365 Kurz je určen všem, kteří se chtějí ponořit do tajů Cloud služeb a chtějí naplno využít možnosti Office 365, jako komunikačního nástroje i prostředí pro

Více