ŘEČOVÉ TECHNOLOGIE v PRAXI



Podobné dokumenty
Řečové technologie na Katedře kybernetiky FAV ZČU v Plzni. Katedra kybernetiky. Fakulta aplikovaných věd. Západočeská univerzita v Plzni

Řečové technologie pomáhají překonávat bariéry

Úvod do praxe stínového řečníka. Úvod

NEWTON Technologies a.s. Jaroslava Schmidtová Project manager

NEWTON Technologies a.s.

Diktovací sw NovaVoice zkušenosti. D.Zoubek KZM FN Motol

Úvod do praxe stínového řečníka. Titulkování TV pořadů

SEMESTRÁLNÍ PRÁCE Z PŘEDMĚTU KVD/GRPR GRAFICKÉ PROJEKTY

SKRYTÉ TITULKY K ŽIVÝM TELEVIZNÍM POŘADŮM

NAKI - ČRo archiv - Zpřístupnění archivu Českého rozhlasu pro sofistikované vyhledávání

Obsah. Co to je MojeMedicína. Nabídka pacientům a jejich blízkým. Nabídka odborníkům. Budoucnost

Podporováno Technologickou agenturou České republiky, projekt TE

Nové přístupové služby České televize

Dolování dat z multimediálních databází. Ing. Igor Szöke Speech group ÚPGM, FIT, VUT

Alternativní ovládání PC a okolí

Využití hlasového zadávání Google

Komparativní lingvistická analýza paralelních komunikátů vytvářených stínovým řečníkem

SYNTÉZA ŘEČI. Ústav fotoniky a elektroniky, v.v.i. AV ČR, Praha

B2M31SYN 9. PŘEDNÁŠKA 7. prosince Granulační syntéza Konkatenační syntéza Nelineární funkce Tvarovací syntéza

Voice portál. Pavel Cenek OptimSys, s.r.o.

Roman Lupoměský Neslyšící s nadějí, o.s.

NEWTON Dictate Úvodní školení testovací skupiny. Oblastní inspektorát Brno 23. listopadu 2010

Umělá inteligence pro zpracování obrazu a zvuku

Alternativní ovládání PC a okolí

Simultánní přepis mluvené češtiny pro osoby se sluchovým postižením

7 Další. úlohy analýzy řeči i a metody

Asistivní technologie


O 2 TV. jediná televize, která se vám přizpůsobí

Komunikační podpora pro neslyšící a nedoslýchavé lidi

AUTOMATICKÉ VYTVÁŘENÍ DOPROVODNÉ ZVUKOVÉ STOPY TELEVIZNÍHO VYSÍLÁNÍ PRO SLUCHOVĚ POSTIŽENÉ

O 2 TV. jediná televize, která se vám přizpůsobí

4.1. Organizační schéma ČT v Praze

český jazyk a literatura

escribe: Online přepisovací centrum pro neslyšící

Speciální struktury číslicových systémů ASN P12

escribe: Online přepisovací centrum pro neslyšící

Hlas a počítač Možnosti nasazení nových technologií v resortu školství a jako pomůcka pro zdravotně postižené studenty

ZÁKLADY PROGRAMOVÁNÍ. Mgr. Vladislav BEDNÁŘ /14

- naslouchání praktické naslouchání; věcné a pozorné naslouchání. - respektování základních forem společenského styku.

učivo - témata kompetence hygiena, bezpečnost pomůcky

Christoph Damm, Svatoslav Ondra, Jiří Tužil. Masarykova univerzita

SignEditor 1 - návod k použití

Vzdělávací obsah vyučovacího předmětu

Úvod do praxe stínového řečníka. Automatické rozpoznávání řeči

Ročník II. Český jazyk. Období Učivo téma Metody a formy práce- kurzívou. Kompetence Očekávané výstupy. Průřezová témata. Mezipřed.

Anglický jazyk. Anglický jazyk. žák: TÉMATA. Fonetika: abeceda, výslovnost odlišných hlásek, zvuková podoba slova a její zvláštnosti

Překladům čest a rukám pokoj. aneb diktovací software v překladatelské praxi

7 UČEBNÍ OSNOVY 7.1 JAZYK A JAZYKOVÁ KOMUNIKACE Český jazyk (ČJ) Charakteristika předmětu 1. stupně

Český jazyk a literatura Mluvené projevy

Návod k obsluze. GeoVision ViewLog SW verze Návod k obsluze GV-ViewLog Stránka 1

SPECIÁLNĚ PEDAGOGICKÁ PÉČE. Pokaždé se něčemu přiučíme, kdykoliv otevřeme knihu

VPCO - video pult centrální ochrany

Strategie pro naplnění klíčových kompetencí v ročníku

jediná televize s multidimenzí Ovládání a funkce

Základy umělé inteligence

KOMUNIKAČNÍ A SLOHOVÁ VÝCHOVA - čtení - praktické plynulé čtení. - naslouchání praktické naslouchání; věcné a pozorné naslouchání.

Příloha č. 1 ke Školnímu vzdělávacímu programu základního vzdělávání pro žáky s mentálním postižením a poruchami komunikace

VOLEBNÍ SERVIS České televize

Ukázka charakteristiky předmětu Český jazyk (pro nedoslýchavé) z pracovní verze ŠVP ZŠ pro sluchově postižené, Liberec.

Návod k využívání interaktivních funkcí

Normalizace textu. Text to Speech, TTS Konverze textu do mluvené podoby. Pavel Cenek, Aleš Horák. Obsah: Související technologie

Co chcete udělat? Přepis nahrávek. Přepis URL. Korekce přepisů. Vyhodnocení přepisů. Ukládání přepisů. Přidávání slov do slovníku

Předmět:: Český jazyk a literatura

Technologie počítačového zpracování řeči

Bezpečnostní systémy - rychlostní kamery Identifikace SPZ a RZ.

Český jazyk ve 2. ročníku

Výstupy z RVP Učivo Ročník Průřezová témata Termín Komunikační a slohová výchova 1. plynule čte s porozuměním texty přiměřeného rozsahu a náročnosti

BP / DP / semestrální práce / semestrální projekt

Využití Umělé Inteligence (AI) v prostředí NKÚ

Minimální doporučená úroveň Školní výstupy Učivo

činí BODOVÁ HODNOTA DÍLA /BHD/: Audiovizuální dílo (režie): 100

pokyny, vybídnutí, instrukce pozdravy, setkání, loučení, omluva, prosba, poděkování pomalejší promluvy, později v běž ném tempu řeči

Zpravodajský web pro televizi Michal Hanzlík

provozovatel regionálního vysílání na sdílených frekvencích s TV Prima: zasahuje téměř 50 % území a tedy i obyvatel ČR,

Výsledky úspěšné výuky ovládání počítače hlasem

JAK VYPLNIT OSOBNÍ DOVEDNOSTI

PROGRAMY PRO DIKTOVÁNÍ DO POČÍTAČE A MOŽNOSTI JEJICH VYUŽITÍ OSOBAMI SE SPECIÁLNÍMI POTŘEBAMI'

Zpráva z evaluačního nástroje. Strategie učení se cizímu jazyku Dotazník pro učitele základní školy

Vyučovací předmět: Český jazyk a literatura Ročník: 6. Jazyková výchova

ANGLICKÝ JAZYK - I. období (1. 2. ročník)

Zápočtová úloha z předmětu KIV/ZSWI DOKUMENT SPECIFIKACE POŽADAVKŮ

DALŠÍ CIZÍ JAZYK - NĚMECKÝ JAZYK

Předmět: R U S K Ý J A Z Y K

český jazyk a literatura

Výuka obvykle probíhá v běžných třídách, v jazykové učebně, v multimediální učebně, v učebně s interaktivní tabulí nebo na jiném vhodném místě.

Vzdělávací oblast : Jazyk a jazyková komunikace Vzdělávací obor: Cizí jazyk

činí BODOVÁ HODNOTA DÍLA /BHD/: Audiovizuální dílo (režie): 100

Jak Švýcarské spolkové dráhy radikálně zvýšily propustnost své železniční infrastruktury. Michal Petrtýl, CSC

VOLBY parlamentní, prezidentské, komunální

Webová verze Selfnet TV

Simultánní přepis mluvené češtiny pro osoby se sluchovým postižením. Ing. Martin Novák

Základní pojmy audiovizuální komunikace. Jana Dannhoferová Ústav informa3ky PEF MENDELU v Brně Audiovizuální komunikace (AVK)

O 2 TV. jediná televize, která se vám přizpůsobí

META o. s. Sdružení pro příležitosti mladých migrantů

SBĚRNICOVÝ SYSTÉM NIKOBUS OVLÁDÁNÍ PROVOZNĚ TECHNICKÝCH FUNKCÍ HLASEM

Specializované korpusy mluveného jazyka - jejich tvorba a využití

Multimediální systémy

INTEROPERABILITA ÚVOD DO STUDIA STRUKTURA, POSLÁNÍ A FUNKCE INTEROPERABILITY A JEJÍ UPLATNĚNÍ V PROCESECH BEZPEČNOSTNÍHO MANAGEMENTU ING.

Zdeňka Telnarová. Problematika studentů se sluchovým postižením na VŠ

Transkript:

ŘEČOVÉ TECHNOLOGIE v PRAXI Josef Psutka, FAV ZČU v Plzni Obsah: 1. Automatické rozpoznávání řeči počítačem 2. Počítačová syntéza řeči 3. Hlasový dialog člověka s počítačem 1.10 2014 1

Automatické rozpoznávání řeči Úloha: Systém pro diktování textů do počítače Charakteristika: o SW systém pro automatický převod české mluvené řeči do textu o Využívá se pro snížení náročnosti tvorby psaných dokumentů o Uvolnění rukou a zraku pro jiné účely o Pomoc handicapovaným 1.10 2014 2

Vlastnosti: o Přepis v reálném čase bez zpoždění se slovníkem větším než 1 mil. slov o Rozsáhlé výslovnostní slovníky jmen a příjmení, obcí, ulic, firem (dalších 1,5 milionu slov) o Denní aktualizace slovní zásoby o Automatická adaptace na hlas řečníka o Využití moderního HW (paralelizace, GPU) o Hlasové ovládání aplikace o Obory použití - medicína (patologie, histologie, radiologie, chirurgie, ORL, interna, kardiologie, onkologie, psychiatrie ) - právo (soudnictví, advokacie ) - státní správa - soukromá sféra o SW se prodává pod označením MegaWord 1.10 2014 3

1.10 2014 4

Automatické rozpoznávání řeči Úloha: Projekt: Titulkování živých televizních pořadů Eliminace jazykových bariér handicapovaných diváků České televize Charakteristika: Tvorba skrytých titulků živě vysílaných TV pořadů různých žánrů (politika sport, zábava ) Náhrada stenotypistů a rychlopísařů na klávesnici Dva přístupy k řešení úlohy o přímé (automatické) titulkování z doprovodné zvukové stopy TV pořadu o titulkování s využitím tzv. stínového řečníka 1.10 2014 5

Přímé automatické titulkování Zvuková stopa TV pořadu Titulky ASR (realtime LVCSR) Lze využít jen pro specifické typy TV pořadů o vždy mluví pouze jeden řečník o kultivovaný projev řečníka o omezená doména projevu o klidné akustické prostředí 1.10 2014 6

Přímé automatické titulkování přenosy z Parlamentu ČR (Poslanecké sněmovny a Senátu) specifické akustické modely pro poslance a senátory specifický jazykový model a slovník s automatickou aktualizací zpracovaný titulek je automaticky doplněn interpunkcí titulky opatřeno dosud více než 1,5 tisíce přenosových hodin přesnost vytvářených titulků je přes 90% 1.10 2014 7

Titulkování s využitím stínového řečníka Zvuková stopa TV pořadu Titulky ASR (realtime LVCSR) Hodí se pro pořady diskusní (časté střídání řečníků, řečníci mluví najednou), pořady sportovní a zábavní (ruch na pozadí, emotivní řeč) apod. Lze využít pro libovolné žánry pořadů Inspirace u BBC, vyvinuta vlastní (lepší) technologie 4-fázový trénink s využitím patentem chráněného trenažéru Přesnost vytvářených titulků přes 98% 1.10 2014 8

Práce stínového řečníka Poslouchá zvukovou stopu TV pořadu Diktuje do titulkovacího systému Vybírá řeč hlavního řečníka (pokud mluví více řečníků najednou) Koriguje mluvu řečníka Kontroluje a opravuje výsledný text titulků Přidává nová slova do slovníku (je-li to třeba) Indikuje změnu řečníka (změna barvy titulku) Zadává interpunkci Zvládá až 2 hodiny titulkování 1.10 2014 9

Schéma titulkování živých pořadů 1.10 2014 10

Titulkování s využitím stínového řečníka Individuální akustický model pro každého stínového řečníka Specifický jazykový model a slovníky pro každou domény S využitím stínového řečníka titulkovány Diskusní a politické pořady: Otázky Václava Moravce, Hyde Park, Interview 24, Ekonomika 24, Volební debaty Zábavné, estrádní a kratochvilné pořady: Cena TýTý, Cena Thálie, Sportovci roku (atlet, fotbalista. ), Star Dance Sportovní přenosy: hokejová a fotbalová čs.liga, evropská liga, tenis (Davis Cup, Fed Cup); OH v Soči, MS v hokeji a ve fotbale (titulkování dalších typů pořadů se připravuje 1.10 2014 11

Vyhledávání informací v audio(-vizuálních) archivech Rychlé vyhledávání informací v proudu mluvené řeči (on-line anebo archiv záznamů) Hledání klíčových frází (slov) v proudu řeči o o Hledání na úrovni vyslovených a rozpoznaných slov Hledání na úrovni vyslovené posloupnosti fonetických zvuků Hledání topiků, tj. audio segmentů, kde se mluví o daném tématu Využití: call centra, rozsáhlé multimediální archivy, bezpečnostní složky státu 1.10 2014 12

Počítačová syntéza řeči IT technologie, která umožňuje převádět psaný text na mluvenou řeč (angl. TTS systémy Text-to-Speech) Cílem je generovat řeč z libovolného textu ve vysoké kvalitě Není možné uložit všechna slova (věty) do počítače, a pak je jen přehrávat! Konkatenační korpusově orientovaný systém Text Řeč 1.10 2014 13

Řečové technologie 33 v praxi Schéma procesu TTS Dnes D bude zataženo,, v některých oblastech přeháňky,, po 6. hod. očekáváme sněžení.. dnez bude zataženo vňekterích oblastech přeháňki pošesté hoďiňe očekáváme sňežeňí textová analýza, fonetická transkripce, prozodická slova pauza pauza pauza nádech prozodická analýza, intonační a rytmický průběh výběr, spojování a úprava základních řečových jednotek 1.10 2014 14

Počítačová syntéza řeči Využití: Automatické čtení textu pro zrakově handicapované osoby Automatický dabing (čtení titulků) televizních pořadů Automatické hlásiče (nádraží, bezpečnostní složky apod.) Součást hlasových dialogových systémů Ukázky : monohlasový pořad míchání (2orig) (2TTS) 1.10 2014 15

Hlasový dialog člověka s počítačem Hlavním účelem hlasových dialogových systémů (HDS) je vytvořit rozhraní mezi počítačem řízenou aplikací a uživatelem komunikujícím hlasem 1.10 2014 16

Hlasový dialog člověka s počítačem Hlasové dialogové systémy dovolují uživatelům komunikovat prostřednictvím hlasu s počítačovými nebo internetovými aplikacemi, jako jsou databázové a expertní systémy nebo systémy automatického řízení, ovládání a monitorování Využití HDS je efektivní v situacích, kdy o o o o Oči i ruce uživatele jsou plně zaměstnány jinými úkoly Uživatel má potřebu být pohyblivý a jiná vstupně-výstupní zařízení jsou neefektivní Uživatel je vzdálen od systému a může využít pouze hlasové komunikace přes běžné telefonní nebo radiové spoje Uživatel je zdravotně handicapovaná osoba s pohybovými, příp. zrakovými obtížemi Ukázky dialogu: - Informace o odjezdech vlaků zde - Inteligentní asistentka zde - Trenažér pro výuku řídicích letového provozu zde 1.10 2014 17

Děkuji za pozornost 1.10 2014 18

1.10 2014 19