Úvod do praxe stínového řečníka. Úvod



Podobné dokumenty
Řečové technologie na Katedře kybernetiky FAV ZČU v Plzni. Katedra kybernetiky. Fakulta aplikovaných věd. Západočeská univerzita v Plzni

ŘEČOVÉ TECHNOLOGIE v PRAXI

SEMESTRÁLNÍ PRÁCE Z PŘEDMĚTU KVD/GRPR GRAFICKÉ PROJEKTY

SYNTÉZA ŘEČI. Ústav fotoniky a elektroniky, v.v.i. AV ČR, Praha

Řečové technologie pomáhají překonávat bariéry

B2M31SYN 9. PŘEDNÁŠKA 7. prosince Granulační syntéza Konkatenační syntéza Nelineární funkce Tvarovací syntéza

Asistivní technologie

Umělá inteligence pro zpracování obrazu a zvuku

NAKI - ČRo archiv - Zpřístupnění archivu Českého rozhlasu pro sofistikované vyhledávání

Pavel Cenek, Aleš Horák

Normalizace textu. Text to Speech, TTS Konverze textu do mluvené podoby. Pavel Cenek, Aleš Horák. Obsah: Související technologie

Podporováno Technologickou agenturou České republiky, projekt TE

Speciální struktury číslicových systémů ASN P12

Základy umělé inteligence

NEWTON Technologies a.s. Jaroslava Schmidtová Project manager

AUTOMATICKÉ VYTVÁŘENÍ DOPROVODNÉ ZVUKOVÉ STOPY TELEVIZNÍHO VYSÍLÁNÍ PRO SLUCHOVĚ POSTIŽENÉ

ZČU v Plzni Fakulta aplikovaných věd Katedra kybernetiky

Jazyky a jazykové technologie v České republice. Tomáš Svoboda Jan Hajič

7 Další. úlohy analýzy řeči i a metody

NEWTON Technologies a.s.

Roman Lupoměský Neslyšící s nadějí, o.s.

Voice portál. Pavel Cenek OptimSys, s.r.o.

Překladům čest a rukám pokoj. aneb diktovací software v překladatelské praxi

Efektivní komunikace díky inovativním hlasovým technologiím. Praha, Call centrum ve finančních službách

Simultánní přepis online pro osoby se sluchovým postižením

Zdeňka Telnarová. Problematika studentů se sluchovým postižením na VŠ

Pokročilá navigace nevidomých JIŘÍ CHOD

Dolování dat z multimediálních databází. Ing. Igor Szöke Speech group ÚPGM, FIT, VUT

Úvod do praxe stínového řečníka. Titulkování TV pořadů

A2M31RAT Řečový signál a jeho základní charakteristiky Model vzniku řeči. Digitalizace a základní kódovací strategie

SKRYTÉ TITULKY K ŽIVÝM TELEVIZNÍM POŘADŮM

INSPO ročník konference Internet a informační systémy pro osoby se specifickými potřebami Kongresové centrum Praha, 14.

Oblastní unie neslyšících Olomouc

MASARYKOVA UNIVERZITA STŘEDISKO PRO POMOC STUDENTŮM SE SPECIFICKÝMI NÁROKY. Polygraf

Nové přístupové služby České televize

Nabídky spolupráce pro průmysl

Univerzita Pardubice Fakulta-ekonomicko správní

PODPŮRNÉ TECHNOLOGIE. Vzdělávání osob se zdravotním postižením Podtèma 3.1

Alternativní ovládání PC a okolí

Simultánní přepis mluvené češtiny pro osoby se sluchovým postižením

ZÁKLADY PROGRAMOVÁNÍ. Mgr. Vladislav BEDNÁŘ /14

Podmínky služby přenositelnost telefonních čísel

Hlasová biometrie & ověřování identity

Komparativní lingvistická analýza paralelních komunikátů vytvářených stínovým řečníkem

VYHLÁŠKA DĚKANA FAV 8D/2018 PŘIJÍMACÍ ŘÍZENÍ DO BAKALÁŘSKÝCH STUDIJNÍCH PROGRAMŮ FAKULTY APLIKOVANÝCH VĚD PRO AKADEMICKÝ ROK 2019/2020

Obsah. Co to je MojeMedicína. Nabídka pacientům a jejich blízkým. Nabídka odborníkům. Budoucnost

CO JE A NENÍ NOVÉHO V MODELOVÁNÍ DYNAMICKÝCH SPOJITÝCH SYSTÉMŮ NA POČÍTAČI ZA PŮL STOLETÍ

Z á p i s č. 6 ze zasedání vědecké rady Fakulty elektrotechnické ČVUT konaného dne V zasedací místnosti č. 209:

Konferenční systém Bosch CCS 800 Ultro Přináší inovace...

Tipy na vytvoření kvalitní prezentace PowerPoint. Martin Mazánek

Info schůzka. 16-Jan-16 Open Day - Dept. of English 1

Info schůzka. 2-Nov-18 Open Day - Dept. of English 1

Univerzitní informační systém

Rozpoznávání izolovaných slov (malý slovník, např. číslovky, povely).

Zpráva o vědě a výzkumuza rok 2017 Fakulta elektrotechniky a informatiky Ostrava, Proděkan pro VaV Michal Krátký

VOŠ A SPŠE PLZEŇ OT E VÍRÁME DVEŘE VZDĚLÁNÍM

Zpráva o průběhu přijímacího řízení na vysokých školách pro akademický rok na ČVUT v Praze Fakultě dopravní

OBECNÁ JAZYKOVĚDA (dvouoborové bakalářské studium) B 7310 Filologie

Roviny analýzy jazyka. Fonetika

Pokročil. Vyučující: Prof. Ing. Jan Nouza, CSc., ITE

ÚSTAV GERMÁNSKÝCH STUDIÍ ODDĚLENÍ FINSKÝCH STUDIÍ

Projekt OKO. Mobilní komunikace a navigační centra pro navádění nevidomých TA Jiří Chod chod@fel.cvut.cz

Václav Matoušek KIV. Umělá inteligence a rozpoznávání. Václav Matoušek / KIV

Alternativní ovládání PC a okolí

Ústav bohemistických studií Bohemistika pro cizince tříletý bakalářský studijní program

NÁVRH IMPLEMENTACE JAZYKOVÉHO MODULU PRO OVLÁDÁNÍ MAPY HLASEM

Anglický jazyk. Anglický jazyk. žák: TÉMATA. Fonetika: abeceda, výslovnost odlišných hlásek, zvuková podoba slova a její zvláštnosti

Systém KobaSpeech 2 stáhnete z internetové stránky

Stroje a zařízení L/01 Mechanik seřizovač PŘEDMĚT: OBOR:

Umělá inteligence a rozpoznávání

Fakulta elektrotechnická ZČU v Plzni se představuje

Zpráva o průběhu přijímacího řízení na vysokých školách pro akademický rok na ČVUT v Praze Fakultě dopravní

E K O G Y M N Á Z I U M B R N O o.p.s. přidružená škola UNESCO

Přeji nám všem hodně zdaru. prof. Ing. Petr Konvalinka, CSc., FEng., rektor ČVUT v Praze

Zpráva o průběhu přijímacího řízení na vysokých školách pro akademický rok na ČVUT v Praze Fakultě dopravní

Charakteristika vyučovacího předmětu 1. stupeň

SW pro správu a řízení bezpečnosti

Asistivní technologie

4.1. Organizační schéma ČT v Praze

Indexace audiovizuálních archivů s využitím metod automatického rozpoznávání řeči a obrazu

Ing. Jiří Fejfar, Ph.D. GNSS. Globální navigační satelitní systémy

Komplexní nabídka služeb ke komunikaci s neslyšícím a nedoslýchavým

Zpráva o průběhu přijímacího řízení na vysokých školách pro akademický rok na ČVUT v Praze Fakultě dopravní

Zpráva o průběhu přijímacího řízení na vysokých školách pro akademický rok na ČVUT v Praze Fakultě dopravní

FAKULTA ELEKTROTECHNICKÁ Spojujeme elektrotechniku a informatiku PRACUJ V OBORU. S OBRATEM VÍCE NEŽ MILIARD Kč

Zpráva o vědě a výzkumu za rok 2016 Fakulta elektrotechniky a informatiky Ostrava, Proděkan pro VaV Michal Krátký

Testování a verifikace softwaru

Komunikační podpora pro neslyšící a nedoslýchavé lidi

Inovace oboru čínská filologie na Univerzitě Palackého v Olomouci se zaměřením na uplatnění absolventů v praxi reg. č. CZ.1.07/2.2.00/15.

Vytvořeno v rámci výzkumu Povědomí žáků základních škol Jihomoravského kraje o problematice sluchového postižení

ÚSTAV GERMÁNSKÝCH STUDIÍ ODDĚLENÍ FINSKÝCH STUDIÍ

Řešené granty a projekty za rok 1996

Zahájení výuky. Doc. Ing. Jaroslav Machan, CSc. Škoda Auto, TC Zvláštní projekty elektrostrategie a výzkumu

escribe: Online přepisovací centrum pro neslyšící

Střední odborné učiliště Domažlice, škola Stod, Plzeňská 322, Stod

PODPORA STUDENTŮ SE SPECIFICKÝMI POTŘEBAMI NA ČVUT

Zpráva o vědě a výzkumu za rok 2012 Název prezentace Proděkan pro VaV Michal Krátký

Univerzita s kladným nábojem. Spolupráce TU v Liberci s průmyslem současné možnos; a aktuální témata

SBĚRNICOVÝ SYSTÉM NIKOBUS OVLÁDÁNÍ PROVOZNĚ TECHNICKÝCH FUNKCÍ HLASEM

TEMATICKÝ PLÁN NEPOVINNÉHO SEMINÁŘE PRO TVORBU MATURITNÍCH PRACÍ

Transkript:

Úvod do praxe stínového řečníka Úvod 1

Ukázka Kdo je to stínový řečník? Simultánní tlumočník z daného jazyka do téhož jazyka Jeho úkolem je přemlouvat televizní pořady tak, aby výsledná promluva byla vhodná pro rozpoznávací systém, který vyslovenou promluvu automaticky převede na titulky 2

Historie řečových technologií 1769 Wolfgang Ritter von Kempelen (maďarský šlechtic narozený v Bratislavě a žijící ve Vídni) začal pracovat na mechanickém mluvícím stroji 1779 německý profesor Christian Kratzenstein sestrojil akustické rezonátory napodobující hlasový trakt člověka, bylo jimi možné vytvářet samohlásky 1791 von Kempelen představil první syntetizér řeči schopný produkovat zvuky odpovídající hláskám 3

Von Kempelenův mluvicí stroj Převzato z: Psutka a kol., Mluvíme s počítačem česky. Academia, Praha, 2006. 4

Historie řečových technologií Rozvoj řečových technologií v současném pojetí nastal ve 20. století s rozvojem elektrotechniky 30. léta 20. století 1. syntéza souvislé řeči (elektronický syntetizér VODER vyvinutý v Bell Labs) 5

VODER (Voice Operation DEmonstratoR) Převzato z: Matoušek J., Syntéza řeči. Přednáška 24.4.2013 6

Historie řečových technologií Největší pokrok učiněn s nástupem číslicových počítačů (2. polovina 20. století) Frederick Jelinek (Bedřich Jelínek) (1932 2010) český vědec žijící v USA je považován za hlavního autora teorie, podle které je možné mluvenou řeč na text převádět pomocí statistických metod (do té doby se strojové rozpoznávání mluvené řeči snažilo řídit lidským modelem, stroje měly rozpoznávat syntaxi, gramatiku a významy slov). 7

Oblasti řečových technologií Počítačová syntéza řeči Automatické rozpoznávání řeči Hlasové dialogové systémy Rozpoznávání řečníka (rozpoznávání lidí podle hlasu) Rozpoznávání emocí z hlasu 8

Počítačová syntéza řeči Syntéza řeči = proces umělého vytváření řeči (počítačem), převod textu na řeč Počáteční snaha dosažení co největší srozumitelnosti syntetizované řeči (70. a 80. léta) Současná snaha dosažení co největší přirozenosti syntetizované řeči Konečný cíl vytvářet řeč v takové formě a kvalitě, aby nebyla rozpoznatelná od řeči člověka (opravdu to ale chceme?! etický problém) 9

Využití syntézy řeči Všude tam, kde není jiná možnost, jak přijímat informace aplikace pro nevidomé telefonní aplikace člověk uživatel má zaměstnán zrak jinými činnostmi operátor složitého přístroje řidič auta pilot letadla 10

Konkrétní příklady aplikace syntézy řeči pomoc handicapovaným lidem (nevidomí, lidé s poruchami hlasu) telekomunikační služby (call centra... ) informační služby (hlasová navigace v automobilech) dialogové systémy automatické čtení (SMS, e maily, e knihy,... ) multimediální systémy (automatický dabing?) zábavní průmysl (hračky, hry) výzkum (lingvistika, fonetika) výuka jazyků? 11

Počítačová syntéza řeči ukázka 12

Ukázky současných systémů syntézy řeči Komerční sféra NUANCE VOCALIZER AT&T NATURAL VOICES ACAPELA GROUP IVONA TTS Akademická sféra Festival (Edinburgh) HTS (Nagoya) Mary TTS (DFKI, Saarbrücken) Epos TTS (ÚFE AV ČR Praha) ARTIC (KKY FAV ZČU Plzeň) Převzato z: Matoušek J., Syntéza řeči. Přednáška 24.4.2013 13

Automatické rozpoznávání řeči Rozpoznávání řeči = proces převodu řeči na text Rozpoznávání izolovaně vyslovených slov Rozpoznávání souvislé řeči systémy s malým slovníkem (hlasové povely) systémy se středně velikým slovníkem (omezené úlohy předpověď počasí) systémy s velkým slovníkem (lze hovořit přirozeně na jakékoli téma) systémy závislé na řečníkovi (1 uživatel systému) systémy nezávislé na řečníkovi (více uživatelů) 14

Ukázka rozpoznávání řeči projekt ELJABR On line titulkování sportovních přenosů 15

Ukázka rozpoznávání řeči projekt ELJABR On line titulkování zasedání parlamentu 16

Hlasové dialogové systémy Umožňují uživatelům komunikovat prostřednictvím hlasu s počítačovými aplikacemi Kombinují systémy rozpoznávání a syntézy řeči Často se využívá telefonní rozhraní V současnosti pouze pro omezenou aplikační oblast 17

Využití hlasové dialogových systémů přístup k databázovým, informačním nebo monitorovacím systémům, zákaznická podpora informace o odjezdech a příjezdech vlaků informace o přijímacím řízení zákaznická samoobsluha (telefonní operátoři) 18

Dialogový systém Přijímací řízení Vybrat fakultu ze seznamu Pozdrav a informace Vybrat studijní obor ze seznamu Vlož své IČ IČ nalezeno? + - Výsledky zkoušky Další info? - + 19

Rozpoznávání řečníka a emocí Rozpoznávání řeči cílem je určit, co se říká Rozpoznávání řečníka cílem je učit, kdo to říká Identifikace řečníka Verifikace řečníka Rozpoznávání emocí cílem je určit, jak se to říká 20

Využití systémů rozpoznávání řečníka bezpečnostní systémy přístup do budov přístup k databázím telefonní transakce kriminalistika anonymní telefonáty analýza odposlechů 21

Využití systémů rozpoznávání emocí Kontrola psychického stavu uživatele, tj. operátorů na velínech (např. v jaderných elektrárnách) řídících letového provozu řidičů 22

Kde se řečové technologie vyvíjejí? Akademická pracoviště (ČR) ČVUT Praha rozpoznávání řeči (zejména v zašuměném prostředí), syntéza řeči (hlavně prozodie) VUT Brno rozpoznávání řeči, rozpoznávání řečníka Technická univerzita Liberec rozpoznávání řeči ZČU v Plzni rozpoznávání řeči, syntéza řeči, rozpoznávání řečníka, dialogové systémy 23

Projekty ZČU, katedry kybernetiky Projekt ELJABR (Eliminace jazykových bariér) pro Českou televizi Projekt MALACH (Multilanguage Access to Large Archives) vyhledávání ve zvukových archivech výpovědí z období holocaustu Projekt MEGAWORD diktovací systém pro převod řeči na text s velmi velkým slovníkem Projekt IT BLP (inteligentní technologie pro zvýšení bezpečnosti letového provozu) vývoj systému inteligentní komunikace mezi operátory řízení letového provozu a automatickým počítačovým pseudopilotem 24

Kde se řečové technologie vyvíjejí? Komerční sféra svět Nuance, Acapela, Amazon syntéza řeči Google, Nuance, Microsoft, Apple rozpoznávání řeči, dialogové systémy Komerční sféra ČR (zejména rozpoznávání řeči) NewtonTechnologies systém NewtonDicate (TU Liberec) NovaSoft systém NovaVoice (ZČU Plzeň) SpeechTech, s.r.o. spin off firma ZČU (řešení na míru nejen pro malé zákazníky např. Škoda Auto a.s., Česká televize) 25