jednotky + Projekty Jan Černocký ÚPGM FIT VUT Brno, cernocky@fit.vutbr.cz FIT VUT Brno



Podobné dokumenty
Dolování dat z multimediálních databází. Ing. Igor Szöke Speech group ÚPGM, FIT, VUT

Jan Černocký ÚPGM FIT VUT Brno, FIT VUT Brno

A2M31RAT- Řečové aplikace v telekomunikacích

Použití mluvených korpusů ve vývoji systému pro rozpoznávání českých přednášek *

Pokročil. Vyučující: Prof. Ing. Jan Nouza, CSc., ITE

kursu, úvod 2017/18 Igor Szöke a Honza Černocký ÚPGM FIT VUT Brno, FIT VUT Brno

LOMBARDŮV EFEKT V ŘEČOVÝCH DATABÁZÍCH CLSD A SPEECON

7 Další. úlohy analýzy řeči i a metody

Lombardův efekt v řečové databázi CLSD

Pavel Cenek, Aleš Horák

Josef Rajnoha. České vysoké učení technické v Praze, Fakulta elektrotechnická rajnoj1@fel.cvut.cz

Korpusová lingvistika a počítačové zpracování přirozeného jazyka

The Military Technical Institute

Project Life-Cycle Data Management

Nabídky spolupráce pro průmysl

Normalizace textu. Text to Speech, TTS Konverze textu do mluvené podoby. Pavel Cenek, Aleš Horák. Obsah: Související technologie


Technologie počítačového zpracování řeči


Modernizace a inovace výpočetní kapacity laboratoří ITE pro účely strojového učení. Jiří Málek

Klepnutím lze upravit styl předlohy. Klepnutím lze upravit styl předlohy. nadpisů. nadpisů. Aleš Křupka.

Logistika (nejen) pro e-commerce. Milan LUDVIK ZETES CZ Managing Director

Jiří Donát Konference IT 2001 Česká zemědělská univerzita 13. listopadu 2001

Výuka IVT pro MŠ. Autor: Mgr. Lenka Justrová. Datum (období) tvorby: Ročník: MATEŘSKÉ ŠKOLY

Klepnutím lze upravit styl předlohy. nadpisů. nadpisů.

Klepnutím lze Introduction upravit styl předlohy. nadpisů.

PRO ELEKTRONICKÉ SLOVNÍKY VISUALIZATION OF USER PRONUNCIATIONS FOR ELECTRONIC DICTIONARIES

ADA Semestrální práce. Harmonické modelování signálů

Speciální struktury číslicových systémů ASN P12

LPC. Jan Černocký ÚPGM FIT VUT Brno, FIT VUT Brno. LPC Jan Černocký, ÚPGM FIT VUT Brno 1/39

Karta předmětu prezenční studium

SRE 03 - Skryté Markovovy modely HMM


Centrum kompetence automobilového průmyslu Josefa Božka - AutoSympo a Kolokvium Božek až , Roztoky -

WEBOVÉ RÁDIO. Tomáš Barták. Střední průmyslová škola elektrotechnická a Vyšší odborná škola Karla IV. 13, Pardubice

Gymnázium a Střední odborná škola, Rokycany, Mládežníků 1115

BRDSM: Komplexní systém dynamického řízení kvality plynule odlévané oceli


Presentations of Buy Smart

(Akty přijaté před 1. prosincem 2009 podle Smlouvy o ES, Smlouvy o EU a Smlouvy o Euratomu)

Second WHO Global Forum on Medical Devices. Ing. Gleb Donin

Raně středověké centrum na Pohansku u Břeclavi. Stav bádání. Petr Dresler - Jiří Macháček

Summer semester

Part I. The Registry focuses on recruitment of new young donors and stem cells donation promotion

Centrum kompetence automobilového průmyslu Josefa Božka - AutoSympo a Kolokvium Božek 2. a , Roztoky -

Whale detection Brainstorming session. Jiří Dutkevič Lenka Kovářová Milan Le

BRDSM core: Komplexní systém dynamického řízení kvality plynule odlévané oceli

Národní spolupráce. Workshop na POSED. Michal Sikora Barbora Chmelíková. Subject Name Name, Position

Centrum kompetence automobilového průmyslu Josefa Božka - Kolokvium Božek 2012, Roztoky -

LIGHT SOURCE FOR PUPILS EXPERIMENTS

SIMOTION novinky v4.4

WP22: Human Centered Cabin Design (modely lidských faktorů a optimalizace hardwaru kabiny) Vedoucí konsorcia podílející se na pracovním balíčku

Bibliometric probes into the world of scientific publishing: Economics first

J. Tatarinov, P. Pollák. Fakulta elektrotechnická. Abstrakt. otestován a zhodnocen na signálech z databáze CAR2CS. Detektor využívající

Karta předmětu prezenční studium

SYSTÉM PRO KONFIGURACI KOMUNIKAČNÍCH TERMINÁLŮ A VIZUALIZACI STAVOVÝCH DAT Z KOLEJOVÝCH VOZIDEL

VÚTS, a.s. Liberec CENTRE OF ENGINEERING RESEARCH AND DEVELOPMENT

FAKULTA INFORMAČNÍCH TECHNOLOGIÍ

Jan Černocký ÚPGM FIT VUT Brno, FIT VUT Brno

OpenAIRE Advance v České republice

Karta předmětu prezenční studium

escribe: Online přepisovací centrum pro neslyšící

Lukáš Brodský Praha Osnova. Objektový přístup Verze 4, 5, 6 / 7 Developer7 -funkčnost, nové vlastnosti HW

Algoritmy a struktury neuropočítačů ASN P6

CZ.1.07/2.3.00/

Předzpracování dat. Pavel Kordík. Department of Computer Systems Faculty of Information Technology Czech Technical University in Prague

Creation of Lexicons and Language Models for Automatic Broadcast News Transcription

escribe: Online přepisovací centrum pro neslyšící

Analýzou dat k efektivnějšímu rozhodování

Geneticky modifikované zvířecí. modely pro charakterizaci. funkce genů

Umělá inteligence pro zpracování obrazu a zvuku


Přehled mezinárodních norem (ISO) Označení mezinárodní normy Názvy mezinárodních norem Rok vydání

Horizont 2020 Přístup k rizikovému financování

DATABÁZOVÉ SYSTÉMY. Vladimíra Zádová, KIN, EF TUL - DBS

internetové stránky municipality

Tvorba protokolů o GPS měření v programech LEICA Geo Office a SKI-Pro v3.0

Karta předmětu prezenční studium

Výuka IVT pro MŠ. Autor: Mgr. Lenka Justrová. Datum (období) tvorby: Ročník: MATEŘSKÉ ŠKOLY. Vzdělávací oblast: KDO CO DĚLÁ

NAIL072 ROZPOZNÁVÁNÍ VZORŮ

SMLOUVY V PROJEKTECH MARIE CURIE (SP LIDÉ)

Vojtěch Franc Centrum strojového vnímání, Katedra kybernetiky, FEL ČVUT v Praze Eyedea Recognition s.r.o MLMU

Drags imun. Innovations

Common Language Resources and Their Applications

Témata pro zpracování školních zkušebních úloh

Efektivní komunikace díky inovativním hlasovým technologiím. Praha, Call centrum ve finančních službách

TIA Portal V15.1 SW novinky. siemens.com/tia-portal

místo, kde se rodí nápady

Dobrovolná bezdětnost v evropských zemích Estonsku, Polsku a ČR

Vstup a úkoly pro 11. kapitolu IDENTIFIKACE A BALENÍ JAKO SUBSYSTÉM ŘETĚZCE.

IT4Innovations Centre of Excellence

Videokonference pro každého Produktová řada LifeSize

Smart Grid Data Mining


Dobývání znalostí z textů text mining

Výuka IVT pro MŠ. Autor: Mgr. Lenka Justrová. Datum (období) tvorby: Ročník: MATEŘSKÉ ŠKOLY. Vzdělávací oblast: DO ŠKOLY

Projekt MEFANET. MEdical FAculties educational NETwork. Představení náplně a cílů projektu. Institut biostatistiky a analýz

Parametrická studie změny napětí v pánevní kosti po implantaci cerkvikokapitální endoprotézy

Inzulínová pumpa Accu-Chek Insight. Vašemu životu na míru

NEWTON Technologies a.s. Jaroslava Schmidtová Project manager

Transkript:

Databáze + Automaticky učené řečové jednotky + Projekty Jan Černocký ÚPGM FIT VUT Brno, cernocky@fit.vutbr.cz FIT VUT Brno Databáze + Automaticky učené řečové jednotky Jan Černocký, ÚPGM FIT VUT Brno 1/12

Sběr velkých řečových databází Proč? rozpoznávače se musí trénovat na popsaných řečových datech. Požadavky Prostředí musí odpovídat reálnýcm podmínkám (auto, obývák, tlf. linka). Pokrytí různých kategoríı mluvčích (pohlaví, dialekt, věk). Databáze + Automaticky učené řečové jednotky Jan Černocký, ÚPGM FIT VUT Brno 2/12

Nahrávané položky číslovky, kĺıčová slova, povely řetězce číslic, čísla jména (města, lidé) hláskování foneticky vyrovnaná slova/věty: Odzbrojením, které je klíčovým bodem dohody, se neobtěžují. Muž totiž nepřerušil klasickou onkologickou léčbu. Mám neseriózního jednání dost, poznamenala. Je ženatý, má tři děti a je vynikajícím hráčem bridže. Určitě neuhodnete, z čeho to je, prohlásil sebevědomě. Bridž totiž hrají dvě dvojice proti sobě. Aprílové počasí provázelo včerejší program mítinku. Mezi sólisty nové inscenace se objeví řada hostů. Řekl to ve čtvrtek člen vedení belgické strany zelených. Po městě jezděte tramvají, ta je ekologická. Databáze + Automaticky učené řečové jednotky Jan Černocký, ÚPGM FIT VUT Brno 3/12

DB - projekty - vše společně s ČVUT Praha Číslovky (1999) - 1227 mluvčích, telefon, ca 7 min/mluvčí, pouze číslovky, čísla, řetězce čísel + spec. znaky. Finance od Siemens AG R&D Mnichov. Výzkumná a výuková práva. SpeechDat-East (1999-2000) - 1052 mluvčích, telefon, ca 15 min/mluvčí, všechny typy položek. Finance od EU - 4. rámcový program, INCO Copernicus, spolupráce s Matra Lernout&Hauspie ScanSoft. Plná práva. SpeeCon (2003) - 600 mluvčích (z toho 50 dětí), ca 40 min/mluvčí, prostředí Office, Entertainment, Public, Car. 4-kanálové nahrávání, speeconí bedna, notebook, 2 VXPocket2. TEMIC2 (teď!) - 600 mluvčích, ca 40 min/mluvčí, různá auta, 2 kanály. nahrávání na DAT, pak přepis. Mluvčí z Východní Moravy a Slezska needed! Platíme 200,- za max. hodinovou session :-) pořizování multimodálních meeting dat - viz Petr Jenderka. Databáze + Automaticky učené řečové jednotky Jan Černocký, ÚPGM FIT VUT Brno 4/12

DB - anotace zapsat, co mluvčí skutečně řekl. Databáze + Automaticky učené řečové jednotky Jan Černocký, ÚPGM FIT VUT Brno 5/12

DB - anotace - kontrola annotator ask annotator to correct and re-submit the batch generation of log-file with positions of errors annotation batch generation of pronunciation dictionary pronunciation dictionary comparison with the reference dictionary difference dictionary proof-reading reference pronunciation dictionary update of the reference dictionary correct wordforms and pronunciations errors? yes no PASSED Databáze + Automaticky učené řečové jednotky Jan Černocký, ÚPGM FIT VUT Brno 6/12

Automaticky naučené řečové jednotky Proč? DB projekty mají rozpočty v milionech, jednodušší by bylo zapíchnout počítač do rádia a jen nahrávat. jenže pro trénování klasických řečových jednotek fonémy, trifóny potřebujeme anotace (nejvíce peněz a největší opruz... ). pro některé aplikace (kódování, identifikace jazyka) nepotřebujeme vůbec souvislost s textem. daty řízené metody pro učení jednotek. Databáze + Automaticky učené řečové jednotky Jan Černocký, ÚPGM FIT VUT Brno 7/12

Návrh, jak na to (Černockého PhD) raw data samples LPCC parametrization multigrams LPCC vectors temporal decomposition events vector quantization symbols sequences of symbols conversion to transcriptions initial transcriptions initial HMM training HMM segmentation termination initial models new transcriptions HMM parameter reestimation no dictionary of units new parameters yes set of models transcriptions Databáze + Automaticky učené řečové jednotky Jan Černocký, ÚPGM FIT VUT Brno 8/12

Aplikace I. Kódování VLBR input speech CODER HMM recognizer index of coding unit DECODER models of coding units determination of synthesis unit selection of representative determination of synthesis unit selection of representative synthesis output speech pitch, energy timing dictionary of representatives of each synthesis unit Databáze + Automaticky učené řečové jednotky Jan Černocký, ÚPGM FIT VUT Brno 9/12

Pokračování Petr Motĺıček - minimalizace přechodů mezi jednotkami - diphone-like jednotky. Igor Szoke - HNM syntéza, EHMM pro koherentnější postup trénování jednotek. http://www.fit.vutbr.cz/~szoke/speech/index.html Problém: na toto nám nikdo nedává peníze :-( Databáze + Automaticky učené řečové jednotky Jan Černocký, ÚPGM FIT VUT Brno 10/12

EU projekty M4 Multimodal Meeting Manager - EU IST 5th PCRD (10 partnerů z Evropy a USA) Development of a smart meeting room, collection and annotation of a multimodal meetings database. Analysis and processing of the audio and video streams. Integration and structuring using the output of the various recognizers. Demonstrator. Speech@Brno tasks: down-scaled meeting room with hyperbolic mirror - data collection and annotation. LVCSR, phoneme recognition, feature extraction. http://www.m4project.org Databáze + Automaticky učené řečové jednotky Jan Černocký, ÚPGM FIT VUT Brno 11/12

EU projekty AMI Augmented MultiParty Interaction - EU IST 6th PCRD (16 partnerů z EVropy a USA včetně průmyslových (např. Philips Smart Display) a W3C). Multimodal input interface Integration of modalities and coordination among modalities Meeting dynamics and human-human interaction modelling Content abstraction (multimodal information indexing, summarising, and retrieval) Technology transfer Training activities, including an international exchange programme. Speech@Brno task: Keyword detection / Acoustic event spotting (with suporting technologies) http://www.amiproject.org Databáze + Automaticky učené řečové jednotky Jan Černocký, ÚPGM FIT VUT Brno 12/12