B2M31SYN 9. PŘEDNÁŠKA 7. prosince Granulační syntéza Konkatenační syntéza Nelineární funkce Tvarovací syntéza

Podobné dokumenty
SYNTÉZA ŘEČI. Ústav fotoniky a elektroniky, v.v.i. AV ČR, Praha

Úvod do praxe stínového řečníka. Úvod

ZČU v Plzni Fakulta aplikovaných věd Katedra kybernetiky

Akustika. 3.1 Teorie - spektrum

Univerzita Pardubice Fakulta-ekonomicko správní

Úvod do zpracování signálů

Signál v čase a jeho spektrum

VY_32_INOVACE_E 15 03

ŘEČOVÉ TECHNOLOGIE v PRAXI

Zpráva k semestrální práci z předmětu Syntéza audio signálů. Vypracoval: Jakub Krista Zimní semestr 2016/2017 Datum odevzdání:

Úvod do praxe stínového řečníka. Proces vytváření řeči

ADA Semestrální práce. Harmonické modelování signálů

Speciální struktury číslicových systémů ASN P12

SYNTÉZA AUDIO SIGNÁLŮ

B2M31SYN SYNTÉZA AUDIO SIGNÁLŮ

Pavel Cenek, Aleš Horák

Algoritmy a struktury neuropočítačů ASN P8b

A2B31SMS 11. PŘEDNÁŠKA 4. prosince 2014

7. listopadu 2018 Hlas a řeč. Hudební nástroje. Formantové syntézy. Číslicové pásmové propusti. Aplikace

Normalizace textu. Text to Speech, TTS Konverze textu do mluvené podoby. Pavel Cenek, Aleš Horák. Obsah: Související technologie


Direct Digital Synthesis (DDS)

SEMESTRÁLNÍ PRÁCE Z PŘEDMĚTU KVD/GRPR GRAFICKÉ PROJEKTY

Zvuk. 1. základní kmitání. 2. šíření zvuku

SIGNÁLY A LINEÁRNÍ SYSTÉMY

SIGNÁLY A LINEÁRNÍ SYSTÉMY

Syntéza zvuků a hudebních nástrojů v programovém prostředí MATLAB

Osnova. Idea ASK/FSK/PSK ASK Amplitudové... Strana 1 z 16. Celá obrazovka. Konec Základy radiotechniky

Univerzita Karlova v Praze Filozofická fakulta

Hlavní parametry rádiových přijímačů

JAK VZNIKÁ LIDSKÝ HLAS? Univerzita Palackého v Olomouci

A7B31ZZS 10. PŘEDNÁŠKA Návrh filtrů 1. prosince 2014

Zpráva k semestrální práci z B2M31SYN Syntéza audio signálů

Optimalizace rychlosti výběru řečových jednotek v konkatenační syntéze řeči. Ing. Jiří Kala

Rádiové funkční bloky X37RFB Krystalové filtry

Fyzikální podstata zvuku

Nízkofrekvenční (do 1 MHz) Vysokofrekvenční (stovky MHz až jednotky GHz) Generátory cm vln (až desítky GHz)

Západočeská univerzita v Plzni Fakulta aplikovaných věd Katedra kybernetiky BAKALÁŘSKÁ PRÁCE

Lineární a adaptivní zpracování dat. 1. ÚVOD: SIGNÁLY a SYSTÉMY

14 - Moderní frekvenční metody

MĚŘENÍ A ANALÝZA ELEKTROAKUSTICKÝCH SOUSTAV NA MODELECH. Petr Kopecký ČVUT, Fakulta elektrotechnická, Katedra Radioelektroniky

Kepstrální analýza řečového signálu

Pro tvorbu samostatně spustitelných aplikací je k dispozici Matlab library.

Akustika pro posluchače HF JAMU

DSY-4. Analogové a číslicové modulace. Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti

A7B31ZZS 4. PŘEDNÁŠKA 13. října 2014

STANOVENÍ CHARAKTERU SEGMENTU ŘEČI S VYUŽITÍM REÁLNÉHO KEPSTRA

2. GENERÁTORY MĚŘICÍCH SIGNÁLŮ II

31SCS Speciální číslicové systémy Antialiasing

Základní komunikační řetězec

Synth challange 2016

SIGNÁLY A SOUSTAVY, SIGNÁLY A SYSTÉMY

KTE/TEVS - Rychlá Fourierova transformace. Pavel Karban. Katedra teoretické elektrotechniky Fakulta elektrotechnická Západočeská univerzita v Plzni

Otázka 22(42) Přístroje pro měření signálů, metody pro měření v časové a frekvenční doméně. Přístroje

VY_32_INOVACE_ENI_2.MA_05_Modulace a Modulátory

Multimediální systémy

DIPLOMOVÁ PRÁCE. Západočeská univerzita v Plzni Fakulta aplikovaných věd Katedra kybernetiky

Zásady regulace - proudová, rychlostní, polohová smyčka

9. PRINCIPY VÍCENÁSOBNÉHO VYUŽITÍ PŘENOSOVÝCH CEST

Multimediální systémy

MODELOVÁNÍ SUPRASEGMENTÁLNÍCH RYSŮ MLUVENÉ ČEŠTINY POMOCÍ LINEÁRNÍ PREDIKCE

A/D převodníky - parametry

Analogové modulace. Podpora kvality výuky informačních a telekomunikačních technologií ITTEL CZ.2.17/3.1.00/36206

Operační systémy. Jednoduché stránkování. Virtuální paměť. Příklad: jednoduché stránkování. Virtuální paměť se stránkování. Memory Management Unit

Václav Syrový: Hudební akustika, Praha 2003, s. 7

popsat princip činnosti základních zapojení čidel napětí a proudu samostatně změřit zadanou úlohu

ZÁKLADY AUTOMATICKÉHO ŘÍZENÍ

Přednáška. Správa paměti II. Katedra počítačových systémů FIT, České vysoké učení technické v Praze Jan Trdlička, 2012

Multimediální systémy

Obr. 1 Činnost omezovače amplitudy

doc. Dr. Ing. Elias TOMEH Elias Tomeh / Snímek 1

1. Vlastnosti diskretních a číslicových metod zpracování signálů... 15

Západočeská univerzita v Plzni Fakulta aplikovaných věd Katedra kybernetiky

Zvuk včetně komprese. Digitálně = lépe! Je to ale pravda? X36PZA Periferní zařízení

Základy tvorby výpočtového modelu

PSK1-5. Frekvenční modulace. Úvod. Vyšší odborná škola a Střední průmyslová škola, Božetěchova 3 Ing. Marek Nožka. Název školy: Vzdělávací oblast:

Řečové technologie na Katedře kybernetiky FAV ZČU v Plzni. Katedra kybernetiky. Fakulta aplikovaných věd. Západočeská univerzita v Plzni

Oscilátory. Oscilátory s pevným kmitočtem Oscilátory s proměnným kmitočtem (laditelné)

elektrické filtry Jiří Petržela filtry založené na jiných fyzikálních principech

Zvuk a multimédia II.

Biofyzikální ústav LF MU Brno. jarní semestr 2011

Akustika. Cesta zvuku od hudebního nástroje přes nahrávací a reprodukční řetězec k posluchači

P7: Základy zpracování signálu

Strategie ACE využívající virtuální elektrody v kochleárních implantátech Nucleus 24

Při návrhu FIR filtru řešíme obvykle následující problémy:

1 Zpracování a analýza tlakové vlny

r Odvoď te přenosovou funkci obvodů na obr.2.16, je-li vstupem napě tí u 1 a výstupem napě tí u 2. Uvaž ujte R = 1Ω, L = 1H a C = 1F.

Návrh frekvenčního filtru

Dolování dat z multimediálních databází. Ing. Igor Szöke Speech group ÚPGM, FIT, VUT

Jana Dannhoferová Ústav informatiky, PEF MZLU

CW01 - Teorie měření a regulace

Oscilátory Oscilátory

A6M33BIO- Biometrie. Biometrické metody založené na rozpoznávání hlasu I

P9 Provozní tvary kmitů

Předmět A3B31TES/Př. 13

Lineární a adaptivní zpracování dat. 3. SYSTÉMY a jejich popis ve frekvenční oblasti

31ZZS 9. PŘEDNÁŠKA 24. listopadu 2014

Vlastnosti členů regulačních obvodů Osnova kurzu

Lineární a adaptivní zpracování dat. 2. SYSTÉMY a jejich popis v časové doméně a frekvenční doméně

3 METODY PRO POTLAČENÍ ŠUMU U ŘE- ČOVÉHO SIGNÁLU

Transkript:

B2M31SYN 9. PŘEDNÁŠKA 7. prosince 2016 Granulační syntéza Konkatenační syntéza Nelineární funkce Tvarovací syntéza

Granulační syntéza Jako alternativu k popisu pomocí sinusovek při úvahách o zvuku navrhl Gabor (1947) "akustická kvanta". Klasická definice granulační syntézy říká, že akustické kvanta jsou malé samostané exploze "harmonických oscilací" (např. sinusových vln) s amplitudovou obálkou založenou na Gaussově distribuci. Barry Truax jako první vytvořil program umožňující realizaci granulační syntézy v reálném čase. Za nejlepší jeho skladbu používající tento systém se považuje Riverrun (1986).

Postup při granulační syntéze Vzorkovaný audio signál Gaussovská obálka 1 A( t) e 2 2 2 ( t ) / 2 zvukové zrno

Další obálky Trapezoidální obálka (Truax)

Délka zrna Perioda Zpoždění

Délka zrna Typická délka zrn je mezi 1 a 50 ms. Abychom slyšeli události zněle, je na vysokých frekvencích jejich minimální délka 13 ms a na nízkých frekvencích 45 ms. Délky větší než 50 ms vytváří dojem separovaných zvukových událostí.

Granulační syntéza Technika není vhodná pro klasické hudební barvy zvuku Vyniká v některých přirozených zvucích, které je obtížné generovat jinou metodou (např. praskající oheň, bublající voda, poryvy větru, výbuchy). http://en.wikipedia.org/wiki/granular_synthesis

Historie syntézy řeči Mechanické syntetizéry - Kratzenstein (1779) (první pokusy - samohlásky) - Kempelen (1791) (mluvící stroj) Elektronické syntetizéry - Stewart (1922) (dva rezonátory) - Dudley (1939) (Voder - první syntetizér souvislé řeči) - Fant (1953) (OVE I - kaskádní formantový syntetizér) Digitální syntetizéry - Klatt (1979) (MITalk, Klattalk - nejlepší formantová syntéza)

Kempelenův syntezátor Jednalo se o mechanické zařízení napodobující artikulační orgány člověka

Klatt Blokové schéma Klattova syntezátoru

Historie české syntézy řeči Kaňka - první pokusy (20. léta 20. století) Janota - první český syntetizér řeči (1964) Ptáček, Borovičková, Maláč - OVED 1 - první syntetizér souvislé řeči (1968) - HO2 - první český TTS systém (1977) ÚRE AV ČR, Ptáček - PCVOX - první český LPC TTS systém (1990) - Epos - první český open source TTS (1996) ZČU Plzeň - ARTIC - první český Unit Selection TTS (2000)

Janota (1964) Jednoduchý paralelní formantový syntetizér češtiny

Metody syntézy řeči Artikulační syntéza - Modelovaní kompletního hlasového traktu - Výpočetně náročné, špatná kvalita - Prakticky se zatím nevyužívá, pouze ve výuce Formantová syntéza - Zjednodušené modelování hlasového traktu pomocí formantů a antiformantů - Praktické aplikace - nejpoužívanější v 60.- 80. letech Konkatenační syntéza - Řetězení segmentů řeči z inventáře řečových jednotek - Používá většina současných TTS 22

Formantová syntéza Založena na akustické teorii vytváření řeči Zjednodušená simulace vytváření řeči člověkem - Zdroj buzení - generátor impulsů pro znělé zvuky a šum nebo smíšené buzení pro neznělé zvuky - Hlasový trakt - modelování pomocí filtru, jehož parametry odpovídají formantům a antiformantům hlasového traktu Syntéza podle pravidel parametry se nastavují podle manuálně nalezených pravidel Dříve velmi úspěšná a používaná metoda 24

Formantová syntéza Výhody: - Jednoduchý model - Snadné řízení prozodických charakteristik - Konstantní kvalita - Změny hlasu a emoce možno řídit podle pravidel - Schopnost vytvářet plynulou kvalitní řeč Nevýhody: - Pracné hledání a nastavování pravidel - Vzájemná interakce mezi hodnotami parametrů - Složité vytváření některých zvuků (explozívy) - Nízká přirozenost řeči 25

Konkatenační syntéza Používá přímo části přirozeného řečového signálu 16

Konkatenační syntéza Používá přímo části přirozeného řečového signálu Předpokládá, že se řeč skládá z řečových (akustických) jednotek 17

Konkatenační syntéza Používá přímo části přirozeného řečového signálu Předpokládá, že se řeč skládá z řečových (akustických) jednotek Řeč je možné rozdělit na segmenty odpovídající těmto jednotkám a uložit je do inventáře řečových jednotek 18

Konkatenační syntéza Používá přímo části přirozeného řečového signálu Předpokládá, že se řeč skládá z řečových (akustických) jednotek Řeč je možné rozdělit na segmenty odpovídající těmto jednotkám a uložit je do inventáře řečových jednotek Řeč se vytváří řetězením (konkatenací) řečových segmentů uložených v inventáři řečových jednotek 19

Konkatenační syntéza Používá přímo části přirozeného řečového signálu Předpokládá, že se řeč skládá z řečových (akustických) jednotek Řeč je možné rozdělit na segmenty odpovídající těmto jednotkám a uložit je do inventáře řečových jednotek Řeč se vytváří řetězením (konkatenací) řečových segmentů uložených v inventáři řečových jednotek Syntetická řeč napodobuje řečníka z inventáře

Konkatenační syntéza Generování posloupnosti řečových jednotek Výběr vhodné realizace řečové jednotky Vlastní řetězení (konkatenace) Syntéza řízená daty parametry syntetizéru se nastavují automaticky z řečových dat

Konkatenační syntéza Vytváření inventáře řečových jednotek - Ruční vytváření - Automatické vytváření Způsob reprezentace řečových jednotek - Neparametrická (přímo vzorky řeči) - Parametrická (LPC, kepstrální, HMM) spektrální/prozodické modifikace jednotek - Bez modifikací (pouze řetězení) - S modifikacemi (snaha o minimalizaci nespojitostí na hranicích řetězených jednotek) Možnosti generování řeči - S omezeným slovníkem (věty ze specifické oblasti) - S neomezeným slovníkem (libovolné věty) 28

Konkatenační syntéza m y n u m b er 23

Porovnání technik syntézy řeči Konkatenační Formantová Artikulační Jednoduché Střední složitost Složité Slyšitelné přechody Trochu umělé Nejpřirozenější Požadavek ohromných databází pro dosažení plynulosti Kritické je efektivní vyhledávání Požadavek na minimální množství řídících dat Modelování rezonátorů pomocí nul a pólů Obrovské databáze nejsou podmínkou Potřeba přesných a výkonných modelů

Korpusově orientovaná syntéza Zvláštní případ konkatenační syntézy Využití rozsáhlých a prozodicky pečlivě anotovaných řečových korpusů Více realizací každé řečové jednotky (v rozdílných fonetických, spektrálních i prozodických kontextech) Plně automatická konkatenační syntéza Všechny parametry se určují automaticky na základě dat z řečového korpusu Často tzv. neuniformní řečové jednotky (jednotky různého typu) během syntézy se vybere typ a realizace jednotky => syntéza výběrem jednotek Unit Selection http://www.kky.zcu.cz/cs/research-fields/acoustic-speech-synthesis

Korpusově orientovaná syntéza http://www.kky.zcu.cz/cs/research-fields/acoustic-speech-synthesis

České řečové syntezátory Komerční - ARTIC - ZČU Plzeň http://www.speechtech.cz/ http://www.speechtech.cz/cs/produkty/demo.html#iva210 - Acapela Group - Eliška http://www.acapela-group.com/text-to-speech-interactive-demo.html - RealSpeek - Zuzana http://www.freedomscientific.com/downloads/realspeak-solo-direct-voi OpenSource - Epos http://epos.ufe.cz/ (zde jsou i zajímavé odkazy) http://epos.ufe.cz/cgi-bin/saye.cgi?lang=czech - Festival (s podporou češtiny od Brailcomu) http://live.freebsoft.org/desktop#speech-synthesis - Mbrola http://tcts.fpms.ac.be/synthesis/mbrola.html

Aplikace syntézy řeči Pomůcky pro nevidomé a slabozraké Telekomunikační služby Automatické čtení (SMS, e-maily...) Výuka jazyků Multimédia, komunikace člověk-počítač Mluvící hračky pro děti Výzkum (fonetika, lingvistika, akustika) 39

Aplikace syntézy řeči Pomůcky pro nevidomé a slabozraké Telekomunikační služby Automatické čtení (SMS, e-maily...) Výuka jazyků Multimédia, komunikace člověk-počítač Mluvící hračky pro děti Výzkum (fonetika, lingvistika, akustika) 39

Literatura J. Psutka, L. Müller, J. Matoušek, V. Radová: Mluvíme s počítačem česky. Academia 2006 41

Nelineární a tvarovací syntézy Metody vyvinuté J. C. Rissetem

Nelineární a tvarovací syntézy Metody vyvinuté J. C. Rissetem Rovněž nazývané nelineární zkreslení

Nelineární a tvarovací syntézy Metody vyvinuté J. C. Rissetem Rovněž nazývané nelineární zkreslení Modifikují (zkreslují) audio signál prostřednictvím přenosové funkce

Nelineární a tvarovací syntézy Metody vyvinuté J. C. Rissetem Rovněž nazývané nelineární zkreslení Modifikují (zkreslují) audio signál prostřednictvím přenosové funkce Účinnost metody a možnosti tvorby dynamických změn barev je srovnatelná s FM

Nelineární a tvarovací syntézy Metody vyvinuté J. C. Rissetem Rovněž nazývané nelineární zkreslení Modifikují (zkreslují) audio signál prostřednictvím přenosové funkce Účinnost metody a možnosti tvorby dynamických změn barev je srovnatelná s FM Předností je přesný návrh pásmově omezeného spektra (bez FM cvrlikání )

Tvarování Technika, kterou lze vytvořit dynamická spektra Tvarování (waveshaping) vstup (často sinusovka) výstup (s dalšími harmonickými) zkreslení nebo tvarovací index nelineární přenosová funkce

Tvarování Přenosová funkce výstupní hodnota vstupní hodnota

Přenosové funkce Tvarování může modifikovat vstupní signál v závislosti na přenosové funkci různými způsoby. Harmonický průběh je: (a) invertován, (b) potlačen, (c) oříznut, (d) výrazně pozměněn.

Příklady přenosových funkcí (a) lineární funkce nemění výsledné spektrum (na rozdíl od nelineární) (b) lichá symetrická funkce generuje pouze liché harmonické (c) sudá symetrická funkce generuje sudé harmonické (d-f) funkce s prudkými změnami mohou zapříčinit aliasing

Příklady přenosových funkcí (a) lineární funkce nemění výsledné spektrum (na rozdíl od nelineární) (b) lichá symetrická funkce generuje pouze liché harmonické (c) sudá symetrická funkce generuje sudé harmonické (d-f) funkce s prudkými změnami mohou zapříčinit aliasing

Dynamické nelineární zkreslení

Dynamické nelineární zkreslení quadric transfer function y = x 2

Intermodulace Pokud do přenosové funkce vstupuje více harmonických, vznikají další harmonické (intermodulační produkty) Čím více vstupních složek, tím více intermodulačních produktů

Návrh přenosových funkcí Přenosové funkce lze navrhovat různými způsoby včetně grafických

Návrh přenosových funkcí Přenosové funkce lze navrhovat různými způsoby včetně grafických Nicméně pro návrh přenosové funkce, která přesně definuje spektrum výstupního signálu, je nejlepší použít polynomů.

Návrh přenosových funkcí Přenosové funkce lze navrhovat různými způsoby včetně grafických Nicméně pro návrh přenosové funkce, která přesně definuje spektrum výstupního signálu, je nejlepší použít polynomů. Polynomy neprodukují harmonické výše než N: F(x) = d 0 + d 1 x + d 2 x 2 + + d N x N

Čebyševovy polynomy Jsou užitečné při návrhu přenosové funkce

Čebyševovy polynomy Jsou užitečné při návrhu přenosové funkce Generují harmonické parciály

Čebyševovy polynomy Jsou užitečné při návrhu přenosové funkce Generují harmonické parciály Specifikace relativních amplitud

Čebyševovy polynomy Jsou užitečné při návrhu přenosové funkce Generují harmonické parciály Specifikace relativních amplitud Na vstupu je harmonický signál

Čebyševovy polynomy Jsou užitečné při návrhu přenosové funkce Generují harmonické parciály Specifikace relativních amplitud Na vstupu je harmonický signál Čebyševův polynom k tého řádu generuje právě k tou harmonickou

Čebyševovy polynomy Jsou užitečné při návrhu přenosové funkce Generují harmonické parciály Specifikace relativních amplitud Na vstupu je harmonický signál Čebyševův polynom k tého řádu generuje právě k tou harmonickou Čebyševovy polynomy různých řádů lze sčítat a vytvořit tak přenosovou funkci, která bude definovat amplitudové spektrum