Algoritmy a struktury neuropočítačů ASN P09. Analýza emocionální řeči neuronovými sítěmi Proč?

Podobné dokumenty
Algoritmy a struktury neuropočítačů ASN P8b

Klasifikace hudebních stylů

FJFI. Emoce a jak je zvládat

Fyziologická akustika. fyziologická akustika: jak to funguje psychologická akustika: jak to na nás působí

AKUSTIKA. Tón a jeho vlastnosti

Hlavní parametry rádiových přijímačů

Akustika. Tónové systémy a ladění

Zvuk a jeho vlastnosti

Zpráva k semestrální práci

Zpráva k semestrální práci z B2M31SYN Syntéza audio signálů

fluktuace jak dob trvání po sobě jdoucích srdečních cyklů, tak hodnot Heart Rate Variability) je jev, který

Viditelné elektromagnetické záření

Úvod do praxe stínového řečníka. Proces vytváření řeči

Senzorická fyziologie

Obecná psychologie Kurz pro zájemce o psychologii 16/3/2013. motivace a vůle

Algoritmy a struktury neuropočítačů ASN - P10

Grafika na počítači. Bc. Veronika Tomsová

Akustika. 3.1 Teorie - spektrum

Martin Novák Michal Novák Martin Werner Martina Nepimachová

Fyziologie sportovních disciplín

Analogové modulace. Podpora kvality výuky informačních a telekomunikačních technologií ITTEL CZ.2.17/3.1.00/36206

PaedDr. Lenka Dohnalová RNDr. Tomáš Fürst, PhD. Katedra Hv PdF UP Olomouc

Václav Syrový: Hudební akustika, Praha 2003, s. 7

Geometrická optika. Vnímání a měření barev. světlo určitého spektrálního složení vyvolá po dopadu na sítnici oka v mozku subjektivní barevný vjem

ADA Semestrální práce. Harmonické modelování signálů

5.Psychické procesy a stavy

AKUSTIKA. Barva tónu

Signál v čase a jeho spektrum

VY_32_INOVACE_FY.18 ZVUKOVÉ JEVY

Akustika pro posluchače HF JAMU

Vymezení pojmu komunikace

SIGNÁLY A LINEÁRNÍ SYSTÉMY

Zvuk a jeho vlastnosti

Emoce a jejich poruchy. Rozšiřující materiál k tématu emoce.

B2M31SYN SYNTÉZA AUDIO SIGNÁLŮ

9. PRINCIPY VÍCENÁSOBNÉHO VYUŽITÍ PŘENOSOVÝCH CEST

Přenos pasivního dvojbranu RC

Zvuk. 1. základní kmitání. 2. šíření zvuku

City, emoce a jejich vliv na výkonnost. PaedDr. Mgr. Hana Čechová

Akustika pro posluchače HF JAMU

Výchozí teorie barvy zvuku a jejich současná akustická interpretace

Membránové potenciály

ROZPOZNÁNÍ TITULU GRAMOFONOVÉ DESKY PODLE KRÁTKÉ UKÁZKY

ÚČINKY ELEKTRICKÉHO PROUDU NA LIDSKÝ ORGANIZMUS

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

PSK1-5. Frekvenční modulace. Úvod. Vyšší odborná škola a Střední průmyslová škola, Božetěchova 3 Ing. Marek Nožka. Název školy: Vzdělávací oblast:

Neuronové časové řady (ANN-TS)

Mapování hluku v terénu (práce v terénu)

Taje lidského sluchu

Název materiálu: Emoce Autor materiálu: Mgr. Veronika Plecerová Datum vytvoření: Zařazení materiálu:

SIGNÁLY A LINEÁRNÍ SYSTÉMY

Tomáš Karel LS 2012/2013

Moderní multimediální elektronika (U3V)

Kvízové otázky Obecná ekonomie I. Teorie firmy

A2B31SMS 2. PŘEDNÁŠKA 9. října 2017 Číslicové signály

Synth challange 2016

1. Základy teorie přenosu informací

VY_32_INOVACE_E 15 03

VY_32_INOVACE_ENI_2.MA_05_Modulace a Modulátory

Přednáší Kontakt: Ing. Michal WEISZ,Ph. Ph.D. Experimentáln. michal.weisz.

Příloha č. 10 HUDEBNÍ VÝCHOVA

BAZÁLNÍ STIMULACE U NOVOROZENCŮ. Miluše Hurtová

Mechanické kmitání a vlnění

Zásady regulace - proudová, rychlostní, polohová smyčka

Reakce a adaptace oběhového systému na zátěž

Měření na nízkofrekvenčním zesilovači. Schéma zapojení:

Laboratorní úloha č. 8: Polykardiografie

veličin, deskriptivní statistika Ing. Michael Rost, Ph.D.

Správné držení těla a uvolnění

Jaký význam má kritický kmitočet vedení? - nejnižší kmitočet vlny, při kterém se vlna začíná šířit vedením.

Bezpečnostně právní akademie Brno. Vzdělávací oblast: První pomoc 1 Název školy: Bezpečnostně právní akademie Brno. s.r.o.

Středofrekvenční terapie (SF)

Komprese dat Obsah. Komprese videa. Radim Farana. Podklady pro výuku. Komprese videa a zvuku. Komprese MPEG. Komprese MP3.

Hudební intervaly základní pojmy

Emoce a škola. Jméno a Příjmení lektora Etická výchova, o.p.s. datum

Strategie ACE využívající virtuální elektrody v kochleárních implantátech Nucleus 24

Akustika. Teorie - slyšení. 5. Přednáška

MĚŘENÍ, TYPY VELIČIN a TYPY ŠKÁL

KONTROLNÍ A ŘÍDÍCÍ SOUSTAVY. kontrolu a řízení organismu zajišťují 2 soustavy: o nervová soustava o hormonální soustava

Míra vjemu flikru: flikr (blikání): pocit nestálého zrakového vnímání vyvolaný světelným podnětem, jehož jas nebo spektrální rozložení kolísá v čase

Snímání biologických signálů. A6M31LET Lékařská technika Zdeněk Horčík Katedra teorie obvodů

Světlo jako elektromagnetické záření

Maximání tepová rezerva - MTR

Akustika. Teorie - slyšení. 5. Přednáška

Psychologický přístup k agresivním nemocným

KTE/TEVS - Rychlá Fourierova transformace. Pavel Karban. Katedra teoretické elektrotechniky Fakulta elektrotechnická Západočeská univerzita v Plzni

pracovní list studenta RC obvody Měření kapacity kondenzátoru Vojtěch Beneš

Zvuk a sluch. Stručný popis toho, jak vnímáme zvuk a jak funguje náš sluchový systém

Zvuková karta. Zvuk a zvuková zařízení. Vývoj, typy, vlastnosti

Osnova. Idea ASK/FSK/PSK ASK Amplitudové... Strana 1 z 16. Celá obrazovka. Konec Základy radiotechniky

Problematika hluku z větrných elektráren. ČEZ Obnovitelné zdroje s.r.o.

Měření hlasitosti zvuku. Tematický celek: Zvuk. Úkol:

(VIII.) Časová a prostorová sumace u kosterního svalu. Fyziologický ústav LF MU, 2016 Jana Svačinová

Operační zesilovač (dále OZ)

Počítačové sítě. Lekce 5: Základy datových komunikací

13 Měření na sériovém rezonančním obvodu

Úvod do medicínské informatiky pro Bc. studium. 6. přednáška

Systém psychologických věd

Základy a aplikace digitálních. Katedra radioelektroniky (13137), blok B2, místnost 722

Posouzení pracovní zátěže dle doby jízdního výkonu u strojvedoucích metra

Transkript:

Analýza emocionální řeči neuronovými sítěmi Proč? Pomocí emocí zlepšit kvalitu syntetické řeči a zvýšit přirozenost Jak? Analýzou emocí na základě spektrálních vlastností řeči na základě hudební teorie kombinací obou přístupů Pomocí MLNN a SOM

Dělení emocí: syrová emoce socializovana emoce pasívní a aktivní emoce fyziologicke narušeni, šok, záchvat chování a chronická forma nějakého stavu postoj Akustické rysy spojené s emocemi Velikost, rozsah a tvar obálky základni hlasivkové frekvence f0. Úroveň hlasové energie a distribuce energie na jednotlivých frekvencich. Frekvence, velikost a tvar obálky řečových formantů, které mají vliv při artikulaci. Kadence, která udává informaci o rychlosti promluvy.

Radost Reakce na zisk či úspěch, má silný sociálni kontext. Je vyvolána různými druhy podnětů a dosahuje různých stupňů intenzity od spokojenosti po štěstí. Fyziologicky je provázena zrychlováním srdeční činnosti i dýchání, zvyšováním krevního tlaku a teploty, rozšiřováním krevních vlásečnic (objevuje se červenání).

Nuda Reakce nervového systému na nedostatek fyzické nebo mentální aktivity. Intenzita této emoce záleží na vnějším prostředí a na době trvání této emoce. Vyznačuje se ztrátou zájmu. Fyziologicky se projevuje zpomalením srdečního tepu, poklesem krevního tlaku a zvýšeným sliněním.

Smutek Je to reakce na neúspěch či ztrátu. Intenzita pociťovaného smutku závisí na významu neúspěchu či ztráty. Je to utlumující cit, provázený inaktivitou a ztrátou zajmů. Fyziologické projevy jsou podobné jako u fyzické bolesti, dochází ke zpomaleni srdeční činnosti a ke změnám v rytmu dechu.

Vztek Stejně jako zlost, hněv, zuřivost, je to emocionální reakci na nějakou překážku. Aktivizuje se a zvyšuje fyzická síla objektu. Původně byl vztek spojen s agresí, tj. s obrannou reakcí a sociálnim postojem nepřátelství. Fyziologicky je vztek provázen zvýšeným svalovým napětím a zvýšenou motorikou, zrychluje se frekvence dechu a tep srdce, zvyšuje se krevní tlak, snižuje se pohyb střev a sekrece žaludečních šťáv.

Citové a volní postoje mluvčího spoluvytváří tzv. barva hlasu řekl smutně, vesele, nadšeně, rozčileně, naléhavě Emoce se vyjadřují také tempem řeči - mimořádně rychlé nebo pomalé Tvorba databáze promluv Nahravání promluv v profesionálním studiu, namluvili divadelní herci Jé. Má? Nevím. Vidíš? Povídej! Poezie. To mi nevadí. Neumím to vysvětlit. To bude světový rekord. Jak se Ti to líbí? Podívej se na nebe! Až přijdeš uvidíš.

Formát wav, vzorkovací kmitočet 44,1 khz, 24 bittů Jednotlivé věty byly namluveny 4 emocemi v 10ti opakováních Převzorkováno na 16 bittů Subjektivní poslechové testy pro ověření věrohodnosti vyjádřené emoce. Celkem 720 vzorků emocí - 360 jednoslovních + 360 víceslovných

Experimenty Spoftware: Matlab a NN Toolbox SOMToolbox Emoce: 1- hněv, 2- nuda, 3- radost 4- smutek Časova oblast Aritmetický průměr absolutní hodnoty Směrodatná odchylka Maximum Minimum Frekvenční oblast Základní hlasivková frekvence Frekvence 1. - 4. formantu vstupy do UNS

Princip hudební teorie tónovou příbuznost f0 Harmonická řada tónů je percepčně je vnímána jako jediný tón o výšce x Amplituda vyšších harmonických obvykle klesá s jejich rostoucím indexem, ale i když je amplituda f0 nižší, případně nulová, je stále jednoznačně percepčně vnímána jako tentýž tón. Původní výška budícího tónu harmonické řady je ve zbytku frekvenčního pásma kódována frekvenčním rozdílem po sobě jdoucích harmonických, který je vždy roven hodnotě x.tento jev vysvětluje teorie rozdílových a kombinačních tónů.

Rozdílové a kombinační tóny - vysvětlení Při výrobě varhan pro realizaci nejhlubších tónů. Píšťaly by byly příliš veliké (i drahé). Proto se vyrobí dvě píšťaly menší produkující složené tóny o základních frekvencích 2x a 3x, kde x je frekvenční hodnota požadovaného tónu. Je dodržen poměr harmonických f3 a f2 (=1,5) fiktivního tónu x, jejich rozdíl je roven jeho frekvenci. Pokud zní dva tóny o frekvencích a a b, vnímá člověk především tóny rozdílové o kmitočtu f = a -b, a tóny kombinační (také součtové) o f = a + b Je vnímána příbuznost a příslušnost libovolných dvou (i více) tónů k jejich základu, ať tóny znějí současně nebo postupně.

Z řeči jsou extrahovány f0 a formanty Je definován hudební interval - poměr frekvence n-tého tonu ku frekvenci tónu, od kterého počítáme interval. Kvinta je poměr frekvence pátého tónu ku frekvenci prvního tónu : 1.498. Kvintový kruh Kvintový kruh vyjadřuje vlastnost, že příbuznost s rostoucím n nejdříve klesá, nejmenší hodnoty nabývá pro k7, pak znovu roste, kvintovými kroky se blíží k členu k13, který je s výchozím tónem o1 = k1 v oktávovém poměru (příbuznosti) jako člen řady o8.

Charakter kvintové i oktávové příbuznosti Oktávová příbuznost zdůrazněna stejnou barvou. Kvintová je respektována blízkostí odstínů. Čísla u tónů označují pořadí v chromatické stupnici. Vyjdeme z bodu 1 do bodu 2 ----- dostaví se pocit negativní emoce (barvy nejsou příbuzné = vzdálená kvintová příbuznost). Pokud budeme pokračovat do bodu 3, vystřídá záporný vjem pocit pozitivní emoce dané blízkou kvintovou příbuzností (blízký barevný odstín) s výchozím bodem.

Úspěšná klasifikace emocí: 74% (MLNN) QE / TE QE / TE 0.274 / 0.014 0.275 / 0.017 (SSOM) 1 word sentence multiword sentence QE kvantizační chyba TE topografická chyba Porovnání se zahraničními výsledky: Úspěšná klasifikace 54-64% standardní klasifikátory 81 % ANN korejština tónový jazyk

U matice, KSOM Hněv Smutek Radost Nuda

Matice záměn pro jednoslovné věty parametry hudební Teorie MLNN 29-55-4 Trainscg, sigmoida Trénování: 216 vzorků Test: 72 vzorků Validace: 72 vzorků

Matice záměn pro víceslovné věty Hudební teorie MLNN

Výsledky pro MLNN: Metoda úspěšnost 1-slab. vice-slab I 88.7 % 77.8 % II 70.4 % 65.3 % III 85.9 % 84.7 %