KLASIFIKACE AKUSTICKÝCH SIGNÁLŮ CLASSIFICATION OF ACOUSTIC SIGNALS

Rozměr: px
Začít zobrazení ze stránky:

Download "KLASIFIKACE AKUSTICKÝCH SIGNÁLŮ CLASSIFICATION OF ACOUSTIC SIGNALS"

Transkript

1 VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY FAKULTA ELEKTROTECHNIKY A KOMUNIKAČNÍCH TECHNOLOGIÍ ÚSTAV TELEKOMUNIKACÍ FACULTY OF ELECTRICAL ENGINEERING AND COMMUNICATION DEPARTMENT OF TELECOMUNICATION KLASIFIKACE AKUSTICKÝCH SIGNÁLŮ CLASSIFICATION OF ACOUSTIC SIGNALS BAKALÁŘSKÁ PRÁCE BACHELOR S THESIS AUTOR PRÁCE AUTHOR VEDOUCÍ PRÁCE SUPERVISOR ALEŠ POSPÍŠIL ING. HICHAM ATASSI BRNO 2009

2 VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ Fakulta elektrotechniky a komunikačních technologií Ústav telekomunikací Bakalářská práce bakalářský studijní obor Teleinformatika Student: Aleš Pospíšil ID: Ročník: 3 Akademický rok: 2008/2009 NÁZEV TÉMATU: Klasifikace akustických signálů POKYNY PRO VYPRACOVÁNÍ: Prozkoumejte problematiku číslicového zpracování akustických signálů. Zaměřte se na Metody extrahování příznaků a metody klasifikace (například neuronové sítě ). Navrhněte metodu, která bude schopna seřadit vstupní signál do jedné z předem definovaných tříd. DOPORUČENÁ LITERATURA: [1] Smékal Z., Číslicové zpracování signálů. Skripta předmětu MCSI, Brno VUT [2] Zaplatílek K., Doňar B., Matlab-začínáme se signály, nakladatelství BEN [3) R. Duda, P. Hart, D. Stork, Pattern Classification, druhé vidání, Wiley, Termín zadání: Termín odevzdání: Vedoucí práce: Ing. Hicham Atassi prof. Ing. Kamil Vrba, CSc. Předseda oborové rady UPOZORNĚNÍ: Autor bakalářské práce nesmí při vytváření bakalářské práce porušit autorská práve třetích osob, zejména nesmí zasahovat nedovoleným způsobem do cizích autorských práv osobnostních a musí si být plně vědom následků porušení ustanovení 11 a následujících autorského zákona č. 121/2000 Sb., včetně možných trestněprávních důsledků vyplývajících z ustanovení 152 trestního zákona č. 140/1961 Sb.

3 ABSTRAKT Bakalářská práce se zaměřuje na problematiku automatické klasifikace hudebních žánrů. Nejprve je hodnocen současný stav řešení problému s odkazem na již vytvořené studie a získané poznatky jsou využity k vlastní práci. Předmětem řešení problému je shrnutí použitelných hudebních příznaků a také klasifikačních metod jako neuronové sítě a k- nejbližší soused. Vybrané klasifikační třídy jsou vážná hudba, elektro, jazz a rock. Výsledkem bakalářské práce je systém pro automatické rozpoznání hudebních žánrů, který bude použitelný a uživatelsky přístupný. Dosažené rozpoznavací výsledky do jisté míry respektují schopnosti lidského organismu právě hudební žánry rozpoznat. KLÍČOVÁ SLOVA Klasifikace, hudební žánr, neuronová síť, k-nn, SVM, HMM, GMM, extrakce, hudební příznak, akustický signál ABSTRACT Bachelor s thesis is focused on automatic music genre classification. First part of work evaluates present situation and refer to published studies. Gained knowledge from there is applied in this work. In terms of finding solution for problem the work summarize and describe suitable music features and classification techniques like neural networks and k-nearest neighbor. Four selected classification classes were classical, electro, jazz and rock music. Result of work is user-friendly system that provides automatic music genre recognition. Achieved classification performance is more less comparable to human music genres recognition. KEYWORDS Classification, music genre, neural network, k-nn, SVM, HMM, GMM, extraction, music feature, acoustic signal

4 POSPÍŠIL A. Klasifikace akustických signálů. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. Ústav telekomunikací, s., 2 s. příloh. Vedoucí práce byl Ing. Hicham Atassi.

5 PROHLÁŠENÍ Prohlašuji, že svou bakalářskou práci na téma KLASIFIKACE AKUSTICKÝCH SIG- NÁLŮ jsem vypracoval samostatně pod vedením vedoucího bakalářské práce a s použitím odborné literatury a dalších informačních zdrojů, které jsou všechny citovány v práci a uvedeny v seznamu literatury na konci práce. Jako autor uvedené bakalářské práce dále prohlašuji, že v souvislosti s vytvořením této bakalářské práce jsem neporušil autorská práva třetích osob, zejména jsem nezasáhl nedovoleným způsobem do cizích autorských práv osobnostních a jsem si plně vědom následků porušení ustanovení 11 a následujících autorského zákona č. 121/2000 Sb., včetně možných trestněprávních důsledků vyplývajících z ustanovení 152 trestního zákona č. 140/1961 Sb. V Brně dne (podpis autora)

6 PODĚKOVÁNÍ Rád bych poděkoval vedoucímu bakalářské práce, Ing. Hichamu Atassimu, za odborné konzultace, připomínky a náměty k řešení bakalářské práce a za ochotu a trpělivý přístup. Dále bych chtěl poděkovat své rodině, která mě ve studiu nepřetržitě podporuje.

7 OBSAH Úvod 11 1 Rozpoznávání hudebních žánrů Hudební žánr Rozpoznávání hudby člověkem Schématický model Publikované práce Extrakce hudebních příznaků Kategorie příznaků Popis použitých příznaků Kmitočtové spektrum Spektrální příznaky Melovské kepstrální koeficienty Počet průchodů nulou Krátkodobá energie Výběr vhodných příznaků Míra geometrické oddělitelnosti Funkce rankfeatures Klasifikace Úvod do problematiky Bayesovská teorie rozhodování Použité metody Umělé neuronové sítě k-nejbližší soused Další metody Algoritmy podpůrných vektorů Smíšený Gaussův model Skryté Markovovy modely Řešení bakalářské práce Databáze skladeb Zpracování dat Extrakce příznaků Výběr příznaků Výsledky klasifikace Neuronové sítě

8 4.3.2 k-nn Hodnocení Program Závěr 42 Literatura 44 Seznam symbolů, veličin a zkratek 46 Seznam příloh 47 A CD - bakalářská práce 48 B Hudební databáze 49

9 SEZNAM OBRÁZKŮ 1.1 Schématický model systému pro klasifikaci hudebních žánrů Spektogramy: a)vážná hudba, b)elektro, c)jazz a d)rock Ilustrace postupu výpočtu melovských kepstrálních koeficientů z přivedeného signálu Příklad graf melovských kepstrálních koeficientů zobrazujících vzorek hudby (rock) Porovnání ZCR pro periodický signál a) 0.8sin(x) a signál se šumem b) 0.8sin(x)+0.2sin(20x) Model neuronu Ukázka obecné dopředné sítě Ilustrace klasifikace pomocí metody k-nn Graf zobrazující hodnoty určené kvality příznaku pro jednotlivé příznaky Pracovní okno programu při zpracování testovací nahrávky rock.wav. 40

10 SEZNAM TABULEK 4.1 Přehled trénovací databáze hudebních žánrů Přehled testovací databáze hudebních žánrů Přehled použitých hudebních příznaků a skripty k jejich výpočtu Tabulka 5-ti nejkvalitnějších příznaků Přehled výsledků trénování neuronové sítě Tabulka úspěšností rozpoznání s použitím neuronové sítě a délky okna 10 ms Tabulka úspěšností rozpoznání s použitím neuronové sítě a délky okna 50 ms Tabulka úspěšností rozpoznání s použitím neuronové sítě a délky okna 100 ms Tabulka úspěšností rozpoznání s použitím neuronové sítě a délky okna 200 ms Tabulka zobrazující matici přiřazení hudebních žánrů s použitím neuronové sítě Tabulka zobrazující úspěšnost rozpoznávání pomocí neuronové sítě pro 5 nejlepších příznaků Tabulka úspěšností rozpoznání s použitím k-nn a délky okna 10 ms pro k=3,4,5,6, Tabulka úspěšností rozpoznání s použitím k-nn a délky okna 50 ms pro k=3,4,5,6, Tabulka úspěšností rozpoznání s použitím k-nn a délky okna 100 ms pro k=3,4,5,6, Tabulka úspěšností rozpoznání s použitím k-nn a délky okna 200 ms pro k=3,4,5,6, Tabulka zobrazující matici přiřazení hudebních žánrů s použitím k-nn Tabulka zobrazující úspěšnost rozpoznávání pomocí k-nn pro 5 nejlepších příznaků

11 ÚVOD Tématem bakalářské práce je klasifikace akustických signálů. Toto téma je úzce spjato se samotným číslicovým zpracováním akustických signálů, které má v současné době široké využití v oblastech zpracování řeči a hudby. Témata jako rozpoznávání věku a pohlaví řečníka, určení emocí člověka, stanovení národnosti řečníka nebo rozpoznání hudebního žánru jsou velmi aktuální. Právě poslední jmenované téma, klasifikaci hudebních žánrů, jsem si vybral jako zaměření své bakalářské práce. Hudba je nezbytnou součástí naší existence už od počátku bytí a v moderní době se její význam určitě nesnížil ba naopak. Hudba nás každodenně ovlivňuje při našich činnostech, přičemž jedním z nejdůležitějších faktorů, který rozděluje typy hudby je její žánr. Hudební žánry jsou třídy vytvořené lidmi k popisu hudebních skladeb. Skladby zařazené do jednoho hudebního žánru mají společné charakteristiky, které jsou většinou spojeny s použitými hudebními nástroji, rytmem skladby a jejím harmonickým obsahem. Pro znalce je schopnost rozeznat hudební žánr otázka několika sekund. Lidský mozek je schopen roztřídit poslouchané vzory a dále je zpracovávat. V současném elektronickém světě se počet multimediálních dat stále zvyšuje a obliba jejich využívání každoročně roste, ale neexistuje machanismus, který by je dokázal 100% automaticky roztřídit dle zadaných kritérií. Využívá se možnost přidání dodatečných dat, které vzorek správně zařadí. Tato činnost je ovšem manuální a proto také dosti časově náročná. Pro velký objem multimediálních dat, které v součastnosti například internet nabízí, by bylo velice užitečné vytvořit systém, který s dostatečnou přesností jednotlivé skladby dle žánrů roztřídí. Bakalářská práce si klade za cíl vytvořit ucelený pohled na problematiku automatické klasifikace hudebních žánrů. Zhodnotit současný stav řešení problému s dostatečného množství studií a využít dosažených závěrů a poznatků k vlastní práci. Předmětem řešení problému je shrnutí použitelných hudebních příznaků a také klasifikačních metod vhodných k potřebným účelům. Vybrané klasifikační třídy jsou vážná hudba, elektro, jazz a rock. Výsledkem bakalářské práce je systém pro automatické rozpoznání hudebních žánrů, který bude použitelný a uživatelsky přístupný. Dosažené rozpoznavací výsledky by měly respektovat schopnosti lidského organismu právě hudební žánry rozpoznat. 11

12 1 ROZPOZNÁVÁNÍ HUDEBNÍCH ŽÁNRŮ 1.1 Hudební žánr Termín hudební žánr představuje nejrozšířenější, ale také nejednotné a nejobtížněji definovatelné rozdělení hudby podle jejích formálních a obsahových charakteristik. Je tedy širším členěním než hudební směr či styl. Samotný výraz žánr (anglicky genre) pochází z latinského slova genus, které znamená druh nebo třídu. Celkově je pro hudební skladby velmi těžké definovat jednotlivé žánry, protože 1. ve všech dochází k přesahům do jiné kategorie, proto užíváme spíše zažitých a praktikovaných než pregnantně stanovených jednotek, 2. rozdělení je poplatné době, z čehož plyne jeho nerovnoměrnost, 3. žánry jsou navíc chápány jinak jak v různých kulturách, tak jazykově. Např. označení klasická hudba v anglosaském prostředí proti vážná hudba v českém prostředí - čeština chápe hudbu klasickou spíše jako tradiční období vážné hudby; dalším příkladem je např. populární hudba, která v americké terminologii zahrnuje např. rock a jeho styly, country, folk atd., v Česku je však tradicí, že jsou odděleny, protože slovo populární má do jisté míry pejorativní nádech - to, co je v Česku populární hudbou, je v USA popem, tedy v jejich chápání komerční populární hudbou [7]. 1.2 Rozpoznávání hudby člověkem Pro nalezení uspokojivého řešení problému je nutno vědět jak samotný člověk hudbu vnímá a dokáže ji rozpoznat. Samotné zpracování zvukového signálu lidským uchem je založeno na frekvenční analýze, přičemž mozek dostává informace o zastoupení jednotlivých frekvencí ve slyšeném zvuku. Matematicky provedená frekvenční analýza má však na výstupu spektrum s lineární frekvenční osou. To neodpovídá lidskému slyšení, které je logaritmické, tudíž má v nižších frekvencích lepší rozlišení a směrem k vyšším frekvencím rozlišení klesá. Všechny systémy musí s tímto poznatkem počítat a najít vhodné řešení [3]. Schopností lidí rozlišit jednotlivé hudební žánry se zabývá studie pánů R.O. Gjerdigena and D. Perrota. Pro výzkum použili celkem 10 hudebních žánrů, konkrétně blues, vážnou hudbu, country, dance, jazz, latin, pop, R&B, rap a rock. Celková data obsahovala 8 skladeb každého žánru. Z každé skladby bylo náhodně vybráno 5 vzorků o délkách 3000 ms, 475 ms, 400 ms, 325 ms a 250 ms. V experimentu bylo použito celkem 52 vyskoškolských studentů, kterým byly náhodně pouštěny jednotlivé 12

13 vzorky a jejich úkolem bylo vzorek zařadit do jedné z tříd. Úspěšnost rozpoznání dosahovala pro 3000 ms přibližně 70% vzhledem k oficiálnímu žánru hudby dle nakladatelství. Pro 250 ms dosahovala úspěšnost okolo 40%. Dosažené výsledky byly nad očekávání dobré a hodnoty úspěšností pro jednotlivé délky vzorků by mohly být využity při řešení problému automatické klasifikace hudebních žánrů [4]. 1.3 Schématický model Jak již bylo řečeno, rozpoznávání hudebních žánrů je dáno klasifikací hudby do předem definovaných tříd. Cílem je proto vyvinou systém s následujícími parametry: Vstupem je hudební signál v digitální podobě. Výstupem je informace o zařazení vstupního signálu k jednomu definovanému hudebnímu žánru. Vytvoření černé skříňky, které bude generovat tento výstup je předmětem výzkumu v oblasti rozpoznávání hudebních žánrů. Obr. 1.1: Schématický model systému pro klasifikaci hudebních žánrů Při zpracovávání komplexního problému jakým je téma bakalářské práce je snahou rozložit jej na problémy parciální. Rozpoznání hudebních žánrů může být chápáno jako problematika spadající pod rozpoznávání vzoru a jako taková vyžaduje 2 základní kroky řešení: 1. Extrakce hudebních příznaků 2. Klasifikace Cílem prvního kroku, extrakce hudebních přiznaků, je získání potřebné informace ze vstupních dat. Extrakce hudebních příznaků je detailně probírána v kapitole 2. Druhým krokem je nalezení vhodných kombinací hodnot hudebních příznaků, které kvalitně popisují jednotlivé hudební žánry. Tato problematika je popsána v rámci kapitoly 3. Jednotlivé kroky mohou být jednoznačné odděleny, přičemž výstup z extrakce hudebních příznaků složí jako vstup do procesu klasifikace. Takovýmto subsystémem můžeme nahradit zmiňovanou černou skříňku a výsledek je znázorněn na obrázku 1.1. Takto může být prezentován systém pro rozpoznávání hudebních žánrů v jeho jednoduché podobě. 13

14 1.4 Publikované práce Jak již bylo uvedeno, odvětví automatického rozpoznávání hudebních žánrů řeší v zásadě 2 základní problémy: extrakci hudebních přiznaků a klasifikační metody. Při zkoumání již vytvořených prací a studií jsem se právě na tyto 2 oblasti zaměřil. Další oblastí, ve které se budu odvolávat na čerpané informace bude tvorba databáze jednotlivých žánrů hudby. Její kvalita, rozsah a paramatery hrají důležitou roli v celkové tvorbě systému. Informace byly čerpány převážně z příspěvků publikovaných na odborných konferencích a uveřejněny na jejichž přehled je uveden v seznamu použité literatury. Celkem bylo nastudováno 16 příspěvků z konferencí a 1 diplomová práce. Byl vytvořen seznam hudebních příznaků a typů klasifikačních metod, které byly v pracích použity a tím vznikl jakýsi statistický přehled řešení problematiky, který pomohl v práci na řešení bakalářské práce. Konkrétně bych chtěl jmenovat George Tzanetakise, který se rozpoznávání hudebních žánrů dlouhodobě věnuje a ve svých pracích [6] [14] [16] předkládá základní informace o problematice a zároveň nastiňuje aktuální způsob řešení. Navíc vytvořil otevřený program MARSYAS [20], který slouží k získávání důležitých informací z hudebních nahrávek a je využitelný při řešení problematiky extrakce hudebních příznaků. Dále se problematice věnují autoři Tao Li [11] [13] nebo Geoffroy Peeters [5] a další. Obecně je tématu věnována značná pozornost, ale nalezení relevantních materiálů v češtině nebo od českých autorů je obtížné nebo přímo nemožné. 14

15 2 EXTRAKCE HUDEBNÍCH PŘÍZNAKŮ Kapitola podává detailní přehled o možných kategoriích a typech hudebních příznaků, které již byly použity v předešlých pracích. Dále se zabývá výběrem vhodných hudebních příznaků pro úspěšnou a efektivní klasifikaci a představuje příznaky použité při řešení bakalářské práce. 2.1 Kategorie příznaků Nejlepší přehled a nahlédnutí do problematiky nabízí práce Geoffroye Peeterse [5], který v ní uvádí přehled audio příznaků vhodných pro popis a zpracování zvuku. Audio příznaky jsou rozděleny do 6ti základních kategorií. Tvar časové obálky - (Temporal shape) Příznaky vypočtené přímo z časového průběhu signálu nebo energie signálu. Příkladem je doba náběhu, časový nárůst nebo pokles a efektivní doba trvání. Časové příznaky - (Temporal features) Mezi časové příznaky patří autokorelační koeficienty a počet průchodů nulou. Energetické příznaky - (Energy features) Energetickými příznaky se rozumí příznaky odkazující se na různé energetické vlastnosti signálu. Příkladem je celková energie. Spektrální příznaky - (Spectral features) Příznaky jsou vypočtené ze signálu pomocí krátkodobé Fourierovy transformace (STFT). Příkladem je spektrální těžiště, spektrální proměnlivost a melovské kepstrální koeficienty. Harmonické příznaky - (Harmonic features) Příznaky jsou vypočtené ze sinusového harmonického modelu signálu. Příkladem je poměr harmonické části a šumu nebo harmonická odchylka. Příznaky vnímatelnosti (Perceptual features) Příznaky vypočtené s použitím modelu lidského slyšení. Příkladem je relativní hlasitost. Pro účely rozpoznávání hudebních žánrů je vhodné uvažovat ještě další dvě kategorie, které jsou popsány Georgem Tzanetakisem [6]. Rytmické příznaky (Rytmic features) Příznaky jsou vypočtené ze signálu pomocí vlnkové transformace. Příkladem je relativní síla nejvýraznějšího beatu nebo suma celého histogramu. 15

16 Příznaky základního tónu (Pitch content features) Příznaky jsou vypočtené na základě mnohonásobné techniky detekce základního tónu. 2.2 Popis použitých příznaků Prvotní výběr příznaků byl vytvořen na základě informací získaných z prací mapujících danou problematiku. Selekce bere v úvahu účinnost použití příznaku a náročnost jeho implementace do systému. Popisované příznaky jsou jedny ze základních a nejčastěji používaných pro rozpoznávání hudebních žánrů Kmitočtové spektrum Rozložení signálu na harmonické složky lze provést s využitím Fourierovy transformace. K podobnému procesu zpracování signálu dochází ve sluchovém ústrojí lidí a ostatních obratlovců, což ukazuje, že spektrální kompozice signálu je opravdu důležitým nositelem informace. Kmitočtové spektrum je tedy velmi důležitým příznakem v oblasti klasifikace hudebních žánrů a je od něj odvozeno mnoho dalších příznaků [3]. Pro zobrazení informace o kmitočtovém spektru signálu se využívá spektogram. Spektogram je graf zobrazující změnu úrovně spektrálních složek v závislosti na čase. Osa x zobrazuje narůstající čas t zatímco osa x zobrazuje frekvenci f (nízké frekvence nahoře). Na obrázku 2.1 je možné porovnat spektogramy pro odlišné hudební žánry. Byly použity vzorky o délce 10 s vzorkované frekvencí Hz Spektrální příznaky Spektrální těžiště (Spectral centroid) Spektrální těžiště je získáno z modulového spektra a je často spojováno s teorií spektrálního jasu. Spektrální těžiště vypočteme ze vztahu C = Kk=1 M[k].k Kk=1 M[k], (2.1) kde M[k] je hodnota modulu k-té složky spektra, K je celkový počet bodů spektra a k je index bodu spektra. 16

17 a) b) f [Hz] f [Hz] t [s] t [s] c) d) f [Hz] f [Hz] t [s] t [s] Obr. 2.1: Spektogramy: a)vážná hudba, b)elektro, c)jazz a d)rock. Spektrální entropie (Spectral entropy) Spektrální entropii získáme z tvaru modulového spektra a představuje míru neuspořádanosti zkoumaného systému. Výpočet je definován jako N H = M[k].log 2 M[k]. (2.2) n=1 Spektrální proměnlivost (Spectral flux) Spektrální proměnlivost udává míru změny spektrálního tvaru mezi sousedními okny a je definována vztahem K F i = (M[k] M[k 1]) 2. (2.3) k=1 Spektrální roll-off koeficient (Spectral roll-off) Spektrální roll-off koeficient určuje frekvenci, pro kterou je obvykle 95% energie signálu koncentrováno pod úrovní vyhraněnou touto frekvencí. Veličinu můžeme tedy chápat jako mezní frekvenci mezi harmonickým signálem a šumem. 17

18 Vztah je definován R M 2 Ni [k] = 0.95 M 2 [k], (2.4) 0 0 kde R značí frekvenci spektrálního koeficientu roll-off a N i značí Nyquistovu frekvenci, která je definována jako Ni = f vz 2, kde f vz značí vzorkovací kmitočet. (2.5) Melovské kepstrální koeficienty Zpracování akustických signálů pomocí melovských kepstrálních koeficientů (MFCC) je navrženo tak, aby do určité míry respektovalo nelinearitu vnímání zvuků lidským uchem. Melovské kepstrální koeficienty se snaží kompenzovat především nelinearitu vnímání frekvencí. Využívají se k tomu trojúhelníkové pásmové filtry s nelineárním rozložením frekvencí v tzv. melovské frekvenční škále, která je definována vztahem ( f m = 2595 log f ), (2.6) 700 kde f [Hz] je frekvence v lineární oblasti a f m [mel] je frekvence v nelineární melovské škále. Hlavní a nejčastější využití melovských kepstrálních koeficientů se dá nalézt v systémech pro rozpoznávání řeči [21], rozpoznávání řečníka analýzou jeho hlasu [22] a v neposlední řadě také při získávání informací ze zvukových nahrávek (např. třídění hudby dle žánru). Obr. 2.2: Ilustrace postupu výpočtu melovských kepstrálních koeficientů z přivedeného signálu Proces určování melovských kepstrálních koeficientů lze popsat v několika krocích následujícím postupem. V prvním kroku se na vstup systému přivádí akustický 18

19 signál a dochází k rozdělení signálu na menší segmenty o délce obvykle 10 až 30 ms [1]. Tyto hodnoty se vztahují pro zpracování řeči, pro zpracování hudby je potřeba nalézt trochu odlišný přístup a určit vhodnou délku segmentů. V dalším bloku dochází k výpočtu rychlé Fourierovy transformace (FFT), pomocí které se vypočte modulové spektrum analyzovaného signálu. Klíčovou částí celého procesu je následující melovská filtrace. Celý výpočetní algoritmus je tvořen bankou trojúhelníkových filtrů podél frekvenční osy s měřítkem v melovské škále. Volba počtu pásem banky filtrů je volena v závislosti na počtu a umístění kritických pásem a s přihlédnutím k vzorkovacímu kmitočtu a celkové šířce přenášeného pásma. Průchod signálu filtrem v podstatě znamená, že každý koeficient FFT je násoben odpovídajícím ziskem filtru a výsledky jsou pro dané filtry akumulovány. Dalším krokem je výpočet logaritmu z výstupů jednotlivých filtrů. Logaritmováním akumulovaných koeficientů je vkládán do procesu důležitý příznak kepstrální analýzy, který příznivě omezí dynamiku signálu (podobně jako u lidského ucha) a přináší další užitečné předpoklady pro další zpracování signálu. Posledním krokem v celém procesu je provedení zpětné rychlé Fourierovy transformace (IFFT)[1]. Celý proces určování melovských kepstrálních koeficientů je graficky znázorněn na obrázku MFCC Císlo vzorku 45 Obr. 2.3: Příklad graf melovských kepstrálních koeficientů zobrazujících vzorek hudby (rock) Počet průchodů nulou Počet průchodů nulou, anglicky zero-crossing rate (ZCR), je hodnota ukazující na počet průchodu signálu přes nulovou osu. Periodický zvuk má tendenci mít hodnotu 19

20 ZCR nízkou zatímco šum má hodnotu ZCR vysokou. Výpočty se provádi pro každý rámec vstupního signálu. ZCR je oblíbeným a často použitým příznakem v oblasti klasifikace audio signálů především díky rychlosti výpočtu. ZCR může být využitý v jako statistická míra spektrálních charakteristik při rozpoznávání hudby a mluveného slova. Dalším využitím je také možnost odlišení části řeči obsahující znělé a neznělé prvky. Znělé prvky mají významnější hodnotu ZCR a neznělé prvky naopak [3]. Výpočet ZCR je pro jeden segment dán Z = 1 N sign(x[n]) sign(x[n 1]), (2.7) N n=1 kde x[n] představuje vstupní segment, N počet vzorků segmentu a sign je funkce, která nabývá hodnoty 1 pro kladné parametry a hodnoty 0 pro parametry záporné. 0.8 a) 1 b) f(x) [ ] 0 f(x) [ ] t [s] t [s] Obr. 2.4: Porovnání ZCR pro periodický signál a) 0.8sin(x) a signál se šumem b) 0.8sin(x)+0.2sin(20x) Krátkodobá energie Krátkodobá energie (anglicky short time energy) audio signálu pro jeden segment je definován jako E = 1 N [x[n]] 2. (2.8) N n=1 Fukce krátkodobé energie zobrazuje časovou proměnu úrovní a tím podává informaci o variabilitě v časové oblasti. [3]. 2.3 Výběr vhodných příznaků V předešlých částech byly definovány příznaky, kterou mohou být ke klasifikaci použity. Jejich vhodnost pro řešení konkrétního problému ovšem není definována 20

21 a proto musí být určena určitá kritéria selekce. Využití předešlých prací v dané oblasti a jejich výsledků je také vhodným indikátorem využitelnosti a efektivity použití příznaků Míra geometrické oddělitelnosti V této metodě porovnáváme výskyt prvků jedné klasifikační třídy v blízkém okolí střední hodnoty a zároveň co největší odstup středních hodnot jednotlivých tříd. Výpočet míry geometrické oddělitelnosti Q(.)je dán Q(.) = S 2, 0 Q(.) 1. (2.9) S 2 + D2 Pokud koeficient x i vykazuje malé rozdíly v rámci své třídy a velké rozdíly v rámci ostatních tříd dosahuje míra geometrické oddělitelnosti Q(x i ) nízkých hodnot. Naopak při vysokých hodnotách je velký i rozptyl hodnot a tím je možnost využití příznaku nízká. Aritmetická střední hodnota S 2 se určí ze vztahu S 2 = 1 V V Sv, 2 (2.10) v=1 kde V je celkový počet tříd. Kvadrát rozptylu určíme vztahem S 2 v = (x µ v ) 2, (2.11) kde x představuje vektor příznaků a µ střední hodnotu. Aritmetickou střední hodnotu vzdálenosti vypočteme podle D 2 1 V V = D V (V 1) v,u. 2 (2.12) v=1 u=1 Kvadrát vzdáleností mezi středními hodnotami dvou tříd je D 2 v,u = (µ v µ u ) 2. (2.13) Porovnání hodnot geometrické oddělitelnosti pro všechny příznaky nám podá informaci o kvalitě daného příznaku a vhodnosti jeho použití [2]. 21

22 2.3.2 Funkce rankfeatures Tato implementovaná statistická funkce v prostředí MATLAB hodnotí klíčové příznaky dle kritérií rozdílnosti tříd. Volání funkce je dáno [IDX, Z] = rankfeatures(x, Group), kde X je maticí vstupních dat a funkce řadí příznaky v ní obsažené s použitím nezávislého hodnotícího měřítka pro binární klasifikaci. V matici X představují sloupce vektor příznaků daného vzorku a počet řad odpovídá původnímu počtu příznaků. Vstupní vektor Group obsahuje rozdělení vzorků do jednotlivých tříd, přičemž počet sloupců Group musí odpovídat počtu sloupců X a počet tříd musí být roven 2. Výstupem funkce jsou vektory IDX a Z. Vektor IDX představuje seznam odkazů na řádky X seřazené dle významnosti příznaků pro klasifikaci v rámci vybraných tříd a vektor Z nese informaci o absolutní hodnotě použitého měřítka. Nevýhodou funkce je absence možnosti určení kvality příznaku v rámci všech klasifikačních tříd a tím nutnost manuálního zpracování při počtu tříd vyšším než dvě [8]. 22

23 3 KLASIFIKACE Extrakce příznaků (kapitola 2) počítá vektory příznaků reprezentující data, které je potřeba klasifikovat. Tyto příznakové vektory potom slouží k přiřazení každého objektu do určité kategorie. Takto je popsána klasifikační část, která je druhým základním kamenem systému pro automatickou klasifikaci hudebních žánrů. Existuje mnoho klasifikačních technik, které mohou být určeny pro různé typy klasifikací při různých vstupních podmínkách. Cílem kapitoly je kromě úvodu do problematiky samotné také představit a popsat základní techniky klasifikace vhodné pro použití při klasifikaci hudebních žánrů a detailněji se zaměřit na techniky použité při řešení bakalářské práce. 3.1 Úvod do problematiky Klasifikace je jako taková podoborem teorie rozhodování. Takové tvrzení vychází z předpokladu, že každý pozorovaný vzor musí náležet do určité kategorie nebo třídy, která může být považována za model tohoto vzoru. Bez ohledu na odlišnosti mezi jednotlivými vzory existuje skupina příznaků, které jsou podobné ve vzorech stejné třídy a naopak rozdílné u odlišných tříd. Takové příznaku mohou být použity k rozhodnutí o příslušnosti ke třídě. Vezměme v úvahu klasifikaci hudebních žánrů. Hudba může být jakkoli komplexní a skladby jednoho žánru od sebe odlišné ve spoustě aspektů, ale člověk stejně dokáže jednotlivé žánry celkem jednoduše odlišit. Tento fakt podporuje tvrzení, že v každé skladbě, v každém kousku hudby existují elementární znaky společné pro kusy patřící do stejného žánru [3] Bayesovská teorie rozhodování Klasifikaci si můžeme představit jako rozhodnutí o příslušnosti daného klasifikovaného objektu k určité třídě. Takové rozhodnutí může být samozřejmě správné ale i špatné. V rámci klasifikace se tedy snažíme maximalizovat šanci správného rozhodnutí. Jedním z přístupu k dané problematice je Bayesovská teorie rozhodování, která kvantifikuje závislosti mezi možnými rozhodnutími s použitím stastistiky. V Bayesovské teorii rozhodování používámé základní proměnnou w, která je popsána určitou pravděpodobností a popisuje reálný stav objektu. V našem případě hudební žánry představují konečný počet c možných stavů w 1,..., w c. Známá apriorní pravděpodobnost P (w j ) popisuje známou znalost, kterou máme před vlastním zpracováním dat. Ukažme si na příkladu, kdy hudební kolekce se skládá z 35 jazzových CD a 15 metalových CD, přičemž každé obsahuje 10 písní. 23

24 Pokud označíme w 1 jako žánr jazzový a w 2 žánr metalový, potom známá pravděpodobnost náhodně vybrané písně bude náležet k jazzu je P (w 1 = 0, 7). Známá podmíněná pravděpodobnost p(x w j ) označuje pravděpodobnost příslušnosti vektoru příznaků x stavu w j. Při předpokladu, že známá apriorní pravděpodobnost P (w j ) i známá podmíněná pravděpodobnost p(x w j ) jsou pro j = 1,..., n známy a že hodnota x je určena, můžeme spočítat pravděpodobnost stavu w j daného x s požitím Bayesovského vzorce kde P (w j x) = p(x w j)p (w j ), (3.1) p(x) c p(x) = p(x w j )P (w j ). (3.2) j=1 P (w j x) je podmíněná (aposteriorní) pravděpodobnost a označuje pravděpodobnost, že objekt náleží stavu w j dané vektorem příznaků x. Kvůli minimalizaci možnosti chyby musí systém samožřejmě určit stav w j, jehož P (w j x) je nejvyšší. Tento proces je nazván Bayesovské rozhodovací pravidlo [3]. 3.2 Použité metody Umělé neuronové sítě Umělá neuroná síť vychází do jisté míry z biologické neuronové sítě, od které převzala zjednodušený matematický model. Z hlediska realizace spolu však nemají tyto sítě nic společného. Pod pojmem umělá neuronová síť si můžeme představit obecně nelineární, adabtabilní stroj se schopností učit se. Matematický model neuronu Základním prvkem umělé neuronové sítě je neuron, přičemž se tento název používá spíše z historických důvodů a jeho podobnost s biologickým modelem neuronu je značně vzdálená. Každý neuron má více vstupů, ale jen jeden výstup. Tento výstup ovšem může být přiveden zpět na vstup téhož neuronu nebo vstup jiných neuronů. Každý neuron vypočte na základě kombinace vstupů a vlastních parametrů (vah a prahů) hodnotu výstupu, kterou transformuje na základě aktivační funkce. 24

25 Vztah pro výpočet výstupních hodnot neuronu je ( N ) y = f w i x i θ, (3.3) i=1 přičemž x = [x 1, x 2,..., x N ] T je vstupní vektor, w = [w 1, w 2,..., w N ] T je vektor vah a θ udává hodnotu prahu neuronu. Funkce f(α) je aktivační funkcí neuronu a je zpravidla nelineární. Práh neuronu si můžeme představit jako nultý vstup neuronu x 0, jehož hodnota je rovna jedné, váha w 0 toho vstupu pak bude odpovídat právě prahu neuronu θ. Na základě této úvahy a úpravou výše zmíněného vztahu získáváme zjednodušenou rovnici y = f ( w T x ), (3.4) kde x = [1, x 1,..., x N ] T je vstupní vektor, w = [θ, w 1,..., w N ] T je vektor vah [10]. Grafické znázornění modelu neuronu je na obrázku 3.1. x 1 w 1 x 2 w 2 f(.) y x N w N Obr. 3.1: Model neuronu Topologie a druhy neuronových sítí Neuronové sítě lze dělit podle následujících kritérií [2]: 1. podle počtu vrstev: - jednovrstvá (např. Hopfieldova síť) - vícevrstvá (např. ART síť), 2. podle algoritmu učení: - s učitelem (např. síť s algoritmem Backpropagation) - bez učitele (např. Hopfieldova síť), 25

26 3. podle stylu učení na síť s učením: - deterministický (např. algoritmus Backpropagation) - stochastický (např. náhodné nastavení vah). Dopředné sítě Nejjednodušší realizací dopředné sítě představuje jednovrstvý perceptron, tvořený M paralelně pracujícími neurony, z kterých každý nezávisle vytváří transformaci vstupního vektoru podle svého vektoru vah. Obecně můžou sítě obsahovat libovolný počet neuroů, ale zvýšený počet použitých neuronů nedokáže pozitivně ovlivnit kvalitu výsledku, jelikož chybí možnost kombinace setřízení pomocí odlišných dělících přímek. Z tohoho důvodu se v praxi používají především vícevrstvé struktury. index vrstvy x 1 x 2 x N n=3 výstupní vrstva 2 1 w 1 3 M w N n=2 skryté vrstvy n=1 1 1 w w N x 1 x 2 x 3 x N vstupní uzly Obr. 3.2: Ukázka obecné dopředné sítě Nejčastěji používanou sítí je je síť dopředná, skládající se z následujících vstev: výstupní vrstva neuronů - nejvyšší vrstva sítě vrstva vstupních uzlů - nejnižší vrstva sítě skryté vrstvy - může jich být několik a nejsou zvenčí dosažitelné 26

27 Síť je úplně propojená, což znamená vzájemné propojení výstupů všech neuronů jedné vrstvy se vstupy všech neuronů následující vrstvy. Signály v síti tak postupují od vstupní vrstvy k výstupní jedním směrem [10]. Metoda zpětného šíření chyb Jedním z nejpoužívanšjších algoritmů pro učení a trénování neuronových sítí patří algoritmus zpětné šíření chyby (Back propagation). Tato metoda vychází ze snahy minimalizovat energii neuronové sítě, kde právě energie vyjadřuje míru neurčitosti sítě, tedy odchylku mezi skutečnou hodnotou a hodnotou z výstupu neuronové sítě pro zvolenou trénovací množinu. Trénovací množina je tvořena určitým počtem dvojic (x p, d p ), kde x p zastupuje vstupní vektor o rozměru N z trénovací množiny a d p odpovídá požadovanému výstupnímu vektoru. Každý krok trénování je založený na přivedení prvků vektoru x p na odpovídající vstup sítě a následné určení odlišnosti prvků výstupu sítě od prvků vektoru d p. Podle zjištěného rozdílu se upravují jednotlivé váhy neuronové sítě. Úprava vah může přitom být vykonána po každém kroku, na základě integrované informace po několika krocích nebo za celou epochu, přičemž za epochu považujeme výkonání trénovacího kroku s využitím všech dvojic trénovací množiny. Vzhledem k pomalé konvergenci vah k požadovanému stavu musí většinou proběhnout velké množství učebních epoch. V každém kroku trénování probíhá úprava vah takto: ukázání vektoru x p síti a zjištění její odezvy y p, výpočet chybového vektoru e p = d p y p, výpočet rozpočtených chyb jednotlivých neuronů zpětným šířením chyb, oprava vektoru vah každého jednotlivého neuronu lokálně podle δ-pravidla s využitím známé aktivace tohoto neuronu při ukázání x p síti. Vlastnosti neuronové sítě vhodně popisuje její výkonnost, která určuje do jaké míry se chování sítě blíží požadovanému chování. Jako parametr výkonnosti býva definována relativní početnost správného zařazení nebo průměrná kvadratická odchylka výsledků od správných hodnot [10] k-nejbližší soused Klasifikační metoda k-nejbližšího souseda, anglicky k-nearest neighbor (k-nn), patří mezi nejjednodušší ze všech metod strojového učení. Zkoumaný objekt je klasifikován na základě příslušnosti většiny jeho sousedů, takže je přiřazen ke třídě, ke které náleží 27

28 většina jeho sousedních objektů. Parametr k je kladným celým číslem, které může nabývat různých hodnot. Pokud k = 1, pak je objekt jednoduše přiřazen ke třídě jeho nejbližšího sousedního objektu. V rámci klasifikační problematiky je vhodnější volit k jako liché číslo, čímž je zabráněno možnosti patové situace se stejným počtem nejbližších sousedících objektů ze 2 nebo více různých tříd. Klasifikační proces je znázorněn na obrázku 3.3, kde je zkoumaný vzorek při k = 3 zařazen do třídy modrých hvězd, zatímco při k = 5 je převažující třída mezi sousedními vzorky červený čtverec.? Obr. 3.3: Ilustrace klasifikace pomocí metody k-nn Sousední objekty jsou získány z databáze objektů, u kterých je známo jejich zařazení v rámci tříd. Takováto databáze je pojmenována trénovací, přestože k opravdovému trénování vůbec nedochází. Pro správnou identifikaci sousedních objektů jsou objekty reprezentovány pozicí vektorů umístěných ve vícerozměrném prostoru. Pro zjištěni vzdálenosti zkoumaného objektu od jeho sousedů se používá několik způsobů měření, přičemž každá má své výhody a nevýhody a svou oblast použití. Euklidovská míra Kosinová míra Korelační míra Hammingova míra Trénovací fáze výpočetního algoritmu spočívá pouze v uchování vektoru příznaků a jednotlivých tříd trénovacích vzorů. V klasifikační fázi je zkoumaný vzorek prezentován vektorem příznaků v prostoru. Dále jsou vypočteny vzdálenosti mezi 28

29 vstupním vektorem a vektory trénovacími a jsou vybrány k-té nejbližší vzorky z trénovací sady. Existuje několik způsobů klasifikace nového vektoru do příslušné třídy, přičemž nejpoužívanější metoda spočívá v predikci nového vektoru k nejvýraznější třídě v rámci k-nn. Hlavní nevýhodou dané metody je inklinování k zařazení vektoru v rámci klasifikace ke třídě s nejčasteji se vyskytujícími vzorky. Řešením problému může být uvažování vzdálenosti každého k-nejbližšího souseda s klasifikovaným novým vektorem a predikce příslušnosti nového ke třídě založené na této vzdálenosti. Výběr vhodného parametru k by měl být volen na základě znalosti klasifikovaných dat. Obecně k s vyšší hodnotou redukuje efekt šumu při klasifikaci a na druhou stranu snižuje výraznost vymezení jednotlivých tříd. Nejvhodnější hodnotu k lze určit experimentálně nebo pomocí heuristických technik jakou je například křížová validace [9]. Princip klasifikační metody k-nn se zdá být vhodná ke klasifikaci hudebních žánrů, jelikož svou podstatou respektuje proces klasifikace u člověka. Stejně jako člověk klasifikátor k-nn nestaví závěry na základě znalosti rozložení dat, ale porovnává zkoumaná data s již známými informacemi a dle podobnosti přiřadí nejvhodnější třídu. Proto se tato metoda často označuje jako metoda učení dle příkladu [24]. 3.3 Další metody Další metody klasifikace lze použít k řešení problému klasifikace hudebních žánrů. Při zpracovávání tématu se vyskytly 3 nejvýrazněji zastoupené metody, které bych rád krátce rozebral. První z nich je metoda algoritmů podpůrných vektorů, která byla použita v pracích [11], [12], [13] a [14]. Druhou metodu, smíšený Gaussův model, aplikovali autoři v pracích [6], [12], [13]. Poslední probíranou metodou jsou skryté Markovovy modely, které jsou využity v práci [12] Algoritmy podpůrných vektorů Algoritmy podpůrných vektorů, anglicky Support vector machine (SVM), patří k alternativním a poměrně novým metodám, které tvoří určitou kategorii tzv. jádrových algoritmů (kernel machines). Tyto metody se snaží využít výhody poskytované efektivními algoritmy pro nalezení lineární hranice a zároveň jsou schopny representovat vysoce složité nelineární funkce. Jedním ze základních principů je převod daného původního vstupního prostoru do jiného, vícedimensionálního, kde již lze od sebe oddělit třídy lineárně. Pro ilustraci si představme v dvourozměrném prostoru dvě třídy, oddělené nelineární kružnicí. Přidáním další dimenze vznikne možnost prvků třídy uvnitř kružnice 29

30 přidat další souřadnici, která je posune např. nahoru podél nové osy, takže pro oddělení obou tříd již lze použít rovinou rovnoběžku.problémem je ale stále umístění dané lineární hranice, které by mělo být vedeno co nejefektivněji z hlediska klasifikace budoucích dat, které nejsou přímo obsaženy v trénovací množině [23] Smíšený Gaussův model Smíšený Gaussův model, anglicky Gaussian mixture model (GMM), je velice účinný nástroj pro statisktické modelování příznakového prostoru pomocí jedné, popř. více Gaussovských funkcí. Při zpracovávání existuje několik algoritmů pro odhad parametrů GMM a také jsou používány některé další speciální GMM modely. Nejčastější využití GMM je při zpracování řečového signálu [23] Skryté Markovovy modely Skryté Markovovy modely, anglicky hidden Markov models (HMM) jsou statistickým modelem založeným na Markovově procesu s neznámými parametry. Umožňuje algoritmicky klasifikovat vstupní data určitého typu. Pro každou třídu je nutné vytvořit vlastní samostatný model. Ve skrytém Markovovu modelu (HMM), nejsou narozdíl od klasického Markovova modelu stavy přímo přístupny, ale je viděna pouze závislost stavu na výstupu. Každý stav má svou vlastní pravděpodobnost rozložení v rámci možných výstupních tříd. Proto přináší sekvence znaků generovaná skrytým Markovovým modelem informaci o sekvenci možných tříd a nepřináší tak pouze jedno rozhodnutí [23]. HMM je mimo již zmiňované využití aplikován především v oblastech rozpoznávání vzoru, jakými jsou například rozpoznávání řeči, videa a obrazu. Pro jednodušší zpracování HMM byl vytvořen tzv. Hidden Markov Model Toolkit, který se zaměřuje právě na manipulaci s HMM v rámci zpracování řeči, ovšem jeho využití je mnohem širší. Více informací je k nalezení na oficiálním webu [15]. 30

31 4 ŘEŠENÍ BAKALÁŘSKÉ PRÁCE 4.1 Databáze skladeb Všechny disciplíny zabývající se klasifikací a rozpoznáváním vzoru musí řešit úkol najít nebo vytvořit kvalitní databázi. Pro různé disciplíny je tento úkol odlišně náročný, ovšem vždy je potřeba brát v úvahu různé aspekty. V rámci klasifikace hudebních žánrů není problém v dostupnosti, hudba je dostupná v jakékoliv podobě téměř kdekoliv, ale vzhledem k její různorodosti je nutné databázi pečlivě vybírat. V rámci studia dané problematiky jsem nenašel jasná kritéria pro kvalitu a kvantitu potřebné databáze, ale z hlediska trénování klasifikátorů je vhodná co největší trénovací množina, tedy co největší množství prvků v databázi. Jak již bylo v úvodu uvedeno, pro bakalářskou práci jsem pro klasifikaci zvolil čtyři hudební žánry: vážnou hudbu, elektro, jazz a rock. Základní údaje o trénovací databázi jsou uvedeny v tabulce 4.1. Pro každou databázi bylo vybráno 50 reprezentativních skladeb, které byly převedy z formátu mp3 do formátu wav. Výstupní wav soubory měly parametr: Hz, 16 bit, mono. Konverze formátu proběhla s využitím produktu společnosti Sony, Sound Forge 8.0. Tab. 4.1: Přehled trénovací databáze hudebních žánrů Hudební žánr Počet skladeb Délka Formát Vzorkovací kmitočet Vážná hudba 50 4h 12min 59s wav Hz Elektro 50 4h 23min 03s wav Hz Jazz 50 3h 04min 46s wav Hz Rock 50 3h 13min 30s wav Hz V rámci výběru vhodných skladeb daných žánrů jsem si stanovil cíl vystihnout žánr co nejlépe, ale vzhledem k množství podžánrů, které současná hudební scéna nabízí je tento úkol dosti obtížný. Příkladem může být hudební databáze na serveru které v kategorii rock nabízí přibližně dalších 200 podžánrů. I přesto jsem se pokusil dané žánry co nejlépe vystihnout. Pro kategorii rocku jsem vybral písně patřící k hard rocku (AC/DC, Motörhead), dále přes grunge (Nirvana) a indie rock (Franz Ferdinand, The killers) až po progressive rock (Muse). V rámci vážné hudby byly použity například skladby z období baroka (Bach, Vivaldi), z období klasicismu (Mozart, Beethoven) a z období novoromantismu (Dvořák, Smetana). Pro jazz byly vybrány písně Elly Fitzgerald, Luise Armstronga, Milese Davise a dalších. U elektrické hudby reprezentoval kategorii Drum n Bass High Contrast, kategorii rave a hardcore techno Prodigy a kategorii house skupina Faithless. Detailní seznam všech použitých skladeb je uveden v příloze A. 31

32 V kapitole 3 věnující se klasifikaci bylo definován požadavek odlišení databáze určené k trénování a k testování, proto bylo dle výše zmíněných vytvořena i databáze trénovací a její parametry jsou uvedeny v tabulce 4.2. Tab. 4.2: Přehled testovací databáze hudebních žánrů Hudební žánr Počet skladeb Délka Formát Vzorkovací kmitočet Vážná hudba 50 3h 45min 34s wav Hz Elektro 50 3h 35min 14s wav Hz Jazz 50 4h 04min 42s wav Hz Rock 50 3h 12min 26s wav Hz 4.2 Zpracování dat Veškeré zpracování použitých dat bylo provedeno v prostředí MATLAB (R2008a). Nejprve muselo dojít k převodu wav souborů do zpracovatelné podoby. Toto jsem provedl funkcí wavread(), která soubor převede na matici o rozměrech Y x X, kde Y značí délku souboru a N značí počet kanálů. V našem případě pracuji s mono signálem, takže N = 1. Zpracování celé skladby jako celku by nebylo efektivní a nepřineslo by patřičnou vypovídající hodnotu, proto je dalším krokem zpracování segmentace skladby. K tomu účelu jsem převzal skript, jehož funkce segmentace() má vstupní parametry: vstupní signál, délku okna a překryv. Překryv je použit především při zpracování řečových signálů a v našem případě ho není nutné použít, proto vkládáme hodnotu 0. Pro délku okna jsem zvolil na základě závěrů uvedených v kapitole 1.2 hodnotu větší než 3 s, rozhodl jsem se pro 4 s. Výstupem funkce je matice, jejíž sloupce představují segmenty skladby o požadované délce. Takováto matice je připravena k extrakci příznaků Extrakce příznaků Extrakci příznaků i přímo použitým příznakům se věnuje celá kapitola 2, tady proto poukáži na skripty 1 přímo použité k extrakci daných příznaků. Základní výběr příznaků byl přitom vytvořen na základě doporučení autorů předchozích prací mapujících problematiku klasifikace hudebních žánrů a efektivnosti a obtížnosti implementace. Seznam použitých příznaků a skriptů, jejichž kód je uveden v příloze, je uveden v tabulce Skripty pro extrakci hudebních příznaků byly převzaty z práce Theodorose Giannakopoulose Some Basic Audio Features. 32

33 Tab. 4.3: Přehled použitých hudebních příznaků a skripty k jejich výpočtu Název příznaku Skript výpočtu Označení Spektrální entropie Energy Entropy Bloc.m 1 Krátkodobá energie ShortTimeEnergy.m 2 Počet průchodů nulou zcr.m 3 Spektrální koeficient roll-off SpectralRollOff.m 4 Spektrální těžiště SpectralCentroid.m 5 Spektrální proměnlivost SpectralFlux.m 6 MFCC mfcc.m 7-28 Pro účely klasifikace bylo potřeba vytvořit trénovací matice. Z každé skladby bylo proto vybráno 10 segmenů, přičemž pro výběr byla skladba rozdělena na tři části. Z první části skladby byly vybrány 3 segmenty, z druhé části 4 a z poslední části opět 3 segmenty. Takovéto rozdělení mělo zaručit dostatečné zastoupení všech částí skladeb, což je důležité pro robustnost výsledného klasifikačního systému. Pro každý žánr bylo vypočteno celkem 500 vektorů příznaků a každý vektor příznaků obsahoval celkem 28 příznaků. Každý z výše zmíněných příznaků po jednom a navíc bylo použito celkem 22 melovských kepstrálních koeficientů. Pro všechny žánry tedy vznikla matice o rozměrech 28 x 2000, která představuje trénovací data pro použité klasifikátory (stejným způsobem byla vytvořena i testovací matice). Důležitým parametrem výpočtu příznaků je délka okna, v rámci bakalářské práce jsem se rozhodl použít 4 různé délky: 10 ms, 50 ms, 100 ms, 200 ms. Pro všechny tyto hodnoty byla vytvořena trénovací a testovací matice a v klasifikační části byly porovnané dosažené výsledky Výběr příznaků Pro zvýšení úspěšnosti klasifikace jsem učinil výběr příznaků dle kvality. K určení kvality příznaku jsem z metod uvedených v kapitole 2.3 použil funkci prostředí MATLAB rankfeatures(). Výsledky porovnání jsou zaznamenány v grafu 4.1 a pořadí pěti nejkvalitnějších příznaků je uvedeno v tabulce Výsledky klasifikace Úvod do problematiky klasifikace a popis klasifikačních metod je uveden v kapitole 3. Pro baklářskou práci jsem se rozhodl využít dva klasifikátory: neuronové sítě a k- Nearest neighbor. V první fázi byla použita celá trénovací matice, ve fázi druhé bylo 33

34 Tab. 4.4: Tabulka 5-ti nejkvalitnějších příznaků 1. Spektrální entropie 2. Spektrální těžiště MFCC 4. Spektrální koeficient roll-off 5. Spektrální proměnlivost Hodnota kvality příznaku Číslo příznaku Obr. 4.1: Graf zobrazující hodnoty určené kvality příznaku pro jednotlivé příznaky použita matice obsahující 5 nejkvalitnějších příznaků. Veškeré trénování, simulace, testování a výpočty probíhaly v prostředí MATLAB (R2008a) Neuronové sítě Pro práci s neuronovými sítěmi jsem v prostředí MATLAB využil implementovaného toolboxu: Neural Network Toolbox. S jeho použitím došlo k vytvoření neuronové sítě a k jejímu trénování. Základními parametry vytvořené neuronové sítě jsou: Typ neuronové sítě: dopředná síť se zpětným šířením chyby Počet vrstev: 2 (první vrstva 80 neuronů, druhá vrstva 4 neurony) Trénovací funkce: Levenberg-Marquardt Trénování neuronové sítě proběhlo s použitím trénovací matice, jejíž tvorba je popsána v předchozí části. Výsledky trénování jsou zaznačeny v tabulce 4.5, když 34

35 jejich výkonost je vyjádřena pomocí průměrné kvadratické odchylky, anglicky mean squared error (MSE). Tab. 4.5: Přehled výsledků trénování neuronové sítě. Délka okna MSE 10 ms e-2 50 ms e ms e ms e-2 Samotné testování probíhalo s využitím testovací matice a skriptů, které testovací činnost automatizovaly. Výsledky testování klasifikace hudebních žánrů jsou uvedeny pro okno 10 ms v tabulce 4.6, pro okno 50 ms v tabulce 4.7, pro okno 100 ms v tabulce 4.8 a pro okno 200 ms v tabulce 4.9. Pro délku okna 50 ms, jejiž rozpoznávací úspěšnost byla nejlepší (70,35%), byla vytvořená klasifikační matice, v angličtině známá pod pojmem confusion matrix, (tabulka 4.10), která dává informaci o správných i špatných zařazeních v rámci jednotlivých tříd. V rámci snahy zvýšit úspěšnost klasifikace jsem modifikoval trénovací a testovací matice dle výsledků výběru nejlepších příznaků uvedených v tabulce 4.4 a právě těchto pět příznaků použil. Byla použita délka okna 50 ms, která byla dle předchozích výsledků nejvhodnější, a výsledky klasifikace v takovémto nastavení jsou uvedeny v tabulce k-nn Klasifikace pomocí metody k-nearest neighbor jsem provedl s využitím funkce prostředí MATLAB knnclassify(), jejímž výstupem je přímo označení klasifikované třídy. Základními vstupními parametry jsou: klasifikovaná data, trénovací matice, klasifikátor trénovací matice a koeficient k. Testování proběhlo na všech délkách oken jako u neuronové sítě a z důvodu určení nejvýkonějšího nastavení byly testovány koeficienty k s hodnotou 3, 4, 5, 6 a 7. Výsledky rozpoznávání hudebních žánrů jsou pro délku okna 10 ms uvedeny v tabulce 4.12, pro okno 50 ms v tabulce 4.13, pro okno 100 ms v tabulce 4.14 a pro okno 200 ms v tabulce Pro délku okna 50 ms a koeficient k = 6, jejichž rozpoznávací úspěšnost byla nejlepší (67,1%), byla opět vytvořena klasifikační matice (tabulka 4.16). 35

36 Tab. 4.6: Tabulka úspěšností rozpoznání s použitím neuronové sítě a délky okna 10 ms VÁŽNÁ HUDBA ELEKTRO JAZZ ROCK Celkem Celkem vzorků Rozpoznáno vzorků Úspěšnost Tab. 4.7: Tabulka úspěšností rozpoznání s použitím neuronové sítě a délky okna 50 ms VÁŽNÁ HUDBA ELEKTRO JAZZ ROCK Celkem Celkem vzorků Rozpoznáno vzorků Úspěšnost Tab. 4.8: Tabulka úspěšností rozpoznání s použitím neuronové sítě a délky okna 100 ms VÁŽNÁ HUDBA ELEKTRO JAZZ ROCK Celkem Celkem vzorků Rozpoznáno vzorků Úspěšnost Tab. 4.9: Tabulka úspěšností rozpoznání s použitím neuronové sítě a délky okna 200 ms VÁŽNÁ HUDBA ELEKTRO JAZZ ROCK Celkem Celkem vzorků Rozpoznáno vzorků Úspěšnost Tab. 4.10: Tabulka zobrazující matici přiřazení hudebních žánrů s použitím neuronové sítě Vážná hudba Elektro Jazz Rock Vážná hudba Elektro Jazz Rock

37 Tab. 4.11: Tabulka zobrazující úspěšnost rozpoznávání pomocí neuronové sítě pro 5 nejlepších příznaků VÁŽNÁ HUDBA ELEKTRO JAZZ ROCK Celkem Celkem vzorků Rozpoznáno vzorků Úspěšnost Tab. 4.12: Tabulka úspěšností rozpoznání s použitím k-nn a délky okna 10 ms pro k=3,4,5,6,7 k VÁŽNÁ HUDBA ELEKTRO JAZZ ROCK Celkem Celkem vzorků Rozpoznáno vzorků Úspěšnost Rozpoznáno vzorků Úspěšnost Rozpoznáno vzorků Úspěšnost Rozpoznáno vzorků Úspěšnost Rozpoznáno vzorků Úspěšnost Tab. 4.13: Tabulka úspěšností rozpoznání s použitím k-nn a délky okna 50 ms pro k=3,4,5,6,7 k VÁŽNÁ HUDBA ELEKTRO JAZZ ROCK Celkem Celkem vzorků Rozpoznáno vzorků Úspěšnost Rozpoznáno vzorků Úspěšnost Rozpoznáno vzorků Úspěšnost Rozpoznáno vzorků Úspěšnost Rozpoznáno vzorků Úspěšnost

38 Tab. 4.14: Tabulka úspěšností rozpoznání s použitím k-nn a délky okna 100 ms pro k=3,4,5,6,7 k VÁŽNÁ HUDBA ELEKTRO JAZZ ROCK Celkem Celkem vzorků Rozpoznáno vzorků Úspěšnost Rozpoznáno vzorků Úspěšnost Rozpoznáno vzorků Úspěšnost Rozpoznáno vzorků Úspěšnost Rozpoznáno vzorků Úspěšnost Tab. 4.15: Tabulka úspěšností rozpoznání s použitím k-nn a délky okna 200 ms pro k=3,4,5,6,7 k VÁŽNÁ HUDBA ELEKTRO JAZZ ROCK Celkem Celkem vzorků Rozpoznáno vzorků Úspěšnost Rozpoznáno vzorků Úspěšnost Rozpoznáno vzorků Úspěšnost Rozpoznáno vzorků Úspěšnost Rozpoznáno vzorků Úspěšnost Tab. 4.16: Tabulka zobrazující matici přiřazení hudebních žánrů s použitím k-nn Vážná hudba Elektro Jazz Rock Vážná hudba Elektro Jazz Rock

39 Stejně jakou u neuronové sítě jsem v rámci snahy zvýšit úspěšnost klasifikace využil modifikované trénovací matice dle výsledků výběru nejlepších příznaků uvedených v tabulce 4.4. Byla použita délka okna 50 ms a hodnota koeficientu k = 6. Tyto hodnoty byly dle předchozích výsledků nejvhodnější a výsledky klasifikace v takovémto nastavení jsou uvedeny v tabulce Tab. 4.17: Tabulka zobrazující úspěšnost rozpoznávání pomocí k-nn pro 5 nejlepších příznaků k VÁŽNÁ HUDBA ELEKTRO JAZZ ROCK Celkem Celkem vzorků Rozpoznáno vzorků Úspěšnost Hodnocení Výsledky klasifikace hudebních žánrů byly různé v závislosti na nastavení vstupních parametrů. Pro neuronové sítě bylo dosaženo nejlepších výsledků při použití délky okna 50 ms, kdy výsledná úspěšnost dosahovala hodnoty 70,35%. Při použití k-nn bylo dosaženo nejlepšího výsledku s délkou okna 50 ms a koeficientem k = 6, kdy výsledná úspěšnost dosahovala hodnoty 67,1%. Zajímavým zjištěním byla nízká úspěšnost rozpoznání při použití vybraných nejkvalitnějších příznaků. V klasifikaci neuronovou sítí dosáhla úspěšnost pouze 56,5% a při použití k-nn dokonce jen 50,8%. Tento fakt nabízí 2 možné odůvodnění: prvním je zvolení špatné metody výběru příznaku, druhým může být nutnost použití více než 5ti příznaku, které dokáží v rámci klasifikace hudební žánry správně separovat. Dalším zájímavým zjištěním bylo v rámci použití metody k-nn, kdy bylo dosaženo největší úspěšnosti s použitím koeficientu k = 6, přičemž obecným doporučením je využití lichých koeficientů. Tento fakt byl ovšem proměnlivý v rámci změny délek oken a není proto tak prokazatelný. Při porovnání hodnot rozpoznaných hudebních žánrů bylo dosaženo nejnižších hodnot pro elektro a nejlépe byla rozeznána vážná hudba společně s rockem. Z tabulek 4.10 a 4.16 je zřejmé, že nejčastěji byla elektro hudba zařazena do kategorie rocku a to je asi hlavním problémem, jelikož oba žánry mají společné prvky a správně je od sebe odlišit je tedy dosti obtížné. 39

40 4.4 Program Výstupem bakalářské práce je program, který umožňuje uživateli klasifikovat vstupní wav soubor do 4 klasifikačních tříd. Grafické rozhraní bylo vytvořeno v prostředí MATLAB, s jehož funkcemi také program pracuje. Program respektuje výsledky testování uvedené v bakalářské práci a využívá je k co nejlepší výkonnosti klasifikace. Program nejprve přečte vybraný wav soubor a následně ho rozděluje na segmenty o délce 4 s. Dále vypočte vektor příznaků vybraného segmentu a klasifikuje ho dle uživatelem vybrané metody. Segment je na základě testování a výsledků práce [19] vybrán z prostřední části dané zvukové nahrávky. Takové nastavení dosahuje nejvyšší rozpoznávací úspěšnosti. Obr. 4.2: Pracovní okno programu při zpracování testovací nahrávky rock.wav. Práce s programem je velmi jednoduchá a pro uživatele spočívá ve dvou krocích: v prvním je nutno zvolit klasifikační metodu a ve druhém dojde k vybrání skladby určené ke klasifikaci. Vzhledem k tomu, že výpočetní skript není nijak optimalizván pro práci v reálném čase, je třeba na výsledek několik sekund počkat. Pracovní okno programu je znázorněno na obrázku 4.2. Pracovní plocha se skláda z tlačítka pro výběr skladby, pole grafu, ve kterém se zobrazuje spektrum dané nahrávky, selectu boxu pro výběr klasifikační metody a několika textových polí, které zobrazují doplňkové informace. Základní informací, kterou program získá, je rozpoznaný žánr 40

Kybernetika a umělá inteligence, cvičení 10/11

Kybernetika a umělá inteligence, cvičení 10/11 Kybernetika a umělá inteligence, cvičení 10/11 Program 1. seminární cvičení: základní typy klasifikátorů a jejich princip 2. počítačové cvičení: procvičení na problému rozpoznávání číslic... body za aktivitu

Více

Úloha - rozpoznávání číslic

Úloha - rozpoznávání číslic Úloha - rozpoznávání číslic Vojtěch Franc, Tomáš Pajdla a Tomáš Svoboda http://cmp.felk.cvut.cz 27. listopadu 26 Abstrakt Podpůrný text pro cvičení předmětu X33KUI. Vysvětluje tři způsoby rozpoznávání

Více

Algoritmy a struktury neuropočítačů ASN - P11

Algoritmy a struktury neuropočítačů ASN - P11 Aplikace UNS při rozpoznání obrazů Základní úloha segmentace obrazu rozdělení obrazu do několika významných oblastí klasifikační úloha, clusterová analýza target Metody Kohonenova metoda KSOM Kohonenova

Více

Klasifikace hudebních stylů

Klasifikace hudebních stylů Klasifikace hudebních stylů Martin Šimonovský (mys7@seznam.cz) Rozpoznávání hudby úloha z oblasti DSP klasifikace dle hudebních stylů

Více

Fiala P., Karhan P., Ptáček J. Oddělení lékařské fyziky a radiační ochrany Fakultní nemocnice Olomouc

Fiala P., Karhan P., Ptáček J. Oddělení lékařské fyziky a radiační ochrany Fakultní nemocnice Olomouc Neuronové sítě a možnosti jejich využití Fiala P., Karhan P., Ptáček J. Oddělení lékařské fyziky a radiační ochrany Fakultní nemocnice Olomouc 1. Biologický neuron Osnova 2. Neuronové sítě Umělý neuron

Více

1. Vlastnosti diskretních a číslicových metod zpracování signálů... 15

1. Vlastnosti diskretních a číslicových metod zpracování signálů... 15 Úvodní poznámky... 11 1. Vlastnosti diskretních a číslicových metod zpracování signálů... 15 1.1 Základní pojmy... 15 1.2 Aplikační oblasti a etapy zpracování signálů... 17 1.3 Klasifikace diskretních

Více

Algoritmy a struktury neuropočítačů ASN P9 SVM Support vector machines Support vector networks (Algoritmus podpůrných vektorů)

Algoritmy a struktury neuropočítačů ASN P9 SVM Support vector machines Support vector networks (Algoritmus podpůrných vektorů) Algoritmy a struktury neuropočítačů ASN P9 SVM Support vector machines Support vector networks (Algoritmus podpůrných vektorů) Autor: Vladimir Vapnik Vapnik, V. The Nature of Statistical Learning Theory.

Více

Úvod do zpracování signálů

Úvod do zpracování signálů 1 / 25 Úvod do zpracování signálů Karel Horák Rozvrh přednášky: 1. Spojitý a diskrétní signál. 2. Spektrum signálu. 3. Vzorkovací věta. 4. Konvoluce signálů. 5. Korelace signálů. 2 / 25 Úvod do zpracování

Více

Neuronové sítě v DPZ

Neuronové sítě v DPZ Univerzita J. E. Purkyně v Ústí nad Labem Fakulta životního prostředí Neuronové sítě v DPZ Seminární práce z předmětu Dálkový průzkum Země Vypracovali: Jan Lantora Rok: 2006 Zuzana Vašková Neuronové sítě

Více

Pokročilé operace s obrazem

Pokročilé operace s obrazem Získávání a analýza obrazové informace Pokročilé operace s obrazem Biofyzikální ústav Lékařské fakulty Masarykovy univerzity Brno prezentace je součástí projektu FRVŠ č.2487/2011 (BFÚ LF MU) Získávání

Více

Semestrální projekt. Vyhodnocení přesnosti sebelokalizace VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ. Fakulta elektrotechniky a komunikačních technologií

Semestrální projekt. Vyhodnocení přesnosti sebelokalizace VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ. Fakulta elektrotechniky a komunikačních technologií VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ Fakulta elektrotechniky a komunikačních technologií Semestrální projekt Vyhodnocení přesnosti sebelokalizace Vedoucí práce: Ing. Tomáš Jílek Vypracovali: Michaela Homzová,

Více

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Prostá regresní a korelační analýza 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Problematika závislosti V podstatě lze rozlišovat mezi závislostí nepodstatnou, čili náhodnou

Více

Signál v čase a jeho spektrum

Signál v čase a jeho spektrum Signál v čase a jeho spektrum Signály v časovém průběhu (tak jak je vidíme na osciloskopu) můžeme dělit na periodické a neperiodické. V obou případech je lze popsat spektrálně určit jaké kmitočty v sobě

Více

KLASIFIKÁTOR MODULACÍ S VYUŽITÍM UMĚLÉ NEURONOVÉ SÍTĚ

KLASIFIKÁTOR MODULACÍ S VYUŽITÍM UMĚLÉ NEURONOVÉ SÍTĚ KLASIFIKÁTOR MODULACÍ S VYUŽITÍM UMĚLÉ NEURONOVÉ SÍTĚ Marie Richterová 1, David Juráček 2 1 Univerzita obrany, Katedra KIS, 2 PČR MŘ Brno Abstrakt Článek se zabývá rozpoznáváním analogových a diskrétních

Více

5. Umělé neuronové sítě. Neuronové sítě

5. Umělé neuronové sítě. Neuronové sítě Neuronové sítě Přesný algoritmus práce přírodních neuronových systémů není doposud znám. Přesto experimentální výsledky na modelech těchto systémů dávají dnes velmi slibné výsledky. Tyto systémy, včetně

Více

Využití neuronové sítě pro identifikaci realného systému

Využití neuronové sítě pro identifikaci realného systému 1 Portál pre odborné publikovanie ISSN 1338-0087 Využití neuronové sítě pro identifikaci realného systému Pišan Radim Elektrotechnika 20.06.2011 Identifikace systémů je proces, kdy z naměřených dat můžeme

Více

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze Dobývání znalostí Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze Dobývání znalostí Pravděpodobnost a učení Doc. RNDr. Iveta Mrázová,

Více

Quantization of acoustic low level signals. David Bursík, Miroslav Lukeš

Quantization of acoustic low level signals. David Bursík, Miroslav Lukeš KVANTOVÁNÍ ZVUKOVÝCH SIGNÁLŮ NÍZKÉ ÚROVNĚ Abstrakt Quantization of acoustic low level signals David Bursík, Miroslav Lukeš Při testování kvality A/D převodníků se používají nejrůznější testovací signály.

Více

ANALÝZA A KLASIFIKACE BIOMEDICÍNSKÝCH DAT. Institut biostatistiky a analýz

ANALÝZA A KLASIFIKACE BIOMEDICÍNSKÝCH DAT. Institut biostatistiky a analýz ANALÝZA A KLASIFIKACE BIOMEDICÍNSKÝCH DAT prof. Ing. Jiří Holčík,, CSc. NEURONOVÉ SÍTĚ otázky a odpovědi 1 AKD_predn4, slide 8: Hodnota výstupu závisí na znaménku funkce net i, tedy na tom, zda bude suma

Více

Fakulta informačních technologií VUT Brno. Předmět: Srovnání klasifikátorů Autor : Jakub Mahdal Login: xmahda03 Datum:

Fakulta informačních technologií VUT Brno. Předmět: Srovnání klasifikátorů Autor : Jakub Mahdal Login: xmahda03 Datum: Fakulta informačních technologií VUT Brno Předmět: Projekt: SRE Srovnání klasifikátorů Autor : Jakub Mahdal Login: xmahda03 Datum: 9.12.2006 Zadání Vyberte si jakékoliv 2 klasifikátory, např. GMM vs. neuronová

Více

Ing. Petr Hájek, Ph.D. Podpora přednášky kurzu Aplikace umělé inteligence

Ing. Petr Hájek, Ph.D. Podpora přednášky kurzu Aplikace umělé inteligence APLIKACE UMĚLÉ INTELIGENCE Ing. Petr Hájek, Ph.D. Podpora přednášky kurzu Aplikace umělé inteligence Aplikace umělé inteligence - seminář ING. PETR HÁJEK, PH.D. ÚSTAV SYSTÉMOVÉHO INŽENÝRSTVÍ A INFORMATIKY

Více

Algoritmy a struktury neuropočítačů ASN P4. Vícevrstvé sítě dopředné a Elmanovy MLNN s učením zpětného šíření chyby

Algoritmy a struktury neuropočítačů ASN P4. Vícevrstvé sítě dopředné a Elmanovy MLNN s učením zpětného šíření chyby Algoritmy a struktury neuropočítačů ASN P4 Vícevrstvé sítě dopředné a Elmanovy MLNN s učením zpětného šíření chyby Vrstevnatá struktura - vícevrstvé NN (Multilayer NN, MLNN) vstupní vrstva (input layer)

Více

Moderní systémy pro získávání znalostí z informací a dat

Moderní systémy pro získávání znalostí z informací a dat Moderní systémy pro získávání znalostí z informací a dat Jan Žižka IBA Institut biostatistiky a analýz PřF & LF, Masarykova universita Kamenice 126/3, 625 00 Brno Email: zizka@iba.muni.cz Bioinformatika:

Více

Algoritmy a struktury neuropočítačů ASN - P10. Aplikace UNS v biomedicíně

Algoritmy a struktury neuropočítačů ASN - P10. Aplikace UNS v biomedicíně Aplikace UNS v biomedicíně aplikace v medicíně postup při zpracování úloh Aplikace UNS v medicíně Důvod: nalezení exaktnějších, levnějších a snadnějších metod určování diagnóz pro lékaře nalezení šetrnějších

Více

U Úvod do modelování a simulace systémů

U Úvod do modelování a simulace systémů U Úvod do modelování a simulace systémů Vyšetřování rozsáhlých soustav mnohdy nelze provádět analytickým výpočtem.často je nutné zkoumat chování zařízení v mezních situacích, do kterých se skutečné zařízení

Více

3 METODY PRO POTLAČENÍ ŠUMU U ŘE- ČOVÉHO SIGNÁLU

3 METODY PRO POTLAČENÍ ŠUMU U ŘE- ČOVÉHO SIGNÁLU 3 METODY PRO POTLAČENÍ ŠUMU U ŘE- ČOVÉHO SIGNÁLU V současné době se pro potlačení šumu u řečového signálu používá mnoho různých metod. Jedná se například o metody spektrálního odečítání, Wienerovy filtrace,

Více

Umělé neuronové sítě

Umělé neuronové sítě Umělé neuronové sítě 17. 3. 2018 5-1 Model umělého neuronu y výstup neuronu u vnitřní potenciál neuronu w i váhy neuronu x i vstupy neuronu Θ práh neuronu f neuronová aktivační funkce 5-2 Neuronové aktivační

Více

Whale detection Brainstorming session. Jiří Dutkevič Lenka Kovářová Milan Le

Whale detection Brainstorming session. Jiří Dutkevič Lenka Kovářová Milan Le Whale detection Brainstorming session Jiří Dutkevič Lenka Kovářová Milan Le Signal processing, Sampling theorem Spojitý signál může být nahrazen diskrétní posloupností vzorků, aniž by došlo ke ztrátě informace,

Více

13 Barvy a úpravy rastrového

13 Barvy a úpravy rastrového 13 Barvy a úpravy rastrového Studijní cíl Tento blok je věnován základním metodám pro úpravu rastrového obrazu, jako je např. otočení, horizontální a vertikální překlopení. Dále budo vysvětleny různé metody

Více

TSO NEBO A INVARIANTNÍ ROZPOZNÁVACÍ SYSTÉMY

TSO NEBO A INVARIANTNÍ ROZPOZNÁVACÍ SYSTÉMY TSO NEBO A INVARIANTNÍ ROZPOZNÁVACÍ SYSTÉMY V PROSTŘEDÍ MATLAB K. Nováková, J. Kukal FJFI, ČVUT v Praze ÚPŘT, VŠCHT Praha Abstrakt Při rozpoznávání D binárních objektů z jejich diskrétní realizace se využívají

Více

Rozpoznávání izolovaných slov (malý slovník, např. číslovky, povely).

Rozpoznávání izolovaných slov (malý slovník, např. číslovky, povely). Rozpoznávání řeči Každý člověk má originální hlasové ústrojí a odlišný způsob artikulace, to se projevuje rozdílnou barvou hlasu, přízvukem, rychlostí řeči atd. I hlas jednoho řečníka je variabilní a závislý

Více

ADA Semestrální práce. Harmonické modelování signálů

ADA Semestrální práce. Harmonické modelování signálů České vysoké učení technické v Praze ADA Semestrální práce Harmonické modelování signálů Jiří Kořínek 31.12.2005 1. Zadání Proveďte rozklad signálu do harmonických komponent (řeč, hudba). Syntetizujte

Více

7. Rozdělení pravděpodobnosti ve statistice

7. Rozdělení pravděpodobnosti ve statistice 7. Rozdělení pravděpodobnosti ve statistice Statistika nuda je, má však cenné údaje, neklesejte na mysli, ona nám to vyčíslí Jednou z úloh statistiky je odhad (výpočet) hodnot statistického znaku x i,

Více

Vytěžování znalostí z dat

Vytěžování znalostí z dat Pavel Kordík, Josef Borkovec (ČVUT FIT) Vytěžování znalostí z dat BI-VZD, 2012, Přednáška 8 1/26 Vytěžování znalostí z dat Pavel Kordík, Josef Borkovec Department of Computer Systems Faculty of Information

Více

ZÁKLADNÍ METODY REFLEKTOMETRIE

ZÁKLADNÍ METODY REFLEKTOMETRIE VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY FAKULTA ELEKTROTECHNIKY A KOMUNIKAČNÍCH TECHNOLOGIÍ ÚSTAV RADIOELEKTRONIKY FACULTY OF ELECTRICAL ENGINEERING AND COMMUNICATION DEPARTMENT OF

Více

Profilování vzorků heroinu s využitím vícerozměrné statistické analýzy

Profilování vzorků heroinu s využitím vícerozměrné statistické analýzy Profilování vzorků heroinu s využitím vícerozměrné statistické analýzy Autor práce : RNDr. Ivo Beroun,CSc. Vedoucí práce: prof. RNDr. Milan Meloun, DrSc. PROFILOVÁNÍ Profilování = klasifikace a rozlišování

Více

Rosenblattův perceptron

Rosenblattův perceptron Perceptron Přenosové funkce Rosenblattův perceptron Rosenblatt r. 1958. Inspirace lidským okem Podle fyziologického vzoru je třívrstvá: Vstupní vrstva rozvětvovací jejím úkolem je mapování dvourozměrného

Více

ROZPOZNÁNÍ TITULU GRAMOFONOVÉ DESKY PODLE KRÁTKÉ UKÁZKY

ROZPOZNÁNÍ TITULU GRAMOFONOVÉ DESKY PODLE KRÁTKÉ UKÁZKY ROZPOZNÁNÍ TITULU GRAMOFONOVÉ DESKY PODLE KRÁTKÉ UKÁZKY V. Moldan, F. Rund Katedra radioelektroniky, fakulta elektrotechnická České vysoké učení technické v Praze, Česká republika Abstrakt Tento článek

Více

vzorek1 0.0033390 0.0047277 0.0062653 0.0077811 0.0090141... vzorek 30 0.0056775 0.0058778 0.0066916 0.0076192 0.0087291

vzorek1 0.0033390 0.0047277 0.0062653 0.0077811 0.0090141... vzorek 30 0.0056775 0.0058778 0.0066916 0.0076192 0.0087291 Vzorová úloha 4.16 Postup vícerozměrné kalibrace Postup vícerozměrné kalibrace ukážeme na úloze C4.10 Vícerozměrný kalibrační model kvality bezolovnatého benzinu. Dle následujících kroků na základě naměřených

Více

K možnostem krátkodobé předpovědi úrovně znečištění ovzduší statistickými metodami. Josef Keder

K možnostem krátkodobé předpovědi úrovně znečištění ovzduší statistickými metodami. Josef Keder K možnostem krátkodobé předpovědi úrovně znečištění ovzduší statistickými metodami Josef Keder Motivace Předpověď budoucí úrovně znečištění ovzduší s předstihem v řádu alespoň několika hodin má význam

Více

Pracovní celky 3.2, 3.3 a 3.4 Sémantická harmonizace - Srovnání a přiřazení datových modelů

Pracovní celky 3.2, 3.3 a 3.4 Sémantická harmonizace - Srovnání a přiřazení datových modelů Pracovní celky 3.2, 3.3 a 3.4 Sémantická harmonizace - Srovnání a datových modelů Obsah Seznam tabulek... 1 Seznam obrázků... 1 1 Úvod... 2 2 Metody sémantické harmonizace... 2 3 Dvojjazyčné katalogy objektů

Více

Využití algoritmu DTW pro vyhodnocování vad řeči dětí postižených Landau-Kleffnerovým syndromem (LKS)

Využití algoritmu DTW pro vyhodnocování vad řeči dětí postižených Landau-Kleffnerovým syndromem (LKS) Využití algoritmu DTW pro vyhodnocování vad řeči dětí postižených Landau-Kleffnerovým syndromem (LKS) Petr Zlatník České vysoké učení technické v Praze, Fakulta elektrotechnická zlatnip@fel.cvut.cz Abstrakt:

Více

STANOVENÍ CHARAKTERU SEGMENTU ŘEČI S VYUŽITÍM REÁLNÉHO KEPSTRA

STANOVENÍ CHARAKTERU SEGMENTU ŘEČI S VYUŽITÍM REÁLNÉHO KEPSTRA STANOVENÍ CHARAKTERU SEGMENTU ŘEČI S VYUŽITÍM REÁLNÉHO KEPSTRA Oldřich Horák Univerzita Pardubice, Fakulta ekonomicko-správní, Ústav systémového inženýrství a informatiky Abstract: The extraction of the

Více

Moderní multimediální elektronika (U3V)

Moderní multimediální elektronika (U3V) Moderní multimediální elektronika (U3V) Prezentace č. 13 Moderní kompresní formáty pro přenosné digitální audio Ing. Tomáš Kratochvíl, Ph.D. Ústav radioelektroniky, FEKT VUT v Brně Program prezentace Princip

Více

Neuronové sítě Ladislav Horký Karel Břinda

Neuronové sítě Ladislav Horký Karel Břinda Neuronové sítě Ladislav Horký Karel Břinda Obsah Úvod, historie Modely neuronu, aktivační funkce Topologie sítí Principy učení Konkrétní typy sítí s ukázkami v prostředí Wolfram Mathematica Praktické aplikace

Více

Synth challange 2016

Synth challange 2016 ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE Fakulta elektrotechnická Synth challange 2016 Komentář k práci Jan Dvořák OBSAH ÚVOD... 2 1 Syntéza orchestrálních nástrojů pro symfonickou báseň B. Smetany "Vltava"...

Více

SIGNÁLY A LINEÁRNÍ SYSTÉMY

SIGNÁLY A LINEÁRNÍ SYSTÉMY SIGNÁLY A LINEÁRNÍ SYSTÉMY prof. Ing. Jiří Holčík, CSc. holcik@iba.muni.cziba.muni.cz II. SIGNÁLY ZÁKLADNÍ POJMY SIGNÁL - DEFINICE SIGNÁL - DEFINICE Signál je jev fyzikální, chemické, biologické, ekonomické

Více

doc. Dr. Ing. Elias TOMEH Elias Tomeh / Snímek 1

doc. Dr. Ing. Elias TOMEH   Elias Tomeh / Snímek 1 doc. Dr. Ing. Elias TOMEH e-mail: elias.tomeh@tul.cz Elias Tomeh / Snímek 1 Frekvenční spektrum Dělení frekvenčního pásma (počet čar) Průměrování Časovou váhovou funkci Elias Tomeh / Snímek 2 Vzorkovací

Více

ANALÝZA A KLASIFIKACE DAT

ANALÝZA A KLASIFIKACE DAT ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc. INVESTICE Institut DO biostatistiky ROZVOJE VZDĚLÁVÁNÍ a analýz III. PŘÍZNAKOVÁ KLASIFIKACE - ÚVOD PŘÍZNAKOVÝ POPIS Příznakový obraz x zpracovávaných

Více

SIGNÁLY A LINEÁRNÍ SYSTÉMY

SIGNÁLY A LINEÁRNÍ SYSTÉMY SIGNÁLY A LINEÁRNÍ SYSTÉMY prof. Ing. Jiří Holčík, CSc. holcik@iba.muni.cz II. SIGNÁLY ZÁKLADNÍ POJMY SIGNÁL - DEFINICE SIGNÁL - DEFINICE Signál je jev fyzikální, chemické, biologické, ekonomické či jiné

Více

VYUŽITÍ MATLABU PRO PODPORU VÝUKY A PŘI ŘEŠENÍ VÝZKUMNÝCH ÚKOLŮ NA KATEDŘE KOMUNIKAČNÍCH A INFORMAČNÍCH SYSTÉMŮ

VYUŽITÍ MATLABU PRO PODPORU VÝUKY A PŘI ŘEŠENÍ VÝZKUMNÝCH ÚKOLŮ NA KATEDŘE KOMUNIKAČNÍCH A INFORMAČNÍCH SYSTÉMŮ VYUŽITÍ MATLABU PRO PODPORU VÝUKY A PŘI ŘEŠENÍ VÝZKUMNÝCH ÚKOLŮ NA KATEDŘE KOMUNIKAČNÍCH A INFORMAČNÍCH SYSTÉMŮ Markéta Mazálková Katedra komunikačních a informačních systémů Fakulta vojenských technologií,

Více

Statistická teorie učení

Statistická teorie učení Statistická teorie učení Petr Havel Marek Myslivec přednáška z 9. týdne 1 Úvod Představme si situaci výrobce a zákazníka, který si u výrobce objednal algoritmus rozpoznávání. Zákazník dodal experimentální

Více

Lineární klasifikátory

Lineární klasifikátory Lineární klasifikátory Lineární klasifikátory obsah: perceptronový algoritmus základní verze varianta perceptronového algoritmu přihrádkový algoritmus podpůrné vektorové stroje Lineární klasifikátor navrhnout

Více

Strojové učení se zaměřením na vliv vstupních dat

Strojové učení se zaměřením na vliv vstupních dat Strojové učení se zaměřením na vliv vstupních dat Irina Perfilieva, Petr Hurtík, Marek Vajgl Centre of excellence IT4Innovations Division of the University of Ostrava Institute for Research and Applications

Více

Algoritmy a struktury neuropočítačů ASN P3

Algoritmy a struktury neuropočítačů ASN P3 Algoritmy a struktury neuropočítačů ASN P3 SOM algoritmus s učitelem i bez učitele U-matice Vektorová kvantizace Samoorganizující se mapy ( Self-Organizing Maps ) PROČ? Základní myšlenka: analogie s činností

Více

31SCS Speciální číslicové systémy Antialiasing

31SCS Speciální číslicové systémy Antialiasing ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE 2006/2007 31SCS Speciální číslicové systémy Antialiasing Vypracoval: Ivo Vágner Email: Vagnei1@seznam.cz 1/7 Převod analogového signálu na digitální Složité operace,

Více

veličin, deskriptivní statistika Ing. Michael Rost, Ph.D.

veličin, deskriptivní statistika Ing. Michael Rost, Ph.D. Vybraná rozdělení spojitých náhodných veličin, deskriptivní statistika Ing. Michael Rost, Ph.D. Třídění Základním zpracováním dat je jejich třídění. Jde o uspořádání získaných dat, kde volba třídícího

Více

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY. MRBT Robotika

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY. MRBT Robotika VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY FAKULTA ELEKTROTECHNIKY A KOMUNIKAČNÍCH TECHNOLOGIÍ ÚSTAV AUTOMATIZACE A MĚŘÍCÍ TECHNIKY FACULTY OF ELECTRICAL ENGINEERING AND COMMUNICATION

Více

Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D.

Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D. Zpracování náhodného výběru popisná statistika Ing. Michal Dorda, Ph.D. Základní pojmy Úkolem statistiky je na základě vlastností výběrového souboru usuzovat o vlastnostech celé populace. Populace(základní

Více

Jasové transformace. Karel Horák. Rozvrh přednášky:

Jasové transformace. Karel Horák. Rozvrh přednášky: 1 / 23 Jasové transformace Karel Horák Rozvrh přednášky: 1. Úvod. 2. Histogram obrazu. 3. Globální jasová transformace. 4. Lokální jasová transformace. 5. Bodová jasová transformace. 2 / 23 Jasové transformace

Více

ANALÝZA LIDSKÉHO HLASU

ANALÝZA LIDSKÉHO HLASU ANALÝZA LIDSKÉHO HLASU Pomůcky mikrofon MCA-BTA, LabQuest, program LoggerPro (nebo LoggerLite), tabulkový editor Excel, program Mathematica Postup Z každodenní zkušenosti víme, že každý lidský hlas je

Více

B) výchovné a vzdělávací strategie jsou totožné se strategiemi vyučovacího předmětu Matematika.

B) výchovné a vzdělávací strategie jsou totožné se strategiemi vyučovacího předmětu Matematika. 4.8.3. Cvičení z matematiky Předmět Cvičení z matematiky je vyučován v sextě a v septimě jako volitelný předmět. Vzdělávací obsah vyučovacího předmětu Cvičení z matematiky vychází ze vzdělávací oblasti

Více

Klasifikace a rozpoznávání. Lineární klasifikátory

Klasifikace a rozpoznávání. Lineární klasifikátory Klasifikace a rozpoznávání Lineární klasifikátory Opakování - Skalární součin x = x1 x 2 w = w T x = w 1 w 2 x 1 x 2 w1 w 2 = w 1 x 1 + w 2 x 2 x. w w T x w Lineární klasifikátor y(x) = w T x + w 0 Vyber

Více

Klasifikace předmětů a jevů

Klasifikace předmětů a jevů Klasifikace předmětů a jevů 1. Úvod Rozpoznávání neboli klasifikace je základní znak lidské činnosti. Rozpoznávání (klasifikace) předmětů a jevů spočívá v jejich zařazování do jednotlivých tříd. Třídou

Více

UČENÍ BEZ UČITELE. Václav Hlaváč

UČENÍ BEZ UČITELE. Václav Hlaváč UČENÍ BEZ UČITELE Václav Hlaváč Fakulta elektrotechnická ČVUT v Praze katedra kybernetiky, Centrum strojového vnímání hlavac@fel.cvut.cz, http://cmp.felk.cvut.cz/~hlavac 1/22 OBSAH PŘEDNÁŠKY ÚVOD Učení

Více

MATLAB PRO PODPORU VÝUKY KOMUNIKAČNÍCH SYSTÉMŮ

MATLAB PRO PODPORU VÝUKY KOMUNIKAČNÍCH SYSTÉMŮ MATLAB PRO PODPORU VÝUKY KOMUNIKAČNÍCH SYSTÉMŮ Aneta Coufalíková, Markéta Smejkalová Mazálková Univerzita obrany Katedra Komunikačních a informačních systémů Matlab ve výuce V rámci modernizace výuky byl

Více

Teorie náhodných matic aneb tak trochu jiná statistika

Teorie náhodných matic aneb tak trochu jiná statistika Teorie náhodných matic aneb tak trochu jiná statistika B. Vlková 1, M.Berg 2, B. Martínek 3, O. Švec 4, M. Neumann 5 Gymnázium Uničov 1, Gymnázium Václava Hraběte Hořovice 2, Mendelovo gymnázium Opava

Více

SYLABUS PŘEDNÁŠKY 10 Z GEODÉZIE 1

SYLABUS PŘEDNÁŠKY 10 Z GEODÉZIE 1 SYLABUS PŘEDNÁŠKY 10 Z GEODÉZIE 1 (Souřadnicové výpočty 4, Orientace osnovy vodorovných směrů) 1. ročník bakalářského studia studijní program G studijní obor G doc. Ing. Jaromír Procházka, CSc. prosinec

Více

Kapitola 1. Signály a systémy. 1.1 Klasifikace signálů

Kapitola 1. Signály a systémy. 1.1 Klasifikace signálů Kapitola 1 Signály a systémy 1.1 Klasifikace signálů Signál představuje fyzikální vyjádření informace, obvykle ve formě okamžitých hodnot určité fyzikální veličiny, která je funkcí jedné nebo více nezávisle

Více

Komprese dat Obsah. Komprese videa. Radim Farana. Podklady pro výuku. Komprese videa a zvuku. Komprese MPEG. Komprese MP3.

Komprese dat Obsah. Komprese videa. Radim Farana. Podklady pro výuku. Komprese videa a zvuku. Komprese MPEG. Komprese MP3. Komprese dat Radim Farana Podklady pro výuku Obsah Komprese videa a zvuku. Komprese MPEG. Komprese MP3. Komprese videa Velký objem přenášených dat Typický televizní signál - běžná evropská norma pracuje

Více

Obr. 1: Vizualizace dat pacientů, kontrolních subjektů a testovacího subjektu.

Obr. 1: Vizualizace dat pacientů, kontrolních subjektů a testovacího subjektu. Řešení příkladu - klasifikace testovacího subjektu pomocí Bayesova klasifikátoru: ata si vizualizujeme (Obr. ). Objem mozkových komor 9 8 7 6 5 pacienti kontroly testovací subjekt 5 6 Objem hipokampu Obr.

Více

Náhodné (statistické) chyby přímých měření

Náhodné (statistické) chyby přímých měření Náhodné (statistické) chyby přímých měření Hodnoty náhodných chyb se nedají stanovit předem, ale na základě počtu pravděpodobnosti lze zjistit, která z možných naměřených hodnot je více a která je méně

Více

ZÁKLADY AUTOMATICKÉHO ŘÍZENÍ

ZÁKLADY AUTOMATICKÉHO ŘÍZENÍ VYSOKÁ ŠKOLA BÁŇSKÁ TECHNICKÁ UNIVERZITA OSTRAVA FAKULTA STROJNÍ ZÁKLADY AUTOMATICKÉHO ŘÍZENÍ 1. týden doc. Ing. Renata WAGNEROVÁ, Ph.D. Ostrava 2013 doc. Ing. Renata WAGNEROVÁ, Ph.D. Vysoká škola báňská

Více

Neuronové časové řady (ANN-TS)

Neuronové časové řady (ANN-TS) Neuronové časové řady (ANN-TS) Menu: QCExpert Prediktivní metody Neuronové časové řady Tento modul (Artificial Neural Network Time Series ANN-TS) využívá modelovacího potenciálu neuronové sítě k predikci

Více

Akustika. 3.1 Teorie - spektrum

Akustika. 3.1 Teorie - spektrum Akustika 3.1 Teorie - spektrum Rozklad kmitů do nejjednodušších harmonických Spektrum Spektrum Jedna harmonická vlna = 1 frekvence Dvě vlny = 2 frekvence Spektrum 3 vlny = 3 frekvence Spektrum Další vlny

Více

Úvod do optimalizace, metody hladké optimalizace

Úvod do optimalizace, metody hladké optimalizace Evropský sociální fond Investujeme do vaší budoucnosti Úvod do optimalizace, metody hladké optimalizace Matematika pro informatiky, FIT ČVUT Martin Holeňa, 13. týden LS 2010/2011 O čem to bude? Příklady

Více

Rozdělování dat do trénovacích a testovacích množin

Rozdělování dat do trénovacích a testovacích množin Rozdělování dat do trénovacích a testovacích množin Marcel Jiřina Rozpoznávání je důležitou metodou při zpracování reálných úloh. Rozpoznávání je definováno dvěma kroky a to pořízením dat o reálném rozpoznávaném

Více

Základy popisné statistiky. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

Základy popisné statistiky. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Základy popisné statistiky Anotace Realitu můžeme popisovat různými typy dat, každý z nich se specifickými vlastnostmi, výhodami, nevýhodami a vlastní sadou využitelných statistických metod -od binárních

Více

Inženýrská statistika pak představuje soubor postupů a aplikací teoretických principů v oblasti inženýrské činnosti.

Inženýrská statistika pak představuje soubor postupů a aplikací teoretických principů v oblasti inženýrské činnosti. Přednáška č. 1 Úvod do statistiky a počtu pravděpodobnosti Statistika Statistika je věda a postup jak rozvíjet lidské znalosti použitím empirických dat. Je založena na matematické statistice, která je

Více

5. Umělé neuronové sítě. neuronové sítě. Umělé Ondřej Valenta, Václav Matoušek. 5-1 Umělá inteligence a rozpoznávání, LS 2015

5. Umělé neuronové sítě. neuronové sítě. Umělé Ondřej Valenta, Václav Matoušek. 5-1 Umělá inteligence a rozpoznávání, LS 2015 Umělé neuronové sítě 5. 4. 205 _ 5- Model umělého neuronu y výstup neuronu u vnitřní potenciál neuronu w i váhy neuronu x i vstupy neuronu Θ práh neuronu f neuronová aktivační funkce _ 5-2 Neuronové aktivační

Více

Rozpoznávání písmen. Jiří Šejnoha Rudolf Kadlec (c) 2005

Rozpoznávání písmen. Jiří Šejnoha Rudolf Kadlec (c) 2005 Rozpoznávání písmen Jiří Šejnoha Rudolf Kadlec (c) 2005 Osnova Motivace Popis problému Povaha dat Neuronová síť Architektura Výsledky Zhodnocení a závěr Popis problému Jedná se o praktický problém, kdy

Více

ANALÝZA A KLASIFIKACE DAT

ANALÝZA A KLASIFIKACE DAT ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc. INVESTICE Institut DO biostatistiky ROZVOJE VZDĚLÁVÁNÍ a analýz LITERATURA Holčík, J.: přednáškové prezentace Holčík, J.: Analýza a klasifikace signálů.

Více

Komplexní obálka pásmového signálu

Komplexní obálka pásmového signálu České vysoké učení technické v Praze, Fakulta elektrotechnická X37SGS Signály a systémy Komplexní obálka pásmového signálu Daniel Tureček 8.11.8 1 Úkol měření Nalezněte vzorky komplexní obálky pásmového

Více

Náhodné chyby přímých měření

Náhodné chyby přímých měření Náhodné chyby přímých měření Hodnoty náhodných chyb se nedají stanovit předem, ale na základě počtu pravděpodobnosti lze zjistit, která z možných naměřených hodnot je více a která je méně pravděpodobná.

Více

Trénování sítě pomocí učení s učitelem

Trénování sítě pomocí učení s učitelem Trénování sítě pomocí učení s učitelem! předpokládá se, že máme k dispozici trénovací množinu, tj. množinu P dvojic [vstup x p, požadovaný výstup u p ]! chceme nastavit váhy a prahy sítě tak, aby výstup

Více

Úvod do modelování a simulace. Ing. Michal Dorda, Ph.D.

Úvod do modelování a simulace. Ing. Michal Dorda, Ph.D. Úvod do modelování a simulace systémů Ing. Michal Dorda, Ph.D. 1 Základní pojmy Systém systémem rozumíme množinu prvků (příznaků) a vazeb (relací) mezi nimi, která jako celek má určité vlastnosti. Množinu

Více

CW01 - Teorie měření a regulace

CW01 - Teorie měření a regulace Ústav technologie, mechanizace a řízení staveb CW01 - Teorie měření a regulace ZS 2010/2011 SPEC. 2.p 2010 - Ing. Václav Rada, CSc. Ústav technologie, mechanizace a řízení staveb Teorie měření a regulace

Více

Automatické rozpoznávání dopravních značek

Automatické rozpoznávání dopravních značek ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE FAKULTA DOPRAVNÍ Jiří Hofman Automatické rozpoznávání dopravních značek Semestrální práce z předmětu ITS 2012 Obsah 1. Automatické rozpoznávání dopravních značek (ATSR)...

Více

Identifikace obsahu archivních zvukových záznamů. Archive Audio Record Content Identification

Identifikace obsahu archivních zvukových záznamů. Archive Audio Record Content Identification ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE Fakulta elektrotechnická Katedra radioelektroniky Identifikace obsahu archivních zvukových záznamů Archive Audio Record Content Identification Bakalářská práce Studijní

Více

8. přednáška z předmětu GIS1 Rastrový datový model a mapová algebra

8. přednáška z předmětu GIS1 Rastrový datový model a mapová algebra 8. přednáška z předmětu GIS1 Rastrový datový model a mapová algebra Vyučující: Ing. Jan Pacina, Ph.D. e-mail: jan.pacina@ujep.cz Pro přednášku byly použity texty a obrázky z www.gis.zcu.cz Předmět KMA/UGI,

Více

INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ. Příklady použití tenkých vrstev Jaromír Křepelka

INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ. Příklady použití tenkých vrstev Jaromír Křepelka Příklady použití tenkých vrstev Jaromír Křepelka Příklad 01 Spočtěte odrazivost prostého rozhraní dvou izotropních homogenních materiálů s indexy lomu n 0 = 1 a n 1 = 1,52 v závislosti na úhlu dopadu pro

Více

Analýza dat na PC I.

Analýza dat na PC I. CENTRUM BIOSTATISTIKY A ANALÝZ Lékařská a Přírodovědecká fakulta, Masarykova univerzita Analýza dat na PC I. Popisná analýza v programu Statistica IBA výuka Základní popisná statistika Popisná statistika

Více

SIGNÁLY A SOUSTAVY, SIGNÁLY A SYSTÉMY

SIGNÁLY A SOUSTAVY, SIGNÁLY A SYSTÉMY SIGNÁLY A SOUSTAVY, SIGNÁLY A SYSTÉMY TEMATICKÉ OKRUHY Signály se spojitým časem Základní signály se spojitým časem (základní spojité signály) Jednotkový skok σ (t), jednotkový impuls (Diracův impuls)

Více

Direct Digital Synthesis (DDS)

Direct Digital Synthesis (DDS) ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE Fakulta elektrotechnická Ing. Radek Sedláček, Ph.D., katedra měření K13138 Direct Digital Synthesis (DDS) Přímá číslicová syntéza Tyto materiály vznikly za podpory

Více

Přednáška 13 Redukce dimenzionality

Přednáška 13 Redukce dimenzionality Vytěžování Dat Přednáška 13 Redukce dimenzionality Miroslav Čepek Fakulta Elektrotechnická, ČVUT Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti ČVUT (FEL) Redukce dimenzionality 1 /

Více

Vyhodnocení 2D rychlostního pole metodou PIV programem Matlab (zpracoval Jan Kolínský, dle programu ing. Jana Novotného)

Vyhodnocení 2D rychlostního pole metodou PIV programem Matlab (zpracoval Jan Kolínský, dle programu ing. Jana Novotného) Vyhodnocení 2D rychlostního pole metodou PIV programem Matlab (zpracoval Jan Kolínský, dle programu ing. Jana Novotného) 1 Obecný popis metody Particle Image Velocimetry, nebo-li zkráceně PIV, je měřící

Více

3. Vícevrstvé dopředné sítě

3. Vícevrstvé dopředné sítě 3. Vícevrstvé dopředné sítě! Jsou tvořeny jednou nebo více vrstvami neuronů (perceptronů). Výstup jedné vrstvy je přitom připojen na vstup následující vrstvy a signál se v pracovní fázi sítě šíří pouze

Více

Vlastnosti a modelování aditivního

Vlastnosti a modelování aditivního Vlastnosti a modelování aditivního bílého šumu s normálním rozdělením kacmarp@fel.cvut.cz verze: 0090913 1 Bílý šum s normálním rozdělením V této kapitole se budeme zabývat reálným gaussovským šumem n(t),

Více

Globální matice konstrukce

Globální matice konstrukce Globální matice konstrukce Z matic tuhosti a hmotnosti jednotlivých prvků lze sestavit globální matici tuhosti a globální matici hmotnosti konstrukce, které se využijí v řešení základní rovnice MKP: [m]{

Více

Úloha: Verifikace osoby pomocí dynamického podpisu

Úloha: Verifikace osoby pomocí dynamického podpisu Cvičení z předmětu Biometrie Úloha: Verifikace osoby pomocí dynamického podpisu Jiří Wild, Jakub Schneider kontaktní email: schnejak@fel.cvut.cz 5. října 2015 1 Úvod Úloha má za cíl seznámit vás s metodami

Více