Whale detection Brainstorming session. Jiří Dutkevič Lenka Kovářová Milan Le

Podobné dokumenty
P7: Základy zpracování signálu

Algoritmy a struktury neuropočítačů ASN P9 SVM Support vector machines Support vector networks (Algoritmus podpůrných vektorů)

Počítačové sítě. Lekce 5: Základy datových komunikací

Klasifikace hudebních stylů

Vytěžování znalostí z dat

Multimediální systémy

Lineární a adpativní zpracování dat. 3. Lineární filtrace I: Z-transformace, stabilita

Strojové učení Marta Vomlelová

DFT 1D i 2D obrázkové připomenutí a trošku konvoluce 1

Strojové učení se zaměřením na vliv vstupních dat

Digitalizace převod AS DS (analogový diskrétní signál )

Algoritmy a struktury neuropočítačů ASN - P11

Úvod do zpracování signálů

Lineární klasifikátory

Lineární a adaptivní zpracování dat. 1. ÚVOD: SIGNÁLY a SYSTÉMY

Dodatky k FT: 1. (2D digitalizace) 2. Více o FT 3. Více k užití filtrů. 7. přednáška předmětu Zpracování obrazů

1. Vlastnosti diskretních a číslicových metod zpracování signálů... 15

A7B31ZZS 4. PŘEDNÁŠKA 13. října 2014

Ing. Jan Buriánek. Katedra softwarového inženýrství Fakulta informačních technologií České vysoké učení technické v Praze Jan Buriánek, 2010

1. Úvod Jednou z! "# $ posledn % & $$' ( )(( (*+ % ( (* $ $%, (* ( (* obvodech pro elektronickou regulaci.*' (( $ /

Reprezentace bodu, zobrazení

Vytěžování znalostí z dat

Moderní systémy pro získávání znalostí z informací a dat

Náhodné signály. Honza Černocký, ÚPGM

ANALÝZA SIGNÁLŮ SPOJITÉ AKUSTICKÉ EMISE

Speciální struktury číslicových systémů ASN P12

Detekce hudebních žánrů pro účely masteringu gramofonových desek. Music Genre Detection For Vinyl Mastering

Klasifikace a rozpoznávání. Extrakce příznaků

Trénování sítě pomocí učení s učitelem

Rozpoznávání písmen. Jiří Šejnoha Rudolf Kadlec (c) 2005

Grafika na počítači. Bc. Veronika Tomsová

SONAR. Sonar FyzSem - FJFI 1.

Snímání biologických signálů. A6M31LET Lékařská technika Zdeněk Horčík Katedra teorie obvodů

31ZZS 9. PŘEDNÁŠKA 24. listopadu 2014

Omezení barevného prostoru

B2M31SYN SYNTÉZA AUDIO SIGNÁLŮ

ADA Semestrální práce. Harmonické modelování signálů

SIGNÁLY A SOUSTAVY, SIGNÁLY A SYSTÉMY

Kybernetika a umělá inteligence, cvičení 10/11

Lineární diskriminační funkce. Perceptronový algoritmus.

Číslicové zpracování signálů a Fourierova analýza.

VOLBA ČASOVÝCH OKEN A PŘEKRYTÍ PRO VÝPOČET SPEKTER ŠIROKOPÁSMOVÝCH SIGNÁLŮ

Umělé neuronové sítě

3 METODY PRO POTLAČENÍ ŠUMU U ŘE- ČOVÉHO SIGNÁLU

Lineární a adaptivní zpracování dat. 1. ÚVOD: SIGNÁLY, ČASOVÉ ŘADY a SYSTÉMY

Charakteristiky zvuk. záznamů

Základy a aplikace digitálních. Katedra radioelektroniky (13137), blok B2, místnost 722

Lineární a adaptivní zpracování dat. 1. ÚVOD: SIGNÁLY, ČASOVÉ ŘADY a SYSTÉMY

Fakulta informačních technologií VUT Brno. Předmět: Srovnání klasifikátorů Autor : Jakub Mahdal Login: xmahda03 Datum:

Neuronové sítě (11. přednáška)

ROZPOZNÁNÍ TITULU GRAMOFONOVÉ DESKY PODLE KRÁTKÉ UKÁZKY

Moderní multimediální elektronika (U3V)

Princip digitalizace vstupních multimediálních dat Klasifikace Zpracování Využití

Rozpoznávání v obraze

Ing. Petr Hájek, Ph.D. Podpora přednášky kurzu Aplikace umělé inteligence

Úvod do medicínské informatiky pro Bc. studium. 6. přednáška

STANOVENÍ CHARAKTERU SEGMENTU ŘEČI S VYUŽITÍM REÁLNÉHO KEPSTRA

Následující text je součástí učebních textů předmětu Bi0034 Analýza a klasifikace dat a je určen

Flexibilita jednoduché naprogramování a přeprogramování řídícího systému

Multimediální systémy

KLASIFIKÁTOR MODULACÍ S VYUŽITÍM UMĚLÉ NEURONOVÉ SÍTĚ

KTE/TEVS - Rychlá Fourierova transformace. Pavel Karban. Katedra teoretické elektrotechniky Fakulta elektrotechnická Západočeská univerzita v Plzni

ZÍSKÁVÁNÍ ZNALOSTÍ Z DATABÁZÍ

Lineární a adaptivní zpracování dat. 3. SYSTÉMY a jejich popis ve frekvenční oblasti

31SCS Speciální číslicové systémy Antialiasing

7 Další. úlohy analýzy řeči i a metody

Identifikace obsahu archivních zvukových záznamů. Archive Audio Record Content Identification

ANALÝZA A KLASIFIKACE BIOMEDICÍNSKÝCH DAT. Institut biostatistiky a analýz

NG C Implementace plně rekurentní

Katedra kybernetiky laboratoř Inteligentní Datové Analýzy (IDA) Katedra počítačů, Computational Intelligence Group

Textmining a Redukce dimenzionality

KLASIFIKACE AKUSTICKÝCH SIGNÁLŮ CLASSIFICATION OF ACOUSTIC SIGNALS

Aplikace obrazové fúze pro hledání vad

Základní metody číslicového zpracování signálu a obrazu část II.

Modernizace a inovace výpočetní kapacity laboratoří ITE pro účely strojového učení. Jiří Málek

Dynamic Signals. Ananda V. Mysore SJSU

Zvuková karta. Zvuk a zvuková zařízení. Vývoj, typy, vlastnosti

DATA MINING KLASIFIKACE DMINA LS 2009/2010

Dolování dat z multimediálních databází. Ing. Igor Szöke Speech group ÚPGM, FIT, VUT

Ochutnávka strojového učení

ZÍSKÁVÁNÍ ZNALOSTÍ Z DATABÁZÍ

Anti Aliasing. Ondřej Burkert. atrey.karlin.mff.cuni.cz/~ondra/ ~ondra/stranka

A/D převodníky, D/A převodníky, modulace

Smart Grid Data Mining

Automatické vyhledávání informace a znalosti v elektronických textových datech

1. Základy teorie přenosu informací

Analogově číslicové převodníky

Vojtěch Franc. Biometrie ZS Poděkování Janu Šochmanovi za slajdy vysvětlující AdaBoost

5. Umělé neuronové sítě. neuronové sítě. Umělé Ondřej Valenta, Václav Matoušek. 5-1 Umělá inteligence a rozpoznávání, LS 2015

Vojtěch Franc Centrum strojového vnímání, Katedra kybernetiky, FEL ČVUT v Praze Eyedea Recognition s.r.o MLMU

MĚŘENÍ A ANALÝZA ELEKTROAKUSTICKÝCH SOUSTAV NA MODELECH. Petr Kopecký ČVUT, Fakulta elektrotechnická, Katedra Radioelektroniky

Neparametrické odhady hustoty pravděpodobnosti

Pokročilé neparametrické metody. Klára Kubošová

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ

Algoritmy a struktury neuropočítačů ASN P3

Základní principy přeměny analogového signálu na digitální

Princip digitalizace vstupních multimediálních dat Klasifikace Zpracování Využití

UŽITÍ KOHERENČNÍ FUNKCE PRO DISTRIBUOVANOU

Vytěžování znalostí z dat

Potlačování šumu v mikroskopických snímcích pomocí adaptivního non-local means filtru

Transkript:

Whale detection Brainstorming session Jiří Dutkevič Lenka Kovářová Milan Le

Signal processing, Sampling theorem Spojitý signál může být nahrazen diskrétní posloupností vzorků, aniž by došlo ke ztrátě informace, a to tak, že vzorkovací frekvence Fs je nejméně 2x větší než nejvyšší frekvenci v signálu. Původní spojitý signál může být zrekonstruován ze získaných vzorků.

Signal processing, Aliasing Jinými slovy: Fs/2 (Nyquist frekvence) je nejvyšší frekvence, které lze docílit rozkladem. Ve filmu se vrtule točí: V opačném směru než ve skutečnosti Nepřirozeně pomalu Správně by byl pohyb zachycen jenom kdyby kamera snímala alespoň dvakrát tak rychleji

Signal processing, Aliasing

Signal processing, Aliasing

Antialiasing Spojitý signál -> antialising filter -> diskrétní popis signálu Filtruje frekvence vyšší než odpovídají Shannonovu teorému

Framing - rozdělení na "okénka". FT jsou stacionární sinusoidy, skutečný signál není U lidí je framing 25ms, u velryb jsem zvolil 250ms Vážení signálu s okénkovou funkcí Požadujeme

DFT, Spectral analysis

Denoising "odšumění" Audio Denoising by Time-Frequency Block Thresholding. Volba všech parametrů adaptivně na vlastnostech signálu minimalizací Steinovým odhadem risku. "Hudební šum" způsobený denoising algoritmem jako power subtraction, algoritmus block thresholding tento šum reguluje

Audio Features Spectralní features - popisují spectrum, nejoblíbenější - cepstral koefy, v krátkých frame c=real(ifft(log(abs(fft(x))))) - Mel-freq cepstral koefy - spekrální centroid, bandwidth

Harmonické vlny Harmonické vlny

Features Temporální features - pro rozpoznání pohlaví, mluvčího, nástrojů

Features Zero-crossing rate ZCR koreluje se spectrálním centroidem

193 vytažených features Energic - AudioPower = čtverec waveform Harmonic - stupeň harmoničnosti v nahrávce Perceptual Spectral Temporal Jiné

Referencies BlockThresholding http://www.cmap.polytechnique.fr/~yu/research/abt/samples.html G. Yu, S. Mallat, E. Bacry, Audio Denoising by Time-Frequency Block Thresholding, IEEE Trans. on Signal Processing, vol 56, no. 5, pp. 1830-1839, May 2008. Audio Descriptors http://www-sipl.technion.ac.il/info/teaching_projects_mpeg-7-audiodescriptors_e.shtml Sound Description Toolbox Assembled (and partially written) by Emmanouil Benetos with a little help by M. Kotti & C. Kotropoulos Inspired by: G. Peeters, "A large set of audio features for sound description in the CUIDADO project", IRCAM Technical Report, 2004.

Referencies Klapury, ISMIR Graduate School, October 4th9th, 2004

Neuronové sítě s extrahovanými příznaky - použita klasifikační neuronová síť s jednou skrytou vrstvou a jedním neuronem ve výstupní vrstvě - náš nejlepší výsledek: úspěšnost 87% - benchmark: 72.18% (Cornell University) - vítěz: 98.384% (tým SluiceBox)

Neuronové sítě s extrahovanými příznaky

Random forests Klasifikační metoda Během trénovací fáze algoritmu se vytvoří několik rozpoznávacích stromů Výsledek modelu je získán jako modus výsledků jednotlivých stromů

Support vector machines Metoda strojového učení - klasifikátor Hledá se nadrovina, která v prostoru atributů rozdělí trénovací data do dvou skupin Rozdělovací nadrovina je lineární funkcí prostoru atributů

Data mining v programu Rapidminer

Evolutionary algorithms pokus o řešení problému s příliš mnoha příznaky nevedlo to k dobrým výsledkům

Další rozpoznávání obrazu jpeg / mp3 deep learning