Určování geografického původu hudby Petr Pako Mária Běhaová Jan Hak Vácav Steiger
O čem budeme muvit? I. Formuace probému II. Řešení probému III.Diskuze výsedků
I. Formuace probému Naezení geografické poohy vzniku skadby Použití neuronové sítě Výstup: srozumitený, GIS Dvojí data: Naučení sítě na datasetuhttp://archive.ics.uci.edu/m/datasets/geographica+origina+of +Music/ Použití sítě nad daty získanými svépomocí
II. Řešení probému - toochain
II.Řešení probému Dataset Získán z http://archive.ics.uci.edu/m/datasets/geographica+origina +of+music/ 1059 idových písní z 33 zemí světa Každá popsána 68 features + at,on havního města státu Zastoupení zemí:
Řešení probému: earn.py Pythonovský program, síť pomocí Pybrain Regresní přístup aproximujeme bod na mapě, neurčujeme pravděpodobnost zařazení do státu Při vývoji testováno na trénovacím datasetu, po dosažení nejepších výsedků předěání de toochain Nejvhodnější konfigurace sítě = 68, 68, 32, 2 Learning rate = 0.08, Epoch = 100 Zváštně vypadající učící křivky, síť neze přeučit (chyba nad 100 epoch fuktuuje a nezačne stoupat ani nad 2000 epoch) = probém povahy datasetu Metoda trainunticonvergence() - sama si děí data a provádí cross-vaidaci - ve snaze síť přeučit nahrazena houpější metodou train() - žádné pozorovatené změny v performance Naučená síť vyexportována
Řešení probému: earn.py
Řešení probému VLC VLC media payer umí krom přehrávání souborů mnoho dašího, např. otevřít síťový stream a uožit ho na okání disk v ibovoném formátu Eegantní řešení, VLC umí přímo *.wav nepotřebujeme internetové mp3 convertery
Řešení probému marsyas peko na zemi Framework napsaný v C++, podpora pro širokou škáu operací se zvukem Program bextract umí extrahovat různé features ze zvukových souborů Největší kámen ůrazu ceého projektu
Řešení probému marsyas peko na zemi V popisu datasetu není řečeno, jaké features obsahuje, pouze že jsou dosaženy defautním nastavením bextract (nakonec naezen paper, který to zhruba popisuje) http://www.academia.edu/4489774/predicting_the_geographic _ORIGIN_OF_WORLD_MUSICRetain_these_fake_authors_in_submis sion_to_preserve_the_formatting Autoři datasetu používai marsyas 0.22, který defautně generuje 68 features / track Marsyas 0.22 není nikde onine dostupný ve funkční podobě (neze přeožit) Dostupný je marsyas 0.5, jehož bextract který má ůpně jiné ovádácí rozhraní, vrací defautně 116 features inuxová verze navíc vrací samé nuy Win32 verzi neze vůbec spustit Win64 verze jediná funguje a nevrací nesmysy, nereaguje ae na přepínače voby extrakce neze vypnout extrakci nechtěných features
Řešení probému prep.py Nutnost vyřadit z dat nechtěné features, protože bextract nereaguje na přepínače, navíc pořadí dat je také jinak a původní pořadí neznáme Otázka bude vůbec originání dataset použitený? Pythonovský program,mě parsovat výstupní weka fie z bextractu a tvořit výstupní data ve stejném formátu jako originání dataset
Řešení probému use.py Pythonovský program generující výsedky, knihovny: pybrain Načtení neuronové sítě a aktivace na vastních datech basemap Vykresení mapy světa a přepočet výsedků neuronové sítě (severní déky a jižní šířky) na souřadnice této mapy Matpotib.pypot Samotné kresení bodů na mapu
Řešení probému use.py - mapa Mapa světa, světadíy bíe na šedém moři, vykreseny hranice států Mercatorova mapová projekce nedochází k deformaci zmenšení pochy severní evropy, severní ameriky, nejnázornější zobrazení Přijdeme o antarktidu, na které stejně (v datasetu) nikdo hudbu neděá
Překážka Bextract z Marsyas 0.5 nejen že nevrací správný počet hodnot, ae ani správné pořadí hodnot Význam features z Marsyas 0.5 je znám, je obsažen ve výstupním weka souboru Význam features z datasetu (Marsyas 0.22) znám není v popisu datasetu chybí, v paperu je uveden, ae evidentně ne ve správném pořadí (např MFCC z vastních dat a to, co má být de pořadí MFCC z datasetu jsou na první pohed zcea jiná data) Dokonce nesedí ani počty typů features de paperu je v datasetu 32 MFCC features/ track, Marsyas 0.5 jich extrahuje 12*4 = 48
Diskuze výsedků Vzhedem k výše uvedenému není dataset ve spojení s daty získanými svépomocí použitený Pro prověření funkce neuronové sítě bya tedy zvoena náhradní varianta výběr testovacích dat z původního datasetu Testovací data zvoena: ze země s nejvíce vzorky Indie Ze země s výrazně nižším počtem vzorků - Japonsko
Diskuze výsedku Indie
Diskuze výsedku Japonsko
Hodnocení Mínusy Nepodařio se dosáhnout původně zamýšené funkcionaity viv nepředpokadatené nekompatibiity výstupu programu bextract Neuronová síť nefunguje uspokojivě pro většinu zemí v datasetu (máo dat) Pusy Neuronová síť je po naučení schopná s uspokojivou přesností určit poohu hudby má-i dost dat pro danou obast (Indie) Výkon našeho řešení je epší než výkon řešení autorů původního datasetu ti s použitím k-nn a ceé řady postprocessingových operací s využitím daších externích dat dosáhi nejepší chyby cca 1500km, naše řešení má v Indii nejmenší chybu cca 500km
Co příště uděat épe Nespoéhat na frameworky a postavit si vastní dataset Použít více vzorků síť funguje uspokojivě v Indii se 116 vzorky, už méně uspokojivě funguje v japonsku se 17 vzorky Více features pode tvaru křivky učení není síť schopná v datech najít příiš siné souvisosti, více dat by moho pomoct, ae Výstižnější features používat např. chromatické ukazatee je spíše na škodu, síť pak bere v ůvahu tóninu skadby, což je většinou (kromě vsi Těrchová na Sovensku, kde hrají všechno v D dur) nepodstatná, až rušivá informace