VZDÁLENÁ ANALÝZA LIDSKÉHO HLASU V REÁLNÉM ČASE. Tomáš Kulhánek 1,2, Marek Frič 3, Jaroslav Hrb 3



Podobné dokumenty
Tomáš Kulhánek, Marek Friš, Milan Šárek

Úvod. T. Kulhánek, M. Frič, M. Šárek CESNET z.s.p.o., HAMU

TECHNOLOGICKÝ LIST čís. 46

TC-502L TC-60xL. Tenký klient

TC-502L. Tenký klient

MATLABLINK - VZDÁLENÉ OVLÁDÁNÍ A MONITOROVÁNÍ TECHNOLOGICKÝCH PROCESŮ

MetaCentrum. Tomáš Rebok MetaCentrum NGI, CESNET z.s.p.o. CERIT-SC, Masarykova Univerzita Olomouc,

Cloudy a gridy v národní einfrastruktuře

TELEFONNí LiNKA PREMiUM PRŮVODCE APLIKACí T UC-ONE - PC

CS monitorovací jednotky. Edice: Vytvořil: Luboš Fistr

CS monitorovací jednotky. Edice: Vytvořil: Luboš Fistr

Vypracoval: Ing. Antonín POPELKA. Datum: 30. června Revize 01

Zápočtová úloha z předmětu KIV/ZSWI DOKUMENT SPECIFIKACE POŽADAVKŮ

bezpečnost přenášená vzduchem

SYSTÉM SCREENS SYSTEM SCREENS

OSNOVA. 1. Definice zvuku a popis jeho šíření. 2. Rozdělení zvukových záznamů (komprese) 3. Vlastnosti jednotlivých formátů

Inteligentní řešení kamerového systému

Identifikátor materiálu: ICT-1-19

Sona-Speech II, Model 3650 PROGRAM PRO LOGOPEDICKOU PRAXI NA ČESKÉM LOGOPEDICKÉM NEBI POČÍTAČOVÝ PROGRAM. Úvodem.

REMARK. Perfektně popsaný záznam. Uživatelský manuál

TECHNOLOGIE ELASTICKÉ KONFORMNÍ TRANSFORMACE RASTROVÝCH OBRAZŮ

XTB VPS. XTB Virtual Private Server manuál

Virtuální učebna: VMware VDI zefektivňuje výuku, zjednodušuje správu a snižuje náklady

Zvuková karta. Zvuk a zvuková zařízení. Vývoj, typy, vlastnosti

Důvěryhodná výpočetní základna v prostředí rozsáhlých IS státní správy

VYTVOŘENÍ / EDITACE RDP SOUBORU

Elektronická komunikace

Nástroje LabVIEW pro měření přes internet

SADA VY_32_INOVACE_PP1

HARMONYS. Nový system zvonění a hlášení po ethernetu

IDENTIFIKACE FYZIOLOGICKÝCH SYSTÉMŮ Tomáš Kulhánek, Marek Mateják, Jan Šilar, Jiří Kofránek

Záznamy přednášek a streaming

SME Terminál + SmeDesktopClient. Instalace. AutoCont CZ a.s.

OVLÁDACÍ A MONITOROVACÍ SYSTÉM ID 6.2 typ

dodání během 2. pololetí 2013, objednáno bude s měsíčním předstihem

POSTUP PŘIPOJENÍ POKLADNÍ TISKÁRNY PRO PRÁCI S ABRA GEN SPUŠTĚNOU NA VZDÁLENÉ PLOŠE

Otevřená platforma VMS systému od firmy AxxonSoft

Vzdálený přístup k počítačům

Remote Download Device (DLD ) rychlé, pohodlné, úsporné Bezdrátový př enos prostřednictvím WLAN/GPRS

IP kamera. Uživatelský manuál

Z internetu do nemocnice bezpečně a snadno

APS 400 ipanel. Online informační a ovládací panel pro systém APS 400. Uživatelská příručka

Envis LIMS Klient distribučního portálu

Akustika pro posluchače HF JAMU

Prostředí pro spolupráci Multimédia

P. Bartoš a J. Tesař

Webové rozhraní pro datové úložiště. Obhajoba bakalářské práce Radek Šipka, jaro 2009

Terminálové služby pro InTouch Využití nových možností MS Windows 2000 pro provozování tenkých klientů

Představení Kerio Control

RHEV for Desktops & SPICE příklad nasazení v akademickém prostředí. Milan Zelenka, RHCE Enlogit s.r.o.

Gymnázium a Střední odborná škola, Rokycany, Mládežníků 1115

Přechod na síťovou verzi programu

Meo S-H: software pro kompletní diagnostiku intenzity a vlnoplochy

Konfigurace Windows 7

Příloha číslo 3 1 / 7

DINOX IP kamery řady: DDC-xxxx DDR-xxxx DDX-xxxx DDB-xxxx

Modulární monitorovací systém Gradient Digitální systém pro záznam, archivaci a vyhodnocení telefonie.

Avaya Scopia verze 8.3

Prostředí pro spolupráci Multimédia

TELEFONNí LiNKA PREMiUM PRŮVODCE NASTAVENíM SLuŽBY MEET-ME KONFERENCE

VYUŽITÍ MATLABU PRO PODPORU VÝUKY A PŘI ŘEŠENÍ VÝZKUMNÝCH ÚKOLŮ NA KATEDŘE KOMUNIKAČNÍCH A INFORMAČNÍCH SYSTÉMŮ

Instalace programu C-on

Provozní statistiky Uživatelský manuál

Vzdálená plocha z macos

Flow Monitoring & NBA. Pavel Minařík

Program pro tvorbu technických výpočtů. VIKLAN - Výpočty. Uživatelská příručka. pro seznámení se základními možnostmi programu. Ing.

ANALÝZA LIDSKÉHO HLASU

Měření Záznam Online monitorování Regulace Alarmování

Technické podmínky a návod na obsluhu

ODBORNÝ VÝCVIK VE 3. TISÍCILETÍ. MEIV Windows server 2003 (seznámení s nasazením a použitím)

Sítě SFN Systém pro analýzu a vizualizaci pokrytí a rušení vysílacích sítí

Jakub Šesták. ESEJ DO PŘEDMĚTU DIGITÁLNÍ KNIHOVNY

PRODUKTY. Tovek Tools

MetaCentrum a náro (nejen matematické) výpočty

Systémy pro sběr a přenos dat

Definice pojmů a přehled rozsahu služby

Využití mobilní technologie O2 pro dohledové systémy a sběr medicínských dat

TSC diagnostika. Prezentace programu

2015 GEOVAP, spol. s r. o. Všechna práva vyhrazena.

Zvukoměry v mobilu při výuce akustiky VLADIMÍR VOCHOZKA 1, VÍT BEDNÁŘ 1, JIŘÍ TESAŘ 2. Úvod. Budějovice. Mobilní aplikace

Permanentní GNSS stanice pro sledování systému Galileo pro projekt IGS MGEX. Dokumentace funkčního vzorku

Konektory a Kabely. Aneb zařízení integrovaná do základní desky a konektory a kabeláž pro připojení externích zařízení

Pokyny pro obsluhu programu. EZZ01 File reader 1.3

Tovek Tools. Tovek Tools jsou standardně dodávány ve dvou variantách: Tovek Tools Search Pack Tovek Tools Analyst Pack. Připojené informační zdroje

Očekávané trendy v telemedicíně

Mikropilot pro SmVaK. Cíle mikropilotu. Zadání mikropilotu

ZAŘÍZENÍ PRO VZDÁLENÝ SBĚR A PŘENOS DAT FIRMWARE

Novinky v ASEPu a zkušenosti s vkládáním plných textů

Nahrávací systém TriREC

CESNET. Národní e-infrastruktura. Ing. Jan Gruntorád, CSc. ředitel CESNET, z.s.p.o.

Inovace výuky prostřednictvím ICT v SPŠ Zlín, CZ.1.07/1.5.00/ Vzdělávání v informačních a komunikačních technologií

STASA s.r.o. 03/18/2014

Katedra biomedicínské techniky

SODATSW Case Study 2009 Řešení monitoringu tisku ve společnosti Iveco Czech Republic, a. s.

A U T O M A T I Z O V A N Ý SKŘÍŇOVÝ SKLADOVÝ SYSTÉM LockerVend. leden 2015

Zkrácený návod k použití

Microsoft.NET. AppTima Feedback Solution - komplexní systém pro zjišťování a vyhodnocování spokojenosti zákazníků

2N NetSpeaker. Obsah. IP Audio Systém. Uživatelské manuály 1.5

Bibliografické databáze umění vyhledávat v záplavě pramenů relevantní informace

Přechod z AutoCADu na CADKON+

Transkript:

VZDÁLENÁ ANALÝZA LIDSKÉHO HLASU V REÁLNÉM ČASE. Tomáš Kulhánek 1,2, Marek Frič 3, Jaroslav Hrb 3 Abstrakt Během foniatrického vyšetření se provádí analýza hlasu, jejímž výsledkem je diagram hlasového pole, tzv. fonetogram. Aplikace RealVoiceLab vyvinutá centrem hudební akustiky HAMU v prostředí Matlab umožňuje vytvoření fonetogramu v reálném čase a další následné analýzy jakými jsou plocha hlasového pole, poloha nejčetnějších zastoupení, statistiky hlasových projevů po dokončení nahrávání. V příspěvku představíme vzdálené nasazení aplikace RealVoiceLab přes upravený protokol RDP. Tato aplikace je přístupná v síti CESNET 2 a obecně Internetu a umožňuje aplikaci používat pomocí standardního klientského programu Vzdálená plocha nebo i Remote Desktop, která přesměrovává grafické rozhraní, vstupy z klávesnice a myši a nahrávaný zvuk k výkonnému serveru, kde aplikace ve skutečnosti běží. Aplikaci používají u specialistů na foniatrii, kteří ji používají k analýze hlasu v reálném čase za přítomnosti pacienta a také k analýze záznamu hlasu archivovaných. Klíčová slova: fonetogram, vzdálená plocha, RDP, přenos zvuku Úvod V rámci spolupráce Hudební a taneční fakulty akademie múzických umění (HAMU), První lékařské fakulty Univerzity Karlovy v Praze a sdružením CESNET z.s.p.o. vzniká produkt pro podporu vzdálených vyšetření v oblasti ORL medicíny, konkrétně v oblasti pořízení a analýza hlasu vydávaný hlasivkami. Ve výzkumném centru hudební akustiky HAMU vzniká aplikace RealVoiceLab, která provádí analýzu hlasového signálu v real-time režimu, tzn. během nahrávání se zobrazuje rychlá analýza hlasového pole. Na konferenci MEDSOFT 2010, jsme představili aplikaci ParVRP[1], která analýzu prováděla v tzv. postprocesingu, tzn. bezprostředně po pořízení nahrávky přes tzv. vzdálenou plochu (Remote Desktop). Vzdálená plocha dovoluje použít aplikaci z jakéhokoliv počítače připojeného na dálku a vybaveného jen klientskou aplikací pro vzdálenou plochu bez nutnosti instalace výpočetních knihoven a konfigurace analytické aplikace v lokálním počítači [2]. Aplikaci jsme rozšířili o možnost sledování a vyhodnocování v reálném čase. Po ukončení nahrávání, lze provádět detailnější analýzy a připravit výsledný report. Aplikace zároveň umožňuje sdílet na souborové úrovni data z lokálního počítače opět přes protokol RDP. 1 1.LF UK, 2 CESNET z.s.p.o., 3 HAMU 180

Metody Protokol Vzdálené plochy, tzv. RDP přenáší od klientské aplikace (většinou okna) události z klávesnice a změny polohy myši k serveru, která tyto události vyhodnotí a vykreslí je v prostředí, či předá aplikaci. Změny grafického vzhledu jsou zakódovány a přeneseny zpět ke klientovi, který je vykreslí na obrazovku uživatele. Protokol RDP verze 5.2 umí přesměrovat zvuk ke vzdálené aplikace ke klientovi na zvukovou kartu, ale neumí přesměrovat nahrávání zvuku z klientského mikrofonu k serverové aplikaci. Protokol RDP verze 7 dostupný v novějších verzí MS Windows 2008 R2 a Windows 7, případně pluginy třetích stran umí přesměrovat i nahrávání zvuku ke vzdálené aplikaci běžící na serveru. Při přenosu zvuku touto cestou jsou však použity zvukové kodeky, které jsou ztrátové a v předchozím výzkumu se ukázaly jako nevhodné pro přesnou analýzu lidského hlasu. Proto jsme vyvinuli vlastní metodu přenosu nahrávaného zvuku. Plugin v protokolu RDP, který je naprogramován v technologii.net, využívá samostatné kanály RDP spojení tak, aby po nich posílal a přijímal proprietární data (v našem případě řídící signály pro spuštění) a ukončení nahrávání a binární audio data ve formátu WAV. Kvalita přenášeného zvuku je tak pod kontrolou analytické aplikace RealVoiceLab[2]. Zvukové vzorky se v nahrávce několikrát opakují, analýza několika vybraných vzorků během nahrávání proto poskytne dostačující přehled o hlasovém rozsahu. Analytická část aplikace v reálném čase vyhodnocuje jen několik 181 Obrázek 1 Obrazovka aplikace RealVoiceLab s analýzou hlasového pole

vybraných vzorků zvuku za sekundu podle rychlosti s jakou je stačí analyzovat. Po dokončení nahrávání se analyzuje zbytek nahrávky už post-procesingově. Plugin protokolu RDP využívající technologii.net byl pro analýzu v reálném čase upraven tak, aby poskytoval vybrané vzorky matematické části aplikace k rychlé analýze z datového toku, který proudí z vyhrazeného RDP kanálu. Analýza zvuku Aplikace RealVoiceLab využívá numerické knihovny systému Matlab a ze zvukových dat ve formátu WAV analyzuje základní frekvenci (pomocí autokorelační funkce), vypočte okamžitou energii signálu a spektrální charakteristiky pomocí rychlé Fourierovy transformace. Vypočtená data jsou následně efektivně filtrována podle vlastností lidského hlasu, tak aby vytvořila konečné zobrazení hlasového pole (voice range profile, VRP) a jeho parametrů. Na virtuálních serverech se systémy MS Windows 2003 a MS Windows 2008 provozujeme aplikaci RealVoiceLab, která se automaticky spustí při přihlášení uživatele na vzdálenou plochu, připojí lokální disk a nastaví přesměrování nahrávání k lokálnímu mikrofonu. Obrázek 2 Porovnání průměrných obrysů zpěvních hlasových polí pěvecky trénovaných (modře) a netrénovaných (červeně) studentek. Zelené hvězdičky označují tóny se statisticky významným rozdílem v průměrně dosažené hladině akustického tlaku. 182

Obrázek 3 Porovnání rozložení parametru Singing power ratio s ohledem na pozici v hlasovém poli. Modré části ukazují část překrývajícího se hlasového pole s naměřeným parametrem statisticky významně vyšším pro první skupinu, červeně pro druhou skupinu, zelené části nevykazují významné rozdíly.. Výsledky Pokud je nahrávka pořízena kalibrovaným mikrofonem v předem dané vzdálenosti od obličeje, pak lze poměrně dobře porovnat analýzy hlasů různých lidí a najít statisticky významné rozdíly, které mohou sloužit k obecným závěrům či dalšímu výzkumu. Přípravek k upevnění mikrofonu na hlavu je doporučován uživatelům programu. Vzdálený přístup k analýze hlasu pomocí programu RealVoiceLab a serveru medicus.cesnet.cz byl využit v roce 2011 k několika vědeckým účelům. Významným příkladem spolupráce je výzkum Mgr. A. Kulanové z Katolické Univerzity v Ružomberku, která systém použila pro zpracování akustických nahrávek vzorku svých studentů, které vzdělává v oblasti liturgického zpěvu. Na základě uvedené spolupráce vznikla studie, připravená k publikování 183

v časopise Disputationes (SK), pod názvem: A. Kulanová, M. Frič: Komparácia náčuvových a počítačových akustických hodnotení speváckych vlastností hlasu. Dále byl systém použit při výzkumu porovnání vlastností hlasu pěvecky trénovaných a netrénovaných studentů pedagogiky na Pedagogické fakultě Univerzity Karlovy [3], viz též obrázek 2 a 3. Závěr Přenos zvuku pořízeného na lokálním počítači ke vzdálené aplikaci pomocí virtuálních kanálů v protokolu RDP je efektivním řešením pro systémy sledující koncept tenkého klienta i pro systémy, které chtějí obecně přenést balík dat z klienta na server. Využití této koncepce pro nasazení aplikace RealVoiceLab vede k jejímu použití z různých míst, kterým stačí připojení k Internetu rychlostí aspoň 1MBit/s. Poděkování Práce na tomto projektu byla podpořena z projektu Velká Infrastruktura CESNET a z fondu rozvoje sdružení CESNET č. 423 r. 2011. Literatura [1.] Frič M., Parametrizovaný fonetogram obecných řečových a hlasových projevů ParVRP, MARC Technologický list čís. 12, Zvukové studio HAMU, Praha 2007, http://web.hamu.cz/ zvuk/vyzkum/dokumenty/tl12x.pdf [2.] Kulhánek T., Frič M., Šárek M.: Vzdálená analýza lidského hlasu bezeztrátové nahrávání zvuku přes IP sítě, MEDSOFT 2010, sborník příspěvků, vydal Creative Connections s.r.o., ISSN 1803 8115 [3.] Králová M.Nároky učitelské profese na hlas pedagoga,diplomová práce, Pedagogická fakulta Univerzity Karlovy v Praze, katedra hudební výchovy, Praha 2011 Kontakt: Mgr. Tomáš Kulhánek Ústav patologické fyziologie 1.LFUK U Nemocnice 5 128 53 Praha 2 email: tomas.kulhanek@lf1.cuni.cz 184