Tomáš Kulhánek, Marek Friš, Milan Šárek



Podobné dokumenty
VZDÁLENÁ ANALÝZA LIDSKÉHO HLASU V REÁLNÉM ČASE. Tomáš Kulhánek 1,2, Marek Frič 3, Jaroslav Hrb 3

Úvod. T. Kulhánek, M. Frič, M. Šárek CESNET z.s.p.o., HAMU

TC-502L TC-60xL. Tenký klient

Cloudy a gridy v národní einfrastruktuře

TECHNOLOGICKÝ LIST čís. 46

TC-502L. Tenký klient

Vzdálený přístup k počítačům

Elektronická komunikace

REMARK. Perfektně popsaný záznam. Uživatelský manuál

Gymnázium a Střední odborná škola, Rokycany, Mládežníků 1115

RHEV for Desktops & SPICE příklad nasazení v akademickém prostředí. Milan Zelenka, RHCE Enlogit s.r.o.

Co je doma, to se počítá, aneb Jak ušetřit na komunikaci. Petr SOLNAŘ / Liberecká IS, a.s. Michal NOVÁK / SOITRON CZ, s.r.o

MetaCentrum. Tomáš Rebok MetaCentrum NGI, CESNET z.s.p.o. CERIT-SC, Masarykova Univerzita Olomouc,

SADA VY_32_INOVACE_PP1

Linux a Vzdálená plocha

IMPLEMENTACE OPERAČNÍHO SYSTÉMU LINUX DO VÝUKY INFORMAČNÍCH TECHNOLOGIÍ

Záznamy přednášek a streaming

Jakub Šesták. ESEJ DO PŘEDMĚTU DIGITÁLNÍ KNIHOVNY

Integrace datových služeb vědecko-výukové skupiny

TELEFONNí LiNKA PREMiUM PRŮVODCE APLIKACí T UC-ONE - PC

TDP RPort 1.0. uživatelská příručka. 12. července 2007 Na slupi 2a, Praha 2

X32MKO - Mobilní komunikace. projekt č.1 Sítě DECT, přenos hlasu, výstavba sítě a její rozšíření

Inteligentní řešení kamerového systému

Modemy a síťové karty

Karel Bittner HUMUSOFT s.r.o. HUMUSOFT s.r.o.

Modulární monitorovací systém Gradient Digitální systém pro záznam, archivaci a vyhodnocení telefonie.

Multimédia. Jan Růžička Konference CESNET 2019

Elektronická komunikace

PRODUKTY. Tovek Tools

2N NetSpeaker. Obsah. IP Audio Systém. Uživatelské manuály 1.5

TECHNOLOGIE ELASTICKÉ KONFORMNÍ TRANSFORMACE RASTROVÝCH OBRAZŮ

VirtualBox desktopová virtualizace. Zdeněk Merta

JAK ČÍST TUTO PREZENTACI

Milan Šárek, Leoš Rejmont, Jiří Navrátil, Vladimír Třeštík

V tomto zařízení jsou implementovány veškeré komponenty pro firemní komunikaci včetně kompletních hlasových a mnoha dalších uživatelských služeb.

PSK2-14. Služby internetu. World Wide Web -- www

Praktické využití M-learningu

SME Terminál + SmeDesktopClient. Instalace. AutoCont CZ a.s.

VYTVOŘENÍ / EDITACE RDP SOUBORU

Nahrávací systém TriREC

Základní komunikační řetězec

Zápočtová úloha z předmětu KIV/ZSWI DOKUMENT SPECIFIKACE POŽADAVKŮ

DODATEČNÉ INFORMACE K ZADÁVACÍM PODMÍNKÁM Č. 4

Uživatelský manuál WEB SERVICE V3.0 IP kamer Dahua

.NET Framework verze Program pro připojení ke vzdálené ploše (RDC) verze

OVLÁDACÍ A MONITOROVACÍ SYSTÉM ID 6.2 typ

SSL Secure Sockets Layer

Formy komunikace s knihovnami

Avaya Scopia verze 8.3

7. Aplikační vrstva. Aplikační vrstva. Počítačové sítě I. 1 (5) KST/IPS1. Studijní cíl. Představíme si funkci aplikační vrstvy a jednotlivé protokoly.

MATLABLINK - VZDÁLENÉ OVLÁDÁNÍ A MONITOROVÁNÍ TECHNOLOGICKÝCH PROCESŮ

Network Measurements Analysis (Nemea)

Služby e-infrastruktury CESNET. Tomáš Košňar CESNET z. s. p. o.

Obsah. Kapitola 1. Předmluva 11 O této knize 13 Konvence...13

VÝPOČETNĚ NÁROČNÉ APLIKACE S VYUŽITÍM VIRTUALIZACE PRACOVNÍCH STANIC NA BÁZI INTEGRACE TECHNOLOGIÍ MICROSOFT VDI A SUN RAY

Webové rozhraní pro datové úložiště. Obhajoba bakalářské práce Radek Šipka, jaro 2009

Popis výukového materiálu

Další služby internetu

TSM for Virtual Environments Data Protection for VMware v6.3. Ondřej Bláha CEE+R Tivoli Storage Team Leader. TSM architektura IBM Corporation

Virtuální učebna: VMware VDI zefektivňuje výuku, zjednodušuje správu a snižuje náklady

Tovek Tools. Tovek Tools jsou standardně dodávány ve dvou variantách: Tovek Tools Search Pack Tovek Tools Analyst Pack. Připojené informační zdroje

Proč počítačovou sí? 9 Výhody sítí 9 Druhy sítí 9. Základní prvky sítě 10 Vybavení počítače 10 Prvky sítě mimo PC 10 Klasické dělení součástí sítí 10

Gridy v České republice. Luděk Matyska Masarykova univerzita v Brně CESNET, z.s.p.o.

Možnosti využití dat RÚIAN poskytovaných VDP pomocí webových služeb

File Transfer Protocol (FTP)

Očekávané trendy v telemedicíně

Identifikátor materiálu: ICT-1-19

Otevřená platforma VMS systému od firmy AxxonSoft

OSNOVA. 1. Definice zvuku a popis jeho šíření. 2. Rozdělení zvukových záznamů (komprese) 3. Vlastnosti jednotlivých formátů

STŘEDOŠKOLSKÁ ODBORNÁ ČINNOST. Obor SOČ: 18. Informatika. Školní sdílení PC obrazovek. School sharing PC screens

SIMATIC S GPRS. Micro Automation. Promoters Meeting October Aplikace pro GPRS. Vzdálená stanice. Server SINAUT MICRO SC.

Prostředí pro spolupráci Multimédia

ICT plán školy pro období od do

Novinky z vývoje v MetaCentru

Michal Andrejčák, Seminář Energetika v průmyslu, Hotel Vista Dolní Morava, Možnosti monitorování a ovládání Zpracování dat z rozvoden

Zajištění rozvoje komunikační a systémové infrastruktury MPSV_I.

VÝDAJE NA POŘÍZENÍ SW, VČ. AGEND ÚŘADU VÝDAJ KDY ZPŮSOBILÝ KDY NEZPŮSOBILÝ Pořízení nového operačního systému

Aplikace akustiky koncertních sálů, hal, kostelů a dalších interpretačních prostor na nahrávku hry na klasické nástroje

Inovované řešení VDT s plynem OTE-COM

XTB VPS. XTB Virtual Private Server manuál

Popis programu EnicomD

PROTOKOL RDS. Dotaz na stav stanice " STAV CNC Informace o stavu CNC a radiové stanice FORMÁT JEDNOTLIVÝCH ZPRÁV

Důvěryhodná výpočetní základna v prostředí rozsáhlých IS státní správy

Připojení k internetu pro domácnosti

Úložiště certifikátů pro vzdálené podepisování

Testování Triple play služeb & EtherSAM

Systémy pro měření, diagnostiku a testování prototypů II. Odůvodnění vymezení technických podmínek podle 156 odst. 1 písm. c) ZVZ

SYSTÉMY PRO CALL CENTRA

HiPath HG 1500 Multimediální komunikace ve společnostech střední velikosti

Instalace a konfigurace ústředen Asterisk. Bc. Marek Červenka, IPEX a.s.,

Systémy pro sběr a přenos dat

Operační systém. Mgr. Renáta Rellová. Výukový materiál zpracován v rámci projektu EU peníze školám

MOBILNÍ KOMUNIKACE LABORATORNÍ CVIČENÍ. VoIP přenos hlasu v prostředí IP. MAREK Michal Po 10:00. ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ Fakulta elektrotechnická

Menu =Prijimace

Nové vývojové nástroje i5/os Rational Developer for System i V7.1

ABRA Software a.s. ABRA on- line

představte si DVR který umožňuje oddělené nahrávání a přenos obrazu pomocí systému Dual Codec SHR-5040/5042 SHR-5080/5082 SHR-5160/5162

Inovace bakalářského studijního oboru Aplikovaná chemie

Typy samostatných úloh PSI 2005/2006

High-definition video ve výuce

Transkript:

T. Kulhánek, M. Frič, M. Šárek VZDÁLENÁ ANALÝZA LIDSKÉHO HLASU - BEZEZTRÁTOVÉ NAHRÁ- VÁNÍ ZVUKU PŘES IP SÍTĚ. Tomáš Kulhánek, Marek Friš, Milan Šárek Anotace Aplikace ParVRP vyvinutá Výzkumným centrem hudební akustiky HAMU v prostředí Matlab umožňuje vytvoření fonetogramu a další následné analýzy jakými jsou plocha hlasového pole, poloha nejčetnějších zastoupení, statistiky hlasových projevů. V příspěvku představíme nasazení aplikace ParVRP ve virtualizovaném systému XEN a přístupnou přes protokol RDP v síti CESNET 2 a obecně Internetu. Během vývoje jsme vyzkoušeli několik možností pořizování nahrávek ze zvukové karty klientského počítače ke vzdálené aplikaci, neboť tato možnost není standardně v protokolu RDP k dispozici. RDP protokol verze 7.0 dostupný od nejnovějších systémů Windows Server 2008 R2 přenáší zvuk pomocí ztrátové komprese, která vede ke zkresleným výsledkům následné analýzy hlasu. Modifikace rozšířeného protokolu RDP v 5.2 pomocí Sound over RDP přináší podobný problém zkresleného zvuku přeneseného ke vzdálené aplikaci. Proto jsme vyvinuli bezeztrátovou možnost nahrávání zvuku přes IP sítě, která přináší stejnou kvalitu pořízeného záznamu jako na lokálním počítači, oproti předchozím ztrátovým kompresím je zhruba 10 krát náročnější na propustnost sítě a pro potřeby průběžné realtime analýzy potřebuje propustnost skoro 1 MBit/s, která je dosažitelná v běžných v lokálních sítích a je běžně dosažitelná i v organizacích připojených do sítě CESNET2 Klíčová slova: fonetogram, vzdálená plocha, RDP, přenos zvuku Úvod Ve spolupráci Hudební akademie múzických umění (HAMU), Ústřední vojenské nemocnice, Pardubickou krajskou nemocnicí a sdružením CESNET z.s.p.o. pracujeme na projektu vzdálených vyšetření v oblasti otorhinolaryngologické medicíny[1], konkrétně v oblasti pořízení a analýza hlasového signálu. Ve výzkumném centru hudební akustiky HAMU jsme vyvinuli aplikaci ParVRP [2], která provede analýzu hlasového signálu z pořízených nahrávek, nebo za běhu aplikace s využitím mikrofonu připojeného ke zvukové kartě počítače. Aby tuto aplikaci mohli využívat spolupracovníci z různých míst republiky, umístili jsme aplikaci do virtuálního prostředí v rámci již existující pilotní infrastruktury, která byla budována v minulosti pro potřeby gridového projektu Globus MEDICUS a zpřístupnili ji pomocí protokolu RDP (Remote Desktop Protocol). Tato koncepce se obecně nazývá tenkým klientem. Klientský počítač má jednoduchý prohlížeč a veškerá aplikační logika je provozována na straně tlustého serveru. Protokol RDP od verze 5.2 přenáší od klienta události z klávesnice a změny polohy myši k serveru, která tyto události vyhodnotí 96

VZDÁLENÁ ANALÝZA LIDSKÉHO HLASU - BEZEZTRÁTOVÉ NAHRÁVÁNÍ ZVUKU PŘES IP SÍTĚ a vykreslí je v prostředí, či předá aplikace a změny grafického vzhledu jsou zakódovány a přeneseny zpět ke klientovi, který je vykreslí na obrazovku uživatele. Protokol RDP verze 5.2 umí přesměrovat zvuk ze vzdálené aplikace ke klientovi na zvukovou kartu, ale neumí přesměrovat nahrávání zvuku z klientského mikrofonu k serverové aplikaci. Tato funkcionalita je dostupná až od RDP verze 7 dostupné od MS Windows 2008 R2, případně lze tuto funkcionalitu doinstalovat pluginem třetí strany. Nicméně v minulosti jsme ukázali, že obě dostupná řešení pro přesměrování zvuku z mikrofonu k serveru pomocí protokolu RDP jsou ztrátová v kvalitě, dochází k ořezání vysokých či nízkých frekvencí i v kvantitě, dochází ke ztrátám některých úseků nahrávky. Tudíž nejsou příliš vhodná pro přesnou analýzu lidského hlasu[3]. Navíc tyto a další metody např. VoIP technologie či obecně přenosu zvuku přes IP sítě jsou navrhovány s požadavkem realtime přenosu a poslechu zvuku, tudíž odchylky v rychlosti přenosu zvuku vyrovnávají dynamicky dočasným zhoršením kvality tím i objemu přenášené zvukové frekvence. V našem případě je balík audio dat jen balík obyčejných dat, které chceme přenést beze ztrát kvality a jedno v jakém pořadí pakety k cíli dojdou a jestli a k jakému dojde zpoždění. V této práci představíme řešení přenosu zvukového signálu z mikrofonu lokálního počítače až k aplikaci, které rozšiřuje protokol RDP, používající k přenosu zvuku vyhrazený RDP kanál s možností použití nastavitelné komprese audio signálu a to hlavně bezeztrátové. Obrázek 1: Obrazovka aplikace parametrického fonetogramu ParVRP s analýzou hlasového pole v pravé části okna 97

T. Kulhánek, M. Frič, M. Šárek 98 Analýza zvuku Ve Výzkumném centru hudební akustiky HAMU bylo vytvořeno uživatelské prostředí pro analýzu hlasových signálů ParVRP parametrizované hlasové pole [3] pracující v postprocessingovém módu. Aplikace využívá numerické knihovny systému Matlab. Program umožňuje ze zvukových dat ve formátu WAV analyzovat základní frekvenci (pomocí autokorelační funkce), vypočte okamžitou energii signálu a spektrální charakteristiky pomocí rychlé Fourierovy transformace. Vypočtená data jsou následně efektivně filtrována podle vlastností lidského hlasu, tak aby vytvořila konečné zobrazení hlasového pole (voice range profile, VRP) a jeho parametrů. Systém hlavně umožňuje efektivní segmentaci signálů na jednotlivé typy vyšetřovaných hlasových úkonů. Přesměrování nahrávání přes RDP Na virtuálních serverech se systémy MS Windows 2003 a MS Windows 2008 provozujeme aplikaci ParVRP, která se automaticky spustí při přihlášení uživatele na vzdálenou plochu. Protokol RDP jsme modifikovali na klientské straně pluginem, který čeká na signál k zahájení a ukončení nahrávání a souběžného přenosu zvuku přes vyhrazený virtuálního kanálu v navázaném RDP spojení a na serverové straně samostatným modulem otvírajícím virtuální kanál. Na serverové straně běží modul, který posílá signál k zahájení a k ukončení nahrávání a přijímá binární data nahrávky standardně ve formátu WAV a buďto je ukládá do souboru, nebo je předává aplikaci ParVRP k dalšímu zpracování. Modul používá funkce z knihovny Remote Desktop Service API (Wtsapi32.dll) a otvírá pojmenovaný virtuální kanál, který je používán pro posílání signálu a příjem dat [6]. Plugin na klientské straně jsme vyvinuly pro platformu Windows i Linux. Plugin na klientské straně v Linuxu je realizován jako aplikace, která čte zprávy ze standardního vstupu a zapisuje binární data na standardní výstup. Modifikovali jsme RDP klienta rdesktop pomocí záplaty přidávající nový parametr: -r addin:<channelname>:</path/to/executable>[:arg1[:arg2:]...] Ten spustí program a veškerou komunikaci z RDP kanálu <channelname> přesměrovává na standardní vstup programu a výstup programu přesměrovává zpět do RDP kanálu.[5] Sekvenční diagram na Obrázku 2. ukazuje sekvenci při zahájení a ukončení nahrávání. Plugin jsme implementovali jako třídu RecordPlugin. Ze serveru přijde asynchronní zpráva start, přes standardní výstup (objekt Console) tato zpráva doputuje k třídě RecordPlugin, která vyvolá nahrávání s předvolenými parametry tak, že výsledný WAV je v průběhu nahrávání již přesměrováván na standardní výstup. Ten je kódován do RDP kanálu k serveru. Pokud server chce ukončit nahrávání, pošle signál stop, který se obdobným způsobem distribuuje až k třídě RecordPlugin. Zpátky se ještě pošle ukončovací sekvence WAV. Serverový modul i klientský plugin musí poslouchat tentýž kanál, který je identifikován svým jménem. Prototyp

VZDÁLENÁ ANALÝZA LIDSKÉHO HLASU - BEZEZTRÁTOVÉ NAHRÁVÁNÍ ZVUKU PŘES IP SÍTĚ klientského pluginu i serverového modul jsou napsány v C# a zkompilované do.net. Klientská část v Linuxu využívá k vykonávání.net aplikací projekt MONO [7] a pro digitalizaci nahrávání na klientovi arecord[8]. Obrázek 2: Sekvenční diagram při zahájení a ukončení nahrávání pomocí pluginu pro rdesktop. Výsledky Pokud je zapnuto nahrávání z klientské strany, datový tok z klienta k serveru dosahuje průměrně 98 kb/s. Pokud je klient připojen pomalejším připojením, dochází ke kumulaci neposlaných dat na klientské straně a ke zpoždění doručení dat, které ale nemá vliv na kvalitu pořízeného záznamu. Pro srovnání sound recording redirection v protokolu RDP v 7 je datový tok od klienta k serveru průměrně 10 kb/s a obdobné výsledky dává Sound over RDP v protokolu RDP v 5.2. Závěr Přenos zvuku pořízeného na lokálním počítači ke vzdálené aplikaci pomocí virtuálních kanálů v protokolu RDP je efektivním řešením pro systémy sledující koncept tenkého klienta i pro systémy, které chtějí obecně přenést balík dat z klienta na server. Toto řešení využívá již navázané RDP spojení, tudíž není nutné navazovat a konfigurovat nové extra síťové spojení pro přenos audio dat a konfigurovat firewally na cestě. Toto řešení však není vhodné např. pro využití v IP telefonii, neboť plýtvá kapacitou sítě a nereaguje na výkyvy 99

T. Kulhánek, M. Frič, M. Šárek v latenci IP sítě. Uvedený způsob přenosu audio signálu je náročný k přenosové kapacitě sítě, oproti řešením se ztrátovou kompresí využívající různé kodeky je až 10x náročnější. S uvažovaným nasazením v rámci vysokorychlostní sítě CESNET2 jsou však tyto nároky zdaleka naplněny s dostatečnou rezervou. Díky bezeztrátovému přenos audio signálu je tento typ nasazení aplikace na vzdálený server a zpřístupnění lokálních zdrojů včetně nahrávání z lokálního mikrofonu plnohodnotnou náhradou za lokální instalaci na klientském počítači. Toto řešení je navíc akceptovatelné pro zamýšlené nasazení této služby v klinické praxi, kdy pacient nemusí dojíždět na specializované pracoviště, případně specialisté nemusejí dojíždět na různá pracoviště, ale vyšetření hlasu může být prováděno na dálku. Plánujeme systém rozšířit o plugin pro klientský prohlížeč vzdálené plochy na platformě MS Windows a doplnit možnost komprese při přenášení audio dat. Poděkování Tento příspěvek vznikl za podpory projektu Výzkumného centra hudební akustiky (za podpory Ministerstva školství a mládeže, ČR Pr.No. 1M6138498401) na Hudební fakultě Akademie múzických umění v Praze a s podporou výzkumného záměru MŠMT Optická síť národního výzkumu a její nové aplikace ve sdružení CESNET z.s.p.o. Literatura [1.] Šárek M., Kulhánek T., Nové směry medicínských aplikací sdružení CESNET, MEDSOFT 2009. (Milena Ziethamlová Ed.) Praha: Agentura Action M, Praha 2008, str. 145-148. ISBN 978-80-904326-0-4 [2.] Frič M., Parametrizovaný fonetogram obecných řečových a hlasových projevů ParVRP, MARC-Technologický list čís. 12, Zvukové studio HAMU, Praha 2007, http://web.hamu.cz/ zvuk/vyzkum/dokumenty/tl12x.pdf [3.] Kulhánek T., Frič M., Šárek M.: Vzdálený přístup k virtuálním výukovým a výzkumným aplikacím - podpora foniatrických vyšetření, MEFANET 2009 sborník přednášek, Brno, ISBN: 978-80-7392-118-7 [4.] Remote Desktop Protokol http://msdn.microsoft.com/en-us/library/aa383015(vs.85). aspx [5.] Yakimenko S., Writing plugins for Rdesktop, The Code Project, Apriorit Inc, 1.12.2009, Web, http://www.codeproject.com/kb/cross-platform/writing-plugins-for-rd.aspx [6.] Selvin, How to Write a Terminal Services Add-in in Pure C#, The Code Project, 14.11.2006, Web, http://www.codeproject.com/kb/system/tsaddinincs.aspx [7.] Mono, Cross platform, open source.net development framework,web, 2.2.2010, http:// www.mono-project.com/main_page [8.] Kysela J., arecord, Linux manual page, 2.8.2001, Web, http://linuxcommand.org/man_ pages/arecord1.html 100

VZDÁLENÁ ANALÝZA LIDSKÉHO HLASU - BEZEZTRÁTOVÉ NAHRÁVÁNÍ ZVUKU PŘES IP SÍTĚ Kontakt: Mgr. Tomáš Kulhánek CESNET z.s.p.o. Zikova 4 16000 Praha 6 e-mail: tomaton@centrum.cz 101