ESKÉ VYSOKÉ U ENÍ TECHNICKÉ V PRAZE Fakulta elektrotechnická BAKALÁ SKÁ PRÁCE 2007 Old ich Slavata
ESKÉ VYSOKÉ U ENÍ TECHNICKÉ V PRAZE Fakulta elektrotechnická Katedra m ení M ení kvality p enosu hlasu pro sít typu VoIP Vedoucí práce Doc. Ing. Jan HOLUB Ph.D. Autor Old ich Slavata Praha 2007
Prohlášení Prohlašuji, že jsem svou bakalá skou práci vypracoval samostatn a použil jsem pouze podklady (literaturu, projekty, SW atd.) uvedené v p iloženém seznamu. Nemám závažný d vod proti užití tohoto školního díla ve smyslu 60 Zákona.121/2000 Sb., o právu autorském, o právech souvisejících s právem autorským a o zm n n kterých zákon (autorský zákon). V Praze dne.. podpis
---VLOŽIT ZADÁNÍ BAKALÁ SKÉ PRÁCE--- (originál nebo kopie)
Anotace Bakalá ská práce se zabývá testováním dostupných program pro IP telefonii s ohledem na možnosti vnit ního nastavení parametr p enosu a vliv t chto zm n na kvalitu p enosu hlasu. M ítkem kvality p enosu je parametr MOS zjišt ný algoritmem ITU-T P.563 pomocí programu Mosquito. Testované programy jsou: OpenPhone, Linphone, SJphone, AGE Phone a Tivi. Annotation This Bachelor Project deals with testing of several programs available for IP telephony. Tests have been focused to available settings of transmission parameters and effect of these settings to a voice transmission quality. Criterion of transmission quality is a parametr MOS investigated with an algorithm ITU-T P.563 in program Mosquito. The following programs have been tested: OpenPhone, Linphone, SJphone, AGE Phone and Tivi.
Obsah 1. Zkratky 2 2. Úvodní rozbor 3 2.1 Standard P.563 (3SQM) 3 2.2 Protokoly pro p enos hlasu v IP síti 4 2.2.1 H.323 4 2.2.2 SIP 5 3. Popis ešení 6 3.1 M ící soustava 6 3.2 Program Mosquito 8 3.3 Testované programy 9 3.3.1 OpenPhone 9 3.3.2 Linphone 12 3.3.3 SJphone 14 3.3.4 AGE Phone 16 3.3.5 Tivi 18 4. Záv r 19 5. Reference 20 6. P ílohy 21 1
1 Zkratky V textu jsou použity následující zkratky a anglické termíny IETF Internet Engineering Task Force ITU T International Telecommunications Union Telecommunications Standartization Sector MOS Mean Opinion Score PCM pulse-code modulation SNR Signal to Noise Ratio (odstup signál - šum) TCP Transfer Communication Protocol VoIP Voice over Internet Protocol (p enos hlasu v síti s protokolem IP) account jitter buffer mute length Speech Interruptions uživatelský ú et vyrovnávací pam délka ztlumení zvuku p erušení e i 2
2 Úvodní rozbor 2.1 Standard P.563 (3SQM) ITU-T norma P.563 je metoda pro jednostranné m ení kvality p enosu hlasu. Je použitelná pro odhad kvality p enosu v aplikacích, kde není k dispozici referen ní signál. Jako je monitorování sít nebo telefonní hovory na dlouhou vzdálenost s neznámým zdrojem hlasu. Po p edzpracování je signál analyzován n kolika odd lenými testy, které detekují sadu charakteristických parametr. P.563 má t i hlavní skupiny parametr, rozd lené do nezávislých blok (obr. 1): Analýza polohy hlasu a nep irozená e Mužský hlas Ženský hlas Silná robotizace Analýza šumu Nízký statický SNR Nízký segmentový SNR (šum související s obálkou signálu) P erušení, ztlumení, asové o íznutí 3
Obr. 1 ásti P.563 a jejich propojení do blok Výstupem m ení je parametr MOS - odhad kvality a srozumitelnosti e i pro poslucha e. Hodnota MOS se m že pohybovat mezi 1 (nejhorší) a 5 (nejlepší). Tabulka tab.1 ukazuje interpretaci hodnoty MOS p i hodnocení kvality p enosu. MOS Kvalita p enosu 4,4 4,0 žádoucí 4,0 3,6 akceptovatelná 3,6 2,6 dosažitelná 2,6-1 nedoporu ená Tab. 1 význam hodnoty parametru MOS 2.2 Protokoly pro p enos hlasu v IP síti V sou asné dob se pro p enos hlasu v IP sítích nej ast ji používají dva protokoly. Starší standard H.323 od ITU-T a nov jší SIP vytvo ený v IETF. 2.2.1 H.323 Protokol H.323 je komplexní protokol, který pokrývá všechny služby pot ebné pro p enos hlasu v IP síti. Pro p enos informací využívá služeb protokolu TCP, 4
což zajiš uje velkou spolehlivost p enosu, ale na druhou stranu m že zp sobit velké zpožd ní reakcí. Protokol definuje v síti n kolik center, na jejichž funk nosti závisí funk nost celého systému. To s sebou nese riziko selhání celku z d vodu poruchy jedné ásti. Logická struktura sít pro p enos hlasu pomocí H.323 je definována pomocí n kolika pojm : Entita každá komponenta H.323. Endpoint koncový bod, jakýkoliv koncový terminál, brána nebo podobná entita. Gateway brána, rozhraní sít H.323 s jinými sít mi Gatekeeper zajiš uje a ídí spojení pro všechny koncové body sít. Multipoint Controler ídí v reálném ase konferenci více uživatel. 2.2.2 SIP Na rozdíl od H.323 se standard SIP skládá z celé ady protokol realizujících pouze konkrétní ást služeb pot ebných pro p enos hlasu. To umož uje v p ípad pot eby snadnou úpravu celého systému. Cílem tv rc protokolu byla decentralizace ízení, protokol nedefinuje žádné uzlové body sít a komunikace probíhá výlu n mezi koncovými body. Tento p ístup podstatn zvyšuje odolnost systému proti výpadk m. Doporu ení IETF pro protokol SIP definuje ty i základní prvky sít : User Agent uživatelská aplikace umož ující obousm rnou komunikaci SIP Proxi Server provádí funkce jako: hledání ú astníka, sm rování hovoru, zprost edkování komunikace s jinou sítí. SIP Redirect Server sm ruje volání jiným server m v síti. SIP Registra slouží k registraci koncových uživatel. Standard H.323 je v sou asnosti již na ústupu. Vývoj v oblasti po íta ových sítí sm uje k maximální decentralizaci ízení, a proto se postupn p echází na modern jší a jednodušší protokol SIP. 5
3 Popis ešení ešení této práce se dá rozd lit na t i odd lené okruhy. 1. Vytipování program Pomocí internetových vyhledáva a specializovaných stránek bylo t eba najít vhodné programy, otestovat jejich funk nost a zp sob ovládání. Vzhledem ke zvolenému zp sobu testování bylo nutné, aby programy fungovaly v uzav ené síti bez p ístupu k internetu, to vy adilo z test n které rozší ené programy jako nap íklad Skype. Další asté d vody vy azení programu z testu byly: zpoplatn ní samotného programu nebo volání, požadavek na registraci nebo vytvo ení SIP account (nutný p ístup do internetu), složité ovládání programu nepoda ilo se zjistit zp sob vytá ení hovoru. Do testu bylo nakonec za azeno p t program z cca osmdesáti nalezených. 2. Získání vzork hlasu S pomocí níže popsané m ící soustavy (obr. 2) byly prom eny všechny programy v r zných kombinacích nastavení. 3. Testování jednotlivých vzork Nejprve bylo nutno všechny vzorky pomocí programu Adobe Audition 2.0 (obr. 4) upravit podle standardu P.563 (16bit, 8kSa/s, délka < 13s, >3,6s aktivní e i). Poté všechny vzorky otestovat algoritmem P.563 pomocí níže popsaného programu Mosquito. 3.1 M ící soustava Zdrojem zvuku byl CD p ehráva. Z n j byl zvuk veden do audio vstupu (mikrofon) PC 1 a do levého kanálu externí zvukové karty ( Sound Blaster Creative Labs Model No. SB0490, 24 bit ) jako referen ní signál pro p ípadné testování pomocí algoritm série P.8xx. P es k ížený sí ový kabel byl pomocí testovaného programu uskute n n telefonní hovor na PC 2. Z audio výstupu (sluchátka) PC 2 byl signál veden do pravého kanálu zvukové karty. V PC 3 se vzorky ukládaly v programu Creative Smart Recorder (obr. 3). 6
PC 1 k ížený UTP kabel PC 2 IN OUT L EXT. AUDIO R CD USB PC 3 Obr. 2 schéma m icí soustavy Obr. 3 Creative Smart Recorder 7
Obr. 4 Adobe Audition 2.0 3.2 Program Mosquito Mosquito je implementací standardu P.563 pro PC. Poskytuje p ehledné uživatelské rozhraní pro usnadn ní testování algoritmem P.563. Umož uje testovat jednotlivé soubory nebo celé složky. Výsledky ukládá do textových soubor. Program vytvo il ing. Ivan Vondrka v rámci své diplomové práce na kated e m ení FEL v roce 2005. 8
Obr. 5 Program Mosquito 3.3 Testované programy 3.3.1 OpenPhone OpenPhone je GUI klient projektu OpenH323. Uživatelské rozhraní je velmi jednoduché s možností m nit velikost a font písma. Ovládání je intuitivní, vytá í se p ímo ip adresa cílového po íta e. Z testovaných program nabízí nejširší možnosti nastavení parametr p enosu. protokol: H.323 domovská stránka: www.openh323.org možnosti nastavení: jitter buffer, kodeky: G.726, G.729, G.711, GSM-06.10, LCP-10 dostupnost: freeware velikost: 2809 kb 9
Obr. 6 Program OpenPhone Obr. 7 Nastavení programu OpenPhone 10
. Codek Nastavení jiter buffer MOS Speech Interruptions Mute length 01 MS - GSM 10ms 2,68 3,27 112 02 MS - GSM 50ms 2,98 0 47 03 MS - GSM 100ms 3,12 0 0 04 G.726-32K 10ms 1,31 3,36 250 05 G.726-32K 50ms 1,37 3,15 250 06 G.726-32K 100ms 1,38 2,75 250 07 G.729A 50ms 1,37 3,62 250 08 G.729A 50ms 1,58 3,99 250 09 G.711-Ulaw-64K 30 Frames 50ms 4,08 0,28 24 10 G.711-Ulaw-64K 50 Frames 50ms 3,56 0,45 169 11 G.711-Ulaw-64K 100 Frames 50ms 3,36 1,82 250 12 G.711-Alaw-64K 30 Frames 50ms 3,7 0,27 188 13 G.711-Alaw-64K 50 Frames 50ms 3,48 0 250 14 G.711-Alaw-64K 100 Frames 50ms 4,09 0 48 15 GSM-06.10 4 Frames 50ms 2,52 0,18 187 16 GSM-06.10 7 Frames 50ms 3,04 0 11 17 LCP-10 4 Frames 10ms 3,3 0 178 18 LCP-10 4 Frames 50ms 3,08 0 250 19 LCP-10 4 Frames 100ms 3,17 0,2 250 20 LCP-10 8 Frames 50ms 3,67 0 16 21 LCP-10 16 Frames 50ms 3,48 0,42 166 Tab. 2 výsledky programu Open Phone Nejlepších výsledk bylo dosaženo s použitím kodeku G.711. Rovn ž lze íci, že v tší jitter buffer v tšinou zvyšuje kvalitu p enosu. Vliv nastavení rámc (Frames) je diskutabilní, a z ejm závisí na použitém kodeku. 11
3.3.2 Linphone Linphone je softwarový telefon stejnojmenné francouzské spole nosti. Uživatelské rozhraní je jednoduché bez možnosti zm ny vzhledu. Ovládání je jednoduché a intuitivní. Program podporuje i videohovory. Parametry p enosu zle m nit nastavením kodeku. protokol: SIP domovská stránka: www.linphone.org možnosti nastavení: kodeky: SPEEX, PCMU, GSM, PCMA dostupnost: freeware velikost: 6357 Kb Obr. 8 program Linphone 12
Obr. 9 nastavení programu Linphone. Codek MOS Speech Interruptions Mute length 01 SPEEX 16000 3,48 0 0 02 SPEEX 8000 3,33 0,36 4 03 PCMU 4,01 0 4 04 GSM 2,97 0,16 2 05 PCMA 3,9 0,13 14 Tab. 3 výsledky programu Linphone Nejlepších výsledk dosáhl kodek PCMU (jiný název pro G.711). Pom rn dobrý je rovn ž kodek SPEEX vyvinutý speciáln pro aplikace VoIP jako open source. 13
3.3.3. SJphone SJ phone je softwarový telefon americko-ruské spole nosti SJ Labs. Uživatelské rozhraní je propracované a umož uje i m nit skin. Program nabízí široké možnosti uživatelského nastavení, ale parametry p enosu nastavit nelze. Jako jediný z testovaných program podporuje oba protokoly a umož uje zvolit, který bude použit pro volání. protokol: H.323, SIP domovská stránka: www.sjlabs.com možnosti nastavení: volba protokolu H.323 nebo SIP dostupnost: freeware velikost: 3798 kb Obr. 10 Program SJphone možnosti vzhledu 14
Obr. 11 nastavení programu SJphone. protokol MOS Speech Interruptions Mute length 01 SIP 3,21 0 17 02 H.323 2,96 0,37 34 Tab. 4 výsledky programu SJphone Protokol SIP umož uje kvalitn jší p enos, ale výsledek není p íliš dobrý ani u jednoho. 15
3.3.4. AGE phone AGE Phone je softwarový telefon japonské spole nosti Ageet, p vodn ur ený pro PDA. Uživatelské rozhraní je pokro ilé a propracované, podporuje skiny. Program obsahuje n které pokro ilé uživatelské funkce, nap. import kontakt z Outlooku. Ovládání není úpln jednoduché, pro navázání spojení je t eba vytá et ip adresu + íslo portu, nap. 10.0.0.14:36400. protokol: SIP domovská stránka: www.ageet.com možnosti nastavení: jitter buffer dostupnost: free tryal, 40$ velikost: 3631 kb Obr. 12 Program AGE phone 16
Obr. 13 nastavení programu AGE phone. jitter buffer MOS Speech Interruptions Mute length 01 MIN 2,41 0 0 02 +1 2,54 0 0 03 +2 2,26 0 0 04 +3 2,67 0 0 05 +4 2,62 0 0 06 +5 2,72 0 0 07 +6 2,76 0 0 08 MAX 2,81 0 0 Tab. 5 výsledky programu AGE phone Op t platí, že v tší jitter buffer znamená lepší kvalitu p enosu, ale i tak jsou výsledky programu velmi špatné. Zajímavé jsou nulové hodnoty p erušení a utlumení dané z ejm použitým kodekem a zp sobem rekonstrukce signálu. 17
3.3.5. Tivi Tivi je velmi jednoduchý softwarový telefon lotyšského výrobce. Uživatelské rozhraní je jednoduché bez možnosti nastavení. Ovládání je intuitivní, vytá í se p ímo ip adresa. Parametry p enosu nelze nijak nastavit. Program nepot ebuje instalaci, sta í spustit exe soubor. protokol: SIP domovská stránka: www.tivi.com možnosti nastavení: - dostupnost: freeware velikost: 348 kb Obr. 14 program Tivi. MOS Speech Interruptions Mute length 01 2,84 0 0 Tab. 6 výsledek programu Tivi 18
4 Záv r Nejlepší kvality p enosu dosáhly programy OpenPhone (MOS = 4,09) a Linphone (MOS = 4,01). Jediné tyto dva dosáhly kvality ozna ené jako žádoucí (MOS > 4). Naopak výsledky ostatních (SJphone 3,21, AGE phone 2,81, Tivi - 2,84) jsou pom rn špatné a nedosahují ani úrovn ozna ené jako akceptovatelná (MOS > 3,6). Z nam ených hodnot vyplývá, že nejv tší vliv na kvalitu p enosu má použitý kodek. Jednozna n nejlepší je kodek ITU-T G.711 n kdy ozna ovaný jako PCM. P t nejlepších výsledk bylo dosaženo tímto kodekem. Akceptovatelné kvality p enosu dosahují ješt kodeky SPEEX (Linphone) a LCP-10 (OpenPhone). Další parametr, který ovliv uje kvalitu p enosu, je Jitter buffer. V tšinou platí, že vyšší hodnota jitter buffer znamená lepší kvalitu p enosu. Naopak žádný vliv na kvalitu p enosu nemá použitý protokol. Nejlepší kvalitu sice zaznamenal OpenPhone (H.323), ale výsledek Linphone (SIP) je srovnatelný. U programu SJphone, který umož uje nastavit používaný protokol, naopak dosáhl lepšího výsledku SIP. 19
5 Reference [1] ITU-T P.563: Single-ended Metod for objektive speech quality assessment in narrow-band telephony applications,may 2004 [2] Vondrka, I.: Implementation of the P.563 (3SQM) standard in PC s using Lab/Windows CVI, Diploma Thesis, CTU FEE, May 2005 [3] Bazala, D.: Telekomunikace a VoIP telefonie. BEN technická literatura, 2006, ISBN 80-7300-201-9 [4] Saidl, M.: Telefonie v prost edí sítí TCP/IP, odborná doktorská studie, CVUT FEL, Únor 2002 [5] http://en.wikipedia.org/wiki/ [6] http://www.voip-info.org [7] http://www.ten.cz/iptelefonie/ [8] http://www.itu.ch 20
6 P ílohy P ílohou práce je CD-ROM, který obsahuje archiv nam ených vzork. 21