POSUZOVÁNÍ KVALITY HLASU Ing. Miloslav BRADA, Ing. Jan ZELENKA pracoviště: ČVUT FEL, Katedra telekomunikační techniky; mail: bradam2@fel.cvut.cz; zelenj2@fel.cvut.cz Abstrakt: Posuzování kvality hlasu je nedílnou součástí při měření kvality služby. S nástupem VoIP technologií se mění požadavky kladené na měřící technologie, nástroje a postupy. Mizí typická rušení známá z analogových telefonních sítí a naopak objevují se jiná, specifická pro digitální přenos hlasu. Sledování kvality přeneseného řečového signálu umožňuje monitorovat a zlepšovat parametry sítě, které se ve výsledku podílejí na spokojenosti zákazníka a jeho ochoty více využívat poskytované služby. 1 Kvalita řeči ve VoIP Kvalita řeči je pojem, který se začal často používat v době, kdy se na poli klasických telekomunikačních sítí začaly vynořovat technologie, které měly za úkol těmto klasickým sítím konkurovat. Tato konkurenceschopnost byla založena na nejrůznějších kategoriích vlastností spojení mezi dvěma účastníky: levnější volání, mobilita účastníků, přínos nových služeb, kvalita služeb atd. Poslední zmíněný pojem kvalita služeb úzce souvisí s termínem kvalita řeči, který dominuje především v sítích VoIP. Telefonování přes internetovou síť je v časovém měřítku již, dá se říci, historická záležitost, avšak právě v dnešní době dochází k velmi prudkému rozvoji tohoto druhu mezilidské komunikace a otázka jako je kvalita hovoru (kvalita řeči) je velmi klíčovou záležitostí. 1.1 Definice kvality řeči Úkol definovat kvalitu řeči je velmi obtížný, protože kvalita je velmi individuální záležitostí. Ať už dojdeme sebelepším způsobem k nějakému číslu reprezentující ohodnocení kvality nějakého úseku hovoru, vždy se najde někdo, komu bude daná kvalita nadmíru vyhovovat, a naopak někdo, kdo bude danou kvalitu považovat za nepřijatelnou. Dá se dokonce říci, že jeden a ten samý pozorovatel bude považovat kvalitu jistého degradovaného hovorového signálu po každém pozorování jinak, protože bude záležet i na tom, jakou má pozorovatel například náladu nebo bude ovlivněn jiným hovorovým signálem, který mu byl přehrán dříve. Je tedy prakticky nemožné označit nějaký úsek hovorového signálu (promluvu) konkrétním ohodnocením, které bude vždy, všude a pro každého stejné. Terminologii problematiky měření kvality hlasu upravuje doporučení ITU-T P.10, viz [1] Toto doporučení obsahuje stručnou charakteristiku a případně další odkazy na jednotlivé termíny vyskytující v oblasti měření kvality, jejím cílem je sjednocení této terminologie a zabránění nejasnostem v interpretaci naměřených výsledků, bez ohledu na to, jakým způsobem byly tyto výsledky získány. Samotný termín MOS (Mean Opinion Score) je definován normou ITU-T P.10 jako hodnota z rozsahu předdefinované stupnice, pomocí které testovací subjekty vyjadřují své hodnocení výkonnosti telefonního přenosového řetězce ve smyslu konverzačním nebo pouze poslechovém. Podle doporučení ITU-T P.800 (viz [2]) existuje několik druhů stupnic, používá se právě ta, která je pro daný prováděný experiment vhodná. Nejčastěji používanou stupnicí je stupnice poslechové kvality, která je definována v tabulce 1. Jedná se o pětibodovou stupnici s pevně daným číselným rozsahem 1 5. Jednotlivým hodnotám odpovídá kvalitativní ohodnocení hlasového signálu. Toto slovní ohodnocení je rovněž přesně definované a mělo by být neměnné. Pro lepší pochopení se ještě často uvádí kratší slovní doprovod, který lépe postihuje ona jednoslovná ohodnocení. Výsledná kvalita se pak označuje anglickým termínem mean listening-quality opinion score, zkráceně pouze mean opinion score, z toho pak vyplývá označení jednotky MOS. Další možnou stupnicí, která se v určitých případech používá pro ohodnocení kvality je stupnice poslechového úsilí s jednotkami MOS LE (mean listening-effort opinion score), která vyjadřuje úsilí vynaložené subjektem k porozumění smyslu věty, nebo stupnice preference hlasitosti s jednotkami MOS LP (mean loudnesspreference opinion score), která vyjadřuje míru spokojenosti s hlasitostí řečového signálu. Doporučení umožňuje použít i další druhy stupnic, pokud je to vyžadováno kompozicí testu, možnosti dalších stupnic jsou uvedeny v literatuře, viz [3]. strana 55
MOS Kvalita Popis 5 Vynikající Neznatelné rušení 1 4 Dobrá Rušení lze rozpoznat, ale není obtěžující 3 Průměrná Rušení lze rozpoznat a mírně obtěžuje. 2 Nízká Rušení obtěžuje, je nutno vyvinout úsilí při snaze porozumět. 1 Špatná Rušení velmi obtěžuje, řeč je nesrozumitelná. Tab. 1: Hodnoty stupnice MOS Až doposud jsme se nezabývali tím, jaké existují způsoby pro ohodnocení hlasového signálu. Pouze ve zkratce zde také nyní uvedeme 3 zásadní způsoby jak hodnotit z hlediska kvality řeči pozorovaný systém. Prvním způsobem je, jak už bylo naznačeno, subjektivní testování, kdy je hodnocení systému ponecháno pouze na člověku a jeho subjektivním dojmu. Druhým velmi častým způsobem je hodnocení pomocí objektivních měřících metod, kde využíváme více či méně sofistikovaných metod za pomoci výpočetních schopností počítačů nebo jiného speciálního hardwaru. Třetí způsob ohodnocení kvality systému je poněkud odlišný od prvních dvou. Využívá se pouze parametrického popisu daného systému a empirických hodnot kvality, které jsou daným parametrům vlastní. Takovýto způsob nezohledňuje dynamické jevy, které mohou v systému nastat a proto se tento způsob používá zejména k přibližnému popisu a tedy k odhadu kvality při návrhu nějakého nového systému. Později budou první dva způsoby hodnocení kvality detailněji popsány. Dále je třeba rozlišovat další dvě skutečnosti. Experiment k posouzení kvality systému lze koncipovat buď jako poslechový, nebo jako konverzační. U poslechového experimentu je vyžadována přítomnost jednotlivých subjektů, které hodnotí kvalitu hlasového signálu na konci telekomunikačního řetězce. Ve skutečnosti ani není potřeba, aby testující subjekt měl k dispozici telekomunikační systém, v praxi se realizují poslechové testy tak, ze jsou subjektu přehrávány zvukové nahrávky do sluchátek například z počítače. U konverzačního experimentu je do hodnocení kvality zapojena dvojice subjektů. Spojení těchto subjektů zajišťuje celý telekomunikační řetězec. Podle toho, jaký způsob hodnocení kvality systému se používá, se rozlišují i jednotky kvality. Přehled všech variant MOS hodnocení je shrnut v následující tabulce 2 a lze jej rovněž nalézt v doporučení ITU-T P.800.1, viz [4], což je v podstatě doplnění doporučení P.800. MOS Poslechový Konverzační Subjektivní MOS LQS MOS CQS Objektivní MOS LQO MOS CQO Odhadovaný MOS LQE MOS CQE Tab. 2: Upřesňující varianty MOS skóre Vidíme, že první úhel pohledu určuje, zda se jedná o subjektivní, objektivní nebo odhadovaný MOS. Druhý úhel pohledu určuje, zda se jedná o poslechový nebo konverzační experiment. Kombinací získáme tedy šest variant MOS faktoru. Na tomto místě je potřeba zdůraznit, že většinou se v praxi setkáváme pouze s prostým označením kvality s jednotkou MOS bez dalšího upřesňujícího vysvětlení. Je potom tedy na odhadu čtenáře, aby si tuto jednotku zařadil do správné kategorie pro případné porovnání s dalšími systémy. Jak uvidíme později, může se stát, že hodnota MOS-LQO nemusí být adekvátní k jednotce MOS-LQS a je třeba učinit přepočet (viz kap. 3). 1 Nejlepší možná dosažitelná kvalita; odpovídá přímému rozhovoru dvou osob. strana 56
Vstupní řečový signál Telekomunikační přenosový řetězec Výstupní řečový signál Parametry přenosového řetězce Objektivní test Subjektivní test Odhad MOS MOS-LQO MOS-LQE MOS-LQS Obr. 1: Vztah mezi jednotlivými typy MOS hodnocení Pro lepší ilustraci je na obrázku 1 znázorněna ukázka toho, kde vznikají v telekomunikačním systému jaké jednotky MOS. U objektivního testování se v některých případech (viz kap. 4) užívá k určení kvality pouze výstupního řečového signálu. Při přenosu řeči telekomunikační sítí dochází ke snižování kvality. Na snižování se podílí jednak klasické jevy jako jsou echo a zpoždění, ale také u VoIP především výpadky paketů. Na zřetel je nutno brát také to, že kódování řeči prostřednictvím kodeku samo o sobě už způsobí degradaci. V tabulce 3 jsou uvedeny běžné kodeky používané v internetové telefonii a maximální MOS, který s nimi lze dosáhnout. Kodek Datový tok [kbit/s] MOS skóre ITU-T G.711 64 4,2 ilbc 15,2 4,14 ITU-T G.729 8 3,92 GSM EFR 12,2 3,8 ITU-T G.729a 8 3,7 ITU-T G.728 LD-CELP 16 3,61 ITU-T G.729 x2 8 3,27 ITU-T G.729 x3 8 2,68 Tab. 3: MOS skóre jednotlivých kodeků 1.2 Měření kvality řeči K získání MOS skóre potřebujeme provést test vzorku řeči. Jak už bylo řečeno, existují vypracované metodiky pro realizaci těchto testů. Základní dělení testů je podle toho, zda hodnocení provádí testující subjekt testy subjektivní nebo matematický algoritmus testy objektivní. Role subjektivních testů je nezpochybnitelná, ale jejich největší nevýhodou je pracnost přípravy, pomalá rychlost realizace a následného vyhodnocení a v neposlední řadě také finanční náročnost. Náročnost přípravy subjektivních testů nespočívá jen v přípravě vhodného prostředí a poslechových řečových vzorků, ale v nutnosti mít k dispozici potřebné množství testujících subjektů. Navíc každý testující strana 57
subjekt se může zúčastnit testu jen jednou za jisté časové období a neměl by mít odborné znalosti vzhledem k jevům, které posuzuje. Nesplnění těchto podmínek vede ke zkreslení výsledků až k znehodnocení celého testu. Objektivní metody mají oproti subjektivním řadu výhod, zejména možnost jejich nepřetržitého běhu a vyhodnocení výsledků v reálném čase. Jejich přesnost a spolehlivost ale není taková, aby dokázaly zastoupit testování pomocí skutečných posluchačů. Jejich role je tedy spíše informační, mohou být použity ke sledování trendů nebo k detekci prudkého zhoršení kvality. Směrodatné ale prozatím zůstávají testy subjektivní. 2 Metody pro měření kvality řeči 2.1 Subjektivní metody Subjektivní metody jsou založeny na poslechových nebo konverzačních testech, při kterých posluchači hodnotí kvalitu přehrávaných promluv. Pro subjektivní testy existují různé metodiky vyhodnocování: ACR (Absolute Category Rating) Quantal-Response Detectability Tests DCR - Degradation Category Rating method CCR - Comparison Category Rating Metod The treshold method Nejčastější způsob vyhodnocení je ACR, který ve svém principu využívá přímého hodnocení kvality řeči tak, že každé promluvě je testujícím subjektem přiřazeno ohodnocení využívající stupnice MOS s rozsahem od 1 do 5. Druhý způsob vyhodnocení (Quantal-Response Detectability Tests) je určen zejména pro testování prahových úrovní. DCR metoda je modifikací metody ACR, používá nedegradovaný a degradovaný signál a testuje se jak moc je degradace výrazná. Používá se hlavně pro systémy s převážně dobrou kvalitou. Metoda CCR je mírnou modifikací metody DCR. Poslední metoda (The treshold metod) se používá pro přímé porovnání dvou systémů, hodnotí se signály z referenčního a testovaného systému a určuje se pouze to, který signál je lepší. Více o těchto metodách lze najít v doporučení P.800. Velikou výhodou subjektivních testů jsou jejich nenahraditelné výsledky, které se dají považovat za takřka absolutně přesné. Zvolíme-li totiž dostatečný soubor testujících subjektů a vyjde-li nám ze statistického zpracování výsledných dat vysoký interval spolehlivosti, můžeme pak považovat vyhodnocené výsledky za referenční hodnoty, kterých bychom žádným jiným způsobem nedosáhli. Jak už bylo dříve naznačeno, existují dva typy přístupů pro testování. Poslechový test ke své existenci v podstatě nevyžaduje testovaný systém. V poslechovém testu se hodnotí jedna nebo více specifických vlastností, které se v systému dají izolovat (typicky například rušení signálu typu výpadky paketů, šum, diskontinuity fáze při navazování obnovených segmentů řeči, harmonické zkreslení, saturace řečového signálu atd.). V konverzačním testu se pak provádí testování v rámci celého systému, kdy se do hlasového signálu promítnou všechny rušivé signály a tyto nelze úplně odstranit, pouze se mohou jednotlivé rušivé vlivy cíleně eliminovat (typická úloha je odstraňování echa), a do výsledného kvalitativního skóre se pak uplatní i všechna ostatní rušení (sidetone, doba šíření), s čímž je potřeba při zpracování výsledků počítat. 2.2 Objektivní metody Objektivní metody jsou matematické algoritmy snažící se predikovat subjektivní hodnocení signálu zkoumáním průběhu digitalizovaného řečového signálu. Podle toho, zda metoda potřebuje originální nezkreslený signál, metody dělíme na intrusivní a neintrusivní. Požadavek originálního nezkresleného řečového signálu sice omezuje využitelnost metody v případech, kdy nemáme přístup ke zdroji, ale na druhou stranu umožňuje postihnout jevy typu zpoždění, které jsou u neintrusivních metod nepostihnutelné. Aplikace těchto intrusivních metod může být někdy problémová a může narušovat provoz systému, kde se má měření uskutečnit. Intrusivních metod existuje celá řada, například PAMS, PSQM, PESQ (bude dále popsána v kap.3). Z neintrusivních metod lze jmenovat LCQA, ANIQUE, 3SQM (bude popsána v kap.4). Tyto metody lze pasivně používat na přijímací straně telekomunikačního řetězce pro monitoring reálného provozu. U těchto neintrusivních metod se lze setkat s přístupem, kdy se kvalita odhaduje pouze na základě síťových parametrů strana 58
přenosového řetězce a vůbec nezávisí na signálu, který telekomunikačním kanálem prochází. Zástupcem těchto metod je například VQMON. Míru korelace mezi subjektivními a objektivními metodami lze vyjádřit pomoci korelačního koeficientu. Ten je definován tzv. Pearsonovým vztahem (1) a nabývá hodnoty 0 až 1. r = ( ( x x x) i i x)( y 2 i y) ( y i y) Koeficienty x i a y i představují jednotlivé výsledky subjektivní a objektivní metody u odpovídajících si měření. 2 (1) 3 Metoda PESQ Metoda PESQ (Perceptual Evaluation of Speech Quality) patří mezi intrusivní objektivní metody. Je definována v doporučení ITU-T P.862, viz [5]. Základní schéma metody je na obrázku 2. PESQ srovnává originální signál X(t) s degradovaným signálem Y(t), který vzniknul průchodem signálu X(t) telekomunikačním systémem. Výsledkem je odhad kvality, kterou by signálu Y(t) přiřknul hodnotící subjekt. Většina intrusivních algoritmů včetně metody PESQ používají pro svou funkci psychoakustických modelů smyslového vnímání člověka. Tyto modely se snaží popsat vnímání zvuku člověkem matematickou cestou. Základními stavebními kameny psychoakustických modelů jsou takové vlastnosti sluchu jako je závislost vnímané hlasitosti na frekvenci zvuku, maskování zvuků a mnoho dalších vlastností. Algoritmus se pak snaží postihnout ve zvukovém signálu ty důležité veličiny, které přímo ovlivňují vnímanou kvalitu hlasového signálu. Tyto veličiny pak porovnává jak u nedegradovaného tak u degradovaného signálu a z jejich porovnání se pak snaží odhadnout úbytek kvality. originální signál Model vnímání Převod na sadu koeficientů TS Časové zarovnání Rozdíl koeficientů Odhad MOS skóre výsledná kvalita degradovaný signál Model vnímání Převod na sadu koeficientů Obr. 2: Základní schéma metody PESQ MOS skóre je při subjektivních testech v rozsahu od 1 do 5 a MOS pro PESQ podle ITU-T P.862 je v rozsahu od -0.5 do 4.5. Aby bylo možné porovnat PESQ a subjektivní hodnocení, je nutné sjednotit jejich rozsah, to zajišťuje doporučení ITU-T P.862.1, viz [6]. Toto doporučení definuje mapovací funkci (2) pro přepočet MOS skóre. Tato funkce převádí výsledky objektivního hodnocení MOS-PESQ na subjektivní hodnocení MOS-LQO. Zpětné mapování se provádí inverzní funkcí (3). y 4.999 0.999 1+ e = 0.999 + 1.4945* x+ 4.6607 4.999 y 4.6607 ln y 0.999 x = (3) 1.4945 (2) strana 59
Na obrázku 3 je znázorněna mapovací křivka, odpovídající vztahům (2) a (3) pro přechod mezi hodnotami dle doporučení ITU-T P.862 a ITU-T P.862.1. Mapped P.862 5 4.5 4 3.5 3 2.5 2 1.5 1 0.5 0 1 0 1 2 3 4 5 P.862 Obr. 3: Vztah mezi jednotlivými typy MOS hodnocení P.862.1_F1 4 Metoda 3SQM Druhou objektivní metodou je 3SQM. Podobně jako PESQ se i tato metoda snaží odhadnout MOS skóre, kterým by byla ohodnocena promluva v subjektivním testu. Narozdíl od metody PESQ nepotřebuje 3SQM pro odhad kvality řeči originální vstupní signál, ale výslednou kvalitu odhaduje pouze ze signálu degradovaného, získaného na konečné straně testovaného řetězce. Proto může být metoda 3SQM použita i pro průběžné monitorování kvality hovoru v síti. Blokové schéma této metody je na obrázku 4. V bloku předzpracování je hlas upraven pomocí IRS filtru, dále je nalezena hraniční úroveň mezi řečí a šumem, signál je normován a nakonec je označkován pitch markery. Následující 3 bloky (Analýza hlasového traktu, Aditivní šum, Pauzy a přerušení) vypočtou 39 parametrů signálu. Podle tzv. klíčových parametrů se určí, které ze 6 zkreslení (nízké klidové SNR, pauzy a přerušení, nízké segmentové SNR, nepřirozený hlas robotizace, nepřirozený mužský hlas, nepřirozený ženský hlas) je dominantní. Pro výpočet výsledného MOS skóre je vždy použito 11 stejných koeficientů ze zmíněných 39 a dále je pak na základě určení dominantního zkreslení vybrána skupina 12-ti dalších koeficientů. Některé koeficienty vybrané na základě dominantního zkreslení se mohou překrývat s 11 stálými koeficienty. Celkem je tedy výsledné MOS skóre počítáno lineární kombinací maximálně 23 koeficientů. Analýza hlasového traktu a Nepřirozený hlas Předzpracování Aditivní šum Model kvality řeči Pauzy a přerušení Obr. 4: Základní schéma metody 3SQM Ke zjištění korelace mezi výsledky 3SQM a subjektivními testy se používá, stejně jako u metody PESQ, Pearsonova vztahu (1). Pro 24 ITU srovnávacích testů je korelace se subjektivními testy 0.88. 5 Testovací metodika Realizace jak subjektivních, tak objektivních testů vyžaduje důkladnou přípravu. Někdy je výhodné udělat průnik podmínek pro subjektivní a objektivní testy a připravit vzorky k testování tak, aby bylo možné provést oba typy testů. Lze tak například provést rozsáhlé objektivní testování a výsledky si poté nechat potvrdit menším subjektivním testem. strana 60
5.1 Objektivní testy Teorie a praxe IP telefonie - 3. dvoudenní odborný seminář Podle doporučení ITU-T P.563 lze použít pro testování metodou 3SQM 16-bit PCM signál, jehož vzorkovací frekvence je 8 khz. Signály s vyšší vzorkovací frekvencí musejí být převzorkovány. Délka promluvy může být od 3 do 20 s. Řeč by měla být v promluvě zastoupena percentuelně od 25 % do 75 %. V doporučení ITU-T P.862 jsou popsány všechny požadavky na testovaný signál. Jedním z nejdůležitějších je to, že signál musí mít charakter reálného signálu běžně přenášeného přes komunikační sítě. Testovací signál se musí skládat z řečových úseků o délce 1 3 s. Tyto úseky musí být odděleny tichem a jejich délka musí být mezi 40% 80% celkové délky testovacího signálu. Ve většině případů se využívá signálů složených ze dvou nebo tří úseků řeči o celkové délce cca 8 s, ale lze použít věty s dobou trvání až 20 s. Promluva musí být lineární 16-bit PCM signál se vzorkovací frekvencí 8 nebo 16 khz. 5.2 Subjektivní testy Při realizaci subjektivních testů je zapotřebí dodržet podmínky popsané v doporučeních ITU-T P.800 a ITU-T P.830, viz [7]. V prvním doporučení jsou definovány zejména požadavky na realizaci testů. Jsou v něm uvedeny požadavky na testované prostředí a na testované subjekty, včetně pokynů k instruktáži testovaných subjektů. Dále je v něm uveden minimální počet posluchačů pro subjektivní poslechový test. Druhé doporučení, ITU-T P.830, se zaměřuje především na přípravu promluv pro poslechové testy. Toto doporučení definuje výběr mluvčích a jejich počet a způsob pořizování a úpravy promluv pro testování (úroveň signálu, vzorkování, formát dat,...). 6 Typické rušivé jevy v prostředí VoIP a jejich vliv na MOS Prostředí VoIP přineslo specifické typy rušení, nemající analogii v prostředí POTS 2. Setkáváme se kromě klasických rušivých jevů, jako jsou harmonické zkreslení a šum, také s jevy jako např. neharmonické zkreslení, diskontinuita fáze signálu nebo výpadky v signálu. Pro získání lepší představy si můžeme předvést dva typické druhy rušení a jejich vliv na pokles kvality řečového signálu. 6.1 Výpadky signálu Výpadky signálu jsou typickým jevem prostředí VoIP. V praxi se četnost výpadků pohybuje od jednotek procent až po extrémní hodnoty několika desítek procent. Typická degradace řečového signálu vztažena vzhledem k hláskám, ve kterým došlo k výpadku, je nastíněna v následujících tabulkách. Výsledky získané subjektivním testem se nacházejí v tabulce 4. V tabulkách 5 a 6 jsou potom výsledky metod PESQ a 3SQM. Subjektivní MOS hodnocení ztráty paketů v rámci fonetických jednotek Ztráta paketů [%] Samohlásky, Dvojhlásky Nosovky, Likvidy Plosiva, Afrikáty Frikativa 2,00 3,66 3,68 4,52 4,11 4,00 3,02 3,11 4,11 3,93 6,00 2,57 3,02 3,66 2,98 8,00 2,66 2,70 3,68 2,93 10,00 2,11 2,27 3,39 2,84 Tab. 4: MOS pro výpadky, subjektivní hodnocení Objektivní PESQ MOS hodnocení ztráty paketů v rámci fonetických jednotek Ztráta paketů [%] Samohlásky, Dvojhlásky Nosovky, Likvidy Plosiva, Afrikáty Frikativa 2,00 3,39 3,36 4,06 3,87 4,00 3,23 3,25 3,78 3,54 6,00 2,93 2,77 3,45 3,37 8,00 2,57 2,28 3,05 3,18 10,00 2,40 2,06 2,84 2,79 Tab. 5: MOS pro výpadky, objektivní metoda PESQ 2 Plain Old Telephone Service strana 61
Objektivní 3SQM MOS hodnocení ztráty paketů v rámci fonetických jednotek Ztráta paketů [%] Samohlásky, Dvojhlásky Nosovky, Likvidy Plosiva, Afrikáty Frikativa 2,00 2,90 2,80 3,00 2,92 4,00 2,63 2,97 2,88 3,12 6,00 2,44 2,86 2,96 2,78 8,00 2,14 2,46 2,50 2,85 10,00 2,18 2,49 2,94 2,92 Tab. 6: MOS pro výpadky, objektivní metoda 3SQM Srovnání shody subjektivních a objektivních metod se nachází v tabulce 7. Pearsonovy koeficienty pro porovnání subjektivní a objektivních metod Objektivní metoda Samohlásky, Dvojhlásky Nosovky, Likvidy Plosiva, Afrikáty Frikativa PESQ 0,91 0,93 0,94 0,87 3SQM 0,90 0,69 0,30 0,62 Tab. 7: MOS pro výpadky, objektivní metoda 3SQM 6.2 Neharmonické zkreslení K neharmonickému zkreslení může dojít např. při saturaci řečového signálu. V tabulce 8 jsou shrnuty výsledky ovlivnění kvality pomocí degradace saturací. Parametr saturace udává poměr úrovní saturovaného a původního signálu. Saturace MOS Subjektivní PESQ P.862.1 3SQM P.563 0,00005 1,46 1,52 2,93 0,00010 1,50 1,38 2,49 0,00020 1,57 1,30 2,25 0,00050 1,69 1,35 1,61 0,00100 1,85 1,38 1,59 0,00200 1,82 1,39 1,68 0,00500 2,17 1,51 2,15 0,01000 2,52 1,54 2,92 0,02000 2,94 1,60 2,99 0,05000 3,33 1,75 3,14 0,10000 3,73 2,07 3,58 0,20000 4,15 2,83 3,79 0,50000 4,51 4,24 3,69 1,00000 4,82 4,55 3,41 Tab. 8: MOS pro výpadky, objektivní metoda 3SQM strana 62
7 Závěr Teorie a praxe IP telefonie - 3. dvoudenní odborný seminář Problematika měření kvality řečového signálu je značně rozsáhlá a komplexní. S nástupem moderních komunikačních technologií se objevily nové, předtím neznámé, typy rušivých vlivů. Testovací metodika a použité algoritmy musí být schopny věrohodně postihnout i tyto jevy. Přes neustálý vývoj automatizovaných objektivních měřících metod poskytují spolehlivé výsledky jen metody subjektivní. Metody objektivní a metody odhadující MOS na základě parametrů sítě mají jen doplňující význam. Měření kvality řečového signálu je jedním z prostředků, umožňujícím optimalizovat telekomunikačním operátorům parametry své sítě tak, aby dosáhli optimální spokojenosti uživatele s nabízenou službou. Své místo nachází ale i ve výzkumu, kde je nedílným prvkem při výzkumu nových kódovacích schémat řeči nebo algoritmů pro náhradu ztracených paketů, tzv. PLC (packet loss concealment) algoritmů. Literatura [1] ITU-T P.10: Vocabulary of terms on telephone transmission quality and telephone sets, 1998. [2] ITU-T P.800: Methods for subjective determination of transmission quality, 1996. [3] CCITT: Handbook on Telephonometry, Geneva, 1992. [4] ITU-T P.800.1: Mean Opinion Score (MOS) terminology, 2003. [5] ITU-T P.862: Perceptual Evaluation of Speech Quality (PESQ): An Objective Method for End-toend Speech Quality Assessment of Narrow-band TelephoneNetworks and Speech Codecs, 2001. [6] ITU-T P.862.1: Mapping function for transforming P.862 raw result scores to MOS-LQO, 2003. [7] ITU-T P.830: Subjective PerformanceAssessment of Telephone-Band and Wideband Digital Codecs, 1996. strana 63
strana 64