Mendelova zemědělská a lesnická univerzita v Brně Provozně ekonomická fakulta Ústav statistiky a operačního výzkumu Statistické zpracování výzkumu trhu mobilních telefonů a operátorů BAKALÁŘSKÁ PRÁCE Vedoucí práce: Ing. Kristina Somerlíková, Ph. D. Jana Žilková Brno 2007
Prohlašuji, že jsem tuto bakalářskou práci vypracovala samostatně s využitím odborné literatury, kterou uvádím v seznamu. V Brně 24. května 2007 Jana Žilková
Tímto bych ráda poděkovala své vedoucí bakalářské práce Ing. Kristině Somerlíkové, Ph. D. za její drahocenný čas, odborný dohled a potřebné rady, které jsem uplatnila při psaní své bakalářské práce.
Abstrakt Žilková, J. Statistické zpracování výzkumu trhu mobilních telefonů a operátorů, Bakalářská práce. Brno 2007. Bakalářská práce se zabývá marketingovým výzkumem na trhu mobilních telefonů a službami s tím souvisejícími. Výsledky dotazníkového šetření byly zpracovány pomocí základních statistických metod a postupů. V závěru práce je uvedeno věcné shrnutí a krátká polemika na dané téma. Abstract Zilkova, J. Statistical processing research of the market with mobile phone and operators, Bachelor work. Brno 2007. This bachelor work deals with marketing research in the market of mobile phones and services associated with them. Results of questionnaire search were process by basic statistical methods and procedures. In conclusion is summary of important elements and short polemic on the given subject.
Obsah Obsah...6 1. Úvod...7 2. Cíl práce a metodika...8 3. Marketingový přehled...9 3.1 Historie marketingového výzkumu...9 3.2 Co je marketingový výzkum?...9 3.3 Využití marketingového výzkumu...11 3.4 Klasifikace výzkumu...11 3.5 Proces marketingového výzkumu...14 3.6 Techniky marketingového výzkumu...17 4. Statistický přehled...22 4.1 Historie statistiky...22 4.2 Co je statistika?...22 4.3 Základní statistické pojmy...23 4.4 Etapy statistické činnosti...27 4.5 Zpracování statistických údajů...30 5. Vlastní práce...36 5.1 Zpracování výsledků dotazníku...36 5.2 Analýza závislostí...48 6. Závěr...50 7. Použitá literatura...52 6
1. Úvod Telefon je telekomunikační zařízení, které přenáší hovor prostřednictvím elektrických signálů. Za vynálezce byl považován Alexander Graham Bell, jehož první telefon byl sestrojen v Bostonu v roce 1876. Ale podle novějších údajů vynalezl telefon italský vynálezce Antonio Meucci už v roce 1849. Jeho prvenství bylo v červnu roku 2002 oficiálně potvrzeno například i kongresem Spojených států. Mobilní telefon je zařízení fungující jako normální telefon, ale s možností použití ve velkém prostoru (na rozdíl od bezdrátového telefonu fungujícího jen na omezenou vzdálenost). Mobily mají dlouhou historii, která sahá do počátku 70. let 20. století, kdy firma Ericsson představila první mobilní telefon, který vážil desítky kilogramů, stál hodně peněz a proto ho v kufru auta mohlo vozit jen několik vyvolených. První mobil se jmenoval MTA (Mobile Telephony A) a fungoval jen ve Stockholmu a Goteborgu. Pro nízké zaváděcí náklady a rychlé rozmístění se mobilní sítě rychle rozšířily po světě a předstihly růst pevné telefonie. V minulém století firmy pochopily, že mobilní telefon není jen módní výstřelek a tak se chytily příležitosti a zaměřily se na jejich výrobu. Většinou se jednalo o firmy podnikající v odvětví elektrotechniky např. LG, která byla prvním výrobcem rádií na korejském trhu nebo Samsung, který se věnoval výrobě digitálních médií, informačním a telekomunikačním přístrojům. Ale našly se i takové firmy, které s elektronikou neměly nic společného např. Nokia začínala jako výrobce bot a pneumatik. S rozvojem mobilů jde ruku v ruce i vývoj mobilních sítí. Počátkem devadesátých let minulého století se toho ujaly buď národní telecomy, nebo pro tento účel speciálně založené firmy mobilní operátoři. V dnešní době u nás působí tři operátoři, kteří zároveň patří mezi největší globální operátory, jsou to Vodafone, T-Mobile a O 2. Je zřejmé, že mobilní telefony si získaly velmi významné a neopomenutelné místo v našich životech. Je jen málo lidí, kteří se ve svém životě obejdou bez mobilu, jsou to většinou Ti, kteří ho nemají, ale jakmile ho jednou získají tak už si ho nedovedou představit bez něj. 7
2. Cíl práce a metodika Cílem této bakalářské práce je provést marketingový výzkum na trhu s mobilní technikou a službami s ní souvisejícími, výsledky zpracovat pomocí statistických metod a postupů a následně slovně i za pomoci grafů a tabulek prezentovat. Než se přikročí k vlastnímu psaní práce je nezbytné nastudovat zvolenou problematiku. Nejvhodnějším a obvyklým způsobem je studium odborné literatury a vyhledávání potřebných informací na internetu. Následujícím krokem je sestavení dotazníku. Je velmi důležité, aby kladené otázky byly pro respondenta co nejvíce srozumitelné, a aby se předešlo zbytečným nedorozuměním a pozdějším problémům, měl by se provést předvýzkum. Po jeho provedení upravit zjištěné nedostatky, které jsou většinou už jen technického rázu, a začít s vlastním výzkumem. Po získání dostatečného množství vzorků končí práce v terénu a začíná vlastní zpracovávání informací, ke kterému se používá informační technologie. K výpočtům a propočtům jsem využila program Unistat a následně Microsoft Excel, který je vhodnější pro vytváření grafů a tabulek. Ke zpracování odpovědí postačí základní statistické analýzy jako jsou absolutní a relativní četnosti, prostý a vážený aritmetický průměr a měření závislostí slovních znaků. Vše jsem slovně okomentovala a přehledně zaznamenala do tabulek a grafů. Písemná část práce je vypracována pomocí textového programu Microsoft Word. Práce je přehledně členěna do 8 kapitol a několika potřebných podkapitol. Práce je rozdělena na dvě základní části a to část teoretickou a část praktickou, která je zakončena mým názorem na danou problematiku. 8
3. Marketingový přehled 3.1 Historie marketingového výzkumu Historie marketingového výzkumu začíná podle Foreta a Stávkové (2003) již v 19. století. Přesněji rokem 1824, kdy se v USA poprvé uskutečnil empirický výzkum chování a rozhodování voličů v prezidentských volbách. O sto let později obohatila generace nastupujících výzkumníků v čele G. Gallupem a E. Roperem tyto výzkumy především o statisticky propracované postupy výběru vzorku. Ve 40. letech minulého století P. F. Lazarsfeld a B. R. Berelson publikují v monografiích Vořiny a The People s Choice první explanační modely chování. Jednalo se zejména o to, jak dokáží názoroví vůdci ovlivnit rozhodování voličů. Záhy se tyto poznatky o vlečníkovém a bumerangovém chování a rozhodování voličů přenesly také do marketingu, především do modelů chování a rozhodování spotřebitelů. Proto jsou právem výzkumy chování a rozhodování voličů považovány za počátky marketingového výzkumu. 3.2 Co je marketingový výzkum? Clemente (2004) uvádí, že efektivní marketingové rozhodování vyžaduje shromažďování informací, které se vztahují na specifické situace na trhu nebo na specifický problém. Marketingový výzkum se týká procesu shromažďování, analýzy a předání této informace. Kompilace výsledků vyžaduje určit údaje o trhu, které jsou potřebné. Volá také po rozhodnutí a strategii vytvoření použitelných informací efektivním způsobem, co se týká nákladů.shromažďování údajů o trhu zahrnuje čtyři následující kroky: 1. Definování marketingového problému. Nemůžete vytvářet použitelné informace, aniž byste věděli, o jaký problém jde. Příklady marketingových problémů mohou být klesající prodej v konkrétném regionu nebo městě nebo nízká hladina povědomí o výrobku mezi cílovými spotřebiteli. Jakmile je problém definován, potom výzkumní pracovníci stanoví úkoly výzkumu. Zjištění problému je nezbytné k určení požadovaného typu výzkumu. Existují tři typy výzkumu: předběžný, popisný a kauzální. 9
2. Plán výzkumu a vývoje zahrnuje určení nejúčinnějšího způsobu shromažďování potřebné informace. Plán zjistí jaký zdroj informace bude použit, jaké výzkumné instrumenty budou použity a jak budou respondenti kontaktování. 3. Sbírání informací. Mohou být využity různé manuální a technologické metody. Manuální sběr údajů může jednoduše zahrnovat zapisování odpovědí respondentů výzkumným pracovníkem na otázky pohovoru. Technologické nástroje obsahují počítačový a elektronický komunikační hardware. 4. Analýza informací ta obsahuje vynětí relevantních odpovědí ze shromážděných údajů. Informace jsou seřazeny do tabulky. Potom jsou použity statistické postupy a rozhodovací modely pro nalezení dodatečných závěrů. 3.2.1 Průzkum trhu Foret, Stávková (2003) chápou průzkum trhu především jako jednorázovou záležitost, zjišťující zvolenou výzkumnou technikou aktuální situaci, na trhu a poskytující zadavatelům především základní popis této situace. Marketingový výzkum je dlouhodobější prací, kombinující hned několik výzkumných postupů, uplatňující náročnější postupy statistického zpracování, porovnávající a vyhodnocující výsledky získané z různých zdrojů a docházející k hlubším poznatkům a souvislostem. 3.2.2 Výzkum trhu x marketingový výzkum Vážná nedorozumění vznikají podle Majaro (1996) při užívání dvou odlišných termínů výzkum trhu a marketingový výzkum. Tyto termíny se často zaměňují. Výzkum trhu se vztahuje na shromažďování údajů o trhu samotném. Marketingový výzkum se vztahuje na shromažďování, zaznamenávání a analyzování těch údajů, které se týkají marketingu určitého zboží nebo služeb. Jinými slovy řečeno, výzkum trhu zkoumá trh, jeho strukturu a lidi, kteří se na něm pohybují. Naopak marketingový výzkum studuje nejefektivnější cesty, kterými lze na tento trh vstoupit a jak tento trh maximálním způsobem uspokojit. 10
3.3 Využití marketingového výzkumu Hague tvrdí, že téměř všechen marketingový výzkum je prováděn z praktických důvodů; musí být prověřena obchodní příležitost, je nutná identifikace důvodů problému a musí být zredukováno obchodní riziko. Marketingový výzkum je vědou aplikovanou a její výkon by se měl v ukázat v akci. Využití nám dává souvislosti, které ukazují, kam marketingový výzkum zařadit. To je velmi důležité, jelikož pokud je marketingový výzkum předmětem naších úvah, mohlo by dojít k nedorozumění, že marketingový výzkum je centrem celého obchodního světa. Jistě hraje důležitou roli v obchodním rozhodování, ale konečný úspěch na trzích je určen mnoha dalšími faktory, zejména oddaností týmu, velikostí a směsí marketingového rozpočtu a schopností reagovat na nepředvídané problémy. Není vždy jednoduché posuzovat obchodní úspěch a říci, že byl výhradně zásluhou marketingového výzkumu. V nejlepším případě bude výzkumník schopný říci byl jsem toho součástí. 3.4 Klasifikace výzkumu Smith (2000) tvrdí, že v podstatě existují dva druhy zdrojů informací k výzkumu: primární a sekundární. Primární informace si organizace nechává sbírat na objednávku za určitým účelem (například to může být průzkum, jaký postoj mají zákazníci ke značce podniku). Na druhé straně sekundární informace jsou data, která už existují, která už sesbíral někdo jiný z nějakého jiného důvodu (například statistiky vlády, články v novinách, různé zprávy atd.). U sekundárního výzkumu je podle Foreta a Stávkové (2003) rozdíl mezi tím, zda máme k dispozici data neagregovaná, tedy v původní podobě hodnot zjištěných za každou jednotku, oproti datům již agregovaným, kdy jsou hodnoty vlastností sumarizované za celý soubor, případně zpracované do podoby statistických hodnot (procenta, průměry, rozptyly, koeficienty). Výhodou neagregovaných dat je to, že si je můžeme znovu statisticky zpracovat zcela podle svých potřeb. Foret (2003) uvádí, že pod vlivem terminologie výpočetní techniky se někdy hovoří o harddatech ( tvrdých datech ) a softdatech ( měkkých datech ). Za harddata považujeme 11
zpravidla údaje z oficiální statistické evidence. Například o počtech jednotek (obyvatel, domácností, podniků), jejich stavu (rodinném, vlastnickém, stáří), vybavenosti (předměty dlouhodobé spotřeby, zásobami), vynaložených prostředcích (výdajích) a výsledcích činností (výstavě piva, spotřebě piva). Softdata jsou spíše výpovědi o stavech vědomí (názory, hodnocení, přání), jak je poskytují speciální výzkumy (marketingové, sociologické, veřejného mínění). Rozdíly mezi harddaty a softdaty nejsou tak zásadní, jak by se mohlo na první pohled zdát. Rozhodně je velmi zkreslená představa, že harddata jsou objektivní údaje a softdata subjektivní. Foret, Stávková (2003) člení marketingový výzkum na základní a aplikovaný. Základní (badatelský) výzkum se zabývá zpravidla teoretickým řešením dané problematiky (teorie chování a rozhodování zákazníků) a na rozdíl od aplikovaného výzkumu, který je většinou realizován na objednávku nějaké organizace, se od něj neočekávají žádné návrhy řešení. Cílem aplikovaného výzkumu je naopak shromáždit potřebné údaje k vyjasnění zkoumaného problému, zejména navrhnout nové hypotézy (náměty, nápady) jeho praktického řešení. Podle Foreta a Stávkové (2003) se běžně rozlišuje výzkum z hlediska obecné metodologie na: popisný neboli deskriptivní; jeho výsledky popisují jevy, se kterými se v dané oblasti setkáváme. Dívá se a zachycuje náš problém, který je předmětem výzkumu, jak v daném okamžiku vypadá, právě zde bychom spíše hovořili o průzkumu; diagnostický neboli kauzální, který již nejen popisuje daný problém, ale snaží se o formulaci hypotéz, hledá příčiny popisovaných jevů, souvislosti, pravidelnosti, vztahy příčiny a následku. Východiskem pro tento výzkum bývá často výzkum popisný, Navazující diagnostický je však náročnější jak na přípravu, tak na zpracování a interpretaci. Hledá odpověď na otázku, proč je daný jev, proces právě takový; 12
prognostický, který se snaží postihnout současné vývojové trendy a předpokládaný budoucí stav. Měl by nám tedy poskytnout informace, kam spěje vývoj našeho problému. Primární marketingový výzkum prováděný v terénu lze členit na kvantitativní a kvalitativní. 3.4.1 Kvantitativní výzkum Foret (2003) uvádí, že kvantitativní výzkum je koncipován a prováděn s cílem postihnout dostatečně velký a reprezentativní vzorek jednotek. K objektivitě a systematičnosti zjištěných informací přispívají takové postupy jako standardizace otázek, výběr vzorku a statistické postupy zpracování dat. Základní techniky kvantitativního výzkumu tvoří osobní rozhovory, pozorování, experiment a písemné dotazy, případně analýza jakýchkoli záznamů. 3.4.2 Kvalitativní výzkum Kvalitativní výzkum se podle Foreta (2003) snaží zjistit důvody chování lidí, jejich motivy a příčiny. Je tedy hlubším poznáním a může sloužit jako doplněk kvantitativních poznatků. Druhou obvyklou situací, kdy použijeme kvalitativní postupy, je naopak vstup do nové problematiky, v níž se potřebujeme nejprve zorientovat nebo dostat nové nápady. Základní tři techniky kvalitativního výzkumu tvoří: hloubkové rozhovory, skupinové rozhovory (focus group) a projektivní techniky. Kvalitativní výzkum se omezuje na menší počty dotazovaných jednotek, obvykle okolo desíti, maximálně padesáti. Také číselná podoba výsledků má spíše orientační než vypovídací hodnotu. 13
3.5 Proces marketingového výzkumu Majaro (1996) uvádí, že marketingový výzkum je proces, který se skládá z pěti základních kroků: 1. Definování projektu 2. Plán výzkumu 3. Shromažďování údajů 4. Interpretace údajů 5. Souhrnná zpráva a závěry 3.5.1 Definování projektu Poslání projektu musí být definováno (a redefinováno) s ohledem na stanovený záměr a odpovídající úkoly marketingu. V této fázi je třeba prověřit následující: Zda již nebyly publikovány materiály, které by anulovaly potřebu provádění tohoto výzkumného projektu. Zhodnocení nákladů a přínosů, se kterými je nutné počítat. Měli bychom se vyhnout řadě léček a problémů: Používání neurčitých výrazů v našich stanoviscích. Špatné formulaci problému. Zahájení projektu s nejasným nebo neurčitým posláním. 3.5.2 Plán výzkumu Plán výzkumu je podle Foreta a Stávkové (2003) dalším krokem, který následuje po definování problému a cíle výzkumu. Přesněji specifikuje potřebné informace, postup jejich získání a plán dalšího postupu výzkumu. Umožňuje kontrolovat průběh výzkumu. Plán výzkumu by měl obsahovat: formulaci zkoumaného problému, základní hypotézu řešení a určení výzkumného cíle a jeho zdůvodnění, 14
předběžné představy o tom, co lze od výzkumu očekávat na rozdíl od dosavadních znalostí, stanovení informačních potřeb, jejich struktury a jejich zdrojů, navržení výběrového souboru, zdůvodnění jeho velikosti a složení, navržení místa a času realizace výzkumu, stanovení techniky výzkumu a nástrojů vhodných pro výzkum, určení způsobu kontaktování respondentů, předvýzkum, zpřesňující předcházející body na základě praktického ověření sběru informací v terénu na malém vzorku (sonda zpravidla zahrnuje nejvýše několik desítek jednotek 20 až 30), vlastní výzkum, statistické zpracování výsledků, časový rozvrh jednotlivých etap s uvedením odpovědného pracovníka, rozpočet nákladů výzkumu. Na začátku je tedy třeba zajistit a shromáždit co nejvíce základních a obecných informací o podstatě problému, Naopak pokud jsme již vypracovali postup sběru informací v terénu, je nutné si jej nejprve prakticky ověřit na malém souboru sledovaných jednotek. Tato etapa se nazývá předběžný výzkum, předvýzkum (pretest). Většinou se od něj očekává ověření srozumitelnosti a jednoznačnosti otázek, ověření manipulace s dotazníkem, reakcí osob při rozhovorech, ověření dílčích hypotéz, technické zpracovatelnosti atd. Nejčastěji je prováděn na malém vzorku respondentů a zaměřuje se na celkovou koncepci dotazníku, resp. záznamového archu, na spontánnost odpovědí, zda je přijímán se zájmem či unavuje atd. 3.5.3 Shromažďování údajů Majaro (1996) tvrdí, že shromažďování údajů je velmi důležitá etapa realizace programu. Je třeba vyhledávat zdroje informací. Pokud jsou tyto informace využitelné, je třeba je získat. Je třeba využít i vnitřních zdrojů informací. Konkrétně je třeba systematicky podniknout následující kroky: 15
Nalezení zdrojů informací vnitřních i vnějších. Tento krok vyžaduje provedení podrobných analýz publikovaných materiálů, které existují ve velkých kvantech v knihovnách a ostatních veřejně přístupných zdrojích informací. Pokud je do výzkumu začleněn dotazníkový výzkum respondentů, je třeba dotazník otestovat na vybraném vzorku. Je třeba překontrolovat odpovědi, odstranit chyby, dvojznačnosti a nejasnosti dotazníku. Shromáždit a roztřídit údaje. V dnešní době máme mnoho možností jak potřebné informace vyhledat. Nejpoužívanějšími zdroji informací jsou např. průmysloví experti, internet, online databáze a tržní údaje, specializovaná průmyslová data, vládní statistiky, seznamy a tisk. 3.5.4 Interpretace údajů Podle Majaro (1996) nyní nadešel čas pro analyzování získaných údajů, jejich třídění, hodnocení a uspořádání. Využitelné údaje jsou sestavovány do vhodných výstupů. Provádí se vysvětlování významných vztahů. Údaje se v podstatě převádějí na informace a do konečné podoby hodnotných zpravodajských informací. 3.5.5 Souhrnná zpráva a závěry Majaro (1996) uvádí, že v této etapě se prověřuje schopnost účinné komunikace. Závěrečná zpráva musí mít formu, která je převoditelná na publikovatelné a snadno pochopitelné prohlášení. K tomu má také sloužit. Velmi často se totiž stává, že vynikající projekty průzkumu neuspějí z jednoho velice jednoduchého důvodu, jsou prezentovány způsobem nebo stylem, který nejdůležitější příjemci naprosto nechápou. Protože zprávu nepochopili, zpravidla se potom stává, že se jí také neřídí. 16
3.6 Techniky marketingového výzkumu Foret, Stávková (2003) definují techniky marketingového výzkumu jako proces, kde jde o způsob sběru primárních dat umožňující evidovat výskyt jevů i chování lidí, ale také zjistit jejich názory, postoje a motivy. Základní tři techniky marketingového výzkumu představují dotazování, pozorování a experiment. 3.6.1 Dotazování Podle Foreta a Stávkové (2003) patří dotazování k nejrozšířenějším postupům marketingového výzkumu. Uskutečňuje se pomocí nástrojů (dotazníků, záznamových archů) a vhodně zvoleného kontaktu s nositelem informací dotazovaným (respondentem). Tento kontakt může být přímý, bezprostřední nebo může být naopak zprostředkovaný tazatelem, vstupujícím mezi výzkumníka a respondenta, jako je tomu při osobním (ústním) dotazování, včetně třeba telefonického. Dotazník Clemente (2004) definuje dotazník jako jeden z hlavních přehledových nástrojů, používaných ke zjišťování údajů z tržního průzkumu. Dotazníky zahrnují série otázek, určených k získání zpětné vazby (odpovědí) o postojích, dojmech a domněnkách respondentů o produktu nebo problémech, které jsou důležité pro marketingové pracovníky. Tvorba dotazníku obsahuje nejprve stanovení cílů průzkumu. Identifikace informací potřebných pro dosažení cílů průzkumu určuje způsob strukturování a stylizace otázek. Existují tři běžné přístupy ke strukturování položek dotazníku: uzavřené otázky (close-ended questions), otevřené otázky (open-ended questions), a otázky se stupnicí (scale items). Uzavřené otázky podle Foreta a Stávkové (2003) jsou takové, které předem uvádějí (nabízejí) několik možných variant odpovědí, ze kterých je dotazovaný nucen si jednu nebo několik vybrat. Uzavřené otázka je možno dělit na: dichotonické, které připouštějí dvě možnosti (ano ne); 17
výběrové (polytomické, s možností výběru jedné alternativy); výčtové (polytomické, s možností výběru několika alternativ); polytomické, s uvedením pořadí alternativ. U otevřených otázek podle Foreta a Stávkové (2003) nepředkládáme respondentovi žádné varianty odpovědí. Může se tedy vyjádřit zcela svobodně, podle svého, svými slovy. Patří sem takové typy otázek s otevřeným koncem, jako jsou: volné respondentovi je ponechána při formulaci názoru absolutní volnost, asociační respondent má uvést slovo, které si uvědomí jako první reakci na pojem uvedený v dotazníku, volné dokončení věty dotazovaná osoba má podle svého úsudku dokončit předloženou větu, dokončení povídky je předložena nedokončená povídka a úkolem respondenta je ji dokončit, dokončení obrázku je předložen obrázek dvou postav, jedna něco říká a respondent má doplnit reakci druhé osoby, dokončení tematické námětu je předložen obrázek a respondent má za úkol vymyslet příběh o tom, co se na obrázku stalo nebo se může stát. Otázky se stupnicí podle Clementa (2004) měří stupeň (úroveň) názoru nebo postoje respondenta ohledně daného předmětu nebo pojmu. Tyto položky (otázky) obsahují série tvrzení. Respondenti jsou žádáni, aby označili, jestli souhlasí silně, souhlasí, jsou si nejisti, nesouhlasí, nebo nesouhlasí silně. Například Likertova stupnice v dotazníkových otázkách obvykle žádá respondenta, aby klasifikoval svou odpověď číslem. Podle Hague existují tři typy dotazovacích situací, jež vyžadují tři typy dotazníků: strukturovaný ve velkých dotazových programech (běžně přes 200 rozhovorů), kde je možné očekávat mnoho přesných odpovědí. polostrukturovaný hojně využívaný v business-to-business marketingovém výzkumu, kde je nutné uchovat odpovědi společností. Také najde využití tam, kde, odpovědi nemohou být předem odhadnuty. 18
nestrukturovaný je základem mnoha studií technických a omezených trhů. Také se využívá v hloubkových rozhovorech a diskusních skupinách. Umožňuje zjišťovat a hledat tam, kde si tazatel není úplně jistý odpovědí ještě před interview. Anketa Foret, Stávková (2003) říkají, že ankety jsou vhodné pro prvotní seznámení se a oslovení veřejnosti. Anketu zpravidla tvoří jedna nebo několik málo otázek na určité téma, které jsou publikovány v tisku, rozdávány při nákupu zboží apod. a jejíž autoři se obracejí na co nejvíce lidí s výzvou, aby uvedli svůj názor. Pro zvýšení návratnosti, se někdy v anketním lístku uvádí, že každý vrácený a vyplněný lístek bude slosován o ceny. I když se podaří nashromáždit velké množství odpovědí, bývá skladba vzorku nereprezentativní. Je totiž známo, že vyplnění anketního lístku přitahuje především určité skupiny respondentů; zejména ty, kteří mají více volného času, jako jsou důchodci, ženy na mateřské dovolené, mladí školáci atd. Naopak velmi vzácně se jich zúčastňují lidé zaměstnaní, náročnějších profesí, s vyšším postavením v práci či podnikatelé. K základním nedostatkům ankety tudíž patří právě tento tzv. samovýběr účastníků. Přes uvedené problémy však může mít anketa své opodstatnění, protože dokáže veřejnost zaujmout, oslovit ji, navázat a upevnit s ní vztahy, ale neměla by se na jejích výsledcích stavět rozhodovací a plánovací činnost. Interview Foret, Stávková (2003) definují interview jako standardizovaný rozhovor tazatele pouze s jedním respondentem. Tazatel čte otázky, případně i varianty odpovědí, jak je naformuloval výzkumník. Nevýhodou standardizovaného rozhovoru je, oproti dotazníku, jeho obsah. S dotazníkem obsáhneme při poměrně malých výdajích a jednoduché manipulaci velké množství lidí. Při rozhovoru je to obtížnější, neboť je finančně, časově i organizačně náročné získat množství tazatelů, vyškolit je, umožnit jim, aby navštívili dotazované osoby a provedli s nimi rozhovor. Výhodou dotazníku je jeho standardnost. I když také v rozhovoru dostávají tazatelé přesné instrukce, jak postupovat, přece jen se jedná o různé lidi, kteří se ptají různým způsobem, různě se chovají někdy i různě formulují otázky. Tazatel nesporně respondenta ovlivňuje, ať si to uvědomuje nebo ne, 19
v dobrém či špatném smyslu. Práci tazatelů je nutné náležitě kontrolovat. Další nevýhodou rozhovoru oproti dotazníku je, že zachovává méně anonymity. Na druhé straně ale víme přesně, kdo nám na naše otázky odpovídal. Při rozhovoru je možné navázat kontakt s dotazovaným, zmírnit jeho ostych, vysvětlit to, čemu nerozumí, apod. Skupinový rozhovor Dotazovaná skupina lidí (6-10 osob) stráví několik hodin se zkušeným marketingovým výzkumníkem nebo tazatelem (moderátorem), který s nimi prodiskutuje řešený problém. Tazatel musí být objektivní, musí znát řešený problém a musí mít znalosti z oblasti skupinového chování. Celá diskuse je zaznamenávána pomocí písemných poznámek nebo pomocí magnetofonu či videa a poté podrobně studována. Výzkum pomocí skupinového rozhovoru je velice užitečný a měl by být podniknut dříve, než se přikročí k výzkumu širokého rozsahu, tedy ve fázi předvýzkumu, nebo naopak ve fázi závěrečné interpretace, kdy si ještě chceme prohloubit některé poznatky, přijít jim tzv. na kloub, zodpovědět si otázky proč. Takhle skupinový rozhovor definují Foret, Stávková (2003). Telefonické dotazovaní je podle Foreta a Stávkové (2003) velmi operativní technika. U telefonického rozhovoru je výhodou jeho rychlost a cena, respondent je skryt v jisté anonymitě a může poskytnout i upřímnější a otevřenější odpovědi. Na druhé straně je jasné, že vybavenost a dostupnost telefonem ještě zdaleka není stoprocentní a také telefonický rozhovor musí být nutně stručnější než osobní z očí do očí. 3.6.2 Pozorování Pozorování je podle Clemente (2004) postup výzkumu, který zahrnuje pozorování lidí nebo zjištění kvalitativních údajů o trhu. Například výzkumní pracovníci se sami postaví v obchodě, aby pozorovali nakupující a třeba s nimi dělali rozhovory o jejich rozhodnutích o nákupu. Nebo mohou být výzkumní pracovníci rozmístěni v obchodě konkurenta, aby pozorovali typy zákazníků nebo environmentální faktory (např. projekt obchodu). Pozorovací výzkum může být použit jako dodatečná statistická informace nebo pro formování hypotézy, která by mohla být potvrzena kvantitativním výzkumem. 20
Podle Hague se dnes pozorování užívá všude tam, kde je výhodnější než přímé dotazování lidí. Hraje významnou roli převážně u dětí, jejichž schopnosti jim zatím nedovolují přesněji vyjádřit, co si myslí. Využití najde i v obchodních výzkumech, zvlášť pak přímo v obchodech, kde se zákazník nahlížející do regálů rozmýšlí, co koupit. Také se užívá při zjišťování, jak produkty fungují v praxi. Způsob, jakým lidé otevírají balení oplatků a jakým si čtou instrukce, může být lépe odhalen pozorováním než dotazováním. 3.6.3 Experiment Experimentální metody podle Foreta a Stávkové (2003) sledují vliv jednoho jevu (nezávisle proměnná) na druhý (závisle proměnná), a to v nově vytvořené situaci. Usilujeme o zachycení reakcí na novou situaci a hledáme vysvětlení tohoto chování. Experimenty lze rozdělit do dvou hlavních skupin. Jsou to jednak experimenty laboratorní, které se uskutečňují ve zvlášť organizovaném prostředí, v prostředí umělém a jednak experimenty terénní (přirozené), které se uskutečňují v přirozeném prostředí. Rozeznáváme dvě formy experimentů: Experiment, ve kterém se měří pouze působení nezávisle proměnné. Měří se ve dvou skupinách, experimentální a kontrolní přičemž kontrolní skupina není vystavena nezávisle proměnné a experimentální skupina ano. Experiment, ve kterém se měří před i po působení nezávisle proměnné. V případě, že rozdíl mezi měřeními kontrolní skupiny dosahuje nulových hodnot, můžeme usuzovat, že nenulový rozdíl mezi měřeními v experimentální skupině je způsoben výhradně vlivem pokusu, tj. nezávisle proměnné. 21
4. Statistický přehled 4.1 Historie statistiky Dufek, Bodečková (1982) uvádí, že počátky statistiky jako vědy jsou spojovány s pracemi Hermana Conringa (1606-1681) a Gottfrieda Achenwalla (1719 1772) a jejich spolupracovníků, kteří tvořili tzv. školu německých universitních statistiků. Daleko větší význam pro dnešní vědeckou statistiku měly práce anglických vědců Johna Graunta (1620 1674) a Williama Pettyho (1623 1687), kteří sice neoznačovali svoji činnost jako statistiku, ale nazývali ji politickou aritmetikou. Jako první pochopili, že sledované hromadné jevy je nutno charakterizovat čísly a že vedle sledování jejich stavu a struktury, je třeba si všímat i jejich vývoje a vzájemných souvislostí. 4.2 Co je statistika? Cyhelský a kol. (2001) poukazují na to, že slova statistický, statistik a statistika mají svůj kořen v latinském slově status (= stav ). Z latinského slovního spojení status rei publicae (= stav věci veřejné ) se vyvinulo italské slovo státo (= stát ), od něhož byla odvozena v XVI. XVII. století italská slova státisticko (= statistický a též statistik ) a poněkud později i státistica (= statistika ). Pojem statistika může a je často chápán v různých spojitostech, a proto statistikou nejčastěji rozumíme: Statistika jako činnost zabývající se zjišťováním, shromažďováním, zpracováváním a především prezentací daného materiálu. Statistika jako výsledky dané činnosti, které můžeme najít v nejrůznějších statistických publikacích. Statistikou bývá často označována specializovaná instituce a tou je Český statistický úřad. 22
Statistika jako věda, která zkoumá zákonitosti hromadných jevů. 4.2.1 Členění statistiky Rozeznáváme dva druhy statistiky a to statistiku popisnou a matematickou. Hindls a kol. (2006) je definují následovně: Popisná statistika - podává popis stavu a vývoje hromadných jevů; zjištěné výsledky se vztahují pouze na skutečně prozkoumané případy. Matematická (induktivní) statistika vychází z pravděpodobnostního přístupu ke zkoumaným hromadným jevům a pomocí metod statistické indukce činí obecné závěry o hromadném jevu na základě poznání jeho části. 4.3 Základní statistické pojmy 4.3.1 Statistická jednotka Statistika zkoumá hromadné jevy prostřednictvím jejich nositelů statistických jednotek. Pojem statistická jednotka je ovsem velmi široký jak z hlediska rozmanitosti jejích druhů, tak i z hlediska rozlišovací úrovně. Statistickými jednotkami mohou být především reálně existující objekty a živé bytosti: přírodní předměty, výrobky, rostliny, živočichové a lidé. Statistickými jednotkami jsou ovšem i smluvně vymezené části přírodního nebo společenského prostředí: obce, regiony, státy, firmy a instituce. Přírodní a společenské jevy a události: požáry, úrazy, úmrtí, atd. O statistických jednotkách hovoříme nezávisle na tom, zda mají hmotnou či nehmotnou abstraktní povahu. Významným aspektem statistické jednotky je relativita jejího vymezení v závislosti na účelu zkoumání. V souladu se zvolenou rozlišovací úrovní může být statistická jednotka někdy relativně velmi malá: rostlina, zvíře, volič, pacient apod., jindy zase naopak velká: porost na pozemku, stádo zvířat, skupina pracovníků určité firmy nebo profese apod. Tato hierarchie vymezení statistických jednotek může být samozřejmě mnohastupňová, např. student studijní skupina ročník obor fakulta univerzita. Takhle je definovaná statistická jednotka podle Minaříka (2006) 23
Při statistických zjišťováních a šetřeních se můžeme setkat s podobně znějícími pojmy a těmi jsou: Zpravodajská jednotka subjekty, které mají ze zákona stanovenou povinnost vůči orgánům státní statistické služby např. obce, instituce, firmy nebo domácnosti. Výběrová jednotka setkáváme se s ní u výběrového zjišťování a je buď totožná se statistickou jednotkou nebo je definována jako skupina společně vybíraných statistických jednotek. 4.3.2 Statistický soubor Cyhelský a kol. (2001) uvádí, že studium hromadných jevů předpokládá definování množiny prvků, z nichž každý má celou řadu vlastností, z nichž některé jsou u každého prvku dané množiny zcela stejné a jiné se u jednotlivých prvků mohou vyskytovat v různé míře. Jsou-li identické vlastnosti prvků určité množiny přesně stanoveny, mluví se o dané množině, vytvořené z prvků s těmito přesně stanovenými shodnými vlastnostmi, jako o statistickém souboru. Statistickým souborem může být množina osob, zvířat, rostlin, věcí, institucí, závodů, podniků, organizací, prodejen, provozoven, úřadů, území, událostí, časových intervalů apod. Statistické jednotky tvoří statistický soubor. Podle Minaříka (2006) může být statistický soubor vymezen buď explicitně nebo implicitně. V prvním případě má vymezení souboru podobu seznamu obsahujícího názvy statistických jednotek (např. pacienti Novák, Svoboda, Turek). Ve druhém případě je soubor vymezen nepřímo, výčtem vlastností statistických jednotek, které, pokud tyto vlastnosti mají, do souboru automaticky patří (např. všichni pacienti interního oddělení okresní nemocnice, kteří byli v uplynulém týdnu hospitalizováni s podezřením na zánět žlučových cest). Každý soubor má vedle své kvalitativní stránky i stránku kvantitativní. Počet statistických jednotek tvořících statistický soubor se nazývá rozsah souboru. 24
V případě výběrových zjišťování rozlišujeme soubory: Základní soubor (či populace) je soubor, ze kterého je vybíráno např. může jít o některé znaky obyvatelstva ČR na začátku roku 1999 apod. Výběrový soubor je soubor vybraných jednotek. 4.3.3 Statistický znak Cyhelský a kol. (2001) definují statistický znak jako odraz (postih, obraz, označení) určité vlastnosti, kterou má v té či oné míře každá jednotka daného statistického souboru. Mírou dané vlastnosti (statistického znaku) u každé jednotky souboru je hodnota (slovní nebo číselná) daného znaku. Těchto hodnot je pro daný statistický znak tolik, kolik jednotek patří do daného souboru. Počet hodnot jednoho statistického znaku je tedy roven rozsahu souboru. Různé pohledy na statistické znaky nám umožňují jejich rozsáhlé členění: Znaky identifikační a variabilní Identifikační rozhodují o příslušnosti jednotky k určitému souboru. Nedochází k jejich zpracování ani analýze, protože mají vztah k rozsahu souboru. Každý znak identifikuje danou statistickou jednotku ze tří hledisek: věcného (CO, KDO), časového (KDY) a prostorového (KDE). Variabilní (proměnlivé) podléhají zpracování a analýze, a proto jejich hodnota (obměna) spolurozhoduje o výsledcích zpracování a analýzy. Proměnlivé znaky můžeme dále dělit na znaky slovní a číselné. Znaky slovní a číselné Slovní (kvalitativní) nabývají vždy nejméně dvou obměn a rozlišujeme alternativní (pokud nabývají právě dvou obměn např. pohlaví) a množné (pokud nabývají více než dvou obměn např. dosažený stupeň vzdělání). 25
Číselné (kvantitativní) nabývají nejméně dvou číselných hodnot. Číselné znaky se rozdělují na znaky měřitelné a pořadové. Znaky pořadové a měřitelné Pořadové (ordinální) umožňují řazení jednotlivých hodnot do stupnice (škály). Můžeme u nich pouze říci, která hodnota je menší nebo větší. Měřitelné (kardinální) jsou výsledky měření např. hmotnost, čas, teplota atd. Kardinální znaky můžeme dále dělit na znaky spojité a diskrétní. Znaky spojité a diskrétní Spojité nabývají libovolných reálných hodnot. Diskrétní nabývají izolovaných, často celočíselných nezáporných (např. počet dětí v domácnosti) nebo přirozených (počet členů domácnosti) hodnot. Zjišťování hodnot takovýchto znaků se říká čítání. 4.3.4 Statistické údaje (data) Záznamy o hodnotách jednoho nebo více znaků v určitém statistickém souboru nazýváme statistickými údaji. Typickým způsobem uchování a aktualizace statistických dat jsou statistické databáze, provozované na počítačích a sdílené uživateli v rámci počítačových sítí. To bylo vymezení statistických údajů podle Minaříka (2006). 4.3.5 Statistické charakteristiky (ukazatele) Minařík (2006) říká, že základním úkolem statistické analýzy je ze statistických údajů, které charakterizují každou statistickou jednotku zvlášť, získat informace, umožňující charakterizovat statistický soubor jako celek. Nositeli této informace jsou statistické charakteristiky (neboli ukazatele). Hodnoty statistických charakteristik měří určité statistické vlastnosti datových souborů, jako je např. úroveň (poloha) nebo proměnlivost (variabilita) statistických dat a mnohé další. 26
Přechodem od statistických dat ke statistickým charakteristikám se zdánlivě vytrácí hromadný charakter zkoumaných jevů, neboť i velmi rozsáhlý soubor je charakterizován jednou nebo několika málo statistickými charakteristikami. Někdy se však paradoxně může vyskytnout i situace přesně opačná statistický soubor nepatrného rozsahu může v rukou pečlivého statistika vydat takový počet charakteristik, který podstatně převýší jeho původní rozsah. 4.4 Etapy statistické činnosti Žádná statistická činnost se neobejde bez provedení čtyř po sobě jedoucích a na sebe navazujících kroků, kterými jsou: statistické zjišťování, zpracování, analýza a prezentace výsledků. 4.4.1 Statistické zjišťování Minařík (2006) uvádí, že statistické zjišťování spočívá ve shromažďování a zaznamenávání údajů číselné (méně často i slovní) povahy o zkoumaném jevu. Bezchybné zjišťování a spolehlivé zaznamenání údajů je prvním předpokladem úspěchu jakéhokoli statistického šetření. Statistické zjišťování (šetření) podle Stávkové a Dufka (2004): Vyčerpávající šetření je finančně i časově velmi náročné, zvlášť u velkých základních souborů. Jejich vypovídací hodnota nemusí být vždy vyšší než při neúplném šetření. Typickou ukázkou vyčerpávajícího šetření je sčítání lidu, volební výsledky či určité formy výkaznictví. Nevyčerpávající šetření (výběr) je častěji používaným typem šetření. Předpokládá se vyšetření pouze určitého vzorku jednotek. Šetření je zpravidla méně finančně i časově náročné. Nevýhodou je, že získané informace a vypočítané charakteristiky se vztahují pouze k výběrovému vzorku jednotek a je třeba dodatečně provádět jejich zobecnění na celý základní soubor zkoumaného jevu. 27
Nevyčerpávající šetření se podle Cyhelského a kol. v zásadě dělí na dva druhy: Záměrný (úsudkový) výběr je takové výběrové šetření, kdy se jeho reprezentativnost zabezpečuje tak, že zkušený odborník na základě některých důležitých známých vlastností základního souboru a vlastního úsudku vybírá ze základního souboru určité statistické jednotky záměrně tak, aby byl výběrový soubor reprezentativní. Úsudkový výběr můžeme dále dělit na kvótní (výběrem se snažíme vytvořit dokonalou napodobeninu základního souboru) a typologický (analyzujeme jen některé skupiny obyvatelstva) výběr. Náhodný (pravděpodobnostní) výběr je takové výběrové šetření, kdy se jeho reprezentativnost zabezpečuje prostřednictvím náhody, resp. přesněji řečeno prostřednictvím zabezpečení působení zákonitostí náhody. 4.4.2 Statistické zpracování Stávková, Dufek (1982) říkají, že výsledkem statistického zjišťování jsou neuspořádané, neroztříděné a nepřehledné statistické údaje o hodnotách sledovaných znaků u jednotlivých statistických jednotek. Hlavním úkolem statistického zpracování tedy je uspořádat tyto údaje, aby se staly přehlednými a shrnout jednotlivé údaje do několika málo čísel. Základní metodou statistického zpracování je metoda třídění. 4.4.3 Statistická analýza Minařík (2006) říká, že k dispozici máme různé statistické prostředky pomocí kterých můžeme provést statistickou analýzu předem zpracovaných dat zkoumaného jevu. Jedná se o výpočetní a grafické kvantifikátory základních statistických vlastností, prostřednictvím nichž vypočítáváme hodnoty různých statistických charakteristik. 28
4.4.4 Prezentace výsledků Prezentace výsledků statistické analýzy spočívá ve zpracování jejích závěrů do takové podoby (tabulkové či grafické), která je srozumitelná potenciálnímu uživateli. Vyjadřovací prostředky se skládají ze statistických tabulek a grafů. Statistické tabulky jsou formalizovaným nástrojem číselného vyjádření. Můžeme je klasifikovat podle účelu na tabulky prezentační (pro prezentaci dat, výsledků zpracování nebo výsledků analýzy), pracovní (např. dokumentující průběh výpočtu na listu Excelu) a tabulky důležitých konstant, které se používají v matematické statistice. Při sestavování tabulky je vhodné dodržet několik obecně platných zásad, které dopomáhají k větší přehlednosti, srozumitelnosti a snižují riziko nepochopení při jejich prezentaci. Tabulka se skládá z těchto základních prvků: číslo tabulky, její název, záhlaví, legenda, číselné pole, sloupce, řádky a popř. poznámky a prameny. Každé políčko tabulky musí být vyplněné a to buď číslem, textem nebo smluvenou značkou. Statistické grafy jejich nespornou výhodou je lepší názornost a přehlednost. Statistické grafy se skládají z těchto základních prvků: číslo grafu, jeho název, pomocné grafické prostředky (osy, stupnice), geometrické grafické prostředky (kvádry), smluvené grafické prostředky (barvy), legenda a popř. pramen. Existence velkého množství statistických grafů umožňuje jejich rozsáhlou klasifikaci podle: Účelu prezentační (k prezentaci dat, výsledků zpracování nebo analýzy), konstrukční a odečítací (nomogramy), které slouží k odečítání důležitých konstant. Použité souřadnicové soustavy na grafy v pravoúhlé souřadnicové soustavě, v polární a ostatní, které nevyžadují souřadnicovou soustavu. Počtu dimenzí rovinné (2 D) a prostorové (3 D), které jsou dále pravé a nepravé. Použitých grafických prostředků bodové, čárové, sloupcové, pruhové, kruhové, bublinové, kartogramy, kartodiagramy, piktogramy atd. Statistické analýzy grafy srovnávací, struktury, vývoje, vyjadřující závislosti mezi jevy atd. Konstrukce spojnicové a sloupcové, bodové a výsečové. 29
4.5 Zpracování statistických údajů Údaje, získané ze statistických šetření, je nutné zpracovat (uvést do přehledné formy tabulek, grafů či zhustit je formou zpřehledňujících charakteristik) a vyhodnotit. Udává Cyhelský a kol. (2001). Výsledkem statistického zjišťování jsou podle Minaříka (2006) statistické údaje v chaotické neuspořádané podobě. Posloupnost hodnot je dána pořadím zjišťovaní a nijak nesouvisí např. s jejich velikostí. Úkolem statistického zpracování je statistická data uspořádat. V principu lze statistická data uspořádat z pohledu věcného, časového nebo prostorového. V této souvislosti hovoříme o věcných, časových a prostorových statistických řadách. Minařík (2006) rozeznává třídění podle jediného znaku, které může být v principu provedeno jako třídění prosté nebo skupinové, v obou případech jak pro číselný, tak i pro slovní znak nebo třídění podle více než jednoho znaku, které může být prováděno jako třídění vícestupňové (hierarchické) nebo třídění kombinační. 4.5.1 Rozdělení četností Stávková a Dufek (2004) uvedli o rozdělení četností: Rozdělení četností je doplněním informací o obměnách kvalitativního znaku či o hodnotách číselného znaku. Výsledky třídění hodnot se uvádí do tabulky rozdělení četností, eventuálně se vyjadřují graficky. Tuto tabulku nazveme v obou případech tabulkou rozdělení četností (nezáleží na tom, zda předmětem třídění je číselný nebo slovní znak). Obě tabulky se však přece jen poněkud liší. Zatímco v tabulce číselného znaku se provádí skupinové (intervalové) třídění, tak v tabulce slovního znaku se jedná o třídění prosté. Prosté i skupinové třídění lze aplikovat jak na variační, tak i na slovní řady. Uvádí Minařík (2006). Obecné schéma tabulky rozdělení četností (absolutních i relativních) a kumulativních četností (absolutních i relativních): Obecné schéma tabulky rozdělení četností (absolutních i relativních) a kumulativních četností (absolutních i relativních): 30
Tabulka 1: Rozdělení četností a kumulativních četnosti. Varianta proměnné (a i ) Četnosti Kumulativní četnosti absolutní (n i ) relativní (p i ) absolutní relativní a 1 n 1 p 1 n 1 p 1 a 1 n 2 p 2 n 1 + n 2 p 1 + p 2............... a k n k p k n 1,00 Celkem n 1,00 x x V této tabulce jsme varianty nominální proměnné označili jako a i, i = 1, 2,..., k, kde k je počet obměn této proměnné. Název první varianty je tedy a 1, druhé a 2, atd. až název poslední obměny je a k. Obdobně jsme označili absolutní četnosti jako n i, i = 1, 2,..., k, takže n 1 je počet jednotek souboru s obměnou a 1, n 2 je počet jednotek souboru s variantou a 2, atd. až n k je počet jednotek souboru s variantou a k. k i= 1 p i Relativní četnosti jsou čísla p i = k n i= 1 i n i, kde n i absolutní četnosti. Platí = 1. Někdy se uvádějí relativní četnosti v procentech, v tom případě pracujeme s hodnotami 100 p i, jejichž součet je roven 100. Součtová (též kumulativní) četnost (absolutní nebo relativní) i-té třídy je číslo, vytvořené jako součet příslušných četností v první až i-té třídě kn = i n j j= 1, kp i = p j i j= 1, kde i, j = 1, 2,, k. Součtové četnosti k-té (poslední) třídy jsou kn k = n, kp k = 1. Případný součet četností již nemá žádný význam. Vysvětlení četnostní absolutních, relativních i kumulativních podle Minaříka (2006). 31
4.5.2 Významné hodnoty variační řady Předpokladem určení významných hodnot je variační řadu nejprve uspořádat podle velikosti, v některých případech dokonce roztřídit. Charakteristiky úrovně se v omezené míře používají i u slovních znaků. Významnými hodnotami variační řady jsou např.: modus je hodnota s největší četností, kterou nazýváme typickou čili modální hodnotou. kvantily jsou hodnoty, které dělí uspořádanou variační řadu v určitém poměru četností. Kvantily (dolní, medián, horní) dělí uspořádanou řadu na dvě poloviny se stejnou četností. medián je nejznámější kvantil, který rozděluje uspořádanou řadu na části se stejnou četností. 4.5.3 Průměry Pod pojmem průměry rozumíme podle Minaříka (2006) míry polohy, které splňují tyto základní vlastnosti: jsou funkcí všech hodnot variační řady, jejich hodnota tedy závisí na každé z měřených hodnot, leží vždy mezi minimální a maximální naměřenou hodnotou, změní-li se kterákoli hodnota řady, změní se ve stejném smyslu i hodnota průměru (ne však o stejnou hodnotu). Rozeznáváme tyto druhy průměrů: aritmetický průměr stálost součtu průměrovaných hodnot harmonický průměr stálost součtu převrácených hodnot geometrický průměr stálost součinu průměrovaných hodnot kvadratický průměr stálost součtu čtverců hodnot Průměry stírají rozdíly mezi konkrétními hodnotami znaku, zjištěnými u jednotlivých prvků soboru. Jde tedy o určitý stupeň abstrakce, protože dospíváme k číslu, které se v celém souboru nemusí vůbec vyskytovat. Musíme proto brát průměr jako prostředek pro 32
zjednodušené zobrazení a používat s co největší možnou opatrností a rozvahou. Rozhodně nemůže průměr sloužit jako prognóza pro jednotlivé případy. Uvádí Dufek, Boučková (1982). Aritmetický průměr podle Marka (2005) se používá všude, kde má smysl součet individuálních hodnot znaků. Vyplývá to z určující vlastnosti aritmetického průměru. 1 Aritmetický průměr řady n hodnot x i, i = 1, 2,..., n, je definován jako x = n n x i i= 1 Udává, jaká stejná část z úhrnu hodnot číselné proměnné připadá na jednu jednotku. Má smysl všude tam, kde má nějaký informační smysl součet hodnot proměnné. Aritmetický průměr, počítaný z řady n hodnot x i, se nazývá prostý (jednoduchý) aritmetický průměr. Z rozdělení četností se aritmetický průměr počítá podle vzorce x k i= 1 = k i= 1 x n i n i i. Při takovémto počítání aritmetického průměru se mluví o váženém aritmetickém průměru, protože se v něm jednotlivým obměnám proměnné x přisuzují různé závažnosti (váhy), dané v tomto případě absolutními četnostmi jejich výskytu. Uvádí Minařík (2006).. 4.5.4 Statistická závislost slovních znaků Stávková, Dufek (2004) říká, že při marketingovém šetření se častěji setkáváme právě se slovními znaky. Přitom jedinou informaci, kterou o tomto znaku získáme je četnost příslušné obměny. Četnost souvisí s tříděním a výsledkem je kontingenční či asociační tabulka. Kontingenční tabulka Minařík (2006) říká, že kontingenční tabulka vzniká kombinačním tříděním podle dvou slovních znaků, z nichž alespoň jeden je znakem množným. Znak, jehož podmíněná rozdělení četností jsou v jednotlivých sloupcích kontingenční tabulky, označíme symbolem A. Tento znak nabývá obměn a 1, a 2,..., a i,..., a r, kde r je počet řádků kontingenční tabulky. 33
Znak B, jehož podmíněná rozdělení četností jsou v řádcích kontingenční tabulky, nabývá obměn b 1, b 2,..., b j,..., b s, kde s je počet sloupců kontingenční tabulky (řádkovým indexem je index i, sloupcovým indexem je index j. Nepodmíněné četnosti znaku A v posledním sloupci tabulky označíme symbolem n i a nepodmíněné četnosti znaku B v posledním řádku tabulky n j. Součet posledního řádku i sloupce tabulky je rozsah souboru n. Podmíněné četnosti v jednotlivých políčkách kontingenční tabulky označíme n ij (pro i = 1, 2,..., r, j = 1, 2,..., s). Analýza kontingenční tabulky je založena na tom, že pro každé políčko tabulky lze stanovit četnost, která by zde byla v případě, že znaky A, B by byly nezávislé. Tuto četnost nazveme četností vypočtenou a stanovíme ji podle vztahu nin j n ij =. Vypočtená četnost n n ij na rozdíl od pozorované četnosti n ij může nabývat i jiných než celočíselných hodnot. Pomocí kontingenční tabulky můžeme vypočítat několik dalších ukazatelů: Čtvercová kontingence (chí kvadrát) měří rozdílnost pozorovaných a vypočtených četností souhrnně za celou kontingenční tabulku. 2 χ = 2 r s ( nij nij ), i= 1 j= 1 n ij kde dvojitý symbol sumace znamená součet přes všechny řádky a zároveň přes všechny sloupce tabulky. Čtvercová kontingence nabývá hodnoty od nuly, která signalizuje nezávislost znaků A, B, po určitou maximální hodnotu, kteráže tím větší, čím větší je rozsah souboru a čím větší jsou rozměry kontingenční tabulky. Čtvercová kontingence je tedy charakteristikou intenzity v kontingenční tabulce, ovšem ne příliš dokonalou charakteristikou, neboť kromě stupně závislosti zkoumaných znaků závisí ještě na dalších činitelích (rozsahu souboru, rozměry kontingenční tabulky). Vliv rozsahu souboru lze 2 2 χ odstranit stanovením tzv. průměrné čtvercové kontingence Φ =. n 34