Marketingový výzkum 6 Analýza dat Grafy Závěrečná zpráva
Analýza dat 1. Deskriptivní statistika výběr vhodných měřítek 2.Induktivní statistika - měření a testování závislostí
Na výběr statistické metody má vliv Typ dat (použitá škála) Typ výzkumu nezávislost výběrů, počet skupin, počet proměnných možnost kontroly proměnných
1. stupeň zpracování Popis odpovědí pro celý soubor, pro jednotlivé části (Ž,M) Absolutní a relativní četnosti Míry polohy Míry variability (vč. var.koef.) Míry šikmosti Tvorba kontingenčních tabulek
Kategorie měřící škály Typ postoje Kdy použít Typická aplikace Nominální Ano, ne Objekty jsou stejné nebo rozdílné Ordinální, pořadové Intervalové Poměrové Pořadí, párové srovnání, Likert,Thurstone, sem.d. Objekty jsou větší či menší Intervaly jsou stejné 0 má smysl, možné srovnání absolutních odchylek Pohlaví, sociální třída Řazení Měření postojů Tržby, počty výrobků, věk Statistické testy %, mo, chíkvadrát Me, korelace pořadí, percentily Průměr, směrod. odchylka, anova, regrese, faktorová an. geom. a harm. průměr, variační koeficient
Rozdělení četností Zájem o službu Počet % Ano 124 11,1 Asi ano 211 18,9 Nevím 376 33,7 Asi ne 204 18,3 Ne 200 17,9 Celkem 115 99,9 Ano 124 11,1 Asi ano 211 18,9 5 4 3 2 1 3 2 Histogram 0 50 100 150 200 250 300 350 400 Nejistota, nezájem 780 69,9 1 0 200 400 600 800 1000
Četnosti Četnosti Pořad.číslo Velikost balení (l) Velikost balení (l) Velikost balení (l) Cena Kč/l Pořad.číslo Cena Kč/litr Pořad. číslo Cena Kč/litr 1. 2 24,95 11. 2 24,95 21. 1 24,90 2. 2 21,45 12. 2 22,45 22. 1 27,50 3. 2 27,40 13. 2 27,40 23. 1 24,90 4. 2 24,50 14. 2 22,45 24. 1 30,00 5. 2 24,50 15. 1 28,60 25. 1 30,00 6. 2 26,10 16. 1 28,00 26. 1 24,90 7. 2 22,45 17. 1 32,00 27. 1 27,50 8. 2 27,40 18. 1 24,90 28. 1 27,50 9. 2 26,10 19. 1 32,60 29. 1 24,90 10. 2 26,10 20. 1 21,90 30. 1 31,00 Aritmetický průměr = 26,31 Kč, medián = 26,10 Kč, směrodatná odchylka = 2,86 Kč 6 5 4 3 2 1 0 23 25 27 29 31 33 Cena ( balení 1l) Kč 5 4 3 2 1 0 23 25 27 29 31 33 Cena (balení 2l) Kč Průměrná cena džusu (balení 1l) = 27,57 Kč, průměrná cena džusu (balení 2l) = 24,87 Kč
Deskriptivní statistika Souhlas na škále 1(silný s.- 7 (silný n.) Průměrné skóre Uživatelé Neuživatelé Rozdíl mezi průměry Řídím nerad 3,7 4,3 2,9 1,4 Rád chodím pěšky Sleduji cenu benzínu Zajímá mě znečištění ovzduší Podíl resp., Kteří kladně odpověděli : 3,9 3,8 4,0-0,2 5,3 6,1 4,4 1,7 4,6 4,6 4,6 3,9 36% 50% 25% 25% Bydlím do vzdálenosti 1 km od stanice metra Velikost vzorku 62 28 34
Deskriptivní statistika Otázka Škála Odpověď Četnost % Při bolestech hlavy preferuji bylinky. Nesouhlas -3 300 30-2 120 12-1 50 5 0 50 5 1 100 10 2 300 30 Souhlas 3 80 8 Průměr -0,3
Deskriptivní statistika Lék X, Z na snižování hmotnosti hodnotím jako: velmi účinný, účinný, ani-ani, neúčinný, velmi neúčinný(problémy) Škála 1 Škála 2 Lék X Škála 1 Škála 2 Lék Y Škála 1 Škála 2-2 1 3-6 3 12-24 12-1 2 8-8 16 20-20 40 0 3 15 0 45 60 0 180 1 4 160 158 640 110 110 440 2 5 99 198 495 83 166 415 S1 S2 285 342 1199 285 232 1087 1,2 3,505848 0,814035 3,814035
Kontingenční tabulky Méně než 7000 Záměr koupit v závislosti na příjmu 7000-15999 Víc než 16 000 Ano 20,4% (38) 11,6%(46) 7,6%(37) 11,3% (121) Asi ano 19,4% (36) 11,9%(47) 17,9% (87) 16% (170) Neví, nezájem 60,2% (112) 76,5%(302) 74,5% (362) 72,5% (776) 100%(186) 100% (395) 100%(362) 100% (1067) Záměr koupit v závislosti na věku Do 30 let 30-40 let Nad 40 let Ano 14%(60) 12,5% (40) 6,6% (24) 11,1% (24) Asi ano 21,9%(94) 20% (64) 14,5% (53) 18,9%(211) Neví, nezájem 64,1%(276) 67,5%(216) 78,9%(288) 70% (780) 100% (430) 100% (320) 100%(365) 100%(115)
Analýza závislostí- statistické charakteristiky v analýze dvou proměnných Typ proměnných Charakteristika Příklad Deskriptivní Dvě intervalové proměnné Závislost výdajů na příjmu Korelační koeficient Regresní koeficienty Nominální a intervalová proměnná Závislost mezi barvou balení a velikostí prodeje Analýza rozptylu (ANOVA) Dvě ordinální proměnné Shoda kvality zboží v názorech odborníků a laiků Koeficient korelace pořadí Deduktivní A a Z testy U-test Test Mann Whitney Dvě nominální proměnné Vazba mezi kouřením rodičů a kouřením dětí Kontingenční koeficienty (Pearsonův a Cramerův) Test 2
Závislost dvou intervalových proměnných Závislost ceny na stáří automobilu (20 automobilů stejně značky a typu) B = -1,529, r = -0,923 Závislost výdajů na potravinářské zboží (y) na příjmu domácnosti (x) a počtu členů domácnosti (z) b yx.z =0,27 b yz.x =1089 r yx.z =0,538 r yz.x =0,689
Závislost nominálních proměnných Existence test χ 2 H 0 : nezávislost H 1 = závislost χ 2 > K krit přijetí H 1 Síla - Pearsonův a Cramerův kontingenční koficient C, C r = <0,1>
Závislost nominálních proměnných Vzdělání Názor na množství reklamy Součty příliš mnoho přiměřeně příliš málo základní 29 57 14 100 vyučení 38 75 27 140 středoškolské 40 65 15 120 vysokoškolské 13 23 4 40 Součty 120 220 60 400 Relativní četnosti 0,30 0,55 0,15 1,00 G = (nij-n0,ij) 2 / n 0,ij C= G/G+n, C r = G/c.n G = 4,074 G krit = 12,6 C = 0,100 C r =0,071
Mladší 30 let Kontingenční tabulka ano Penzijní připojištění ne celkem ano 144 456 600 ne 576 424 1000 720 880 1600 Souvisí důchodové pojištění s věkem? G * = n(n11n22n12n21і-n/2) 2 /n1 * n 2* n *1 n *2 G>X0,95 =3,84
Závislost ordinálních proměnných Pořadí vypracované 2 skupinami hodnotitelů podle názoru na přitažlivost výrobků či na vlastnosti, které by měl mít výrobek 2 skupiny pořadí : Spearmen Více skupin. Kendallův koef. konkordance
Koeficient konkordance Znač k a piva Pořadí podle chuti 1. 2. 3. 4. Součet pořadový ch čísel Ai Ai2 A 2 3 3 1 9 81 B 7 5 4 6 22 484 R k = 12/(h 2 (n 3 -n)). Σ Ai 2 3(n+1)/(n-1) C 9 7 8 7 31 961 D 3 2 1 2 8 64 E 10 8 9 9 36 1296 F 8 10 10 10 38 1444 G 1 1 2 3 7 49 H 6 9 7 8 30 900 I 4 4 5 5 18 324 R k = J 5 6 6 4 21 441 Součt y 55 55 55 55 220 6044
Závislost nominální a ordinální proměnné Variační analýza ANOVA H 0 : a 1 = a 2 = a 3 = a M ; H 1 = non H 0 Výpočet testové charakteristiky F F >F tab. závislost Problém: závislost výše prodeje na typu obalu nebo barvě balení
ANOVA: Cenový experiment Má cena vliv na prodej NV? 3 úrovně ceny: 39,44,49 Kč 3 soubory supermarketů, v každém 5 obchodů (na úroveň prodeje může mít vliv jak cena tak samotný supermarket, lokalita a skupina zákazníků, ) H 0 : x 1 = x 2 = x 3 = x M ; H 1 = non H 0 F statistika
PRODEJ PRODEJ ANOVA:cenový experiment Poro 14 = 8 13 12 X 11 X 10 X X 9 X X X 8 X X X 7 X X X 6 X 5 4 X 3 2 1 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 Cena 39Kč 44Kč 49Kč
ANOVA:cenový experiment 1 2 3 4 5 Celkem Průměr.prodej CENA 39Kč 8 12 10 9 11 50 1 = 10 44Kč 7 10 6 8 9 40 2 = 8 49Kč 4 8 7 9 7 35 3 = 7 Rozptyl v důsledku změny cen: SS r r p 1 n p X X 23, 3 p Rozptyl v důsledku obchodu : SS u np r X ip X p i 1 p 1 2 34
ANOVA:cenový experiment Rozptyl vysvětlený změnami ceny 23,3/2 = 11,65 Rozptyl vlivem obchodu 34/12= 2,8 Statistika F =11,65/2,8= 4,16 Pro daný počet stupňů volnost čitatele (2) a jmenovatele (12) tabulky distribuční fce F udávají hodnotu p= cca 0,4 Závěr: zamítáme hypotézu o rovnosti průměrů
Speciální testy (závislé výběry) Mc Namarův test změny názorů Stejná skupina je tázána na názor před a po Wilcoxonův test pro závislé výběry stejná skupina kupuje určité množství výrobků a změní se např. cena
Mc Namarův test změny názorů na Názor před získáním informace příznivý Názor po získání informace nepříznivý Součty příznivý 146 8 154 nepříznivý 26 20 46 Součty 172 28 200 G= ( n12-n21-1) 2 /n12+n21 G = 8,5 H o : nezměnil H 1 : změnil se G> G krit
Vybrané vícerozměrné statistické metody
Faktorová analýza Používá se pro omezení počtu proměnných Vstupy tvoří soubor proměnných vztahujících se ke každému objektu Výstupy poskytují faktorová skóre s údaji, z kolika % vysvětlují daný faktor
Banka Měření postojů na 9 bodové škále souhlas-nesouhlas 1. Malé banky požadují nižší poplatky než velké 2. Velké banky se pravděpodobně dopouštějí více chyb než malé 3. Pracovníci na přepážkách nemusí být mimořádně přátelští a uctiví, stačí když se budou chovat civilně 4. Přeji si, aby mě v bance znali osobně a jednali se mnou s velmi uctivě. 5. Když se ke mě v bance chovají neosobně a neochotně, nestanu se jejím pravidelným zákazníkem.
Ot. X1 X2 X3 X4 X5 F1 F2 Respond ent 1 9 6 9 2 2 -.91581 1.03767 2 4 6 2 6 7.93263 -.00767 3 0 0 5 0 0-1.05059-1,94294 4 2 2 0 9 9 1.64856-1,03405 5 6 9 8 3 3-0,44159 1.04045 6 3 8 5 4 7 0,44671 0,30815 7 4 5 6 3 6 8 8 6 8 2 2 9 4 4 0 8 8 10 2 8 4 5 7 11 1 2 6 0 0 12 6 9 7 3 5 13 6 7 1 7 8 14 2 1 7 1 1 15 9 7 9 2 1
Korelační analýza X1 X2 X3 X4 X5 X1 1.0000 0,60980 0,46870-0,01795-0,09642 X2 1,0000 0,23048 0,18969 0,31863 X3 1,000-0,83183-0,77394 X4 1,0000 0,92732 X5 1,0000 Principal-Component Analysis 1 2 3 4 5 Eigenvalue 2,754602 1,774869 0,377091 0,064964 0,028474 Difference,979733 1,397778 0,312127 0,036491 Proportion 0,5509 0,3550 0,0754 0,0130 0,0057 Cumulative 0,5509,9059,9813.9943 1,0000
Složení faktorů F1 F2 Komunalita X1-0,29 0,85 0,81 X2 0,05 0,92 0,83 X3 -,94 0,28 0,94 X4 0,95 0,23 0,94 X5 0,94 0,27 0,96 Interpretace faktorů F1: proměnné 3,4,5 interpretace: personální faktor F2: proměnné 1,2 interpretace: velikost banky
FA: Prací prášky Co zákazníci očekávají od pracích prášků? síla, odstranění všech nečistot, rozjasnění barev, cena, zamezení ztráty barev, odstranění skvrn od tuku, vůně, nepoškození struktury prádla (netřepí se), praktičnost balení, přehlednost dávkování, vliv na životní prostředí, vypere límečky na košilích, odstranění zapraných nečistot, náklady na praní, účinek na pokožku, snadnost rozpouštění, hebkost prádla, cena přiměřená účinku.
FA: Prací prášky (požadavky a JE SILNÝ vnímání zákazníků) Nejméně silný Nejvíce silný VYPERE VŠECHNY NEČISTOTY Vůbec nevypere Zcela vypere ROZJASNÍ BARVY Vůbec nerozjasní Nádherně rozjasní CENA JE Vysoká Nízká PRÁDLO PO VYPRÁNÍ ZTRÁCÍ BARVU Ztrácí barvu Vůbec neztrácí barvu ODSTRANÍ SKVRNY OD TUKU Vůbec neodstraní Zcela odstraní skvrny PRÁDLO PO VYPRÁNÍ VONÍ Bez vůně Intenzivní vůně NEPOŠKOZUJE STRUKTURU PRÁDLA Silně poškozuje Nepoškozuje ( prádlo je po častém praní otřepené ) PRAKTIČNOST BALENÍ Zcela nepraktické balení Velmi praktické balení PŘEHLEDNOST DÁVKOVÁNÍ Nepřehledné Srozumitelné, přehledné VLIV NA ŽIVOTNÍ PROSTŘEDÍ Škodlivý Neškodlivý VYPERE LÍMEČKY NA KOŠILÍCH Vůbec nevypere Zcela vypere ODSTRANÍ I ZAPRANÉ NEČISTOTY Vůbec neodstraní Zcela odstraní NÁKLADY NA PRANÍ JSOU Vysoké Nízké ÚČINEK NA POKOŽKU Dráždivý Šetrný SNADNOST ROZPOUŠTĚNÍ Nízká Vysoká HEBKOST PRÁDLA PO VYPRÁNÍ Nízká Vysoká CENA PŘIMĚŘENÁ ÚČINKU, KTERÝ Zcela nepřiměřená Velmi přiměřená POSKYTUJE
FA: Prací prášky - faktory Jednotlivé vlastnosti souvisí s faktory takto: F1:hebkost, síla, nečistoty, zašpiněnost F2: cena, cena/účin, náklady F3:pokožka, struktura, prostředí (prostředí málo koresponduje s ostatními) Vysvětlení celkového rozptylu F1: 65%, F2: 16,8%, F3:16%
Grafy
Krabicový graf 250 280 310 340 370 400 Výdaje na 1 člena domácnosti
Grafy ordinální škála Základní rozdělení četností 5 st. škály způsob využití videomagnetofonu stupeň využití 1 2 3 4 5 velmi často dosti často prů-měrně dosti zřídka velmi zřídka zatím nevědí k nahrávání TV pořadů 9 19 33 8 3 28 k přehrávání nahraných videokazet 7 20 23 11 4 35 k promítání vlastních natočených snímků 8 10 12 7 17 46 N=400, údaje v %
50 45 40 35 30 25 20 15 1 velmi často 2 dosti často 3 prů-měrně 4 dosti zřídka 5 velmi zřídka 5 zatím nevědí 10 5 0 k nahrávání TV pořadů k přehrávání nahraných videokazet k promítání vlastních natočených snímků
k přehrávání nahraných videokazet 1 velmi často 2 dosti často 3 prů-měrně 4 dosti zřídka 5 velmi zřídka 5 zatím nevědí k promítání vlastních natočených snímků k nahrávání TV pořadů 1 velmi často 2 dosti často 3 prů-měrně 4 dosti zřídka 5 velmi zřídka 5 zatím nevědí 1 velmi často 2 dosti často 3 prů-měrně 4 dosti zřídka 5 velmi zřídka 5 zatím nevědí
4 3,5 3 2,5 2 1,5 nahrávání TV pořadů přehrávání videokazet promítání vl. snímků 1 0,5 0 základní středoškolské s maturitou vysokoškolské
Průměrné hodnoty 5-stupňové škály využití videomagnetofonu pro: Znak nahrávání TV pořadů přehrávání videokazet promítání vl. snímků muži 2,7 3,1 3,8 ženy 2,6 2,8 3,0 věk 15-24 2,7 2,5 3,3 25-34 2,6 2,6 3,1 35-44 2,6 2,8 3,5 45-59 2,8 3 3,8 60+ 2,7 2,9 3,2 vzdělání základní 2,7 2,8 3,4 středoškolské s maturitou 2,6 2,8 3,5 vysokoškolské 2,8 2,7 3,3
Závisí způsob použití na? 4 3,5 3 2,5 2 1,5 nahrávání TV pořadů přehrávání videokazet promítání vl. snímků 1 0,5 0 základní středoškolské s maturitou vysokoškolské
Grafy 4 3,5 3 2,5 2 1,5 nahrávání TV pořadů přehrávání videokazet promítání vl. snímků 1 0,5 0 muži ženy
Grafy 4 3,5 3 2,5 2 1,5 1 nahrávání TV pořadů přehrávání videokazet promítání vl. snímků 0,5 0 15-24 25-34 35-44 45-59 60+
Struktura zprávy Titulní strana (název, zadavatel, autoři) Obsah (kapitoly, subkapitoly) Stručný souhrn (cca 10% -úvod, hlavní výsledky,hlavní doporučení) Hlavní část (úvod problém, cíle, metodika,metodologie. Získané výsledky údaje, grafy, tabulky, názory) Závěry a doporučení: návrhy a dopady pro zadavatele Přílohy výsledky v podobě tabulek